|
引言9 r: v; q# l! x
基于可編程馬赫-曾德干涉儀(MZI)網(wǎng)格實現(xiàn)的光神經(jīng)網(wǎng)絡(ONN)已成為加速機器學習計算的方法。本文概述了基于MZI的光處理器,重點介紹了兩種關鍵架構 - Reck網(wǎng)格和Diamond網(wǎng)格,并分析了實現(xiàn)ONN的性能。6 I6 k# s# M! H1 s( B: r2 J
$ J6 c3 b) Z X( G/ C" R* C6 FMZI光處理器基礎
% U% j- I7 A. q; b光處理器的基本構建模塊是2x2可重構MZI,如圖11所示。由兩個3-dB耦合器組成,帶有可調相移器θ和φ,用于控制功率分配比和兩個輸出之間的相對相位。8 Z. [6 V" J5 b" A
oopqxrhyxww64076734929.png (420.64 KB, 下載次數(shù): 3)
下載附件
保存到相冊
oopqxrhyxww64076734929.png
4 小時前 上傳
9 A; n4 H" D1 n: E5 _% c3 V圖1:具有可調相移器θ和φ的2x2可重構MZI示意圖。
0 m/ K1 Q$ G9 u7 S
+ i& V* r% l ~' J) m, @單個MZI的單一轉移矩陣由下式給出:# V- H9 }- L" R5 N, q, ] b
3potgicok5u64076735029.png (106.42 KB, 下載次數(shù): 3)
下載附件
保存到相冊
3potgicok5u64076735029.png
4 小時前 上傳
- {$ B( N4 j4 L- d. Y) `6 u( H/ k6 r V1 V; N- {8 Z' l4 |5 D1 S* q
通過在網(wǎng)格中級聯(lián)多個MZI,可以實現(xiàn)更大的單一變換。圖2所示的4x4處理器的Reck網(wǎng)格是一種三角形排列,可使用6個MZI實現(xiàn)任何4x4單一矩陣。
& t: b% R% y7 k+ Z
, s' g' {7 Y# K6 t* o6 m9 p& J
bbtbhgtws5d64076735129.png (84.74 KB, 下載次數(shù): 4)
下載附件
保存到相冊
bbtbhgtws5d64076735129.png
4 小時前 上傳
) z. C" v: D) i
圖2:由6個MZI組成的4x4 Reck網(wǎng)格光處理器示意圖。. H3 W$ M: Z* q8 ~ _, R
% p6 t3 ~6 N9 s$ Q9 M2 F* D3 L
完整4x4 Reck處理器的單一矩陣由各個MZI矩陣的乘積給出:
( `3 B& b& E# {1 Z$ o1 U
v5gyerqtnfy64076735230.png (38.98 KB, 下載次數(shù): 4)
下載附件
保存到相冊
v5gyerqtnfy64076735230.png
4 小時前 上傳
6 ~( u3 R. A& n* v& z. Q
b$ d2 D1 ~( G: V+ ]. R A光處理器編程
9 b7 p. Y3 X- w要對光處理器進行編程以實現(xiàn)所需的單一變換,必須確定每個MZI所需的相移。這是通過分解過程完成的,該過程將目標矩陣依次乘以逆MZI矩陣:
' m8 A1 q) |: L/ J/ @
i2d2rtbjzyu64076735330.png (40.11 KB, 下載次數(shù): 4)
下載附件
保存到相冊
i2d2rtbjzyu64076735330.png
4 小時前 上傳
# J6 e' d/ Z3 v1 P! V
4 n7 F9 v2 J/ `. g2 a通過在每個步驟中將非對角元素設置為零,可以提取所需的相移。圖3顯示了4x4 Reck網(wǎng)格在此分解過程中考慮MZI的順序。7 u. I0 W* X0 C! k# T+ N7 _
x5rbbssmxsr64076735430.png (146.39 KB, 下載次數(shù): 3)
下載附件
保存到相冊
x5rbbssmxsr64076735430.png
4 小時前 上傳
4 J% E+ ^6 ~6 w' R$ j* b
圖3:4x4 Reck網(wǎng)格中用于編程的MZI分解順序。$ w4 s2 h1 c1 k- |0 E
- i2 |: I- h" e# [. { W' R
光神經(jīng)網(wǎng)絡+ M: y' g& i9 _4 x. I: K
ONN利用這些可編程光處理器來實現(xiàn)神經(jīng)網(wǎng)絡層中的線性變換。圖4顯示了單層ONN的結構。
, H* y% g4 z j" O
1ioqdxfr24i64076735530.png (222.16 KB, 下載次數(shù): 2)
下載附件
保存到相冊
1ioqdxfr24i64076735530.png
4 小時前 上傳
! c1 I) K" \. `; C# {5 r- N Q
圖4:光學實現(xiàn)的單層神經(jīng)網(wǎng)絡示意圖。
% T: q4 o5 r2 ?" B6 V- G8 _2 @: h4 R, O- R7 y: W5 U" `. V
光處理器實現(xiàn)權重矩陣W,而非線性激活函數(shù)通常以電子方式應用。對于分類任務,網(wǎng)絡接受多維輸入I0并為每個類別產(chǎn)生輸出概率。 f! }$ q7 Q7 P6 b% t. Y
?! ]! I( w0 D- f1 i' n+ R
網(wǎng)絡使用反向傳播進行訓練,通過最小化均方誤差等損失函數(shù)來優(yōu)化權重矩陣:/ u6 F: F; F2 P" y
0jkfbzbd0vd64076735630.png (25.62 KB, 下載次數(shù): 4)
下載附件
保存到相冊
0jkfbzbd0vd64076735630.png
4 小時前 上傳
$ M0 ?: p, c% h( N* k
( J3 F3 w4 p4 C+ v# m" t9 ?7 M, A
圖5顯示了4類數(shù)據(jù)集示例和4x4 ONN的訓練過程。
' j" [3 a/ \, z7 n3 \- b1 ]
v1o45em4svh64076735730.png (253.27 KB, 下載次數(shù): 4)
下載附件
保存到相冊
v1o45em4svh64076735730.png
4 小時前 上傳
) O) x9 j! }, _
圖5:(a)4類高斯數(shù)據(jù)集和(b)顯示4x4 ONN的損失和準確度與訓練周期的關系的訓練過程。
. F1 z1 c: ^/ M( F+ Y+ ^
" e7 X) C2 F' h0 @) }1 B3 j. y, c1 XDiamond網(wǎng)格架構
* A1 z" g/ G' F) L# x8 z+ dReck網(wǎng)格可以實現(xiàn)任何單一矩陣,但對制造誤差和光損耗很敏感。為解決這個問題,提出了一種替代的Diamond網(wǎng)格架構,如圖6所示的4x4處理器。1 P8 o1 \5 W! q+ Q8 T: }3 _
1qdmqy20vq364076735831.png (496.17 KB, 下載次數(shù): 4)
下載附件
保存到相冊
1qdmqy20vq364076735831.png
4 小時前 上傳
% i# c! Y6 j8 @圖6:具有9個MZI的4x4 Diamond網(wǎng)格光處理器示意圖。
9 P; }/ q" h# x. k: v! D4 v( }: { z |- m5 |0 d
與相同大小的Reck網(wǎng)格相比,Diamond網(wǎng)格使用額外的N(N-1)(N-2)/2個MZI。這提供了幾個優(yōu)點:更對稱的拓撲結構,具有平衡的光路能夠將不需要的光重定向到額外的輸出優(yōu)化權重矩陣的額外自由度% r+ U. k6 N: f* \" Y7 e
[/ol]
$ v L0 P* a6 L" ~% j4x4 Diamond處理器的單一矩陣由下式給出:
( c- S# K2 i' }7 v- @1 m
1prnfvrpj5e64076735931.png (71.81 KB, 下載次數(shù): 2)
下載附件
保存到相冊
1prnfvrpj5e64076735931.png
4 小時前 上傳
/ L. S- U o! ?
& _- H0 l; r* i @- }可以使用與Reck網(wǎng)格類似的分解過程對其進行編程,遵循圖7所示的順序。5 Q8 C' e4 U& K4 R
zz1clakmcvm64076736031.png (236.55 KB, 下載次數(shù): 4)
下載附件
保存到相冊
zz1clakmcvm64076736031.png
4 小時前 上傳
$ R& @, Q6 k) R- {, Z9 x6 {* m! E, N
圖7:4x4 Diamond網(wǎng)格中用于編程的MZI分解順序。8 I* F1 P" R9 Z0 O4 A( t
3 Z( o+ B* b, V; G
性能比較9 T# |% Z( `1 E0 Z' R
為比較Reck和Diamond架構,分析了各種大小的單層ONN的實現(xiàn)性能。圖8顯示了4x4處理器的分類準確度與相位誤差的關系。
$ _' y/ u( @" H7 I
rlujfeftugo64076736131.png (125.34 KB, 下載次數(shù): 3)
下載附件
保存到相冊
rlujfeftugo64076736131.png
4 小時前 上傳
3 q9 Z( e2 ~1 I7 V, w5 [
圖8:4x4 Reck和Diamond ONN的分類準確度與相位誤差的關系,每個MZI的損耗為(a)0 dB和(b)1 dB。
; }* Q9 E% T4 a: j, e. |3 Q. O) _( ?6 p) N2 P
Diamond網(wǎng)格對相位誤差表現(xiàn)出更好的魯棒性,尤其是在存在光損耗的情況下。這種優(yōu)勢在更大的網(wǎng)絡規(guī)模中變得更加明顯。
! s& t+ }, q/ v6 s/ l3 h, d, s4 K3 S* b$ ^' p8 a; B8 a
圖9比較了不同大小處理器(最大64x64)的準確度與相位誤差的關系。% B1 {* O( H+ ~/ q; q
p0oz0wwbgf364076736231.png (416.84 KB, 下載次數(shù): 3)
下載附件
保存到相冊
p0oz0wwbgf364076736231.png
4 小時前 上傳
' w1 S+ Q7 L& A6 z9 ^ h+ b圖9:不同大小(a-d)Reck和(e-h)Diamond ONN的分類準確度與相位誤差的關系。( `3 k' v' k: Q. m
8 X2 x4 D3 Z" C) k6 Y- Q$ m
對于較大的網(wǎng)絡,高精度區(qū)域縮小,但Diamond網(wǎng)格在所有尺寸上都保持更好的性能。
7 E# O- \) D0 J# E1 Z/ H0 w- i% D" Q/ f" U. u. {8 b5 o
圖10將此分析擴展到包括每個MZI的光損耗影響。' u- ^; W7 E# Y! C( N" x3 y2 R, L
kagrofhrnyk64076736332.png (391.07 KB, 下載次數(shù): 3)
下載附件
保存到相冊
kagrofhrnyk64076736332.png
4 小時前 上傳
2 N) J& P+ z, S1 H
圖10:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與損耗和相位誤差的關系。; S, ]2 Y& C. @
2 O- s, r8 W! p4 {- w5 |再次,Diamond網(wǎng)格在所有網(wǎng)絡規(guī)模上表現(xiàn)出更優(yōu)的魯棒性。: V; B( }" W, l
& R. y+ V8 w0 ?! k! X( J
最后,圖11總結了不同網(wǎng)絡規(guī)模的兩個關鍵性能指標 - 性能指標(>75%準確度的區(qū)域)和訓練期間達到的最終損失值。/ ~) ~0 c8 O- e f8 s' W1 k6 c
ry5kcbvddlr64076736432.png (92.32 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ry5kcbvddlr64076736432.png
4 小時前 上傳
$ j/ M3 `9 J/ d+ V( a: z. _圖11:不同大小的Reck和Diamond ONN的(a)性能指標和(b)最終損失值比較。
! Q) u/ v& \2 Z4 q* u2 N F
1 U# V) R- L V& u: N1 Z" ?0 XDiamond網(wǎng)格在這兩個指標上始終優(yōu)于Reck網(wǎng)格,優(yōu)勢隨網(wǎng)絡規(guī)模增大而增加。! t& N, V" _- z2 B; f& E
4 [: ]6 l, O9 ^% x& B+ G結論
/ f7 S% z/ @1 w/ Z/ a' h& J% n" Y基于可編程MZI的光處理器為實現(xiàn)ONN和加速機器學習計算提供了有前途的平臺。Reck網(wǎng)格提供了可實現(xiàn)任何單一變換的緊湊設計,但Diamond網(wǎng)格提高了對制造誤差和光損耗的魯棒性。這使Diamond架構更適合實際的大規(guī)模ONN。硅基光電子制造和架構設計的持續(xù)進步可能會進一步提高這些光處理器的性能,有望實現(xiàn)新一類超快速、節(jié)能的機器學習加速器。
5 A" \0 G( I5 |& X* H
5 U ]2 K2 y( z參考文獻
3 h8 n8 [% P+ J[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
: ~! p4 n) J+ r/ s$ kEND" R3 h J; v( ^8 C- z
; {8 G3 ~; ~ K
" m( [, Q0 _: N4 ]% W4 E
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
4 L+ G! W$ X, u點擊左下角"閱讀原文"馬上申請
! _+ k3 k. _2 @7 x) z6 _3 a6 L
4 F% |5 M) } r j歡迎轉載) d1 Q. D0 \3 I% I+ i4 u1 m3 G
( l9 G) S5 h# p- t K轉載請注明出處,請勿修改內容和刪除作者信息!9 w& \# V' h1 ~1 i) {
4 R" l& E4 T' v( e
. O4 ?0 R1 K i1 k
' f' i& U2 N6 {/ T# w
3xfam3wcrst64076736532.gif (16.04 KB, 下載次數(shù): 3)
下載附件
保存到相冊
3xfam3wcrst64076736532.gif
4 小時前 上傳
' Q1 t, ?! \8 k8 Y0 Q4 E( u# _( |" N
9 h( h0 E5 }* j
關注我們5 r4 @: H6 M$ r( }$ x7 Q8 q
) h0 X- S ?* b5 ~8 l6 U: Y# v1 c
! J" g0 y$ k* D {( p
vodpuva2mj564076736632.png (31.33 KB, 下載次數(shù): 4)
下載附件
保存到相冊
vodpuva2mj564076736632.png
4 小時前 上傳
" h0 h1 l1 J: f9 V |
3 ]! t: }7 G5 F# O9 J
u5is0s3sr5f64076736732.png (82.79 KB, 下載次數(shù): 4)
下載附件
保存到相冊
u5is0s3sr5f64076736732.png
4 小時前 上傳
1 Y6 O5 y% A/ ^6 K3 R/ `1 E3 R9 h$ L |
! e& e: ]$ J- V! {
txrhkjadsy064076736832.png (21.52 KB, 下載次數(shù): 3)
下載附件
保存到相冊
txrhkjadsy064076736832.png
4 小時前 上傳
* b! T& q' G0 X
| & q$ m, D7 u6 E l2 `* c2 w
# }, [4 }0 F% P! i* a- ~
/ A8 E% |3 I; V+ \( `( _$ j- U& Q2 N) m+ h1 p) L
關于我們:8 H8 n" y- [8 b' j5 ~( [
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
8 i/ E) v: K) K2 _- h/ I5 `3 ?& n7 Y* U. V7 ^, [8 x' V8 G- P& x7 w
http://www.latitudeda.com/
% R0 q5 }. l5 @6 B, c(點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容) |
|