|
引言
0 U- v j9 R; s0 b9 o$ V* Q3 `基于可編程馬赫-曾德干涉儀(MZI)網(wǎng)格實現(xiàn)的光神經(jīng)網(wǎng)絡(luò)(ONN)已成為加速機器學習計算的方法。本文概述了基于MZI的光處理器,重點介紹了兩種關(guān)鍵架構(gòu) - Reck網(wǎng)格和Diamond網(wǎng)格,并分析了實現(xiàn)ONN的性能。
8 R8 \; J% ^1 x2 E
! {7 T' L$ L, Y& R" WMZI光處理器基礎(chǔ)
8 A0 Y2 E. v; W9 o, S5 L( j, U) w p光處理器的基本構(gòu)建模塊是2x2可重構(gòu)MZI,如圖11所示。由兩個3-dB耦合器組成,帶有可調(diào)相移器θ和φ,用于控制功率分配比和兩個輸出之間的相對相位。
+ x* A2 |; F9 p
oopqxrhyxww64076734929.png (420.64 KB, 下載次數(shù): 6)
下載附件
保存到相冊
oopqxrhyxww64076734929.png
6 小時前 上傳
& H% X- c/ S, S8 R9 Z. y
圖1:具有可調(diào)相移器θ和φ的2x2可重構(gòu)MZI示意圖。
# k/ j% \2 z7 `- p9 \' Q& H
; e7 M( M ^7 G5 w: f單個MZI的單一轉(zhuǎn)移矩陣由下式給出:* F% w F8 T1 F- z/ z* t9 |
3potgicok5u64076735029.png (106.42 KB, 下載次數(shù): 7)
下載附件
保存到相冊
3potgicok5u64076735029.png
6 小時前 上傳
9 m1 z+ @" x; I& k8 a' |: C' {- u
; y6 \" r: c, [8 a9 X2 H
通過在網(wǎng)格中級聯(lián)多個MZI,可以實現(xiàn)更大的單一變換。圖2所示的4x4處理器的Reck網(wǎng)格是一種三角形排列,可使用6個MZI實現(xiàn)任何4x4單一矩陣。
/ }. }7 p7 o* S2 [- |; |
# ]. f1 r% E: i
bbtbhgtws5d64076735129.png (84.74 KB, 下載次數(shù): 8)
下載附件
保存到相冊
bbtbhgtws5d64076735129.png
6 小時前 上傳
4 y* u/ X! o a4 k; c# _
圖2:由6個MZI組成的4x4 Reck網(wǎng)格光處理器示意圖。
6 t R& ]% p6 b- _
& _+ x7 @. t+ H7 A( K9 \完整4x4 Reck處理器的單一矩陣由各個MZI矩陣的乘積給出:
8 c1 ], D# h% J8 N1 J% ^
v5gyerqtnfy64076735230.png (38.98 KB, 下載次數(shù): 7)
下載附件
保存到相冊
v5gyerqtnfy64076735230.png
6 小時前 上傳
2 B3 }! { |: F& ^1 Z
$ I: N4 L4 ^; Q7 i, H光處理器編程
. a% z1 S& \# O: ~/ N, P要對光處理器進行編程以實現(xiàn)所需的單一變換,必須確定每個MZI所需的相移。這是通過分解過程完成的,該過程將目標矩陣依次乘以逆MZI矩陣:
: U' z- j3 e, Y! R& H; R6 X& _( {
i2d2rtbjzyu64076735330.png (40.11 KB, 下載次數(shù): 6)
下載附件
保存到相冊
i2d2rtbjzyu64076735330.png
6 小時前 上傳
, I' G0 S7 E& m5 k/ M
) l" A5 T: J# r# k, z& v+ G通過在每個步驟中將非對角元素設(shè)置為零,可以提取所需的相移。圖3顯示了4x4 Reck網(wǎng)格在此分解過程中考慮MZI的順序。
+ J7 K; z# K, N
x5rbbssmxsr64076735430.png (146.39 KB, 下載次數(shù): 8)
下載附件
保存到相冊
x5rbbssmxsr64076735430.png
6 小時前 上傳
/ B0 U4 D8 e. ^" O* b9 x: @3 u* u0 z圖3:4x4 Reck網(wǎng)格中用于編程的MZI分解順序。6 ?) _4 |7 H1 _$ s! [3 b- p
3 H K% |5 {& h8 N. j6 Q4 B6 O0 n; x
光神經(jīng)網(wǎng)絡(luò)
8 Y _+ O/ L' \( ~7 C4 hONN利用這些可編程光處理器來實現(xiàn)神經(jīng)網(wǎng)絡(luò)層中的線性變換。圖4顯示了單層ONN的結(jié)構(gòu)。
/ l- i; p7 B# }+ A9 T7 }1 F
1ioqdxfr24i64076735530.png (222.16 KB, 下載次數(shù): 7)
下載附件
保存到相冊
1ioqdxfr24i64076735530.png
6 小時前 上傳
7 a1 }( x" a1 V# Z9 z, F& T4 `7 {4 l圖4:光學實現(xiàn)的單層神經(jīng)網(wǎng)絡(luò)示意圖。2 O2 {% W1 }6 u3 C) A
/ v: { C. |8 p5 R5 x( s光處理器實現(xiàn)權(quán)重矩陣W,而非線性激活函數(shù)通常以電子方式應用。對于分類任務,網(wǎng)絡(luò)接受多維輸入I0并為每個類別產(chǎn)生輸出概率。
* Q7 X$ z# Q+ X$ c& Q( Y' t1 B( J5 P
網(wǎng)絡(luò)使用反向傳播進行訓練,通過最小化均方誤差等損失函數(shù)來優(yōu)化權(quán)重矩陣:* X ~6 j7 y3 A0 b2 S- E& x
0jkfbzbd0vd64076735630.png (25.62 KB, 下載次數(shù): 8)
下載附件
保存到相冊
0jkfbzbd0vd64076735630.png
6 小時前 上傳
) _' P0 e4 N2 b) B! H) w$ R& i" w
. {( P4 k4 t2 [6 I2 E( w8 f圖5顯示了4類數(shù)據(jù)集示例和4x4 ONN的訓練過程。- a, J' {# M+ L
v1o45em4svh64076735730.png (253.27 KB, 下載次數(shù): 7)
下載附件
保存到相冊
v1o45em4svh64076735730.png
6 小時前 上傳
% d8 a7 Q( X% e& ]) P% [圖5:(a)4類高斯數(shù)據(jù)集和(b)顯示4x4 ONN的損失和準確度與訓練周期的關(guān)系的訓練過程。
) |7 X4 B. Q6 h& @& `2 [5 [+ R# B$ F# A; V8 P; M
Diamond網(wǎng)格架構(gòu)
4 D2 L9 r; v, v6 s9 G: h- g) {Reck網(wǎng)格可以實現(xiàn)任何單一矩陣,但對制造誤差和光損耗很敏感。為解決這個問題,提出了一種替代的Diamond網(wǎng)格架構(gòu),如圖6所示的4x4處理器。
" r. R+ Z. O1 I+ j, q
1qdmqy20vq364076735831.png (496.17 KB, 下載次數(shù): 7)
下載附件
保存到相冊
1qdmqy20vq364076735831.png
6 小時前 上傳
' H. X% A# J/ K8 D& T- u& _! s9 ~7 w圖6:具有9個MZI的4x4 Diamond網(wǎng)格光處理器示意圖。! G: i& O, j& T x, W' \8 Y
. T2 G0 \# H c' u
與相同大小的Reck網(wǎng)格相比,Diamond網(wǎng)格使用額外的N(N-1)(N-2)/2個MZI。這提供了幾個優(yōu)點:更對稱的拓撲結(jié)構(gòu),具有平衡的光路能夠?qū)⒉恍枰墓庵囟ㄏ虻筋~外的輸出優(yōu)化權(quán)重矩陣的額外自由度
) E# s8 u H; b' @5 X[/ol]
6 E2 s8 V7 f' @4 |: X4x4 Diamond處理器的單一矩陣由下式給出:: u( a+ R# g0 P- N3 S Z
1prnfvrpj5e64076735931.png (71.81 KB, 下載次數(shù): 6)
下載附件
保存到相冊
1prnfvrpj5e64076735931.png
6 小時前 上傳
' ~" h) h3 G z# ?
6 t! D D6 J6 h6 _% b可以使用與Reck網(wǎng)格類似的分解過程對其進行編程,遵循圖7所示的順序。
% I$ Y v! A4 z9 Z
zz1clakmcvm64076736031.png (236.55 KB, 下載次數(shù): 8)
下載附件
保存到相冊
zz1clakmcvm64076736031.png
6 小時前 上傳
3 W, ]+ r5 D6 u% x0 Y( t圖7:4x4 Diamond網(wǎng)格中用于編程的MZI分解順序。
4 L" `) H' A& c* m! S& \; C+ j4 Y- Z& t0 d2 l; R9 @ D) h
性能比較# u% X% f/ k+ M l: i) K
為比較Reck和Diamond架構(gòu),分析了各種大小的單層ONN的實現(xiàn)性能。圖8顯示了4x4處理器的分類準確度與相位誤差的關(guān)系。+ ~. R5 u! C/ _* n& t7 ~
rlujfeftugo64076736131.png (125.34 KB, 下載次數(shù): 7)
下載附件
保存到相冊
rlujfeftugo64076736131.png
6 小時前 上傳
7 E, j) L/ I3 A
圖8:4x4 Reck和Diamond ONN的分類準確度與相位誤差的關(guān)系,每個MZI的損耗為(a)0 dB和(b)1 dB。
. B/ ]3 a% G" o# \1 X& e" p: s: i7 s7 _4 ~6 m' U
Diamond網(wǎng)格對相位誤差表現(xiàn)出更好的魯棒性,尤其是在存在光損耗的情況下。這種優(yōu)勢在更大的網(wǎng)絡(luò)規(guī)模中變得更加明顯。5 H/ g' s& |6 h: Z6 d5 {& Q
, x# ^7 E) l2 ]) \: i1 b$ R. N圖9比較了不同大小處理器(最大64x64)的準確度與相位誤差的關(guān)系。# d/ [! z) j( d& k4 \
p0oz0wwbgf364076736231.png (416.84 KB, 下載次數(shù): 6)
下載附件
保存到相冊
p0oz0wwbgf364076736231.png
6 小時前 上傳
7 b* U0 z2 h& t# R
圖9:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與相位誤差的關(guān)系。
! u' l8 i; F1 ?1 y2 e) ~' s" M
( N" R2 f- v# V$ N' |1 L對于較大的網(wǎng)絡(luò),高精度區(qū)域縮小,但Diamond網(wǎng)格在所有尺寸上都保持更好的性能。
, ~ \ p" X2 r5 P! k @* G& r+ J
圖10將此分析擴展到包括每個MZI的光損耗影響。
! l9 [8 J' x% |7 h, q$ {- G
kagrofhrnyk64076736332.png (391.07 KB, 下載次數(shù): 7)
下載附件
保存到相冊
kagrofhrnyk64076736332.png
6 小時前 上傳
, n/ ~* a# G* q6 R; O3 N圖10:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準確度與損耗和相位誤差的關(guān)系。( c" R' R! o0 C9 d; E7 f/ e
. [% c& M2 ]/ s
再次,Diamond網(wǎng)格在所有網(wǎng)絡(luò)規(guī)模上表現(xiàn)出更優(yōu)的魯棒性。9 L7 R, \- b# |, ]) d$ U
! A/ H/ J; b/ v; u- Z
最后,圖11總結(jié)了不同網(wǎng)絡(luò)規(guī)模的兩個關(guān)鍵性能指標 - 性能指標(>75%準確度的區(qū)域)和訓練期間達到的最終損失值。+ B4 T( ?. O9 A+ B5 E* X
ry5kcbvddlr64076736432.png (92.32 KB, 下載次數(shù): 7)
下載附件
保存到相冊
ry5kcbvddlr64076736432.png
6 小時前 上傳
+ w- ]5 q! k# e9 {4 Y
圖11:不同大小的Reck和Diamond ONN的(a)性能指標和(b)最終損失值比較。7 v0 D% {) O& O/ v0 |- {$ K! f
) J }+ |% F1 `- e* w
Diamond網(wǎng)格在這兩個指標上始終優(yōu)于Reck網(wǎng)格,優(yōu)勢隨網(wǎng)絡(luò)規(guī)模增大而增加。
; C$ |7 }4 C2 B* b( B* r- f1 \7 o4 }8 w8 Y
結(jié)論
# H+ ]0 ]# n4 B基于可編程MZI的光處理器為實現(xiàn)ONN和加速機器學習計算提供了有前途的平臺。Reck網(wǎng)格提供了可實現(xiàn)任何單一變換的緊湊設(shè)計,但Diamond網(wǎng)格提高了對制造誤差和光損耗的魯棒性。這使Diamond架構(gòu)更適合實際的大規(guī)模ONN。硅基光電子制造和架構(gòu)設(shè)計的持續(xù)進步可能會進一步提高這些光處理器的性能,有望實現(xiàn)新一類超快速、節(jié)能的機器學習加速器。
# }0 f- z' M0 T5 T- a5 p. p; `: Q2 o( ?% D0 h, Y- H( `
參考文獻
4 K% j, t( S% m* ^[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.. h1 F6 x: ^7 X0 L! ^
END; I, `* C4 g/ T- W$ U6 O# S
/ i% B$ ^9 t$ A0 d" ^6 H
4 K/ O" ^' V2 Q# w! Y
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。7 j1 {1 c2 n4 r: v3 x" b# p
點擊左下角"閱讀原文"馬上申請: E" q! c2 p! L5 d: j
8 o# f$ K' S% }; A* N: u7 ]6 { P0 [歡迎轉(zhuǎn)載% Q1 ~7 U9 a( S8 W
( Z6 ?6 }+ p( z' {3 A& p$ @2 z轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!5 l) X. n/ }! G5 x8 n$ r) n
" x4 p4 H! ~( ?% q9 t; ~
- u, G& B$ r. {2 U X1 a( _
3 t* q+ l- B- K. m
3xfam3wcrst64076736532.gif (16.04 KB, 下載次數(shù): 6)
下載附件
保存到相冊
3xfam3wcrst64076736532.gif
6 小時前 上傳
3 `3 R4 v2 k2 n8 |& _
7 K% _) ?, @4 @0 Y: Q6 E" ]關(guān)注我們
- L A% v0 T5 K5 i- r
1 N' C; g P3 `0 x
$ p1 P5 `2 `3 C, l" c, g5 D u
vodpuva2mj564076736632.png (31.33 KB, 下載次數(shù): 7)
下載附件
保存到相冊
vodpuva2mj564076736632.png
6 小時前 上傳
6 r' J$ c$ G) o# o& Q' k
| & S0 s* Y5 P: L, I
u5is0s3sr5f64076736732.png (82.79 KB, 下載次數(shù): 8)
下載附件
保存到相冊
u5is0s3sr5f64076736732.png
6 小時前 上傳
/ s# T, V$ ]5 [
| , V/ C+ f6 ~! N6 W7 i
txrhkjadsy064076736832.png (21.52 KB, 下載次數(shù): 7)
下載附件
保存到相冊
txrhkjadsy064076736832.png
6 小時前 上傳
2 j+ c# o9 z9 I8 ~+ l% n+ W | : U6 X" Z2 w/ }$ f6 M! a* r% H5 s
% R, @, [+ T5 x% R9 D7 N9 l
6 R* o! v& S: o/ O l8 ~8 P+ @ U
5 o5 M, O* v4 z+ d7 y8 Y關(guān)于我們:2 B4 Y m8 _4 O0 j6 I D
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務。
: U; G8 Y- W5 q- f) a: ]2 N0 o# `! M' s# t6 L% ], J/ V& L
http://www.latitudeda.com/; V9 X8 Z. L4 R! ?7 R# F! }
(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|