|
引言隨著深度神經(jīng)網(wǎng)絡(luò)(DNNs)在各種應用中變得越來越復雜和普遍,對高效硬件加速器的需求比以往任何時候都更為迫切。在后摩爾定律時代,傳統(tǒng)電子加速器面臨著基本限制,在帶寬和能效方面造成瓶頸。硅基光電子技術(shù)應運而生,可為深度學習加速提供節(jié)能、超高帶寬和低延遲的解決方案。
: w; g$ |5 _- O5 o- n本文介紹CrossLight,新型硅基光電子神經(jīng)網(wǎng)絡(luò)加速器,通過跨層設(shè)計方法解決光計算中的關(guān)鍵挑戰(zhàn)。將探討光計算的基礎(chǔ)知識、CrossLight的架構(gòu)以及與最先進加速器的性能比較。. m3 L, d* q8 k( {/ C& S. a
" s& E$ T5 _2 B4 V# e( r: Z0 n
光計算基礎(chǔ)' i0 [! |4 P, d# z9 i
在深入了解CrossLight之前,讓我們先了解深度學習光計算的基礎(chǔ)知識。光加速器通常使用廣播和權(quán)重(B&W)配置來執(zhí)行矩陣-矢量乘法,這對DNN中的卷積(CONV)和全連接(FC)層都是必不可少的。) k, T2 T. J8 o% h) \9 Y
4pv52a3kqku6407745425.png (266.63 KB, 下載次數(shù): 1)
下載附件
保存到相冊
4pv52a3kqku6407745425.png
2024-9-8 13:49 上傳
) l, q: N: \" H B
圖1顯示了基于非相干廣播和權(quán)重(B&W)的光電子神經(jīng)元配置。* ]* H1 u. v+ }5 V, b! j; |
在此配置中,輸入值通過調(diào)制器印刻在不同波長的光上。然后,這些波長被合并并分成多個分支,每個分支由微環(huán)諧振器(MRs)加權(quán)。加權(quán)信號通過光電探測器求和,完成矩陣-矢量乘法運算。
i* s0 s3 c2 M# p$ e$ x這種設(shè)置中的關(guān)鍵組件是微環(huán)諧振器(MR)。MR可以調(diào)諧以改變特定波長的能量,有效地在光域中實現(xiàn)乘法運算。
' ]8 f/ T; |3 S% w* W# r* d |- YCrossLight架構(gòu)( A# g T% }2 Z
CrossLight采用跨層方法優(yōu)化光加速,解決設(shè)備、線路和架構(gòu)層面的挑戰(zhàn)。
7 B5 |( U8 {7 {7 a5 r% B
hdv40znuf1f6407745525.png (471 KB, 下載次數(shù): 3)
下載附件
保存到相冊
hdv40znuf1f6407745525.png
2024-9-8 13:49 上傳
1 X8 ~+ z$ i( e/ @
圖2展示了CrossLight非相干硅基光電子神經(jīng)網(wǎng)絡(luò)加速器的高級概述。4 S3 C+ f- l1 o) J
設(shè)備級優(yōu)化在設(shè)備級別,CrossLight引入了優(yōu)化的MR設(shè)計,對制造工藝變化(FPVs)更具彈性。通過全面的設(shè)計空間探索,研究人員發(fā)現(xiàn),使用400納米的輸入波導寬度和800納米的環(huán)形波導寬度可以將由FPV引起的不期望的諧振波長偏移減少70%。
z* J/ Z- @8 m1 Y7 E線路級優(yōu)化為解決緊密排列的MR之間的熱串擾問題,CrossLight采用了結(jié)合熱光(TO)和電光(EO)調(diào)諧的混合調(diào)諧方法。與傳統(tǒng)的僅TO調(diào)諧方法相比,這種方法可以實現(xiàn)更快的操作速度和更低的功耗。! B4 S( }. s( n3 k
此外,CrossLight采用了稱為熱特征分解(TED)的方法,可以集體調(diào)諧MR組中的所有MR,有效地以較低的功耗消除熱串擾效應。( S9 S9 K8 A% x) B. z) d
1q2ag15zr5n6407745625.png (237.02 KB, 下載次數(shù): 3)
下載附件
保存到相冊
1q2ag15zr5n6407745625.png
2024-9-8 13:49 上傳
* v2 w% P3 B" l7 _: s5 {
圖3顯示了10個制造的MR塊中相鄰MR對之間距離可變時的相位串擾比和調(diào)諧功耗。
' h% [0 L7 F/ c7 Q; _架構(gòu)級優(yōu)化CrossLight為CONV和FC層加速引入了單獨的矢量點積(VDP)單元,認識到這些層的不同計算需求。這種分離允許更高效地處理這兩種類型的層。
/ I& Z( D9 d7 H0 i, l1 p. w' I該架構(gòu)還在VDP單元內(nèi)實現(xiàn)了波長重用策略,減少了所需的激光器總數(shù),從而降低了功耗。通過將較大的矢量分解為較小的矢量,并在VDP單元內(nèi)的多個分支上執(zhí)行并行計算,CrossLight在并行性和激光器功率需求之間實現(xiàn)了平衡。
1 O" j2 c. q6 W性能分析為評估CrossLight的性能,研究人員使用四個不同復雜度的DNN模型進行了廣泛的模擬。. v5 j. X- e" u8 }' r
分辨率分析CrossLight的一個主要優(yōu)勢是能夠?qū)崿F(xiàn)高分辨率計算。雖然一些光加速器限制在2-4位分辨率,但CrossLight可以為其MR組實現(xiàn)高達16位的分辨率。
3 Q- K+ m: E0 |* ?' t4 P# ~* F9 `
zk1xbolbcjt6407745726.png (222.75 KB, 下載次數(shù): 2)
下載附件
保存到相冊
zk1xbolbcjt6407745726.png
2024-9-8 13:49 上傳
+ Y$ I1 g2 z) M
圖4演示了四個DNN模型在權(quán)重和激活的量化(分辨率)范圍從1位到16位時的推理準確性。 ~" `- j6 \; S6 ]; V, M m, V3 Q
這種高分辨率對于維持模型準確性很重要,特別是對于在具有挑戰(zhàn)性的數(shù)據(jù)集上訓練的復雜模型。* G D& j$ y. t) W1 U
敏感性分析研究人員進行了敏感性分析,以確定CrossLight的最佳配置,改變CONV和FC層加速器的VDP單元的數(shù)量和復雜度。9 N6 W, A4 l% c* f1 D0 f
hgvq4apes4o6407745826.png (255.44 KB, 下載次數(shù): 3)
下載附件
保存到相冊
hgvq4apes4o6407745826.png
2024-9-8 13:49 上傳
0 F) q R2 K k# T圖5是散點圖,顯示了各種CrossLight配置的平均每秒幀數(shù)(FPS)與平均每比特能耗(EPB)與面積的關(guān)系。) x- ^' G7 V% L4 l' ^/ C' P! x2 d7 V
最佳配置是基于最高的FPS/EPB比率選擇的,平衡了性能和能效。
- C2 {7 a, H6 _! T( i1 Q5 F與最先進加速器的比較CrossLight與兩個著名的光加速器(DEAP-CNN和Holylight)以及幾個電子加速器(包括GPU和CPU)進行了比較。7 [3 R8 q8 `( r0 J+ a5 q
ds1gwxks5up6407745926.png (125.24 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ds1gwxks5up6407745926.png
2024-9-8 13:49 上傳
9 n4 Z8 ?5 h4 k8 m9 E圖6比較了CrossLight各變體與光電子和電子加速器平臺的功耗。
) a& O3 J n k4 H結(jié)果顯示,CrossLight,特別是在優(yōu)化配置(Cross_opt_TED)中,實現(xiàn)了比其他光加速器和傳統(tǒng)CPU/GPU平臺更低的功耗,盡管功耗仍高于一些專用電子加速器。
$ E4 P. h7 n+ J/ i9 Y( ~8 c8 ^& n) p
vk1wwklqxez6407746026.png (120.52 KB, 下載次數(shù): 3)
下載附件
保存到相冊
vk1wwklqxez6407746026.png
2024-9-8 13:49 上傳
! A5 m4 m; T" }) R7 Y* o1 l, x/ [
圖7比較了光電子DNN加速器的每比特能耗(EPB)值。; Y% A; z O8 U; \3 [6 q
在能效方面,CrossLight顯著優(yōu)于其他光加速器,平均比DEAP-CNN和Holylight分別低1544倍和9.5倍的EPB。
9 E' D3 j2 ]8 c" @0 q' C/ b2 C$ \CrossLight的性能優(yōu)勢源于全面考慮了光系統(tǒng)中的各種損耗和串擾,以及在設(shè)備、線路和架構(gòu)層面采用新方法來減輕影響。
* z" ~8 b# K# {. W7 c結(jié)論CrossLight展示了光電子神經(jīng)網(wǎng)絡(luò)加速器中跨層優(yōu)化的潛力。通過解決硬件棧多個層面的挑戰(zhàn),與最先進的光電子和電子加速器相比,在能效和每瓦性能方面實現(xiàn)了顯著改進。1 q) b J& y+ ?1 g3 V3 G
隨著硅基光電子制造工藝的不斷成熟,我們可以期待設(shè)備調(diào)諧成本、損耗和激光器功率開銷進一步降低。這一趨勢可能會加強光域加速器在深度學習推理任務中的地位。+ q1 H+ q; i$ P1 V0 l
CrossLight的成功突出了在設(shè)計下一代硬件加速器時采用全面、跨層方法的重要性。隨著我們推動人工智能和機器學習的邊界,這種創(chuàng)新架構(gòu)將在實現(xiàn)更高效和強大的計算系統(tǒng)方面發(fā)揮關(guān)鍵作用。$ E" e% W A9 H
參考文獻[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
9 F' k1 B7 F3 z& g# C5 i- END -
1 ]! z# V. F4 z6 ?9 q
6 K9 n7 D# q' D0 n: h軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。/ u6 M0 ]6 U0 F5 z! U
點擊左下角"閱讀原文"馬上申請8 s% a& a% ~: ?1 P; Y/ t
# e) Z" V9 O$ c歡迎轉(zhuǎn)載& w k5 m- x* M; C3 }/ z
8 Z# K/ g2 |' ]* D) Z, ^
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
6 Z- i q: V! m) T" S( c P; {( n. D$ q" n" r# G
( m5 M% F* H+ V( f; B! }1 x0 v# f: Y; d: i5 [. ^
2nxeukl4gmg6407746126.gif (16.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊
2nxeukl4gmg6407746126.gif
2024-9-8 13:49 上傳
6 U `5 R2 u! X8 T' F: F$ R! x
. y4 d2 }! `& _8 k& A; k5 u關(guān)注我們
; y' }5 Q+ h8 ], ]8 l: D
9 s3 f6 @/ n5 B4 c; o& V: f2 N6 j0 O) t8 q# z, L' }, z6 m
urjgobttdj46407746226.png (31.33 KB, 下載次數(shù): 3)
下載附件
保存到相冊
urjgobttdj46407746226.png
2024-9-8 13:49 上傳
7 d; E1 B1 {& Z, }
| ) x: C( C' j# |3 o: L! w
p1gldr1aa3m6407746326.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊
p1gldr1aa3m6407746326.png
2024-9-8 13:49 上傳
0 r9 I: L+ ?" | |
) f% H9 A6 R. T2 w. |& D; G
k5zvs42z5od6407746426.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
k5zvs42z5od6407746426.png
2024-9-8 13:49 上傳
; B/ n. P Q7 q) i4 D8 f
| , r; s5 D8 n0 a! V' A" L. l5 B
2 t: [# g% ?/ s( n$ N' W
# p2 k( v& i% O$ v7 _3 n5 @9 @5 A; [1 P4 O
關(guān)于我們:% w- r+ `8 U3 G Z$ }# A" j
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務。
: {1 l7 l; W7 X
7 w T0 B1 u8 Mhttp://www.latitudeda.com/8 i1 t+ n+ N T6 Z _( O2 q8 ?5 [
(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|