|
引言隨著深度神經網絡(DNNs)在各種應用中變得越來越復雜和普遍,對高效硬件加速器的需求比以往任何時候都更為迫切。在后摩爾定律時代,傳統(tǒng)電子加速器面臨著基本限制,在帶寬和能效方面造成瓶頸。硅基光電子技術應運而生,可為深度學習加速提供節(jié)能、超高帶寬和低延遲的解決方案。) B Q1 b5 T+ N7 z
本文介紹CrossLight,新型硅基光電子神經網絡加速器,通過跨層設計方法解決光計算中的關鍵挑戰(zhàn)。將探討光計算的基礎知識、CrossLight的架構以及與最先進加速器的性能比較。) `5 R, w* N; |, x* f3 Q
$ K V9 ~' r4 Y. X/ o6 R光計算基礎
! b1 E( |' b5 V6 [/ E- L在深入了解CrossLight之前,讓我們先了解深度學習光計算的基礎知識。光加速器通常使用廣播和權重(B&W)配置來執(zhí)行矩陣-矢量乘法,這對DNN中的卷積(CONV)和全連接(FC)層都是必不可少的。; }- L: B( p2 N$ F6 w b
u5t5b2alz3y6401283547.png (266.63 KB, 下載次數(shù): 2)
下載附件
保存到相冊
u5t5b2alz3y6401283547.png
2024-9-6 13:32 上傳
' ` K! x( b+ T+ c' ^$ b7 B
圖1顯示了基于非相干廣播和權重(B&W)的光電子神經元配置。3 F# F9 r/ b9 n8 a& {* P2 @' ~( S
在此配置中,輸入值通過調制器印刻在不同波長的光上。然后,這些波長被合并并分成多個分支,每個分支由微環(huán)諧振器(MRs)加權。加權信號通過光電探測器求和,完成矩陣-矢量乘法運算。
2 N' g# @3 X: ^, x9 \. `) r" p這種設置中的關鍵組件是微環(huán)諧振器(MR)。MR可以調諧以改變特定波長的能量,有效地在光域中實現(xiàn)乘法運算。
7 C5 l, K: v% j: f) y* i; K7 wCrossLight架構0 \4 O' ?# W' [6 Y# u# e9 a
CrossLight采用跨層方法優(yōu)化光加速,解決設備、線路和架構層面的挑戰(zhàn)。$ i7 f3 X! P: o0 P; P: d8 c
r440eh0t2ow6401283647.png (471 KB, 下載次數(shù): 0)
下載附件
保存到相冊
r440eh0t2ow6401283647.png
2024-9-6 13:32 上傳
- H3 Y5 {1 ?) K( c圖2展示了CrossLight非相干硅基光電子神經網絡加速器的高級概述。% l. E9 P# M( Z1 s
設備級優(yōu)化在設備級別,CrossLight引入了優(yōu)化的MR設計,對制造工藝變化(FPVs)更具彈性。通過全面的設計空間探索,研究人員發(fā)現(xiàn),使用400納米的輸入波導寬度和800納米的環(huán)形波導寬度可以將由FPV引起的不期望的諧振波長偏移減少70%。0 M* Z* V+ ]0 I; d' f& G
線路級優(yōu)化為解決緊密排列的MR之間的熱串擾問題,CrossLight采用了結合熱光(TO)和電光(EO)調諧的混合調諧方法。與傳統(tǒng)的僅TO調諧方法相比,這種方法可以實現(xiàn)更快的操作速度和更低的功耗。3 @0 t& {+ o9 p( i& o( y, i* V9 f1 h
此外,CrossLight采用了稱為熱特征分解(TED)的方法,可以集體調諧MR組中的所有MR,有效地以較低的功耗消除熱串擾效應。& x! v1 _$ c$ r+ K0 d/ }8 {& M
gosr1kbepbz6401283747.png (237.02 KB, 下載次數(shù): 1)
下載附件
保存到相冊
gosr1kbepbz6401283747.png
2024-9-6 13:32 上傳
) M, X7 V: g& U8 Z% n+ M
圖3顯示了10個制造的MR塊中相鄰MR對之間距離可變時的相位串擾比和調諧功耗。
( s/ w# B1 Q# V& o架構級優(yōu)化CrossLight為CONV和FC層加速引入了單獨的矢量點積(VDP)單元,認識到這些層的不同計算需求。這種分離允許更高效地處理這兩種類型的層。0 a' ^! d9 W4 h5 ?+ A' v0 R: R
該架構還在VDP單元內實現(xiàn)了波長重用策略,減少了所需的激光器總數(shù),從而降低了功耗。通過將較大的矢量分解為較小的矢量,并在VDP單元內的多個分支上執(zhí)行并行計算,CrossLight在并行性和激光器功率需求之間實現(xiàn)了平衡。
. ~6 w+ w& G+ o6 f- y& C0 O性能分析為評估CrossLight的性能,研究人員使用四個不同復雜度的DNN模型進行了廣泛的模擬。7 Y9 ?, j& P0 a& I% W7 u4 y. g
分辨率分析CrossLight的一個主要優(yōu)勢是能夠實現(xiàn)高分辨率計算。雖然一些光加速器限制在2-4位分辨率,但CrossLight可以為其MR組實現(xiàn)高達16位的分辨率。
* t4 o+ C" G1 @- C! D' }2 D
wcmaphexdg16401283847.png (222.75 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wcmaphexdg16401283847.png
2024-9-6 13:32 上傳
/ [* r3 R8 c9 p/ r圖4演示了四個DNN模型在權重和激活的量化(分辨率)范圍從1位到16位時的推理準確性。0 m* t# i B. i7 ? w* a$ e9 O
這種高分辨率對于維持模型準確性很重要,特別是對于在具有挑戰(zhàn)性的數(shù)據集上訓練的復雜模型。) g2 W* O7 v6 L/ f' D
敏感性分析研究人員進行了敏感性分析,以確定CrossLight的最佳配置,改變CONV和FC層加速器的VDP單元的數(shù)量和復雜度。
* u6 n/ [& `( I2 C+ c$ Y {9 Q8 ~
povttnqyf1r6401283947.png (255.44 KB, 下載次數(shù): 2)
下載附件
保存到相冊
povttnqyf1r6401283947.png
2024-9-6 13:32 上傳
! z# o& M- F1 }. d, ]1 k7 a
圖5是散點圖,顯示了各種CrossLight配置的平均每秒幀數(shù)(FPS)與平均每比特能耗(EPB)與面積的關系。
8 ^- A |- h; i最佳配置是基于最高的FPS/EPB比率選擇的,平衡了性能和能效。
7 g/ z- \& I% c. s與最先進加速器的比較CrossLight與兩個著名的光加速器(DEAP-CNN和Holylight)以及幾個電子加速器(包括GPU和CPU)進行了比較。
2 Z* [0 E4 a- L' v/ Z0 W1 t6 p
o1mo3m44ri06401284047.png (125.24 KB, 下載次數(shù): 2)
下載附件
保存到相冊
o1mo3m44ri06401284047.png
2024-9-6 13:32 上傳
1 a7 Q, d1 b' b; j3 p$ p
圖6比較了CrossLight各變體與光電子和電子加速器平臺的功耗。! |1 i3 _5 t3 J
結果顯示,CrossLight,特別是在優(yōu)化配置(Cross_opt_TED)中,實現(xiàn)了比其他光加速器和傳統(tǒng)CPU/GPU平臺更低的功耗,盡管功耗仍高于一些專用電子加速器。( e5 ]; |( y9 U% v w
, J: R. \1 |" u1 l) A* p
s5pbjcfws456401284147.png (120.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊
s5pbjcfws456401284147.png
2024-9-6 13:32 上傳
9 f/ ]* b7 i/ c) M+ d; U% `* S) h3 }圖7比較了光電子DNN加速器的每比特能耗(EPB)值。
, V- D" s- {. z% ^在能效方面,CrossLight顯著優(yōu)于其他光加速器,平均比DEAP-CNN和Holylight分別低1544倍和9.5倍的EPB。
0 i) g+ S+ E4 n7 LCrossLight的性能優(yōu)勢源于全面考慮了光系統(tǒng)中的各種損耗和串擾,以及在設備、線路和架構層面采用新方法來減輕影響。" v3 o5 L% L8 P1 K
結論CrossLight展示了光電子神經網絡加速器中跨層優(yōu)化的潛力。通過解決硬件棧多個層面的挑戰(zhàn),與最先進的光電子和電子加速器相比,在能效和每瓦性能方面實現(xiàn)了顯著改進。
4 J$ A2 | p* e: Y8 c隨著硅基光電子制造工藝的不斷成熟,我們可以期待設備調諧成本、損耗和激光器功率開銷進一步降低。這一趨勢可能會加強光域加速器在深度學習推理任務中的地位。
0 w5 Q# t4 q; ACrossLight的成功突出了在設計下一代硬件加速器時采用全面、跨層方法的重要性。隨著我們推動人工智能和機器學習的邊界,這種創(chuàng)新架構將在實現(xiàn)更高效和強大的計算系統(tǒng)方面發(fā)揮關鍵作用。" O }5 k4 |/ g6 W& O
參考文獻[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
4 b/ X9 B; d L5 r- END -! T/ y- V% h3 @, ?8 W1 U
* h% V ~4 @6 b, b f軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
' H; r: M1 g/ K* j. x點擊左下角"閱讀原文"馬上申請- Q9 a+ O9 n5 ~
: t9 T# W3 R& c, A0 |9 x歡迎轉載
( E8 x9 a, X% i) [ z
; O G2 A" Z6 c% F: L3 C轉載請注明出處,請勿修改內容和刪除作者信息!' M3 {. c( @. d2 ^' P9 }
+ |) g" ~3 y/ j% E
2 |' F) R1 |2 c/ w5 K3 G
9 x# |- U/ v1 ^+ Y
t4fh1omw4bj6401284247.gif (16.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊
t4fh1omw4bj6401284247.gif
2024-9-6 13:32 上傳
( V1 ~# E g9 U& h y3 x
/ h5 f; S) b) p) f! X% c關注我們8 X7 \! f. b' H/ v3 Z: L
) K2 v) T/ l: L$ H/ W# _
+ A. x/ e+ [, G/ R3 _/ j0 a2 o5 X/ j
4fflkvqbpgm6401284347.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
4fflkvqbpgm6401284347.png
2024-9-6 13:32 上傳
D* P7 `* t' y. E" w
| . ^$ v5 _" A! ~
rnhb2dzvtyy6401284447.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊
rnhb2dzvtyy6401284447.png
2024-9-6 13:32 上傳
, Y! v4 W! A# b# L
| # J& G1 z" N2 U; v. v( _
2fgii0sxz4i6401284547.png (21.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊
2fgii0sxz4i6401284547.png
2024-9-6 13:32 上傳
7 N2 j6 y- R4 Y% h5 {
| & ]1 A' c* D' u! _$ }
" y; B* H( x2 [7 T/ E. m% g
7 R) I* ~9 ~; f( Q8 e3 W
( f5 ?, t. O) A/ h, @& D# Y& ]關于我們:6 S2 \8 v: A9 F+ C0 W+ h
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
( w2 J6 x# m/ ^4 [7 I2 L; A0 {
2 A5 o" v8 ?! _3 l/ {. E Uhttp://www.latitudeda.com/
% A: u. e2 g9 |' x8 U8 r G# i( s+ a(點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容) |
|