|
引言隨著深度神經(jīng)網(wǎng)絡(DNNs)在各種應用中變得越來越復雜和普遍,對高效硬件加速器的需求比以往任何時候都更為迫切。在后摩爾定律時代,傳統(tǒng)電子加速器面臨著基本限制,在帶寬和能效方面造成瓶頸。硅基光電子技術應運而生,可為深度學習加速提供節(jié)能、超高帶寬和低延遲的解決方案。
2 ~; D3 X7 t, @7 p# N/ {本文介紹CrossLight,新型硅基光電子神經(jīng)網(wǎng)絡加速器,通過跨層設計方法解決光計算中的關鍵挑戰(zhàn)。將探討光計算的基礎知識、CrossLight的架構以及與最先進加速器的性能比較。
! d% K( C% k7 T+ i. u5 R! S% G, u5 y* ^6 N& b8 n
光計算基礎
+ g8 c- |0 ` k) m- v/ S' |6 B在深入了解CrossLight之前,讓我們先了解深度學習光計算的基礎知識。光加速器通常使用廣播和權重(B&W)配置來執(zhí)行矩陣-矢量乘法,這對DNN中的卷積(CONV)和全連接(FC)層都是必不可少的。: A: L. ^% ^3 _
vndjbb4wr4k6405695118.png (266.63 KB, 下載次數(shù): 2)
下載附件
保存到相冊
vndjbb4wr4k6405695118.png
2024-9-4 13:39 上傳
: t6 M" N. I ~" R& A7 t圖1顯示了基于非相干廣播和權重(B&W)的光電子神經(jīng)元配置。9 V8 U+ j5 Q; [+ r6 ^' w+ G
在此配置中,輸入值通過調(diào)制器印刻在不同波長的光上。然后,這些波長被合并并分成多個分支,每個分支由微環(huán)諧振器(MRs)加權。加權信號通過光電探測器求和,完成矩陣-矢量乘法運算。: v# N0 l" p* r2 U* O& e
這種設置中的關鍵組件是微環(huán)諧振器(MR)。MR可以調(diào)諧以改變特定波長的能量,有效地在光域中實現(xiàn)乘法運算。
* H7 m) w+ ^+ \2 GCrossLight架構; \+ a( o; [- j
CrossLight采用跨層方法優(yōu)化光加速,解決設備、線路和架構層面的挑戰(zhàn)。
$ B- x% K5 k7 X% p' L8 l2 ?. R
rcw4xofdo3b6405695218.png (471 KB, 下載次數(shù): 1)
下載附件
保存到相冊
rcw4xofdo3b6405695218.png
2024-9-4 13:39 上傳
( C- L' m% k6 m( N; E5 J
圖2展示了CrossLight非相干硅基光電子神經(jīng)網(wǎng)絡加速器的高級概述。
: A3 P2 ]. R1 n: x$ z設備級優(yōu)化在設備級別,CrossLight引入了優(yōu)化的MR設計,對制造工藝變化(FPVs)更具彈性。通過全面的設計空間探索,研究人員發(fā)現(xiàn),使用400納米的輸入波導寬度和800納米的環(huán)形波導寬度可以將由FPV引起的不期望的諧振波長偏移減少70%。% m# o7 k9 i4 t3 K
線路級優(yōu)化為解決緊密排列的MR之間的熱串擾問題,CrossLight采用了結合熱光(TO)和電光(EO)調(diào)諧的混合調(diào)諧方法。與傳統(tǒng)的僅TO調(diào)諧方法相比,這種方法可以實現(xiàn)更快的操作速度和更低的功耗。- L0 {4 [! B {6 A. p! b- q4 |
此外,CrossLight采用了稱為熱特征分解(TED)的方法,可以集體調(diào)諧MR組中的所有MR,有效地以較低的功耗消除熱串擾效應。
6 X5 S7 [) |( u' H: f! p
a1mbmdzge1b6405695318.png (237.02 KB, 下載次數(shù): 2)
下載附件
保存到相冊
a1mbmdzge1b6405695318.png
2024-9-4 13:39 上傳
$ T; k$ _7 Y% r% i( {
圖3顯示了10個制造的MR塊中相鄰MR對之間距離可變時的相位串擾比和調(diào)諧功耗。
. s% u: r: m+ N/ L% F架構級優(yōu)化CrossLight為CONV和FC層加速引入了單獨的矢量點積(VDP)單元,認識到這些層的不同計算需求。這種分離允許更高效地處理這兩種類型的層。- X+ ?: f, u% n8 [
該架構還在VDP單元內(nèi)實現(xiàn)了波長重用策略,減少了所需的激光器總數(shù),從而降低了功耗。通過將較大的矢量分解為較小的矢量,并在VDP單元內(nèi)的多個分支上執(zhí)行并行計算,CrossLight在并行性和激光器功率需求之間實現(xiàn)了平衡。 C' s- L- ~8 V2 c$ t( C* s
性能分析為評估CrossLight的性能,研究人員使用四個不同復雜度的DNN模型進行了廣泛的模擬。2 w9 v" @0 z l1 Q& m/ z# W
分辨率分析CrossLight的一個主要優(yōu)勢是能夠?qū)崿F(xiàn)高分辨率計算。雖然一些光加速器限制在2-4位分辨率,但CrossLight可以為其MR組實現(xiàn)高達16位的分辨率。
+ n0 [) s7 d/ b/ c$ }1 D5 C
ajq0l4vbmzq6405695418.png (222.75 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ajq0l4vbmzq6405695418.png
2024-9-4 13:39 上傳
& w" K2 D1 y9 i7 {# L; A
圖4演示了四個DNN模型在權重和激活的量化(分辨率)范圍從1位到16位時的推理準確性。
1 c( x& k. s4 c% N- t% v& `) m這種高分辨率對于維持模型準確性很重要,特別是對于在具有挑戰(zhàn)性的數(shù)據(jù)集上訓練的復雜模型。/ x. ^3 a# [ {0 r
敏感性分析研究人員進行了敏感性分析,以確定CrossLight的最佳配置,改變CONV和FC層加速器的VDP單元的數(shù)量和復雜度。3 w3 S% j1 `# g% [( l+ R& A
yipnw3evhz36405695518.png (255.44 KB, 下載次數(shù): 2)
下載附件
保存到相冊
yipnw3evhz36405695518.png
2024-9-4 13:39 上傳
2 b) I9 l a8 G2 {2 k r
圖5是散點圖,顯示了各種CrossLight配置的平均每秒幀數(shù)(FPS)與平均每比特能耗(EPB)與面積的關系。" m+ d3 ]" p$ e4 l( \0 T
最佳配置是基于最高的FPS/EPB比率選擇的,平衡了性能和能效。- ?3 v4 F W5 e
與最先進加速器的比較CrossLight與兩個著名的光加速器(DEAP-CNN和Holylight)以及幾個電子加速器(包括GPU和CPU)進行了比較。- y, o0 Y: s' F' y) E o; K
mtx404baupp6405695619.png (125.24 KB, 下載次數(shù): 3)
下載附件
保存到相冊
mtx404baupp6405695619.png
2024-9-4 13:39 上傳
) }* K" r/ b* O7 L& T
圖6比較了CrossLight各變體與光電子和電子加速器平臺的功耗。
% s0 S k3 P/ t- a8 G2 N結果顯示,CrossLight,特別是在優(yōu)化配置(Cross_opt_TED)中,實現(xiàn)了比其他光加速器和傳統(tǒng)CPU/GPU平臺更低的功耗,盡管功耗仍高于一些專用電子加速器。
* V8 U% O; x7 u5 f. U8 B# {8 F' j& s4 i: d8 t0 P
1gbbpwqp4hk6405695719.png (120.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
1gbbpwqp4hk6405695719.png
2024-9-4 13:39 上傳
/ P9 r- p# k2 S/ \6 K
圖7比較了光電子DNN加速器的每比特能耗(EPB)值。
Y, d7 b7 Y& G! s6 ` H! @在能效方面,CrossLight顯著優(yōu)于其他光加速器,平均比DEAP-CNN和Holylight分別低1544倍和9.5倍的EPB。
# g# q' `) M& k: C" B: yCrossLight的性能優(yōu)勢源于全面考慮了光系統(tǒng)中的各種損耗和串擾,以及在設備、線路和架構層面采用新方法來減輕影響。
/ l& ?, D6 H5 _1 }* `* a7 G& j結論CrossLight展示了光電子神經(jīng)網(wǎng)絡加速器中跨層優(yōu)化的潛力。通過解決硬件棧多個層面的挑戰(zhàn),與最先進的光電子和電子加速器相比,在能效和每瓦性能方面實現(xiàn)了顯著改進。
& d7 L7 G2 g0 C! m7 |" A隨著硅基光電子制造工藝的不斷成熟,我們可以期待設備調(diào)諧成本、損耗和激光器功率開銷進一步降低。這一趨勢可能會加強光域加速器在深度學習推理任務中的地位。2 v3 j" D9 T0 N
CrossLight的成功突出了在設計下一代硬件加速器時采用全面、跨層方法的重要性。隨著我們推動人工智能和機器學習的邊界,這種創(chuàng)新架構將在實現(xiàn)更高效和強大的計算系統(tǒng)方面發(fā)揮關鍵作用。
; y7 I; D3 Z* l參考文獻[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.6 c1 A- `4 `/ P
- END -5 J& c! m9 p2 L: `( U
' n" m. t/ J2 y9 j: f軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。: `# [/ b. t3 T6 G+ g3 S# r
點擊左下角"閱讀原文"馬上申請
' e+ D7 m: n. L. ^* u, ~ K7 O* i
0 v- ?! z) S# [9 q' M2 Q, h歡迎轉(zhuǎn)載
# P4 N( I: h" A/ i8 V: Q! ^) _8 X- h7 n& t, K$ s j% h+ P
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
4 n1 c/ I5 X6 e$ Q5 l; W# q5 K! u# O: }4 G/ s, \, M4 W6 t+ [% n
- i. O4 z. R/ p& |5 Y6 i& u
9 F, p# W0 \5 U0 S, ]
i04sdcaxjtp6405695819.gif (16.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊
i04sdcaxjtp6405695819.gif
2024-9-4 13:39 上傳
- p2 P/ ~/ J; x E
) s: Z% Z( w0 y# I* ?( H8 T關注我們2 {6 E& A5 Z/ n% M& c2 e
5 I9 M2 B# Q1 Q
2 `# b3 Z' W) I9 W5 n# S
fhdji2uy4fr6405695919.png (31.33 KB, 下載次數(shù): 2)
下載附件
保存到相冊
fhdji2uy4fr6405695919.png
2024-9-4 13:39 上傳
$ M! u5 K; z# b5 ?7 a. b7 D |
. A+ O8 `8 Q) U4 G" [5 S2 k
toe11bamh4p6405696019.png (82.79 KB, 下載次數(shù): 3)
下載附件
保存到相冊
toe11bamh4p6405696019.png
2024-9-4 13:39 上傳
# |2 }0 H7 a& M" N3 [6 N- ^+ ^ |
z# t: L. T. Y, ], k9 f
wyfszhdjarq6405696119.png (21.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wyfszhdjarq6405696119.png
2024-9-4 13:39 上傳
1 P6 _ U7 Y0 u! ~& x. P7 s6 I- Q1 G
| ! x( \8 c, ]0 g$ k) q, f% j- U( H
' Y* v( N& K% O% |, c8 _
! N! k3 k$ w" g1 h4 F y) f* W6 l# A9 q) a
關于我們:
- |; |8 l, r* R2 H# \! Q; o& y! D深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。% w J, n y: i0 J! }
* Q0 U. g' K6 ^2 Ehttp://www.latitudeda.com/
8 e2 T" s; n/ y" O7 t(點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|