|
引言隨著深度神經(jīng)網(wǎng)絡(luò)(DNNs)在各種應(yīng)用中變得越來越復(fù)雜和普遍,對高效硬件加速器的需求比以往任何時候都更為迫切。在后摩爾定律時代,傳統(tǒng)電子加速器面臨著基本限制,在帶寬和能效方面造成瓶頸。硅基光電子技術(shù)應(yīng)運(yùn)而生,可為深度學(xué)習(xí)加速提供節(jié)能、超高帶寬和低延遲的解決方案。+ A P2 p$ H& Y
本文介紹CrossLight,新型硅基光電子神經(jīng)網(wǎng)絡(luò)加速器,通過跨層設(shè)計方法解決光計算中的關(guān)鍵挑戰(zhàn)。將探討光計算的基礎(chǔ)知識、CrossLight的架構(gòu)以及與最先進(jìn)加速器的性能比較。4 q Y4 P- ?; _1 @, R/ I
7 ~4 _6 ?, E! r& W6 [
光計算基礎(chǔ)8 b* P' j5 _: W0 X3 o2 R
在深入了解CrossLight之前,讓我們先了解深度學(xué)習(xí)光計算的基礎(chǔ)知識。光加速器通常使用廣播和權(quán)重(B&W)配置來執(zhí)行矩陣-矢量乘法,這對DNN中的卷積(CONV)和全連接(FC)層都是必不可少的。4 T! F4 o# r/ x0 l" A6 s
vndjbb4wr4k6405695118.png (266.63 KB, 下載次數(shù): 0)
下載附件
保存到相冊
vndjbb4wr4k6405695118.png
2024-9-4 13:39 上傳
& d" B! Q& N' h9 V0 @
圖1顯示了基于非相干廣播和權(quán)重(B&W)的光電子神經(jīng)元配置。9 _5 l/ [; j. y
在此配置中,輸入值通過調(diào)制器印刻在不同波長的光上。然后,這些波長被合并并分成多個分支,每個分支由微環(huán)諧振器(MRs)加權(quán)。加權(quán)信號通過光電探測器求和,完成矩陣-矢量乘法運(yùn)算。8 O9 `2 \* v8 N* S" d
這種設(shè)置中的關(guān)鍵組件是微環(huán)諧振器(MR)。MR可以調(diào)諧以改變特定波長的能量,有效地在光域中實(shí)現(xiàn)乘法運(yùn)算。4 ~$ B4 |0 Q: @+ m
CrossLight架構(gòu)
! k. k e- c8 Y7 k( aCrossLight采用跨層方法優(yōu)化光加速,解決設(shè)備、線路和架構(gòu)層面的挑戰(zhàn)。
T) q7 \. F3 W" f
rcw4xofdo3b6405695218.png (471 KB, 下載次數(shù): 0)
下載附件
保存到相冊
rcw4xofdo3b6405695218.png
2024-9-4 13:39 上傳
# [! p! X* z. Q- s% \) h6 c; M
圖2展示了CrossLight非相干硅基光電子神經(jīng)網(wǎng)絡(luò)加速器的高級概述。8 i# c% V( V& I# I& a0 @6 Q& j, @
設(shè)備級優(yōu)化在設(shè)備級別,CrossLight引入了優(yōu)化的MR設(shè)計,對制造工藝變化(FPVs)更具彈性。通過全面的設(shè)計空間探索,研究人員發(fā)現(xiàn),使用400納米的輸入波導(dǎo)寬度和800納米的環(huán)形波導(dǎo)寬度可以將由FPV引起的不期望的諧振波長偏移減少70%。
9 }- W! ?8 _/ K+ G線路級優(yōu)化為解決緊密排列的MR之間的熱串?dāng)_問題,CrossLight采用了結(jié)合熱光(TO)和電光(EO)調(diào)諧的混合調(diào)諧方法。與傳統(tǒng)的僅TO調(diào)諧方法相比,這種方法可以實(shí)現(xiàn)更快的操作速度和更低的功耗。2 s6 z; H2 _# h- a6 J
此外,CrossLight采用了稱為熱特征分解(TED)的方法,可以集體調(diào)諧MR組中的所有MR,有效地以較低的功耗消除熱串?dāng)_效應(yīng)。
6 f6 t2 ^8 \' d- J" W5 d) ~% a# U# h
a1mbmdzge1b6405695318.png (237.02 KB, 下載次數(shù): 0)
下載附件
保存到相冊
a1mbmdzge1b6405695318.png
2024-9-4 13:39 上傳
* Q$ u1 r' Z' F( ]+ x1 P
圖3顯示了10個制造的MR塊中相鄰MR對之間距離可變時的相位串?dāng)_比和調(diào)諧功耗。
% z5 p. ^4 u1 |5 D3 f* n架構(gòu)級優(yōu)化CrossLight為CONV和FC層加速引入了單獨(dú)的矢量點(diǎn)積(VDP)單元,認(rèn)識到這些層的不同計算需求。這種分離允許更高效地處理這兩種類型的層。
% [( |' l* ^; G# C該架構(gòu)還在VDP單元內(nèi)實(shí)現(xiàn)了波長重用策略,減少了所需的激光器總數(shù),從而降低了功耗。通過將較大的矢量分解為較小的矢量,并在VDP單元內(nèi)的多個分支上執(zhí)行并行計算,CrossLight在并行性和激光器功率需求之間實(shí)現(xiàn)了平衡。
* S# \' {$ w: d: J% Y, u K性能分析為評估CrossLight的性能,研究人員使用四個不同復(fù)雜度的DNN模型進(jìn)行了廣泛的模擬。
' i2 i' N n5 {* ]' e9 c( T9 E分辨率分析CrossLight的一個主要優(yōu)勢是能夠?qū)崿F(xiàn)高分辨率計算。雖然一些光加速器限制在2-4位分辨率,但CrossLight可以為其MR組實(shí)現(xiàn)高達(dá)16位的分辨率。* K! v6 W* N' E+ L
ajq0l4vbmzq6405695418.png (222.75 KB, 下載次數(shù): 1)
下載附件
保存到相冊
ajq0l4vbmzq6405695418.png
2024-9-4 13:39 上傳
2 p0 M% `# c+ g* _圖4演示了四個DNN模型在權(quán)重和激活的量化(分辨率)范圍從1位到16位時的推理準(zhǔn)確性。
5 N8 o* q# V5 q1 t/ o8 R這種高分辨率對于維持模型準(zhǔn)確性很重要,特別是對于在具有挑戰(zhàn)性的數(shù)據(jù)集上訓(xùn)練的復(fù)雜模型。' ?5 Q9 R1 H8 Z; h. G- I
敏感性分析研究人員進(jìn)行了敏感性分析,以確定CrossLight的最佳配置,改變CONV和FC層加速器的VDP單元的數(shù)量和復(fù)雜度。+ Y7 M9 X! p7 _! ~0 `' Y* @
yipnw3evhz36405695518.png (255.44 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yipnw3evhz36405695518.png
2024-9-4 13:39 上傳
, O W5 d, X, L7 |4 ~# S' `
圖5是散點(diǎn)圖,顯示了各種CrossLight配置的平均每秒幀數(shù)(FPS)與平均每比特能耗(EPB)與面積的關(guān)系。
* R+ ]) h* d4 z. l最佳配置是基于最高的FPS/EPB比率選擇的,平衡了性能和能效。
! B) C' {% y" i! T1 W/ ^與最先進(jìn)加速器的比較CrossLight與兩個著名的光加速器(DEAP-CNN和Holylight)以及幾個電子加速器(包括GPU和CPU)進(jìn)行了比較。6 t7 }9 L4 I( L6 |' O* s
mtx404baupp6405695619.png (125.24 KB, 下載次數(shù): 1)
下載附件
保存到相冊
mtx404baupp6405695619.png
2024-9-4 13:39 上傳
: _" `5 t5 B6 U/ G1 U
圖6比較了CrossLight各變體與光電子和電子加速器平臺的功耗。
; |, [9 Q1 I1 }8 p3 g! Z結(jié)果顯示,CrossLight,特別是在優(yōu)化配置(Cross_opt_TED)中,實(shí)現(xiàn)了比其他光加速器和傳統(tǒng)CPU/GPU平臺更低的功耗,盡管功耗仍高于一些專用電子加速器。
5 ^$ N8 L: N4 J# T3 I1 i' v+ m& l& n4 z, g5 `
1gbbpwqp4hk6405695719.png (120.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
1gbbpwqp4hk6405695719.png
2024-9-4 13:39 上傳
X$ m! {; A- R6 i F8 q0 }
圖7比較了光電子DNN加速器的每比特能耗(EPB)值。
3 u5 O0 H+ S$ P" \% c* p/ j; x: I在能效方面,CrossLight顯著優(yōu)于其他光加速器,平均比DEAP-CNN和Holylight分別低1544倍和9.5倍的EPB。6 u& z" m# E0 M/ y+ L1 N
CrossLight的性能優(yōu)勢源于全面考慮了光系統(tǒng)中的各種損耗和串?dāng)_,以及在設(shè)備、線路和架構(gòu)層面采用新方法來減輕影響。
8 u7 y/ P$ X' G5 b結(jié)論CrossLight展示了光電子神經(jīng)網(wǎng)絡(luò)加速器中跨層優(yōu)化的潛力。通過解決硬件棧多個層面的挑戰(zhàn),與最先進(jìn)的光電子和電子加速器相比,在能效和每瓦性能方面實(shí)現(xiàn)了顯著改進(jìn)。
/ l, o R4 e3 l; o: @隨著硅基光電子制造工藝的不斷成熟,我們可以期待設(shè)備調(diào)諧成本、損耗和激光器功率開銷進(jìn)一步降低。這一趨勢可能會加強(qiáng)光域加速器在深度學(xué)習(xí)推理任務(wù)中的地位。, \7 v2 [2 j4 Q$ k8 h" I
CrossLight的成功突出了在設(shè)計下一代硬件加速器時采用全面、跨層方法的重要性。隨著我們推動人工智能和機(jī)器學(xué)習(xí)的邊界,這種創(chuàng)新架構(gòu)將在實(shí)現(xiàn)更高效和強(qiáng)大的計算系統(tǒng)方面發(fā)揮關(guān)鍵作用。' D- s, |- ?$ L1 X2 o7 k g- g) U
參考文獻(xiàn)[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.( [6 I: m: t* ], r9 p
- END -. R# B7 s4 j. e9 K- _) k, J
6 `/ B7 J/ P4 @ B+ z0 G$ s$ e' j
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
# y) d- d0 H/ Z. b( m$ @點(diǎn)擊左下角"閱讀原文"馬上申請- k' l6 S( L, z
: A& E0 N! v, T; O3 M. l
歡迎轉(zhuǎn)載! b/ T1 u1 N6 ` R0 s% f: P5 v& f: @
* W2 S9 a/ u) Q% p( Y/ U" U轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
; k! {4 U! A: j
) F2 Q: _' |% T& |% H- E6 v$ w
x7 `2 {/ O. f c' {7 |% P/ E! T3 t( ]: [( v) f
i04sdcaxjtp6405695819.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
i04sdcaxjtp6405695819.gif
2024-9-4 13:39 上傳
8 l- U. }" L4 H& y6 ]6 v7 `
# B- X# {* J+ m0 @關(guān)注我們
3 s* @/ f0 l& {+ g' U- v6 s+ V' z- c/ d6 |/ U+ S3 `1 a+ u
, K: {; _( |3 U7 s$ o
fhdji2uy4fr6405695919.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
fhdji2uy4fr6405695919.png
2024-9-4 13:39 上傳
! J6 F, d: v% I
|
$ ^, d G4 _3 ~2 v
toe11bamh4p6405696019.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
toe11bamh4p6405696019.png
2024-9-4 13:39 上傳
& v$ l8 I/ U B# D: U9 U9 P( _( f1 q j
| $ U' Q+ D U! G, k, {( P, x2 g, j( v
wyfszhdjarq6405696119.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
wyfszhdjarq6405696119.png
2024-9-4 13:39 上傳
+ u+ ?8 m, T" I- u
| % x1 |4 I. h8 @
* N1 ?# f* m9 g) _5 g& o: o+ a$ N% P/ [& e& p D3 c4 e2 m2 Z% _
- ?* `: f$ Z# D, L關(guān)于我們:
7 L/ V3 P) q, V& w* z; C4 T/ y深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。8 [4 A" V# w3 P0 G( g% U4 Y6 P! X
& J2 x0 X8 F2 \- y. U+ x# T9 I
http://www.latitudeda.com/0 p: O& o9 C5 T8 F2 R
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|