|
引言隨著深度神經(jīng)網(wǎng)絡(luò)(DNNs)在各種應(yīng)用中變得越來越復(fù)雜和普遍,對(duì)高效硬件加速器的需求比以往任何時(shí)候都更為迫切。在后摩爾定律時(shí)代,傳統(tǒng)電子加速器面臨著基本限制,在帶寬和能效方面造成瓶頸。硅基光電子技術(shù)應(yīng)運(yùn)而生,可為深度學(xué)習(xí)加速提供節(jié)能、超高帶寬和低延遲的解決方案。# m# ^: P7 S- H$ g% w* k
本文介紹CrossLight,新型硅基光電子神經(jīng)網(wǎng)絡(luò)加速器,通過跨層設(shè)計(jì)方法解決光計(jì)算中的關(guān)鍵挑戰(zhàn)。將探討光計(jì)算的基礎(chǔ)知識(shí)、CrossLight的架構(gòu)以及與最先進(jìn)加速器的性能比較。
( M- b0 ?7 g! v% c$ | G; p/ l+ g, ^, u6 K8 [
光計(jì)算基礎(chǔ)( [, }0 w u, _% F
在深入了解CrossLight之前,讓我們先了解深度學(xué)習(xí)光計(jì)算的基礎(chǔ)知識(shí)。光加速器通常使用廣播和權(quán)重(B&W)配置來執(zhí)行矩陣-矢量乘法,這對(duì)DNN中的卷積(CONV)和全連接(FC)層都是必不可少的。' J& r! M. o" B! u; A n
u5t5b2alz3y6401283547.png (266.63 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
u5t5b2alz3y6401283547.png
2024-9-6 13:32 上傳
2 M7 F9 o+ s; y4 F* g8 q& B圖1顯示了基于非相干廣播和權(quán)重(B&W)的光電子神經(jīng)元配置。
5 ~7 h# j: z& W& D: l在此配置中,輸入值通過調(diào)制器印刻在不同波長(zhǎng)的光上。然后,這些波長(zhǎng)被合并并分成多個(gè)分支,每個(gè)分支由微環(huán)諧振器(MRs)加權(quán)。加權(quán)信號(hào)通過光電探測(cè)器求和,完成矩陣-矢量乘法運(yùn)算。! L% H& @! o2 y4 P
這種設(shè)置中的關(guān)鍵組件是微環(huán)諧振器(MR)。MR可以調(diào)諧以改變特定波長(zhǎng)的能量,有效地在光域中實(shí)現(xiàn)乘法運(yùn)算。
5 F7 o1 }1 T; }) z6 m6 dCrossLight架構(gòu)
3 R% y7 {5 g4 ^, v; F BCrossLight采用跨層方法優(yōu)化光加速,解決設(shè)備、線路和架構(gòu)層面的挑戰(zhàn)。+ q0 A% e& Y- c0 F7 h9 n
r440eh0t2ow6401283647.png (471 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
r440eh0t2ow6401283647.png
2024-9-6 13:32 上傳
% m# ?0 x8 T( c x8 l' s& G
圖2展示了CrossLight非相干硅基光電子神經(jīng)網(wǎng)絡(luò)加速器的高級(jí)概述。" I# y& J& @: l0 I# y* a
設(shè)備級(jí)優(yōu)化在設(shè)備級(jí)別,CrossLight引入了優(yōu)化的MR設(shè)計(jì),對(duì)制造工藝變化(FPVs)更具彈性。通過全面的設(shè)計(jì)空間探索,研究人員發(fā)現(xiàn),使用400納米的輸入波導(dǎo)寬度和800納米的環(huán)形波導(dǎo)寬度可以將由FPV引起的不期望的諧振波長(zhǎng)偏移減少70%。
2 B: |- m3 B. A/ q4 ~6 @ L" [; n線路級(jí)優(yōu)化為解決緊密排列的MR之間的熱串?dāng)_問題,CrossLight采用了結(jié)合熱光(TO)和電光(EO)調(diào)諧的混合調(diào)諧方法。與傳統(tǒng)的僅TO調(diào)諧方法相比,這種方法可以實(shí)現(xiàn)更快的操作速度和更低的功耗。
1 A( Y# a, ~" ]# H* G( g5 B此外,CrossLight采用了稱為熱特征分解(TED)的方法,可以集體調(diào)諧MR組中的所有MR,有效地以較低的功耗消除熱串?dāng)_效應(yīng)。! C3 \9 h+ v: b! k7 @- W) W
gosr1kbepbz6401283747.png (237.02 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
gosr1kbepbz6401283747.png
2024-9-6 13:32 上傳
Z: X& P: ~8 S }* I
圖3顯示了10個(gè)制造的MR塊中相鄰MR對(duì)之間距離可變時(shí)的相位串?dāng)_比和調(diào)諧功耗。
" z6 [* K6 `* A3 l7 V6 w) p架構(gòu)級(jí)優(yōu)化CrossLight為CONV和FC層加速引入了單獨(dú)的矢量點(diǎn)積(VDP)單元,認(rèn)識(shí)到這些層的不同計(jì)算需求。這種分離允許更高效地處理這兩種類型的層。3 b) a' i* p5 z% {3 t ^! v& [
該架構(gòu)還在VDP單元內(nèi)實(shí)現(xiàn)了波長(zhǎng)重用策略,減少了所需的激光器總數(shù),從而降低了功耗。通過將較大的矢量分解為較小的矢量,并在VDP單元內(nèi)的多個(gè)分支上執(zhí)行并行計(jì)算,CrossLight在并行性和激光器功率需求之間實(shí)現(xiàn)了平衡。( v. X* X8 d! [' j" M0 J3 o2 f* V7 i
性能分析為評(píng)估CrossLight的性能,研究人員使用四個(gè)不同復(fù)雜度的DNN模型進(jìn)行了廣泛的模擬。
0 c! L. u7 E1 [# a3 B分辨率分析CrossLight的一個(gè)主要優(yōu)勢(shì)是能夠?qū)崿F(xiàn)高分辨率計(jì)算。雖然一些光加速器限制在2-4位分辨率,但CrossLight可以為其MR組實(shí)現(xiàn)高達(dá)16位的分辨率。
: T: ]2 A. F6 ]
wcmaphexdg16401283847.png (222.75 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
wcmaphexdg16401283847.png
2024-9-6 13:32 上傳
8 |: c7 N; A$ ?/ a
圖4演示了四個(gè)DNN模型在權(quán)重和激活的量化(分辨率)范圍從1位到16位時(shí)的推理準(zhǔn)確性。* `6 [+ R, y; Q# q* |7 o
這種高分辨率對(duì)于維持模型準(zhǔn)確性很重要,特別是對(duì)于在具有挑戰(zhàn)性的數(shù)據(jù)集上訓(xùn)練的復(fù)雜模型。; |( w; P4 O2 {& e+ W1 R+ x7 b
敏感性分析研究人員進(jìn)行了敏感性分析,以確定CrossLight的最佳配置,改變CONV和FC層加速器的VDP單元的數(shù)量和復(fù)雜度。
' F2 P6 `7 G: Y f1 n, r! P7 Z _# R
povttnqyf1r6401283947.png (255.44 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
povttnqyf1r6401283947.png
2024-9-6 13:32 上傳
2 V2 J$ O0 J1 x( e+ z" V" M, I圖5是散點(diǎn)圖,顯示了各種CrossLight配置的平均每秒幀數(shù)(FPS)與平均每比特能耗(EPB)與面積的關(guān)系。5 B+ ^7 d0 r, n1 Z- X. Y
最佳配置是基于最高的FPS/EPB比率選擇的,平衡了性能和能效。
) K( A& r% X6 k B. A! o* F8 e, \與最先進(jìn)加速器的比較CrossLight與兩個(gè)著名的光加速器(DEAP-CNN和Holylight)以及幾個(gè)電子加速器(包括GPU和CPU)進(jìn)行了比較。
- Y1 o) F: ~% m6 b2 `! }8 j
o1mo3m44ri06401284047.png (125.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
o1mo3m44ri06401284047.png
2024-9-6 13:32 上傳
5 A# H$ n: I4 j: m. ^9 G# O( O
圖6比較了CrossLight各變體與光電子和電子加速器平臺(tái)的功耗。8 o9 J9 C, d6 Y8 c$ X
結(jié)果顯示,CrossLight,特別是在優(yōu)化配置(Cross_opt_TED)中,實(shí)現(xiàn)了比其他光加速器和傳統(tǒng)CPU/GPU平臺(tái)更低的功耗,盡管功耗仍高于一些專用電子加速器。1 S" t, |0 j; ^. U3 l
2 R/ N+ g; ^( b7 e; a
s5pbjcfws456401284147.png (120.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
s5pbjcfws456401284147.png
2024-9-6 13:32 上傳
0 f {5 j1 q3 L: j( M圖7比較了光電子DNN加速器的每比特能耗(EPB)值。. q R- t) Z% R* H4 n
在能效方面,CrossLight顯著優(yōu)于其他光加速器,平均比DEAP-CNN和Holylight分別低1544倍和9.5倍的EPB。$ ]- l4 U( s# g B) p
CrossLight的性能優(yōu)勢(shì)源于全面考慮了光系統(tǒng)中的各種損耗和串?dāng)_,以及在設(shè)備、線路和架構(gòu)層面采用新方法來減輕影響。
3 A' Q! P: u! K9 Z+ C- T3 b結(jié)論CrossLight展示了光電子神經(jīng)網(wǎng)絡(luò)加速器中跨層優(yōu)化的潛力。通過解決硬件棧多個(gè)層面的挑戰(zhàn),與最先進(jìn)的光電子和電子加速器相比,在能效和每瓦性能方面實(shí)現(xiàn)了顯著改進(jìn)。2 \! T; ~4 ^8 U7 q
隨著硅基光電子制造工藝的不斷成熟,我們可以期待設(shè)備調(diào)諧成本、損耗和激光器功率開銷進(jìn)一步降低。這一趨勢(shì)可能會(huì)加強(qiáng)光域加速器在深度學(xué)習(xí)推理任務(wù)中的地位。. ]2 V- J- H9 j
CrossLight的成功突出了在設(shè)計(jì)下一代硬件加速器時(shí)采用全面、跨層方法的重要性。隨著我們推動(dòng)人工智能和機(jī)器學(xué)習(xí)的邊界,這種創(chuàng)新架構(gòu)將在實(shí)現(xiàn)更高效和強(qiáng)大的計(jì)算系統(tǒng)方面發(fā)揮關(guān)鍵作用。
5 j) W' U9 T' @, D4 H2 A: A; }參考文獻(xiàn)[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.% C6 J" ~ P# V
- END -
( G6 |+ U3 R1 O0 r
. [: k+ G# Q4 L S* _軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
8 z9 `. f. P$ d點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)7 C; J5 a# y* ~8 Y/ J
3 s% p$ X0 j% ~+ }0 E, Z6 y
歡迎轉(zhuǎn)載$ F8 g ?( {2 L& ?
) E9 J4 ]) m* r* p1 K3 W( {) F轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
" K" {6 r j) r' F4 r# m3 p
/ I) G- w. c+ n f" j' j7 ?6 f1 @+ y* J- h
3 E o6 G, V. q6 g/ O( W, s
t4fh1omw4bj6401284247.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
t4fh1omw4bj6401284247.gif
2024-9-6 13:32 上傳
5 n$ X P, W. i/ D1 z3 }4 t# `2 v! q- O
關(guān)注我們
1 i: c3 y* g5 L) I( H
. P: x+ K( U4 V3 J2 Q: q3 p
6 P9 O) n7 D8 A. _3 H! I* Z6 A
4fflkvqbpgm6401284347.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
4fflkvqbpgm6401284347.png
2024-9-6 13:32 上傳
0 h+ o0 Q9 L: `: V2 d" p& r5 M | * L- y, ]) r; n+ s! Z9 `
rnhb2dzvtyy6401284447.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
rnhb2dzvtyy6401284447.png
2024-9-6 13:32 上傳
. w5 O2 _- G$ `1 X' Q9 b) o& w$ D3 n
|
) X: L4 m9 E0 E4 [+ R7 ^
2fgii0sxz4i6401284547.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
2fgii0sxz4i6401284547.png
2024-9-6 13:32 上傳
& Y! M q/ Q% ]
| & u: L. h& `# L( s/ [; N$ {
7 B& j& L" e4 G+ S6 H
m1 _5 J8 u" l, x$ f1 l( l& y# g& M+ B% S
關(guān)于我們:- \; A, }0 s8 U1 g+ |9 X
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
3 N9 M3 G) E! I6 ^5 o7 h: O0 G- k4 k3 J X& S: a2 K! R6 ]4 F2 N
http://www.latitudeda.com/0 z+ j6 j$ P' y z! z; Z8 y
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|