電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 32|回復: 0
收起左側(cè)

硅基光電子技術(shù)在深度學習加速中的應用:CrossLight介紹

[復制鏈接]

465

主題

465

帖子

3514

積分

四級會員

Rank: 4

積分
3514
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-4 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言隨著深度神經(jīng)網(wǎng)絡(DNNs)在各種應用中變得越來越復雜和普遍,對高效硬件加速器的需求比以往任何時候都更為迫切。在后摩爾定律時代,傳統(tǒng)電子加速器面臨著基本限制,在帶寬和能效方面造成瓶頸。硅基光電子技術(shù)應運而生,可為深度學習加速提供節(jié)能、超高帶寬和低延遲的解決方案。7 {0 N2 ]# J) q9 n$ `# [
本文介紹CrossLight,新型硅基光電子神經(jīng)網(wǎng)絡加速器,通過跨層設(shè)計方法解決光計算中的關(guān)鍵挑戰(zhàn)。將探討光計算的基礎(chǔ)知識、CrossLight的架構(gòu)以及與最先進加速器的性能比較。3 B; b% W/ |% F% j( E+ K
( ~) n& d# U% V8 l: q9 k( Z8 g+ _% E
光計算基礎(chǔ)
3 t+ ]+ w8 }8 }+ S- v: |; t在深入了解CrossLight之前,讓我們先了解深度學習光計算的基礎(chǔ)知識。光加速器通常使用廣播和權(quán)重(B&W)配置來執(zhí)行矩陣-矢量乘法,這對DNN中的卷積(CONV)和全連接(FC)層都是必不可少的。0 a4 j8 L; @8 f8 x, V( f
: M% V  I  J: p
圖1顯示了基于非相干廣播和權(quán)重(B&W)的光電子神經(jīng)元配置。
& t5 h1 I, c- e& P2 z0 _在此配置中,輸入值通過調(diào)制器印刻在不同波長的光上。然后,這些波長被合并并分成多個分支,每個分支由微環(huán)諧振器(MRs)加權(quán)。加權(quán)信號通過光電探測器求和,完成矩陣-矢量乘法運算。* l& P! w! u1 D1 J6 o
這種設(shè)置中的關(guān)鍵組件是微環(huán)諧振器(MR)。MR可以調(diào)諧以改變特定波長的能量,有效地在光域中實現(xiàn)乘法運算。
5 @. M( \3 \7 B, ]2 bCrossLight架構(gòu)
/ g+ w/ I9 \! H, sCrossLight采用跨層方法優(yōu)化光加速,解決設(shè)備、線路和架構(gòu)層面的挑戰(zhàn)。
! B0 N+ r/ _2 q0 b$ ?+ E7 W ! {4 n: z% A! q( _* \9 A
圖2展示了CrossLight非相干硅基光電子神經(jīng)網(wǎng)絡加速器的高級概述。6 ~5 d; T* F" o  J( D
設(shè)備級優(yōu)化在設(shè)備級別,CrossLight引入了優(yōu)化的MR設(shè)計,對制造工藝變化(FPVs)更具彈性。通過全面的設(shè)計空間探索,研究人員發(fā)現(xiàn),使用400納米的輸入波導寬度和800納米的環(huán)形波導寬度可以將由FPV引起的不期望的諧振波長偏移減少70%。4 j  [# R* W/ a) @; a" C
線路級優(yōu)化為解決緊密排列的MR之間的熱串擾問題,CrossLight采用了結(jié)合熱光(TO)和電光(EO)調(diào)諧的混合調(diào)諧方法。與傳統(tǒng)的僅TO調(diào)諧方法相比,這種方法可以實現(xiàn)更快的操作速度和更低的功耗。5 Q4 a: [" w2 l% ^+ o  o! _
此外,CrossLight采用了稱為熱特征分解(TED)的方法,可以集體調(diào)諧MR組中的所有MR,有效地以較低的功耗消除熱串擾效應。
) b9 N% k3 c0 h3 W; W3 ^9 |" E/ z3 R
# \5 g0 g1 P$ B& Q) |/ q; Y圖3顯示了10個制造的MR塊中相鄰MR對之間距離可變時的相位串擾比和調(diào)諧功耗。
0 b1 R9 d1 b5 x( Y7 e$ n架構(gòu)級優(yōu)化CrossLight為CONV和FC層加速引入了單獨的矢量點積(VDP)單元,認識到這些層的不同計算需求。這種分離允許更高效地處理這兩種類型的層。
+ X9 L4 Z7 s: j+ E% f) ^% y! W% X該架構(gòu)還在VDP單元內(nèi)實現(xiàn)了波長重用策略,減少了所需的激光器總數(shù),從而降低了功耗。通過將較大的矢量分解為較小的矢量,并在VDP單元內(nèi)的多個分支上執(zhí)行并行計算,CrossLight在并行性和激光器功率需求之間實現(xiàn)了平衡。* R3 c$ a$ C7 p
性能分析為評估CrossLight的性能,研究人員使用四個不同復雜度的DNN模型進行了廣泛的模擬。
8 Z" R/ [; R* `9 h' k6 B分辨率分析CrossLight的一個主要優(yōu)勢是能夠?qū)崿F(xiàn)高分辨率計算。雖然一些光加速器限制在2-4位分辨率,但CrossLight可以為其MR組實現(xiàn)高達16位的分辨率。) z4 I; h1 Z+ Y" K+ e. F

( Q" ?% `1 D; j: w# i* k# w3 c$ q* M圖4演示了四個DNN模型在權(quán)重和激活的量化(分辨率)范圍從1位到16位時的推理準確性。/ L$ q' b, `$ ?* _# c/ E1 W
這種高分辨率對于維持模型準確性很重要,特別是對于在具有挑戰(zhàn)性的數(shù)據(jù)集上訓練的復雜模型。
$ m) f+ h% x" S, g/ A
敏感性分析研究人員進行了敏感性分析,以確定CrossLight的最佳配置,改變CONV和FC層加速器的VDP單元的數(shù)量和復雜度。% Z; W3 V0 Y& m" T. _. z& t( s

3 f4 x$ w; ~5 M# t圖5是散點圖,顯示了各種CrossLight配置的平均每秒幀數(shù)(FPS)與平均每比特能耗(EPB)與面積的關(guān)系。  ~# |0 s3 u/ y) n% C/ P  `9 b2 j
最佳配置是基于最高的FPS/EPB比率選擇的,平衡了性能和能效。( N+ A% ~& g. k8 [3 v3 o2 `
與最先進加速器的比較CrossLight與兩個著名的光加速器(DEAP-CNN和Holylight)以及幾個電子加速器(包括GPU和CPU)進行了比較。2 m$ E8 A- H1 X, G
; E, Q1 K4 n5 w4 f8 c7 u
圖6比較了CrossLight各變體與光電子和電子加速器平臺的功耗。" r8 l/ E# E0 n3 L. y4 s8 L2 `
結(jié)果顯示,CrossLight,特別是在優(yōu)化配置(Cross_opt_TED)中,實現(xiàn)了比其他光加速器和傳統(tǒng)CPU/GPU平臺更低的功耗,盡管功耗仍高于一些專用電子加速器。
8 m% q, ?5 B5 T
) y* R  e; Y3 h% y
( q( I! d6 M2 r! ^& C
圖7比較了光電子DNN加速器的每比特能耗(EPB)值。
- @8 Q5 {4 P5 n- l5 z+ f3 P9 J在能效方面,CrossLight顯著優(yōu)于其他光加速器,平均比DEAP-CNN和Holylight分別低1544倍和9.5倍的EPB。, U* m! u8 m% C: z2 n9 ]5 D8 Z) G
CrossLight的性能優(yōu)勢源于全面考慮了光系統(tǒng)中的各種損耗和串擾,以及在設(shè)備、線路和架構(gòu)層面采用新方法來減輕影響。
3 k, a: D+ Q3 ]3 q. I# W
結(jié)論CrossLight展示了光電子神經(jīng)網(wǎng)絡加速器中跨層優(yōu)化的潛力。通過解決硬件棧多個層面的挑戰(zhàn),與最先進的光電子和電子加速器相比,在能效和每瓦性能方面實現(xiàn)了顯著改進。
* n: K+ x" c, @! p隨著硅基光電子制造工藝的不斷成熟,我們可以期待設(shè)備調(diào)諧成本、損耗和激光器功率開銷進一步降低。這一趨勢可能會加強光域加速器在深度學習推理任務中的地位。. f6 q" R' B. p/ C8 B# T) t( D' K- e( o
CrossLight的成功突出了在設(shè)計下一代硬件加速器時采用全面、跨層方法的重要性。隨著我們推動人工智能和機器學習的邊界,這種創(chuàng)新架構(gòu)將在實現(xiàn)更高效和強大的計算系統(tǒng)方面發(fā)揮關(guān)鍵作用。
9 |/ r" ?! c) y參考文獻[1]M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
( r  ^" Y. D" {6 E+ m. W- END -
1 E8 s& {: |" b1 W: _( w, h: H' z) L" Q% n  w
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
, x5 I' q. m! j) ~2 m點擊左下角"閱讀原文"馬上申請
" O, w8 H) M: [7 l: g( ]
3 K' |# ?* d& M+ p+ J' R( n. g歡迎轉(zhuǎn)載) t5 u& l7 J$ @7 B+ o( [/ L$ q
6 S: [- \: K& V
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!8 l! ^' G6 ]! @4 K
1 G  s2 N; |( m! V; _$ m
  r! B, c8 P/ h4 ?

- A+ C: J0 J  S" }' @+ P
' N; {; f: Y8 L$ t0 s' Z4 f# p) Z
關(guān)注我們
, V. h6 ?* m) v9 U) v$ Q* i0 v) {1 P9 ?4 G9 G5 E: V; p1 b- J
4 b7 W( b* \& }: x& n* y* m

( t# t" n2 Y! a8 X, k' |
+ Z8 p6 S0 m8 l: n3 K$ ^( `
2 c% B$ d7 e! y) w4 n

9 @; z, {+ I2 s$ J1 l 2 W: c% I( x5 H) q5 J* E) U
                     
* o+ D5 X  L) O' S$ t; @" `  T4 i! m' H6 F% u

# P) J1 J! i/ Z
+ I8 x. f9 c+ b" D關(guān)于我們:
: d3 o0 q; \# G1 y8 R! `深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務。
5 s$ l6 a: r- M4 Q" L& f! o  k, B6 a! q
http://www.latitudeda.com/
% Q8 ^$ i9 a2 _$ m(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
回復

使用道具 舉報

發(fā)表回復

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

關(guān)閉

站長推薦上一條 /1 下一條


聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表