|
引言3 \- D" a2 R( U/ ]
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
- t1 Q$ ~/ Y$ O" ]% o: y; Y! v0 u6 t
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。5 B) F# G; u1 q: N) H0 R# B5 j8 c
& {( \; {) Q* o# r& e! ~: i
5 P, E, s G3 }* n& w5 d% I
背景1 j- q, u0 H5 S4 n6 w s
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
% ~( B( G" v h& }& P: N( U激光器:光源,可以是片外或片上調(diào)制器:將電信號轉(zhuǎn)換為光信號波導(dǎo):在芯片上引導(dǎo)光光電探測器:將光信號轉(zhuǎn)換回電信號
* l0 j* f/ {$ o* @. a: [" }5 u* g+ V4 S& R
光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
4 v# \0 a6 }' Q. _9 V' K1 e
* h5 l3 {1 p; M' \為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
" P: u7 a* B- a: X% o& h監(jiān)控網(wǎng)絡(luò)活動指標(biāo)預(yù)測未來活動相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)$ O! @+ K# F4 D9 X+ O
0 H1 _, |9 `0 Q3 ^+ f0 \
讓我們看看為不同類型處理器提出的一些具體方案。
' x Q, i) ^; x3 R0 O
' e) Q# M& \+ B0 s/ V3 q% Y: |多核CPU設(shè)計中的激光調(diào)制方案) |% G" \/ g" O# E2 {) h
Probe
% C+ \4 I2 r6 t- [% u2 a最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
1 a% J' U! k, A$ S% P r5 C w/ J! P- d0 D+ D$ l
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
( c6 X: d1 u" R$ k! X/ L" T: r[/ol]# O! _- A& s$ b m6 P# c
錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。 D }" z# V; w' ]
5 { D4 }9 B/ D: M) A
ColdBus
# Z2 u: t1 {" n. c* {$ O7 z: O/ W f1 EColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
# t- m# Z [' x/ `
% x) r7 v+ t- p9 ]使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。9 L) a, X/ {" k+ P' {2 j* ?
7 C* a$ w# Y% y8 }7 T3 rColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。5 _) F' U3 T: W( o9 I! T
. X+ Y" z; r9 y+ ~2 l O; T
PShaRe
4 v! q6 p P! L. S; ~PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器站點之間的功率共享重用浪費的光功率進(jìn)行熱調(diào)諧/ r2 Y$ {4 o( o
[/ol]
$ X$ K3 |( ^4 _8 Z( |5 Q3 k圖1顯示了整體架構(gòu):
7 p; e9 K+ u k% r2 O3 e" o: V2 P
& T& s( @# L7 Q& N
v0i132opydn64034878813.png (157.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊
v0i132opydn64034878813.png
2024-9-22 01:17 上傳
5 }3 X7 v4 H, R; A! w! J: q; Y圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。/ n" Z" j9 f; Z9 P% t3 Q( A
' S7 ^+ c/ q+ U1 K G3 {) \" V神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進(jìn)行二元預(yù)測。8 K0 }/ D5 M3 y1 A1 ^
0 a8 M% j- ~6 N& R# e3 N
BigBus
$ U0 `4 B- @4 W; h& X( S3 N& X! r& D對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
) y% F( {2 G+ u1 S
; L7 {/ U0 p+ S7 s, i. ?$ ]圖2說明了BigBus設(shè)計:
9 M) c4 ]! ], Z6 k# j8 C" }% o2 v/ x: L# }1 c7 ]: S6 j" e
2lsssyofp4g64034878913.png (216.89 KB, 下載次數(shù): 2)
下載附件
保存到相冊
2lsssyofp4g64034878913.png
2024-9-22 01:17 上傳
' B/ y: }+ ^/ K, [圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。! i6 N/ u/ ? H/ Y' j% P
+ I1 F0 r5 M$ h& H* v' W/ E1 N! N
BigBus使用兩階段預(yù)測過程:每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合
4 S9 q6 o& ~" {[/ol]
( c- u; {/ V4 v/ l這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
1 i% D/ @; d# r. F2 Y& ^/ O' _8 P0 C$ W- j6 m& h( `! W
4 V+ C) `7 N# [2 [7 m2 W. i0 O3 b
多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案6 t; _8 N2 I/ y! _
對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
, F9 z+ A" Y- h+ }- q" p" n* h2 \+ a7 ?
片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊列中的待處理事件0 i2 r5 m: L. l" @+ J
[/ol]( _) c) _4 u% Z s5 h2 a$ u' s
功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
7 y4 s; r# N, A
5 ] o5 Q' \( A/ ^GPU設(shè)計中的激光調(diào)制方案! v) p" y0 h+ I& N
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。4 B7 Q' R. h7 G; V& M; J) g
* S+ O- c* I6 k1 Y( J2 \
圖3顯示了GPUOpt的整體架構(gòu):, h7 D9 m" X8 \: e" B
l1 h0 D- C+ G/ N/ h
m5tbfrm3byw64034879013.png (198.05 KB, 下載次數(shù): 1)
下載附件
保存到相冊
m5tbfrm3byw64034879013.png
2024-9-22 01:17 上傳
% Y/ Y$ i3 u) o; H- h
圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
. T. W3 d: S4 A4 u
* T5 ]: O `3 uGPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機(jī)制:" [* l; J+ ] i& n9 w( s# Q$ g. F
1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):1 r) H; ~" y5 k/ [' `. F
接收的消息發(fā)送的消息等待時間
9 N% D/ D3 }; @: |, q4 i% V/ i5 G& d
2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):; Q7 K8 [6 V* i2 J: S
接收的消息發(fā)送的消息待處理事件
# k! U( w- j9 d1 R4 `" P( g: {1 w% j7 N
激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
) K. @# X J, C
( T9 M/ ?# L# v
6 m0 b7 Z+ G! F+ T關(guān)鍵概念和趨勢
; s: e) G7 E; }0 |" O雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:" x4 s, f2 S- a- B
2 s/ `: a" b& @" ~: \$ n5 r& r1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置
; h' y8 {2 U' w2 h2. 使用多個輸入指標(biāo):+ n2 f8 Q; K0 X5 |
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件
9 E3 k7 L: m5 T% ~ o3 [3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合) Y/ r. e- [1 `( Z5 x& O
4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
/ J" \" d; p/ \4 }" ~: d5. 對不同流量類型進(jìn)行單獨預(yù)測(如一致性與非一致性)
5 U9 R+ ?8 F, }7 G6. 分層設(shè)計以實現(xiàn)可擴(kuò)展性. b0 E; a" B; c5 c3 ?) T! w2 l
7. 盡可能重用未使用的光功率& c. z. p) w2 H! G
8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù). z! M/ I1 s/ F! m0 ~, f- i) O
0 B8 N6 f1 p( o
圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。: H+ q* e* e) S( a; x
) r2 \+ |6 e" L9 h
om02xkr3dhc64034879113.png (100.12 KB, 下載次數(shù): 2)
下載附件
保存到相冊
om02xkr3dhc64034879113.png
2024-9-22 01:17 上傳
J' G1 @" I& o9 ?+ ]* ~+ B
圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
9 z- c. g# P% i- K1 c
- q& E: j/ ~7 Z0 M) S; o- g* K$ ~# q4 t9 s1 [% @6 R
未來方向& K. u$ |: b2 I# u! l
隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
- m$ ~! S7 x# v0 @2 F用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識的集成在運行時調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對新興工作負(fù)載(如AI加速)的專門化
5 _. s: f5 j! l. p: y4 [$ G6 ]
3 r) \! T0 \0 z6 @/ s
8 v" `; w6 {5 Y7 Y9 c9 n結(jié)論6 h# m8 \' ?& d* w/ y# z
有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。: h( D' G* W3 t! E6 ?
3 c! L. m) @. I3 v+ s- W' s
g: i: w4 Q- {; z$ G. \5 C
參考文獻(xiàn)
% j; [+ o% l/ h- n[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021. _: [+ c. z( {1 Q
; e& b4 i% L s2 _( U, z- END -) d! X( x5 @$ c2 Y- C$ d- s
6 J; C$ u! h' S. w2 v- D/ K
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
`0 W7 t, p: }: R" L) r' T點擊左下角"閱讀原文"馬上申請
) h$ T9 q1 \! h! [6 G' b {+ Y% L2 E% I% l7 |
歡迎轉(zhuǎn)載( z \( j6 H- y% I7 i& c+ @- p
$ N' N2 D% l6 A0 L0 F1 F3 w
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
d8 u7 w9 L5 I3 c" N5 P" L$ d
! ]! Z; r9 ^2 k& `! }, V3 \
- K4 M5 }/ S0 k0 a |) ]6 j! b* c) z; j k+ y% O
tlesfwadvw464034879213.gif (16.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊
tlesfwadvw464034879213.gif
2024-9-22 01:17 上傳
5 D+ A X4 V8 z0 x: Q1 h$ e
( P2 }$ t5 Z) |$ b0 g6 S關(guān)注我們1 C2 x4 R" F$ |) j% \4 x4 b# m
' p, D1 C4 s p0 m3 j# ?- z
$ _% a0 A6 L$ J
0rzxntnecf364034879313.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
0rzxntnecf364034879313.png
2024-9-22 01:17 上傳
9 b; R, X ^( z$ ? |
& ^( s9 Z3 c0 ]: j/ m5 X z
wklhaednp3g64034879413.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
wklhaednp3g64034879413.png
2024-9-22 01:17 上傳
8 d, V" T0 a4 b
| ' A' E6 T; r, o/ S) ]4 g
v05awecejyj64034879513.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
v05awecejyj64034879513.png
2024-9-22 01:17 上傳
3 L& d) Q5 g2 n( A |
: z) R% r: }: {% k1 [. m6 }
- v. Z/ n3 [/ U2 R8 S) _; L
+ p7 R- p1 T' H3 z
3 }+ ]2 M, u: F" l6 y關(guān)于我們: L2 k2 k5 f7 Q/ u) r2 T
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。" y& D% s: }# b2 b+ p) R" [
( w: x8 S+ C& T+ V9 O2 e
http://www.latitudeda.com/
, ]! T3 E* A6 L7 i) F; Y7 z ^(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|