|
引言
1 L* L2 E; o3 m隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
, k% a h# y r/ c1 b3 {' L' E) O6 Z! v
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。( J1 a/ c) {0 C- W& i3 I9 `
, _% }: t, c' i
5 J7 }% ?! _4 m& C, g背景9 D+ B+ u" [, ^ e% }
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
; Y! h6 X8 F6 x+ q! [激光器:光源,可以是片外或片上調(diào)制器:將電信號轉(zhuǎn)換為光信號波導(dǎo):在芯片上引導(dǎo)光光電探測器:將光信號轉(zhuǎn)換回電信號
r2 V' q0 \5 v1 L2 e, Z8 ^ s3 w
/ u& c7 E) q& C, ^. a7 H7 [光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
$ m3 S; }- \. I8 R# u! _* J" R9 @% p( I: ~" H
為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
4 v6 q4 }# V0 E9 r% O: y監(jiān)控網(wǎng)絡(luò)活動指標(biāo)預(yù)測未來活動相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)& E; \4 T8 f/ a6 a4 K ~" _9 {
; L0 d/ s: }! D4 \, n2 K1 H# N
讓我們看看為不同類型處理器提出的一些具體方案。
9 x- S. h; o( N4 m+ f) g$ R
y* C( Q7 R9 P1 G3 d: C% P$ c多核CPU設(shè)計中的激光調(diào)制方案: [/ m4 O5 G$ V3 G5 o9 o! g2 _
Probe- `7 m3 I% N! [2 U p
最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
R# X \; t1 n" V
3 G) E4 v% m+ ]7 u8 g! K1 i$ `8 A6 S. N! pProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
. j# J2 w7 k- Z3 r2 z+ z( [[/ol]3 P' z# f9 T8 [! f/ G* a& U- c6 Z7 r
錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。- ~) |& K$ {9 a; K; c! r
3 A, ]6 `2 h& EColdBus
0 R4 z, o5 w. t% [ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。* a3 \8 J8 E& Z9 B' |0 [! [
; D! Q; V( x, j) S& O5 X5 `4 q, B
使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。. A4 H2 N: e/ A4 J3 o
3 v4 N" A9 n' Y( D) }% ?
ColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。* S$ ?2 `0 I+ ]6 @; E y. G% g
9 i+ ~. m7 i, D& Z
PShaRe Q, @0 c+ n+ f( V
PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器站點之間的功率共享重用浪費的光功率進(jìn)行熱調(diào)諧7 M+ g# u; I2 |
[/ol]3 J: q3 ~! `5 E
圖1顯示了整體架構(gòu):; p9 ~: i/ d9 y* |# \/ y
& z* Y: ~5 p; S/ O
nltekny5u1g64015584757.png (157.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊
nltekny5u1g64015584757.png
2024-9-18 13:47 上傳
. [" g/ Y" Z. p9 C
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。& R7 j7 y4 {3 h2 \
( Q( L& O2 d z5 [
神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進(jìn)行二元預(yù)測。
s G, U( D5 P7 r
1 P9 G) g( j! T6 C4 O7 K$ \, hBigBus
1 p. \+ U# ]: ~對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
, h! t" y4 C8 A* }+ |
) Y* `2 V G+ |8 X5 \6 g圖2說明了BigBus設(shè)計:
# n0 b1 i- V6 D3 _% y$ W1 h& m0 s% ^) x ]$ v; [) V* A9 J
4dtw2bmj0vp64015584857.png (216.89 KB, 下載次數(shù): 0)
下載附件
保存到相冊
4dtw2bmj0vp64015584857.png
2024-9-18 13:47 上傳
7 c% m0 q8 s6 ~! J1 d: H& S* i圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
3 t! M) v" I/ Z4 p8 v- i! _& r3 \/ J- d, F8 x& M9 {. l6 l1 J
BigBus使用兩階段預(yù)測過程:每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合
4 m+ G1 s: y- ^1 ]$ ?& M; W ^1 v[/ol]
$ m* m3 G, n( ^( E- q- L這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。; k e! s1 a9 X4 t
* x n2 u+ `6 z% o% X2 b$ i {$ n% @4 L
6 z$ E4 I; z' M: d3 G8 m9 h' s多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案% c4 [& ?/ y5 ~/ M+ I+ q
對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
3 D! b i3 h7 g: {, l0 i* z+ b+ s# c9 ~* n: {/ u( j, v. m
片間預(yù)測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊列中的待處理事件1 r8 r. [7 D5 e r5 k2 U7 ^4 x
[/ol]5 H, X% K1 l% {1 @9 G1 {
功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
- o8 W u5 y' |/ K( R' p& Z0 y
! z; Y4 B" T& m. YGPU設(shè)計中的激光調(diào)制方案2 a: M. P! E4 y+ x0 O) c8 J
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。
- l4 W- p& S6 @, G
. r0 H2 K6 O+ L, x4 ~. q+ ~圖3顯示了GPUOpt的整體架構(gòu): d6 h7 ^3 Y) S, u! a, L5 J
2 d8 R4 b A- j: p2 O1 @" C& e- e' d
nhvur1armwm64015584957.png (198.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
nhvur1armwm64015584957.png
2024-9-18 13:47 上傳
2 l. y% t& R6 m5 O7 Z; G. P
圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。' o2 F1 c7 e0 k, `1 C
/ ]. m. B2 ]7 R% }' q3 c, iGPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機制:% o9 H% i- b' D( t4 `; }
1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):5 i: Y% f8 p) u
接收的消息發(fā)送的消息等待時間
0 J# w, P3 a$ j1 o, T: e, ^1 d6 Q/ C7 T6 {( @
2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):% K+ k6 Q- v' h0 F+ P& }7 F
接收的消息發(fā)送的消息待處理事件
, f8 b# ^& D8 T* ~8 G: L
3 ~ i6 b: p9 o% h* _激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
& x. o5 }+ t$ m; ?: @8 r
4 r8 Z1 ^( N- Q+ f( x+ f4 w8 B: Z' v% p! ~9 {
關(guān)鍵概念和趨勢
. q+ S$ U' o9 P% L- m5 y雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
8 }& [( R' I: x2 D
& `- c; z! J+ j$ F' `7 [5 i2 k1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置8 o1 c6 U ~: c0 R5 J2 v* R; G
2. 使用多個輸入指標(biāo):9 {3 L7 Q& q, r2 C
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件2 N) d# }( M0 `" N8 D9 e
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
: V1 {% \ t, j+ S4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系1 ^3 B) S: z2 e/ m3 u
5. 對不同流量類型進(jìn)行單獨預(yù)測(如一致性與非一致性). i# p0 _) E5 J: i; e' z
6. 分層設(shè)計以實現(xiàn)可擴展性
6 `6 z5 G" J8 K( O4 ?& }. ?& c7. 盡可能重用未使用的光功率. ~5 K; |& Y- @( D- D
8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù)# e: f" p* p% x$ d, j. X
- o% s3 I7 b6 [- _& @. e! g% m
圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。- n) t1 S- S6 p" @8 v
0 N$ N0 b* w' Y% [7 {" }
lkotyjfobgw64015585058.png (100.12 KB, 下載次數(shù): 0)
下載附件
保存到相冊
lkotyjfobgw64015585058.png
2024-9-18 13:47 上傳
# D4 f$ v% U" ?3 H- F' P N圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
0 t4 u+ P: ?( G7 a* w2 V( L9 m$ w$ ~
$ L Z! l4 k, }# ]: A未來方向! n7 z& n$ X' r6 g5 C/ f8 _
隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
6 r. e, M0 O1 c2 Z0 V用于更準(zhǔn)確預(yù)測的機器學(xué)習(xí)技術(shù)與應(yīng)用層知識的集成在運行時調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對新興工作負(fù)載(如AI加速)的專門化
3 {% A( l& N* ]6 Q
0 |$ {4 J% [3 v: k# M3 i( r: h+ w6 T& a8 e, u9 V6 f
結(jié)論
! H8 p, D' X! N, k1 O' y( C" t. d有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
' ]; f; o9 [+ L; o" W1 t' h: I. v1 Z3 v- ^4 B" c/ _
/ |, @9 S. [( m/ ~. |) Y' m
參考文獻(xiàn)
" I& o, K' o$ L( Q[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.6 ~+ r4 M1 z8 D* H# f
7 s p& V. g2 Z9 Y! P8 Z1 k* Y
- END -5 q# b: |/ p$ I. ?
/ ^% H* i' Z2 P' X軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。3 p6 v# K: B8 z/ r/ \
點擊左下角"閱讀原文"馬上申請! K, R5 l4 H# g2 |/ l
6 ]& Z: f( D3 |4 b, d ^) ~* {
歡迎轉(zhuǎn)載
# @# _7 v- M5 `9 w a7 b- o$ _* S$ ?/ T; t7 j6 a! y
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
/ a+ ~8 t4 m" O. n' Z+ Q$ s
# [* I/ |) w3 s `9 k0 o
( z v v% {6 ?" Y
( N2 x1 X3 [/ P1 i9 u3 t
h15zec0g0gj64015585158.gif (16.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊
h15zec0g0gj64015585158.gif
2024-9-18 13:47 上傳
& d/ [! ^& }0 ]
! R, {2 I! N: H關(guān)注我們% V F, I# d0 L2 {6 c0 ?
+ x6 s5 A+ J0 W/ M2 x5 ~2 v# m3 z: ~. j* D: s" X
o2gci22howu64015585258.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
o2gci22howu64015585258.png
2024-9-18 13:47 上傳
# ?8 H. S' F+ D! ?4 F |
8 v# n+ L3 o; \/ O
cxsfmyb44sa64015585358.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
cxsfmyb44sa64015585358.png
2024-9-18 13:47 上傳
4 C: N a% P1 w4 F- O6 j | # A% P/ [' E8 C4 e' ]
uyczgfdbh4w64015585458.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
uyczgfdbh4w64015585458.png
2024-9-18 13:47 上傳
: r; h. t! d( t7 z+ h7 G( [ |
/ s3 s; w% U' Y G1 w$ k- }( q, _7 x9 C# E
' u5 {* p3 A: F E5 m) O
9 w! M, A; q* h( ^關(guān)于我們:
! s6 Q: w, V% c* w: b+ D) `/ C深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。- \# |+ |) R# b9 k5 I& ^
* l. A+ X% p+ c% L8 d' {http://www.latitudeda.com/& Y0 z/ u, J- v h6 E1 ]
(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|