|
引言
/ T+ T; @( G' O7 J% |9 a/ p& l# W隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
" @6 N; Q- U# k* `
# Q! N. L& i8 p" b; s本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。0 M% e0 T3 H2 w0 l+ ?
/ |9 U$ ?/ _( z( N! z! N
6 v- L4 Z. k0 K$ e
背景8 z/ S# ~3 S2 ^" F) n
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù)。基本構(gòu)建模塊包括:
0 ]& {% v+ f- W) k4 J3 h$ c r激光器:光源,可以是片外或片上調(diào)制器:將電信號轉(zhuǎn)換為光信號波導(dǎo):在芯片上引導(dǎo)光光電探測器:將光信號轉(zhuǎn)換回電信號
, {: S6 x, i6 ]4 a) c) ]3 J V' K" i1 e# Q! d# h9 R
光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
! Z4 W( z4 | S% Z* E/ ]7 }8 x' K4 {7 m/ w, |' S
為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
; f8 T! m# J) x. P6 R8 |監(jiān)控網(wǎng)絡(luò)活動指標(biāo)預(yù)測未來活動相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)6 j3 u/ E3 z0 V2 f- E
: n2 P1 ?3 P) y. O8 O6 u+ P
讓我們看看為不同類型處理器提出的一些具體方案。8 z! Z, S7 g2 ~" b. A0 M
! i" M' v5 s9 Q+ j多核CPU設(shè)計中的激光調(diào)制方案8 u$ l# X* Y4 h6 Q, a
Probe
1 K+ K' o- F4 p! u# ?. _$ {最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
" d; r6 k9 y3 }: F/ o1 R; l6 V) k6 K
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
5 k0 N" P" M0 h* E[/ol]5 M' ]. t: c% `0 z l
錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。, K' o" [" d D# }- U, V
! p3 U8 B: }5 i* B
ColdBus- P/ X* L5 [" ?( k% }6 E' T! I
ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。+ H) J& r, M7 Q |8 l
) ]. y, V1 `9 Z使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。7 Y3 R/ O# z1 I
9 ]8 O( O1 j, N* K7 b2 A: K- EColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。- J: T6 u" @3 U: b$ e
6 P$ W# g4 d# }+ W' b
PShaRe+ b# P \( S6 X' p
PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器站點之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧/ x6 z& l- @4 J9 {7 r, H. k5 U
[/ol]
6 f/ W# ` L+ I4 y圖1顯示了整體架構(gòu):
9 _8 a2 w! W7 D% N) z' ]3 j% n6 f4 M9 @( w
cjhdyiznw5w64024513536.png (157.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊
cjhdyiznw5w64024513536.png
2024-9-20 01:31 上傳
; L9 k) x. Y7 t
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。1 ~6 S' H# G! i
& l7 P3 `7 g- ~+ z: G# L2 I8 g
神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進(jìn)行二元預(yù)測。# l b- C) X: p) m: x* R0 C; _
2 G6 E- B* ~7 oBigBus! w9 b7 ]7 u8 T. }5 N8 [1 i
對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。5 H5 O$ a; x1 S4 I6 a& K
* D; z- B, }4 z U9 y% Q圖2說明了BigBus設(shè)計:0 q V4 b* l- Y% |
: l: q# Y% V1 }- z' H2 S+ C% x
hck0tgbp1b364024513636.png (216.89 KB, 下載次數(shù): 0)
下載附件
保存到相冊
hck0tgbp1b364024513636.png
2024-9-20 01:31 上傳
3 `! E& X! t+ Q. p8 Z2 C9 f; j
圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。, w+ Z @" e3 g3 R; I
1 I! ?: T f6 \+ z
BigBus使用兩階段預(yù)測過程:每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合( N' x9 x- E. |, D) ^; o2 G' g+ t: C+ g
[/ol]! h2 T$ X# t: s& `0 R
這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
* o& H2 b, ]/ z/ q# i+ C5 Z' \1 s0 T5 l [$ |
" ~( a# e% S$ ~- B, z, U多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
, H' F# O, q" S% \對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。9 d8 }% q: X& t' u
; n9 D7 _7 ~4 b! i7 t+ {/ c) ?片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊列中的待處理事件
( ^1 |( [# K/ o$ G, N/ D[/ol]
0 P' I3 } F; x! @$ d7 l2 f功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
$ I* d1 \8 b: j: }+ F" Y% S6 T" {& D
GPU設(shè)計中的激光調(diào)制方案2 z5 f/ U$ U4 e4 t
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。; c6 Y# h e! r2 C0 n4 U, g
/ U5 J9 {! c4 M# @( t- r2 ]: N圖3顯示了GPUOpt的整體架構(gòu):4 B: `. i) ^9 s9 S+ G- R$ O' B
% o& H5 \% |1 X, E3 m, w
2r1e3lybmxf64024513736.png (198.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
2r1e3lybmxf64024513736.png
2024-9-20 01:31 上傳
; `7 D, i1 H0 [) q; ]% H% v+ \
圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
7 g9 z& d+ R8 o3 S' O* l- z6 ^
$ A# Z; f3 X3 W' }8 i; |GPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機(jī)制: M: I8 I7 ]& ?: X
1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):
( {+ z2 B6 h0 Z4 S: h接收的消息發(fā)送的消息等待時間/ L8 y, x4 t* q5 _ X( |! h- n
& l) h. \: v, |6 Q6 V# m2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):
. o# F7 K7 e' A# r接收的消息發(fā)送的消息待處理事件2 k/ b: ?' J r5 ~4 ]+ G& ^
' Z2 c4 X! H1 T. T% H( p
激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。! I+ \4 w, ]9 |
3 y8 [( o) U- ~$ w+ K
( y. V- s& o4 {4 t關(guān)鍵概念和趨勢
9 @% C7 T/ }4 Q* @- J6 \4 g1 ]) H. ~雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:: ]% ~! W& Z' \. B
' r( R. b+ f" c- X- ~
1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置
" f& n2 c' x+ q8 J1 i$ @ c2. 使用多個輸入指標(biāo):. h" K: p5 i+ i4 g
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件& K" u! `$ d. b" X. M
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
, F4 h, [! ?( |4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
' G8 b% P- T+ ?$ M( a1 V3 ]; l" [3 X" J5. 對不同流量類型進(jìn)行單獨(dú)預(yù)測(如一致性與非一致性)" V8 r, F- b5 |- O# x* m* h% l
6. 分層設(shè)計以實現(xiàn)可擴(kuò)展性
! j( m' q9 U. R+ V! u$ o3 P3 p, P7. 盡可能重用未使用的光功率% ~4 Z8 l/ G- R- I; ^% q" Z& Y
8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù)7 R4 f9 C: V. k) |* [1 E, r/ H
v* S: {5 s M; e: @; n
圖4說明了有效激光調(diào)制可能帶來的功率節(jié)省:
$ T( @+ q" u V2 }6 O! w9 ]. O
! H' z8 d) }: q9 o/ }
opnnfadxepq64024513836.png (100.12 KB, 下載次數(shù): 0)
下載附件
保存到相冊
opnnfadxepq64024513836.png
2024-9-20 01:31 上傳
! v! M) ^1 @! k7 G& I& p圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
$ T* ?! G; L; I% W9 q
2 L# p' W. z4 e. ]% p: z1 f1 F7 R/ C2 d6 W+ D
未來方向1 C' [2 i. V* _1 R, f1 A# \5 i
隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
) G5 i! ^$ H- i9 h5 ^; T1 c$ d% m用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識的集成在運(yùn)行時調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對新興工作負(fù)載(如AI加速)的專門化3 S& N5 K( q Q% ~. Y
0 j# `9 |( u) N: Z, F8 G$ }5 F8 Y3 _ t, k6 C- V }. K
結(jié)論4 Q9 W9 p& U. e0 s) p/ u- M
有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
. b( b) }7 i& K6 E! o+ }# T/ b$ F0 I
% ~1 N) G1 p! `2 a4 \
q4 l$ I8 V8 Y$ Z% L& K& J參考文獻(xiàn)
% I* {4 [. B8 [$ G[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.% ~9 r7 s4 o B f
6 ?; T1 R% t4 q/ z; T7 @# u- END -6 R0 \* E G% P# @3 x
# c* O7 X8 {6 T4 n% G: |軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。' M+ f# `6 e% i" l2 K; ^- n
點擊左下角"閱讀原文"馬上申請4 J/ ?- [! }1 `2 P: X; b
! }6 B0 j0 B5 W! T( \1 S歡迎轉(zhuǎn)載& Q3 ?& Y! _! \
& y0 l% ?4 j. L. h! D- Y. j5 \) }" ~轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!; w4 a" w2 r* x. b5 J) F. X
& h+ `, \& o9 E& u* E! _$ S
: Y- N# A3 C1 [; `3 l
) z0 D& t% E1 a0 K
pqequtkewc264024513936.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
pqequtkewc264024513936.gif
2024-9-20 01:31 上傳
1 d+ ?& ^4 D0 M1 N% m0 S
+ c" I# U. j; m# d5 p* R% s
關(guān)注我們( s! ^' D: c3 T4 {: p$ c
! ~! O1 u( c; F# O: G7 V4 E$ a/ K+ Q# ^/ H/ u9 K9 b+ I
f04h1q5oxrw64024514036.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
f04h1q5oxrw64024514036.png
2024-9-20 01:31 上傳
- }- {. ~ q. m+ y9 p* ?5 g6 Q
| 0 b' c5 h: H% n" ^6 J
ckxurcq3lg364024514137.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ckxurcq3lg364024514137.png
2024-9-20 01:31 上傳
/ j- I+ o, {' A2 |3 ~' H
|
W. p2 l3 t7 v4 L# s
rq40zwpyofx64024514237.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
rq40zwpyofx64024514237.png
2024-9-20 01:31 上傳
2 T1 C$ Q4 N) v$ B
| 8 U% j" \4 Q2 s6 R3 R7 ^
2 b6 n# P& ^" }( t+ x
/ `# ^" c* F! j% `% J H
* s" x/ E- M1 r9 V' m關(guān)于我們:
" o* A% f6 d/ U& u( I$ I深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。. i3 e: {& n, o6 i. N" o! p
* }3 i# Q! D7 D- z3 ?
http://www.latitudeda.com/
" ~. C* J# H2 B8 n- N(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|