|
引言+ `8 L3 x. D0 @) H) F
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來(lái)替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來(lái)了新的挑戰(zhàn)[1]。4 z3 a4 t' z7 G3 x5 S" D
5 p& ~; T. K$ c# m3 |9 E6 s- R本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
: W+ C2 s+ j0 [
/ g9 T! b: y s2 y W/ z) X6 B
0 m5 ^: ]. \6 F2 f6 P背景0 G' X3 ]3 m7 ?& V0 j5 D2 z
光學(xué)NoC使用光來(lái)傳輸芯片上組件之間的數(shù)據(jù)。基本構(gòu)建模塊包括:
% I: p+ E5 {: z y% I6 G$ Y激光器:光源,可以是片外或片上調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)波導(dǎo):在芯片上引導(dǎo)光光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
+ y E# r. N2 ?
; H5 K- }) @4 \& f9 z光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。3 A* T+ H7 r4 D! f
) ?2 h! Z4 Q2 h. e9 @" J* h為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:
% i1 M% I. A! O+ G監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)
. }! H$ c1 L6 c$ [0 j# r, C; ]7 t7 ~' D6 q
讓我們看看為不同類型處理器提出的一些具體方案。9 v4 w+ { R- }" v; x6 \
: q+ U' _9 O4 Z
多核CPU設(shè)計(jì)中的激光調(diào)制方案4 w1 b# l9 f+ j3 K& h' q% j
Probe
8 w3 l S/ R, i' Q# V7 D% Y* |$ S最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
9 Y- m8 L: d* ?6 k; z _" k
3 o( B3 C. P4 ?: K% o3 O% [Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)。使用兩種類型的預(yù)測(cè)器:用于低流量變化:過(guò)去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
7 A) T2 C# H8 D' d0 e& S, O[/ol]
M; l: e- y: B- c; R# T錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
C4 B5 o6 u% b" j" A$ V4 ^' O+ C5 ?9 i. E0 r G" Y
ColdBus9 N3 k3 S) C- x/ W# b% Z) |! s
ColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來(lái)自L1未命中。
: e; m' y0 x/ d* b3 `% J2 D
) U) S: j3 U" @使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來(lái)識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。
2 B1 S0 X5 o9 {5 L( t: \9 ?4 N( O0 G) O8 O% N
ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。, `7 k) K7 f1 @3 N* ]5 {8 L* x
6 a% [) h. ^, u0 g
PShaRe
7 `8 l- ?' W9 `! e* A1 ^3 ZPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
1 j: K9 ~% i9 `" [0 C- i3 t$ b6 q( ?[/ol]6 l u" r; b+ B. f) U
圖1顯示了整體架構(gòu):
% G; ]. n( m! W6 }- J5 P- T
) D0 t8 H0 _/ f9 Y1 k
srqgc3eexiq64021065016.png (157.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
srqgc3eexiq64021065016.png
2024-9-19 13:40 上傳
3 T/ r! D/ v4 l& s. k6 @圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。& _! h; s$ W: S! [7 b7 `/ X
7 Y* V' M) [& n* k" { x1 |$ C神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。
d# \; N2 ^' K) t( y; ^. Q
+ E7 u2 ^: t1 k" [! Y% ~$ N9 P) DBigBus \3 z' x. k$ c. ]' B
對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
" S) Z9 R( j9 K ~2 C' L* W9 Z" P2 B- h$ Q2 R' l
圖2說(shuō)明了BigBus設(shè)計(jì):
, z. V. }6 {2 I% ^: ]- y# u2 D1 w" r" Q; p& w- ]
3ru5uphwiop64021065116.png (216.89 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
3ru5uphwiop64021065116.png
2024-9-19 13:40 上傳
! j, w8 j* M" A' l2 t+ t
圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫(kù)的分層組織。: j" Y3 h+ \6 c1 b* H
; F9 L4 Q u! q3 j; I
BigBus使用兩階段預(yù)測(cè)過(guò)程:每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合" G: ?4 {/ m) ]# K. F: J
[/ol]
4 {5 \9 ]& a& w& e! I0 _2 \這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。0 B5 Z: D8 [( x; ]# \
. W5 g/ `5 D+ w
% [6 m& Q; x4 z; x多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案' D/ l' a1 ]! J: [1 Z* _1 q) S
對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
/ ]' o( p) |7 J) {
- L- s2 J& P4 y/ N7 I- ?( \8 H( Q: K片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊(duì)列中的待處理事件% J7 g& ?% \) O0 p8 _
[/ol]
6 y) E% a* s. |0 z功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。7 `/ _3 x( ~, U% m: W
( H) r4 b5 T) i, i \
GPU設(shè)計(jì)中的激光調(diào)制方案
% b$ r2 w1 @( m: q由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來(lái)了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。1 P' D3 i1 n9 K, G0 B
- t: J+ f, m+ b
圖3顯示了GPUOpt的整體架構(gòu):
4 g' q9 k% d1 Q0 ^* L! b. ^
5 _' _' ~% c8 a2 m" ?/ x6 T! r3 j
mkq4dnaq3ip64021065217.png (198.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
mkq4dnaq3ip64021065217.png
2024-9-19 13:40 上傳
0 r- k! A) j. W圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
0 K+ ]7 y: w$ T! k) Y7 O
; e5 a/ R( O0 G! tGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:2 ~0 @; e, g& q
1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):) }0 K6 f; ]# D1 o1 ]
接收的消息發(fā)送的消息等待時(shí)間9 s5 x. p. l3 F
* _6 u3 X6 X0 `& v. V' [+ G
2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):: X4 U1 c" x4 d- p5 i
接收的消息發(fā)送的消息待處理事件
( Q3 q/ p+ d) }6 \$ f' v6 W8 n+ b
! c9 @& I- g) A! `激光控制器將這些預(yù)測(cè)結(jié)合起來(lái),確定整體功率需求。, P) w& O& D/ F. q9 H
7 ?4 G0 c5 a! b& X
! A) r- I( r& ^8 P* g" G; r( z. u6 ^關(guān)鍵概念和趨勢(shì)
v# M: X! C: o2 W2 G% _/ v3 }雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來(lái):0 |3 ~7 E- |+ j ?9 q
/ `& J6 B6 H e+ ^! b; X
1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置
; i: t7 B) X; M" N1 u S2. 使用多個(gè)輸入指標(biāo):
8 }! ]$ X4 E N5 b8 [ `網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件) ^; v) c- ^' q6 N2 s% H
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合# A v* y5 j% H) r
4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系4 e; p3 H$ ~* {; B9 R# D/ ^. @
5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)7 G6 z# i" @; U! ?
6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性
+ K1 K# _/ x6 n8 i, {7. 盡可能重用未使用的光功率
% [; J: {" V: q! z; p3 r8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
) |9 R# o$ V; o T
/ P8 @" `/ [+ |( Z4 g0 v圖4說(shuō)明了有效激光調(diào)制可能帶來(lái)的功率節(jié)省:6 [# y* |- J( o
3 [6 l& s% K9 R% `
c4ryd1jrep564021065317.png (100.12 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
c4ryd1jrep564021065317.png
2024-9-19 13:40 上傳
$ Q) X! A: |7 l& w6 P
圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。
. M$ A S* c. @! m: Q/ }& s
3 J3 ]; M$ m z' M M/ Z1 A8 t6 A, E }/ L: |
未來(lái)方向2 X$ ~3 q, k3 q+ k- i8 B! m
隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:* g# p2 F& D N2 j. _ D; n: o
用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識(shí)的集成在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對(duì)新興工作負(fù)載(如AI加速)的專門化2 m) N0 u; S! T9 f7 l# Y
$ y8 B- L" p0 s m! L
1 \" U% B/ a ?& u8 s' p r
結(jié)論
- G6 D9 S. x' X! m4 W有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過(guò)準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來(lái)計(jì)算系統(tǒng)解鎖新的能效水平。
; n( p3 _; m. s8 d
; ]9 l/ U2 C1 F. B$ ?) p% [5 W& F7 d+ h( k; J
參考文獻(xiàn)
$ Z, C2 y& [5 `1 _; R# s[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021. @5 u5 X9 B+ m, v
7 [0 Z" l7 M5 U6 @ K8 B) a+ {& V
- END -! F4 T0 Y, }/ k$ h( _; U- E
P! c: D2 g2 B7 V! t7 p0 o$ @軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
* w4 f* }+ V4 H0 X$ }, ]7 r8 T點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)! @6 y& C* {5 V
* S, j& E0 c* l2 I! [& o7 i1 \
歡迎轉(zhuǎn)載
1 u( q$ t! q4 ^; |* c. F0 h" [* |% k L5 m- i9 S
轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!" N- U' G4 f! S, |$ {, G& D& ?! h
( j5 d: M" B3 m. |# l0 J" M
" R) M/ V! p7 ]# P
! E5 D( `! t' ^" A; L% @
0xpbhnxw1i464021065417.gif (16.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
0xpbhnxw1i464021065417.gif
2024-9-19 13:40 上傳
& H; }! P0 s* w6 X. v+ i3 t. i8 L4 A! W4 [
關(guān)注我們
3 v9 u# x+ H- |$ U; \6 U& g5 z( l2 C1 d& [1 x
' e" {; H7 K$ Y4 X
52hg30m1xdu64021065517.png (31.33 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
52hg30m1xdu64021065517.png
2024-9-19 13:40 上傳
. t4 S) g& J5 t# | |
0 g. T! P, s e8 Y! u" H) X
nn4ow0j30tq64021065617.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
nn4ow0j30tq64021065617.png
2024-9-19 13:40 上傳
- X) ]1 J4 t4 Q
|
5 q# x$ f7 }6 U+ W+ O- E
24dgnjrfrph64021065717.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
24dgnjrfrph64021065717.png
2024-9-19 13:40 上傳
0 `( s; \5 A( x/ p* |1 O% t- y
|
0 E" y( P; u) P! z2 i* f' k
7 s% Q5 [2 z3 K9 k+ k* L: g6 A9 X( {1 x# b$ Z" X- o
6 a c& w% I7 g. ~" P( N ^$ `關(guān)于我們:5 N/ `0 j% ]+ V4 B; u
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。- S' \5 b% _8 K9 E+ r
. W7 Z9 _ b7 r; Y/ G3 Ihttp://www.latitudeda.com// f+ e7 H% c6 u( K5 z9 L
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|