|
引言
% b: v2 Z( p2 [$ A2 a/ \4 P隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
9 `/ w: I4 s3 I& r" \# e! u: O6 F9 s+ Z# j+ `$ X! S! q
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
6 P% b; G, c( C$ s' m1 i$ s8 Y4 [3 i- h7 n+ o6 i' s& D* g$ ]" e
3 P( l" E7 {8 \+ c: W `背景
$ L8 T6 h+ P# \( H光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
' F! p( P/ d& e) c激光器:光源,可以是片外或片上調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)波導(dǎo):在芯片上引導(dǎo)光光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)$ d; a( A9 C) e/ ~5 @
; t' V+ L$ T. j: f% p
光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
3 i1 P/ i' G, X0 ?. m/ H+ x6 W2 g/ M3 T3 Q! B
為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:
% o L1 @. z$ g7 J監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)預(yù)測(cè)未來活動(dòng)相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)) _% h( G/ {' T4 u+ F. q
% S+ P& O' s' e( E& M5 q讓我們看看為不同類型處理器提出的一些具體方案。
8 s. A/ E- ^2 P. k' w
; {) I# F' `% ^多核CPU設(shè)計(jì)中的激光調(diào)制方案
! ?8 a- { p$ ]1 z: P1 t! bProbe. I; i2 O9 O, V8 {: E0 L" X
最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。+ W0 {1 I4 v" O. L; R7 W
. U, Y# N& S. B) M) A2 I+ N
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來活動(dòng)。使用兩種類型的預(yù)測(cè)器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
5 u# Q" e# m( L1 {; W, s[/ol]
' d5 k7 Q* T2 K7 g- c錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。, f8 ]) I: W+ W
& ?- Z: j2 W) P: lColdBus
' B! }8 ~: x: fColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
! K. e [* w( d. i; @2 G, R' a6 k6 _) a0 i: X: l- H$ U2 X0 }7 a
使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。
3 t( O; G ^# f6 {: @
5 Y' b2 \! [0 A! b) `& g; e5 EColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。; F3 @! Q. P( s" z
( @, F' ^, n: w2 [9 p+ J+ D3 R8 q
PShaRe
# l# R6 p% M! j, C7 `! R, |5 jPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧, z7 K7 S& E; Q$ v2 _/ ^! \* O
[/ol]
, k; b J3 i) t* E' \$ N圖1顯示了整體架構(gòu):6 j$ X* B4 N" S# W' C
5 m! Z" V0 v/ t/ J: ^( S0 m
v0i132opydn64034878813.png (157.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
v0i132opydn64034878813.png
2024-9-22 01:17 上傳
' o8 n' X* X0 W圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。" M% K" g, E' N* J# K: m
7 w. Y+ ]* D3 o. y/ f& |
神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。3 I) t5 F. u! R* }% | y
! l% Z- D5 \% b; Y5 t [' y7 bBigBus) ?4 W9 |0 r& g
對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
5 z* E2 \ O$ U3 k- k2 w, f, d! Z4 [- X/ f; N- T! x
圖2說明了BigBus設(shè)計(jì):: \: L% Q$ g) Q' d6 p5 e8 A
e2 d4 m* p5 q% U. m8 K
2lsssyofp4g64034878913.png (216.89 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
2lsssyofp4g64034878913.png
2024-9-22 01:17 上傳
8 w+ S h3 R$ c# K" _- C# Q/ p: U圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
' R3 H- c/ ?4 S0 p5 F5 s( U7 `1 R3 ~8 F0 |2 Z. H& [; i
BigBus使用兩階段預(yù)測(cè)過程:每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合9 |6 \( S: J: v3 U+ z, E* _5 m
[/ol]
' \& [/ d6 [0 h. X這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
$ Q/ ]7 j/ h+ c1 I, j' `# Y
& Y7 R: s$ q9 p6 A; \! i0 Y% ?1 e' S0 T; l
多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
1 x( G" Q, G, \" F' ^; e對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。/ L) G+ e0 C8 O; m2 f. W0 C" J
8 b8 I) X+ k; @) C; h3 R. @片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊(duì)列中的待處理事件, a7 W7 J. n# H; a* ~/ F q0 D/ _9 M |
[/ol]% T- G# O* M* h& H3 z# u
功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。0 U% O/ z! N! P; l6 G! {
: W; L. R* u5 dGPU設(shè)計(jì)中的激光調(diào)制方案
9 j7 X& U; v) W4 V0 V6 F由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
3 `6 N0 }( m: U, R0 Z; X# B1 y; ?6 [0 \6 x
圖3顯示了GPUOpt的整體架構(gòu):
W+ {( Y; M( U: Z: n$ g9 A1 H, H4 j- a6 Y# M e0 D
m5tbfrm3byw64034879013.png (198.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
m5tbfrm3byw64034879013.png
2024-9-22 01:17 上傳
5 u& b$ ~$ Z% M) g r7 ?7 A3 w圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
) |( r0 M$ d6 t: c: N7 M" L Q3 |8 p/ ]9 d* j
GPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:
I9 y: C, X& H8 u- W1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):
+ F: \) B C) x, W( {: k8 [5 M2 N接收的消息發(fā)送的消息等待時(shí)間
! f4 U0 A$ A4 I4 p8 G: `8 Y$ e1 c9 } s7 r. [/ v9 s/ D. _$ g
2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):
l, j6 L" T& c# z0 x$ e接收的消息發(fā)送的消息待處理事件
$ `% {6 g9 l* c3 J2 x/ b; S( K: [6 ]8 s6 E* C' }0 z. u
激光控制器將這些預(yù)測(cè)結(jié)合起來,確定整體功率需求。 d; P! a* Q* X8 i
% p I [0 q0 @) u% F4 ^ I; x5 V
關(guān)鍵概念和趨勢(shì)
: J' [7 V- w2 ?6 g3 M9 ~6 C雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:
& K, b( ?' l. ^+ j6 l4 N; R/ Y! M! a$ d$ V- H5 \4 T; A t
1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置' R$ \$ K6 n) L: h6 T: }/ @
2. 使用多個(gè)輸入指標(biāo):
- q s8 A0 W: {; I$ @0 j網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件. d4 Z3 l" `! q
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合8 ^6 ]& A9 }4 c0 S1 T# j
4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
" t' h1 _7 Z, f) o1 O4 E5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)& K4 a' F: _; A2 Q( L
6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性; \% }3 t {) G, @
7. 盡可能重用未使用的光功率
; G+ m* R4 e4 L% j6 P) x: T# W8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
3 @& {* _+ W5 Q# c* X4 H$ ?" i) u" L' A" p( {
圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。
) l9 l# Y* k( H& s& Q
* o+ A/ c, M) b- D; r, ^; _/ K
om02xkr3dhc64034879113.png (100.12 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
om02xkr3dhc64034879113.png
2024-9-22 01:17 上傳
" t$ |! E4 D0 j
圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。
; ]* {1 B0 r' ^) C j# ^% L3 z$ X& R, m$ y8 w$ f8 q+ `* C& R0 U H
2 A( q' Y+ X' k) B8 `( i: _- u4 _
未來方向
, O) o9 a" z; N9 K6 L" F8 o' G隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
, u) e' @9 U3 u. n2 _. ?7 n用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識(shí)的集成在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對(duì)新興工作負(fù)載(如AI加速)的專門化
. z) \5 ]( u4 ^4 ]4 f+ b; `& z9 C; T2 j; C) o0 ?
& a: w: g* l6 u結(jié)論
8 i* X ^( z* m R$ K* d有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計(jì)算系統(tǒng)解鎖新的能效水平。
6 R9 E6 e& V; G' u. Q7 Z
& g. g9 X; C, y2 m9 a' ?) p: w' L A
參考文獻(xiàn)
9 ]- o! y" P* |1 K& n# i[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
8 G3 U/ o, R" o1 v4 }5 A/ z) F! [0 m) \! b1 T2 w& k
- END -
# B- R" T% ]+ p9 c
- [( d3 y2 l1 E) O0 }+ _/ y( A" W軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
- Y- ~1 w( ]4 W t( @點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
% {9 @6 o7 M7 _3 `
/ _0 |5 { t: y歡迎轉(zhuǎn)載# F4 \0 s8 w( V F
: j0 x9 D* D! y) f9 R( {6 Q4 e
轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!8 X+ Y# b; b* z2 U3 e
! `' ]$ ^7 ^; F6 a u
" q! U+ L1 `/ I: ^' |0 @' Q, J" e1 G! E; U5 I$ a$ E! X
tlesfwadvw464034879213.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
tlesfwadvw464034879213.gif
2024-9-22 01:17 上傳
* A3 x5 Y z5 J: {6 B# G2 e# U# T! y
關(guān)注我們& u# A& X( E! J2 `
4 s4 n& i9 o: C9 B+ P- ^
3 S2 H. k9 y/ G9 _& W
0rzxntnecf364034879313.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
0rzxntnecf364034879313.png
2024-9-22 01:17 上傳
, _, @9 A* k9 }. x( h3 f |
$ Z+ P% ]9 }+ L1 K) l, E
wklhaednp3g64034879413.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
wklhaednp3g64034879413.png
2024-9-22 01:17 上傳
W' S3 Y" l8 `& G; D | 6 X4 w& F, ]- c2 C. t* l+ d& R
v05awecejyj64034879513.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
v05awecejyj64034879513.png
2024-9-22 01:17 上傳
% O& A! p, Y. r8 l
|
) w; Y: r- L9 ^5 f, N: N- l5 l, J
# r, |6 H5 U" b" _" p" O" [" b; `+ k# h% J: ^8 `$ d" |
# F7 t# }1 K8 I- f2 S0 f0 _
關(guān)于我們:8 X: P# T( ]) P7 n
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
. _: P, W# T9 @$ I5 H" U
" G( |0 P0 N" vhttp://www.latitudeda.com/. C) J- |& f. \+ e: ^5 k V/ P
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|