|
引言
, s: G4 z( J4 ]# S F" _( d隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
$ U J8 m- ?( S8 _) H
: a$ z8 B, b+ m3 v本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
. }6 F4 V& [6 z# [) a' g4 L; O' ?! t% T
1 n5 U8 E# O, e# L3 ~( a) W1 \( o5 u! V
背景
" d* m* ^7 N% n# Z0 l光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
& J7 f4 o6 Y- Y2 ^' I激光器:光源,可以是片外或片上調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)波導(dǎo):在芯片上引導(dǎo)光光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
$ a G( C, u) t7 Q2 S2 `$ y4 ?8 B- B
光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。 f# c2 p% D$ p3 j3 b
' v$ V4 G# j" ^2 G" [1 L為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:6 F0 U* |( p5 M/ B
監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)預(yù)測(cè)未來活動(dòng)相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)
* o) [& k7 L, x* `, p9 y( U( v! @. W. l/ H1 [( y2 P7 H3 L
讓我們看看為不同類型處理器提出的一些具體方案。* j$ `: c( O7 S- D3 _7 {
/ ^9 V. { q, S多核CPU設(shè)計(jì)中的激光調(diào)制方案
5 L: O9 N. \+ T1 b$ h7 WProbe5 P/ Q/ a& v* |% Y
最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
$ P) c- {4 D$ p. j9 ^+ Q6 N' ]
/ Z% @6 d+ o' T6 p$ q oProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來活動(dòng)。使用兩種類型的預(yù)測(cè)器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
, C- v- ~7 y, r6 e[/ol]
1 h s3 _4 T8 ~3 d( q+ b: l/ ~錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。4 h, I* J# C/ {) \, I
! r! q. R9 J" w, x7 u2 G) u# EColdBus; z8 o2 c9 S3 g$ i
ColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
! X9 C6 |+ Q4 [1 b8 M: K% t4 W9 J9 b; u6 |4 o" B# a6 P& w
使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。' {1 E" `0 `* A/ c! p' w( m
- b5 q, [" @3 o6 j. j4 U. c$ R
ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。
/ l2 Z* B% i4 ^+ P4 e7 U
; [8 K5 x2 \5 [* t8 N8 O1 v+ {PShaRe `% _, F) B% X/ Y" r4 x& _0 F# }
PShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
D9 S* `/ U2 u# i/ }[/ol], v( J8 e1 U+ a3 i$ n+ @0 M. n* J
圖1顯示了整體架構(gòu):6 z6 c/ n( c" q
3 C6 t$ T; o t7 y/ P4 {( F& r: V9 A
v0i132opydn64034878813.png (157.24 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
v0i132opydn64034878813.png
2024-9-25 01:02 上傳
# W1 C4 z" z g1 {* r+ e
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。% L' L# y4 I) k1 j$ K
! u& ?+ {! @( ]
神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。
, b4 T) M6 ]' L( O! g) T# u9 t( X1 u" S
BigBus
7 @! ?! \1 k7 X對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
( n) T( D( _: l v3 l( j3 k) L/ o" s- ~/ s- e% \; Q
圖2說明了BigBus設(shè)計(jì):
( G* |! [ ^2 R# X9 c0 k5 A/ E% K1 W; g- |3 H: L, K- ^% N* b
2lsssyofp4g64034878913.png (216.89 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
2lsssyofp4g64034878913.png
2024-9-25 01:02 上傳
* L0 I6 e, _$ \9 H1 @$ |- t
圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
9 D. I- \/ |$ j( L( f# _* D; f& E# S5 n- a% R0 q
BigBus使用兩階段預(yù)測(cè)過程:每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合
/ D: q" i2 K1 g# p- ][/ol]4 V$ p2 i" e$ j8 @+ [
這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
" b' x( [5 G5 V4 ?$ k c# d; J, G: \0 X5 r! M3 P
. A; m1 b s7 l
多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案9 [' h# t% [# k/ E
對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
$ c7 ^, y# f4 Y3 p/ [1 ]( @+ S+ }7 O m6 {- }# h
片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊(duì)列中的待處理事件
! _: H4 B9 b+ u[/ol]
& k; [- D3 r: m) o( t( g9 @. p2 @功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。
9 T9 L9 R; G0 H% H
, n, G1 W" t' B, D. Q n3 ZGPU設(shè)計(jì)中的激光調(diào)制方案- u: A+ D& v4 y- M$ r
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
' q- ~. j2 j& }2 {
: }1 M \: X! H& L/ D$ v+ g圖3顯示了GPUOpt的整體架構(gòu):& I$ u' |7 ^) f
q3 a1 V- N# ?, Z# I0 ?
m5tbfrm3byw64034879013.png (198.05 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
m5tbfrm3byw64034879013.png
2024-9-25 01:02 上傳
! O+ ^1 f- }' I% r$ R
圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
6 R5 l6 a+ T$ L6 [* h
# {$ N& C" }6 N3 V* lGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:
H; f1 C! A7 C1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):- K& H6 ~. f7 K7 H! j) [
接收的消息發(fā)送的消息等待時(shí)間
+ E: P. o' B, e) X1 `" c6 Y
: B1 p2 s7 j% [) k* g2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):
P+ T5 F. p H; @" m+ `6 O接收的消息發(fā)送的消息待處理事件 K# N6 X$ c0 n3 ?# V
+ G1 E# ~8 y/ U& N
激光控制器將這些預(yù)測(cè)結(jié)合起來,確定整體功率需求。5 w% Y7 J) d) t f* E; ]7 S) v
x; x0 v O! N4 c) h7 I* p2 b, _- {& _- j; O9 d3 t
關(guān)鍵概念和趨勢(shì)
: `" i: S3 w" @1 Z雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:% c9 D5 T s, s
7 ?+ l0 w& k% E, [
1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置
$ }. ^1 j% y8 Q) I2. 使用多個(gè)輸入指標(biāo):
9 a- {/ U9 M2 l' S) e, p網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件& H! L/ h! l9 F7 |+ C4 x
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合6 V; G/ }" V$ X3 U" j3 V
4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系! H* A2 s6 T X) D L
5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)
0 Q6 P' E( p; O7 R3 s7 c+ \6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性
( W. U/ w! Q7 I# ~/ p7. 盡可能重用未使用的光功率
$ k+ l! S4 v9 M) j# g, d8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)2 }, B2 H9 J5 g3 U5 a$ \& u5 C
2 K4 W" v* A* h2 f1 ?9 x7 d# E4 s7 y圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。) A) N7 C6 G/ s) K1 r% Z
8 K$ u& M& l$ S
om02xkr3dhc64034879113.png (100.12 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
om02xkr3dhc64034879113.png
2024-9-25 01:02 上傳
5 T, t0 m7 ? h% |& \圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。9 q8 J9 b$ ~* |# Z# p6 c$ _
* U& {2 E/ m; j$ j0 E
7 L, W& X7 |6 N" e8 f$ ?未來方向% l% k/ S/ L8 k; ]3 d; J& }# q
隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:1 q' n' R: q7 Z4 D5 o. @
用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識(shí)的集成在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對(duì)新興工作負(fù)載(如AI加速)的專門化+ X+ F7 o- E. r9 [& w
v& Z9 ] e1 W! q3 J. W
% S( I% k' \8 ^, i
結(jié)論: q* Y2 L2 p5 |! q, @
有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計(jì)算系統(tǒng)解鎖新的能效水平。* i/ m1 V0 d3 L" s6 ~8 R: Y6 n
9 J2 z" A' N- S. P; s( j! E
, G$ l: S& B" \1 o6 \" Z! u8 |
參考文獻(xiàn)
: J% t3 G, \* h[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
. \$ v5 O/ N f8 ]) k/ t( L: h- R# I* D3 \0 F- P! I
- END -
) ]' I; i! [ }1 M3 z S% e' K6 c/ O% U8 V# W1 M: |3 a
軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
& ~" ^5 r6 G+ g& o$ s/ p點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
" f H9 r' b! V- D! [- a: [% r; m: l$ x
歡迎轉(zhuǎn)載
# O/ @. S" d" t9 `: m' w" L4 t
7 u0 h L; z# T2 d' C5 g% e轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!2 n/ W4 g$ Q( M' o/ v( n9 A* p
0 v! h8 f: b* w+ P ^3 v+ K
' Y/ j+ }" A% _' K8 |
8 G6 c& r# f* C
tlesfwadvw464034879213.gif (16.04 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
tlesfwadvw464034879213.gif
2024-9-25 01:02 上傳
/ a: c8 \, A3 t3 z" @# L
; G- Z2 f e' l. f
關(guān)注我們8 P6 f T K) Y
! c; B, _$ z$ [# F& Z- |! ~) w
8 a1 l: ]7 u1 p
0rzxntnecf364034879313.png (31.33 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
0rzxntnecf364034879313.png
2024-9-25 01:02 上傳
; ]6 ~- k# s3 c5 g6 f4 H
| ! T& c0 P [, w* J
wklhaednp3g64034879413.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
wklhaednp3g64034879413.png
2024-9-25 01:02 上傳
4 A5 z' \+ s8 q7 _
|
6 ?: l @+ T* s6 D/ A U8 @: N+ @
v05awecejyj64034879513.png (21.52 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
v05awecejyj64034879513.png
2024-9-25 01:02 上傳
' I# i3 s+ a, M2 f
| 5 ^7 [! k% ]4 K8 g1 q2 s- w
7 @; ^3 H2 ?3 Z! b
3 G3 W6 n* F( A9 F
3 a4 z( _+ h4 S' o; [5 @關(guān)于我們:! i& [7 V, \' X q! _/ Z9 I" _
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。( B. h2 @6 s; U4 v2 N) p
/ `1 l5 i+ X* n1 E& E. t; I, k& y
http://www.latitudeda.com/- h6 y( Q6 e& n( j H, ]( i
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|