電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 26|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級(jí)會(huì)員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言
, s: G4 z( J4 ]# S  F" _( d隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
$ U  J8 m- ?( S8 _) H
: a$ z8 B, b+ m3 v本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
. }6 F4 V& [6 z# [) a' g4 L; O' ?! t% T
1 n5 U8 E# O, e# L
3 ~( a) W1 \( o5 u! V
背景
" d* m* ^7 N% n# Z0 l光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
& J7 f4 o6 Y- Y2 ^' I
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
    $ a  G( C, u) t7 Q
    2 S2 `$ y4 ?8 B- B
    光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。  f# c2 p% D$ p3 j3 b

    ' v$ V4 G# j" ^2 G" [1 L為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:6 F0 U* |( p5 M/ B
  • 監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)
  • 預(yù)測(cè)未來活動(dòng)
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)
    * o) [& k7 L, x* `, p9 y( U( v! @. W
    . l/ H1 [( y2 P7 H3 L
    讓我們看看為不同類型處理器提出的一些具體方案。* j$ `: c( O7 S- D3 _7 {

    / ^9 V. {  q, S多核CPU設(shè)計(jì)中的激光調(diào)制方案
    5 L: O9 N. \+ T1 b$ h7 WProbe5 P/ Q/ a& v* |% Y
    最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
    $ P) c- {4 D$ p. j9 ^+ Q6 N' ]
    / Z% @6 d+ o' T6 p$ q  oProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來活動(dòng)。使用兩種類型的預(yù)測(cè)器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    , C- v- ~7 y, r6 e[/ol]
    1 h  s3 _4 T8 ~3 d( q+ b: l/ ~錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。4 h, I* J# C/ {) \, I

    ! r! q. R9 J" w, x7 u2 G) u# EColdBus; z8 o2 c9 S3 g$ i
    ColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
    ! X9 C6 |+ Q4 [1 b8 M: K% t4 W9 J9 b; u6 |4 o" B# a6 P& w
    使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。' {1 E" `0 `* A/ c! p' w( m
    - b5 q, [" @3 o6 j. j4 U. c$ R
    ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。
    / l2 Z* B% i4 ^+ P4 e7 U
    ; [8 K5 x2 \5 [* t8 N8 O1 v+ {PShaRe  `% _, F) B% X/ Y" r4 x& _0 F# }
    PShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
      D9 S* `/ U2 u# i/ }[/ol], v( J8 e1 U+ a3 i$ n+ @0 M. n* J
    圖1顯示了整體架構(gòu):6 z6 c/ n( c" q

    3 C6 t$ T; o  t7 y/ P4 {( F& r: V9 A # W1 C4 z" z  g1 {* r+ e
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。% L' L# y4 I) k1 j$ K
    ! u& ?+ {! @( ]
    神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。
    , b4 T) M6 ]' L( O! g) T# u9 t( X1 u" S
    BigBus
    7 @! ?! \1 k7 X對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    ( n) T( D( _: l  v3 l( j3 k) L/ o" s- ~/ s- e% \; Q
    圖2說明了BigBus設(shè)計(jì):
    ( G* |! [  ^2 R# X9 c0 k5 A/ E% K1 W; g- |3 H: L, K- ^% N* b
    * L0 I6 e, _$ \9 H1 @$ |- t
    圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    9 D. I- \/ |$ j( L( f# _* D; f& E# S5 n- a% R0 q
    BigBus使用兩階段預(yù)測(cè)過程:
  • 每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合
    / D: q" i2 K1 g# p- ][/ol]4 V$ p2 i" e$ j8 @+ [
    這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
    " b' x( [5 G5 V4 ?$ k  c# d; J, G: \0 X5 r! M3 P
    . A; m1 b  s7 l
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案9 [' h# t% [# k/ E
    對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
    $ c7 ^, y# f4 Y3 p/ [1 ]( @+ S+ }7 O  m6 {- }# h
    片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件
    ! _: H4 B9 b+ u[/ol]
    & k; [- D3 r: m) o( t( g9 @. p2 @功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。
    9 T9 L9 R; G0 H% H
    , n, G1 W" t' B, D. Q  n3 ZGPU設(shè)計(jì)中的激光調(diào)制方案- u: A+ D& v4 y- M$ r
    由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
    ' q- ~. j2 j& }2 {
    : }1 M  \: X! H& L/ D$ v+ g圖3顯示了GPUOpt的整體架構(gòu):& I$ u' |7 ^) f

      q3 a1 V- N# ?, Z# I0 ? ! O+ ^1 f- }' I% r$ R
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
    6 R5 l6 a+ T$ L6 [* h
    # {$ N& C" }6 N3 V* lGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:
      H; f1 C! A7 C1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):- K& H6 ~. f7 K7 H! j) [
  • 接收的消息
  • 發(fā)送的消息
  • 等待時(shí)間
    + E: P. o' B, e) X1 `" c6 Y

    : B1 p2 s7 j% [) k* g2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):
      P+ T5 F. p  H; @" m+ `6 O
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件  K# N6 X$ c0 n3 ?# V
    + G1 E# ~8 y/ U& N
    激光控制器將這些預(yù)測(cè)結(jié)合起來,確定整體功率需求。5 w% Y7 J) d) t  f* E; ]7 S) v

      x; x0 v  O! N4 c) h7 I* p2 b
    , _- {& _- j; O9 d3 t
    關(guān)鍵概念和趨勢(shì)
    : `" i: S3 w" @1 Z雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:% c9 D5 T  s, s
    7 ?+ l0 w& k% E, [
    1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置
    $ }. ^1 j% y8 Q) I2. 使用多個(gè)輸入指標(biāo):
    9 a- {/ U9 M2 l' S) e, p
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件& H! L/ h! l9 F7 |+ C4 x
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合6 V; G/ }" V$ X3 U" j3 V
    4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系! H* A2 s6 T  X) D  L
    5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)
    0 Q6 P' E( p; O7 R3 s7 c+ \6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性
    ( W. U/ w! Q7 I# ~/ p7. 盡可能重用未使用的光功率
    $ k+ l! S4 v9 M) j# g, d8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)2 }, B2 H9 J5 g3 U5 a$ \& u5 C

    2 K4 W" v* A* h2 f1 ?9 x7 d# E4 s7 y圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。) A) N7 C6 G/ s) K1 r% Z
    8 K$ u& M& l$ S

    5 T, t0 m7 ?  h% |& \圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。9 q8 J9 b$ ~* |# Z# p6 c$ _

    * U& {2 E/ m; j$ j0 E

    7 L, W& X7 |6 N" e8 f$ ?未來方向% l% k/ S/ L8 k; ]3 d; J& }# q
    隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:1 q' n' R: q7 Z4 D5 o. @
  • 用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識(shí)的集成
  • 在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對(duì)新興工作負(fù)載(如AI加速)的專門化+ X+ F7 o- E. r9 [& w
      v& Z9 ]  e1 W! q3 J. W
    % S( I% k' \8 ^, i
    結(jié)論: q* Y2 L2 p5 |! q, @
    有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計(jì)算系統(tǒng)解鎖新的能效水平。* i/ m1 V0 d3 L" s6 ~8 R: Y6 n
    9 J2 z" A' N- S. P; s( j! E
    , G$ l: S& B" \1 o6 \" Z! u8 |
    參考文獻(xiàn)
    : J% t3 G, \* h[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    . \$ v5 O/ N  f8 ]) k/ t( L: h- R# I* D3 \0 F- P! I
    - END -
    ) ]' I; i! [  }1 M3 z  S% e' K6 c/ O% U8 V# W1 M: |3 a
    軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    & ~" ^5 r6 G+ g& o$ s/ p點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
    " f  H9 r' b! V- D! [- a: [% r; m: l$ x
    歡迎轉(zhuǎn)載
    # O/ @. S" d" t9 `: m' w" L4 t
    7 u0 h  L; z# T2 d' C5 g% e轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!2 n/ W4 g$ Q( M' o/ v( n9 A* p
    0 v! h8 f: b* w+ P  ^3 v+ K

    ' Y/ j+ }" A% _' K8 |

    8 G6 c& r# f* C / a: c8 \, A3 t3 z" @# L
    ; G- Z2 f  e' l. f
    關(guān)注我們8 P6 f  T  K) Y
    ! c; B, _$ z$ [# F& Z- |! ~) w

    8 a1 l: ]7 u1 p ; ]6 ~- k# s3 c5 g6 f4 H
    ! T& c0 P  [, w* J
    4 A5 z' \+ s8 q7 _

    6 ?: l  @+ T* s6 D/ A  U8 @: N+ @ ' I# i3 s+ a, M2 f
                          5 ^7 [! k% ]4 K8 g1 q2 s- w
    7 @; ^3 H2 ?3 Z! b
    3 G3 W6 n* F( A9 F

    3 a4 z( _+ h4 S' o; [5 @關(guān)于我們:! i& [7 V, \' X  q! _/ Z9 I" _
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。( B. h2 @6 s; U4 v2 N) p
    / `1 l5 i+ X* n1 E& E. t; I, k& y
    http://www.latitudeda.com/- h6 y( Q6 e& n( j  H, ]( i
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長(zhǎng)推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表