電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 36|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級會員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
: p; p8 z5 v7 L; N$ L+ w隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
* n9 f: @9 y; }
! o4 Q$ z- q- ~1 @, U; w8 i本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。% ]( f9 S8 W+ `0 u+ D

1 C3 y3 L7 D6 a) L1 K. q1 _
  h- y8 g- z) u1 e  A% L" q3 V, [
背景
0 `0 u8 b1 x% F9 ~' P光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù)。基本構(gòu)建模塊包括:
6 n- v6 C; E& A) _2 |, F2 V
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號轉(zhuǎn)換為光信號
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測器:將光信號轉(zhuǎn)換回電信號
    * ~* D2 q6 `1 `/ p, f/ }

    ( R! ^& Q# }3 Z- W/ M5 I& q光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。" d2 _: @, e9 {' N; V" ?! I3 F
    ! g; D3 T- Z2 Z  ?2 B7 x
    為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:7 F! W1 b4 w. U" J! e/ E' ?
  • 監(jiān)控網(wǎng)絡(luò)活動指標(biāo)
  • 預(yù)測未來活動
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)4 V! k% s3 X" T6 [2 n" Q
      I# z( |. V- l4 L
    讓我們看看為不同類型處理器提出的一些具體方案。& L& n" R4 t* ?( i/ \

    3 Z+ _. V- ^9 {) o; }9 ^% f' j, k多核CPU設(shè)計中的激光調(diào)制方案3 i  u5 b- O9 r3 S" c2 R% Z
    Probe
    + @$ o" b  v1 L/ r; Y2 f最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。( P4 |8 j9 O8 I% g' g8 P5 }; A. L: p

    7 W0 M$ f, o9 L" r6 A. AProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表5 ?% m' O+ u5 w0 f
    [/ol]
    ! u4 v# {6 r7 ^2 b% l8 j錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
    4 L' D$ H: _5 a7 R7 i8 i* D5 c% k- d
    7 A; `9 j" n+ c7 K3 k- M# R4 @) iColdBus
    2 e; A; ]% r& p' s2 u: O4 tColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
    . t# \* n, J( T% w! D2 I
    6 V  V7 M# }7 {- g使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。
    & A2 N# s, p1 I6 g! l- `8 Y6 K5 w. w3 i4 }
    ColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。
      d* ^) U4 \* w4 B
    4 ~0 M& x5 _0 i' b) wPShaRe
    ! z' r, T6 ?& ~& MPShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器
  • 站點之間的功率共享
  • 重用浪費的光功率進(jìn)行熱調(diào)諧
    # k8 [, X! m5 M6 _& R& M[/ol]6 m, d9 X* s! J$ I0 \
    圖1顯示了整體架構(gòu):3 N' ^# e2 t: g; U- O+ {
    ! v' U# e! _6 ~3 D5 A. Q. w
    ! Q4 c3 x4 h# \/ T. U
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。2 z" G/ V; D1 n7 r' d5 Q

    . J8 V; }9 D# U神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進(jìn)行二元預(yù)測。
    ) Q; m  v- Z  O5 ?7 S  b0 f1 L) {& n+ n, k- @" w% t0 @
    BigBus$ J- n# a( c( i: ^7 Y
    對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    ) N0 k5 K- b6 C/ C- R7 U6 J: @
    ( \; N# l: r8 f1 U7 j7 e圖2說明了BigBus設(shè)計:$ P2 `8 E; e& T! W9 E, ~% w+ m& q! c
    * j9 x2 }4 X, j: h2 H9 e

    5 r: ~3 s' ^- i, f圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    0 p* B0 p& _/ A. a& J& `
    " |$ C* G3 z, F5 Q' x, v$ ~BigBus使用兩階段預(yù)測過程:
  • 每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合$ s8 I+ e- P* b
    [/ol]* C3 k3 J# q8 l
    這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。; G5 H: h* f5 A& _; k  n1 j

    0 C- b- n8 W& I  f
    3 n4 j  h! A% \. f) u- O
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案/ p# s' Y6 z8 ~1 e- |0 D, Z$ G$ A& _
    對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
    ( n8 t% f0 Q. M! d4 U5 F9 {2 F: U  f$ f: k
    片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊列中的待處理事件. z/ A/ q: ~$ w1 A+ ?* L. G3 i- W8 N
    [/ol]
    ; B& X  }3 j" k功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。" {( Y0 D+ d/ E; W0 c, D
    7 [: o' g2 N; L" z  c) N
    GPU設(shè)計中的激光調(diào)制方案, n. E7 G1 K0 `, P) W
    由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。
    - P) F. G7 D4 L) c9 G  w) I0 F7 ^2 X0 P
    圖3顯示了GPUOpt的整體架構(gòu):/ I6 h. e3 T, z: }' @
    ' z+ j# A5 b& N6 d

    : \, Y9 h- j$ F9 t+ N* i6 c0 ?圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
    2 [1 w* h) b* b- ]2 R* f0 w- @8 H  I6 i
    GPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機(jī)制:
    - W# x- p% }, G; T1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):
    3 S! N" C% S$ r) k
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間
      q( F/ w! e! K4 F+ G
    7 Q& h+ ^. G, m$ W# e7 W
    2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):1 a5 ]6 |) h( v1 o+ B* e$ y) [% B
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件# D; r4 z% r5 }+ X/ j6 Q' N, x
    / F4 Z* b" B9 Q8 X
    激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
      a. ~6 G8 a! h
    ! z+ C% j& P" X0 J) n) C) a0 o

    / A2 }, m) J9 E% j+ \6 |. W關(guān)鍵概念和趨勢
    " [: _, y: M  R6 i8 ^+ x  m7 {雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
    / K& Y" U# u$ R$ x) N6 B1 X/ H
    * B5 U0 ?  @+ p& j& z1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置; w/ ?* x9 u' Z* h8 }) G: z  {# `
    2. 使用多個輸入指標(biāo):% Z2 ?# e! ~2 ~" l
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件
    ) a& O0 q  H. H0 f8 Z
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
    " H9 J0 y- C2 [, z2 ]  O. Z4 p4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
    0 f% V- G  i3 i* ^4 l9 a5. 對不同流量類型進(jìn)行單獨預(yù)測(如一致性與非一致性)
    . m4 o1 b! P8 ^+ X6. 分層設(shè)計以實現(xiàn)可擴(kuò)展性" k1 F( Y6 F0 S4 _$ J  B
    7. 盡可能重用未使用的光功率
    , a. v: Z! T( F  }8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù)* b. I% i  u3 M! I

    2 J5 e' [* r7 J圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。% k- ~7 f8 N, ^' R- |; L8 |0 I

    6 B. K% G$ m  A/ X9 b/ J; g# t
    ' d( z4 W8 ^; b4 s& K2 B9 X! P+ p4 h圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
    3 s) B) i, R9 q* {/ O! f3 H# b& i8 h# v" }! G  L

    . w" y' m# i, r未來方向. a0 g. a' D! A6 \( m( c/ \/ F
    隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:, X3 T+ i1 Y2 @! E
  • 用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識的集成
  • 在運行時調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對新興工作負(fù)載(如AI加速)的專門化8 R2 J# ?; o: c$ T. i' |! a" W* F

    & }3 r7 ~/ N* ^" P1 e: H; @
    6 c: M# p$ ~; l" W3 M
    結(jié)論
    , q3 w6 v- q# q% S9 w3 k  n3 x有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    - `% q" }/ L) _& D- u9 i- m6 S  z- n* `- `/ w& c

    + o$ m' z% f7 |5 E, }參考文獻(xiàn)' {+ }! T% n% \3 P1 M2 D6 l
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.5 z/ i, P. I" u; E5 X$ f, R

    ( j4 m0 x9 m3 }) z7 m- END -
    7 X, }6 l: C3 l6 r
      E; v( V  G5 a! k; s. o軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。2 w, D- s2 d% _* e5 i: ^9 V) c
    點擊左下角"閱讀原文"馬上申請4 e8 d5 g: B6 q" ?: A
    1 a2 Y0 i5 M/ q4 @: I( s- A) ]
    歡迎轉(zhuǎn)載* o- g) r6 \% s8 ^

    ! s5 n6 \% `- J4 S! j; G6 k轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!5 P  `% p' M* |$ E4 ?9 g) l
    * e0 K& p* A" |# q2 f

    1 H$ U0 t# a/ v; ?9 B
    & h: o7 n2 E* v1 n- h9 c
    : W. E  x. w# }: Q0 M2 e' a

    6 C5 Z, ~, \) n6 Q關(guān)注我們6 s2 F6 Q# {% ~  b* b+ M$ s( C
    ) X* ~4 R# H7 L& w1 h

    & }- D' l  a2 u: T, K/ q , B+ R2 C- b# ~4 b0 _1 E
    7 z) |7 ]$ @. z" |0 d! n" C# S1 k
    : E* r0 }5 W- M. G" [7 O* g4 z, A

    $ ]: ~% q" W) h0 q7 `, a. Y 8 U# w4 u" S' |6 W) l3 |- Q& d
                         
    0 T7 z6 ^9 J; d9 |7 h' D* \- {, M% `9 D! @4 l- M8 {8 X

    2 h: v0 d9 u5 ?& i! L
    5 `5 O; @$ W( o5 r: x( W2 v: V& }  Z- B關(guān)于我們:6 l3 y7 D* V+ e8 @0 R  d
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。  n. m+ N* L: z% e" K3 e; o
    - X$ u) B" N! ]. ^5 J% D: s
    http://www.latitudeda.com/
    " ?1 |. }4 W( c(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表