電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 81|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級會員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
1 L* L2 E; o3 m隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
, k% a  h# y  r/ c1 b3 {' L' E) O6 Z! v
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。( J1 a/ c) {0 C- W& i3 I9 `
, _% }: t, c' i

5 J7 }% ?! _4 m& C, g背景9 D+ B+ u" [, ^  e% }
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
; Y! h6 X8 F6 x+ q! [
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號轉(zhuǎn)換為光信號
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測器:將光信號轉(zhuǎn)換回電信號
      r2 V' q0 \5 v1 L2 e, Z8 ^  s3 w

    / u& c7 E) q& C, ^. a7 H7 [光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
    $ m3 S; }- \. I8 R# u! _* J" R9 @% p( I: ~" H
    為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:
    4 v6 q4 }# V0 E9 r% O: y
  • 監(jiān)控網(wǎng)絡(luò)活動指標(biāo)
  • 預(yù)測未來活動
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)& E; \4 T8 f/ a6 a4 K  ~" _9 {
    ; L0 d/ s: }! D4 \, n2 K1 H# N
    讓我們看看為不同類型處理器提出的一些具體方案。
    9 x- S. h; o( N4 m+ f) g$ R
      y* C( Q7 R9 P1 G3 d: C% P$ c多核CPU設(shè)計中的激光調(diào)制方案: [/ m4 O5 G$ V3 G5 o9 o! g2 _
    Probe- `7 m3 I% N! [2 U  p
    最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
      R# X  \; t1 n" V
    3 G) E4 v% m+ ]7 u8 g! K1 i$ `8 A6 S. N! pProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    . j# J2 w7 k- Z3 r2 z+ z( [[/ol]3 P' z# f9 T8 [! f/ G* a& U- c6 Z7 r
    錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。- ~) |& K$ {9 a; K; c! r

    3 A, ]6 `2 h& EColdBus
    0 R4 z, o5 w. t% [ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。* a3 \8 J8 E& Z9 B' |0 [! [
    ; D! Q; V( x, j) S& O5 X5 `4 q, B
    使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。. A4 H2 N: e/ A4 J3 o
    3 v4 N" A9 n' Y( D) }% ?
    ColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。* S$ ?2 `0 I+ ]6 @; E  y. G% g
    9 i+ ~. m7 i, D& Z
    PShaRe  Q, @0 c+ n+ f( V
    PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器
  • 站點之間的功率共享
  • 重用浪費的光功率進(jìn)行熱調(diào)諧7 M+ g# u; I2 |
    [/ol]3 J: q3 ~! `5 E
    圖1顯示了整體架構(gòu):; p9 ~: i/ d9 y* |# \/ y
    & z* Y: ~5 p; S/ O
    . [" g/ Y" Z. p9 C
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。& R7 j7 y4 {3 h2 \
    ( Q( L& O2 d  z5 [
    神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進(jìn)行二元預(yù)測。
      s  G, U( D5 P7 r
    1 P9 G) g( j! T6 C4 O7 K$ \, hBigBus
    1 p. \+ U# ]: ~對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    , h! t" y4 C8 A* }+ |
    ) Y* `2 V  G+ |8 X5 \6 g圖2說明了BigBus設(shè)計:
    # n0 b1 i- V6 D3 _% y$ W1 h& m0 s% ^) x  ]$ v; [) V* A9 J

    7 c% m0 q8 s6 ~! J1 d: H& S* i圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    3 t! M) v" I/ Z4 p8 v- i! _& r3 \/ J- d, F8 x& M9 {. l6 l1 J
    BigBus使用兩階段預(yù)測過程:
  • 每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合
    4 m+ G1 s: y- ^1 ]$ ?& M; W  ^1 v[/ol]
    $ m* m3 G, n( ^( E- q- L這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。; k  e! s1 a9 X4 t

    * x  n2 u+ `6 z% o% X2 b$ i  {$ n% @4 L

    6 z$ E4 I; z' M: d3 G8 m9 h' s多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案% c4 [& ?/ y5 ~/ M+ I+ q
    對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
    3 D! b  i3 h7 g: {, l0 i* z+ b+ s# c9 ~* n: {/ u( j, v. m
    片間預(yù)測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊列中的待處理事件1 r8 r. [7 D5 e  r5 k2 U7 ^4 x
    [/ol]5 H, X% K1 l% {1 @9 G1 {
    功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。
    - o8 W  u5 y' |/ K( R' p& Z0 y
    ! z; Y4 B" T& m. YGPU設(shè)計中的激光調(diào)制方案2 a: M. P! E4 y+ x0 O) c8 J
    由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。
    - l4 W- p& S6 @, G
    . r0 H2 K6 O+ L, x4 ~. q+ ~圖3顯示了GPUOpt的整體架構(gòu):  d6 h7 ^3 Y) S, u! a, L5 J

    2 d8 R4 b  A- j: p2 O1 @" C& e- e' d 2 l. y% t& R6 m5 O7 Z; G. P
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。' o2 F1 c7 e0 k, `1 C

    / ]. m. B2 ]7 R% }' q3 c, iGPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機制:% o9 H% i- b' D( t4 `; }
    1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):5 i: Y% f8 p) u
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間
    0 J# w, P3 a$ j1 o
    , T: e, ^1 d6 Q/ C7 T6 {( @
    2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):% K+ k6 Q- v' h0 F+ P& }7 F
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    , f8 b# ^& D8 T* ~8 G: L

    3 ~  i6 b: p9 o% h* _激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
    & x. o5 }+ t$ m; ?: @8 r
    4 r8 Z1 ^( N- Q+ f( x+ f
    4 w8 B: Z' v% p! ~9 {
    關(guān)鍵概念和趨勢
    . q+ S$ U' o9 P% L- m5 y雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
    8 }& [( R' I: x2 D
    & `- c; z! J+ j$ F' `7 [5 i2 k1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置8 o1 c6 U  ~: c0 R5 J2 v* R; G
    2. 使用多個輸入指標(biāo):9 {3 L7 Q& q, r2 C
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件2 N) d# }( M0 `" N8 D9 e
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
    : V1 {% \  t, j+ S4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系1 ^3 B) S: z2 e/ m3 u
    5. 對不同流量類型進(jìn)行單獨預(yù)測(如一致性與非一致性). i# p0 _) E5 J: i; e' z
    6. 分層設(shè)計以實現(xiàn)可擴展性
    6 `6 z5 G" J8 K( O4 ?& }. ?& c7. 盡可能重用未使用的光功率. ~5 K; |& Y- @( D- D
    8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù)# e: f" p* p% x$ d, j. X
    - o% s3 I7 b6 [- _& @. e! g% m
    圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。- n) t1 S- S6 p" @8 v
    0 N$ N0 b* w' Y% [7 {" }

    # D4 f$ v% U" ?3 H- F' P  N圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
    0 t4 u+ P: ?( G7 a* w2 V( L9 m$ w$ ~

    $ L  Z! l4 k, }# ]: A未來方向! n7 z& n$ X' r6 g5 C/ f8 _
    隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
    6 r. e, M0 O1 c2 Z0 V
  • 用于更準(zhǔn)確預(yù)測的機器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識的集成
  • 在運行時調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對新興工作負(fù)載(如AI加速)的專門化
    3 {% A( l& N* ]6 Q

    0 |$ {4 J% [3 v: k
    # M3 i( r: h+ w6 T& a8 e, u9 V6 f
    結(jié)論
    ! H8 p, D' X! N, k1 O' y( C" t. d有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    ' ]; f; o9 [+ L; o" W1 t' h: I. v1 Z3 v- ^4 B" c/ _
    / |, @9 S. [( m/ ~. |) Y' m
    參考文獻(xiàn)
    " I& o, K' o$ L( Q[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.6 ~+ r4 M1 z8 D* H# f
    7 s  p& V. g2 Z9 Y! P8 Z1 k* Y
    - END -5 q# b: |/ p$ I. ?

    / ^% H* i' Z2 P' X軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。3 p6 v# K: B8 z/ r/ \
    點擊左下角"閱讀原文"馬上申請! K, R5 l4 H# g2 |/ l
    6 ]& Z: f( D3 |4 b, d  ^) ~* {
    歡迎轉(zhuǎn)載
    # @# _7 v- M5 `9 w  a7 b- o$ _* S$ ?/ T; t7 j6 a! y
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    / a+ ~8 t4 m" O. n' Z+ Q$ s
    # [* I/ |) w3 s  `9 k0 o
    ( z  v  v% {6 ?" Y

    ( N2 x1 X3 [/ P1 i9 u3 t & d/ [! ^& }0 ]

    ! R, {2 I! N: H關(guān)注我們% V  F, I# d0 L2 {6 c0 ?

    + x6 s5 A+ J0 W/ M2 x5 ~2 v
    # m3 z: ~. j* D: s" X

    # ?8 H. S' F+ D! ?4 F

    8 v# n+ L3 o; \/ O
    4 C: N  a% P1 w4 F- O6 j
    # A% P/ [' E8 C4 e' ]

    : r; h. t! d( t7 z+ h7 G( [
                         
    / s3 s; w% U' Y  G1 w$ k- }( q, _7 x9 C# E
    ' u5 {* p3 A: F  E5 m) O

    9 w! M, A; q* h( ^關(guān)于我們:
    ! s6 Q: w, V% c* w: b+ D) `/ C深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。- \# |+ |) R# b9 k5 I& ^

    * l. A+ X% p+ c% L8 d' {http://www.latitudeda.com/& Y0 z/ u, J- v  h6 E1 ]
    (點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表