電子產業(yè)一站式賦能平臺

PCB聯盟網

搜索
查看: 46|回復: 0
收起左側

光學片上網絡的激光調制方案

[復制鏈接]

441

主題

441

帖子

3200

積分

四級會員

Rank: 4

積分
3200
跳轉到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言  o+ u. d; G, q8 D* [, t* f0 c
隨著硅晶體管縮放接近極限,研究人員正在探索新技術以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學網絡(也稱為光學片上網絡或光學NoC)來替代傳統(tǒng)的電氣互連。與電氣網絡相比,光學NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學NoC的功耗帶來了新的挑戰(zhàn)[1]。
; k* x+ u) v. W8 c2 k
* ?# U: \4 v8 x' r( E本文將探討用于最小化光學NoC靜態(tài)功耗的激光調制方案。我們將介紹基于網絡活動動態(tài)調制激光功率的關鍵概念、架構和預測技術。: [$ N" F# k5 g  ~; D& Z

  O# n" N: W8 ]5 s: D! p# U6 e% T
! K- h( }$ e4 Y0 R. S* P" V
背景
+ _' x" o" t; ?/ `1 w光學NoC使用光來傳輸芯片上組件之間的數據;緲嫿K包括:
  T1 ]5 c* p' c" Y
  • 激光器:光源,可以是片外或片上
  • 調制器:將電信號轉換為光信號
  • 波導:在芯片上引導光
  • 光電探測器:將光信號轉換回電信號
    * ^' M; l( R" K
    # L7 P# U( N$ ?8 m" _
    光傳輸本身非常高效,但產生光的激光器消耗大量功率。一個關鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數據時也是如此。這種靜態(tài)功耗可能占光學NoC總功耗的80-90%。( y6 J, `  N9 F6 }

    4 n1 n3 y3 i1 `. `$ W, h( C為解決這個問題,研究人員開發(fā)了激光調制方案,旨在根據預測的網絡活動動態(tài)調整激光功率。一般方法包括:
    / O' [. @  J- h  D; y
  • 監(jiān)控網絡活動指標
  • 預測未來活動
  • 相應調整激光功率
  • 重新配置網絡8 t2 U* r. l2 k+ C. w, a/ |

    ; Y" e& m7 N5 X0 Q/ v# z) s讓我們看看為不同類型處理器提出的一些具體方案。# `8 f; Z% l; P1 j! Y, }+ E* x

    / C2 X$ u0 P" w4 l多核CPU設計中的激光調制方案& h" ]; N6 ?6 ~3 ?
    Probe: M& k' V8 U1 C4 P% Y9 a+ Q
    最早提出的激光調制方案之一是Probe。使用64核架構,核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。' u+ f" x: d4 X; F

    ; e- F0 M! t+ W# ]Probe根據鏈路利用率和緩沖區(qū)利用率指標預測未來活動。使用兩種類型的預測器:
  • 用于低流量變化:過去和當前利用率的加權平均
  • 用于高變化:由利用率水平索引的模式歷史表, l! Q, l2 \9 V8 _, ?( g7 k% `
    [/ol]8 K. `" G/ i+ @- Z# w- r
    錦標賽預測器根據最近的準確性在兩者之間選擇。
    ! F4 d- B* `: F; D7 W- b6 x. F3 M& x3 ^, W5 I
    ColdBus
      G! P3 r2 g5 [; DColdBus采用不同的方法,基于L1緩存未命中預測活動。關鍵洞察是在共享內存系統(tǒng)中,大部分網絡流量來自L1未命中。
    : t3 S3 u2 O' y2 y. S3 t9 |2 y. w0 U) o% G: @  T0 X% H7 f$ Z
    使用類似于分支預測器的基于PC的預測器來識別可能導致未命中的指令。然后,一個時期預測器估計這些未命中何時發(fā)生。- ~+ p! l% r3 G. ]& b( ]
    $ B5 k/ A/ P3 ]9 p  i2 Z5 R
    ColdBus還引入了一個"額外波導",為需要的站點提供應急功率。, z0 J: n7 W" G& N! \# B

    1 n( u7 C. `3 b# y7 mPShaRe5 N! H0 ~: |1 Y/ I
    PShaRe在之前工作的基礎上有幾個關鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網絡
  • 基于神經網絡的非線性預測器
  • 站點之間的功率共享
  • 重用浪費的光功率進行熱調諧
    : h$ z) [) V! B3 }[/ol]
    . D5 Q! G" O4 F+ Z圖1顯示了整體架構:
    8 {( _$ U( }0 }3 b/ B. |- N! ^+ |2 g: u; o
    0 O% L- [" |4 u" d5 g
    圖1:PShaRe架構,顯示連接光學站點的功率和數據波導。5 |) ^* o7 s' g& k, o
    0 E& N/ q, s9 B7 o$ ^1 s
    神經網絡預測器使用14個性能計數器輸入,對每個站點在下一個時期的活動進行二元預測。
    / N; r1 x, v4 d7 \: j9 k
    , K9 D, o4 B' D( \; R) V% f, y3 kBigBus
    ! G- K% k8 g1 X) p$ q. U對于非常大的核心數(500+),需要像BigBus這樣的設計。BigBus使用分層架構,將塊簇組成更大的單元。
    ' A$ H; d& M6 }  f. s! A8 c+ x* b) G9 P2 o( g8 I( e* R
    圖2說明了BigBus設計:; X2 u9 j% q3 U, g( h; o+ X" C

    : j- R. Y$ ~& i' I
    6 V+ v8 i# z9 v9 C: e, }圖2:BigBus架構,顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    5 f  C; \# A- ?$ b/ J4 I* S- O5 m" r1 U2 x% _
    BigBus使用兩階段預測過程:
  • 每個站點根據等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當前預測與歷史數據結合
    4 W. R/ q" {$ q6 m5 Q[/ol]
    , f' d% D* _( Y: U& `  P6 A, c9 [- T這允許在當前條件的響應性和穩(wěn)定性之間取得平衡。
    9 Q. F2 s- M4 @3 u: P) {$ I5 b1 Z/ i9 q3 S9 h0 k5 w& ~
    ! I: \1 W: _7 l) L
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調制方案; h5 K# O' F* x
    對于像服務器這樣的多芯片系統(tǒng),像Nuplet這樣的設計將光網絡擴展到插槽之間。Nuplet同時使用片內和片間光網絡。* u. i9 Q/ C& Z
      h( L/ i1 m/ z9 J/ [: ]$ x5 U
    片間預測機制旨在確定要流通的仲裁令牌數量。它考慮:
  • 發(fā)送到片間光學站(ICOS)的消息
  • ICOS隊列中的待處理事件
    . e) Y  I9 t1 a$ K% Y) X5 p[/ol]9 H  O  A+ S3 y1 b6 ^5 J
    功率請求表(PRT)存儲歷史令牌計數。預測將PRT值與當前流量趨勢和隊列狀態(tài)結合。
    * u) k7 f- {" t/ T
    ) ?- c% `' {, a* |GPU設計中的激光調制方案& n/ @, Z# h7 J  L' o4 Y4 }
    由于GPU側重于內存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設計將光學NoC適配于GPU架構。
    & Z- l2 e/ D' N
    & ?. z6 Z( G# c1 U4 z圖3顯示了GPUOpt的整體架構:6 y5 D- |' B6 e: ]+ f; v+ R8 f0 f" v

    * ~5 j! C% a. N7 S6 | $ v% ]& l5 G' H: P
    圖3:GPU光學NoC的架構,顯示由光網絡連接的SM和LLC集群。
    * i& B4 S4 |- T8 |; d
    % ^8 A  m: m: i3 z9 u8 g4 uGPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預測機制:7 k7 w4 O- P) t% e2 C3 S
    1. SM站點使用基于以下因素的受限預測器(Restr_Pred):* K" m9 N- f3 F) d; Q5 @
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間
    ' E8 {9 m& Y2 t7 n

    5 \7 V! ~0 Q; {( B+ Z2. LLC站點使用考慮以下因素的靈活預測器(Flex_Pred):
    6 f6 p, U2 E* d! V5 D! W% V' ~
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件+ U" ^. n" l5 L2 h
    - y" }) \8 S8 }, W& s4 |
    激光控制器將這些預測結合起來,確定整體功率需求。
    ' n" \/ m9 G3 c4 G) q/ w. T' T1 m( C' x1 t6 _: m3 X

    ) a* _& E5 @  @+ ~/ m關鍵概念和趨勢
    " M& y; Q, `& T  s雖然具體方案各不相同,但一些共同主題和最佳實踐浮現出來:# O6 Y$ m4 [, @- M: A/ {6 p
    8 V$ g" y4 Y: r
    1.將時間劃分為固定時期進行預測和重新配置
    , @5 p% e% D- [) M' U2. 使用多個輸入指標:
    ) M* I; I( x% _. a* U
  • 網絡利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件: M9 j8 h! X: w& X2 I% |+ i8 N
    3. 將當前指標與歷史數據結合3 u( x! `0 |2 I  u; G
    4. 使用非線性預測函數(如神經網絡)捕捉復雜關系
      s; I6 k9 B8 {8 K* ^. m5. 對不同流量類型進行單獨預測(如一致性與非一致性)
    : w/ _' z: n" T3 e( C" ?6. 分層設計以實現可擴展性
    , L. F! f' G+ `( n; w1 l5 w7. 盡可能重用未使用的光功率
    ' I& y6 v- P) ]* ?2 P5 a+ c0 [8. 為特定架構經驗性地調整預測參數
    6 X& s+ K$ i& m. A- S8 b; d8 z& P7 x+ [  h9 I
    圖4說明了有效激光調制可能帶來的功率節(jié)。. e+ y; D" S+ m+ O; {$ b/ A
    9 O) e' g1 {6 H5 }
    8 @1 ?, x( W- u$ B7 i8 ^
    圖4:ideal、Probe和ColdBus方案在各種基準測試中的相對激光功耗。
    9 t9 H% B: [* m# b# v  K! G$ J8 E5 l  T" l' P

    : j& A6 V! h& u4 a未來方向( s4 S. z% L7 F9 S
    隨著光學NoC從研究轉向實際實施,可以期待這些技術的進一步完善。方向包括:
    & J  y5 l% k3 M: h% Q( Y: w' u. U
  • 用于更準確預測的機器學習技術
  • 與應用層知識的集成
  • 在運行時調整參數的自適應方案
  • 考慮電氣和光網絡的整體優(yōu)化
  • 針對新興工作負載(如AI加速)的專門化
    ) s* n$ y5 ~- z) u; @$ I9 g( i+ P

    , j, {. U' ^! W2 p" l- D0 [1 z

    $ `% m3 o3 s8 n+ l  K9 }/ Z2 g結論
    0 ]) x; p/ e0 O. }9 I/ j/ @有效的激光調制對實現光學片上網絡的潛在優(yōu)勢非常重要。通過準確預測網絡活動并相應調整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構繼續(xù)發(fā)展,激光調制方案需要適應新的設計約束和流量模式。該領域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    9 [8 }+ q. D8 L- n8 O# ?8 G* d
    ' ~# h0 T5 ?1 i5 P- S

    ! p. `% y: B# U9 ?$ K" z8 p參考文獻
    0 _8 S& z" T! M3 n8 L' \[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    7 A$ k% d: L% g4 o( t8 K% r
    % R% e: V0 y5 G, {8 h  \- END -5 L9 D+ ]# D+ i
      Y0 ^/ I" T- m! @1 p) ~
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
    " ^0 M! I$ d1 |) y點擊左下角"閱讀原文"馬上申請# N1 Q4 k6 k2 d; {" l% B
    3 \( b+ a, n' u1 I3 ~$ ~
    歡迎轉載# ~, J4 K( X: `  q: B$ V8 h

    " W/ p4 j* y0 r, O! b轉載請注明出處,請勿修改內容和刪除作者信息!3 I- n& Y; T3 _* _$ L/ \
    ; k- q+ |1 N+ f( P# v/ N. c
    " |' Y' F* G9 ]  F

    # U5 C1 `7 P$ c2 y  o 2 \' d% o2 y" K8 y' v0 S; _# J
    ) a: @; Z; M" S, b# X
    關注我們
    " R3 k! t$ r  k* i) D! N8 i7 G. }. I6 x# J' l3 X* z; i
    + t4 c* N! k+ B0 L3 M
    + P- A6 L2 l; J7 H

    # v$ A5 X$ r* Q3 F+ v* o  J- W ' Z! w; m) `$ o5 Y4 O" V, C# C

    6 L/ G' T+ c8 j; r$ N0 K
    . E% w8 W% Q$ o4 U+ n5 C
                          9 V! n5 V8 X4 g: `9 q; ^
    - S5 O  B" B* D- _: N$ O: @$ G$ H

    $ y* R& }8 r& v+ a+ H
    ' Q: ~: w9 d+ D關于我們:) [* B' J3 L4 c+ \# q
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。5 p6 g4 v, C" r+ K
    ; @* T+ H0 p( P  b, N4 {" s+ x8 @
    http://www.latitudeda.com/+ J0 u! u3 l" E1 x& K* t
    (點擊上方名片關注我們,發(fā)現更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯系客服 關注微信 下載APP 返回頂部 返回列表