電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 82|回復: 0
收起左側

光學片上網(wǎng)絡的激光調制方案

[復制鏈接]

441

主題

441

帖子

3200

積分

四級會員

Rank: 4

積分
3200
跳轉到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |正序瀏覽 |閱讀模式
引言; z! d, \" |" |- @- V! e7 `( ]
隨著硅晶體管縮放接近極限,研究人員正在探索新技術以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學網(wǎng)絡(也稱為光學片上網(wǎng)絡或光學NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡相比,光學NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學NoC的功耗帶來了新的挑戰(zhàn)[1]。. m4 T% w8 C- l3 Q' ~7 H& y
+ O7 i7 l8 M5 K& _
本文將探討用于最小化光學NoC靜態(tài)功耗的激光調制方案。我們將介紹基于網(wǎng)絡活動動態(tài)調制激光功率的關鍵概念、架構和預測技術。
8 g  d! q8 e; D) ]
& N" f, C- h7 A4 e9 a7 b3 p& z

$ F0 m" [3 c/ Z, e. _5 @背景
( w7 e/ y" x8 \' g; E光學NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲嫿K包括:
! w# K4 u& ~( S7 j- I' \
  • 激光器:光源,可以是片外或片上
  • 調制器:將電信號轉換為光信號
  • 波導:在芯片上引導光
  • 光電探測器:將光信號轉換回電信號
    ! m5 k, l+ C! P( @/ t
    ' @3 ]- ]; x  a: o4 s/ I# b
    光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學NoC總功耗的80-90%。
    ; i' i7 r& s& n1 j6 K. y( G
    $ R) }8 B0 l3 M為解決這個問題,研究人員開發(fā)了激光調制方案,旨在根據(jù)預測的網(wǎng)絡活動動態(tài)調整激光功率。一般方法包括:6 q7 y; X" d6 }/ Z/ R' m
  • 監(jiān)控網(wǎng)絡活動指標
  • 預測未來活動
  • 相應調整激光功率
  • 重新配置網(wǎng)絡. r4 J" ?7 h4 c% W: B7 t+ O; r

    8 e+ ^5 j: y* K# {" t$ O讓我們看看為不同類型處理器提出的一些具體方案。
    & c/ O4 A" T* W' i. x" `5 c; V2 g: ^8 m1 o& V
    多核CPU設計中的激光調制方案  ]8 C# C5 v4 e# N6 M- L/ a
    Probe
    6 A$ N" x9 \" \5 s- h' h2 p5 Q$ S2 t最早提出的激光調制方案之一是Probe。使用64核架構,核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
    4 v) T& t9 a2 A( M
    6 N& W3 ]- R. j- ]7 mProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標預測未來活動。使用兩種類型的預測器:
  • 用于低流量變化:過去和當前利用率的加權平均
  • 用于高變化:由利用率水平索引的模式歷史表
    6 x( R0 ]/ `5 H7 n' Q[/ol]
    6 z2 h6 c0 y, w( A% }) @% I$ |2 C錦標賽預測器根據(jù)最近的準確性在兩者之間選擇。+ a: g  Q! v9 ]. p' _

    4 {2 W; E2 m) I( U% @ColdBus
    / N: B& f- p* T) mColdBus采用不同的方法,基于L1緩存未命中預測活動。關鍵洞察是在共享內存系統(tǒng)中,大部分網(wǎng)絡流量來自L1未命中。
    " w- x3 V/ _5 c, A+ a( [- ?
      U4 o+ f  b. Y; l  `使用類似于分支預測器的基于PC的預測器來識別可能導致未命中的指令。然后,一個時期預測器估計這些未命中何時發(fā)生。4 R) k$ k) Z, b" A9 s: r! s

    # w- P) i7 ^) ^4 Z/ e! PColdBus還引入了一個"額外波導",為需要的站點提供應急功率。
    $ j" O; I- {- e+ l
    ) g" ]$ T/ n/ ?' e0 G, ~PShaRe% I/ d* a% S8 S6 K( X6 B% [+ q% p
    PShaRe在之前工作的基礎上有幾個關鍵創(chuàng)新:
  • 一致性和非一致性流量的獨立網(wǎng)絡
  • 基于神經(jīng)網(wǎng)絡的非線性預測器
  • 站點之間的功率共享
  • 重用浪費的光功率進行熱調諧
    2 j$ O5 i, Y' P+ ^[/ol]
      p- b# }* ?/ M4 i" Q; a圖1顯示了整體架構:0 E  J, @1 X* l

    9 z. B; y- o" y: w" Q   n2 C9 q* E( y1 ?! w2 P1 o
    圖1:PShaRe架構,顯示連接光學站點的功率和數(shù)據(jù)波導。
    # d  ?7 [5 r9 L' ]) E+ i' Y1 p; B8 E" ~% C
    神經(jīng)網(wǎng)絡預測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進行二元預測。
    9 s0 y6 h: m: @4 ~2 U5 D" P- Y" ~$ g8 k  A/ b( W$ s; P, Z8 M
    BigBus
    % w( b& X! D  X" Z對于非常大的核心數(shù)(500+),需要像BigBus這樣的設計。BigBus使用分層架構,將塊簇組成更大的單元。! A6 y! z0 w) f; k1 D: A" V

    ) ~- U$ R7 M1 l圖2說明了BigBus設計:
    : }( c. M! b- v
    8 ^' s" f6 i, n# H
    # C9 Y# g1 c1 \7 b' o. q# W圖2:BigBus架構,顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    : u: J( @& U2 T0 E; g8 k2 t" |) Y- e" v7 ?0 I
    BigBus使用兩階段預測過程:
  • 每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當前預測與歷史數(shù)據(jù)結合+ o& Q* i$ `  E" P
    [/ol]9 ^. B! E- \' ]5 H% K) f+ \
    這允許在當前條件的響應性和穩(wěn)定性之間取得平衡。
    3 j2 \8 ]% W9 F, |( `, u# b" _! V6 ^2 I  U1 C' \! J3 a
    9 v! \  g/ j9 R. M
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調制方案' V2 U$ F, L6 |
    對于像服務器這樣的多芯片系統(tǒng),像Nuplet這樣的設計將光網(wǎng)絡擴展到插槽之間。Nuplet同時使用片內和片間光網(wǎng)絡。/ h- |6 B* G: }' p

    + v* o7 d* ~  o1 V/ H片間預測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學站(ICOS)的消息
  • ICOS隊列中的待處理事件
    / m3 [! ~" d. [) G( A& p0 d[/ol]) y5 D+ F: G6 V# q. o. Y
    功率請求表(PRT)存儲歷史令牌計數(shù)。預測將PRT值與當前流量趨勢和隊列狀態(tài)結合。: u  ]1 o3 Y. C6 K, E9 F9 g) o! ]

    3 ^( k  r! r; C$ ^' e1 Z1 t; fGPU設計中的激光調制方案
    % D: `; P* }: z9 _% [6 {2 B3 s由于GPU側重于內存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設計將光學NoC適配于GPU架構。
    ' z5 v( ?# b8 Y- e# ~
    ( |8 \2 Z, F+ c7 _圖3顯示了GPUOpt的整體架構:
    4 s/ B* P& F& |( e+ n: V" b1 E0 {) s
    9 s- {' Y' k0 z- N 2 o* {" ]5 b+ P0 b8 z, S* j
    圖3:GPU光學NoC的架構,顯示由光網(wǎng)絡連接的SM和LLC集群。. A5 K+ D2 G! m" F: O! {
    , h8 }0 s) p4 B9 y' \  y
    GPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預測機制:
    ! Y$ g) @6 R- _5 M. R1. SM站點使用基于以下因素的受限預測器(Restr_Pred):
    % l( W( p) v) m& L9 g% r$ y
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間
    7 n) h: c8 t& M/ Z, f5 Q! ?
    & C- ?! W8 T6 G% Y& l. l2 [0 d
    2. LLC站點使用考慮以下因素的靈活預測器(Flex_Pred):  J' E" \. ]2 O6 h4 W1 u+ _
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件8 n2 `! j: @$ p' W9 A  s

    2 a9 [2 C/ J9 o4 l) w0 f激光控制器將這些預測結合起來,確定整體功率需求。4 Z3 S5 K. i  o9 A+ u0 h

    - p/ k! ~6 _8 B: w

    " t! b; Z) T, \  T9 ^3 f關鍵概念和趨勢3 ~- [! `5 ^( C& d
    雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
    . \, @! s0 K9 {9 r% r1 J) Z1 j. x4 w6 l! D
    1.將時間劃分為固定時期進行預測和重新配置. S. C+ H! |3 Z" |+ h3 B1 u
    2. 使用多個輸入指標:: y1 ?/ U- N( j& Z4 h# c: W
  • 網(wǎng)絡利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件
    0 N& d3 f# ~/ v/ a
    3. 將當前指標與歷史數(shù)據(jù)結合
    ' I* Y7 K7 O% ?; m4. 使用非線性預測函數(shù)(如神經(jīng)網(wǎng)絡)捕捉復雜關系
    8 G# X# A5 \' V+ u5. 對不同流量類型進行單獨預測(如一致性與非一致性)
    0 d& ?. y  I% d( d# U' m* ^6. 分層設計以實現(xiàn)可擴展性* v- V. w2 f/ a/ v% @1 Q+ i
    7. 盡可能重用未使用的光功率  \9 S# A/ B/ m
    8. 為特定架構經(jīng)驗性地調整預測參數(shù)  `: l3 m+ l0 L8 H5 }6 N; H
    7 O, n3 @7 a6 L0 d
    圖4說明了有效激光調制可能帶來的功率節(jié)。5 x% Y/ c' l% m# b6 q
    : H8 l) W9 p) o0 p" Z% t3 D
    , X2 ?! n# E3 H* W) h  t
    圖4:ideal、Probe和ColdBus方案在各種基準測試中的相對激光功耗。/ _" y% @, Z- t9 A; I
    $ P9 v& ~) h0 r+ z; B2 B; D

    ) b6 n# a* F% f. r5 m1 U未來方向
    / [, ?+ M8 P$ g9 K隨著光學NoC從研究轉向實際實施,可以期待這些技術的進一步完善。方向包括:; C4 p& o( L" b8 \
  • 用于更準確預測的機器學習技術
  • 與應用層知識的集成
  • 在運行時調整參數(shù)的自適應方案
  • 考慮電氣和光網(wǎng)絡的整體優(yōu)化
  • 針對新興工作負載(如AI加速)的專門化* y5 w5 k# q% i: B# Z: E" G
    / x' ?" V. q. s3 B6 V

    8 p& S* R- Q; p8 D  U# h結論0 |' D- z1 L4 p
    有效的激光調制對實現(xiàn)光學片上網(wǎng)絡的潛在優(yōu)勢非常重要。通過準確預測網(wǎng)絡活動并相應調整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構繼續(xù)發(fā)展,激光調制方案需要適應新的設計約束和流量模式。該領域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    . M+ d$ L5 I4 d, Z+ L$ I, n* ^( @1 @

    6 v- F) O$ s; A& }) O* ^參考文獻
    ; i  i+ [) s: i& C/ O; r3 i[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.* T# P* a' j% S# c3 Z: N0 \- x  j7 C

    2 m, {( w* h: B1 E; w( R& y% J- END -5 Q# K& f) p3 I& b$ i$ A* P
    7 y8 ^' V3 i, k5 [' c: B/ q0 [) t1 i/ c
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。3 i' x4 B' ?- r. g" f, D- D. e3 W% v
    點擊左下角"閱讀原文"馬上申請. c8 x$ D! C, C5 X& t

    3 h2 Q% u+ I5 ?' C" ]1 g歡迎轉載
    , i/ C% p  g  n/ g* H' }) e/ d6 o7 J; O1 M* n
    轉載請注明出處,請勿修改內容和刪除作者信息!+ Y2 D* Z( U  h2 v
    % P2 W9 C  Q4 F
    + t6 q9 }2 ^6 A; a+ X

    9 K  F- A8 u- e4 _3 {& e
    # ~7 m$ \5 h0 D6 S1 t0 C& q  {' R! z. @( `8 X, U
    關注我們
    ' J# N  _- `% ~+ x! N0 ?4 t6 u
    , t9 t& B7 R4 Q2 Y8 w7 C
    ' G, @2 ?, a% y
    - w7 i2 t! a$ s# S  S
    3 q2 l, ^# e9 c* p! w4 Y9 |

    1 ?$ |) y: d7 R* E# w! x
    ( c' @! ]: S' x: O# _

    * \, p- i6 f4 ]% X; \) I5 A/ n
                         
    ( _7 R5 }  h: P0 A! `. T7 a
    9 \8 m7 v( X4 v$ ~& `

    ; `  }: U' e. u" n6 h
      d  ^- F  X. c' \; E關于我們:
    ; P- l! b2 ^$ R. J! B/ P5 ?7 T深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
    - Q5 d( G5 z/ b6 f2 H' F2 P2 e% Q2 p4 P3 ?/ Z8 k
    http://www.latitudeda.com/
    0 b( p7 D4 y- e; b6 P* o(點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表