電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 45|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級(jí)會(huì)員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言+ `8 L3 x. D0 @) H) F
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來(lái)替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來(lái)了新的挑戰(zhàn)[1]。4 z3 a4 t' z7 G3 x5 S" D

5 p& ~; T. K$ c# m3 |9 E6 s- R本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
: W+ C2 s+ j0 [
/ g9 T! b: y  s2 y  W/ z) X6 B

0 m5 ^: ]. \6 F2 f6 P背景0 G' X3 ]3 m7 ?& V0 j5 D2 z
光學(xué)NoC使用光來(lái)傳輸芯片上組件之間的數(shù)據(jù)。基本構(gòu)建模塊包括:
% I: p+ E5 {: z  y% I6 G$ Y
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
    + y  E# r. N2 ?

    ; H5 K- }) @4 \& f9 z光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。3 A* T+ H7 r4 D! f

    ) ?2 h! Z4 Q2 h. e9 @" J* h為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:
    % i1 M% I. A! O+ G
  • 監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)
  • 預(yù)測(cè)未來(lái)活動(dòng)
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)
    . }! H$ c1 L6 c$ [0 j# r
    , C; ]7 t7 ~' D6 q
    讓我們看看為不同類型處理器提出的一些具體方案。9 v4 w+ {  R- }" v; x6 \
    : q+ U' _9 O4 Z
    多核CPU設(shè)計(jì)中的激光調(diào)制方案4 w1 b# l9 f+ j3 K& h' q% j
    Probe
    8 w3 l  S/ R, i' Q# V7 D% Y* |$ S最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。
    9 Y- m8 L: d* ?6 k; z  _" k
    3 o( B3 C. P4 ?: K% o3 O% [Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)。使用兩種類型的預(yù)測(cè)器:
  • 用于低流量變化:過(guò)去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    7 A) T2 C# H8 D' d0 e& S, O[/ol]
      M; l: e- y: B- c; R# T錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
      C4 B5 o6 u% b" j" A$ V4 ^' O+ C5 ?9 i. E0 r  G" Y
    ColdBus9 N3 k3 S) C- x/ W# b% Z) |! s
    ColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來(lái)自L1未命中。
    : e; m' y0 x/ d* b3 `% J2 D
    ) U) S: j3 U" @使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來(lái)識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。
    2 B1 S0 X5 o9 {5 L( t: \9 ?4 N( O0 G) O8 O% N
    ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。, `7 k) K7 f1 @3 N* ]5 {8 L* x
    6 a% [) h. ^, u0 g
    PShaRe
    7 `8 l- ?' W9 `! e* A1 ^3 ZPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
    1 j: K9 ~% i9 `" [0 C- i3 t$ b6 q( ?[/ol]6 l  u" r; b+ B. f) U
    圖1顯示了整體架構(gòu):
    % G; ]. n( m! W6 }- J5 P- T
    ) D0 t8 H0 _/ f9 Y1 k
    3 T/ r! D/ v4 l& s. k6 @圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。& _! h; s$ W: S! [7 b7 `/ X

    7 Y* V' M) [& n* k" {  x1 |$ C神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。
      d# \; N2 ^' K) t( y; ^. Q
    + E7 u2 ^: t1 k" [! Y% ~$ N9 P) DBigBus  \3 z' x. k$ c. ]' B
    對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    " S) Z9 R( j9 K  ~2 C' L* W9 Z" P2 B- h$ Q2 R' l
    圖2說(shuō)明了BigBus設(shè)計(jì):
    , z. V. }6 {2 I% ^: ]- y# u2 D1 w" r" Q; p& w- ]
    ! j, w8 j* M" A' l2 t+ t
    圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫(kù)的分層組織。: j" Y3 h+ \6 c1 b* H
    ; F9 L4 Q  u! q3 j; I
    BigBus使用兩階段預(yù)測(cè)過(guò)程:
  • 每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合" G: ?4 {/ m) ]# K. F: J
    [/ol]
    4 {5 \9 ]& a& w& e! I0 _2 \這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。0 B5 Z: D8 [( x; ]# \
    . W5 g/ `5 D+ w

    % [6 m& Q; x4 z; x多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案' D/ l' a1 ]! J: [1 Z* _1 q) S
    對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
    / ]' o( p) |7 J) {
    - L- s2 J& P4 y/ N7 I- ?( \8 H( Q: K片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件% J7 g& ?% \) O0 p8 _
    [/ol]
    6 y) E% a* s. |0 z功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。7 `/ _3 x( ~, U% m: W
    ( H) r4 b5 T) i, i  \
    GPU設(shè)計(jì)中的激光調(diào)制方案
    % b$ r2 w1 @( m: q由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來(lái)了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。1 P' D3 i1 n9 K, G0 B
    - t: J+ f, m+ b
    圖3顯示了GPUOpt的整體架構(gòu):
    4 g' q9 k% d1 Q0 ^* L! b. ^
    5 _' _' ~% c8 a2 m" ?/ x6 T! r3 j
    0 r- k! A) j. W圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
    0 K+ ]7 y: w$ T! k) Y7 O
    ; e5 a/ R( O0 G! tGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:2 ~0 @; e, g& q
    1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):) }0 K6 f; ]# D1 o1 ]
  • 接收的消息
  • 發(fā)送的消息
  • 等待時(shí)間9 s5 x. p. l3 F
    * _6 u3 X6 X0 `& v. V' [+ G
    2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):: X4 U1 c" x4 d- p5 i
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    ( Q3 q/ p+ d) }6 \$ f' v6 W8 n+ b

    ! c9 @& I- g) A! `激光控制器將這些預(yù)測(cè)結(jié)合起來(lái),確定整體功率需求。, P) w& O& D/ F. q9 H

    7 ?4 G0 c5 a! b& X

    ! A) r- I( r& ^8 P* g" G; r( z. u6 ^關(guān)鍵概念和趨勢(shì)
      v# M: X! C: o2 W2 G% _/ v3 }雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來(lái):0 |3 ~7 E- |+ j  ?9 q
    / `& J6 B6 H  e+ ^! b; X
    1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置
    ; i: t7 B) X; M" N1 u  S2. 使用多個(gè)輸入指標(biāo):
    8 }! ]$ X4 E  N5 b8 [  `
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件) ^; v) c- ^' q6 N2 s% H
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合# A  v* y5 j% H) r
    4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系4 e; p3 H$ ~* {; B9 R# D/ ^. @
    5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)7 G6 z# i" @; U! ?
    6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性
    + K1 K# _/ x6 n8 i, {7. 盡可能重用未使用的光功率
    % [; J: {" V: q! z; p3 r8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
    ) |9 R# o$ V; o  T
    / P8 @" `/ [+ |( Z4 g0 v圖4說(shuō)明了有效激光調(diào)制可能帶來(lái)的功率節(jié)省:6 [# y* |- J( o

    3 [6 l& s% K9 R% ` $ Q) X! A: |7 l& w6 P
    圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。
    . M$ A  S* c. @! m: Q/ }& s
    3 J3 ]; M$ m  z' M  M/ Z
    1 A8 t6 A, E  }/ L: |
    未來(lái)方向2 X$ ~3 q, k3 q+ k- i8 B! m
    隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:* g# p2 F& D  N2 j. _  D; n: o
  • 用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識(shí)的集成
  • 在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對(duì)新興工作負(fù)載(如AI加速)的專門化2 m) N0 u; S! T9 f7 l# Y
    $ y8 B- L" p0 s  m! L
    1 \" U% B/ a  ?& u8 s' p  r
    結(jié)論
    - G6 D9 S. x' X! m4 W有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過(guò)準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來(lái)計(jì)算系統(tǒng)解鎖新的能效水平。
    ; n( p3 _; m. s8 d
    ; ]9 l/ U2 C1 F. B$ ?) p% [
    5 W& F7 d+ h( k; J
    參考文獻(xiàn)
    $ Z, C2 y& [5 `1 _; R# s[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.  @5 u5 X9 B+ m, v
    7 [0 Z" l7 M5 U6 @  K8 B) a+ {& V
    - END -! F4 T0 Y, }/ k$ h( _; U- E

      P! c: D2 g2 B7 V! t7 p0 o$ @軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    * w4 f* }+ V4 H0 X$ }, ]7 r8 T點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)! @6 y& C* {5 V
    * S, j& E0 c* l2 I! [& o7 i1 \
    歡迎轉(zhuǎn)載
    1 u( q$ t! q4 ^; |* c. F0 h" [* |% k  L5 m- i9 S
    轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!" N- U' G4 f! S, |$ {, G& D& ?! h
    ( j5 d: M" B3 m. |# l0 J" M
    " R) M/ V! p7 ]# P

    ! E5 D( `! t' ^" A; L% @
    & H; }! P0 s* w6 X. v+ i3 t. i8 L4 A! W4 [
    關(guān)注我們
    3 v9 u# x+ H- |$ U; \6 U& g5 z( l2 C1 d& [1 x

    ' e" {; H7 K$ Y4 X
    . t4 S) g& J5 t# |

    0 g. T! P, s  e8 Y! u" H) X - X) ]1 J4 t4 Q

    5 q# x$ f7 }6 U+ W+ O- E 0 `( s; \5 A( x/ p* |1 O% t- y
                         
    0 E" y( P; u) P! z2 i* f' k
    7 s% Q5 [2 z3 K9 k+ k
    * L: g6 A9 X( {1 x# b$ Z" X- o

    6 a  c& w% I7 g. ~" P( N  ^$ `關(guān)于我們:5 N/ `0 j% ]+ V4 B; u
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。- S' \5 b% _8 K9 E+ r

    . W7 Z9 _  b7 r; Y/ G3 Ihttp://www.latitudeda.com// f+ e7 H% c6 u( K5 z9 L
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長(zhǎng)推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表