電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 40|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級(jí)會(huì)員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言
% b: v2 Z( p2 [$ A2 a/ \4 P隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。
9 `/ w: I4 s3 I& r" \# e! u: O6 F9 s+ Z# j+ `$ X! S! q
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
6 P% b; G, c( C$ s' m1 i$ s8 Y4 [3 i- h7 n+ o6 i' s& D* g$ ]" e

3 P( l" E7 {8 \+ c: W  `背景
$ L8 T6 h+ P# \( H光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
' F! p( P/ d& e) c
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)$ d; a( A9 C) e/ ~5 @
    ; t' V+ L$ T. j: f% p
    光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
    3 i1 P/ i' G, X0 ?. m/ H+ x6 W2 g/ M3 T3 Q! B
    為解決這個(gè)問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:
    % o  L1 @. z$ g7 J
  • 監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)
  • 預(yù)測(cè)未來活動(dòng)
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)) _% h( G/ {' T4 u+ F. q

    % S+ P& O' s' e( E& M5 q讓我們看看為不同類型處理器提出的一些具體方案。
    8 s. A/ E- ^2 P. k' w
    ; {) I# F' `% ^多核CPU設(shè)計(jì)中的激光調(diào)制方案
    ! ?8 a- {  p$ ]1 z: P1 t! bProbe. I; i2 O9 O, V8 {: E0 L" X
    最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。+ W0 {1 I4 v" O. L; R7 W
    . U, Y# N& S. B) M) A2 I+ N
    Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來活動(dòng)。使用兩種類型的預(yù)測(cè)器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    5 u# Q" e# m( L1 {; W, s[/ol]
    ' d5 k7 Q* T2 K7 g- c錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。, f8 ]) I: W+ W

    & ?- Z: j2 W) P: lColdBus
    ' B! }8 ~: x: fColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。
    ! K. e  [* w( d. i; @2 G, R' a6 k6 _) a0 i: X: l- H$ U2 X0 }7 a
    使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。
    3 t( O; G  ^# f6 {: @
    5 Y' b2 \! [0 A! b) `& g; e5 EColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。; F3 @! Q. P( s" z
    ( @, F' ^, n: w2 [9 p+ J+ D3 R8 q
    PShaRe
    # l# R6 p% M! j, C7 `! R, |5 jPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧, z7 K7 S& E; Q$ v2 _/ ^! \* O
    [/ol]
    , k; b  J3 i) t* E' \$ N圖1顯示了整體架構(gòu):6 j$ X* B4 N" S# W' C

    5 m! Z" V0 v/ t/ J: ^( S0 m
    ' o8 n' X* X0 W圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。" M% K" g, E' N* J# K: m
    7 w. Y+ ]* D3 o. y/ f& |
    神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。3 I) t5 F. u! R* }% |  y

    ! l% Z- D5 \% b; Y5 t  [' y7 bBigBus) ?4 W9 |0 r& g
    對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    5 z* E2 \  O$ U3 k- k2 w, f, d! Z4 [- X/ f; N- T! x
    圖2說明了BigBus設(shè)計(jì):: \: L% Q$ g) Q' d6 p5 e8 A
      e2 d4 m* p5 q% U. m8 K

    8 w+ S  h3 R$ c# K" _- C# Q/ p: U圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
    ' R3 H- c/ ?4 S0 p5 F5 s( U7 `1 R3 ~8 F0 |2 Z. H& [; i
    BigBus使用兩階段預(yù)測(cè)過程:
  • 每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合9 |6 \( S: J: v3 U+ z, E* _5 m
    [/ol]
    ' \& [/ d6 [0 h. X這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
    $ Q/ ]7 j/ h+ c1 I, j' `# Y
    & Y7 R: s$ q9 p6 A; \! i
    0 Y% ?1 e' S0 T; l
    多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
    1 x( G" Q, G, \" F' ^; e對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。/ L) G+ e0 C8 O; m2 f. W0 C" J

    8 b8 I) X+ k; @) C; h3 R. @片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件, a7 W7 J. n# H; a* ~/ F  q0 D/ _9 M  |
    [/ol]% T- G# O* M* h& H3 z# u
    功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。0 U% O/ z! N! P; l6 G! {

    : W; L. R* u5 dGPU設(shè)計(jì)中的激光調(diào)制方案
    9 j7 X& U; v) W4 V0 V6 F由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
    3 `6 N0 }( m: U, R0 Z; X# B1 y; ?6 [0 \6 x
    圖3顯示了GPUOpt的整體架構(gòu):
      W+ {( Y; M( U: Z: n$ g9 A1 H, H4 j- a6 Y# M  e0 D

    5 u& b$ ~$ Z% M) g  r7 ?7 A3 w圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
    ) |( r0 M$ d6 t: c: N7 M" L  Q3 |8 p/ ]9 d* j
    GPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:
      I9 y: C, X& H8 u- W1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):
    + F: \) B  C) x, W( {: k8 [5 M2 N
  • 接收的消息
  • 發(fā)送的消息
  • 等待時(shí)間
    ! f4 U0 A$ A4 I4 p8 G: `8 Y$ e1 c
    9 }  s7 r. [/ v9 s/ D. _$ g
    2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):
      l, j6 L" T& c# z0 x$ e
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    $ `% {6 g9 l* c3 J2 x/ b; S( K
    : [6 ]8 s6 E* C' }0 z. u
    激光控制器將這些預(yù)測(cè)結(jié)合起來,確定整體功率需求。  d; P! a* Q* X8 i

    % p  I  [0 q0 @) u
    % F4 ^  I; x5 V
    關(guān)鍵概念和趨勢(shì)
    : J' [7 V- w2 ?6 g3 M9 ~6 C雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:
    & K, b( ?' l. ^+ j6 l4 N; R/ Y! M! a$ d$ V- H5 \4 T; A  t
    1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置' R$ \$ K6 n) L: h6 T: }/ @
    2. 使用多個(gè)輸入指標(biāo):
    - q  s8 A0 W: {; I$ @0 j
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件. d4 Z3 l" `! q
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合8 ^6 ]& A9 }4 c0 S1 T# j
    4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
    " t' h1 _7 Z, f) o1 O4 E5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)& K4 a' F: _; A2 Q( L
    6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性; \% }3 t  {) G, @
    7. 盡可能重用未使用的光功率
    ; G+ m* R4 e4 L% j6 P) x: T# W8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
    3 @& {* _+ W5 Q# c* X4 H$ ?" i) u" L' A" p( {
    圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。
    ) l9 l# Y* k( H& s& Q
    * o+ A/ c, M) b- D; r, ^; _/ K " t$ |! E4 D0 j
    圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。
    ; ]* {1 B0 r' ^) C  j# ^% L3 z$ X& R, m$ y8 w$ f8 q+ `* C& R0 U  H
    2 A( q' Y+ X' k) B8 `( i: _- u4 _
    未來方向
    , O) o9 a" z; N9 K6 L" F8 o' G隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
    , u) e' @9 U3 u. n2 _. ?7 n
  • 用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識(shí)的集成
  • 在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對(duì)新興工作負(fù)載(如AI加速)的專門化
    . z) \5 ]( u4 ^4 ]4 f+ b; `
    & z9 C; T2 j; C) o0 ?

    & a: w: g* l6 u結(jié)論
    8 i* X  ^( z* m  R$ K* d有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計(jì)算系統(tǒng)解鎖新的能效水平。
    6 R9 E6 e& V; G' u. Q7 Z
    & g. g9 X; C, y2 m9 a
    ' ?) p: w' L  A
    參考文獻(xiàn)
    9 ]- o! y" P* |1 K& n# i[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    8 G3 U/ o, R" o1 v4 }5 A/ z) F! [0 m) \! b1 T2 w& k
    - END -
    # B- R" T% ]+ p9 c
    - [( d3 y2 l1 E) O0 }+ _/ y( A" W軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    - Y- ~1 w( ]4 W  t( @點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
    % {9 @6 o7 M7 _3 `
    / _0 |5 {  t: y歡迎轉(zhuǎn)載# F4 \0 s8 w( V  F
    : j0 x9 D* D! y) f9 R( {6 Q4 e
    轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!8 X+ Y# b; b* z2 U3 e

    ! `' ]$ ^7 ^; F6 a  u
    " q! U+ L1 `/ I: ^' |0 @' Q, J
    " e1 G! E; U5 I$ a$ E! X

    * A3 x5 Y  z5 J: {6 B# G2 e# U# T! y
    關(guān)注我們& u# A& X( E! J2 `
    4 s4 n& i9 o: C9 B+ P- ^

    3 S2 H. k9 y/ G9 _& W
    , _, @9 A* k9 }. x( h3 f

    $ Z+ P% ]9 }+ L1 K) l, E
      W' S3 Y" l8 `& G; D
    6 X4 w& F, ]- c2 C. t* l+ d& R
    % O& A! p, Y. r8 l
                         
    ) w; Y: r- L9 ^5 f, N: N- l5 l, J
    # r, |6 H5 U" b" _" p" O" [" b
    ; `+ k# h% J: ^8 `$ d" |
    # F7 t# }1 K8 I- f2 S0 f0 _
    關(guān)于我們:8 X: P# T( ]) P7 n
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    . _: P, W# T9 @$ I5 H" U
    " G( |0 P0 N" vhttp://www.latitudeda.com/. C) J- |& f. \+ e: ^5 k  V/ P
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表