電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 22|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級會員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
引言
/ v8 }* @+ M3 n, l1 T; R3 f隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。8 j6 e! T8 i! R; u2 J5 e
3 C" a, s2 A2 h! \5 q
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。+ p' \6 }: l$ `

1 u1 K* P, B7 i8 O2 l2 O

3 @8 F9 w0 `- G" c% B背景( u( r+ A% u0 ^& x( ^. O: E
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù)。基本構(gòu)建模塊包括:
" ~3 p% F1 r. O  w/ @% b3 t5 b
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號轉(zhuǎn)換為光信號
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測器:將光信號轉(zhuǎn)換回電信號) W. |2 l( ~$ |8 p9 I5 z  S7 x
    - }- }) S! e: R6 [
    光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。0 m( r8 b( Q: Z- F4 i! p4 V
    ! H8 [$ b5 S1 B5 \4 b( U8 O
    為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:. v" [9 o+ ?3 G) [; v4 `$ t* P  @
  • 監(jiān)控網(wǎng)絡(luò)活動指標(biāo)
  • 預(yù)測未來活動
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)
    6 U% n) U+ Z. [# o# U3 x. D: x

    + o, m! T: |$ ^. w/ f# V- m讓我們看看為不同類型處理器提出的一些具體方案。# k& a/ [4 X- W+ {- o

    + e  R) M8 E2 M8 R! o7 t8 P多核CPU設(shè)計中的激光調(diào)制方案- c" @8 r  N" U! t9 i5 k
    Probe7 }" l& U8 e7 O1 @
    最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。' f# C6 W9 l  A- e

    , W8 ~; |# }9 OProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:
  • 用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表. I# P. M, p1 P* @$ i& Z
    [/ol]5 j7 y- u+ D2 @7 P/ v5 y
    錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。4 o, ?1 n7 y; p$ S$ e/ [9 g

    2 Z8 D# B' f+ f* g" b* xColdBus! c: S/ e( U& |, U( ]! O- T& ^
    ColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。; Y- H- _" M5 K' C5 v+ f+ f

    & X. _% ~- ~8 |% B4 X8 H使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。
    / k# H4 u2 f! i6 S" N0 c3 ~. V' t" a( q6 e* U
    ColdBus還引入了一個"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。0 v8 n6 b6 f. ]$ f1 o# |! S
    8 B* g0 Z$ V2 O% i4 ]2 u: l2 o
    PShaRe) F6 }6 n6 P8 c3 M% w& V& S: q
    PShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧- A: ?" a' W0 l: I2 v
    [/ol]5 E- v* l7 @5 b! O% ?
    圖1顯示了整體架構(gòu):
    1 q  X: @2 z2 E2 t% l' @' k+ s' t# o6 G; X; n

    . u( b+ h5 [5 P% K. L. R! b% c4 |2 ]圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。
    2 C9 y. U  g' N! W  @, c0 V0 T) d  Q
    神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點(diǎn)在下一個時期的活動進(jìn)行二元預(yù)測。
    , S# \7 o( r( q/ h3 J2 U% I' P- E  j2 \
    BigBus9 |  V' `" g6 R% R3 Y
    對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    . V  W7 f. T$ H" v* G9 [! O, r5 Z, Y6 {, G# H6 O( ^
    圖2說明了BigBus設(shè)計:
    $ A" N6 |, P4 P3 c* W+ j) L
    2 {7 K- _. D- w" W$ x, \ 2 R0 ^! g) U+ E% n
    圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。6 _9 d. O0 P" y5 p! D5 |

    $ w% i0 b) h7 i2 h0 ^BigBus使用兩階段預(yù)測過程:
  • 每個站點(diǎn)根據(jù)等待時間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合' }" U; D! {4 Q9 \: w  Z0 {/ S
    [/ol]
    - v! w. v/ ?3 y& O# ?& _8 _這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。. f$ d9 d. u2 I1 D- r

    , c4 s7 i% z: Z; e3 ^$ q

    + C, S  k2 G. Z3 g* _2 t. g多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案4 J6 ~7 _) ?! w$ ~3 M4 P
    對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。
    1 D0 W& R0 K, \. x2 ]
    9 P# g- i6 X. _0 `' z9 U+ e! s片間預(yù)測機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件/ H- i/ [: a, E7 D3 n, U
    [/ol]
    / ]" Y% }5 m* n7 d6 S% ^; G! z功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊(duì)列狀態(tài)結(jié)合。- \3 O+ _( y, c1 X  E

    4 n+ m9 y2 o5 U! a5 j/ n2 ^7 tGPU設(shè)計中的激光調(diào)制方案
    0 f/ d" I3 C* t) _+ F由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。
    ; h5 M3 r' f8 v$ P4 U; p
    # I3 i. U) l3 F/ A! X2 |圖3顯示了GPUOpt的整體架構(gòu):
    5 \3 o9 ]: Q* Q6 m- Q
    ; Z" x' {+ j. ? 5 \& l/ G8 {8 }+ B" ^- |
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。1 h' f) ?$ y; V4 J! Z2 N5 {
    + l' i% M% V4 Q2 e* ]  F. F
    GPUOpt對流式多處理器(SM)站點(diǎn)和最后級緩存(LLC)站點(diǎn)使用不同的預(yù)測機(jī)制:% p! S% ~* M: q% r& n, {
    1. SM站點(diǎn)使用基于以下因素的受限預(yù)測器(Restr_Pred):
    " M; s2 B9 s% S% F* z6 Z
  • 接收的消息
  • 發(fā)送的消息
  • 等待時間  L! p' O, w* E+ [" q

    + D; n" U2 W' V" E2 G  J2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測器(Flex_Pred):
    , O* _+ v5 k; y% u% [
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件4 d  Z% \5 x) u2 d/ T

    3 O, S4 |0 J* b" u激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
    & e1 n* f0 O1 @2 }
    / k8 b7 p9 W/ j9 ?# c( u. [
    . n& `, R! @2 h2 Q0 f. m" U7 ~* Q- K( r
    關(guān)鍵概念和趨勢
    3 v( O# K7 _& g. |4 Z雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來:
    - i4 O9 h6 D4 y" t7 M) r& e8 L+ m; Y. e8 F
    1.將時間劃分為固定時期進(jìn)行預(yù)測和重新配置& k, x/ ?. E8 F
    2. 使用多個輸入指標(biāo):' o* J( z- n$ H1 D
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件
    7 J0 T# D+ F2 b$ L. ?7 h! _% K
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合
    + K- A! Y* ^8 S1 t) j: q9 \4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
    ( g) P: |; S" a5. 對不同流量類型進(jìn)行單獨(dú)預(yù)測(如一致性與非一致性)
    . N+ W4 w& w0 f: h6 Y" e  A6. 分層設(shè)計以實(shí)現(xiàn)可擴(kuò)展性8 z, S6 X: G7 e5 d1 u$ W# \2 X2 n
    7. 盡可能重用未使用的光功率( M' _# y1 a, e
    8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測參數(shù)& y& y8 l6 G. d

    ( |; k/ O5 L8 l' G' L* O& f圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。
    . a6 G0 @# }0 |( Y( f: q3 \$ l
    2 W! t' E2 E+ K' g7 e6 s2 l) f   h9 Z7 Q5 V# {, s4 ?
    圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
    / b- ]; R$ z; o7 F) R
    . f  h5 u6 a4 p

    8 d% u8 M1 ?( ]  i# U/ Z- s未來方向
    4 Q6 z0 `( O4 q( f4 S隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
    ( ^/ w- N3 K' N- ~4 Q3 B
  • 用于更準(zhǔn)確預(yù)測的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識的集成
  • 在運(yùn)行時調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對新興工作負(fù)載(如AI加速)的專門化5 j! Z( g5 a2 ~& f6 F/ M# Q( \+ n

    + k) w( }+ t& }
    ' V. C- A7 b% Z: X% K7 s* b/ h
    結(jié)論
    ! o0 v; v0 r2 K' y有效的激光調(diào)制對實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。
    - l  T6 `" T! G
    . n8 F- ]2 V1 v3 G& \0 Q: @2 Z; Y5 ]% D

    5 K2 E9 A8 h5 ?9 p9 I% H2 {" T參考文獻(xiàn)2 i* D6 e. B* f4 h  e% p
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.- H2 j( w6 Y& k( S4 k+ k( p/ O
    ' y; q) Z+ D" z' L( K0 d8 M
    - END -$ `3 D) j# |/ v/ O9 X0 A- a5 R
    1 N) H$ n6 f& P% ^8 u
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。$ `( g* a7 \; \6 j6 O& T
    點(diǎn)擊左下角"閱讀原文"馬上申請
    5 f$ |0 X% M- d+ O8 T
    ; |  o! P& k; t1 ^; F5 X  N/ D. e歡迎轉(zhuǎn)載6 V9 e( K2 W8 Q7 P% X

    . u# H' i# F& Z# `4 j2 }轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    7 R: W; F" @7 A. v& g; g
    9 X/ `- A6 Y8 p8 S1 j; y8 s8 }( G! \! Z4 ^9 l; e# z& j
    6 V; ~& r. S2 e7 ?) R; D

    ' l. Q) [" E( j) F9 L* p
    $ V' I4 o& m' t3 |關(guān)注我們% t$ X% |' b$ j7 A4 a1 M+ ~

    : m6 |9 x" ?" ~) Z4 U9 X) m
    8 c- u1 s# Y' [+ b
    ' M' y2 |* `, t! U. K/ d" r5 S

    - e+ I( _* S: d7 k, d1 k4 S
    $ @' A- v' D+ \/ z

    / P% [5 g! s& ?9 w
    ' v$ Y; ]( \$ E5 D1 B. m7 ?
                          # n2 N  Y% b, N  z

    3 g# f. @; `) z
      Q; F% l' ], ]9 `
    , A( W/ ^, A  |$ ^2 d+ _; H
    關(guān)于我們:& @1 s) v; Y8 g+ s. o: P! X/ n. y
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。+ l/ m6 e) m5 `2 \6 J. U$ ]. j

    4 ?# }) z7 c/ S: ~# Qhttp://www.latitudeda.com/& a5 G8 u: L. K0 L9 l; a
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表