電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 25|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

441

主題

441

帖子

3200

積分

四級(jí)會(huì)員

Rank: 4

積分
3200
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |正序?yàn)g覽 |閱讀模式
引言- k( U- H& M+ \+ J
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱(chēng)為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來(lái)替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來(lái)了新的挑戰(zhàn)[1]。1 D' ~7 [0 U$ n) E

" M0 W! K+ v" `0 v" B- I本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。: p% K, Q9 h3 f
1 H; o) U2 k/ z; t2 o9 q" b4 ]6 b

  Z- [4 I: `# x0 u4 w/ u  q背景
8 F; V; d3 e) q  F  j' {- F4 {光學(xué)NoC使用光來(lái)傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:7 W1 N5 i+ q& d
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)" W5 o# W. r5 L: s7 z

    9 r0 q) a( u" T: `3 S$ |* m* H: {光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
    ! r: d/ c7 L1 m5 _% J3 @
    : U! P3 f* _! C, H為解決這個(gè)問(wèn)題,研究人員開(kāi)發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:- E* D  f0 G5 k& c. f. m& v+ |# Y
  • 監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)
  • 預(yù)測(cè)未來(lái)活動(dòng)
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò)
    ) f5 h3 c' f' _
    8 l4 a: W$ Z! k5 g6 y- ]
    讓我們看看為不同類(lèi)型處理器提出的一些具體方案。
    + a6 l9 X( H. s! h3 H. F
    8 G. U$ ^, r6 r  Z% T多核CPU設(shè)計(jì)中的激光調(diào)制方案9 a# Y1 }' g; q# A' J, {
    Probe; p( g5 Y% \3 }9 ]6 F( @7 k
    最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專(zhuān)用的片外激光器,可以使用單寫(xiě)多讀(SWMR)總線廣播消息。& A3 w- A7 Q+ b+ P+ R& u

    2 o- X) ]6 J  l, D6 i6 L" NProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)。使用兩種類(lèi)型的預(yù)測(cè)器:
  • 用于低流量變化:過(guò)去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表
    % k$ y) @$ @! F9 M# @# d4 T* ~[/ol]
    & H* H/ `3 m9 y& B" b錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。3 J& _% A/ c  \: q( h; [6 n* e; ]1 m

    ; `* i8 a2 C3 |8 X4 d  n: k! JColdBus
    . m- x: f8 k. M# Y, C0 N- HColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來(lái)自L1未命中。
    0 Z' E6 Z/ p& L2 o$ x+ z5 e  ?7 `- W& {
    使用類(lèi)似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來(lái)識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。
    2 s( C+ ^$ G- D2 M; c% t
    ; m8 _7 o; R/ Z+ lColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。) q* y! x5 @) ?' z8 ^% y5 ^, s

    3 s5 _. M& x, J5 iPShaRe
    * {% P- m8 G  b* F5 d# vPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧
    / M; k; l# r; ?5 `5 ^: _  R[/ol]5 B' D) ~2 j, a0 [+ K/ z
    圖1顯示了整體架構(gòu):6 E5 E: @: q) G# S7 r

    ( y  K% G# ?" M $ `9 i8 h3 m2 M- V. h% A" _7 f9 |
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。
    5 t( g- n# h( p7 G$ \% x: ~/ |6 m& A0 d! K
    神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。& q7 b+ g7 }8 c* q3 \% a! ~
    * B1 B- ~* B8 C- H. w$ e
    BigBus6 I4 [( B, C6 E. ~
    對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
    9 }% e) b& \# T8 i$ B, \
    ) }' T! z: r  t1 k: h圖2說(shuō)明了BigBus設(shè)計(jì):# Y/ S5 v& k) j3 {

    - Y' V+ Z: Z0 m5 V3 v; {) s5 ? ! O6 b1 e" K1 F: \( n  ^
    圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫(kù)的分層組織。" Q9 U: c7 {3 m2 K4 N

    ; B; k  E1 [9 S2 N9 `4 K# K7 ]BigBus使用兩階段預(yù)測(cè)過(guò)程:
  • 每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合2 i# Y3 ^# I( p- Z6 |
    [/ol]2 X# N' v) y" V) o6 b
    這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
    - J$ F5 S3 S" [# T, w. B9 x
    + h4 N( S9 E: D' ~8 |1 @

    0 w  P; r- t. Z$ S0 A+ _多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案, {; F) U4 G, l! {& x- I
    對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。' Y8 T1 J2 i" ~
    0 t- @! x( Q/ \* J/ q
    片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件
    # G: K. L7 K& D; C5 D3 w, R[/ol]
      S- g' E# X4 s( Q4 t: T7 f功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。
    / t2 V# l* s+ J: f, N
    + D* ?5 _# T, {/ |3 K4 K$ SGPU設(shè)計(jì)中的激光調(diào)制方案/ Z- s9 m+ U$ Q" M0 W( R5 V8 [- g
    由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來(lái)了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。3 D2 w$ R* w1 E

    / r- o# C! O3 A1 `/ V圖3顯示了GPUOpt的整體架構(gòu):$ O6 a2 X8 O! m3 ]/ w
    4 ]$ j1 G3 {6 d7 K$ h% E2 g
    * z6 m, h7 K* `$ ~$ r
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。6 K. O, A7 R# D( M/ C( ?3 o9 @+ c/ U

    0 @2 f) h. b$ E8 V. jGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:
    8 h5 |% f. R/ B' O. D- L& X# F1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):. p4 ^1 t7 ?# h
  • 接收的消息
  • 發(fā)送的消息
  • 等待時(shí)間1 \: @9 Y  T8 U& e* @4 _. u: I1 i

    ( J7 ]3 a1 a2 f( W) ^, P# L% r3 E+ x2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):
    # ^% W# o. Y$ S
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    , R$ N" ?, W. r$ _$ L; U4 j

    1 N0 U! ?4 L6 e0 z5 J激光控制器將這些預(yù)測(cè)結(jié)合起來(lái),確定整體功率需求。
    , S( v7 t& P" F$ z! u
    & U' f# I+ R3 e; `6 A

    + X0 @+ Y8 q" y$ }% V, l# U關(guān)鍵概念和趨勢(shì)
    ; s1 y  O' b9 o: Z$ g0 w" o, ^雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來(lái):# w/ _8 A% ?2 h4 E7 [/ B
    2 V, ]& H* [; k! \
    1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置# E' d: w- L  N8 p6 _9 H; |" p
    2. 使用多個(gè)輸入指標(biāo):
    , f& w+ s: C9 D/ h# b$ _
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類(lèi)型
  • 待處理事件
    8 R4 i" h9 F8 H4 g. O, A) f
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合- x2 z8 u7 B9 d- g- J; ^0 L
    4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系
    - C' t7 n# X. T5 G' t- ?! z/ f5. 對(duì)不同流量類(lèi)型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)1 l6 |1 M3 y3 ~2 }) h3 Q3 W
    6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性4 r( e+ x8 d8 i$ e) E- k" ~8 R
    7. 盡可能重用未使用的光功率
    6 Y; t/ s! _1 ~# O% A8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù): p: q# X# N( p# l+ D% J9 ?, N
    5 [/ \( [8 n7 O# [* c' K9 H. B
    圖4說(shuō)明了有效激光調(diào)制可能帶來(lái)的功率節(jié)。
    $ P. e( H# `& p' I
    ) i- @, \; }% X& I0 Q
    $ Z, x' o$ d) V# s3 q- }5 L圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。
    $ P% O! `7 F7 [: r  p  @' n( ^* E
    ; R5 J1 {7 a3 U- N% i
    - M9 K* D& `' F5 Z; d
    未來(lái)方向" U  k; ]: V$ t3 A( l( T
    隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:
    7 D  V5 g4 o) g; T) y" u& v
  • 用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識(shí)的集成
  • 在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對(duì)新興工作負(fù)載(如AI加速)的專(zhuān)門(mén)化
    - C* {5 m7 I* X

    2 R2 k4 i6 X% y

    & C. O* K* J% _結(jié)論
    7 ]6 y  B0 Y& \! ?7 E, Z2 E; _' V4 _有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過(guò)準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來(lái)計(jì)算系統(tǒng)解鎖新的能效水平。
    ) N* \2 t! A. B$ b! J8 v# }" n* N& X+ C! _1 i3 o6 W. [, w
    / i6 Q9 @4 [, {$ D5 z$ e
    參考文獻(xiàn)
    " i" J# Z* n6 A[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.3 W1 }, W! d. f- Z; V( A
    0 l. y" u) x4 i$ ~( D
    - END -4 r& p' M% }5 |! s9 B1 S! H3 b9 ^
    4 b& O/ F0 \) f- N$ i
    軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    $ X1 v) m" ^2 e4 E! {, w7 v點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
    7 k4 B) {/ [7 ^3 T2 e
    . J, O/ k' s+ E- `歡迎轉(zhuǎn)載3 }. O2 N+ F& M3 w2 D
    8 Z. e5 R' b: y1 Y1 `2 j6 d$ I
    轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!/ H: h. J. H- D" t$ q) x
    % ~: r% Z# I2 ?* f9 \! k
    0 i9 ^# Z+ y* v' B3 a$ M& C

    & J' \8 U3 U8 K: s  @: t
    ; m( }+ \: I: l4 Q
    ( y* M( B; O( _關(guān)注我們/ {, _6 ]. z. P1 f

    ) l3 y* e, p% W% R/ P. j1 ~
    3 S+ W. M) `1 B: @6 i$ h" d% Q
    2 p' N( a- s8 ^! i1 E  k: l) ~

      ~' w  H3 `: t$ V" L ! I4 |- V  j6 j/ ~: |
    4 g6 k& [9 F$ n

    8 N- Y7 u# e  s, N( T. V3 A
                          $ z4 _6 W  w' d5 X% p# F& C& y

    $ x9 S% t+ A4 F6 ?; P5 S/ h* I; Q0 d

    : J+ u. m' |% B/ M6 ?0 ~! c, z; e
    關(guān)于我們:
    ; t0 ]8 z  P: J0 d: d" b% t5 G6 Q7 L深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專(zhuān)注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開(kāi)發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。: ~4 K. Q$ ?8 Z: L9 F
    5 D0 P/ u$ I4 V# F: B9 f4 P5 h
    http://www.latitudeda.com/) n. c) _  Q* R7 j; T
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長(zhǎng)推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表