電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 88|回復(fù): 0
收起左側(cè)

利用近似計算技術(shù)提高硅基光電子片上網(wǎng)絡(luò)的能源效率

[復(fù)制鏈接]

686

主題

686

帖子

5863

積分

四級會員

Rank: 4

積分
5863
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-19 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
) a8 B9 B$ `$ v% V隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應(yīng)運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時保持特定應(yīng)用的可接受輸出質(zhì)量。
8 G/ X& ]$ W5 f& {4 h0 B% S% w, u% m* f* l: q1 t4 `! f
背景
, G8 Y: r. K3 p- G# _PNoCs利用在片上波導(dǎo)中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標(biāo)端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。
% T% g5 }# z2 |9 E1 E5 N) X0 I
" q# S$ A* _( [+ M+ Q  V浮點數(shù)據(jù)表示遵循IEEE-754標(biāo)準(zhǔn),由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。/ d8 x! Z' Z+ l5 [$ o7 ^
# X# c- _3 a: g$ [" O  \
5 |' u; b' o2 j9 f% G
圖1:IEEE 754浮點數(shù)表示格式
* _; }  h" U" R
: S* a/ c+ b# ]7 u+ R# O; rLORAX框架
) ]* v9 K7 {  @6 X  R% O, H' W本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。: d# P2 d2 E8 s: s" q+ ^

8 B) \0 G+ h& j; `LORAX的核心思想包括:
  • 基于信號傳播距離的自適應(yīng)激光功率管理
  • 應(yīng)用特定的近似級別調(diào)整
  • 集成多級信號技術(shù)  F% l7 }, `4 b2 f$ ]
    [/ol]: O! K9 p9 Q5 R
    損耗感知激光功率管理
    , y7 ?% S; |+ Q8 t& WLORAX采用損耗感知方法在運行時調(diào)整激光功率。對于波導(dǎo)上的每次通信,根據(jù)源端和目標(biāo)端之間的距離計算信號遭受的損耗。
    7 r/ _. s6 N8 E; \9 Y- p7 X9 B- _( n7 ^
    這使LORAX能夠確定:
  • 信號是否可以在降低激光功率的情況下準(zhǔn)確恢復(fù)
  • 信號是否應(yīng)該被截斷以節(jié)省能源( m7 [( ]+ M3 ?; ]' I* O
    [/ol]
    5 G* Y$ l7 V) Y" f) b+ u( V. E9 Z* `, ~+ F* f, q
    ' ^. Z0 E+ E/ L# I
    圖2:提出的LORAX框架概述
    * h5 [  T" E1 W# M( }
    6 o: g. ^9 S+ Z* V5 j該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅(qū)動器。: s" ]1 B5 D4 v; U

    7 Y/ g& d) E, uLORAX要求每個源節(jié)點知道:
    & J: A4 M9 y6 f% H
  • 何時在截斷和降低激光功率之間切換
  • 數(shù)據(jù)包是否包含可近似數(shù)據(jù)
    4 a* ?* a5 m' @- w- [5 y" B
    ! Y& I' t+ z7 C5 g$ A) p
    這通過以下方式實現(xiàn):
    9 g3 v+ N1 S) D6 U4 L6 h( e
  • 源代碼注釋生成可近似數(shù)據(jù)的標(biāo)志
  • 每個GWI中的查找表,包含到目標(biāo)的損耗值
    + S. k9 @4 h' W7 M1 z1 X, W

    , T0 t! H+ R& A# Y8 H6 ~* g# [集成多級信號技術(shù)$ P' X) |  o( u; p
    LORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。
    ) L. j( {( I( ?4 F7 n. H! V& S; l3 C! [8 P

    ! K" u/ M0 P' _圖3:LSB信號:(a)截斷,(b)降低激光功率7 h& \& ]# M7 e5 ?. [' C) i, X
    6 f4 r! m  I; A$ R* ^/ N
    實驗設(shè)置和結(jié)果4 `& l: @# B. x8 N4 r9 }" Z9 u
    LORAX框架在具有64個核心的Clos PNoC架構(gòu)上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。8 T7 G% X! S& G) ~2 m

    3 B# ?2 l0 N8 P9 t7 m/ G3 O" ^3 }
    2 y8 p7 \; j) p- ~& ?1 a* b圖4:具有64個核心的8路3階段Clos架構(gòu). z  ?1 d3 L, ^4 b
    & l  {$ B: J' v/ N) B  ?9 S2 _& A
    應(yīng)用特定近似敏感性分析# q$ E" x& ]: M! b% Q
    對各種應(yīng)用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。
    1 R4 Q3 r: i! f: I, ?. X1 {0 p5 ^! @
    這涉及變化:
  • 近似的最低有效位(LSBs)數(shù)量
  • LSB信號的激光功率降低程度. j. M" i  ^" B) \0 X# g
    [/ol]
    ( O1 b9 v2 N  G2 }9 b
    - j' Q6 C/ L) r6 k6 e " |  m6 u9 a6 \! G/ T" F0 n
    圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準(zhǔn)測試在大輸入工作負載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)3 k2 z1 y8 j5 Q! ]' D

    * A2 [8 q) ~# j這項分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強度控制設(shè)置。表1總結(jié)了每個應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。( O; s8 c. Z" K' q' o1 F
    ! h9 x0 _+ c# @/ z5 T, T" A
    8 N" r) m9 A) J( O7 P% S$ s4 u1 s  L
    表1( Z& i# q% N2 e/ `" U  e

    8 V+ o, A5 k) G8 x6 _5 l( A$ W. }比較結(jié)果
    - M9 S0 `! f" WLORAX框架與以下方法進行了比較:; J8 F/ I3 A; V
    1. 無近似的基準(zhǔn)Clos PNoC6 R3 R9 j3 T1 S
    2. 文獻中現(xiàn)有的近似框架$ k" [7 ?9 ~0 L1 ^# J8 H7 f
    3. 靜態(tài)截斷方法
    * m, s4 b. O. B2 @1 C- }# n/ E* s9 n& o5 W" W7 Q$ h# a' Z% D
    評估了LORAX的兩種變體:
    $ m# |2 j5 r+ F8 C/ @$ d/ O+ g1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制# s4 L! _) r4 R( y' E, I
    2. LORAX-PAM4:使用4級脈沖幅度調(diào)制3 [: S1 ^$ g$ y4 I/ f9 g8 |1 T  [

    ! |/ a9 {, D) u: A9 A . _9 N* Q) o) ?2 k& {
    圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較0 u3 N- r0 ^0 S% j

    / p0 z; R4 `, Z7 u主要發(fā)現(xiàn):
    * G3 ^* U! y" v& X1. 能量每比特(EPB)降低:
    7 U0 S% y4 Q8 ^4 ^6 N
  • LORAX-PAM4:比基準(zhǔn)Clos低13.01%
  • LORAX-OOK:比基準(zhǔn)Clos低2.5%3 K! u9 \- R; S6 X8 r7 v+ w9 G! \
    6 O- V6 j& N$ X; |
    2. 激光功率降低:
    ' n; d( e, Z& R) ]3 X1 S7 h2 D# h! }
  • LORAX-PAM4:比基準(zhǔn)Clos低34.17%
  • LORAX-OOK:比基準(zhǔn)Clos低12.2%9 a6 L6 `; U; F7 }% g
    ! w3 H: f5 O/ J" g. x' Y
    3. 最佳情況(Blackscholes和FFT應(yīng)用):
    0 k3 w8 ?+ T+ S' T! N: [) w
  • LORAX-PAM4:激光功率比基準(zhǔn)Clos低達39.7%
    ; Q% P# ~$ R" Z# Z; O1 L5 c

    - Z/ c- U2 D1 {結(jié)論& e* V3 v! F0 b5 q" ~
    LORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。
    7 P5 W+ g0 N  U5 K
    * s7 c( k  `# D' f$ M8 W2 o主要要點包括:
  • 損耗感知激光功率管理允許基于信號傳播距離進行自適應(yīng)近似。
  • 應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。
  • 集成多級信號技術(shù)(如PAM4)可進一步提高能源效率,盡管增加了復(fù)雜性和易出錯性。
  • 必須針對每個應(yīng)用程序仔細考慮能源節(jié)省和輸出精度之間的權(quán)衡。: e2 W1 Z. @, w' I
    [/ol]5 n/ b$ {. S/ n2 ]8 Y% h
    未來研究方向可能包括:
  • 探索更先進的多級信號技術(shù)
  • 開發(fā)自動化工具以確定最佳近似設(shè)置
  • 研究LORAX對其他類型PNoC架構(gòu)的適用性
  • 擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似% H5 c* D% M6 s4 c2 J  j2 E( I
    [/ol], k3 |) Q3 f; X0 {
    通過利用像LORAX這樣的近似技術(shù),設(shè)計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。0 |: _$ B7 Z  i
    # C9 F1 d# f3 d
    參考文獻
    3 ?( f5 Z9 q% M& \$ I  b! [[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    / o5 A# H4 }- a) C9 x- n9 t. x) y: W/ V
    - END -
    4 s, J7 s, J/ z& Z5 e" F7 Q
    / |! E: k1 _& Y; t1 w; y軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    4 |. e) E, Q  b' i8 J# T( [點擊左下角"閱讀原文"馬上申請8 i9 ?1 J2 }. y& J" x8 ^: i

    : L) u9 G( d8 E; O3 F歡迎轉(zhuǎn)載
    * D, k5 p+ x- Q/ B: Z! q2 w0 d$ C5 W: _9 [+ H
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    ( M& S+ a# }! k# p- M& |0 l7 j. }. h+ R7 w5 _

    $ [% J5 ?' [1 F" K( k; T: n  l
    5 D+ k* s4 X; F( _9 L3 R
    ' H! H! ]; _6 N) `( o( m- H
    * o! |" X8 f' M9 I
    關(guān)注我們
    9 q0 e* _) m0 j7 e4 h+ a
    ( D) t, M3 n% e0 [

    ) U6 l& K& B# }4 e2 W
    - }- b0 |' T, w* @- }2 D, h4 @
    % x4 }/ ^% l" A8 L" @
    # d+ N5 O! L( O: _' e% n0 U
    # o9 q4 T. s8 m) Y4 ]" o
    / }( i, [' `4 W0 g" g
                         
    & I: n) [5 A) h
    3 D# A' J! g- E
    0 }& |9 U: p0 Z! |5 I
      x0 N1 p" p& R2 L; q

    ; P, j  N6 {% }% Y7 p4 j  y+ `6 Y& T' Q

    ' l% b$ C2 P( y* A3 T# [關(guān)于我們:2 u' d5 [) B) d0 L
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    5 V  v; S: h+ M; x$ r
    ; k) u" D& k% G# h7 A6 I, xhttp://www.latitudeda.com/
    6 q  N; F0 Q& Y( K% ^(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表