電子產業(yè)一站式賦能平臺

PCB聯(lián)盟網

搜索
查看: 32|回復: 0
收起左側

利用近似計算技術提高硅基光電子片上網絡的能源效率

[復制鏈接]

441

主題

441

帖子

3200

積分

四級會員

Rank: 4

積分
3200
跳轉到指定樓層
樓主
發(fā)表于 2024-9-19 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言5 n# [4 Z% Y5 ^$ A( _! n9 W/ t
隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術應用于硅基光電子片上網絡(PNoCs),以降低能耗同時保持特定應用的可接受輸出質量。
- B; f  X! A' L) h+ j6 N# y
& v$ A/ N: k! ^& x背景
" z& u* i! B: {. MPNoCs利用在片上波導中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標端能夠無誤地恢復數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。
* O5 k, l$ K9 u# X$ s0 {9 n" u. T! p5 ?6 _/ x
浮點數(shù)據(jù)表示遵循IEEE-754標準,由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。
% T6 p7 p& L( `& q. q9 q4 C# T4 _7 x/ G9 r% a  t

2 }$ i2 Y* Y/ M& Q圖1:IEEE 754浮點數(shù)表示格式
) Z3 h4 }( _( w  |) z
; G! Y, E3 p& O6 c) \9 d5 ?LORAX框架+ j$ M/ s3 r/ y% N) D
本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。$ k; [+ a1 _# ?  n( Y  v

5 L& ~, K- t+ XLORAX的核心思想包括:
  • 基于信號傳播距離的自適應激光功率管理
  • 應用特定的近似級別調整
  • 集成多級信號技術
    & j$ S9 C' ?7 U0 j0 ?[/ol]
    ! Z7 Y; g/ B( z6 \, O損耗感知激光功率管理
    - E6 x* [& Z; V3 n+ J5 q- H: sLORAX采用損耗感知方法在運行時調整激光功率。對于波導上的每次通信,根據(jù)源端和目標端之間的距離計算信號遭受的損耗。
    5 _, Y; y8 |" O
    4 ], _6 v: P( Y8 y5 o4 `這使LORAX能夠確定:
  • 信號是否可以在降低激光功率的情況下準確恢復
  • 信號是否應該被截斷以節(jié)省能源
    0 y, P. ~# l# f0 f) X[/ol]2 j7 W% j; h7 o( j$ ~

    * j! p# n% A% r 6 c4 ~5 H7 I) b! q; _3 |
    圖2:提出的LORAX框架概述
    2 F. N9 f1 ^3 B* [
    5 J0 C, Q( u# \4 e該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅動器動態(tài)控制。網關接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅動器。3 p+ H" b; a7 w+ S

    ! A) G( b- y' a, ULORAX要求每個源節(jié)點知道:7 f) N3 V3 V- k
  • 何時在截斷和降低激光功率之間切換
  • 數(shù)據(jù)包是否包含可近似數(shù)據(jù)- a6 R' M' Q. @7 p! w" f0 o

    3 Z: I7 d9 P1 T$ Z4 {' x這通過以下方式實現(xiàn):0 z& `7 U7 R( }6 }
  • 源代碼注釋生成可近似數(shù)據(jù)的標志
  • 每個GWI中的查找表,包含到目標的損耗值
    # X8 R' Y5 ?* H% v  l# Y4 F; a
    ( @5 x! C+ g6 U, _6 A3 U
    集成多級信號技術; Y5 c- _  B: A! i
    LORAX還探索了多級信號技術的使用,特別是4級脈沖幅度調制(PAM4),作為傳統(tǒng)開關鍵控(OOK)調制的替代方案。PAM4允許每次調制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。/ a1 U3 c2 h, R& T& c) c, s4 h" T! w

    * l. B* S# }9 G" X# W" N 3 @; \7 W* V5 Y7 Z- V
    圖3:LSB信號:(a)截斷,(b)降低激光功率
    3 J3 p7 p! x( _( v# G; c* ~  i
    ) j; g: G% U% E) Z' m) W; Y- U  n實驗設置和結果+ U) e# m8 }, p- h* d
    LORAX框架在具有64個核心的Clos PNoC架構上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。
    & P% X7 i5 Q; m; J' `( _5 X) F6 I! ^- A- |
    4 A! }7 k" j7 E# w( `8 E
    圖4:具有64個核心的8路3階段Clos架構
    4 w+ n$ F  c5 {! I7 O8 @7 \$ E3 G' _3 z  u; I+ z' Y4 g8 l9 y
    應用特定近似敏感性分析
    : \* w8 o+ v* t2 s! ^9 a對各種應用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。
    8 `' @# e3 |( r* I( |; `8 S/ ^; A1 l; E; Z! J. R
    這涉及變化:
  • 近似的最低有效位(LSBs)數(shù)量
  • LSB信號的激光功率降低程度
    5 `0 [6 [* ^" B8 L[/ol]
    9 j  [/ H5 S. t2 h! ?% R, j4 H6 C* J$ }& k/ P

    2 ]9 M2 S) d- m: N圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準測試在大輸入工作負載下,應用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)
    # G2 R, E  S/ R5 _- B- Z. l1 \+ \  ?2 B: l
    這項分析的結果用于確定LORAX的應用特定激光功率強度控制設置。表1總結了每個應用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。5 Q" k# Q# B; [+ b
    % g0 t7 N3 ~$ b/ }
    / P% x& Y  w# A
    表1
    * `+ Q5 X  J+ s, n' ?& F7 S' ?9 L6 m7 F- a! k( y
    比較結果
    3 A: p; n/ P7 X/ c: I9 A7 i8 JLORAX框架與以下方法進行了比較:5 s1 j. y5 N' G4 c9 Z) J
    1. 無近似的基準Clos PNoC  |2 P, A9 o0 b8 M
    2. 文獻中現(xiàn)有的近似框架1 J$ ~, a4 n7 o7 Y
    3. 靜態(tài)截斷方法; `! Y7 [$ v) u( R9 j

    1 h* B* H6 o* R% a1 i評估了LORAX的兩種變體:
    * \* a8 z$ N* e) y; K1. LORAX-OOK:使用傳統(tǒng)開關鍵控調制
      A: r- }! t; L% |2. LORAX-PAM4:使用4級脈沖幅度調制/ ]# V2 W, s9 ^  v1 k6 `0 X

    . C! {$ }% T& `
    - ^3 ?- a( F1 m1 H0 H6 c/ M: z. z圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較- ]  f5 |5 M: A1 [: s
    * E, E& E# C+ i( O  g
    主要發(fā)現(xiàn):
    2 p+ y" ^' v+ V/ z. X& W$ R6 t! d" Y1 i1. 能量每比特(EPB)降低:
    9 f- k( v% \* u: Z( I- N9 k
  • LORAX-PAM4:比基準Clos低13.01%
  • LORAX-OOK:比基準Clos低2.5%
    / Q2 _9 Z! }" s# ~5 ]

    1 `# I# e5 K6 N8 t2. 激光功率降低:% l0 H0 n9 @& @* L
  • LORAX-PAM4:比基準Clos低34.17%
  • LORAX-OOK:比基準Clos低12.2%
    * \- K$ P$ e7 J! K& F& \7 M" C
    4 n& K) d" k" f
    3. 最佳情況(Blackscholes和FFT應用):" F# J9 f9 k  t) c% k, w9 S8 J4 [
  • LORAX-PAM4:激光功率比基準Clos低達39.7%
    " C% Q( N  ]: S3 V# ]

    - _/ I  c2 ^) b" h" {% I結論8 t: F# a2 F# w! i* s
    LORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。
    6 K* b/ b) A/ P& [% h; I9 Q
    6 U' D) W+ P8 `/ O& N" T  a, o主要要點包括:
  • 損耗感知激光功率管理允許基于信號傳播距離進行自適應近似。
  • 應用特定近似級別調整對于保持可接受的輸出質量非常重要。
  • 集成多級信號技術(如PAM4)可進一步提高能源效率,盡管增加了復雜性和易出錯性。
  • 必須針對每個應用程序仔細考慮能源節(jié)省和輸出精度之間的權衡。5 m$ g6 T# P& H) E& C, o( L
    [/ol]
    + G8 Y+ k" r. B0 A& E未來研究方向可能包括:
  • 探索更先進的多級信號技術
  • 開發(fā)自動化工具以確定最佳近似設置
  • 研究LORAX對其他類型PNoC架構的適用性
  • 擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似* p! a# l; e: ~
    [/ol]
    * |& s; z3 |* E8 \6 L! `8 \+ ^通過利用像LORAX這樣的近似技術,設計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。7 K; S) W9 u4 W  d; a
    ; B3 `* C+ p/ I5 D  Z" R8 D
    參考文獻
    , w$ j+ O; Q1 ?[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
    + q3 _/ ~# T5 L7 Z4 N
    9 }, w8 w2 c* j* r8 Q1 F% ?- END -- t2 j$ K" \1 e" e
    ; @9 }& d5 l4 l* `+ o6 l, i, H
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。! `, S6 p* t8 v4 m
    點擊左下角"閱讀原文"馬上申請
    $ K7 G! O: d. H6 H2 {9 F+ j, p7 u4 @* x; i! z: i6 z: ?
    歡迎轉載% Q9 o; |5 u; b+ K1 g3 ^# k3 R
    8 \) d: H5 S& N9 A: g, H# F
    轉載請注明出處,請勿修改內容和刪除作者信息!
    & d! y9 s% o& o. U
    - g1 a  F& z# @! L- h9 ~8 A! w
    ' w: {; A1 ?1 u6 T. `$ y
    * o- h- ]! ?& y& L- m" W0 s0 x. J

    4 ^, a; V' _% s) Q
    : B: \7 Z7 H# v% O9 r6 o關注我們
    ; C0 M5 L3 y2 r" L' I, f* e" u# A
    1 Z4 d9 |  }7 O, b- H

    % M* k; H1 M+ J! x2 W* v1 _; S1 Z
    & _- R3 x: {( N) p9 V  T

      @7 U7 v3 E& H$ B. N' B / H9 D: d2 [( }

    7 _/ w. a4 Z3 Y
    ) H( E# _* d5 X! J7 b
                         
    6 f# t; y( m' M) x* G& J* ?6 x9 |! U3 W0 t  t* P9 x
    # y1 X  h. k/ U" e# w* x
    , t6 |% A7 R: s& P8 w
    + e  G5 C- D3 o
    1 ]5 U3 l3 m7 H7 d% `/ F% D

    0 k+ K! `0 g/ a' _2 N關于我們:
    5 C5 ]0 n9 }0 K2 k  }& E深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
    * S8 j/ ?4 }5 x' b: s( b7 X+ M  w& }0 @2 M" j: k, h4 N
    http://www.latitudeda.com/( l+ Q' ~6 T$ W9 V  B+ T- N5 Z
    (點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表