|
引言
! s: ?; i+ m `% z隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應(yīng)運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時保持特定應(yīng)用的可接受輸出質(zhì)量。6 @- O0 D$ u8 C9 \2 E
8 `: i; x. k9 X2 ?; @6 k背景3 k+ ?6 ]9 B& ?7 Q: c G5 c p
PNoCs利用在片上波導(dǎo)中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。
, ?) Y- f) H" F ?1 F3 ~3 H
0 q# [* i2 A+ X; V) J$ w3 H浮點數(shù)據(jù)表示遵循IEEE-754標準,由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。
8 C; x, b; h8 G8 g/ o: X$ M5 x- v! f n7 }8 u$ l+ x, Q) g/ u2 p
qrh0mmugeky64034875601.png (62.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
qrh0mmugeky64034875601.png
2024-9-22 01:17 上傳
4 W& j. m1 V& N7 w; L8 J( o
圖1:IEEE 754浮點數(shù)表示格式" s4 c9 I+ O' v) j
2 O) m& B# G8 _; i' ELORAX框架
2 [5 g* r. i T本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。, Q7 F4 h2 ?* C0 ?# }9 L; u* V
- [" ^6 ~' c( b" \$ g( E, g3 v* D
LORAX的核心思想包括:基于信號傳播距離的自適應(yīng)激光功率管理應(yīng)用特定的近似級別調(diào)整集成多級信號技術(shù)
; _$ m( ~* C; ^+ l" F7 A' h[/ol]9 g. E/ s6 C. p9 y0 Z5 a
損耗感知激光功率管理
4 a# o: M8 g6 p# YLORAX采用損耗感知方法在運行時調(diào)整激光功率。對于波導(dǎo)上的每次通信,根據(jù)源端和目標端之間的距離計算信號遭受的損耗。
/ Z3 y( H% f8 R& V7 T0 Z' h; s2 M
( d* `, f- Y4 d: q: e, \這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準確恢復(fù)信號是否應(yīng)該被截斷以節(jié)省能源8 L. _' ?! r. [, ~ y, _% _
[/ol]) a% X( {8 ~9 O( x5 z6 O
5 Z, ^5 O" {; j8 l
0dfhs3ealaf64034875701.png (304.94 KB, 下載次數(shù): 1)
下載附件
保存到相冊
0dfhs3ealaf64034875701.png
2024-9-22 01:17 上傳
1 r7 [; Y* J! Q s: m/ h
圖2:提出的LORAX框架概述
* O- x# f$ u5 L" f
`6 N! M$ v$ K. v" P該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅(qū)動器。
/ I9 _& E0 y7 n% [( a3 m/ ~6 n& k- i# j/ l
LORAX要求每個源節(jié)點知道:
( x; }5 X! d, Q1 ~ O& g7 }何時在截斷和降低激光功率之間切換數(shù)據(jù)包是否包含可近似數(shù)據(jù)
" F6 n& i* ^" Y- K; ~- W
8 ~- C0 {& ~6 ], D5 ^- C$ P* p0 k9 }) } ?- f這通過以下方式實現(xiàn):
! Q- E3 I$ S6 d9 |8 R源代碼注釋生成可近似數(shù)據(jù)的標志每個GWI中的查找表,包含到目標的損耗值/ @9 Y! e& P) _
$ j1 Z8 l+ ^$ F4 w* B' y集成多級信號技術(shù), u3 _5 L" R; m9 v* S
LORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。+ r/ D9 L2 w3 a/ H' `% A6 p
8 n: Q; r; B! ~
i1jx2pdw5yh64034875802.png (160.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊
i1jx2pdw5yh64034875802.png
2024-9-22 01:17 上傳
' [5 l+ O4 l. B8 |) F
圖3:LSB信號:(a)截斷,(b)降低激光功率' |# T0 [6 S! y6 b' _" \4 ^
$ | @* z- X* w* u7 K實驗設(shè)置和結(jié)果
C0 C9 B5 k* d- h& `LORAX框架在具有64個核心的Clos PNoC架構(gòu)上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。! E& @) C7 \: l: b7 i
; @( b! U0 I" O
2p25aaae00v64034875902.png (235.47 KB, 下載次數(shù): 0)
下載附件
保存到相冊
2p25aaae00v64034875902.png
2024-9-22 01:17 上傳
8 g) w C1 B. o; n# Y
圖4:具有64個核心的8路3階段Clos架構(gòu)5 K8 F! M" Y, z
U6 U: m7 [2 [
應(yīng)用特定近似敏感性分析9 R. f' m/ W5 _5 b( m
對各種應(yīng)用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。
8 {) U2 z' \% f G3 @3 ~+ A+ |; a; g0 S2 {7 m/ \
這涉及變化:近似的最低有效位(LSBs)數(shù)量LSB信號的激光功率降低程度& i; Y, E9 S; l7 }
[/ol]
# }( r6 G. D" o5 c6 b* N2 D
* L( ^5 e6 F" T2 h& _
d2qqlugmsls64034876002.png (545.54 KB, 下載次數(shù): 0)
下載附件
保存到相冊
d2qqlugmsls64034876002.png
2024-9-22 01:17 上傳
3 `2 o6 n0 O6 t圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準測試在大輸入工作負載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)
. D! N% \% g$ ^7 o9 V; S J# @" \. K* r7 X) V* L+ C" l3 ?) D- d
這項分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強度控制設(shè)置。表1總結(jié)了每個應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。* G1 n% r7 [. j% I8 {2 \' s
: b0 h# V1 X, c* @7 m* g
ogjfv3j511z64034876102.png (130.27 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ogjfv3j511z64034876102.png
2024-9-22 01:17 上傳
4 I2 e4 E" g- e9 B4 t. u4 i% B
表13 s5 o8 v( m: ?6 c6 N) q
" F! z- [& v& c
比較結(jié)果
2 |; \9 h9 ?! Q( C0 Y: ALORAX框架與以下方法進行了比較:' [. g" J3 O- v; Z: d0 B8 O% G
1. 無近似的基準Clos PNoC
- n5 a1 E& `& }0 c' O2 h2. 文獻中現(xiàn)有的近似框架& h# x5 k2 O/ r5 W0 x3 `+ X. s
3. 靜態(tài)截斷方法, f8 v+ l) f5 ^/ C
# ]3 n) ~+ G" J
評估了LORAX的兩種變體:" p. b5 N/ @( Y2 k: Z
1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制
" E0 \- ^" M' ^3 E! u) O+ U2. LORAX-PAM4:使用4級脈沖幅度調(diào)制, c* x- d$ K% `5 C
; S- f3 K) U, h0 G: P
1tubhacbjrg64034876202.png (146.3 KB, 下載次數(shù): 1)
下載附件
保存到相冊
1tubhacbjrg64034876202.png
2024-9-22 01:17 上傳
7 B8 [ X$ O- [6 o6 p* t
圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較) b: p" Q! c3 Y0 o' O
4 ^' O" i7 b* P1 r6 m H- h Y主要發(fā)現(xiàn):
' {! z+ A9 k% K) J1. 能量每比特(EPB)降低:2 z8 e+ @; z1 {' \; E: R% K
LORAX-PAM4:比基準Clos低13.01%LORAX-OOK:比基準Clos低2.5%
( V2 p" d5 d& p& ~# t
+ G7 R; `: }' ?6 U2. 激光功率降低:
: b/ \4 {8 I$ ^: s# e1 NLORAX-PAM4:比基準Clos低34.17%LORAX-OOK:比基準Clos低12.2%/ N6 F- e. F/ S9 G
4 k+ I }7 v, R; C9 h) F$ d! K5 f4 `3. 最佳情況(Blackscholes和FFT應(yīng)用):
& V, f* s' O6 [: t8 s C! E* sLORAX-PAM4:激光功率比基準Clos低達39.7%, ^; d; W6 Z+ }, g
a3 v4 }8 J5 G9 W, ^8 M
結(jié)論
# x u+ S1 r5 f) `* bLORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。
8 `$ Q0 e- k( ~1 O6 u% I; L' h4 @/ B3 N, f2 L' n4 c
主要要點包括:損耗感知激光功率管理允許基于信號傳播距離進行自適應(yīng)近似。應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。集成多級信號技術(shù)(如PAM4)可進一步提高能源效率,盡管增加了復(fù)雜性和易出錯性。必須針對每個應(yīng)用程序仔細考慮能源節(jié)省和輸出精度之間的權(quán)衡。( [/ D3 ^8 } I2 R0 v3 w& v" j/ X' q9 M
[/ol]
3 y0 o5 W% u0 l) k2 z& `未來研究方向可能包括:探索更先進的多級信號技術(shù)開發(fā)自動化工具以確定最佳近似設(shè)置研究LORAX對其他類型PNoC架構(gòu)的適用性擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似
: c% E, @/ m, N4 t) x o[/ol]" v+ m" H7 }. G8 Z4 v
通過利用像LORAX這樣的近似技術(shù),設(shè)計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。
# _" j6 n! q* C2 m/ e+ a/ d6 b. F
J( m; E: ^& T參考文獻
9 U( y: g2 E- \4 D[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.7 N1 `5 m0 o/ r- Q, G; Y& T" H
( x# W" w7 X& }1 a! r- END -
# m/ T p7 X9 F& P) [" k* V" m0 X7 H2 P- A& @' Q2 g
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
0 Q' B# q: ~" I# F0 g點擊左下角"閱讀原文"馬上申請
3 Q y; b5 v3 g- A2 e8 V) z: g5 W1 {9 C" h( a( C5 h$ ]: g1 a! s1 U6 d
歡迎轉(zhuǎn)載4 _8 p; M4 t; L+ W0 I$ U+ O
' M' R, J2 n# v2 _
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
8 s$ n. Z5 |3 h$ ~% l
U' a! Y( R9 l" d1 \" {+ c% k- |3 ~9 ]! [5 A& T
# U) u& z+ F- z% F, t
yrzy5ssllfe64034876302.gif (16.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊
yrzy5ssllfe64034876302.gif
2024-9-22 01:17 上傳
: x4 z" d c8 N" B
( W) o3 c/ K+ U" S1 o1 x" @9 N關(guān)注我們
7 r7 U# ], M2 j
% Q. |9 ~' ]' s8 Z2 ^
6 L- h8 c; d2 k3 H
gpnpcxalkom64034876402.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
gpnpcxalkom64034876402.png
2024-9-22 01:17 上傳
/ R" N+ v' ]4 t' W9 p2 G |
/ q7 N: [7 E, v ?$ ]' M
s4flhcb3paa64034876502.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
s4flhcb3paa64034876502.png
2024-9-22 01:17 上傳
0 P: O6 c- {" C& f" s. c- Z+ e9 a | 1 C6 E) X3 V$ F8 C) y( W
wocwyzpxlrr64034876602.png (21.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wocwyzpxlrr64034876602.png
2024-9-22 01:17 上傳
5 ~0 V) L: a5 G' B |
# V# a; ~5 u7 {
' |/ w0 b5 B3 `; Q/ e( a
. I! f) L! M. C5 A0 x6 c! C9 j+ z0 ? Y2 m2 u( q# O: o& P
; t: g6 D# H( _/ `$ y$ U' e3 Z. x I& {$ R1 P1 Z. f. d
+ I/ x+ U8 M& v- i; ?關(guān)于我們:0 S; x$ C' `5 s
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
$ w" v0 K0 o4 ~: J
3 n# t+ h. b' P+ Z7 N2 Uhttp://www.latitudeda.com/
5 B) [$ l2 o( z! P1 m; J% M7 \, M(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|