|
引言
& @/ p: r' b: R% N7 J' y隨著現(xiàn)代計(jì)算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯(cuò)處理變得越來越具有挑戰(zhàn)性。近似計(jì)算作為有前途的解決方案應(yīng)運(yùn)而生,通過犧牲一些計(jì)算精度來換取更高的能源效率。本文探討了如何將近似計(jì)算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時(shí)保持特定應(yīng)用的可接受輸出質(zhì)量。4 ?" s' |: i, v* F
' A$ e/ ]* k5 V7 q9 w7 K M背景& }; L6 m& m0 N- f$ @5 E6 j$ q1 u
PNoCs利用在片上波導(dǎo)中傳播的光信號,實(shí)現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標(biāo)端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。* H0 [* S1 ~8 V4 E1 m, Y
" ] G9 w! s- ~% H6 N2 M- A3 \
浮點(diǎn)數(shù)據(jù)表示遵循IEEE-754標(biāo)準(zhǔn),由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計(jì)算更具韌性。) z3 j% V$ z# D! O* X
7 p: m& Z) B4 \9 c" _- }
qrh0mmugeky64034875601.png (62.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
qrh0mmugeky64034875601.png
2024-9-24 01:03 上傳
- `- d: {8 {( b# i& I% P圖1:IEEE 754浮點(diǎn)數(shù)表示格式6 ^& c( u/ n' ]2 ]8 G' f
9 V& X- m3 j0 A/ Y Y5 kLORAX框架
8 |" c' V4 b' r本文重點(diǎn)介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點(diǎn)數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。
1 i+ u, w( o5 d! g& O2 i0 B, r
5 B4 U( s0 G4 Y/ ALORAX的核心思想包括:基于信號傳播距離的自適應(yīng)激光功率管理應(yīng)用特定的近似級別調(diào)整集成多級信號技術(shù)- ^9 c8 |6 O. x) S3 r1 m# T, Z! m9 J: B
[/ol]4 a! t0 B, ^) p
損耗感知激光功率管理
$ A+ x0 i* T) L9 K" V. z% gLORAX采用損耗感知方法在運(yùn)行時(shí)調(diào)整激光功率。對于波導(dǎo)上的每次通信,根據(jù)源端和目標(biāo)端之間的距離計(jì)算信號遭受的損耗。
" X6 u6 O% @3 _3 r. t1 y( |: `% y
; F y7 h% Y+ O8 D這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準(zhǔn)確恢復(fù)信號是否應(yīng)該被截?cái)嘁怨?jié)省能源
- O8 e& w# h" D9 R4 a# L# A[/ol]- z3 r, b2 O2 l; }
( O9 G" G) x& T
0dfhs3ealaf64034875701.png (304.94 KB, 下載次數(shù): 0)
下載附件
保存到相冊
0dfhs3ealaf64034875701.png
2024-9-24 01:03 上傳
; O# B. t. I! v: w圖2:提出的LORAX框架概述
x) f4 q* U& x3 y4 R! K
) |+ R. Y$ K1 h) P1 `8 h' e該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強(qiáng)度級別傳遞給驅(qū)動器。
, D1 u# I$ c; d+ E0 D9 d4 s( f$ V
LORAX要求每個(gè)源節(jié)點(diǎn)知道:
% D3 N$ _) n# w$ \何時(shí)在截?cái)嗪徒档图す夤β手g切換數(shù)據(jù)包是否包含可近似數(shù)據(jù)
5 p* x' y0 [3 Q; H: Y
! E' E P0 ^! Y% H8 Q這通過以下方式實(shí)現(xiàn):, b% Y' ?2 p" n/ u- k
源代碼注釋生成可近似數(shù)據(jù)的標(biāo)志每個(gè)GWI中的查找表,包含到目標(biāo)的損耗值
# x- v Z3 A6 P& Z6 w# t1 w# k. Y
( U- W- e& Q2 E( ]$ X' p2 V集成多級信號技術(shù)
/ ~' U5 B4 w8 R2 v# n2 }LORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個(gè)信號級別彼此接近,因此更容易出現(xiàn)比特錯(cuò)誤。
) z( B8 l4 U( l5 u
" K, V- B# X: R9 k0 ?' Z+ |
i1jx2pdw5yh64034875802.png (160.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
i1jx2pdw5yh64034875802.png
2024-9-24 01:03 上傳
; \: q) w% }8 L5 W; r圖3:LSB信號:(a)截?cái)啵╞)降低激光功率3 q8 e* W# U1 N6 u" c5 Q' I
- G2 j8 z0 P6 v9 g& x j* H實(shí)驗(yàn)設(shè)置和結(jié)果
. B8 B, l. S' E4 `1 [+ r3 JLORAX框架在具有64個(gè)核心的Clos PNoC架構(gòu)上進(jìn)行了評估。模擬使用gem5進(jìn)行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進(jìn)行模擬。
) g6 Z i2 \2 G5 p l- m1 g3 h' f+ D
2p25aaae00v64034875902.png (235.47 KB, 下載次數(shù): 0)
下載附件
保存到相冊
2p25aaae00v64034875902.png
2024-9-24 01:03 上傳
. j1 J4 @' t7 t( T5 v: H& R圖4:具有64個(gè)核心的8路3階段Clos架構(gòu)
9 S& f& ]7 R: C/ M/ }2 d- [2 l$ d' k: _" E5 n, {7 A, a
應(yīng)用特定近似敏感性分析1 b- F% V7 ^; B
對各種應(yīng)用程序進(jìn)行了全面研究,分析了浮點(diǎn)數(shù)據(jù)近似對其敏感性。' L/ b0 {+ w' e5 D% ^
8 [. T* N) b5 l4 c9 x# @0 e3 s" \
這涉及變化:近似的最低有效位(LSBs)數(shù)量LSB信號的激光功率降低程度
: e( K) I; E: r L& w0 G" U! M& y: t[/ol]
0 m; h" S3 L) p# P5 g- ]* V7 F/ K! ]
d2qqlugmsls64034876002.png (545.54 KB, 下載次數(shù): 0)
下載附件
保存到相冊
d2qqlugmsls64034876002.png
2024-9-24 01:03 上傳
' _6 P0 c- w" n6 V' g: ~/ s7 B+ o圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準(zhǔn)測試在大輸入工作負(fù)載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)- o3 k% c: W7 C6 b) s
/ [$ Z9 U- A/ J) B! P& O! C
這項(xiàng)分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強(qiáng)度控制設(shè)置。表1總結(jié)了每個(gè)應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。 b% Z2 B6 e9 C, l; e/ X
6 N3 G& _& W9 j3 J4 P
ogjfv3j511z64034876102.png (130.27 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ogjfv3j511z64034876102.png
2024-9-24 01:03 上傳
: d1 c. k$ ~5 _) W6 {% {表1
1 x0 h3 d' ?* r* q4 [- \& Z, p; ^* d# W6 y
比較結(jié)果# C2 M- l/ V" u
LORAX框架與以下方法進(jìn)行了比較:
) w% S w( v$ g1. 無近似的基準(zhǔn)Clos PNoC
?% C; _& C" V* B. o' _' _2. 文獻(xiàn)中現(xiàn)有的近似框架
9 w& t& h2 I4 ^9 O3. 靜態(tài)截?cái)喾椒?br />
* W7 }* m x4 s7 _4 {" g7 ?8 p& s! V7 Q5 C% O) N
評估了LORAX的兩種變體:
7 E0 {+ Z* ^7 z3 k8 _1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制
7 N7 _ z3 }5 |$ q9 Z) {- u2. LORAX-PAM4:使用4級脈沖幅度調(diào)制: n; A5 A+ a! B) i" p
" G& ?, t. a K; j( F: |# Q8 l& r
1tubhacbjrg64034876202.png (146.3 KB, 下載次數(shù): 0)
下載附件
保存到相冊
1tubhacbjrg64034876202.png
2024-9-24 01:03 上傳
& U: ]" M6 z+ t& R
圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較
6 \, l! T& b! X+ d' t# B* r
) o2 A h+ {" E+ L- T$ b$ |( n' @主要發(fā)現(xiàn):; ]2 y: [: q B: D! G! ~. ?+ W" j
1. 能量每比特(EPB)降低:
: b# z6 M7 I% H8 B. QLORAX-PAM4:比基準(zhǔn)Clos低13.01%LORAX-OOK:比基準(zhǔn)Clos低2.5%* @! a/ P* r( L Q9 n! V8 e* e
- {6 u- }& ~0 u/ \
2. 激光功率降低:
( v; e, \9 W2 R5 {, o. ^" ]LORAX-PAM4:比基準(zhǔn)Clos低34.17%LORAX-OOK:比基準(zhǔn)Clos低12.2%
% R, v7 g7 ^: F# P! P! v0 @. R; o- \6 n! T9 J+ P
3. 最佳情況(Blackscholes和FFT應(yīng)用):
/ f' k0 ?' ^6 L) bLORAX-PAM4:激光功率比基準(zhǔn)Clos低達(dá)39.7%
/ p8 y- u6 V) Z k
* ^" k, S0 p% P% G2 G7 }4 u結(jié)論, Q3 V# H1 r$ g: Z5 G* q4 q
LORAX框架展示了通過智能近似浮點(diǎn)數(shù)據(jù)傳輸在PNoCs中實(shí)現(xiàn)顯著能源和激光功率節(jié)省的潛力。
, K" I. G: B3 H7 F- Q
0 ?2 C8 c) I5 Y主要要點(diǎn)包括:損耗感知激光功率管理允許基于信號傳播距離進(jìn)行自適應(yīng)近似。應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。集成多級信號技術(shù)(如PAM4)可進(jìn)一步提高能源效率,盡管增加了復(fù)雜性和易出錯(cuò)性。必須針對每個(gè)應(yīng)用程序仔細(xì)考慮能源節(jié)省和輸出精度之間的權(quán)衡。
: p- U' J, I/ Z# H2 Z& G. y[/ol]
5 y% L/ d" u4 f0 i未來研究方向可能包括:探索更先進(jìn)的多級信號技術(shù)開發(fā)自動化工具以確定最佳近似設(shè)置研究LORAX對其他類型PNoC架構(gòu)的適用性擴(kuò)展框架以支持浮點(diǎn)數(shù)據(jù)以外其他數(shù)據(jù)類型的近似1 U. A- \2 ]( F7 x" v
[/ol]
" i+ N/ h: O9 V9 ~ K7 {通過利用像LORAX這樣的近似技術(shù),設(shè)計(jì)者可能克服未來高性能計(jì)算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。$ N) {) V( x+ Y1 `7 K; t
( l+ B9 S0 w- j
參考文獻(xiàn)5 |: y, [! A, y4 n9 }: u
[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.7 \- v- F- _/ R6 N, `
e3 P7 }, ^; K9 v
- END -0 ~+ i: }2 F, `) J8 f/ k
7 O, ~) k/ G! ^/ n% @% ]. R軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
! y/ A7 H/ s( K點(diǎn)擊左下角"閱讀原文"馬上申請
) _* ^4 b# |' a; x1 ~" n0 X% d( L) L4 }
1 o7 I7 {$ e: S" S6 F* O歡迎轉(zhuǎn)載! l$ T- c' b" c' ~* @ C8 D7 F
; _' m" k p. W轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!' X" e- R6 w, _
. h* Y2 j" V8 D1 d
# w% i( T/ k0 @4 ]1 f& a( V' ]1 Y
yrzy5ssllfe64034876302.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yrzy5ssllfe64034876302.gif
2024-9-24 01:03 上傳
7 _, _ i- O! [0 }; L
5 A* l7 m; ^/ h: w* O" r9 h關(guān)注我們
3 G3 f' V, j3 A9 @
; ?6 x% S: ~! a6 I: w6 a7 x4 a
3 \# T1 Q+ Y2 X2 M0 J, [; u- [1 C
gpnpcxalkom64034876402.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
gpnpcxalkom64034876402.png
2024-9-24 01:03 上傳
8 I8 j9 z1 m, Z7 Q" }( f |
6 l# M6 r0 m4 J0 S( ~, w( F
s4flhcb3paa64034876502.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
s4flhcb3paa64034876502.png
2024-9-24 01:03 上傳
/ x& F) |% Y+ U0 w5 X |
0 T8 ^+ ]6 X9 C" m' u* F) j0 L
wocwyzpxlrr64034876602.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
wocwyzpxlrr64034876602.png
2024-9-24 01:03 上傳
9 D/ x1 W! b# f5 g: B6 `9 I5 h |
5 G# F; }4 L3 N! J; d+ F- z+ x9 m
9 O1 v7 B9 o, S6 f5 }6 x- c. H! _7 `! m5 v1 u$ T l/ S5 _ w
3 a5 L H7 l6 A p7 z( @
; |2 F0 z- s6 n. L, i' }
0 Q1 {/ @0 F# f( p# t' n
9 V. l0 r; e& \0 y關(guān)于我們:
Q* w3 {7 t4 U7 h深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
0 v& c6 K6 A# T8 s- R6 d4 B
) k2 {' A$ X" F' u" q# D* hhttp://www.latitudeda.com/ z9 d( j2 @; N
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|