|
引言
& x& P) E. m7 F+ f3 b隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應(yīng)運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時保持特定應(yīng)用的可接受輸出質(zhì)量。& h6 j, s- d: j$ R
, x L M# b+ p x W+ n. u
背景4 q5 R! W# ], J
PNoCs利用在片上波導(dǎo)中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。5 u) J) j/ a, `+ b/ w
! W# q3 v& Z# z3 j k3 Q8 c浮點數(shù)據(jù)表示遵循IEEE-754標準,由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。! U' z1 _, }4 X6 `4 d- [6 Q
9 _+ f1 N6 @9 c, J. C: y
qrh0mmugeky64034875601.png (62.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
qrh0mmugeky64034875601.png
2024-9-25 01:02 上傳
0 c$ n! J+ x1 \/ l圖1:IEEE 754浮點數(shù)表示格式
) }! j# S5 r% |* K0 F# a
n- M+ i' N. r3 [LORAX框架
$ a0 y. K* J l本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。9 c G3 w8 A% C; x
) v0 g: w, N+ k& [; e" z
LORAX的核心思想包括:基于信號傳播距離的自適應(yīng)激光功率管理應(yīng)用特定的近似級別調(diào)整集成多級信號技術(shù)/ V7 n: b# `8 v+ @; d
[/ol]3 D, Z; V. O( c) E3 b2 f
損耗感知激光功率管理1 `- y/ ]' Q* y6 ? f* `% K0 s$ f
LORAX采用損耗感知方法在運行時調(diào)整激光功率。對于波導(dǎo)上的每次通信,根據(jù)源端和目標端之間的距離計算信號遭受的損耗。) T% s/ d+ i' S) D+ w& ?! }7 s
8 t2 S5 V9 [1 [/ g) y: L$ A這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準確恢復(fù)信號是否應(yīng)該被截斷以節(jié)省能源
5 m" c% ^- D7 c* J' A/ H7 ~ b[/ol]4 J. i) ~2 _2 x+ i+ ]
6 v" f, T4 A- c+ ?' T3 M6 T
0dfhs3ealaf64034875701.png (304.94 KB, 下載次數(shù): 0)
下載附件
保存到相冊
0dfhs3ealaf64034875701.png
2024-9-25 01:02 上傳
7 L5 ]& ~* h7 z# p. ~8 P t4 g圖2:提出的LORAX框架概述( N7 O/ q6 ^) e& _* J
- {' |$ e) L$ N3 x6 O
該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅(qū)動器。
) {) d, C3 ^6 U* U. G: E; G6 C
8 N% w3 ~$ y8 r, C' u% x! ZLORAX要求每個源節(jié)點知道:6 }* e# F- d) p1 w8 b- }3 K
何時在截斷和降低激光功率之間切換數(shù)據(jù)包是否包含可近似數(shù)據(jù)
% c" ? e2 [2 Q" x3 @8 V+ e& F: s2 ?2 k
這通過以下方式實現(xiàn):: C9 L+ S: F% d) D# Q2 X% T
源代碼注釋生成可近似數(shù)據(jù)的標志每個GWI中的查找表,包含到目標的損耗值
- a j* V) M4 V8 V$ x [3 F. h! \0 |0 d! k6 Y
集成多級信號技術(shù)
' g/ i" r5 {( m: `LORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。
0 ] D# o: d2 K$ [7 a) a% ~
6 g: t8 O# o( s* G r, F
i1jx2pdw5yh64034875802.png (160.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
i1jx2pdw5yh64034875802.png
2024-9-25 01:02 上傳
* A2 z/ x' Q3 i4 I7 ]7 M圖3:LSB信號:(a)截斷,(b)降低激光功率5 H0 X( H' J3 l, J( |" e
$ b$ Q) Q- K6 r" I- a: ]7 ~
實驗設(shè)置和結(jié)果
' q/ T7 ]8 J$ S5 O' qLORAX框架在具有64個核心的Clos PNoC架構(gòu)上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。" E1 `' W( U1 j$ a; V; G
2 |1 J0 {' H8 I, p! g0 @
2p25aaae00v64034875902.png (235.47 KB, 下載次數(shù): 0)
下載附件
保存到相冊
2p25aaae00v64034875902.png
2024-9-25 01:02 上傳
7 q9 d! w) H: W$ \5 W( L- M
圖4:具有64個核心的8路3階段Clos架構(gòu)
6 W9 S$ u1 v( ]' }7 k" d$ S9 n7 p: t' F
應(yīng)用特定近似敏感性分析! p8 b1 c I9 C% g$ Y
對各種應(yīng)用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。
) p- V0 M3 l- g; K# m6 D# t9 G8 U+ l( F
這涉及變化:近似的最低有效位(LSBs)數(shù)量LSB信號的激光功率降低程度
/ ]" \/ s5 Y( q1 w- S% i3 }6 R[/ol]8 z4 _4 n. v+ P2 D6 Q3 A9 } T
! s$ e5 e5 F# E4 \
d2qqlugmsls64034876002.png (545.54 KB, 下載次數(shù): 0)
下載附件
保存到相冊
d2qqlugmsls64034876002.png
2024-9-25 01:02 上傳
# ^2 s% O0 z& P: a F$ E7 ^
圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準測試在大輸入工作負載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)- d( t$ L. N+ e
# I; a( D& W1 | i3 O這項分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強度控制設(shè)置。表1總結(jié)了每個應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。. [ p7 c0 G" w$ e3 Z7 y: ?9 E
# g, b1 u! C4 I3 L; p: p$ X, R$ U
ogjfv3j511z64034876102.png (130.27 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ogjfv3j511z64034876102.png
2024-9-25 01:02 上傳
& E3 g9 L+ O, `! X' u+ \
表1
3 `% i5 @5 H- S& I5 H( s
E* F! \9 `9 \/ d1 A2 f比較結(jié)果0 b J0 d+ s' [" ~* Y" P1 J
LORAX框架與以下方法進行了比較:' l4 v! r8 m7 S; J
1. 無近似的基準Clos PNoC
" l7 C* r% G# j, F2. 文獻中現(xiàn)有的近似框架% d1 f! O x6 Y9 ]3 K" x# p: B3 \
3. 靜態(tài)截斷方法$ S' v+ v, d4 m$ U
4 K# v7 J! ^* G1 h ^
評估了LORAX的兩種變體:
% J9 y6 c7 D' @1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制1 V2 x' j y0 X3 T
2. LORAX-PAM4:使用4級脈沖幅度調(diào)制/ B! I+ p) l& g E3 r) y8 t2 i* r% ^
$ F/ @$ ~2 L0 S1 ?# g, ~
1tubhacbjrg64034876202.png (146.3 KB, 下載次數(shù): 0)
下載附件
保存到相冊
1tubhacbjrg64034876202.png
2024-9-25 01:02 上傳
) y3 c8 U1 S( U' t. P3 v1 ]; k
圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較
4 j! S) p: k" @
$ ?8 s$ ?% A+ d0 W K2 l主要發(fā)現(xiàn):
* R: `0 i8 i: ^* k i4 a, W1. 能量每比特(EPB)降低:5 d1 m+ j* K( ]4 M
LORAX-PAM4:比基準Clos低13.01%LORAX-OOK:比基準Clos低2.5%
( u& G3 d) I4 v7 Y q( A% R$ |( s7 H( L; }6 J
2. 激光功率降低:
" D) Z2 E$ V; g4 O6 f' B% a# U! sLORAX-PAM4:比基準Clos低34.17%LORAX-OOK:比基準Clos低12.2%
- p2 j" o% w' p9 H c
1 g# t2 `7 }7 P5 a# @3. 最佳情況(Blackscholes和FFT應(yīng)用):9 {# \; ^3 K1 ?& S( R. n% S% }" ~
LORAX-PAM4:激光功率比基準Clos低達39.7%
# g' t* @' C: x7 a" O; a9 f: `9 V9 h. |4 B6 x7 K) C; D5 a7 k
結(jié)論; w; _+ c+ E7 B5 c6 {7 r5 j; ~* T1 Y% d
LORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。6 ], ^4 T3 E7 [" H# J: p
0 G; T: ^/ t& e4 l; ^) k- N7 g/ ]8 z8 }主要要點包括:損耗感知激光功率管理允許基于信號傳播距離進行自適應(yīng)近似。應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。集成多級信號技術(shù)(如PAM4)可進一步提高能源效率,盡管增加了復(fù)雜性和易出錯性。必須針對每個應(yīng)用程序仔細考慮能源節(jié)省和輸出精度之間的權(quán)衡。
- ~; ]3 \3 d8 h& s/ F4 Y[/ol]
/ ]3 k0 {7 L$ J( q4 z6 n6 o1 T未來研究方向可能包括:探索更先進的多級信號技術(shù)開發(fā)自動化工具以確定最佳近似設(shè)置研究LORAX對其他類型PNoC架構(gòu)的適用性擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似- }% K: s! W# R4 W
[/ol]
- u* A' o: T9 ?1 w4 o! Y. J H1 P0 ]7 g通過利用像LORAX這樣的近似技術(shù),設(shè)計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。/ Z/ Z7 l; Z4 C( H6 u6 W' m
5 e3 ~! r$ z! T/ W# U W7 f參考文獻
% j! W( h- D7 G. `( W[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.5 B9 {: G1 F" X0 N* R, N8 P
) {4 P1 A2 Y5 ~4 X& y+ {' j- END -8 \1 m+ n# G3 }- h( c3 Z
) b+ S" u3 ~3 x% U |( D/ B" b
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
7 Y/ R' b; {' `點擊左下角"閱讀原文"馬上申請6 s/ {! L4 ?/ ]8 D9 w C
* H- U. D# ~. y# Q& W0 f: N3 \5 ?7 V
歡迎轉(zhuǎn)載- j& [# T+ Z# u
+ G1 n; P- P' d+ w& K/ J$ |轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!* A5 a4 o* \8 G$ ]
$ v/ b8 ^9 I" q0 m( L s
) N, b1 q" D0 M# Z3 Y. a8 l9 ]( ]0 k" E
yrzy5ssllfe64034876302.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yrzy5ssllfe64034876302.gif
2024-9-25 01:02 上傳
7 [( E# y7 S1 U" h
- ]& t- X9 Q0 `) {關(guān)注我們' b+ P0 Q) n9 Y/ @# r6 c1 V
* }' @- Z7 w! h9 z: h
9 f6 a# Z# ~" @& o7 d
gpnpcxalkom64034876402.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
gpnpcxalkom64034876402.png
2024-9-25 01:02 上傳
- J8 F5 K l! {0 O0 l2 {* G
|
4 K3 v0 c U$ h% _& T7 t
s4flhcb3paa64034876502.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
s4flhcb3paa64034876502.png
2024-9-25 01:02 上傳
$ z- ~. z: z+ m. l/ a3 C | ( x5 }$ u% e, O" n4 ^( H
wocwyzpxlrr64034876602.png (21.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wocwyzpxlrr64034876602.png
2024-9-25 01:02 上傳
0 C4 ]. o, x- }
| & y) W1 H8 ?) `9 Y6 W
- X6 `! F/ r2 x i
: o: R+ g2 Q3 w3 L9 E$ ?6 v( u+ {$ Z4 I! _$ {: s+ }
" x4 V8 u9 E u1 ~: x
' }) P, f2 x( W, W1 [% F) p2 D/ a; p2 Z% s/ F
關(guān)于我們:
5 D6 n& F: h2 ]- S! `! _. h$ N- D5 \深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
% A# m2 f- O0 Z% h+ L, i. ~6 D
http://www.latitudeda.com/4 y& p! Y1 l7 u/ t3 a" z9 g- q, a
(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|