|
引言
0 Z% }( @ @, L2 W隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應(yīng)運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時保持特定應(yīng)用的可接受輸出質(zhì)量。/ `* r8 q' W" d
$ i1 J" A, n$ C$ m4 ~- Q: _. i+ S2 h0 i
背景/ \% g/ ]) J# J8 T
PNoCs利用在片上波導(dǎo)中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標(biāo)端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。
5 \! v# w9 p4 T' v C# M5 o/ s& {
浮點數(shù)據(jù)表示遵循IEEE-754標(biāo)準(zhǔn),由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。
" o F6 o P: R- d! Y! P+ r# S8 Y$ Y% U7 U2 [
nmfghqhmlwy64021061805.png (62.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
nmfghqhmlwy64021061805.png
2024-9-19 13:40 上傳
+ s$ \6 e' `' B; t& \4 F. ]3 R圖1:IEEE 754浮點數(shù)表示格式# F1 l8 j8 d+ T8 v5 f' z
8 x6 O' I x) U7 a% XLORAX框架% M( n/ m+ i0 |) B8 [
本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。
& [6 o) O K3 t- @0 y' R% V$ d
7 B. g: b: K5 h5 M, A9 |; Q5 zLORAX的核心思想包括:基于信號傳播距離的自適應(yīng)激光功率管理應(yīng)用特定的近似級別調(diào)整集成多級信號技術(shù)& d3 |& m/ f# F3 D0 z- j+ g
[/ol]
' r5 z0 J9 R% i2 x& V' j6 y; k: n9 ^* _損耗感知激光功率管理% S7 _5 V8 y/ X: v4 [$ ^; I% y
LORAX采用損耗感知方法在運行時調(diào)整激光功率。對于波導(dǎo)上的每次通信,根據(jù)源端和目標(biāo)端之間的距離計算信號遭受的損耗。
9 S, h: z% Z7 s' ]; O J# u, V9 Q
這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準(zhǔn)確恢復(fù)信號是否應(yīng)該被截斷以節(jié)省能源3 a3 `' |3 _4 W C9 d0 G: C& L
[/ol]
2 @7 d4 W( d( }$ v
! K4 f8 K: c& C* y" O
lpqqw54vfjt64021061905.png (304.94 KB, 下載次數(shù): 0)
下載附件
保存到相冊
lpqqw54vfjt64021061905.png
2024-9-19 13:40 上傳
, Y0 ?) U: N Y; s% z
圖2:提出的LORAX框架概述4 S4 i. ]* D: c/ H: A+ i
4 z" d4 b5 A0 l3 v' s該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅(qū)動器。
$ _% V$ H6 ^+ {! ]5 k5 z+ X; h4 i ]% F
LORAX要求每個源節(jié)點知道:
3 S2 }6 o/ c5 M/ ?1 Q% B+ h1 L何時在截斷和降低激光功率之間切換數(shù)據(jù)包是否包含可近似數(shù)據(jù); { }: r- A+ {5 S4 k! u# u
& L; W) _5 }2 q% w
這通過以下方式實現(xiàn):
9 U6 }5 I% r) P U& B* u源代碼注釋生成可近似數(shù)據(jù)的標(biāo)志每個GWI中的查找表,包含到目標(biāo)的損耗值
' o N1 R7 T" t5 B1 C) N: l: v
. a Z- \# ~$ ?$ C. Y& V2 G E集成多級信號技術(shù)
: {% q; y0 b1 N8 j* B* \ r. _- ^LORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。
6 e6 |+ C% M8 p9 [1 J: Z
7 s' ~# k! Y9 I9 y
osplvrulk5p64021062005.png (160.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
osplvrulk5p64021062005.png
2024-9-19 13:40 上傳
- T8 n3 v9 x9 v
圖3:LSB信號:(a)截斷,(b)降低激光功率& g3 z: D) \7 F/ ?# V
! h, x" O' H% `9 {; Y" w: x a實驗設(shè)置和結(jié)果% a6 n- m7 c# }( V: ]& g1 i
LORAX框架在具有64個核心的Clos PNoC架構(gòu)上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。 E* \, L% d+ H6 m, m
& Y1 |8 S' g: m l6 V
e1jmy3zysun64021062105.png (235.47 KB, 下載次數(shù): 0)
下載附件
保存到相冊
e1jmy3zysun64021062105.png
2024-9-19 13:40 上傳
# m# N$ n. ]1 H- _圖4:具有64個核心的8路3階段Clos架構(gòu)
" \0 X3 v$ k; _ \+ }* j6 n
" ^5 I5 Z$ Y7 ^& z) ]/ Z應(yīng)用特定近似敏感性分析1 j; v2 I0 j/ `. h( W+ @
對各種應(yīng)用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。5 x, o: p5 @& O& A9 H
3 S; K) C# b/ S. }3 x' i$ K4 |+ ?# g
這涉及變化:近似的最低有效位(LSBs)數(shù)量LSB信號的激光功率降低程度8 y: R& I$ ]; @, Q5 P) I. D
[/ol]
9 Q2 D0 P, i0 k' P) K2 h6 N. ~5 g/ J6 g4 Y- k
e1hyf5zkdkj64021062205.png (545.54 KB, 下載次數(shù): 0)
下載附件
保存到相冊
e1hyf5zkdkj64021062205.png
2024-9-19 13:40 上傳
2 p0 \3 F1 k5 v" S8 o l8 h7 M: L& h圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準(zhǔn)測試在大輸入工作負(fù)載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)# L2 ?/ Y& |* O2 t7 P
$ o5 i! J2 ?( n這項分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強度控制設(shè)置。表1總結(jié)了每個應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。
/ m5 c/ D3 p# N
# C2 y# j# K$ x3 F# e @% W M( Q' [
5ysgrvvjjlt64021062305.png (130.27 KB, 下載次數(shù): 0)
下載附件
保存到相冊
5ysgrvvjjlt64021062305.png
2024-9-19 13:40 上傳
9 z2 R. |6 H; h1 p: B表1
8 e6 K7 d) N& h! o$ M& ^4 ^+ `1 c! o* k. B2 I+ w- B( p
比較結(jié)果
$ V. {! S# d% i' l- P" xLORAX框架與以下方法進行了比較:- U! C$ s/ `8 c% S6 [
1. 無近似的基準(zhǔn)Clos PNoC
/ b8 q6 ?! P3 \' k& u2. 文獻中現(xiàn)有的近似框架/ F4 T6 x" b5 [. Q# M
3. 靜態(tài)截斷方法2 C+ l- i+ b8 A
) ^1 z3 y! K" q) C0 h! S評估了LORAX的兩種變體:8 D& R7 S9 ? a% F5 Q
1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制
/ a% v8 O3 ~7 H+ d! F2. LORAX-PAM4:使用4級脈沖幅度調(diào)制4 S& k* a! o) f3 Z- T
- D' P& [; \1 n. J
cidknpd4swp64021062406.png (146.3 KB, 下載次數(shù): 0)
下載附件
保存到相冊
cidknpd4swp64021062406.png
2024-9-19 13:40 上傳
. g: w4 z1 {( P& P' e6 @1 \
圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較
* {' [3 N& U% F: ?4 u {
6 h! e% Q: Z% f3 H主要發(fā)現(xiàn):. [4 a+ F; B5 n
1. 能量每比特(EPB)降低:
0 b8 z4 H# ?7 f4 R& I+ m# A9 uLORAX-PAM4:比基準(zhǔn)Clos低13.01%LORAX-OOK:比基準(zhǔn)Clos低2.5%
9 _3 @ @" a# i" L0 K! x8 e8 p. N+ X9 B2 Z7 S
2. 激光功率降低:+ O6 u8 T" w9 P3 L, M8 H# N
LORAX-PAM4:比基準(zhǔn)Clos低34.17%LORAX-OOK:比基準(zhǔn)Clos低12.2%) y$ x" j \+ F0 _
5 r; R6 a: V% M- d3. 最佳情況(Blackscholes和FFT應(yīng)用):
- y5 s; W5 b! l* T5 F- kLORAX-PAM4:激光功率比基準(zhǔn)Clos低達39.7%+ D/ R* t- D. x. S6 m: n
; z7 @5 s+ k# A$ J: l
結(jié)論
2 r6 b7 l. z D B8 rLORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。
' j2 J1 R" X& }8 a z3 _& g, \! d$ }. Z; Y5 k
主要要點包括:損耗感知激光功率管理允許基于信號傳播距離進行自適應(yīng)近似。應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。集成多級信號技術(shù)(如PAM4)可進一步提高能源效率,盡管增加了復(fù)雜性和易出錯性。必須針對每個應(yīng)用程序仔細考慮能源節(jié)省和輸出精度之間的權(quán)衡。& j( N. ]/ K, F9 h6 R
[/ol]! q3 s( \& f" ] j- S1 L
未來研究方向可能包括:探索更先進的多級信號技術(shù)開發(fā)自動化工具以確定最佳近似設(shè)置研究LORAX對其他類型PNoC架構(gòu)的適用性擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似
& P A1 [5 Y6 s3 t! e& N[/ol]
( A& e: p+ C. ~3 C0 R" h通過利用像LORAX這樣的近似技術(shù),設(shè)計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。
" G- ?1 G7 s, ]; t+ \, |7 g
, m b7 I6 c, j, _( x3 s參考文獻
; {7 c( [* [+ \$ A[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
' \ G0 _ Q, e( H: \
# z5 J4 y8 o5 _; j" q& ~3 k2 H, N/ M- END -
7 u: p! ]& @0 s) w- R. k1 C7 W9 E2 n- R/ M7 }" e+ W
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
2 J: r8 I, N# f) e點擊左下角"閱讀原文"馬上申請
3 ?1 s# @' }9 k' J" Q4 M3 p: I$ W5 i. q1 J. \ @, y; W
歡迎轉(zhuǎn)載# C9 ]' M5 y8 L9 ~9 M
% n' Z/ \/ O+ l轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!& U/ F8 Y$ l2 O3 t7 v0 G$ u
, [; d9 l8 w1 {( l. S: j
# l0 v3 }& C- M7 u$ k
3 g9 L" x+ |& ^: M' b. l
eybbva1cwqa64021062506.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
eybbva1cwqa64021062506.gif
2024-9-19 13:40 上傳
2 H6 E0 E j' g
* }5 E* J* G+ A3 T5 Z
關(guān)注我們9 `: A! ]* k. c) X8 \' h
4 \* s, D8 r! y! K+ O" h; U0 I1 @! C
0n4bgxpjtze64021062606.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
0n4bgxpjtze64021062606.png
2024-9-19 13:40 上傳
/ y& r) S, l! m1 Q- v3 @$ C |
7 m/ ~0 m2 A5 w. m# m
acvhsbft1id64021062706.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
acvhsbft1id64021062706.png
2024-9-19 13:40 上傳
" |$ m- w4 ~/ X- k: k( ?
|
2 N; k; H% I( D' V! W
nrtnogwtg2j64021062806.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
nrtnogwtg2j64021062806.png
2024-9-19 13:40 上傳
/ g, G, S8 |, n
| " o/ Q0 P) O6 C
9 P/ w3 f( U1 d) h/ V
, h& T9 H C" [/ i7 D8 n9 s" ~. y1 G2 f) o6 M9 T( W# r
( J) m1 v8 E4 j& c" V; ^6 j9 f: ^* m/ c
" f y: I- D% N2 t9 S# v: e. Q/ O
關(guān)于我們:
W# h% c9 n! J) L' S3 f深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
4 o6 d: }$ j6 L7 U! h' \' R. f4 }: u4 S, G {1 E2 X" C1 W, e
http://www.latitudeda.com/7 U- {% B' Z. i. i" \
(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|