|
引言
) a8 B9 B$ `$ v% V隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應(yīng)運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時保持特定應(yīng)用的可接受輸出質(zhì)量。
8 G/ X& ]$ W5 f& {4 h0 B% S% w, u% m* f* l: q1 t4 `! f
背景
, G8 Y: r. K3 p- G# _PNoCs利用在片上波導(dǎo)中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標(biāo)端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。
% T% g5 }# z2 |9 E1 E5 N) X0 I
" q# S$ A* _( [+ M+ Q V浮點數(shù)據(jù)表示遵循IEEE-754標(biāo)準(zhǔn),由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。/ d8 x! Z' Z+ l5 [$ o7 ^
# X# c- _3 a: g$ [" O \
j4oumsbdnvz64024510325.png (62.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
j4oumsbdnvz64024510325.png
2024-9-20 01:31 上傳
5 |' u; b' o2 j9 f% G
圖1:IEEE 754浮點數(shù)表示格式
* _; } h" U" R
: S* a/ c+ b# ]7 u+ R# O; rLORAX框架
) ]* v9 K7 { @6 X R% O, H' W本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。: d# P2 d2 E8 s: s" q+ ^
8 B) \0 G+ h& j; `LORAX的核心思想包括:基于信號傳播距離的自適應(yīng)激光功率管理應(yīng)用特定的近似級別調(diào)整集成多級信號技術(shù) F% l7 }, `4 b2 f$ ]
[/ol]: O! K9 p9 Q5 R
損耗感知激光功率管理
, y7 ?% S; |+ Q8 t& WLORAX采用損耗感知方法在運行時調(diào)整激光功率。對于波導(dǎo)上的每次通信,根據(jù)源端和目標(biāo)端之間的距離計算信號遭受的損耗。
7 r/ _. s6 N8 E; \9 Y- p7 X9 B- _( n7 ^
這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準(zhǔn)確恢復(fù)信號是否應(yīng)該被截斷以節(jié)省能源( m7 [( ]+ M3 ?; ]' I* O
[/ol]
5 G* Y$ l7 V) Y" f) b+ u( V. E9 Z* `, ~+ F* f, q
pwxfzv5wexn64024510425.png (304.94 KB, 下載次數(shù): 2)
下載附件
保存到相冊
pwxfzv5wexn64024510425.png
2024-9-20 01:31 上傳
' ^. Z0 E+ E/ L# I
圖2:提出的LORAX框架概述
* h5 [ T" E1 W# M( }
6 o: g. ^9 S+ Z* V5 j該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅(qū)動器。: s" ]1 B5 D4 v; U
7 Y/ g& d) E, uLORAX要求每個源節(jié)點知道:
& J: A4 M9 y6 f% H何時在截斷和降低激光功率之間切換數(shù)據(jù)包是否包含可近似數(shù)據(jù)
4 a* ?* a5 m' @- w- [5 y" B! Y& I' t+ z7 C5 g$ A) p
這通過以下方式實現(xiàn):
9 g3 v+ N1 S) D6 U4 L6 h( e源代碼注釋生成可近似數(shù)據(jù)的標(biāo)志每個GWI中的查找表,包含到目標(biāo)的損耗值
+ S. k9 @4 h' W7 M1 z1 X, W
, T0 t! H+ R& A# Y8 H6 ~* g# [集成多級信號技術(shù)$ P' X) | o( u; p
LORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。
) L. j( {( I( ?4 F7 n. H! V& S; l3 C! [8 P
p2ezeawbols64024510526.png (160.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊
p2ezeawbols64024510526.png
2024-9-20 01:31 上傳
! K" u/ M0 P' _圖3:LSB信號:(a)截斷,(b)降低激光功率7 h& \& ]# M7 e5 ?. [' C) i, X
6 f4 r! m I; A$ R* ^/ N
實驗設(shè)置和結(jié)果4 `& l: @# B. x8 N4 r9 }" Z9 u
LORAX框架在具有64個核心的Clos PNoC架構(gòu)上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。8 T7 G% X! S& G) ~2 m
3 B# ?2 l0 N8 P9 t7 m/ G3 O" ^3 }
5rgys10ephz64024510626.png (235.47 KB, 下載次數(shù): 2)
下載附件
保存到相冊
5rgys10ephz64024510626.png
2024-9-20 01:31 上傳
2 y8 p7 \; j) p- ~& ?1 a* b圖4:具有64個核心的8路3階段Clos架構(gòu). z ?1 d3 L, ^4 b
& l {$ B: J' v/ N) B ?9 S2 _& A
應(yīng)用特定近似敏感性分析# q$ E" x& ]: M! b% Q
對各種應(yīng)用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。
1 R4 Q3 r: i! f: I, ?. X1 {0 p5 ^! @
這涉及變化:近似的最低有效位(LSBs)數(shù)量LSB信號的激光功率降低程度. j. M" i ^" B) \0 X# g
[/ol]
( O1 b9 v2 N G2 }9 b
- j' Q6 C/ L) r6 k6 e
lsxbaccaffd64024510726.png (545.54 KB, 下載次數(shù): 0)
下載附件
保存到相冊
lsxbaccaffd64024510726.png
2024-9-20 01:31 上傳
" | m6 u9 a6 \! G/ T" F0 n
圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準(zhǔn)測試在大輸入工作負載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)3 k2 z1 y8 j5 Q! ]' D
* A2 [8 q) ~# j這項分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強度控制設(shè)置。表1總結(jié)了每個應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。( O; s8 c. Z" K' q' o1 F
! h9 x0 _+ c# @/ z5 T, T" A
3ocssa21n3v64024510826.png (130.27 KB, 下載次數(shù): 2)
下載附件
保存到相冊
3ocssa21n3v64024510826.png
2024-9-20 01:31 上傳
8 N" r) m9 A) J( O7 P% S$ s4 u1 s L
表1( Z& i# q% N2 e/ `" U e
8 V+ o, A5 k) G8 x6 _5 l( A$ W. }比較結(jié)果
- M9 S0 `! f" WLORAX框架與以下方法進行了比較:; J8 F/ I3 A; V
1. 無近似的基準(zhǔn)Clos PNoC6 R3 R9 j3 T1 S
2. 文獻中現(xiàn)有的近似框架$ k" [7 ?9 ~0 L1 ^# J8 H7 f
3. 靜態(tài)截斷方法
* m, s4 b. O. B2 @1 C- }# n/ E* s9 n& o5 W" W7 Q$ h# a' Z% D
評估了LORAX的兩種變體:
$ m# |2 j5 r+ F8 C/ @$ d/ O+ g1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制# s4 L! _) r4 R( y' E, I
2. LORAX-PAM4:使用4級脈沖幅度調(diào)制3 [: S1 ^$ g$ y4 I/ f9 g8 |1 T [
! |/ a9 {, D) u: A9 A
pq5yvtfxktj64024510927.png (146.3 KB, 下載次數(shù): 2)
下載附件
保存到相冊
pq5yvtfxktj64024510927.png
2024-9-20 01:31 上傳
. _9 N* Q) o) ?2 k& {
圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較0 u3 N- r0 ^0 S% j
/ p0 z; R4 `, Z7 u主要發(fā)現(xiàn):
* G3 ^* U! y" v& X1. 能量每比特(EPB)降低:
7 U0 S% y4 Q8 ^4 ^6 NLORAX-PAM4:比基準(zhǔn)Clos低13.01%LORAX-OOK:比基準(zhǔn)Clos低2.5%3 K! u9 \- R; S6 X8 r7 v+ w9 G! \
6 O- V6 j& N$ X; |
2. 激光功率降低:
' n; d( e, Z& R) ]3 X1 S7 h2 D# h! }LORAX-PAM4:比基準(zhǔn)Clos低34.17%LORAX-OOK:比基準(zhǔn)Clos低12.2%9 a6 L6 `; U; F7 }% g
! w3 H: f5 O/ J" g. x' Y
3. 最佳情況(Blackscholes和FFT應(yīng)用):
0 k3 w8 ?+ T+ S' T! N: [) wLORAX-PAM4:激光功率比基準(zhǔn)Clos低達39.7%
; Q% P# ~$ R" Z# Z; O1 L5 c
- Z/ c- U2 D1 {結(jié)論& e* V3 v! F0 b5 q" ~
LORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。
7 P5 W+ g0 N U5 K
* s7 c( k `# D' f$ M8 W2 o主要要點包括:損耗感知激光功率管理允許基于信號傳播距離進行自適應(yīng)近似。應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。集成多級信號技術(shù)(如PAM4)可進一步提高能源效率,盡管增加了復(fù)雜性和易出錯性。必須針對每個應(yīng)用程序仔細考慮能源節(jié)省和輸出精度之間的權(quán)衡。: e2 W1 Z. @, w' I
[/ol]5 n/ b$ {. S/ n2 ]8 Y% h
未來研究方向可能包括:探索更先進的多級信號技術(shù)開發(fā)自動化工具以確定最佳近似設(shè)置研究LORAX對其他類型PNoC架構(gòu)的適用性擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似% H5 c* D% M6 s4 c2 J j2 E( I
[/ol], k3 |) Q3 f; X0 {
通過利用像LORAX這樣的近似技術(shù),設(shè)計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。0 |: _$ B7 Z i
# C9 F1 d# f3 d
參考文獻
3 ?( f5 Z9 q% M& \$ I b! [[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
/ o5 A# H4 }- a) C9 x- n9 t. x) y: W/ V
- END -
4 s, J7 s, J/ z& Z5 e" F7 Q
/ |! E: k1 _& Y; t1 w; y軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
4 |. e) E, Q b' i8 J# T( [點擊左下角"閱讀原文"馬上申請8 i9 ?1 J2 }. y& J" x8 ^: i
: L) u9 G( d8 E; O3 F歡迎轉(zhuǎn)載
* D, k5 p+ x- Q/ B: Z! q2 w0 d$ C5 W: _9 [+ H
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
( M& S+ a# }! k# p- M& |0 l7 j. }. h+ R7 w5 _
$ [% J5 ?' [1 F" K( k; T: n l5 D+ k* s4 X; F( _9 L3 R
gdq2dhuiqqb64024511027.gif (16.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊
gdq2dhuiqqb64024511027.gif
2024-9-20 01:31 上傳
' H! H! ]; _6 N) `( o( m- H
* o! |" X8 f' M9 I
關(guān)注我們
9 q0 e* _) m0 j7 e4 h+ a
( D) t, M3 n% e0 [
) U6 l& K& B# }4 e2 W
sgommm4hhla64024511127.png (31.33 KB, 下載次數(shù): 1)
下載附件
保存到相冊
sgommm4hhla64024511127.png
2024-9-20 01:31 上傳
- }- b0 |' T, w* @- }2 D, h4 @ | % x4 }/ ^% l" A8 L" @
kixfpsu2brp64024511227.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊
kixfpsu2brp64024511227.png
2024-9-20 01:31 上傳
# d+ N5 O! L( O: _' e% n0 U
| # o9 q4 T. s8 m) Y4 ]" o
15pdiyf1ph164024511327.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
15pdiyf1ph164024511327.png
2024-9-20 01:31 上傳
/ }( i, [' `4 W0 g" g
|
& I: n) [5 A) h
3 D# A' J! g- E0 }& |9 U: p0 Z! |5 I
x0 N1 p" p& R2 L; q
; P, j N6 {% }% Y7 p4 j y+ `6 Y& T' Q
' l% b$ C2 P( y* A3 T# [關(guān)于我們:2 u' d5 [) B) d0 L
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
5 V v; S: h+ M; x$ r
; k) u" D& k% G# h7 A6 I, xhttp://www.latitudeda.com/
6 q N; F0 Q& Y( K% ^(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|