|
引言
' b0 t8 K' l8 |1 R4 A5 @隨著現代計算系統中數據量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術應用于硅基光電子片上網絡(PNoCs),以降低能耗同時保持特定應用的可接受輸出質量。' ?* Q* d$ C. Q j k# |9 L
0 u! \# d# c1 \4 v
背景# m3 x( E9 K" _# Q4 r. A$ B6 y: s* {) V
PNoCs利用在片上波導中傳播的光信號,實現處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標端能夠無誤地恢復數據。這種高激光功率需求是PNoCs整體功耗的主要來源之一。+ |# n9 |0 K. W1 M+ H
4 j4 s- `8 ^1 @. i- p; z3 k浮點數據表示遵循IEEE-754標準,由三部分組成:符號位、指數位和尾數位。相比符號位和指數位,尾數位通常對近似計算更具韌性。
3 X# l7 T9 M7 K6 P+ w- c
. y( ^7 n, n' h0 j+ b6 F! S
nmfghqhmlwy64021061805.png (62.14 KB, 下載次數: 2)
下載附件
保存到相冊
nmfghqhmlwy64021061805.png
2024-9-19 13:40 上傳
3 i! B- z& o! P3 `7 a/ t( J7 q: s
圖1:IEEE 754浮點數表示格式& C6 Y* C2 S" m7 V' ]
& E7 ~( K' j$ H/ A8 Y2 r. D
LORAX框架
6 |& G; h+ o9 O+ z, S3 `9 z本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數據傳輸來降低PNoCs中的激光功耗。; \& L" a. T( w7 u/ p5 r
0 S/ G5 ]" \+ k0 {6 j5 H
LORAX的核心思想包括:基于信號傳播距離的自適應激光功率管理應用特定的近似級別調整集成多級信號技術5 t! f5 P% z! k# k
[/ol]+ J$ @2 l7 {. {/ t; n' ^
損耗感知激光功率管理: s& H% V0 ~8 G. w+ d. u( k0 ?2 Y
LORAX采用損耗感知方法在運行時調整激光功率。對于波導上的每次通信,根據源端和目標端之間的距離計算信號遭受的損耗。% C7 K3 y g- L( _% i8 J
6 H. |8 C, f% v4 }0 h這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準確恢復信號是否應該被截斷以節(jié)省能源
. p$ [/ D, z' h' g3 d2 C9 \% y, w5 B[/ol]: v% I$ W( | U
" v6 w* u. a9 R" C
lpqqw54vfjt64021061905.png (304.94 KB, 下載次數: 2)
下載附件
保存到相冊
lpqqw54vfjt64021061905.png
2024-9-19 13:40 上傳
- G5 a$ |" q- r8 n3 p0 u圖2:提出的LORAX框架概述' y7 v( E1 L# e
7 A) \0 q- }* c7 I, O該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅動器動態(tài)控制。網關接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅動器。6 f* m r+ M% X, I1 |
, X( C, b* E! T& Q% V sLORAX要求每個源節(jié)點知道:# o! F6 _) z1 q6 I5 H
何時在截斷和降低激光功率之間切換數據包是否包含可近似數據
$ q- \+ s! ]/ C, J# X7 O7 ]$ \3 p7 _( V
這通過以下方式實現:" S: M4 s, F; b6 W/ o4 a
源代碼注釋生成可近似數據的標志每個GWI中的查找表,包含到目標的損耗值3 h4 {9 Y3 i. ]" s/ n) l" n
8 p8 T3 A I: z1 W# K集成多級信號技術
y4 P7 A% C" jLORAX還探索了多級信號技術的使用,特別是4級脈沖幅度調制(PAM4),作為傳統開關鍵控(OOK)調制的替代方案。PAM4允許每次調制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現比特錯誤。, w9 v/ U7 ~7 b4 w* H% s7 r
]1 J( {7 W$ c$ M
osplvrulk5p64021062005.png (160.04 KB, 下載次數: 2)
下載附件
保存到相冊
osplvrulk5p64021062005.png
2024-9-19 13:40 上傳
}5 @# A+ R; C- Q8 B9 G4 L* o O. ] ]圖3:LSB信號:(a)截斷,(b)降低激光功率. n6 S7 E4 v6 C. {2 U( [
' C5 F" S+ H& B/ T c @( s實驗設置和結果7 o M" r6 G2 H8 D
LORAX框架在具有64個核心的Clos PNoC架構上進行了評估。模擬使用gem5進行全系統模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。
6 o/ e! e2 V' K. |% T2 N m- w* k# }# O' ^6 w
e1jmy3zysun64021062105.png (235.47 KB, 下載次數: 2)
下載附件
保存到相冊
e1jmy3zysun64021062105.png
2024-9-19 13:40 上傳
: T9 z; _! v$ J& t( M3 X" o5 g圖4:具有64個核心的8路3階段Clos架構
' m i+ X5 W4 v$ A. U. P, r
$ R) {% \, l, o: U% ?" P Z應用特定近似敏感性分析4 j1 x/ O" p U1 ~9 t
對各種應用程序進行了全面研究,分析了浮點數據近似對其敏感性。
2 Q' i p+ X+ B; v& P1 ^' j
1 H! t; W% x* v# b5 T這涉及變化:近似的最低有效位(LSBs)數量LSB信號的激光功率降低程度
3 N6 {/ u% P+ |) t( ?! ]' ]% H[/ol]" I1 x0 s- J6 H8 ~) r
% g; X+ r: M, _- y# R% l2 _
e1hyf5zkdkj64021062205.png (545.54 KB, 下載次數: 2)
下載附件
保存到相冊
e1hyf5zkdkj64021062205.png
2024-9-19 13:40 上傳
, h3 w. t: L7 G, F0 v$ c圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準測試在大輸入工作負載下,應用程序輸出百分比誤差(PE)作為近似LSB信號數量和LSB信號激光功率降低的函數
m5 }! o- j& C: }: [4 I
/ v5 B, B9 |6 @8 c; `0 A9 p這項分析的結果用于確定LORAX的應用特定激光功率強度控制設置。表1總結了每個應用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。
1 X! A1 w; c; ?
) l* V, u t7 c) e
5ysgrvvjjlt64021062305.png (130.27 KB, 下載次數: 2)
下載附件
保存到相冊
5ysgrvvjjlt64021062305.png
2024-9-19 13:40 上傳
+ C6 q# |6 N; T/ {9 R' M表11 k4 S* v6 p, v' h
5 h+ L- s) |. |& U( z$ x
比較結果
( m8 _6 `; F# f( ]& hLORAX框架與以下方法進行了比較:
) |( I4 t9 j8 j) J/ n; G1. 無近似的基準Clos PNoC: e0 C& a9 |) @& W: H" j! j
2. 文獻中現有的近似框架' d+ k) Q5 }& ]
3. 靜態(tài)截斷方法6 h0 j- X6 }- J
2 j4 O: p3 ]1 ]6 c( L' Y2 T
評估了LORAX的兩種變體: c6 K+ F+ ^- r5 e
1. LORAX-OOK:使用傳統開關鍵控調制
( ?' @& K) i: O7 ]% a. h2. LORAX-PAM4:使用4級脈沖幅度調制
7 m% l. s% x* Q5 _3 @7 W- p% R
4 Q5 I. p/ }, c: k8 V
cidknpd4swp64021062406.png (146.3 KB, 下載次數: 2)
下載附件
保存到相冊
cidknpd4swp64021062406.png
2024-9-19 13:40 上傳
/ C& I7 X G0 h& G( u O
圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較1 k+ ~% {( O( ]8 l9 l
- K7 g: \) n- w" k; P主要發(fā)現:; `; N% P# e& K* H" [+ ]8 }7 p
1. 能量每比特(EPB)降低:
) W3 Q1 ]# F! f' R. c+ n/ _LORAX-PAM4:比基準Clos低13.01%LORAX-OOK:比基準Clos低2.5%
# m2 K9 u7 I2 N3 C1 Z: s# o' o# }7 H7 o% i9 T! f
2. 激光功率降低:
7 E- p7 m( t* Z2 K5 W, `% @1 Q0 rLORAX-PAM4:比基準Clos低34.17%LORAX-OOK:比基準Clos低12.2%! q' l5 o! u9 d4 F r1 `$ z+ \# v
, P1 ^0 t% T9 V- J. g, ^. D2 r3. 最佳情況(Blackscholes和FFT應用):
5 K2 O' Y M$ r# k" SLORAX-PAM4:激光功率比基準Clos低達39.7%
& a+ r, x$ P; l& b, T
; \9 ~7 D0 {7 {) a結論
8 F9 i$ ^$ L9 I7 b( d: I) ULORAX框架展示了通過智能近似浮點數據傳輸在PNoCs中實現顯著能源和激光功率節(jié)省的潛力。
# N$ u, e @6 f' Q% ~& y% `; y* j* V f6 @" M4 @9 \& W$ D
主要要點包括:損耗感知激光功率管理允許基于信號傳播距離進行自適應近似。應用特定近似級別調整對于保持可接受的輸出質量非常重要。集成多級信號技術(如PAM4)可進一步提高能源效率,盡管增加了復雜性和易出錯性。必須針對每個應用程序仔細考慮能源節(jié)省和輸出精度之間的權衡。4 M# a1 _0 Z- M& E7 }
[/ol]/ o) ?% x: Q6 K: I; F% a* l, e
未來研究方向可能包括:探索更先進的多級信號技術開發(fā)自動化工具以確定最佳近似設置研究LORAX對其他類型PNoC架構的適用性擴展框架以支持浮點數據以外其他數據類型的近似
: d) [! z- Z% \4 [4 [! |[/ol]. H, k& C: i9 }! a
通過利用像LORAX這樣的近似技術,設計者可能克服未來高性能計算系統中使用硅基光電子互連的一些能源效率挑戰(zhàn)。; `# K- l, h1 J( k9 z& K
' V% W5 `% L/ ]0 x
參考文獻
F9 M: _" b% m[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.' p2 c2 X+ {) C( e* t0 W
5 ?! ~- \, `# ]- W- END -; L- t6 [, g% d$ ?) f
% k2 q+ r# y5 ?1 b9 O1 u
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
5 `; e# R, \3 _5 r點擊左下角"閱讀原文"馬上申請
4 Q3 ^- E* T0 y' }( T7 O* |4 w6 I3 b8 n
歡迎轉載
' |8 ?/ J$ a7 n; S6 \7 L# F6 V* h
轉載請注明出處,請勿修改內容和刪除作者信息!
. o% V5 B O9 D# v; n! O' Q" ^& l% t P
5 k2 M q2 ]1 }2 p: C
' D* D& n+ b: }! }
eybbva1cwqa64021062506.gif (16.04 KB, 下載次數: 2)
下載附件
保存到相冊
eybbva1cwqa64021062506.gif
2024-9-19 13:40 上傳
2 N* [* k B7 T1 j0 u" ?
5 F3 t" P3 Q- [9 Z5 \
關注我們
$ P; N7 A/ t# X
4 c" f7 J- ~6 q# u3 ?& U; h4 B8 l1 R; n& m( {9 P j
0n4bgxpjtze64021062606.png (31.33 KB, 下載次數: 1)
下載附件
保存到相冊
0n4bgxpjtze64021062606.png
2024-9-19 13:40 上傳
1 i d. C; ~& Z' _' V | 6 A: V9 f5 E5 [# U
acvhsbft1id64021062706.png (82.79 KB, 下載次數: 1)
下載附件
保存到相冊
acvhsbft1id64021062706.png
2024-9-19 13:40 上傳
0 n* m7 t* u7 I0 @6 Q* Z+ V9 L
|
$ b2 `6 m8 S! @& n3 G9 T) l
nrtnogwtg2j64021062806.png (21.52 KB, 下載次數: 2)
下載附件
保存到相冊
nrtnogwtg2j64021062806.png
2024-9-19 13:40 上傳
. y9 w# C4 A5 T- r' k7 r | 9 v' ]2 \1 o: {$ W" P$ F$ `
. L7 {- I8 G! _3 U/ ?/ a
6 |6 j& D- J7 M, s
' f3 R0 ]# s( y1 d9 H" z: Z- q
, |4 S1 g- r, \3 n# K0 ]
- Q: o, x' `4 ^0 V
, N5 L" ~7 z4 e9 k+ y關于我們:
+ @ {6 u$ Y* k/ f深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。* e4 q$ @/ S3 D& D$ a
9 {' U1 S/ Q( a- h z! M+ xhttp://www.latitudeda.com/& R, |' u; q. e; I
(點擊上方名片關注我們,發(fā)現更多精彩內容) |
|