|
引言2 l' I0 C; b$ ]9 i
隨著現(xiàn)代計算系統(tǒng)中數(shù)據(jù)量的快速增長,確保能源高效和容錯處理變得越來越具有挑戰(zhàn)性。近似計算作為有前途的解決方案應(yīng)運而生,通過犧牲一些計算精度來換取更高的能源效率。本文探討了如何將近似計算技術(shù)應(yīng)用于硅基光電子片上網(wǎng)絡(luò)(PNoCs),以降低能耗同時保持特定應(yīng)用的可接受輸出質(zhì)量。! e2 F0 W+ f! P! M+ d! D- ]
- H9 T8 H" R( V4 c3 R! F; K6 _背景
8 O/ N5 L0 p5 w( n" hPNoCs利用在片上波導中傳播的光信號,實現(xiàn)處理器核心之間的高帶寬、低延遲通信。然而,光信號在傳播過程中會遭受各種損耗,需要高功率激光器來確保目標端能夠無誤地恢復(fù)數(shù)據(jù)。這種高激光功率需求是PNoCs整體功耗的主要來源之一。% W" A8 T- Z: I8 K5 M
0 o1 v: x. {' X, ?
浮點數(shù)據(jù)表示遵循IEEE-754標準,由三部分組成:符號位、指數(shù)位和尾數(shù)位。相比符號位和指數(shù)位,尾數(shù)位通常對近似計算更具韌性。
; ^% q5 t' H+ Z3 T+ |
: Z! R3 O1 K. k$ @
nmfghqhmlwy64021061805.png (62.14 KB, 下載次數(shù): 1)
下載附件
保存到相冊
nmfghqhmlwy64021061805.png
2024-9-19 13:40 上傳
% k" H" v* |* r6 G0 h' Y
圖1:IEEE 754浮點數(shù)表示格式, {& ^5 f$ b9 ?
# K( F6 G, V `) t7 bLORAX框架" k, B3 k4 M6 n* w6 d7 |
本文重點介紹LORAX(LOss-awaRe ApproXimation,損耗感知近似)框架,通過智能近似浮點數(shù)據(jù)傳輸來降低PNoCs中的激光功耗。6 ]( D% T% s) `' D6 m9 Q+ o
/ O* C# H- @& m e* V
LORAX的核心思想包括:基于信號傳播距離的自適應(yīng)激光功率管理應(yīng)用特定的近似級別調(diào)整集成多級信號技術(shù)
' e5 R1 V' _6 E) ?[/ol]
- e9 O# l9 T K# a* X% W, X損耗感知激光功率管理3 c# w' H; J* X
LORAX采用損耗感知方法在運行時調(diào)整激光功率。對于波導上的每次通信,根據(jù)源端和目標端之間的距離計算信號遭受的損耗。6 q% i6 B0 T+ Z% z
8 v5 N$ L: G9 v, G- A/ }6 w
這使LORAX能夠確定:信號是否可以在降低激光功率的情況下準確恢復(fù)信號是否應(yīng)該被截斷以節(jié)省能源7 W' [* O C' C8 W: s
[/ol]& s! F3 c3 _( s/ A6 U2 Q, f$ U, M
$ P e9 \" ^% G7 E5 l; [/ O
lpqqw54vfjt64021061905.png (304.94 KB, 下載次數(shù): 0)
下載附件
保存到相冊
lpqqw54vfjt64021061905.png
2024-9-19 13:40 上傳
% L' t X8 y7 Y圖2:提出的LORAX框架概述/ \0 } ?5 O4 X- E7 L
6 g9 @8 o4 F& j7 c& R- Q' o* ?
該框架使用垂直腔表面發(fā)射激光器(VCSELs)組成的片上激光器陣列,可通過片上激光驅(qū)動器動態(tài)控制。網(wǎng)關(guān)接口(GWI)連接電子層和PNoC,并將期望的激光功率強度級別傳遞給驅(qū)動器。, @2 V L1 t: [9 W, \
' o; h( |3 G+ ]/ c0 a6 zLORAX要求每個源節(jié)點知道:/ [9 ?/ V% D' A5 B' }8 M- }
何時在截斷和降低激光功率之間切換數(shù)據(jù)包是否包含可近似數(shù)據(jù)
. R) Z4 K+ e5 }. k( J( W. M' g" E. e9 U6 n# X2 z
這通過以下方式實現(xiàn):
+ U5 T& [. w R1 d, T源代碼注釋生成可近似數(shù)據(jù)的標志每個GWI中的查找表,包含到目標的損耗值& m7 g3 u' b) ~& {6 W% p7 ~
* s5 Z, {! k; [5 U0 D3 F' i' w
集成多級信號技術(shù)
, A9 Z: R1 \) h/ ^, oLORAX還探索了多級信號技術(shù)的使用,特別是4級脈沖幅度調(diào)制(PAM4),作為傳統(tǒng)開關(guān)鍵控(OOK)調(diào)制的替代方案。PAM4允許每次調(diào)制傳輸2位,可能增加帶寬和能源效率。然而,由于多個信號級別彼此接近,因此更容易出現(xiàn)比特錯誤。
- j2 b, k# S7 o
4 {' \- v& y+ x& g
osplvrulk5p64021062005.png (160.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
osplvrulk5p64021062005.png
2024-9-19 13:40 上傳
; e4 K, D, Q* f' k# W, f; h
圖3:LSB信號:(a)截斷,(b)降低激光功率3 X W/ Y, S. z( o' h2 N
9 t8 W" ?5 k9 \8 w4 f實驗設(shè)置和結(jié)果
) H& q5 V+ o4 m9 a+ J: BLORAX框架在具有64個核心的Clos PNoC架構(gòu)上進行了評估。模擬使用gem5進行全系統(tǒng)模擬,并使用基于Systemc的周期精確模擬器對PNoC進行模擬。- X, {5 C( F2 A) M
- F- K5 Y! Z; X- I2 Y+ E
e1jmy3zysun64021062105.png (235.47 KB, 下載次數(shù): 0)
下載附件
保存到相冊
e1jmy3zysun64021062105.png
2024-9-19 13:40 上傳
2 _ Y7 w' A6 J& A, L' z; ^) C圖4:具有64個核心的8路3階段Clos架構(gòu)
4 S, Z3 w* L, J" W! a/ N3 k: o1 z3 A3 W8 o$ M2 v) i
應(yīng)用特定近似敏感性分析
% |- a; B( Z' }8 z對各種應(yīng)用程序進行了全面研究,分析了浮點數(shù)據(jù)近似對其敏感性。
. A5 N3 p6 R- l+ n1 B/ d, Q$ b
: J* `4 R/ V. L1 v& d& @這涉及變化:近似的最低有效位(LSBs)數(shù)量LSB信號的激光功率降低程度 B/ B- v2 A' v3 z: y0 o3 G
[/ol]( [; ]0 w) z* Z$ f+ p3 c9 p
' o* B$ m6 J* X$ W( x; q( z v: F
e1hyf5zkdkj64021062205.png (545.54 KB, 下載次數(shù): 1)
下載附件
保存到相冊
e1hyf5zkdkj64021062205.png
2024-9-19 13:40 上傳
3 C! E/ S% P" p- U" p- R+ {) c
圖5:blackscholes、canneal、fft、jpeg、sobel和streamcluster基準測試在大輸入工作負載下,應(yīng)用程序輸出百分比誤差(PE)作為近似LSB信號數(shù)量和LSB信號激光功率降低的函數(shù)1 y: n# l* A; L9 B6 u# g
8 r* w" ]5 N v4 X- p5 @這項分析的結(jié)果用于確定LORAX的應(yīng)用特定激光功率強度控制設(shè)置。表1總結(jié)了每個應(yīng)用程序的最佳可近似位組合和激光功率傳輸水平,確保輸出誤差不超過10%。
* ]" B; f# d1 g
& `2 ?3 x: N' ~& L
5ysgrvvjjlt64021062305.png (130.27 KB, 下載次數(shù): 1)
下載附件
保存到相冊
5ysgrvvjjlt64021062305.png
2024-9-19 13:40 上傳
: q3 r" |6 G! P" ~' R( S' T
表11 C; ]2 m8 \. ~( M3 H
( W; D: h4 B) q
比較結(jié)果
# e, D6 C6 t4 H5 dLORAX框架與以下方法進行了比較:" W [& _4 y/ E# \2 Q) [0 W- h. I
1. 無近似的基準Clos PNoC9 t; `8 u# R: D
2. 文獻中現(xiàn)有的近似框架
- }$ U+ Z/ d" l- }4 R1 c" j7 X3. 靜態(tài)截斷方法- k/ K3 C. B/ W6 x8 u: `
& a# L# T( H, k+ n5 n* V評估了LORAX的兩種變體:% s5 g6 `) q6 ]
1. LORAX-OOK:使用傳統(tǒng)開關(guān)鍵控調(diào)制! r/ ~: K+ k2 ]- l @
2. LORAX-PAM4:使用4級脈沖幅度調(diào)制 v( ~3 Y8 @+ K( x& A$ W" `
* y3 K: `' {* {& G5 H0 d
cidknpd4swp64021062406.png (146.3 KB, 下載次數(shù): 1)
下載附件
保存到相冊
cidknpd4swp64021062406.png
2024-9-19 13:40 上傳
. H" @5 I) u e8 @& P" V圖6:(a)各框架能量每比特(EPB)比較,(b)各框架激光功率比較! E a4 z! g* X- x. N4 _
/ o/ O$ J# {. j; U) w1 P主要發(fā)現(xiàn):
0 S f! l6 U3 e+ c) D1. 能量每比特(EPB)降低:. O$ E) A4 `$ N. N2 v7 }
LORAX-PAM4:比基準Clos低13.01%LORAX-OOK:比基準Clos低2.5% ^) n8 Z/ w# h4 ]( d
, c/ Z. C7 l+ S2. 激光功率降低:
9 L3 c, t6 ]5 q* p% ~. C* ULORAX-PAM4:比基準Clos低34.17%LORAX-OOK:比基準Clos低12.2%6 X- J) s* q. ?. ~! a
1 z# l4 q1 R$ g
3. 最佳情況(Blackscholes和FFT應(yīng)用):
6 x1 z3 q& A3 I! V* O0 YLORAX-PAM4:激光功率比基準Clos低達39.7%2 N0 }/ e1 M7 S6 X* j
l" I7 f2 u# E& q+ p結(jié)論
: [+ m7 h) a4 M4 P% WLORAX框架展示了通過智能近似浮點數(shù)據(jù)傳輸在PNoCs中實現(xiàn)顯著能源和激光功率節(jié)省的潛力。
@5 J) z1 R5 _6 g' [/ k& M& {8 E4 z, Z$ J( C) U
主要要點包括:損耗感知激光功率管理允許基于信號傳播距離進行自適應(yīng)近似。應(yīng)用特定近似級別調(diào)整對于保持可接受的輸出質(zhì)量非常重要。集成多級信號技術(shù)(如PAM4)可進一步提高能源效率,盡管增加了復(fù)雜性和易出錯性。必須針對每個應(yīng)用程序仔細考慮能源節(jié)省和輸出精度之間的權(quán)衡。% f6 p# S' g) V9 }' V9 s
[/ol]. B9 j' U1 F' }8 g u3 C S3 @; ]
未來研究方向可能包括:探索更先進的多級信號技術(shù)開發(fā)自動化工具以確定最佳近似設(shè)置研究LORAX對其他類型PNoC架構(gòu)的適用性擴展框架以支持浮點數(shù)據(jù)以外其他數(shù)據(jù)類型的近似
* |4 ]4 q, Q3 C' |1 R I" G[/ol]
& \/ Q" i- n4 A+ |8 S5 M! U通過利用像LORAX這樣的近似技術(shù),設(shè)計者可能克服未來高性能計算系統(tǒng)中使用硅基光電子互連的一些能源效率挑戰(zhàn)。
8 _4 W' f! P0 A
! i7 P' L0 H8 F1 _! E參考文獻
: X- K0 T1 B5 Q& [6 B- b0 \$ d6 V7 ]; l[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
1 @0 A: x4 R3 {8 r. _* M9 B# c, [3 b! @" b6 v
- END -$ Z" o* S6 X& b+ t
7 s* q7 b* r1 E z8 _, }+ [
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。$ s8 R+ ^$ N9 I
點擊左下角"閱讀原文"馬上申請& v1 E) C- g+ d" T9 @
4 V1 U5 K" P. {4 B. D: {
歡迎轉(zhuǎn)載
: S. S+ j% {- o, {. r, E% Z# T: D0 R9 y
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!9 }4 y# G, E/ e; e
) n0 W$ m, E j# `) s4 S# t" x" ?
- v1 N3 g4 g: n4 z" P+ ?* v
; j6 q" r4 W1 `% v0 x" C" [
eybbva1cwqa64021062506.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
eybbva1cwqa64021062506.gif
2024-9-19 13:40 上傳
, H6 [% n1 v! m4 h, E
! s4 H$ j3 g: P$ T4 {: m' Z/ i關(guān)注我們
$ Y$ T; I1 d7 l; E* N9 S6 x" ^7 _9 P! V% R; ?. p; `8 ^# \1 P% D3 ]4 D
4 f. I _2 j) B+ W. Q
0n4bgxpjtze64021062606.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
0n4bgxpjtze64021062606.png
2024-9-19 13:40 上傳
# d: p1 ]+ |- v4 `4 W* J |
/ u; P- K3 ^9 C5 T
acvhsbft1id64021062706.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
acvhsbft1id64021062706.png
2024-9-19 13:40 上傳
/ U1 y3 X, n, m. J1 J/ S |
! K2 x! J+ X8 B8 O( l( \4 f
nrtnogwtg2j64021062806.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
nrtnogwtg2j64021062806.png
2024-9-19 13:40 上傳
7 G8 \* Z7 c) _$ o# L3 } |
' B1 L. R0 @( Y9 h4 j1 q# c& a
u: G" L1 C% R& d) P$ T- A; B* y8 t
3 x- |: p Q% q- p5 K
" C0 s* C4 e( u) `
& n' l2 \. Z& |7 T, R$ l) w! m( U8 S% K3 e _: n! i
! A$ a! n1 f5 C1 V/ k7 y" n2 O( g
關(guān)于我們:" h( X# }% s* p- [3 M" i
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。4 X; ` g) L: a9 U! x
D- D; E. e5 A. V* rhttp://www.latitudeda.com/
M- r% h" W# e/ o u- ^(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|