|
引言
% A& n6 X/ L% R4 ]' g在快速發(fā)展的計算領(lǐng)域中,高效的內(nèi)存管理和互連技術(shù)對系統(tǒng)性能起著關(guān)鍵作用。計算快速鏈接(Compute Express Link,CXL)已成為連接內(nèi)存與各種處理元件以及在數(shù)據(jù)中心內(nèi)共享內(nèi)存資源的主要協(xié)議。本文探討CXL的功能、演變及其對現(xiàn)代計算架構(gòu)的影響[1]。
- a6 \7 f/ \1 e C3 H* P: O
4 } b8 |5 F8 I什么是CXL?1 u5 |4 O3 G3 U0 n* | P
計算快速鏈接(CXL)是建立在PCI Express(PCIe)基礎(chǔ)上的開放行業(yè)標(biāo)準(zhǔn)互連技術(shù)。它于2019年3月首次提出,此后獲得了主要芯片制造商的廣泛支持。CXL的主要功能是通過串行通信連接CPU、GPU、FPGA和其他專用加速器,同時允許跨器件池化內(nèi)存以提高利用率和資源效率。+ f6 Z: ]1 x+ w* b
3 O0 z4 h* t! U- J: JCXL由三個子協(xié)議組成:CXL.ioCXL.cacheCXL.memory5 u8 i1 ^" ~3 W2 b0 K
[/ol]
$ _1 W/ ~1 p& K$ e# M* ^$ U其中,CXL.memory因其在數(shù)據(jù)中心內(nèi)存擴(kuò)展和先進(jìn)AI拓?fù)渲械臐摿Χ鹆俗疃嚓P(guān)注。+ ?0 P7 K E2 s( ^- Y: }1 J, ]
1 \- M, v' \; [9 I" y: q% c7 _. o. b
w2p1sg53goz64076743312.png (190.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
w2p1sg53goz64076743312.png
2024-11-2 01:17 上傳
% A) N+ W; R$ X% W( v# r' _圖1展示了CXL版本3.0和3.1的擴(kuò)展功能,突出了該協(xié)議的演進(jìn)和能力。- V& j6 ?. u( I; V$ I" ]
0 M# Q9 o1 f9 p6 O5 a; w
CXL與其他互連技術(shù)的比較
9 \; y) z1 ^" s- _" I雖然CXL經(jīng)常被與NVIDIA的NVLink(用于連接GPU的高帶寬技術(shù))相比較,但它已經(jīng)沿著不同的路徑發(fā)展。CXL的主要焦點已從加速器到主機通信轉(zhuǎn)向內(nèi)存連接。
0 S+ y& ?7 ]: l+ n+ Z
6 Z3 } V) I- I6 R9 g! gRambus高級產(chǎn)品營銷經(jīng)理Zaman Mollah解釋道:"CXL將與其他類似的互連技術(shù)共存,有自己的應(yīng)用和使用場景。CXL可能無法提供GPU中心的AI應(yīng)用所需的帶寬,但在加速器和基于CPU的AI用例中有用處。"' N5 i7 i" M% |
$ p: ^5 \: F& `% x Z
CXL的獨特優(yōu)勢包括:4 k; c1 u4 K# D4 v% G) S9 O2 c
增加容量和帶寬的內(nèi)存擴(kuò)展內(nèi)存重用智能內(nèi)存分層應(yīng)用可組合的數(shù)據(jù)中心架構(gòu)以可接受的延遲靈活且經(jīng)濟(jì)地增加內(nèi)存容量和帶寬
8 d0 y* o+ G C, B- g; [( r
* p1 Y& a. V6 ?1 r1 j3 XCXL的演變:從1.0到3.17 A }) q# I3 W" G# `) ^" t8 v
自誕生以來,CXL經(jīng)歷了幾次修訂,每個版本都引入了新功能和能力: O' f! N: j% j" \
CXL 1.0(2019):初始發(fā)布CXL 2.0(2020):增強內(nèi)存池化和共享CXL 3.0(2022):引入fabric能力CXL 3.1(2023):改進(jìn)fabric管理能力和安全功能# {; i# i" H% \% y& U, g+ j
9 K* L- t4 L* }; t% R$ j8 y7 w
CXL 3.1:最新進(jìn)展- |% v/ a, y6 [' P8 V* v& J7 ?
2023年11月發(fā)布的CXL 3.1規(guī)范為該協(xié)議帶來了顯著改進(jìn)。主要增強包括:% K# ^9 U. N9 W2 G" {
改進(jìn)了分解系統(tǒng)的fabric管理能力優(yōu)化了資源利用擴(kuò)展了內(nèi)存共享和池化能力促進(jìn)了加速器之間的內(nèi)存共享5 ~& E( Z3 N9 D6 t) T- Q& l
* r G1 _) f3 y; C# f* ?5 v( D5 Y3 M. _! B
t4elzqgmvlc64076743412.png (261.36 KB, 下載次數(shù): 0)
下載附件
保存到相冊
t4elzqgmvlc64076743412.png
2024-11-2 01:17 上傳
9 R* U8 E" I3 R p* y圖2說明了CXL 3.1中可信安全協(xié)議(TSP)如何增強安全性。
- C0 {6 x& w7 Z
0 J2 W; \6 ^1 [, w3 zRambus硅IP產(chǎn)品營銷高級總監(jiān)Lou Ternullo強調(diào)了CXL 3.1中的一些新功能:CXL.IO點對點(P2P)無序I/O(UIO)CXL.mem P2P可信執(zhí)行環(huán)境(TEE)操作碼跨PCIe傳輸層的完整性和數(shù)據(jù)加密(IDE)支持
6 }) n' F$ a6 x# L. A$ |; T[/ol]$ Q# a. p7 ~6 ~. }: d' A$ y6 ~2 t/ F
這些功能共同作用,減少延遲,提高安全性,并增強CXL fabric中端點和主機之間的通信。& H/ R! r) o# ~3 @) F4 v; ~5 R. f
# c. }# H' l' C7 o t' w6 [/ `
ruof03je2pj64076743513.png (216.31 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ruof03je2pj64076743513.png
2024-11-2 01:17 上傳
* j7 i0 S2 x7 G4 t! L$ M
圖3描述了CXL 3.1中引入的新全局集成內(nèi)存(GIM)概念。
+ H0 ?# ]/ P0 x' Q2 B' ?' {0 T/ ^, C; V! j5 q1 s0 H5 ^3 T
Fabric能力和擴(kuò)展1 U. T1 p; h) r4 K1 j9 m
CXL 3.1中最顯著的改進(jìn)之一是交換Fabric能力的增強。Ternullo解釋道:"現(xiàn)在可以處理基于端口的路由,這允許進(jìn)行規(guī)模擴(kuò)展部署。交換fabric不受傳統(tǒng)樹狀層次結(jié)構(gòu)的限制。允許主機和器件進(jìn)行跨域訪問,一個器件能夠訪問多達(dá)4,096個主機或其他器件。"
6 g) B9 _" a$ h, s F. y. N; P; f1 B* m
這一進(jìn)步使設(shè)計者能夠?qū)崿F(xiàn)具有任意到任意通信的大型系統(tǒng)或拓?fù),為?shù)據(jù)中心架構(gòu)創(chuàng)造了新的可能性。( D* C" Q) ]* F6 n- H- B# y8 a% @& h
, A. h7 Y1 m6 g& {% V0 |6 ]安全性和元數(shù)據(jù)增強
; J0 F. X) }( T4 X$ X4 SCXL 3.1還引入了重要的安全功能,包括:; U ?6 M0 c8 ]8 v) j& K! H
增強保護(hù)的可信安全協(xié)議擴(kuò)展的元數(shù)據(jù)能力(最多34位)
* {5 q1 w% e' T( @1 f" e& n. }7 i& K7 `, g- H! d/ k0 o
這些改進(jìn)對于通過fabric連接眾多虛擬機的規(guī)模擴(kuò)展部署非常重要,允許更好的監(jiān)控和診斷。' f" R: a0 {! R0 e* x
6 R- \9 z) F6 a# F/ _: r% R
內(nèi)存池化和擴(kuò)展. T% q% e% E5 t9 D- u& j/ w+ D5 p
CXL最令人興奮的應(yīng)用之一是其促進(jìn)內(nèi)存池化和擴(kuò)展的能力。這一能力解決了數(shù)據(jù)密集型應(yīng)用(如AI和機器學(xué)習(xí)工作負(fù)載)對更多內(nèi)存的日益增長的需求。
! I t% V2 `2 w6 p& D
5 ^/ h) K2 ?" K3 G( D! Y' F* x: CCadence高級產(chǎn)品營銷總監(jiān)Arif Khan指出,盡管在成本和軟件復(fù)雜性方面存在一些批評,但實施者對使用CXL構(gòu)建內(nèi)存擴(kuò)展器和池化器件仍有很大興趣。
2 q1 q$ d; F6 z7 Z- l; R
; f. S1 |! H/ Q( ]2 M' ], `" [' I
qf22ywzfth364076743613.png (549.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
qf22ywzfth364076743613.png
2024-11-2 01:17 上傳
3 F2 Q) k; M. {* X6 O+ l
圖4概述了CXL的使用案例和驗證解決方案,展示了該協(xié)議的多功能性。
" F5 |9 _5 q) ^# D6 [" ~) @9 M. `" Q- m
內(nèi)存池化的經(jīng)濟(jì)性特別具有吸引力,正如Rambus的Mollah解釋的那樣:"隨著每字節(jié)成本降低,內(nèi)存池化等高級應(yīng)用將變得更具吸引力,并允許分解的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低總擁有成本(TCO)。"
2 a% i3 |2 C. |! W2 ~
: V2 J, g' \# T( H! g0 P- nCXL在其他技術(shù)環(huán)境中的地位- N+ v% e) m$ C/ K8 Q0 k" n
雖然CXL已經(jīng)獲得了顯著的關(guān)注,但了解其在其他互連技術(shù)中的位置很重要。Synopsys高級技術(shù)產(chǎn)品經(jīng)理Richard Solomon強調(diào),CXL應(yīng)被視為選擇范圍的一部分,類似于內(nèi)存如何有廣泛的產(chǎn)品來滿足特定需求。" t% o7 o+ m) j m2 r
% k; N) f5 X6 c( G5 y
Siemens Digital Industries Software VIP產(chǎn)品線高級總監(jiān)Christopher Browy提供了CXL與其他技術(shù)比較的見解:"基于PCIe SerDes的CXL具有更低的錯誤率、更低的延遲和相應(yīng)的較低帶寬。NVLink和UALink使用以太網(wǎng)風(fēng)格的SerDes,導(dǎo)致高錯誤率、高延遲和高帶寬,因此對于最高性能帶寬受限的情況,如GPU到GPU,這些技術(shù)具有優(yōu)勢。"7 _5 E1 K) j$ Q K$ A. i7 H5 D2 b0 w- J
% U- q0 k& c3 r* B* w未來展望
. W* ~, s, T1 I: k' ^4 XCXL的未來看起來很有希望,Yole Research預(yù)測到2028年市場將達(dá)到160億美元。隨著技術(shù)的成熟,可以期待看到:
) c3 x2 R& T& ^3 a/ W X繼續(xù)用于內(nèi)存擴(kuò)展進(jìn)一步實現(xiàn)異構(gòu)計算增強數(shù)據(jù)中心分解最小化服務(wù)器過度配置按需訪問內(nèi)存、存儲和加速資源9 D% x# }* X/ p9 H7 \, Q1 L
8 q5 b- m. Y( X5 w# ~4 N
CXL聯(lián)盟營銷工作組聯(lián)合主席兼英特爾高級營銷經(jīng)理Anil Godbole強調(diào),CXL正在成為主流:"隨著我們推出CXL,每個CPU都將具有CXL功能,因此現(xiàn)在正成為主流。"
( ^8 c( L. R5 o' e, p' {) R9 {& K# g' w) { j. Z7 p Y9 ~
結(jié)論7 V F, a2 l5 k* T
CXL迅速發(fā)展成為現(xiàn)代計算架構(gòu)中的重要技術(shù)。其高效連接和池化內(nèi)存資源的能力,加上fabric能力和安全功能的持續(xù)改進(jìn),使CXL成為未來數(shù)據(jù)中心和高性能計算設(shè)計中的關(guān)鍵參與者。隨著技術(shù)繼續(xù)成熟并獲得廣泛采用,可以期待看到利用CXL獨特能力的創(chuàng)新解決方案,以滿足數(shù)據(jù)密集型應(yīng)用和異構(gòu)計算環(huán)境日益增長的需求。
1 }6 H( d( e1 f; a0 v' l. ?* E: R6 v) q/ ^( u; d3 {
參考文獻(xiàn) f/ G- ?) G: w% _* l
[1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online]." Y! I# u5 r1 N6 O* p! p. d
END3 d. j, M! ^, b2 I' h
1 `. q( v6 i5 H5 }- c% Z2 w% J0 u3 e8 L, i- a
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。. C0 S l2 y( \- Q7 I2 h
點擊左下角"閱讀原文"馬上申請! t# y# s8 `6 w3 {9 L$ a
9 S) V, Z' f3 V歡迎轉(zhuǎn)載
6 j& u! Y- s7 J- @; `8 g/ Q# H7 P2 U! {
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!# A7 N: k; n2 R; X
( V6 I0 B! J: o# w6 R9 b0 d$ }
$ |' O1 m g& M3 A
m, B/ j, ~! j
5n2oxhiqkds64076743713.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
5n2oxhiqkds64076743713.gif
2024-11-2 01:17 上傳
2 Y3 ^7 ^* |7 r- n7 ]' H- F, F
6 {5 y% S" K* s+ M1 \% }/ m% F- K關(guān)注我們
" Q/ o$ I- y! r0 @$ {& Y, V- W+ v9 \/ T( {2 g2 c4 F+ `4 s/ O
! U& a6 C+ r- K! R: q
rvd1e5k2qu464076743813.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
rvd1e5k2qu464076743813.png
2024-11-2 01:17 上傳
) p& o/ u# o7 l' t2 G8 H8 F9 d | - c4 b; [! e3 K5 `4 R
yq04wwlhj0e64076743913.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yq04wwlhj0e64076743913.png
2024-11-2 01:17 上傳
9 T3 T* L/ W+ g
| ! d$ F- c! O; q4 a
svsnew3foyh64076744013.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
svsnew3foyh64076744013.png
2024-11-2 01:17 上傳
3 j+ K9 Z' f+ t/ y" f0 [; k+ T
|
) K" g( Q2 s& P2 N3 R, K, b( M% k1 A3 i# k" q: a
$ v1 R8 \1 N/ f3 z$ l0 E7 y; f5 K V" m4 W/ e
關(guān)于我們:9 Z* n7 O: e, v3 r
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
: {* W) f7 j" T) K+ r
8 F4 q! w/ _$ H4 t4 K0 K3 Q$ zhttp://www.latitudeda.com/
$ c0 n$ s! }0 a7 C(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|