|
引言
* H" `+ G7 j3 A1 Q. n在快速發(fā)展的計(jì)算領(lǐng)域中,高效的內(nèi)存管理和互連技術(shù)對(duì)系統(tǒng)性能起著關(guān)鍵作用。計(jì)算快速鏈接(Compute Express Link,CXL)已成為連接內(nèi)存與各種處理元件以及在數(shù)據(jù)中心內(nèi)共享內(nèi)存資源的主要協(xié)議。本文探討CXL的功能、演變及其對(duì)現(xiàn)代計(jì)算架構(gòu)的影響[1]。: C" @2 Z7 P, e9 d
+ P; X$ }7 p6 w' ^% h- }6 t% |# @什么是CXL?. n/ x: Z$ u! E+ _0 u3 K Z5 P6 q
計(jì)算快速鏈接(CXL)是建立在PCI Express(PCIe)基礎(chǔ)上的開放行業(yè)標(biāo)準(zhǔn)互連技術(shù)。它于2019年3月首次提出,此后獲得了主要芯片制造商的廣泛支持。CXL的主要功能是通過串行通信連接CPU、GPU、FPGA和其他專用加速器,同時(shí)允許跨器件池化內(nèi)存以提高利用率和資源效率。
0 a9 B% U& Z. O0 @* e6 {* B
3 N Y4 ^* w( D+ [3 g3 JCXL由三個(gè)子協(xié)議組成:CXL.ioCXL.cacheCXL.memory$ D0 W, g8 i. K7 N
[/ol]
) A9 K: _. F d- M P' `$ x7 o其中,CXL.memory因其在數(shù)據(jù)中心內(nèi)存擴(kuò)展和先進(jìn)AI拓?fù)渲械臐摿Χ鹆俗疃嚓P(guān)注。
5 z2 S0 [, H5 O% P2 A) k
9 d/ e# D% H5 N) x' A
w2p1sg53goz64076743312.png (190.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
w2p1sg53goz64076743312.png
2024-11-2 01:17 上傳
4 \0 h8 H% a. H4 `/ g- p圖1展示了CXL版本3.0和3.1的擴(kuò)展功能,突出了該協(xié)議的演進(jìn)和能力。
' @% d x9 b7 b2 s5 t
' ~$ J; U; C r) MCXL與其他互連技術(shù)的比較* K8 B0 P& _9 ^, x. n% E2 M+ d
雖然CXL經(jīng)常被與NVIDIA的NVLink(用于連接GPU的高帶寬技術(shù))相比較,但它已經(jīng)沿著不同的路徑發(fā)展。CXL的主要焦點(diǎn)已從加速器到主機(jī)通信轉(zhuǎn)向內(nèi)存連接。7 v; N. G' v5 |, D) w; \. U8 c1 l* E
- ?- ?5 D( p$ }2 `$ C4 b
Rambus高級(jí)產(chǎn)品營(yíng)銷經(jīng)理Zaman Mollah解釋道:"CXL將與其他類似的互連技術(shù)共存,有自己的應(yīng)用和使用場(chǎng)景。CXL可能無法提供GPU中心的AI應(yīng)用所需的帶寬,但在加速器和基于CPU的AI用例中有用處。"! ^, i+ L& G5 l; c6 S
6 Z- ?4 {3 n2 W8 z2 L5 C% F8 d
CXL的獨(dú)特優(yōu)勢(shì)包括:
- N7 y; k3 v; c8 N& l0 _; F增加容量和帶寬的內(nèi)存擴(kuò)展內(nèi)存重用智能內(nèi)存分層應(yīng)用可組合的數(shù)據(jù)中心架構(gòu)以可接受的延遲靈活且經(jīng)濟(jì)地增加內(nèi)存容量和帶寬
7 H2 t9 Z+ ]4 L5 p" h7 o( j8 C" n7 p O( Y$ ?4 C0 N, p* h
CXL的演變:從1.0到3.1& ?7 \! ~8 F) R! I6 b
自誕生以來,CXL經(jīng)歷了幾次修訂,每個(gè)版本都引入了新功能和能力:6 o- ]' Q- \. K0 p# \9 V/ E
CXL 1.0(2019):初始發(fā)布CXL 2.0(2020):增強(qiáng)內(nèi)存池化和共享CXL 3.0(2022):引入fabric能力CXL 3.1(2023):改進(jìn)fabric管理能力和安全功能
: e" m# K4 |7 U' Q& P _+ y+ [! S& h; m
CXL 3.1:最新進(jìn)展! ^1 l% X% V" y s0 e h% s
2023年11月發(fā)布的CXL 3.1規(guī)范為該協(xié)議帶來了顯著改進(jìn)。主要增強(qiáng)包括:' J$ @( Q; u8 ?6 I7 e3 t L$ C# U
改進(jìn)了分解系統(tǒng)的fabric管理能力優(yōu)化了資源利用擴(kuò)展了內(nèi)存共享和池化能力促進(jìn)了加速器之間的內(nèi)存共享
: n8 r. l6 c7 b2 h3 D( S
3 ]! }/ N5 a. W- Q m( R2 O' Y" n3 e B. z5 l8 p
t4elzqgmvlc64076743412.png (261.36 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
t4elzqgmvlc64076743412.png
2024-11-2 01:17 上傳
9 c! q m2 J8 u' d& L) I
圖2說明了CXL 3.1中可信安全協(xié)議(TSP)如何增強(qiáng)安全性。
" L6 a5 c3 g8 T( O/ M8 n3 O2 ^# H6 ?' Q$ b* \4 P9 Y1 q
Rambus硅IP產(chǎn)品營(yíng)銷高級(jí)總監(jiān)Lou Ternullo強(qiáng)調(diào)了CXL 3.1中的一些新功能:CXL.IO點(diǎn)對(duì)點(diǎn)(P2P)無序I/O(UIO)CXL.mem P2P可信執(zhí)行環(huán)境(TEE)操作碼跨PCIe傳輸層的完整性和數(shù)據(jù)加密(IDE)支持5 Z& [: W7 u$ V; T: t7 w
[/ol]! ?( B* c+ Q2 `
這些功能共同作用,減少延遲,提高安全性,并增強(qiáng)CXL fabric中端點(diǎn)和主機(jī)之間的通信。) h/ t" V8 w, j; a* U8 s
" W* z0 T v9 Z' L% m+ L
ruof03je2pj64076743513.png (216.31 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
ruof03je2pj64076743513.png
2024-11-2 01:17 上傳
) K, [. ?9 r9 u* [- i5 p
圖3描述了CXL 3.1中引入的新全局集成內(nèi)存(GIM)概念。
. B N. S, o0 S$ Y7 y i3 I$ d$ J) @2 F! G
Fabric能力和擴(kuò)展
% Q& C: E4 e( S2 S9 `CXL 3.1中最顯著的改進(jìn)之一是交換Fabric能力的增強(qiáng)。Ternullo解釋道:"現(xiàn)在可以處理基于端口的路由,這允許進(jìn)行規(guī)模擴(kuò)展部署。交換fabric不受傳統(tǒng)樹狀層次結(jié)構(gòu)的限制。允許主機(jī)和器件進(jìn)行跨域訪問,一個(gè)器件能夠訪問多達(dá)4,096個(gè)主機(jī)或其他器件。"
g" D# z5 c' _9 B4 R+ V H; U* }* b4 u5 u0 b+ }7 I" c
這一進(jìn)步使設(shè)計(jì)者能夠?qū)崿F(xiàn)具有任意到任意通信的大型系統(tǒng)或拓?fù),為?shù)據(jù)中心架構(gòu)創(chuàng)造了新的可能性。8 B% D! J6 h4 j+ B' r/ g1 p
' D& v2 f+ B* e1 n. W7 M
安全性和元數(shù)據(jù)增強(qiáng)
* ^% {, M- f& jCXL 3.1還引入了重要的安全功能,包括:
; Y+ d- Q" K+ T9 [增強(qiáng)保護(hù)的可信安全協(xié)議擴(kuò)展的元數(shù)據(jù)能力(最多34位)+ U2 j; m* `0 j9 R/ i
8 g: ~. Y0 Z* X2 ~這些改進(jìn)對(duì)于通過fabric連接眾多虛擬機(jī)的規(guī)模擴(kuò)展部署非常重要,允許更好的監(jiān)控和診斷。
5 D% n$ G! Y6 ^+ K% n
5 H( ^) p8 s: Z8 U7 N內(nèi)存池化和擴(kuò)展
- U( g' c) k, J: S2 y" M* sCXL最令人興奮的應(yīng)用之一是其促進(jìn)內(nèi)存池化和擴(kuò)展的能力。這一能力解決了數(shù)據(jù)密集型應(yīng)用(如AI和機(jī)器學(xué)習(xí)工作負(fù)載)對(duì)更多內(nèi)存的日益增長(zhǎng)的需求。
+ B7 K0 i7 q' h( ]
/ q3 m9 }5 ~; \9 H# p8 QCadence高級(jí)產(chǎn)品營(yíng)銷總監(jiān)Arif Khan指出,盡管在成本和軟件復(fù)雜性方面存在一些批評(píng),但實(shí)施者對(duì)使用CXL構(gòu)建內(nèi)存擴(kuò)展器和池化器件仍有很大興趣。 w: v* M W) i, h
" n1 n" }9 d8 y- d( E
qf22ywzfth364076743613.png (549.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
qf22ywzfth364076743613.png
2024-11-2 01:17 上傳
4 I" T0 j0 H* N$ e圖4概述了CXL的使用案例和驗(yàn)證解決方案,展示了該協(xié)議的多功能性。2 R( M0 _1 l( m9 P
" b; `3 r6 b7 Q" V內(nèi)存池化的經(jīng)濟(jì)性特別具有吸引力,正如Rambus的Mollah解釋的那樣:"隨著每字節(jié)成本降低,內(nèi)存池化等高級(jí)應(yīng)用將變得更具吸引力,并允許分解的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低總擁有成本(TCO)。": e* y5 N: B \. [
3 T6 |4 V# q: D: o$ P" E+ CCXL在其他技術(shù)環(huán)境中的地位
! R3 H; z9 o& _# a( T雖然CXL已經(jīng)獲得了顯著的關(guān)注,但了解其在其他互連技術(shù)中的位置很重要。Synopsys高級(jí)技術(shù)產(chǎn)品經(jīng)理Richard Solomon強(qiáng)調(diào),CXL應(yīng)被視為選擇范圍的一部分,類似于內(nèi)存如何有廣泛的產(chǎn)品來滿足特定需求。
/ l I& Z9 ^/ J5 X4 t6 {" y0 X0 S7 e% R8 D3 }: f. ?" k8 i7 W4 X
Siemens Digital Industries Software VIP產(chǎn)品線高級(jí)總監(jiān)Christopher Browy提供了CXL與其他技術(shù)比較的見解:"基于PCIe SerDes的CXL具有更低的錯(cuò)誤率、更低的延遲和相應(yīng)的較低帶寬。NVLink和UALink使用以太網(wǎng)風(fēng)格的SerDes,導(dǎo)致高錯(cuò)誤率、高延遲和高帶寬,因此對(duì)于最高性能帶寬受限的情況,如GPU到GPU,這些技術(shù)具有優(yōu)勢(shì)。"* H. D# w- C$ T4 G$ x) |
2 H0 Y( u2 z. o未來展望1 w; f9 S0 \1 m! ?8 `5 v, ?( F X
CXL的未來看起來很有希望,Yole Research預(yù)測(cè)到2028年市場(chǎng)將達(dá)到160億美元。隨著技術(shù)的成熟,可以期待看到:
' @9 k9 o1 f9 s& e* _繼續(xù)用于內(nèi)存擴(kuò)展進(jìn)一步實(shí)現(xiàn)異構(gòu)計(jì)算增強(qiáng)數(shù)據(jù)中心分解最小化服務(wù)器過度配置按需訪問內(nèi)存、存儲(chǔ)和加速資源
0 P0 U2 ]+ b0 J+ J9 q; B5 k9 r, T0 l% d' q$ l1 D
CXL聯(lián)盟營(yíng)銷工作組聯(lián)合主席兼英特爾高級(jí)營(yíng)銷經(jīng)理Anil Godbole強(qiáng)調(diào),CXL正在成為主流:"隨著我們推出CXL,每個(gè)CPU都將具有CXL功能,因此現(xiàn)在正成為主流。"
8 @/ H7 f8 D1 K8 J# w+ H+ _8 o8 [, I! Z6 z: V# Y
結(jié)論
# x! P) I& b8 |3 e0 o3 ]CXL迅速發(fā)展成為現(xiàn)代計(jì)算架構(gòu)中的重要技術(shù)。其高效連接和池化內(nèi)存資源的能力,加上fabric能力和安全功能的持續(xù)改進(jìn),使CXL成為未來數(shù)據(jù)中心和高性能計(jì)算設(shè)計(jì)中的關(guān)鍵參與者。隨著技術(shù)繼續(xù)成熟并獲得廣泛采用,可以期待看到利用CXL獨(dú)特能力的創(chuàng)新解決方案,以滿足數(shù)據(jù)密集型應(yīng)用和異構(gòu)計(jì)算環(huán)境日益增長(zhǎng)的需求。( l0 I& W7 O5 b5 r9 |1 m0 m
+ d1 Y& S% Y5 x# f/ E8 F$ E- y. {
參考文獻(xiàn)
" P4 s. W/ s% Q, B5 l: {7 a5 J[1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online].7 k/ f- f! d* [# C8 R
END4 q( h) V7 I" `9 b& I. V
; G, R* M/ g( k
# p# i( H' _# Y1 I( Q' B3 d
軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
7 V' B3 T8 Y3 o) y7 X1 l& G點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
6 N6 V3 }" X# R; l6 p2 J2 y9 |, V! |0 N2 i4 R4 l* ]2 ~2 u# D ~; ]
歡迎轉(zhuǎn)載
' t9 ]( C6 H* V! Y9 q: O
/ K& f( Q3 L5 `8 k/ w轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
6 H2 @$ z5 H7 @: s
8 ?7 \; X/ o# i/ Y
- C7 f0 z K4 e G3 g& O
1 a+ l0 F' ~9 y+ X0 D$ h
5n2oxhiqkds64076743713.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
5n2oxhiqkds64076743713.gif
2024-11-2 01:17 上傳
y( }- D: ?0 k) R
) l. ]) V; S* y R) W" e
關(guān)注我們
; H1 ~+ A+ i4 |$ B' Z8 L: M* i* d0 a1 Q% p7 `4 [
' o- ?" A6 v8 T R2 u3 w
rvd1e5k2qu464076743813.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
rvd1e5k2qu464076743813.png
2024-11-2 01:17 上傳
8 W; z4 t. Q' i( Z
|
1 d7 n4 _! C8 K
yq04wwlhj0e64076743913.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
yq04wwlhj0e64076743913.png
2024-11-2 01:17 上傳
) }" f) M1 }! Y3 H0 E2 w | 6 l; G) }+ o) M8 a6 U U
svsnew3foyh64076744013.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
svsnew3foyh64076744013.png
2024-11-2 01:17 上傳
C+ t$ ^& J: A5 |4 g/ L5 @, m
|
+ Y) |5 i0 m# J7 J- D; }' U5 Z. d( i3 o; H9 z R
6 Z* u( B p0 ^9 H7 ^$ X7 c" Z0 {& T2 |
關(guān)于我們:" ~" R( R0 y4 H( H) z2 B$ N) T
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
( l. F# P$ b \- s6 d0 v3 S0 e2 X
: ~ K* \. ]1 B Y/ |$ Y1 Rhttp://www.latitudeda.com/
2 _# |/ Y6 k {1 S/ b. |(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|