|
引言2 c! |( m$ t. N& b" X! e5 c
在快速發(fā)展的計(jì)算領(lǐng)域中,高效的內(nèi)存管理和互連技術(shù)對(duì)系統(tǒng)性能起著關(guān)鍵作用。計(jì)算快速鏈接(Compute Express Link,CXL)已成為連接內(nèi)存與各種處理元件以及在數(shù)據(jù)中心內(nèi)共享內(nèi)存資源的主要協(xié)議。本文探討CXL的功能、演變及其對(duì)現(xiàn)代計(jì)算架構(gòu)的影響[1]。% R8 x3 R/ I. ^4 k# P f; ^
, O/ h- ~5 p+ x" k/ L8 X什么是CXL?: @0 A8 w7 y# U8 ~# p
計(jì)算快速鏈接(CXL)是建立在PCI Express(PCIe)基礎(chǔ)上的開放行業(yè)標(biāo)準(zhǔn)互連技術(shù)。它于2019年3月首次提出,此后獲得了主要芯片制造商的廣泛支持。CXL的主要功能是通過串行通信連接CPU、GPU、FPGA和其他專用加速器,同時(shí)允許跨器件池化內(nèi)存以提高利用率和資源效率。0 t, ~. S. U k! J
) [, G: W; A& W6 N
CXL由三個(gè)子協(xié)議組成:CXL.ioCXL.cacheCXL.memory
" I1 L" _) P H9 o[/ol]6 ^0 ?# m+ H: w0 B
其中,CXL.memory因其在數(shù)據(jù)中心內(nèi)存擴(kuò)展和先進(jìn)AI拓?fù)渲械臐摿Χ鹆俗疃嚓P(guān)注。
5 |1 M- b8 I3 r- ~: r5 ~: j! S8 R
1 c: z9 D3 J2 u' X: {1 N
w2p1sg53goz64076743312.png (190.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
w2p1sg53goz64076743312.png
2024-11-2 01:17 上傳
7 g' m, C$ _0 I# {0 a. q圖1展示了CXL版本3.0和3.1的擴(kuò)展功能,突出了該協(xié)議的演進(jìn)和能力。2 V5 ?* w' |5 I% o3 [
$ i0 G6 g) x0 e) q/ yCXL與其他互連技術(shù)的比較! X S9 Y) Y/ ~
雖然CXL經(jīng)常被與NVIDIA的NVLink(用于連接GPU的高帶寬技術(shù))相比較,但它已經(jīng)沿著不同的路徑發(fā)展。CXL的主要焦點(diǎn)已從加速器到主機(jī)通信轉(zhuǎn)向內(nèi)存連接。$ J* `2 Q& i( S T+ I1 w4 y5 H
* E, a1 P- A, C* l, y1 N t
Rambus高級(jí)產(chǎn)品營(yíng)銷經(jīng)理Zaman Mollah解釋道:"CXL將與其他類似的互連技術(shù)共存,有自己的應(yīng)用和使用場(chǎng)景。CXL可能無法提供GPU中心的AI應(yīng)用所需的帶寬,但在加速器和基于CPU的AI用例中有用處。"
7 G: ^* |7 r0 F2 D8 a2 }8 U/ N+ a q0 U
CXL的獨(dú)特優(yōu)勢(shì)包括:( _4 a: Q% E4 [
增加容量和帶寬的內(nèi)存擴(kuò)展內(nèi)存重用智能內(nèi)存分層應(yīng)用可組合的數(shù)據(jù)中心架構(gòu)以可接受的延遲靈活且經(jīng)濟(jì)地增加內(nèi)存容量和帶寬
4 ?- l" p7 y% e% E% t
0 }6 Y( Q* Q/ kCXL的演變:從1.0到3.11 Z7 [: p; q3 {6 I! ~" P6 Y
自誕生以來,CXL經(jīng)歷了幾次修訂,每個(gè)版本都引入了新功能和能力:
& l( G1 c: e& }) R3 w, ?0 _0 pCXL 1.0(2019):初始發(fā)布CXL 2.0(2020):增強(qiáng)內(nèi)存池化和共享CXL 3.0(2022):引入fabric能力CXL 3.1(2023):改進(jìn)fabric管理能力和安全功能3 ?" ~3 {" w' r) B, w
% i* B7 ]" m1 b& W4 g. x
CXL 3.1:最新進(jìn)展3 _+ r; k" i" _
2023年11月發(fā)布的CXL 3.1規(guī)范為該協(xié)議帶來了顯著改進(jìn)。主要增強(qiáng)包括:7 g! n7 y2 {8 o/ g6 o+ n( k' T% n
改進(jìn)了分解系統(tǒng)的fabric管理能力優(yōu)化了資源利用擴(kuò)展了內(nèi)存共享和池化能力促進(jìn)了加速器之間的內(nèi)存共享( i* Z3 ~1 l; \7 m. y( c: g# B8 ]8 e
% |& l& j* v1 d9 T N0 C' _5 }5 m$ }2 O, Z# a. J
t4elzqgmvlc64076743412.png (261.36 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
t4elzqgmvlc64076743412.png
2024-11-2 01:17 上傳
8 ~4 B3 O, b* w: w- L5 ?( {. D, a# ^/ w圖2說明了CXL 3.1中可信安全協(xié)議(TSP)如何增強(qiáng)安全性。" v$ { z9 @9 a8 q6 m
7 y* N% x0 | x3 tRambus硅IP產(chǎn)品營(yíng)銷高級(jí)總監(jiān)Lou Ternullo強(qiáng)調(diào)了CXL 3.1中的一些新功能:CXL.IO點(diǎn)對(duì)點(diǎn)(P2P)無序I/O(UIO)CXL.mem P2P可信執(zhí)行環(huán)境(TEE)操作碼跨PCIe傳輸層的完整性和數(shù)據(jù)加密(IDE)支持! {5 n& S5 P6 z5 O* I5 E
[/ol]
; R" r6 Z: S2 b. t/ }9 \' p7 I) w這些功能共同作用,減少延遲,提高安全性,并增強(qiáng)CXL fabric中端點(diǎn)和主機(jī)之間的通信。
+ G) t2 I% Z9 |8 D
6 O2 P: M8 d9 S( y
ruof03je2pj64076743513.png (216.31 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
ruof03je2pj64076743513.png
2024-11-2 01:17 上傳
& K( ~0 g5 e: g* J K& S* g
圖3描述了CXL 3.1中引入的新全局集成內(nèi)存(GIM)概念。
- k3 f" p2 K7 X$ k/ |; i$ ~8 f2 o# C9 w$ _! B2 \- K8 Y
Fabric能力和擴(kuò)展
! U4 t/ w, I4 K2 U& A+ wCXL 3.1中最顯著的改進(jìn)之一是交換Fabric能力的增強(qiáng)。Ternullo解釋道:"現(xiàn)在可以處理基于端口的路由,這允許進(jìn)行規(guī)模擴(kuò)展部署。交換fabric不受傳統(tǒng)樹狀層次結(jié)構(gòu)的限制。允許主機(jī)和器件進(jìn)行跨域訪問,一個(gè)器件能夠訪問多達(dá)4,096個(gè)主機(jī)或其他器件。"
: a, W6 t' r2 Z3 Z# W. h, ]1 J/ ^) { p
這一進(jìn)步使設(shè)計(jì)者能夠?qū)崿F(xiàn)具有任意到任意通信的大型系統(tǒng)或拓?fù),為?shù)據(jù)中心架構(gòu)創(chuàng)造了新的可能性。" }& q8 W$ y# P- q& Q ]8 |
4 y5 Y9 j" ^1 ^安全性和元數(shù)據(jù)增強(qiáng)
3 d1 m. y) Y: yCXL 3.1還引入了重要的安全功能,包括:8 |3 X6 ]8 R2 o' @2 y
增強(qiáng)保護(hù)的可信安全協(xié)議擴(kuò)展的元數(shù)據(jù)能力(最多34位)
+ l; U9 n$ z+ D. t/ Y1 O5 e$ J2 P; l( v0 X
這些改進(jìn)對(duì)于通過fabric連接眾多虛擬機(jī)的規(guī)模擴(kuò)展部署非常重要,允許更好的監(jiān)控和診斷。* z7 I1 j/ C( T0 c! L
5 p7 a$ q |. @9 G& H& Q* b/ z
內(nèi)存池化和擴(kuò)展
" ^) B3 b6 n" u8 }0 A' }CXL最令人興奮的應(yīng)用之一是其促進(jìn)內(nèi)存池化和擴(kuò)展的能力。這一能力解決了數(shù)據(jù)密集型應(yīng)用(如AI和機(jī)器學(xué)習(xí)工作負(fù)載)對(duì)更多內(nèi)存的日益增長(zhǎng)的需求。
5 ^6 Z1 K% x: m8 o5 n- n0 o2 m9 D8 k7 ^0 x% K; L6 [, |/ e c
Cadence高級(jí)產(chǎn)品營(yíng)銷總監(jiān)Arif Khan指出,盡管在成本和軟件復(fù)雜性方面存在一些批評(píng),但實(shí)施者對(duì)使用CXL構(gòu)建內(nèi)存擴(kuò)展器和池化器件仍有很大興趣。
* [3 s6 P- r8 B. i8 A5 A
& u+ K9 X6 ?; h' w& [7 H
qf22ywzfth364076743613.png (549.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
qf22ywzfth364076743613.png
2024-11-2 01:17 上傳
/ H9 Q0 S( \) D圖4概述了CXL的使用案例和驗(yàn)證解決方案,展示了該協(xié)議的多功能性。7 W" H |( F- v4 q/ Q! D
% h3 s0 K: D' U& o- N2 b內(nèi)存池化的經(jīng)濟(jì)性特別具有吸引力,正如Rambus的Mollah解釋的那樣:"隨著每字節(jié)成本降低,內(nèi)存池化等高級(jí)應(yīng)用將變得更具吸引力,并允許分解的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低總擁有成本(TCO)。"
x% `. @. e, x& L
, ~$ t! h. B: ]: t& {1 }CXL在其他技術(shù)環(huán)境中的地位
4 i2 l8 P8 {, P1 u雖然CXL已經(jīng)獲得了顯著的關(guān)注,但了解其在其他互連技術(shù)中的位置很重要。Synopsys高級(jí)技術(shù)產(chǎn)品經(jīng)理Richard Solomon強(qiáng)調(diào),CXL應(yīng)被視為選擇范圍的一部分,類似于內(nèi)存如何有廣泛的產(chǎn)品來滿足特定需求。7 F/ }( m) e( I2 @2 `; D: z: s% n
/ W6 A a7 A6 A" e$ `7 ]Siemens Digital Industries Software VIP產(chǎn)品線高級(jí)總監(jiān)Christopher Browy提供了CXL與其他技術(shù)比較的見解:"基于PCIe SerDes的CXL具有更低的錯(cuò)誤率、更低的延遲和相應(yīng)的較低帶寬。NVLink和UALink使用以太網(wǎng)風(fēng)格的SerDes,導(dǎo)致高錯(cuò)誤率、高延遲和高帶寬,因此對(duì)于最高性能帶寬受限的情況,如GPU到GPU,這些技術(shù)具有優(yōu)勢(shì)。"
: \ N. D o/ @2 l% N% l% t8 J! X8 \. ^- M4 ^' {
未來展望
: P [7 p3 [) S4 Y# Z7 [* d9 XCXL的未來看起來很有希望,Yole Research預(yù)測(cè)到2028年市場(chǎng)將達(dá)到160億美元。隨著技術(shù)的成熟,可以期待看到:3 f* @0 z2 s4 v! _0 J6 k
繼續(xù)用于內(nèi)存擴(kuò)展進(jìn)一步實(shí)現(xiàn)異構(gòu)計(jì)算增強(qiáng)數(shù)據(jù)中心分解最小化服務(wù)器過度配置按需訪問內(nèi)存、存儲(chǔ)和加速資源
4 n( K) a$ |# Z9 V; z& x/ g/ s& o* h l5 Z- D1 X+ D( \8 g
CXL聯(lián)盟營(yíng)銷工作組聯(lián)合主席兼英特爾高級(jí)營(yíng)銷經(jīng)理Anil Godbole強(qiáng)調(diào),CXL正在成為主流:"隨著我們推出CXL,每個(gè)CPU都將具有CXL功能,因此現(xiàn)在正成為主流。"
" E5 N7 M1 |2 T s1 o- E
& F0 _$ @7 v, l" L4 q, a# P9 P結(jié)論3 s3 I* a- \- z1 x2 e" X- |
CXL迅速發(fā)展成為現(xiàn)代計(jì)算架構(gòu)中的重要技術(shù)。其高效連接和池化內(nèi)存資源的能力,加上fabric能力和安全功能的持續(xù)改進(jìn),使CXL成為未來數(shù)據(jù)中心和高性能計(jì)算設(shè)計(jì)中的關(guān)鍵參與者。隨著技術(shù)繼續(xù)成熟并獲得廣泛采用,可以期待看到利用CXL獨(dú)特能力的創(chuàng)新解決方案,以滿足數(shù)據(jù)密集型應(yīng)用和異構(gòu)計(jì)算環(huán)境日益增長(zhǎng)的需求。% s+ o8 L2 [3 O; M9 `
0 O1 E% l4 e: J& `; F% D# `. B. `- t參考文獻(xiàn)
8 t) D: g- L' F* A; u1 X[1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online].
) F. |8 i8 P, c, |8 vEND2 T }' y8 ?4 X0 F' P* e
4 P5 N% W( o& q( R6 \' O; m3 C6 |7 z- b) @! a* w
軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。7 {5 z- S$ f9 s( E2 Y2 y, D! e
點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
) g7 c) X* j4 X: c5 |0 M
* A* a, x5 @ `* C4 Z+ z) ^歡迎轉(zhuǎn)載
2 V' T; p- Q. N
y1 L4 e1 n5 k5 Q) ]# j* e7 x轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!4 |& R9 a7 L$ p
# s2 r; r$ k% R/ M4 Z B
9 r3 P( ] d4 V
# e5 _" r' v- c9 l' f6 h
5n2oxhiqkds64076743713.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
5n2oxhiqkds64076743713.gif
2024-11-2 01:17 上傳
) V2 D$ |+ ?+ X6 u- L, ^* u
' Z/ u) n- O) s/ F
關(guān)注我們- S# Q- u! z' X# A
1 x: C, O8 f% M1 i/ P, ~ \. ` N; y5 I3 S8 Y y. |* w
rvd1e5k2qu464076743813.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
rvd1e5k2qu464076743813.png
2024-11-2 01:17 上傳
. u- w. w" \. ^4 l: E | , x- o' D3 b- L! Q8 `8 q3 Q3 r
yq04wwlhj0e64076743913.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
yq04wwlhj0e64076743913.png
2024-11-2 01:17 上傳
" r/ }3 ?" M$ }. ^2 Z! q" l# d6 ~) [
| ! J5 A0 N4 N. e$ G) Q7 u+ N$ h
svsnew3foyh64076744013.png (21.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
svsnew3foyh64076744013.png
2024-11-2 01:17 上傳
, ?/ Z" S+ ?) V# s- ^- i
| " a- @5 z& ~; l( p- q% b# O% }
+ B# f. _0 t: y% D! i6 W+ G9 i1 n* i7 e5 g0 v
/ ~' d, y# K6 ]* d' V
關(guān)于我們:; D8 S" \, i( h0 ], o
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
9 h; E3 a" y0 R2 J' e3 @+ E0 ^' o; W+ S
http://www.latitudeda.com/
& M6 v. [; e) [2 o% Q7 y; G(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|