電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 173|回復(fù): 0
收起左側(cè)

理解Compute Express Link(CXL)內(nèi)存互連技術(shù)

[復(fù)制鏈接]

686

主題

686

帖子

5863

積分

四級會員

Rank: 4

積分
5863
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-10-31 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
% A& n6 X/ L% R4 ]' g在快速發(fā)展的計算領(lǐng)域中,高效的內(nèi)存管理和互連技術(shù)對系統(tǒng)性能起著關(guān)鍵作用。計算快速鏈接(Compute Express Link,CXL)已成為連接內(nèi)存與各種處理元件以及在數(shù)據(jù)中心內(nèi)共享內(nèi)存資源的主要協(xié)議。本文探討CXL的功能、演變及其對現(xiàn)代計算架構(gòu)的影響[1]。
- a6 \7 f/ \1 e  C3 H* P: O
4 }  b8 |5 F8 I什么是CXL?1 u5 |4 O3 G3 U0 n* |  P
計算快速鏈接(CXL)是建立在PCI Express(PCIe)基礎(chǔ)上的開放行業(yè)標(biāo)準(zhǔn)互連技術(shù)。它于2019年3月首次提出,此后獲得了主要芯片制造商的廣泛支持。CXL的主要功能是通過串行通信連接CPU、GPU、FPGA和其他專用加速器,同時允許跨器件池化內(nèi)存以提高利用率和資源效率。+ f6 Z: ]1 x+ w* b

3 O0 z4 h* t! U- J: JCXL由三個子協(xié)議組成:
  • CXL.io
  • CXL.cache
  • CXL.memory5 u8 i1 ^" ~3 W2 b0 K
    [/ol]
    $ _1 W/ ~1 p& K$ e# M* ^$ U其中,CXL.memory因其在數(shù)據(jù)中心內(nèi)存擴(kuò)展和先進(jìn)AI拓?fù)渲械臐摿Χ鹆俗疃嚓P(guān)注。+ ?0 P7 K  E2 s( ^- Y: }1 J, ]

    1 \- M, v' \; [9 I" y: q% c7 _. o. b
    % A) N+ W; R$ X% W( v# r' _圖1展示了CXL版本3.0和3.1的擴(kuò)展功能,突出了該協(xié)議的演進(jìn)和能力。- V& j6 ?. u( I; V$ I" ]
    0 M# Q9 o1 f9 p6 O5 a; w
    CXL與其他互連技術(shù)的比較
    9 \; y) z1 ^" s- _" I雖然CXL經(jīng)常被與NVIDIA的NVLink(用于連接GPU的高帶寬技術(shù))相比較,但它已經(jīng)沿著不同的路徑發(fā)展。CXL的主要焦點已從加速器到主機通信轉(zhuǎn)向內(nèi)存連接。
    0 S+ y& ?7 ]: l+ n+ Z
    6 Z3 }  V) I- I6 R9 g! gRambus高級產(chǎn)品營銷經(jīng)理Zaman Mollah解釋道:"CXL將與其他類似的互連技術(shù)共存,有自己的應(yīng)用和使用場景。CXL可能無法提供GPU中心的AI應(yīng)用所需的帶寬,但在加速器和基于CPU的AI用例中有用處。"' N5 i7 i" M% |
    $ p: ^5 \: F& `% x  Z
    CXL的獨特優(yōu)勢包括:4 k; c1 u4 K# D4 v% G) S9 O2 c
  • 增加容量和帶寬的內(nèi)存擴(kuò)展
  • 內(nèi)存重用
  • 智能內(nèi)存分層應(yīng)用
  • 可組合的數(shù)據(jù)中心架構(gòu)
  • 以可接受的延遲靈活且經(jīng)濟(jì)地增加內(nèi)存容量和帶寬
    8 d0 y* o+ G  C, B- g; [( r

    * p1 Y& a. V6 ?1 r1 j3 XCXL的演變:從1.0到3.17 A  }) q# I3 W" G# `) ^" t8 v
    自誕生以來,CXL經(jīng)歷了幾次修訂,每個版本都引入了新功能和能力:  O' f! N: j% j" \
  • CXL 1.0(2019):初始發(fā)布
  • CXL 2.0(2020):增強內(nèi)存池化和共享
  • CXL 3.0(2022):引入fabric能力
  • CXL 3.1(2023):改進(jìn)fabric管理能力和安全功能# {; i# i" H% \% y& U, g+ j
    9 K* L- t4 L* }; t% R$ j8 y7 w
    CXL 3.1:最新進(jìn)展- |% v/ a, y6 [' P8 V* v& J7 ?
    2023年11月發(fā)布的CXL 3.1規(guī)范為該協(xié)議帶來了顯著改進(jìn)。主要增強包括:% K# ^9 U. N9 W2 G" {
  • 改進(jìn)了分解系統(tǒng)的fabric管理能力
  • 優(yōu)化了資源利用
  • 擴(kuò)展了內(nèi)存共享和池化能力
  • 促進(jìn)了加速器之間的內(nèi)存共享5 ~& E( Z3 N9 D6 t) T- Q& l

    * r  G1 _) f3 y; C# f* ?5 v( D5 Y3 M. _! B

    9 R* U8 E" I3 R  p* y圖2說明了CXL 3.1中可信安全協(xié)議(TSP)如何增強安全性。
    - C0 {6 x& w7 Z
    0 J2 W; \6 ^1 [, w3 zRambus硅IP產(chǎn)品營銷高級總監(jiān)Lou Ternullo強調(diào)了CXL 3.1中的一些新功能:
  • CXL.IO點對點(P2P)
  • 無序I/O(UIO)
  • CXL.mem P2P
  • 可信執(zhí)行環(huán)境(TEE)操作碼
  • 跨PCIe傳輸層的完整性和數(shù)據(jù)加密(IDE)支持
    6 }) n' F$ a6 x# L. A$ |; T[/ol]$ Q# a. p7 ~6 ~. }: d' A$ y6 ~2 t/ F
    這些功能共同作用,減少延遲,提高安全性,并增強CXL fabric中端點和主機之間的通信。& H/ R! r) o# ~3 @) F4 v; ~5 R. f
    # c. }# H' l' C7 o  t' w6 [/ `
    * j7 i0 S2 x7 G4 t! L$ M
    圖3描述了CXL 3.1中引入的新全局集成內(nèi)存(GIM)概念。
    + H0 ?# ]/ P0 x' Q2 B' ?' {0 T/ ^, C; V! j5 q1 s0 H5 ^3 T
    Fabric能力和擴(kuò)展1 U. T1 p; h) r4 K1 j9 m
    CXL 3.1中最顯著的改進(jìn)之一是交換Fabric能力的增強。Ternullo解釋道:"現(xiàn)在可以處理基于端口的路由,這允許進(jìn)行規(guī)模擴(kuò)展部署。交換fabric不受傳統(tǒng)樹狀層次結(jié)構(gòu)的限制。允許主機和器件進(jìn)行跨域訪問,一個器件能夠訪問多達(dá)4,096個主機或其他器件。"
    6 g) B9 _" a$ h, s  F. y. N; P; f1 B* m
    這一進(jìn)步使設(shè)計者能夠?qū)崿F(xiàn)具有任意到任意通信的大型系統(tǒng)或拓?fù),為?shù)據(jù)中心架構(gòu)創(chuàng)造了新的可能性。( D* C" Q) ]* F6 n- H- B# y8 a% @& h

    , A. h7 Y1 m6 g& {% V0 |6 ]安全性和元數(shù)據(jù)增強
    ; J0 F. X) }( T4 X$ X4 SCXL 3.1還引入了重要的安全功能,包括:; U  ?6 M0 c8 ]8 v) j& K! H
  • 增強保護(hù)的可信安全協(xié)議
  • 擴(kuò)展的元數(shù)據(jù)能力(最多34位)
    * {5 q1 w% e' T( @
    1 f" e& n. }7 i& K7 `, g- H! d/ k0 o
    這些改進(jìn)對于通過fabric連接眾多虛擬機的規(guī)模擴(kuò)展部署非常重要,允許更好的監(jiān)控和診斷。' f" R: a0 {! R0 e* x
    6 R- \9 z) F6 a# F/ _: r% R
    內(nèi)存池化和擴(kuò)展. T% q% e% E5 t9 D- u& j/ w+ D5 p
    CXL最令人興奮的應(yīng)用之一是其促進(jìn)內(nèi)存池化和擴(kuò)展的能力。這一能力解決了數(shù)據(jù)密集型應(yīng)用(如AI和機器學(xué)習(xí)工作負(fù)載)對更多內(nèi)存的日益增長的需求。
    ! I  t% V2 `2 w6 p& D
    5 ^/ h) K2 ?" K3 G( D! Y' F* x: CCadence高級產(chǎn)品營銷總監(jiān)Arif Khan指出,盡管在成本和軟件復(fù)雜性方面存在一些批評,但實施者對使用CXL構(gòu)建內(nèi)存擴(kuò)展器和池化器件仍有很大興趣。
    2 q1 q$ d; F6 z7 Z- l; R
    ; f. S1 |! H/ Q( ]2 M' ], `" [' I 3 F2 Q) k; M. {* X6 O+ l
    圖4概述了CXL的使用案例和驗證解決方案,展示了該協(xié)議的多功能性。
    " F5 |9 _5 q) ^# D6 [" ~) @9 M. `" Q- m
    內(nèi)存池化的經(jīng)濟(jì)性特別具有吸引力,正如Rambus的Mollah解釋的那樣:"隨著每字節(jié)成本降低,內(nèi)存池化等高級應(yīng)用將變得更具吸引力,并允許分解的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低總擁有成本(TCO)。"
    2 a% i3 |2 C. |! W2 ~
    : V2 J, g' \# T( H! g0 P- nCXL在其他技術(shù)環(huán)境中的地位- N+ v% e) m$ C/ K8 Q0 k" n
    雖然CXL已經(jīng)獲得了顯著的關(guān)注,但了解其在其他互連技術(shù)中的位置很重要。Synopsys高級技術(shù)產(chǎn)品經(jīng)理Richard Solomon強調(diào),CXL應(yīng)被視為選擇范圍的一部分,類似于內(nèi)存如何有廣泛的產(chǎn)品來滿足特定需求。" t% o7 o+ m) j  m2 r
    % k; N) f5 X6 c( G5 y
    Siemens Digital Industries Software VIP產(chǎn)品線高級總監(jiān)Christopher Browy提供了CXL與其他技術(shù)比較的見解:"基于PCIe SerDes的CXL具有更低的錯誤率、更低的延遲和相應(yīng)的較低帶寬。NVLink和UALink使用以太網(wǎng)風(fēng)格的SerDes,導(dǎo)致高錯誤率、高延遲和高帶寬,因此對于最高性能帶寬受限的情況,如GPU到GPU,這些技術(shù)具有優(yōu)勢。"7 _5 E1 K) j$ Q  K$ A. i7 H5 D2 b0 w- J

    % U- q0 k& c3 r* B* w未來展望
    . W* ~, s, T1 I: k' ^4 XCXL的未來看起來很有希望,Yole Research預(yù)測到2028年市場將達(dá)到160億美元。隨著技術(shù)的成熟,可以期待看到:
    ) c3 x2 R& T& ^3 a/ W  X
  • 繼續(xù)用于內(nèi)存擴(kuò)展
  • 進(jìn)一步實現(xiàn)異構(gòu)計算
  • 增強數(shù)據(jù)中心分解
  • 最小化服務(wù)器過度配置
  • 按需訪問內(nèi)存、存儲和加速資源9 D% x# }* X/ p9 H7 \, Q1 L
    8 q5 b- m. Y( X5 w# ~4 N
    CXL聯(lián)盟營銷工作組聯(lián)合主席兼英特爾高級營銷經(jīng)理Anil Godbole強調(diào),CXL正在成為主流:"隨著我們推出CXL,每個CPU都將具有CXL功能,因此現(xiàn)在正成為主流。"
    ( ^8 c( L. R5 o' e, p' {) R9 {& K# g' w) {  j. Z7 p  Y9 ~
    結(jié)論7 V  F, a2 l5 k* T
    CXL迅速發(fā)展成為現(xiàn)代計算架構(gòu)中的重要技術(shù)。其高效連接和池化內(nèi)存資源的能力,加上fabric能力和安全功能的持續(xù)改進(jìn),使CXL成為未來數(shù)據(jù)中心和高性能計算設(shè)計中的關(guān)鍵參與者。隨著技術(shù)繼續(xù)成熟并獲得廣泛采用,可以期待看到利用CXL獨特能力的創(chuàng)新解決方案,以滿足數(shù)據(jù)密集型應(yīng)用和異構(gòu)計算環(huán)境日益增長的需求。
    1 }6 H( d( e1 f; a0 v' l. ?* E: R6 v) q/ ^( u; d3 {
    參考文獻(xiàn)  f/ G- ?) G: w% _* l
    [1] K. Heyman, "CXL Thriving As Memory Link," Semiconductor Engineering, Sep. 16, 2024. [Online]." Y! I# u5 r1 N6 O* p! p. d
    END3 d. j, M! ^, b2 I' h

    1 `. q( v6 i5 H5 }- c% Z2 w% J0 u3 e8 L, i- a
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。. C0 S  l2 y( \- Q7 I2 h
    點擊左下角"閱讀原文"馬上申請! t# y# s8 `6 w3 {9 L$ a

    9 S) V, Z' f3 V歡迎轉(zhuǎn)載
    6 j& u! Y- s7 J- @; `8 g/ Q# H7 P2 U! {
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!# A7 N: k; n2 R; X

    ( V6 I0 B! J: o# w6 R9 b0 d$ }
    $ |' O1 m  g& M3 A

      m, B/ j, ~! j
    2 Y3 ^7 ^* |7 r- n7 ]' H- F, F
    6 {5 y% S" K* s+ M1 \% }/ m% F- K關(guān)注我們
    " Q/ o$ I- y! r0 @$ {& Y, V- W+ v9 \/ T( {2 g2 c4 F+ `4 s/ O

    ! U& a6 C+ r- K! R: q
    ) p& o/ u# o7 l' t2 G8 H8 F9 d
    - c4 b; [! e3 K5 `4 R
    9 T3 T* L/ W+ g
    ! d$ F- c! O; q4 a
    3 j+ K9 Z' f+ t/ y" f0 [; k+ T
                         
    ) K" g( Q2 s& P2 N3 R, K, b( M% k1 A3 i# k" q: a

    $ v1 R8 \1 N/ f3 z$ l0 E7 y; f5 K  V" m4 W/ e
    關(guān)于我們:9 Z* n7 O: e, v3 r
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    : {* W) f7 j" T) K+ r
    8 F4 q! w/ _$ H4 t4 K0 K3 Q$ zhttp://www.latitudeda.com/
    $ c0 n$ s! }0 a7 C(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表