電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 81|回復(fù): 0
收起左側(cè)

以GPU為中心的通信

[復(fù)制鏈接]

433

主題

433

帖子

3062

積分

四級會員

Rank: 4

積分
3062
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-30 08:01:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
引言
% X3 W2 p1 u* U1 N/ y高性能計算(HPC)和機(jī)器學(xué)習(xí)(ML)領(lǐng)域已經(jīng)因GPU的廣泛應(yīng)用而發(fā)生了變革。截至2024年6月,世界排名前10的超級計算機(jī)中有9個依賴GPU集群進(jìn)行加速。GPU在計算方面表現(xiàn)出色,但GPU之間的通信可能成為重大瓶頸,特別是當(dāng)每個節(jié)點(diǎn)和集群中的GPU數(shù)量增加時。
3 s# a8 a" h, r. f0 u( O0 E  o/ E) ^3 L. U
傳統(tǒng)上,多GPU通信由CPU管理。然而,近期以GPU為中心的通信進(jìn)展正在挑戰(zhàn)這一范式,減少CPU參與,賦予GPU更多通信任務(wù)自主權(quán),并解決多GPU通信與計算之間的不匹配問題[1]。; i6 C0 d6 m  b! P

0 T( g2 f% w5 y3 u$ e
2 D% n# ?8 E4 Y6 w" @圖1:展示了不同類型的節(jié)點(diǎn)內(nèi)通信方法的數(shù)據(jù)路徑和API調(diào)用。
2 a4 O  `8 s/ G" N4 J& D- L. Y. e* X& u7 Z" m
理解GPU中心通信+ G/ i6 L. P+ \! p( B
GPU中心通信可以廣泛定義為減少CPU在多GPU執(zhí)行關(guān)鍵路徑中參與的機(jī)制。這包括供應(yīng)商層面的改進(jìn)(賦予GPU通信自主權(quán))和利用這些改進(jìn)的用戶層面實(shí)現(xiàn)。; K2 j4 I4 f9 h$ C6 f% W6 f; y

1 ]6 w& U9 [- MGPU中心通信主要分為兩類:/ w+ X3 J% b" _4 s$ k4 {
  • 節(jié)點(diǎn)內(nèi)通信:在單個節(jié)點(diǎn)內(nèi)進(jìn)行通信,該節(jié)點(diǎn)包含多個連接到共享內(nèi)存主機(jī)的GPU卡。
  • 節(jié)點(diǎn)間通信:跨多個節(jié)點(diǎn)進(jìn)行通信,每個GPU由不同的進(jìn)程控制,不同節(jié)點(diǎn)上的進(jìn)程之間不共享內(nèi)存。1 S! U4 u+ C/ A* p" u2 b2 K
    7 y( V+ t4 \+ \. c; ?
    支持GPU中心通信的關(guān)鍵技術(shù)
    : T, Z( z) E6 q% v幾項(xiàng)技術(shù)為高效的GPU中心通信奠定了基礎(chǔ):
    0 F5 {7 n, K& v  R; V: r/ X$ l7 t9 f! G- b, _4 y  b9 p! ?6 |+ ~9 O
    1. 統(tǒng)一虛擬尋址(UVA):在CUDA 4.0中引入,UVA允許節(jié)點(diǎn)內(nèi)的所有GPU和CPU共享同一統(tǒng)一虛擬地址空間,簡化了內(nèi)存管理。2 r* k3 F& {9 o: B! o
    & l8 S% j; T1 a) P: S; P
    2. GPUDirect:一系列優(yōu)化GPU與其他器件之間數(shù)據(jù)傳輸?shù)募夹g(shù):! p, z" z/ K9 s5 _
  • GPUDirect RDMA:支持NVIDIA GPU跨節(jié)點(diǎn)直接通信,無需CPU參與。
  • GPUDirect P2P:允許同一PCIe根復(fù)合體上的GPU之間直接內(nèi)存訪問。$ }& C' n$ D& P' A$ w
    7 q) N8 ^; Y4 x; A0 N- G
    3. NVLink:高帶寬、低延遲的GPU到GPU互連,顯著提高了GPU之間的數(shù)據(jù)傳輸速率。
    5 Y1 c3 T* w, a! l1 r  G- U0 F& z7 T

    1 P6 C, u0 G$ ~圖2:呈現(xiàn)了NVIDIA支持GPU中心通信和網(wǎng)絡(luò)的技術(shù)時間線。# c, m8 B# a, k) h9 B# n& g, g
    3 n( S8 V+ q/ P- b
    4. CUDA IPC:允許同一節(jié)點(diǎn)上的進(jìn)程訪問其他進(jìn)程的器件緩沖區(qū),無需額外復(fù)制。( J3 i6 C2 ]3 `. D  m* O
    ' N8 j' C) B# q5 p
    5. 統(tǒng)一內(nèi)存(UVM):創(chuàng)建一個節(jié)點(diǎn)內(nèi)所有處理器可訪問的單一地址空間,自動管理CPU和GPU內(nèi)存之間的數(shù)據(jù)移動。
    7 O: S* Q1 M# ?8 ]0 T
    ( r) Z+ l5 f. |: I
    $ a! n( O7 F/ s8 T2 V
    GPU中心通信庫! l# q7 W- }) Q* q3 Q
    幾個庫已經(jīng)開發(fā)出來利用這些技術(shù)并提供高效GPU為中心的通信:
    + N/ d$ t4 M- Q; ^) }, l
  • GPU感知MPI:可以區(qū)分主機(jī)和器件緩沖區(qū)的MPI實(shí)現(xiàn),允許GPU之間直接通信,無需通過主機(jī)內(nèi)存中轉(zhuǎn)。
  • NCCL (NVIDIA集體通信庫):提供針對深度學(xué)習(xí)工作負(fù)載優(yōu)化的拓?fù)涓兄w原語,用于GPU間通信。
  • NVSHMEM:NVIDIA對CUDA器件OpenSHMEM規(guī)范的實(shí)現(xiàn),為進(jìn)程提供高效的單邊put/get API以訪問遠(yuǎn)程數(shù)據(jù)對象。
  • ROC_SHMEM:AMD對NVSHMEM的對應(yīng)實(shí)現(xiàn),為AMD GPU提供類似功能。: V3 r5 t7 S. A
    [/ol]1 _9 F' u. z$ ~" ]. y
    , U  l1 P/ x! S0 j( Z8 T+ D/ e

    ! d1 b' `7 `$ Y. P# |圖3:展示了各種以GPU為中心的通信方法的節(jié)點(diǎn)間通信數(shù)據(jù)和控制路徑。
    1 r% e0 o" Q3 B6 J) B  j2 S( {# n/ f/ F7 v+ N" E9 D+ b
      |% O, x* D# c, J/ N
    挑戰(zhàn)和未來方向0 I0 @9 ?7 D9 {! H6 {$ p0 Y
    以GPU為中心的通信提供了顯著優(yōu)勢,但仍存在幾個挑戰(zhàn)和未來研究方向:: V6 t- O* N5 {4 v
  • 語義不匹配:MPI和GPU編程模型之間存在根本的語義不匹配,因?yàn)镸PI不了解GPU流。這可能導(dǎo)致強(qiáng)制同步和內(nèi)核啟動流水線受損。
  • 資源爭用:當(dāng)通信和計算都由GPU線程執(zhí)行時,它們會爭用相同的有限資源,可能導(dǎo)致性能問題。
  • 內(nèi)存一致性:確保內(nèi)核運(yùn)行時GPU和NIC內(nèi)存之間的一致性可能具有挑戰(zhàn)性,特別是對于持久內(nèi)核。
  • 集體算法設(shè)計:多GPU系統(tǒng)復(fù)雜且非傳統(tǒng)的拓?fù)浣Y(jié)構(gòu),以及GPU對之間不均勻的帶寬,使設(shè)計高效的集體通信算法變得復(fù)雜。( o' w7 H) s0 I1 v/ n
    [/ol]
    2 H6 G7 ]3 @$ j9 K* z+ Q未來研究方向包括:$ Q, ?' b7 z6 S3 h1 V8 H. d" g
  • 無CPU網(wǎng)絡(luò):將整個網(wǎng)絡(luò)棧移至GPU,實(shí)現(xiàn)完全自主的多GPU執(zhí)行。
  • 更廣泛的GPU自主性:使GPU能夠處理傳統(tǒng)上由CPU管理的任務(wù),如文件系統(tǒng)訪問和系統(tǒng)調(diào)用。
  • 改進(jìn)調(diào)試和分析工具:開發(fā)能夠監(jiān)控和可視化GPU中心通信的工具,包括器件原生傳輸和多GPU環(huán)境中的競爭檢測。
    * l0 U, F% M8 M2 {6 f+ B% P[/ol]
    & F5 e- B# s5 [& H+ D8 N; d結(jié)論1 l+ {% u- u% j  B! o
    以GPU為中心的通信代表了多GPU執(zhí)行范式的重大轉(zhuǎn)變,提供了提高性能、降低延遲和增強(qiáng)可擴(kuò)展性的潛力。隨著GPU繼續(xù)主導(dǎo)HPC和ML領(lǐng)域,理解和利用這些通信技術(shù)對于開發(fā)人員、研究人員和系統(tǒng)設(shè)計師來說將變得越來越重要,以便從多GPU系統(tǒng)中獲得最大性能。
    ( x+ A  e. \8 K) O. c, D$ ^
    " D& u; ~6 Y* C) W+ _以GPU為中心的通信領(lǐng)域正在迅速發(fā)展,新的硬件特性、軟件庫和編程模型不斷涌現(xiàn)。了解這些發(fā)展及其影響對于任何使用大規(guī)模GPU加速系統(tǒng)的人來說都是必要的。
    7 {- Z8 a- x& I. D- J' R1 M, V2 E9 I1 F2 z* ]
    展望未來,可以期待GPU中心通信的進(jìn)一步優(yōu)化,這將由硬件互連的進(jìn)步、更復(fù)雜的軟件庫和創(chuàng)新的編程模型推動。這些發(fā)展將繼續(xù)推動高性能計算和機(jī)器學(xué)習(xí)的邊界,使更復(fù)雜和要求更高的應(yīng)用能夠在大規(guī)模GPU集群上高效運(yùn)行。3 J  e& b& @' h- A6 \
    * M; s, y3 z0 {$ Z2 m8 j
    參考文獻(xiàn)
    : Y9 R) q% m9 G3 t/ V& [[1] D. Unat et al., "The Landscape of GPU-Centric Communication," ACM Comput. Surv., vol. 37, no. 4, Article 111, Aug. 2024.1 \2 v5 I) n8 g+ b0 A& k4 ^8 W
    7 f, r. b) Q* O; A' g  h) Z

    7 o& |4 Y+ q+ i; a% j8 J- END -
    * k' n4 r0 b9 b0 l" Q% W& L  k4 m! e5 d
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。/ S5 v; P# M# ]$ p: I1 O
    點(diǎn)擊左下角"閱讀原文"馬上申請6 |) y1 G" ?) l

    4 ?7 l! w+ }- U9 @歡迎轉(zhuǎn)載
    : v' A0 a5 w( V  ~* F+ l' s$ f5 U9 O2 \* x' T+ J5 {
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    - L1 n$ O1 x) s# K- B5 W
    ) c* Q2 K  r# [9 L6 L3 ]" ~
    9 `+ w* h& A( a) v/ W# D% J% A

    3 J! j9 l- \0 W2 @) Q1 X" y
    + s, \7 Z5 }; Z6 O
    & B4 n) A' e3 g$ e; I關(guān)注我們  i$ `% [) e  v; j; w; A

    3 @0 V. U4 o* r8 g! x2 @) c

    ' n( X& i2 \3 Z( ]7 l& i
    5 X8 e3 x: n( a$ H6 \- M2 a$ G
    8 E/ W- r) g8 V8 i

    1 d% p* r7 f3 n

    : p6 D( z  a' M: O. w$ }9 e
    ' n  [  `( u: t7 F; A
                          $ m+ I# M4 V9 d5 o* \  j* q

    2 p* }& O1 h; h9 q

    , d" b! C& r6 y& u
    5 H4 I$ C. Y0 [0 k5 w+ P關(guān)于我們:, V  d& [- N5 X8 _6 X
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。9 I5 n4 H+ n9 J: S5 d! \
    6 x' Y& Y9 H, g
    http://www.latitudeda.com/
    6 ~2 }6 X* ?0 k% i$ d6 r(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表