電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 659|回復(fù): 0
收起左側(cè)

Hot Chips 2024 | AMD下一代"Zen 5"核心性能和效率的進(jìn)展

[復(fù)制鏈接]

686

主題

686

帖子

5863

積分

四級(jí)會(huì)員

Rank: 4

積分
5863
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-27 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言1 n) ]3 T$ }; x9 B! Y" x6 u: S
本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對(duì)于計(jì)算行業(yè)的發(fā)展具有重要意義。
0 O" X" P5 C: J! Q. l
7 e; _+ J& q) e! E7 U8 _3 u0 ]; r"Zen 5"核心概述
4 J" K& ^# m+ q: B8 g  _# ~) T  g"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢(shì)的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時(shí)保持出色的能效比。
5 V3 p. k6 r7 N' @. ?- u6 O' I5 w0 ~4 i2 J1 |
8 e' [0 _* o$ n& @$ P$ w* P
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。
! a) O5 @. I; I
/ k9 e  i& P& x5 I$ ~( O( C" K"Zen 5"的主要特性:
  • 相比"Zen 4"提升16%的IPC(每時(shí)鐘周期指令數(shù))
  • 支持AVX-512變體和FP-512
  • 8寬度指令分發(fā)和6個(gè)ALU(算術(shù)邏輯單元)
  • 雙管線取指/解碼
  • 采用4nm/3nm制程工藝9 X  V# W3 i" h0 v% Q" @
    [/ol]
    / |" ^1 k1 V9 ]9 o微架構(gòu)深入分析
    ; x/ _; H/ m4 {$ L; }: w) b4 q"Zen 5"微架構(gòu)引入了多項(xiàng)增強(qiáng)功能,以提高性能和效率。- T2 h$ W( i) p) E$ R

    $ N) a0 U$ K0 g4 l
    ! _& @9 ^. L' I6 u! D. d: }圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個(gè)組件及其互連。' n7 R6 p+ b  T! H/ D

    7 H# H: X+ N2 h1 R* a% G; S1 X% u. v前端改進(jìn):( h# d7 d) C2 K* Q6 f6 K
  • 雙指令取指和解碼管線
  • 8寬度指令分發(fā)到整數(shù)或浮點(diǎn)單元
  • 增強(qiáng)的分支預(yù)測(cè),每周期可進(jìn)行2次預(yù)測(cè)
  • 更大的Op-Cache,可存儲(chǔ)6K條指令,每周期2x6寬度取指
    & r! u. ]! u# f7 W8 ~3 \

    7 ^" I: Q$ p* ~+ {執(zhí)行單元增強(qiáng):. r% K) H) }, }1 r( k$ O1 f
  • 6個(gè)整數(shù)ALU和4個(gè)AGU(地址生成單元)
  • 每周期4個(gè)浮點(diǎn)運(yùn)算,FADD(浮點(diǎn)加法)延遲為2周期
  • 完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量8 T, r- B4 [) [+ g- _
    + }8 d, `3 t' w, Q2 K1 k
    緩存和內(nèi)存子系統(tǒng):, }, k$ L) b6 Q/ Q/ y+ {8 K
  • 48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫入操作
  • 1MB 16路組相聯(lián)L2緩存
  • 改進(jìn)的L3緩存延遲
    - E, w8 [! `8 P

    ; b" F* y- G. Q% ]"Zen 5"家族和平臺(tái)支持& f  t5 |2 c2 W+ Y1 s! B5 w
    AMD推出了兩種"Zen 5"核心變體,以滿足不同市場(chǎng)細(xì)分的需求:
  • "Zen 5":優(yōu)化單線程性能
  • "Zen 5c":注重性能功耗比和性能面積比
    ; o3 W' Q* A9 V[/ol]6 f) `; j& |! W+ i

    # k' u# |% g; P% z$ v8 f5 K 7 T. G! X- E" H8 C2 }
    圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。6 T3 m1 L- d0 V9 o" I; Z
    9 n; p7 Z9 ]6 ]+ x8 Z6 T
    這種方法使AMD能夠針對(duì)從高性能臺(tái)式機(jī)到節(jié)能移動(dòng)設(shè)備的廣泛產(chǎn)品范圍。
    1 |( y6 h# l  E* |0 \
    : O& k& ]4 r1 m8 {5 e) g# d4 Z新指令集架構(gòu)(ISA)特性' C( f8 l' D! x" G9 g) k7 Y! W- b
    "Zen 5"核心引入了幾項(xiàng)新指令和功能:4 Z# u. Y: U! Z* |% b+ h: a$ ]5 n- K
  • MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲(chǔ)指令
  • VP2INTERSECT[DQ]:AVX-512向量對(duì)交集
  • 3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令
  • PREFETCH[I*]:指令線的軟件預(yù)取
  • 增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)3 [' N. ]+ e2 [0 R( O2 O( X
    & t/ S7 C5 C3 r% l" I4 O
    性能提升) v" W; I/ |& w) N' w8 L
    AMD聲稱"Zen 5"核心在各種應(yīng)用和使用場(chǎng)景中都實(shí)現(xiàn)了顯著的性能提升。$ m! Q! \% d5 M( m4 z

    , L* @# F3 {3 J( Y4 Z6 E) V
    / i$ l! S( k3 r2 @. q圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個(gè)領(lǐng)域的改進(jìn)。
    ( X% p0 R( U% ]; o% f3 n4 n% F" u0 H- `2 m8 |1 a) _
    IPC提升
    * b( U5 g5 |* w; T; j"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):
    : N) r) [9 G  T
    9 ]  v6 a" \9 n) V( Z' H
    # m. N2 f* F% }# v4 J) u圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。
    4 l3 B4 s4 X4 Y. @$ \% [1 @. q& g2 i, M4 M: _
    AI和科學(xué)計(jì)算  A! |( i* B& J3 @9 }, K" X- R
    "Zen 5"核心在AI和科學(xué)計(jì)算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:
    6 \# X/ |/ f5 V
    . d- t2 F% X7 J/ Y) c
    " a2 b0 ~2 C: k, ~- J圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。
    3 k: \# A$ x$ t$ P) y
    ; \( ~% T8 X# W  t在SoC中的實(shí)現(xiàn)
    & v3 u- n" e$ {3 R"Zen 5"核心將被實(shí)現(xiàn)在各種系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)中,以滿足不同市場(chǎng)細(xì)分的需求。$ a' j5 y# }, U% C
    "Strix Point" SoC:2 M. h* q& Y, H4 D+ w
    : P; I; A, V& Z! t7 }
    圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。2 \5 t& l) v0 E- q+ v! o' U9 d

    0 T3 D: x5 T) b- O9 ^$ B"Strix Point"的主要特性:6 k& M& j; o2 u( I% J4 e) J
  • 異構(gòu)架構(gòu),包含4個(gè)"Zen 5"核心和8個(gè)"Zen 5c"核心
  • 集成RDNA 3.5圖形處理器,最多16個(gè)計(jì)算單元
  • XDNA 2推理引擎,用于AI加速
  • 支持DDR5/LPDDR5內(nèi)存
  • PCIe 4.0和USB4連接
    ( O1 `% J8 a2 Q0 k
    " u# F$ w! L9 T' f
    "Granite Ridge" SoC# J7 T' M# h* A( L) t" H% Z

    ' z0 {( G. i" K; L: a" m/ |; f圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺(tái)式機(jī)應(yīng)用設(shè)計(jì)。
    + v( R4 b, ?/ b9 e& J3 z; m. O3 q# ]: P9 B( K
    "Granite Ridge"的主要特性:/ W7 v* J+ f; ]4 O( R; I
  • 最多16個(gè)"Zen 5"核心(2個(gè)CCD,每個(gè)8核)
  • 每個(gè)CCD 32MB L3緩存
  • 支持DDR5內(nèi)存
  • PCIe 5.0連接
  • 兼容AM5插槽
    , H( ?7 Q4 C& q5 ]0 C3 Z

    ! c5 Y6 U1 \9 j8 {能效改進(jìn)
    / v5 R# E. X0 a+ S"Zen 5"核心在Zen系列的能效優(yōu)勢(shì)基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):
  • 增強(qiáng)的電源門控技術(shù)
  • 改進(jìn)的smt(同步多線程)支持,提高性能功耗比
  • 縮短電源狀態(tài)進(jìn)入/退出時(shí)間
  • 優(yōu)化分支預(yù)測(cè),減少無用工作
  • 高效的字符串操作和預(yù)取器改進(jìn)
    5 s+ ?% ^6 `5 m5 i: S[/ol]$ a/ L, Q) }; Z- U: a; P% I
    這些增強(qiáng)功能在保持出色能效的同時(shí),提高了整體系統(tǒng)性能。8 x7 `! ?' X; H1 W

    : v( b9 q/ F. m% |' R' ^7 p/ {RDNA 3.5圖形架構(gòu)
    ) n! K) e$ q9 I  J對(duì)于移動(dòng)應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:
    ! F. O" l3 G' y' O6 j# G& I
    & X3 D( ?/ k4 V( w( H圖9:概述了為移動(dòng)應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。9 O6 ]6 I- y6 S1 c
    ' @- }3 Y8 R( |# H, T& P
    RDNA 3.5的主要改進(jìn):4 x7 Q2 s9 B! e1 I* V* \( u1 J( R+ w
  • 2倍采樣率和點(diǎn)采樣加速
  • 增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍
  • 改進(jìn)的光柵化子系統(tǒng),通過子批處理提高效率
  • 針對(duì)LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮
  • 更大的引擎配置,包括8個(gè)WGP(工作組處理器)和4個(gè)RB+(渲染后端+)
    2 y+ [/ c. {- D, Q

    3 Z' J/ U, Q& t) WAMD Ryzen AI與XDNA 2架構(gòu)( L& y1 o; K& Z8 \2 T8 y% R  j" e
    為了滿足個(gè)人計(jì)算機(jī)對(duì)AI能力日益增長(zhǎng)的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
    3 L8 J' i1 C3 H 7 D& j$ J' q5 c8 `4 m9 p6 b0 {
    圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。. V# ~+ x; j: I6 @. ]6 w& _

    - W  X% K& C, G. r9 A* X) [XDNA 2的主要特性:3 A: y$ |- d' t2 D" t% [9 L
  • 最高50 INT8 TOPS(每秒萬億次運(yùn)算)和50 Block FP16 TFLOPS
  • 8個(gè)并發(fā)隔離空間流,提高多任務(wù)處理能力
  • 片上內(nèi)存容量比上一代增加1.6倍
  • 支持塊浮點(diǎn)和增強(qiáng)的非線性函數(shù)
  • 相比上一代產(chǎn)品,性能功耗比提高2倍9 Y+ d- M, e8 V8 s

    4 R$ L. ?: z# b% A/ H! [, a結(jié)論0 R( U1 P0 a+ f- Y5 O6 R6 W. v& x4 h6 M
    AMD "Zen 5"核心代表了x86處理器設(shè)計(jì)的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對(duì)AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿足從移動(dòng)設(shè)備到高性能服務(wù)器等各種市場(chǎng)細(xì)分的現(xiàn)代計(jì)算需求。$ K0 c3 I; v8 q- \  v

    , {3 q# F. L# X隨著AMD不斷創(chuàng)新和突破處理器設(shè)計(jì)的界限,可以期待未來會(huì)有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實(shí)現(xiàn),展示了AMD在競(jìng)爭(zhēng)激烈的處理器市場(chǎng)中提供領(lǐng)先性能和效率的承諾。
    ! t1 {4 L) F" j7 i
    $ T3 j. r$ L# {+ S% c參考文獻(xiàn)" ~# T; N; Z4 W) F, O
    [1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.
    . p; I4 l; z: F; o8 o6 ~# Y/ C
    ! M5 S1 N' l8 z/ y; V; w- END -% X7 E+ y* d) _; }
    ; G, y: U8 d, T9 B- _  p
    軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。/ c. S% }. P1 h) W. y
    點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
    2 U, c6 @* v2 T" s7 [; R# Z" A2 ]% @  K/ a
    歡迎轉(zhuǎn)載5 D; u1 i( ]% p6 W: Z0 ~, R9 T

    ; \& Q; f# F8 A5 b5 }7 L. t* _/ k轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!5 O4 i( O6 {( f1 L/ O# j8 y

    ' _$ A. E7 X9 x7 _7 _+ ?  B- J( S) `" I
    1 ?0 ^0 J4 _( g) Y/ X0 E
    ( u7 M1 p- {) d6 |1 X
    $ a4 h' g  L& o; m
    關(guān)注我們
    - K  I0 n3 \0 ~0 x' a8 K$ L, o% @; c* d0 z& b) R' r3 S0 v4 |

    # n  H8 H  i' z
    / o6 D3 Q4 t4 i# @' L2 @9 v: i
    6 T+ n' r% P2 w# h3 z9 V
    & s3 e/ f" w! t

    3 B+ J& Z) M" d+ S. }1 y4 A/ m 3 U' W. A) O( B6 K3 T1 y' d, C  J
                         
    / E: h9 q9 v: o9 x* r2 }! Y
    8 C0 v8 j" h) i% M4 l$ r. [$ h& Y

    / v: j& w" g7 e4 o* {' o
    # c! K$ v' I, k3 P& ?關(guān)于我們:
    5 o, T7 i: H$ [6 _+ N. I, l深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    . M( j5 d* z; o! P) r
    $ R. B) ^) V0 Hhttp://www.latitudeda.com/+ ^* c+ T( q4 }
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表