電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 660|回復(fù): 0
收起左側(cè)

Hot Chips 2024 | AMD下一代"Zen 5"核心性能和效率的進(jìn)展

[復(fù)制鏈接]

686

主題

686

帖子

5863

積分

四級會員

Rank: 4

積分
5863
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-27 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
: U1 g0 o0 w0 c' t: A, e本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對于計算行業(yè)的發(fā)展具有重要意義。5 X2 C* _% ?) j
' x% D" f, q$ t* O2 C3 i
"Zen 5"核心概述$ E2 K6 t- Q6 [: T, T
"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時保持出色的能效比。& l9 L4 l, ]! g" L4 @

$ T! k' G; b$ q5 U) h 2 X! `5 b( D  l3 N
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。
7 b0 N. I" W: r4 a% d* ~
2 K- W$ z  m3 p+ @  Q"Zen 5"的主要特性:
  • 相比"Zen 4"提升16%的IPC(每時鐘周期指令數(shù))
  • 支持AVX-512變體和FP-512
  • 8寬度指令分發(fā)和6個ALU(算術(shù)邏輯單元)
  • 雙管線取指/解碼
  • 采用4nm/3nm制程工藝
    * x2 v" }0 C! ^" A' Y' [2 b[/ol]
    * I! |: i0 G1 \8 K) y" O+ v/ k5 ]微架構(gòu)深入分析
    $ d5 `$ z  n/ M* z: ^"Zen 5"微架構(gòu)引入了多項增強(qiáng)功能,以提高性能和效率。
    : L9 @+ D6 H& |6 H  h* [+ G
    , T7 E2 k) n) L; _ ( b5 X, O, ]  o$ T
    圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個組件及其互連。% M; N- d/ o# J' i; H
    $ s- z% f7 M: E1 h
    前端改進(jìn):, b* t; P# E1 y' N" P/ {6 O
  • 雙指令取指和解碼管線
  • 8寬度指令分發(fā)到整數(shù)或浮點單元
  • 增強(qiáng)的分支預(yù)測,每周期可進(jìn)行2次預(yù)測
  • 更大的Op-Cache,可存儲6K條指令,每周期2x6寬度取指
    # R$ r* e8 {7 L. R# D% F& I

    - u) u# ^7 ?- s' @9 `* j8 D, q+ ~執(zhí)行單元增強(qiáng):
    + ~% p0 V7 s5 Y" l$ o/ f
  • 6個整數(shù)ALU和4個AGU(地址生成單元)
  • 每周期4個浮點運算,FADD(浮點加法)延遲為2周期
  • 完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量
    # X7 n. p& V# N! x9 ~

    $ \4 j% f2 @3 Z: X! b' I緩存和內(nèi)存子系統(tǒng):
    , ~" z0 P2 z. \: Z* z+ Q
  • 48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫入操作
  • 1MB 16路組相聯(lián)L2緩存
  • 改進(jìn)的L3緩存延遲" R9 j+ k' V9 @; O. S* m8 y
    + J% d0 N' r8 o8 f) l0 N9 T
    "Zen 5"家族和平臺支持
    6 C3 c/ H2 j6 a" X* L/ X) W8 kAMD推出了兩種"Zen 5"核心變體,以滿足不同市場細(xì)分的需求:
  • "Zen 5":優(yōu)化單線程性能
  • "Zen 5c":注重性能功耗比和性能面積比
    ( _8 u  R1 c7 e+ V8 S[/ol]5 N7 G9 z. Z- u
    2 m. U7 w' s3 r; b

    5 N5 `* e9 m$ E圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。
    0 S9 U* R" F( e* f" j' C  e/ E
    ' H/ Q' D9 Z3 H$ L6 I2 G. P這種方法使AMD能夠針對從高性能臺式機(jī)到節(jié)能移動設(shè)備的廣泛產(chǎn)品范圍。6 Q: I: C7 ^! m+ ]; O8 f

    ! N' ]4 q" T6 M3 e  b" \5 g新指令集架構(gòu)(ISA)特性" [7 j0 }4 C2 |
    "Zen 5"核心引入了幾項新指令和功能:
    + [; e2 k0 M5 c
  • MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲指令
  • VP2INTERSECT[DQ]:AVX-512向量對交集
  • 3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令
  • PREFETCH[I*]:指令線的軟件預(yù)取
  • 增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)
    0 ?$ d( r2 l; b, {( C, V7 P0 \
    & I" L* f8 q- M# }# Y3 g
    性能提升+ q( q! {  m2 D& W- ~7 T$ k1 e1 R
    AMD聲稱"Zen 5"核心在各種應(yīng)用和使用場景中都實現(xiàn)了顯著的性能提升。1 N6 i; @- p4 ^6 O/ P) `; B+ c

    9 D  g: N" X5 n% T# A# I$ I
    : \3 U6 C% G# K* W- \+ O! X6 M1 n圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個領(lǐng)域的改進(jìn)。5 R1 `  ^$ x( [' ]
    # Q. {' ^' c- [0 v0 e
    IPC提升
      ], G8 o1 O3 {$ M"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):6 w% r3 `/ z8 Y

    5 p8 \+ H* g: V. T0 a
    ' j$ Y6 E6 Q9 [1 Y  Z7 ~9 |# G5 W圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。3 p' ~2 v0 t% T  D
    ; @: w6 m8 ~1 ^. @: M+ Q0 _
    AI和科學(xué)計算
    3 [* ^: A$ N& |! [. f: a$ U4 u, j7 \"Zen 5"核心在AI和科學(xué)計算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:* h2 f  ^* O- Q4 M7 D% A$ q7 z

    3 }, g( j  g: y, p( R* H6 _ " O1 m; A. x  G% h$ ]
    圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。0 P5 Q; `) A6 m" `6 v9 @

    2 w7 n6 o% T. a# n' ~1 u: b* f在SoC中的實現(xiàn)! A+ }% R% n1 n/ f
    "Zen 5"核心將被實現(xiàn)在各種系統(tǒng)級芯片(SoC)設(shè)計中,以滿足不同市場細(xì)分的需求。% [: u. w/ @7 J4 F
    "Strix Point" SoC:- y3 O# u4 m/ q3 e
    & T4 b8 m% P. m. Z2 q
    圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。3 f4 j9 d3 M" O( s8 K4 a1 w

    , i2 `$ G- w% ~$ o9 ~$ G"Strix Point"的主要特性:: a. M( Q: Z4 Y2 {6 j  Y% G& U
  • 異構(gòu)架構(gòu),包含4個"Zen 5"核心和8個"Zen 5c"核心
  • 集成RDNA 3.5圖形處理器,最多16個計算單元
  • XDNA 2推理引擎,用于AI加速
  • 支持DDR5/LPDDR5內(nèi)存
  • PCIe 4.0和USB4連接: \( l8 Z' n2 g9 K
    , K$ \& \3 K9 o$ _. |
    "Granite Ridge" SoC
    * u8 t' a7 d3 I+ O* j  w8 E0 M   V( F/ B6 R2 R6 D; k* }! h# Z, ^
    圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺式機(jī)應(yīng)用設(shè)計。
    - p+ l2 H. P& g! R! K& n% m, f& b* X& \0 j8 M1 O' g
    "Granite Ridge"的主要特性:. P; B1 o. h4 n, F$ q
  • 最多16個"Zen 5"核心(2個CCD,每個8核)
  • 每個CCD 32MB L3緩存
  • 支持DDR5內(nèi)存
  • PCIe 5.0連接
  • 兼容AM5插槽/ ], O! p& T" H) P8 S, z
    4 U$ ?) U, D1 W+ z( Q' R/ M5 [
    能效改進(jìn)
    9 [- x: u; Q. M' \" l5 w; v) S) \"Zen 5"核心在Zen系列的能效優(yōu)勢基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):
  • 增強(qiáng)的電源門控技術(shù)
  • 改進(jìn)的smt(同步多線程)支持,提高性能功耗比
  • 縮短電源狀態(tài)進(jìn)入/退出時間
  • 優(yōu)化分支預(yù)測,減少無用工作
  • 高效的字符串操作和預(yù)取器改進(jìn)
    4 T, |# R( l  v2 s1 I[/ol]
    % {- S4 W$ F4 V( Q這些增強(qiáng)功能在保持出色能效的同時,提高了整體系統(tǒng)性能。
    + W; r5 g( z( I5 y7 I4 r& W: q- @5 E! d- @. X* |
    RDNA 3.5圖形架構(gòu)
    ' T; x6 d. u5 {, [: O! u對于移動應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:
    ) t3 s" z' V$ N$ {* a) g! E/ ^ 2 }2 l, z& _! M" L" Z0 W' {
    圖9:概述了為移動應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。
    3 _, r2 E5 c' }0 F" ~9 `5 {9 d2 M8 g* R0 i! N1 Z3 \
    RDNA 3.5的主要改進(jìn):
    ( N8 r+ }4 s, l; z. a) l
  • 2倍采樣率和點采樣加速
  • 增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍
  • 改進(jìn)的光柵化子系統(tǒng),通過子批處理提高效率
  • 針對LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮
  • 更大的引擎配置,包括8個WGP(工作組處理器)和4個RB+(渲染后端+)
    # \: p4 f. s4 }5 ^/ H

    ' U9 @' r& @7 c0 }( z& V( vAMD Ryzen AI與XDNA 2架構(gòu)
    " Q+ k# w0 @: G/ y為了滿足個人計算機(jī)對AI能力日益增長的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
    $ F' L' v: U; m ( F1 f1 p0 N3 Q6 C$ O) |. C
    圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。; v( Q4 E; t# p
    8 {/ a: {' t+ b, |. x
    XDNA 2的主要特性:- ~/ v2 Q6 a: l2 ^% M. L" B) B
  • 最高50 INT8 TOPS(每秒萬億次運算)和50 Block FP16 TFLOPS
  • 8個并發(fā)隔離空間流,提高多任務(wù)處理能力
  • 片上內(nèi)存容量比上一代增加1.6倍
  • 支持塊浮點和增強(qiáng)的非線性函數(shù)
  • 相比上一代產(chǎn)品,性能功耗比提高2倍% T, j* @8 ?6 D( x+ N
    2 t* S$ J4 N2 U7 N! R
    結(jié)論
    + B, y0 ^) u7 rAMD "Zen 5"核心代表了x86處理器設(shè)計的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿足從移動設(shè)備到高性能服務(wù)器等各種市場細(xì)分的現(xiàn)代計算需求。7 O1 I/ k1 k  t: w
    , D) T5 T' ]1 U' F* d' m( a
    隨著AMD不斷創(chuàng)新和突破處理器設(shè)計的界限,可以期待未來會有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實現(xiàn),展示了AMD在競爭激烈的處理器市場中提供領(lǐng)先性能和效率的承諾。
      U8 S0 L8 B4 c. E0 t  q
    4 a5 n9 p+ @1 M) K1 T, s) R參考文獻(xiàn)
    2 G, p2 e( Y2 |7 U3 d% w" t! y[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.
    - V; Z( P" A5 {9 k/ ]8 ~9 R4 m" X4 A" C, j. X7 Q
    - END -' Z  B# P( H/ Y2 I6 m" ?
    9 B  K* T+ s2 _0 G- u
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。( F9 k* C! e- w; m6 T: l- X
    點擊左下角"閱讀原文"馬上申請
    4 y) X$ R1 ?4 O# ?9 D6 _  Q" i; k" R2 |5 I! }; F! P
    歡迎轉(zhuǎn)載3 j7 E6 Y7 p3 V6 B) T

    1 B# Z# n' o/ U' ]; D8 Z6 H轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!7 y* j  Z0 v" M, E" G2 R- Y
    " x$ o8 s1 }  I
    ' a$ g2 k  T0 j4 o, Y2 [* {5 [
    4 O) I  m* Z) G: w

    5 ]6 Z. z( o$ S! Q7 {9 U+ c4 v* Q5 _/ X2 K
    關(guān)注我們
    # h( q3 @- a/ W5 p7 \! u- W' O' ?+ i0 m- p$ ^

    4 K4 H0 z' P6 L. I8 o. @5 Q
    : S" o) l5 s! i% Z

    & d7 h+ N: c- P5 h; L5 ]5 U# O , }* Y# n  k3 o0 q: H# o# O

    6 r4 u+ ^4 k) N8 Z4 n& A5 _ 6 ?- O4 \" q* R3 o
                         
    7 x" n0 `$ \/ p/ k! ^: A, d# v4 r7 X6 Z; M
    $ S% F$ J' {8 @% o% z2 ]" n  s

    0 @7 V: j  h7 ~) b1 E4 E關(guān)于我們:9 V* I1 e. a& a2 u# ]
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。. k7 y- t( R# L: y9 d4 ^) b

    0 Q8 g# U, a1 O2 khttp://www.latitudeda.com/
    8 F6 E2 v% A8 a1 s(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表