電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 216|回復: 0
收起左側(cè)

Hot Chips 2024 | AMD下一代"Zen 5"核心性能和效率的進展

[復制鏈接]

437

主題

437

帖子

3131

積分

四級會員

Rank: 4

積分
3131
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-27 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言
9 H0 m+ d) i7 t: {9 }: ~. s本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對于計算行業(yè)的發(fā)展具有重要意義。
2 |, B+ E: \1 U9 C8 a% {! p# v0 D9 R0 @- q. \% ^$ U" I% U1 o8 x
"Zen 5"核心概述" i' p  s9 z$ ^5 z4 P! Y4 Z+ u
"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢的基礎上,"Zen 5"旨在提供顯著的性能改進,同時保持出色的能效比。7 t3 j% v# q: h- C# c

# f3 E$ A, n' y5 V7 e, S; Q$ T ) Q/ S( g; p0 Y" b+ F! V
圖1:展示了Zen架構(gòu)的演進,突出顯示了Zen 3、Zen 4和Zen 5的關鍵特性。7 d4 J9 X! s8 W! @1 s& g# Q- g2 d
8 P5 g% G" J+ \! P7 A6 |2 S
"Zen 5"的主要特性:
  • 相比"Zen 4"提升16%的IPC(每時鐘周期指令數(shù))
  • 支持AVX-512變體和FP-512
  • 8寬度指令分發(fā)和6個ALU(算術邏輯單元)
  • 雙管線取指/解碼
  • 采用4nm/3nm制程工藝
    7 p3 ]# h; {4 X0 C, i[/ol]1 j0 J; m. j# L8 x9 P9 J: x% d# n
    微架構(gòu)深入分析
    , m7 m3 @% {4 M"Zen 5"微架構(gòu)引入了多項增強功能,以提高性能和效率。
    " V( y0 ^5 \% w+ S/ T; d" M- m( L. _( c2 ~1 g4 Z0 Z- E& g9 N4 N
    ; P5 O6 S1 @4 L: c$ i+ M) d
    圖2:提供了"Zen 5"微架構(gòu)的詳細概覽,展示了各個組件及其互連。
    & v6 `; [/ M2 {2 P3 ]
    7 L0 N3 X# J3 K9 I5 D前端改進:$ C  B4 N( K1 t5 M
  • 雙指令取指和解碼管線
  • 8寬度指令分發(fā)到整數(shù)或浮點單元
  • 增強的分支預測,每周期可進行2次預測
  • 更大的Op-Cache,可存儲6K條指令,每周期2x6寬度取指
    % }+ a+ s' t+ t# ~
    8 b7 N- |. E" I6 D- ~/ m5 F
    執(zhí)行單元增強:/ A! r( z! _" v* P
  • 6個整數(shù)ALU和4個AGU(地址生成單元)
  • 每周期4個浮點運算,FADD(浮點加法)延遲為2周期
  • 完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量0 y* b+ \$ U. n3 q) u

    3 |8 Q# c+ z/ [: u! o緩存和內(nèi)存子系統(tǒng):- a* m) ]( R1 V
  • 48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進行4次讀取,2次寫入操作
  • 1MB 16路組相聯(lián)L2緩存
  • 改進的L3緩存延遲4 {- O, @3 Q& C  M" B! i

    ) a, S. L' q) B# A" b4 ?"Zen 5"家族和平臺支持% ^! d3 }7 L" X! e  j
    AMD推出了兩種"Zen 5"核心變體,以滿足不同市場細分的需求:
  • "Zen 5":優(yōu)化單線程性能
  • "Zen 5c":注重性能功耗比和性能面積比
    " {$ r0 [+ ]3 j' u[/ol]
    , ]3 ?" R' J6 d) K
    * I0 p  Y$ Y! L; Z+ M
    : K2 J5 O$ A( l/ p8 u& m# v圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。0 E  y( y  v0 F) ^9 T

    1 z) G. z% v8 D5 T這種方法使AMD能夠針對從高性能臺式機到節(jié)能移動設備的廣泛產(chǎn)品范圍。( [4 i. D9 T  L: T

    3 A2 @: Y. F# f0 S+ B4 e新指令集架構(gòu)(ISA)特性; q3 S. i9 {5 X  W( i6 x
    "Zen 5"核心引入了幾項新指令和功能:8 G8 v& |4 J# U+ W! \8 ]$ P
  • MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲指令
  • VP2INTERSECT[DQ]:AVX-512向量對交集
  • 3VNNI/VEX:帶VEX編碼的擴展AVX-512指令
  • PREFETCH[I*]:指令線的軟件預取
  • 增強的安全特性,包括SEV(安全加密虛擬化)改進
    * B' I3 y% y# _, d
    " E- z9 m3 e1 `! o% x5 C) z
    性能提升
    8 s$ ?6 T8 B1 V$ eAMD聲稱"Zen 5"核心在各種應用和使用場景中都實現(xiàn)了顯著的性能提升。4 g' S; O" j$ ], L

    ' N2 g0 Q8 I. ]' D, [" {* a# M
    $ ~$ W/ p" ]: [6 e- b: q圖4:展示了"Zen 5"相比"Zen 4"的關鍵進步,突出顯示了各個領域的改進。
    0 `: e4 [$ T. W
      {% n; n5 s% O# x7 c9 d" rIPC提升
    & v: n) Y% P8 E; S4 _"Zen 5"核心在一系列應用中展現(xiàn)了令人印象深刻的IPC改進:
    2 n5 v, Z7 h8 e# }  e: G' Q1 b, G
    1 N" c5 A5 w; X# l; L / Z) c" b) C9 M: N+ h2 o9 Y
    圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。
      _, n( i$ Q% I. J  Q* i! m! I' g
    AI和科學計算
    . Z1 l# e4 w8 l4 F- I) {  \* Q"Zen 5"核心在AI和科學計算工作負載方面也表現(xiàn)出顯著的性能提升:$ u2 w9 k; z% g# z/ E
    3 m8 a) P& p: f- W+ F5 M7 Z# ?

    # n7 N7 R) z$ G# s' C圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領先地位。6 c: y9 P+ ~; B9 P
    1 m0 q" g5 x$ ]0 ^0 V
    在SoC中的實現(xiàn)
    9 x2 b# C1 j. X) J* r! g$ m"Zen 5"核心將被實現(xiàn)在各種系統(tǒng)級芯片(SoC)設計中,以滿足不同市場細分的需求。
    6 ]6 w: Y0 k7 U1 A2 e; z& ^"Strix Point" SoC:
    / N4 s( F0 m; ~& u& K- I 4 s  _, E7 S' H3 M$ i1 d4 o
    圖7提供了"Strix Point" SoC的詳細框圖,展示了"Zen 5"和"Zen 5c"核心的集成。
    2 I; P7 Y- t8 K  V, g
      {+ P" O! U! A) h; y  N"Strix Point"的主要特性:) O8 B, K. i' _; j* T7 D' v
  • 異構(gòu)架構(gòu),包含4個"Zen 5"核心和8個"Zen 5c"核心
  • 集成RDNA 3.5圖形處理器,最多16個計算單元
  • XDNA 2推理引擎,用于AI加速
  • 支持DDR5/LPDDR5內(nèi)存
  • PCIe 4.0和USB4連接8 P& _- ~* F; c7 @
    ) c3 ^( E5 P, W* C" E( L
    "Granite Ridge" SoC6 \6 a* m' k0 U9 P& s

    " r! N- t- s# l" f8 [' k8 }圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺式機應用設計。( P& m6 f2 n7 }- s2 s3 z8 J" S
    & C" L8 N% o4 [! P/ M2 Y5 J
    "Granite Ridge"的主要特性:
    : L! Q2 X8 b; M" R, |
  • 最多16個"Zen 5"核心(2個CCD,每個8核)
  • 每個CCD 32MB L3緩存
  • 支持DDR5內(nèi)存
  • PCIe 5.0連接
  • 兼容AM5插槽
      a) G0 z. U, [( p

    / l1 u+ [  O" W2 C5 _5 L4 k1 z能效改進
    9 }: M% o; n. U" s9 H' q+ P"Zen 5"核心在Zen系列的能效優(yōu)勢基礎上進行了進一步改進:
  • 增強的電源門控技術
  • 改進的smt(同步多線程)支持,提高性能功耗比
  • 縮短電源狀態(tài)進入/退出時間
  • 優(yōu)化分支預測,減少無用工作
  • 高效的字符串操作和預取器改進
    ' K, X9 @% M5 W0 w0 O& k[/ol]
    8 i+ ~$ D- c& O4 }$ A這些增強功能在保持出色能效的同時,提高了整體系統(tǒng)性能。
    + L: S1 b+ }& o; A; L4 P6 O7 A$ e1 b8 n+ O
    RDNA 3.5圖形架構(gòu)
    9 B1 f+ r$ o9 {; P" }對于移動應用,AMD還改進了集成圖形架構(gòu),推出了RDNA 3.5:( D! v% }- w$ M( U! b- P
    4 @- t0 M5 u/ ^: M
    圖9:概述了為移動應用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進。' Q( T+ H, n# ]" w- R
    6 a' m+ b; N8 ^  e' l5 g
    RDNA 3.5的主要改進:
    : y' ~, P" O( z! `4 E: k2 m
  • 2倍采樣率和點采樣加速
  • 增強的著色器子系統(tǒng),插值和比較率提高2倍
  • 改進的光柵化子系統(tǒng),通過子批處理提高效率
  • 針對LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進的壓縮
  • 更大的引擎配置,包括8個WGP(工作組處理器)和4個RB+(渲染后端+)
    5 [) h3 A& j' A0 I7 [  S
    : m, K; _0 L6 F' ^7 m
    AMD Ryzen AI與XDNA 2架構(gòu)
    % u3 U* G6 S7 `1 ]& ]7 Q* o為了滿足個人計算機對AI能力日益增長的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:& `% s# i$ {% G( s
    1 I6 U* m4 J% u" N- j
    圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。- l' i3 A1 y( c$ a+ ^" P. a! N. m
    * C' N9 `2 B4 R9 w# w! x
    XDNA 2的主要特性:
    2 M$ h& l7 M/ h8 o/ D, V3 I
  • 最高50 INT8 TOPS(每秒萬億次運算)和50 Block FP16 TFLOPS
  • 8個并發(fā)隔離空間流,提高多任務處理能力
  • 片上內(nèi)存容量比上一代增加1.6倍
  • 支持塊浮點和增強的非線性函數(shù)
  • 相比上一代產(chǎn)品,性能功耗比提高2倍3 L; E4 P& ]$ V; f  w. e

    ! d& ^/ Y( ^' n5 E/ Y結(jié)論( }0 c  P$ k# |% K; t3 X" o
    AMD "Zen 5"核心代表了x86處理器設計的飛躍,在各種應用中都提供了顯著的性能改進。憑借對AI加速、能效和可擴展性的關注,"Zen 5"核心有能力滿足從移動設備到高性能服務器等各種市場細分的現(xiàn)代計算需求。
      P. u! }3 |! B6 K( S2 n# G; |5 w  f6 P! I6 Y8 P- |
    隨著AMD不斷創(chuàng)新和突破處理器設計的界限,可以期待未來會有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實現(xiàn),展示了AMD在競爭激烈的處理器市場中提供領先性能和效率的承諾。4 `. R% `4 l* K5 e1 @$ Y" D2 A9 P% m
    + w! q4 ^( d1 d  l) |
    參考文獻
    ( l- j3 S5 K: t% L6 f& }' F[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024." W7 W3 s8 I! A4 [! E% e, W) u

    ' i9 t6 A$ e& R: J; x$ @& I6 b- END -
    4 s* B  F/ \$ z& {8 X0 f' l% a% v7 R/ e2 `9 |) s' }
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
    8 d0 H. X8 x/ b  R# L$ |點擊左下角"閱讀原文"馬上申請
    + ?6 s/ M+ o. x: }2 q4 t0 X1 G" P- q+ @9 x; ~, U; G- s
    歡迎轉(zhuǎn)載2 j' X$ z8 X, h" @7 v/ [# O
    . G# ^* _/ k- L$ d- [6 B0 i
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
    ( p' U  u9 @6 K; u$ Q  J( V/ V5 k% w4 _! }( g( v
    : |" t; m3 w. f$ P" c4 `. D: j3 Y
    3 @3 G: T  k7 g, J8 F( R

    . ]% E! ^  @5 A  O# Q; |, N' z3 C0 {) W: X4 w( S
    關注我們  _$ D# q- l+ @8 a# p7 Q

    $ S0 a8 L8 J: [, R- i! A; }. @6 G1 f
    9 o  E% d# _$ [

    1 k* C; ^& z( J0 |

    8 ^; ?5 o$ c1 F7 C. V/ _: _ 3 e: s; ]7 X" S  w- s0 `

    2 F+ Y7 z3 U4 N: \" i 2 B8 V  T; W4 v8 p; [5 v
                          5 [" L7 m% x% H3 S9 x2 l, }

    0 s) {. W1 i0 _# N
    * r( R" [9 B1 S7 N( x

    / z) V" ^3 t2 i關于我們:7 w( p- I% a0 [
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。' T3 T+ M: Q6 ~; Q7 i

    : H: ^* j4 b. f6 N' R8 ^http://www.latitudeda.com/
    6 P  b# W( i# K3 `; b(點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表