電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 219|回復(fù): 0
收起左側(cè)

Hot Chips 2024 | AMD下一代"Zen 5"核心性能和效率的進(jìn)展

[復(fù)制鏈接]

437

主題

437

帖子

3131

積分

四級會員

Rank: 4

積分
3131
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-27 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |正序?yàn)g覽 |閱讀模式
引言
; Y( T! |' w! U4 L3 b) _- P本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對于計(jì)算行業(yè)的發(fā)展具有重要意義。
* J- V4 }" c# j+ s8 q: C( t# h3 Y
) k* Y# C0 M7 F! w  c; D"Zen 5"核心概述1 q) r/ [8 q% V
"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時(shí)保持出色的能效比。9 _+ S( R1 S# @
9 l/ g$ }  _% M) G% L; P& I
4 k4 l& J% G0 D1 f2 \8 u. ?6 T% W, J3 }
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。
: ^2 |$ K1 w9 u2 w+ j
7 z5 v( Y, ]! ]9 {3 S6 a; D"Zen 5"的主要特性:
  • 相比"Zen 4"提升16%的IPC(每時(shí)鐘周期指令數(shù))
  • 支持AVX-512變體和FP-512
  • 8寬度指令分發(fā)和6個ALU(算術(shù)邏輯單元)
  • 雙管線取指/解碼
  • 采用4nm/3nm制程工藝3 Y! X! ]7 a/ ^/ C" u8 e( Y/ t* O
    [/ol]
    ) Y1 y( k1 Q. w; n) Z& H# k微架構(gòu)深入分析
    " l  V) ~+ y7 o2 C5 _2 ]. w"Zen 5"微架構(gòu)引入了多項(xiàng)增強(qiáng)功能,以提高性能和效率。
    ! @- D& \5 [* A+ b3 m
    ( Q! G9 p' o5 ?9 J 7 L" n+ @; v& I0 e2 ^9 M
    圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個組件及其互連。
    . Q6 S  v6 S* E9 D. e9 c: B
    # |! o  E, J* ~* H前端改進(jìn):0 j# ~5 X+ h3 |- E
  • 雙指令取指和解碼管線
  • 8寬度指令分發(fā)到整數(shù)或浮點(diǎn)單元
  • 增強(qiáng)的分支預(yù)測,每周期可進(jìn)行2次預(yù)測
  • 更大的Op-Cache,可存儲6K條指令,每周期2x6寬度取指  ]+ S7 T4 m9 I

    ( X% O* L7 l1 D  \1 b$ Q0 k執(zhí)行單元增強(qiáng):
    - K: x8 G2 [( w2 h7 a
  • 6個整數(shù)ALU和4個AGU(地址生成單元)
  • 每周期4個浮點(diǎn)運(yùn)算,FADD(浮點(diǎn)加法)延遲為2周期
  • 完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量
    # r0 B7 D# a+ \) [- h& \

    ( X: n" s& W* h& k5 o, {/ `+ r) B+ c緩存和內(nèi)存子系統(tǒng):$ [0 v  q- i. |$ Y7 p3 |
  • 48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫入操作
  • 1MB 16路組相聯(lián)L2緩存
  • 改進(jìn)的L3緩存延遲
    ! K- q% P6 Q1 H9 N& k9 d0 u  q" R
    % E/ `# A( _+ _6 ^
    "Zen 5"家族和平臺支持
    8 b* _0 W- \6 F% Y( {! JAMD推出了兩種"Zen 5"核心變體,以滿足不同市場細(xì)分的需求:
  • "Zen 5":優(yōu)化單線程性能
  • "Zen 5c":注重性能功耗比和性能面積比
    8 a; u+ G) k3 K- Q2 \8 P& {& k# i[/ol]
    " U8 @4 B6 z3 Y. d4 O, \/ Q/ Q5 {! V! e3 m1 ?& a( V
    * ~8 E: n+ V) ]! y& L3 v
    圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。- l) V* b+ o) `2 F7 C
    4 ~* t; m8 k. y) n- p9 B) n
    這種方法使AMD能夠針對從高性能臺式機(jī)到節(jié)能移動設(shè)備的廣泛產(chǎn)品范圍。
    1 K& Q# Q1 T# }  u( m% ~+ i' A( g/ ^# L8 w
    新指令集架構(gòu)(ISA)特性( S. N: z- F1 ~- ]9 @# X
    "Zen 5"核心引入了幾項(xiàng)新指令和功能:
    - `8 s+ v& J0 `; w  d. O+ ^
  • MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲指令
  • VP2INTERSECT[DQ]:AVX-512向量對交集
  • 3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令
  • PREFETCH[I*]:指令線的軟件預(yù)取
  • 增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)
    % [! Q/ P; N4 a
    $ p8 N, h4 z7 [) o4 y: N+ D
    性能提升, a# H) I7 A0 i4 H) d, v. I! Z2 G
    AMD聲稱"Zen 5"核心在各種應(yīng)用和使用場景中都實(shí)現(xiàn)了顯著的性能提升。
    ( |2 C2 q7 N; t; l% Z* r% j, f6 S0 H2 z& c2 |4 |9 N
    " |0 ]* l- {2 E/ R
    圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個領(lǐng)域的改進(jìn)。! j: L% U$ u6 G+ z7 w) `: {1 s

    $ Z6 U/ W" X/ R( eIPC提升
    + F; c# H2 |/ Y# K"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):) ^6 U8 y) F( ]
    4 v- A* s6 D0 u3 S' |( V

    % r, @: l6 b- h$ V& {0 {圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。
    7 N' ^4 s; R8 Q* B- K, J$ b) `( I; G; p; t7 j: G% C1 J& M9 X
    AI和科學(xué)計(jì)算
    1 ]6 K- p+ k! n; t"Zen 5"核心在AI和科學(xué)計(jì)算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:3 [/ w+ l2 H$ p' ^% C
    ' H9 |  e) P5 o/ X9 k& ^! [9 Q1 L

    8 G5 \+ \# J8 a& E3 v9 N4 E圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。7 s+ ]7 }+ ?6 U) b* g5 G: H  M0 Z0 g
    ! h; F2 l0 o; [
    在SoC中的實(shí)現(xiàn)
    ' f* T9 C6 H) F$ R"Zen 5"核心將被實(shí)現(xiàn)在各種系統(tǒng)級芯片(SoC)設(shè)計(jì)中,以滿足不同市場細(xì)分的需求。+ Q3 `3 M, {* j7 C3 }1 m* [: d
    "Strix Point" SoC:
    # c- f6 T6 o6 I( V( z2 S / Z, D& Q6 a8 T3 _: t
    圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。" L& F8 \% J) [8 n" ]9 R0 K
    0 U: g9 L0 L- T* C- j' D
    "Strix Point"的主要特性:
    . w6 U$ C7 Y4 n; R/ t
  • 異構(gòu)架構(gòu),包含4個"Zen 5"核心和8個"Zen 5c"核心
  • 集成RDNA 3.5圖形處理器,最多16個計(jì)算單元
  • XDNA 2推理引擎,用于AI加速
  • 支持DDR5/LPDDR5內(nèi)存
  • PCIe 4.0和USB4連接
    : i* V/ U* J6 R
    ' E! D2 Z4 V* F. ^0 S) W7 o( P3 G
    "Granite Ridge" SoC
    : h1 k" A! M3 j  v* Y% t! s1 V% L& |+ n * r  `( \! g+ G: C) l9 N; q: T
    圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺式機(jī)應(yīng)用設(shè)計(jì)。
    ! T7 y! ?: _( h$ ]- h) f
    ( L6 Y. y9 h/ s"Granite Ridge"的主要特性:
    / t( ]1 \- o5 A" w/ _5 _
  • 最多16個"Zen 5"核心(2個CCD,每個8核)
  • 每個CCD 32MB L3緩存
  • 支持DDR5內(nèi)存
  • PCIe 5.0連接
  • 兼容AM5插槽8 E& u0 L8 f( x( ~9 U0 A

    , l7 k) \8 }( D& R能效改進(jìn)2 r/ S: V/ m2 H, g- ?) P
    "Zen 5"核心在Zen系列的能效優(yōu)勢基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):
  • 增強(qiáng)的電源門控技術(shù)
  • 改進(jìn)的smt(同步多線程)支持,提高性能功耗比
  • 縮短電源狀態(tài)進(jìn)入/退出時(shí)間
  • 優(yōu)化分支預(yù)測,減少無用工作
  • 高效的字符串操作和預(yù)取器改進(jìn)
    9 e/ j7 D1 j' Y  ~' _9 M* `; Q[/ol]6 l5 N0 r; `0 Y7 n, m
    這些增強(qiáng)功能在保持出色能效的同時(shí),提高了整體系統(tǒng)性能。) l+ l4 H' G. a6 z0 X

    4 y' ~7 C( ~, ^0 S; I, N0 ~RDNA 3.5圖形架構(gòu)
    9 J; ^# v9 X' [, F9 J; _; Q對于移動應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:1 q- d! m; q9 L& N1 r! L
    / `+ S4 @$ x% Z/ h! K5 g
    圖9:概述了為移動應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。( q/ E7 J1 r0 C# Q0 F) c

    + k% |/ ]* E  p8 [( K# A5 }6 tRDNA 3.5的主要改進(jìn):
    ( [7 h4 V' |9 h3 S" m
  • 2倍采樣率和點(diǎn)采樣加速
  • 增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍
  • 改進(jìn)的光柵化子系統(tǒng),通過子批處理提高效率
  • 針對LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮
  • 更大的引擎配置,包括8個WGP(工作組處理器)和4個RB+(渲染后端+)
    ( a3 [1 i( f4 P' ?* d6 S! b! W

    6 z" I8 L0 }9 n' ?! oAMD Ryzen AI與XDNA 2架構(gòu)6 [0 O/ Y( F3 Z2 r: w
    為了滿足個人計(jì)算機(jī)對AI能力日益增長的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
    7 v* Z" B+ D: T 5 o2 h" f* C1 t* f* b4 _7 M9 v, ?
    圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。: H) A- S2 p5 r& \* ]" R1 o
    3 Q- N3 p  W& g* H' ~0 C- A
    XDNA 2的主要特性:+ t! y' `) I" k& [! _% S$ b
  • 最高50 INT8 TOPS(每秒萬億次運(yùn)算)和50 Block FP16 TFLOPS
  • 8個并發(fā)隔離空間流,提高多任務(wù)處理能力
  • 片上內(nèi)存容量比上一代增加1.6倍
  • 支持塊浮點(diǎn)和增強(qiáng)的非線性函數(shù)
  • 相比上一代產(chǎn)品,性能功耗比提高2倍
    3 W3 F9 ^9 n! B* P- x6 _5 H
    # k: H- y5 A2 r" I  I- A
    結(jié)論- y; a+ N& j& P, [9 ]& z$ F% h0 k
    AMD "Zen 5"核心代表了x86處理器設(shè)計(jì)的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿足從移動設(shè)備到高性能服務(wù)器等各種市場細(xì)分的現(xiàn)代計(jì)算需求。. R/ F: i4 }3 u$ R
    ( N" l" |# ^; S! e7 R4 A! \
    隨著AMD不斷創(chuàng)新和突破處理器設(shè)計(jì)的界限,可以期待未來會有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實(shí)現(xiàn),展示了AMD在競爭激烈的處理器市場中提供領(lǐng)先性能和效率的承諾。
    % }4 l9 H) E. ^' f) e# K  Q" Y7 x# H
    + N: b1 e* `( P8 }參考文獻(xiàn)6 Z8 N& a5 o5 _9 p6 [' G4 `
    [1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.2 e5 l1 u* w: r2 O' l2 @

    2 c) S0 P  }! ]% z, ?5 n- END -
    + `! y! @' ?$ {9 J9 t
    6 u) i4 P7 N* P; x軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    4 k; j( Y7 M0 H6 x+ z7 U$ x4 `點(diǎn)擊左下角"閱讀原文"馬上申請
    $ Y1 g/ M2 Q, P" I
    0 e7 t% N% _& B0 R' U歡迎轉(zhuǎn)載/ b0 j: X+ D5 u
    4 w# V' ]1 g/ M: z* u4 q2 }
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!: s  l# l& ^! n- d  L' }+ D! ]  Z
    7 e* t/ l  d0 C+ N

    * @7 Q; s4 j, H, S, m

    6 K8 J2 B- o# Z+ H  U! v1 {
    4 ^$ ?, d4 a( [2 K& q1 [8 X. P" c7 r% B( z9 t
    關(guān)注我們
    / p% P8 `& Q+ I$ F0 y
    $ v1 U" Y# f! r" a& R  ^

    & U8 p0 T/ F2 }. u2 g; h# [  l! y
    8 F0 M" e) r9 f( b6 n; l6 ~
    ; V7 M( B0 ?+ o! \

    # o9 b% T. M# s7 I6 b

    , L, m9 j3 a) |" H  G/ @  u: Z+ ^
    " B; X' [" l( n+ p2 O- J  o
                          8 e9 `1 F, e, r* \4 Q# n5 x: e
    * O3 ^" ]8 G9 M/ |- M

    ) V) P* E7 B4 I/ \* K9 c2 k. v
    - k0 W- K3 S/ n1 ?1 l2 d% W, o關(guān)于我們:
    & ?4 L$ F8 O8 @+ W3 z深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    0 C: K: f- @& `& m+ k+ D3 r7 Y- i% f5 I0 M, Q. N# I9 O/ a
    http://www.latitudeda.com/
    ( g- z) R' x0 {; `4 Y7 l- j" V(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表