|
引言0 R y9 o7 t0 a, y w) E, Z
本文探討AMD即將推出的"Zen 5"核心架構。這一新一代處理器核心在性能和效率方面都有顯著提升,對于計算行業(yè)的發(fā)展具有重要意義。' ?' ~9 m8 F0 A6 W, g/ x
) @1 Y; X! W# }6 d, E' N
"Zen 5"核心概述
/ G/ c3 u) Q$ v* |, z"Zen 5"核心是AMD成功的Zen架構系列中的最新迭代。在繼承前代優(yōu)勢的基礎上,"Zen 5"旨在提供顯著的性能改進,同時保持出色的能效比。# M: \7 c" M7 h6 t
; P! R S+ I% v
0x14liirb2v64014029133.png (152.74 KB, 下載次數: 1)
下載附件
保存到相冊
0x14liirb2v64014029133.png
2024-9-28 01:31 上傳
$ T5 e6 q; ^- @$ e% Z5 ?' }
圖1:展示了Zen架構的演進,突出顯示了Zen 3、Zen 4和Zen 5的關鍵特性。
. A' x3 v2 [6 b9 I8 ~& l5 x+ h5 c, L! c" u* H1 y
"Zen 5"的主要特性:相比"Zen 4"提升16%的IPC(每時鐘周期指令數)支持AVX-512變體和FP-5128寬度指令分發(fā)和6個ALU(算術邏輯單元)雙管線取指/解碼采用4nm/3nm制程工藝' [# ~9 o( d( l. y9 x! J7 k
[/ol]
% S$ X# w( R, K) l微架構深入分析
/ g1 ~8 M. d6 Q4 W+ \"Zen 5"微架構引入了多項增強功能,以提高性能和效率。4 a6 Q k3 B0 i7 O% z+ m8 Q- v- c7 y
# r- k, q/ I0 @ l: `! O
wjkplehrz3164014029234.png (289.08 KB, 下載次數: 0)
下載附件
保存到相冊
wjkplehrz3164014029234.png
2024-9-28 01:31 上傳
3 N) l$ ~9 u* O
圖2:提供了"Zen 5"微架構的詳細概覽,展示了各個組件及其互連。
; a4 y9 X% X6 m) F- A( y
, J0 t: {- S' K7 h前端改進:6 {- n9 I* @2 m" h
雙指令取指和解碼管線8寬度指令分發(fā)到整數或浮點單元增強的分支預測,每周期可進行2次預測更大的Op-Cache,可存儲6K條指令,每周期2x6寬度取指
+ p# ?6 N$ a( a+ I j: F; G
- X. z+ E7 p0 v$ z. T執(zhí)行單元增強:- g$ O2 ?! V. |0 v8 X7 w
6個整數ALU和4個AGU(地址生成單元)每周期4個浮點運算,FADD(浮點加法)延遲為2周期完整的512位AVX-512數據通路,提高吞吐量" L/ Z R B% h, T1 [
2 {5 r; R1 u+ U4 F4 j2 n. n$ Q6 F緩存和內存子系統(tǒng):
% C) x! n. K" J48KB 12路組相聯L1數據緩存,每周期可進行4次讀取,2次寫入操作1MB 16路組相聯L2緩存改進的L3緩存延遲. e) R3 z5 r$ m5 D8 Q
: ^7 Z; p X. A& E- J# S" ?& z
"Zen 5"家族和平臺支持
8 ]' }0 k3 P6 y- ^0 P- U6 FAMD推出了兩種"Zen 5"核心變體,以滿足不同市場細分的需求:"Zen 5":優(yōu)化單線程性能"Zen 5c":注重性能功耗比和性能面積比
1 d: c; V; {8 b5 Y" u[/ol]
6 e# B( W- [$ X% x$ R
/ `; W! s. M$ l6 }/ `8 P
lsonkembxck64014029334.png (147.66 KB, 下載次數: 0)
下載附件
保存到相冊
lsonkembxck64014029334.png
2024-9-28 01:31 上傳
. v' c V' I' Y9 C5 R9 ^* q& C7 M
圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。2 E" c/ }: S H2 j% F
3 q4 M6 |2 Y9 x& l8 B: z
這種方法使AMD能夠針對從高性能臺式機到節(jié)能移動設備的廣泛產品范圍。$ p0 E4 m, [% x& {# p% Y9 C
9 \/ ]) \1 z% K! X/ U
新指令集架構(ISA)特性3 _: a6 Y' k" L" R8 n Y" ^
"Zen 5"核心引入了幾項新指令和功能:
& \$ h" @9 P6 J8 D j8 F0 |3 VMOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲指令VP2INTERSECT[DQ]:AVX-512向量對交集3VNNI/VEX:帶VEX編碼的擴展AVX-512指令PREFETCH[I*]:指令線的軟件預取增強的安全特性,包括SEV(安全加密虛擬化)改進2 d5 o+ I2 A' x% |
5 @# s: r7 [1 I6 K5 R9 b
性能提升
- e; G5 ^ ^) gAMD聲稱"Zen 5"核心在各種應用和使用場景中都實現了顯著的性能提升。" c2 M, c7 ~$ t
+ y9 J+ m5 T. ^/ U; p& X. d9 h
zvxxsqg3taf64014029434.png (157.54 KB, 下載次數: 1)
下載附件
保存到相冊
zvxxsqg3taf64014029434.png
2024-9-28 01:31 上傳
. `7 F$ t7 O; X- u: ^! c2 R4 T圖4:展示了"Zen 5"相比"Zen 4"的關鍵進步,突出顯示了各個領域的改進。
4 v0 l" V; g& i: {( Q0 B) v/ A- `# W, L& f5 C; g' K
IPC提升7 I0 g& I% e b7 N/ i* r4 ~% q* n
"Zen 5"核心在一系列應用中展現了令人印象深刻的IPC改進:
" ^! R5 Q. |) h3 e
8 L2 I6 y8 a8 M: ^ [+ B
hnj2wk1sava64014029534.png (90.56 KB, 下載次數: 3)
下載附件
保存到相冊
hnj2wk1sava64014029534.png
2024-9-28 01:31 上傳
- P" M4 H' s' f" o圖5:顯示了使用"Zen 5"核心的PC相比前幾代產品的IPC提升。
3 m1 x- p$ J5 t
0 J5 O& @/ G" g3 iAI和科學計算+ C0 I7 \0 z3 Y Y: q# u
"Zen 5"核心在AI和科學計算工作負載方面也表現出顯著的性能提升:2 N- K: _. O. N+ l: H' O+ I
, k, {; I8 Q+ l7 v
pzv5ibat4ld64014029634.png (108.67 KB, 下載次數: 2)
下載附件
保存到相冊
pzv5ibat4ld64014029634.png
2024-9-28 01:31 上傳
: V- d8 ?2 v2 m, U$ K) w圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領先地位。
7 l! [. U2 k. l: r, I
% I* S% M1 i1 W$ ^3 \& |在SoC中的實現
4 |# ], z: f# C1 _' I0 G"Zen 5"核心將被實現在各種系統(tǒng)級芯片(SoC)設計中,以滿足不同市場細分的需求。" x8 i0 F6 O( t+ x
"Strix Point" SoC:$ V/ f* H' J3 W7 m# ~! n' V
mbethlwddx564014029734.png (195.44 KB, 下載次數: 3)
下載附件
保存到相冊
mbethlwddx564014029734.png
2024-9-28 01:31 上傳
- p4 ]$ Z. G( d) b
圖7提供了"Strix Point" SoC的詳細框圖,展示了"Zen 5"和"Zen 5c"核心的集成。
* v# a/ i. w, R: S1 p- l5 ^0 j) Z& t! F3 R; {
"Strix Point"的主要特性:- L+ V! R! K. x/ w# z4 n. G
異構架構,包含4個"Zen 5"核心和8個"Zen 5c"核心集成RDNA 3.5圖形處理器,最多16個計算單元XDNA 2推理引擎,用于AI加速支持DDR5/LPDDR5內存PCIe 4.0和USB4連接$ L9 H3 S2 h2 W$ i1 r9 w, O4 ^
* W( \9 G! K9 [8 k% r0 c4 a
"Granite Ridge" SoC
% G% o `9 u) q" m" c7 d
iciyktynici64014029835.png (171.53 KB, 下載次數: 1)
下載附件
保存到相冊
iciyktynici64014029835.png
2024-9-28 01:31 上傳
+ v# F( p; h; y. u' b* u7 A+ x圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺式機應用設計。
& \$ G! _3 w1 _) n' Q3 _; l$ U- a5 J7 Q$ _ Y; |0 a5 N' z' Y
"Granite Ridge"的主要特性:0 W: i7 T0 z T4 U" \: _$ c r
最多16個"Zen 5"核心(2個CCD,每個8核)每個CCD 32MB L3緩存支持DDR5內存PCIe 5.0連接兼容AM5插槽2 {6 n- S* D7 H$ M
3 z8 m8 l0 q* l+ h, h! \能效改進0 ?1 C. Q# K& x) b; F5 ^+ C
"Zen 5"核心在Zen系列的能效優(yōu)勢基礎上進行了進一步改進:增強的電源門控技術改進的smt(同步多線程)支持,提高性能功耗比縮短電源狀態(tài)進入/退出時間優(yōu)化分支預測,減少無用工作高效的字符串操作和預取器改進3 Y, y5 }( g/ l1 X4 o) ^
[/ol]1 _3 z) F3 U0 r7 ~! r: f' ^7 _) Q1 q
這些增強功能在保持出色能效的同時,提高了整體系統(tǒng)性能。9 c* ?; |. U3 [% G$ A
" ]8 w6 j' u+ Y4 y- _% \3 Q
RDNA 3.5圖形架構1 e& n4 K. I; J/ k U9 V6 c" R
對于移動應用,AMD還改進了集成圖形架構,推出了RDNA 3.5:1 |; ?* v: z8 L
rzwyqc2fvgt64014029935.png (249.83 KB, 下載次數: 1)
下載附件
保存到相冊
rzwyqc2fvgt64014029935.png
2024-9-28 01:31 上傳
# w' R0 Z0 Q, r: C: Q圖9:概述了為移動應用優(yōu)化的RDNA 3.5圖形架構的改進。5 i& o! Z. @* i, J& J! _& z
; T: r9 R q- E' i2 f+ U9 Y
RDNA 3.5的主要改進:
- I; h4 ]/ k ]' t3 K2倍采樣率和點采樣加速增強的著色器子系統(tǒng),插值和比較率提高2倍改進的光柵化子系統(tǒng),通過子批處理提高效率針對LPDDR5的內存子系統(tǒng)優(yōu)化和改進的壓縮更大的引擎配置,包括8個WGP(工作組處理器)和4個RB+(渲染后端+)4 M4 A, u+ y9 j
/ V( @. v7 ]% E6 q# [, n+ O
AMD Ryzen AI與XDNA 2架構6 \4 X9 y$ t0 S& d1 B
為了滿足個人計算機對AI能力日益增長的需求,AMD引入了XDNA 2架構用于AI加速:
/ }# F; D4 ^, o W$ V
xzwccgymld564014030035.png (195.58 KB, 下載次數: 1)
下載附件
保存到相冊
xzwccgymld564014030035.png
2024-9-28 01:31 上傳
; b" l- d. P) K/ }6 w9 y/ i0 P圖10:展示了基于XDNA 2架構的AMD Ryzen AI "Strix" NPU(神經處理單元)。& \+ ?4 W2 n! C7 w& Z( `+ f
" T: p4 X2 f' v+ l' s& tXDNA 2的主要特性:
* G" b* S8 y7 @最高50 INT8 TOPS(每秒萬億次運算)和50 Block FP16 TFLOPS8個并發(fā)隔離空間流,提高多任務處理能力片上內存容量比上一代增加1.6倍支持塊浮點和增強的非線性函數相比上一代產品,性能功耗比提高2倍
; W8 p# h3 P# p$ ~
8 B( g5 v O, M+ h* T; u9 c) `結論$ x i3 g4 p( V, W" O, F n) D+ _
AMD "Zen 5"核心代表了x86處理器設計的飛躍,在各種應用中都提供了顯著的性能改進。憑借對AI加速、能效和可擴展性的關注,"Zen 5"核心有能力滿足從移動設備到高性能服務器等各種市場細分的現代計算需求。
" M2 t6 \0 N! U
- x% h% [9 y" {5 y7 z. |隨著AMD不斷創(chuàng)新和突破處理器設計的界限,可以期待未來會有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實現,展示了AMD在競爭激烈的處理器市場中提供領先性能和效率的承諾。2 Q' S2 T+ }- Q' t7 S
2 U4 F; t2 |* y+ G參考文獻- B$ z" W$ ]8 g9 R: _
[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.; m9 @; F9 S/ I
" i( K2 K! h5 W3 v( U8 S
- END -
3 k. s. ^) O) C x
; c Q; e+ { c軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。; R4 U) e2 N) z, T. b3 J
點擊左下角"閱讀原文"馬上申請1 E4 I9 Y- _, a4 ~ H0 c
' }/ O" v. N; p, Z, Q歡迎轉載/ E( ~0 l# c. D
* s' t8 d; G5 n3 j. [# {" @轉載請注明出處,請勿修改內容和刪除作者信息!
9 e* H2 V& o4 D+ M& c* O% h, Q1 J. O# x" w- X# I; _
6 f! W2 ?+ N4 m6 B, g
6 q) H- x( K1 t
vjhqegeadpe64014030135.gif (16.04 KB, 下載次數: 2)
下載附件
保存到相冊
vjhqegeadpe64014030135.gif
2024-9-28 01:31 上傳
0 G6 u4 m- V' i: ^
, e: N/ |6 T" k+ T4 C5 [
關注我們1 H0 y% e: p. N# R8 L9 w
# r$ l* Z# q0 L$ e
. j9 D$ s% Y& ]' I& n) K8 Q
yfjpo4desb064014030235.png (31.33 KB, 下載次數: 2)
下載附件
保存到相冊
yfjpo4desb064014030235.png
2024-9-28 01:31 上傳
" W: M" j& m: f | ' [, ]; I4 g! m
diigldkjaki64014030335.png (82.79 KB, 下載次數: 0)
下載附件
保存到相冊
diigldkjaki64014030335.png
2024-9-28 01:31 上傳
6 N) y1 u, w& R |
( j6 V; f' h0 s9 }( d4 X; x
5uwjbu0mhxm64014030435.png (21.52 KB, 下載次數: 3)
下載附件
保存到相冊
5uwjbu0mhxm64014030435.png
2024-9-28 01:31 上傳
- H' ^/ i/ [- o( J
|
% k% ^4 z! s E! M* ^
, k- s- j. x8 Y/ T* C2 N( { j+ j; ?* u' x, t" O
' A9 ?5 ~. \" d2 T# b8 D) r
關于我們:% x7 P, X4 \2 o" e/ S
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
- j4 s: y6 `: ~. n$ R
% Y$ @- b& |- D- k7 Hhttp://www.latitudeda.com/0 [; [7 u( Z9 e( B9 O; M7 @ {
(點擊上方名片關注我們,發(fā)現更多精彩內容) |
|