|
引言
: U1 g0 o0 w0 c' t: A, e本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對于計算行業(yè)的發(fā)展具有重要意義。5 X2 C* _% ?) j
' x% D" f, q$ t* O2 C3 i
"Zen 5"核心概述$ E2 K6 t- Q6 [: T, T
"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時保持出色的能效比。& l9 L4 l, ]! g" L4 @
$ T! k' G; b$ q5 U) h
0x14liirb2v64014029133.png (152.74 KB, 下載次數(shù): 3)
下載附件
保存到相冊
0x14liirb2v64014029133.png
2024-9-28 01:31 上傳
2 X! `5 b( D l3 N
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。
7 b0 N. I" W: r4 a% d* ~
2 K- W$ z m3 p+ @ Q"Zen 5"的主要特性:相比"Zen 4"提升16%的IPC(每時鐘周期指令數(shù))支持AVX-512變體和FP-5128寬度指令分發(fā)和6個ALU(算術(shù)邏輯單元)雙管線取指/解碼采用4nm/3nm制程工藝
* x2 v" }0 C! ^" A' Y' [2 b[/ol]
* I! |: i0 G1 \8 K) y" O+ v/ k5 ]微架構(gòu)深入分析
$ d5 `$ z n/ M* z: ^"Zen 5"微架構(gòu)引入了多項增強(qiáng)功能,以提高性能和效率。
: L9 @+ D6 H& |6 H h* [+ G
, T7 E2 k) n) L; _
wjkplehrz3164014029234.png (289.08 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wjkplehrz3164014029234.png
2024-9-28 01:31 上傳
( b5 X, O, ] o$ T
圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個組件及其互連。% M; N- d/ o# J' i; H
$ s- z% f7 M: E1 h
前端改進(jìn):, b* t; P# E1 y' N" P/ {6 O
雙指令取指和解碼管線8寬度指令分發(fā)到整數(shù)或浮點單元增強(qiáng)的分支預(yù)測,每周期可進(jìn)行2次預(yù)測更大的Op-Cache,可存儲6K條指令,每周期2x6寬度取指
# R$ r* e8 {7 L. R# D% F& I
- u) u# ^7 ?- s' @9 `* j8 D, q+ ~執(zhí)行單元增強(qiáng):
+ ~% p0 V7 s5 Y" l$ o/ f6個整數(shù)ALU和4個AGU(地址生成單元)每周期4個浮點運算,FADD(浮點加法)延遲為2周期完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量
# X7 n. p& V# N! x9 ~
$ \4 j% f2 @3 Z: X! b' I緩存和內(nèi)存子系統(tǒng):
, ~" z0 P2 z. \: Z* z+ Q48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫入操作1MB 16路組相聯(lián)L2緩存改進(jìn)的L3緩存延遲" R9 j+ k' V9 @; O. S* m8 y
+ J% d0 N' r8 o8 f) l0 N9 T
"Zen 5"家族和平臺支持
6 C3 c/ H2 j6 a" X* L/ X) W8 kAMD推出了兩種"Zen 5"核心變體,以滿足不同市場細(xì)分的需求:"Zen 5":優(yōu)化單線程性能"Zen 5c":注重性能功耗比和性能面積比
( _8 u R1 c7 e+ V8 S[/ol]5 N7 G9 z. Z- u
2 m. U7 w' s3 r; b
lsonkembxck64014029334.png (147.66 KB, 下載次數(shù): 2)
下載附件
保存到相冊
lsonkembxck64014029334.png
2024-9-28 01:31 上傳
5 N5 `* e9 m$ E圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。
0 S9 U* R" F( e* f" j' C e/ E
' H/ Q' D9 Z3 H$ L6 I2 G. P這種方法使AMD能夠針對從高性能臺式機(jī)到節(jié)能移動設(shè)備的廣泛產(chǎn)品范圍。6 Q: I: C7 ^! m+ ]; O8 f
! N' ]4 q" T6 M3 e b" \5 g新指令集架構(gòu)(ISA)特性" [7 j0 }4 C2 |
"Zen 5"核心引入了幾項新指令和功能:
+ [; e2 k0 M5 cMOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲指令VP2INTERSECT[DQ]:AVX-512向量對交集3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令PREFETCH[I*]:指令線的軟件預(yù)取增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)
0 ?$ d( r2 l; b, {( C, V7 P0 \& I" L* f8 q- M# }# Y3 g
性能提升+ q( q! { m2 D& W- ~7 T$ k1 e1 R
AMD聲稱"Zen 5"核心在各種應(yīng)用和使用場景中都實現(xiàn)了顯著的性能提升。1 N6 i; @- p4 ^6 O/ P) `; B+ c
9 D g: N" X5 n% T# A# I$ I
zvxxsqg3taf64014029434.png (157.54 KB, 下載次數(shù): 4)
下載附件
保存到相冊
zvxxsqg3taf64014029434.png
2024-9-28 01:31 上傳
: \3 U6 C% G# K* W- \+ O! X6 M1 n圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個領(lǐng)域的改進(jìn)。5 R1 ` ^$ x( [' ]
# Q. {' ^' c- [0 v0 e
IPC提升
], G8 o1 O3 {$ M"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):6 w% r3 `/ z8 Y
5 p8 \+ H* g: V. T0 a
hnj2wk1sava64014029534.png (90.56 KB, 下載次數(shù): 5)
下載附件
保存到相冊
hnj2wk1sava64014029534.png
2024-9-28 01:31 上傳
' j$ Y6 E6 Q9 [1 Y Z7 ~9 |# G5 W圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。3 p' ~2 v0 t% T D
; @: w6 m8 ~1 ^. @: M+ Q0 _
AI和科學(xué)計算
3 [* ^: A$ N& |! [. f: a$ U4 u, j7 \"Zen 5"核心在AI和科學(xué)計算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:* h2 f ^* O- Q4 M7 D% A$ q7 z
3 }, g( j g: y, p( R* H6 _
pzv5ibat4ld64014029634.png (108.67 KB, 下載次數(shù): 4)
下載附件
保存到相冊
pzv5ibat4ld64014029634.png
2024-9-28 01:31 上傳
" O1 m; A. x G% h$ ]
圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。0 P5 Q; `) A6 m" `6 v9 @
2 w7 n6 o% T. a# n' ~1 u: b* f在SoC中的實現(xiàn)! A+ }% R% n1 n/ f
"Zen 5"核心將被實現(xiàn)在各種系統(tǒng)級芯片(SoC)設(shè)計中,以滿足不同市場細(xì)分的需求。% [: u. w/ @7 J4 F
"Strix Point" SoC:- y3 O# u4 m/ q3 e
mbethlwddx564014029734.png (195.44 KB, 下載次數(shù): 5)
下載附件
保存到相冊
mbethlwddx564014029734.png
2024-9-28 01:31 上傳
& T4 b8 m% P. m. Z2 q
圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。3 f4 j9 d3 M" O( s8 K4 a1 w
, i2 `$ G- w% ~$ o9 ~$ G"Strix Point"的主要特性:: a. M( Q: Z4 Y2 {6 j Y% G& U
異構(gòu)架構(gòu),包含4個"Zen 5"核心和8個"Zen 5c"核心集成RDNA 3.5圖形處理器,最多16個計算單元XDNA 2推理引擎,用于AI加速支持DDR5/LPDDR5內(nèi)存PCIe 4.0和USB4連接: \( l8 Z' n2 g9 K
, K$ \& \3 K9 o$ _. |
"Granite Ridge" SoC
* u8 t' a7 d3 I+ O* j w8 E0 M
iciyktynici64014029835.png (171.53 KB, 下載次數(shù): 3)
下載附件
保存到相冊
iciyktynici64014029835.png
2024-9-28 01:31 上傳
V( F/ B6 R2 R6 D; k* }! h# Z, ^
圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺式機(jī)應(yīng)用設(shè)計。
- p+ l2 H. P& g! R! K& n% m, f& b* X& \0 j8 M1 O' g
"Granite Ridge"的主要特性:. P; B1 o. h4 n, F$ q
最多16個"Zen 5"核心(2個CCD,每個8核)每個CCD 32MB L3緩存支持DDR5內(nèi)存PCIe 5.0連接兼容AM5插槽/ ], O! p& T" H) P8 S, z
4 U$ ?) U, D1 W+ z( Q' R/ M5 [
能效改進(jìn)
9 [- x: u; Q. M' \" l5 w; v) S) \"Zen 5"核心在Zen系列的能效優(yōu)勢基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):增強(qiáng)的電源門控技術(shù)改進(jìn)的smt(同步多線程)支持,提高性能功耗比縮短電源狀態(tài)進(jìn)入/退出時間優(yōu)化分支預(yù)測,減少無用工作高效的字符串操作和預(yù)取器改進(jìn)
4 T, |# R( l v2 s1 I[/ol]
% {- S4 W$ F4 V( Q這些增強(qiáng)功能在保持出色能效的同時,提高了整體系統(tǒng)性能。
+ W; r5 g( z( I5 y7 I4 r& W: q- @5 E! d- @. X* |
RDNA 3.5圖形架構(gòu)
' T; x6 d. u5 {, [: O! u對于移動應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:
) t3 s" z' V$ N$ {* a) g! E/ ^
rzwyqc2fvgt64014029935.png (249.83 KB, 下載次數(shù): 3)
下載附件
保存到相冊
rzwyqc2fvgt64014029935.png
2024-9-28 01:31 上傳
2 }2 l, z& _! M" L" Z0 W' {
圖9:概述了為移動應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。
3 _, r2 E5 c' }0 F" ~9 `5 {9 d2 M8 g* R0 i! N1 Z3 \
RDNA 3.5的主要改進(jìn):
( N8 r+ }4 s, l; z. a) l2倍采樣率和點采樣加速增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍改進(jìn)的光柵化子系統(tǒng),通過子批處理提高效率針對LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮更大的引擎配置,包括8個WGP(工作組處理器)和4個RB+(渲染后端+)
# \: p4 f. s4 }5 ^/ H
' U9 @' r& @7 c0 }( z& V( vAMD Ryzen AI與XDNA 2架構(gòu)
" Q+ k# w0 @: G/ y為了滿足個人計算機(jī)對AI能力日益增長的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
$ F' L' v: U; m
xzwccgymld564014030035.png (195.58 KB, 下載次數(shù): 3)
下載附件
保存到相冊
xzwccgymld564014030035.png
2024-9-28 01:31 上傳
( F1 f1 p0 N3 Q6 C$ O) |. C
圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。; v( Q4 E; t# p
8 {/ a: {' t+ b, |. x
XDNA 2的主要特性:- ~/ v2 Q6 a: l2 ^% M. L" B) B
最高50 INT8 TOPS(每秒萬億次運算)和50 Block FP16 TFLOPS8個并發(fā)隔離空間流,提高多任務(wù)處理能力片上內(nèi)存容量比上一代增加1.6倍支持塊浮點和增強(qiáng)的非線性函數(shù)相比上一代產(chǎn)品,性能功耗比提高2倍% T, j* @8 ?6 D( x+ N
2 t* S$ J4 N2 U7 N! R
結(jié)論
+ B, y0 ^) u7 rAMD "Zen 5"核心代表了x86處理器設(shè)計的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿足從移動設(shè)備到高性能服務(wù)器等各種市場細(xì)分的現(xiàn)代計算需求。7 O1 I/ k1 k t: w
, D) T5 T' ]1 U' F* d' m( a
隨著AMD不斷創(chuàng)新和突破處理器設(shè)計的界限,可以期待未來會有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實現(xiàn),展示了AMD在競爭激烈的處理器市場中提供領(lǐng)先性能和效率的承諾。
U8 S0 L8 B4 c. E0 t q
4 a5 n9 p+ @1 M) K1 T, s) R參考文獻(xiàn)
2 G, p2 e( Y2 |7 U3 d% w" t! y[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.
- V; Z( P" A5 {9 k/ ]8 ~9 R4 m" X4 A" C, j. X7 Q
- END -' Z B# P( H/ Y2 I6 m" ?
9 B K* T+ s2 _0 G- u
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。( F9 k* C! e- w; m6 T: l- X
點擊左下角"閱讀原文"馬上申請
4 y) X$ R1 ?4 O# ?9 D6 _ Q" i; k" R2 |5 I! }; F! P
歡迎轉(zhuǎn)載3 j7 E6 Y7 p3 V6 B) T
1 B# Z# n' o/ U' ]; D8 Z6 H轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!7 y* j Z0 v" M, E" G2 R- Y
" x$ o8 s1 } I
' a$ g2 k T0 j4 o, Y2 [* {5 [
4 O) I m* Z) G: w
vjhqegeadpe64014030135.gif (16.04 KB, 下載次數(shù): 4)
下載附件
保存到相冊
vjhqegeadpe64014030135.gif
2024-9-28 01:31 上傳
5 ]6 Z. z( o$ S! Q7 {9 U+ c4 v* Q5 _/ X2 K
關(guān)注我們
# h( q3 @- a/ W5 p7 \! u- W' O' ?+ i0 m- p$ ^
4 K4 H0 z' P6 L. I8 o. @5 Q
yfjpo4desb064014030235.png (31.33 KB, 下載次數(shù): 4)
下載附件
保存到相冊
yfjpo4desb064014030235.png
2024-9-28 01:31 上傳
: S" o) l5 s! i% Z |
& d7 h+ N: c- P5 h; L5 ]5 U# O
diigldkjaki64014030335.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊
diigldkjaki64014030335.png
2024-9-28 01:31 上傳
, }* Y# n k3 o0 q: H# o# O
|
6 r4 u+ ^4 k) N8 Z4 n& A5 _
5uwjbu0mhxm64014030435.png (21.52 KB, 下載次數(shù): 5)
下載附件
保存到相冊
5uwjbu0mhxm64014030435.png
2024-9-28 01:31 上傳
6 ?- O4 \" q* R3 o
|
7 x" n0 `$ \/ p/ k! ^: A, d# v4 r7 X6 Z; M
$ S% F$ J' {8 @% o% z2 ]" n s
0 @7 V: j h7 ~) b1 E4 E關(guān)于我們:9 V* I1 e. a& a2 u# ]
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。. k7 y- t( R# L: y9 d4 ^) b
0 Q8 g# U, a1 O2 khttp://www.latitudeda.com/
8 F6 E2 v% A8 a1 s(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|