|
引言
9 k/ r: g# O& Y7 }本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對(duì)于計(jì)算行業(yè)的發(fā)展具有重要意義。( V- T% q, d9 v, g4 g
$ g, T- ~6 _' H, l" q A* \"Zen 5"核心概述
/ U8 H/ w1 v" ?5 z; f"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢(shì)的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時(shí)保持出色的能效比。
+ a) t! |1 ^& \" y6 C$ q' w9 I, ~2 B6 p4 f) F4 E1 [% e# l: y, E- k3 d
0x14liirb2v64014029133.png (152.74 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
0x14liirb2v64014029133.png
2024-9-28 01:31 上傳
: \- ~ r0 K J, J
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。
0 ~; [7 F3 P0 e- z5 C$ s+ |
6 {+ x9 S& u, T1 k0 N T; t# y"Zen 5"的主要特性:相比"Zen 4"提升16%的IPC(每時(shí)鐘周期指令數(shù))支持AVX-512變體和FP-5128寬度指令分發(fā)和6個(gè)ALU(算術(shù)邏輯單元)雙管線(xiàn)取指/解碼采用4nm/3nm制程工藝4 t1 L! ]8 T, c, a, W
[/ol]; j4 ?1 I! W$ [9 ^; ?: } P9 j" z
微架構(gòu)深入分析) H+ ?; x) W7 S5 N2 @0 z) O
"Zen 5"微架構(gòu)引入了多項(xiàng)增強(qiáng)功能,以提高性能和效率。& z) K# m$ L! S ~6 y. w
, O$ G$ Z4 b( s! X* D
wjkplehrz3164014029234.png (289.08 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
wjkplehrz3164014029234.png
2024-9-28 01:31 上傳
8 N6 M% D. w; J9 S0 G9 o+ J( t6 l
圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個(gè)組件及其互連。- e7 M' b7 q- u" T& o' u; q0 Y$ K7 {
8 \# r# r4 I' C4 K7 W% \$ |3 M
前端改進(jìn):) z! m9 O" _6 p9 K1 ~ I; }7 e
雙指令取指和解碼管線(xiàn)8寬度指令分發(fā)到整數(shù)或浮點(diǎn)單元增強(qiáng)的分支預(yù)測(cè),每周期可進(jìn)行2次預(yù)測(cè)更大的Op-Cache,可存儲(chǔ)6K條指令,每周期2x6寬度取指
9 v/ N" E1 Q8 h" ~' q) V C
+ P- Y) T2 A! a0 N; c1 o執(zhí)行單元增強(qiáng):6 ]0 D% I9 v4 y2 t- ] O
6個(gè)整數(shù)ALU和4個(gè)AGU(地址生成單元)每周期4個(gè)浮點(diǎn)運(yùn)算,FADD(浮點(diǎn)加法)延遲為2周期完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量
/ K8 d9 S/ @3 h" A: Z% G# }* h: A5 k5 [0 N. m
緩存和內(nèi)存子系統(tǒng):% P8 b S0 Y$ Q7 i
48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫(xiě)入操作1MB 16路組相聯(lián)L2緩存改進(jìn)的L3緩存延遲
) Y% T" Y; m1 Z
0 x6 c) ^- \. c0 }% I$ l8 q"Zen 5"家族和平臺(tái)支持
' N" p. x1 y$ m% BAMD推出了兩種"Zen 5"核心變體,以滿(mǎn)足不同市場(chǎng)細(xì)分的需求:"Zen 5":優(yōu)化單線(xiàn)程性能"Zen 5c":注重性能功耗比和性能面積比
1 K6 \2 s* N- T/ q8 V3 t[/ol]
7 z0 n! k5 Y, V1 `2 ^8 k
% i6 e) h; G4 i% m# S9 W; r' V" g, q
lsonkembxck64014029334.png (147.66 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
lsonkembxck64014029334.png
2024-9-28 01:31 上傳
8 y8 p( Y ?) `圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。; `& D; }2 j7 E
) L6 T8 O( {% o! y. q: `0 C這種方法使AMD能夠針對(duì)從高性能臺(tái)式機(jī)到節(jié)能移動(dòng)設(shè)備的廣泛產(chǎn)品范圍。2 B5 ]5 ~' }% s' [! `- s
3 ?; H+ }: A1 _* F( ]; e# `) Y
新指令集架構(gòu)(ISA)特性
- S) i4 D5 F2 m, J% v0 \"Zen 5"核心引入了幾項(xiàng)新指令和功能:5 f. w, n1 s! F3 I/ c1 }" e- j
MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲(chǔ)指令VP2INTERSECT[DQ]:AVX-512向量對(duì)交集3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令PREFETCH[I*]:指令線(xiàn)的軟件預(yù)取增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)8 v3 S- x# c5 ?9 e8 I
: B$ d+ W$ W/ W. I- U/ x
性能提升
6 l7 S0 W: W# }0 R# RAMD聲稱(chēng)"Zen 5"核心在各種應(yīng)用和使用場(chǎng)景中都實(shí)現(xiàn)了顯著的性能提升。2 ^$ s. D+ z3 D: v* P! r
5 n1 J; d1 G ]$ N3 Q
zvxxsqg3taf64014029434.png (157.54 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
zvxxsqg3taf64014029434.png
2024-9-28 01:31 上傳
/ |' C0 m, w. l3 g% l5 b圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個(gè)領(lǐng)域的改進(jìn)。
6 n# R3 a3 Y# @2 Y( j. K6 z' }4 {- q4 J+ g" M' _
IPC提升
+ ?: Q3 u+ T) k( `) k; z7 y"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):& k7 @! W/ _) x- k
, V) q3 e+ s! I3 _
hnj2wk1sava64014029534.png (90.56 KB, 下載次數(shù): 5)
下載附件
保存到相冊(cè)
hnj2wk1sava64014029534.png
2024-9-28 01:31 上傳
6 v7 u. t- X. G; |+ y0 N/ f圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。/ m# G }: \8 ]9 m$ w
]% c9 P" U' F
AI和科學(xué)計(jì)算! f. `! V& i# n9 T& i
"Zen 5"核心在AI和科學(xué)計(jì)算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:
, z$ q" p7 d: I% i ~# ?! L8 s/ B* [+ [' _ n% a
pzv5ibat4ld64014029634.png (108.67 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
pzv5ibat4ld64014029634.png
2024-9-28 01:31 上傳
* k; j. |8 E5 I) U( M
圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。 `2 G' J% j% H! y4 F
: f d- ]' I4 ?/ e* b0 z5 E在SoC中的實(shí)現(xiàn)$ D: u4 R3 c+ [4 g8 N/ |9 J
"Zen 5"核心將被實(shí)現(xiàn)在各種系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)中,以滿(mǎn)足不同市場(chǎng)細(xì)分的需求。9 n" c r+ @8 h' z
"Strix Point" SoC:
# G1 q7 t( `1 z
mbethlwddx564014029734.png (195.44 KB, 下載次數(shù): 5)
下載附件
保存到相冊(cè)
mbethlwddx564014029734.png
2024-9-28 01:31 上傳
* W! B$ [& n" ]% Q! E
圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。. D0 i: q( X. V+ _) W0 X
" } c* a& s$ T) ?9 u, h"Strix Point"的主要特性:3 l6 @% r8 i0 z6 H9 x: g3 q
異構(gòu)架構(gòu),包含4個(gè)"Zen 5"核心和8個(gè)"Zen 5c"核心集成RDNA 3.5圖形處理器,最多16個(gè)計(jì)算單元XDNA 2推理引擎,用于AI加速支持DDR5/LPDDR5內(nèi)存PCIe 4.0和USB4連接5 T0 d% Y4 P% D& K- P+ s: r* i
9 F i+ j' d \; ]- N' {0 a"Granite Ridge" SoC
1 L! J7 H* ?% o' C* `
iciyktynici64014029835.png (171.53 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
iciyktynici64014029835.png
2024-9-28 01:31 上傳
# y! N2 @$ @% F, @" d. Q$ W- C+ X2 ]
圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專(zhuān)為高性能臺(tái)式機(jī)應(yīng)用設(shè)計(jì)。
& o1 U; d; z9 c" b) T' S& x
$ O( ?" Q' m- v% H"Granite Ridge"的主要特性:
) C' V4 N) F& |0 S最多16個(gè)"Zen 5"核心(2個(gè)CCD,每個(gè)8核)每個(gè)CCD 32MB L3緩存支持DDR5內(nèi)存PCIe 5.0連接兼容AM5插槽/ `9 S/ |) `% c2 w- W) g$ c
* H7 u# m& R7 m8 C
能效改進(jìn)0 K% M. F) L7 @; _' O
"Zen 5"核心在Zen系列的能效優(yōu)勢(shì)基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):增強(qiáng)的電源門(mén)控技術(shù)改進(jìn)的smt(同步多線(xiàn)程)支持,提高性能功耗比縮短電源狀態(tài)進(jìn)入/退出時(shí)間優(yōu)化分支預(yù)測(cè),減少無(wú)用工作高效的字符串操作和預(yù)取器改進(jìn)2 k& @0 o& s' m; L' f, o& Y3 a; v
[/ol] M7 ^' }: f' f, p
這些增強(qiáng)功能在保持出色能效的同時(shí),提高了整體系統(tǒng)性能。
% ]2 Q5 ?0 C, ]; q0 T- z* j
1 `! @# [8 q/ y! j0 X( {1 FRDNA 3.5圖形架構(gòu)
8 n3 m+ f% c3 ]7 h) w8 c+ n對(duì)于移動(dòng)應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:0 c# N: G+ y. J5 g/ _$ P. d! O3 {) {* G
rzwyqc2fvgt64014029935.png (249.83 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
rzwyqc2fvgt64014029935.png
2024-9-28 01:31 上傳
- ?) Q1 [ t9 D/ n; X$ f; ~9 A! A
圖9:概述了為移動(dòng)應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。& Z2 |3 C- p. }" e% W" h. V
. [8 X: P+ D8 v: o1 q: {
RDNA 3.5的主要改進(jìn): g" v1 T( b J) J% t; I5 }
2倍采樣率和點(diǎn)采樣加速增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍改進(jìn)的光柵化子系統(tǒng),通過(guò)子批處理提高效率針對(duì)LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮更大的引擎配置,包括8個(gè)WGP(工作組處理器)和4個(gè)RB+(渲染后端+)
# m$ r- {, I' X8 D9 B3 l% w, @4 \- f1 u, K! A( o
AMD Ryzen AI與XDNA 2架構(gòu)* m/ j$ l- \0 O( j; D- B
為了滿(mǎn)足個(gè)人計(jì)算機(jī)對(duì)AI能力日益增長(zhǎng)的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
/ E S( B6 |8 {* { b+ I
xzwccgymld564014030035.png (195.58 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
xzwccgymld564014030035.png
2024-9-28 01:31 上傳
" O& b4 T& D% O3 L0 @' @圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。' y2 v# ]. m) l1 o6 Y
9 A0 O" x, [- |7 A% F9 sXDNA 2的主要特性:0 Q3 L$ u9 Q z2 f0 E
最高50 INT8 TOPS(每秒萬(wàn)億次運(yùn)算)和50 Block FP16 TFLOPS8個(gè)并發(fā)隔離空間流,提高多任務(wù)處理能力片上內(nèi)存容量比上一代增加1.6倍支持塊浮點(diǎn)和增強(qiáng)的非線(xiàn)性函數(shù)相比上一代產(chǎn)品,性能功耗比提高2倍
3 {- t# x. {# \# r: e
7 g1 C- x9 h1 Y" {) c結(jié)論
) o" H! Q1 {( n* ?AMD "Zen 5"核心代表了x86處理器設(shè)計(jì)的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對(duì)AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿(mǎn)足從移動(dòng)設(shè)備到高性能服務(wù)器等各種市場(chǎng)細(xì)分的現(xiàn)代計(jì)算需求。
8 M1 \; ?# I3 a: I' h: q+ q! }$ `1 o/ N; k
隨著AMD不斷創(chuàng)新和突破處理器設(shè)計(jì)的界限,可以期待未來(lái)會(huì)有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實(shí)現(xiàn),展示了AMD在競(jìng)爭(zhēng)激烈的處理器市場(chǎng)中提供領(lǐng)先性能和效率的承諾。
5 F9 S b @6 v6 Z5 q+ y- [3 O+ [' |) l6 D: D4 b9 S
參考文獻(xiàn)+ [/ U y( ^$ g
[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.- N* ~% L8 P" n! \" f4 a* F
% N9 J- h n: B' _' b3 D- END -
) d2 I. ^! w5 r, |0 F5 z: H: B) E* @. W* g- w0 [" m+ D
軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
. v" V* C0 Z( I% q& Z9 ^點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)( S3 \3 j$ l8 P
" y, O$ c( a4 Z歡迎轉(zhuǎn)載
% t: B& N" M5 ^7 O4 U4 u! P6 x) v
& J1 Q6 i8 o( { [ D( e: Y轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
4 c+ e1 U3 z0 q% k3 g S6 W# R
q+ r( B1 `( W4 S4 Q
/ }7 a! A; u" F* L
) E5 N: |. x7 u
vjhqegeadpe64014030135.gif (16.04 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
vjhqegeadpe64014030135.gif
2024-9-28 01:31 上傳
8 G4 Y0 O1 m5 p1 Q/ y, Y" ~8 t' ^
v [' f5 o: G3 F關(guān)注我們
9 C% y+ V' a. F% P, Y1 ]6 D
9 r5 s( R, K" z' R( Y; x, k
8 H* V4 f8 I. G( [
yfjpo4desb064014030235.png (31.33 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
yfjpo4desb064014030235.png
2024-9-28 01:31 上傳
7 @0 ]; D- z* e" a. [1 n5 ^ s
|
* I; a, d4 d# d- {
diigldkjaki64014030335.png (82.79 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
diigldkjaki64014030335.png
2024-9-28 01:31 上傳
3 O) `; F% p( i' { | 7 ]+ k* ] |6 `" r1 t* V
5uwjbu0mhxm64014030435.png (21.52 KB, 下載次數(shù): 5)
下載附件
保存到相冊(cè)
5uwjbu0mhxm64014030435.png
2024-9-28 01:31 上傳
2 {% m, ^. v8 a& {. `( ^' B
|
: [! L9 s0 [% x1 _$ N( j6 c: F7 R9 L4 N
: ~ ^6 M9 `9 B) K- r( _
. N' q- \2 N, D8 o* E關(guān)于我們: B' \8 X( S% F3 T* [9 q# S
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專(zhuān)注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開(kāi)發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶(hù)。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線(xiàn)合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶(hù)提供前沿技術(shù)與服務(wù)。
! ]7 C8 Z j5 V# y
* b: {5 G/ H& G: |; o. z! zhttp://www.latitudeda.com/* p y9 o/ O) C' k( w+ _0 F, w
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|