|
引言
3 s: j* J+ j" L) Y: i% }本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對(duì)于計(jì)算行業(yè)的發(fā)展具有重要意義。
/ i* ^! M$ X. b( ^& L( U" H, ~- _3 h9 F1 N& i
"Zen 5"核心概述
( h" \: P4 F5 Z7 Y$ ]"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢(shì)的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時(shí)保持出色的能效比。
$ _; X0 |& W- U
# y8 D2 `. p9 S& L! W& r
0x14liirb2v64014029133.png (152.74 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
0x14liirb2v64014029133.png
2024-9-28 01:31 上傳
0 V' ~( G- e! o/ v! a8 @
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。+ ?, p9 Y6 j1 @- L' e R) E
. @9 p3 s4 w6 T* Z( r* B$ p"Zen 5"的主要特性:相比"Zen 4"提升16%的IPC(每時(shí)鐘周期指令數(shù))支持AVX-512變體和FP-5128寬度指令分發(fā)和6個(gè)ALU(算術(shù)邏輯單元)雙管線取指/解碼采用4nm/3nm制程工藝, j# h$ g% {) a" J/ g. j1 N- H
[/ol]4 F X7 k, ~9 c$ \2 _* U) V
微架構(gòu)深入分析
; g! m( Y0 R: v' i- I9 R, V. H"Zen 5"微架構(gòu)引入了多項(xiàng)增強(qiáng)功能,以提高性能和效率。. @$ F7 v1 d1 v8 g
( F" `9 x! O0 C, u" P% G
wjkplehrz3164014029234.png (289.08 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
wjkplehrz3164014029234.png
2024-9-28 01:31 上傳
% v% m7 r8 {7 d
圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個(gè)組件及其互連。
+ K4 O4 F p4 y7 I+ l$ b) b3 @- ? X3 B. ]: r
前端改進(jìn):
$ {$ j6 [+ w. {! T" |雙指令取指和解碼管線8寬度指令分發(fā)到整數(shù)或浮點(diǎn)單元增強(qiáng)的分支預(yù)測(cè),每周期可進(jìn)行2次預(yù)測(cè)更大的Op-Cache,可存儲(chǔ)6K條指令,每周期2x6寬度取指( o; g; V! P9 A& e# e; I$ u3 L- B5 Q" Y
9 Q) W p0 ^& w9 H
執(zhí)行單元增強(qiáng):( H1 `# N" I. u9 _
6個(gè)整數(shù)ALU和4個(gè)AGU(地址生成單元)每周期4個(gè)浮點(diǎn)運(yùn)算,FADD(浮點(diǎn)加法)延遲為2周期完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量( Q* [4 x) V6 r; r5 x
2 l- }/ ^- Z9 M( X
緩存和內(nèi)存子系統(tǒng):
2 g2 ]! B- p8 J/ p48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫入操作1MB 16路組相聯(lián)L2緩存改進(jìn)的L3緩存延遲
# k+ L% B: \" I. C, n
F- ?/ A0 t$ A2 y"Zen 5"家族和平臺(tái)支持2 t7 B4 L' v& u$ [- }
AMD推出了兩種"Zen 5"核心變體,以滿足不同市場(chǎng)細(xì)分的需求:"Zen 5":優(yōu)化單線程性能"Zen 5c":注重性能功耗比和性能面積比% d' F( w/ q# |( }0 L& {
[/ol]2 Q6 q' Q7 f F8 V6 {
/ Q% {# U# ]7 w N
lsonkembxck64014029334.png (147.66 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
lsonkembxck64014029334.png
2024-9-28 01:31 上傳
. n$ x/ X" j1 K+ G& X+ z1 h( U
圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。! _5 }1 k$ E; u
9 B7 o, A2 Q" o9 V/ U3 B這種方法使AMD能夠針對(duì)從高性能臺(tái)式機(jī)到節(jié)能移動(dòng)設(shè)備的廣泛產(chǎn)品范圍。" k/ b1 L/ q+ e( r$ N# O# R4 b
8 X j5 ?' O6 d$ ?4 p- v {% B2 N新指令集架構(gòu)(ISA)特性
: P) o/ f# g+ O5 y! Y% f8 h"Zen 5"核心引入了幾項(xiàng)新指令和功能:, M3 q/ j& ?5 e* O9 F9 d8 s
MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲(chǔ)指令VP2INTERSECT[DQ]:AVX-512向量對(duì)交集3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令PREFETCH[I*]:指令線的軟件預(yù)取增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)
, ?, Z% a$ o% L& }: u& F% o. g1 ~; e7 v, i* \7 M, q8 d- o. P
性能提升
) v5 O) h, v! {AMD聲稱"Zen 5"核心在各種應(yīng)用和使用場(chǎng)景中都實(shí)現(xiàn)了顯著的性能提升。
9 q! d% N* k( t+ }. L9 g
h# ^# B! \* a7 ?" m0 d2 a" X
zvxxsqg3taf64014029434.png (157.54 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
zvxxsqg3taf64014029434.png
2024-9-28 01:31 上傳
, @6 N$ I7 W6 s/ n- H
圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個(gè)領(lǐng)域的改進(jìn)。
" P! D& B! Y8 U/ d. J* \8 \
1 W# @! X4 D3 R) `/ L MIPC提升% H+ H& ]+ _0 q- |! H9 \
"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):
0 [5 [' ]9 v q5 ~3 J I9 |1 k( K4 x" D. r+ ?
hnj2wk1sava64014029534.png (90.56 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
hnj2wk1sava64014029534.png
2024-9-28 01:31 上傳
: f" \5 J, C" D( D圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。4 F6 o5 q4 `, i# @
! x- t* m) W, N( L9 A2 D# F/ gAI和科學(xué)計(jì)算+ ]8 f$ G) T$ N6 R+ {. E
"Zen 5"核心在AI和科學(xué)計(jì)算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:
# b; e6 \3 \4 S- N, j7 s3 v7 a2 l2 y3 Y1 ?& N0 y
pzv5ibat4ld64014029634.png (108.67 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
pzv5ibat4ld64014029634.png
2024-9-28 01:31 上傳
. o$ n2 {! T: H9 c5 d( f0 Z9 w圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。4 M$ h! J) h: _/ i/ E2 S9 U8 M
- S$ Z' q, n* V4 H( v在SoC中的實(shí)現(xiàn). d+ G4 r( z4 ^9 t% b3 U! W- ^
"Zen 5"核心將被實(shí)現(xiàn)在各種系統(tǒng)級(jí)芯片(SoC)設(shè)計(jì)中,以滿足不同市場(chǎng)細(xì)分的需求。
! b' J- S$ M# `6 y- u, \: c0 m"Strix Point" SoC:$ Q% h/ \/ z( e
mbethlwddx564014029734.png (195.44 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
mbethlwddx564014029734.png
2024-9-28 01:31 上傳
' M+ g ^1 r5 D5 w. U) C圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。
( w6 I$ f2 B! O( A, o) @/ a9 `8 b, C3 T
, Q' y3 }8 k' a5 o"Strix Point"的主要特性: E! q+ P* `8 G; Z( E% X- H
異構(gòu)架構(gòu),包含4個(gè)"Zen 5"核心和8個(gè)"Zen 5c"核心集成RDNA 3.5圖形處理器,最多16個(gè)計(jì)算單元XDNA 2推理引擎,用于AI加速支持DDR5/LPDDR5內(nèi)存PCIe 4.0和USB4連接/ y, g4 I8 f) X& r- T/ L
$ t U7 {2 u: ], d
"Granite Ridge" SoC" p; ] X+ o( e3 G
iciyktynici64014029835.png (171.53 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
iciyktynici64014029835.png
2024-9-28 01:31 上傳
4 }3 C4 N- f6 m! k. C; g圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺(tái)式機(jī)應(yīng)用設(shè)計(jì)。; j' u* u4 I/ Z) u; Q D: E$ Y% a
" a3 z8 O% @9 ?# g7 `( |2 Q2 M
"Granite Ridge"的主要特性:
/ x, L. Z* H P0 f$ H最多16個(gè)"Zen 5"核心(2個(gè)CCD,每個(gè)8核)每個(gè)CCD 32MB L3緩存支持DDR5內(nèi)存PCIe 5.0連接兼容AM5插槽
# I+ r) Q# @' Q1 z! C @# ]4 ^+ \. D- R- Z' F+ q, _# W/ J$ I3 s/ d, _
能效改進(jìn)
1 P7 u( y8 l u# ]1 n7 Z$ P"Zen 5"核心在Zen系列的能效優(yōu)勢(shì)基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):增強(qiáng)的電源門控技術(shù)改進(jìn)的smt(同步多線程)支持,提高性能功耗比縮短電源狀態(tài)進(jìn)入/退出時(shí)間優(yōu)化分支預(yù)測(cè),減少無用工作高效的字符串操作和預(yù)取器改進(jìn)
- x7 w8 U/ e" W6 Q% g[/ol]
3 a1 C" a$ n' I- `9 b0 L這些增強(qiáng)功能在保持出色能效的同時(shí),提高了整體系統(tǒng)性能。
. G6 ]: @0 A& ]( r: q, Y; [+ ^3 I: W' }9 g$ u M6 c# G7 Y
RDNA 3.5圖形架構(gòu)
; b( ?+ F# ^) A, [1 p對(duì)于移動(dòng)應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:
+ f8 I! E, X0 C/ M* w
rzwyqc2fvgt64014029935.png (249.83 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
rzwyqc2fvgt64014029935.png
2024-9-28 01:31 上傳
& i7 }* k+ | {1 r2 I) z- y圖9:概述了為移動(dòng)應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。' k- S+ `' j. Q: v' c
% V. v& \3 [8 [, p [( s: h( d
RDNA 3.5的主要改進(jìn):$ r, @+ d+ D* k& l( T; L, o
2倍采樣率和點(diǎn)采樣加速增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍改進(jìn)的光柵化子系統(tǒng),通過子批處理提高效率針對(duì)LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮更大的引擎配置,包括8個(gè)WGP(工作組處理器)和4個(gè)RB+(渲染后端+)
4 {! p8 i$ I3 {! ]9 U b: ~8 }7 f2 h; D
AMD Ryzen AI與XDNA 2架構(gòu)
+ p, p2 M8 s' }" _; k' s8 n為了滿足個(gè)人計(jì)算機(jī)對(duì)AI能力日益增長(zhǎng)的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
7 Y! c! \$ I$ X" B8 f0 S" y: X2 D
xzwccgymld564014030035.png (195.58 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
xzwccgymld564014030035.png
2024-9-28 01:31 上傳
/ n$ Q7 E5 k) ~
圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。
2 R( n- z: U0 N
: s; b* c4 ?- Y0 l0 ^9 W0 d' WXDNA 2的主要特性:
( y) h* M$ x% x最高50 INT8 TOPS(每秒萬億次運(yùn)算)和50 Block FP16 TFLOPS8個(gè)并發(fā)隔離空間流,提高多任務(wù)處理能力片上內(nèi)存容量比上一代增加1.6倍支持塊浮點(diǎn)和增強(qiáng)的非線性函數(shù)相比上一代產(chǎn)品,性能功耗比提高2倍
- _' y2 T7 M4 i3 W. P) P% U3 p
8 w9 I) @ j/ k0 f: p. m0 [結(jié)論
( E6 H3 l- G+ z3 E# _* W: d' u% wAMD "Zen 5"核心代表了x86處理器設(shè)計(jì)的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對(duì)AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿足從移動(dòng)設(shè)備到高性能服務(wù)器等各種市場(chǎng)細(xì)分的現(xiàn)代計(jì)算需求。
" L* u, l% X) }* C8 I' A2 u8 n$ B2 a$ P( Z- O% q! i3 I
隨著AMD不斷創(chuàng)新和突破處理器設(shè)計(jì)的界限,可以期待未來會(huì)有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實(shí)現(xiàn),展示了AMD在競(jìng)爭(zhēng)激烈的處理器市場(chǎng)中提供領(lǐng)先性能和效率的承諾。
6 |$ G/ V: ^( I* U& _/ t8 T3 l+ z* t D4 |9 c6 Z" p
參考文獻(xiàn)6 y) h. M- G' k" o9 w' t
[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.
. \% o0 G- `+ {6 h9 n, h/ ?" R* `5 ?! ]# o" h0 |5 u: @
- END -
4 n, p& m( m: o
/ A6 m4 l6 ^- U* `- m軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。$ N' t8 b/ K3 a& a$ x
點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)* b- b4 r! m8 a/ E' g2 \6 e0 ?' J7 Z
! w* A. v, o6 P6 u6 R歡迎轉(zhuǎn)載/ ^- I9 ~; a; h: G& j/ z) [% H
+ K9 N2 w( d+ T+ Z/ x7 {& a9 _轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
9 P' j0 a- @! h% E
; V! B0 {+ S$ e ^0 G
0 q" O* @' S9 c
: f4 o8 C9 {; q
vjhqegeadpe64014030135.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
vjhqegeadpe64014030135.gif
2024-9-28 01:31 上傳
# O8 i3 F, l6 G$ h7 @2 e) c( T! X. \% j& x8 D! h. ~' n/ o' Z
關(guān)注我們. H; N# c6 ?1 r" M* L# h& F
0 w0 j" v' U- U" s
+ m( A9 |' `1 O/ y
yfjpo4desb064014030235.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
yfjpo4desb064014030235.png
2024-9-28 01:31 上傳
9 _# a6 G7 }+ u, V0 Z' s/ o
| ! n9 [ y) `& F7 Z! R
diigldkjaki64014030335.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
diigldkjaki64014030335.png
2024-9-28 01:31 上傳
( o, w! x" V8 z: J/ d; w
| 4 w6 }# ]3 H* w) Z/ w" g1 M& k2 J& Y
5uwjbu0mhxm64014030435.png (21.52 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
5uwjbu0mhxm64014030435.png
2024-9-28 01:31 上傳
* e; t5 j. S) }4 h
| - F4 N3 d+ }8 R" w" o
! j- o5 v0 M2 z" j/ V
% M4 g9 c! |' A+ M2 s
1 `% E/ i5 ? n- y
關(guān)于我們:! [5 E5 H/ I/ `7 H
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
) @) l% {& Z; n6 N( A# L& l; B2 Q( c# S1 _5 R, N- C2 _
http://www.latitudeda.com/: u2 t& C: D& M( a6 g
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|