|
引言
; Y( T! |' w! U4 L3 b) _- P本文探討AMD即將推出的"Zen 5"核心架構(gòu)。這一新一代處理器核心在性能和效率方面都有顯著提升,對于計(jì)算行業(yè)的發(fā)展具有重要意義。
* J- V4 }" c# j+ s8 q: C( t# h3 Y
) k* Y# C0 M7 F! w c; D"Zen 5"核心概述1 q) r/ [8 q% V
"Zen 5"核心是AMD成功的Zen架構(gòu)系列中的最新迭代。在繼承前代優(yōu)勢的基礎(chǔ)上,"Zen 5"旨在提供顯著的性能改進(jìn),同時(shí)保持出色的能效比。9 _+ S( R1 S# @
9 l/ g$ } _% M) G% L; P& I
0x14liirb2v64014029133.png (152.74 KB, 下載次數(shù): 1)
下載附件
保存到相冊
0x14liirb2v64014029133.png
2024-9-28 01:31 上傳
4 k4 l& J% G0 D1 f2 \8 u. ?6 T% W, J3 }
圖1:展示了Zen架構(gòu)的演進(jìn),突出顯示了Zen 3、Zen 4和Zen 5的關(guān)鍵特性。
: ^2 |$ K1 w9 u2 w+ j
7 z5 v( Y, ]! ]9 {3 S6 a; D"Zen 5"的主要特性:相比"Zen 4"提升16%的IPC(每時(shí)鐘周期指令數(shù))支持AVX-512變體和FP-5128寬度指令分發(fā)和6個ALU(算術(shù)邏輯單元)雙管線取指/解碼采用4nm/3nm制程工藝3 Y! X! ]7 a/ ^/ C" u8 e( Y/ t* O
[/ol]
) Y1 y( k1 Q. w; n) Z& H# k微架構(gòu)深入分析
" l V) ~+ y7 o2 C5 _2 ]. w"Zen 5"微架構(gòu)引入了多項(xiàng)增強(qiáng)功能,以提高性能和效率。
! @- D& \5 [* A+ b3 m
( Q! G9 p' o5 ?9 J
wjkplehrz3164014029234.png (289.08 KB, 下載次數(shù): 0)
下載附件
保存到相冊
wjkplehrz3164014029234.png
2024-9-28 01:31 上傳
7 L" n+ @; v& I0 e2 ^9 M
圖2:提供了"Zen 5"微架構(gòu)的詳細(xì)概覽,展示了各個組件及其互連。
. Q6 S v6 S* E9 D. e9 c: B
# |! o E, J* ~* H前端改進(jìn):0 j# ~5 X+ h3 |- E
雙指令取指和解碼管線8寬度指令分發(fā)到整數(shù)或浮點(diǎn)單元增強(qiáng)的分支預(yù)測,每周期可進(jìn)行2次預(yù)測更大的Op-Cache,可存儲6K條指令,每周期2x6寬度取指 ]+ S7 T4 m9 I
( X% O* L7 l1 D \1 b$ Q0 k執(zhí)行單元增強(qiáng):
- K: x8 G2 [( w2 h7 a6個整數(shù)ALU和4個AGU(地址生成單元)每周期4個浮點(diǎn)運(yùn)算,FADD(浮點(diǎn)加法)延遲為2周期完整的512位AVX-512數(shù)據(jù)通路,提高吞吐量
# r0 B7 D# a+ \) [- h& \
( X: n" s& W* h& k5 o, {/ `+ r) B+ c緩存和內(nèi)存子系統(tǒng):$ [0 v q- i. |$ Y7 p3 |
48KB 12路組相聯(lián)L1數(shù)據(jù)緩存,每周期可進(jìn)行4次讀取,2次寫入操作1MB 16路組相聯(lián)L2緩存改進(jìn)的L3緩存延遲
! K- q% P6 Q1 H9 N& k9 d0 u q" R% E/ `# A( _+ _6 ^
"Zen 5"家族和平臺支持
8 b* _0 W- \6 F% Y( {! JAMD推出了兩種"Zen 5"核心變體,以滿足不同市場細(xì)分的需求:"Zen 5":優(yōu)化單線程性能"Zen 5c":注重性能功耗比和性能面積比
8 a; u+ G) k3 K- Q2 \8 P& {& k# i[/ol]
" U8 @4 B6 z3 Y. d4 O, \/ Q/ Q5 {! V! e3 m1 ?& a( V
lsonkembxck64014029334.png (147.66 KB, 下載次數(shù): 0)
下載附件
保存到相冊
lsonkembxck64014029334.png
2024-9-28 01:31 上傳
* ~8 E: n+ V) ]! y& L3 v
圖3:展示了"Zen 5"家族成員,顯示了"Zen 5"和"Zen 5c"核心之間的差異。- l) V* b+ o) `2 F7 C
4 ~* t; m8 k. y) n- p9 B) n
這種方法使AMD能夠針對從高性能臺式機(jī)到節(jié)能移動設(shè)備的廣泛產(chǎn)品范圍。
1 K& Q# Q1 T# } u( m% ~+ i' A( g/ ^# L8 w
新指令集架構(gòu)(ISA)特性( S. N: z- F1 ~- ]9 @# X
"Zen 5"核心引入了幾項(xiàng)新指令和功能:
- `8 s+ v& J0 `; w d. O+ ^MOVDIRI/MOVD64B:4、8或64字節(jié)的直接存儲指令VP2INTERSECT[DQ]:AVX-512向量對交集3VNNI/VEX:帶VEX編碼的擴(kuò)展AVX-512指令PREFETCH[I*]:指令線的軟件預(yù)取增強(qiáng)的安全特性,包括SEV(安全加密虛擬化)改進(jìn)
% [! Q/ P; N4 a$ p8 N, h4 z7 [) o4 y: N+ D
性能提升, a# H) I7 A0 i4 H) d, v. I! Z2 G
AMD聲稱"Zen 5"核心在各種應(yīng)用和使用場景中都實(shí)現(xiàn)了顯著的性能提升。
( |2 C2 q7 N; t; l% Z* r% j, f6 S0 H2 z& c2 |4 |9 N
zvxxsqg3taf64014029434.png (157.54 KB, 下載次數(shù): 1)
下載附件
保存到相冊
zvxxsqg3taf64014029434.png
2024-9-28 01:31 上傳
" |0 ]* l- {2 E/ R
圖4:展示了"Zen 5"相比"Zen 4"的關(guān)鍵進(jìn)步,突出顯示了各個領(lǐng)域的改進(jìn)。! j: L% U$ u6 G+ z7 w) `: {1 s
$ Z6 U/ W" X/ R( eIPC提升
+ F; c# H2 |/ Y# K"Zen 5"核心在一系列應(yīng)用中展現(xiàn)了令人印象深刻的IPC改進(jìn):) ^6 U8 y) F( ]
4 v- A* s6 D0 u3 S' |( V
hnj2wk1sava64014029534.png (90.56 KB, 下載次數(shù): 2)
下載附件
保存到相冊
hnj2wk1sava64014029534.png
2024-9-28 01:31 上傳
% r, @: l6 b- h$ V& {0 {圖5:顯示了使用"Zen 5"核心的PC相比前幾代產(chǎn)品的IPC提升。
7 N' ^4 s; R8 Q* B- K, J$ b) `( I; G; p; t7 j: G% C1 J& M9 X
AI和科學(xué)計(jì)算
1 ]6 K- p+ k! n; t"Zen 5"核心在AI和科學(xué)計(jì)算工作負(fù)載方面也表現(xiàn)出顯著的性能提升:3 [/ w+ l2 H$ p' ^% C
' H9 | e) P5 o/ X9 k& ^! [9 Q1 L
pzv5ibat4ld64014029634.png (108.67 KB, 下載次數(shù): 1)
下載附件
保存到相冊
pzv5ibat4ld64014029634.png
2024-9-28 01:31 上傳
8 G5 \+ \# J8 a& E3 v9 N4 E圖6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"處理器在AI吞吐量性能方面的領(lǐng)先地位。7 s+ ]7 }+ ?6 U) b* g5 G: H M0 Z0 g
! h; F2 l0 o; [
在SoC中的實(shí)現(xiàn)
' f* T9 C6 H) F$ R"Zen 5"核心將被實(shí)現(xiàn)在各種系統(tǒng)級芯片(SoC)設(shè)計(jì)中,以滿足不同市場細(xì)分的需求。+ Q3 `3 M, {* j7 C3 }1 m* [: d
"Strix Point" SoC:
# c- f6 T6 o6 I( V( z2 S
mbethlwddx564014029734.png (195.44 KB, 下載次數(shù): 2)
下載附件
保存到相冊
mbethlwddx564014029734.png
2024-9-28 01:31 上傳
/ Z, D& Q6 a8 T3 _: t
圖7提供了"Strix Point" SoC的詳細(xì)框圖,展示了"Zen 5"和"Zen 5c"核心的集成。" L& F8 \% J) [8 n" ]9 R0 K
0 U: g9 L0 L- T* C- j' D
"Strix Point"的主要特性:
. w6 U$ C7 Y4 n; R/ t異構(gòu)架構(gòu),包含4個"Zen 5"核心和8個"Zen 5c"核心集成RDNA 3.5圖形處理器,最多16個計(jì)算單元XDNA 2推理引擎,用于AI加速支持DDR5/LPDDR5內(nèi)存PCIe 4.0和USB4連接
: i* V/ U* J6 R' E! D2 Z4 V* F. ^0 S) W7 o( P3 G
"Granite Ridge" SoC
: h1 k" A! M3 j v* Y% t! s1 V% L& |+ n
iciyktynici64014029835.png (171.53 KB, 下載次數(shù): 1)
下載附件
保存到相冊
iciyktynici64014029835.png
2024-9-28 01:31 上傳
* r `( \! g+ G: C) l9 N; q: T
圖8:顯示了"Granite Ridge" SoC的框圖,該SoC專為高性能臺式機(jī)應(yīng)用設(shè)計(jì)。
! T7 y! ?: _( h$ ]- h) f
( L6 Y. y9 h/ s"Granite Ridge"的主要特性:
/ t( ]1 \- o5 A" w/ _5 _最多16個"Zen 5"核心(2個CCD,每個8核)每個CCD 32MB L3緩存支持DDR5內(nèi)存PCIe 5.0連接兼容AM5插槽8 E& u0 L8 f( x( ~9 U0 A
, l7 k) \8 }( D& R能效改進(jìn)2 r/ S: V/ m2 H, g- ?) P
"Zen 5"核心在Zen系列的能效優(yōu)勢基礎(chǔ)上進(jìn)行了進(jìn)一步改進(jìn):增強(qiáng)的電源門控技術(shù)改進(jìn)的smt(同步多線程)支持,提高性能功耗比縮短電源狀態(tài)進(jìn)入/退出時(shí)間優(yōu)化分支預(yù)測,減少無用工作高效的字符串操作和預(yù)取器改進(jìn)
9 e/ j7 D1 j' Y ~' _9 M* `; Q[/ol]6 l5 N0 r; `0 Y7 n, m
這些增強(qiáng)功能在保持出色能效的同時(shí),提高了整體系統(tǒng)性能。) l+ l4 H' G. a6 z0 X
4 y' ~7 C( ~, ^0 S; I, N0 ~RDNA 3.5圖形架構(gòu)
9 J; ^# v9 X' [, F9 J; _; Q對于移動應(yīng)用,AMD還改進(jìn)了集成圖形架構(gòu),推出了RDNA 3.5:1 q- d! m; q9 L& N1 r! L
rzwyqc2fvgt64014029935.png (249.83 KB, 下載次數(shù): 0)
下載附件
保存到相冊
rzwyqc2fvgt64014029935.png
2024-9-28 01:31 上傳
/ `+ S4 @$ x% Z/ h! K5 g
圖9:概述了為移動應(yīng)用優(yōu)化的RDNA 3.5圖形架構(gòu)的改進(jìn)。( q/ E7 J1 r0 C# Q0 F) c
+ k% |/ ]* E p8 [( K# A5 }6 tRDNA 3.5的主要改進(jìn):
( [7 h4 V' |9 h3 S" m2倍采樣率和點(diǎn)采樣加速增強(qiáng)的著色器子系統(tǒng),插值和比較率提高2倍改進(jìn)的光柵化子系統(tǒng),通過子批處理提高效率針對LPDDR5的內(nèi)存子系統(tǒng)優(yōu)化和改進(jìn)的壓縮更大的引擎配置,包括8個WGP(工作組處理器)和4個RB+(渲染后端+)
( a3 [1 i( f4 P' ?* d6 S! b! W
6 z" I8 L0 }9 n' ?! oAMD Ryzen AI與XDNA 2架構(gòu)6 [0 O/ Y( F3 Z2 r: w
為了滿足個人計(jì)算機(jī)對AI能力日益增長的需求,AMD引入了XDNA 2架構(gòu)用于AI加速:
7 v* Z" B+ D: T
xzwccgymld564014030035.png (195.58 KB, 下載次數(shù): 1)
下載附件
保存到相冊
xzwccgymld564014030035.png
2024-9-28 01:31 上傳
5 o2 h" f* C1 t* f* b4 _7 M9 v, ?
圖10:展示了基于XDNA 2架構(gòu)的AMD Ryzen AI "Strix" NPU(神經(jīng)處理單元)。: H) A- S2 p5 r& \* ]" R1 o
3 Q- N3 p W& g* H' ~0 C- A
XDNA 2的主要特性:+ t! y' `) I" k& [! _% S$ b
最高50 INT8 TOPS(每秒萬億次運(yùn)算)和50 Block FP16 TFLOPS8個并發(fā)隔離空間流,提高多任務(wù)處理能力片上內(nèi)存容量比上一代增加1.6倍支持塊浮點(diǎn)和增強(qiáng)的非線性函數(shù)相比上一代產(chǎn)品,性能功耗比提高2倍
3 W3 F9 ^9 n! B* P- x6 _5 H# k: H- y5 A2 r" I I- A
結(jié)論- y; a+ N& j& P, [9 ]& z$ F% h0 k
AMD "Zen 5"核心代表了x86處理器設(shè)計(jì)的飛躍,在各種應(yīng)用中都提供了顯著的性能改進(jìn)。憑借對AI加速、能效和可擴(kuò)展性的關(guān)注,"Zen 5"核心有能力滿足從移動設(shè)備到高性能服務(wù)器等各種市場細(xì)分的現(xiàn)代計(jì)算需求。. R/ F: i4 }3 u$ R
( N" l" |# ^; S! e7 R4 A! \
隨著AMD不斷創(chuàng)新和突破處理器設(shè)計(jì)的界限,可以期待未來會有更多令人興奮的發(fā)展。"Zen 5"核心及其在各種SoC中的實(shí)現(xiàn),展示了AMD在競爭激烈的處理器市場中提供領(lǐng)先性能和效率的承諾。
% }4 l9 H) E. ^' f) e# K Q" Y7 x# H
+ N: b1 e* `( P8 }參考文獻(xiàn)6 Z8 N& a5 o5 _9 p6 [' G4 `
[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.2 e5 l1 u* w: r2 O' l2 @
2 c) S0 P }! ]% z, ?5 n- END -
+ `! y! @' ?$ {9 J9 t
6 u) i4 P7 N* P; x軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
4 k; j( Y7 M0 H6 x+ z7 U$ x4 `點(diǎn)擊左下角"閱讀原文"馬上申請
$ Y1 g/ M2 Q, P" I
0 e7 t% N% _& B0 R' U歡迎轉(zhuǎn)載/ b0 j: X+ D5 u
4 w# V' ]1 g/ M: z* u4 q2 }
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!: s l# l& ^! n- d L' }+ D! ] Z
7 e* t/ l d0 C+ N
* @7 Q; s4 j, H, S, m
6 K8 J2 B- o# Z+ H U! v1 {
vjhqegeadpe64014030135.gif (16.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊
vjhqegeadpe64014030135.gif
2024-9-28 01:31 上傳
4 ^$ ?, d4 a( [2 K& q1 [8 X. P" c7 r% B( z9 t
關(guān)注我們
/ p% P8 `& Q+ I$ F0 y
$ v1 U" Y# f! r" a& R ^
& U8 p0 T/ F2 }. u2 g; h# [ l! y
yfjpo4desb064014030235.png (31.33 KB, 下載次數(shù): 1)
下載附件
保存到相冊
yfjpo4desb064014030235.png
2024-9-28 01:31 上傳
8 F0 M" e) r9 f( b6 n; l6 ~ | ; V7 M( B0 ?+ o! \
diigldkjaki64014030335.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
diigldkjaki64014030335.png
2024-9-28 01:31 上傳
# o9 b% T. M# s7 I6 b |
, L, m9 j3 a) |" H G/ @ u: Z+ ^
5uwjbu0mhxm64014030435.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
5uwjbu0mhxm64014030435.png
2024-9-28 01:31 上傳
" B; X' [" l( n+ p2 O- J o | 8 e9 `1 F, e, r* \4 Q# n5 x: e
* O3 ^" ]8 G9 M/ |- M
) V) P* E7 B4 I/ \* K9 c2 k. v
- k0 W- K3 S/ n1 ?1 l2 d% W, o關(guān)于我們:
& ?4 L$ F8 O8 @+ W3 z深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
0 C: K: f- @& `& m+ k+ D3 r7 Y- i% f5 I0 M, Q. N# I9 O/ a
http://www.latitudeda.com/
( g- z) R' x0 {; `4 Y7 l- j" V(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|