|
引言5 O9 n% a& N1 D/ h
本文探討英特爾的Lunar Lake架構(gòu)。Lunar Lake是專為下一代AI PC設(shè)計的系統(tǒng)級芯片(SoC),集成了多項突破性技術(shù),旨在提供卓越的核心性能、無與倫比的AI計算能力和顯著提升的圖形性能,同時實現(xiàn)了x86架構(gòu)的突破性能效比[1]。
! B7 V- b" {5 j9 x+ I# j( F6 m, ]$ t8 z
tkvyhnvndhz64072298216.png (520.43 KB, 下載次數(shù): 0)
下載附件
保存到相冊
tkvyhnvndhz64072298216.png
2024-10-11 01:03 上傳
% }- x# p7 m. D8 M) v' f
圖1:展示了Lunar Lake架構(gòu)的主要改進(jìn),包括SoC功耗降低40%,相同單線程性能下功耗減半,圖形性能提升1.5倍,以及AI計算能力達(dá)到120 TOPS(每秒萬億次操作)。
: F @/ m& Y5 t( L7 Y5 w0 p: L" \ N2 k
7 W+ I" b# g4 o+ `2 b8 k
先進(jìn)封裝和內(nèi)存集成
! Q# t$ ^5 Z. E8 y0 b1 c! CLunar Lake架構(gòu)的一項重大創(chuàng)新是采用了英特爾的Foveros 3D封裝技術(shù)。 ^6 d# C* J. I& R9 y! b! B, P0 W
$ W! X! W. m- ] m! L+ S3 |
a54euqcenvs64072298316.png (444.93 KB, 下載次數(shù): 0)
下載附件
保存到相冊
a54euqcenvs64072298316.png
2024-10-11 01:03 上傳
0 k( g4 G. T! B" k0 I3 o
圖2:Lunar Lake架構(gòu)的Foveros封裝結(jié)構(gòu),顯示了計算芯片、平臺控制器芯片和內(nèi)存的堆疊方式。& |8 Q& B4 S& W- J
; z! }$ I* h6 [& U/ pLunar Lake引入了開創(chuàng)性功能:將內(nèi)存直接集成到封裝中。這是英特爾的首次嘗試,帶來了多項優(yōu)勢:7 L% j% W4 B7 n8 }! r4 ]3 v- }+ J
支持LPDDR5x DRAM最高32GB容量,支持雙列每芯片最高8.5GT/s傳輸速率支持16位x4通道物理層功耗降低40%節(jié)省高達(dá)250平方毫米的面積+ O; A1 Q: C- e5 \
- n3 t4 y# F+ k& y4 Y7 ~
架構(gòu)框架$ j6 Q# `5 E4 u$ Q
Lunar Lake架構(gòu)主要由兩個組件構(gòu)成:計算芯片和平臺控制器芯片。$ k. y Q5 N. H" ^- ^
, e6 c" l0 h% a. e# i% i0 C! Y
jtdebbnc1hv64072298417.png (440.97 KB, 下載次數(shù): 2)
下載附件
保存到相冊
jtdebbnc1hv64072298417.png
2024-10-11 01:03 上傳
$ v% q' {$ T4 I- o k1 {2 h
圖3:Lunar Lake架構(gòu)框架,突出顯示了計算芯片和平臺控制器芯片。! E% g2 o, D/ H1 ~! E) C- S* c3 @
8 k& ^! y5 i( w: K; E計算芯片
8 G$ { F( h7 i6 x1 h9 l計算芯片是使用先進(jìn)制程制造的單片式芯片。具有經(jīng)過增強(qiáng)的SoC結(jié)構(gòu),旨在提高性能效率。
) e$ m3 C: X" n* z: _9 K8 T# u9 e4 r; q `4 l8 J/ N: E
計算芯片的主要組件包括:
- \* w) b3 X% c u/ S新型片上網(wǎng)絡(luò)(NoC),具有增強(qiáng)的緩存功能優(yōu)化的內(nèi)存延遲GPU、NPU(神經(jīng)網(wǎng)絡(luò)處理單元)和IPU(圖像處理單元)性能核心(P核心)和高效核心(E核心)媒體和顯示引擎7 m4 l9 l4 {- G0 J9 t* }
' k: u+ m5 I9 x4 z" M; m4 d; {) x5 @$ {: b$ u2 h
i1z1rsoap1l64072298517.png (327.58 KB, 下載次數(shù): 0)
下載附件
保存到相冊
i1z1rsoap1l64072298517.png
2024-10-11 01:03 上傳
2 D9 u+ A# @3 Y& e4 E5 W3 i e圖4:展示了計算芯片的結(jié)構(gòu),描繪了各種組件的排列,如核心、GPU、NPU和內(nèi)存接口。8 B6 N6 S# ]0 ?3 r: V9 ^
: y/ v& k, ?8 i; h: s
內(nèi)存?zhèn)染彺?/strong>9 n3 q8 N7 w8 c$ |
Lunar Lake引入了內(nèi)存?zhèn)染彺,有助于減少DRAM訪問和功耗,同時為其他引擎提高延遲和帶寬性能。這個8MB物理緩存還為I/O引擎提供緩存功能。
5 U6 B7 a2 Q6 ? N% U: q: G0 N
( g) ^1 d# B- c增強(qiáng)型E核心集群
$ U: K) d9 s! v* hLunar Lake的高效核心(E核心)集群得到了顯著改進(jìn):
5 H% W' R7 H$ c: EL2緩存增加到4MB采用先進(jìn)制程,提高頻率和功耗特性內(nèi)存?zhèn)染彺娓纳乒暮脱舆t相比上一代,核心數(shù)量翻倍獨(dú)立供電
+ Z7 Q$ U0 b( j8 o+ i
+ t: K7 z. M# ]4 s2 c1 J; m供電和功耗管理/ T5 ?1 I) Y( S7 D
Lunar Lake具有升級的供電和功耗管理系統(tǒng),對于優(yōu)化SoC功耗利用和性能效率非常重要。這包括:采用4個電源管理集成電路(PMIC)進(jìn)行供電更多電源軌增強(qiáng)的遙測功能(IMON)動態(tài)電壓ID升級的功耗管理,英特爾線程調(diào)度器專注于效率改進(jìn)的"睡眠"狀態(tài),提高功耗和延遲性能針對不同負(fù)載類型優(yōu)化的功率平衡器基于機(jī)器學(xué)習(xí)的工作負(fù)載分類和頻率控制1 M1 @: v r2 B7 i
[/ol]9 Z$ F+ O' k/ O5 L
性能核心:獅灣(Lion Cove)
4 s% J7 A6 g! c7 mLunar Lake引入了新的性能核心架構(gòu),名為獅灣。獅灣的主要目標(biāo)是優(yōu)化客戶端SoC的單線程性能功耗比和性能面積比。
8 d, P7 A! F5 ^$ P+ G) F
0 G, M4 b7 R& `6 e4 U" j# Z: ?獅灣(Lion Cove)的主要特點包括:
* o/ R* Z2 R5 D0 P) r* U7 F; k針對PPA(性能、功耗和面積)優(yōu)化更精細(xì)的時鐘間隔分離的亂序執(zhí)行引擎更寬的調(diào)度能力增強(qiáng)的內(nèi)存子系統(tǒng)基于AI的功耗管理. j4 F' m# k, V* U6 v8 o& i
- D* f$ M$ c/ z: Z& H7 V
4 \' W F! v: `
fpwq0ci1mrv64072298617.png (192.51 KB, 下載次數(shù): 0)
下載附件
保存到相冊
fpwq0ci1mrv64072298617.png
2024-10-11 01:03 上傳
, |+ \& u9 x( v& |圖5:比較了獅灣(Lion Cove)P核心與上一代紅木灣(Redwood Cove)核心的性能,顯示在IPC(每時鐘周期指令數(shù))和功耗效率方面有顯著改進(jìn)。7 r( f! G; ~! I* r! c! C O' m/ y" U
; |3 i1 P5 F- g" {高效核心:天際(Skymont)6 i! p( j% g/ m$ i+ x" A8 J
與獅灣P核心相輔相成的是新的天際E核心。天際旨在擴(kuò)大低功耗島的范圍和提高多線程性能,同時將向量和AI吞吐量翻倍。
1 Q8 ` k c; W, D. [
: k0 J# J1 A! }, j! ~( c9 F天際(Skymont)的主要特點包括:3 J: ^5 N. t& X) m
增強(qiáng)的預(yù)測能力96B并行取指更寬的分配和退休單元26個分發(fā)端口4MB共享L2緩存通過4x 128位浮點和SIMD向量單元實現(xiàn)2倍AI吞吐量
9 Q, p# t2 C# u; k/ H) B! \% j7 H1 J$ q! w" ]; ?1 O8 W1 t
: `$ O" D! Y, |- r( w( E
1gf0ulniivh64072298717.png (161.65 KB, 下載次數(shù): 0)
下載附件
保存到相冊
1gf0ulniivh64072298717.png
2024-10-11 01:03 上傳
/ [8 S+ U4 H% ]& A+ d, m. c1 i圖6:展示了天際(Skymont)E核心集群相比上一代的功耗和性能改進(jìn),顯示性能提升最高可達(dá)2倍,或在相同性能下功耗降低至1/3。) u% s; c7 m/ G/ j% X
0 ~3 C( O2 b! n' X5 w: D/ D
下一代Xe2 GPU
' Z' G+ D3 ^" [0 V: n6 p8 O6 oLunar Lake采用了新的Xe2 GPU架構(gòu),在圖形性能方面實現(xiàn)了重大進(jìn)展。! H: ?: ^ L) {7 _$ u: Z
主要改進(jìn)包括:' _% c( u9 X, ~6 \
新的向量引擎,優(yōu)化效率和AI吞吐量新的Xe矩陣擴(kuò)展(XMX)引擎,INT8運(yùn)算能力為2048 OPS/時鐘,F(xiàn)P16運(yùn)算能力為4096 OPS/時鐘8MB L2緩存增強(qiáng)的Xe超級采樣(XeSS)內(nèi)核8個第二代Xe核心更大的光線追蹤單元AI性能高達(dá)67 TOPS
+ x: a- x/ W5 Q; T4 q+ g" Y/ [( d& ?2 e( @# t: Z
+ `$ ~( R: { s! c; F
njqd4pku52o64072298818.png (386.17 KB, 下載次數(shù): 0)
下載附件
保存到相冊
njqd4pku52o64072298818.png
2024-10-11 01:03 上傳
: B& Z, P$ u0 C; u) N
圖7:顯示了新一代Xe2 GPU相比流星湖的性能改進(jìn),在相似功耗水平下性能提升高達(dá)1.5倍。
- P1 E' S3 P4 s- X4 O- C/ X
' W& B# j3 `* x6 }( l- s下一代NPU 4/ f5 l3 {5 D& E5 T. u6 }3 A# a9 ^, e
Lunar Lake集成了新的神經(jīng)網(wǎng)絡(luò)處理單元(NPU 4),旨在加速AI工作負(fù)載。NPU 4的目標(biāo)是提高時鐘速度、效率和規(guī)模,以處理下一代AI任務(wù),包括大型語言模型(LLM)和轉(zhuǎn)換器。9 m$ J6 E% _% r J3 k2 \
6 ^- B& u1 i9 H! t+ @0 G
NPU 4的主要特點包括:
# M& S: Y7 u: N2 u+ z效率優(yōu)化的MAC(乘加)陣列原生激活函數(shù)和數(shù)據(jù)轉(zhuǎn)換支持增強(qiáng)的SHAVE DSP,用于加速LLM和轉(zhuǎn)換器操作用于LLM的嵌入式標(biāo)記化相比上一代帶寬翻倍12個神經(jīng)計算引擎AI性能高達(dá)48 TOPS- l( t9 C# j, T: ^3 s
: z6 p0 j- z' I/ Q( S
1 K" P1 B9 e6 g6 h* R- C
iuwhihqawad64072298918.png (126.07 KB, 下載次數(shù): 0)
下載附件
保存到相冊
iuwhihqawad64072298918.png
2024-10-11 01:03 上傳
! [5 D6 A. g* d. o圖8:比較了NPU 4與上一代NPU 3的性能和效率,顯示在相同功耗下性能提升2倍,峰值性能提升高達(dá)4倍。! Q- n; A3 H% ?& w+ p0 r+ p5 z' Z
4 ]# W# L4 N+ [& L+ U: n
連接性Lunar Lake將先進(jìn)的連接功能直接集成到封裝中:+ a8 Q+ m) `4 { E z9 X/ i
英特爾Wi-Fi 7(5 Gig),速度高達(dá)5.8Gb/s英特爾藍(lán)牙5.4,提供高效和高清音頻Thunderbolt 4,速度達(dá)40Gb/s支持PCIe Gen 5.0和Gen 4.0支持USB 3.0和2.00 k8 i: ^5 `) F
2 ^1 b9 U! r, u" ^* _# z. E& y# w1 a3 l& L
m5wsrjcjioo64072299018.png (419.53 KB, 下載次數(shù): 1)
下載附件
保存到相冊
m5wsrjcjioo64072299018.png
2024-10-11 01:03 上傳
9 U7 `1 E2 ? O7 B- T8 Y1 k圖9:突出顯示了Lunar Lake集成的連接功能,包括Wi-Fi 7、藍(lán)牙5.4、Thunderbolt 4和PCIe支持。
. d7 ?8 \% } W! U+ M V
( Y7 A* }* [0 Q' \6 E/ v結(jié)論
" c9 Q8 A* D: q4 b, y+ D英特爾的Lunar Lake架構(gòu)代表了x86處理器在AI PC領(lǐng)域發(fā)展的重要一步。憑借在功耗效率、P核心和E核心性能提升、先進(jìn)GPU能力和專用AI加速方面的關(guān)注,Lunar Lake有望在生產(chǎn)力、游戲和AI驅(qū)動的應(yīng)用方面為用戶提供卓越體驗。3 |& p9 q% h9 U. X
$ n, k9 K. X# g6 O% ]7 ~/ S
封裝內(nèi)存集成、先進(jìn)的功耗管理技術(shù)和尖端連接選項進(jìn)一步鞏固了Lunar Lake作為面向未來的架構(gòu)地位,旨在滿足下一代計算設(shè)備的需求。/ j+ G4 F( [% E" z' U4 o6 O8 Z
) E# O8 H! j! K5 g$ n0 ^* \6 F/ I
參考文獻(xiàn)6 T. O/ N/ u0 t+ w. J
[1] Gihon, "Lunar Lake Architecture Session," presented at Hot Chips 2024, 2024.$ t3 S5 R: Q2 [3 Q
_) j% [& D* s/ ?8 P; o- \. S( j- END -' i/ F0 q: O, M5 t! `: u, a4 R
3 R. Q9 g: Z) @& n* d+ [" g# O
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
! |1 C. o7 y( S2 g點擊左下角"閱讀原文"馬上申請2 Y6 N' ~* C; {
9 ^: u/ k. v1 T& f) z0 _1 v# A" H歡迎轉(zhuǎn)載 J6 S, M4 o. F: U8 R; b
4 D* R; k4 t% d: o& l: N$ L3 f% S轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!9 U0 b+ }6 b1 |4 i" `5 B
- N1 A% r" U3 x
) {% t. @% P" A8 g" T8 E4 h- O8 D, Z
$ f4 N% }- A: i2 T
qrkeqvrfiiq64072299118.gif (16.04 KB, 下載次數(shù): 1)
下載附件
保存到相冊
qrkeqvrfiiq64072299118.gif
2024-10-11 01:03 上傳
6 P$ }7 Y8 T6 s; A1 m" F M
; l8 `- E9 G! Y& W, s5 s) _4 S關(guān)注我們
5 Y7 J: o* {* m- Z2 C) ^5 I% l+ }. K" B' h& m0 D" l" Z
4 o6 R( z$ t4 u4 k+ {
dnppj4ki0pq64072299218.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
dnppj4ki0pq64072299218.png
2024-10-11 01:03 上傳
) p2 x V" S! V8 q7 M) S
|
" r8 O# h3 F8 a" q
mctu1ode3iq64072299318.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
mctu1ode3iq64072299318.png
2024-10-11 01:03 上傳
- c+ V' k* Q/ ]% ~
|
f0 F$ A: n% Y
5qbt1nyci1w64072299418.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
5qbt1nyci1w64072299418.png
2024-10-11 01:03 上傳
5 r1 |/ r2 g ^4 p$ S; Z: X | 4 M; O: j8 I% P) \; T3 i9 b5 Y
! h/ R; }6 d1 _8 w! Y4 ^7 V6 Z
/ X5 G# b# B3 N) c" x y: Y$ I. T2 E/ \/ r* i7 Z1 r
關(guān)于我們:0 I: j; i( x( ^" v! L, Q6 P
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。0 e8 r6 f0 U `. @- \, l
2 W6 \3 I, b7 q6 [* ^8 e6 \# k2 Ohttp://www.latitudeda.com/
2 D+ P5 | K; @/ P. Y, X4 m(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|