|
引言
, D! h( D9 w8 r/ ?" ^本文探討英特爾的Lunar Lake架構(gòu)。Lunar Lake是專為下一代AI PC設(shè)計(jì)的系統(tǒng)級芯片(SoC),集成了多項(xiàng)突破性技術(shù),旨在提供卓越的核心性能、無與倫比的AI計(jì)算能力和顯著提升的圖形性能,同時(shí)實(shí)現(xiàn)了x86架構(gòu)的突破性能效比[1]。. X1 ^; Z/ v! I" h
w# n8 j! R" T( E9 @
tkvyhnvndhz64072298216.png (520.43 KB, 下載次數(shù): 0)
下載附件
保存到相冊
tkvyhnvndhz64072298216.png
2024-10-11 01:03 上傳
5 D0 o/ f4 @* C ?5 `! d7 }圖1:展示了Lunar Lake架構(gòu)的主要改進(jìn),包括SoC功耗降低40%,相同單線程性能下功耗減半,圖形性能提升1.5倍,以及AI計(jì)算能力達(dá)到120 TOPS(每秒萬億次操作)。; [; V# c" k) G$ Q6 r/ `$ m
% H1 B5 W9 W( o3 y. J2 s
* \6 `. S$ }$ i# a( v/ J q先進(jìn)封裝和內(nèi)存集成; A/ t& b( b! r1 l' u
Lunar Lake架構(gòu)的一項(xiàng)重大創(chuàng)新是采用了英特爾的Foveros 3D封裝技術(shù)。4 t' Q) L* Y- h1 T8 g0 ^2 O6 ?
0 x+ Q, a* }. i' m/ F
a54euqcenvs64072298316.png (444.93 KB, 下載次數(shù): 0)
下載附件
保存到相冊
a54euqcenvs64072298316.png
2024-10-11 01:03 上傳
^! Z3 j, m+ \+ c圖2:Lunar Lake架構(gòu)的Foveros封裝結(jié)構(gòu),顯示了計(jì)算芯片、平臺控制器芯片和內(nèi)存的堆疊方式。
1 a9 @" u- q6 S3 g8 b: g$ Z/ K/ c8 l1 A. f' i
Lunar Lake引入了開創(chuàng)性功能:將內(nèi)存直接集成到封裝中。這是英特爾的首次嘗試,帶來了多項(xiàng)優(yōu)勢:
8 V: u+ ~& T6 j# E" _& t1 h9 F支持LPDDR5x DRAM最高32GB容量,支持雙列每芯片最高8.5GT/s傳輸速率支持16位x4通道物理層功耗降低40%節(jié)省高達(dá)250平方毫米的面積
, n& I9 t" e$ |. ^# Z9 [/ O
8 ^% V+ \, v/ @! k架構(gòu)框架
9 h& y8 k& n' G2 Z& w: O8 v9 nLunar Lake架構(gòu)主要由兩個(gè)組件構(gòu)成:計(jì)算芯片和平臺控制器芯片。: X1 }! B! t+ |% a# h
0 C. b6 t, q0 O* C8 I+ g
jtdebbnc1hv64072298417.png (440.97 KB, 下載次數(shù): 1)
下載附件
保存到相冊
jtdebbnc1hv64072298417.png
2024-10-11 01:03 上傳
: `" V4 ?2 k/ z, T( [. y* Y0 d% b
圖3:Lunar Lake架構(gòu)框架,突出顯示了計(jì)算芯片和平臺控制器芯片。
# U: h! O" s( H4 B/ W x+ R( N" C; `: y$ Y; T" |6 W; M0 Q
計(jì)算芯片
# P8 l8 \; a' m1 x$ X; a9 f7 L* G! \. r計(jì)算芯片是使用先進(jìn)制程制造的單片式芯片。具有經(jīng)過增強(qiáng)的SoC結(jié)構(gòu),旨在提高性能效率。
+ o; z' e5 `5 E( {* K. A5 l
1 T1 [% i* S' D& [8 I& U計(jì)算芯片的主要組件包括:/ \/ [ r- T2 P$ [4 [7 y) k# ]- m
新型片上網(wǎng)絡(luò)(NoC),具有增強(qiáng)的緩存功能優(yōu)化的內(nèi)存延遲GPU、NPU(神經(jīng)網(wǎng)絡(luò)處理單元)和IPU(圖像處理單元)性能核心(P核心)和高效核心(E核心)媒體和顯示引擎8 Z8 I$ R# v( R& l8 m# W
' Y* X$ D8 J. K7 {1 s# k2 c7 g0 {! _ d! k7 v+ Z
i1z1rsoap1l64072298517.png (327.58 KB, 下載次數(shù): 0)
下載附件
保存到相冊
i1z1rsoap1l64072298517.png
2024-10-11 01:03 上傳
2 Q+ E3 I( m0 _( E( Y- y
圖4:展示了計(jì)算芯片的結(jié)構(gòu),描繪了各種組件的排列,如核心、GPU、NPU和內(nèi)存接口。
4 t [0 ?) i' ~) p0 C# l" a% H4 `( S: {
內(nèi)存?zhèn)染彺?/strong>7 m4 Z. d0 a' H! m* v
Lunar Lake引入了內(nèi)存?zhèn)染彺妫兄跍p少DRAM訪問和功耗,同時(shí)為其他引擎提高延遲和帶寬性能。這個(gè)8MB物理緩存還為I/O引擎提供緩存功能。
, O3 d: ?& K( G7 V2 e
, |0 I. n" T& F5 g5 Z7 r! o7 L7 I增強(qiáng)型E核心集群
& ]0 g k- [) J4 bLunar Lake的高效核心(E核心)集群得到了顯著改進(jìn):5 E J/ A7 Y( s8 G4 O( s
L2緩存增加到4MB采用先進(jìn)制程,提高頻率和功耗特性內(nèi)存?zhèn)染彺娓纳乒暮脱舆t相比上一代,核心數(shù)量翻倍獨(dú)立供電: t- W( W8 C8 X/ ~" p2 P( G! D
$ Q z8 ?6 U% P" J" f供電和功耗管理
* R; Z# V8 E* Y. tLunar Lake具有升級的供電和功耗管理系統(tǒng),對于優(yōu)化SoC功耗利用和性能效率非常重要。這包括:采用4個(gè)電源管理集成電路(PMIC)進(jìn)行供電更多電源軌增強(qiáng)的遙測功能(IMON)動態(tài)電壓ID升級的功耗管理,英特爾線程調(diào)度器專注于效率改進(jìn)的"睡眠"狀態(tài),提高功耗和延遲性能針對不同負(fù)載類型優(yōu)化的功率平衡器基于機(jī)器學(xué)習(xí)的工作負(fù)載分類和頻率控制- [& v x) [% B6 j
[/ol]. Q5 I0 M3 x8 `; N: s
性能核心:獅灣(Lion Cove), Q6 j0 g/ m! U
Lunar Lake引入了新的性能核心架構(gòu),名為獅灣。獅灣的主要目標(biāo)是優(yōu)化客戶端SoC的單線程性能功耗比和性能面積比。
+ `' @% ^1 H7 |# J( G" T2 i0 H" q: J' Q8 f( i6 w
獅灣(Lion Cove)的主要特點(diǎn)包括:
8 z5 j k! ]7 A5 l8 j% Z針對PPA(性能、功耗和面積)優(yōu)化更精細(xì)的時(shí)鐘間隔分離的亂序執(zhí)行引擎更寬的調(diào)度能力增強(qiáng)的內(nèi)存子系統(tǒng)基于AI的功耗管理
2 q( p& _% V9 r! L" Q9 W' h. L8 a3 L; w
6 K2 A. z0 d: S+ x/ s! K6 I
fpwq0ci1mrv64072298617.png (192.51 KB, 下載次數(shù): 0)
下載附件
保存到相冊
fpwq0ci1mrv64072298617.png
2024-10-11 01:03 上傳
/ X7 E. X! X0 }$ d A d1 ?9 H* B
圖5:比較了獅灣(Lion Cove)P核心與上一代紅木灣(Redwood Cove)核心的性能,顯示在IPC(每時(shí)鐘周期指令數(shù))和功耗效率方面有顯著改進(jìn)。% b2 M) G7 u3 g! u* V
% Z: O& g3 f! v9 K& w* _' A# D
高效核心:天際(Skymont)
4 n2 K& M {% W) P2 a7 D與獅灣P核心相輔相成的是新的天際E核心。天際旨在擴(kuò)大低功耗島的范圍和提高多線程性能,同時(shí)將向量和AI吞吐量翻倍。, O/ G' W0 m7 g4 Y4 ]0 k: D9 k' \% q
' }* l! b" x: Q# S% @" w7 a0 L
天際(Skymont)的主要特點(diǎn)包括:3 M# ]* v9 M4 ] [; C& }% w
增強(qiáng)的預(yù)測能力96B并行取指更寬的分配和退休單元26個(gè)分發(fā)端口4MB共享L2緩存通過4x 128位浮點(diǎn)和SIMD向量單元實(shí)現(xiàn)2倍AI吞吐量
9 s2 V/ q* C; r6 i
, \5 J3 [4 i3 x6 g0 U/ c D% f5 {3 {1 t8 G- s
1gf0ulniivh64072298717.png (161.65 KB, 下載次數(shù): 0)
下載附件
保存到相冊
1gf0ulniivh64072298717.png
2024-10-11 01:03 上傳
9 r5 m" _$ d# H# G& }圖6:展示了天際(Skymont)E核心集群相比上一代的功耗和性能改進(jìn),顯示性能提升最高可達(dá)2倍,或在相同性能下功耗降低至1/3。( s U6 o8 h$ h0 L
7 g* _0 d- b/ j! y/ @下一代Xe2 GPU
: ?0 K% J% v [- F& {( [- U- nLunar Lake采用了新的Xe2 GPU架構(gòu),在圖形性能方面實(shí)現(xiàn)了重大進(jìn)展。
( O6 n4 M7 r& T/ Y主要改進(jìn)包括:
0 u6 t9 u( C% E2 H新的向量引擎,優(yōu)化效率和AI吞吐量新的Xe矩陣擴(kuò)展(XMX)引擎,INT8運(yùn)算能力為2048 OPS/時(shí)鐘,F(xiàn)P16運(yùn)算能力為4096 OPS/時(shí)鐘8MB L2緩存增強(qiáng)的Xe超級采樣(XeSS)內(nèi)核8個(gè)第二代Xe核心更大的光線追蹤單元AI性能高達(dá)67 TOPS
* O0 W' M$ I8 }& U1 y
( y" _0 m- r' q% e, m( E; R8 B. h2 o w& D' N0 r% c" ^. Z1 S, J
njqd4pku52o64072298818.png (386.17 KB, 下載次數(shù): 0)
下載附件
保存到相冊
njqd4pku52o64072298818.png
2024-10-11 01:03 上傳
2 T) S f: ?0 F8 h
圖7:顯示了新一代Xe2 GPU相比流星湖的性能改進(jìn),在相似功耗水平下性能提升高達(dá)1.5倍。, h* q4 X5 N* U5 |: ~: O/ q8 N
) X5 W) `, t4 ?! e4 A6 i# ~
下一代NPU 4
- [1 k# B, A* @ o ]1 d \7 fLunar Lake集成了新的神經(jīng)網(wǎng)絡(luò)處理單元(NPU 4),旨在加速AI工作負(fù)載。NPU 4的目標(biāo)是提高時(shí)鐘速度、效率和規(guī)模,以處理下一代AI任務(wù),包括大型語言模型(LLM)和轉(zhuǎn)換器。 Q4 T5 P( r$ m8 s9 L
8 H& r/ T' ?% Y! r, sNPU 4的主要特點(diǎn)包括:
4 E4 c: y) R7 Y效率優(yōu)化的MAC(乘加)陣列原生激活函數(shù)和數(shù)據(jù)轉(zhuǎn)換支持增強(qiáng)的SHAVE DSP,用于加速LLM和轉(zhuǎn)換器操作用于LLM的嵌入式標(biāo)記化相比上一代帶寬翻倍12個(gè)神經(jīng)計(jì)算引擎AI性能高達(dá)48 TOPS
6 W5 H/ M; |- o* w; p! a1 j: c5 T. U; E0 f7 y
$ Z! k* g* W! P; B& N5 O k( L1 _
iuwhihqawad64072298918.png (126.07 KB, 下載次數(shù): 0)
下載附件
保存到相冊
iuwhihqawad64072298918.png
2024-10-11 01:03 上傳
" k1 K, [. u' y7 ^# m圖8:比較了NPU 4與上一代NPU 3的性能和效率,顯示在相同功耗下性能提升2倍,峰值性能提升高達(dá)4倍。
9 E" G8 q4 T) D! j/ o" \1 ]( c% a+ X a* y! X, b1 a
連接性Lunar Lake將先進(jìn)的連接功能直接集成到封裝中:$ S/ N6 k3 @! ?8 v
英特爾Wi-Fi 7(5 Gig),速度高達(dá)5.8Gb/s英特爾藍(lán)牙5.4,提供高效和高清音頻Thunderbolt 4,速度達(dá)40Gb/s支持PCIe Gen 5.0和Gen 4.0支持USB 3.0和2.0
% r' Y' H% i: h" j
& o1 D5 i5 _, i4 U3 U- P7 a6 j! l& u
$ A, @' ~8 }5 o
m5wsrjcjioo64072299018.png (419.53 KB, 下載次數(shù): 0)
下載附件
保存到相冊
m5wsrjcjioo64072299018.png
2024-10-11 01:03 上傳
, B5 d: w' O$ b- u3 |
圖9:突出顯示了Lunar Lake集成的連接功能,包括Wi-Fi 7、藍(lán)牙5.4、Thunderbolt 4和PCIe支持。& `% f$ y; I4 Y% ]/ m
& n, {. d/ j3 Z結(jié)論
4 |& Q, k8 ^# f2 l! b; E* }0 V, K英特爾的Lunar Lake架構(gòu)代表了x86處理器在AI PC領(lǐng)域發(fā)展的重要一步。憑借在功耗效率、P核心和E核心性能提升、先進(jìn)GPU能力和專用AI加速方面的關(guān)注,Lunar Lake有望在生產(chǎn)力、游戲和AI驅(qū)動的應(yīng)用方面為用戶提供卓越體驗(yàn)。
( Z% f/ G: W; f/ y) ]% s0 o% {" `5 [% X/ q' A$ f9 F4 K" l v3 k
封裝內(nèi)存集成、先進(jìn)的功耗管理技術(shù)和尖端連接選項(xiàng)進(jìn)一步鞏固了Lunar Lake作為面向未來的架構(gòu)地位,旨在滿足下一代計(jì)算設(shè)備的需求。3 x, i% M5 s6 ?" q6 `
; W$ w9 t5 d; m6 M. d, T參考文獻(xiàn), U6 x5 v8 ~) W* q
[1] Gihon, "Lunar Lake Architecture Session," presented at Hot Chips 2024, 2024.3 u# O# b' Z* }
) O4 q2 `+ a) Y# |' {$ r
- END -* t- V! I4 D8 I
, f0 s( w) c" g3 q3 Y P軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。$ q5 x s* p6 s
點(diǎn)擊左下角"閱讀原文"馬上申請1 P% i7 H6 c+ H. [
$ [7 P4 a3 M% y歡迎轉(zhuǎn)載# E* x: z+ H+ r. k* c
* g ?/ h% y2 s4 s$ N6 A& Q( K轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!5 i p+ [% v S8 t
' Y8 q+ P% k6 m0 q: A' O+ _/ p. ^: |( h z7 M
?9 r" ?% U, i# [7 ^- f" y6 D4 }
qrkeqvrfiiq64072299118.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
qrkeqvrfiiq64072299118.gif
2024-10-11 01:03 上傳
" K, h4 ?8 X" q
2 \9 e; J. _) g3 ~, i. f$ O" |
關(guān)注我們% v Y: _( W5 q" z, j' s6 ^; [
) a8 g. C4 l8 G# |4 r% N9 a+ o0 J3 D0 I7 r2 Y7 m
dnppj4ki0pq64072299218.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
dnppj4ki0pq64072299218.png
2024-10-11 01:03 上傳
8 E3 M, G- y) s/ B2 t; F | 0 f8 }1 B7 T! p9 d# ?4 k4 l
mctu1ode3iq64072299318.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
mctu1ode3iq64072299318.png
2024-10-11 01:03 上傳
4 B( j- M( ^/ {( @1 \* Q3 u( Q | ; h# u- m7 G- }$ d [
5qbt1nyci1w64072299418.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
5qbt1nyci1w64072299418.png
2024-10-11 01:03 上傳
" b- d; r Y' K |
. D% {( u2 h" h
6 c( A3 ^2 k) |- x: k2 O9 P, q0 G, ]
4 j5 c6 Z: O9 ^: G關(guān)于我們:
6 w1 V* q: j6 i0 }; n3 P# O深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
' n6 z- N9 ]1 y! B. R0 O4 Q9 I. S e9 j
http://www.latitudeda.com/
4 m5 z! y+ [) [; d8 {: Y1 Q, F(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|