電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 35|回復(fù): 0
收起左側(cè)

Hot Chips 2024 | Lunar Lake:英特爾下一代AI PC處理器

[復(fù)制鏈接]

425

主題

425

帖子

2924

積分

三級會員

Rank: 3Rank: 3

積分
2924
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-10-10 08:02:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言5 O9 n% a& N1 D/ h
本文探討英特爾的Lunar Lake架構(gòu)。Lunar Lake是專為下一代AI PC設(shè)計的系統(tǒng)級芯片(SoC),集成了多項突破性技術(shù),旨在提供卓越的核心性能、無與倫比的AI計算能力和顯著提升的圖形性能,同時實現(xiàn)了x86架構(gòu)的突破性能效比[1]。
! B7 V- b" {5 j9 x+ I# j( F6 m, ]$ t8 z
% }- x# p7 m. D8 M) v' f
圖1:展示了Lunar Lake架構(gòu)的主要改進(jìn),包括SoC功耗降低40%,相同單線程性能下功耗減半,圖形性能提升1.5倍,以及AI計算能力達(dá)到120 TOPS(每秒萬億次操作)。
: F  @/ m& Y5 t( L7 Y5 w0 p: L" \  N2 k
7 W+ I" b# g4 o+ `2 b8 k
先進(jìn)封裝和內(nèi)存集成
! Q# t$ ^5 Z. E8 y0 b1 c! CLunar Lake架構(gòu)的一項重大創(chuàng)新是采用了英特爾的Foveros 3D封裝技術(shù)。  ^6 d# C* J. I& R9 y! b! B, P0 W

$ W! X! W. m- ]  m! L+ S3 | 0 k( g4 G. T! B" k0 I3 o
圖2:Lunar Lake架構(gòu)的Foveros封裝結(jié)構(gòu),顯示了計算芯片、平臺控制器芯片和內(nèi)存的堆疊方式。& |8 Q& B4 S& W- J

; z! }$ I* h6 [& U/ pLunar Lake引入了開創(chuàng)性功能:將內(nèi)存直接集成到封裝中。這是英特爾的首次嘗試,帶來了多項優(yōu)勢:7 L% j% W4 B7 n8 }! r4 ]3 v- }+ J
  • 支持LPDDR5x DRAM
  • 最高32GB容量,支持雙列
  • 每芯片最高8.5GT/s傳輸速率
  • 支持16位x4通道
  • 物理層功耗降低40%
  • 節(jié)省高達(dá)250平方毫米的面積+ O; A1 Q: C- e5 \
    - n3 t4 y# F+ k& y4 Y7 ~
    架構(gòu)框架$ j6 Q# `5 E4 u$ Q
    Lunar Lake架構(gòu)主要由兩個組件構(gòu)成:計算芯片和平臺控制器芯片。$ k. y  Q5 N. H" ^- ^
    , e6 c" l0 h% a. e# i% i0 C! Y
    $ v% q' {$ T4 I- o  k1 {2 h
    圖3:Lunar Lake架構(gòu)框架,突出顯示了計算芯片和平臺控制器芯片。! E% g2 o, D/ H1 ~! E) C- S* c3 @

    8 k& ^! y5 i( w: K; E計算芯片
    8 G$ {  F( h7 i6 x1 h9 l計算芯片是使用先進(jìn)制程制造的單片式芯片。具有經(jīng)過增強(qiáng)的SoC結(jié)構(gòu),旨在提高性能效率。
    ) e$ m3 C: X" n* z: _9 K8 T# u9 e4 r; q  `4 l8 J/ N: E
    計算芯片的主要組件包括:
    - \* w) b3 X% c  u/ S
  • 新型片上網(wǎng)絡(luò)(NoC),具有增強(qiáng)的緩存功能
  • 優(yōu)化的內(nèi)存延遲
  • GPU、NPU(神經(jīng)網(wǎng)絡(luò)處理單元)和IPU(圖像處理單元)
  • 性能核心(P核心)和高效核心(E核心)
  • 媒體和顯示引擎7 m4 l9 l4 {- G0 J9 t* }

    ' k: u+ m5 I9 x4 z" M; m4 d; {) x5 @$ {: b$ u2 h

    2 D9 u+ A# @3 Y& e4 E5 W3 i  e圖4:展示了計算芯片的結(jié)構(gòu),描繪了各種組件的排列,如核心、GPU、NPU和內(nèi)存接口。8 B6 N6 S# ]0 ?3 r: V9 ^
    : y/ v& k, ?8 i; h: s
    內(nèi)存?zhèn)染彺?/strong>9 n3 q8 N7 w8 c$ |
    Lunar Lake引入了內(nèi)存?zhèn)染彺,有助于減少DRAM訪問和功耗,同時為其他引擎提高延遲和帶寬性能。這個8MB物理緩存還為I/O引擎提供緩存功能。
    5 U6 B7 a2 Q6 ?  N% U: q: G0 N
    ( g) ^1 d# B- c增強(qiáng)型E核心集群
    $ U: K) d9 s! v* hLunar Lake的高效核心(E核心)集群得到了顯著改進(jìn):
    5 H% W' R7 H$ c: E
  • L2緩存增加到4MB
  • 采用先進(jìn)制程,提高頻率和功耗特性
  • 內(nèi)存?zhèn)染彺娓纳乒暮脱舆t
  • 相比上一代,核心數(shù)量翻倍
  • 獨(dú)立供電
    + Z7 Q$ U0 b( j8 o+ i

    + t: K7 z. M# ]4 s2 c1 J; m供電和功耗管理/ T5 ?1 I) Y( S7 D
    Lunar Lake具有升級的供電和功耗管理系統(tǒng),對于優(yōu)化SoC功耗利用和性能效率非常重要。這包括:
  • 采用4個電源管理集成電路(PMIC)進(jìn)行供電
  • 更多電源軌
  • 增強(qiáng)的遙測功能(IMON)
  • 動態(tài)電壓ID
  • 升級的功耗管理,英特爾線程調(diào)度器專注于效率
  • 改進(jìn)的"睡眠"狀態(tài),提高功耗和延遲性能
  • 針對不同負(fù)載類型優(yōu)化的功率平衡器
  • 基于機(jī)器學(xué)習(xí)的工作負(fù)載分類和頻率控制1 M1 @: v  r2 B7 i
    [/ol]9 Z$ F+ O' k/ O5 L
    性能核心:獅灣(Lion Cove)
    4 s% J7 A6 g! c7 mLunar Lake引入了新的性能核心架構(gòu),名為獅灣。獅灣的主要目標(biāo)是優(yōu)化客戶端SoC的單線程性能功耗比和性能面積比。
    8 d, P7 A! F5 ^$ P+ G) F
    0 G, M4 b7 R& `6 e4 U" j# Z: ?獅灣(Lion Cove)的主要特點包括:
    * o/ R* Z2 R5 D0 P) r* U7 F; k
  • 針對PPA(性能、功耗和面積)優(yōu)化
  • 更精細(xì)的時鐘間隔
  • 分離的亂序執(zhí)行引擎
  • 更寬的調(diào)度能力
  • 增強(qiáng)的內(nèi)存子系統(tǒng)
  • 基于AI的功耗管理. j4 F' m# k, V* U6 v8 o& i
    - D* f$ M$ c/ z: Z& H7 V
    4 \' W  F! v: `

    , |+ \& u9 x( v& |圖5:比較了獅灣(Lion Cove)P核心與上一代紅木灣(Redwood Cove)核心的性能,顯示在IPC(每時鐘周期指令數(shù))和功耗效率方面有顯著改進(jìn)。7 r( f! G; ~! I* r! c! C  O' m/ y" U

    ; |3 i1 P5 F- g" {高效核心:天際(Skymont)6 i! p( j% g/ m$ i+ x" A8 J
    與獅灣P核心相輔相成的是新的天際E核心。天際旨在擴(kuò)大低功耗島的范圍和提高多線程性能,同時將向量和AI吞吐量翻倍。
    1 Q8 `  k  c; W, D. [
    : k0 J# J1 A! }, j! ~( c9 F天際(Skymont)的主要特點包括:3 J: ^5 N. t& X) m
  • 增強(qiáng)的預(yù)測能力
  • 96B并行取指
  • 更寬的分配和退休單元
  • 26個分發(fā)端口
  • 4MB共享L2緩存
  • 通過4x 128位浮點和SIMD向量單元實現(xiàn)2倍AI吞吐量
    9 Q, p# t2 C# u; k/ H) B! \
    % j7 H1 J$ q! w" ]; ?1 O8 W1 t

    : `$ O" D! Y, |- r( w( E
    / [8 S+ U4 H% ]& A+ d, m. c1 i圖6:展示了天際(Skymont)E核心集群相比上一代的功耗和性能改進(jìn),顯示性能提升最高可達(dá)2倍,或在相同性能下功耗降低至1/3。) u% s; c7 m/ G/ j% X
    0 ~3 C( O2 b! n' X5 w: D/ D
    下一代Xe2 GPU
    ' Z' G+ D3 ^" [0 V: n6 p8 O6 oLunar Lake采用了新的Xe2 GPU架構(gòu),在圖形性能方面實現(xiàn)了重大進(jìn)展。! H: ?: ^  L) {7 _$ u: Z
    主要改進(jìn)包括:' _% c( u9 X, ~6 \
  • 新的向量引擎,優(yōu)化效率和AI吞吐量
  • 新的Xe矩陣擴(kuò)展(XMX)引擎,INT8運(yùn)算能力為2048 OPS/時鐘,F(xiàn)P16運(yùn)算能力為4096 OPS/時鐘
  • 8MB L2緩存
  • 增強(qiáng)的Xe超級采樣(XeSS)內(nèi)核
  • 8個第二代Xe核心
  • 更大的光線追蹤單元
  • AI性能高達(dá)67 TOPS
    + x: a- x/ W5 Q; T4 q
    + g" Y/ [( d& ?2 e( @# t: Z

    + `$ ~( R: {  s! c; F : B& Z, P$ u0 C; u) N
    圖7:顯示了新一代Xe2 GPU相比流星湖的性能改進(jìn),在相似功耗水平下性能提升高達(dá)1.5倍。
    - P1 E' S3 P4 s- X4 O- C/ X
    ' W& B# j3 `* x6 }( l- s下一代NPU 4/ f5 l3 {5 D& E5 T. u6 }3 A# a9 ^, e
    Lunar Lake集成了新的神經(jīng)網(wǎng)絡(luò)處理單元(NPU 4),旨在加速AI工作負(fù)載。NPU 4的目標(biāo)是提高時鐘速度、效率和規(guī)模,以處理下一代AI任務(wù),包括大型語言模型(LLM)和轉(zhuǎn)換器。9 m$ J6 E% _% r  J3 k2 \
    6 ^- B& u1 i9 H! t+ @0 G
    NPU 4的主要特點包括:
    # M& S: Y7 u: N2 u+ z
  • 效率優(yōu)化的MAC(乘加)陣列
  • 原生激活函數(shù)和數(shù)據(jù)轉(zhuǎn)換支持
  • 增強(qiáng)的SHAVE DSP,用于加速LLM和轉(zhuǎn)換器操作
  • 用于LLM的嵌入式標(biāo)記化
  • 相比上一代帶寬翻倍
  • 12個神經(jīng)計算引擎
  • AI性能高達(dá)48 TOPS- l( t9 C# j, T: ^3 s
    : z6 p0 j- z' I/ Q( S

    1 K" P1 B9 e6 g6 h* R- C
    ! [5 D6 A. g* d. o圖8:比較了NPU 4與上一代NPU 3的性能和效率,顯示在相同功耗下性能提升2倍,峰值性能提升高達(dá)4倍。! Q- n; A3 H% ?& w+ p0 r+ p5 z' Z
    4 ]# W# L4 N+ [& L+ U: n
    連接性Lunar Lake將先進(jìn)的連接功能直接集成到封裝中:+ a8 Q+ m) `4 {  E  z9 X/ i
  • 英特爾Wi-Fi 7(5 Gig),速度高達(dá)5.8Gb/s
  • 英特爾藍(lán)牙5.4,提供高效和高清音頻
  • Thunderbolt 4,速度達(dá)40Gb/s
  • 支持PCIe Gen 5.0和Gen 4.0
  • 支持USB 3.0和2.00 k8 i: ^5 `) F

    2 ^1 b9 U! r, u" ^* _# z. E& y# w1 a3 l& L

    9 U7 `1 E2 ?  O7 B- T8 Y1 k圖9:突出顯示了Lunar Lake集成的連接功能,包括Wi-Fi 7、藍(lán)牙5.4、Thunderbolt 4和PCIe支持。
    . d7 ?8 \% }  W! U+ M  V
    ( Y7 A* }* [0 Q' \6 E/ v結(jié)論
    " c9 Q8 A* D: q4 b, y+ D英特爾的Lunar Lake架構(gòu)代表了x86處理器在AI PC領(lǐng)域發(fā)展的重要一步。憑借在功耗效率、P核心和E核心性能提升、先進(jìn)GPU能力和專用AI加速方面的關(guān)注,Lunar Lake有望在生產(chǎn)力、游戲和AI驅(qū)動的應(yīng)用方面為用戶提供卓越體驗。3 |& p9 q% h9 U. X
    $ n, k9 K. X# g6 O% ]7 ~/ S
    封裝內(nèi)存集成、先進(jìn)的功耗管理技術(shù)和尖端連接選項進(jìn)一步鞏固了Lunar Lake作為面向未來的架構(gòu)地位,旨在滿足下一代計算設(shè)備的需求。/ j+ G4 F( [% E" z' U4 o6 O8 Z
    ) E# O8 H! j! K5 g$ n0 ^* \6 F/ I
    參考文獻(xiàn)6 T. O/ N/ u0 t+ w. J
    [1] Gihon, "Lunar Lake Architecture Session," presented at Hot Chips 2024, 2024.$ t3 S5 R: Q2 [3 Q

      _) j% [& D* s/ ?8 P; o- \. S( j- END -' i/ F0 q: O, M5 t! `: u, a4 R
    3 R. Q9 g: Z) @& n* d+ [" g# O
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    ! |1 C. o7 y( S2 g點擊左下角"閱讀原文"馬上申請2 Y6 N' ~* C; {

    9 ^: u/ k. v1 T& f) z0 _1 v# A" H歡迎轉(zhuǎn)載  J6 S, M4 o. F: U8 R; b

    4 D* R; k4 t% d: o& l: N$ L3 f% S轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!9 U0 b+ }6 b1 |4 i" `5 B
    - N1 A% r" U3 x
    ) {% t. @% P" A8 g" T8 E4 h- O8 D, Z
    $ f4 N% }- A: i2 T

    6 P$ }7 Y8 T6 s; A1 m" F  M
    ; l8 `- E9 G! Y& W, s5 s) _4 S關(guān)注我們
    5 Y7 J: o* {* m- Z2 C) ^5 I% l+ }. K" B' h& m0 D" l" Z

    4 o6 R( z$ t4 u4 k+ { ) p2 x  V" S! V8 q7 M) S

    " r8 O# h3 F8 a" q - c+ V' k* Q/ ]% ~

      f0 F$ A: n% Y
    5 r1 |/ r2 g  ^4 p$ S; Z: X
                          4 M; O: j8 I% P) \; T3 i9 b5 Y

    ! h/ R; }6 d1 _8 w! Y4 ^7 V6 Z

    / X5 G# b# B3 N) c" x  y: Y$ I. T2 E/ \/ r* i7 Z1 r
    關(guān)于我們:0 I: j; i( x( ^" v! L, Q6 P
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。0 e8 r6 f0 U  `. @- \, l

    2 W6 \3 I, b7 q6 [* ^8 e6 \# k2 Ohttp://www.latitudeda.com/
    2 D+ P5 |  K; @/ P. Y, X4 m(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表