電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 37|回復(fù): 0
收起左側(cè)

Hot Chips 2024 | Lunar Lake:英特爾下一代AI PC處理器

[復(fù)制鏈接]

425

主題

425

帖子

2924

積分

三級會員

Rank: 3Rank: 3

積分
2924
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-10-10 08:02:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
引言7 b& f$ H% d8 I' Y0 R$ g8 e
本文探討英特爾的Lunar Lake架構(gòu)。Lunar Lake是專為下一代AI PC設(shè)計的系統(tǒng)級芯片(SoC),集成了多項(xiàng)突破性技術(shù),旨在提供卓越的核心性能、無與倫比的AI計算能力和顯著提升的圖形性能,同時實(shí)現(xiàn)了x86架構(gòu)的突破性能效比[1]。
9 x3 D5 m% A! V3 j0 ?
. }0 C  o! {( H8 D9 @0 G
' [  I  R# ^$ p+ y, q  F圖1:展示了Lunar Lake架構(gòu)的主要改進(jìn),包括SoC功耗降低40%,相同單線程性能下功耗減半,圖形性能提升1.5倍,以及AI計算能力達(dá)到120 TOPS(每秒萬億次操作)。
7 K* @5 O3 V8 K8 j/ z+ d3 Y' e
, `6 J! i- j; C9 f* q* E& M
  N' A4 K5 {( }1 i. y( k* t
先進(jìn)封裝和內(nèi)存集成
  ?& i/ \9 e# h  vLunar Lake架構(gòu)的一項(xiàng)重大創(chuàng)新是采用了英特爾的Foveros 3D封裝技術(shù)。
8 h# w% k" L6 `. t0 `0 G$ @  d; _4 x: W8 x
; K* g. n2 J( g. m' S) t% f
圖2:Lunar Lake架構(gòu)的Foveros封裝結(jié)構(gòu),顯示了計算芯片、平臺控制器芯片和內(nèi)存的堆疊方式。
% s; D) b) U  b+ H" ?/ x- c* X3 O. S2 @# g* s
Lunar Lake引入了開創(chuàng)性功能:將內(nèi)存直接集成到封裝中。這是英特爾的首次嘗試,帶來了多項(xiàng)優(yōu)勢:
7 Y* D. I  j& N& t, p9 x
  • 支持LPDDR5x DRAM
  • 最高32GB容量,支持雙列
  • 每芯片最高8.5GT/s傳輸速率
  • 支持16位x4通道
  • 物理層功耗降低40%
  • 節(jié)省高達(dá)250平方毫米的面積, ^  H% \7 S6 B4 C9 l: e  C

    ! E+ \& @$ W+ e架構(gòu)框架
    : Q: h4 s+ T& ^7 j! KLunar Lake架構(gòu)主要由兩個組件構(gòu)成:計算芯片和平臺控制器芯片。6 B$ Y9 {9 k* l6 G% G5 B( a
      l/ H( `, V$ b1 A4 H
    3 k( P6 i, Z" g: f
    圖3:Lunar Lake架構(gòu)框架,突出顯示了計算芯片和平臺控制器芯片。- r# }1 F1 D- ^6 c& R

    - }' E& H2 P0 A! Q7 n. _% v% k計算芯片
    & ~8 M% Z  K) U. X* Y  V& U計算芯片是使用先進(jìn)制程制造的單片式芯片。具有經(jīng)過增強(qiáng)的SoC結(jié)構(gòu),旨在提高性能效率。% n4 @& i  X6 p* h* ~+ N" Q' f

    ; N7 }( f! Z3 r( T計算芯片的主要組件包括:
    ! |* R3 S& h+ f# o2 R2 A% E
  • 新型片上網(wǎng)絡(luò)(NoC),具有增強(qiáng)的緩存功能
  • 優(yōu)化的內(nèi)存延遲
  • GPU、NPU(神經(jīng)網(wǎng)絡(luò)處理單元)和IPU(圖像處理單元)
  • 性能核心(P核心)和高效核心(E核心)
  • 媒體和顯示引擎7 o/ n8 L2 O. n2 L
    1 E% {( ^" |1 n3 d6 ^) ^. c

    " x+ c1 K* A4 Q
    : ]1 f  x1 b7 Z2 M0 G圖4:展示了計算芯片的結(jié)構(gòu),描繪了各種組件的排列,如核心、GPU、NPU和內(nèi)存接口。
    ( |& A8 [, u2 L+ z
    . ^& ]5 a. S1 l" G( {內(nèi)存?zhèn)染彺?/strong>
    , T8 Y9 t" H: o' G5 @/ ?Lunar Lake引入了內(nèi)存?zhèn)染彺,有助于減少DRAM訪問和功耗,同時為其他引擎提高延遲和帶寬性能。這個8MB物理緩存還為I/O引擎提供緩存功能。
    5 s0 v1 \3 {* I- u- H% H0 K  U: P! P3 M5 `- b2 l
    增強(qiáng)型E核心集群, o- u" c2 H  X& w0 |6 d+ C2 e" _
    Lunar Lake的高效核心(E核心)集群得到了顯著改進(jìn):0 z4 j/ b% w, V1 H6 K0 {
  • L2緩存增加到4MB
  • 采用先進(jìn)制程,提高頻率和功耗特性
  • 內(nèi)存?zhèn)染彺娓纳乒暮脱舆t
  • 相比上一代,核心數(shù)量翻倍
  • 獨(dú)立供電( Y& J3 M* g+ z6 M0 W; A( y

    : X, Y, X4 X9 I" i# x供電和功耗管理
    2 ]' Q2 M; ~! i9 O9 S$ F; c; w8 |: qLunar Lake具有升級的供電和功耗管理系統(tǒng),對于優(yōu)化SoC功耗利用和性能效率非常重要。這包括:
  • 采用4個電源管理集成電路(PMIC)進(jìn)行供電
  • 更多電源軌
  • 增強(qiáng)的遙測功能(IMON)
  • 動態(tài)電壓ID
  • 升級的功耗管理,英特爾線程調(diào)度器專注于效率
  • 改進(jìn)的"睡眠"狀態(tài),提高功耗和延遲性能
  • 針對不同負(fù)載類型優(yōu)化的功率平衡器
  • 基于機(jī)器學(xué)習(xí)的工作負(fù)載分類和頻率控制
    : G) a( z/ t2 t6 w7 p8 }; O# K[/ol]. F  [6 h& T, S  K# E0 S
    性能核心:獅灣(Lion Cove)% A! u4 v$ F2 z% l- i& V
    Lunar Lake引入了新的性能核心架構(gòu),名為獅灣。獅灣的主要目標(biāo)是優(yōu)化客戶端SoC的單線程性能功耗比和性能面積比。* U9 b! l3 Y. x& k, S) ?2 w" s' l

    ; M2 w* M7 P+ l0 m# X獅灣(Lion Cove)的主要特點(diǎn)包括:  J, b. U7 C  N, {
  • 針對PPA(性能、功耗和面積)優(yōu)化
  • 更精細(xì)的時鐘間隔
  • 分離的亂序執(zhí)行引擎
  • 更寬的調(diào)度能力
  • 增強(qiáng)的內(nèi)存子系統(tǒng)
  • 基于AI的功耗管理$ H' O* t) ~$ w  D! v# v- d
      P+ U: Y1 @- c+ g

    9 }$ V6 L6 p9 n# Y. L
    2 b& ]: b3 ~7 D9 s2 U* K3 O圖5:比較了獅灣(Lion Cove)P核心與上一代紅木灣(Redwood Cove)核心的性能,顯示在IPC(每時鐘周期指令數(shù))和功耗效率方面有顯著改進(jìn)。8 ?" a4 Z' r6 H: q+ w; s4 ]

    ' G" j2 ?4 F; \高效核心:天際(Skymont)- y( i; [+ ?; V. c
    與獅灣P核心相輔相成的是新的天際E核心。天際旨在擴(kuò)大低功耗島的范圍和提高多線程性能,同時將向量和AI吞吐量翻倍。
    7 l0 w( r: j1 H3 z: ^& u' \$ m( `; }) {  O4 s# J( _
    天際(Skymont)的主要特點(diǎn)包括:+ V# t$ c& a9 q: y$ k
  • 增強(qiáng)的預(yù)測能力
  • 96B并行取指
  • 更寬的分配和退休單元
  • 26個分發(fā)端口
  • 4MB共享L2緩存
  • 通過4x 128位浮點(diǎn)和SIMD向量單元實(shí)現(xiàn)2倍AI吞吐量0 N3 ~9 o: r# |9 Z
    ' I7 ?% t- g  H0 h1 O
    2 {' v$ _7 y: K' Z# k

    2 \8 [2 T' L" u4 e. Q圖6:展示了天際(Skymont)E核心集群相比上一代的功耗和性能改進(jìn),顯示性能提升最高可達(dá)2倍,或在相同性能下功耗降低至1/3。
    ! n  b! n7 |, R/ W/ j, J* }' R* c0 h& O/ j
    下一代Xe2 GPU5 {6 t/ r& A' \; N6 I; U' P9 P5 A- I
    Lunar Lake采用了新的Xe2 GPU架構(gòu),在圖形性能方面實(shí)現(xiàn)了重大進(jìn)展。( W$ u3 P- v$ A* x) w
    主要改進(jìn)包括:
    9 `$ d7 r, a: R; D
  • 新的向量引擎,優(yōu)化效率和AI吞吐量
  • 新的Xe矩陣擴(kuò)展(XMX)引擎,INT8運(yùn)算能力為2048 OPS/時鐘,F(xiàn)P16運(yùn)算能力為4096 OPS/時鐘
  • 8MB L2緩存
  • 增強(qiáng)的Xe超級采樣(XeSS)內(nèi)核
  • 8個第二代Xe核心
  • 更大的光線追蹤單元
  • AI性能高達(dá)67 TOPS: _5 _; x4 N' k1 m( ^
    ! j3 ^( f  u, _: u3 [
    0 W; X. n0 r" ~, {

    ; O- s' G$ y1 |3 W* {4 K圖7:顯示了新一代Xe2 GPU相比流星湖的性能改進(jìn),在相似功耗水平下性能提升高達(dá)1.5倍。
    6 K* o# s3 J, q
    " x9 M5 x$ I" b6 |% S6 G下一代NPU 4
    7 G, A+ N( j$ L0 Z8 |Lunar Lake集成了新的神經(jīng)網(wǎng)絡(luò)處理單元(NPU 4),旨在加速AI工作負(fù)載。NPU 4的目標(biāo)是提高時鐘速度、效率和規(guī)模,以處理下一代AI任務(wù),包括大型語言模型(LLM)和轉(zhuǎn)換器。
    4 b. y9 i1 C$ a8 v0 O; h7 T! Q( `5 C
    NPU 4的主要特點(diǎn)包括:
    5 y8 N; u$ Q; u) j, A( U
  • 效率優(yōu)化的MAC(乘加)陣列
  • 原生激活函數(shù)和數(shù)據(jù)轉(zhuǎn)換支持
  • 增強(qiáng)的SHAVE DSP,用于加速LLM和轉(zhuǎn)換器操作
  • 用于LLM的嵌入式標(biāo)記化
  • 相比上一代帶寬翻倍
  • 12個神經(jīng)計算引擎
  • AI性能高達(dá)48 TOPS. t! i* ~, ?: n
    6 B" H) q% C6 z
    3 r$ l1 w* f1 B, X, y; o
    4 [- n/ f  `2 h* [* _
    圖8:比較了NPU 4與上一代NPU 3的性能和效率,顯示在相同功耗下性能提升2倍,峰值性能提升高達(dá)4倍。
    7 Y5 r" k) o% d  n7 \5 w0 K  S9 U0 U
    7 ^0 @4 I1 O9 V1 K# W- L) k連接性Lunar Lake將先進(jìn)的連接功能直接集成到封裝中:
    " A6 \5 ?: t5 {6 `
  • 英特爾Wi-Fi 7(5 Gig),速度高達(dá)5.8Gb/s
  • 英特爾藍(lán)牙5.4,提供高效和高清音頻
  • Thunderbolt 4,速度達(dá)40Gb/s
  • 支持PCIe Gen 5.0和Gen 4.0
  • 支持USB 3.0和2.0; U7 ?; T6 e( K/ ~6 R

    5 u& }1 f( C0 F8 F8 W/ k. c* z3 ~3 O5 R% y  m( M# N

    ; j) o) t8 L9 @圖9:突出顯示了Lunar Lake集成的連接功能,包括Wi-Fi 7、藍(lán)牙5.4、Thunderbolt 4和PCIe支持。
    ! N& Y/ K" _/ l: d, \5 P* ]& i( ]
    ) o6 o+ L0 }/ X7 p! f7 q- ^結(jié)論
      P# D5 \9 ^1 n0 o) Q- h* o英特爾的Lunar Lake架構(gòu)代表了x86處理器在AI PC領(lǐng)域發(fā)展的重要一步。憑借在功耗效率、P核心和E核心性能提升、先進(jìn)GPU能力和專用AI加速方面的關(guān)注,Lunar Lake有望在生產(chǎn)力、游戲和AI驅(qū)動的應(yīng)用方面為用戶提供卓越體驗(yàn)。4 r( u9 c! b6 u3 b- T5 g4 o
    4 c+ f' n. `- a0 R: F/ Y6 c
    封裝內(nèi)存集成、先進(jìn)的功耗管理技術(shù)和尖端連接選項(xiàng)進(jìn)一步鞏固了Lunar Lake作為面向未來的架構(gòu)地位,旨在滿足下一代計算設(shè)備的需求。* D, N8 {: z( `, a' d& G0 H2 ]  U% H

    5 C9 b* }& x2 A2 L. l參考文獻(xiàn)
    . U; z3 ]7 [4 ~% d" f3 a[1] Gihon, "Lunar Lake Architecture Session," presented at Hot Chips 2024, 2024.
    ( W7 `* I, s! _% i3 |4 N# @$ ? 5 j1 p5 d: Q. l; ]9 `/ j$ |
    - END -
    - m* w4 d% c+ n9 f8 R$ b. m0 F
    / Q6 i" t8 B1 R! R6 y$ C: S1 o軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
    7 {% c9 B; u1 Q- t. ?4 C: T點(diǎn)擊左下角"閱讀原文"馬上申請9 T- _. K' N* V9 I9 H+ K+ Q

      r0 ~8 ], \. T3 x6 H歡迎轉(zhuǎn)載3 C/ x: {+ O4 n8 ~! G
    0 [  I0 S) u# D4 t1 l! G+ N& F
    轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!% q3 X% T1 y: k; l% u
    / ^/ [9 ?+ J% K

    2 R) ^+ }0 [/ S* A; o

    $ {. Z( l8 h8 x+ ^( O
    5 [3 V5 Q* y, ]5 B, G* _3 W
    2 b' G+ Q# n, I6 K  P關(guān)注我們
    - g2 \/ q  C7 T7 z' R6 T+ o$ x+ B/ G% v4 a: [' D+ s
    6 x2 Q/ h) o$ ^$ k; m+ I

    ; W- e' ]$ L' ~
      U. @$ e* |4 D, x" G
    , x4 n/ K) @( i  a

    ! L$ A( L: Z9 U# b) Z1 R6 `
    : g6 m: o8 @& Y
                          0 Z8 G! r) D; I' G, W
    + l6 f# Y2 r  ^' z' Q
    2 ~! }. J1 U4 X9 m( Q1 z* O% _

    % f9 F8 j) Y. T. Z( {: p關(guān)于我們:
    & K. b$ R/ @! Z7 i深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。! z1 R' T* L- U' ~
    - \  A4 U6 I" A; S4 Y4 `
    http://www.latitudeda.com/
    4 H, X- t! g( t(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表