電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 111|回復: 0
收起左側

Hot Chips 2024 | 數(shù)據(jù)中心固態(tài)冷卻技術應對爆炸性增長的熱管理創(chuàng)新

[復制鏈接]

686

主題

686

帖子

5863

積分

四級會員

Rank: 4

積分
5863
跳轉到指定樓層
樓主
發(fā)表于 2024-11-1 08:00:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
引言0 S4 A3 K& W$ S( d( W# `9 K
高性能計算,尤其是人工智能和機器學習領域的飛速發(fā)展,導致數(shù)據(jù)中心的功率密度和熱量產(chǎn)生顯著增加。本文探討現(xiàn)代數(shù)據(jù)中心面臨的熱管理難題,并介紹創(chuàng)新解決方案:固態(tài)冷卻技術[1]。9 H+ p0 }6 `1 A" p% R
: `! F, \- H: f* p9 P
熱管理難題2 ]1 X1 E! \# s* s; w
數(shù)據(jù)中心正經(jīng)歷指數(shù)級增長,預計全球市場規(guī)模將從2024年的3018億美元增長到2030年的6224億美元,年復合增長率為10%。這種增長由帶寬、計算密度和數(shù)據(jù)管理能力的不斷提高所驅動。然而,這些進步也帶來了新的挑戰(zhàn),特別是在熱管理方面。
/ C8 I( o3 P: W- e) f. J
! d7 e5 }" T5 J) f) R- {8 v圖1展示2024年到2030年數(shù)據(jù)中心市場規(guī)模的預計增長,突顯了該行業(yè)的爆炸性增長。' o" y  `' c7 S# j1 Q' U

; @) u' r: Y& ?6 F/ N$ a隨著計算能力的提升,處理器產(chǎn)生的熱量也隨之增加。當前一代機架通常消耗約40千瓦,而下一代系統(tǒng)預計每個機架將需要高達120千瓦。這種三倍的功耗增加帶來了重大的冷卻挑戰(zhàn),因為即使是目前最好的解決方案,考慮到冷卻限制,也只能管理約66千瓦每機架。
6 A6 M7 \6 d) [0 a, q% g' @  O+ R- Z; e! i" Q8 ^
有效的熱管理對數(shù)據(jù)中心至關重要。熱管理約占數(shù)據(jù)中心功耗的40%,是這些設施總擁有成本(TCO)的關鍵因素。
, m& a8 [$ w+ ^+ J0 b; B7 C0 b
6 p9 {0 O: y* l3 [/ D/ J圖2說明了數(shù)據(jù)中心功耗的細分,強調(diào)了熱管理所占的顯著部分。6 ]7 a  p- O8 C1 P0 v* a, [3 h

7 @5 c% z; A7 D+ V1 Z傳統(tǒng)冷卻解決方案的局限性
8 m: u- w2 @& G5 w& m# i傳統(tǒng)冷卻方法難以跟上現(xiàn)代數(shù)據(jù)中心不斷增加的熱流密度。被動冷卻技術,如散熱器和熱管,本質上受到環(huán)境溫度的限制,對高性能計算需求往往不足。主動冷卻解決方案,如蒸汽壓縮系統(tǒng),雖然有效但通常缺乏設備級所需的精確度,并可能消耗過多電力。
1 n5 k, N$ H- T8 U) m2 K8 g7 R8 _/ ~- D3 M& ]+ y

  ^" i  k5 X+ z8 z圖3描述了傳統(tǒng)冷卻解決方案,包括被動和主動方法,強調(diào)了這些方法在解決現(xiàn)代數(shù)據(jù)中心冷卻需求方面的局限性。) V. E* Y2 X1 y* P$ b. w* K. V

* Z8 |2 i2 U& v2 F9 A# k0 T隨著熱設計功耗(TDP)值的增加,業(yè)界逐漸轉向液體冷卻。然而,這種轉變也帶來了自身的一系列挑戰(zhàn),包括基礎設施改造和潛在的可靠性問題。
4 S8 h& j+ t! e- C# N" r/ B+ Q" w7 S

) O% J; m, ?( l0 s4 M; K7 H圖4展示了XPU功率與冷卻方法之間的關系,指出了高TDP值向液體冷卻轉變的趨勢。
1 u( }! e% H3 j9 p6 x+ t% v2 R; W7 I1 U: P/ |: A( b: w0 u
固態(tài)冷卻技術簡介
. n9 \% i2 L+ `7 L& [固態(tài)冷卻技術作為一種有前景的解決方案,可以應對數(shù)據(jù)中心面臨的熱管理挑戰(zhàn)。這種創(chuàng)新技術彌合了被動和主動冷卻方法之間的差距,為熱管理提供了動態(tài)方法。
$ L+ Y$ c. l1 ~; i& c1 m$ @3 P- }1 U2 L' ~- q. ]2 ~
固態(tài)冷卻的主要優(yōu)勢包括:
  • 動態(tài)響應:系統(tǒng)可以根據(jù)實時熱需求,在被動和主動冷卻模式之間無縫切換。
  • 性能提升:通過防止熱降頻,固態(tài)冷卻允許處理器長時間保持峰值性能。
  • 能源效率:能夠在可能的情況下以被動模式運行,僅在必要時啟動主動冷卻,從而實現(xiàn)整體節(jié)能。
  • 靈活性:固態(tài)冷卻解決方案可以集成到現(xiàn)有的數(shù)據(jù)中心基礎設施中,減少資本支出和部署時間。/ d, [" [; h0 s6 U% r
    [/ol]- A; u# R4 v; i; C/ O
    8 l- e% c% M5 V- m9 |5 C
    圖5展示了固態(tài)動態(tài)冷卻的概念,說明了如何在被動和主動模式下運行以滿足不同的散熱需求。
    ) q# \! P: b$ ]0 ]0 D8 A9 T7 q5 t& s; E# O6 B  n. W" w- G
    實際應用:Hex 2.0 CPU冷卻器
    8 J5 ^2 ], j% a為了說明固態(tài)冷卻的實際應用,讓我們來看看Phononic公司開發(fā)的Hex 2.0 CPU冷卻器。這種創(chuàng)新的冷卻器在緊湊的92毫米外形中結合了被動和主動冷卻技術。
    ) W$ ?4 y' b* n- \- e/ h* y' @/ o  f# N
    ! A) B8 I4 r! j1 m& H( y; W' M
    圖6展示了Hex 2.0 CPU冷卻器,展示了其緊湊設計以及被動和主動冷卻元件的集成。
    9 d, t  M% K  P/ v/ T
    1 [1 c  ^4 U/ fHex 2.0有兩種運行模式:
  • 被動模式:在正常條件下,冷卻器作為傳統(tǒng)散熱器運行,通過主散熱器有效散熱。
  • 導熱模式:當CPU處于壓力下并產(chǎn)生更多熱量時,熱電元件激活,通過輔助散熱器提供額外的冷卻能力。( |: `8 H' t2 Y+ D! G0 K4 ~
    [/ol]# ~0 E# R) t5 n1 U
    這種動態(tài)方法使Hex 2.0的性能超過了許多傳統(tǒng)冷卻解決方案,包括一些外形更大的液體冷卻系統(tǒng)。  z) C! G( X  `# t
    ) `4 p0 \' p+ E9 I
    % K- R" v! G9 C, [' D- s
    圖7展示了Hex 2.0與其他冷卻解決方案的性能對比,展示了其優(yōu)越的冷卻效率。
    ' O+ c9 _, U6 ~! ~2 ?+ o0 K+ W& X" T$ {' z  ~
    數(shù)據(jù)中心基礎設施的廣泛應用7 }9 i7 ^4 d) T2 p
    固態(tài)冷卻的原理可以應用于單個CPU冷卻器之外的領域。這項技術有潛力徹底改變數(shù)據(jù)中心各種組件的冷卻方式,包括:  k+ d# I$ |; l3 C4 j9 \7 o6 d! [' r
  • 機架頂部交換機
  • 計算核心
  • 后門冷卻系統(tǒng). L# d/ w; [+ _( k( ?$ T
    ; c# F5 B" R; E3 d% \
    通過在整個數(shù)據(jù)中心實施固態(tài)冷卻解決方案,運營商可以:* o6 C$ |2 {9 `" C5 I: t2 f# C$ }
  • 穩(wěn)定光學網(wǎng)絡的頻率
  • 消除CPU/GPU的降頻
  • 提高現(xiàn)有基礎設施的潛力
  • 延長組件的使用壽命
  • 平滑熱點
  • 提高機架和數(shù)據(jù)中心層面的功率密度- s2 I$ m* @0 Q

    ( u! I, w6 _5 H2 }2 \" ?/ B
    2 V! h# P2 s- `7 e8 ]- d # v$ B8 y8 _/ X3 c( ]" \9 D. `4 c
    圖8展示了如何在數(shù)據(jù)中心基礎設施的各個元素中部署固態(tài)冷卻解決方案。5 t: \7 j% f' |1 Y/ b3 C& m
    ! x! Q. t: A6 N: \0 y: ?3 z
    結論6 Q, N6 j9 Z# k) N9 f3 a: T
    隨著數(shù)據(jù)中心不斷發(fā)展以滿足高性能計算和人工智能應用的需求,熱管理仍然是一個關鍵挑戰(zhàn)。固態(tài)冷卻提供了一種有前景的解決方案,具備應對現(xiàn)代數(shù)據(jù)中心復雜熱景觀所需的靈活性和效率。; L" M2 q* Y5 K% i( T0 K# }! ~

    ' O) m' [3 Z/ J& N通過在動態(tài)、響應式系統(tǒng)中結合被動和主動冷卻的優(yōu)勢,固態(tài)冷卻技術使數(shù)據(jù)中心能夠:7 x; U4 t5 k" B! ]8 r
  • 最大化計算性能
  • 提高能源效率
  • 延長現(xiàn)有基礎設施的壽命
  • 為未來功率密度的增加做好準備
    : l# U4 M5 f* e1 c! P+ w: B9 c! c6 v

    1 ?8 N& U. x7 G, l( c0 D隨著行業(yè)的發(fā)展,采用固態(tài)冷卻等創(chuàng)新冷卻解決方案將對釋放下一代計算技術的全部潛力起重要作用,同時保持可持續(xù)和高效的數(shù)據(jù)中心運營。4 Z# c3 f3 v2 y& _8 E$ T
    1 [) F* ]( H4 V6 K
    參考文獻
    ) ^& n" E9 \( u* ^" [  b[1] J. Edwards, "Datacenters: Explosive Growth Meets Thermal Consequences Power & Potential of Solid State Cooling," Phononic, Aug. 25, 2024.! ^$ L+ K% e) f9 r+ I2 A) G
    END$ V" ]( R+ D  S- j- q4 q
    5 a5 r3 U/ X& s  K) F: @* z
    ) `0 t1 J; ?, n  ]6 ]
    軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應用,PIC Studio都可提升您的工作效能。
    ) M+ \8 c$ ?- S- b+ }6 X2 }點擊左下角"閱讀原文"馬上申請  v- i# v; H7 i

    ! Y# X8 L7 ?/ @; ~) Q, v. E歡迎轉載
    ! L- t: o2 _4 g( {; g
    5 U3 n2 {; c; ^轉載請注明出處,請勿修改內(nèi)容和刪除作者信息!
      a1 d, c3 i$ f( l  a
    1 O, z% a$ p$ Y, w( _' M5 X4 `1 N
    * W( i  {0 J; Y+ ]5 N' h
    * }7 a1 m, F& _0 {1 ^
    + M7 P, S& T# _" |% m3 W: m8 g
    關注我們
    ) L: v: ~2 o7 B5 i$ w$ c
    / y2 f& ^$ ^/ @* I2 u

    9 J6 A0 g- x3 v5 h4 S  R1 m
    / j3 \# N8 ]: ^
    4 `& R% R) k. o3 k5 u9 r

    ' B" W, @; r' l

    $ W, @  c( p0 g2 k6 ~  y: }3 [ % ~% U% y) A3 P* _' z' [; ?
                          " U2 J4 k" X; C: g* O6 A/ @" U

    ! ~: u+ Y# t7 g! T

    ' {  a$ A, @; G) G/ q& O/ W4 _& _& O4 I1 A
    關于我們:
    " P6 j$ B: V+ B深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導體芯片設計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設計和仿真軟件,提供成熟的設計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設計與仿真。我們提供特色工藝的半導體芯片集成電路版圖、IP和PDK工程服務,廣泛服務于光通訊、光計算、光量子通信和微納光子器件領域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術與服務。
    & _9 m0 ]' P) |5 g$ v1 e
    7 ?2 z, K* P4 @4 i6 Fhttp://www.latitudeda.com/1 X' u, L/ |; J. F) G" i1 R3 c
    (點擊上方名片關注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表