|
引言
7 {' W: k" j8 v0 h; J0 X- {大語言模型(LLMs)已經(jīng)改變了許多領(lǐng)域,現(xiàn)在正在芯片設(shè)計領(lǐng)域取得進展。本文探討了領(lǐng)域自適應(yīng)大語言模型如何被用來增強和可能改變芯片設(shè)計過程[1]。
" z$ L1 y& M" L. |7 F8 p' O
2 b1 l) P1 l4 W2 k為什么需要領(lǐng)域自適應(yīng)大語言模型?
; S- r" ` I+ ]5 N# g4 z2 P9 z; x9 |7 Y( N大語言模型的強大之處在于廣泛的知識和能力。這些模型擅長自然語言理解、推理、問題解決,甚至代碼生成。然而,要在芯片設(shè)計等專業(yè)領(lǐng)域真正發(fā)揮作用,需要融入特定領(lǐng)域的知識。
7 w$ l# U4 [0 l: y3 M$ {2 k
3hyriufbndw64020270242.png (317.99 KB, 下載次數(shù): 0)
下載附件
保存到相冊
3hyriufbndw64020270242.png
前天 01:06 上傳
' G& D3 ~2 @; p" T
圖1: 展示了預(yù)訓(xùn)練模型廣泛的知識和能力,包括自然語言理解、推理、問題解決和代碼生成。
) m2 D) M& W9 e6 l6 n1 b$ T$ G0 L+ o+ V
領(lǐng)域自適應(yīng)大語言模型彌合了通用語言模型與芯片設(shè)計專業(yè)需求之間的差距。這些模型能夠理解和生成硬件描述語言、協(xié)助驗證過程,甚至幫助優(yōu)化芯片布局。
; q" t5 X6 n5 v3 R& t9 i' I
52pqq5ibjdb64020270342.png (189.62 KB, 下載次數(shù): 0)
下載附件
保存到相冊
52pqq5ibjdb64020270342.png
前天 01:06 上傳
+ @: U& ]2 _9 v* g4 p7 g圖2: 描述了領(lǐng)域自適應(yīng)大語言模型如何為電子設(shè)計自動化任務(wù)融入專業(yè)知識。
2 c* V+ w5 w* C, {) b- g+ K
% _1 r8 J5 p! o$ S9 S! Z1 A- g領(lǐng)域自適應(yīng)大語言模型技術(shù)) E6 S: H4 x, ]" o6 V0 m) R7 \" A
創(chuàng)建芯片設(shè)計領(lǐng)域自適應(yīng)大語言模型主要有三種方法:模型訓(xùn)練階段: 在模型初始訓(xùn)練期間深度融入領(lǐng)域特定知識。模型微調(diào)階段: 在初始訓(xùn)練后,針對特定任務(wù)增強模型性能。模型推理階段: 這種方法在實時動態(tài)調(diào)整模型,無需改變其基本參數(shù)。8 X+ b7 Q: v" t; Z' s
[/ol]
4 ?8 z# u% ^; j3 p, S+ F( ~7 `- B1 p6 b
tuqkywdp4r064020270442.png (193.41 KB, 下載次數(shù): 0)
下載附件
保存到相冊
tuqkywdp4r064020270442.png
前天 01:06 上傳
6 ^* z! a+ j/ {圖3: 比較了不同的領(lǐng)域自適應(yīng)大語言模型技術(shù),展示了成本、資源需求、領(lǐng)域數(shù)據(jù)量和對模型參數(shù)影響之間的權(quán)衡。. \ p7 ?" r e y; _0 A4 u
0 N- E0 z$ w: M4 I( \. c
每種方法都有優(yōu)點和權(quán)衡。選擇取決于可用的計算資源、領(lǐng)域特定數(shù)據(jù)量和具體任務(wù)。
+ Z/ `4 [# A: x- `( l
) u+ U4 Z4 ?; o' x3 h( \9 C領(lǐng)域自適應(yīng)預(yù)訓(xùn)練(DAPT)
6 W7 z* |5 \) T% ^' s1 ODAPT涉及在大量領(lǐng)域特定數(shù)據(jù)上訓(xùn)練模型。對于芯片設(shè)計,這可能包括硬件相關(guān)代碼、RTL(寄存器傳輸級)描述、驗證測試平臺和硬件規(guī)格。
" t% V, J! B3 p2 W, n
o1rtzpvj3vo64020270542.png (224.81 KB, 下載次數(shù): 0)
下載附件
保存到相冊
o1rtzpvj3vo64020270542.png
前天 01:06 上傳
; }# q: U4 Z& p# e+ b+ t* E9 `' j* K! ~* Y
圖4: 圖解說明了芯片設(shè)計任務(wù)的領(lǐng)域自適應(yīng)預(yù)訓(xùn)練過程。
) r; M! Q9 ~& @0 J7 ~5 Z- r# |' y0 v: |/ V% z% ?
ChipNeMo是DAPT在實踐中的例子,這是一個針對芯片設(shè)計的領(lǐng)域自適應(yīng)大語言模型。準備DAPT需要:3 i6 j! R; \9 R4 _3 b
可用的基礎(chǔ)模型(如Llama)大型領(lǐng)域數(shù)據(jù)集足夠的訓(xùn)練資源
; F) i* i5 C) q* b
+ l0 s# W( u3 v' cDAPT過程通常包括:
$ ?& l, h( {. z: P- W; J( L8 W/ }調(diào)整領(lǐng)域自適應(yīng)分詞器使用自回歸語言建模目標在通用和領(lǐng)域內(nèi)語料庫的組合上進行訓(xùn)練
2 l: o! @* Z3 C" e. o# G& Z0 n; j( c Y
DAPT的結(jié)果是一個領(lǐng)域自適應(yīng)基礎(chǔ)模型,可以進一步針對各種芯片設(shè)計任務(wù)進行微調(diào)。
3 b: n" M' x+ D9 [# o! V% P3 G/ K
5 L1 {( C& Q5 E任務(wù)特定微調(diào)(TSFT)
% Y. G" u8 i" T" B; ]. vTSFT涉及對預(yù)訓(xùn)練模型(通用大語言模型或領(lǐng)域自適應(yīng)模型)進行針對特定芯片設(shè)計任務(wù)的微調(diào)。這個過程需要: `$ S/ v% Y+ M; K1 G
基礎(chǔ)模型特定任務(wù)(如Verilog生成、錯誤檢測)領(lǐng)域任務(wù)數(shù)據(jù)集評估基準和指標" V9 p% A) l% X6 p* q7 C& J9 A
- g7 n0 H" x) v' X% V) }" r4 E+ L' M
/ Q7 N1 u4 U* x. V6 R! ~9 ^' ]
5zockxxpdyi64020270642.png (188 KB, 下載次數(shù): 0)
下載附件
保存到相冊
5zockxxpdyi64020270642.png
前天 01:06 上傳
6 G: d: K' c& A& H% f* E8 u圖5: 概述了任務(wù)特定微調(diào)過程,顯示了芯片設(shè)計任務(wù)有效微調(diào)所需的組件。2 q" K+ e6 ?5 q7 g2 f+ z$ D$ e2 ]" z
( u9 S/ a8 [; A
對于基礎(chǔ)模型,研究人員可以使用開源通用模型如CodeGen、Mistral或Llama,或領(lǐng)域自適應(yīng)模型如ChipNemo。選擇取決于任務(wù)的具體要求和可用資源。
8 Z' S# m5 T' G) K
- z/ ~- P) P4 l+ ?% }; O+ X領(lǐng)域任務(wù)數(shù)據(jù)集可以來自多個來源:. k3 U. I! Z. ?* `8 e s+ f* I
教科書開源代碼庫合成數(shù)據(jù)(由人或機器生成)專有數(shù)據(jù)競賽數(shù)據(jù)集+ \- u" K. e9 u# ^5 }' e( t' o0 `
' l: X8 M. u! q U6 m6 h) q5 }( B. t! U. Q( I
hmtwx3knvng64020270742.png (177.76 KB, 下載次數(shù): 0)
下載附件
保存到相冊
hmtwx3knvng64020270742.png
前天 01:06 上傳
7 |8 B/ Y" ^/ L5 i9 l( y- Q圖6: 用于訓(xùn)練芯片設(shè)計任務(wù)領(lǐng)域自適應(yīng)大語言模型的問題描述和參考代碼對的示例。1 T% S4 u, c& f" U( i/ `2 n7 D% E% V$ m
+ U, [' V0 Z. U0 _% ?5 \
基準在評估這些模型的性能中起著關(guān)鍵作用。該領(lǐng)域的兩個著名基準是:0 z+ u0 y0 Y) M/ d$ {8 U8 v
RTLLM: 一個包含30個HDL設(shè)計任務(wù)的基準,配有測試平臺和語法、語義和性能指標。VerilogEval: 該基準包括機器生成和人工策劃的Verilog代碼生成任務(wù)問題描述。- W0 C/ f; J0 m: H7 N3 }
' U- X' _ I7 s8 v1 S
5 t- b5 [* b9 n
l55mjli3e0d64020270843.png (388.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
l55mjli3e0d64020270843.png
前天 01:06 上傳
: [( V5 S/ k0 ?1 X( M. K" B7 |2 z
圖7: RTLLM基準任務(wù)示例,顯示了實現(xiàn)4位無符號數(shù)流水線乘法器的詳細問題描述。1 k6 [3 d/ O7 I# U# P
$ L1 `: ^ W/ V# w0 P! O
5 H$ x/ j5 \8 t$ ^提示工程和推理時技術(shù)
! w( l9 Z" t" \8 S8 O4 g雖然預(yù)訓(xùn)練和微調(diào)專注于修改模型本身,提示工程和其他推理時技術(shù)允許我們利用大語言模型進行芯片設(shè)計,而無需更改底層模型參數(shù)。
8 s% z# x0 G- r& n& ~0 {! n9 H5 F
. a3 C: I/ e: h) j' x提示工程的一個強大應(yīng)用是創(chuàng)建芯片設(shè)計助手聊天機器人。這些聊天機器人可以理解自然語言查詢、解決問題,并與用戶互動,在整個設(shè)計過程中提供指導(dǎo)。0 }, ]2 `* s ]
/ T4 T0 f; a( c( L/ Q. g* e
mrbhhvopbl364020270943.png (242.31 KB, 下載次數(shù): 0)
下載附件
保存到相冊
mrbhhvopbl364020270943.png
前天 01:06 上傳
2 C7 I1 q) @# X. I0 c% U& a! O) f
圖8: 流程圖描述了使用大語言模型驅(qū)動的Verilog RTL助手的過程,包括自我驗證和自我糾正步驟。7 w! x" f$ B4 ]+ Y& N
) x, ^" C( @3 _2 c$ ]( s0 X% o% ?
要有效地使用大語言模型作為芯片設(shè)計助手,請考慮以下提示工程技術(shù):角色扮演: 要求模型扮演硬件專家的角色。少樣本學(xué)習(xí): 提供正面和負面例子來指導(dǎo)模型的輸出。任務(wù)分解: 將復(fù)雜問題分解成更小、可管理的步驟。約束規(guī)范: 使用[BEGIN]和[END]等標簽來控制輸出格式。思維鏈提示: 要求模型逐步解決問題。多輪交互: 進行來回對話以細化輸出。" {- U; J6 h2 j4 o! {; Q
[/ol]
+ l, Q' Q4 }; M4 X5 ^# y& }/ ]5 z" u% X1 }6 I) i& \2 `
cudfsw14roh64020271043.png (346.21 KB, 下載次數(shù): 0)
下載附件
保存到相冊
cudfsw14roh64020271043.png
前天 01:06 上傳
: v) J7 i/ d% b# U
圖9: 圖表顯示了大語言模型驅(qū)動的Verilog RTL助手中的反饋循環(huán)和自我糾正過程。0 `* h- T, m' d$ x% C
( g, Z- M8 r- R% A另一個強大的技術(shù)是將大語言模型與外部工具和模擬器結(jié)合。這創(chuàng)建了一個反饋循環(huán),允許模型驗證其輸出并根據(jù)現(xiàn)實世界結(jié)果進行糾正。該過程通常包括:初始提示創(chuàng)建接收來自大語言模型的輸出將輸出饋送到模擬器或編譯器提取反饋根據(jù)反饋創(chuàng)建新提示重復(fù)交互以進行多輪提示/ f1 z! a' N y4 R2 F
[/ol]
& j, V# c$ Q, `3 `# V: q) k8 z; [. b2 F$ V( c
wof5dtzqbey64020271143.png (158.95 KB, 下載次數(shù): 0)
下載附件
保存到相冊
wof5dtzqbey64020271143.png
前天 01:06 上傳
; \6 h5 @6 ` k4 {* w5 h
圖10: 說明了使用大型語言模型自動修復(fù)RTL語法錯誤的檢索增強生成過程。
$ f0 _) J; P7 ^- O& y
& X1 l+ D8 t7 w檢索增強生成(RAG)是另一種有前景的方法。例如,在RTL語法錯誤糾正中,RAG可用于:對各種語法錯誤進行分類收集人類專家對編譯器日志的指導(dǎo)和解釋建立編譯器日志、錯誤代碼段和人類指導(dǎo)的數(shù)據(jù)庫使用該數(shù)據(jù)庫為大語言模型對語法錯誤的響應(yīng)提供信息. K4 H% a' J1 P& A1 ~$ Z9 \. U
[/ol]- w7 S9 N% T; j" H: h5 D3 A
未來方向- G# Q, ?- _2 X7 p
隨著芯片設(shè)計領(lǐng)域自適應(yīng)大語言模型領(lǐng)域的不斷發(fā)展,幾個方向浮現(xiàn)出來:與相鄰領(lǐng)域交叉: 借鑒軟件開發(fā)和形式驗證中大語言模型的想法。開發(fā)更多開源數(shù)據(jù)集和基準。探索人機協(xié)作方法,結(jié)合大語言模型和人類專家的優(yōu)勢。將PPA(功耗、性能、面積)指標納入大語言模型評估。利用多模態(tài)數(shù)據(jù),包括文本、代碼、圖表和規(guī)格。促進學(xué)術(shù)界和產(chǎn)業(yè)界之間的合作,推進理論基礎(chǔ)和實際應(yīng)用。
L. s$ J$ Y8 p/ `8 L" Z1 m" G[/ol]
+ }* m) I4 D4 _隨著繼續(xù)推動芯片設(shè)計中領(lǐng)域自適應(yīng)大語言模型的可能性邊界,可以期待看到自動化程度的提高、設(shè)計質(zhì)量的改善,以及可能徹底改變硬件開發(fā)方法的變革。芯片設(shè)計的未來無疑與這些強大的AI模型的進步息息相關(guān)。 y8 s- Q; r/ F4 a# f* h
# ^1 ?" H! w0 e8 O* F2 [
參考文獻
) Z5 I# u! Y# N( [6 d z) N: G[1] H. Huang, "Domain-adaptive LLMs for Chip Design," University of California San Diego, 2024.5 o* D5 _3 ?2 _) H
6 d! T* Y: P' Z: n$ }3 S, f% B- END -
, V: o& H- }5 G. A+ Q
% y! f( C/ Q9 v# w2 h; _5 o2 P6 c! Z軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。
6 N! K3 i0 a( \ b點擊左下角"閱讀原文"馬上申請
# j4 ]6 q* T P6 `, t& r# a+ C' c. k. Y3 L$ E6 Q
歡迎轉(zhuǎn)載+ z* P) t2 ^; c" W T* f
; W$ [2 F" o6 O* H轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!
7 ~2 ?3 x0 [! ~2 A4 j! T9 Y
7 Y, O9 n# Y7 @- t, U& \. ~1 V* ^/ ?
. E! m5 ]1 w, f4 M, W" _3 a5 D: F$ Z
jgenfe0hynb64020271243.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊
jgenfe0hynb64020271243.gif
前天 01:06 上傳
! T: m; f- ?4 [7 `( p' I* |: |) G6 k" u2 K4 Z9 L. e, L e2 e
關(guān)注我們
6 b' f% M$ B# ?
0 q; B% H B' e1 C7 @
$ ~. L. j. G& F% @8 ^' |5 m
se5lsne5pvl64020271343.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊
se5lsne5pvl64020271343.png
前天 01:06 上傳
' S/ b, g8 ` q; M
|
6 S$ U& N" n) \* h& C3 F0 |
h4kwlahkizk64020271444.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
h4kwlahkizk64020271444.png
前天 01:06 上傳
6 j3 I8 }: Q3 J# U1 H/ D
|
! U7 q2 L9 H" ^
iioik5xvgl164020271544.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊
iioik5xvgl164020271544.png
前天 01:06 上傳
' [$ r7 i- E5 U# R1 X1 X+ B( g. `
|
7 v; Y8 T4 g% ?# n" ~0 c+ n2 J* K2 [: S5 ~
7 l2 Z# t( }' F1 s) W4 a
' r' Z5 [+ f( U- P# W6 u7 E7 H: |7 r關(guān)于我們:
+ @" b. L, A0 \& @深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。9 F6 e7 T4 {. G/ f4 x
2 e5 j& e' b& s: s7 i3 Shttp://www.latitudeda.com/
) _ S3 p/ [. M0 B5 l: X3 B(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|