?領(lǐng)域自適應(yīng)大語言模型在芯片設(shè)計中的應(yīng)用

逍遙設(shè)計自動化 · 發(fā)表于 4 天前

引言
大語言模型(LLMs)已經(jīng)改變了許多領(lǐng)域,現(xiàn)在正在芯片設(shè)計領(lǐng)域取得進展。本文探討了領(lǐng)域自適應(yīng)大語言模型如何被用來增強和可能改變芯片設(shè)計過程[1]。

為什么需要領(lǐng)域自適應(yīng)大語言模型?
大語言模型的強大之處在于廣泛的知識和能力。這些模型擅長自然語言理解、推理、問題解決,甚至代碼生成。然而,要在芯片設(shè)計等專業(yè)領(lǐng)域真正發(fā)揮作用,需要融入特定領(lǐng)域的知識。

圖1: 展示了預(yù)訓(xùn)練模型廣泛的知識和能力,包括自然語言理解、推理、問題解決和代碼生成。

領(lǐng)域自適應(yīng)大語言模型彌合了通用語言模型與芯片設(shè)計專業(yè)需求之間的差距。這些模型能夠理解和生成硬件描述語言、協(xié)助驗證過程,甚至幫助優(yōu)化芯片布局。

圖2: 描述了領(lǐng)域自適應(yīng)大語言模型如何為電子設(shè)計自動化任務(wù)融入專業(yè)知識。

領(lǐng)域自適應(yīng)大語言模型技術(shù)
創(chuàng)建芯片設(shè)計領(lǐng)域自適應(yīng)大語言模型主要有三種方法:

模型訓(xùn)練階段: 在模型初始訓(xùn)練期間深度融入領(lǐng)域特定知識。

模型微調(diào)階段: 在初始訓(xùn)練后,針對特定任務(wù)增強模型性能。

模型推理階段: 這種方法在實時動態(tài)調(diào)整模型,無需改變其基本參數(shù)。
[/ol]

圖3: 比較了不同的領(lǐng)域自適應(yīng)大語言模型技術(shù),展示了成本、資源需求、領(lǐng)域數(shù)據(jù)量和對模型參數(shù)影響之間的權(quán)衡。

每種方法都有優(yōu)點和權(quán)衡。選擇取決于可用的計算資源、領(lǐng)域特定數(shù)據(jù)量和具體任務(wù)。

領(lǐng)域自適應(yīng)預(yù)訓(xùn)練(DAPT)
DAPT涉及在大量領(lǐng)域特定數(shù)據(jù)上訓(xùn)練模型。對于芯片設(shè)計,這可能包括硬件相關(guān)代碼、RTL(寄存器傳輸級)描述、驗證測試平臺和硬件規(guī)格。

圖4: 圖解說明了芯片設(shè)計任務(wù)的領(lǐng)域自適應(yīng)預(yù)訓(xùn)練過程。

ChipNeMo是DAPT在實踐中的例子,這是一個針對芯片設(shè)計的領(lǐng)域自適應(yīng)大語言模型。準備DAPT需要:

可用的基礎(chǔ)模型(如Llama)

大型領(lǐng)域數(shù)據(jù)集

足夠的訓(xùn)練資源

DAPT過程通常包括:

調(diào)整領(lǐng)域自適應(yīng)分詞器

使用自回歸語言建模目標

在通用和領(lǐng)域內(nèi)語料庫的組合上進行訓(xùn)練

DAPT的結(jié)果是一個領(lǐng)域自適應(yīng)基礎(chǔ)模型,可以進一步針對各種芯片設(shè)計任務(wù)進行微調(diào)。

任務(wù)特定微調(diào)(TSFT)
TSFT涉及對預(yù)訓(xùn)練模型(通用大語言模型或領(lǐng)域自適應(yīng)模型)進行針對特定芯片設(shè)計任務(wù)的微調(diào)。這個過程需要:

基礎(chǔ)模型

特定任務(wù)(如Verilog生成、錯誤檢測)

領(lǐng)域任務(wù)數(shù)據(jù)集

評估基準和指標

圖5: 概述了任務(wù)特定微調(diào)過程,顯示了芯片設(shè)計任務(wù)有效微調(diào)所需的組件。

對于基礎(chǔ)模型,研究人員可以使用開源通用模型如CodeGen、Mistral或Llama,或領(lǐng)域自適應(yīng)模型如ChipNemo。選擇取決于任務(wù)的具體要求和可用資源。

領(lǐng)域任務(wù)數(shù)據(jù)集可以來自多個來源:

教科書

開源代碼庫

合成數(shù)據(jù)(由人或機器生成)

專有數(shù)據(jù)

競賽數(shù)據(jù)集

圖6: 用于訓(xùn)練芯片設(shè)計任務(wù)領(lǐng)域自適應(yīng)大語言模型的問題描述和參考代碼對的示例。

基準在評估這些模型的性能中起著關(guān)鍵作用。該領(lǐng)域的兩個著名基準是:

RTLLM: 一個包含30個HDL設(shè)計任務(wù)的基準,配有測試平臺和語法、語義和性能指標。

VerilogEval: 該基準包括機器生成和人工策劃的Verilog代碼生成任務(wù)問題描述。

圖7: RTLLM基準任務(wù)示例,顯示了實現(xiàn)4位無符號數(shù)流水線乘法器的詳細問題描述。

$ L1 `: ^ W/ V# w0 P! O
提示工程和推理時技術(shù)
雖然預(yù)訓(xùn)練和微調(diào)專注于修改模型本身,提示工程和其他推理時技術(shù)允許我們利用大語言模型進行芯片設(shè)計,而無需更改底層模型參數(shù)。

提示工程的一個強大應(yīng)用是創(chuàng)建芯片設(shè)計助手聊天機器人。這些聊天機器人可以理解自然語言查詢、解決問題,并與用戶互動,在整個設(shè)計過程中提供指導(dǎo)。

圖8: 流程圖描述了使用大語言模型驅(qū)動的Verilog RTL助手的過程,包括自我驗證和自我糾正步驟。

要有效地使用大語言模型作為芯片設(shè)計助手,請考慮以下提示工程技術(shù):

角色扮演: 要求模型扮演硬件專家的角色。

少樣本學(xué)習(xí): 提供正面和負面例子來指導(dǎo)模型的輸出。

任務(wù)分解: 將復(fù)雜問題分解成更小、可管理的步驟。

約束規(guī)范: 使用[BEGIN]和[END]等標簽來控制輸出格式。

思維鏈提示: 要求模型逐步解決問題。

多輪交互: 進行來回對話以細化輸出。
[/ol]

圖9: 圖表顯示了大語言模型驅(qū)動的Verilog RTL助手中的反饋循環(huán)和自我糾正過程。

另一個強大的技術(shù)是將大語言模型與外部工具和模擬器結(jié)合。這創(chuàng)建了一個反饋循環(huán),允許模型驗證其輸出并根據(jù)現(xiàn)實世界結(jié)果進行糾正。該過程通常包括:

初始提示創(chuàng)建

接收來自大語言模型的輸出

將輸出饋送到模擬器或編譯器

提取反饋

根據(jù)反饋創(chuàng)建新提示

重復(fù)交互以進行多輪提示
[/ol]

圖10: 說明了使用大型語言模型自動修復(fù)RTL語法錯誤的檢索增強生成過程。

檢索增強生成(RAG)是另一種有前景的方法。例如,在RTL語法錯誤糾正中,RAG可用于:

對各種語法錯誤進行分類

收集人類專家對編譯器日志的指導(dǎo)和解釋

建立編譯器日志、錯誤代碼段和人類指導(dǎo)的數(shù)據(jù)庫

使用該數(shù)據(jù)庫為大語言模型對語法錯誤的響應(yīng)提供信息
[/ol]
未來方向
隨著芯片設(shè)計領(lǐng)域自適應(yīng)大語言模型領(lǐng)域的不斷發(fā)展,幾個方向浮現(xiàn)出來:

與相鄰領(lǐng)域交叉: 借鑒軟件開發(fā)和形式驗證中大語言模型的想法。

開發(fā)更多開源數(shù)據(jù)集和基準。

探索人機協(xié)作方法,結(jié)合大語言模型和人類專家的優(yōu)勢。

將PPA(功耗、性能、面積)指標納入大語言模型評估。

利用多模態(tài)數(shù)據(jù),包括文本、代碼、圖表和規(guī)格。

促進學(xué)術(shù)界和產(chǎn)業(yè)界之間的合作,推進理論基礎(chǔ)和實際應(yīng)用。
[/ol]
隨著繼續(xù)推動芯片設(shè)計中領(lǐng)域自適應(yīng)大語言模型的可能性邊界,可以期待看到自動化程度的提高、設(shè)計質(zhì)量的改善,以及可能徹底改變硬件開發(fā)方法的變革。芯片設(shè)計的未來無疑與這些強大的AI模型的進步息息相關(guān)。

參考文獻
[1] H. Huang, "Domain-adaptive LLMs for Chip Design," University of California San Diego, 2024.

- END -

軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用，PIC Studio都可提升您的工作效能。
點擊左下角"閱讀原文"馬上申請

歡迎轉(zhuǎn)載

轉(zhuǎn)載請注明出處，請勿修改內(nèi)容和刪除作者信息！

. E! m5 ]1 w, f4 M, W

關(guān)注我們

+ n2 J* K2 [: S5 ~

關(guān)于我們：
深圳逍遙科技有限公司（Latitude Design Automation Inc.）是一家專注于半導(dǎo)體芯片設(shè)計自動化（EDA）的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件，提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio，分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù)，廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作，推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展，致力于為客戶提供前沿技術(shù)與服務(wù)。

http://www.latitudeda.com/
（點擊上方名片關(guān)注我們，發(fā)現(xiàn)更多精彩內(nèi)容）

?領(lǐng)域自適應(yīng)大語言模型在芯片設(shè)計中的應(yīng)用

發(fā)表回復(fù)

精選推薦

站長推薦 /1