電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 67|回復(fù): 0
收起左側(cè)

Hot Chips 2024 | 大型語(yǔ)言模型和檢索增強(qiáng)生成技術(shù)介紹

[復(fù)制鏈接]

433

主題

433

帖子

3062

積分

四級(jí)會(huì)員

Rank: 4

積分
3062
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-10-2 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言' N2 n% ?8 h: N; q' J
本文旨在幫助讀者了解大型語(yǔ)言模型(LLMs)和檢索增強(qiáng)生成(RAG)技術(shù)的基礎(chǔ)知識(shí)。這些技術(shù)正在電子設(shè)計(jì)自動(dòng)化(EDA)領(lǐng)域產(chǎn)生重大影響,正在改變芯片設(shè)計(jì)和驗(yàn)證的方式[1]。! y8 `" L8 e2 ~" U, E; N
( |( E6 ~  L0 T$ j
什么是大型語(yǔ)言模型?
6 f8 x4 e) k. u$ |* o大型語(yǔ)言模型是設(shè)計(jì)用于理解和生成類人文本的先進(jìn)神經(jīng)網(wǎng)絡(luò)。這些模型經(jīng)過(guò)海量數(shù)據(jù)訓(xùn)練,能夠執(zhí)行從簡(jiǎn)單的文本補(bǔ)全到復(fù)雜推理和代碼生成等各種語(yǔ)言任務(wù)。# g$ t$ D; n" f6 N& X
0 m4 j$ o$ b# Z' d7 {7 o, t; B
圖1:AI概念層次結(jié)構(gòu),顯示了LLMs在人工智能廣泛領(lǐng)域中的位置。
7 p5 G1 c: \2 i8 b
: g! K6 O$ R- l' h6 JLLMs建立在復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)之上,通常包含數(shù)十億個(gè)參數(shù)。這些參數(shù)在訓(xùn)練過(guò)程中不斷調(diào)整,模型需要接觸大量文本數(shù)據(jù)。例如,Meta的Llama 3.1模型在訓(xùn)練過(guò)程中處理了超過(guò)10萬(wàn)億個(gè)單詞,需要約60天的訓(xùn)練時(shí)間和20,000多個(gè)Nvidia H100 GPU。
8 I( B/ w0 Z1 g( f8 _
% \8 F6 n9 {- g# Q這些模型的規(guī)模差異很大,從約70億參數(shù)到超過(guò)1萬(wàn)億參數(shù)不等。開放和封閉模型的選擇取決于架構(gòu)和權(quán)重的公開可用性。通常使用量化技術(shù)來(lái)壓縮權(quán)重,在模型大小和準(zhǔn)確性之間取得平衡。2 ]# G# b! r, [4 A9 u4 S8 |4 }( q
+ _6 j( K4 O- ?+ K8 F1 G
LLM架構(gòu)和功能
) Q5 V7 P4 m2 x& ?! w0 l! [現(xiàn)代LLMs的核心是Transformer架構(gòu),由Google DeepMind在2017年的論文"Attention is All You Need"中首次提出。這種架構(gòu)通過(guò)引入自注意力機(jī)制徹底改變了該領(lǐng)域,使模型能夠同時(shí)處理整個(gè)文本序列,而不是按順序處理。' U; h) C  G2 Y7 C, T% l

0 j, q; ?+ v0 h8 S& {6 Y% a" A$ w " e1 D7 V6 G& p8 k2 b  ?9 h& S
圖2:原始Transformer架構(gòu),展示了編碼器和解碼器組件。
5 x  a# k  M8 J2 Q( ~+ B& z+ Y# }$ a9 X5 @7 K
LLM的關(guān)鍵組件包括:
  • 分詞:將輸入文本分解成可管理的單元(稱為標(biāo)記)。
  • 嵌入:將標(biāo)記轉(zhuǎn)換為數(shù)值向量表示,捕捉語(yǔ)義含義和單詞之間的關(guān)系。
  • 注意力機(jī)制:從嵌入中計(jì)算上下文相關(guān)的權(quán)重,關(guān)注輸入的相關(guān)部分。
  • Transformer層:通過(guò)多層自注意力和前饋神經(jīng)網(wǎng)絡(luò)處理嵌入。: A) n) i: W( ^$ h7 j
    [/ol]1 p# F$ S8 s, ~0 |7 o0 ~$ J! {
    LLM訓(xùn)練和局限性
    0 X; o! t$ M- z- U訓(xùn)練LLM是復(fù)雜且資源密集的過(guò)程,通常包括三個(gè)階段:
  • 預(yù)訓(xùn)練:模型接觸大量文本數(shù)據(jù),學(xué)習(xí)一般語(yǔ)言模式和知識(shí)。
  • 微調(diào):預(yù)訓(xùn)練模型在特定任務(wù)數(shù)據(jù)上進(jìn)行進(jìn)一步訓(xùn)練,以專門化其能力。
  • 人類反饋強(qiáng)化學(xué)習(xí)(RLHF):可選階段,根據(jù)人類偏好優(yōu)化模型輸出。
    6 A- g0 ]; \* y5 }8 x[/ol]
    ! h& E  |$ G; a- X; G% g: n盡管LLMs具有令人印象深刻的能力,但也存在幾個(gè)局限性:
    4 [$ J  C- ]0 P
  • 在復(fù)雜的數(shù)學(xué)和邏輯推理方面存在困難
  • 基于訓(xùn)練數(shù)據(jù)可能產(chǎn)生有偏見的輸出
  • 知識(shí)截止于訓(xùn)練時(shí)間
  • 可能產(chǎn)生幻覺或自信地陳述錯(cuò)誤信息
  • 訓(xùn)練和推理需要高昂的計(jì)算和能源成本
  • 關(guān)于數(shù)據(jù)使用和潛在濫用的倫理問(wèn)題+ s4 Y6 ]8 @6 ^3 Y5 X

    9 {& o& P" F0 j( `, M$ ^; B0 n檢索增強(qiáng)生成(RAG)$ D2 P$ i1 F9 e- I3 \
    為了解決一些限制,特別是知識(shí)截止問(wèn)題,檢索增強(qiáng)生成(RAG)技術(shù)應(yīng)運(yùn)而生。RAG使LLMs能夠在生成過(guò)程中訪問(wèn)和整合外部信息。3 z$ I& X2 X# k8 \) N( m

    5 y8 i0 E, @' E2 b8 o. @ 8 j5 s) @/ g1 Q3 N+ I' s, ~8 ^4 v
    圖3:RAG架構(gòu),顯示了從原始數(shù)據(jù)到LLM響應(yīng)的流程。4 R3 Y0 L' O) ]1 _4 B2 X

    0 l+ o7 B6 s& e. ]5 ?RAG過(guò)程包括:
  • 索引:將原始數(shù)據(jù)轉(zhuǎn)換為嵌入并存儲(chǔ)在向量數(shù)據(jù)庫(kù)中。
  • 檢索:接收查詢時(shí),從向量數(shù)據(jù)庫(kù)中檢索相關(guān)信息。
  • 增強(qiáng):將檢索到的信息與用戶的提示結(jié)合。
  • 生成:LLM處理增強(qiáng)后的提示以產(chǎn)生響應(yīng)。4 R- b$ f& l0 b* H' h- J4 W. J: l
    [/ol]
    2 w) O. t, q) P6 dRAG允許LLMs利用專有信息、最新數(shù)據(jù)和已知事實(shí),減少產(chǎn)生幻覺的可能性,并擴(kuò)展模型的有效知識(shí)庫(kù)。6 }. F$ i& l. u+ e) N, }
    # G3 W  r+ k' q7 w5 X
    在電子設(shè)計(jì)自動(dòng)化(EDA)中的應(yīng)用
    5 F2 Z+ F* j$ N3 j" s+ W* mLLMs和RAG技術(shù)在電子設(shè)計(jì)自動(dòng)化領(lǐng)域找到了眾多應(yīng)用。關(guān)鍵用例包括:
    % v/ A% |: ^* d! x( r: k5 M: j9 h% g2 Y
  • 架構(gòu)設(shè)計(jì)和優(yōu)化
  • 代碼生成和調(diào)試
  • IP集成和管理
  • 設(shè)計(jì)驗(yàn)證和文檔編寫
  • 入職支持和培訓(xùn)
    , c  Y, s5 }8 w( d! v8 ]$ {. r
    ! \8 p' W0 M1 I& G$ U. E
    5 @) e: r/ B- K% [# J7 m

    # `1 G6 G, O2 |# F/ w圖4:EDA工作流程的演變,顯示隨著AI技術(shù)的進(jìn)步,人為干預(yù)需求的減少。
    - M1 Z( x0 r2 U' e  g8 x) {8 M" X  w9 E7 ?& v# J" q
    將LLMs和RAG集成到EDA工作流程中,有望減少許多任務(wù)中對(duì)人為干預(yù)的需求。例如,AI代理現(xiàn)在可以處理復(fù)雜的設(shè)計(jì)任務(wù),如創(chuàng)建具有99%代碼覆蓋率的UART接收器和測(cè)試平臺(tái),并自動(dòng)將文件提交到存儲(chǔ)庫(kù)。2 n: o$ [. o0 {& K) O1 \0 V
    , O9 v4 c) T; z. t5 J4 Q

    ; M- d9 i$ I( ^5 c% {) Y7 T. w圖5:基于LLM的AI代理工作流程,演示如何自動(dòng)化復(fù)雜的EDA任務(wù)。
    2 U0 o( ?/ Z5 v+ ^6 b
    6 Q$ J9 |1 s5 y未來(lái)方向和挑戰(zhàn)+ G, d  i5 f  q  K7 {
    隨著LLMs和RAG技術(shù)的不斷發(fā)展,我們可以期待在其能力和應(yīng)用方面出現(xiàn)幾個(gè)進(jìn)展:
    # w& H6 p3 Z, [1 @/ q- m: [
  • 使用網(wǎng)絡(luò)信息進(jìn)行自我事實(shí)檢查
  • 通過(guò)"慢思考"方法提高推理能力
  • 更大的上下文窗口以處理更長(zhǎng)的提示
  • 多模態(tài)能力,包括語(yǔ)音和圖像處理
  • 與外部存儲(chǔ)系統(tǒng)集成,增強(qiáng)長(zhǎng)期記憶
    # j7 ~/ y( ~9 U9 G+ ^/ \

    & W+ }4 c" j2 S% ~4 s/ z然而,仍然存在一些挑戰(zhàn),包括:) `8 d& o: Q% _5 r
  • 確保在設(shè)計(jì)過(guò)程中合乎倫理地使用AI
  • 管理大規(guī)模部署所需的計(jì)算資源
  • 解決EDA行業(yè)潛在的勞動(dòng)力變動(dòng)
  • 處理與訓(xùn)練數(shù)據(jù)相關(guān)的法律和版權(quán)問(wèn)題
    1 ?! D& [( S  T& Y6 r5 Y0 g4 Z: k. x
    ) |+ t( K$ f% Z) k
    大型語(yǔ)言模型和檢索增強(qiáng)生成技術(shù)的結(jié)合有望徹底改變電子設(shè)計(jì)自動(dòng)化領(lǐng)域。通過(guò)減少許多任務(wù)中對(duì)人為干預(yù)的需求,這些技術(shù)有望加速創(chuàng)新并提高芯片設(shè)計(jì)和驗(yàn)證過(guò)程的效率。隨著該領(lǐng)域的不斷發(fā)展,EDA專業(yè)人員必須及時(shí)了解這些進(jìn)展,并調(diào)整工作流程以利用AI輔助設(shè)計(jì)的力量。& x5 U# ^0 D1 Y' k1 C

    ) l* s0 L6 f2 \8 r8 G參考文獻(xiàn)
    " E0 y8 S* _( S[1] H. Bouwmeester, "HotChips 2024 Tutorial: From LLM+RAG to EDA AI-Agent," PrimisAI, 2024.. c6 x5 s# c( D0 d( n

    0 R/ J1 k+ [# |- L& E4 _- END -1 D1 B4 o! U: y9 o- R# @# U
    " s3 h+ O. |  C& j$ P) n- Y! j
    軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。9 ?7 d  S, h; U# _- w+ Y/ ?- F
    點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
    8 \2 w2 r( G6 N
    $ A5 x) J- L2 h  ^# w4 x# Q歡迎轉(zhuǎn)載
    3 u, Y/ F+ }9 I4 m) H$ X! a* W, n" y2 s+ Y$ `
    轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!/ Y( w: _$ S% I

    0 T, p- t# w  _( `) n# L5 T8 B0 l) w3 @6 i" d+ g6 N# ~( V

    . d/ q* G' _4 {( z) N
    $ J7 Q8 \3 A: q, ^: R1 C
    ) W$ ]3 R0 s% D1 A0 Z* ?& m) ?關(guān)注我們
    / w" {& e7 W& o5 s
    : B/ D9 @$ ^% |; i

    5 G7 T+ k0 a/ {0 c 7 o9 e2 s( g( T! t8 l# ]
    , [. n) I5 [% U2 \
    . T. v3 \, D+ O* c" q

    6 @/ o" n4 j$ J5 z% y
    # H& B! K1 r  }$ N4 u
                         
    # o( D: ]1 v) |' v/ v
    : N+ `4 M2 Z: X$ i

    0 h$ B; i7 S: m% `/ r) Y  E1 Z* g3 _2 i! o4 O- O4 q9 N
    關(guān)于我們:; A; o1 i9 p# _) S; b/ I9 H
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。$ ?+ u7 Z: q  v
    ; \4 d' j! k* |3 {) s
    http://www.latitudeda.com/& }6 ]. ?! o! {" ^
    (點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長(zhǎng)推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表