電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 30|回復(fù): 0
收起左側(cè)

ChatGPT為什么會(huì)“胡說八道”?

[復(fù)制鏈接]

530

主題

530

帖子

3059

積分

四級(jí)會(huì)員

Rank: 4

積分
3059
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢(mèng)話”一樣~: e- i. P* W) R2 r
# u  W. a6 y3 b; H7 \
! ~% d4 Z6 q8 k! l. Q: r8 n* p) C
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們?cè)撊绾伪苊釧I幻覺呢?
  R# }1 s* g* B, L; v
  a& t4 v+ `4 W. [7 R1
$ a/ d: N2 V- Y  @% x8 L; C4 x& OAI會(huì)產(chǎn)生什么樣的幻覺?
. l# U0 z  C$ n% E6 y) r5 t5 _
0 Z- K& |2 C3 L3 F0 g9 b& ?可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實(shí)也沒這么簡單,AI幻覺主要有兩類。
1 n. D- s3 n# g5 F2 P8 p事實(shí)幻覺:“假新聞制造機(jī)”
: C2 |+ f# o/ ]& H  J3 J0 [A:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾! a0 _3 m8 G! q* ?0 ~1 t! z
1 T5 E8 E: ~7 w5 S
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個(gè)事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。  _* |. Y- O1 C* l4 q7 B- [
B:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
  e4 ^" J5 {5 k0 t3 G" e5 ~

# M  V+ T/ l% @; I1 n* ] 4 Q6 a1 h9 G7 r
如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。
% ?( a; n. b, N1 X+ Z. a/ w忠誠度幻覺:“指令迷失”
$ \4 S) G1 z" K# V) G- {, ZA:指令不一致:AI的回答偏離用戶的要求
! A# d$ e+ N% j8 j* l! s" R; F

8 \5 j& @! Q3 h( w. l$ ~2 G * C: G6 q  f& A3 A
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。+ L! i" C% B' P" m9 L
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
8 q' j9 R1 c! n1 Z
: C+ D- c7 G+ W3 C6 {4 ^: Q假設(shè)在一個(gè)討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時(shí)候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個(gè)回答是正確的,符合春節(jié)的基本情況。
, l; Q# k9 b: @4 F( p然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會(huì)吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。
. F8 ^2 {* w" g# B" b5 i  R9 {6 KC. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
: ^( }) Q  a& Q8 V) ?1 y# M0 ?( ~開頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~
7 U$ d( R1 J+ w4 @$ ^0 V$ D+ b- A* v( p- y
2
- m9 M( `' q9 R5 A, s# X( rAI幻覺有哪些特點(diǎn)
- }% ^0 I) v0 z2 c& b% B. @1 T$ [8 y: K6 N+ Q
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對(duì)”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時(shí)會(huì)產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。
    * f' g, A9 }8 L2 M. T2 W, r
    3
    9 Q2 p5 e$ C1 M4 x9 ~AI幻覺的“幕后黑手”; r! E- F7 F  H( y3 [( z
    : W  D8 y+ ]3 W/ O) E) ?* ^
    AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”* w' T( l# a2 |; V1 j8 ~, c$ U

    " y; e3 D5 s; y# C+ @
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見或過時(shí)信息。就像教小朋友學(xué)習(xí),課本是錯(cuò)的,考試自然無法答對(duì)。
  • 缺乏實(shí)時(shí)更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時(shí)獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~5 _9 x  T+ W% Y

    % ~! h1 g* m4 U$ Z# J" D

    * @/ x8 y& @" r2 `, h' A訓(xùn)練過程的“小插曲”  R* N% n/ c; D5 N6 _  n" s
    % \% D$ @  @$ X& H1 D! l  V; C

    , m! Z/ E- B9 O  t" Q
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式,卻不會(huì)靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn),或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。
    ! V* Z. b' U7 C9 y6 K: i- a6 I

    + W6 ?7 Y3 d% Z模型本身的“小缺陷”
    " Z! l5 ~1 _( n; y( `9 \( {
    . Y1 Q' x, Y0 n" Q4 S + \6 ?3 B8 K+ h" D5 {5 z
    模型結(jié)構(gòu)限制:AI通過統(tǒng)計(jì)模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”! \* ^) P+ E: V- e) O
    4/ P+ W* O3 M9 @3 [, s0 q
    1 u: j% Z( c1 m7 t2 ?8 @& [8 H& w  _
    如何避免AI幻覺?' J+ ~0 W+ j% a! p- H% I
    5 E/ P3 `; g- a. U6 _5 `$ R
    避免AI幻覺有以下幾個(gè)“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。" K) |4 V, _$ [& n! o* Z& w8 Y3 D
    A. 檢索增強(qiáng)生成(RAG)技術(shù)  G2 j3 q* k# }4 o) y

    # k/ |7 q( ^' S( p2 n* S' x; ]: gRAG技術(shù)通過引入外部知識(shí)來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
    * t( W' L8 h3 s7 k) g3 `生成前檢索:在內(nèi)容生成前,系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息,為生成過程打下堅(jiān)實(shí)的基礎(chǔ)。
    / w6 \1 r$ Q7 J" t1 e. |) O! Y生成過程中檢索:在生成過程中,系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí),確保內(nèi)容的時(shí)效性和深度。5 u. C2 T% f; a2 [3 T
    生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對(duì)比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。
    ' q" Z) Z5 t3 u  A8 D

    4 Z( l/ C# b$ ?9 B4 h8 x" F例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時(shí),RAG系統(tǒng)會(huì)先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。
    $ `7 h: D' D& ~/ j1 V% V  Z- Y& h: ]5 H, c0 n  T5 a) @+ ~
    B. 基于反饋和推理的自我改進(jìn)機(jī)制
    ! l1 N; }% U! d4 Z2 w( X4 G這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。( B* m8 h, A5 l+ |% Y
    . D* J8 m) x$ h

    , X# u% h: A4 OAI在生成答案后,會(huì)進(jìn)行自我審視,提出疑問:“這個(gè)答案是否全面?是否有關(guān)鍵信息被忽略?”& n1 c: }3 u6 i1 m) W* T  ~
    C. 提示詞的精細(xì)化調(diào)優(yōu)
    2 n: p3 A: T9 O; {: {通過精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    $ u3 Y$ P/ Y' C& M; P
    - D1 }- S! F6 Y- ^ ; L. T; |- Q' ]3 A; Y  I& x
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時(shí)推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    * ?4 R' i6 t  q8 c這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對(duì)性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。5 @: W- @( Q! M. a0 C4 K
    3 x2 I: A% _5 f; ^% g
    3 r! a- a% W* a: M. `4 G; z4 E* x
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。
    1 R- C% r, w, o, C; g; C5 O
    + x, O$ L0 t" @5 {9 E# L) kA. 創(chuàng)新解碼技術(shù)
    ( r4 N' y6 ]! {/ X) `6 y采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。" i. G( D4 i4 r: p- `
    / Q1 K+ i- j* `) F! Z; [# A
    這種方法通過在解碼過程中引入上下文信息,鼓勵(lì)模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。: ]( F- I/ D8 w8 O; D. d

    5 X/ j  W% z2 N例子:在翻譯一部科幻小說時(shí),傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    ' [# p. a$ F+ P8 w* D
    0 `) N' Z3 i5 ~. t: y

    : x/ s$ x- ]$ l# D9 C9 Y) JB. 知識(shí)圖譜的應(yīng)用, ?8 k3 ~, H/ \: Z, z* B
    通過知識(shí)圖譜,我們能夠豐富AI的知識(shí)庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    " I: A! o8 c& S6 I & v" d! Y0 X1 b) I3 c
    想象一下,知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體,比如人、地點(diǎn)、事物或者概念。
    " I* ~  I. R0 o3 v7 r+ s! v7 R) c; o
    它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過這種方式組織信息,就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    * ]$ B7 S* W$ h5 f- g+ G1 H% R& q9 o) z1 X- x2 y  R# p+ K9 m
    舉個(gè)例子,如果你在知識(shí)圖譜中查找“蘋果”,它不僅會(huì)告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會(huì)告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。
    : ^- n  W+ Q* J* ~# Q1 w* |/ T' s6 S9 d! b9 ?

    # @' ]% c7 i$ c0 |C. 基于忠實(shí)度的損失函數(shù)& L& i1 m% {% u: t
    引入新的損失函數(shù),對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。! N% K5 G0 J1 U/ v& m3 F: j

    - h! o3 I9 u3 V, g! r 0 t' m& g8 X3 u9 r
    舉個(gè)例子,AI在生成文章摘要時(shí),如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會(huì)提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。7 K/ m7 y% r" K3 U8 y  q( Q# Q

    5 a8 k$ p0 [" l7 l3 B) M: S2 }1 M1 n

    * D7 L0 H1 i, T/ w1 q' h! @D. 監(jiān)督微調(diào)& I1 W. q/ y$ W+ \5 Y3 |/ b1 h
    通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。+ W, s3 c+ q6 B! R9 @' Y' M

    ; [! e3 s: h$ }4 o: P( Q + Z, o' C4 p" _
    舉個(gè)例子,一個(gè)通用的語言模型可能對(duì)通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。9 _3 F2 E7 |) ~# D
    比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
    ' D! `. B- T* b" Y
    , B9 M$ D3 z7 L4 K; p2 ~三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。
    # P6 ~+ I( e. u. J' z& P! NA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。
    1 ~5 Q# ^2 V: {, b0 O9 APAL技術(shù)像是一個(gè)“自動(dòng)化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。; {4 q8 A* k! Y! P' O' J2 V* T1 S

    , B/ W/ h$ N8 i舉個(gè)例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水。”系統(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒,每天按時(shí)提醒你,而不需要進(jìn)一步的交互。& P& Y/ L2 n2 a& z1 y
    1 G; j3 X" g5 P2 z
      n7 G! G% x" C) G' o8 k2 X
    B. ReAct(Reasoning and Acting,推理與行動(dòng)):: d! Q* n. i% Y
    ReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解,以及基于這種理解進(jìn)行的推理和決策。
    & r! _1 P# A& g+ b6 y4 a1 i( t+ H/ T
    ReAct技術(shù)更像是一個(gè)“智能助手”,它不僅理解用戶的請(qǐng)求,還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。8 t1 ~( C: }; u% l" [

    : n/ d/ p& K+ F舉個(gè)例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個(gè)會(huì)議,需要準(zhǔn)備一份報(bào)告!盧eAct系統(tǒng)會(huì)理解你的請(qǐng)求,然后推理出你需要的信息類型,可能會(huì)詢問你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報(bào)告。: W9 E  L& w* i* I

    . T! ~/ R4 [0 X! d7 j+ F
    5 B6 R( g; f9 x* g( l5 Q8 E0 Z! D3 G7 l- m# N
    END9 w' u2 {2 y* p  |( M
    文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
    2 U6 r2 y0 T+ c3 e
    $ B: r) H4 m, W3 ~' q所以下次當(dāng)你的AI應(yīng)用開始“夢(mèng)話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
    4 A2 W: \6 y0 l& Z; ?& X& D其實(shí),AI也是在學(xué)習(xí)中成長的“小朋友”,它們?cè)谂Τ砷L,可能偶爾也會(huì)開個(gè)小差,做個(gè)“白日夢(mèng)”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢(mèng)游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)! d3 K: b( j" J( i2 C: _, g0 c
    3 P' U5 H( C: \0 X1 T: g
    ~~~! q+ A# i3 T6 X# |( I

    3 O4 C4 E" Q; p! s% e) }0 Y7 p小問答4 k" k  [' O% e- g! `6 L$ F
    請(qǐng)問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    ' c" R' D: k+ S& L1 K+ ]8 n4 d9 y3 H% `8 [
    ?還有沒有什么典型的AI幻覺的例子?評(píng)論區(qū)跟大家分享一下吧~
    & \  J3 d. ?+ r, W/ y$ Y
    $ H0 c$ {' q& p2 q6 Z& U* z7 Y( o
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表