電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 26|回復(fù): 0
收起左側(cè)

ChatGPT為什么會(huì)“胡說八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級(jí)會(huì)員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢(mèng)話”一樣~) F+ c, z. ]' e* |0 n
. n0 N7 h" Z* {  b9 }" `
8 k6 ]2 c# K: M) ?+ c
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們?cè)撊绾伪苊釧I幻覺呢?6 ?! M+ \4 J5 q& A

- c, y2 D! n9 ]8 w+ p9 I' K* p1
6 E5 Z* [9 p4 V* b* E' H* m5 sAI會(huì)產(chǎn)生什么樣的幻覺?! A2 l8 w7 z0 D# k/ t0 }
, r" s& y  D5 u2 f
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實(shí)也沒這么簡單,AI幻覺主要有兩類。1 B& a$ u9 y) u/ A/ n
事實(shí)幻覺:“假新聞制造機(jī)”/ E/ ^7 ?! d* g+ X
A:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾# I; n9 d/ L4 O7 e1 v* T
$ V: v/ l# Y# r) s- C- p
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個(gè)事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。
% q/ J+ ]7 ?. _B:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容! H# g9 {* C8 K/ O

5 m/ }' J: N# I$ k( `2 ~ " |9 a/ t/ ^* `8 b" I' E
如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置。”這就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。* j) [5 Q- n  O4 U: r& x; S) Y4 W
忠誠度幻覺:“指令迷失”6 j& J4 C; k3 x& n
A:指令不一致:AI的回答偏離用戶的要求6 j/ `) b* n- q% D+ b
. m8 o1 e+ Q4 e9 Y  r. F* M) J# t

% H+ ]" F5 T8 b  e, G  D" [如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。
/ t8 c" N: R( L4 X/ d4 c6 {  zB:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符& W- \8 p! _8 B9 J# O$ C/ a

4 z9 x' H+ i' H4 H假設(shè)在一個(gè)討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時(shí)候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個(gè)回答是正確的,符合春節(jié)的基本情況。7 |( N# U% C% Y" M& h
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會(huì)吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。
8 r9 t* P' T8 j' ]0 T! @& L; RC. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
1 Z: U; u  F9 C" N7 p* E/ n開頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~
% i$ k: s) R3 }' l- N  D. \7 g1 Y. \1 p  f2 ^/ r# R+ c6 b% H
2. u8 a( C# J, j% b9 y
AI幻覺有哪些特點(diǎn)6 h0 [/ V3 \8 @: g) g& a" |" i
# m9 ?6 D) W* o1 z# O, B- H( B
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對(duì)”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時(shí)會(huì)產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。
    : r2 z) {; U0 _! V; N* |/ |) P- G
    3
    0 M( y; M' e7 }8 O' }AI幻覺的“幕后黑手”
    0 N, g# C- M- r/ L. z( _  T* ?& C6 p5 l/ @6 m$ I& B
    AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
    + @- o5 i  U4 n2 A; ?4 D1 b 7 |1 R  q3 y. V' J/ T2 a
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見或過時(shí)信息。就像教小朋友學(xué)習(xí),課本是錯(cuò)的,考試自然無法答對(duì)。
  • 缺乏實(shí)時(shí)更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時(shí)獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~3 u. j( t* ]; Y/ j

    : I/ s2 c" @6 Q& z- F) N
    + [" N4 b! K4 b# Z' O5 y; S6 h
    訓(xùn)練過程的“小插曲”: v  c8 f* G; _$ x- {1 [( _
    , o/ ?+ g3 m3 R" g0 i

    4 }+ h6 L- p$ ]7 \! \# N, O
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式,卻不會(huì)靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn),或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。
    + ?1 J7 V9 W  d. I2 b- \8 s
    9 p& R( r+ W6 I8 I) c
    模型本身的“小缺陷”9 o& Y' ]7 b: r* V
    1 \5 |; c1 y3 a# W6 T  q
      m$ H3 F: Y4 d& X
    模型結(jié)構(gòu)限制:AI通過統(tǒng)計(jì)模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”
    . k/ F" z0 `0 L9 \5 X45 i$ o1 x1 }/ N+ G. i' ~6 E
    5 X4 B7 M' ?. K: T( A
    如何避免AI幻覺?6 R0 J+ _% r/ w8 P

    - Z8 w; q& Z2 b' r避免AI幻覺有以下幾個(gè)“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。
    $ q& S. ~5 H7 N) D. t2 `A. 檢索增強(qiáng)生成(RAG)技術(shù)0 H% N: U+ \7 w

    / {" N7 `+ x' X' I0 W& uRAG技術(shù)通過引入外部知識(shí)來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:2 ?1 L$ @/ g9 G- m
    生成前檢索:在內(nèi)容生成前,系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息,為生成過程打下堅(jiān)實(shí)的基礎(chǔ)。
    ' @  ?5 H3 g7 R生成過程中檢索:在生成過程中,系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí),確保內(nèi)容的時(shí)效性和深度。& B: h- v) m" C  D2 r3 g: I6 R! w: d
    生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對(duì)比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。
    ; e3 u4 m- P' b/ P2 t' t9 }8 \% O/ c

    . R; @# t( N9 A: a$ n5 f  a例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時(shí),RAG系統(tǒng)會(huì)先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。* Y& S( f; o1 b  l, z

    0 @, q0 ~* u- a/ d/ Q9 y5 K- j( PB. 基于反饋和推理的自我改進(jìn)機(jī)制! _4 m/ l( L4 U+ ~, Q; S' }) w2 _
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。& v2 _5 U. B( \% z, [% K5 }# H

    . G* ?3 M. r# u5 \0 v" g& e/ @* O+ T
    * ^" ?! N# O$ J# \5 `AI在生成答案后,會(huì)進(jìn)行自我審視,提出疑問:“這個(gè)答案是否全面?是否有關(guān)鍵信息被忽略?”
    8 Z; k- y# N, ]0 N$ p; X- T2 QC. 提示詞的精細(xì)化調(diào)優(yōu)3 s# c" N2 \  V2 @
    通過精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    3 z* l: y9 E2 j* J9 X2 O& w3 u9 X
    4 r: M: {3 B: |, C* K   {$ d" u7 ^7 y, z- P  t" ?
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時(shí)推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    $ }2 m8 e1 j% t% T( d/ a這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對(duì)性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。5 H( j# A0 J8 v& w8 f: n: ?; O

    ! x6 s  p# k: P6 `# s5 L. P1 z6 e. T! n* F7 Q
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。
    5 j4 B  m3 Z* P: K# ~- C; s  z+ q
    / `, [8 c- ~3 Y# zA. 創(chuàng)新解碼技術(shù)
    ; y: O  D& C' Q3 T5 `采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。, H5 j: V3 `( k' ]& j: C: ?. ^
    3 V5 M( c0 k: L+ K4 B
    這種方法通過在解碼過程中引入上下文信息,鼓勵(lì)模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。
    ' _5 L6 e8 m' h* g6 ?2 R
    + R- g+ ~' f$ E& N) b. E1 x: @1 v" s例子:在翻譯一部科幻小說時(shí),傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    / x( n8 \' i, C( p# n- }" o: `0 V8 L( T: X0 W

    8 j: q! s+ L0 i% F$ @* fB. 知識(shí)圖譜的應(yīng)用
    6 b+ k' l$ {) Y0 ?, \3 o4 o通過知識(shí)圖譜,我們能夠豐富AI的知識(shí)庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    6 G9 l7 M  o8 H4 H8 ~" w6 F# G # j2 N6 z4 {! f* a' y0 l, |+ x
    想象一下,知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體,比如人、地點(diǎn)、事物或者概念。( R( |3 g1 Q2 r; j% h0 H9 M

    : c4 {7 x5 r3 M) p$ C/ E它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過這種方式組織信息,就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    6 r! N- d) k, u6 b$ ~: T8 Y5 d" b/ K/ z
    舉個(gè)例子,如果你在知識(shí)圖譜中查找“蘋果”,它不僅會(huì)告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會(huì)告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。
    1 g" J- w- A! S1 v9 V
    0 C& b" A! ~; A# k
    $ X/ [* [5 t3 Z: i8 ?
    C. 基于忠實(shí)度的損失函數(shù)
    1 l1 _& g  C( q2 t! j5 S引入新的損失函數(shù),對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。% D" k4 {' c1 w8 w
    4 s1 j8 r$ f: o1 a/ o

    3 v$ h+ ^  Z. r, e舉個(gè)例子,AI在生成文章摘要時(shí),如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會(huì)提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
    2 o$ d- [0 c8 i" x- P* z
    ' P. B  E6 Y- C" Z$ _8 Q2 k

    : B4 m7 z# D; }  l! [+ aD. 監(jiān)督微調(diào)
    9 a+ s% P, s5 X. g3 y% a通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。
    # N* s+ z; u6 Y0 y/ q0 ?7 Y" U4 t. r, G' ^5 B
    6 G$ d# M) e: h' |. K
    舉個(gè)例子,一個(gè)通用的語言模型可能對(duì)通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    % O$ ?% k! N6 V% e2 \1 C+ G7 N比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。' c* J9 O9 Y' G: l5 m

    : s8 i- t' ~5 t4 S( {& G! x三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。
    & ]) [  ~6 Z6 U6 Q* {* @A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。9 J  M0 n6 R+ y. n& S7 ^# C- c
    PAL技術(shù)像是一個(gè)“自動(dòng)化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。
    + ?' W- }2 j4 \  Z- O " h6 Q% s! m9 q' I" Y
    舉個(gè)例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水!毕到y(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒,每天按時(shí)提醒你,而不需要進(jìn)一步的交互。/ |7 }8 V4 y: a

    : @0 Z8 N* u1 f  D9 O2 |0 @! e 0 E7 F5 m: s& F! z
    B. ReAct(Reasoning and Acting,推理與行動(dòng)):
    3 Z0 b- c1 n$ L- ~: LReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解,以及基于這種理解進(jìn)行的推理和決策。
    3 a1 T- b# v, f! O" Q, e7 I
    ' E" d5 G7 X. G6 l& i7 AReAct技術(shù)更像是一個(gè)“智能助手”,它不僅理解用戶的請(qǐng)求,還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些需要靈活推理和決策的任務(wù)。
    $ I0 v. q0 B& |: O8 i+ Y
    * g+ x' p" t) i  J& F7 W1 K5 V2 o舉個(gè)例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個(gè)會(huì)議,需要準(zhǔn)備一份報(bào)告!盧eAct系統(tǒng)會(huì)理解你的請(qǐng)求,然后推理出你需要的信息類型,可能會(huì)詢問你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報(bào)告。# c# W; o& |5 U5 G
    ! o3 t+ y( o" Y8 O1 I
    9 l5 N5 }# p, Y6 w, B1 }5 d# U

    : ?- u# D' j/ B/ w3 _END8 B" \; x. x4 S$ \7 y7 s- S$ Y
    文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
    . i  K; c' h  b, H
    ) m( q/ R+ ~5 ^  U% Y所以下次當(dāng)你的AI應(yīng)用開始“夢(mèng)話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
    5 S. y3 z$ m% B' [其實(shí),AI也是在學(xué)習(xí)中成長的“小朋友”,它們?cè)谂Τ砷L,可能偶爾也會(huì)開個(gè)小差,做個(gè)“白日夢(mèng)”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢(mèng)游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)& M% D" f- q$ V
    % W, c1 m: `# o% w
    ~~~" C  ?7 T0 r" J- x! S4 N

    " b& F; a; K7 }9 K6 ^小問答6 b3 a+ S. a8 o& V$ X; n" ]
    請(qǐng)問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    % N/ [+ P0 g; a% s( @. Z1 R9 F5 P# L" l! D
    ?還有沒有什么典型的AI幻覺的例子?評(píng)論區(qū)跟大家分享一下吧~
    7 V# t) i$ E8 J. R3 T/ K6 a+ S& m. |" u8 g
    0 F' D$ h2 }$ \
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表