電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 28|回復(fù): 0
收起左側(cè)

ChatGPT為什么會(huì)“胡說(shuō)八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級(jí)會(huì)員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
AI幻覺(jué),簡(jiǎn)單來(lái)說(shuō),是指人工智能系統(tǒng)(自然語(yǔ)言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說(shuō)“夢(mèng)話”一樣~# J5 u! n9 r* \" W1 [+ p* ?
% K! u2 i" d' {' i! e- U

$ T2 Z: l5 y3 P, U! M那么AI幻覺(jué)有哪些?是什么原因產(chǎn)生的?我們?cè)撊绾伪苊釧I幻覺(jué)呢?
( @" ?) a) N+ \ ' ~9 x+ W" ]9 l
1
& R' S4 c3 O+ a6 ]" kAI會(huì)產(chǎn)生什么樣的幻覺(jué)?
1 Y0 p6 ^6 u. _, r, ?  I) _& \4 h# o  R, L3 _" g8 U
可能有的小伙伴說(shuō):“我知道了!AI‘胡說(shuō)八道’就是AI幻覺(jué)唄?”其實(shí)也沒(méi)這么簡(jiǎn)單,AI幻覺(jué)主要有兩類。
- L- C3 `5 j% i' M7 h事實(shí)幻覺(jué):“假新聞制造機(jī)”
1 [1 Q* d" ~9 A% r" C/ c* d8 UA:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾0 }% Z( O7 r: z) Y# C/ L: o
, v* i' n, U& `2 B' I9 B6 S
當(dāng)被問(wèn)及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個(gè)事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。
" ?6 L( Q7 z2 p% G) gB:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
, M) ^5 Y9 g3 R$ G2 k% c8 r# x

# X* P+ M# D4 A% l $ Z* B  [6 \( m/ t3 H7 K8 {
如果AI描述說(shuō)“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒(méi)有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說(shuō)藏有古代法老的寶藏或未知的高科技裝置了。
& i/ y! ]( `( D( S$ ~忠誠(chéng)度幻覺(jué):“指令迷失”
" @' B2 \# x0 H2 e- hA:指令不一致:AI的回答偏離用戶的要求
. _$ X& d* P, S. A8 G# n( @
1 d1 E+ r0 H0 v; U
- y! r6 t  ^6 W1 A2 Y, x
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問(wèn)題。
' S( D+ x( C: N4 Z! V3 C- YB:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
( B; L" U3 D9 _" n ) c7 T; j5 P5 s
假設(shè)在一個(gè)討論中國(guó)傳統(tǒng)節(jié)日的上下文中,用戶問(wèn):“春節(jié)是什么時(shí)候?”AI回答:“春節(jié)是中國(guó)農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個(gè)回答是正確的,符合春節(jié)的基本情況。) w! Q- k7 V8 ]" U
然而,如果AI接著說(shuō):“春節(jié)是紀(jì)念屈原的節(jié)日,人們會(huì)吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。
9 A2 D( J+ W- G4 u. XC. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
% j/ r8 ~2 j2 Y; r, ]% d, J開(kāi)頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~4 \! u$ V+ e/ o

  P( M! i7 g* J) T22 b7 y# H7 D0 \1 Y8 D. h0 I
AI幻覺(jué)有哪些特點(diǎn)" R: j" ^. T/ Q6 P* M1 {2 ~' u( }9 }) H

# b, e7 D$ k& X* t8 d1 t
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來(lái)可信,給人以“這看起來(lái)很對(duì)”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺(jué)內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測(cè)性 :很難預(yù)測(cè)AI何時(shí)會(huì)產(chǎn)生幻覺(jué),可能幻覺(jué)也很難復(fù)現(xiàn),就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。4 E* v' m$ Y" Y6 {$ N- Y
    3
    3 g7 M' V7 B2 t- W) NAI幻覺(jué)的“幕后黑手”/ O0 j$ W- ?" J6 O) l9 h
    4 P: z: U5 p. a8 Y6 Z: o
    AI幻覺(jué)主要來(lái)自以下方面:數(shù)據(jù)里的“坑”% s+ ~; k3 R) k: L: K- \$ `' o( W7 Z

    , k. V6 t1 ?5 B* @, m4 c
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見(jiàn)或過(guò)時(shí)信息。就像教小朋友學(xué)習(xí),課本是錯(cuò)的,考試自然無(wú)法答對(duì)。
  • 缺乏實(shí)時(shí)更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無(wú)法及時(shí)獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
    4 H; C1 l4 O+ M5 v7 J5 h3 c
    1 a( O( r4 \! H' y+ M- w9 s+ I
    3 I/ @# g7 @6 \- ^. C4 K* ~" l5 N
    訓(xùn)練過(guò)程的“小插曲”3 `, _7 [$ h+ _3 ~' k, j5 H

    ( l+ V: }4 u, d) K( G& n1 l , ]+ L1 ^( ]& ]2 q% e
  • 過(guò)度泛化 :模型可能過(guò)于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式,卻不會(huì)靈活變通。
  • 上下文理解不足:AI可能無(wú)法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn),或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。
    $ D5 Z, o& U/ `) Q' d, ~
    ' s! O# R5 E9 _, p
    模型本身的“小缺陷”
      k. S! Q. t" w# x* [7 J# E; v+ z+ R* ~0 I
    / ?9 t5 `; e/ ]* ]0 ?& L, C1 Q
    模型結(jié)構(gòu)限制:AI通過(guò)統(tǒng)計(jì)模式預(yù)測(cè),但可能無(wú)法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過(guò)是基于復(fù)雜算法的數(shù)學(xué)而已~”; h6 r: l2 G5 `
    4+ D1 G: i* ]# |+ ?) Z' u$ h
    7 y, y7 B, N$ p3 }
    如何避免AI幻覺(jué)?' s) i, P4 d5 g  `  S# q2 `' R- J
    * K% |4 b. y5 n% A5 \' j1 W
    避免AI幻覺(jué)有以下幾個(gè)“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過(guò)優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。, P# b& Q6 N) A. Y8 {
    A. 檢索增強(qiáng)生成(RAG)技術(shù)6 U) E4 v( z; k: ]9 d0 `: F4 X3 a
    ( H6 H" e/ N7 f
    RAG技術(shù)通過(guò)引入外部知識(shí)來(lái)幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:  B* T* ?4 B) s8 J1 `
    生成前檢索:在內(nèi)容生成前,系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息,為生成過(guò)程打下堅(jiān)實(shí)的基礎(chǔ)。
    + d- s  _8 D" `% l8 {生成過(guò)程中檢索:在生成過(guò)程中,系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí),確保內(nèi)容的時(shí)效性和深度。
    , O; d# r3 T" s& i, e( ^生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對(duì)比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。
    & A1 u/ ^. E1 o- F9 U  g
    # K) z% s5 h- |% ?
    例如,當(dāng)AI被問(wèn)到“2024年登月的宇航員有哪些?“時(shí),RAG系統(tǒng)會(huì)先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。# K5 }* q) s& `: x+ I

    7 M5 f5 J" N* @- iB. 基于反饋和推理的自我改進(jìn)機(jī)制
    , w. K4 {/ V* d1 b: e2 ?這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。+ n# m$ L8 h4 W: ]( T% G, P
    & _8 X: ]: S6 ]6 S. G

    $ }! k) L* L. \. K" e2 Y1 v" uAI在生成答案后,會(huì)進(jìn)行自我審視,提出疑問(wèn):“這個(gè)答案是否全面?是否有關(guān)鍵信息被忽略?”
    # |3 V: t2 u# x* K7 t3 xC. 提示詞的精細(xì)化調(diào)優(yōu)
    : X8 g" g- G" P# t7 ]8 p4 R- l通過(guò)精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。% d7 H+ }" j) k6 E' v8 G0 _

    0 s1 n$ a( S6 V, Y# U
    + n- _4 T8 k2 B. X例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時(shí)推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。& `0 C* P9 s% W3 j& W
    這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對(duì)性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
    9 o1 k2 n% V. g' ~2 ~
    # T4 S9 R( P2 \& {5 F6 E' q9 C6 n8 c% E/ t* \1 T
    二. 模型開(kāi)發(fā)不能停AI模型與訓(xùn)練過(guò)程的不斷進(jìn)化是減少幻覺(jué)產(chǎn)生的關(guān)鍵。
    # I) b+ l# ?% E2 f% G: u) \
    ) {+ c) R. Z5 LA. 創(chuàng)新解碼技術(shù)
    . I. Y  g5 A) I4 ?采用新的解碼策略,以便更精準(zhǔn)地處理語(yǔ)言上下文,例如上下文感知解碼(CAD)。" r0 Y! c7 t9 Y# I5 w# Y) s' V7 r
    # K& ?/ M/ Z3 [# p. z6 y8 f& b5 P
    這種方法通過(guò)在解碼過(guò)程中引入上下文信息,鼓勵(lì)模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。
    * o. f4 w; K/ _3 \/ B" J' O" @) O
    ; d2 |1 i5 r9 L0 L- d  o2 d例子:在翻譯一部科幻小說(shuō)時(shí),傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    - b/ C5 R9 I: ?/ E; }7 I
    9 s2 E$ z6 v+ d1 ?- G
    # ?5 h# k" \1 A7 R" ]+ {) A
    B. 知識(shí)圖譜的應(yīng)用9 M7 ^. G9 d6 h: n- _' W, w
    通過(guò)知識(shí)圖譜,我們能夠豐富AI的知識(shí)庫(kù),讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    6 m8 z9 ~9 ?+ N9 o
    2 V6 h  o1 j+ y4 e; \. i  a% \想象一下,知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體,比如人、地點(diǎn)、事物或者概念。
    5 M4 H& w* ]' S( Z0 X2 b- B% U: ^8 ^$ D9 p: ?, B* J) A" o1 T
    它們通過(guò)各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過(guò)這種方式組織信息,就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    ; l5 X: T  N, c$ J9 [+ Z4 B$ |( `3 u2 G* w( [) S+ _
    舉個(gè)例子,如果你在知識(shí)圖譜中查找“蘋果”,它不僅會(huì)告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會(huì)告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬(wàn)有引力。4 z& D5 c5 G- }3 L8 q1 C
    ! J- H) a# m: e- b. Z+ z
    ! p# n4 }; D: l
    C. 基于忠實(shí)度的損失函數(shù)3 x' a- B6 c* s* v: l, B2 p; l6 |# ^1 ?
    引入新的損失函數(shù),對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺(jué)中“掐醒”。
    ' H1 w! Z0 P; z$ ]' m4 n; P+ t* D6 m% Z: `7 J
    % ^# y5 {  a& O* z% x
    舉個(gè)例子,AI在生成文章摘要時(shí),如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會(huì)提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。4 n9 A& a4 e' o9 \% t) n4 O5 ?3 l

    , x7 Y" m: r! `+ n6 g* P

    % w3 K' Q; ^9 R6 P2 V, y2 KD. 監(jiān)督微調(diào)
    % z- Z+ T% y) w7 Z) m" H通過(guò)特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。- F' `: R; H3 Z; L8 K2 w

    ; T% c0 r' p! K  Z3 h+ p) C$ }1 }5 W
    ) s6 v) J, a8 K( v舉個(gè)例子,一個(gè)通用的語(yǔ)言模型可能對(duì)通信術(shù)語(yǔ)理解有限。通過(guò)使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    / H& x6 G9 ?* x. P比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語(yǔ)的區(qū)別,如EBGP和IBGP。
    0 s2 l7 g7 k% o4 s5 G7 x2 M6 i' P2 f4 \7 X
    三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過(guò)這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。
    $ A& Z2 K" U8 sA. PAL(Program-Aided Language Models,程序輔助語(yǔ)言模型):PAL技術(shù)通過(guò)將程序化邏輯嵌入到語(yǔ)言模型中,使得AI能夠執(zhí)行特定的程序或算法來(lái)完成任務(wù)。
    3 M# i# E8 F  R7 i: O! v, z: u) fPAL技術(shù)像是一個(gè)“自動(dòng)化工具”,它通過(guò)內(nèi)置的程序邏輯來(lái)指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。
    1 B( s0 O. X' o: ]  H! P8 S % L. I) ~' j' r9 s9 G& M9 l1 g
    舉個(gè)例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水!毕到y(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒,每天按時(shí)提醒你,而不需要進(jìn)一步的交互。# C( P  X; X5 ~% o% m
    - R* v% m+ ^) R
    - x7 t+ g+ _( }6 c
    B. ReAct(Reasoning and Acting,推理與行動(dòng)):: `; G' ~. m- t9 ~
    ReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解,以及基于這種理解進(jìn)行的推理和決策。
    # g9 V: m& X: h  L$ J$ n7 l/ r3 G* l$ v6 o" i! [0 Y
    ReAct技術(shù)更像是一個(gè)“智能助手”,它不僅理解用戶的請(qǐng)求,還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些需要靈活推理和決策的任務(wù)。  L/ [0 F2 |" w" n# I( I

    ( @$ j' i; q8 ^9 H. G5 ]2 k: l舉個(gè)例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個(gè)會(huì)議,需要準(zhǔn)備一份報(bào)告!盧eAct系統(tǒng)會(huì)理解你的請(qǐng)求,然后推理出你需要的信息類型,可能會(huì)詢問(wèn)你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來(lái)幫助你準(zhǔn)備報(bào)告。
    + ~) ^3 c. c8 J' Y7 r& N, X& \; ?8 _/ R7 p) M' u1 F) }

    ' J" D2 h" i* `1 n* s( N5 U  U/ N. E- |7 Y8 J8 c8 O/ Y4 j
    END
    ( N7 W% c$ |$ m' l文檔君的AI幻覺(jué)就介紹到這啦!是不是秒懂了“AI幻覺(jué)”?
    + v+ Z; S9 Y( U# c% ^' r# s1 l% t: Y# H  r
    所以下次當(dāng)你的AI應(yīng)用開(kāi)始“夢(mèng)話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。0 c0 K6 A6 ^; W+ }2 B* v
    其實(shí),AI也是在學(xué)習(xí)中成長(zhǎng)的“小朋友”,它們?cè)谂Τ砷L(zhǎng),可能偶爾也會(huì)開(kāi)個(gè)小差,做個(gè)“白日夢(mèng)”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢(mèng)游”中醒來(lái),為我們提供準(zhǔn)確、可靠的服務(wù)2 f; f8 O' D+ k7 [
    9 ^: f7 {5 X. n/ d- j
    ~~~
    . f( q; m% [1 i# U! v
    + c) I. h: K( }  x1 ]+ S5 d小問(wèn)答
    ! u6 g! `9 O8 `! T請(qǐng)問(wèn)“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺(jué)呢3 |! T! ?+ R, f8 ^1 @7 V$ J

    ; e3 T% x) ?4 s9 ]2 }9 N- K1 `?還有沒(méi)有什么典型的AI幻覺(jué)的例子?評(píng)論區(qū)跟大家分享一下吧~
    4 [  }! d& s: \( e7 c: N4 w+ X% L# x8 g
    * ]: F5 F& \! I5 }% i; O6 O
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長(zhǎng)推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表