電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 65|回復(fù): 0
收起左側(cè)

ChatGPT為什么會(huì)“胡說(shuō)八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級(jí)會(huì)員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |正序?yàn)g覽 |閱讀模式
AI幻覺,簡(jiǎn)單來(lái)說(shuō),是指人工智能系統(tǒng)(自然語(yǔ)言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說(shuō)“夢(mèng)話”一樣~: w. ]! _9 \) R# o4 p' s
. x$ @+ e% G2 o- ?( H, P! h
+ N. r7 P0 ?5 E& U
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們?cè)撊绾伪苊釧I幻覺呢?
: e5 _; ^- B- f0 M& J% n. l 1 L4 _8 c. ~7 Y
13 A3 W4 w0 L% b. f
AI會(huì)產(chǎn)生什么樣的幻覺?6 `7 P9 p* T- l) q

0 U; u/ Z4 @5 S% u- |可能有的小伙伴說(shuō):“我知道了!AI‘胡說(shuō)八道’就是AI幻覺唄?”其實(shí)也沒(méi)這么簡(jiǎn)單,AI幻覺主要有兩類。* d. G4 n( Z! G% H8 |
事實(shí)幻覺:“假新聞制造機(jī)”, o/ ?9 ^! @5 D2 ?6 Y) [* Q! a
A:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾0 @7 _7 o, g, Y3 G  }7 Z

5 }/ K. w3 B$ F0 e# X當(dāng)被問(wèn)及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個(gè)事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。/ j7 z) d/ {% B0 o2 A! [
B:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容7 M5 J. I6 m5 [( s3 W# P' ], S

3 E5 V) F& f$ h/ q $ m1 O2 |3 i0 E$ P, d- ?
如果AI描述說(shuō)“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置。”這就是完全虛構(gòu)的信息,截至目前沒(méi)有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說(shuō)藏有古代法老的寶藏或未知的高科技裝置了。
$ h; z8 E. `0 }4 `# M4 q% S忠誠(chéng)度幻覺:“指令迷失”
: A* k& G' V8 d, {( E1 o# mA:指令不一致:AI的回答偏離用戶的要求( h6 E* e9 e0 N+ @6 V8 D0 D
8 a# \  N& g7 |* J' V+ ^9 z

9 `* x; A7 e! S% O2 t( `/ J# j如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問(wèn)題。" n' s6 W0 m  |& }  f5 s
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符; u* N1 N6 d. X0 V5 ?
; P/ V0 ^9 F; _* A/ t2 L! `
假設(shè)在一個(gè)討論中國(guó)傳統(tǒng)節(jié)日的上下文中,用戶問(wèn):“春節(jié)是什么時(shí)候?”AI回答:“春節(jié)是中國(guó)農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個(gè)回答是正確的,符合春節(jié)的基本情況。
8 {7 I9 I1 W+ u然而,如果AI接著說(shuō):“春節(jié)是紀(jì)念屈原的節(jié)日,人們會(huì)吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。
- d4 E/ R/ U8 |( |C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
" I. e, q9 W; I- T' R開頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~: o' Z5 T$ [" ~
- c; Z/ l# Z, \9 W
2' Z. u; }- |3 M, q* I3 M/ U1 T
AI幻覺有哪些特點(diǎn)
/ G# y5 K: M: ]8 B/ y/ }- g: i
/ P8 d# L- z8 b
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來(lái)可信,給人以“這看起來(lái)很對(duì)”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測(cè)性 :很難預(yù)測(cè)AI何時(shí)會(huì)產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。+ u$ A( i" y7 l; d& g
    3
    ' r) g# _. x5 F- w7 gAI幻覺的“幕后黑手”* u) d% Y' `$ ^
    , y4 r. p6 J% Z6 i- q
    AI幻覺主要來(lái)自以下方面:數(shù)據(jù)里的“坑”5 U0 ~+ M8 z& @" u
    ' ]* E: N5 ?' O: K
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見或過(guò)時(shí)信息。就像教小朋友學(xué)習(xí),課本是錯(cuò)的,考試自然無(wú)法答對(duì)。
  • 缺乏實(shí)時(shí)更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無(wú)法及時(shí)獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
    5 j8 M. |6 Z3 L. F! B % t. R) C; g9 G
    $ J4 G& E( z+ Q2 @
    訓(xùn)練過(guò)程的“小插曲”
    - i8 I) ]- Y: o5 g# i. M- s4 o" _. n0 N) h& u6 {

    , l$ b+ }' Q! W0 d, ~
  • 過(guò)度泛化 :模型可能過(guò)于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式,卻不會(huì)靈活變通。
  • 上下文理解不足:AI可能無(wú)法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn),或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。
    5 e. O3 d0 f" W1 \
    : T1 x. \1 u4 X& J
    模型本身的“小缺陷”
    ( K5 s) }1 R1 l/ I6 r, y/ J/ o* F/ J, P' J7 o% J9 z
    : w4 }8 \6 ~8 b. D3 O. g$ y+ W  G
    模型結(jié)構(gòu)限制:AI通過(guò)統(tǒng)計(jì)模式預(yù)測(cè),但可能無(wú)法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過(guò)是基于復(fù)雜算法的數(shù)學(xué)而已~”/ d. [" _, i* e
    4) q# u$ i: X4 @5 s) M) q: k

    3 H) q4 o' t, W5 r6 V9 C7 M0 o如何避免AI幻覺?
    7 S6 K$ i7 v( X$ W+ t3 [% {! j/ v& M4 e
    避免AI幻覺有以下幾個(gè)“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過(guò)優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。
    & ?" q* {* C+ D8 c/ h- AA. 檢索增強(qiáng)生成(RAG)技術(shù). j" F8 u. o; M* T/ O% \4 l+ }  V' E: o7 S

    : |: O: \5 f' A; i, c0 o9 n# uRAG技術(shù)通過(guò)引入外部知識(shí)來(lái)幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
    , I& |2 V" U: M3 z7 K2 r5 L生成前檢索:在內(nèi)容生成前,系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息,為生成過(guò)程打下堅(jiān)實(shí)的基礎(chǔ)。
    ( z3 v1 `. y9 ~: h生成過(guò)程中檢索:在生成過(guò)程中,系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí),確保內(nèi)容的時(shí)效性和深度。
    # @9 Q' S/ ?, F7 h7 c生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對(duì)比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。/ y$ L9 N5 e: A+ n( H# }

    $ V. H% e; [8 s& F- a7 I0 ^例如,當(dāng)AI被問(wèn)到“2024年登月的宇航員有哪些?“時(shí),RAG系統(tǒng)會(huì)先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。
    8 c& u- w2 p$ O' {7 V1 x
    - g* |! H2 G/ D( u6 {$ dB. 基于反饋和推理的自我改進(jìn)機(jī)制" K; d! @& p9 C1 Q) \  s
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。$ t9 W9 d: _3 |& V; O
    - p7 ^6 L& R* I

    9 e1 @$ r. [' O: X! _$ @8 HAI在生成答案后,會(huì)進(jìn)行自我審視,提出疑問(wèn):“這個(gè)答案是否全面?是否有關(guān)鍵信息被忽略?”
    ) ?8 e# a, p8 R3 uC. 提示詞的精細(xì)化調(diào)優(yōu)
      E5 n, K9 k( N2 U通過(guò)精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    ) m2 G8 F) _) q4 C; J+ ]; I7 p5 T9 y+ L
    ( g  s. }2 M7 H- _' }* i
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時(shí)推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    . f# D1 H, @& I! V4 P5 _這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對(duì)性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
    7 W( V4 X  w: l' A
    4 O! C+ P# s4 i6 v5 L
    % B( a  J5 g5 D5 v- n二. 模型開發(fā)不能停AI模型與訓(xùn)練過(guò)程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。
    ; c4 [, ^( A; {* q- ~/ `/ T( B  [9 w( m# g% p
    A. 創(chuàng)新解碼技術(shù)
    4 U1 x$ p/ P: k& c& @采用新的解碼策略,以便更精準(zhǔn)地處理語(yǔ)言上下文,例如上下文感知解碼(CAD)。
    3 p$ c/ O* W# ]! @7 F$ f ' v2 m( a) K( t% s; p
    這種方法通過(guò)在解碼過(guò)程中引入上下文信息,鼓勵(lì)模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。
    . o+ f0 M6 b) s1 U( O/ `# h& Y$ V0 _$ J8 f, ?0 e
    例子:在翻譯一部科幻小說(shuō)時(shí),傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。! \8 H4 M- q2 O, t; c
      f5 c& M$ V8 [3 C

    * e* o! ~4 a0 `7 {  z$ o4 D2 vB. 知識(shí)圖譜的應(yīng)用
    ( N% U7 t' N- N& @通過(guò)知識(shí)圖譜,我們能夠豐富AI的知識(shí)庫(kù),讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    ) }- z2 `2 a; ~% P) H * q' ?# U- n" T
    想象一下,知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體,比如人、地點(diǎn)、事物或者概念。5 ?3 p3 S3 f$ Q& f

    # }) x  p1 Y- E& W- u9 o8 j它們通過(guò)各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過(guò)這種方式組織信息,就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    . z4 K0 R9 l& p. {7 i2 |2 s% d2 B+ p# }- h) |, E& I  [
    舉個(gè)例子,如果你在知識(shí)圖譜中查找“蘋果”,它不僅會(huì)告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會(huì)告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬(wàn)有引力。& b. S( R2 F6 o9 o. y( {& Q- p) k
    ; Y( f0 [+ G3 _3 }4 D8 A' n0 C, p

    / b6 \6 Y4 ^1 h9 V) CC. 基于忠實(shí)度的損失函數(shù): Q8 f* @# R& g
    引入新的損失函數(shù),對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。
    * a; F: |! _+ g+ G7 p8 U2 e, \. b+ L# d$ ]7 N! k# C

    - t: A3 I) O- N+ G( i& H' z舉個(gè)例子,AI在生成文章摘要時(shí),如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會(huì)提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。: h, A. {: n+ N- N, v

    ; B. L% T$ }/ E8 Q- `! E8 E
    5 _) b. k$ ]0 q5 q6 V2 Z
    D. 監(jiān)督微調(diào)
    ; A. m, G' e% \  w" L/ Y' T通過(guò)特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。
    : {- j5 n% j; ^0 H' y* f8 [
    - |/ Z, D& P0 \& K4 ^, W
    2 }- R: t/ |; ?8 w8 x1 ?( M" c舉個(gè)例子,一個(gè)通用的語(yǔ)言模型可能對(duì)通信術(shù)語(yǔ)理解有限。通過(guò)使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    % s! }8 n  i+ s+ ]& ^+ p$ F比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語(yǔ)的區(qū)別,如EBGP和IBGP。' u7 D3 ~+ e7 ~2 ]. T3 T
    4 x& K0 V* P" [! ?" F
    三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過(guò)這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。
    " B! X$ k  v2 W. d" @- t6 G5 sA. PAL(Program-Aided Language Models,程序輔助語(yǔ)言模型):PAL技術(shù)通過(guò)將程序化邏輯嵌入到語(yǔ)言模型中,使得AI能夠執(zhí)行特定的程序或算法來(lái)完成任務(wù)。" C& a! [4 M9 l
    PAL技術(shù)像是一個(gè)“自動(dòng)化工具”,它通過(guò)內(nèi)置的程序邏輯來(lái)指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。4 V5 m$ T- ^6 E& x
    9 l5 V2 p" D1 p! f7 M6 I& X4 S* m
    舉個(gè)例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水!毕到y(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒,每天按時(shí)提醒你,而不需要進(jìn)一步的交互。
    - v+ ~, S; {: B8 m+ U/ H* s' w; S" R1 j& ?5 [2 F' c" m, w8 c
    " J# R$ Z3 j9 _6 a5 {
    B. ReAct(Reasoning and Acting,推理與行動(dòng)):
    2 q5 t* A9 }& ^8 QReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解,以及基于這種理解進(jìn)行的推理和決策。
    ' o2 ~3 u+ h6 \5 V
    $ o- f7 X1 q+ A) e1 CReAct技術(shù)更像是一個(gè)“智能助手”,它不僅理解用戶的請(qǐng)求,還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些需要靈活推理和決策的任務(wù)。5 Q* }  l5 l) ]2 x' G* B
    + c; E; A% K% H9 M8 Q# f7 c: K
    舉個(gè)例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個(gè)會(huì)議,需要準(zhǔn)備一份報(bào)告。”ReAct系統(tǒng)會(huì)理解你的請(qǐng)求,然后推理出你需要的信息類型,可能會(huì)詢問(wèn)你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來(lái)幫助你準(zhǔn)備報(bào)告。. R0 @, Z1 w/ @  u; k- i
    % w# K8 Z; X7 f, c& Q" F' {: C

    & o$ g" ~  [# q6 y/ {
    9 {) H8 j# e5 R* t- i  S4 AEND  C. q$ T0 }. i/ N( @" G* x& Y- a' w
    文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?, a* x# k( a% p% m2 r

    * b7 J/ N8 k8 K+ W% h$ W& |7 [5 S所以下次當(dāng)你的AI應(yīng)用開始“夢(mèng)話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
    % f% D/ S4 e, G4 l, f* m4 `其實(shí),AI也是在學(xué)習(xí)中成長(zhǎng)的“小朋友”,它們?cè)谂Τ砷L(zhǎng),可能偶爾也會(huì)開個(gè)小差,做個(gè)“白日夢(mèng)”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢(mèng)游”中醒來(lái),為我們提供準(zhǔn)確、可靠的服務(wù)
    ( s' {( m) C2 ]( u( |" z/ e; I
    4 ~! w1 |/ f4 h! n8 |+ x~~~
    & \* O+ b+ S! r8 F/ c' J9 b$ i* g3 T8 _6 o* k# s: _+ }* p; ~
    小問(wèn)答) q& t  F/ D* _3 z4 R8 ]
    請(qǐng)問(wèn)“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢# e; ~9 J0 ~- u9 j! \' v
    4 G7 M& S& J/ A: g: |
    ?還有沒(méi)有什么典型的AI幻覺的例子?評(píng)論區(qū)跟大家分享一下吧~
    7 v$ v3 c- q/ f5 A6 W/ E* e. N% K7 Z

    / p1 i1 g& `" C: F( Y2 j8 y
  • 發(fā)表回復(fù)

    本版積分規(guī)則

    關(guān)閉

    站長(zhǎng)推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表