電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 66|回復(fù): 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復(fù)制鏈接]

530

主題

530

帖子

3059

積分

四級會員

Rank: 4

積分
3059
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
7 b9 y! L5 E* G+ l& l! y6 R8 u9 Y2 e9 c2 M4 [" g) l$ b
! P4 g( o  Y7 {" X( k6 `$ Z
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?
5 H2 r  x, u  m! T! E- `
& D  S+ P6 T# Y3 P1
: {+ O4 n# [3 y1 g- y" E4 H' jAI會產(chǎn)生什么樣的幻覺?* o2 o% r6 q! Q' j3 z( L* ]
: Z7 ?( z( n& C' ?5 u0 K+ W  M
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實(shí)也沒這么簡單,AI幻覺主要有兩類。
+ z9 y' y7 t! [9 |# ^' m事實(shí)幻覺:“假新聞制造機(jī)”
% R# w: `: r: _2 l0 P: KA:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾
9 b- a5 E, P7 D0 x, e9 Y2 s
! t( j5 o1 l. _' k' J當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。
. v! y0 Z. A+ k3 P( ]9 @; mB:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
* B) n6 }: D* n; v% [) |* e
; C. F6 s$ F) S$ D: i! o- P" ^

2 |2 y4 E1 O, Q  \如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。
; m1 w$ J, Y" R5 R忠誠度幻覺:“指令迷失”
7 G& T6 ?3 L8 i- l5 J4 G; W; o2 NA:指令不一致:AI的回答偏離用戶的要求" O" Z) I7 X- X. X) c
: I# D( U- n* t' {& @
2 ]6 c" ^9 Q) a
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。
- Y' a5 C' u. G! {% M1 s" \B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
+ K8 U, Y% ]7 B# Z' O! S3 m7 @
- D8 \4 w9 U5 U1 ^假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個回答是正確的,符合春節(jié)的基本情況。. ?+ u' `7 ~  e
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。  }6 b. i- d  h- r6 M
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾2 {  p, X( o5 l4 O, e! {) Y
開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
% b9 n# X( M3 O9 k( n  G1 [$ {) ~% J; G- J4 X
2
0 c5 \+ B* V; V) m2 O" o: GAI幻覺有哪些特點(diǎn)1 D; S2 q6 u2 I6 J) L: r% Y- T
6 {. t+ l5 ]- A( A' N' F
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。
    6 t! J1 O) E7 x0 Z
    3
    & q: I8 V8 e% Z) rAI幻覺的“幕后黑手”& a$ }( Z; g1 }% y/ Q3 i0 n+ j) M3 r
    ; a/ w, F% [5 l+ r# ?  e
    AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
    ' e% V6 n, g6 p$ l
    0 g3 }' y3 G- R* O& ]/ d
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。
  • 缺乏實(shí)時更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
    - G. q, Q/ X1 W/ R2 @( T
    6 ]! [$ @$ M2 l, }

    9 U+ ]( X. h# N+ K訓(xùn)練過程的“小插曲”
    7 Y' R$ @( g: p2 C% I) b& z
    : s+ |! c% @) p! G# D4 r ( ]* ?) m: I, a
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點(diǎn),或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。  p5 L/ i5 n0 C, w6 ]+ R

    $ q& a! w$ _, o/ q; y' C模型本身的“小缺陷”0 z, J( t7 ~* i

    % K  h! i, _. z  a
    : C# s! b% S$ z/ R; X模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”
    $ Q4 h2 D: @- \7 y4 G/ m49 f6 i9 |! @& G0 J* ^

    " k5 F- R# S& l2 x  G% }7 Z; y3 Y如何避免AI幻覺?8 A9 I3 k" Z0 W. J

    % ?$ J3 d. u6 m8 m0 z$ b+ w避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。5 O5 W1 o* f+ p) i5 Q5 S; U3 j
    A. 檢索增強(qiáng)生成(RAG)技術(shù)
    : Q- E; M3 j# [ 5 S8 I- J8 E+ m
    RAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:4 ]/ i9 G3 N# P
    生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅(jiān)實(shí)的基礎(chǔ)。3 Z' l0 d; ~! `0 R% z, k2 h
    生成過程中檢索:在生成過程中,系統(tǒng)實(shí)時檢索并整合外部知識,確保內(nèi)容的時效性和深度。1 |- l: [, C$ m( X; H
    生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。6 ?6 D! Z) R- {
    # @1 U9 P- T+ A# ~/ [) N* W% {
    例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。! M, c% c' o* d  h: s( S

    1 i2 {' e+ U8 g# XB. 基于反饋和推理的自我改進(jìn)機(jī)制0 D8 ?4 B/ Y# @) I- L
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。& q1 \; q7 |" G* _( W
    8 n$ C. ~" V9 z* Y8 y4 r. [
    . ^, b0 \2 X+ }; b, r' X( Z
    AI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”
    8 P: I- i% U( j5 {C. 提示詞的精細(xì)化調(diào)優(yōu)7 T, Q1 F2 \- \; {
    通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    6 y& N. G% q+ m& R; y6 G/ u& b. s3 S0 {* i6 O
    + i9 X' y+ c; J& y( q
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。  Y1 ^5 \2 }  |9 M6 ~: }
    這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。' k3 d+ b( L% o/ r6 R
    9 W! j# v6 _0 L" u( _
    : h  T0 E- V0 _6 Y& n* s
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。2 ?$ Q2 q* l9 R( A: H& J! M$ X
    2 X; J5 q( e  n' P$ n
    A. 創(chuàng)新解碼技術(shù)
    5 w! `( m$ U" j6 H采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。% v2 B9 p7 w7 K4 N# S7 S

    % Z3 U( H; a/ E6 ?- C& p2 p/ A! j這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。" E3 x2 J- Q+ S0 L. {

    6 ?* t$ m- [' h: c例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。* T- x' x# b# o- V- w

    9 w5 d& L8 ]. ]- m! a- X+ E

    ) \  J$ j9 ], O; J: V# Q" r& J6 y, c% OB. 知識圖譜的應(yīng)用
    9 ]- n8 N# y6 m, x" e* F通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。" I: \: }  b  Z% o4 \: b

    * n2 u7 A' L6 ?% `1 w( s& ^6 f+ M想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實(shí)體,比如人、地點(diǎn)、事物或者概念。: ]' k2 \& L, {$ W9 d, A# k

    8 t/ ~0 d( f$ M1 ?. `它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。. H  a; ]& }! I7 \4 u! g2 `- k

    * S+ ?7 m/ \  H5 R$ G舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。: h% f2 h' I, [! v# m1 N: \, {
    ! y! c1 C+ L/ _7 D. h2 n
    & v: r* D! A  d7 c, Y8 W
    C. 基于忠實(shí)度的損失函數(shù)7 g. ?) t6 k. z
    引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。& R: ]4 c4 s0 j1 A+ L5 k
    3 T) _% J: h  s
    + y# X; Y, ]4 ]9 e6 E6 O- x, S
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
    - K5 K& p0 Z3 m" |7 R4 J; p' Y  A% l1 c  e
    * Q8 w' m+ }# m( [& ^
    D. 監(jiān)督微調(diào)! H4 D4 r7 r9 n6 k
    通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。; C1 g" p$ d1 k; p: t) U- j+ |8 n

    2 N0 E5 L' P) {& \
    5 r, n7 T# ^) t' n  ~; A& h舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    2 G, Z3 O( i" u' w" \比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。' B- T9 g8 K. b* B; @

    . ~* X! x0 d" T5 ~7 ^& p三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。, R. z: t9 C) [# p; r  Y
    A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。
    & R5 E, o9 s- U. b" i. m* s" PPAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。+ s- L; Q; B8 D: ?1 A* i4 n# K
      e  |) q7 p  r* ^, ^
    舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水。”系統(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。
    2 M$ D9 U* P8 N! m& M" a1 M, z: y
    % ?, M- D) `! h2 ^ + n2 a* T  k# L* A
    B. ReAct(Reasoning and Acting,推理與行動):
    " s* n. ~, C8 ^& T# h! ^! SReAct技術(shù)強(qiáng)調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。: f. n# o% T/ L! t# c1 L/ P% ?

    4 a) N" G# b/ q' b, ]3 OReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。
    0 d: Q/ m, h( b! L' K0 W& f) [/ n
    舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告。”ReAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。
    3 e9 O) B5 E2 f1 ?! Q
    4 n: T2 Z7 P1 r) V8 a7 B/ o& Q$ m3 _. f' c& N
    0 l9 V3 c" h( N! g
    END
    # }0 y" K- m; }" F- O- y文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
    9 g5 c0 p9 y4 n6 G& \4 s( B  q! a9 q. E# W
    所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
    : P( b* n6 q& H) O5 k$ g; V其實(shí),AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù). W3 A' [" D  H; Y7 b/ y
    2 c, H# G* ^! P# e, L5 z$ {
    ~~~
    7 O4 M0 g# e( M) c9 @2 j9 F  K, d7 S8 a9 s) Q1 x
    小問答
    * {4 |! l/ u1 W+ D請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    & v7 A1 \! b1 D8 U+ Q# q
    ; b. G0 @  x, g. Q?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
    * E* ]' h, H+ i, L1 v# R+ l8 ~& u; I6 S
    , Y  f2 F: D9 T- C& F7 P, O
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表