電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 38|回復(fù): 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級會員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
9 w' i0 z, n" a" g+ G% d6 ^  a
" E" v! T/ p5 p- e 9 z- r/ C( e& a9 R2 {
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?
" I$ Q0 F$ c$ k 9 k0 n/ }% C" H& ]- F
1% M" k0 A, j% \9 d
AI會產(chǎn)生什么樣的幻覺?
5 n; }  K( s3 g) u) R
3 b! G+ r1 G0 V可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。
8 a. F+ \/ P& m' ~事實幻覺:“假新聞制造機(jī)”" r7 l) z1 i: u3 _# K5 V; e& G
A:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾! w) X( a6 y; }. F$ ]5 L, `
; V8 a- ?3 L4 G- ^% [4 v3 P
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。7 U0 Q) O; \& ]9 @
B:事實捏造:AI生成完全虛構(gòu)的內(nèi)容
4 k6 L7 V2 D: n1 m

2 H+ T% Z" y0 K8 C9 e5 Y : N  [& d3 z. V8 L" \0 B
如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置。”這就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。
% i" K& N# G4 u  e/ ?忠誠度幻覺:“指令迷失”
" z* d. J2 l7 I+ p! xA:指令不一致:AI的回答偏離用戶的要求7 y& j0 [0 A% u! p
- F! q, s3 w( n' J

9 \( v: Y0 d; W* U* y: a2 y, |9 B# c3 i如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。; w$ Z+ R! B9 i3 I9 p+ ]( {4 u: o3 F
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
; A; i! Q, ]% ~4 x* g: i! \
. P& ?. e# T7 P! e% b$ C; M假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個回答是正確的,符合春節(jié)的基本情況。
. v& G- y' P2 A, h+ u4 P! I然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟。”這就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。
" t) e$ n$ y" b3 xC. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾* ^/ i3 F! }9 \  M( E% L- i
開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~8 q9 J5 E& `0 _- e8 C$ i) o" q
- d5 w& G; ~" O1 L- ?
2, ?  x& F' I3 P: j' `
AI幻覺有哪些特點
& f5 D! I4 ?2 I$ h. U3 x) R0 C% U! y
# ^  B3 H& x3 W& |
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。
    * C3 j" [( n/ c8 }
    3  m5 B; D  n5 @, Q- M
    AI幻覺的“幕后黑手”( i& }1 L% j$ d' I
    4 {' r" V4 q+ j# @( Y( K! n7 J
    AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
    3 o8 L' y7 Q2 N1 a  N8 A* V
    ' G& a2 x9 `$ ^; F
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。
  • 缺乏實時更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~- M& ^" a( V9 w
    ; F! r, a' U0 O3 Q( }
    # a8 G7 {1 T0 N. j2 b0 L% @
    訓(xùn)練過程的“小插曲”( R5 @. @" ?! V( s; N/ C' {) |
    ! Q8 C# {( a( }% W% h" ~9 ^. i
    + `! k! q- o& b' Q0 t# ^4 j& t  z$ G
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。$ o' D" D4 J5 _- N# `
    6 a1 Z, l, ]. `4 ?% ^
    模型本身的“小缺陷”7 K9 P4 v) l' W# }3 M* B

    ( ?2 c! j  t. H* Z2 X' ^3 m 1 i( d; q& {1 }) X  O+ u1 g/ R3 G; ?: t
    模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”
    - P  n# n% l; b" R. p2 `4# `% I. I! j* u& P* L& e1 p
    3 D2 c$ j" d. s7 \; k- U" A
    如何避免AI幻覺?
    , u0 N6 M3 q0 v  l
    1 X  m: Y+ p& J! ?: C/ H$ O8 j避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。# `- P4 y1 T, c9 g( H7 X
    A. 檢索增強(qiáng)生成(RAG)技術(shù)
    ( g& z7 c* h  S* l 7 w* W/ c: J) k
    RAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
    9 E1 x  s" n0 }9 T+ X生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅實的基礎(chǔ)。
      N$ S5 V% N% E' @5 m6 x8 G& \3 i生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
    - f- L+ J% ^/ @7 g+ H# |% K3 o8 F生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗證生成內(nèi)容的準(zhǔn)確性。
    ) I& V5 E1 B2 U; {

    9 W# t3 A  G9 C6 h例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。6 o( m" s" s- W" \; n* v

    7 x/ b; \* E! h* bB. 基于反饋和推理的自我改進(jìn)機(jī)制9 e# K6 k8 Q: P7 @2 w
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。1 `* }8 d* |+ d" Q3 q
    ' q/ D4 A8 E2 N% `2 c0 M& }9 O: Z

    1 a$ [/ M5 P" K: ~5 p- X# oAI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”  o4 }. E4 A0 l8 |! p0 n
    C. 提示詞的精細(xì)化調(diào)優(yōu)8 u1 t+ X- ?8 m
    通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    4 n/ X- J4 W- ~. j! C6 Z
    4 I  m, s! K1 y4 E( R 9 A1 K, g: B( y' N% C5 k, S3 F' h0 C
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    4 J2 I6 c/ y2 J( C" V這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
    " X2 i. T" z; D( K& ~; d; Y
      A- e5 \7 F' U& c" X4 N: J: K, T5 L, e' ^6 d8 \9 m
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。6 n. c, U7 }$ i+ Y3 k! C4 O$ f8 q
    : q  {8 {( @& E2 |
    A. 創(chuàng)新解碼技術(shù)
    # }' X; Z. [9 t2 L# R- h" `采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。
    ) d6 {3 n0 a$ `- h1 P* B
    & I% ~: ?( u( s9 f+ D( P; L; f這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。2 E, z% y+ ?3 |) E  p% N
    " N7 y9 e# e7 Z( `. W
    例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    ( [* W7 z* |' |' ]
    4 Y* U5 N- S2 v3 n4 l
    " E4 P! R6 p0 ?7 W; K' g1 S8 o
    B. 知識圖譜的應(yīng)用
    ) L4 A  L+ ]& a! Q8 A  Q通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    " I2 `# U( Y/ |: k+ \6 u. Q1 o
    + U5 X8 s5 i3 G$ W3 ^想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實體,比如人、地點、事物或者概念。0 l- m! y% n7 l; `7 u9 x. A% ]
    4 U1 q( T5 V( v( d
    它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    - C" f7 y4 b9 G, L7 r7 r- e$ l. B9 W* B
    舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。8 U5 M7 I8 Q4 ^) K8 z- j2 V  z
    : k( j  e0 C) d/ ~3 J
    4 E# }3 `+ ?  d7 _. _3 L4 R8 X( L
    C. 基于忠實度的損失函數(shù)
    ( L2 E3 Y0 |# P: l  @0 j4 H引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。0 K/ Z5 Q; I' I0 }( k

    + R: @- g; z/ {  b4 Z- L - y8 M5 x: ^. z* R+ }7 F' e  a
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。, G$ [* ~( ]+ ^  Z& k- G2 U

    2 f! C; \$ H. p5 T

    " U# s6 y& r5 Z0 }D. 監(jiān)督微調(diào)0 d" T8 r+ Q+ }
    通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。( N# I1 i1 ?7 I6 k( X7 z) u) u

    6 E8 o( a/ Q( `9 _6 m. n. E
    - C: O* n" d, V) o+ v1 k, W舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    " y9 {8 k7 _, l7 Y8 {  ]/ W2 r比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
    " \( W1 r, L. `. [1 i" A% C$ J" y$ X7 A5 \: N# f- v
    三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。
    ! Z) {( D6 f3 a* d8 E7 wA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。7 D% s1 C6 Z( i/ C4 v
    PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。; M: g9 @; u; @) ^. y7 j

    4 `) g- U3 ^: r* e4 C' q* Y舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點提醒我喝水!毕到y(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。
    4 r. q! Z2 j9 l1 U# v/ U* U! x4 q+ V$ o

    : e  Y9 x# S& P4 i/ ?) TB. ReAct(Reasoning and Acting,推理與行動):( j) x- A( x# o* [% x- `- M6 k( z
    ReAct技術(shù)強(qiáng)調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。* E; w) H# q" n9 e6 v( w
    ; Y2 b1 q; b% I% U6 Y
    ReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。3 P6 B6 C9 e. w3 c8 Z, q; b/ v, ?3 _5 w' r

    , @) E4 @2 j5 B/ o舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告!盧eAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。
    4 y- G& v, {3 m6 g8 y) O- L5 P. {+ F5 H; X5 f
    ( E& S8 C: n. k  ^" S

    ( Z$ I$ G6 D( J; Z8 s+ b  BEND
    / q. h! t; Q' k' N3 c; |/ i: ^( [文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?- f, I5 C. `1 c3 f; M7 c4 L
    0 o* X7 M6 h* R- F, N" E
    所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。5 \5 y+ c. o" a/ j2 T# r0 s9 h
    其實,AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)& w# w7 B$ n3 H
    % K% a2 ]+ v$ G+ ]) O, c
    ~~~
    / J1 [6 K1 k$ n
      D: |  X: }' F' b+ Q小問答
    - g; s5 h  f4 W4 W0 [, v請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    3 G% ?0 L( c& ?! Q6 X% w: t8 r, s; {6 s
    ?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
    3 ~; N% [) [$ U3 n' g4 S& t. }1 U) p

    ! h! N1 |4 E0 T6 j' F" @7 V
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表