電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 63|回復(fù): 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級會員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~( h+ X( H; I+ Y6 `

4 N  t& u0 |  I3 ?0 |" G ; |6 J  m2 Q& S6 f5 J7 x5 g9 A
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?) D  X# ?8 `7 _2 m; F! A

& u7 ]$ U: q6 ]11 d6 p/ F  V7 T9 v
AI會產(chǎn)生什么樣的幻覺?
3 k( u# @$ Z, U1 f2 t2 d
( _2 J( c! h. @可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。
$ w9 [9 i4 S* Q3 ?事實幻覺:“假新聞制造機”
$ o5 M! r3 @- G) A# I5 MA:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾9 |, o. z3 Y( J' s
7 `" |  F4 M) N/ d7 `
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。6 D; u9 c+ d/ i  H9 S1 G
B:事實捏造:AI生成完全虛構(gòu)的內(nèi)容
2 r- V4 e1 Y, i, n1 a+ A. X0 p! j+ T

7 K8 t& @' _+ l! V- X0 k. R ; R: {5 M- J/ m! {/ x1 O' U
如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置。”這就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。* \. z- r) L/ E! H; D' x
忠誠度幻覺:“指令迷失”: U2 x+ l, W6 g) O6 a
A:指令不一致:AI的回答偏離用戶的要求
9 w8 A' C3 x' _) `) s; h
2 P* y& p5 [) M0 ]

+ N, Q* C3 Z* @* h& x. ?9 M  _如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。2 d3 J3 p: u; k9 N
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
' d( O9 a$ e* ~( F
4 V; `( G8 U  e& E& C6 n假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個回答是正確的,符合春節(jié)的基本情況。, I  ?: a; c+ h4 z4 {! [! f
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。7 N4 q/ ]" ]( }& @+ ]" X8 |) g
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾) U2 T+ H1 t) n. `
開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
) X, u& H" u# j( S
, t; s, C6 J# |; [2
3 Y. q9 p  e' u' r. G/ UAI幻覺有哪些特點
! w) B, C) O, g+ {* Y9 a" ~' v5 _- _5 ]% h
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。
    % F* f( I( k( h# I9 j
    3
    $ W+ h% J, i/ V1 @2 YAI幻覺的“幕后黑手”
    - F1 {4 \2 W5 E' W+ t/ k
    4 X6 c; L7 l. k$ b6 i2 V. q7 k  `: bAI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
    " Z5 o2 p5 q" {8 d! U " o: i) k) k/ T+ c/ Y
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。
  • 缺乏實時更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~" v; q/ z/ |* r- S# J0 g& `
    " n" f  |  W. r7 A1 A9 ]5 I8 G

    " \' M( f0 q6 _: u9 w3 p5 C2 B3 u訓(xùn)練過程的“小插曲”
    # I" J7 ~$ u8 x9 W
    9 k( v( K9 r: j- S( ?2 N* w2 Z % c- d$ f5 L- n2 r; `) }
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。
    ; b; b$ L, k- P! t4 X3 L1 }

    0 Z( @$ D$ b3 c& D& M' S* S- l模型本身的“小缺陷”. i' R% {8 y  @( f& X& I2 s
    9 |' }+ k4 Z& D2 P7 }. S
    , p: \( E( m/ Q1 _* c6 L
    模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩悖鋵嵰膊贿^是基于復(fù)雜算法的數(shù)學(xué)而已~”
    ) U8 G5 i5 [+ d4 N44 h# z1 @2 g# z" s
    $ P3 v0 Z: i$ k6 n" E& S, \
    如何避免AI幻覺?! K, k+ q4 p1 ^9 r8 ]% v
    ! O: ]( {9 v* k( p+ o9 t
    避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。, P5 Y0 p8 R/ f8 C8 a* L5 U' f! S! r
    A. 檢索增強生成(RAG)技術(shù)2 j4 s) [! N. J& O! p. I

    # c! {( f0 `# ^) Z. k5 g- M4 yRAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
    3 L2 a$ F$ y& c$ [9 X生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅實的基礎(chǔ)。8 z0 x$ ^& L4 P
    生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
    0 T8 [# f  I8 Q' @$ I5 }生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗證生成內(nèi)容的準(zhǔn)確性。
    ) Y* l( ?! T5 m1 [( B

      y# w4 B' }7 n2 O$ I, V例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。
    / ~9 |: A5 A2 M5 }% `5 w* ?+ ]* N
    " w: K! G' }, y5 ]& n: gB. 基于反饋和推理的自我改進(jìn)機制: F8 [; ~* a' |- n  i: k" _) ]
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。
    , w' j6 R: z) U
    ' Q8 E  W8 a# e& ?- Z9 U$ \: m
    " y7 r5 F0 ^+ M: ^8 M( JAI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”
    8 r. x8 a3 }% B; C2 e/ \/ pC. 提示詞的精細(xì)化調(diào)優(yōu)
    # W9 A' v' t. U- p7 I' [" A  @/ F通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。) v1 |3 g: ^- [& U; g

    & m$ ]- j+ P' `$ x6 V ( Q) [$ `. l" c$ u% ?" O
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    7 Q/ e1 A4 o; r7 A9 _8 J9 Z' p; D這種方法不僅提升了信息的全面性,也增強了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。3 M+ H" ?. n0 r& X9 S

    3 k) A. ~* F* e4 w! b& {% Z6 O1 j( I" r
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。
    & F$ Y* d' W! N# [; q# y$ q( }5 Z2 V% {2 ~1 G
    A. 創(chuàng)新解碼技術(shù)
    7 ]4 K8 q* v) F3 y5 C采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。
    $ ~( R, E: n. k # H, L4 v. Q8 _8 d
    這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。! s$ M& c9 o- a( k3 L

    9 [8 g, h7 k2 r5 `% W/ E0 m: }例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    0 G! ]' K) h- y
    7 e. H9 ?- l9 u& B+ i: `
    $ h# z7 E4 i# p
    B. 知識圖譜的應(yīng)用
    / F6 Y3 |+ V" j- j. H通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    5 r" C# v0 ^$ }/ l
    $ b1 u' q" S8 h& W: p0 P想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實體,比如人、地點、事物或者概念。" D% G, V. s4 N* Z5 h# H
    # {! `% C; w4 Q
    它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    + _3 |$ l) o+ F% Q: y2 d
    ) l' i; d, P8 n7 O舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。  q- o3 {! e; Y  Q  ?. ~

    . {% W2 x/ }+ ]: s2 d7 ?
    4 F* L5 i) K, _/ T
    C. 基于忠實度的損失函數(shù)
    : E( ^5 h7 |1 E引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。* S3 w& q% r! j
    0 o2 h, @! Z$ E# F. O
    % _5 f! K7 a1 i/ h
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
    ) d: E( N; C. h6 [, \5 {7 R# M0 [* ]

    ' R  f2 X/ ^7 |( A6 HD. 監(jiān)督微調(diào)5 G- ~) U8 Q3 r" \2 y$ o2 d
    通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。5 c# Q. Q$ p9 f

    * c1 O: @, M2 w) \) i# P 8 I3 J/ c' ]. n- x7 Q
    舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    2 Q6 a1 U% r: T' M比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
    + p' V& ], U' A5 ]
    4 R/ J7 s3 y- n4 }三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。
    7 c  E( E& `: \; ^; OA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。* f/ _& Y1 f3 K! O( t- l7 S9 v- b
    PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。! C  p# w7 C7 e, ^+ c  R

    ! M- F& s9 i! I# A6 K5 N舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點提醒我喝水。”系統(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。1 E% Q: D4 Z" Q( N5 f" g
    & p! F* g5 }8 ^
    4 |5 U% L7 \2 z# q+ p/ V* ^
    B. ReAct(Reasoning and Acting,推理與行動):
    ' P, O4 Q' J+ |3 Z. D* ZReAct技術(shù)強調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。; f! p" ]+ t4 ?

    + M& _5 M! m: BReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。
    ' ~; F" I3 d- T7 ^0 b; u+ L! n" p; l
    舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告!盧eAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。7 S7 i; Y5 V0 y8 E+ W- c

    / Y( W9 x3 B5 r: ~3 ~8 u5 K4 [" e! m, |+ @3 c3 s3 H

    # ]% G  s, e- n+ E4 pEND
    / @6 c7 o; U; L文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?( z( B, |5 t9 l' V+ `
    . `( x$ Y* _5 g; v7 i" \9 s# q
    所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。5 {  d: R! T9 u' K
    其實,AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)
    4 r! l. ]8 ^6 g# k3 f: s+ y
    , \  A* ~0 b6 a+ z$ E~~~
    & J! |+ y7 J; j  c% w% ?, b$ Z
    ; O% Q! }! w2 f  n小問答& R4 b' ^% ^) \& x4 K. f" H6 r
    請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    , r) H; \5 M2 {& j# f7 D% A0 [4 w; K2 N7 J; X$ s+ i
    ?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~" e  k( R( Z2 w0 h9 |+ l+ P% p
    , Q0 c, {6 x! j) ?: A* u& s& F
    : N! X7 ?. E, D+ S7 G
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表