電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 62|回復(fù): 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級會員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
3 a# A2 x' ?. `
  r, P6 ]3 O0 O& p' b" u
4 J( K- q* T0 S6 e那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?
! w- o% y8 M) t& L% O; j
% Z3 ?& E* ?& F1
& k$ [6 r) o; C$ fAI會產(chǎn)生什么樣的幻覺?+ K9 W. ~! t1 B' F) B3 K
6 M: @& b* q$ w# @; Y
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。
# D: z# _: h3 S1 y/ h( e3 n/ J0 x事實幻覺:“假新聞制造機”
9 D- X4 t# Q" k2 E$ @3 U3 n% I( _A:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾
; W7 Z0 ~7 q7 X% M' z; k1 H   l# E  Y. r3 }+ I
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。
! H# y) j  p( D+ q2 N) kB:事實捏造:AI生成完全虛構(gòu)的內(nèi)容
5 W" c1 z# m& r8 B" D$ @
7 m; p' h% Y# G4 `

' Y1 a8 ]/ E; L/ h) U  e如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。
9 j1 t. S, U. ^' t忠誠度幻覺:“指令迷失”
1 G; o/ Z: K9 O( xA:指令不一致:AI的回答偏離用戶的要求
  [" L' `. `; c6 U

) ]$ Q& d+ Q/ I! F* b) Z7 g 1 A. J. j$ Z, L! r! x
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。
& M; _- h+ j/ k; _( z+ O& k9 sB:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
) \; x4 G$ W5 P- o, q' G# S & }9 @+ |  h0 V% p
假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個回答是正確的,符合春節(jié)的基本情況。
8 J% n+ D) A& S4 \2 i  \' \! `然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。$ Y9 N8 ?( q' f: `) Y! o
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾- L" I1 b+ J8 F' I$ G7 k$ J
開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
; h  d' n  e& A. V# @7 b, O  _$ @7 d
2
- w- p7 |( W. @AI幻覺有哪些特點& b4 y' \2 o: I7 U  T! M/ m$ c

# ?% [  M5 I# B: a  x/ T
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。. b: ?8 _* y* Y
    3: Y6 O* |: {5 i: Y" c
    AI幻覺的“幕后黑手”
    / \& E7 w- q, T/ l8 O! D7 @8 ]3 V9 ^$ V7 @8 K
    AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”2 k4 Q5 N1 x8 N( F# J9 t

    9 f7 W) y$ b4 n/ i7 |
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。
  • 缺乏實時更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~: r" Y* v3 ~$ c9 c4 Z4 Y
    6 V6 K& z( w( g2 |1 Z
    5 H1 A# H2 }0 t6 l0 W* x
    訓(xùn)練過程的“小插曲”
    4 T5 o+ p2 r* Z. L/ O7 z* S
    . w$ F7 ]& d2 F$ u/ G
    " o: U/ s5 X9 X& C' M
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。- A8 g+ O$ u1 w5 ^, H! e5 n( G5 R

    ' B+ q( n0 i' A3 ^9 P, ]模型本身的“小缺陷”/ H8 r; g5 ]% O
    7 d0 P, ]) \3 j# K

    % U4 \$ R( s$ k模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”
    ) n% n# L& L5 W7 F& n) Y& p4
    1 P7 X; E: m( m4 F$ c6 _# D) `

    : z9 X# @  f$ z" J如何避免AI幻覺?
    % Q  {: o- t/ z. _+ ^: t  D8 ^, b% [8 z- I7 E1 Y
    避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。
    : w4 b9 d  M( T9 Q5 HA. 檢索增強生成(RAG)技術(shù): X3 ]  b) ]# l# h
    . f2 m+ I! F( s1 L- ^) h
    RAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
    ' `* P  o% }8 c- D6 s9 P2 _/ {生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅實的基礎(chǔ)。
    ! a3 D6 p" G8 y' A3 Z8 Z; {6 J生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。- `! _& D- P$ H/ C" U  ]2 O2 B
    生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進行對比,驗證生成內(nèi)容的準(zhǔn)確性。, p; X# }" d3 ]# S
    ; [8 w' {" B. N- W" x8 q
    例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。  l' p6 ?- j6 |' a3 l7 e6 x

    : z- W1 w) l& t7 dB. 基于反饋和推理的自我改進機制) ^& Q& a  Q/ \* C5 A& h
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。  E# \# U. W! A3 X6 V8 S! p5 _2 r- y+ ^- B
    6 l" `- Y+ e; k( D. v! F3 s
    $ Z9 e- R' M# c
    AI在生成答案后,會進行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”, F" n$ G' l3 x( Q
    C. 提示詞的精細(xì)化調(diào)優(yōu)' L0 C, q/ |+ ^2 Z+ x) \
    通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    5 b0 j' n* W5 m& o* w/ C/ \! P: @! I. g: F0 ]
    / i* b1 O' E1 }7 C5 n
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    ; J! Y5 c) I* r這種方法不僅提升了信息的全面性,也增強了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
    " n- [7 ^4 i9 n/ N+ C4 m( @ * Q% r1 t# J* ]# w& B5 S7 q  d
    ' A0 ]2 U& z( r4 K5 N) e/ H
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進化是減少幻覺產(chǎn)生的關(guān)鍵。
    ; `" {3 ?5 }' q& i1 I
    , |$ }& P* r/ R; e# M! GA. 創(chuàng)新解碼技術(shù)3 j8 b2 d; z; G; x7 ^
    采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。/ M3 _4 ~8 J0 F, k/ n8 S3 Y
    " Y, L7 }. h7 U2 V
    這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。
    9 O; @/ U% ]' n' a
    : X, u. u( L1 g例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。5 A. ?, D4 r  b9 ?. A
    ( [2 G7 a( X! m* f9 X

    . r  C7 ^0 x2 Z* `B. 知識圖譜的應(yīng)用
    ; S- p0 z! M% p3 t$ _通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    8 z. f; J% a* Q  L ; H2 y3 ^8 f, M( u% G) @: r
    想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實體,比如人、地點、事物或者概念。4 M$ k- g6 }2 F% }5 p" U+ r" _

    * z, h& U% a# I) C! ?它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    / N# D4 s9 y. V9 o! J+ p
    $ x0 S" h8 P" Q2 C1 V# X舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。
    : v* C; S. {9 |. p1 [8 b" F/ o4 @) r4 e2 Q: [! t
    2 |. E/ H$ A- u: s" ~
    C. 基于忠實度的損失函數(shù)
    6 O2 O1 |8 L$ X7 J8 \+ E引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。, t) o; W5 f4 u
    ; G4 Y* W" s$ C( z

      X7 H" Z" u" s1 M8 X8 A舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
      n! _5 L* I: l
    5 C$ S% n' m3 {8 ^1 d7 c+ |6 ^
    9 A9 y9 C8 M# ~1 y
    D. 監(jiān)督微調(diào)
    . T9 [% T0 C8 ^+ e; p7 X1 F/ @通過特定領(lǐng)域的數(shù)據(jù)進行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。
    * ~3 U* @! o3 [* x3 q' N' e" `2 V0 U2 G
    # x3 Y$ G! f/ b! l  y3 p
    舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    " J( H7 d/ G' d' P+ l( n比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
    - Y( m3 J! ]% c. a
    % J( v; p3 c' i2 i$ w9 T9 ]三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。
    ; K# l- r) E7 B; g. HA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。* P; t- I* c) P! K- }
    PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。% v. ]; ?% k' n
    5 Q) b. h5 ]+ u
    舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點提醒我喝水!毕到y(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進一步的交互。
    ! G# \! J' u! s) w% i4 g, I5 A" a( _. J* D
    0 f  ^# H' N! o9 `4 f8 x6 p: s3 J
    B. ReAct(Reasoning and Acting,推理與行動):5 ?- |" J) T5 U1 k. O) {  S
    ReAct技術(shù)強調(diào)AI對上下文的理解,以及基于這種理解進行的推理和決策。! s: R+ l1 \% L% [) W* P6 A* p
    7 W/ V8 n' }+ e1 R3 f4 C" M
    ReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。. ?7 {- D) Z4 w" ^
    4 Y  Z: }- |7 g( t9 v/ f; H5 O( y
    舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告!盧eAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。9 R! x; ]' V! y4 u# v

    4 s& @- K: e3 X3 K* @4 E
    : o3 g. E6 _8 G- g0 O* V% c6 F4 Z' n* f
    END& h* x+ k1 E/ r
    文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?: q% b# P& ~/ P1 R

    ; e& \; h% D! }0 F* i+ J所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
    ( P# V% {* b4 N其實,AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)% q2 x0 @4 k: i

    9 M4 [$ u# V+ i* M  ^( z~~~
    * C- q5 `+ ^3 \& W6 W
    & s6 X/ T, M, y1 r小問答2 N( o& f/ m( I
    請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    , u) u: s% u4 E- T8 M" n
    # h6 T; o/ u- r# h- U' v?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
    ' v1 X/ j0 z. J& [
    # G; [% J1 d" E  R' `$ L; G9 u/ f4 S' |( F: V! q
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表