電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 37|回復: 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復制鏈接]

528

主題

528

帖子

3006

積分

四級會員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
2 e' @" a! L; p
+ i- s9 O9 g' [; V- H  {
1 X5 h' M7 J: r* ~( |7 q那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?0 v6 `  [$ \* |5 k
' [; N0 ^5 W$ _& }/ B) D
18 f3 c* J: o) R0 C2 ?; m) k2 Q
AI會產(chǎn)生什么樣的幻覺?1 R) D: ?" v2 m7 k, C  s

  S1 s% q) j5 U" B, g! j可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。
. v6 ~+ D- b1 p( L事實幻覺:“假新聞制造機”2 u  j4 R4 f6 e
A:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾
# k# @# ~$ I9 s0 H0 {7 W  `
9 z  {# c& O/ f0 T/ K# v當被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。) J! l# ?3 Y7 C1 d6 Q
B:事實捏造:AI生成完全虛構(gòu)的內(nèi)容
- O! G+ W+ E+ y0 H. l

5 u4 R* e, r+ T
. R4 Y  S8 M+ V" F% |% T3 @如果AI描述說“2024年,考古學家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。/ j& m4 i9 i" ~
忠誠度幻覺:“指令迷失”
& j% H0 O9 `6 I! [* B2 k0 {5 o/ wA:指令不一致:AI的回答偏離用戶的要求  t3 W1 P1 O5 ?
9 _7 Q+ k3 ^' u$ c

% s; R) f2 v" m; U7 @如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學” ,這就完全偏離了原始的問題。! [; d8 F% [1 m: x+ e$ H/ Z
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
/ k$ j8 z4 M% z5 v5 ^" C
) s& R; k- V+ c/ p假設在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個回答是正確的,符合春節(jié)的基本情況。# }" `/ T) e) G* q6 _
然而,如果AI接著說:“春節(jié)是紀念屈原的節(jié)日,人們會吃粽子和賽龍舟。”這就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。3 ^; d4 e# H' e% S) ^7 U/ ^
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
% @' W6 m4 M9 U% w開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
/ Z2 A- B- x9 `- f6 `0 V+ o5 [3 x/ Z3 J' S( ]& t
2+ j' A1 i. F- Y" Z+ L2 {
AI幻覺有哪些特點
) Q4 ?2 T/ H; c, t" s( C+ k0 u7 c1 ~0 D8 ]+ M" c$ c4 A/ O. }7 w
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關 :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關。
  • 不可預測性 :很難預測AI何時會產(chǎn)生幻覺,可能幻覺也很難復現(xiàn),就像人很難在今天做一個與昨天相同的夢。
    ' ^4 J: G6 _+ n' g5 d' u
    3
    & [- P6 o1 k* g( H4 Q' B# p# rAI幻覺的“幕后黑手”
    # K% d; f* N( y  T- T" W" n
    6 @( C  w3 B7 |1 B3 e9 {0 dAI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”9 \1 q3 w& s4 E
    " w, v+ `, S5 W  r% B% I$ @3 p
  • 訓練數(shù)據(jù)局限:AI訓練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學習,課本是錯的,考試自然無法答對。
  • 缺乏實時更新:AI通;陟o態(tài)數(shù)據(jù)訓練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復習,拿一本82年的教材是考不了24年的高考的~. b, ^3 c6 c4 S$ c  G

    ) x/ ~/ A5 y$ c, |0 }1 T3 j; B
    6 D- u, @, _9 w: T0 g3 f! C. i
    訓練過程的“小插曲”4 w  a9 x$ I* ?4 X" E8 `

    - i: r" N7 N2 L/ i& t$ c # h, W" X; {% Q( l
  • 過度泛化 :模型可能過于依賴某些模式,導致在新情況下推導錯誤。就像我們學習時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復雜的上下文關系。在處理多個復雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。
    / B4 q/ o$ K# y( M

    ' |# m8 V& I6 |8 J, b& e9 @( b模型本身的“小缺陷”% [( }1 q" |- U! t% c
    / `+ a1 [0 a# v( x& }+ i3 T

    % Y2 p" }$ ]6 @% d9 g模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預測,但可能無法真正理解信息!澳阋詾樗娴亩悖鋵嵰膊贿^是基于復雜算法的數(shù)學而已~”  f( \0 @& P( _5 }9 ?1 g' o7 ?
    4
    4 @% g4 z4 F6 X8 v

    4 V2 x: s9 _/ E4 s! I% t6 ]' W2 _如何避免AI幻覺?
    ' Q# b9 v" d& V+ ?/ [6 ~+ g) ~# @6 T
    避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準確。
    8 c' V% U+ n, `: ]# a& Z  e8 a, `A. 檢索增強生成(RAG)技術
    2 A$ M$ P- H7 z7 I3 A
    $ [' L7 R, L; Q7 w$ lRAG技術通過引入外部知識來幫助AI生成更準確的內(nèi)容。主要方法包括:
    . E/ A$ Y# ?( O2 P5 D1 P2 U生成前檢索:在內(nèi)容生成前,系統(tǒng)會預檢索相關背景信息,為生成過程打下堅實的基礎。% H3 B% @/ I6 g3 L6 r6 W# J( G
    生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
    2 z, p$ t) G% V生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進行對比,驗證生成內(nèi)容的準確性。9 o1 O" h8 i0 O; z3 H
    ' M& v* Y) K8 k. b, |' I
    例如,當AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準確信息生成回答。  W/ A* i) Z& d8 h, Z. o
    8 _) a  S# v8 d% t
    B. 基于反饋和推理的自我改進機制
    8 u# k+ h  u& d" g0 d3 b7 G: B這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。7 i: O4 J0 y# D* T
    8 t2 y+ e& Z! I. y( M2 o! G# e
    & H* T  H* u( H* h3 k9 U. m
    AI在生成答案后,會進行自我審視,提出疑問:“這個答案是否全面?是否有關鍵信息被忽略?”! B  P2 {" `$ y
    C. 提示詞的精細化調(diào)優(yōu); w) R! l4 c* f: x& k/ W/ w4 ~
    通過精心設計的提示詞,引導AI生成更可靠、更精確的內(nèi)容。8 Z1 S1 b0 i3 V- l. q7 {) ]0 g- n
    ) m3 i- B2 \' k6 J* c. F5 |
    # b& ^) ]- |+ ~, G% q& C3 H
    例如,在地圖導航的AI應用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。: D" Y# o$ K8 X) r0 g+ @% b
    這種方法不僅提升了信息的全面性,也增強了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
    : [  R+ y( Q6 R9 U. A1 s( s  o- I
    " h& k* c4 v9 T1 ~* P! l* F# |7 V
    7 l1 }2 B4 J7 E& ^/ C二. 模型開發(fā)不能停AI模型與訓練過程的不斷進化是減少幻覺產(chǎn)生的關鍵。+ l; j  y5 T* M3 k0 {; P0 R

    # k% F/ S7 ]1 k4 z/ y( ]A. 創(chuàng)新解碼技術
    3 ^5 S  T, }2 l% p: W! J采用新的解碼策略,以便更精準地處理語言上下文,例如上下文感知解碼(CAD)。
    1 J  `8 X4 E# d! m# d   N/ _. B$ F) t! ^+ f0 n9 h
    這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關注所提供的上下文,而不是僅僅依賴于模型在預訓練階段學到的知識。& a% ?* n3 H+ J3 v$ G
    ' p: r: D' h4 T: o: @9 Q- z$ ~
    例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    6 B8 ^2 _  t( @) x  }$ @4 \$ Z/ j, Z5 ^5 t& c

    " ]: J$ I  ?9 V: }8 ^+ r( PB. 知識圖譜的應用* r( ?# J" f: w2 ~; X
    通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準確和有深度。7 e- ~$ L: r& X2 S8 M  P
    , b- @; K' f0 @4 ~* E" a3 r7 S
    想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡中都是一個實體,比如人、地點、事物或者概念。1 e' b# N, M; g2 |
    ; ]/ {7 C( ^; V; n. r
    它們通過各種“關系”相互連接,就像社交軟件上的好友關系一樣。知識圖譜通過這種方式組織信息,就像一個超級學霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    . m7 t2 q' x' b2 }" F$ P0 q1 R( Y# a7 k' z/ B4 M4 E/ G5 u" }
    舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。
    3 q; F. g: v. {+ ^. P' }( j% y  q7 W: F! t
    ( |$ h0 U  W4 _2 Z
    C. 基于忠實度的損失函數(shù)
    , q4 N5 g& I2 Z: P4 H6 I& _引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進行懲罰,以減少不準確的信息,從而把AI從幻覺中“掐醒”。
    : h9 r  u" G3 G0 b# F6 ]9 _: W$ X$ {% H9 k7 Q% i
    / y# T6 ^& `+ d# b
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學習到生成與原文相符的內(nèi)容。
      u) c7 U  v9 S  r0 z
    0 r2 G* }9 Z& a+ ?1 O7 v
    ' ?6 j3 N# \* j! F
    D. 監(jiān)督微調(diào)
    . G% I9 I! J  I/ h# Q' s通過特定領域的數(shù)據(jù)進行微調(diào),提升模型在特定任務上的準確性。
    - `9 l! u" k$ ]5 O' z( f- a7 N, Y

    / N( {9 b- [& L  @# `; O舉個例子,一個通用的語言模型可能對通信術語理解有限。通過使用大量通信行業(yè)資料進行訓練微調(diào),可以顯著提高模型在通信領域的準確性。) d' n+ W" Z  w% l! i# f& {. G
    比如,它可以更準確地區(qū)分相似通信術語的區(qū)別,如EBGP和IBGP。
    $ K2 M- a9 [2 Q3 h. p
    ( J( B- _1 r/ z; Q& b三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復雜的任務,減少在生成文本時出現(xiàn)的錯誤或不準確的信息。* B* k  M- N! Q6 l% a8 a
    A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務。' M( u6 W: h/ i( v
    PAL技術像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導AI系統(tǒng)如何完成任務。這種技術的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務。* K% [# L; i! u

    5 O6 b: i( Q" ~. U& w7 s8 k舉個例子,如果你告訴基于PAL技術的AI系統(tǒng):“我需要在每天下午3點提醒我喝水!毕到y(tǒng)會設置一個自動化的日程提醒,每天按時提醒你,而不需要進一步的交互。( }3 E& M. H# N, k
    % Z6 }' p, y" I( q1 n& |

    # J( U) y6 W# X/ d) ]2 z0 v0 DB. ReAct(Reasoning and Acting,推理與行動):
    ( q% n1 L3 |2 E8 y' V. K. KReAct技術強調(diào)AI對上下文的理解,以及基于這種理解進行的推理和決策。5 d$ i" g5 f2 e! }: i( W3 v

    $ B2 Y: j# n+ P8 V& y$ _2 vReAct技術更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進行推理,并采取相應的行動。這種技術的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務。
    * }2 _  J: z, K5 P& c0 p1 g1 {- X: K9 S& P/ p$ G
    舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準備一份報告。”ReAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準備報告。9 E# B7 C4 h: h  j) _
    6 p" Q1 f8 _+ F6 M" K; ^* V
    6 ~' G! ^. m" S+ T6 P7 w+ B7 R! [

    7 p  k* n# h# Q* PEND
    ' A' b' s" A9 c$ D0 I& S, ~/ n文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
    / P1 w6 d! V& U
    ! O/ x0 |1 D( D- K' {) P所以下次當你的AI應用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。3 G8 ~! q4 k  ]8 {. o2 l
    其實,AI也是在學習中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導它,多用一點耐心教導它,它就能從“夢游”中醒來,為我們提供準確、可靠的服務! q2 F  ?6 b" l* `- L# T$ R& ]
    / G6 o) t; a4 _! H  T: y1 f, n
    ~~~; n9 x% W9 O4 S+ p( l  a8 B

    4 Q, b9 v5 y5 R+ B0 Q- T小問答" m6 x* i5 Y. J* {
    請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢* f% `1 |2 a5 {
    + j3 L1 Y$ t* a# e' @& r; B
    ?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
      @0 b  E9 ~. Q* v( X0 @
    . t2 v& a" O6 N% n7 B" |/ ?
    / n. [' X$ g. U
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關注微信 下載APP 返回頂部 返回列表