電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 30|回復(fù): 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復(fù)制鏈接]

528

主題

528

帖子

3006

積分

四級會員

Rank: 4

積分
3006
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
: B. w0 V# X4 e
3 _3 i% r3 R% a- r. r% P# b
; v7 ~$ ~. J+ f9 H6 `- x那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?5 w  N" \  {- w2 ?0 R2 H. \0 l* A

! S+ J7 b  v9 M) b  ]1
; |% |$ w3 k' e/ mAI會產(chǎn)生什么樣的幻覺?! p3 X! C  Q. k. m( `; ?- u1 U
6 A1 ~  E; O# g3 L8 r
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。8 I- ?7 a8 w; r  p  f* [% h& D
事實幻覺:“假新聞制造機(jī)”
5 V( _  v* j1 R+ }+ B2 gA:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾
2 b9 e* \1 P6 ?& Y % `$ ^: i5 x6 D5 l! p
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。
5 J( ?2 Q( E8 u8 D/ I( NB:事實捏造:AI生成完全虛構(gòu)的內(nèi)容8 l, n  j8 |: Y" e
6 d3 o$ E/ J3 _

$ k, A, J2 N' K! V如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置。”這就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。: c, |2 ^5 L: R- e5 v, d8 @0 J+ c
忠誠度幻覺:“指令迷失”
9 ~& {9 [8 @; Y2 W1 [A:指令不一致:AI的回答偏離用戶的要求3 m7 v; k8 n9 h$ c
1 l0 K- p3 L8 j4 F: I

# A% ~* L' q, r6 [2 Q7 V* p如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。- Q: A! v. u' U  z. y
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符. y: k  I, O1 g( U) ^
( A! S8 F# s, L# s
假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個回答是正確的,符合春節(jié)的基本情況。0 ~& O2 e$ S$ @6 I# Q1 c
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。" F; u5 G9 q  ]
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
' M8 T$ k& z7 R開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
, c9 I9 t) @# O" R8 k8 m
+ y5 v! R6 A: L3 f2$ H# N  e" Z3 k2 o& p7 v
AI幻覺有哪些特點
1 x% d+ ]; _  S2 W3 ~2 Y# Z: C
5 f% i# r+ `! b8 X3 o
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。0 |7 o! R7 j* ], V, ~
    3& I" Z  I6 c/ h* E* @0 f& t( N
    AI幻覺的“幕后黑手”' {. S- x4 H' r5 S* h9 r

    7 q/ I7 D: T$ p- k3 m1 B1 y% VAI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
    5 G% ^) w; g% B: C
    , v; g( A, C2 C# o2 M' ^$ I  H
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。
  • 缺乏實時更新:AI通常基于靜態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
    : `7 |' Y2 P7 u " y' v  y8 C4 C7 O4 J# U

    7 L; }  Q7 I9 |! Z9 K# C訓(xùn)練過程的“小插曲”' |7 y% H. z# }# t" S* n1 C

    8 L. H8 p2 @7 F( X. U* @" H0 h 1 I; K/ y# y, }+ E% L" w
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。! z* Q; P, A( w1 h0 z& a9 x
    % [4 c+ y0 b8 g
    模型本身的“小缺陷”# r) J+ H1 R  V5 n0 \+ G
    8 A4 q( Y2 O) }$ [4 `4 d9 q
    # k3 i0 o$ o5 Q
    模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩悖鋵嵰膊贿^是基于復(fù)雜算法的數(shù)學(xué)而已~”
    ( h& H$ c$ \  e: X* M/ k4
    4 P! y0 w- m  \' A( J  j- t
    5 j2 n! ^- K3 m( t! K( ^% C
    如何避免AI幻覺?" i- ?, a  S) C* V2 s% H

    & s5 R' [: E# {  u" {避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。, j8 `% m& B6 y- V$ n5 A; _* l. ?
    A. 檢索增強(qiáng)生成(RAG)技術(shù)
    & J0 l" x1 V( H! ~0 P$ Y* W" a - N$ H' E3 T/ p  {* g
    RAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:+ V0 s+ n, r5 ^& o
    生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅實的基礎(chǔ)。! F6 q' c9 ^+ v$ y! k( v
    生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。7 u) k- [% B$ c( s9 o$ b9 g
    生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗證生成內(nèi)容的準(zhǔn)確性。
    $ g9 u/ S( _; L! T$ K1 Z
    1 y& S5 o8 q0 R% e5 a
    例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。& J; x7 A+ c: I4 R* F" M: a

    - ^# K! n, G: O& F, r; RB. 基于反饋和推理的自我改進(jìn)機(jī)制
      L' {! ?. T; V% D$ p4 ]1 |4 d這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。
    ; d  h7 }% t+ m  O. R, r1 O) ~3 m4 N
    + ^; K2 h8 B; ]) d! \
    AI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”
    6 n& `0 J' n* D1 I! Q( \& wC. 提示詞的精細(xì)化調(diào)優(yōu)
    0 q; x4 m9 Q7 e* ~% F6 V通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。7 c: U+ [- m( b- h. g2 l7 [0 s

    ( {* \) X) k4 v0 {1 K( |4 l* d# s$ o , g3 B" `+ Q  K7 V1 m  ]
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。" D+ E' u) a' n! o0 I) |. Y2 d
    這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。/ R1 y8 O! t* y6 I) @. @
    # R3 \2 D6 Q# [9 V0 l* R
    , k& Y) g, r4 V4 }* I, @
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。
    ( r5 A2 H! a0 S9 w2 e) X) o2 d% G& `0 U+ Q) @
    A. 創(chuàng)新解碼技術(shù)! O" i2 s/ b4 C/ ^% W
    采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。
    * F( Z! }8 v6 s$ Q" |
    & k8 |) X% ^' x6 t; R' D* Z這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。3 f; X0 ^5 V6 t' n
    , _) ]8 [# O) ]9 p+ C6 q& v. k
    例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。1 r, g1 Z5 A0 P2 o8 r- a
    ( B  y: z  z/ j, E) l7 a5 M

    4 r* {6 a0 B1 I7 T; a1 y* ~B. 知識圖譜的應(yīng)用
    / e! _# Q7 f. M: y5 W0 W% ]0 d通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。; Z8 c0 k$ f- U) r0 O/ J- t1 M5 r& O

    , E0 S  H9 X* [3 _& q/ M想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實體,比如人、地點、事物或者概念。
    9 r4 c7 T5 U. n& V2 Y" a; P* J, \. r8 {& Q/ B7 L1 Z
    它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。9 ~  k/ ~: g8 y% W/ R& S6 z( U

    ) x0 g( {* S9 g舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。7 s7 r+ U4 [" v) \! H

    0 F/ Z- M' M  F3 ]- \) b+ h8 W

    . d2 T' D/ H2 Q* \  JC. 基于忠實度的損失函數(shù)' B! L1 D7 L5 f
    引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。; U0 @+ z$ |3 f* Y4 L
    0 B, s# n2 z. _4 S( x) o
    3 c" N! f4 [% {; W
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
    ' c8 U4 w! H- [
    , B. {; f9 `# \9 j% K" K  y( W- v

    : O* [! k8 V' w7 I# D/ d3 F4 HD. 監(jiān)督微調(diào)3 F, S) N! F% v& }( E! ]: y
    通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。2 x* v3 K* |  ~, l* X3 I9 d+ K

    ; a" j# h8 V  S. b6 k" J: a7 g % M6 D; [. [( x1 {$ l# o) S- T& S2 X- R
    舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    1 r2 P7 B; q7 O8 F6 u比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
    3 ]* Q2 {- y% m$ F1 j! j# {1 P# x( D& ~5 D! F4 o0 q
    三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。
    # F( h6 I. y1 q/ b; E+ G4 {5 EA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。3 n7 G( O  T5 l' g- H8 \2 Q# ?
    PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。* v* ~# l; v* x
    & [* E: ?: O2 W+ a0 {6 O2 x
    舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點提醒我喝水!毕到y(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。
    / o; p  k( Z6 L2 K2 B
    " ?4 t- b% r  h% c0 i" h
    - y* S0 U+ ]2 i& gB. ReAct(Reasoning and Acting,推理與行動):
    4 [' [: _- y6 ^* T% MReAct技術(shù)強(qiáng)調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。! W, ^* n/ Q& h, a% G0 V
    " o. N! j' A2 K) ~8 ?
    ReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。
    9 g* V8 Z0 y" N3 b8 S  S! V
    $ r0 R" j- j# A( |舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告!盧eAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。
    % m1 L# c  P5 O  Y6 S8 }2 \, @6 g& f* b8 [5 f0 G

    ) n2 n2 v6 p! @( V4 k& h9 W5 J$ I
    ) E: r4 d# ]: S  `; e6 y- L$ OEND
    3 _7 P' _7 a5 E文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?* P, l. R# w( l3 K
    $ E' D8 o1 f, z' `# }2 N
    所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。9 k: n8 v9 S% K
    其實,AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)
    ( f# X/ L, E4 ~! X# ?2 F2 q4 O6 L# I4 @6 H( A1 u
    ~~~1 ]' D1 F+ Z, U% Q8 G/ H9 e% D
    $ q7 X2 n& |  j2 ?) ]  G
    小問答5 I7 ]! z; E+ U+ |1 w. m
    請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    * Z& r6 o- {! _0 V- {+ Z: \) `9 b* X8 U  H
    ?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
    & b, p! q8 c) G/ D8 {$ d4 X2 z" T) E# T0 Z

    0 L7 u( \" M8 i" p+ V3 o
  • 回復(fù)

    使用道具 舉報

    發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則

    關(guān)閉

    站長推薦上一條 /1 下一條


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表