|
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~, B; t8 M* U0 _6 x+ u9 ^
, j' i I% G% e5 `& D) O8 F5 l+ w! A
s3cjfiq2bpv64018089032.png (83.82 KB, 下載次數(shù): 0)
下載附件
保存到相冊
s3cjfiq2bpv64018089032.png
2024-9-19 09:46 上傳
% B& F$ Q( }, R3 z3 v- B' m那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?+ O- k% C- x1 G' E7 B9 P2 K
m1nhngn3vtp2_1218089132.png (4.55 KB, 下載次數(shù): 0)
下載附件
保存到相冊
m1nhngn3vtp2_1218089132.png
2024-9-19 09:46 上傳
/ I- h% z2 b1 g, Q! l; K1
9 R( E( H3 ]7 [* uAI會產(chǎn)生什么樣的幻覺?( S9 g$ m/ d' ~
; T9 L2 `" U8 Z8 {' h
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。9 I( w4 y6 b( Y
事實幻覺:“假新聞制造機(jī)”
/ `: ?$ V0 Z; T9 u3 h( IA:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾/ y% j) i# I$ X/ j4 Q
vfixkfsjn0164018089232.png (84.98 KB, 下載次數(shù): 0)
下載附件
保存到相冊
vfixkfsjn0164018089232.png
2024-9-19 09:46 上傳
" f P1 k3 G6 P% ^9 h3 H: S+ e) Q
當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。5 r8 w9 [' O0 t7 J: m- H% ` Z5 A
B:事實捏造:AI生成完全虛構(gòu)的內(nèi)容
: k: ] o% ~7 }) B
8 X. }* J- m# k6 }+ Q
fdjwxhrxxsw64018089332.png (83.78 KB, 下載次數(shù): 0)
下載附件
保存到相冊
fdjwxhrxxsw64018089332.png
2024-9-19 09:46 上傳
5 t3 M% V- N' Z7 m& J5 g
如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。3 s( }9 A% y5 u6 S% S- d8 _3 c
忠誠度幻覺:“指令迷失”
! w! a: n* C7 B6 [: x7 q% i3 ]A:指令不一致:AI的回答偏離用戶的要求
: E! q9 s$ s) Q9 V& O& S4 r1 \$ c" p9 l
lj5nofjz3lz64018089432.png (111.32 KB, 下載次數(shù): 0)
下載附件
保存到相冊
lj5nofjz3lz64018089432.png
2024-9-19 09:46 上傳
7 v" `! U+ h S4 K7 V9 `4 S& M
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。+ C2 Z. G' ~' l
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
) s( R0 w, Z1 o& T+ E& x" c6 _4 W6 {
u2zly3oxlna64018089532.png (107.1 KB, 下載次數(shù): 0)
下載附件
保存到相冊
u2zly3oxlna64018089532.png
2024-9-19 09:46 上傳
* m4 T1 T6 P3 x+ p' ~; f, B假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個回答是正確的,符合春節(jié)的基本情況。
$ A% L; |6 N5 e% P) E然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。. c3 Q% N4 ^+ T1 |' M, a& D
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
( Q- {& q' _/ I1 t* b' |開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~/ t" c1 \2 q6 V
4 d8 |7 u* i! E3 i1 U# w
2
6 o( |$ q n* [AI幻覺有哪些特點
4 Y$ ~3 L P9 [! g8 _5 F+ K; ^* N
5 y) c( `, p. n- L. y6 d- i' e內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。
1 r; R) s. \( W* Y$ S/ h3
: A$ Z7 S3 y5 w9 zAI幻覺的“幕后黑手”
8 ?2 `9 k. x' s5 v) H) Z& W) h5 D) W
AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
. T0 L/ k: Z0 L
dvnqkknxg3r64018089633.png (76.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊
dvnqkknxg3r64018089633.png
2024-9-19 09:46 上傳
, V0 n* d$ d4 \+ g& j
訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。缺乏實時更新:AI通常基于靜態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
7 y9 H9 e( t' e3 R3 w+ b6 S
gyidky3j52k2_0518089733.png (5.36 KB, 下載次數(shù): 0)
下載附件
保存到相冊
gyidky3j52k2_0518089733.png
2024-9-19 09:46 上傳
5 q& E. F4 G% n, }
$ d1 X, Y! O$ E6 R/ i6 l訓(xùn)練過程的“小插曲”+ U1 F4 I; n; a6 h1 p( L: C/ z2 m! Z
: s$ ?! n0 V+ N% w
vhnjynkrbbb64018089833.png (76.77 KB, 下載次數(shù): 0)
下載附件
保存到相冊
vhnjynkrbbb64018089833.png
2024-9-19 09:46 上傳
5 z. V+ y# |% T! G% o
過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。4 Q0 n' V! F5 D. x
8 x" u5 v4 U- B9 W* j) e模型本身的“小缺陷”6 l3 n- s& C3 G
6 D9 ^8 u. h/ u2 b. |0 S
ud45jbu4t3k64018089933.png (95.42 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ud45jbu4t3k64018089933.png
2024-9-19 09:46 上傳
; u4 {2 O. B8 B: U5 z模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”1 [+ ^ k t+ X/ P, X
4/ x8 L4 g$ i3 w% ~+ H1 L9 o3 q
: p! N5 |) _8 {' p; b
如何避免AI幻覺?
' V4 X1 L% i h! f5 ?8 v, w. {3 o4 h
避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。
/ H0 N0 Z4 I$ A1 xA. 檢索增強生成(RAG)技術(shù)
: A8 M k1 {! G" R a- K1 `
yeu3jjrjjwk64018090033.png (2.32 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yeu3jjrjjwk64018090033.png
2024-9-19 09:46 上傳
7 t+ n! |5 E7 H4 q8 g3 b" T' jRAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:! @# E8 {$ h* R) E( _3 m% o
生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅實的基礎(chǔ)。. \1 j+ q7 Z7 M" y+ K2 T
生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
9 n% v7 H$ u6 N: C- f. \生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗證生成內(nèi)容的準(zhǔn)確性。( ?& r+ E2 `* N% Y
& W* O0 X6 {" n; B- a6 e2 A+ s
例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。: Q8 a6 e/ A4 v/ \
' H% e; `4 r4 q& x( h+ j6 }! @B. 基于反饋和推理的自我改進(jìn)機(jī)制
9 [, Y1 `& a6 d這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。! r: t' g( q+ G K
) @; ^. Z2 }5 h; O0 j7 o
jevyshka0uw64018090133.png (99.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
jevyshka0uw64018090133.png
2024-9-19 09:46 上傳
6 g' S+ k1 R3 ]; hAI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”
4 ]5 l& A( j" E5 K- S) {C. 提示詞的精細(xì)化調(diào)優(yōu)0 A$ }, \1 y. [4 G4 }1 t
通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
$ |. U7 o/ h' ]' x$ ?# o3 v! S$ S4 Y3 z2 O0 D8 c' n
yu54jj1b44q64018090233.png (92.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
yu54jj1b44q64018090233.png
2024-9-19 09:46 上傳
% u9 `/ w1 Q: m1 y9 n
例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。% Q( J2 z9 i! S/ n7 S
這種方法不僅提升了信息的全面性,也增強了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
r3 B1 ^. {1 ]3 m
dq0lgkffeow2_0618090333.png (5.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
dq0lgkffeow2_0618090333.png
2024-9-19 09:46 上傳
( H) I% g" m! w9 d& q5 X); B- ~* h8 {4 w, K: o4 w- t8 I! [
二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。
. r! e# p5 I) z
* G' u8 [2 I- e [8 {) TA. 創(chuàng)新解碼技術(shù)( }8 q/ H5 ?- p0 A
采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。
' s$ c+ K$ I/ Q) ]3 W3 e4 T0 G
upud11kgwnd64018090433.png (2.22 KB, 下載次數(shù): 0)
下載附件
保存到相冊
upud11kgwnd64018090433.png
2024-9-19 09:46 上傳
1 l( z0 S( h _* z這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。9 t2 i; U1 q7 y. s
/ L& b) J# ]$ l3 J! C# E5 f$ M
例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。# \/ J1 K+ Q0 `2 N
* F4 `; u+ X+ f# Z* V }
2 |8 ?; k3 [1 n5 [5 y' I; XB. 知識圖譜的應(yīng)用. i+ }- i0 z @* [* Q3 V
通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。* p1 o/ m& s; H b5 `8 u
oooagm3jnko64018090533.png (1.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊
oooagm3jnko64018090533.png
2024-9-19 09:46 上傳
) o2 I4 S ^* T4 c想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實體,比如人、地點、事物或者概念。9 F, L6 ]3 i- m; ?( s: c
/ i, m% L9 j* Q# I3 f8 }- a/ v它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。/ b* h- P# C6 }" l
3 \( V' Y* ~/ v# ^; }. y舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。
" J: w( G9 W# \0 D
2 b: m2 b% `! o' U3 J6 E+ j5 {+ ~, O# N; c& ]' g( @) \, |
C. 基于忠實度的損失函數(shù)! X8 L- w2 g. B! l4 _8 t
引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。! J& V7 v: D$ m, M; N' B
" ?$ f+ X5 A$ T7 w' U& G( U
a0rn03ciegi64018090633.png (90.68 KB, 下載次數(shù): 0)
下載附件
保存到相冊
a0rn03ciegi64018090633.png
2024-9-19 09:46 上傳
3 A4 x5 |. u8 R( V: C0 ~
舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
. b/ d0 Q! ?6 v
, T7 P. I+ |7 O v0 h& S' L4 d, z, @# h
D. 監(jiān)督微調(diào)' U8 V" M, {% w f
通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。
/ ]6 v2 q" J* S. u9 f0 l4 P- Z9 J6 h9 I; M& Q1 Z. _% |
zb1pcgztzs164018090734.png (126.48 KB, 下載次數(shù): 0)
下載附件
保存到相冊
zb1pcgztzs164018090734.png
2024-9-19 09:46 上傳
9 P: \4 U+ h$ g/ @1 r/ m [舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。% K3 k2 e0 M% A L
比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。; |! s7 w1 B+ A; u
0 C+ ^# o, v" v5 u* m- N0 _1 C) e
三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。$ h- f5 e) c4 ]1 _3 `, @
A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。4 Z; A- S# Q6 p$ Z7 L. [
PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。0 N$ z8 a2 Q7 X: Q& E% j5 p
wigpiccet0164018090834.png (40.31 KB, 下載次數(shù): 0)
下載附件
保存到相冊
wigpiccet0164018090834.png
2024-9-19 09:46 上傳
+ O: W+ f! D" `; I舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點提醒我喝水!毕到y(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。
7 r% h/ R5 J5 s- I7 i( \" B' q; z: ~7 C' t
mhlif5glzn564018090934.png (109.53 KB, 下載次數(shù): 0)
下載附件
保存到相冊
mhlif5glzn564018090934.png
2024-9-19 09:46 上傳
$ @; G0 t! ]* E1 g }9 \3 `- H4 G
B. ReAct(Reasoning and Acting,推理與行動):
6 j: X- U* G+ \4 S! y3 MReAct技術(shù)強調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。% W6 E+ z# A! r* e M& e
2 k/ N: f$ {1 _2 }" wReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。
" _5 ^7 z, @, C4 t6 S2 b9 U8 f/ l2 H8 _- e" J
舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告!盧eAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。
# F/ U: i- s/ ^) Q
3 S$ _% p, w/ d5 F7 i6 T7 ~2 T7 s/ Q2 Q0 R( W7 p7 {# R$ k
: A/ g1 J* ~$ vEND
% P/ |! m5 k, r Z4 C6 g: i文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?5 }* z3 p8 J/ z5 G5 C5 M, F) d, e
0 M% M' R/ r% O& I) A4 B所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
2 W( L; j. ~1 G, A% [其實,AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)
# C* h9 @$ l, \! [, w
& F( `9 V$ v5 ^9 D$ Q" O9 _: K~~~$ p' {7 R; s/ T2 P. y" }
' Q# y# D# G ?, W小問答; r' U0 X, P% l* J& K- i4 j
請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
& H( b3 [: t# i8 M8 b' a/ ^: _+ A, m0 i+ H7 D( W: g
?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~* \ b j( w5 a9 X. _5 L0 S
. W# L* B! v' Y3 v& J3 D
( T0 H8 w$ Y3 }5 L. p& O |
|