|
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~; t% k E) o4 g3 x5 P) z# P
( N2 i! d. e7 A% h' ?6 i
zpmfi1pfciw64013564718.png (83.82 KB, 下載次數(shù): 0)
下載附件
保存到相冊
zpmfi1pfciw64013564718.png
2024-9-18 09:46 上傳
4 E# B' X) Z. M, T
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?2 d! R4 V% {8 L! M' i3 `3 z
bfc4zcfcpkh2_1213564818.png (4.55 KB, 下載次數(shù): 1)
下載附件
保存到相冊
bfc4zcfcpkh2_1213564818.png
2024-9-18 09:46 上傳
' [5 P0 S% Q; |0 z- ~1% r9 \$ W {4 Q" v- @( n; p
AI會產(chǎn)生什么樣的幻覺?- u/ C5 D2 ?; t5 D
?8 i# \& w7 m6 L0 S" s可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。' t9 E1 |+ l0 v. Q; S
事實幻覺:“假新聞制造機”0 C) w% v( w% J ?! P: r
A:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾
2 x; n$ c# v0 M1 v! R
rjjugz5kou164013564918.png (84.98 KB, 下載次數(shù): 1)
下載附件
保存到相冊
rjjugz5kou164013564918.png
2024-9-18 09:46 上傳
9 L2 K) W7 F/ V當被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。+ V( C. N4 m& N
B:事實捏造:AI生成完全虛構的內(nèi)容
4 }$ a$ H2 `( ^( t3 B/ S! K; T P, z, D2 S
xcnqg3gbzo164013565018.png (83.78 KB, 下載次數(shù): 1)
下載附件
保存到相冊
xcnqg3gbzo164013565018.png
2024-9-18 09:46 上傳
) k8 u# H f7 x$ w如果AI描述說“2024年,考古學家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構的信息,截至目前沒有考古發(fā)現(xiàn)或科學證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。
j# |+ h l# w4 e5 }忠誠度幻覺:“指令迷失”1 n/ U" {. @9 r3 O4 V. e5 M
A:指令不一致:AI的回答偏離用戶的要求! L4 o& r& ?. o( j# X1 ]$ D% y3 e
; e/ [* I f- I
swa45i2tfsa64013565118.png (111.32 KB, 下載次數(shù): 0)
下載附件
保存到相冊
swa45i2tfsa64013565118.png
2024-9-18 09:46 上傳
# w" o U3 h; h3 @8 i如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學” ,這就完全偏離了原始的問題。7 ?, w- @. J' T+ \0 D% n
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
* w E# C* E7 Y( m8 |
44z5xxldxdp64013565218.png (107.1 KB, 下載次數(shù): 1)
下載附件
保存到相冊
44z5xxldxdp64013565218.png
2024-9-18 09:46 上傳
, @" I1 m" M) {# p1 L
假設在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個回答是正確的,符合春節(jié)的基本情況。6 ^/ j: X w5 r# l7 y' a8 u
然而,如果AI接著說:“春節(jié)是紀念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。
$ W% d1 O' u Z0 \0 u% U. K, KC. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾: U4 I0 I o9 J: X
開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~; f' c9 n( n% w. t1 S) @1 {3 c" p
" b) c" M. E& b
2
: c B9 b' |: F: k4 oAI幻覺有哪些特點1 y7 c1 \5 L6 A: R' @' F0 K( o
* Z: j, g# Q* I$ x內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。上下文相關 :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關。不可預測性 :很難預測AI何時會產(chǎn)生幻覺,可能幻覺也很難復現(xiàn),就像人很難在今天做一個與昨天相同的夢。
: l: E1 M v2 l& Q+ R$ H: _39 K" B+ \! I* e# v9 L6 q4 G8 \
AI幻覺的“幕后黑手”' Q6 `! @( t1 B! e
5 w3 ?0 J7 S" c8 DAI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
/ [( l# P* u6 q8 c: y' q; |/ e
0lu5d32d4d364013565318.png (76.24 KB, 下載次數(shù): 0)
下載附件
保存到相冊
0lu5d32d4d364013565318.png
2024-9-18 09:46 上傳
P& O! I+ X& [2 a
訓練數(shù)據(jù)局限:AI訓練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學習,課本是錯的,考試自然無法答對。缺乏實時更新:AI通;陟o態(tài)數(shù)據(jù)訓練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復習,拿一本82年的教材是考不了24年的高考的~0 S' i$ S. P0 e
15nlv5jblhi2_0513565418.png (5.36 KB, 下載次數(shù): 0)
下載附件
保存到相冊
15nlv5jblhi2_0513565418.png
2024-9-18 09:46 上傳
( F$ y4 @6 H0 ?. _6 p5 K
$ N& b. P7 c% g
訓練過程的“小插曲”
' N& a/ C: ?' {* X
3 Y6 H" a! @1 g* [! \5 d
2tu2cuwfrah64013565518.png (76.77 KB, 下載次數(shù): 1)
下載附件
保存到相冊
2tu2cuwfrah64013565518.png
2024-9-18 09:46 上傳
6 Y2 Y+ [+ ]5 T# q/ |5 F& Y
過度泛化 :模型可能過于依賴某些模式,導致在新情況下推導錯誤。就像我們學習時候只記住了公式,卻不會靈活變通。上下文理解不足:AI可能無法完全把握復雜的上下文關系。在處理多個復雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。
- K9 j8 B. e, y. P' B
2 v% n9 ?4 T. l6 w0 |6 {# q4 p模型本身的“小缺陷”- c; i. m" \2 u' W* |
, |( _7 ?# H4 `+ `
vc4rcxf53ol64013565618.png (95.42 KB, 下載次數(shù): 0)
下載附件
保存到相冊
vc4rcxf53ol64013565618.png
2024-9-18 09:46 上傳
5 g. D- i1 c6 Z' t
模型結構限制:AI通過統(tǒng)計模式預測,但可能無法真正理解信息。“你以為他真的懂你,其實也不過是基于復雜算法的數(shù)學而已~”
0 L9 p. E2 ^& J! g4% R% Q4 K9 h& k7 K) D3 S
3 A7 m$ Z* y% j/ m0 @. @如何避免AI幻覺?9 c& ]) F& u5 U4 {0 w: r
8 J7 ~7 v# g; V* ~$ I6 O
避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準確。1 S6 F$ q9 i2 S& o9 T0 s5 A
A. 檢索增強生成(RAG)技術
4 \' t8 S1 t4 W; C( u8 k
4fr33s444ic64013565718.png (2.32 KB, 下載次數(shù): 0)
下載附件
保存到相冊
4fr33s444ic64013565718.png
2024-9-18 09:46 上傳
( [# n, H5 `$ x8 [* C* n3 p7 n; r4 ~
RAG技術通過引入外部知識來幫助AI生成更準確的內(nèi)容。主要方法包括:
2 p: E7 d) v$ H; B生成前檢索:在內(nèi)容生成前,系統(tǒng)會預檢索相關背景信息,為生成過程打下堅實的基礎。
5 e s2 y5 O; _! n7 C生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
* }, A" x0 u2 R9 { C生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進行對比,驗證生成內(nèi)容的準確性。
2 U2 H; H, j: W- I
1 T* d4 S- y2 P% m, K1 a) Y! K例如,當AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準確信息生成回答。
" A5 i: t5 j9 j, u, Z
1 O# w* v7 ^% x* ^B. 基于反饋和推理的自我改進機制6 e, z7 C% _6 p% ^& d& C( j
這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。& g, t8 m! a" A# e+ v
M8 i, I4 u# F" Z# V5 f% u
grzqozroywl64013565818.png (99.05 KB, 下載次數(shù): 0)
下載附件
保存到相冊
grzqozroywl64013565818.png
2024-9-18 09:46 上傳
+ P: W; E6 L. u4 E8 G p5 v
AI在生成答案后,會進行自我審視,提出疑問:“這個答案是否全面?是否有關鍵信息被忽略?”
$ N. y0 A* g& W2 fC. 提示詞的精細化調(diào)優(yōu) U5 e- @+ f0 e8 V+ p" j/ \8 C. ?5 \
通過精心設計的提示詞,引導AI生成更可靠、更精確的內(nèi)容。5 ~$ B; M1 p! F8 a
1 b9 P& V1 K; y- u& }2 A; F' r/ E
encqtl1sq2564013565918.png (92.14 KB, 下載次數(shù): 0)
下載附件
保存到相冊
encqtl1sq2564013565918.png
2024-9-18 09:46 上傳
" k. p; `1 @: s! E" b例如,在地圖導航的AI應用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。0 v% y; e4 w2 y4 l% ~+ }/ C
這種方法不僅提升了信息的全面性,也增強了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
4 J4 l; k. b2 r4 Q/ M
tjvlggz4eef2_0613566019.png (5.05 KB, 下載次數(shù): 1)
下載附件
保存到相冊
tjvlggz4eef2_0613566019.png
2024-9-18 09:46 上傳
! c' K7 Z& P+ T) t/ N$ u. u
)
/ N& R$ Y) x/ j9 r. _3 n/ P二. 模型開發(fā)不能停AI模型與訓練過程的不斷進化是減少幻覺產(chǎn)生的關鍵。# U, k q( \( g& K5 r
- \0 R: T, T! L* I7 C) TA. 創(chuàng)新解碼技術
6 ~7 M9 v ^9 q+ z3 B @* O采用新的解碼策略,以便更精準地處理語言上下文,例如上下文感知解碼(CAD)。2 K* @3 W8 r! h
ddaagb0yqfw64013566119.png (2.22 KB, 下載次數(shù): 0)
下載附件
保存到相冊
ddaagb0yqfw64013566119.png
2024-9-18 09:46 上傳
9 U5 k I4 r6 _) q' r5 z2 u9 h這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關注所提供的上下文,而不是僅僅依賴于模型在預訓練階段學到的知識。
2 U/ q; y& x- O$ g% X
' ~* x1 v) E. |4 ^" i例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。: L) C: x8 S& z Q
% V, I1 ]7 u0 W5 [
6 j) k4 r3 R/ n$ NB. 知識圖譜的應用8 m- ? O8 ]' h
通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準確和有深度。! O+ w- K3 H* p, P5 Y) p( r
keos5bsrbkp64013566219.png (1.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
keos5bsrbkp64013566219.png
2024-9-18 09:46 上傳
3 O9 v2 X8 @; L/ R. g I想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡中都是一個實體,比如人、地點、事物或者概念。 T& b1 Q9 [& R! s! e
" t9 T7 J5 ^, x/ a b3 E+ _
它們通過各種“關系”相互連接,就像社交軟件上的好友關系一樣。知識圖譜通過這種方式組織信息,就像一個超級學霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。+ t& V7 a" q% R" Y7 N7 ], J7 V @
# \9 q) @: A& f7 T: d: W4 S; ~3 I
舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。$ o& Z2 y0 E& _9 [& Z
5 t# p- @. o; @8 O9 ^
1 N: t4 e0 c) R) L2 X$ I9 LC. 基于忠實度的損失函數(shù); l7 R5 I2 L* {7 d' h
引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進行懲罰,以減少不準確的信息,從而把AI從幻覺中“掐醒”。# }9 E3 m+ X0 J& o& H# E1 t
2 a8 P4 Q# C" o0 r/ s
atbxsjnsezo64013566319.png (90.68 KB, 下載次數(shù): 1)
下載附件
保存到相冊
atbxsjnsezo64013566319.png
2024-9-18 09:46 上傳
! R }$ y- X. ~7 |/ L1 K舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學習到生成與原文相符的內(nèi)容。
3 W3 C" @7 k" y+ f" ^
' P% }# V7 u* {9 e% }9 M& G. V& M& ]$ t
D. 監(jiān)督微調(diào)
$ X9 V9 c+ A7 E: U1 G1 y) D( W0 L通過特定領域的數(shù)據(jù)進行微調(diào),提升模型在特定任務上的準確性。0 `" c) C% O! j0 s- z. q1 h+ H: N: p
6 o3 F2 K; z9 y- E0 P' P
oxhgbc10kro64013566419.png (126.48 KB, 下載次數(shù): 0)
下載附件
保存到相冊
oxhgbc10kro64013566419.png
2024-9-18 09:46 上傳
* D! Z: ]; j* Q* m- }
舉個例子,一個通用的語言模型可能對通信術語理解有限。通過使用大量通信行業(yè)資料進行訓練微調(diào),可以顯著提高模型在通信領域的準確性。
{( k0 @( B- V1 Q! C" X- p x- Q比如,它可以更準確地區(qū)分相似通信術語的區(qū)別,如EBGP和IBGP。% {8 Z0 y* p. u- [7 S
9 M! j+ V$ G3 y' L3 s三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復雜的任務,減少在生成文本時出現(xiàn)的錯誤或不準確的信息。: i1 B- ?: P1 \" x5 E2 I9 ]! s
A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務。) ~5 F5 l2 h) Y: z' N) d' e# ~
PAL技術像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導AI系統(tǒng)如何完成任務。這種技術的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務。7 G% S9 n0 G; m3 g$ p
i304x2nkbyj64013566519.png (40.31 KB, 下載次數(shù): 1)
下載附件
保存到相冊
i304x2nkbyj64013566519.png
2024-9-18 09:46 上傳
. T5 g; X# }6 R5 J$ o5 ^+ Q( B; P5 X舉個例子,如果你告訴基于PAL技術的AI系統(tǒng):“我需要在每天下午3點提醒我喝水。”系統(tǒng)會設置一個自動化的日程提醒,每天按時提醒你,而不需要進一步的交互。. p7 H% ~5 \5 _$ u
3 A7 k; T& L% |8 U% y3 s
g4bsldkggfu64013566619.png (109.53 KB, 下載次數(shù): 0)
下載附件
保存到相冊
g4bsldkggfu64013566619.png
2024-9-18 09:46 上傳
4 `% l# N7 }* N& KB. ReAct(Reasoning and Acting,推理與行動):& I$ p8 t! _: q: m- n/ \! h
ReAct技術強調(diào)AI對上下文的理解,以及基于這種理解進行的推理和決策。
! D& g8 g: i. ?& G
: D1 I6 w: }( G- JReAct技術更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進行推理,并采取相應的行動。這種技術的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務。. B" x! E; C! u4 f2 |5 t- s0 }+ D
; Q( c: j5 A2 x* L6 t# g舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準備一份報告。”ReAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準備報告。9 H) M. Z: M! `' \0 s" @4 [- ?
9 d6 h) o5 O+ Y: W& ~$ X2 r
" y$ U$ W* o* M$ L3 u: I# M
- q% O9 s" J! s0 d3 Q" EEND8 d. b$ }# J) N2 `. N$ e
文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
) L2 c! M+ @' u1 P0 h' x p6 Q' g2 a+ R; O0 g
所以下次當你的AI應用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
7 m- E( ~2 d: {( @; L- w) ^: r其實,AI也是在學習中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導它,多用一點耐心教導它,它就能從“夢游”中醒來,為我們提供準確、可靠的服務
$ |7 v$ v4 e- W! }. F2 y1 e2 [6 i* G. d* K( e. ]
~~~; t, Z4 N4 Q$ ~: d$ R' ~
5 D. ]$ H" \8 G小問答8 V" F$ B! O' V1 i: z6 F4 [+ Q
請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
1 k* s+ H: z2 G7 R4 m
5 [1 ?9 i; t. h8 a5 ^- E% C?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~! `" s) w2 b0 r: X/ j# a* r9 ~( {
) l4 p1 t8 h4 k( _/ ^8 o2 u4 G0 W2 h. q7 e" [
|
|