|
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
7 b9 y! L5 E* G+ l& l! y6 R8 u9 Y2 e9 c2 M4 [" g) l$ b
syimypeif4j6401183011.png (83.82 KB, 下載次數(shù): 2)
下載附件
保存到相冊
syimypeif4j6401183011.png
2024-9-15 09:49 上傳
! P4 g( o Y7 {" X( k6 `$ Z
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?
5 H2 r x, u m! T! E- `
3gsfhzuwk0e2_121183111.png (4.55 KB, 下載次數(shù): 1)
下載附件
保存到相冊
3gsfhzuwk0e2_121183111.png
2024-9-15 09:49 上傳
& D S+ P6 T# Y3 P1
: {+ O4 n# [3 y1 g- y" E4 H' jAI會產(chǎn)生什么樣的幻覺?* o2 o% r6 q! Q' j3 z( L* ]
: Z7 ?( z( n& C' ?5 u0 K+ W M
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實(shí)也沒這么簡單,AI幻覺主要有兩類。
+ z9 y' y7 t! [9 |# ^' m事實(shí)幻覺:“假新聞制造機(jī)”
% R# w: `: r: _2 l0 P: KA:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾
9 b- a5 E, P7 D0 x, e9 Y2 s
gdfcldtlg506401183211.png (84.98 KB, 下載次數(shù): 2)
下載附件
保存到相冊
gdfcldtlg506401183211.png
2024-9-15 09:49 上傳
! t( j5 o1 l. _' k' J當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。
. v! y0 Z. A+ k3 P( ]9 @; mB:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
* B) n6 }: D* n; v% [) |* e; C. F6 s$ F) S$ D: i! o- P" ^
uygn1c3fw4l6401183311.png (83.78 KB, 下載次數(shù): 2)
下載附件
保存到相冊
uygn1c3fw4l6401183311.png
2024-9-15 09:49 上傳
2 |2 y4 E1 O, Q \如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。
; m1 w$ J, Y" R5 R忠誠度幻覺:“指令迷失”
7 G& T6 ?3 L8 i- l5 J4 G; W; o2 NA:指令不一致:AI的回答偏離用戶的要求" O" Z) I7 X- X. X) c
: I# D( U- n* t' {& @
ubopicvgtbw6401183411.png (111.32 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ubopicvgtbw6401183411.png
2024-9-15 09:49 上傳
2 ]6 c" ^9 Q) a
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。
- Y' a5 C' u. G! {% M1 s" \B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
+ K8 U, Y% ]7 B# Z' O! S3 m7 @
hvgdukm530p6401183511.png (107.1 KB, 下載次數(shù): 2)
下載附件
保存到相冊
hvgdukm530p6401183511.png
2024-9-15 09:49 上傳
- D8 \4 w9 U5 U1 ^假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝。”這個回答是正確的,符合春節(jié)的基本情況。. ?+ u' `7 ~ e
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。 }6 b. i- d h- r6 M
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾2 { p, X( o5 l4 O, e! {) Y
開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
% b9 n# X( M3 O9 k( n G1 [$ {) ~% J; G- J4 X
2
0 c5 \+ B* V; V) m2 O" o: GAI幻覺有哪些特點(diǎn)1 D; S2 q6 u2 I6 J) L: r% Y- T
6 {. t+ l5 ]- A( A' N' F
內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。
6 t! J1 O) E7 x0 Z3
& q: I8 V8 e% Z) rAI幻覺的“幕后黑手”& a$ }( Z; g1 }% y/ Q3 i0 n+ j) M3 r
; a/ w, F% [5 l+ r# ? e
AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
' e% V6 n, g6 p$ l
vchgejyketw6401183611.png (76.24 KB, 下載次數(shù): 2)
下載附件
保存到相冊
vchgejyketw6401183611.png
2024-9-15 09:49 上傳
0 g3 }' y3 G- R* O& ]/ d訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。缺乏實(shí)時更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
- G. q, Q/ X1 W/ R2 @( T
3qvu3przvht2_051183711.png (5.36 KB, 下載次數(shù): 3)
下載附件
保存到相冊
3qvu3przvht2_051183711.png
2024-9-15 09:49 上傳
6 ]! [$ @$ M2 l, }
9 U+ ]( X. h# N+ K訓(xùn)練過程的“小插曲”
7 Y' R$ @( g: p2 C% I) b& z
: s+ |! c% @) p! G# D4 r
wzwd2pdnth06401183812.png (76.77 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wzwd2pdnth06401183812.png
2024-9-15 09:49 上傳
( ]* ?) m: I, a
過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點(diǎn),或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。 p5 L/ i5 n0 C, w6 ]+ R
$ q& a! w$ _, o/ q; y' C模型本身的“小缺陷”0 z, J( t7 ~* i
% K h! i, _. z a
j3zyrqy1vwi6401183912.png (95.42 KB, 下載次數(shù): 1)
下載附件
保存到相冊
j3zyrqy1vwi6401183912.png
2024-9-15 09:49 上傳
: C# s! b% S$ z/ R; X模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預(yù)測,但可能無法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”
$ Q4 h2 D: @- \7 y4 G/ m49 f6 i9 |! @& G0 J* ^
" k5 F- R# S& l2 x G% }7 Z; y3 Y如何避免AI幻覺?8 A9 I3 k" Z0 W. J
% ?$ J3 d. u6 m8 m0 z$ b+ w避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。5 O5 W1 o* f+ p) i5 Q5 S; U3 j
A. 檢索增強(qiáng)生成(RAG)技術(shù)
: Q- E; M3 j# [
h45y1b2e0eg6401184012.png (2.32 KB, 下載次數(shù): 2)
下載附件
保存到相冊
h45y1b2e0eg6401184012.png
2024-9-15 09:49 上傳
5 S8 I- J8 E+ m
RAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:4 ]/ i9 G3 N# P
生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅(jiān)實(shí)的基礎(chǔ)。3 Z' l0 d; ~! `0 R% z, k2 h
生成過程中檢索:在生成過程中,系統(tǒng)實(shí)時檢索并整合外部知識,確保內(nèi)容的時效性和深度。1 |- l: [, C$ m( X; H
生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。6 ?6 D! Z) R- {
# @1 U9 P- T+ A# ~/ [) N* W% {
例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。! M, c% c' o* d h: s( S
1 i2 {' e+ U8 g# XB. 基于反饋和推理的自我改進(jìn)機(jī)制0 D8 ?4 B/ Y# @) I- L
這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。& q1 \; q7 |" G* _( W
8 n$ C. ~" V9 z* Y8 y4 r. [
4zbhv33auoi6401184112.png (99.05 KB, 下載次數(shù): 2)
下載附件
保存到相冊
4zbhv33auoi6401184112.png
2024-9-15 09:49 上傳
. ^, b0 \2 X+ }; b, r' X( Z
AI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”
8 P: I- i% U( j5 {C. 提示詞的精細(xì)化調(diào)優(yōu)7 T, Q1 F2 \- \; {
通過精心設(shè)計的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
6 y& N. G% q+ m& R; y6 G/ u& b. s3 S0 {* i6 O
1btyypediar6401184212.png (92.14 KB, 下載次數(shù): 1)
下載附件
保存到相冊
1btyypediar6401184212.png
2024-9-15 09:49 上傳
+ i9 X' y+ c; J& y( q
例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。 Y1 ^5 \2 } |9 M6 ~: }
這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。' k3 d+ b( L% o/ r6 R
ewbmml5gfhp2_061184312.png (5.05 KB, 下載次數(shù): 2)
下載附件
保存到相冊
ewbmml5gfhp2_061184312.png
2024-9-15 09:49 上傳
9 W! j# v6 _0 L" u( _
): h T0 E- V0 _6 Y& n* s
二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。2 ?$ Q2 q* l9 R( A: H& J! M$ X
2 X; J5 q( e n' P$ n
A. 創(chuàng)新解碼技術(shù)
5 w! `( m$ U" j6 H采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。% v2 B9 p7 w7 K4 N# S7 S
pevsu2leeyk6401184412.png (2.22 KB, 下載次數(shù): 2)
下載附件
保存到相冊
pevsu2leeyk6401184412.png
2024-9-15 09:49 上傳
% Z3 U( H; a/ E6 ?- C& p2 p/ A! j這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。" E3 x2 J- Q+ S0 L. {
6 ?* t$ m- [' h: c例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。* T- x' x# b# o- V- w
9 w5 d& L8 ]. ]- m! a- X+ E
) \ J$ j9 ], O; J: V# Q" r& J6 y, c% OB. 知識圖譜的應(yīng)用
9 ]- n8 N# y6 m, x" e* F通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。" I: \: } b Z% o4 \: b
edekxjzhbnz6401184512.png (1.79 KB, 下載次數(shù): 3)
下載附件
保存到相冊
edekxjzhbnz6401184512.png
2024-9-15 09:49 上傳
* n2 u7 A' L6 ?% `1 w( s& ^6 f+ M想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實(shí)體,比如人、地點(diǎn)、事物或者概念。: ]' k2 \& L, {$ W9 d, A# k
8 t/ ~0 d( f$ M1 ?. `它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。. H a; ]& }! I7 \4 u! g2 `- k
* S+ ?7 m/ \ H5 R$ G舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。: h% f2 h' I, [! v# m1 N: \, {
! y! c1 C+ L/ _7 D. h2 n
& v: r* D! A d7 c, Y8 W
C. 基于忠實(shí)度的損失函數(shù)7 g. ?) t6 k. z
引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。& R: ]4 c4 s0 j1 A+ L5 k
3 T) _% J: h s
2eklg21dwbl6401184612.png (90.68 KB, 下載次數(shù): 1)
下載附件
保存到相冊
2eklg21dwbl6401184612.png
2024-9-15 09:49 上傳
+ y# X; Y, ]4 ]9 e6 E6 O- x, S
舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
- K5 K& p0 Z3 m" |7 R4 J; p' Y A% l1 c e
* Q8 w' m+ }# m( [& ^
D. 監(jiān)督微調(diào)! H4 D4 r7 r9 n6 k
通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。; C1 g" p$ d1 k; p: t) U- j+ |8 n
2 N0 E5 L' P) {& \
xulkj4si3tn6401184713.png (126.48 KB, 下載次數(shù): 1)
下載附件
保存到相冊
xulkj4si3tn6401184713.png
2024-9-15 09:49 上傳
5 r, n7 T# ^) t' n ~; A& h舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
2 G, Z3 O( i" u' w" \比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。' B- T9 g8 K. b* B; @
. ~* X! x0 d" T5 ~7 ^& p三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。, R. z: t9 C) [# p; r Y
A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。
& R5 E, o9 s- U. b" i. m* s" PPAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。+ s- L; Q; B8 D: ?1 A* i4 n# K
rs2ki3x1ihf6401184813.png (40.31 KB, 下載次數(shù): 2)
下載附件
保存到相冊
rs2ki3x1ihf6401184813.png
2024-9-15 09:49 上傳
e |) q7 p r* ^, ^
舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水。”系統(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。
2 M$ D9 U* P8 N! m& M" a1 M, z: y
% ?, M- D) `! h2 ^
obthtznez0z6401184913.png (109.53 KB, 下載次數(shù): 3)
下載附件
保存到相冊
obthtznez0z6401184913.png
2024-9-15 09:49 上傳
+ n2 a* T k# L* A
B. ReAct(Reasoning and Acting,推理與行動):
" s* n. ~, C8 ^& T# h! ^! SReAct技術(shù)強(qiáng)調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。: f. n# o% T/ L! t# c1 L/ P% ?
4 a) N" G# b/ q' b, ]3 OReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。
0 d: Q/ m, h( b! L' K0 W& f) [/ n
舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報告。”ReAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報告。
3 e9 O) B5 E2 f1 ?! Q
4 n: T2 Z7 P1 r) V8 a7 B/ o& Q$ m3 _. f' c& N
0 l9 V3 c" h( N! g
END
# }0 y" K- m; }" F- O- y文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
9 g5 c0 p9 y4 n6 G& \4 s( B q! a9 q. E# W
所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
: P( b* n6 q& H) O5 k$ g; V其實(shí),AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù). W3 A' [" D H; Y7 b/ y
2 c, H# G* ^! P# e, L5 z$ {
~~~
7 O4 M0 g# e( M) c9 @2 j9 F K, d7 S8 a9 s) Q1 x
小問答
* {4 |! l/ u1 W+ D請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
& v7 A1 \! b1 D8 U+ Q# q
; b. G0 @ x, g. Q?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
* E* ]' h, H+ i, L1 v# R+ l8 ~& u; I6 S
, Y f2 F: D9 T- C& F7 P, O
|
|