青青青久草,四虎永久在线精品,二区免费视频,一级毛片在线直接观看,黄网在线免费观看,美女露全身永久免费网站,色婷婷六月桃花综合影院

人類幻覺比AI要嚴(yán)重多了

人們很容易對deepseek、元寶、ChatGPT這些AI產(chǎn)品吹毛求疵,批評最多的就是AI幻覺,通俗說就是你問AI一個問題,對方回答振振有詞,看似嚴(yán)絲合縫,但其中有的內(nèi)容是捏造的,弄得你對它半信半疑。

要了解AI幻覺為何產(chǎn)生,先得了解AI模型主要是通過從數(shù)據(jù)中尋找規(guī)律來學(xué)習(xí)進(jìn)行預(yù)測。按照谷歌對AI產(chǎn)生幻覺的官方解釋,其原因主要有兩條:

最核心的是訓(xùn)練數(shù)據(jù)的質(zhì)量和完整性。如果訓(xùn)練數(shù)據(jù)不完整、有偏差或存在其他缺陷,AI 模型可能會學(xué)習(xí)不正確的模式,導(dǎo)致預(yù)測不準(zhǔn)確或出現(xiàn)幻覺。比如,基于醫(yī)學(xué)圖片數(shù)據(jù)集訓(xùn)練的 AI 模型可能會學(xué)習(xí)識別癌細(xì)胞。但是,如果數(shù)據(jù)集中不包含任何健康組織的圖片,AI 模型可能會錯誤地預(yù)測健康組織會癌變。

另外一點是,AI 模型可能難以準(zhǔn)確理解現(xiàn)實世界的知識、物理屬性或事實信息。缺乏依據(jù)可能會導(dǎo)致模型生成看似合理的輸出,但其實是不正確、不相關(guān)或無意義的內(nèi)容。這甚至還包括編造指向從未存在過的網(wǎng)頁的鏈接。例如,用于生成新聞報道摘要的 AI 模型可能會生成包含原始報道中未包含的詳情的摘要,甚至完全虛構(gòu)信息。

如果說AI模型回答問題的準(zhǔn)確性,主要依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,但他們又不能主動驗證信息的真實性,那么從理論上來講,人類可以通過批判性思維和多源信息驗證來評估信息的準(zhǔn)確性,但事實果真如此嗎?

聲譽(yù)良好的Vectara在2025年3月對目前市場上主流的AI大模型測試發(fā)現(xiàn),大部分主流大模型產(chǎn)品的幻覺率大都處于一個較低的水平, Gemini-2.0-Flash-001,以0.7%的低幻覺率位居榜首,顯示出其在處理文檔時幾乎沒有引入虛假信息。此外,Gemini-2.0-Pro-Exp 和 OpenAI 的 o3-mini-high-reasoning 模型分別以0.8%的幻覺率緊隨其后。

這樣的幻覺率已經(jīng)遠(yuǎn)低于我們?nèi)祟愔械膶I(yè)精英了。當(dāng)前頂尖大模型在知識密集型任務(wù)和結(jié)構(gòu)化場景(如代碼生成、合規(guī)審查)中已超越人類專家,只是在開放性創(chuàng)造(如文學(xué)創(chuàng)作)和現(xiàn)實經(jīng)驗依賴型任務(wù)(如復(fù)雜倫理判斷)上仍有差距。

以醫(yī)學(xué)為例,世界衛(wèi)生組織曾公布,臨床醫(yī)學(xué)的平均誤診率為30%,其中80%醫(yī)療失誤是思維和認(rèn)識錯誤導(dǎo)致的。另據(jù)《中國罕見病綜合社會調(diào)查》2020-2021數(shù)據(jù),國內(nèi)罕見病平均確診需要4.26年,誤診率高達(dá)42%。

醫(yī)學(xué)是人類幻覺的一個縮影。從宏觀上看,人類的認(rèn)知偏見和誤解比大模型要嚴(yán)重多了。這其實是與我們?nèi)祟惖拇竽X處理信息的方式、認(rèn)知偏見以及外部環(huán)境的影響有關(guān),也是我們生物局限性的必然。人類產(chǎn)生幻覺的原因比AI幻覺的病根要多得多。

首先,人類傾向于尋找、解釋和記住支持自己已有信念的信息,同時忽視或低估相反的信息。人類依賴于容易想到的信息來判斷事件的可能性或頻率,可能導(dǎo)致對事件概率的誤判。我們在做決策時過于依賴最初獲得的信息(錨定效應(yīng)),即使后續(xù)信息可能更為重要。泰坦尼克號被認(rèn)為是“永不沉沒”的船只,船員和管理層對冰山警告未給予足夠重視,不幸在它的首次航行中撞上冰山沉沒,導(dǎo)致1500多人喪生。

其次,當(dāng)面對大量信息時,人類可能難以有效處理和篩選,導(dǎo)致信息誤解或錯誤判斷。1986年,前蘇聯(lián)切爾諾貝利核電站的操作人員在進(jìn)行安全測試時,忽視了多項安全協(xié)議和警告信號,導(dǎo)致了歷史上最嚴(yán)重的核電站事故之一,造成大量輻射泄漏,事故發(fā)生后至今,普里皮亞季和切爾諾貝利一直被形容為一座“鬼城”,2000多平方公里范圍接近無人區(qū)。

還有,人類時常波動的情緒狀態(tài)及個人動機(jī)會影響信息處理和決策。例如,焦慮可能導(dǎo)致對風(fēng)險的過度評估,而樂觀可能導(dǎo)致風(fēng)險低估。2003年,美國及其盟國基于錯誤的情報判斷,認(rèn)為伊拉克擁有大規(guī)模殺傷性武器,于是發(fā)動了對伊拉克的軍事入侵,導(dǎo)致長期的地區(qū)不穩(wěn)定和大量人員傷亡,最終未能找到大規(guī)模殺傷性武器。

即使是擁有巨大權(quán)力和影響力的人物,也可能因為認(rèn)知偏見、錯誤判斷或忽視警告而導(dǎo)致嚴(yán)重后果。歐洲獵巫、納粹屠殺,以及美國總統(tǒng)特朗普最近發(fā)起的關(guān)稅戰(zhàn),就是很典型的人類幻覺所引發(fā)的一系列危機(jī)。

特朗普在演講中曾表示:“多年來,當(dāng)其他國家變得富有和強(qiáng)大時,辛勤工作的美國公民被迫袖手旁觀,其中大部分是以我們的利益為代價……現(xiàn)在輪到我們繁榮發(fā)展了。”

這樣的言論,就連美國的鐵桿盟友英國老牌的《經(jīng)濟(jì)學(xué)人》雜志都忍不住要批評幾句:“他(指特朗普)方便地忽略了兩個事實:全球化為美國帶來了前所未有的繁榮,美國一直是支撐國際貿(mào)易的規(guī)則的主要制定者。現(xiàn)在,如果特朗普得償所愿,那么二戰(zhàn)后緩慢而穩(wěn)步建立起來的經(jīng)濟(jì)秩序?qū)⒈宦裨?。相反,特朗普贊揚了 19 世紀(jì)末美國的繁榮,當(dāng)時美國比今天貧窮得多?!?/p>

位高權(quán)重如美國總統(tǒng)也無法從自我認(rèn)知偏見中爬出來,信息差更大的普通人的幻覺程度又當(dāng)如何?就像神經(jīng)科學(xué)家達(dá)馬西奧所說:“人不是可以感受的思維機(jī)器,而是可以思維的感受機(jī)器。”這句話讀起來繞口,但你多看兩眼,就會察覺這句話的精妙之處。


相關(guān)內(nèi)容