青青青久草,四虎永久在线精品,二区免费视频,一级毛片在线直接观看,黄网在线免费观看,美女露全身永久免费网站,色婷婷六月桃花综合影院

AI解夢靠譜嗎?學界目前進展如何?

“莊周夢胡蝶,胡蝶為莊周?!笨v觀東西方歷史,人類對夢境有著不約而同的執(zhí)念。夢境也是神秘學的重要部分,常常與預知未來、認識自己等概念聯(lián)系在一起。時至今日,人類一直試圖解開夢境背后的意義,經(jīng)常求助于各種解釋方法,甚至發(fā)展出了許多流派。

的確,夢境提供了對我們潛意識深處的一瞥,揭示了隱藏的欲望、恐懼和情緒,對我們的現(xiàn)實生活也不無影響。隨著大模型等技術的興起,在GPT store等平臺上,也出現(xiàn)了聲稱能夠通過對話解析夢境的AI助手。

圖片

圖片

?圖1. 基于大模型的夢境解析網(wǎng)站:https://dreamybot.com

與民間占卜解夢不同,腦科學與夢境的相關研究首先關注的是夢境的內容,例如夢里看到的圖像、聽到的聲音,之后才是夢境的意義。其研究對象也并非單個人的自述(軼事),而是一群人敘述的匯總及其中的統(tǒng)計規(guī)律。伴隨技術進步,研究方法還包括了使用功能性磁共振成像(fMRI)等腦電檢測,依據(jù)客觀記錄而不是主觀描述來解析夢境。本文將從科學研究現(xiàn)狀到商業(yè)應用前景,概述人們在“如何用AI作為工具指導人們更好地理解做夢”這件小事上做出的努力。

圖片

基于個人自述的夢境匯總,

男生女生的夢有區(qū)別嗎?

夢境的內容可歸因于大腦對白天收集的信息的處理和整合,這便是美國心理學家卡爾文·霍爾(Calvin Hall)提出的延續(xù)假設(continuity hypothesis)。當我們睡眠時,我們的大腦通常會從之前的記憶、經(jīng)歷和情感中提取片段并拼貼成一個故事。這些神經(jīng)活動的復雜相互作用產生了我們在夢中遇到的生動的、有時令人費解的場景和人物。

人的大腦就像一個專長蒙太奇的導演,它采用日常經(jīng)歷中看似無關的事件、人物和物體,并以只有潛意識才能理解的方式將它們組合在一起。在夢里,物理和邏輯定律被扭曲,產生了脫離現(xiàn)實引力的奇幻景象和意識流情節(jié),讓我們常常在第二天醒來后反復琢磨前一晚夢境的深意。

然而科學研究畢竟不是奇聞怪談的收集,不論哪個學科,科研的第一步是建立基線,也就是理解大多數(shù)人的典型狀況,以便在后續(xù)嘗試理解個案時,能夠有一個合適的錨點。2020年的一篇發(fā)表在皇家協(xié)會開放科學(Royal Society Open Science)的期刊上的研究[1],通過自然語言處理,分析了不同年齡和性別的24000個被試自述的夢境,構建了數(shù)據(jù)庫Dream Bank。研究發(fā)現(xiàn),年齡,性別,過往經(jīng)歷(如是否當過兵)等不同因素都會對被試者的夢境產生影響(圖2)。該研究基于是美國收集的數(shù)據(jù),由于各國文化風俗上的差異,該研究的結論不適用于國內,但其研究思路是可以借鑒的。

圖片

?圖源:參考文獻[1]

不同年齡的夢境報告中攻擊性的等級從20世紀60年代到現(xiàn)在在逐步減少,這個趨勢和美國的暴力犯罪統(tǒng)計數(shù)據(jù)相符。

除了統(tǒng)計性的群體描述,這類研究還讓人們可以比較和自己處境相似的人會做什么樣的夢。例如在dreamcatcher中,人們可以根據(jù)自身身份查看下圖中的每一個葉子(點擊后對應一個夢的描述),通過了解與自身處境相似的人做了什么夢,從而緩解因夢境引發(fā)的焦慮,也可以上傳自身的夢境描述,豐富數(shù)據(jù)庫的內容。

圖片

?圖3.基于自然語言處理的夢境解析和匯總網(wǎng)站

基于Dream Bank數(shù)據(jù)庫的衍生研究[2],還包括通過GPT模型分析夢境自述文本的困惑度(Preplexity,一個衡量文本意外程度的統(tǒng)計量)。以維基百科的文本作為基線,研究表明夢境中的文本并非人們之前預計的那樣格外不可預測,兩者困惑度接近。該研究的另一個發(fā)現(xiàn)也符合常識,即女性對夢的描述文本困惑度更高,組間差異更大,這意味著相比女性,男性的夢更容易預測。

圖片

?圖4.男性和女性夢境自述文本的困惑度對比,圖源:參考文獻[2]

圖片

科學家是如何讀心的?

與上述依賴主觀自述的研究不同,夢境可視化試圖將人腦在潛意識或無意識狀態(tài)下的內在認知活動轉化為顯性的圖像或標簽,例如做夢時看到了什么,聽到了什么,有什么樣的情感。這其中的研究,包括研究者要一次次的將被試從睡眠時喚醒,詢問夢到了什么的實驗,用以考察人們清醒后對夢的回憶。在這之中,又以清醒夢最為熱門。所謂的“清醒夢”,可看成夢境與清醒的疊加態(tài):做夢者有“正在做夢”的意識,并能描述出自己在做的夢。

夢境可視化的基礎,首先是需要證明經(jīng)由核磁共振成像,近紅外線光譜儀及腦電圖(EEG)等方法測量得到的大腦的血流,腦電及因工作而發(fā)熱的變化模式,可被用以預測腦中的所思所想。19年的研究[3]根據(jù)人腦活動,復現(xiàn)了被試觀察的影像。而23年的研究[4],基于Stable Diffusion,能夠更準確地再現(xiàn)被試者腦中所看的畫面。

對比圖5和圖6,可以顯著的看到重塑的圖像更加準確了,那這性能進步的背后,是有哪些創(chuàng)新促成的?

圖片

?圖5.基于腦電MRI記錄,實用深度神經(jīng)網(wǎng)絡重現(xiàn)被試觀察到的圖像。圖源:參考文獻[3]

圖片

?圖6.被試者看到的真實圖片(第一行)和模型重構的圖片對比。圖源:參考文獻[4]

對比2019年的研究與2023年的研究,最直觀的區(qū)別在于2023年的研究增加了語義解碼部分。不過在談及這一點之前,先看看23年研究的圖像解碼是怎么做的。在大腦處理圖像的過程中,像經(jīng)過有損壓縮后再放大的圖片一樣進行操作,腦中圖像會先被壓縮成基本的素描形式,保留關鍵信息,同時形式更簡潔,便于管理。這些壓縮后的信息在大腦中是分布式存儲的,這為科學家提供了解碼的可能性。通過fMRI技術,科學家可以記錄大腦活躍的部分,類似于觀察一個擁有數(shù)萬塊硬盤的超級電腦處理特定數(shù)據(jù)時哪些硬盤處于工作狀態(tài),從而建立起一個基本的模型。

在解碼大腦的實際操作中,基于fMRI數(shù)據(jù),研究者首先根據(jù)大腦的信息壓縮和分布式處理特點,構建了一個類似簡筆畫的初步圖像。隨后,在擴散過程中,模型會像繪畫時一樣逐步渲染上色,讓圖像逐漸豐富起來。然而,正如繪畫時需要明確所畫目標,重構大腦中想象的圖像也需要利用大腦在觀看圖像后產生的語義信息,即大腦對圖像的描述。

圖片

?圖7.研究5的模型框架示意圖。圖源:參考文獻[4]

根據(jù)大腦的“語義地圖”[5],被試在聽到某些詞匯時,相關的fMRI數(shù)據(jù)顯示這些詞匯在大腦周圍分布,而沒有一個明確的語言處理區(qū)域。與此同時,與意義相關的詞匯在大腦中的分布更為集中。而研究[4],則將語義信號和視覺信號分別用不同的神經(jīng)網(wǎng)絡去處理,從而用解碼的語義信息來幫助圖像重建。

例如,當被試者看到的是一個狗的圖畫,但只基于視覺信號,重建的圖像可能會缺少狗的典型特征,使得重建圖像看起來更像是貓;而有了語義信息的幫助,解碼系統(tǒng)發(fā)現(xiàn)觀察到的詞匯和骨頭接近,于是在潛在擴散過程豐富簡筆畫的時候,就會選擇突出那些狗的特征。這種結合了兩種模型的圖像重建方法,比單一依賴語義或視覺信息的方法,能夠實現(xiàn)更清晰、更準確的圖像還原。

圖片

?圖8. 由985個詞構成的大腦語義地圖。圖源:參考文獻[5]

圖片

?圖9. 圖源:參考文獻[4]

對比被試看到的原圖,以及只基于圖像特征(第二列),只基于語義特征(第三列)以及基于兩者(第四列)的效果圖。

近年來,科學家通過類似的思路,可以基于腦電數(shù)據(jù)生成被試聽到的聲音信號[6],從而讓失語者可以說出自己腦中所想的話。此外,當前還有研究能通過腦電信號解讀出被試者默念的文本[7],并重建被試觀看的短視頻內的場景[8]。所有這些研究,都說明了研究者目前有能力根據(jù)大腦活動讀心。

但這距離解夢還有很長的距離。原因首先是夢境大多是迷幻的,跳躍的,人們會懷疑對夢境的描述更加沒有邏輯,充滿了離奇的意外(前述的基于夢境描述文本困惑度的[2],已提供了相反的證據(jù));第二個原因,則在于很多夢境中包含了強烈的情緒,人們會擔心夢境中強烈的情緒可能干擾其解讀。

對此,24年的一項研究[9]聲稱可以結合個人敘事和fMRI,以此開發(fā)預測自發(fā)思維情感內容的模型,從而判斷清醒夢中的主觀體驗是積極還是消極的。該預測模型不僅在閱讀故事時能夠預測被試的自我相關性和情感體驗,同樣適用于在自發(fā)思維(清醒夢)或休息狀態(tài)下的199名參與者。

在這一研究中,研究人員監(jiān)測參與者閱讀故事時大腦活動,旨在解碼思維的情感維度。為了捕捉各種思維模式,參與者參與了一對一訪談,以制作反映他們過去經(jīng)歷和情感的個性化敘事刺激。當參與者閱讀他們的故事時,其大腦活動在MRI掃描儀內被記錄。在fMRI掃描后,參與者再次閱讀故事,并報告每個時刻感知到的自我相關性(即這些內容與他們的相關程度)和情感(即這些內容是積極還是消極)。使用每個參與者的自我相關性和情感評分的五分位數(shù),研究團隊創(chuàng)建了25個不同的情感和自我相關性組合,使用機器學習技術結合這些數(shù)據(jù)及49名參與者的fMRI數(shù)據(jù)來實時解碼思維的情感維度。

研究發(fā)現(xiàn)前扣帶回皮層和島葉前部等關鍵大腦區(qū)域在預測個人相關性和情感調子方面至關重要。通過解碼與具體情節(jié)無關的情感,該研究有助于我們理解影響主觀體驗的內部狀態(tài)和背景,可能有助于揭示思維和情感方面的個體差異,并有助于評估心理健康。

圖片

夢境可視化的現(xiàn)實與理想

前述的研究都還沒有直接涉及對做夢時大腦的解析,只是試圖對清醒狀態(tài)(或清醒夢)下受試者的所思所見進行預測。然而,有研究開始直接探索夢境中大腦的活動,并嘗試將夢中的圖像可視化。

例如,研究[10]依據(jù)兩名受試者在fMRI下的大腦活動數(shù)據(jù)和他們自述的夢境內容,揭示了大腦在夢境中的圖像處理具有層次化特點,即做夢時會激活與夢到物體相關的分層視覺特征表征。研究表明,從自做夢時大腦活動中解碼的特征值與夢中物體類別相關的特征值,在在中間到高級深度神經(jīng)網(wǎng)絡中表現(xiàn)出正相關。這不僅提高了區(qū)分夢中物體類別的準確性,而且表明夢境中的視覺特征表征與清醒時的視覺處理相似,意味著大腦在做夢時可能和清醒時使用相同的機制,這支持了通用解碼方法在不同視覺體驗(清醒和夢境)中的泛化能力,從而論證了夢境解析的可行性。

圖片

?圖10.圖源:參考文獻[10]

單次實驗中,針對夢境在出現(xiàn)圖片的預測,可基于較高抽象層級的特征得出。

早在2013年,研究[11]在視覺皮層區(qū)域刺激誘導的腦活動上訓練的解碼模型,顯示出模型對夢境內容的分類能力超過隨機猜測。在這項研究中,三名受試者在進行磁共振睡眠實驗時,每當腦電信號被檢測到,他們便被喚醒,并描述醒來前的視覺體驗。為了收集充分的數(shù)據(jù),每位受試者平均每5-6分鐘就被喚醒一次,主要關注人們剛入睡階段產生的類夢境視覺感受。在超過75%的喚醒中,受試者報告了夢中的內容。預測模型試圖區(qū)分受試者夢見的是人還是椅子等物體,并在解碼器的輸出中使用了多個標簽來提升準確性。這距離上文所講的解碼夢境中的所思所想,還相距甚遠。

21年來自清華大學未來實驗室的研究[12],基于11名被試者REM睡眠期的EEG數(shù)據(jù),結合心理問卷幫助評估情緒,最終生成了夢境的抽象視覺表述。圖11展示了基于EEG產生的對夢境的藝術化展示,該例中夢境的情感關鍵詞是如釋重負(relieved)。這項研究進一步說明了當前對夢境的解讀,還遠遠做不到“像素級”的準確度,只是能夠對情感進行定性的含糊描述,或者對夢境中出現(xiàn)的物體生成有一個比隨機更準確的有根據(jù)猜測。

圖片

?圖11.基于EEG數(shù)據(jù)對夢境中的情感產生的藝術化表征。圖源:參考文獻[12]

然而,前文關于清醒時大腦解析的研究,以及夢境和大腦遵循相同神經(jīng)機制的研究,共同說明了夢境解析具有技術可行性,只是目前受限于當前研究條件(例如fMRI的機器噪音,實驗成本,受試者過少等技術因素)還不夠成熟。未來隨著技術的進步,有著巨大的潛力。且夢境可視化這項技術在心理健康領域的應用具有重要意義。對夢境的理解可能帶來新的治療方法,特別是創(chuàng)傷后應激障礙(PTSD)、抑郁癥和焦慮癥等疾病。

除了心理干預,對夢境的重現(xiàn)還可以用于創(chuàng)意生成。應用創(chuàng)意設計等方式對夢境中的內容進行重構,可以產生更有藝術創(chuàng)造力的內容。此外,在科學史中,凱庫勒在夢中找到了苯環(huán)的結構,門捷列夫在夢中產生了元素周期表的概念,我們不知道有多少科學上的創(chuàng)意,出現(xiàn)又無聲的消失在夢中,通過對夢境的記錄和解讀,我們未來也許能夠撿起更多這樣帶有科學創(chuàng)新點的夢。

總的來說,EEG和fMRI已經(jīng)將夢境分析從純粹的猜測轉變?yōu)閷嵶C科學探索,從而得以讓我們更加接近揭示夢境的真相的那一天。

圖片

夢境解析和引導的商業(yè)應用

說起解夢,人們最熟悉的是弗洛伊德-榮格的精神分析學派。雖然這一派的理論廣為人知,但學術界對其有效性存在爭議。隨著大模型及對應智能體的成熟,市面上出現(xiàn)了不少號稱可以解夢的聊天機器人,但這樣的機器人帶給筆者的個人體驗并沒有多么驚艷。更有一些解夢的應用,宣稱結合中醫(yī)典籍,對于這樣有“偽科學”嫌疑的研究,讀者更應該批判性地審視,不能因為大模型的套皮而輕信。

除了就夢境內容展開對話,基于夢境和AI結合還可以考慮夢境記錄方面的應用??紤]到我們對夢境的記錄往往出現(xiàn)在剛睡醒或半睡半醒間,并且很大比例的夢境會在我們醒來后消失,一個記錄工具顯得尤為重要。蘋果平臺的PlotPilot[13]可記錄使用者對夢境的語音描述,并通過AI文本分析配上屬于對應的背景音樂,制作成專屬的有聲書(現(xiàn)在可以根據(jù)夢境描述產生視頻)。這樣的工具不僅能幫助用戶更好地了解自身潛意識的心理需求,還可以促進對夢境的研究。

如果說根據(jù)腦電活動預測個人的所思所想,會讓人想到許多科幻小說里的場景,那么能幫助用戶進入且穩(wěn)定在清醒夢中的工具,則充滿了《盜夢空間》的意味。2024年1月,美國初創(chuàng)公司“Prophetic”開發(fā)了一款名為“Morpheus-1”的新型人工智能模型,該模型可以以大腦的腦電活動作為提示詞,基于多模態(tài)大模型生成與該大腦狀態(tài)相互作用的形狀聲波。據(jù)稱,輸出的聲波可與Prophetic計劃明年春季發(fā)布的一款新頭帶產品“The Halo”綁定。The Halo會發(fā)送聲波進入大腦,與當前的大腦狀態(tài)相連接,從而使心靈進入清醒狀態(tài)。據(jù)Prophetic稱:“引導產生的清醒夢是一種夢者意識到自己正在睡覺的夢?!倍驹O想的產品則可以讓用戶有效控制自己的夢境。

由于該公司成立不久,宣傳的產品還沒有發(fā)布,其技術的實際能力還有待進一步觀察。一旦成功,此舉對學界和市場都有重要的意義,引導清醒夢將有助于減少PTSD等心理疾病引發(fā)的噩夢,促進正念,為意識的神秘本質打開新的窗口。

另一方面,無論是引導還是預測夢境,這些涉及個人私人體驗的應用無疑將產生大量敏感的數(shù)據(jù)。如何避免這樣的技術被濫用?消費者需要提前意識到技術的雙刃劍性質,有保護自身的權利和隱私的意識。在技術成熟前,不妨先通過科幻小說進行思想實驗,模擬各種情況下新技術產品的推動可能對社會造成的影響:例如,如果未來的打工人要通過清醒夢來證明自己對企業(yè)的忠誠,多疑的伴侶可以偷偷記錄并解析枕邊人的夢境以查找出軌的證據(jù)時,社會又將成為什么樣?

圖片

小結

“Life is but a dream···”

從弗洛伊德和榮格的心理學,到最新的基于腦電的讀心術,以及基于大模型的海量夢境自述的文本分析,我們對大腦的理解,正在從定性轉為定量,從個體案例轉為群體統(tǒng)計,從依賴主觀描述轉為客觀數(shù)據(jù)。隨著對夢境產生機制的了解,人們也能夠逐漸去控制夢的產生,從而避免或減少噩夢的出現(xiàn),甚至引導清醒夢的產生。

同時,隨著人們對夢境的測量和控制手段的進步,研究者得以用科學地方式去嘗試回答更多之前無法解答的問題,如夢境中的情感體驗究竟是什么樣的?動物們在做夢時在想到了什么場景?AI是否具有做夢的能力?知識帶來新的技術應用,而新技術擴展了可觸及知識的邊界。對夢境的研究,一旦脫離了民科和偽科學,就將踏上科學界通用的正向飛輪。