12月27-29日,第二十三屆中國國際高新技術(shù)成果交易會(huì)中國高新技術(shù)論壇在深圳舉行,主題為“推動(dòng)高質(zhì)量發(fā)展,構(gòu)建新發(fā)展格局”,中國科學(xué)院院士,中國科學(xué)院生物物理研究所研究員,中國科學(xué)院大學(xué)榮譽(yù)講席教授郭愛克出席并發(fā)表演講。
郭愛克在演講中指出,從宇宙創(chuàng)生到生命爆發(fā),到智能演生再到人工智能,天地人腦萬物互聯(lián),當(dāng)代科學(xué)技術(shù)正處在大發(fā)展、大交叉、大融合的時(shí)代,科學(xué)正在向微觀、介觀、宏觀和宇觀進(jìn)軍,正在向深海、深空、量子、大數(shù)據(jù)、通用智能、腦海深處進(jìn)軍,物質(zhì)科學(xué)、信息科學(xué)和智能科學(xué)正在相互照亮。
以下為發(fā)言實(shí)錄:
各位嘉賓,大家好!我今天報(bào)告的題目是“腦科學(xué)和類腦智能正在相互照亮”。從宇宙創(chuàng)生到生命爆發(fā),到智能演生,再到人工智能,有一首詩講“腦比天恢弘,若將兩相并,腦中有天空,君亦在其中”。中國古代就有天人合一的哲學(xué)思想,近代西方也有天腦合一的觀念,如今我們大家都認(rèn)為天地人腦萬物互聯(lián)。當(dāng)代科學(xué)的技術(shù)正處在大發(fā)展、大交叉、大融合的時(shí)代,科學(xué)正在向微觀、介觀、宏觀和宇觀進(jìn)軍,正在向深海、深空、量子、大數(shù)據(jù)、通用智能、腦海深處進(jìn)軍,物質(zhì)科學(xué)、信息科學(xué)和智能科學(xué)正在相互照亮,這是科學(xué)發(fā)展的必然規(guī)律。因?yàn)榇笞匀皇遣环謱W(xué)科的,德國著名詩人歌德說過:“大自然不是核,也不是殼,它同時(shí)是一切?!?/p>
過去人們常說科學(xué)面對(duì)四大奧秘,宇宙起源、物質(zhì)本質(zhì)、生命起源、思維本質(zhì),但這都是從學(xué)科角度來說的,實(shí)際上這是一個(gè)連續(xù)鏈條,一條演化歷史長河??茖W(xué)是在求索從宇宙創(chuàng)生到智慧演生之路,在求索從無中生有到三生萬物之路,這就是復(fù)雜系統(tǒng)科學(xué)所開創(chuàng)的認(rèn)知造路。2021年諾貝爾物理學(xué)家授予了三位研究復(fù)雜物理系統(tǒng)的科學(xué)家,以表彰他們在預(yù)測氣候變化和理解復(fù)雜物理系統(tǒng)的科學(xué)貢獻(xiàn):“發(fā)現(xiàn)從原子到行星尺度的物理系統(tǒng)中的
無序和波動(dòng)的相互作用”。帕里西(Giorgio Parisi)說過,他的大部分研究都涉及簡單的行為如何產(chǎn)生復(fù)雜的集體行為, 聯(lián)想到2019年物理諾獎(jiǎng)對(duì)我們理解宇宙演化和地球在宇宙中的地位做出了重要的貢獻(xiàn),指出了“從簡單的初始狀態(tài)按照簡單的定律演化出豐富的復(fù)雜性,需要漫長的時(shí)間和大量的物質(zhì)”。宇宙學(xué)告訴我們,在直徑長達(dá)十萬光年擁有上億顆恒星銀河系中,我們地球人很可能是唯一的智慧生物,人類大腦無疑是已知宇宙的最為復(fù)雜的智能系統(tǒng),它好比一個(gè)無比龐大的交響樂團(tuán)演奏恢弘的心智樂章。當(dāng)下腦科學(xué)和智能科學(xué)正呈爆發(fā)之勢,二者怎樣才能相互照亮,如何從復(fù)雜系統(tǒng)科學(xué)的思維,求索腦與智慧的關(guān)系,物質(zhì)與精神的關(guān)系,來回答腦在整體上怎樣工作的,這是戰(zhàn)略的制高點(diǎn)。
兩千多年前偉大的詩人屈原的長詩《天問》提出了172個(gè)問題,反映出我國先輩對(duì)宇宙洪荒,天地自然的思考與探索之心,“路漫漫其修遠(yuǎn)兮,吾將上下而求索”。1619年開普勒發(fā)表了《宇宙的和諧》(Harmonice Mundi)。開普勒一直懷有宇宙是一個(gè)和諧整體的強(qiáng)烈信念,他描述音樂和數(shù)學(xué)、音樂和宇宙規(guī)律的共同性。我們可以想象從宇宙和諧到大腦的心智樂章。從這張圖,我們可以看到大自然的魂魄,歐州椋鳥的群飛起舞,電線干上小鳥序列,以及馬踏雪原的奔騰。他們都遵循三個(gè)原則,一是聚集的原則,個(gè)體與鄰居相互靠近,以避免個(gè)體孤立;二是排斥的原則,個(gè)體與鄰居保持一定的距離,以避免個(gè)體間的碰撞;三是對(duì)齊的原則,個(gè)體與鄰居盡量保持速度大小和遠(yuǎn)動(dòng)方向一致性。
在我們的實(shí)驗(yàn)室里,我們可以用兩臺(tái)高速的紅外相機(jī)正交放置拍攝不同數(shù)量梯度的飛行果蠅群體的時(shí)空交互行為;50只、150只、300只、600只,他們都維系了彼此不相碰撞。
我們這里提一個(gè)問題,為什么腦內(nèi)多巴胺系統(tǒng)能夠介導(dǎo)多種認(rèn)知功能和精神活動(dòng)?神奇多巴胺,天使兼魔鬼,這里是荷蘭大藝術(shù)家埃舍(M.C. Esher)的木刻畫。我們這里展示出一些圖畫,不用很多文字,表明多巴胺參與風(fēng)險(xiǎn)和不確定性抉擇,參與了毒癮、煙癮、網(wǎng)癮,酒癮,也參與雙向情感障礙:躁狂和焦慮,參與孤獨(dú)的行為,這是偉大的孤獨(dú)者梵高,參與頭痛、帕金森疾病、抑郁癥等等。
多巴胺是腦內(nèi)通貨,是獎(jiǎng)勵(lì)價(jià)值的一種測度,多巴胺由腦內(nèi)的多巴胺神經(jīng)元生物合成并釋放,中腦多巴胺神經(jīng)元主要集中在黑質(zhì)致密區(qū)和中腦腹側(cè)被蓋區(qū),果蠅130個(gè)多巴胺神經(jīng)元,小鼠為2—3萬,大鼠4—4.5萬,猴子是16—32萬,我們?nèi)祟悶?0—60萬,這與動(dòng)物進(jìn)化的趨勢是一致的??梢钥吹綇母箓?cè)被蓋區(qū)投射到前額葉,參于很多腦功能,前額葉大腦當(dāng)中的腦區(qū)的分布情況,可以用領(lǐng)結(jié)結(jié)構(gòu)(蝴蝶結(jié))來表示,共有29個(gè)腦區(qū),其中有17個(gè)腦區(qū)在領(lǐng)結(jié)芯。前額葉的功能有兩個(gè)重要的功能要素:一是自由意志,前額葉腦區(qū)受損的人常常表現(xiàn)出環(huán)境依賴綜合癥;二是與時(shí)俱進(jìn),前一分鐘還和一個(gè)朋友在聊天,下一分鐘就要去趕飛機(jī)了,所以,自由意志和與時(shí)俱進(jìn)是前額葉腦功能的兩個(gè)基本符號(hào)。
這兩個(gè)特征是怎么實(shí)現(xiàn)的?前額葉的基本功能是基于多巴胺的動(dòng)態(tài)門控機(jī)制,當(dāng)閘門開啟時(shí),前額葉會(huì)迅速更新信息,當(dāng)閘門關(guān)閉時(shí),可以穩(wěn)健保存現(xiàn)有的主要信息。這個(gè)過程我們可以用中國太極圖表示,當(dāng)D2開啟時(shí),是與時(shí)俱進(jìn)的,當(dāng)D1開啟時(shí)是自由意志的。大草原田鼠的伏隔核(NAc)的多巴胺 D1和 D2 對(duì)維系該種鼠的“一夫一妻”制起關(guān)健的,但是相反的作用。激活D1 受體阻止“一夫一妻”的最初形成,而激活D2 受體卻促進(jìn)配偶偏好過程。 這個(gè)過程與成癮過程極為相似:激活多巴胺D2受體,將導(dǎo)致復(fù)吸,反之激活多巴胺D1受體將阻止復(fù)吸。即使是線蟲(C.elegans)的多巴胺D1和D2受體在運(yùn)動(dòng)調(diào)控中也相互拮抗。
多巴胺的功能怎樣描述?它可以用這樣的公式表示,多巴胺的反應(yīng)=實(shí)際上獲得的回報(bào)-預(yù)期的回報(bào),這個(gè)差值如果是正,多巴胺反應(yīng)是積極的;如果是負(fù)的,多巴胺反應(yīng)是消極的;如果是0,多巴胺反應(yīng)是無動(dòng)于衷。多巴胺的編碼原則和信息論一脈相承,按信息論之父香農(nóng)的定義,100 % 出現(xiàn)的,信息等于0;如講“太陽從東方升起”,大家都知道,是不含信息量的,如某一事件出現(xiàn)的概率很小反而蘊(yùn)含了大量的信息量,這是由香農(nóng)公式給出來的。
直覺也是一種智能,多巴胺系統(tǒng)是通用獎(jiǎng)勵(lì)貨幣,是我們評(píng)價(jià)我們的世界和其他人的一種方式,所以我將它稱之為“腦幣”,每當(dāng)我們沒法用簡單的源由來解釋我們做的某項(xiàng)決策時(shí),那就是直覺腦內(nèi)多巴胺驅(qū)使我們做的,在決策過程中,多巴胺不知不覺地參與了投票。俗話說,情人眼里出西施,西施眼里出白癡,就是由多巴胺投票造成的感知現(xiàn)象。多巴胺是一種神經(jīng)調(diào)質(zhì),調(diào)控期望、預(yù)測和風(fēng)險(xiǎn);多巴胺的功能是跨物種保守的,這是根據(jù)達(dá)爾文的大道至簡大美天成可以悟到的。我們與果蠅同在藍(lán)天下,同住地球村,它的消化道、體結(jié)構(gòu)、分泌系統(tǒng)、神經(jīng)系統(tǒng)和人類的都是可以相類比的,果蠅的腦內(nèi)多巴胺系統(tǒng)和哺乳動(dòng)物的多巴胺系統(tǒng)在合成、運(yùn)輸、分泌、信號(hào)接收和信號(hào)轉(zhuǎn)導(dǎo)方面有大多數(shù)基因都是保守,只是參與多巴胺代謝的主要酶在兩種物種中是不同的。
強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL),又稱再勵(lì)學(xué)習(xí)、評(píng)價(jià)學(xué)習(xí)或增強(qiáng)學(xué)習(xí),是機(jī)器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體(agent)在與環(huán)境的交互過程中通過學(xué)習(xí)策略以達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問題。
腦科學(xué)和類腦智能正在相互照亮,最近,Will Dabney 等科學(xué)家(2020)提出了一個(gè)受最近人工智能啟發(fā)的基于多巴胺強(qiáng)化學(xué)習(xí)的分布式強(qiáng)化學(xué)習(xí)的新思路。假設(shè)大腦表征未來可能的回報(bào),并不是用一種單一的平均值方式(大鍋飯),而是一種同時(shí)并平行地有效地表征多個(gè)未來后果的概率性分布。這個(gè)想法意味著有一套預(yù)測組的檢驗(yàn)。Will Dabney 等 使用來自小鼠腹側(cè)被蓋區(qū)VTA的單細(xì)胞記錄來進(jìn)行檢驗(yàn),為分布式強(qiáng)化學(xué)習(xí)的神經(jīng)實(shí)現(xiàn)提供了有力的證據(jù) 。
多巴胺的功能,我們可以理解它是一個(gè)辯證法,怎樣解決天使和惡魔的矛盾呢?中華民族永恒的太極智慧,老子的道德經(jīng)講 “萬物負(fù)陰而抱陽,沖氣以為和”,即由陰陽兩個(gè)對(duì)立共存的方面相互矛盾沖突 產(chǎn)生第三者,即“先二而后三”, 進(jìn)而生成萬物。”奇畫共欣賞,寓意相與析,我可以用三個(gè)世界著名的畫作來詮釋這個(gè)1→2→3概念。 這是蒙娜麗莎(27.540, -0.19, -0.69%),道生一;這是畢加索的畫,是一生二,這是二生三的畫。最后是中國故宮博物院國寶級(jí)藏畫,一團(tuán)和氣圖。1465年明憲宗朱見深所繪。
恩格斯在自然辯證法中這樣論述,“一切差異都在中間階段融合,一切對(duì)立都經(jīng)過中間環(huán)節(jié)而相互給過渡,辯證法不知道什么絕對(duì)分明和固定不變的界限,不知道什么無條件的普遍有效的非此即彼,它使固定的形而上學(xué)的差異互相過渡,除了非此即彼又在適當(dāng)?shù)牡胤匠姓J(rèn)亦此亦彼,并且使對(duì)立互為中介?!?。這段論述與老子的陰陽對(duì)立統(tǒng)一觀是何等相近呀!