7月20日,國際頂級(jí)學(xué)術(shù)期刊Nature子刊Nature Machine Intelligence(Nature旗下專注于機(jī)器學(xué)習(xí)領(lǐng)域的頂級(jí)期刊)在線發(fā)表了華大智造(93.130, 0.00, 0.00%)楊夢(mèng)團(tuán)隊(duì)研究成果《Self-play reinforcement learning guides protein engineering》,發(fā)布了一款名為EvoPlay的算法模型。這也是華大智造團(tuán)隊(duì)在該雜志發(fā)表單細(xì)胞對(duì)比學(xué)習(xí)自監(jiān)督Concerto算法后,時(shí)隔一年再度發(fā)表AI算法相關(guān)文章。
EvoPlay由“Evo”、“Play”兩個(gè)英文單詞組合而成,前者意為進(jìn)化,指蛋白質(zhì)分子的功能進(jìn)化;Play指的是博弈類搜索算法。EvoPlay算法模型就是借鑒圍棋自博弈的方式搜索海量蛋白質(zhì)突變空間,通過結(jié)合不同的功能或結(jié)構(gòu)預(yù)測模擬器,像自動(dòng)駕駛一樣訓(xùn)練智能體完成指定功能增強(qiáng)的蛋白進(jìn)化。
據(jù)悉,蛋白質(zhì)的工程化設(shè)計(jì)和改造是基因測序儀的底層基礎(chǔ),基因測序儀的迭代升級(jí)離不開蛋白工程技術(shù)的突破??茖W(xué)家們通過改造各種各樣的蛋白質(zhì)操縱DNA分子、讀取酶催化的信號(hào)從而識(shí)別堿基序列。從華大智造測序儀試劑里用到的聚合酶、熒光素酶等各種工具酶,到更廣范圍的生物催化劑、生物傳感器、治療類抗體到生物燃料,都離不開對(duì)蛋白質(zhì)的設(shè)計(jì)和改造。
從AI到BI,EvoPlay模型實(shí)現(xiàn)AI智能體訓(xùn)練
近期,人工智能再一次成為全球矚目的焦點(diǎn),今天,現(xiàn)代詞典將人工智能定義為計(jì)算科學(xué)的分支,及機(jī)器如何模仿人類智能?!洞笥倏迫珪分赋觯骸叭斯ぶ悄?,指數(shù)字計(jì)算機(jī)或計(jì)算機(jī)控制的機(jī)器人(13.490, 0.00, 0.00%)執(zhí)行通常與智能生物相關(guān)的任務(wù)的能力?!焙喲灾?,AI是技術(shù)性的模擬與推理,是“技術(shù)驅(qū)動(dòng)”模式,目標(biāo)是用機(jī)器代替部分人工勞動(dòng)。
大眾熟知的AlphaGo是DeepMind最重要的AI模型之一。它是一個(gè)基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的人工智能圍棋程序,2016年,AlphaGo與世界圍棋冠軍李世石進(jìn)行五局三勝的對(duì)弈,并以4比1的總比分獲勝,引起了廣泛的關(guān)注和震動(dòng)。這一勝利標(biāo)志著人工智能首次在高度復(fù)雜的游戲中超越人類頂尖選手。
而AlphaZero是DeepMind后續(xù)進(jìn)一步發(fā)展的AI模型。它不需要任何人類的經(jīng)驗(yàn)知識(shí),只需要知道游戲規(guī)則便能通過自我對(duì)弈和強(qiáng)化學(xué)習(xí)從零開始學(xué)習(xí)并掌握多種棋類游戲,包括圍棋、國際象棋和日本象棋,它以驚人的速度超越了世界上最強(qiáng)大的棋類引擎,并展示了一種通用的自學(xué)習(xí)方法,能夠適應(yīng)不同的領(lǐng)域和問題。
而華大智造發(fā)布的EvoPlay模型便是借鑒了這種方法,并將其運(yùn)用到了蛋白質(zhì)設(shè)計(jì)領(lǐng)域當(dāng)中,研究團(tuán)隊(duì)將蛋白質(zhì)序列上每一個(gè)位點(diǎn)的突變當(dāng)作是圍棋中的每一次落子,將優(yōu)化的最終序列當(dāng)作是一局圍棋的結(jié)束,通過自我對(duì)弈和蒙特卡洛樹搜索在蛋白質(zhì)序列空間中不斷的搜索和優(yōu)化序列,同時(shí)作者使用一個(gè)代理模型來為每一次位點(diǎn)突變進(jìn)行獎(jiǎng)勵(lì),最終成功生成了大量的具有特定功能的序列。
從人工智能(AI)到生物智能(BI),EvoPlay算法把經(jīng)典的強(qiáng)化學(xué)習(xí)應(yīng)用到了蛋白質(zhì)設(shè)計(jì)框架中,不僅能夠增強(qiáng)傳統(tǒng)MLDE的采樣效率,并能夠結(jié)合最新的蛋白質(zhì)結(jié)構(gòu)解析模型(AlphaFold2)直接設(shè)計(jì)出帶目標(biāo)結(jié)構(gòu)的氨基酸序列。EvoPlay既能夠用于傳統(tǒng)定向進(jìn)化,也能夠被納入“從頭設(shè)計(jì)”的理性設(shè)計(jì)框架中。
文章的通訊作者,來自華大智造研發(fā)團(tuán)隊(duì)的楊夢(mèng)表示:“我們有理由相信在更多的理性機(jī)制分析以及更精密的結(jié)構(gòu)代理模型的幫助下,EvoPlay的蒙特卡洛樹搜索+神經(jīng)網(wǎng)絡(luò)可以更好地結(jié)合‘從頭設(shè)計(jì)’框架,從而為蛋白設(shè)計(jì)領(lǐng)域提供新的思路,也可以用來進(jìn)一步優(yōu)化基因測序儀里用到的各種工具酶。
此外,EvoPlay模型已經(jīng)進(jìn)行了一些實(shí)踐,比如說研究者已經(jīng)利用EvoPlay前瞻性地設(shè)計(jì)了36個(gè)熒光素酶突變體,其中的29個(gè)變體已申請(qǐng)專利,發(fā)現(xiàn)。EvoPlay在尋找起始庫之外更高適應(yīng)性突變體方面非常有效,并且可以與現(xiàn)有的工程流程相集成。
同時(shí),實(shí)踐也證實(shí)了EvoPlay展示了其在高效設(shè)計(jì)高質(zhì)量多肽上的性能,將適用于蛋白質(zhì)-蛋白質(zhì)相互作用、酶設(shè)計(jì)和藥物發(fā)現(xiàn)等多種應(yīng)用領(lǐng)域。
AI推動(dòng)生命真智能:EvoPlay模型的展望與未來
伴隨著自動(dòng)化生物實(shí)驗(yàn)室的蓬勃發(fā)展,以及微流控技術(shù)廣泛用于分子篩選和進(jìn)化實(shí)驗(yàn)室,更多的自動(dòng)駕駛實(shí)驗(yàn)室(Self-driving Lab)即將出現(xiàn)。在生命科學(xué)和技術(shù)實(shí)驗(yàn)室中的各個(gè)環(huán)節(jié),包括實(shí)驗(yàn)的執(zhí)行、數(shù)據(jù)的收集和分析、實(shí)驗(yàn)計(jì)劃的制定等, 如Design-Build-Test-Learn (DBTL)的循環(huán)的自主執(zhí)行,未來都可以由自動(dòng)化系統(tǒng)和人工智能來完成,而不需要人類進(jìn)行主動(dòng)的干預(yù)或操作。智能體還可以通過LLM等工具整合外部知識(shí),多輪迭代探索,連續(xù)學(xué)習(xí),創(chuàng)造出滿足人類需求的酶、抗體、小分子、基因序列甚至人造細(xì)胞。
EvoPlay模型的誕生無疑驗(yàn)證了這種可能性,在人類不斷升級(jí)認(rèn)知極限的過程中,人工智能和機(jī)器人有巨大的潛力去幫助人類科學(xué)進(jìn)一步探索未知的邊界,從認(rèn)知生命到掌控生命,期待能夠?qū)崿F(xiàn)人工智能和生物智能的和諧共生,最終實(shí)現(xiàn)真智能。