Chat GPT熱度尚未退散,一場大會又將AI大模型的注意力推向新高度。
在剛剛舉辦的北京智源大會上,匯聚了眾多傳說中的AI大佬,以張鈸、張宏江為代表的國內(nèi)AI最前沿領(lǐng)軍人物,Geoffery Hinton、Yann LeCun、姚期智、Joseph Sifakis這四位圖靈獎得主,Open AI創(chuàng)始人Sam Altman、PaLM-E和RoBERTa等AI公司高管。
因每次的智源大會秉承著專業(yè)的學(xué)術(shù)思想路線,因此在國內(nèi)外人工領(lǐng)域內(nèi)行精英圈層口碑極高,但對大眾來說,卻稍顯高冷。而在本次大會上,Sam Altman指出為搞清楚通用AI技術(shù)的發(fā)展,Open AI必須要推進(jìn)AI研究變革。
但這一說法卻遭到了不少AI大佬們的反對。其中,加州伯克利分校教授斯圖爾特·羅素抨擊Open AI研發(fā)的Chat GPT和GPT-4沒有在“回答”問題,它們不理解世界,也不是一個通用AI的發(fā)展步驟。楊立昆更是直接指出,當(dāng)前的GPT自回歸模型存在缺乏規(guī)劃、推理的能力,未來GPT系統(tǒng)或?qū)⒈粧仐墶?/p>
除激烈的學(xué)術(shù)爭論外,關(guān)于當(dāng)前AI如何監(jiān)管、后續(xù)AI的發(fā)展方向也成了本次會議討論的焦點(diǎn)。
01.后續(xù)AI到底要如何監(jiān)管?
進(jìn)入到2023年以來,在生成式AI以勢如破竹的速度席卷諸多領(lǐng)域的同時,由AI所引發(fā)的各種問題也在加劇外界的擔(dān)憂。
在我國,“AI詐騙”成為近期社會關(guān)注的方向之一。日前,內(nèi)蒙古包頭警方通報一起利用AI實施詐騙的案件,福州市某公司法人代表郭先生10分鐘內(nèi)被騙430萬元。據(jù)通報,騙子通過AI換臉和擬聲技術(shù),佯裝熟人實施詐騙。無獨(dú)有偶,江蘇常州的小劉被騙子冒充其同學(xué)發(fā)語音、打視頻電話,小劉看到“真人”后信以為真,“借”了6000元給騙子。
圖源:抖音
事實上,AI詐騙案發(fā)生的背后還是和當(dāng)前AI技術(shù)迅速發(fā)展,技術(shù)合成門檻持續(xù)降低有關(guān)。而從后續(xù)來看,若AI大模型技術(shù)不斷突破,未來也將逐漸從面部合成轉(zhuǎn)向到全身合成、3D合成技術(shù),其合成效果也將更加逼真。
在美國,AI是否會影響選舉成為當(dāng)?shù)孛襟w討論的重點(diǎn)。據(jù)美聯(lián)社報道,如今復(fù)雜的生成性AI工具能在幾秒鐘內(nèi)“克隆”某人的聲音和形象,制造出大量“假料”。只要綁定強(qiáng)大的社交媒體算法,AI就可以迅速鎖定受眾進(jìn)行傳播,以前所未見的規(guī)模和速度破壞選舉。
美國其他媒體則預(yù)測,因美國下一任總統(tǒng)選舉是在明年舉行,不排除美國兩黨將使用AI技術(shù)用于宣傳、籌款等活動。更重要的是,因Chat GPT在文本能力上有著卓越的表現(xiàn)。因此,參選者的團(tuán)隊僅需在幾秒鐘就能生成一份措辭華麗的演講稿。
基于外界對AI的種種擔(dān)憂,日前,由“AI教父”杰弗里?辛頓、Anthropic的首席執(zhí)行官達(dá)里奧?阿莫代,Google Deep Mind首席執(zhí)行官戴米斯?哈薩比斯等超過350位AI領(lǐng)域高管和專家共同簽署了“減輕AI帶來的滅絕風(fēng)險,應(yīng)該與流行病和核戰(zhàn)爭等其他社會規(guī)模的風(fēng)險一起,成為全球優(yōu)先事項”的聯(lián)合聲明。
其次,Sam Altman認(rèn)為人類是無法發(fā)現(xiàn)一些惡意模型在一些邪惡的事情。目前Open AI正在投資一些新的、互補(bǔ)的方向,希望能夠?qū)崿F(xiàn)突破。但可擴(kuò)展的監(jiān)督是嘗試使用 AI 系統(tǒng)來協(xié)助人類發(fā)現(xiàn)其他系統(tǒng)缺陷,而解釋能力是用GPT-4解釋GPT-2神經(jīng)元,雖然還有很長的路要走,但Open AI相信機(jī)器學(xué)習(xí)技術(shù)可進(jìn)一步提高AI可解釋能力。同時,Sam Altman也認(rèn)為未來只有把模型做得更智能,更加有幫助,才能更好地實現(xiàn)通用AI的目標(biāo)優(yōu)勢,進(jìn)而降低AI風(fēng)險。
最后,Open AI短期內(nèi)雖不會推出GPT-5版本,但未來十年全球可能會擁有更強(qiáng)大的AI系統(tǒng),全球范圍內(nèi)需做好提前準(zhǔn)備。而Open AI后續(xù)對AI大模型的核心工作仍是訓(xùn)練,并且準(zhǔn)備在全球建立一套數(shù)據(jù)庫,以反映全球AI的價值觀和偏好,即時向全球分享AI安全研究。
除Open AI自身努力外,Sam Altman也呼吁全球共同努力來完善對于AI的監(jiān)管。比如說,Sam Altman指出當(dāng)前中國擁有一些世界上最優(yōu)秀的AI人才,考慮到解決 AI 系統(tǒng)對齊的困難需要來自世界各地最好的頭腦。
因此,Sam Altman也希望未來中國AI研究人員能夠在AI風(fēng)險上做出貢獻(xiàn)。Tegmark也認(rèn)為,目前中國在人工智能的監(jiān)管方面做得最多,其次則為歐洲,最后則是美國。
圖源:智源大會
另外,Sam Altman也指出,全球AI監(jiān)管的合作困難是有的,但這也實則是一種機(jī)遇。AI在讓全世界走到一起的同時,后續(xù)也需要出臺系統(tǒng)性的框架和安全標(biāo)準(zhǔn)。
但考慮當(dāng)前全球大國和大國之間的博弈加劇,地緣沖突呈現(xiàn)多點(diǎn)式爆發(fā),各國政府對生成式AI的態(tài)度不一,這在讓全球關(guān)于AI監(jiān)管的合作短時間難以落地的同時,也會影響到生成式AI公司的市場業(yè)務(wù)。
歐洲一直走在AI監(jiān)管的前沿,5月份歐盟已經(jīng)接近通過一項人工智能技術(shù)監(jiān)管的立法,這也有望成為全球首部全面的人工智能法案,并可能成為發(fā)達(dá)經(jīng)濟(jì)體的先例。
歐盟委員會主席烏爾蘇拉·馮德萊恩此前在接受媒體采訪說曾表示,“我們希望人工智能系統(tǒng)準(zhǔn)確、可靠、安全且無歧視,無論其來源如何。歐盟相關(guān)法律法規(guī)的出臺,可能會讓Open AI后續(xù)退出歐盟市場。因此,后續(xù)如何根據(jù)全球監(jiān)管政策的調(diào)整,不斷完善自家的生成式AI模型,這不僅僅是Open AI自身遇到的問題,更是全行業(yè)需不斷關(guān)注的問題。
02.生成式AI未來的發(fā)展方向在哪?
不可否認(rèn)的是,當(dāng)前GPT-4在諸多能力上得到了很大提高。和GPT-3.5相比,GPT-4在復(fù)雜專業(yè)領(lǐng)域的性能表現(xiàn)大幅提升,邏輯推理能力也更強(qiáng),其在美國律師資格考試測試中,GPT-4的成績可以達(dá)到前10%,但GPT-3.5只能達(dá)到后10%的水平。
圖源:Open AI
能力的大幅度提高,也讓Chat GPT正開拓更多的使用場景。目前Open AI官方也給出了幾大應(yīng)用場景,如在Duolingo里加入AI與用戶進(jìn)行日常聊天,加速用戶對語言的學(xué)習(xí);摩根士丹利采用GPT-4來對其知識庫進(jìn)行管理,幫助員工快速訪問想要的內(nèi)容。
但針對GPT目前的能力,也有不少大佬存在質(zhì)疑。斯圖爾特·羅素在演講中指出,Chat GPT和GPT-4他們并不理解世界,也沒有在“回答”問題,目前的大語言模型僅僅只是一塊拼圖,這個拼圖目前缺少哪些以及最終會拼成什么樣,這些均不確定。諸多能力上的欠缺,也決定了發(fā)展通用人工智能還有很長的路要走?;趯PT-4能力的種種質(zhì)疑,也讓斯圖爾特·羅素在Sam Altman在演講期間全程在修改PPT。
圖源:智源大會
和斯圖爾特·羅素持有相同觀點(diǎn)的也有來自圖靈獎”得主、“深度學(xué)習(xí)三巨頭”之一、Meta首席人工智能科學(xué)家楊立昆。他認(rèn)為,當(dāng)前GPT的自回歸模型因缺乏規(guī)劃,導(dǎo)致其推理能力目前整體不行。若單純根據(jù)概率生成自回歸的大語言模型從本質(zhì)上根本無法解決幻覺,錯誤的問題。在輸入文本增大的時候,錯誤的概率也會呈指數(shù)增加。
事實上,兩位大佬對GPT的指責(zé)并非不是沒有道理。因Chat GPT所使用的RLHF算法,本身就是借助人類的感知,讓模型判斷自己的答案質(zhì)量,訓(xùn)練自己逐步給出更高質(zhì)量的回答。若想要讓模型的推理能力得以提高的話,則需要在補(bǔ)充數(shù)據(jù)庫大量參數(shù)的同時,對算法也要進(jìn)行不斷迭代。
圖源:西南證券
但各種風(fēng)險的存在,也讓眾多生成式AI公司并不敢輕易嘗試。若生成式AI能到達(dá)和小說作家一樣的具備故事推理能力,以及人物情感創(chuàng)造能力,這是否會讓生成式AI完全脫離人類的控制呢?這在引發(fā)全球恐慌的同時,又是否會遭遇來自當(dāng)?shù)卣膹?qiáng)監(jiān)管,進(jìn)而讓生成式AI此前的投入付諸東流呢?
針對未來生成式AI的發(fā)展方向,楊立昆給出的答案是世界模型。這個世界模型不單單是神經(jīng)水平上模仿人腦的模型,而是在認(rèn)知模塊上也完全貼合人腦分區(qū)的世界模型,它與大語言模型最大的差別在于可以有規(guī)劃和預(yù)測能力(世界模型)以及成本核算能力(成本模塊)。
借助世界模型能夠更好地理解這個世界并預(yù)測和規(guī)劃未來,通過成本核算模塊,結(jié)合一個簡單的需求(一定按照最節(jié)約行動成本的邏輯去規(guī)劃未來),它就可以杜絕一切潛在的毒害和不可靠性。
圖源:智源大會
但問題是世界模型在訓(xùn)練期間的參數(shù)、算法、成本等等問題,楊立昆也只是簡單地給出了一些戰(zhàn)略級想法。比如采用自監(jiān)督模型去訓(xùn)練以及建立多層級的思維模式等等,但對于具體如何落地,楊立昆也無法給出一個完整的方案。
而其他參會嘉賓對于未來生成式AI的發(fā)展方向,也并沒有分享自己的看法。因此,后續(xù)生成式AI仍將維持各家“各自為政”的局面,全球統(tǒng)一的生成式AI或許也只能停留在實驗室階段。
03.國內(nèi)生成式AI預(yù)測
智源研究院院長黃鐵軍教授在會后接受媒體采訪時說,當(dāng)前國內(nèi)生成式AI大模型存在的問題是行業(yè)過熱,但訓(xùn)練數(shù)據(jù)過小,現(xiàn)在百億模型也只是剛剛涌現(xiàn)能力。雖然中間也都有一些技術(shù)能力,但因重復(fù)性發(fā)力,這在讓行業(yè)資源愈發(fā)分散的同時,其智能水平和國外生成式AI大模型相比,仍有一定差距。
如黃鐵軍教授所言,以阿里旗下的“通義千問”大模型為例,因該大模型訓(xùn)練時的數(shù)據(jù)是從阿里旗下的淘寶、支付寶、天貓等產(chǎn)業(yè)中抽取的大量中文對話和文本數(shù)據(jù),以及一些其他來源的文本數(shù)據(jù),其前期訓(xùn)練數(shù)據(jù)量是約2000億個詞,相當(dāng)于14TB的文本數(shù)據(jù)。
而Chat GPT的訓(xùn)練數(shù)據(jù)量是約45億個詞,相當(dāng)于300GB的文本數(shù)據(jù)。訓(xùn)練數(shù)據(jù)的相對較小,讓阿里的“通義千問”也欠缺多模態(tài)能力,在文字方面上來看二者均和GPT-4有較大差距。
另據(jù)InfoQ 研究中心發(fā)布的《大語言模型綜合能力測評報告2023》數(shù)據(jù)顯示,目前Chat GPT以77.13%的綜合得分領(lǐng)先于國內(nèi)其他的大模型廠商。
圖源:《大語言模型綜合能力測評報告2023》
同時,黃鐵軍教授也指出,今天的大模型都是技術(shù)迭代的一個中間產(chǎn)品,隨著后續(xù)國內(nèi)大模型行業(yè)的發(fā)展,未來能夠存活的大模型生態(tài)合理數(shù)量為3個左右。
正如黃鐵軍教授所說,此前馬化騰在騰訊內(nèi)部的高層會議上曾指出,未來十年C端市場紅利將消失殆盡,整個希望在ToB端市場,互聯(lián)網(wǎng)的下半場則屬于產(chǎn)業(yè)互聯(lián)網(wǎng)。阿里商業(yè)研究院此前也指出,未來十年是傳統(tǒng)企業(yè)轉(zhuǎn)型的黃金風(fēng)口。
但從ToB端市場來看,以發(fā)展多年的SaaS市場作為參考,大模型若想要真正打開ToB端市場,其核心一定是要客戶帶來“降本增效”的價值,尤其是在當(dāng)前不少行業(yè)對大模型仍保持觀望的情況下更是如此。以傳統(tǒng)制造業(yè)為主,目前中小型傳統(tǒng)制造業(yè)普遍遇到的問題是訂單減少,行業(yè)一直在價格戰(zhàn)中廝殺,下游回款周期變長,許多中小制造業(yè)目前均是在苦苦支撐。為避免出現(xiàn)較高的試錯成本,不少中小制造企業(yè)自然不敢輕易嘗試大模型的使用。
并且從SaaS產(chǎn)業(yè)的發(fā)展歷程來看,自2004年初期開始國內(nèi)SaaS產(chǎn)業(yè)在經(jīng)歷了波瀾不驚的10年之后,于2015年迎來了一波生長高峰。從2020年疫情暴發(fā)至今,疫情加速企業(yè)數(shù)字化轉(zhuǎn)型,國內(nèi)SaaS市場進(jìn)入了關(guān)鍵的生長期。但即使如此,當(dāng)前國內(nèi)SaaS產(chǎn)業(yè)生態(tài)尚未完整,市場并未成熟。
圖源:Flash Cloud
顯然,大模型打開TOB端市場也并非一朝一夕,而是一個極其緩慢的過程。而且模型迭代其間因算法、算力、數(shù)據(jù)產(chǎn)生的成本,包括后續(xù)推出各種功能,均要求大模型公司不斷投入高額資金。
商業(yè)化落地時間長,資金投入高,短期內(nèi)難以盈利等問題的存在,后續(xù)也會讓缺乏現(xiàn)金流的企業(yè),在資金壓力面前只能將企業(yè)自身的大模型進(jìn)行關(guān)停,行業(yè)資源也會更加向頭部大模型廠商身上集中。
而從網(wǎng)約車、外賣等多個行業(yè)的經(jīng)驗來看,一個新興行業(yè)在歷經(jīng)多年的大浪淘沙過程中,后續(xù)能夠真正發(fā)展起來的企業(yè)也只在3家左右,其他不少企業(yè)則被淹沒在歷史的長河中。
04.結(jié)語
不可否認(rèn)的是,生成式的AI能力正在逐漸被市場所認(rèn)可,但如何對AI進(jìn)行監(jiān)管將會是后續(xù)全球多國一直要重視的問題。
而對于我們普通人擔(dān)心未來是否會被AI搶走飯碗,引發(fā)自己失業(yè)所產(chǎn)生的焦慮,或許正如Tegmark所說,經(jīng)濟(jì)和就業(yè)市場的變化會越來越快,如果你在基礎(chǔ)知識方面很強(qiáng),并且非常善于創(chuàng)造性的開放思維,你就可以靈活地隨波逐流。
上一篇:抖音的“拿來主義”