2019年,前谷歌CEO埃里克·施密特向白宮遞交了一份頗為“詭譎”的報告。這份長達(dá)750頁的文件,核心觀點其實只有一句話:若美國再不加大投資,中國將徹底主導(dǎo)AI領(lǐng)域[1]。
施密特此舉其實有“騙經(jīng)費”之嫌:一年前,谷歌曾迫于輿論壓力退出了一個政府AI項目,他一直對此耿耿于懷。但報告本身卻并非胡謅。同年,美國數(shù)據(jù)創(chuàng)新中心也發(fā)布了一份報告,聲稱中國AI實力全球第二,且在數(shù)據(jù)等層面比美國更具優(yōu)勢[2]。
在全民追趕GPT的今天,這則舊聞讀起來頗有幾分“魔幻感”。
報告甚至上升到了“國家安全”的高度
然而,施密特口中的AI,與如今人們談?wù)摰?/span>GPT并非一個東西。
以GPT為代表的AI,指的其實是大模型。它擁有生成圖像、音頻、視頻等內(nèi)容的能力,像是個文藝青年。但彼時讓美國人深感威脅的,多指識別型AI(小模型)。它擅長各類數(shù)據(jù)分析工作,如同一個木
得感情的運算機(jī)器。
大模型走紅前,識別型AI曾被寄予了太多改變世界的厚望,在中國催生了一段群雄并起、熱錢涌動的黃金歲月。巔峰時期,中國AI初創(chuàng)企業(yè)的融資金額甚至超過了美國——李開復(fù)將其形容為“有三個AI專家就能估值7億、靠AI概念就能忽悠投資人”,也不怪美國人感到焦慮。
只是好景不長:后來VC陸陸續(xù)續(xù)退出,曾經(jīng)風(fēng)頭無兩的獨角獸也褪去了身上的光環(huán),殘暴的歡愉最終以殘暴終結(jié)。
對此,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖曾打過這么一個比方:大模型出現(xiàn)前的AI像是氧氣——本身很有價值,但自己不會燃燒,必須找到可燃物才能把價值給發(fā)揮出來。這里的“可燃物”,指的是落地場景。
AI起起落落這十年,成也場景,敗也場景。
舊范式的困境
2016年,谷歌AlphaGO不僅徹底顛覆了圍棋,也改變了當(dāng)時的AI創(chuàng)業(yè)。一時間,VC、科學(xué)家、大學(xué)教授,乃到各路鄉(xiāng)鎮(zhèn)企業(yè)家,無一不在談?wù)撝鳤I商業(yè)化的可能性。短短一年時間,國內(nèi)誕生了528家AI企業(yè),催生371起AI投融資,同比漲幅達(dá)到了38.9%;同一時間,中國AI企業(yè)申請了9000多項AI專利,幾乎是美國新增專利數(shù)的兩倍有余[3]。
不過,整個行業(yè)閉眼狂奔的同時,鮮有人會注意到初冬的號角已經(jīng)悄悄吹響。2019年,繁榮戛然而止。
首先是融資遇冷:這一年的AI融資金額僅有186億元,相比2018年直接腰斬了一個0。受此影響,AI初創(chuàng)企業(yè)的數(shù)量也大幅縮水,僅有鼎盛時期的1/20。至于那些從競爭中幸存、成功“上岸”的AI企業(yè),其財務(wù)狀況仍舊慘不忍睹。據(jù)不完全統(tǒng)計,近九成AI企業(yè)都處于嚴(yán)重虧損的狀態(tài)[4]。
大起大落背后,是AI長期以來的產(chǎn)業(yè)化困境。
2021年之前,業(yè)界三大主流AI技術(shù)分別是計算機(jī)視覺、語音識別、自然語言識別,本質(zhì)都屬于識別型AI。單從技術(shù)層面來看,上述技術(shù)都具備著充分的下游應(yīng)用空間,想象力充足。
例如在“AI+安防”領(lǐng)域,2020年時已有453億元的市場,且增速可觀,預(yù)計到2025年時市場規(guī)模將再翻一番[6]。
可下游需求不斷擴(kuò)大,并無法拯救虧錢的AI企業(yè)。識別型AI的技術(shù)特點,決定了它是一門技術(shù)、投入與產(chǎn)出不成正比的生意。
識別型AI采用的是小模型——這是一種專為特定任務(wù)而生的技術(shù)。在實際訓(xùn)練小模型時,研究員只需給AI灌入標(biāo)注過的特定數(shù)據(jù),便能讓AI獲得對應(yīng)的能力。如果想要一個能抓“闖紅燈”的AI,那么無需教它語文數(shù)學(xué),只要讓它從小學(xué)習(xí)各種闖紅燈的視頻即可。
小模型的優(yōu)點在于簡單、高效,專用向的AI能夠很好地完成對應(yīng)任務(wù)。但其缺點同樣明顯:由于沒學(xué)過其他知識,一個AI只能解決一個問題。譬如一個抓闖紅燈的AI,顯然不會具備識別超速、違規(guī)變道的能力。
識別不同元素需要不同的標(biāo)注數(shù)據(jù)
由于小模型不具備通用性,導(dǎo)致識別型AI只能成為一門類手工作坊的定制生意。
且具體到實際應(yīng)用中,一個需求有時還需要定制不止一個AI。例如在工業(yè)領(lǐng)域,在制造冶金鋼卷時有缺陷檢測這一步驟。如果將這項工作交由AI,定制起來其實相當(dāng)麻煩。因為鋼卷分為冷軋、熱軋,所以AI企業(yè)需要同時用“冷軋-合格”“冷軋-缺陷”“熱軋-合格”“熱軋-缺陷”四組數(shù)據(jù)訓(xùn)練四遍[7]。其繁瑣程度,與“五彩斑斕的黑”有的一拼。
定制需求繁瑣的同時,對人力要求還不低——這活兒可不是月薪三千的大學(xué)生能干的。
出于業(yè)務(wù)需要,頭部AI企業(yè)都聘請了大批科學(xué)家、博士生與教授作為研究員,而AI研究員又是出了名的“高薪崗位”。2015年,谷歌為了不讓知名研究員伊利亞(Ilya Sutskever)跳槽,曾開出過200萬美元/年的高薪——后來桑達(dá)爾·皮查伊繼任谷歌CEO時,其基本工資是同一個數(shù)字。
財新曾對國內(nèi)AI企業(yè)招股書做過一筆測算,發(fā)現(xiàn):它們每掙1塊錢,就要花掉0.75元的人力成本。再算上定制AI的算力、數(shù)據(jù)開銷、以及其他成本,幾乎做一單虧一單。
人們這才驚奇地發(fā)現(xiàn),AI這門生意似乎遠(yuǎn)不如想象中那么性感。
陷入死局后,AI企業(yè)們只能寄希望于一場“推翻重來”式變革。幸運的是,沒過幾年,暴風(fēng)雨真的來了。
通用性的價值
紅杉資本率先嗅到了風(fēng)雨欲來的氣息。2022年9月,紅杉發(fā)表了文章《Generative AI: A Creative New World》,預(yù)言一場全新的科技競賽即將來臨。投資人同行很快聞風(fēng)而動,一度冷清的AI圈再度人聲鼎沸。
這篇文章發(fā)布僅半年,有頭有臉的科技公司們幾乎全部一頭扎進(jìn)了AI浪潮之中,要用人工智能把每個行業(yè)都重新做一遍。
例如當(dāng)下火熱的直播行業(yè),大模型應(yīng)用的空間就相當(dāng)廣闊。對于那些養(yǎng)不起專業(yè)直播團(tuán)隊的商家,如今只需輸入商品信息,百度的文心一言能夠自動生成話術(shù)、配音以及數(shù)字人主播,直接包攬了整個流程。
企業(yè)無需再花錢雇主播、想話術(shù)、搞培訓(xùn),能輕松實現(xiàn)7*24小時直播,對中小企業(yè)而言無疑是個重大利好。
在沈抖看來,大模型創(chuàng)業(yè)帶來的眾多機(jī)會,將帶動數(shù)字化經(jīng)濟(jì)更進(jìn)一步,有機(jī)會在全球范圍內(nèi)掀起一股產(chǎn)業(yè)再造的浪潮。
他認(rèn)為,隨著大模型深入數(shù)字經(jīng)濟(jì),更多產(chǎn)業(yè)會出現(xiàn)新的改變。智能化不僅讓整個生產(chǎn)流程大幅提效,也改變了很多原有的生產(chǎn)關(guān)系,包括人和人、人和設(shè)備、人和系統(tǒng)的關(guān)系。以前沒有智能時,很多工作實際上是靠人來操作;有了智能以后,機(jī)器、設(shè)備、系統(tǒng)都可以按照人的思想去學(xué)習(xí)。
未來的工作模式,很有可能是一個聰明的人去指導(dǎo)一堆機(jī)器人。這些機(jī)器人執(zhí)行人類的決定,重塑整個生產(chǎn)線。沈抖說道,“生成式AI已經(jīng)形成全球性的‘AI再造業(yè)務(wù)’趨勢,企業(yè)迎來‘智能化躍遷’的歷史機(jī)遇?!?/p>
AI產(chǎn)業(yè)能夠二度迎來春天,背后其實是大模型技術(shù)邁向成熟。
這場變革的起點發(fā)生在2017年:彼時,谷歌幾位研究員公開了深度學(xué)習(xí)模型Transformer。以此為基礎(chǔ),OpenAI等機(jī)構(gòu)開始嘗試研究大模型,一種不同于識別型AI的全新技術(shù)。
其研究成果,正是如今備受關(guān)注的GPT,即Generative Pre-trained Transformer(生成式預(yù)訓(xùn)練Transformer)。
眾所周知,一個AI由模型、數(shù)據(jù)、算力三要素構(gòu)成。相比于傳統(tǒng)的識別型AI(小模型),以GPT為代表大模型在數(shù)據(jù)、模型等方面均有不同程度的革新,賦予了大模型更強(qiáng)的通用性。這恰好改善了小模型時代的產(chǎn)業(yè)化痛點,AI實現(xiàn)即插即用。AI企業(yè)終于能擺脫手工作坊般的生產(chǎn)模式,有機(jī)會變成一門好生意。
大模型的這一價值,幾乎吸引了全球所有的目光。連早已退休、專心搞慈善的比爾蓋茨,都為此興奮不已。他在一篇文章中寫道,自己有幸親歷了人類可能最重要的兩場革命的開端:第一次發(fā)生在Windows萌芽、PC市場剛剛興起的80年代,而第二次正是去年——大模型剛剛開始涌現(xiàn)的時候。
而沈抖認(rèn)為,作為“通才”的大模型還催生一種全新的產(chǎn)業(yè)化路徑:MaaS(Model as a Service),模型即服務(wù)?!案鶕?jù)我們提供的文心一言的大模型服務(wù),企業(yè)能夠以此為基礎(chǔ),結(jié)合他們所在行業(yè)去微調(diào)出一個行業(yè)大模型,再用這個行業(yè)大模型去服務(wù)整個行業(yè)?!?/p>
未來,大模型可能會成為一個類似于安卓的“超級底座”, 每個行業(yè)都迎來AI再造的機(jī)會,并給應(yīng)用端帶來大量的機(jī)會。
而在美國,已經(jīng)誕生了依托于大模型開展業(yè)務(wù)的獨角獸。在德克薩斯州,一家初創(chuàng)企業(yè)憑借微調(diào)后的AI應(yīng)用,在短短18個月時間做到了15億美元估值,年收入已有3000萬美元,比直接做大模型的企業(yè)還賺錢[10]。
不過,產(chǎn)業(yè)化潛力僅僅是大模型價值的一個方面。不同于過去兩年流行的元宇宙、Web3等概念,大模型帶來了實打?qū)嵉纳a(chǎn)力提升。
例如長安汽車在參與百度文心一言的邀測時,就體驗了一回大模型的生成PPT功能。過去,制作一份PPT通常要花費半天甚至一天時間;如今,只需三分鐘即可做出一份內(nèi)容齊全、格式精美的PPT。未來,機(jī)械的重復(fù)性工作將完全可以交給AI,員工可以集中于創(chuàng)造更大價值的工作,企業(yè)競爭力增加同時增加社會財富。
百度智能云舉行的閉門溝通會上,現(xiàn)場演示文心一言生成PPT
毫無疑問,大模型將是未來十年科技圈最重要的敘事之一。
百模大戰(zhàn)
“百模大戰(zhàn)”來了,一如當(dāng)年的“百團(tuán)大戰(zhàn)”。
國內(nèi)大公司紛紛扎堆推出大模型,百度文心一言最先,360、騰訊、阿里、商湯、科大訊飛、字節(jié)等紛紛緊追。大模型產(chǎn)品大多同時兼具對話問答、文章創(chuàng)作、代碼寫作等多項技能。市場上供給多了,但這些產(chǎn)品的“智力”水平卻參差不齊,如何挑選成為了一個難題。
目前主流觀點認(rèn)為,可以有以下兩個標(biāo)準(zhǔn):
第一,從芯片到框架、模型再到應(yīng)用的全鏈路環(huán)節(jié)都具備極為優(yōu)秀的性能。
芯片決定了算力,這是AI訓(xùn)練的基礎(chǔ)。OpenAI曾做過一筆測算:2012年開始,全球AI訓(xùn)練所用的計算量平均每3.43個月便會翻一倍,遠(yuǎn)超摩爾定律。在肉眼可見的未來,“算力不足”都將會是制約AI發(fā)展的最大因素。因此,芯片要做到性能過硬。
只有制造出算力極強(qiáng)的高端芯片,才能滿足智算時代的計算需求,讓云好用,這是基礎(chǔ)條件。
而在框架和模型層面,軟件適配程度要更高,算法積累足夠,大模型能力要更強(qiáng)。深度學(xué)習(xí)框架需要做到全棧自主可控,推動大模型不斷迭代升級。在此基礎(chǔ)上,推出多樣云服務(wù)使得大模型適應(yīng)各產(chǎn)業(yè)的數(shù)字、智能化需求,做好模型即服務(wù)(MaaS)。
第二,能為大家提供全鏈路的服務(wù)保障。
服務(wù)商不僅要具備多元的能力,還需要將它們有機(jī)地結(jié)合起來:如此一來不僅能帶來更高的可靠性、幫助企業(yè)降本增效,還降低AI使用門檻,既易用,又好用。
好的智算基礎(chǔ)設(shè)施,就是要高效解決算力、算法、數(shù)據(jù)處理等多維度的問題,而且這些維度之間不是獨立存在的,而是互相依賴,相互優(yōu)化、緊密耦合,從而提升整體基礎(chǔ)設(shè)施效能。
比如芯片解決算力問題,框架解決算法開發(fā)問題,大模型解決模型泛化問題,他們?nèi)呔酮q如三人四足比賽中的團(tuán)隊合伙人,只有彼此心有靈犀、協(xié)調(diào)互補(bǔ),才能打出完美的團(tuán)隊配合,贏得比賽勝利。
百度的解決方案,是將文心一言大模型與百度智能云服務(wù)結(jié)合起來,提供一種更便捷的一站式服務(wù),即“云智一體”。
該方案同時提供了算力與大模型服務(wù),企業(yè)只需提供自身行業(yè)的數(shù)據(jù)做微調(diào),即可快速生產(chǎn)出符合市場需求的AI產(chǎn)品。不過,百度智能云能做的還不止微調(diào)一項,它還額外集成了推理與托管服務(wù)。
推理是大模型所具備的一項能力,指利用訓(xùn)練好的AI去進(jìn)行結(jié)論推導(dǎo)的過程。如果說微調(diào)是將已有的房子重新裝修一遍,那么推理則相當(dāng)于給你空地和材料,搭建一個全新的房子。雖然推理的成本高于微調(diào),但能讓大模型新增更多原本不具備的能力,滿足企業(yè)更深層次的開發(fā)需求。
至于托管,則能幫助較為早期的大模型創(chuàng)業(yè)者解決搭建團(tuán)隊的難題。高薪的AI研究員一直是市場上最搶手的資源之一,初創(chuàng)企業(yè)不僅資金有限,且很難在人才競爭中獲得太多優(yōu)勢。相比之下,托管服務(wù)則會提供一支高度專業(yè)的團(tuán)隊,幫助第三方企業(yè)管理他們的AI解決方案。
由此可見,微調(diào)、推理、托管三大服務(wù)的功能各不相同,能夠滿足不同階段企業(yè)的需求。
如今,上述“云智一體”服務(wù)已成為一種行業(yè)共識。百度智能云作為這一概念的提出者,具備一些獨有的優(yōu)勢。
2022年,百度副總裁沈抖升級了原有的架構(gòu),正式對外官宣了“云智一體3.0”。該架構(gòu)的優(yōu)勢在于,形成了“芯片-框架-大模型-行業(yè)應(yīng)用”的智能化閉環(huán)路徑,百度是全球唯一在每一層都有自研產(chǎn)品的公司。比如芯片層有昆侖芯,框架有中國市場份額第一的飛槳。
沈抖認(rèn)為,四層架構(gòu)的高效協(xié)同,能實現(xiàn)更高的運轉(zhuǎn)效率,“我們能在同等算力投入下,把某個應(yīng)用的性能提高100%,相當(dāng)于讓算力需求降低了50%?!边@是百度智能云非常獨特的優(yōu)勢,也使得百度智能云成為國內(nèi)第一個訓(xùn)練出大模型的云。
如今,“云智一體”不僅僅只是一項服務(wù),更有可能成為數(shù)字時代的一種新基建。經(jīng)濟(jì)學(xué)博士任澤平曾在2023年跨年演講中預(yù)測,智能云將成為數(shù)字經(jīng)濟(jì)的重要技術(shù)支撐,并在未來20年成為支撐中國經(jīng)濟(jì)繁榮發(fā)展的新型基礎(chǔ)設(shè)施。
對當(dāng)今社會而言,這些變化既是將來時,也是進(jìn)行時——AI正在以肉眼可見的速度重塑這個社會。對此,輿論上充斥著許多不安的聲音。不過,當(dāng)時代的浪潮撲面而來,企業(yè)、個體最好的選擇,只有擁抱它。
尾聲
不論是紅杉資本還是黃仁勛,都喜歡將當(dāng)下稱為“AI的IPhone時刻”。
初代IPhone發(fā)布于2007年。彼時,摩托羅拉、諾基亞才是手機(jī)市場的霸主,張小龍還在忙著做QQ郵箱,百度搜索的網(wǎng)頁訪問量每天都在增長,沒人知道世界上第一款智能手機(jī)到底會帶來些什么。
然而,當(dāng)喬布斯講出那句“今天,蘋果將重新發(fā)明手機(jī)”時,世界依舊為之沸騰,變革的伏筆已經(jīng)埋下。相比于市面上的其他產(chǎn)品,初代IPhone的革新之處其實只有兩個方面:一是取消了鍵盤,改用觸屏設(shè)計;二是借鑒了電腦的設(shè)計,嘗試在手機(jī)中加入瀏覽器、股票、天氣等應(yīng)用。
10年之后,初代IPhone的這兩大設(shè)計已然成為了智能手機(jī)的設(shè)計標(biāo)準(zhǔn),以此構(gòu)建的移動互聯(lián)網(wǎng)改寫了數(shù)十億人的生活。
沈抖曾在采訪時提到,初代IPhone的出現(xiàn),將手機(jī)分成了兩類:智能手機(jī)與非智能手機(jī),而非智能手機(jī)最終被淘汰了。大模型出來后,同樣會把企業(yè)分成兩類:一類是智能企業(yè),一類是非智能企業(yè)——類似的故事有可能會再次上演。
關(guān)于大模型的未來,如今看來仍有些模糊,但唯有一點是確信的——新時代的序幕正緩緩拉開,一場重新定義時代的比賽已經(jīng)開始。