11月13日早上,一則關(guān)于阿里巴巴決定申請(qǐng)仲裁“通義大模型前員工周暢違反競(jìng)業(yè)協(xié)議”的消息迅速在AI圈傳播開(kāi)來(lái),而當(dāng)天中午就有媒體得到阿里內(nèi)部人士的確認(rèn):情況屬實(shí)。
早在2020年,周暢就開(kāi)始在阿里達(dá)摩院帶領(lǐng)團(tuán)隊(duì)訓(xùn)練名為M6的多模態(tài)模型,2023年ChatGPT爆火后,他所在的團(tuán)隊(duì)在M6基礎(chǔ)上研發(fā)了“通義千問(wèn)”大模型,該模型如今已成為眾多通義系列AI產(chǎn)品的技術(shù)底座??梢哉f(shuō)他就是當(dāng)今世界上最懂阿里大模型的人,但這個(gè)人現(xiàn)在跳槽到了字節(jié)跳動(dòng),對(duì)于阿里來(lái)說(shuō)這無(wú)異于釜底抽薪。
7月中旬,最先曝出來(lái)的消息是周暢即將辭職創(chuàng)業(yè),然而10月底,他就已經(jīng)加入了字節(jié)跳動(dòng)。“辭職創(chuàng)業(yè)就是個(gè)幌子,就是怕被競(jìng)業(yè),”在一家服務(wù)字節(jié)的獵頭公司工作的沈曼告訴《第一財(cái)經(jīng)》雜志,“但這次瞞不住了,來(lái)字節(jié)的不止周暢一個(gè)人,他手底下的團(tuán)隊(duì)還有十多個(gè)人也跟著跳槽了?!?/span>
此外,最近幾個(gè)月加入字節(jié)大模型團(tuán)隊(duì)的關(guān)鍵人才還包括零一萬(wàn)物前算法副總裁黃文灝,面壁智能原核心成員、序智科技創(chuàng)始人秦禹嘉。
這家中國(guó)最年輕也最激進(jìn)的技術(shù)公司一直以擁有龐大的招聘團(tuán)隊(duì)著稱(chēng),HR部門(mén)巔峰時(shí)有5000多名員工,其中絕大部分人唯一的工作就是招聘,再輔以同等規(guī)模的外包獵頭體系,共同構(gòu)成了一座史無(wú)前例的搶人工廠。其他體量相近的技術(shù)公司在招聘團(tuán)隊(duì)規(guī)模上與它有著約一個(gè)數(shù)量級(jí)的差距,這意味著只要字節(jié)決定入場(chǎng),每家競(jìng)對(duì)公司都將面臨人才流失的風(fēng)險(xiǎn)。
但字節(jié)曾是“遲鈍”的。CEO梁汝波在2024年年初的全員會(huì)上反思道,公司“直到2023年才開(kāi)始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的”。百度2023年10月宣布已在百度搜索、文庫(kù)、地圖等各種應(yīng)用中全部植入了AI能力時(shí),豆包App剛上線(xiàn)不久,這也是當(dāng)時(shí)字節(jié)唯一一款A(yù)I原生應(yīng)用。
字節(jié)提速,從搶人開(kāi)始
從2023年年中開(kāi)始,這座工廠AI方向的搶人需求就沒(méi)有斷過(guò)。“目標(biāo)主要是阿里通義團(tuán)隊(duì)、百度文心和飛槳團(tuán)隊(duì),以及包括月之暗面、智譜在內(nèi)的‘AI六小龍’,等等,”沈曼說(shuō),“國(guó)內(nèi)有模型研發(fā)經(jīng)驗(yàn)的人才基數(shù)較少,所以工作時(shí)往往可以直接定位到團(tuán)隊(duì)甚至個(gè)人?!弊止?jié)對(duì)于基礎(chǔ)模型研發(fā)相關(guān)人才的招聘是沒(méi)有名額上限的,對(duì)于目標(biāo)團(tuán)隊(duì)的候選人在薪資上開(kāi)出的數(shù)字非常可觀,經(jīng)常可以看到基于原薪資雙倍的漲薪幅度。
根據(jù)沈曼的經(jīng)驗(yàn),字節(jié)各個(gè)部門(mén)首先要向招聘團(tuán)隊(duì)提出招人需求,但公司開(kāi)放給各部門(mén)招聘人才級(jí)別的權(quán)限并不相同。字節(jié)職級(jí)一共分10級(jí),從最低的1-1到最高的5-2,數(shù)字越大,職級(jí)越高。其中2-1(工程師)到3-1(高級(jí)技術(shù)專(zhuān)家)是內(nèi)部占比最大的。在業(yè)務(wù)維穩(wěn)期,會(huì)有大量2-1和2-2的招聘需求。在業(yè)務(wù)需要“開(kāi)疆拓土的階段”會(huì)放出3-2、4-1以及更高的需求。一般來(lái)說(shuō),只有盈利部門(mén)3-1以上的需求會(huì)更多,但是在大模型研發(fā)人才的招聘上,字節(jié)格外大方?!兜谝回?cái)經(jīng)》雜志通過(guò)多方信源了解到,字節(jié)給周暢提供了一份幾乎無(wú)法拒絕的合同:4-2的職級(jí)和8位數(shù)的年包工資,按阿里的職級(jí)體系換算大約是連跳兩級(jí)且薪資翻好幾倍。與他一起來(lái)的原團(tuán)隊(duì)成員,字節(jié)也都給了4-1、3-2(對(duì)標(biāo)阿里級(jí)別P10、P9)的職級(jí)?!澳阋部梢园阎軙尺@單合同看作一份英雄帖,字節(jié)是在告訴所有人,它愿意給,而且給得起。”沈曼說(shuō)。
對(duì)于字節(jié)來(lái)說(shuō),搶人早已是公司開(kāi)辟新業(yè)務(wù)時(shí)慣用的手段。字節(jié)創(chuàng)始人張一鳴曾多次在公開(kāi)場(chǎng)合提到“人才密度”的概念,在他看來(lái),只要保證人才密度超過(guò)業(yè)務(wù)復(fù)雜度,那么在有效的激勵(lì)措施下業(yè)務(wù)的成功是水到渠成的。
張一鳴本人就是這套理論最忠實(shí)的踐行者,字節(jié)旗下今日頭條、抖音等信息流產(chǎn)品所倚仗的核心技術(shù),即推薦、廣告、搜索算法(簡(jiǎn)稱(chēng)“推廣搜”)的研發(fā)班底其實(shí)就來(lái)自于百度。2014年至2015年,張一鳴以高薪從百度網(wǎng)頁(yè)搜索部相繼挖來(lái)了當(dāng)時(shí)的副總監(jiān)楊震原、主任架構(gòu)師朱文佳,以及一批機(jī)器學(xué)習(xí)算法工程師?,F(xiàn)如今,楊震原已是字節(jié)跳動(dòng)副總裁兼火山引擎業(yè)務(wù)負(fù)責(zé)人,朱文佳則擔(dān)任過(guò)今日頭條CEO及TikTok產(chǎn)品技術(shù)負(fù)責(zé),2023年年初更是成立了代號(hào)為“Seed”的神秘團(tuán)隊(duì),專(zhuān)注于大模型底層技術(shù)的研發(fā)。
其實(shí)比從外面搶人更早一點(diǎn)發(fā)生的,是字節(jié)內(nèi)部的“搶人”,或者按官方的說(shuō)法:團(tuán)隊(duì)重組。
神秘和特殊是樂(lè)雁對(duì)Seed團(tuán)隊(duì)的最早印象。2023年年初,他發(fā)現(xiàn)在字節(jié)機(jī)器學(xué)習(xí)平臺(tái)的算力使用榜前排出現(xiàn)了一些新名字。依照過(guò)往經(jīng)驗(yàn)來(lái)看,排名靠前的都是當(dāng)前字節(jié)內(nèi)部最受重視、得到最多資源傾斜的團(tuán)隊(duì),而前幾名的算力使用量往往能占當(dāng)時(shí)總算力的一半。一些消息靈通的同事稱(chēng)這個(gè)新成立的團(tuán)隊(duì)很可能在做基礎(chǔ)模型的研發(fā),他們的工作區(qū)還有第二道門(mén)禁。
樂(lè)雁2020年才作為算法工程師加入字節(jié),但他對(duì)這家公司靈活多變的管理風(fēng)格并不陌生,從每個(gè)人到每個(gè)部門(mén),一切都在名為效率的指揮棒下快速移動(dòng)、安置、再移動(dòng)、再安置。
AI Lab在公司內(nèi)部式微后,字節(jié)AI研究的重心轉(zhuǎn)移到應(yīng)用機(jī)器學(xué)習(xí)(Applied Machine Learning,AML),也被稱(chēng)作機(jī)器學(xué)習(xí)中臺(tái)部門(mén),該部門(mén)一方面負(fù)責(zé)傳統(tǒng)產(chǎn)品的推廣搜算法研發(fā),另一方面被要求拓展新業(yè)務(wù),包括搭建字節(jié)的算力集群并訓(xùn)練大模型。其中的關(guān)鍵人物包括原機(jī)器學(xué)習(xí)系統(tǒng)負(fù)責(zé)人朱亦博,他2023年辭職后參與創(chuàng)辦了“AI六小龍”之一的階躍星辰;大語(yǔ)言模型研發(fā)技術(shù)專(zhuān)家楊紅霞2023年年初加入字節(jié),曾在阿里達(dá)摩院擔(dān)任M6大模型的技術(shù)負(fù)責(zé)人,也就是周暢曾經(jīng)的領(lǐng)導(dǎo),不過(guò)2024年5月她已離開(kāi)字節(jié)。
在2023年年初成立Seed團(tuán)隊(duì)是字節(jié)在AI業(yè)務(wù)上的又一次調(diào)整,該團(tuán)隊(duì)主要班底來(lái)自搜索、AML、AI Lab等部門(mén)中的大模型相關(guān)人才。不僅如此,樂(lè)雁稱(chēng)這個(gè)團(tuán)隊(duì)同時(shí)還在從其他部門(mén)物色人才,以提升這個(gè)新興業(yè)務(wù)的“人才密度”。
沈曼估計(jì),如今Seed團(tuán)隊(duì)的人數(shù)應(yīng)該已經(jīng)超過(guò)了150人,這還僅僅只是字節(jié)研發(fā)基礎(chǔ)模型的團(tuán)隊(duì)。2023年年底,字節(jié)又成立了一個(gè)名為Flow的團(tuán)隊(duì),負(fù)責(zé)基于大模型的AI原生應(yīng)用的研發(fā),豆包就是其成果之一,該團(tuán)隊(duì)的人員增長(zhǎng)更快,目前有近300人。除此之外,字節(jié)每個(gè)業(yè)務(wù)部門(mén)都被要求思考如何將大模型落地到相關(guān)業(yè)務(wù)場(chǎng)景里。
回歸AI核心
字節(jié)正在自上而下地重建它的核心——人工智能。
早在2016年,張一鳴就在公司內(nèi)建立了AI Lab,力邀微軟亞洲研究院前常務(wù)副院長(zhǎng)馬維英、華為諾亞方舟實(shí)驗(yàn)室原主任李航、自然語(yǔ)言處理技術(shù)專(zhuān)家李磊等多位科學(xué)家加入,設(shè)立了包括計(jì)算機(jī)視覺(jué)(CV)、自然語(yǔ)言處理(NLP)、語(yǔ)音和音頻處理、音樂(lè)、機(jī)器學(xué)習(xí)等多個(gè)子團(tuán)隊(duì),幾乎覆蓋當(dāng)時(shí)人工智能涉及的所有前沿領(lǐng)域。同時(shí),這個(gè)實(shí)驗(yàn)室在北京、上海、深圳、新加坡、美國(guó)、歐洲等地都設(shè)有辦公室。馬維英被委任為AI Lab負(fù)責(zé)人,直接向張一鳴匯報(bào)。
AI Lab的設(shè)立顯示了張一鳴在新技術(shù)時(shí)代的雄心。彼時(shí)的字節(jié)還不是“大廠”,它創(chuàng)立僅4年,只有今日頭條一個(gè)爆款應(yīng)用,無(wú)論公司資歷還是業(yè)務(wù)體量都無(wú)法與阿里巴巴、百度、騰訊等巨頭相比。那段時(shí)期,百度和騰訊已先后大手筆成立了自己的人工智能實(shí)驗(yàn)室,在全球招攬人才,其中百度還招募到了微軟前全球執(zhí)行副總裁陸奇加入。字節(jié)是那一輪AI Lab建設(shè)浪潮中鮮見(jiàn)的初創(chuàng)公司,而且它作出這一決定的時(shí)間比阿里巴巴早,后者直到2017年5月才宣布成立達(dá)摩?院。
字節(jié)后來(lái)的發(fā)展數(shù)十倍、百倍地回報(bào)了這一時(shí)期的技術(shù)投?入。
AI Lab成立的同一年9月,抖音誕生。當(dāng)時(shí),2011年就成立的快手通過(guò)“農(nóng)村包圍城市”策略已收獲大量三四線(xiàn)城市用戶(hù),作為剛誕生的同類(lèi)應(yīng)用,抖音試圖從一二線(xiàn)城市突破,將“音樂(lè)”“年輕”“潮流”確立為主打風(fēng)格,而支持這些風(fēng)格所需要的功能——變臉、換裝、美顏甚至尬舞,都依賴(lài)于人工智能技術(shù)。以“尬舞”為例,它使用字節(jié)AI Lab的“人體關(guān)鍵點(diǎn)檢測(cè)”技術(shù),可以讓用戶(hù)在鏡頭前跳舞時(shí)了解自己的姿態(tài)是否和目標(biāo)姿態(tài)準(zhǔn)確匹配。2017年,抖音上線(xiàn)了基于該技術(shù)的“尬舞機(jī)”功能,App版本更新后的第二天,抖音就沖到了應(yīng)用商店免費(fèi)榜的第一名。
人工智能技術(shù)不止加持了抖音,也使字節(jié)開(kāi)始成為真正的App工廠、全球化公司。2018年,張一鳴在當(dāng)年舉辦的首屆數(shù)字中國(guó)建設(shè)峰會(huì)上發(fā)表題為《技術(shù)出海,建設(shè)全球創(chuàng)作與交流平臺(tái)》的主題演講時(shí)表示,“人工智能技術(shù)是字節(jié)跳動(dòng)在全球市場(chǎng)取得優(yōu)勢(shì)地位的關(guān)鍵”。不論是綜合資訊類(lèi)的產(chǎn)品TopBuzz、News Republic,還是短視頻類(lèi)的產(chǎn)品TikTok、musical.ly、Vigo Video、BuzzVideo,這些產(chǎn)品雖然有著不同名字,內(nèi)核都是同一套人工智能技術(shù)方案——推薦算法,張一鳴稱(chēng)它為全球用戶(hù)提供了一致的產(chǎn)品體驗(yàn)。
然而當(dāng)抖音、TikTok等核心應(yīng)用取得具有絕對(duì)優(yōu)勢(shì)的市場(chǎng)地位、開(kāi)始步入“流量如何商業(yè)化”的階段,AI Lab在字節(jié)的位置松動(dòng)了。指標(biāo)性跡象是AI Lab負(fù)責(zé)人馬維英的匯報(bào)對(duì)象從張一鳴變?yōu)楫?dāng)時(shí)的抖音負(fù)責(zé)人張楠,這意味著AI Lab不再是個(gè)集團(tuán)級(jí)的前瞻性項(xiàng)目,變成了服務(wù)于抖音這一應(yīng)用的技術(shù)團(tuán)隊(duì)。
馬維英于2020年年中宣布離開(kāi)字節(jié)跳動(dòng),回歸學(xué)界加入清華大學(xué)智能產(chǎn)業(yè)研究院。同在該實(shí)驗(yàn)室擔(dān)任總監(jiān)的李磊和王長(zhǎng)虎也于次年離職,其中李磊像馬維英一樣重返了學(xué)界,王長(zhǎng)虎則于2023年投入視頻生成模型領(lǐng)域的創(chuàng)業(yè)。
隨著核心團(tuán)隊(duì)成員的離開(kāi),字節(jié)AI Lab體系開(kāi)始被進(jìn)一步弱化和拆分。按照樂(lè)雁的說(shuō),他2020年加入AI Lab時(shí)這個(gè)部門(mén)還是字節(jié)跳動(dòng)AI研究的核心部門(mén),團(tuán)隊(duì)規(guī)模上百人。但次年,AI Lab重組,各個(gè)組被拆分到不同的業(yè)務(wù)線(xiàn),比如圖像視覺(jué)的一部分人就被劃分到商業(yè)化團(tuán)隊(duì)下,為公司一些業(yè)務(wù)提供技術(shù)中臺(tái)支持,如抖音的手勢(shì)、肢體識(shí)別等AI功能。這次重組后,整個(gè)AI Lab只剩下不到50人,主要做一些偏學(xué)術(shù)方向的研究,比如機(jī)器人等,原先的視覺(jué)模型、自然語(yǔ)言處理等方向都已不存?在。
張一鳴很早就意識(shí)到了AI在內(nèi)容分發(fā)上的巨大潛力,不過(guò)他可能沒(méi)有意識(shí)到AI在內(nèi)容生產(chǎn)上的潛力更大,大到可能顛覆其基于內(nèi)容分發(fā)技術(shù)構(gòu)建的產(chǎn)品形態(tài)和競(jìng)爭(zhēng)優(yōu)勢(shì)。目前,業(yè)內(nèi)已有不少創(chuàng)業(yè)項(xiàng)目都在基于生成式AI構(gòu)建新一代內(nèi)容社區(qū),其中既包括可能取代小紅書(shū)的文字、圖文社區(qū),也包括可能顛覆抖音、TikTok的短視頻社區(qū)。如果字節(jié)不能提供相似或更好水平的內(nèi)容生產(chǎn)技術(shù),用戶(hù)很可能會(huì)轉(zhuǎn)移至其他平臺(tái)。畢竟社區(qū)的本質(zhì)首先是為創(chuàng)作者提供創(chuàng)作工具,其次才是表達(dá)渠道,Instagram、小紅書(shū)、抖音的崛起,一再說(shuō)明了這一點(diǎn)。
公開(kāi)資料顯示,早在2017年馬維英就公開(kāi)表達(dá)過(guò):“在內(nèi)容分發(fā)上AI算法已經(jīng)做得很好了,但很多信息的需求不是靠搜索3個(gè)網(wǎng)頁(yè)就可以滿(mǎn)足……我們希望AI能夠在創(chuàng)作端釋放出人更多的創(chuàng)意?!盇I Lab總監(jiān)李航也曾在2022年發(fā)表論文討論基于Transformer的“序列到序列模型”,Transformer正是后來(lái)令GPT系列模型大火的新AI架構(gòu)。李航在那篇論文中提到了Google的BERT,還提到了OpenAI的GPT。當(dāng)年11月的最后一天,OpenAI發(fā)布了基于Transformer的ChatGPT。到了2024年年初,字節(jié)CEO梁汝波在全員會(huì)上反思公司對(duì)大模型反應(yīng)“遲鈍”“直到2023年才開(kāi)始討論GPT”。
2023年緊急成立的Seed團(tuán)隊(duì),某種程度上承擔(dān)了AI Lab最初成立時(shí)被賦予的角色:理解和抓住眼下最前沿的人工智能技術(shù),讓字節(jié)跳動(dòng)不要掉隊(duì),甚至能引領(lǐng)行業(yè)。
補(bǔ)課、燒錢(qián)與飽和式攻擊
字節(jié)跳動(dòng)自2023年以來(lái)的狀態(tài)與其說(shuō)在試圖重現(xiàn)“大力出奇跡”的神奇功效,不如說(shuō)是一種擔(dān)心被落下的補(bǔ)課。
不僅在人才端搶人,應(yīng)用端也在搶用戶(hù)。據(jù)《第一財(cái)經(jīng)》雜志統(tǒng)計(jì),字節(jié)目前還在正常運(yùn)營(yíng)的AI應(yīng)用有大約20款,其中絕大部分是在2024年以后發(fā)布的。而在模型層,2023年只正式發(fā)布了語(yǔ)言模型的字節(jié),在2024年相繼補(bǔ)全了圖像、語(yǔ)音、音樂(lè)、視頻、3D等不同模態(tài)的生成式AI模型。在這一輪生成式AI浪潮中起步最晚的字節(jié),已經(jīng)成為目前擁有最全生成式AI模型、最多AI應(yīng)用的技術(shù)公司。
字節(jié)再一次祭出了拿手好戲:內(nèi)部賽馬,外部“小步快跑、敏捷迭代”,以及燒錢(qián)。
樂(lè)雁對(duì)《第一財(cái)經(jīng)》雜志說(shuō),現(xiàn)在Seed和Flow是字節(jié)明面上的生成式模型與應(yīng)用部門(mén),但當(dāng)公司高層都將目光投向這個(gè)領(lǐng)域時(shí),每個(gè)有AI研發(fā)能力的團(tuán)隊(duì)都在嘗試研發(fā)出更好的模型或產(chǎn)品,爭(zhēng)奪更多的資源與升職的機(jī)會(huì)?!熬捅热鏢eed最近同時(shí)發(fā)了兩款視頻模型(SeaWeed和PixelDance),這兩個(gè)模型其實(shí)是不同小組做出來(lái)的,最后都放出來(lái)說(shuō)明這兩個(gè)模型確實(shí)在能力上各有千秋,”他說(shuō),“如果其中某個(gè)團(tuán)隊(duì)的模型哪怕稍弱一點(diǎn),那壓根就不會(huì)被外面看到,字節(jié)一直都是這種賽馬模式?!?/p>
面對(duì)外部,字節(jié)則采取了一貫的“飽和式攻擊”。以Coze為例,它對(duì)應(yīng)的是AI智能體最熱門(mén)的應(yīng)用場(chǎng)景之一,它允許用戶(hù)自己創(chuàng)建定制化的聊天機(jī)器人,并且這個(gè)機(jī)器人能將各種功能節(jié)點(diǎn)(如插件、模型、代碼)按照一定的順序和邏輯關(guān)系連接起來(lái),創(chuàng)建出復(fù)雜的業(yè)務(wù)流程,以實(shí)現(xiàn)特定的任務(wù)或功能。
白話(huà)Agent主理人古德白今年年初就一直在嘗試基于AI工作流做營(yíng)銷(xiāo)工具,他告訴《第一財(cái)經(jīng)》雜志,Coze幾乎每天都在更新版本,這需要大量資源投入和團(tuán)隊(duì)配置,字節(jié)雇用了大量外包公司完成最后的產(chǎn)品測(cè)試,“創(chuàng)業(yè)公司很難應(yīng)對(duì)這樣的飽和式攻擊?!惫诺掳渍f(shuō)。而且Coze推出時(shí)直接采取“模型免費(fèi)使用”策略,導(dǎo)致國(guó)內(nèi)最早落地AI工作流功能的另一個(gè)平臺(tái)FastGPT迅速沉寂,Coze則后來(lái)居上。
字節(jié)也是今年年中國(guó)內(nèi)大模型價(jià)格戰(zhàn)的發(fā)起者。2024年5月,火山引擎FORCE原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)在正式發(fā)布豆包大模型的同時(shí)向模型的B端價(jià)格揮起屠刀,豆包通用模型pro-32k版的推理輸入價(jià)格僅為0.0008元/千tokens,比行業(yè)均價(jià)低99.3%。這意味著客戶(hù)花一元錢(qián)就能讓豆包模型處理200萬(wàn)個(gè)漢字,相當(dāng)于3本《三國(guó)演義》——當(dāng)時(shí)花同樣的錢(qián)只能向GPT-4輸入不到4000字,甚至不夠一篇短篇小說(shuō)。面對(duì)字節(jié)發(fā)起的價(jià)格戰(zhàn),競(jìng)爭(zhēng)對(duì)手不得不快速跟進(jìn)。阿里云將其通義千問(wèn)主力模型的價(jià)格下調(diào)97%;百度甚至直接宣布文心兩款輕量級(jí)模型免?費(fèi)。
面向C端用戶(hù)的AI應(yīng)用上,字節(jié)燒起錢(qián)來(lái)更是毫不手軟,花錢(qián)投流買(mǎi)量成為它實(shí)現(xiàn)產(chǎn)品冷啟動(dòng)最直接快速的方式。據(jù)廣告情報(bào)分析平臺(tái)AppGrowing統(tǒng)計(jì),豆包智能助手4月、5月的投放金額接近1800萬(wàn)元,等到6月上旬,投放金額飆升至1.24億?元。
與此同時(shí),字節(jié)還限制了豆包的競(jìng)對(duì)產(chǎn)品在抖音平臺(tái)的廣告投放。其中受影響最大的就是智能助手Kimi,這個(gè)由“AI六小龍”之一月之暗面推出的產(chǎn)品,在豆包下場(chǎng)前曾經(jīng)依靠在抖音、嗶哩嗶哩等平臺(tái)的投放快速起量,但一位“AI六小龍”的員工說(shuō),豆包不僅復(fù)制了這個(gè)成功路徑,還依靠其母公司字節(jié)跳動(dòng)的力量,限制了包括Kimi在內(nèi)的對(duì)手在抖音內(nèi)的廣告推送。
結(jié)果就是,今年3月,Kimi依靠社交平臺(tái)的廣告投放超過(guò)百度旗下的同類(lèi)產(chǎn)品“文小言”(原文心一言),成為月活最高的原生生成式AI應(yīng)用。4個(gè)月后,Kimi被豆包超越。一個(gè)月內(nèi),豆包的月活用戶(hù)數(shù)量從904萬(wàn)陡然上升至5127萬(wàn),把廣告投放沒(méi)那么激進(jìn)的Kimi和文小言遠(yuǎn)遠(yuǎn)甩在后面。“AI產(chǎn)品榜”的數(shù)據(jù)顯示,10月豆包的排名以近7000萬(wàn)月活用戶(hù)在中國(guó)AI產(chǎn)品中斷崖式領(lǐng)先,同為智能助手的Kimi與文小言分別只有約3900萬(wàn)和3400萬(wàn)月活。
用花錢(qián)的方式買(mǎi)用戶(hù)的成本目前還不算高。一位熟悉Kimi投放策略的人士對(duì)《第一財(cái)經(jīng)》雜志說(shuō):“目前Kimi、豆包的用戶(hù)留存率還很健康,單個(gè)用戶(hù)獲取成本只有十幾元,這是相當(dāng)劃算的數(shù)字,成熟階段互聯(lián)網(wǎng)產(chǎn)品的用戶(hù)獲取成本都在好幾百?元?!?/p>
但這些用戶(hù)有沒(méi)有忠誠(chéng)度就是另外一回事了。以視頻生成領(lǐng)域?yàn)槔?,今?月,Luma AI發(fā)布的最新模型Dream Machine 4天內(nèi)獲得了1000多萬(wàn)用戶(hù),這些人最早是Runway的用戶(hù),后來(lái)Pika發(fā)布時(shí)也曾涌入Pika。而且,廣告投流能帶來(lái)的邊際效益也在減少。綜合Similarweb發(fā)布的投流數(shù)據(jù)和App Growing發(fā)布的用戶(hù)數(shù)據(jù),不久前階躍星辰的智能助手躍問(wèn)也在瘋狂投放,花了近7000萬(wàn)元,但截至今年10月只轉(zhuǎn)化來(lái)不到2萬(wàn)個(gè)新用戶(hù)。
與字節(jié)的激進(jìn)形成對(duì)比的是國(guó)內(nèi)其他大廠和初創(chuàng)公司們的謹(jǐn)慎。
除了字節(jié),其他中國(guó)技術(shù)公司對(duì)生成式AI的熱情都在消退——以積極的視角看,這個(gè)領(lǐng)域正在變得理性。最早押注AI的李彥宏在剛剛召開(kāi)的第三季度總監(jiān)會(huì)上表示,“百度不碰Sora類(lèi)的視頻生成”,并且在文小言的推廣上選擇“穩(wěn)健”而非“激進(jìn)”;阿里不再執(zhí)著于開(kāi)發(fā)all in one的AI超級(jí)應(yīng)用,而是將更多精力放在AI云服務(wù)上;短視頻巨頭快手至今沒(méi)有推出過(guò)語(yǔ)言模型應(yīng)用,而是集中在視頻模型的開(kāi)發(fā)與應(yīng)用上。多位人士向《第一財(cái)經(jīng)》雜志證實(shí),隨著國(guó)內(nèi)模型在能力上逼近GPT-4,以及GPT-5的一再延遲,多家公司尤其資源有限的初創(chuàng)公司對(duì)于投入訓(xùn)練下一代基礎(chǔ)模型(通稱(chēng)“預(yù)訓(xùn)練”)變得謹(jǐn)慎。甚至有投資人稱(chēng)暫?!邦A(yù)訓(xùn)練”的AI六小龍不止兩家。
一位業(yè)內(nèi)人士告訴《第一財(cái)經(jīng)》雜志,獨(dú)角獸們選擇暫緩預(yù)訓(xùn)練下一代大語(yǔ)言模型的原因之一,是即便預(yù)訓(xùn)練一個(gè)比現(xiàn)有模型好1代甚至1.5代、超越GPT-4的模型,其推理能力仍然達(dá)不到讓終端應(yīng)用從陪伴領(lǐng)域進(jìn)入生產(chǎn)力領(lǐng)域的產(chǎn)品需求。GPT-4o目前在生產(chǎn)力領(lǐng)域的應(yīng)用狀況已經(jīng)說(shuō)明了這一點(diǎn)。根據(jù)階躍星辰創(chuàng)始人姜大昕在阿里云棲大會(huì)上提到的數(shù)據(jù),GPT-4達(dá)到萬(wàn)億級(jí)參數(shù)后,再去提升參數(shù)量,邊際收益是下降的。
字節(jié)卻沒(méi)有減速的跡象。沈曼對(duì)《第一財(cái)經(jīng)》雜志透露,預(yù)訓(xùn)練人才是字節(jié)目前最急要的人才類(lèi)型。最近字節(jié)成立了一個(gè)叫“大模型研究院”的機(jī)構(gòu),從名字看,它可能承擔(dān)比基于現(xiàn)有算法訓(xùn)練模型更為前沿的任務(wù)。最初的市場(chǎng)傳言稱(chēng),從阿里云挖來(lái)周暢就是讓他負(fù)責(zé)這個(gè)團(tuán)隊(duì)。不過(guò)也有消息稱(chēng),為避開(kāi)競(jìng)業(yè)協(xié)議,周暢被派去了新加坡就職,工作方向是具身智能,研究機(jī)器人在物理世界中自由行動(dòng)需要的“世界模型”(world model)。AI Lab在字節(jié)式微,其仍然被張一鳴看重并重點(diǎn)投入的最后一個(gè)研究方向就是機(jī)器人,這些機(jī)器人被認(rèn)為可以服務(wù)于字節(jié)的電商履約需求。
豆包目前還沒(méi)有盈利,據(jù)Acecamp上一份專(zhuān)家訪(fǎng)談紀(jì)要,字節(jié)跳動(dòng)對(duì)于大模型的財(cái)務(wù)政策是“推理層不虧”,即模型訓(xùn)練階段所需要的研發(fā)投入、芯片算力投入、人員成本方面可以承受戰(zhàn)略性虧損,而模型投入應(yīng)用后每次調(diào)用的成本需要降低。豆包目前對(duì)于B端用戶(hù)按照API調(diào)用收費(fèi),平均每1億個(gè)tokens調(diào)用收費(fèi)約為80元至200元,豆包能從這種調(diào)用中獲得8%-10%的毛利。尚未向C端用戶(hù)收費(fèi)。訪(fǎng)談紀(jì)要稱(chēng),從2023年至2024年,字節(jié)跳動(dòng)通過(guò)“模型蒸餾”,將模型尺寸從300B降到了80B左右,大幅降低了算力開(kāi)銷(xiāo)。
目前,豆包還沒(méi)有向C端用戶(hù)收費(fèi),一大原因仍然是產(chǎn)品不夠,一旦開(kāi)始收費(fèi)用戶(hù)就可能流失。紀(jì)要提供的數(shù)據(jù)稱(chēng),每個(gè)豆包用戶(hù)每天使用該應(yīng)用的平均時(shí)長(zhǎng)只有10到11分鐘,而且這個(gè)時(shí)長(zhǎng)是多次使用后的累積數(shù)字,如果平攤到每次使用時(shí)長(zhǎng),數(shù)字就會(huì)降低為2分鐘,即用戶(hù)每次打開(kāi)豆包基本只會(huì)進(jìn)行3到4輪對(duì)話(huà)就會(huì)結(jié)束?!叭绻?分鐘內(nèi)未能滿(mǎn)足需求,他們可能會(huì)切換到其他應(yīng)用,而不一定是其他AI工具。例如,用戶(hù)可能會(huì)打開(kāi)微信、小紅書(shū)等應(yīng)用?!奔o(jì)要中稱(chēng)。
豆包已經(jīng)是目前國(guó)內(nèi)用戶(hù)量最大的原生AI了。然而字節(jié)對(duì)此有個(gè)更激進(jìn)的目標(biāo),即今年年底實(shí)現(xiàn)1億月活。
日后看,字節(jié)的飽和式投入中一定有不少比例是浪費(fèi)的,但眼下的現(xiàn)實(shí)狀況是,它不得不為新技術(shù)時(shí)代的到來(lái)做足準(zhǔn)備。作為字節(jié)一直以來(lái)——從社交媒體到元宇宙——的戰(zhàn)略對(duì)標(biāo)對(duì)象,Meta也在以上百億美元的規(guī)模投入AI,MetaCEO扎克伯克在最近一次與英偉達(dá)CEO黃仁勛的對(duì)談中解釋為什么這么做時(shí)說(shuō):“今天你在Instagram上看到的大部分內(nèi)容是根據(jù)你的興趣匹配給你的……在未來(lái),我認(rèn)為這些內(nèi)容會(huì)由創(chuàng)作者使用AI工具創(chuàng)造,或者由AI綜合生?成?!?/p>
字節(jié)的財(cái)務(wù)狀況在眾多大廠中還算不錯(cuò)。據(jù)科技媒體The Information報(bào)道,2024年上半年字節(jié)跳動(dòng)的營(yíng)收約為730億美元(約合5280億元人民幣),這一數(shù)字已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)騰訊同期3206億元的營(yíng)收,接近Meta。而字節(jié)目前的估值只有Meta的1/5。若有資金需要,它還比其他公司都多一個(gè)可觀的融資渠道:上市。不過(guò)它的造血業(yè)務(wù)——廣告和電商的增速已在快速放緩。今年前三季度,字節(jié)中國(guó)區(qū)單季度廣告同比增速?gòu)?0%左右跌至17%以?xún)?nèi),已有兩個(gè)季度未能達(dá)成既定目標(biāo)。與此同時(shí),抖音電商的銷(xiāo)售額增速也已從年初的超過(guò)60%跌至9月的不到20%。成熟業(yè)務(wù)的增速一旦變成個(gè)位數(shù),字節(jié)能夠支持新業(yè)務(wù)的現(xiàn)金流就會(huì)受限。
不過(guò)對(duì)一個(gè)試圖進(jìn)行重大轉(zhuǎn)型的公司來(lái)說(shuō),上市并不是個(gè)好選擇——上市之前轉(zhuǎn)型成功的公司多見(jiàn),上市后成功的則不多。對(duì)字節(jié)而言,造血能力決定一切。(應(yīng)采訪(fǎng)對(duì)象要求,文中沈曼、樂(lè)雁為化名)