由ChatGPT引發(fā)的人工智能風(fēng)潮還在猛烈地刮著。但從各個角度來看,目前這都是一個巨頭爭霸的戰(zhàn)場:更大的模型、更強的算力、更多的用戶、更雄厚的資金……這些都似乎成為了想要加入這場角逐的門票。與此同時,核心技術(shù)的研究也逐漸開放走向封閉。
而在這高墻正在筑起的過程中,也有一些新銳的創(chuàng)業(yè)公司想要高舉旗幟來一場革命。其中,尤其引人注目的是一家名為Hugging Face開源創(chuàng)業(yè)公司。
目前,Hugging Face已經(jīng)是全球最受歡迎的開源機器學(xué)習(xí)社區(qū)和平臺,不僅創(chuàng)下了GitHub有史以來增長最快的AI項目記錄,估值也一路沖破了20億美元。近期,微軟和浙江大學(xué)聯(lián)合發(fā)布的一篇關(guān)于HuggingGPT的論文更是把Hugging Face推到了舞臺中心,也讓更多人關(guān)注到了當(dāng)前這股與眾不同的人工智能發(fā)展力量。
01.HuggingGPT火了,Hugging是啥?
本月初,微軟亞洲研究院和浙江大學(xué)聯(lián)合發(fā)布了一項最新的名為HuggingGPT的研究,介紹了一個全新的協(xié)作系統(tǒng),讓開發(fā)者能夠在ChatGPT的幫助下快速、準(zhǔn)確地去選擇合適的人工智能模型,從而完成包括文字、視頻、語音等多模態(tài)在內(nèi)的復(fù)雜任務(wù)。
該項目目前已經(jīng)在Github上開源,還有一個超拉風(fēng)的名字叫JARVIS(沒錯,就是跟鋼鐵俠的助手一個名字)。在這個研究中,主要涉及到了兩個主體,一個是眾所周知的ChatGPT,另一個則是AI社區(qū)Hugging Face。
圖片來自HuggingGPT研究論文
那么Hugging Face是做什么的?
簡單來說,Hugging Face是一個針對人工智能的開源平臺,用戶可以在上邊發(fā)布和共享預(yù)訓(xùn)練模型、數(shù)據(jù)集和演示文件等。目前Hugging Face上已經(jīng)共享了超過10萬個預(yù)訓(xùn)練模型,1萬多個數(shù)據(jù)集,包括微軟、谷歌、Bloomberg、英特爾等各個行業(yè)超過1萬家機構(gòu)都在使用Hugging Face的產(chǎn)品。
在HuggingGPT中,ChatGPT通過扮演了“操作大腦”的角色,能夠自動解析用戶提出的需求,接著在 Hugging Face 的“AI模型池”里進(jìn)行自動模型選擇、執(zhí)行和報告,為開發(fā)者們開發(fā)更復(fù)雜的人工智能程序提供了極大的便利。
雖然在模型上ChatGPT跟Hugging Face能夠牽手,但從本質(zhì)上來說,Hugging Face跟OpenAI目前是在做兩個相反方向的事。其中最大的不同點在于,在開發(fā)者服務(wù)方面,OpenAI現(xiàn)在正在搭建人工智能開發(fā)的圍墻,僅允許滿足條件的機構(gòu)和個人進(jìn)入,但Hugging Face則希望每個人都可以訪問生成式 AI 模型,包括各類企業(yè)和所有普通開發(fā)者。
今年2月,OpenAI上線了一個名為Foundry的新開發(fā)者平臺,允戶可以在這個平臺上運行OpenAI最新的機器學(xué)習(xí)模型,但在產(chǎn)品的描述中,OpenAI明確表示Foundry是為運行較大工作負(fù)載的尖端客戶設(shè)計,而根據(jù)一份價格表顯示,即使是 GPT-3.5 的輕量級版本,三個月費用高達(dá)7.8萬美元,一年費用為 26.4萬美元。
就在Foundry發(fā)布后,Hugging face便立刻宣布了其與 AWS 的最新合作伙伴關(guān)系,并發(fā)出了“讓人工智能走向開放”的呼吁。通過該合作,任何開發(fā)人員都將能夠使用 AWS 的托管服務(wù)并處理 Hugging Face 上可用的任何模型。
圖片來自Hugging face CTO推特
在現(xiàn)在巨頭林立的人工智能戰(zhàn)場上,Hugging Face就像是一支強有力的民間力量。當(dāng)巨頭們都在努力保持自己生成式 AI 的霸主地位的時候,Hugging Face 的目標(biāo)則是尋找各種途徑來保持 AI 研究空間的開放。
而這樣特點也讓Hugging Face目前頗有一些“中立”的色彩。無論微軟、谷歌、亞馬遜、Meta這些大公司打得再激烈,但它們幾乎全都是Hugging Face的支持者。
那么,Hugging Face究竟是如何發(fā)展起來的,它具體做著什么樣的業(yè)務(wù)?
02.一次歪打正著的創(chuàng)業(yè),造就AI界的頂流“笑臉”
在普通人的眼中,人工智能一向都屬于“冷感”很強的技術(shù)領(lǐng)域,無論是充斥著大量數(shù)字、模型的算法,還是由各種機械零件組裝成的機器人,都不免讓人感到有些距離感。但作為專為人工智能開發(fā)者服務(wù)的Hugging Face卻主打了一個反差萌,笑臉Emoji再加上一雙攤開的小手,logo甚至有點過份可愛。
之所以有這樣一個可愛的logo,是因為一開始Hugging Face做的產(chǎn)品其實是一款針對青少年群體的聊天機器人。
當(dāng)時Hugging Face的想法是基于自然語言處理 (NLP) 的人工智能技術(shù),來為年輕人們開發(fā)一個帶有娛樂性、類似于電子寵物一樣的個性化聊天機器人,讓大家可以在無聊的時候跟它聊八卦、問它問題、讓它生成一些有趣的圖片之類的事情。
這種新穎的人機社交模式得到了一些關(guān)注。2017年3月9號,Hugging Face App在iOS App Store正式推出,并拿到了包括SV Angel、NBA球星杜蘭特在內(nèi)的120萬美元的天使投資。此后一年多,Hugging Face都一直圍繞著自己的聊天機器人業(yè)務(wù)在做著自然語言理解的相關(guān)訓(xùn)練并發(fā)布相關(guān)的產(chǎn)品,高峰時期每天處理的消息數(shù)量達(dá)到了1百萬條。在2018年5月,它又獲得了400萬美元的種子輪融資。
Hugging Face聊天軟件界面
雖然發(fā)展的還算不錯,但由于當(dāng)時的人工智能的理解能力和聊天水平遠(yuǎn)不及ChatGPT這樣智能有趣,再加上并非剛需的業(yè)務(wù)場景,Hugging Face的規(guī)模一直都難以擴大。
但為了開發(fā)這個聊天機器人,Hugging Face的團隊做了一個很重要的事,那就是構(gòu)建了一個底層庫來容納各種機器學(xué)習(xí)模型和各種類型的數(shù)據(jù)集。包括幫助訓(xùn)練聊天機器人檢測文本消息情緒、生成連貫的響應(yīng)、理解不同對話主題等,并且在GitHub上始終以開源項目的形式持續(xù)發(fā)布該底層庫的一些內(nèi)容。
就這樣不溫不火地發(fā)展了一段時間后,2018年底,Hugging Face迎來了一個重要的轉(zhuǎn)折。
當(dāng)年11月,谷歌宣布推出基于雙向 Transformer 的大規(guī)模預(yù)訓(xùn)練語言模型BERT,瞬間成為了自然語言理解領(lǐng)域最受開發(fā)者關(guān)注的模型。但一開始,Google只發(fā)布了BERT的TensorFlow版本,Hugging Face就想為啥沒有Pytorch版本呢?于是Hugging Face創(chuàng)始人之一的Thomas Wolf就用幾天的時間完成并開源了PyTorch-BERT,但沒想到,就是這么一個“無心插柳”的項目讓Hugging Face一炮而紅。
借著BERT的東風(fēng),Hugging Face的Pytorch-pretrained-BERT發(fā)布3個多月后,快速達(dá)成了在Github上5000+ 星標(biāo)的成就,到了7月份其Star數(shù)量已經(jīng)超過了1萬,發(fā)展速度遠(yuǎn)超其他同類開源項目,在Github的AI項目領(lǐng)域里一飛沖天。
在這樣的發(fā)展勢頭下,Hugging Face的產(chǎn)品戰(zhàn)略開始發(fā)生了調(diào)整。他們將更多精力放到了開源模型的建設(shè)上,將 Pytorch-pretrained-BERT項目正式命名為Transformers,同時支持Pytorch和Tensorflow 2.0。
借助 Transformers庫,開發(fā)者可以快速使用BERT、GPT、XLNet、T5 、DistilBERT等NLP大模型,并使用這些模型來完成文本分類、文本總結(jié)、文本生成、信息抽取、自動QA等任務(wù),節(jié)省大量時間和計算資源,此后Hugging Face在人工智能開源領(lǐng)域的名氣也越來越大。
Hugging Face在Github上的Star曲線,圖片來自于Lux Capital
到了2019年12月,Hugging Face拿到了由Lux Capital 領(lǐng)投的A輪融資,融資額也比上一輪上了一個量級達(dá)到了1500萬美元。值得注意的是,從這一輪開始,Hugging Face的標(biāo)簽開始不再是聊天機器人,而是把AI開源業(yè)務(wù)放在了首位。這張可愛的笑臉emoji也開始被廣大人工智能開發(fā)者們所熟知。
03.朝著人工智能界的Github前進(jìn)
在2019年底All in AI開源之后,Hugging Face開始著手構(gòu)建一套完整的開源產(chǎn)品矩陣。用Hugging Face自己的話來講,他們所做的事情,就是要架起人工智能科研和應(yīng)用的橋梁(bridges the gap from research to production)。
過去這些年,人工智能領(lǐng)域的科研和商業(yè)應(yīng)用是相對獨立的兩個板塊,科研部門的任務(wù)就是對前沿技術(shù)進(jìn)行研究,搞模型、發(fā)論文,應(yīng)用部門的人則是要將最新技術(shù)用到產(chǎn)品中探索商業(yè)變現(xiàn)。如何將科研成果進(jìn)行系統(tǒng)性的整合成為開源產(chǎn)品,讓開發(fā)者們能夠很快上手去應(yīng)用轉(zhuǎn)化是長期困擾業(yè)界的一個問題。
Hugging Face之前歪打正著地摸到了這個痛點,接著開始認(rèn)真向下挖掘。簡單來說,Hugging Face就是承擔(dān)了人工智能科研走向應(yīng)用這個過程中幾乎所有復(fù)雜、繁瑣、細(xì)碎的工作,然后方便任何人工智能從業(yè)者都可以去便捷地使用這些研究模型和資源。
目前,除了頭號產(chǎn)品Transformers之外,Hugging Face還建立了Tokenizers、Datasets、Accelerate等庫,從模型到數(shù)據(jù)集、從托管平臺到性能優(yōu)化,以開源社區(qū)為載體,Hugging Face已建立起了完整的人工智能開發(fā)生態(tài),涵蓋了 NLP、計算機視覺、語音、時間序列、生物學(xué)、強化學(xué)習(xí)等各個領(lǐng)域。
值得注意的是,Hugging Face并不是因為ChatGPT帶火的。2022年5月,當(dāng)市場的注意力都還停留在Web3、元宇宙之上時,Hugging Face拿到了有紅杉、Lux Capital參與的1億美元融資,讓其估值一舉突破了20億美元。
Hugging Face的融資歷史,圖片來自于企查查
Hugging Face當(dāng)前的目標(biāo)是想成為人工智能領(lǐng)域的Github。其創(chuàng)始團隊認(rèn)為,只有將那些少數(shù)人掌握的技術(shù)推廣給更多人使用,才能真正最大程度地推進(jìn)整個行業(yè)的進(jìn)步。而從商業(yè)的角度來說,Hugging Face認(rèn)為賦能整個AI社區(qū)所可能產(chǎn)生的價值可能比一個專有的工具高出千倍,而只要將其中的1%變現(xiàn)就能夠足以撐起一個高市值的公司,類似的例子包括MongoDB、Elastic等等。
除了蓬勃發(fā)展的開源社區(qū),從2020年開始,Hugging Face也開始做面向企業(yè)的定制自然語言模型,其客戶涵蓋彭博社、高通、英特爾等各類大中小型公司,并推出了包括AutoTrain、Inference API & Infinity、Private Hub、Expert Support等針對不同開發(fā)者類型的產(chǎn)品。據(jù)報道顯示,從2021年開始Hugging Face就一直處于正現(xiàn)金流的狀態(tài)。
Hugging Face的的產(chǎn)品服務(wù),圖片來自于其官網(wǎng)
Hugging Face在當(dāng)前的人工智能領(lǐng)域中能夠以開源社區(qū)的模式異軍突起,有一些偶然也有必然。首先,過去這些年,人工智能技術(shù)所取得的進(jìn)步都是由全世界的科研和產(chǎn)業(yè)領(lǐng)域共同協(xié)作所推動的,它的技術(shù)基因里其實就帶著開放,因此建立起一個平臺來鏈接研究者和開發(fā)者順應(yīng)了行業(yè)發(fā)展的歷史和趨勢。
此外,Hugging Face通過完成大量的基礎(chǔ)性工作,來幫助彌補在人工智能領(lǐng)域里長期存在的科學(xué)與生產(chǎn)之間的鴻溝,這是過去很多開源平臺沒有關(guān)注和做到的。
在此前的一個采訪中Hugging Face的CEO Clément Delangue表示,機器學(xué)習(xí)技術(shù)仍然還處于早期發(fā)展階段,開源社區(qū)的能力將是巨大的。他認(rèn)為,在未來5到10年,我們一定還會看到更多開源機器學(xué)習(xí)公司的崛起。