青青青久草,四虎永久在线精品,二区免费视频,一级毛片在线直接观看,黄网在线免费观看,美女露全身永久免费网站,色婷婷六月桃花综合影院

知乎大模型“知海圖AI”來了 要與GPT-4掰掰手腕

此前一直被看作是“ChatGPT概念股”的知乎,終于做出了自己的大模型。在日前舉行的“2023知乎發(fā)現(xiàn)大會”上,知乎方面公開了與面壁智能共建的大模型產(chǎn)品“知海圖AI”,而雙方的合作則將以聯(lián)合研發(fā)與戰(zhàn)略投資的方式展開。據(jù)悉,目前該大模型的首個(gè)功能“熱榜摘要”已啟動內(nèi)測,其將對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶。

作為一個(gè)在toC內(nèi)容平臺上線的大語言模型項(xiàng)目,“知海圖AI”是基于清華NLP實(shí)驗(yàn)室和面壁智能CPM-Bee(10B)模型的技術(shù)支撐。按照官方的說法,針對知乎熱榜問題中的所有回答,在“熱榜摘要”這個(gè)特定場景中將“知海圖AI”大模型的效果與GPT-4進(jìn)行比較發(fā)現(xiàn),兩個(gè)模型的表現(xiàn)幾乎持平。

要知道,在王小川眼中,國內(nèi)目前的大模型與GPT的差距是三年,即使樂觀如李彥宏也只是喊出了,“百度的文心一言和OpenAI的差距是2個(gè)月”。而到了知乎這里,知海圖AI就敢說與GPT-4在特定場景能戰(zhàn)成平手了。

從某種意義上來說,知乎方面似乎是學(xué)習(xí)了手機(jī)廠商的“好榜樣”,畢竟只要定語加的足夠多,誰都能成為“第一”。在許多業(yè)內(nèi)人士看來,對于知乎而言,將“知海圖AI”的首秀放在知乎熱榜是恰到好處的,畢竟要是去拼技術(shù)底蘊(yùn)、拼應(yīng)用范圍,它可能不是百度文心一言、阿里通義千問的對手。

事實(shí)上,知乎入局大語言模型賽道,加入“百模大戰(zhàn)”幾乎是一種必然。如今在移動互聯(lián)網(wǎng)紅利近乎于枯竭的環(huán)境下,未來無疑是混沌的,因此抓住可能通往未來的船票就成為了互聯(lián)網(wǎng)廠商擁抱變化的必然。用大語言模型來變革業(yè)務(wù)層、為具體的業(yè)務(wù)落地場景賦能,這也已經(jīng)是諸多互聯(lián)網(wǎng)廠商的共同策略。并且在當(dāng)下這個(gè)存量市場中,在效率上的些許變化就已經(jīng)能兌現(xiàn)為競爭優(yōu)勢。

當(dāng)下做大語言模型已經(jīng)不僅僅是追趕潮流,更是內(nèi)容平臺屬性突出的知乎,保持市場競爭力的一種方式。無論老用戶如何吐槽,知乎依舊還是目前國內(nèi)互聯(lián)網(wǎng)中數(shù)一數(shù)二的優(yōu)質(zhì)內(nèi)容平臺。君不見,微軟集成了ChatGPT的New Bing在回答用戶問題時(shí),參考資料大量來源于知乎,由此也足以證明知乎的內(nèi)容質(zhì)量已經(jīng)受到了海外科技巨頭的認(rèn)可。

要知道,ChatGPT這類大語言模型之所以比以往的人工智能產(chǎn)品更加智能,靠的就是“力大磚飛”,也需要海量的語料庫做支撐,而語料庫本身的質(zhì)量更優(yōu)秀、產(chǎn)出的結(jié)果也就會更好。有得天獨(dú)厚的資源作為基礎(chǔ),知乎如果對大語言模型視而不見,未免就過于暴殄天物了。

反過來說,大語言模型其實(shí)也需要知乎的優(yōu)質(zhì)答主來幫助其實(shí)現(xiàn)迭代,讓大語言模型的文本理解和上下文關(guān)聯(lián)能力進(jìn)一步升級。

眾所周知,基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)是ChatGPT得以爆發(fā)的秘密武器,雖然目前OpenAI還沒有開源RLHF,外界只知道它是強(qiáng)化學(xué)習(xí)(RL)的一個(gè)擴(kuò)展,是將人類的反饋納入訓(xùn)練過程,為機(jī)器提供一種自然的、人性化的互動學(xué)習(xí)過程。

而ChatGPT自己給出的解釋,就是與傳統(tǒng)的RL相比,RLHF的優(yōu)勢在于能更好地與人類的意圖保持一致,允許機(jī)器掌握明顯嵌入人類經(jīng)驗(yàn)中的決策要素,并從各種類型的反饋中進(jìn)行學(xué)習(xí),且根據(jù)需要對反饋進(jìn)行整理。

所以人類的反饋無疑是ChatGPT智能化的關(guān)鍵,那么知乎能不能扮演這樣的一個(gè)角色呢?答案顯然是肯定的,因?yàn)橹跏腔凇罢J(rèn)知盈余”建立起來的問答社區(qū)。如果將AI生成的回答放到知乎上,讓不同領(lǐng)域的專業(yè)用戶來驗(yàn)證,就可以在反復(fù)調(diào)校中優(yōu)化AI的性能。反過來講,高質(zhì)量的原創(chuàng)內(nèi)容也更容易被AI發(fā)現(xiàn),這有助于改變知乎在如今泥沙俱下的環(huán)境里、優(yōu)質(zhì)內(nèi)容越來越難以被用戶發(fā)現(xiàn)的困局。

至于為什么要將知海圖AI的第一個(gè)應(yīng)用場景聚焦在“熱榜摘要”,知乎CEO周源在接受媒體采訪時(shí)就表示,這是從早期產(chǎn)品“回答總結(jié)”中汲取的靈感。他表示,“那個(gè)功能(回答總結(jié))是開放給所有用戶,大家進(jìn)行wiki一樣的編輯,后來發(fā)現(xiàn)這個(gè)事情太困難了,回答數(shù)量多了以后成本非常高,而且效果并不好,現(xiàn)在則可以通過技術(shù)的方式,幫人來完成這樣的事情?!?/p>

如果直接用大語言模型來進(jìn)行創(chuàng)作,并回答知乎上的問題,結(jié)果幾乎一定是災(zāi)難性的的。相信許多朋友在使用ChatGPT、文心一言,以及New Bing時(shí)就會發(fā)現(xiàn),生成式人工智能有一個(gè)非常突出問題,那就是一本正經(jīng)的胡說八道。但之所以用戶知道ChatGPT在胡說,是因?yàn)樵谔釂柷澳憔鸵呀?jīng)對答案有了一個(gè)大概的認(rèn)識,是有能力判斷他所給出的結(jié)果正確與否??扇绻脩魧栴}的答案沒有概念呢?

知海圖AI在熱榜摘要上小試牛刀,可以說是知乎因地制宜來實(shí)現(xiàn)以點(diǎn)破面的方式,因?yàn)檫@個(gè)功能是面向內(nèi)容消費(fèi)者、而非生產(chǎn)者的。通過近似于“長話短說”的熱榜摘要功能,用戶不需要仔細(xì)瀏覽具體的回答,就可以大致了解大家圍繞熱榜話題進(jìn)行了哪些評論,這對于以實(shí)時(shí)消息為主的知乎熱榜而言,最大的好處就是將信息濃縮、以幫助用戶提高效率。

在這個(gè)內(nèi)容消費(fèi)不斷碎片化的時(shí)代,短視頻的脫穎而出就已經(jīng)證明了用戶對于仔細(xì)“咀嚼”內(nèi)容,以提煉信息這件事,是越來越?jīng)]有耐心了。高質(zhì)量的內(nèi)容雖然是知乎的立身之本,但隨著邀請制被廢除,門檻降低后的大眾化策略除了帶來海量的用戶外,也讓知乎的大環(huán)境泥沙俱下,有價(jià)值的內(nèi)容被發(fā)掘的難度越來越大。而有了熱榜摘要,用AI來幫助用戶發(fā)掘優(yōu)質(zhì)內(nèi)容,自然也就能盤活資源。

不過對于創(chuàng)作者來說,熱榜摘要可能并非一個(gè)福音。將熱榜問題的回答去粗取精、再整理到用戶面前,盡管滿足了用戶無障礙獲取信息的痛點(diǎn),但代價(jià)是用戶既然已經(jīng)看完了精華,還會不會去繼續(xù)查看具體的回答呢。所以結(jié)果會是做出了優(yōu)質(zhì)回答的答主可能不會被用戶發(fā)現(xiàn)并關(guān)注,這也就代表著屬于優(yōu)質(zhì)答主的流量無形中會變少。

順著這一思路再發(fā)散一下會發(fā)現(xiàn),既然用戶尋找答案的工作被AI代替,也就意味著熱榜摘要有減少用戶使用時(shí)長的風(fēng)險(xiǎn)。在其他APP都在想方設(shè)法讓用戶留下的情況下,知乎這無疑是反其道而行之。并且對于一個(gè)依賴廣告和商業(yè)化內(nèi)容解決方案的平臺而言,用戶停留時(shí)間短幾乎就等于流量變差,所以這似乎并非一個(gè)好的結(jié)果。


相關(guān)內(nèi)容