青青青久草,四虎永久在线精品,二区免费视频,一级毛片在线直接观看,黄网在线免费观看,美女露全身永久免费网站,色婷婷六月桃花综合影院

百度不做Sora的理由,李彥宏講清楚了

2024年11月12日舉辦的百度世界大會(huì)上,探討“什么是有價(jià)值的AI應(yīng)用”成了主題。

百度集團(tuán)創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏提到,將大會(huì)主題定為“應(yīng)用來(lái)了”,代表百度對(duì)于當(dāng)前大模型和生成式人工智能時(shí)代的認(rèn)知和判斷。

圖片

△文心大模型的日均調(diào)用量變化。

目前,文心大模型的日均調(diào)用量已經(jīng)超過(guò)15億。李彥宏認(rèn)為,如果文心大模型調(diào)用量一年能漲10倍,意味著市場(chǎng)需求確實(shí)存在。他提到,事實(shí)上,文心的調(diào)用量,在半年內(nèi)的增長(zhǎng)就接近10倍。

在會(huì)上,李彥宏提到了幾個(gè)共識(shí):

首先,檢索增強(qiáng)(RAG)成為了行業(yè)共識(shí),因?yàn)橄盎糜X(jué)”,是模型行業(yè)落地的必須。李彥宏認(rèn)為,過(guò)去24個(gè)月,大模型的最大變化是基本消除了“幻覺(jué)”。

其次,智能體是AI應(yīng)用最主流的形態(tài),是AI原生時(shí)代內(nèi)容、信息和服務(wù)的新載體。

“智能體”,無(wú)疑是世界大會(huì)上出現(xiàn)最高頻的術(shù)語(yǔ)。李彥宏將智能體比作PC時(shí)代的網(wǎng)站和移動(dòng)時(shí)代的自媒體,區(qū)別在于,智能體更像人、更智能。

他提到了智能體的4個(gè)應(yīng)用方向:公司類(lèi)(如銷(xiāo)售客服)、角色類(lèi)(如數(shù)字人直播)、工具類(lèi)(如行業(yè)報(bào)告智能生成)、行業(yè)類(lèi)。

技術(shù)的商業(yè)價(jià)值,也是李彥宏在發(fā)言中反復(fù)提起的主題。

比如,他認(rèn)為iRAG的商業(yè)價(jià)值在于無(wú)幻覺(jué)、超真實(shí)、沒(méi)成本、立即可取。

圖片

具體到0代碼開(kāi)發(fā)工具“秒噠”的發(fā)布,李彥宏認(rèn)為產(chǎn)品價(jià)值在于實(shí)現(xiàn)了生產(chǎn)力的無(wú)限擴(kuò)張。用他的話來(lái)形容,這是“一個(gè)前所未有的只靠想法就能賺錢(qián)的時(shí)代”。

在產(chǎn)業(yè)落地層面,李彥宏提到,大模型帶給行業(yè)的價(jià)值增量,體現(xiàn)在兩個(gè)層面:降本和增效。

目前,百度智能云千帆大模型平臺(tái)已經(jīng)精調(diào)了3.3萬(wàn)個(gè)模型,開(kāi)發(fā)了77萬(wàn)個(gè)企業(yè)應(yīng)用,一半以上的央國(guó)企都是千帆的用戶。

文庫(kù)和網(wǎng)盤(pán)融合了

在2024年9月的架構(gòu)調(diào)整中,百度網(wǎng)盤(pán)回歸了MEG,被劃分到了文庫(kù)BU——這也為兩個(gè)內(nèi)容工具型應(yīng)用的生態(tài)打通,埋下了伏筆。

百度副總裁、百度文庫(kù)兼百度網(wǎng)盤(pán)負(fù)責(zé)人王穎看來(lái),以往文庫(kù)和網(wǎng)盤(pán)的用戶具有以下兩個(gè)痛點(diǎn):

一方面,不同形式、品類(lèi)、格式的素材,無(wú)法在同一個(gè)平臺(tái)上編輯操作,也無(wú)法生成任何形式、格式的內(nèi)容;

另一方面,文庫(kù)中的公域知識(shí),和網(wǎng)盤(pán)中的私域知識(shí),是分開(kāi)存儲(chǔ)的,無(wú)法協(xié)同形成完整的知識(shí)。

百度文庫(kù)上線的“自由畫(huà)布”功能,就成了打通文庫(kù)和網(wǎng)盤(pán)內(nèi)容的橋梁。在李彥宏看來(lái),自由畫(huà)布本質(zhì)上就是一個(gè)工具類(lèi)智能體。

就像一個(gè)智能白板,用戶能夠通過(guò)點(diǎn)選、對(duì)話、框選,自由選擇和組合文庫(kù)和網(wǎng)盤(pán)上需要操作的內(nèi)容。

基于背后的MoE(混合專家模型)架構(gòu)和多模態(tài)模型,自由畫(huà)布可以支持文字、圖像、視頻等文件的跨模態(tài)處理,最后也能生成圖文等跨模態(tài)內(nèi)容。

而這些經(jīng)自由畫(huà)布生成的多模態(tài)內(nèi)容,適配的是微信朋友圈、小紅書(shū)的圖+文、視頻+文內(nèi)容生態(tài),也能生成帶圖表的研報(bào)等專業(yè)領(lǐng)域內(nèi)容。

圖片

△自由畫(huà)布根據(jù)要求生成了孫悟空來(lái)現(xiàn)代探險(xiǎn)的小說(shuō)、漫畫(huà)和視頻。

在AI工具型產(chǎn)品苦尋變現(xiàn)模式的當(dāng)下,王穎卻認(rèn)為,網(wǎng)盤(pán)和文庫(kù)的商業(yè)模式天生與大模型產(chǎn)品非常匹配。

她告訴《智能涌現(xiàn)》,文庫(kù)和網(wǎng)盤(pán)的收費(fèi)模式,本質(zhì)上是和用戶分潤(rùn),產(chǎn)品通過(guò)給用戶帶來(lái)價(jià)值、幫他們掙到錢(qián),來(lái)提高用戶的留存率和付費(fèi)率。

AI能力能夠拓展產(chǎn)品功能的邊界,組合出來(lái)的產(chǎn)品變得更多,給用戶帶來(lái)更多的權(quán)益,也會(huì)讓付費(fèi)轉(zhuǎn)化率變高。”王穎對(duì)《智能涌現(xiàn)》表示。

做Sora之前,先解決“幻覺(jué)”

即便李彥宏提到,目前文字和RAG(檢索增強(qiáng))技術(shù)的結(jié)合已有成效,但他也指出,圖像和RAG技術(shù)的結(jié)合還遠(yuǎn)遠(yuǎn)不夠。

多模態(tài)模型目前沒(méi)有大規(guī)模應(yīng)用,是由于幻覺(jué)問(wèn)題還沒(méi)有解決。”李彥宏在發(fā)言中指出。

這一認(rèn)知,也決定了百度面對(duì)Sora的態(tài)度。李彥宏提到,在Sora出現(xiàn)時(shí),百度的決策不是跟進(jìn),而是著手解決多模態(tài)的幻覺(jué)問(wèn)題。

在會(huì)上,百度發(fā)布了iRAG,一項(xiàng)基于檢索增強(qiáng)的文生圖技術(shù)。用李彥宏的話來(lái)說(shuō),iRAG可以去除生成圖像的“機(jī)器味”。

圖片

△基于iRAG生成的圖片。

百度CTO王海峰在會(huì)上介紹了iRAG實(shí)現(xiàn)可控生圖的技術(shù)鏈路:

首先,大模型對(duì)用戶的需求進(jìn)行分析理解,自動(dòng)規(guī)劃精確或者泛化的方案,比如對(duì)哪些實(shí)體進(jìn)行增強(qiáng);

接著,在增強(qiáng)階段,對(duì)需要增強(qiáng)的實(shí)體進(jìn)行檢索,并且選擇對(duì)應(yīng)的參考;

最后,在生成階段,百度自研了多模態(tài)可控生圖技術(shù)。一方面,通過(guò)局部注意力計(jì)算,大模型能夠在保持實(shí)體特征不變的情況下,實(shí)現(xiàn)圖像的高泛化生成;另一方面,通過(guò)整體注意力計(jì)算,實(shí)現(xiàn)圖像的高精確生成。

小度做了副AI眼鏡

2023年換上大模型“大腦”的小度,這次推出的不再是音箱,而是百度的第一副眼鏡:小度AI眼鏡。

圖片

在硬件層面,這幅眼鏡自重僅45g,低于行業(yè)平均重量49g。為了提高成像效果,眼鏡搭載了1600萬(wàn)像素超廣角鏡頭和AI防抖算法;為了提高聲音識(shí)別準(zhǔn)確率、降低漏音,眼鏡采用了四麥陣列和開(kāi)放式防漏音揚(yáng)聲器設(shè)計(jì)。

在續(xù)航能力上,小度AI眼鏡用30min就能充滿電,實(shí)現(xiàn)56小時(shí)待機(jī),超5小時(shí)連續(xù)聆聽(tīng)。這三個(gè)指標(biāo)均超過(guò)了行業(yè)標(biāo)桿水平。

將小度AI眼鏡與普通眼鏡進(jìn)行區(qū)別的,還是在“AI”上。

基于文心大模型和DuerOS AI原生操作系統(tǒng),小度AI能夠?qū)崿F(xiàn)第一視角拍攝、邊走邊問(wèn)、識(shí)物百科、視聽(tīng)翻譯、智能備忘、歌單等功能。

據(jù)百度集團(tuán)副總裁、小度科技CEO李瑩介紹,小度AI眼鏡將在2025年上半年上市。

一個(gè)0代碼開(kāi)發(fā)工具,就是一支智能體團(tuán)隊(duì)

會(huì)上,百度還官宣了“秒噠”,一個(gè)將在2025年Q1上線的0代碼應(yīng)用開(kāi)發(fā)平臺(tái)。

相較于其他的0代碼開(kāi)發(fā)平臺(tái),秒噠的特色是,應(yīng)用的開(kāi)發(fā)過(guò)程,由多個(gè)多智能體進(jìn)行協(xié)作。

圖片

比如,在網(wǎng)頁(yè)制作過(guò)程中,網(wǎng)頁(yè)的代碼編寫(xiě)和部署由程序員智能體完成,網(wǎng)頁(yè)中的文案由寫(xiě)作智能體完成,文案中最新的資料由檢索機(jī)器人上網(wǎng)查詢,其中的配圖又由擅長(zhǎng)生圖的智能體實(shí)現(xiàn)。

最后,負(fù)責(zé)質(zhì)檢的智能體,還會(huì)利用反思能力,運(yùn)行測(cè)試代碼,發(fā)現(xiàn)其中的bug,并與程序員智能體進(jìn)行配合修改。

多智能體協(xié)作,不僅應(yīng)用在了針對(duì)小白開(kāi)發(fā)者的“秒噠”上,還運(yùn)用在了針對(duì)專業(yè)程序員的文心快碼Comate上。

王海峰介紹,Comate已經(jīng)迭代到了3.0版本。在開(kāi)發(fā)全流程中,Comate 3.0中的不同智能體可以實(shí)現(xiàn)自動(dòng)代碼質(zhì)檢、代碼補(bǔ)全等功能,目的是提高程序員的工作質(zhì)量和效率,讓其把更多精力投入到探索和創(chuàng)新。


相關(guān)內(nèi)容