春節(jié)這幾天,國(guó)內(nèi)外 AI 圈都被 DeepSeek 刷了屏。英偉達(dá)的股市震蕩更是讓全世界看得目瞪口呆(參見(jiàn)《英偉達(dá)市值蒸發(fā)近 6000 億美元,而 DeepSeek 剛剛又開(kāi)源新模型》)。
簡(jiǎn)單來(lái)說(shuō),DeepSeek 最近發(fā)布的兩個(gè)模型 —— DeepSeek-V3 和 DeepSeek-R1 以很低的成本獲得了比肩 OpenAI 同類模型的性能。這引發(fā)了市場(chǎng)對(duì) AI 硬件需求的擔(dān)憂,投資者擔(dān)心未來(lái)對(duì)英偉達(dá)高端芯片的需求可能會(huì)減少。
與此同時(shí),關(guān)于 DeepSeek 技術(shù)創(chuàng)新的討論也非常多。很多人認(rèn)為,DeepSeek 在硬件受限的條件下被逼走出了一條不同于 OpenAI 等狂堆算力的道路,用一系列技術(shù)創(chuàng)新來(lái)減少模型對(duì)算力的需求,同時(shí)獲得性能提升。
這些成就得到了包括 Sam Altman 在內(nèi)的 AI 領(lǐng)軍人物的肯定。
隨后,OpenAI 首席研究官 Mark Chen 也發(fā)了帖。他表示,DeepSeek 確實(shí)獨(dú)立發(fā)現(xiàn)了一些 OpenAI o1 也在用的核心理念,不過(guò),這并不代表 OpenAI 在算力上的高投入是不合理的。
帖子原文如下:
恭喜 Deepseek 開(kāi)發(fā)出了 o1 級(jí)別的推理模型!他們的研究論文表明,他們獨(dú)立發(fā)現(xiàn)了一些我們?cè)谕ㄍ?o1 的路上發(fā)現(xiàn)的核心理念。
不過(guò),我認(rèn)為外界的反應(yīng)有些過(guò)度夸大,特別是在成本方面的說(shuō)法。擁有兩個(gè)范式(預(yù)訓(xùn)練和推理)意味著我們可以在兩個(gè)維度而不是一個(gè)維度(低成本)上優(yōu)化某項(xiàng)能力。
但這也意味著我們有兩個(gè)可以擴(kuò)展的維度,我們打算在這兩個(gè)維度上都積極投入算力!
隨著蒸餾研究的日益成熟,我們也發(fā)現(xiàn)降低成本和提升能力愈發(fā)解耦。能夠以更低成本(特別是在更高延遲的情況下)提供服務(wù),并不意味著就能產(chǎn)生更好的能力。
我們將繼續(xù)提升以更低成本提供模型服務(wù)的能力,但我們對(duì)我們的研究路線圖保持樂(lè)觀,并將繼續(xù)專注于執(zhí)行它。我們很高興能在本季度和今年為大家?guī)?lái)更好的模型!
短短幾段話,Mark Chen 表達(dá)了好幾層觀點(diǎn),我們讓 DeepSeek-R1 來(lái)解讀一下每段話的言外之意:
總之,和 Sam Altman 一樣,Mark Chen 的發(fā)言也是在重塑外界對(duì) OpenAI 的信心,并預(yù)告今年會(huì)帶來(lái)更好的模型。
此外,OpenAI研究科學(xué)家Noam Brown也在努力弱化外界對(duì)OpenAI和DeepSeek的對(duì)比,但大家似乎并不買單。
另外,Mark Chen 提到的「外界的反應(yīng)有些過(guò)度夸大,特別是在成本方面的說(shuō)法」這一點(diǎn)最近也被很多人討論,尤其是「DeepSeek-v3 訓(xùn)練成本僅為 558 萬(wàn)美元」這一說(shuō)法。其實(shí),DeepSeek-v3 的技術(shù)報(bào)告原文是這么寫的:「上述成本僅包括 DeepSeek-V3 的正式訓(xùn)練,不包括與架構(gòu)、算法、數(shù)據(jù)相關(guān)的前期研究、消融實(shí)驗(yàn)的成本」。
圖靈獎(jiǎng)得主、Meta AI 首席科學(xué)家 Yann LeCun 也認(rèn)為市場(chǎng)對(duì)于 DeepSeek 的成本反應(yīng)并不合理。不過(guò),他是從推理的角度來(lái)看的。他指出,人們常常以為巨額投資主要用于訓(xùn)練更強(qiáng)大的模型,但實(shí)際上大部分錢都花在了讓這些 AI 服務(wù)能夠穩(wěn)定地服務(wù)數(shù)十億用戶身上。而且隨著 AI 能力的增強(qiáng),維持服務(wù)運(yùn)行的成本會(huì)變得更高,關(guān)鍵是要看用戶是否愿意為這些增強(qiáng)的功能付費(fèi)。
不少網(wǎng)友對(duì) LeCun 的看法表示贊同,認(rèn)為訓(xùn)練、推理成本更低的 AI 意味著這項(xiàng)技術(shù)能更快普及,從而創(chuàng)造更大的市場(chǎng)。
從這個(gè)角度來(lái)看,DeepSeek 在降低推理成本方面的努力似乎比降低訓(xùn)練成本的貢獻(xiàn)更值得被關(guān)注。
針對(duì)可能即將到來(lái)的推理需求的激增,OpenAI、Meta 等都在做相應(yīng)準(zhǔn)備,比如旨在為 OpenAI 建設(shè)強(qiáng)大基礎(chǔ)設(shè)施的「星際之門」項(xiàng)目(計(jì)劃投資 5000 億美元,但資金是否到位一直存疑)、Meta 新一年 600 億美元的 AI 投資……
看來(lái),2025 年,AI 市場(chǎng)的競(jìng)爭(zhēng)依然激烈,DeepSeek 將在新一年走出多遠(yuǎn)還有待觀察。