美國時間1月28日周一早盤,美國科技股一片哀嚎,人工智能芯片領先供應商英偉達股價直接暴跌12%。此外,Meta和 谷歌母公司 Alphabet,英偉達的競爭對手 Marvell、還有博通、美光和臺積電也均大幅下跌。 造成美國股市哀鴻遍野的原因,是一款來自東方的"神秘AI應用":DeepSeek。這款來自中國的AI產品,登頂了美國蘋果地區(qū)的免費下載榜,一舉超越了AI巨頭ChatGPT!一時間,硅谷的所有從業(yè)者,紛紛坐立不安... DeepSeek打破了美國AI壟斷 DeepSeek是一家來自中國的開發(fā)開源大型語言模型的人工智能公司,總部位于浙江杭州。DeepSeek作為開源的大型語言AI模型,在最新發(fā)布的DeepSeek- R模型中,在僅有極少數標注數據的情況下,極大提升了模型的推理能力。 目前在數學、代碼、自然語言推理,以及科學領域的測試中,性能比肩目前行業(yè)的領頭羊,OpenAI O1的正式版。這一結果不僅震驚了整個硅谷,更是讓美國政府苦心經營的限制中國AI的策略落空。 從2022年的拜登政府,到如今的特朗普2.0,為了構建美國AI科技領先的護城河,美國政府先后三次出臺芯片法案,切斷了中國獲得美國強大芯片的渠道,試圖限制中國AI技術的發(fā)展。例如英偉達公司的GPU H100型號,原本被認為是構建AI模型競爭力的關鍵產品,被禁止出口中國。但隨著DeepSeek的發(fā)布被徹底顛覆,美國在AI上進行的芯片封鎖“政策破產”。 青出于藍 在很多AI基準測試結果與Open AI不相上下的情況下,DeepSeek僅僅花費了560萬美元,就完成了R1模型的訓練,這讓硅谷的各家公司相當震驚。要知道,行業(yè)領頭羊OpenAI每年的投入是50億美元,而背后的金主微軟則是投入了130億美元,谷歌在2024年度的報表中,更是豪擲了驚人的510億美元! DeepSeek可能是對美國股市的最大威脅,因為該模型引發(fā)了對數千億美元資本支出的效用的質疑?!叭绻柧毮P妥兊酶阋?、更快、更容易,那么對使用AI的需求將增長和加速得更快,這確保了計算的供應將被使用。這也就有了開篇美國科技硬件和AI公司股票集體暴跌的一幕。 所以,DeepSeek是如何做到如此小的預算達成如此高的成就呢?這主要愿意DeepSeek的工程師們,利用強大的開源模型,讓開發(fā)者們跳過了自行構建和訓練模型。只需要在現(xiàn)有模型的基礎上,進行自己模型的構建。行業(yè)內部的詞匯是“蒸餾”:即利用一個非常大的模型,來幫助你訓練小模型,并在特定任務上表現(xiàn)更出色。 對此,OpenAI的創(chuàng)始人薩姆·奧特曼發(fā)文表示:“復制已有有效的事物相對容易,但在不確定任何前景的情況下,但嘗試新事物、冒險和挑戰(zhàn)則是極其困難的?!痹捓镌捦猓瑠W特曼對于突然殺出來DeepSeek這個對手相當不爽。 其實,在AI領域中,所有的公司都是靠著互相模仿起家:Google建立了第一批大型語言模型,但是并未將其作為第一優(yōu)先級,ChatGPT看到了機會后,抄襲了Google的想法迅速進入這一領域。而當ChatGPT成為行業(yè)領頭羊時,谷歌,亞馬遜和Meta等公司紛紛入局, 同樣,DeepSeek也對于自己的來源沒有藏著掖著,當對DeepSeek提問你是什么型號時,DeepSeek會直接回答說,我是由OpenAI所創(chuàng)建的人工智能,架構則是基于ChatGPT-4。不過,這絕非是簡單的“站在巨人肩膀上”,而是青出于藍而勝于藍的故事。如今的DeepSeek,不僅是簡單的模仿,而是通過創(chuàng)新進行彎道超車。 DeepSeek與ChatGPT 最大的不同在于:DeepSeek R1是開源的,而 ChatGPT是閉源的。開源意味著開發(fā)者有著完全的訪問權限,而一旦開源軟件趕上甚至超越閉源軟件,所有開發(fā)者都將會轉向開源軟件。 這就給Open AI這樣的行業(yè)領頭羊敲響了警鐘,今天你們還是領跑者,明天就有可能被迎頭趕上! 美國硅谷的CEO們贊嘆不已 想知道自己做的到底怎么樣,要聽聽對手對你的評價。面對DeepSeek的突然崛起,微軟CEO薩提亞?納德拉在瑞士達沃斯論壇上表示:“DeepSeek 的新模型令人印象深刻,尤其是在如何高效開發(fā)開源模型并進行推理計算方面。它的計算效率非常出色,我們應當非常、非常認真地對待來自中國的這些技術進展?!? AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)同樣在達沃斯論壇上,他表示,過去十年來,美國可能一直在人工智能競賽中領先于中國,但DeepSeek的AI大模型發(fā)布可能會“改變一切”,尤其是在開源領域。 Meta創(chuàng)始人馬克·扎克伯格在一檔播客節(jié)目中表示,DeepSeek的大模型非常先進。美國科技行業(yè)雖然暫時領先,但中國正在全力沖刺,兩者差距很小。而Meta已經成立了四個專門研究小組來研究量DeepSeek的工作原理并基于此來改進旗下大模型Llama。 小分隊1和2試圖搞清楚DeepSeek是如何降低訓練和運行成本的; 小分隊3負責研究DeepSeek可能使用了哪些數據來訓練模型; 小分隊4正在考慮基于DeepSeek模型的屬性重組Meta模型的新技術。 Meta的惶恐并不意外,畢竟,當部門里一個高管的薪資就超過整個DeepSeek V3的訓練成本,而且這樣的高管還有幾十位,他們該如何向高層交代? 揭秘DeepSeek團隊 而DeepSeek能取得今天的成就,絕非一日之功,同樣是經歷了多年的努力和“孵化”。創(chuàng)始人梁文峰來自浙江大學,擁有信息與電子工程學系本科和碩士學位。從2008年起,他就開始帶領團隊使用機器學習等技術探索全自動量化交易。不過直到2023年7月,DeepSeek才算是正式成立,進軍通用人工智能領域,且至今也未對外進行融資。 面對如此神秘的公司,前OpenAI政策主管、如今Anthropic聯(lián)合創(chuàng)始人Jack Clark認為,DeepSeek雇用了“一批高深莫測的奇才”。不過,梁文峰在接受采訪時曾透露,這里沒有什么高深莫測的奇才,不過都是來自Top高校的畢業(yè)生、包括尚未畢業(yè)的博四、博五實習生,還有一些畢業(yè)不久的年輕人。 DeepSeek團隊最大的特點是名校、年輕,即使是團隊Leader級別,年紀也多在35歲以下。不到140人的團隊,工程師和研發(fā)人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校。 作為AI公司的創(chuàng)始人,梁文峰也曾被問到關于錢夠不夠的問題:怎么看待做量化同時做大量基礎研發(fā),不燒錢嗎?對此他的回答是:一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因為有一群急于在上面彈奏樂曲的人。 中美之間的AI競爭剛剛開始 2011年,馬斯克在接受媒體采訪時,主持人問了他一個問題,如何看看待中國比亞迪?馬斯克聽完后,不僅哈哈大笑,隨后還反問道,你見過比亞迪的車輛嗎?我不認為比亞迪有什么好的產品!時間推到2023年時,有網友把這段舊視頻翻出來后,馬斯克大方承認了自己當年的錯誤。他說,這是很多年前的事兒了,如今他們的汽車很具競爭力。 這樣的狀況,又一次出現(xiàn)在AI的領域中。一年半前,谷歌的前CEO埃里克·施密特曾說過,中國的人工智能領域落后美國兩到三年。但到了本周ABC電視臺《This Week》節(jié)目上,這位前CEO改了口“在過去的六個月里,中國以驚人的速度迎頭趕上?!? 喬治梅森大學(George Mason University)AI研究員迪恩·鮑爾 (Dean Ball)認為,這一趨勢表明,中國開發(fā)團隊正在迅速接近前沿技術水平。他指出,DeepSeek的小型版本R1能夠在普通家庭電腦上運行,這將有助于推動AI應用的快速普及:“DeepSeek小型模型的卓越性能意味著強大的推理系統(tǒng)會迅速傳播,并能在本地硬件上運行——遠離任何集中監(jiān)管(包括美國的出口管制)的視線。” 如今的美國,正計劃大舉砸錢投入AI基礎設施。就在上周,美國新任總統(tǒng)特朗普宣布OpenAI、甲骨文、軟銀將成立一家合資企業(yè)“星際之門項目”,未來四年斥資5000億美元(約合人民幣3.6萬億元)建設新的AI數據中心。特朗普的人工智能“沙皇”薩克斯表示,DeepSeek“表明人工智能競賽將非常具有競爭力,美國人能自信但不能自滿。 中國AI公司證明了用有限的計算資源,足以做出頂尖水平的模型。DeepSeek R1正在改寫AI游戲規(guī)則。隨著更多的中國AI公司通過開源和低價模型的進入,這場中美之間的AI競爭大戲,才剛剛開始... 美國大廠慌了?美國人看就是幸災樂禍! 小王再次邀請在中國生活了九年,現(xiàn)居華盛頓的資深英語老師馬思瑞馬老師(Chris),根據每篇文章內容分享一些英語常用詞匯,讓大家了解英語新聞里的地道表達,以及一個美國人對當地新聞的真實看法,努力打破信息差。 01 馬老師有話說 DeepSeek is now the #1 most-downloaded app on the Apple App Store, and Western social media is blowing up with discussions about who’s better and how Big Tech is doomed (完蛋了)! I’ve seen people saying that you shouldn’t use DeepSeek because it’s Chinese, but it seems like many U.S. netizens (網民) really don’t care. Just like we‘ve seen with other Chinese apps lately… DeepSeek成為蘋果app商店下載量最多的app之后,西方社交媒體的討論真是炸了。大家都在討論哪個(AI模型)是最好的、說大科技公司完蛋了。我看有人說因為DeepSeek是中國的公司,所以我們美國人不應該用它,但是看來很多美國網友真不在乎。就跟最近其他的中國app火起來一樣... “Look, it’s a tool in the toolbox. You find which tool works for your particular needs and you use it.” The idea seems to be that loyalty doesn’t exist to any specific app. They just want to use the BEST app for their goals. “我跟你說,只是工具箱里的一個工具。你看哪個工具最符合你具體的需求,然后就用它”。網上的很多討論反映出大家不對任何app忠誠。他們只想用最能幫他們達到目標的app。 And, yeah, stocks did plummet (狂跌) today, but with the state of the U.S. economy, many people have zero sympathy for tech companies that haven’t prioritized Americans‘ interests anyway. 反正確實今天很多股票狂跌了,但是考慮到美國經濟的現(xiàn)狀,很多人根本不同情那些沒有把保護美國人的利益放在第一位的(美國)科技公司。 U.S. tech companies have been trying to hiring more people overseas because they can pay less money. So for many Americans who are impacted by those policies, this is a “schadenfreude” (幸災樂禍) moment. 很多美國科技公司一直想在海外雇更多人,因為這樣不用付那么高的工資。所以對于那些受到該政策影響的美國人來說,這就是個幸災樂禍的時刻。 “(Tech companies) spent years sending your jobs (overseas) and are working on an attempt to replace the remaining jobs, (then) get mad at us for using a Chinese version that will financial hurt them.” “(科技公司)花好幾年把我們的工作送到國外去了,而且還繼續(xù)想辦法看看怎么取代剩下的美國員工... 現(xiàn)在大家開始用一個中國的競品,那些公司發(fā)現(xiàn)要虧錢了就生我們的氣?” I’ve seen a lot of people bring up “FAFO,” which means “f*** around and find out.” This idea is actually very similar to 不作死就不會死. 我還看到不少人提到FAFO,意思就是f*** around and find out。這個短語的意思跟“不作死就不會死”還挺類似。 Another great phrase here is “You reap what you sow” (種瓜得瓜,種豆得豆). 另外一個特別好的短語就是you reap what you sow,就是種瓜得瓜,種豆得豆。 Like Bingru mentioned above, people definitely are concerned about an AI (人工智能) bubble (泡沫) bursting, since DeepSeek proves that you can achieve pretty amazing results with much smaller budgets. 像冰汝提到的,確實有不少人擔心人工智能泡沫已經爆了,畢竟DeepSeek證明了小預算還能獲取驚人的成果。 That’s probably why NVIDIA’s stock plummeted today. But, honestly, I think everything is just going to lead to more efficient uses of tech to train even better models. 這應該也是為什么英偉達的股票今天狂跌。但是說實話,我覺得最終的結果應該就是大家可以用這些科技來更高效地訓練更厲害的模型。 Personally, I agree with the people that see AI as a tool. If all these tools can make our lives easier and our work more efficient, I’m all for it. 對我個人而言,我還是同意那些人的說法,人工智能是個工具。如果這些工具能讓我們的生活變得更方便、讓工作更有效率,那我完全支持。