幾乎是一夜之間,“來自東方的神秘力量”又一次震撼海外人士心臟。 1月27日,由國(guó)產(chǎn)大模型公司杭州深度求索開發(fā)的Deepseek應(yīng)用登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。 蘋果美國(guó)區(qū)應(yīng)用商店 蘋果APP Store中國(guó)區(qū)免費(fèi)榜 據(jù)界面新聞,1月27日,DeepSeek官網(wǎng)顯示,DeepSeek網(wǎng)頁(yè)/API不可用。昨日(26日),DeepSeek曾出現(xiàn)短時(shí)閃崩現(xiàn)象。對(duì)此,DeepSeek回應(yīng)稱,當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務(wù)器一時(shí)無法滿足大量用戶的并發(fā)需求。 Deepseek來自國(guó)產(chǎn)大模型公司深度求索,系量化巨頭幻方量化旗下大模型公司。1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。一經(jīng)推出,DeepSeek-R1便憑借其“物美價(jià)廉”的特性在海外開發(fā)者社區(qū)中引發(fā)了轟動(dòng)。 今年1月20日,據(jù)新聞聯(lián)播,國(guó)務(wù)院總理李強(qiáng)主持召開專家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會(huì),聽取對(duì)《政府工作報(bào)告(征求意見稿)》的意見建議。 DeepSeek創(chuàng)始人梁文鋒參加此次座談會(huì),梁文鋒既是深度求索(DeepSeek)創(chuàng)始人,也是頭部量化私募幻方的創(chuàng)始人,創(chuàng)業(yè)范疇橫跨金融和人工智能領(lǐng)域。 (央視新聞截圖,左一梁文鋒) 據(jù)潮新聞客戶端,梁文鋒,1985年出生于廣東省湛江市。2002年,這位對(duì)數(shù)學(xué)建模充滿熱情的年輕人考入浙江大學(xué)電子信息工程專業(yè),并在隨后的幾年里繼續(xù)深造,最終于2010年獲得信息與通信工程碩士學(xué)位。 在校期間,他對(duì)金融市場(chǎng)產(chǎn)生了濃厚的興趣。特別在2008年全球金融危機(jī)之際,他帶領(lǐng)團(tuán)隊(duì)探索了機(jī)器學(xué)習(xí)技術(shù)在全自動(dòng)量化交易中的應(yīng)用潛力,這一經(jīng)歷為他日后的職業(yè)生涯奠定了堅(jiān)實(shí)的基礎(chǔ)。 畢業(yè)后,梁文鋒將目光轉(zhuǎn)向更廣闊的金融市場(chǎng)。 2013年,他與浙大同學(xué)徐進(jìn)共同創(chuàng)立了杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,致力于通過數(shù)學(xué)和人工智能進(jìn)行量化投資。2015年的市場(chǎng)波動(dòng)中,幻方依靠先進(jìn)的高頻量化策略取得了令人矚目的成績(jī)。 2016年是幻方的重要轉(zhuǎn)折點(diǎn)。這一年,公司推出了首個(gè)基于深度學(xué)習(xí)的交易模型,并實(shí)現(xiàn)了所有量化策略的AI化轉(zhuǎn)型。2018年,幻方正式確立了以AI為核心的發(fā)展戰(zhàn)略。然而,隨著業(yè)務(wù)的快速擴(kuò)展,算力瓶頸逐漸顯現(xiàn)。 為解決計(jì)算資源不足的問題,2019年,梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái),總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬張英偉達(dá)A100顯卡。 2021年,幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),躋身國(guó)內(nèi)量化私募領(lǐng)域的“四大天王”之列。2023年,他宣布將正式進(jìn)軍通用人工智能領(lǐng)域,并創(chuàng)辦了深度求索DeepSeek,專注于做真正人類級(jí)別的人工智能。 2024年5月,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2。同年12月,DeepSeek-V3問世,這款性能優(yōu)越且性價(jià)比極高的大語言模型,被硅谷同行譽(yù)為“來自東方的神秘力量”。 DeepSeek之所以被科技圈關(guān)注,在于DeepSeek-V3的出現(xiàn)極大地降低了大模型訓(xùn)練和應(yīng)用的成本,DeepSeek-V3訓(xùn)練成本僅557.6萬美元,而OpenAI訓(xùn)練ChatGPT-4o所花費(fèi)的成本高達(dá)7800萬美元甚至是1億美元,雙方的成本至少是10倍的差距。 在性能上,DeepSeek-V3在數(shù)學(xué)、代碼能力和中文知識(shí)問答方面還超過了ChatGPT-4o,行業(yè)震驚于這一性價(jià)比,DeepSeek-V3開源給全世界的技術(shù)開發(fā)團(tuán)隊(duì)。 在團(tuán)隊(duì)配置上,DeepSeek團(tuán)隊(duì)只有139名研發(fā)人員,對(duì)比ChatGPT的OpenAI團(tuán)隊(duì)則有1200名研究人員,團(tuán)隊(duì)規(guī)模是DeepSeek的近乎9倍之多。近期熱門話題“雷軍千萬年薪挖95后天才AI少女”,這位AI少女就是DeepSeek團(tuán)隊(duì)的研發(fā)人員,但小米和當(dāng)事人并未就此回應(yīng)。 通過招聘網(wǎng)站注意到,深度求索公司的北京子公司正在招人,現(xiàn)共放出了52個(gè)崗位,包括深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師以及資深ui設(shè)計(jì)師等,均為14薪。 其中,薪資最高的為核心系統(tǒng)研發(fā)工程師(校招),薪資范圍為6萬元-9萬元;除此之外,大部分崗位的起薪在2萬元及以上。 值得一提的是,該公司正在招聘實(shí)習(xí)生,AGI大模型實(shí)習(xí)生的工資為500元/天-1000元/天,數(shù)據(jù)百曉生實(shí)習(xí)生為500元/天-510元/天。 1月27日,DeepSeek概念股表現(xiàn)強(qiáng)勢(shì),截至發(fā)稿,每日互動(dòng)、華金資本、浙江東方漲停,并行科技、卓創(chuàng)資訊、拓爾思等漲幅居前。 消息面上,此前AMD宣布,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實(shí)現(xiàn)最佳性能。 華經(jīng)產(chǎn)業(yè)研究院報(bào)告顯示,2023年國(guó)內(nèi)智能體市場(chǎng)規(guī)模達(dá)59.81億元,預(yù)計(jì)2024年突破百億元。中國(guó)工程院院士鄔賀銓在2025年ICT行業(yè)趨勢(shì)年會(huì)上表示,2025年不僅是智能體的元年,也將是AI終端的元年。 聲明:文章內(nèi)容和數(shù)據(jù)僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。