鞭牛士報道,1月31日消息,英偉達(dá)官方公告稱,DeepSeek-R1 是一個具有最先進(jìn)推理能力的開放模型。DeepSeek-R1 等推理模型不會提供直接響應(yīng),而是對查詢進(jìn)行多次推理,采用思路鏈、共識和搜索方法來生成最佳答案。
執(zhí)行這一系列推理過程(使用推理得出最佳答案)稱為測試時間擴(kuò)展。DeepSeek-R1 是此擴(kuò)展定律的完美示例,證明了加速計算對于代理 AI推理的需求至關(guān)重要。
由于模型可以反復(fù)思考問題,因此它們會創(chuàng)建更多輸出標(biāo)記和更長的生成周期,因此模型質(zhì)量會不斷提高。大量的測試時計算對于實現(xiàn)實時推理和來自 DeepSeek-R1 等推理模型的更高質(zhì)量響應(yīng)至關(guān)重要,這需要更大規(guī)模的推理部署。
R1 在需要邏輯推理、推理、數(shù)學(xué)、編碼和語言理解的任務(wù)中提供了領(lǐng)先的準(zhǔn)確性,同時還提供了高推理效率。
為了幫助開發(fā)人員安全地試驗這些功能并構(gòu)建自己的專用代理,6710 億參數(shù)的 DeepSeek-R1 模型現(xiàn)已作為 NVIDIA NIM 微服務(wù)預(yù)覽版在build.nvidia.com上提供。
DeepSeek-R1 NIM 微服務(wù)可以在單個 NVIDIA HGX H200 系統(tǒng)上每秒提供多達(dá) 3,872 個令牌。
開發(fā)人員可以使用應(yīng)用程序編程接口 (API) 進(jìn)行測試和試驗,該接口預(yù)計很快將作為可下載的 NIM 微服務(wù)提供,是NVIDIA AI Enterprise軟件平臺的一部分。
DeepSeek-R1 NIM 微服務(wù)通過支持行業(yè)標(biāo)準(zhǔn) API 簡化了部署。企業(yè)可以通過在其首選的加速計算基礎(chǔ)設(shè)施上運(yùn)行 NIM 微服務(wù)來最大限度地提高安全性和數(shù)據(jù)隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟件,企業(yè)還可以為專門的 AI 代理創(chuàng)建定制的 DeepSeek-R1 NIM 微服務(wù)。