IT之家 3月12日消息,北京人形機(jī)器人創(chuàng)新中心(國家地方共建具身智能機(jī)器人創(chuàng)新中心)今日在京發(fā)布了全球首個(gè)“一腦多能”、“一腦多機(jī)”的通用具身智能平臺(tái)“慧思開物”。
“慧思開物”的應(yīng)用號(hào)稱是對(duì)基于單一場景單一任務(wù)做專項(xiàng)開發(fā)這一傳統(tǒng)機(jī)器人應(yīng)用開發(fā)模式的顛覆,同時(shí)也填補(bǔ)了具身智能領(lǐng)域在通用軟件系統(tǒng)方面的空白,推動(dòng)智能機(jī)器人從單一任務(wù)執(zhí)行向復(fù)雜環(huán)境下的自主決策與執(zhí)行能力躍升。
據(jù)悉,“慧思開物”能夠?qū)崿F(xiàn)從任務(wù)理解到執(zhí)行的全流程智能化,具備處理多場景復(fù)雜任務(wù)的泛化能力,首次實(shí)現(xiàn)了單個(gè)軟件系統(tǒng)在機(jī)械臂、輪式機(jī)器人、人形機(jī)器人等多構(gòu)型本體上的兼容,能夠適應(yīng)多樣化的應(yīng)用場景和任務(wù),為具身智能機(jī)器人提供感知、決策與執(zhí)行能力。
北京人形機(jī)器人創(chuàng)新中心總經(jīng)理熊友軍表示,具身智能在“智能化”方面仍處于初級(jí)階段,行業(yè)亟需一個(gè)具備多本體兼容性、多場景適應(yīng)性和強(qiáng)大泛化能力的通用智能平臺(tái)。為了替具身智能產(chǎn)業(yè)補(bǔ)上通用軟件系統(tǒng)這塊重要拼圖,創(chuàng)新中心研發(fā)了全球首個(gè)支持多本體多場景應(yīng)用的通用具身智能平臺(tái)“慧思開物”,“在‘慧思開物’的支持下,優(yōu)必選在全球范圍內(nèi)首次把群腦網(wǎng)絡(luò)(BrainNet)用于人形機(jī)器人執(zhí)行整條產(chǎn)線的工業(yè)級(jí)任務(wù)?!?/p>
此外,熊友軍在現(xiàn)場發(fā)言時(shí)還表示,創(chuàng)新中心的開源計(jì)劃自落地以來已取得了豐碩的成果,在本體開源方面,多家合作伙伴們基于“天工”平臺(tái)面向應(yīng)用場景進(jìn)行二次開發(fā),大量極具應(yīng)用能力的機(jī)器人涌現(xiàn),例如優(yōu)必選的新產(chǎn)品“天工行者”,將基于“天工”平臺(tái)重點(diǎn)應(yīng)用至教育領(lǐng)域。
發(fā)布會(huì)現(xiàn)場,創(chuàng)新中心首席技術(shù)官唐劍演示了“慧思開物”在工業(yè)分揀、積木搭建、桌面清理和物流打包四個(gè)場景的真機(jī)操作。通過語音交互、App 直連等多種方式,用戶能夠與機(jī)器人交互。這是全球首次多場景、多任務(wù)、多構(gòu)型具身智能機(jī)器人操作的直播展示。IT之家附官方介紹如下:
在工業(yè)分揀任務(wù)中,通過“慧思開物”App 直連,UR-5e 機(jī)械臂能夠精準(zhǔn)解析語音指令,并通過雙臂協(xié)同的方式完成分揀操作,展現(xiàn)了“慧思開物”在人機(jī)自然交互協(xié)作與機(jī)器人系統(tǒng)高效對(duì)接方面的技術(shù)優(yōu)勢。行業(yè)內(nèi)首創(chuàng)的“App + 機(jī)器人”模式,將復(fù)雜的技術(shù)能力(如推理、規(guī)劃、技能調(diào)用)封裝為簡單易用的操作流程,顯著降低了用戶使用門檻。同時(shí),平臺(tái)支持自定義模型和技能的快速添加,能夠靈活適配不同場景的應(yīng)用需求,為工業(yè)自動(dòng)化領(lǐng)域提供便捷、高效、智能的解決方案。
搭載“慧思開物”的機(jī)械臂基于語音指令完成工業(yè)分揀任務(wù)
隨后,唐劍現(xiàn)場展示了“慧思開物”賦能下的人形機(jī)器人積木搭建任務(wù)。積木搭建對(duì)人形機(jī)器人的空間理解能力和執(zhí)行精度要求極高,“慧思開物”通過充分發(fā)揮大模型思維鏈能力,首次實(shí)現(xiàn)了復(fù)雜任務(wù)的智能化拆解與執(zhí)行。工作人員與“天工”閑聊的過程中隨機(jī)搭建了一個(gè)積木樣例,隨后,“天工”利用視覺大模型(VLM)對(duì)樣例進(jìn)行拆解,精確規(guī)劃每一層的搭建順序,準(zhǔn)確拾取相應(yīng)積木,并按次序完成了 3 層積木的毫米級(jí)精準(zhǔn)搭建。這一過程首次實(shí)現(xiàn)了基于視覺空間思維鏈的復(fù)雜任務(wù)智能化拆解與執(zhí)行,以及強(qiáng)大的擬人交互能力和執(zhí)行精度,展現(xiàn)了具身智能在教育娛樂、精密制造等領(lǐng)域的應(yīng)用潛力。
搭載“慧思開物”的“天工”完成積木搭建任務(wù)
在桌面清理場景中,人形機(jī)器人“天工”展現(xiàn)了端到端模型賦能下雙臂協(xié)作的高效性與動(dòng)態(tài)環(huán)境下的自適應(yīng)能力,流暢地整理桌面餐具,將垃圾收進(jìn)錫紙盤并放入垃圾桶。整個(gè)過程中,機(jī)器人動(dòng)作絲滑流暢,且在多次任意隨機(jī)的人為打斷和移位干擾的情況下,仍能自主糾錯(cuò)、重新規(guī)劃并完成任務(wù),充分體現(xiàn)了平臺(tái)在雙臂協(xié)同控制、動(dòng)態(tài)運(yùn)動(dòng)規(guī)劃以及自適應(yīng)糾錯(cuò)方面的技術(shù)優(yōu)勢,這也是全球首個(gè)經(jīng)受真實(shí)場景直播充分驗(yàn)證展示的,具備高實(shí)時(shí)性、高泛化性的糾錯(cuò)適應(yīng)能力的端到端技能學(xué)習(xí)方案。
搭載“慧思開物”的“天工”完成桌面清理任務(wù)
在物流打包場景,基于“慧思開物”平臺(tái),“天工 PRO”首次實(shí)現(xiàn)了全尺寸人形機(jī)器人物流打包全流程的自主作業(yè)。通過上半身29個(gè)自由度的精密配合,“天工 PRO”使用左右手分別拿起物品和掃碼槍,通過頭部相機(jī)確認(rèn)物品條形碼位置,雙手協(xié)同完成掃碼、裝箱、封箱及粘貼快遞標(biāo)簽等一系列操作。“慧思開物”將任務(wù)拆解為拿、擰、挑等多項(xiàng)元技能,僅需少量數(shù)據(jù)即可高效訓(xùn)練并成功執(zhí)行,顯著提升了數(shù)據(jù)利用效率,并能在復(fù)雜場景的長程任務(wù)執(zhí)行中實(shí)現(xiàn)子任務(wù)間的平滑過渡。該場景不僅展現(xiàn)了機(jī)器人對(duì)復(fù)雜任務(wù)的理解與執(zhí)行能力,還凸顯了靈巧手在工具使用與精細(xì)操作中的優(yōu)勢,展現(xiàn)了對(duì)真實(shí)物流打包場景中從物品處理到包裝封箱的全流程自動(dòng)化應(yīng)用需求的充分支持。
搭載“慧思開物”的“天工”完成物流打包任務(wù)
除了具身“大腦”和具身操作能力,基于“慧思開物”,“天工”機(jī)器人的具身運(yùn)控能力也在持續(xù)升級(jí)。發(fā)布會(huì)現(xiàn)場,搭載“慧思開物”的“天工”機(jī)器人通過多模態(tài)傳感器融合技術(shù)精準(zhǔn)感知環(huán)境,結(jié)合高效的路徑規(guī)劃與步態(tài)生成算法,穩(wěn)健地走上舞臺(tái),并與唐劍進(jìn)行了多輪流暢對(duì)話,進(jìn)一步凸顯了“慧思開物”平臺(tái)在感知、決策與執(zhí)行一體化方面的技術(shù)優(yōu)勢。
“天工”與創(chuàng)新中心首席技術(shù)官唐劍共同上臺(tái)并完成多輪對(duì)話互動(dòng)
上一篇:SU7接頭接錯(cuò)突然遭遇剎車失靈 相關(guān)車主已刪帖 小米回應(yīng)
下一篇:沒有了