人形機(jī)器人距離下場(chǎng)干活,又往前邁進(jìn)了一步。
3月12日,北京人形機(jī)器人創(chuàng)新中心對(duì)外發(fā)布了首個(gè)“一腦多能”、“一腦多機(jī)”的通用具身智能平臺(tái)“慧思開物”。通過該平臺(tái),這家公司試圖將人形機(jī)器人的通用化能力拆解成單個(gè)的技能模塊,通過組合這些技能模塊,讓通用人形機(jī)器人的開發(fā)門檻大幅降低,并且還能讓不同形態(tài)的機(jī)器人也能適配這些能力。
“具身智能在‘智能化’方面仍處于初級(jí)階段,行業(yè)亟需一個(gè)具備多本體兼容性、多場(chǎng)景適應(yīng)性和強(qiáng)大泛化能力的通用智能平臺(tái)。為了替具身智能產(chǎn)業(yè)補(bǔ)上通用軟件系統(tǒng)這塊重要拼圖,創(chuàng)新中心研發(fā)了全球首個(gè)支持多本體多場(chǎng)景應(yīng)用的通用具身智能平臺(tái)‘慧思開物’。”
創(chuàng)新中心總經(jīng)理熊友軍表示,在“慧思開物”的支持下,優(yōu)必選在全球范圍內(nèi)首次把群腦網(wǎng)絡(luò)(BrainNet)用于人形機(jī)器人執(zhí)行整條產(chǎn)線的工業(yè)級(jí)任務(wù)。
具體而言,“慧思開物”由AI大模型驅(qū)動(dòng)的任務(wù)規(guī)劃“大腦”以及數(shù)據(jù)驅(qū)動(dòng)的端到端技能執(zhí)行具身“小腦”構(gòu)成。
其中,“大腦”具備自然交互、空間感知、意圖理解、分層規(guī)劃和錯(cuò)誤反思等能力,“小腦”分為具身操作和具身運(yùn)控兩個(gè)子平臺(tái):具身操作涵蓋元技能庫、泛化抓取、技能拆解和錯(cuò)誤處理等功能,而具身運(yùn)控負(fù)責(zé)實(shí)現(xiàn)全身控制、雙臂協(xié)作、穩(wěn)定行走和移動(dòng)導(dǎo)航等任務(wù)。
由具身“大腦”進(jìn)行任務(wù)規(guī)劃,再調(diào)用具身“小腦”技能庫執(zhí)行具體動(dòng)作,并將執(zhí)行反饋傳遞給具身“大腦”,形成任務(wù)閉環(huán)。
基于高效協(xié)同的具身“大腦”與具身“小腦”架構(gòu),“慧思開物”可以精準(zhǔn)解析自然語言交互指令,通過多模態(tài)信息融合與上下文理解,將復(fù)雜任務(wù)分解為可執(zhí)行的子任務(wù)序列,并在任務(wù)執(zhí)行過程中實(shí)時(shí)監(jiān)測(cè)狀態(tài),通過自適應(yīng)糾錯(cuò)機(jī)制和動(dòng)態(tài)路徑規(guī)劃,確保任務(wù)的高效推進(jìn)與準(zhǔn)確完成。
同時(shí),“慧思開物”內(nèi)置多場(chǎng)景適配引擎,支持從工業(yè)制造到家庭服務(wù)等多種場(chǎng)景,結(jié)合高效的資源調(diào)度與并行計(jì)算能力,能夠精準(zhǔn)滿足特定場(chǎng)景下的工作節(jié)拍與精度標(biāo)準(zhǔn),為機(jī)器人在復(fù)雜場(chǎng)景的應(yīng)用提供可靠的技術(shù)保障。
“現(xiàn)在慧思開物的技能庫中已經(jīng)具備了30多種技能,可以覆蓋大部分的任務(wù)類型。”創(chuàng)新中心CTO唐劍表示,整個(gè)端側(cè)運(yùn)動(dòng)控制的輸出功率為200赫茲,可以讓機(jī)器人的整個(gè)運(yùn)動(dòng)非常平滑。
而在人形機(jī)器人的數(shù)據(jù)訓(xùn)練方面,目前業(yè)界主流的訓(xùn)練方式有兩種。其一,是讓機(jī)器人在仿真環(huán)境中訓(xùn)練,然后將訓(xùn)練結(jié)果遷移到真實(shí)環(huán)境中;其二,則是讓機(jī)器人直接在真實(shí)環(huán)境中訓(xùn)練,根據(jù)真實(shí)環(huán)境的訓(xùn)練過程進(jìn)行AI的直接調(diào)教。
宇樹科技創(chuàng)始人曾向鈦媒體表示,隨著端到端的AI模型進(jìn)一步完善,仿真數(shù)據(jù)對(duì)于人形機(jī)器人將不再重要。而在與創(chuàng)新中心的交流中,唐劍則向鈦媒體表示,他們更傾向于虛實(shí)結(jié)合的數(shù)據(jù)訓(xùn)練方式。
![]()
“我們一貫堅(jiān)持虛實(shí)結(jié)合的訓(xùn)練,才能達(dá)到最好的效果。”唐劍稱,在虛擬環(huán)境中能夠非常好地去泛化和隨機(jī)化場(chǎng)景,比如改變環(huán)境光線、物體形狀、顏色等。而在實(shí)際場(chǎng)景中,這些多樣性并不容易實(shí)現(xiàn)。
根據(jù)創(chuàng)新中心提供的數(shù)據(jù),當(dāng)混合數(shù)據(jù)比例達(dá)到真機(jī)數(shù)據(jù):仿真數(shù)據(jù)為100:400時(shí),機(jī)器人的執(zhí)行成功率接近100%。
基于虛實(shí)結(jié)合的訓(xùn)練模式和以技能庫為核心的運(yùn)動(dòng)執(zhí)行方式,“慧思開物”此次也展示了工業(yè)分揀、積木搭建、桌面清理和物流打包四個(gè)場(chǎng)景的真機(jī)操作。通過語音交互、APP直連等多種方式,用戶能夠與機(jī)器人自然交互,并通過模糊指令讓機(jī)器人完成操作任務(wù)。
在工業(yè)分揀任務(wù)中,通過“慧思開物”APP直連,UR-5e機(jī)械臂能夠精準(zhǔn)解析語音指令,將復(fù)雜的技術(shù)能力(如推理、規(guī)劃、技能調(diào)用)封裝為簡(jiǎn)單易用的操作流程,并通過雙臂協(xié)同的方式完成分揀操作,顯著降低了用戶使用門檻。
同時(shí),平臺(tái)支持自定義模型和技能的快速添加,能夠靈活適配不同場(chǎng)景的應(yīng)用需求,為工業(yè)自動(dòng)化領(lǐng)域提供便捷、高效的解決方案。
在積木搭建中,“慧思開物”通過大模型思維鏈能力,首次實(shí)現(xiàn)了復(fù)雜任務(wù)的智能化拆解與執(zhí)行。基于隨機(jī)搭建的積木樣例,“天工”利用視覺大模型(VLM)對(duì)樣例進(jìn)行拆解,精確規(guī)劃每一層的搭建順序,準(zhǔn)確拾取相應(yīng)積木,并按次序完成了3層積木的毫米級(jí)精準(zhǔn)搭建。
![]()
在桌面清理場(chǎng)景中,人形機(jī)器人“天工”展現(xiàn)了雙臂協(xié)作的高效性與動(dòng)態(tài)環(huán)境下的自適應(yīng)能力,流暢地整理桌面餐具,將垃圾收進(jìn)錫紙盤并放入垃圾桶。整個(gè)過程中,機(jī)器人在多次任意隨機(jī)的人為打斷和移位干擾的情況下,仍能自主糾錯(cuò)、重新規(guī)劃并完成任務(wù)。
在物流打包場(chǎng)景,基于“慧思開物”平臺(tái),“天工PRO”首次實(shí)現(xiàn)了全尺寸人形機(jī)器人物流打包全流程的自主作業(yè)。
通過上半身29個(gè)自由度的配合,“天工PRO”使用左右手分別拿起物品和掃碼槍,通過頭部相機(jī)確認(rèn)物品條形碼位置,雙手協(xié)同完成掃碼、裝箱、封箱及粘貼快遞標(biāo)簽等一系列操作。
“目前,創(chuàng)新中心正在將這些能力逐步實(shí)現(xiàn)商業(yè)化落地。”唐劍稱,現(xiàn)在主要探索的方向?yàn)榻逃蒲小⒔】叼B(yǎng)老、特種作業(yè)以及工業(yè)制造。(本文首發(fā)于鈦媒體APP,作者 | 饒翔宇 編輯 | 鐘毅)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
平臺(tái)由“大腦”和“小腦”構(gòu)成,分工明確,感覺能處理超復(fù)雜任務(wù)!
數(shù)據(jù)驅(qū)動(dòng)的具身“小腦”,是不是意味著機(jī)器人能更靈活應(yīng)對(duì)情況?
感覺這平臺(tái)能讓機(jī)器人走進(jìn)更多普通人的生活,太期待了!
桌面清理場(chǎng)景展示,體現(xiàn)了平臺(tái)在日常應(yīng)用方面的實(shí)用性!
這具身智能平臺(tái)聽起來超厲害,把復(fù)雜技能拆分,開發(fā)難度降了好多!
積木搭建場(chǎng)景展示出平臺(tái)在精細(xì)操作方面的強(qiáng)大能力,太驚艷了!
降低開發(fā)門檻這一點(diǎn)太贊,能讓更多人投身機(jī)器人研發(fā)領(lǐng)域了!
特種作業(yè)用這機(jī)器人,能幫工作人員解決不少危險(xiǎn)困難任務(wù)呢!
把復(fù)雜任務(wù)拆成技能模塊,開發(fā)人員能更有針對(duì)性地優(yōu)化了!
有了“慧思開物”,不同形態(tài)機(jī)器人適配更簡(jiǎn)單,應(yīng)用場(chǎng)景要拓寬了!