近期,一款名為Mobile ALOHA的機(jī)器人因其出色的烹飪和家務(wù)技能在網(wǎng)絡(luò)上迅速走紅。
視頻中的機(jī)器人外觀較為基礎(chǔ),主要由兩只機(jī)械臂、提供運(yùn)算能力的主機(jī)以及底部移動(dòng)平臺(tái)構(gòu)成。從整體上看,這款機(jī)器人尚處于初級(jí)階段,更像是一個(gè)粗糙的“原型機(jī)”。與我們?cè)诳苹米髌分锌吹降?ldquo;機(jī)器人管家”相比,它還有很大的提升空間。盡管如此,這款機(jī)器人的潛力卻不容小覷。
此前也有不少服務(wù)機(jī)器人展示過烹飪、攙扶、地面清潔等能力,為何說Mobile ALOHA的潛力很大呢?主要原因是它擁有便宜且開源這兩個(gè)特點(diǎn)。換句話說,只要你花費(fèi)32000美元(約23萬元)且動(dòng)手與學(xué)習(xí)能力足夠強(qiáng)的話,就能自己在家復(fù)刻一臺(tái)具備這些技能的機(jī)器人。
![]()
開發(fā)出Mobile ALOHA的斯坦福三人組
這個(gè)由斯坦福三人團(tuán)隊(duì)研發(fā)的通用機(jī)器人Mobile ALOHA,可以通過模仿學(xué)習(xí),執(zhí)行各種復(fù)雜的任務(wù)。同時(shí)在操控層面,除了可以自主操作外,還可以支持全身遠(yuǎn)程操控。
從機(jī)器人發(fā)展的整體方向來看,可以被簡(jiǎn)單劃分為專用機(jī)器人和通用機(jī)器人兩類,前者主要聚焦于提升單一場(chǎng)景的生產(chǎn)、干活效率。在日常生活中,人們或多或少都會(huì)接觸到此類產(chǎn)品,像智能工廠里應(yīng)用的各類機(jī)械臂,家里用于清潔地面的掃地機(jī)器人、酒店中用于派送物品的送貨機(jī)器人等,都可以劃分為專用機(jī)器人。
通用機(jī)器人與之相比則擁有更廣泛的適用性,尤其是在“為人提供服務(wù)”的層面,通用機(jī)器人的一大結(jié)構(gòu)特點(diǎn)就是更具“擬人化”特征。因?yàn)樗淖畲笥猛揪褪谴嬗脩羧ネ瓿梢徊糠秩粘9ぷ?,像做家?wù)、做飯等等,所以很多科技公司以及研究機(jī)構(gòu)在產(chǎn)品設(shè)計(jì)之初,就會(huì)將“人形機(jī)器人”作為未來持續(xù)投入的發(fā)展方向。
![]()
WABOT-1
世界上第一個(gè)全尺寸人形“智能”機(jī)器人WABOT-1誕生于1972年,但早期的電機(jī)、驅(qū)動(dòng)程序、算力都很難滿足機(jī)器人的應(yīng)用需求,WABOT-1只是一個(gè)形態(tài)上具備類人特征的產(chǎn)物。2009年,波士頓動(dòng)力開始研發(fā)PETMAN人形機(jī)器人,此后又推出了不斷迭代的Atlas,在整個(gè)21世紀(jì)10年代,它就是受關(guān)注度最高的人形機(jī)器人產(chǎn)品。
2022年,隨著特斯拉首次展示Optimus機(jī)器人,這臺(tái)能走路、能揮手能舉重甚至可以組裝另一個(gè)“自己”的機(jī)器人再次刷新了大眾對(duì)于人形機(jī)器人發(fā)展速度的認(rèn)知。
![]()
CyberOne
除了國(guó)外企業(yè),近兩年國(guó)內(nèi)科技企業(yè)也在加速布局人形機(jī)器賽道,像蒂艾斯科技的exrobots、優(yōu)必選發(fā)布的WALKER X機(jī)器人、小米推出的CyberOne等等。但以上這些機(jī)器人都存在一個(gè)問題,就是它們只屬于“未來”,特斯拉預(yù)計(jì)2030年才會(huì)將Optimus完成大規(guī)模量產(chǎn)并推向市場(chǎng)。
而Mobile ALOHA的出現(xiàn),則開啟了普通人與機(jī)器人接觸的低門檻通道,斯坦福團(tuán)隊(duì)除了在網(wǎng)頁(yè)中展示了Mobile ALOHA所能實(shí)現(xiàn)的能力以外,也完整開源了機(jī)器人的軟硬件所涉及到的各類參數(shù)、資料內(nèi)容,比如機(jī)器人使用的硬件以及具體的參數(shù)信息。
![]()
Mobile ALOHA配備有2個(gè)腕部攝像頭,和1個(gè)頂部攝像頭,并配有移動(dòng)電源和本地計(jì)算模塊,在其自主執(zhí)行時(shí)只使用2個(gè)ViperX 300。兩只手臂的最低/最高高度分別為65厘米/200厘米,并可以從底座向四周最長(zhǎng)能夠伸出100厘米。
算力方面,從視頻中可以看到,Mobile ALOHA的“大腦”其實(shí)是一臺(tái)筆記本電腦,根據(jù)官方公布的資料,其配置為英特爾第十二代酷睿處理器i7-12800H,顯卡則采用了英偉達(dá)RTX3070ti,這套配置放在2024年的市場(chǎng)來看,意味著只需要一臺(tái)8000元左右的游戲本,就能滿足Mobile ALOHA的算力需求。
為了讓機(jī)器人具備更大的活動(dòng)范圍,研發(fā)團(tuán)隊(duì)在組建Mobile ALOHA時(shí)選擇了將AgileX Tracer AGV(Tracer)作為了移動(dòng)底座,這原本是一個(gè)專為倉(cāng)庫(kù)物流設(shè)計(jì)的移動(dòng)平臺(tái),其移動(dòng)速度可以達(dá)到1.6m/s、最大有效載荷為100kg,由于全套資料均為開源,因此在組建過程中,其他人也可以根據(jù)自身需求對(duì)方案做進(jìn)一步的DIY。
除了硬件以外,Mobile ALOHA還通過加入數(shù)據(jù)和視覺的學(xué)習(xí)能力,也就是當(dāng)下比較流行的“大模型”人工智能。Mobile ALOHA的學(xué)習(xí)能力由兩部分組成,包括靜態(tài)ALOHA數(shù)據(jù)集以及基于視覺識(shí)別或手動(dòng)操控獲得“模仿能力”。

目前已經(jīng)開源的靜態(tài)ALOHA數(shù)據(jù)集總共有825個(gè)演示任務(wù),包括密封袋子、拿起叉子、包裝糖果、撕紙巾、打開帶蓋塑料杯、玩乒乓球、使用咖啡機(jī)、翻轉(zhuǎn)鉛筆、固定魔術(shù)貼電纜、裝上電池和操作螺絲刀等等。
演示中,研究人員每個(gè)任務(wù)只用了50個(gè)演示就可以讓Mobile ALOHA機(jī)器人開始學(xué)會(huì)做這件事,比如連續(xù)9次擦拭灑在桌子上的葡萄酒,連續(xù)5次乘坐電梯。最終呈現(xiàn)的整體效果還是不錯(cuò)的,Mobile ALOHA完成了從備菜烹飪到最后清掃收拾的所有環(huán)節(jié)。
鈦媒體App注意到在烹飪環(huán)節(jié),Mobile ALOHA除了可以執(zhí)行切菜的固定動(dòng)作以外,也學(xué)會(huì)了顛勺、擺盤等操作。在收拾的過程中,它既能夠挪動(dòng)對(duì)椅子這樣體積較大且笨重的家具,同時(shí)也能夠?qū)ΡP子這樣體積小且光滑的物品的抓握與清潔,說明作為通用機(jī)器人其場(chǎng)景應(yīng)用空間還是很大的。
那么對(duì)于整個(gè)機(jī)器人產(chǎn)業(yè)來說,Mobile ALOHA也有很大意義,首先是作為開源項(xiàng)目,自然會(huì)吸引到很多企業(yè)以它為基礎(chǔ)藍(lán)本開始探索類似機(jī)器人的商業(yè)落地能力,并且隨著零部件從目前的單獨(dú)采購(gòu)變?yōu)橐?guī)?;?yīng),成品的成本將會(huì)進(jìn)一步降低,進(jìn)而推動(dòng)機(jī)器人的普及化。
同時(shí),Mobile ALOHA也指明了當(dāng)機(jī)械組件不斷成熟后,依靠大模型人工智能為機(jī)器人賦予的學(xué)習(xí)能力,能夠讓機(jī)器人的應(yīng)用潛力得到更快的釋放。
此前斯坦福大學(xué)機(jī)器人實(shí)驗(yàn)室主任、計(jì)算機(jī)科學(xué)教授,IEEE會(huì)士,國(guó)際機(jī)器人研究基金會(huì)主席Oussama Khatib就曾表示:“機(jī)器人面臨新的環(huán)境和新的挑戰(zhàn)之一便是復(fù)雜的環(huán)境帶來的學(xué)習(xí)成本問題,如今機(jī)器人要面對(duì)的是從工廠當(dāng)中走出來,進(jìn)入到實(shí)際復(fù)雜的人類環(huán)境,因此它需要具備人類的智慧。”
而大模型人工智能與日漸成熟的機(jī)器人零部件供應(yīng)體系,顯然讓“機(jī)器人走入普通家庭為大眾服務(wù)”的進(jìn)程得到了加速。(本文首發(fā)鈦媒體App,作者/鄧劍云,編輯/鐘毅)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
這個(gè)工作簡(jiǎn)直是機(jī)器人和人工智能的悲哀,應(yīng)用和技術(shù)都沒有太多創(chuàng)新
不知道幾時(shí)可以大規(guī)模量產(chǎn)
本質(zhì)上用了一個(gè)六自由度機(jī)構(gòu)取代了過去三自由度機(jī)構(gòu)系統(tǒng),把原本簡(jiǎn)單的問題復(fù)雜化了,就只能用一些模仿學(xué)習(xí)來拔高身價(jià)
等什么?上鏈接啊!
據(jù)說,團(tuán)隊(duì)將軟,硬件已全部開源? 機(jī)器臂的時(shí)代真的來了…
這種不行,本質(zhì)是過擬合,換一個(gè)廚房就不行,或者廚房放點(diǎn)菜可能就不行了,不能做到真正的智能,只是一預(yù)設(shè)行為