來(lái)源:Mimic Robotics
這家公司叫Mimic Robotics,它近日獲得由Elaia和Speedinvest領(lǐng)投的1600萬(wàn)美元種子輪融資,F(xiàn)ounderful、1st Kind、10X Founders、2100以及Sequoia Scout跟投。在2024年5月,它還獲得Founderful領(lǐng)投的250萬(wàn)美元早期融資。
Mimic Robotics成立于2024年,從ETH Zürich(蘇黎世聯(lián)邦理工學(xué)院)Soft Robotics Lab分拆而來(lái),實(shí)驗(yàn)室的核心成員Stefan Weirich(CEO)、Elvis Nava(CTO)、Stephan-Daniel Gravert(CPO)、Benedek Forrai (首席科學(xué)家)擔(dān)任公司的聯(lián)合創(chuàng)始人,實(shí)驗(yàn)室負(fù)責(zé)人Robert Katzschmann教授是公司的聯(lián)合創(chuàng)始人兼首席顧問(wèn)。
Mimic Robotics的創(chuàng)始團(tuán)隊(duì),來(lái)源:Mimic Robotics
在通用具身模型出現(xiàn)之前,機(jī)器人的大部分領(lǐng)域被特設(shè)(ad-hoc)的方法所主導(dǎo),這些方法是針對(duì)特定任務(wù)的,它們有足夠高的精度和不錯(cuò)的魯棒性,但是只能解決單一任務(wù)。例如,它們需要多個(gè)獨(dú)立的組件來(lái)解決路徑規(guī)劃、碰撞避免、物體檢測(cè)、狀態(tài)估計(jì)和應(yīng)用邏輯等問(wèn)題。很顯然,它們不具有通用性。同時(shí),讓整個(gè)系統(tǒng)具有高可靠性和商業(yè)可行性,也相對(duì)困難。
例如,傳統(tǒng)的機(jī)器人手,是專(zhuān)為特定的重復(fù)性任務(wù)而設(shè)計(jì),缺乏靈活性。其編程過(guò)程耗時(shí)且需要專(zhuān)業(yè)知識(shí),導(dǎo)致它們難以適應(yīng)需要機(jī)器人配合人類(lèi)專(zhuān)用工具和工作流程的動(dòng)態(tài)環(huán)境。
Mimic Robotics團(tuán)隊(duì),押注于具身智能在行為上的端到端深度學(xué)習(xí)模型(也可稱(chēng)為大行為模型),相比由多個(gè)獨(dú)立組件組成的復(fù)雜系統(tǒng),它可以理解為一個(gè)將RGB圖像和本體感覺(jué)讀數(shù)映射到機(jī)器人動(dòng)作的單一端到端模型。這使得學(xué)習(xí)大量不同的操作任務(wù)變成了一個(gè)數(shù)據(jù)擴(kuò)展問(wèn)題,而不是一系列特設(shè)的工程問(wèn)題。
但是從計(jì)算規(guī)模和數(shù)據(jù)的質(zhì)和量來(lái)說(shuō),通用具身智能模型的發(fā)展水平,相比大語(yǔ)言模型,還要落后5年左右,當(dāng)然,這也給了初創(chuàng)公司在基礎(chǔ)模型層面進(jìn)行競(jìng)爭(zhēng)的機(jī)會(huì)。
當(dāng)然,現(xiàn)在通用具身智能模型公司的估值水平都已經(jīng)不低,例如Figure,估值已經(jīng)390億美元,其他如Skild AI和Physical Intelligence也估值數(shù)十億美元。
Mimic Robotics專(zhuān)注在機(jī)器人的“操作”(manipulation)能力,因?yàn)闊o(wú)論其余的機(jī)器人系統(tǒng)是什么樣子(無(wú)論是固定工作站、輪式機(jī)器人、四足機(jī)器人還是人形機(jī)器人),“操作”都是實(shí)現(xiàn)機(jī)器人廣泛經(jīng)濟(jì)影響的關(guān)鍵。
具體來(lái)說(shuō):Mimic Robotics構(gòu)建能無(wú)縫融入人類(lèi)工作場(chǎng)所的靈巧機(jī)械手,并用端到端的基礎(chǔ)AI模型來(lái)驅(qū)動(dòng)它們,使得這些機(jī)械手能夠執(zhí)行通用的技能,簡(jiǎn)單的工業(yè)和物流拾取放置,到配套、食品制備,甚至是服務(wù)和護(hù)理。
通用具身智能模型,其原生數(shù)據(jù)格式是“機(jī)器人遙操作數(shù)據(jù)”,以往的數(shù)據(jù)獲取方式是部署大量機(jī)器人,雇傭機(jī)器人操作員,并獲取大量的機(jī)器人軌跡和攝像頭畫(huà)面數(shù)據(jù),以便通過(guò)模仿學(xué)習(xí)來(lái)訓(xùn)練模型。
但是通用模型,其模型能力的好壞,大半倒要決定于數(shù)據(jù)的數(shù)量和質(zhì)量,此前的數(shù)據(jù)獲取方式,保證了數(shù)據(jù)質(zhì)量,但鑒于通用具身智能模型的Scaling Law已經(jīng)一定程度上被驗(yàn)證(參看我們此前關(guān)于Generalist的文章),模型對(duì)于數(shù)據(jù)量的需求幾乎是無(wú)限的,若長(zhǎng)期依賴昂貴的物理機(jī)器人人工數(shù)據(jù)收集,成本很難控制,必然遇到瓶頸。
Mimic Robotics采取的方法是讓工廠工人戴上能夠捕捉他們執(zhí)行日常任務(wù)時(shí)詳盡數(shù)據(jù)的手套,這些數(shù)據(jù)隨后被用于訓(xùn)練具身智能模型,確保Mimic的機(jī)械手能夠復(fù)現(xiàn)人類(lèi)的操作手法,包括對(duì)工作環(huán)境的變化做出反應(yīng)。同時(shí),它們用現(xiàn)在可以低成本獲取的海量第一人稱(chēng)人類(lèi)視頻數(shù)據(jù)上進(jìn)行訓(xùn)練。保證了數(shù)據(jù)的數(shù)量,同時(shí)控制了成本。
前文提到,Mimic Robotics構(gòu)建能無(wú)縫融入人類(lèi)工作場(chǎng)所的靈巧機(jī)械手,一方面因?yàn)槿祟?lèi)的手和機(jī)器人手之間的“具身差距”(embodiment gap)遠(yuǎn)小于人類(lèi)手和雙指夾具機(jī)器人之間的差距,另一方面,也因?yàn)閷?duì)于它們專(zhuān)注的機(jī)器人的“操作”能力來(lái)說(shuō),靈巧機(jī)械手是最佳載體。
不過(guò)Mimic Robotics并沒(méi)有一開(kāi)始就走人形機(jī)器人的路線,甚至沒(méi)有自己生產(chǎn)機(jī)器人的手臂;他們是市面上已廣泛銷(xiāo)售的機(jī)械臂,并制造自己的機(jī)械手與之連接。
這樣做的好處首先在于降低了他們的開(kāi)發(fā)和生產(chǎn)的成本,另一方面,使用市售的機(jī)械臂可以讓他們無(wú)縫接入到這些機(jī)械臂原來(lái)就有的場(chǎng)景里,并且做得更好。
Mimic聯(lián)合創(chuàng)始人Elvis Nava(CTO)表示:“用市售機(jī)械臂加我們的機(jī)械手結(jié)合,可以更快的切入市場(chǎng),解決行業(yè)目前急需解決的問(wèn)題,即完成那些原來(lái)需要人類(lèi)完成的工作,而且即插即用。我們已經(jīng)完成了一個(gè)主要技術(shù)里程碑,就是從實(shí)驗(yàn)室驗(yàn)證技術(shù),轉(zhuǎn)變?yōu)闃?gòu)建能夠大規(guī)模執(zhí)行客戶任務(wù)的產(chǎn)品化機(jī)械手。”
憑借其解決方案,mimic旨在服務(wù)零售、物流和制造業(yè)中固定工位的體力勞動(dòng)市場(chǎng),這些行業(yè)在歐洲面臨嚴(yán)重的勞動(dòng)力短缺,且許多任務(wù)對(duì)工人來(lái)說(shuō)枯燥重復(fù)。
根據(jù)Grand View Research最近的研究,2024年全球工業(yè)機(jī)器人市場(chǎng)規(guī)模為339億美元,并預(yù)測(cè)其年增長(zhǎng)率將接近10%,到2030年將達(dá)到605億美元。
目前,Mimic正與歐洲大型制造和汽車(chē)公司合作開(kāi)展多個(gè)試點(diǎn)項(xiàng)目,在裝配線和包裝環(huán)節(jié)測(cè)試其技術(shù),其機(jī)械臂+機(jī)械手的全面商業(yè)部署將在未來(lái)一到兩年內(nèi)開(kāi)始。
進(jìn)入全面商業(yè)部署后,Elvis Nava表示,Mimic將采取兩種定價(jià)模式。主流的是提供“機(jī)器人即服務(wù)”訂閱,這降低了采用門(mén)檻,并能讓客戶從第一個(gè)月起就看到運(yùn)營(yíng)成本的節(jié)省。
他還補(bǔ)充說(shuō),達(dá)到一定規(guī)模的一些客戶不喜歡運(yùn)營(yíng)支出模式,因此Mimic也會(huì)將機(jī)器人工作站直接出售給他們,并收取持續(xù)的服務(wù)等級(jí)協(xié)議(SLA)費(fèi)用和軟件訂閱費(fèi)。
具身智能機(jī)器人要走向?qū)嵱没呦蚱占?,目前還面臨眾多卡點(diǎn)。在硬件方面,就有感知(視覺(jué),聽(tīng)覺(jué),觸覺(jué)),移動(dòng)能力(雙足、四足、輪式),操作能力(手臂,靈巧手),續(xù)航能力,以及成本控制;在軟件/智能方面,有指令理解能力,對(duì)物理規(guī)則的遵循,控制算法,通用泛化能力與魯棒性的平衡,當(dāng)然,還有作為基石的數(shù)據(jù)。
要讓具身智能機(jī)器人走向普及,需要的是產(chǎn)業(yè)鏈上所有環(huán)節(jié)的共同進(jìn)步,無(wú)論是軟件還是硬件,無(wú)論是模型還是機(jī)械手。
但這需要一個(gè)過(guò)程,就像新能源智能汽車(chē)的產(chǎn)業(yè)鏈,經(jīng)過(guò)了多年的共同發(fā)展,在能源(純電、插電、增程)、車(chē)體、車(chē)內(nèi)舒適性、智能化上都有長(zhǎng)足進(jìn)步,才迎來(lái)了近幾年的整體爆發(fā)。
當(dāng)然,對(duì)于具身智能行業(yè),通用智能(模型)的進(jìn)化是核心,但是推動(dòng)具身通用智能的進(jìn)化,并不像LLM那樣容易,因?yàn)樽鳛槲锢鞟I的通用智能,它的維度要更加復(fù)雜,所以整個(gè)具身智能機(jī)器人各個(gè)部位的整體突破才顯得更重要,因?yàn)閱蝹€(gè)部位的突破,比如機(jī)械手-操作能力,只要它進(jìn)入應(yīng)用,創(chuàng)造價(jià)值,積累數(shù)據(jù),也是能夠反復(fù)通用智能的。
中國(guó)市場(chǎng)擁有全球最完備的具身智能硬件產(chǎn)業(yè)鏈之一,在成本控制上更是全球領(lǐng)先,同時(shí)也擁有豐富的應(yīng)用落地場(chǎng)景,中國(guó)在具身智能產(chǎn)業(yè)鏈上各個(gè)領(lǐng)域的創(chuàng)業(yè)者們,都有機(jī)會(huì)做到世界前列。
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論