當(dāng)OpenClaw將AI帶入自主接管本地電腦時(shí)代,Agent接管所有終端的日子便已經(jīng)開(kāi)啟了降臨倒計(jì)時(shí)。而另一方面,OpenClaw的“具身化”——即對(duì)于物理AI世界的影響也迅速成為行業(yè)熱議的新課題。
2026年2月,ClawCon 2026(OpenClaw全球首場(chǎng)線(xiàn)下聚會(huì))上,OpenClaw展示了直控人形機(jī)器人的能力,搭載OpenClaw的“龍蝦頭”人形機(jī)器人在人群中自主移動(dòng)、與觀(guān)眾揮爪互動(dòng),并能檢測(cè)啤酒庫(kù)存和自動(dòng)下單。這一突破驗(yàn)證了OpenClaw的具身化潛力——無(wú)需專(zhuān)門(mén)軟件或算法,通過(guò)“日常對(duì)話(huà)”即可控制機(jī)器人。
而幾乎同時(shí),國(guó)內(nèi)的空間智能公司宸境科技(DeepMirror)也官宣將OpenClaw融入其核心物理AI產(chǎn)品,并接入宇樹(shù)科技(Unitree)的機(jī)器人軟件中間件,通過(guò)OpenClaw的推理能力與機(jī)器人底層控制系統(tǒng)的聯(lián)動(dòng),實(shí)現(xiàn)了“感知—理解—規(guī)劃—執(zhí)行”的完整閉環(huán)。據(jù)宸境科技介紹,該系統(tǒng)重點(diǎn)面向園區(qū)巡檢、安防管理、倉(cāng)儲(chǔ)協(xié)作等場(chǎng)景,公司也計(jì)劃通過(guò)技能模塊(Skills)機(jī)制,持續(xù)拓展機(jī)器人在不同場(chǎng)景中的應(yīng)用能力。
而站在這一事件背后的宸境科技,正是全球第一家提出空間智能(Spatial Intelligence)概念的公司。成立于2019年的宸境科技,至今已獲得共計(jì)5輪數(shù)億美元的融資,股東名單涵蓋火山石投資、OPPO、斯道資本、廣汽集團(tuán)、IDG資本、臨港科創(chuàng)等一眾知名機(jī)構(gòu)。創(chuàng)始人胡聞曾任李澤湘教授旗下工業(yè)機(jī)器人公司——李群自動(dòng)化的CFO,后任小馬智行COO。而宸境科技的整個(gè)高管團(tuán)隊(duì)更是充斥著谷歌Xlab、奧賽金牌、清華姚班、麻省理工等一眾豪華標(biāo)簽。
以“空間智能”為核心技術(shù)脈絡(luò)的宸境科技,經(jīng)過(guò)了AR/VR和元宇宙風(fēng)口的起起伏伏,終于迎來(lái)了今天具身智能賽道的爆發(fā)。在率先實(shí)現(xiàn)OpenClaw的具身化嘗試之際,我們有幸與宸境科技創(chuàng)始人胡聞進(jìn)行了一場(chǎng)深度對(duì)話(huà),不僅還原了這一技術(shù)整合的幕后細(xì)節(jié),更拆解了宸境科技在具身智能時(shí)代的核心布局與戰(zhàn)略思考。
▎以下為與胡聞的對(duì)話(huà)全文,略有刪減:
當(dāng)OpenClaw接管具身智能
創(chuàng)投家:OpenClaw對(duì)于具身智能到底意味著什么?
胡聞:它意味著具身智能從特殊用途設(shè)備向通用智能體的范式轉(zhuǎn)移的開(kāi)始,是機(jī)器人領(lǐng)域的操作系統(tǒng)級(jí)變革。如果說(shuō)之前的機(jī)器人像功能機(jī),由硬件定義行為,OpenClaw的接入則讓它變成了智能機(jī),由軟件定義行為。
具體體現(xiàn)在以下兩個(gè)方面:
第一,賦予機(jī)器人常識(shí)與推理。傳統(tǒng)機(jī)器人依賴(lài)預(yù)設(shè)的規(guī)則,而OpenClaw接入了大模型,讓機(jī)器人擁有對(duì)物理世界的常識(shí)性理解。例如機(jī)器狗不再只是執(zhí)行走到A點(diǎn)的指令,而是能理解現(xiàn)在是下午3點(diǎn),人少,先去檢查消防通道這樣的復(fù)雜邏輯。
第二,構(gòu)建感知-理解-規(guī)劃-執(zhí)行的完整閉環(huán)。它作為軟件基礎(chǔ)設(shè)施,打通了云端智能與物理執(zhí)行層,讓機(jī)器人成為真正自主的物理AI Agent。
創(chuàng)投家:OpenClaw是如何接管機(jī)器人的?
胡聞:接管的核心邏輯是一致的。OpenClaw充當(dāng)了大腦(大模型)與身體(硬件)之間的操作系統(tǒng)。
可以把接管電腦理解為接入機(jī)器人的MVP。接管電腦其實(shí)是接管數(shù)字世界。OpenClaw通過(guò)在本地運(yùn)行一個(gè)常駐的Gateway Daemon來(lái)接管電腦。這個(gè)進(jìn)程擁有對(duì)操作系統(tǒng)的極高權(quán)限,它通過(guò)看屏幕截圖、點(diǎn)鼠標(biāo)、敲鍵盤(pán)來(lái)操作一切應(yīng)用,本質(zhì)是在模擬人類(lèi)操作。
而接入機(jī)器人是接管物理世界,邏輯是一致的。OpenClaw接入宇樹(shù)機(jī)器人的軟件中間件,將Gateway發(fā)出的指令,如向前走或者抓取,翻譯成機(jī)器人的底層運(yùn)動(dòng)控制信號(hào),同時(shí)將傳感器數(shù)據(jù)——例如攝像頭、觸覺(jué)傳感器——回傳給大腦進(jìn)行多模態(tài)理解和分析。
創(chuàng)投家:接管之后有什么具體的變化?
胡聞:目前達(dá)到了初步自主智能的水平,在特定場(chǎng)景下表現(xiàn)得挺不錯(cuò)。
我們?cè)诤贾菖R平區(qū)藝尚小鎮(zhèn)落地了一個(gè)物理AI的場(chǎng)景。在園區(qū)機(jī)器狗巡檢和導(dǎo)覽的場(chǎng)景中,我們不需要再去用Pad指揮機(jī)器狗去到具體的A點(diǎn),只需要通過(guò)語(yǔ)音傳達(dá)模糊的指令,例如這位游客渴了,麻煩帶他去買(mǎi)瓶可樂(lè),機(jī)器狗會(huì)自主理解并引領(lǐng)游客去自動(dòng)販賣(mài)機(jī)。
同時(shí),機(jī)器人不僅僅能夠通過(guò)實(shí)時(shí)感知做決策,還能根據(jù)時(shí)間、人流量動(dòng)態(tài)調(diào)整路線(xiàn)和優(yōu)先級(jí)。它能在沒(méi)有人類(lèi)明確指示的情況下,自主決定先完成高優(yōu)先級(jí)的任務(wù)。
創(chuàng)投家:OpenClaw接管物理AI引發(fā)的潛在風(fēng)險(xiǎn)是否會(huì)比接管個(gè)人電腦更嚴(yán)重?
胡聞:這點(diǎn)確實(shí)有爭(zhēng)議。因?yàn)閿?shù)字世界的錯(cuò)誤可以通過(guò)修改數(shù)據(jù)修正,而物理世界的錯(cuò)誤更加麻煩。
接管電腦引發(fā)的爭(zhēng)議——如誤刪郵件等——主要集中在隱私和財(cái)產(chǎn)安全。當(dāng)OpenClaw接入機(jī)器人后,爭(zhēng)議將觸及物理安全,包括對(duì)人和物損害、控制相對(duì)滯后、接管不及時(shí)以及責(zé)任界定的模糊性。這也是無(wú)人系統(tǒng)需要長(zhǎng)期解決的問(wèn)題。
創(chuàng)投家:現(xiàn)在就開(kāi)始探索OpenClaw的接管,對(duì)于整個(gè)行業(yè)來(lái)說(shuō),是否還是過(guò)早了?
何佳:從技術(shù)成熟度看有點(diǎn)早,但從產(chǎn)業(yè)探索的規(guī)律看,現(xiàn)在必要開(kāi)始做了。這是一個(gè)應(yīng)用倒逼技術(shù)的典型階段。
如果等所有數(shù)據(jù)訓(xùn)練完美再行動(dòng),就會(huì)錯(cuò)失寶貴的真實(shí)世界反饋。OpenClaw的接入,本質(zhì)上是讓機(jī)器人在真實(shí)環(huán)境中去獲取那些仿真環(huán)境里永遠(yuǎn)無(wú)法生成的長(zhǎng)尾數(shù)據(jù)和corner cases。這個(gè)接入方式讓大家開(kāi)始重寫(xiě)下一代操作系統(tǒng),也就是真正的AI系統(tǒng)的規(guī)則。
空間智能:世界模型的底層infra
創(chuàng)投家:宸境科技是如何定義空間智能的?
胡聞:宸境科技對(duì)空間智能的定義是通過(guò)將世界模型與高精度空間感知硬件相結(jié)合,鏈接空間、場(chǎng)景、數(shù)據(jù)和用戶(hù),構(gòu)建了一個(gè)從物理信號(hào)輸入到行為決策輸出的全鏈路閉環(huán)。其目標(biāo)是讓機(jī)器人像人類(lèi)一樣,憑直覺(jué)在復(fù)雜多變的真實(shí)世界中穩(wěn)定工作,最終成為物理任務(wù)的標(biāo)準(zhǔn)化感知規(guī)劃一體的空間數(shù)字基礎(chǔ)設(shè)施 。
創(chuàng)投家:宸境科技是如何完成從AR/VR、元宇宙等概念轉(zhuǎn)型到具身智能領(lǐng)域的?
胡聞:其實(shí)宸境科技一直堅(jiān)持的是空間智能,我們也是全球第一個(gè)提出空間智能和Spatial Intelligence的公司。AR/VR、元宇宙和具身智能都只是本體和場(chǎng)景的遷移。
我們的核心邏輯是將原先為人在數(shù)字世界交互而構(gòu)建的空間智能基礎(chǔ)設(shè)施,移植到機(jī)器人身上,成為物理AI的基礎(chǔ)設(shè)施。
宸境已經(jīng)有多年的技術(shù)積累、場(chǎng)景經(jīng)驗(yàn)、大量的空間數(shù)據(jù)以及強(qiáng)大的研發(fā)和工程能力。從多傳感器前融合、世界模型,包括此次發(fā)布的Insight空間相機(jī)、TinyNav算法庫(kù)和RoboSpatial工具鏈,正是這套能力的體現(xiàn)。
創(chuàng)投家:空間智能是否可以理解為世界模型中的一種?
胡聞:準(zhǔn)確地說(shuō),空間智能是世界模型的一個(gè)底層的infra,世界模型的內(nèi)涵更廣。
首先,空間智能是世界模型的必要前提??臻g智能提供了對(duì)三維世界的感知、理解和推理能力,這是構(gòu)建世界模型的基礎(chǔ)。沒(méi)有強(qiáng)大的空間智能,世界模型就會(huì)缺乏對(duì)物理布局、物體尺寸、空間關(guān)系的準(zhǔn)確表征,就像一個(gè)大模型沒(méi)有視覺(jué)能力一樣。李飛飛教授現(xiàn)在也在補(bǔ)齊空間智能的物理層的能力。
其次,世界模型是空間智能的超級(jí)擴(kuò)展。世界模型不僅包含空間(Where/What),還包含時(shí)間(When/Next)、物理規(guī)律(Why/How)乃至常識(shí)(Common Sense)。它需要預(yù)測(cè)如果我推動(dòng)這個(gè)杯子,它會(huì)倒下并碎掉這樣的因果關(guān)系。
我們可以把空間智能理解為靜態(tài)或動(dòng)態(tài)的空間結(jié)構(gòu)理解,而世界模型是基于這種理解對(duì)未來(lái)狀態(tài)的推演。李飛飛教授指出世界模型必須具備生成性、多模態(tài)和交互性,這一點(diǎn)我們的認(rèn)知是一致的。
創(chuàng)投家:目前主流具身企業(yè)會(huì)如何選擇合作的空間算法合作伙伴?
胡聞:主要會(huì)從以下幾個(gè)維度考慮:
第一,魯棒性與精度。算法必須在光照變化、動(dòng)態(tài)干擾、傳感器噪聲下穩(wěn)定輸出位姿和定位,工程化要求非常高。例如Insight相機(jī)具備24g抗震和強(qiáng)光抑制能力,就是為了保證極端工況下的精度。
第二,計(jì)算效率與功耗。具身智能的算力在端側(cè),算法必須輕量。像視覺(jué)token壓縮等,為了在保證性能的同時(shí)降低計(jì)算消耗。端側(cè)10TOPS的算力內(nèi)閉環(huán)處理也是關(guān)鍵。
第三,泛化能力。算法不能僅在一個(gè)實(shí)驗(yàn)室好用,換一個(gè)場(chǎng)景就失靈。這就需要算法本身具備對(duì)未知環(huán)境的適應(yīng)性,而世界模型正是通過(guò)合成無(wú)限多樣的數(shù)據(jù)來(lái)提升這種泛化性。
第四,特定場(chǎng)景的數(shù)據(jù)積累,這一點(diǎn)是護(hù)城河。其中包括數(shù)據(jù)的場(chǎng)景特異性——通用的預(yù)訓(xùn)練模型無(wú)法理解特定工廠(chǎng)的消防通道在哪、特定倉(cāng)庫(kù)的貨架布局有何異常。只有長(zhǎng)期在特定場(chǎng)景運(yùn)行,積累該場(chǎng)景的空間先驗(yàn),才能實(shí)現(xiàn)精準(zhǔn)決策。同時(shí)包括結(jié)構(gòu)化知識(shí)庫(kù)——單純的3D點(diǎn)云不夠,需要將其轉(zhuǎn)化為帶語(yǔ)義的空間知識(shí)庫(kù)。RoboSpatial平臺(tái)的作用正是將環(huán)境信息結(jié)構(gòu)化存儲(chǔ)并智能調(diào)用。
創(chuàng)投家:宸境科技在數(shù)據(jù)采集上有什么獨(dú)特的護(hù)城河?
胡聞:數(shù)采也是我們的亮點(diǎn)。
第一是協(xié)同式采集。我們有個(gè)強(qiáng)大的平臺(tái),支持多設(shè)備——包括專(zhuān)有的采集設(shè)備、手機(jī)、平板、眼鏡以及Looper相機(jī)——的多位姿協(xié)同采集。這種方式能極大提高采集效率,并且通過(guò)多視角融合,構(gòu)建出的數(shù)據(jù)集更完整、精度更高,這也是我們?cè)缙诘暮诵哪芰Α?/p>
第二是同步技術(shù)。為了解決多傳感器數(shù)據(jù)不同步、數(shù)據(jù)不同源的痛點(diǎn),我們實(shí)現(xiàn)了多攝像頭(也可以加上激光雷達(dá))的硬件級(jí)時(shí)間同步與方位對(duì)齊。這種傳感器前融合級(jí)別的采集,保證了生成的點(diǎn)云與RGB圖像是像素級(jí)對(duì)齊的,為后續(xù)的AI訓(xùn)練提供了高質(zhì)量數(shù)據(jù)。
第三是自動(dòng)化AI構(gòu)建。在采集到原始數(shù)據(jù)后,利用AI自動(dòng)進(jìn)行三維重建、feature獲取和語(yǔ)義分割,形成結(jié)構(gòu)化的數(shù)據(jù)集。
關(guān)于2026
創(chuàng)投家:您對(duì)宸境科技的2026年有怎樣的期待?
胡聞:宸境科技希望今年沖刺港股,現(xiàn)在最關(guān)注的是技術(shù)領(lǐng)先性、產(chǎn)品商業(yè)化能力以及頭部企業(yè)合作。
具體的戰(zhàn)略規(guī)劃包括:
第一,全面進(jìn)軍具身智能的數(shù)個(gè)產(chǎn)品發(fā)布。1月正式發(fā)布具身智能品牌LooperRobotics,推出Insight相機(jī)、TinyNav算法、RoboSpatial平臺(tái)三大產(chǎn)品,定位為機(jī)器人提供標(biāo)準(zhǔn)化眼睛和感知規(guī)劃的底座。第三季度還有一個(gè)大的產(chǎn)品發(fā)布會(huì)。
第二,深化產(chǎn)業(yè)合作。聯(lián)合宇樹(shù)科技開(kāi)展行業(yè)解決方案,并與地瓜機(jī)器人等生態(tài)伙伴深度合作。
第三,推動(dòng)技術(shù)落地。重點(diǎn)面向園區(qū)巡檢、安防管理、倉(cāng)儲(chǔ)協(xié)作等場(chǎng)景,提升機(jī)器人在復(fù)雜場(chǎng)景中的感知和自主決策能力,強(qiáng)化快速集成和部署能力。
第四,構(gòu)建開(kāi)源生態(tài)。TinyNav定位為開(kāi)源機(jī)器人導(dǎo)航系統(tǒng),通過(guò)降低開(kāi)發(fā)者門(mén)檻來(lái)構(gòu)建生態(tài)。
寫(xiě)在最后:
從全球第一個(gè)提出空間智能概念,到第一個(gè)完成OpenClaw對(duì)宇樹(shù)機(jī)器人的接入,宸境科技身體力行地證明了一件事:風(fēng)口的遷移和變化,掩蓋不了良好的技術(shù)傳承與不斷突破創(chuàng)新的堅(jiān)持。在這個(gè)技術(shù)飛速迭代的時(shí)代,每一天都有可能誕生改變行業(yè)格局和公司命運(yùn)的契機(jī)。在具身智能的舞臺(tái)上,不僅有耀眼的新生代整機(jī)廠(chǎng),更有一批終于等到能將自身長(zhǎng)年的技術(shù)積累施展落地的“前輩”。
對(duì)于宸境科技而言,收獲的季節(jié)或許才剛剛開(kāi)始。






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論