第一波機(jī)器人“嬰兒潮”已來。
吹拉彈唱、寫詩作畫、做飯?zhí)?、給鞋打膠、給汽車打釘、包裝可樂、搬運(yùn)重物......只有我們想不到的,沒有機(jī)器人做不到的。
在2024年世界機(jī)器人大會上,處于無干擾環(huán)境的機(jī)器人,賣力的展示著自己的才藝,似乎向前來圍觀的人群訴說著,“你看,你們沒白來吧,我們?nèi)诵螜C(jī)器人已經(jīng)進(jìn)展到如此地步,你們?nèi)祟惪梢宰龅氖虑椋覀兌伎梢宰觥?rdquo;
169家參展企業(yè),超過600款展出的產(chǎn)品,包括工業(yè)機(jī)械臂、商用機(jī)器人,還有現(xiàn)在風(fēng)頭正旺的人形機(jī)器人。
與之同時涌來的,是行業(yè)和資本對人形機(jī)器人的關(guān)注。數(shù)據(jù)顯示,截至2024年6月30日,今年國內(nèi)機(jī)器人行業(yè)融資69起,融資總額總計(jì)約在75億元左右,其中融資額超億元的共12起。
在藍(lán)馳創(chuàng)投合伙人曹巍看來,“現(xiàn)在人形機(jī)器人行業(yè)是一個百花齊放的階段,在這個階段,大家會不斷朝著自己認(rèn)為的最好方向做探索。這時多一些創(chuàng)業(yè)公司,多一些選擇空間,對整個生態(tài)是好的。”
對于機(jī)器人能“能動起來”的期望,如同十年前對于自動駕駛的期待。“當(dāng)Google做的自動駕駛小車剛開始在路上跑時,大家都希望它能夠達(dá)到L4或L5級別的自動化,這無疑是一個遙遠(yuǎn)的目標(biāo)。而現(xiàn)在的人形機(jī)器人或具身智能,可能正處在類似自動駕駛早期的階段。”峰瑞資本副總裁顏黔杭向鈦媒體創(chuàng)投家表示。
才剛剛開始,理想主義與現(xiàn)實(shí)主義之間,橫亙著軟硬件交互、生產(chǎn)成本等多方面問題,這似乎是投資人的共識。
“現(xiàn)在行業(yè)整體還處在早期探索階段。雖然大模型為具身智能泛化性優(yōu)勢的實(shí)現(xiàn)了夯實(shí)了基礎(chǔ),但要讓機(jī)器人真正動起來、解決更多實(shí)際問題,需要軟硬件層面很多個環(huán)節(jié)的突破。”在云啟資本合伙人陳昱看來。
綠洲資本董事總經(jīng)理Ivy Li同樣表示:“由于涉及硬件和交互,軟硬件結(jié)合的落地周期通常比純軟件更長,難度也更大。此外,任何硬件產(chǎn)品都面臨成本問題,這對市場推廣和應(yīng)用也有重要影響。”
錯過了具身智能,如同錯過了新能源革命,可是尚處于早期的具身智能賽道到底應(yīng)該如何投資?其中存在的挑戰(zhàn)與落地之間,需要等待多久?細(xì)分賽道之中還有哪些創(chuàng)業(yè)機(jī)會?投資人更偏愛投資哪些具身智能團(tuán)隊(duì)?
鈦媒體創(chuàng)投家對話了4位知名投資人,聊聊他們眼中的具身智能投資:
云啟資本 合伙人 陳昱
云啟資本已投具身智能相關(guān)項(xiàng)目:星塵智能、睿爾曼智能、擎朗智能、松應(yīng)科技、C12.AI
藍(lán)馳創(chuàng)投 合伙人 曹巍
藍(lán)馳創(chuàng)投已投具身智能相關(guān)項(xiàng)目:智元機(jī)器人、銀河通用機(jī)器人
綠洲資本 董事總經(jīng)理 Ivy Li
綠洲資本已投具身智能相關(guān)項(xiàng)目:逐際動力、千尋智能、極殼、縱貫創(chuàng)新
峰瑞資本 副總裁 顏黔杭
峰瑞已投具身智能相關(guān)項(xiàng)目:逐際動力、因時機(jī)器人、源絡(luò)科技、航凱微電子、肇觀電子、covariant、動易科技
鈦媒體:過去一年,幾乎每周都會誕生一家新的人形機(jī)器人公司,如何看待這一波浪潮?我們看到的那些視頻,更多只是炫技,還是離真的落地不遠(yuǎn)了?
陳昱:現(xiàn)在行業(yè)整體還處在早期探索階段。雖然大模型為具身智能泛化性優(yōu)勢的實(shí)現(xiàn)夯實(shí)了基礎(chǔ),但要讓機(jī)器人真正動起來、解決更多實(shí)際問題,需要軟硬件層面很多個環(huán)節(jié)的突破。
基于技術(shù)和成本,短期內(nèi)具身智能不會走進(jìn)千家萬戶,大家現(xiàn)在更多在探索工廠自動化場景的應(yīng)用。比如做柔性生產(chǎn),讓一個機(jī)器人去完成不同工位的操作。往這個方向做的好處是有客戶陪機(jī)器人一起打磨產(chǎn)品和技術(shù),對于具身智能企業(yè)來說也是一種造血方式,能夠活下去,等技術(shù)發(fā)展到一定程度,成本急速下降后,推向更廣闊的市場。
曹巍:現(xiàn)在人形機(jī)器人行業(yè)是一個百花齊放的階段,在這個階段,大家會不斷朝著自己認(rèn)為的最好方向做探索。這時多一些創(chuàng)業(yè)公司,多一些選擇空間,對整個生態(tài)是好的。
但3年到5年后,人形機(jī)器人玩家數(shù)量一定會收縮,完成優(yōu)勝劣汰?,F(xiàn)在大量公司是靠資本輸血養(yǎng)活自己,它們還沒有真正的產(chǎn)品落地能力和商業(yè)化能力。隨著時間的推移,資本市場的熱潮一定會消散。那時,只有能做出好產(chǎn)品的公司,和能真正實(shí)現(xiàn)商業(yè)化落地的團(tuán)隊(duì),才能夠存活下來。
Ivy Li:視頻主要展示了demo團(tuán)隊(duì)在軟硬一體化方面的實(shí)力,但在實(shí)際落地時,需要重點(diǎn)考慮產(chǎn)品市場契合度(PMF),實(shí)現(xiàn)真正的落地仍需一定時間。由于涉及硬件和交互,軟硬件結(jié)合的落地周期通常比純軟件更長,難度也更大。
此外,任何硬件產(chǎn)品都面臨成本問題,這對市場推廣和應(yīng)用也有重要影響。
如果具身智能未來是一個與新能源汽車同等規(guī)模的產(chǎn)業(yè),那么這個產(chǎn)業(yè)足夠容納各類的優(yōu)秀的企業(yè),現(xiàn)在只是剛剛開始而已。
顏黔杭:經(jīng)過學(xué)界、工業(yè)界20多年科研上的探索,當(dāng)下這波人形機(jī)器人浪潮主要有以下幾個驅(qū)動要素,第一是大模型的爆發(fā)推動了機(jī)器人大腦側(cè)的前沿探索,第二是中國過去10年工業(yè)、協(xié)作機(jī)器人的快速發(fā)展形成了完善的機(jī)器人供應(yīng)鏈體系。第三是人形機(jī)器人在控制上引入了AI方法后加速了機(jī)器人運(yùn)動能力的進(jìn)化。所以,這一賽道吸引了AI與智能制造賽道投資人的共同關(guān)注,承接住了AI大模型賽道的熱度的外溢。
從當(dāng)前技術(shù)進(jìn)展來看,目前整體行業(yè)還處于早期技術(shù)研發(fā)迭代階段,距離理想的大規(guī)模的產(chǎn)品化與商業(yè)化還有很長的路。如果將人形機(jī)器人的主要功能拆解為操作和移動,那么,移動能力的落地早于操作,現(xiàn)在人形機(jī)器人已經(jīng)初步展示出基于感知的泛化運(yùn)動能力了。在不少工業(yè)、特種場景,這類足式移動的需求是剛需。當(dāng)下,操作能力在跨任務(wù)場景的泛化上還面臨挑戰(zhàn),未來進(jìn)展有待觀察。
鈦媒體:大模型對于具身智能機(jī)器人的發(fā)展有哪些助力?您認(rèn)為到底什么樣的大模型跟什么樣的機(jī)器人本體結(jié)合才會實(shí)現(xiàn)真正的具身智能?
陳昱:和上一波機(jī)器人相比,具身智能最大的區(qū)別在于AI技術(shù)帶來的泛化性特性。比如,專一功能的機(jī)器人。一個機(jī)器人把一個動作學(xué)好之后,換100個場景都能用,或者在同一個環(huán)境下,可以快速學(xué)習(xí)并執(zhí)行100個動作。這也被業(yè)內(nèi)認(rèn)為是物理世界通往AGI的路徑?;诜夯蕴卣?,這一代機(jī)器人也弱化了對場景的要求。
曹?。?/strong>具身智能機(jī)器人有LLM(Large Language Model)和VLM(Vision Language Model),上層有一個大腦,下層就是執(zhí)行,大腦里面包含了LLM和VLM。我們可以簡單理解為,機(jī)器人的大腦就是長在本體里的,但是它的大腦是非常發(fā)育不良的,可能是算力非常弱的。
簡單粗暴去劃分的話,所有和感知、邏輯、決策相關(guān)的都是大腦,所有和運(yùn)動控制、即時的條件反射相關(guān)的都是小腦。從整個機(jī)器人來看,當(dāng)前的短板更多的是在底層的控制系統(tǒng),不管是運(yùn)動的控制還是精細(xì)化操作的控制,都亟待改進(jìn)。
在大模型的推動下,機(jī)器人在復(fù)雜任務(wù)的串聯(lián)和執(zhí)行上有了大幅度的提升。有了大模型的加持,同樣的算法結(jié)合大模型后,成功率提升了 50%以上,有的甚至提高了 100%,逐漸接近商用水平。這種趨勢讓我們看到未來機(jī)器人的成長空間可以與數(shù)據(jù)結(jié)合,基于數(shù)據(jù)進(jìn)行學(xué)習(xí),數(shù)據(jù)越多表現(xiàn)越好,真正感受到了這種潛力。
我們以工業(yè)機(jī)器人為例,工業(yè)機(jī)器人經(jīng)典的控制架構(gòu)體系是基于編程的(Program-Based),這個技術(shù)體系本身就有一定的柔性和延展性的能力了;如果要跟大模型結(jié)合,只能以分層、多層的方式。當(dāng)遇到一些具體問題的時候,向大模型的端口提調(diào)用需求。
工業(yè)場景強(qiáng)調(diào)的是高實(shí)時、高響應(yīng)、高精度,當(dāng)場景有高要求的時候,控制模型和大模型之間的調(diào)用和連接就非常重要。第一,為了提高調(diào)用的響應(yīng)速度,網(wǎng)絡(luò)環(huán)境一定要非常好;第二,如果不是部署在云端,而是部署在本地,非常強(qiáng)調(diào)成本,不太可能把非常昂貴的推理芯片部署到每一臺工業(yè)機(jī)器人中,這會造成非常高的成本。所以我覺得響應(yīng)速度、算力部署的架構(gòu)以及對應(yīng)的整套系統(tǒng)的成本,是工業(yè)機(jī)器人和大模型相結(jié)合面臨的一些問題。
結(jié)合視覺推理、語言理解和任務(wù)編排等功能的基座大模型,與負(fù)責(zé)提升機(jī)器人操作敏捷性的神經(jīng)網(wǎng)絡(luò)系統(tǒng),將成為未來通用機(jī)器人的關(guān)鍵架構(gòu)范式。
Ivy Li:首先,大模型帶給機(jī)器人更完善的自主學(xué)習(xí)和決策能力、感知與交互能力、運(yùn)動控制能力,讓機(jī)器人能夠更好地理解和適應(yīng)周圍的環(huán)境,通過自主學(xué)習(xí)和決策的智能系統(tǒng)在面對復(fù)雜多變的環(huán)境時,能夠更加靈活地做出反應(yīng),如行走、抓取、操作等。
另外一個層面,讓機(jī)器人在泛化上有走向通用的可能性。具身智能的實(shí)現(xiàn)路徑上還有很多需要解決的問題,比如大腦的決策模型和小腦的運(yùn)控算法的泛化性問題,現(xiàn)在各家公司都有各自的思路。此外,在數(shù)據(jù)的來源上和數(shù)據(jù)的配方上,不同的團(tuán)隊(duì)也有不同的側(cè)重點(diǎn)。
顏黔杭:對于機(jī)器人,大模型當(dāng)下提供的價值非常明確,即在機(jī)器人的多模態(tài)感知能力與任務(wù)理解、決策的泛化上,大模型使機(jī)器人能夠從單一任務(wù)場景拓展到更通用的復(fù)雜場景,賦予了機(jī)器人具備通用智能的“大腦”。在負(fù)責(zé)運(yùn)動控制的“小腦”這一側(cè),高頻率推理和快速響應(yīng)的基本需求使得大模型直接應(yīng)用于“小腦”還有挑戰(zhàn)。這也是為什么業(yè)內(nèi)有一種聲音在質(zhì)疑Google RTX那套用大模型端到端直接替代小腦的可行性。
未來隨著多模態(tài)大模型的成熟以及最近李飛飛提出的世界模型的研發(fā)推進(jìn),預(yù)期上我們希望大模型能在“大腦”側(cè)發(fā)揮更多的作用,例如通過推理出符合物理世界規(guī)律的物體軌跡規(guī)劃,來實(shí)現(xiàn)更高泛化性能的任務(wù)執(zhí)行能力。如何結(jié)合負(fù)責(zé)“大腦”的大模型,與小腦側(cè)的運(yùn)動控制模型去搭建好一個兼具泛化與高推理頻率的具身智能系統(tǒng)架構(gòu),是具身智能下一步的重要挑戰(zhàn)。
鈦媒體:為什么具身智能都在“卷”人形?
陳昱:人形和具身智能是兩個不同的概念。人形機(jī)器人更多強(qiáng)調(diào)的是形態(tài)、運(yùn)動能力,具身智能強(qiáng)調(diào)的是應(yīng)用AI學(xué)習(xí)的能力,也就是能不能快速掌握技能,完成通用場景的操作。
大家的夢想肯定是想做人的形態(tài),理由也是非常充分的,畢竟現(xiàn)在環(huán)境都是圍繞著人來打造的。但從技術(shù)和成本考量,是否要做雙足,我覺得這不是必須的。因?yàn)閺膶?shí)用性角度,當(dāng)前操作能力會更加重要。
Ivy Li:具身智能不一定局限于人形形式,最終,成功與否仍取決于具體的應(yīng)用場景和需求,關(guān)鍵在于客戶是否愿意為其買單。我們認(rèn)為,人形之所以能成為具身最終的形態(tài),是因?yàn)槿诵文軌蚋玫睦萌说臄?shù)據(jù)來學(xué)習(xí)。
顏黔杭:人形機(jī)器人是具身智能替代人執(zhí)行任務(wù)的最理想硬件載體,追求人形的形態(tài)主要有兩個原因。一個是為了實(shí)現(xiàn)仿人自由度和功能的最簡潔形態(tài),另一個是考慮到機(jī)器人需要適應(yīng)為人打造的物理環(huán)境,而人形是適應(yīng)能力最好的形態(tài)。如果是采用輪式,機(jī)器人的移動就被約束在平面上,無法適應(yīng)一些復(fù)雜地形。
但對具身智能來說,人形不是唯一的載體,它可以應(yīng)用到協(xié)作臂,復(fù)合機(jī)器人,甚至工業(yè)設(shè)備上,它并不用與人形強(qiáng)綁定。
鈦媒體:如果要實(shí)現(xiàn)通用智能機(jī)器人,硬件本體現(xiàn)在的成熟度如何,已經(jīng)能夠支撐具身智能的發(fā)展了嗎?
曹?。?/strong>過去 2 - 3 年,機(jī)器人人形初步硬件架構(gòu)已經(jīng)確立,但關(guān)鍵模塊和技術(shù)路徑仍在不斷迭代和探索。
中國的智能制造生態(tài)已經(jīng)具備了非常完整的機(jī)器人產(chǎn)業(yè)鏈,包括感知系統(tǒng)、關(guān)節(jié)驅(qū)動系統(tǒng)、整體軀干以及靈巧手的手部關(guān)節(jié)等,國內(nèi)都有非常優(yōu)秀的供應(yīng)商,既有上市公司也有初創(chuàng)公司。
比如,現(xiàn)在機(jī)器人的感知方案五花八門,上海 WAIC 上展示的十八羅漢,每個機(jī)器人的感知方案都不同,目前還沒有統(tǒng)一的行業(yè)標(biāo)準(zhǔn)。這給投資人帶來了很強(qiáng)的信心和良好的生態(tài)效應(yīng)。
我們認(rèn)為,未來的機(jī)器人團(tuán)隊(duì)不應(yīng)單兵作戰(zhàn),而要做到生態(tài)協(xié)同、生態(tài)供應(yīng)。從人形機(jī)器人架構(gòu)成立到未來硬件架構(gòu)穩(wěn)定、行業(yè)達(dá)成共識,我們認(rèn)為還需要 3 - 5 年的周期。如果硬件未來能夠快速達(dá)成共識,對整個產(chǎn)業(yè)的發(fā)展和人形機(jī)器人生態(tài)的迭代將非常有幫助。
Ivy Li:硬件并非當(dāng)前具身智能的核心瓶頸。雖然硬件技術(shù)路徑尚未完全收斂,上游產(chǎn)業(yè)鏈也還不夠成熟,但這只是時間和過程的問題。
硬件的關(guān)鍵不在于技術(shù)突破,而在于工程化實(shí)現(xiàn)。這本質(zhì)上回歸到制造業(yè)的三大核心:成本、質(zhì)量和交期。我們對中國供應(yīng)鏈充滿信心,隨著產(chǎn)業(yè)發(fā)展和硬件技術(shù)路徑的逐步收斂,行業(yè)共識將形成,成本也將持續(xù)下降。
顏黔杭:談到硬件,我們可以把它分成上半身和下半身去看。
上半身更多是負(fù)責(zé)操作的臂與靈巧手。這么些年下來,臂的技術(shù)相對已經(jīng)比較完善與成熟,因?yàn)樗诠I(yè)場景里已經(jīng)落地驗(yàn)證了很多年。靈巧手的進(jìn)展相對緩慢一些,當(dāng)前很多場景的任務(wù)操作,用吸盤或者夾爪即可。目前,高自由度的靈巧手還處于科研或者說研發(fā)階段,在應(yīng)用落地之前需要解決可靠性,承載負(fù)荷,集成度等諸多問題。
機(jī)器人上肢操作能力的泛化與迭代離不開力反饋控制與觸覺反饋控制的結(jié)合。力傳感器與觸覺傳感器是這些新控制反饋鏈路的硬件基礎(chǔ)。目前,市場上比較缺乏高性價比、功能可靠的這類傳感器產(chǎn)品,但這也意味著投資機(jī)會。
至于下半身,即機(jī)器人的腿部和足部,包括電機(jī)、減速器等執(zhí)行器件本身,目前并不是構(gòu)成硬壁壘的稀缺前沿技術(shù)。對于人形或通用智能機(jī)器人來說,隨著新需求的誕生和中國供應(yīng)鏈的快速迭代,硬件的基礎(chǔ)能力已經(jīng)可以去支持一些具身智能的落地與驗(yàn)證。不過,基于人形機(jī)器人的新場景和特點(diǎn),硬件上也需要依托供應(yīng)鏈來做一些創(chuàng)新。
例如,機(jī)器人的抗沖擊能力是一個需要去關(guān)注的問題。傳統(tǒng)的協(xié)作機(jī)器人或工業(yè)機(jī)器人通常在固定場景下工作,側(cè)重于保障運(yùn)動的平順性。但是人形機(jī)器人不管在操作和移動中都有大量的隨機(jī)事件發(fā)生,比如操作任務(wù)的干擾和移動時環(huán)境中的暗坑,解決這類隨機(jī)事件對機(jī)器人運(yùn)動帶來的瞬態(tài)沖擊是人形機(jī)器人在硬件需求上變化比較顯著的一點(diǎn)。
鈦媒體:如果不考慮觸覺或感官問題,只關(guān)注于如何控制靈巧手,哪些因素最難達(dá)成妥協(xié)?
曹巍:如果從感知和認(rèn)知的角度看,因?yàn)楦兄驼J(rèn)知包含一些復(fù)雜任務(wù)的規(guī)劃,它是由大腦來做的,而且大腦很多都是大模型在做,大家會基于開源的大模型或現(xiàn)有大模型去改,而這些大模型的能力現(xiàn)在其實(shí)是非常強(qiáng),應(yīng)該講現(xiàn)在的機(jī)器人是“大腦強(qiáng)、小腦弱”,所以現(xiàn)在關(guān)鍵問題還是在小腦。目前在小腦領(lǐng)域,我們沒有看到特別大的技術(shù)變化去驅(qū)動它,沒有看到代際級的運(yùn)動能力表現(xiàn)。
小腦領(lǐng)域,有一個模型叫做Vision Action Model,這個Action其實(shí)就是和小腦對應(yīng)的。比如像local motion,它是小腦里跟運(yùn)動能力相關(guān)的部分,這個人是個傻子,他沒有大腦,但是他依然能走路,或者有一些條件反射,你一敲膝蓋腿會動,這可能是你下意識的舉動,也是屬于小腦端側(cè)、非常末端的基礎(chǔ)模型去控制的。
“小腦”的話就是在控制側(cè),比如我們關(guān)注的像強(qiáng)化學(xué)習(xí)方向,我們有一個項(xiàng)目可能會去投資,他們是在強(qiáng)化學(xué)習(xí)方面做得非常優(yōu)秀的一個團(tuán)隊(duì),在雙手的靈巧操作方面會有非常差異化的能力展現(xiàn)。
像靈巧手的選型,有眾多創(chuàng)業(yè)團(tuán)隊(duì)在從事這方面的創(chuàng)業(yè),但高自由度與穩(wěn)定性、魯棒性之間的矛盾,無論是學(xué)術(shù)界研究人員還是產(chǎn)業(yè)界創(chuàng)業(yè)企業(yè)家,都還在努力解決。
Ivy Li:現(xiàn)在還處于行業(yè)的早期階段,各家公司在技術(shù)方案上都在進(jìn)行不同的探索,關(guān)于需要多少自由度等問題尚未形成共識。這是一個產(chǎn)業(yè)發(fā)展過程中必經(jīng)的階段,隨著時間的推移,行業(yè)將逐漸明確方向并達(dá)成共識
顏黔杭:峰瑞比較早在靈巧手賽道做了投資布局,今年也還在持續(xù)看新項(xiàng)目。靈巧手之所以能獨(dú)立于其他機(jī)器人零部件作為一個單獨(dú)的技術(shù)方向,是因?yàn)樗仨氁鉀Q在人手大小的空間內(nèi),完成上驅(qū)動單元、傳動結(jié)構(gòu),以及多類型傳感器的集成,同時又要滿足末端精度、末端負(fù)載、自由度,可靠性等多維度的需求。這需要從底層設(shè)計(jì)上去重構(gòu)很多傳統(tǒng)的機(jī)器人設(shè)計(jì)。這是硬件側(cè)的難點(diǎn),當(dāng)然也是機(jī)遇。
至于如何如控制一個高自由度的靈巧手,這是一個復(fù)雜的問題。單個靈巧手的自由度遠(yuǎn)超之前的協(xié)作臂,同時要考慮引入多模態(tài)的閉環(huán)控制反饋(視覺、力覺,觸覺),用經(jīng)典控制方法很難實(shí)現(xiàn)高頻率靈巧手的控制。學(xué)術(shù)界與行業(yè)內(nèi)都在采用AI這類數(shù)據(jù)驅(qū)動的方式,通過模仿學(xué)習(xí),sim2real的強(qiáng)化學(xué)習(xí)等方法,去推進(jìn)靈巧手技術(shù)控制的迭代。
靈巧手的硬件與軟件之間存在一個相互促進(jìn)的飛輪效應(yīng)。我們認(rèn)為目前靈巧手的一個典型的矛盾點(diǎn)是,因?yàn)榧婢吒咦杂啥?、高性價比、高可靠性的硬件產(chǎn)品還比較缺乏,研發(fā)者們要研發(fā)控制算法與采集數(shù)據(jù)就很難。在研發(fā)上,一旦靈巧手的滲透率大幅度提升,就能推動這個飛輪快速轉(zhuǎn)起來。
鈦媒體:如果說需要考慮落地的話,潛在挑戰(zhàn)在哪?
曹?。?/strong>從機(jī)器人運(yùn)動控制方向來看,目前機(jī)器人的雙腿控制部分已經(jīng)能夠做得很好,但如何把靈巧手用好,依然是學(xué)術(shù)界和產(chǎn)業(yè)界所面臨的難點(diǎn)。人在做任務(wù)時,60%-70%的價值創(chuàng)造是由雙手完成的,靈巧手的開發(fā)是機(jī)器人含金量非常高的技術(shù)棧,也是藍(lán)馳創(chuàng)投現(xiàn)階段看好的新細(xì)分方向之一。
顏黔杭:人形機(jī)器人公司要實(shí)現(xiàn)技術(shù)落地,一個路徑是在研發(fā)上瞄準(zhǔn)前沿和未來,然后在過程中逐步把關(guān)鍵技術(shù)拆解出來,再降維去做產(chǎn)品,實(shí)現(xiàn)商業(yè)化。這是一種由高到低的技術(shù)轉(zhuǎn)化過程。
但現(xiàn)狀是,不管是行走還是操作,目前的技術(shù)進(jìn)展距離實(shí)際應(yīng)用需求還有差距。
中短期,這一波創(chuàng)業(yè)公司如果能在某些垂直場景中找到可以產(chǎn)品化的方向,并解決場景內(nèi)的通用性問題,就能實(shí)現(xiàn)一定程度的商業(yè)化。例如側(cè)重于足式移動的人形機(jī)器人公司去做一些特種復(fù)雜路面場景的落地嘗試,或者偏操作的具身智能公司在物流分揀和藥房等零售類場景進(jìn)行上下貨。
挑戰(zhàn)在于,市場對產(chǎn)品的要求通常會非常高,即便證明了技術(shù)可行性,也需要在商業(yè)價值上體現(xiàn)競爭力。
總體而言,相比于傳統(tǒng)機(jī)器人,這一波人形機(jī)器人的優(yōu)勢還是在通用和泛化上,尤其是在感知與任務(wù)決策上已經(jīng)展示出明顯優(yōu)勢,但在基于模仿學(xué)習(xí)的任務(wù)操作上泛化仍然是挑戰(zhàn)。
所以,比較適合短期落地的是感知復(fù)雜度高、操作復(fù)雜度低的場景,例如前面提到的藥房上下貨。
鈦媒體:機(jī)器人方向進(jìn)行創(chuàng)業(yè),您認(rèn)為哪些細(xì)分領(lǐng)域的機(jī)會更大?
陳昱:從投資角度來看,具身智能是一個非常復(fù)雜的行業(yè),涉及軟件、硬件多個層級,包括零組件、本體、數(shù)據(jù)采集、模擬器等等,這些細(xì)分領(lǐng)域都包含很多創(chuàng)業(yè)機(jī)會。
此外,具身智能的技術(shù)路線尚未收斂,有端到端機(jī)器學(xué)習(xí)方案、大模型加強(qiáng)化學(xué)習(xí)的方案,還有其他方案。在技術(shù)早期我們也會多布局不同技術(shù)路線的公司,未來技術(shù)路線可能也未必收斂,可能每種技術(shù)路線都有存在價值,都有可能做出高性價比、高功能的具身智能。不同的技術(shù)路線下也有創(chuàng)新突破的機(jī)會。
曹?。?/strong>圍繞小腦領(lǐng)域,我們比較關(guān)注的是靈巧操作,在靈巧操作的算法上有創(chuàng)新的團(tuán)隊(duì),同時也關(guān)注垂直領(lǐng)域的機(jī)器人公司,我們投資了一家深圳的公司叫小楠科技,它是做海外末端物流分揀的智能化設(shè)備的,非常有特色和差異化。
未來還會在仿真訓(xùn)練平臺、關(guān)鍵傳感器、機(jī)器人核心模組等方面持續(xù)尋找優(yōu)秀創(chuàng)業(yè)團(tuán)隊(duì)。
Ivy Li:在我們看來,具身智能是未來人工智能引發(fā)社會性革命的核心載體,因此圍繞具身智能將會有許多機(jī)會涌現(xiàn)。
在當(dāng)前階段,無論是圍繞本體展開的移動平臺,還是上半身的手眼結(jié)合技術(shù),我們都給予高度關(guān)注。技術(shù)正在不斷進(jìn)步,這需要對機(jī)械系統(tǒng)的深入理解以及多模態(tài)模型的調(diào)試。
展望未來,手眼一體化本質(zhì)上是多模態(tài)技術(shù)與機(jī)械的融合,隨著產(chǎn)業(yè)鏈的日益成熟,具身智能的上游技術(shù),包括傳感器,將成為我們關(guān)注的重點(diǎn)方向。
顏黔杭:在具身智能賽道,我們峰瑞已經(jīng)投資了AI+本體、包括靈巧手在內(nèi)的核心零部件、關(guān)鍵傳感器、垂直場景應(yīng)用等多個細(xì)分方向。
我們相信具身智能是個長遠(yuǎn)的大賽道。大家對具身智能的共識目標(biāo)是,基于高質(zhì)量的數(shù)據(jù)采集與供應(yīng),結(jié)合AI模型側(cè)的創(chuàng)新,來實(shí)現(xiàn)泛化與可靠性更強(qiáng)的具身智能系統(tǒng)。因此,我們希望能夠保持對具身智能賽道的敏感,并持續(xù)探索新的具身投資機(jī)會。
此外,隨著這波浪潮的興起,我們也看好具身智能相關(guān)的技術(shù)與能力外溢到其他行業(yè),比如傳統(tǒng)工業(yè)、協(xié)作類機(jī)器人場景,去推動垂直場景內(nèi)的機(jī)器人智能化。例如焊接、打磨等經(jīng)典工業(yè)機(jī)器人場景里的任務(wù),固定編程的傳統(tǒng)機(jī)器人可以升級成為智能化的新型機(jī)器人。
鈦媒體:具身智能賽道,您會著重看哪些方向的公司以及在選擇團(tuán)隊(duì)時, 您會重視哪些能力?
曹?。?/strong>技術(shù)進(jìn)步是推動機(jī)器人能力的關(guān)鍵抓手,藍(lán)馳在看機(jī)器人方向的時候非常關(guān)注底層技術(shù)變化趨勢。
機(jī)器人公司本質(zhì)上來說是制造業(yè)公司,所以公司壁壘的構(gòu)建首先體現(xiàn)在制造層面,是否有足夠的規(guī)模、高效的生產(chǎn)能力、高效的供應(yīng)鏈協(xié)同能力。
第二從機(jī)器人層面看,是否在數(shù)據(jù)側(cè)、場景側(cè)、算法側(cè)形成足夠的差異化。如果創(chuàng)業(yè)者有差異化的競爭力,單項(xiàng)能力突出就很好。但這樣的團(tuán)隊(duì)一定要去快速補(bǔ)短,因?yàn)槲磥淼母偁?,一定?ldquo;六邊形戰(zhàn)士”之間的競爭。如果創(chuàng)業(yè)者對機(jī)器人有夢想,而不只是追熱點(diǎn),并且有差異化競爭力,他們隨時都可以入場。
總體來說投機(jī)器人,一看技術(shù)變化,二看產(chǎn)業(yè)趨勢。除了機(jī)器人,在整個的大科技領(lǐng)域,我們還關(guān)注AI和智能硬件的結(jié)合,同時也關(guān)注文生3D、圖生3D等基礎(chǔ)的底層模型和世界模型。
Ivy Li:我們?nèi)栽陉P(guān)注有差異化競爭力的團(tuán)隊(duì)。我們相信,不論是長板足夠清晰的企業(yè),抑或是在產(chǎn)業(yè)中經(jīng)驗(yàn)豐富的企業(yè),只要在產(chǎn)業(yè)發(fā)展的過程中清晰自己的定位就存在機(jī)會。
顏黔杭:對于具身智能和人形機(jī)器人這類短期還未到達(dá)商業(yè)化拐點(diǎn)的前沿科技賽道,我們的投資判斷邏輯還是從技術(shù)趨勢和團(tuán)隊(duì)能力這兩個角度來綜合判斷。
首先,我們希望團(tuán)隊(duì)具備足夠前沿的技術(shù)戰(zhàn)略視野與決策能力,能夠領(lǐng)先于行業(yè)平均水平去推動前沿技術(shù)的發(fā)展,而不是總跟在后面“抄作業(yè)”。其次,團(tuán)隊(duì)需要在這類新賽道里具備非常強(qiáng)的快速學(xué)習(xí)能力,去應(yīng)對行業(yè)發(fā)展過程中的預(yù)期外的新變化。
鈦媒體:未來 10 到 20 年,全球人形機(jī)器人或智能機(jī)器人行業(yè)的格局將會變成什么樣?
陳昱:具身智能最終應(yīng)該是替代或輔助人去完成一些工作,所以商業(yè)模式肯定是對標(biāo)人的。如果在一些應(yīng)用場景下,機(jī)器人能夠做到比相應(yīng)的人工成本更便宜,那市場肯定會買單。
更終局的視角下,大家最后都需要一個全能的個人助理,但這個商業(yè)模式還需要很長一段時間。
具身智能的發(fā)展模式和自動駕駛會有些類似,大概在2014年-2016年,我們已經(jīng)能夠看到自動駕駛的雛形在路上跑了。具身智能也在走同樣的路,大家先把雛形做出來,再花5-10年把鏈條上各個環(huán)節(jié)的成本降下來。
曹巍:根據(jù)我們的觀察,人形機(jī)器人和半人形機(jī)器人,都需要穿越2個到3個投資周期才能成功。
在機(jī)器人落地的過程中,未來的發(fā)展趨勢一定是循序漸進(jìn),從簡單到困難逐步展開。因?yàn)闄C(jī)器人什么時候能落地取決于機(jī)器人的能力邊界和、場景和任務(wù)特點(diǎn)。
比如在 B 端場景,B 端最關(guān)注明確的成本要求,即要講清楚 ROI,明確替代幾個人、何時回本,是在場景側(cè)百分百完成簡單任務(wù)還是 80%完成復(fù)雜任務(wù)但只是秀一下?他們需要百分百穩(wěn)定的簡單任務(wù)。所以,B端場景里,能夠克服外部干擾,從簡單任務(wù)做起,做到高魯棒性,是切入點(diǎn)的關(guān)鍵。
而在 C 端,我們看到大量標(biāo)準(zhǔn)化任務(wù)已被成熟的消費(fèi)電子產(chǎn)品取代,留給機(jī)器人創(chuàng)業(yè)公司的基本都是復(fù)雜任務(wù),如非標(biāo)的房間打理、帶孩子、照顧老人、非標(biāo)的清潔等。這些任務(wù)非常復(fù)雜,既有空間交互的大量智能體與之博弈,又有復(fù)雜長序列任務(wù)的串聯(lián),還可能涉及機(jī)器人與其他智能體的協(xié)作,所以 C 端并不容易。我們也看到很多優(yōu)秀的團(tuán)隊(duì)已經(jīng)開始嘗試在 C 端努力,期待有團(tuán)隊(duì)一起交流和碰撞,找到 C 端的解題路徑。
總的來說,機(jī)器人的落地不是一蹴而就的,而是一個循序漸進(jìn)的過程。
最后,雖然我們談到了產(chǎn)業(yè)的發(fā)展趨勢、遇到的問題和挑戰(zhàn),但我們也看到了大家對通用機(jī)器人、人形機(jī)器人、半人形機(jī)器人的巨大期望,這源于它們在場景適應(yīng)上的包容性,無論是科研、交互服務(wù)、搬運(yùn)巡檢、復(fù)雜分揀、產(chǎn)業(yè)組裝柔性任務(wù),還是生活服務(wù)場景中的住宿、零售、批發(fā),甚至 C 端的居家、養(yǎng)老、看護(hù)、陪伴等,未來都將是一個萬億級的市場,是一個值得大家傾心投入、共同努力的巨大機(jī)會。雖然短期內(nèi)可能還看不到。(本文首發(fā)于鈦媒體APP,作者|郭虹妘,編輯|陶天宇)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論