鈦媒體注:本文來源于微信公眾號量子位(ID:QbitAI),鈦媒體經(jīng)授權(quán)發(fā)布。

馬斯克是我偶像,很榮幸能有機(jī)會在這個賽道和他同臺競技。

說出這話的稚暉君,十分清楚他離開華為創(chuàng)業(yè)要做什么:

對標(biāo)馬斯克,做通用機(jī)器人,競品擎天柱,既面向星辰大海也奔著商用落地,產(chǎn)品目標(biāo)最終定價不超過20萬人民幣。

換成最流行的說法,他在做大模型和機(jī)器人結(jié)合的具身智能。

想法始于他學(xué)生時期的探索。

早在他還沒成B站up主的2015年,學(xué)生身份的稚暉君就參與組織了一群打比賽認(rèn)識的小伙伴,準(zhǔn)備“做個人吧”:

當(dāng)時,普通人對AI的切身感受還是人臉識別或美顏這類應(yīng)用,大模型概念還沒誕生,“要讓機(jī)器人具備像人一樣的思考和行動能力”這個命題,似乎離實(shí)現(xiàn)還有點(diǎn)過于遙不可及。

因此,畢業(yè)后的稚暉君沒繼續(xù)只在機(jī)器人身上折騰,而是選擇進(jìn)入AI賽道,成為大廠的AI算法工程師,在軟件算法領(lǐng)域干了好幾年。

直到ChatGPT石破天驚,大模型智能涌現(xiàn),OpenAI證明大力堆疊真的可以產(chǎn)生質(zhì)變。

回看自己的機(jī)器人夢想,稚暉君又看到了這條路的可行性。

所以,離開菊廠,投身創(chuàng)業(yè)。

于是半年時間,他帶著團(tuán)隊(duì)拿出了一套有模有樣的原型機(jī)。

8月發(fā)布會上,被稚暉君自豪請上臺的自家機(jī)器人步伐穩(wěn)健,行走效果可以比肩去年馬斯克擎天柱Optimus的初亮相。

就是憑借這樣一款作品,他的初創(chuàng)公司智元機(jī)器人,在投資者冷靜但賽道又火爆的當(dāng)下,成為了少數(shù)幾個拿到VC和大廠戰(zhàn)投重金押注的標(biāo)的。

發(fā)布會結(jié)束后和量子位的會面,他表露出對發(fā)布會、團(tuán)隊(duì)和整體進(jìn)展的還算滿意,也表露出沿著這條路往未來走的信心。

還在他的工位前告訴我們,他的桌面壁紙已經(jīng)換了很久了:

全身心投入人形機(jī)器人創(chuàng)業(yè),他會怎么看待自己公司的高估值?智元的下一步規(guī)劃是什么?商業(yè)化落地場景將在何方?創(chuàng)業(yè)過后這個百大up主的B站賬號咋辦?

量子位問,稚暉君答,一切都在這次對話中。

再晚點(diǎn),也許就不用出來創(chuàng)業(yè)了

稚暉君算是最早感知到這一波大環(huán)境變化,并且付諸實(shí)踐的那撥人。

外界看來,他去年年底宣布創(chuàng)業(yè)時,機(jī)器人和大模型都是科技領(lǐng)域的大熱議題,尤其是ChatGPT剛出道,帶給大家暴力美學(xué)的震撼。

那個時間節(jié)點(diǎn),賽道遠(yuǎn)沒有今天擁擠。技術(shù)從業(yè)者聞風(fēng)而動,不算意外。

但稚暉君第一次透露了他當(dāng)時的心態(tài):

要是選擇再晚一點(diǎn),也許就沒必要出來創(chuàng)業(yè)做這事了。

為了解釋這句話,他給競品特斯拉擎天柱拉出一條時間線:

去年9月展示原型機(jī),今年5月展示識別周圍環(huán)境存儲記憶和準(zhǔn)確控制物品拿放的能力,7月表示已經(jīng)生產(chǎn)10臺,預(yù)計(jì)11月進(jìn)行行走測試,明年在特斯拉自己的工廠進(jìn)行實(shí)用性測試。

動作很快,實(shí)際效果也哇噻。

馬斯克,一個從不按套路出牌的男人,自從宣布入局機(jī)器人賽道,就用火箭般的速度推進(jìn)量產(chǎn)節(jié)奏,在他的口中,未來機(jī)器人的數(shù)量會超過人類。

稚暉君看到這一切,心潮澎湃。

與此同時,他也觀察到機(jī)器人和大模型結(jié)合的潛力。

微軟的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,還有VoxPoser、RoboCat等眾多工作,都在嘗試把圖像語言大模型的能力和知識遷移到機(jī)器人領(lǐng)域。

其中轟動最大的谷歌RT(Robot Transformer)系列,在論文闡述和demo視頻中,都展示出抓取領(lǐng)域非常優(yōu)秀的泛化能力。

要做到這一點(diǎn)并不容易,核心門檻,在于數(shù)據(jù)。

光是訓(xùn)練它,谷歌就花了17個月,收集13臺機(jī)器人的13萬條機(jī)器人真實(shí)數(shù)據(jù)——這大概也是RT模型開源而數(shù)據(jù)暫時閉源的一個小小心機(jī)。

稚暉君坦言,雖然也從一開始就在準(zhǔn)備自家的動作任務(wù)數(shù)據(jù)集,但目前能用來訓(xùn)練自家產(chǎn)品的數(shù)據(jù),“只有上千”。

一對比,差距之大,顯而易見。

數(shù)字上的直觀差距,足以解釋稚暉君對量子位說的,“當(dāng)前節(jié)點(diǎn),遠(yuǎn)征A1最需要提升的地方,是數(shù)據(jù)帶來的AI泛化能力”,足以解釋這為什么“會是一個相對長期的布局”。

也能部分解釋發(fā)布機(jī)器人時,直播間網(wǎng)友對展示時間較短、展示能力不如想象炫酷的疑問。

“我覺得要想達(dá)到真正理想的實(shí)用效果,還是需要大量的真實(shí)場景數(shù)據(jù)。我們時間太短了,這方面還沒有做夠積累。”稚暉君如是說。

競爭對手不會給你多留喘息的機(jī)會。正因如此,稚暉君表示團(tuán)隊(duì)接下來的工作重心之一,是建立自己的數(shù)據(jù)中心。

計(jì)劃未來幾個月內(nèi)落地臨港,主要目的是搭建場景和仿真平臺,填補(bǔ)運(yùn)動數(shù)據(jù),提高泛化能力。

數(shù)據(jù)是如何生成的?稚暉君的總結(jié)有三:

建數(shù)據(jù)中心是工作重點(diǎn)之一,另一個重點(diǎn)則是對硬件結(jié)構(gòu)進(jìn)行迭代重構(gòu),加強(qiáng)機(jī)器人本體運(yùn)動性能。

按稚暉君的說法,團(tuán)隊(duì)會用做軟件敏捷開發(fā)的速度和效率去迭代硬件。

這是非常顛覆并且有挑戰(zhàn)性的一件事情。

此處送上小八卦一則。

今年4月,智慧軍在投稿B站的自制雙足機(jī)器人哪吒,并在視頻結(jié)尾表示,“如果不出意外的話,哪吒會成為發(fā)布會的彩蛋”。

當(dāng)然了,按照經(jīng)典劇情,不出意外的話果然就出意外了:D,哪吒并沒有上發(fā)布會。

就是它 ↓

量子位幫大家打聽到,原因是哪吒上面用到的幾個電機(jī)被供應(yīng)商鴿了,3月下的訂單7月才收到貨,導(dǎo)致開發(fā)時間不夠。

稚暉君說道:“后面有空還是會繼續(xù)完成這個項(xiàng)目的,鴿王有坑必填。”

半年成獨(dú)角獸,背后還有另一條商業(yè)化隱線

讀到這里大概能察覺,智元人形機(jī)器人項(xiàng)目的機(jī)器人本體,還需要迭代幾版;而AI能力受限于當(dāng)前訓(xùn)練數(shù)據(jù)不足,也還需要積累一段時間。

總體來說,產(chǎn)品離落地似乎還有一段距離的樣子。

然而就是這樣一個創(chuàng)業(yè)項(xiàng)目,半年估值直奔10億美元開外。

這合理嗎???

聽到這個問題,稚暉君并沒有直接回答到底“值或不值”,只是回答道,其實(shí)融資思路也不是一開始就定型的,期間參考了很多行業(yè)大佬和前輩的建議。

團(tuán)隊(duì)最初的設(shè)想很單純,就是先做出Demo,然后順其自然地提高估值。

“但創(chuàng)業(yè)顯然不是那么單純的事情,大經(jīng)濟(jì)環(huán)境不算景氣的背景下,要整合資源、吸引人才,無一不需資本的背書。”稚暉君表示,“這并不是一件壞事。”

高效實(shí)干,快速調(diào)整思路和策略,以結(jié)果導(dǎo)向推進(jìn)事情,這是稚暉君的行事風(fēng)格。

他的風(fēng)格最終也決定了智元,至少是智元研發(fā)團(tuán)隊(duì)的工作風(fēng)格。

技術(shù)團(tuán)隊(duì)每個早期成員都是他親自面進(jìn)公司的,30多號人基本都是自來卷,卷得一天睡五、六個小時的稚暉君都心生感慨:

之前大家都覺得我是時間管理大師,現(xiàn)在我可以很慚愧地講,我們公司像我這么肝的,還有一堆……

整個交流過程中,量子位關(guān)注到他強(qiáng)調(diào)了兩個關(guān)鍵詞,“壓成本”和“應(yīng)用場景”

這倆是目前整個賽道的普遍痛點(diǎn)。團(tuán)隊(duì)如何解決痛點(diǎn),必然是他們獲得高瓴、鼎暉、經(jīng)緯、高榕、藍(lán)馳、BV百度風(fēng)投等頭部資方重金押注的關(guān)鍵。

來聽聽稚暉君的看法——

先說壓低成本。

現(xiàn)在智元對外喊出的口號是,人形機(jī)器人落地控價20萬元內(nèi)。

這約與馬斯克放話的7萬美元售價持平,而國內(nèi)類似人形機(jī)器人的售價水平在50萬RMB上下,大家喜聞樂見的波士頓動力Atlas,成本則在200萬美元。

稚暉君直言不諱:“不是我們希望做到20萬元,而是如果做不到20萬元的價格,就根本沒辦法實(shí)現(xiàn)商業(yè)落地。”

至于為什么是20萬,他表示,以新能源汽車制造業(yè)為例,20萬的機(jī)器人替代部分人工崗位的話,可以做到1~2年的投資回報期。

稚暉君也大致描述了一下智元為量產(chǎn)控制成本的方法。

一是盡最大可能采取自研路線,降本增效。

如關(guān)節(jié)電機(jī)和靈巧手等部件占硬件成本一半以上,而且市場現(xiàn)有供應(yīng)還存在特性不匹配的情況,自主研發(fā)核心部件能讓成本降低一半以上。

二是采用類似特斯拉造車的部分思路,用軟件和算法補(bǔ)硬件方面的精度要求,降低硬件成本。

如放棄諧波減速器而選擇行星減速器,靈巧手上面使用的視覺閉環(huán)方案等等。

再說落地應(yīng)用場景。

稚暉君表示,預(yù)計(jì)明年下半年商業(yè)化落地,先應(yīng)用在工業(yè)制造領(lǐng)域,家庭等服務(wù)型應(yīng)用場景都往后排,現(xiàn)階段突出一個“場景相對簡單,任務(wù)相對復(fù)雜”。

“這條路線是邊走邊摸索出來的,還是最初就定下的目標(biāo)?”
“團(tuán)隊(duì)還不到10個人時候的最早期,我們就基本敲定了這條落地方案。”

同時表示,

很多人會拿我們或者特斯拉的機(jī)器人去跟波士頓動力對比,其實(shí)是不合適的。
奔著商業(yè)化落地去做,正確的邏輯應(yīng)該是:在滿足應(yīng)用場景功能和性能需求的前提下,以盡量最低的成本去實(shí)現(xiàn)方案。
所以能走著去搬東西的場景下,就沒有必要非得讓它有能力后空翻。

現(xiàn)在,這條半年前定下的路線,最終落地跡象愈發(fā)明晰。

最新工商動態(tài)顯示,比亞迪入股了智元下屬公司,加上此前量子位從智元方面獲悉,公司已與國產(chǎn)頭部智能汽車廠商和3C廠商等密切洽談。

由此在官宣前推測一波,遠(yuǎn)征A1在工業(yè)制造領(lǐng)域的首發(fā)打工地點(diǎn),不出意外,就是比亞迪汽車工廠。

除成本和落地場景這兩點(diǎn)外,隨著團(tuán)隊(duì)對具身智能的愈發(fā)深入,智元手里還握了些其它差異化的牌。

比如,量子位就從稚暉君口中挖到公司商業(yè)化的一條隱線——

如果說通用人形機(jī)器人是商業(yè)落地的中長期計(jì)劃和最終愿景,那么在邁向這個終點(diǎn)的過程中,團(tuán)隊(duì)也會有一些“沿途下蛋”的產(chǎn)品形態(tài)。

具體是什么形態(tài)呢?稚暉君一如既往地口風(fēng)很嚴(yán),賣了個關(guān)子,但還是有所透露。

他聽到過很多次疑問,問為什么要把機(jī)器人做成人類形態(tài),相比于其他專用形態(tài)(機(jī)械臂、輪式),是不是費(fèi)力不討好?

針對這個問題,稚暉君有兩方面思考。

一方面,這會是一個長期投入的過程,大家不要高估短期的價值,也不要低估長期的價值

人形是智元以終為始、面向終極形態(tài)邁出的第一步,這也是為什么給這款機(jī)器人取名叫“遠(yuǎn)征”。

另一方面,選擇做這件事情(人形)并不是因?yàn)樗菀祝炊且驗(yàn)樗芾щy。

通用人形機(jī)器人牽涉到最全面的機(jī)器人技術(shù)棧,它的實(shí)現(xiàn)過程中各種前沿技術(shù)(視覺伺服、MPC、SLAM、LLM/VLM、中間件等各種技術(shù)的自研和優(yōu)化)的沿途下蛋,可以催生很多創(chuàng)新性專用形態(tài)的機(jī)器人產(chǎn)品,“大家未來會陸續(xù)看到這些成果的”。

“網(wǎng)友們放心,B站賬號不會變成公司專用營銷號”

過人的技術(shù),漂亮的簡歷,大廠的光環(huán),百萬計(jì)的粉絲,又恰逢新技術(shù)爆發(fā)周期:大模型、具身智能、AIGC……攢局創(chuàng)業(yè)后,出任團(tuán)隊(duì)CTO,帶領(lǐng)公司迅速壯大,半年時間,公司人數(shù)近百,市場估值超10億美元。

一系列附帶光環(huán)的故事砸過來,圍觀者不由得在這個時候,重新審視稚暉君。

他又會怎樣定義現(xiàn)在的自己?量子位把這個問題拋給了稚暉君本人。

稚暉君倒沒表現(xiàn)出什么遲疑,只是說,他給自己的定位并沒有太大變化。

首先是個工程師,其次才是創(chuàng)業(yè)者。

我可能屬于一個非典型創(chuàng)業(yè)者,做這些事情的動力都是基于個人興趣,也很幸運(yùn)取得了一些小成就:早期在大廠里發(fā)光發(fā)熱,頂了一些光環(huán),又在網(wǎng)上獲得了不小的知名度,然后又突然跑出來創(chuàng)業(yè)。一開始身邊的人都覺得挺震驚的。
我一直認(rèn)為自己是一個樂觀主義者。

還有句話,他說得毫不猶豫——

“既然人生沒有后悔的機(jī)會,那么就堅(jiān)持相信自己到現(xiàn)在的每一步,都是我做的最正確的選擇。”

“每一步都是正確的選擇”,可能也包括不少人為之唏噓的離開華為,脫離“天才”tag。

在量子位面前,他沒有掩飾曾經(jīng)在華為工作取得榮譽(yù)的感激,也提到,

老東家在做一些很偉大的事情,但是像機(jī)器人這樣面向更未來領(lǐng)域的探索,可能更適合在小的創(chuàng)新團(tuán)隊(duì)中去做。

希望自己能繼承‘散是滿天星’的優(yōu)良傳統(tǒng)吧“。

然后,又像他常常做的那樣,再次強(qiáng)調(diào)自己既不是天才,也不再是少年。

能感受到,稚暉君更希望外界把對他的關(guān)注從一個具體的tag,轉(zhuǎn)移到他想做的事情本身。

有趣的是,他又勸大伙兒不要太早創(chuàng)業(yè)。“對于學(xué)生來說,建議還是要先工作幾年,接受一下社會的毒打,才對社會、公司運(yùn)作的方式有一個清晰的了解哈哈。”

當(dāng)時在發(fā)布會上,他也表達(dá)了自己的觀點(diǎn):檢驗(yàn)一家科技公司價值最有效的方式之一,就看它能否實(shí)現(xiàn)商用落地。

不然技術(shù)做得再好也容易陷入自嗨。

聊到這兒,稚暉君表露心跡,既然正兒八經(jīng)創(chuàng)業(yè)了,項(xiàng)目也不能單純按照個人的奇思妙想隨意自嗨了。

組了人、拿了錢,就需要在公司戰(zhàn)略發(fā)展方向上多做考慮,“要為公司這么多兄弟姐妹們負(fù)責(zé)”。

但顯然,他自有自嗨處:B站。

“個人號???這陣子太忙了(所以沒更新)。”稚暉君解釋到,稱自己絕對沒有挖坑就跑的意思,“后面稍微閑下來一點(diǎn),還是會更新的。”

至于之后的B站投稿,還會是原來的風(fēng)格,原來的味道,可能偶爾夾雜一些創(chuàng)業(yè)日常。

但他保證,不會變成純粹公司的營銷窗口。

(他暗示,畢竟智元有單獨(dú)的官方賬號,歡迎大家關(guān)注~)

“也是向馬斯克學(xué)習(xí)嘛,他在公司管理運(yùn)營和個人賬號運(yùn)作之間,就做得很好。”

One More Thing

話趕話聊到這兒,怎么能不追問鴿王,下次B站視頻更新,在啥時候?

“今年一定,年底之前一定。”

內(nèi)容與什么相關(guān)?

還是機(jī)器人吧,之前挖過的某個坑,下個視頻就是這個。”

好的,經(jīng)本人授權(quán),我們替他把話放在這兒了。

本文系作者 量子位 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

11:48

中國首臺商用12兆伏串列加速器成功下線

11:40

美副總統(tǒng)稱無意滯留伊朗,將很快撤出

11:39

中關(guān)村兩院具身通用智能基座模型與社會模擬器等科研成果發(fā)布

11:37

清明檔新片預(yù)售票房突破2000萬

11:30

約千人“包圍”洛杉磯政府機(jī)構(gòu)大樓,兩人被捕

10:59

中穎電子:有序推進(jìn)車規(guī)芯片研發(fā),新產(chǎn)品預(yù)期今年推出

10:50

德研究報告:中國工業(yè)數(shù)字化水平全球領(lǐng)先

10:39

訊飛醫(yī)療2025年?duì)I收增長25%,虧損收窄

10:14

廣東省市場監(jiān)管局聯(lián)合廣州市市場監(jiān)管局召開平臺企業(yè)座談會

10:10

貝殼啟動戰(zhàn)略變革:管理者站上一線,經(jīng)紀(jì)人KPI減負(fù)

10:06

中東戰(zhàn)事致燃油短缺,越南多家航司將削減航班數(shù)量

10:06

新研究估計(jì)全球每年逾25萬人死于腦膜炎

10:02

印尼16歲以下人群“社媒禁令”正式生效

10:01

調(diào)查顯示日本市場逾2500種食品4月份將漲價

10:01

西南首個商業(yè)衛(wèi)星遙感測運(yùn)控站啟用

09:25

美國全國范圍爆發(fā)反對特朗普政府集會,預(yù)計(jì)超900萬人參與,或?yàn)椤懊绹鴼v史上規(guī)模最大”抗議活動

09:23

馬斯克旗下AI公司初創(chuàng)“11羅漢”全部離職

09:21

巴基斯坦稱伊朗已同意再放行20艘巴船只通過霍爾木茲海峽

09:20

法國警方挫敗美資銀行門前爆炸企圖

09:18

美軍否認(rèn)其人員在迪拜遭襲

掃描下載App