圖片系A(chǔ)I 生成
英偉達(dá)GTC大會(huì)再次把“物理AI”推到了臺(tái)前。
3月17日,英偉達(dá)GTC 2026在美國(guó)舉行,和往年相比,這屆GTC對(duì)外釋放的信號(hào)更直接:英偉達(dá)已經(jīng)不滿足于把AI停留在數(shù)字世界,而是把“Physical AI”推到了舞臺(tái)中央。
官方議程把 physical AI 與 agentic AI、AI factories 并列為大會(huì)主線;黃仁勛在相關(guān)發(fā)布中也把重點(diǎn)放在機(jī)器人、仿真、世界模型和開(kāi)放數(shù)據(jù)工廠上,試圖把“會(huì)算”的AI,進(jìn)一步推進(jìn)到“會(huì)感知、會(huì)判斷、會(huì)行動(dòng)”的AI。
在這個(gè)背景下,元戎啟行CTO曹通易在GTC上介紹了Foundation Model(基座模型)為核心重構(gòu)的輔助駕駛技術(shù)體系。 這家公司試圖把輔助駕駛從一個(gè)單點(diǎn)產(chǎn)品,重新定義為物理世界AI的一種落地形態(tài)。換句話說(shuō),車不再只是終點(diǎn),而是起點(diǎn)。
英偉達(dá)這次發(fā)布的新內(nèi)容里,既有面向機(jī)器人和工業(yè)場(chǎng)景的 Isaac 仿真框架、GR00T 模型,也有面向 physical AI 訓(xùn)練的數(shù)據(jù)工廠藍(lán)圖;官方甚至明確提到,這套體系將用于機(jī)器人、視覺(jué)AI代理和自動(dòng)駕駛開(kāi)發(fā)。
這背后其實(shí)是一個(gè)比較明顯的產(chǎn)業(yè)判斷:過(guò)去幾年,AI主要解決的是“理解文本、生成內(nèi)容、輔助決策”的問(wèn)題;接下來(lái)要解決的,是如何讓系統(tǒng)進(jìn)入現(xiàn)實(shí)空間,在復(fù)雜環(huán)境里感知、推理、行動(dòng),并且承擔(dān)結(jié)果。
對(duì)汽車行業(yè)來(lái)說(shuō),這件事并不抽象。輔助駕駛本質(zhì)上就是最早、最成熟、也是最嚴(yán)苛的 physical AI 試驗(yàn)場(chǎng)之一。因?yàn)檐嚸刻於荚谡鎸?shí)道路中運(yùn)行,場(chǎng)景開(kāi)放、變量密集、容錯(cuò)極低,遠(yuǎn)比很多封閉環(huán)境里的機(jī)器人更難。
所以,元戎啟行選擇在GTC這個(gè)時(shí)間點(diǎn),把自己的技術(shù)體系和“物理世界AI基座”綁定,并不是在追熱點(diǎn),而是在順著英偉達(dá)定義的新敘事往前走。問(wèn)題不在于它會(huì)不會(huì)講故事,而在于這個(gè)故事有沒(méi)有產(chǎn)業(yè)基礎(chǔ)。
按照曹通易在GTC上的表述,元戎啟行正在用 Foundation Model 重構(gòu)下一代輔助駕駛技術(shù)體系,并將其定義為面向物理世界的AI基座模型。公開(kāi)信息顯示,這套系統(tǒng)以 400 億參數(shù)規(guī)模的 VLA(視覺(jué)—語(yǔ)言—動(dòng)作)基座模型為核心,試圖把場(chǎng)景理解、駕駛決策和安全評(píng)估統(tǒng)一到同一套模型架構(gòu)里,而不是像過(guò)去那樣,把感知、規(guī)劃、控制拆成多個(gè)相互耦合但并不真正統(tǒng)一的模塊。
這件事為什么重要?因?yàn)檫^(guò)去一代輔助駕駛系統(tǒng)最大的問(wèn)題,不是功能做不出來(lái),而是系統(tǒng)天然是“拼接式”的。看見(jiàn)是一個(gè)模塊,理解是一個(gè)模塊,決策又是一個(gè)模塊,最后靠規(guī)則、工程經(jīng)驗(yàn)和大量人工調(diào)參,把它們盡量焊在一起。
這種架構(gòu)在高速和標(biāo)準(zhǔn)化道路上還能工作,一旦進(jìn)入城市、施工、混行、博弈密集的復(fù)雜場(chǎng)景,就容易出現(xiàn)兩個(gè)老問(wèn)題:第一,系統(tǒng)知道“看到了什么”,但不一定真正理解發(fā)生了什么;第二,系統(tǒng)能完成動(dòng)作,但不一定讓用戶敢持續(xù)使用。
元戎啟行現(xiàn)在想做的,是把“駕駛員”、“分析師”、“裁判員”三種能力塞進(jìn)同一個(gè)基礎(chǔ)模型里。說(shuō)白了,就是讓系統(tǒng)不只是執(zhí)行,而是先形成對(duì)物理場(chǎng)景的統(tǒng)一理解,再輸出動(dòng)作。這種路徑和行業(yè)過(guò)去的“規(guī)則+模塊堆疊”相比,核心變化不在架構(gòu)邏輯:它希望系統(tǒng)先長(zhǎng)出一個(gè)統(tǒng)一認(rèn)知,再去調(diào)用不同能力,而不是讓不同能力各干各的。
這也是為什么曹通易會(huì)把輔助駕駛稱為基座模型的第一個(gè)“身體”。這句話聽(tīng)上去很像技術(shù)圈常見(jiàn)的大詞,但放到產(chǎn)業(yè)邏輯里并不難理解:今天先讓模型在車上學(xué)會(huì)感知道路、處理風(fēng)險(xiǎn)、完成動(dòng)作,明天同樣的認(rèn)知底座,就有可能遷移到 Robotaxi,甚至更廣義的具身智能系統(tǒng)。
如果只把這套邏輯當(dāng)成概念包裝,其實(shí)會(huì)低估它。元戎啟行這次最現(xiàn)實(shí)的一點(diǎn),是它給終局找到了一條當(dāng)前可走的路徑:先從量產(chǎn)車開(kāi)始,把真實(shí)世界的數(shù)據(jù)、反饋和訓(xùn)練閉環(huán)做出來(lái)。
公開(kāi)報(bào)道顯示,搭載元戎啟行方案的量產(chǎn)車?yán)塾?jì)交付已超過(guò)25萬(wàn)輛;公司方面同時(shí)強(qiáng)調(diào),這些車輛在復(fù)雜道路中的場(chǎng)景理解能力,可以遷移到 Robotaxi 研發(fā)中。其面向量產(chǎn)輔助駕駛的數(shù)據(jù)閉環(huán)周期已壓縮到12小時(shí)。無(wú)論這些數(shù)字最終效果如何,至少說(shuō)明一件事:它不是先去做人形機(jī)器人,再倒推通用模型,而是先在車這個(gè)高頻、高風(fēng)險(xiǎn)、高反饋密度的場(chǎng)景里,把模型打磨出來(lái)。
這條路徑的現(xiàn)實(shí)性,恰恰在于汽車行業(yè)的特殊性。車是少數(shù)已經(jīng)具備規(guī)?;布d體、持續(xù)在線運(yùn)行環(huán)境、海量真實(shí)場(chǎng)景數(shù)據(jù),以及明確安全邊界要求的行業(yè)。
換句話說(shuō),汽車很可能是離物理AI最近的訓(xùn)練場(chǎng)。英偉達(dá)對(duì) physical AI 的最新布局里,也一再把自動(dòng)駕駛和機(jī)器人并列:從 Cosmos 世界模型,到開(kāi)放數(shù)據(jù)工廠藍(lán)圖,再到面向自動(dòng)駕駛長(zhǎng)尾場(chǎng)景的開(kāi)放模型家族,底層思路都指向同一個(gè)方向——用更統(tǒng)一的世界建模和仿真能力,處理真實(shí)世界里最昂貴的長(zhǎng)尾問(wèn)題。
所以,汽車行業(yè)積累的數(shù)據(jù)、算力和工程體系,不只能服務(wù)于賣車,也可能反過(guò)來(lái)成為物理AI時(shí)代最先成型的一塊底座,因?yàn)檐囀亲钯F也最有效的數(shù)據(jù)源。
當(dāng)然,這條路線還遠(yuǎn)沒(méi)到可以下結(jié)論的時(shí)候。Foundation Model 能不能真正解決輔助駕駛里的安全一致性、責(zé)任邊界和長(zhǎng)尾穩(wěn)定性,最終還要看量產(chǎn)表現(xiàn),而不是技術(shù)演講。尤其在智能駕駛領(lǐng)域,所有宏大敘事最后都要落到一個(gè)最樸素的問(wèn)題上:用戶敢不敢開(kāi),車企敢不敢上,監(jiān)管敢不敢放。
但從行業(yè)競(jìng)爭(zhēng)的角度看,元戎啟行在GTC釋放這個(gè)信號(hào),仍然值得重視。因?yàn)檫^(guò)去兩年,汽車AI的主導(dǎo)敘事,基本掌握在特斯拉、英偉達(dá)這樣的平臺(tái)型巨頭手里。中國(guó)智駕公司更多是在做應(yīng)用落地、性能追趕和成本優(yōu)化,很少有人試圖從“底層范式”層面重新定義自己。
元戎啟行這次的動(dòng)作,本質(zhì)上是在爭(zhēng)奪一個(gè)新的解釋權(quán):它不滿足于被理解成一家輔助駕駛供應(yīng)商,而是試圖把自己放進(jìn)物理AI的更大坐標(biāo)系里。
這件事能不能成功,現(xiàn)在還言之過(guò)早。但有一點(diǎn)已經(jīng)越來(lái)越清楚:輔助駕駛行業(yè)正在進(jìn)入一個(gè)新階段。過(guò)去比的是有沒(méi)有功能、有沒(méi)有地圖、能不能開(kāi);接下來(lái)比的,是誰(shuí)能先做出一個(gè)足夠統(tǒng)一、足夠可遷移、足夠能在真實(shí)世界里持續(xù)學(xué)習(xí)的“大腦”,只有這個(gè)才能拉開(kāi)差距。(作者|李玉鵬,編輯|李程程)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論