圖源理想汽車官微

從技術(shù)角度看,把VLM引入端到端架構(gòu)中,就可基于感知信息和導(dǎo)航數(shù)據(jù)做出推理,并生成“前方路口遇紅燈,會(huì)減速停車”的意圖描述,這不僅給予研發(fā)工程師一個(gè)優(yōu)化架構(gòu)的窗口,對(duì)于車主用戶來(lái)說(shuō),也是更人性化的智駕交互。

正因這樣,才有了智駕行業(yè)在去年初對(duì)VLM架構(gòu)的追逐熱潮。只不過(guò),VLM很快也被認(rèn)為只是一個(gè)過(guò)渡架構(gòu)。

因?yàn)閺募軜?gòu)上看,VLM只是覆蓋了傳統(tǒng)端到端的感知到?jīng)Q策流程,缺乏對(duì)于最后控制輸出的理解,導(dǎo)致端到端架構(gòu)依然存在多模塊的協(xié)作,消耗過(guò)多算力的同時(shí),整體效率還不高。

在這背景下,VLA架構(gòu)應(yīng)運(yùn)而生。相較于VLM,VLA補(bǔ)全了動(dòng)作特征的對(duì)齊,讓感知到?jīng)Q策、再到動(dòng)作輸出全部集成到一個(gè)完整的神經(jīng)網(wǎng)絡(luò)中,既實(shí)現(xiàn)了一段式端到端的完整性,又保證了高效和非“黑箱”特性。

按照元戎啟行CEO周光的話來(lái)說(shuō),VLA既有全程可求導(dǎo)的端到端神經(jīng)網(wǎng)絡(luò)形式,又有大語(yǔ)言模型的推理能力。由于VLA補(bǔ)足了傳統(tǒng)端到端架構(gòu)的諸多不足,由此該架構(gòu)的誕生也被行業(yè)稱為“端到端2.0時(shí)代”。

圖源元戎啟行

為了在這個(gè)新技術(shù)時(shí)代中爭(zhēng)奪到優(yōu)勢(shì),玩家們紛紛快速涌入。

在去年三月的英偉達(dá)GTC大會(huì)上,理想發(fā)布了MindVLA模型,通過(guò)語(yǔ)言模型把3D編碼器和邏輯推理結(jié)合,給出駕駛決策的同時(shí),還要對(duì)周圍環(huán)境和自車駕駛行為進(jìn)行編碼,基于Diffusion模型優(yōu)化出最佳的駕駛軌跡,從而成為其官方口中的“貼心的專職司機(jī)”。

正因如此,當(dāng)理想他們?cè)谌ツ?月正式向用戶推送VLA模型時(shí),將其稱為“司機(jī)大模型”。幾乎在同時(shí),元戎啟行也發(fā)布了他們的VLA大模型,并宣布會(huì)先搭載在5款產(chǎn)品上,累計(jì)覆蓋約20萬(wàn)輛車。

從進(jìn)場(chǎng)時(shí)間看,元戎啟行也很早。去年上海車展上,他們就宣布正在基于火山引擎算力的支持,加速推動(dòng)VLA模型的迭代開(kāi)發(fā)。

同在去年8月,小鵬汽車在全新P7的發(fā)布會(huì)上,也端出了他們的VLA+VLM模型,為了讓該模型在車端進(jìn)行部署,小鵬為全新P7搭載了三顆圖靈AI芯片,總算力達(dá)到了2250 TOPS。

除了以上玩家之外,在最近2026 CES展上,智駕企業(yè)Nullmax宣布成功完成VLA模型在黑芝麻華山A2000上的深度適配與驗(yàn)證。

圖源黑芝麻智能官微

就在VLA模型陣營(yíng)規(guī)模越來(lái)越大時(shí),以世界模型為技術(shù)路線的陣營(yíng)隨之出現(xiàn)。

其中以華為乾崑為代表,在去年4月發(fā)布了ADS 4輔助駕駛系統(tǒng),采用了其自研的WEWA架構(gòu),主要由云端運(yùn)行的World Engine世界引擎和車端運(yùn)行的World Action Model 世界行為模型組成。

提到世界模型,很多人并不陌生,因?yàn)槔硐?、小鵬、零跑和商湯絕影等國(guó)內(nèi)玩家為了做數(shù)據(jù)自動(dòng)標(biāo)注和算法仿真訓(xùn)練已經(jīng)早已布局。

但按照華為乾崑他們的介紹,車端的世界行為模型WA,并不是簡(jiǎn)單從云端模型修剪而生,而是基于視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)等感知數(shù)據(jù),經(jīng)過(guò)Token化后訓(xùn)練出的原生基模型。

VLA和世界模型兩條路線,都不完美。

在世界模型路線的擁躉們看來(lái),由于VLA架構(gòu)中存在大語(yǔ)言模型,不僅會(huì)增大車端的算力要求,同時(shí)對(duì)于輔助駕駛所需要的空間感知和推理能力比較弱;而VLA路線的堅(jiān)定者則認(rèn)為,世界模型由于缺少了語(yǔ)言推理能力,在面對(duì)復(fù)雜路況時(shí)會(huì)很難處理好。

由此,從去年下半年開(kāi)始智駕行業(yè)中就展開(kāi)了端到端、VLA和世界模型的三種技術(shù)路線優(yōu)劣之爭(zhēng)。

而就在這個(gè)關(guān)鍵節(jié)點(diǎn),特斯拉時(shí)隔三年再次公開(kāi)了他們?cè)谥悄荞{駛技術(shù)路線的新進(jìn)展,正當(dāng)大家期待特斯拉能像之前那樣給出新的“奮斗目標(biāo)”時(shí),卻發(fā)現(xiàn)特斯拉已不是智駕行業(yè)標(biāo)準(zhǔn)答案了。

去年ICCV大會(huì)上,特斯拉公布了他們的技術(shù)路線,應(yīng)該是把現(xiàn)有端到端、VLA和世界模型都融合了,去支持他們自動(dòng)駕駛和機(jī)器人未來(lái)的發(fā)展。飛說(shuō)智行曾在《深度 | 特斯拉已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”》一文中對(duì)此進(jìn)行過(guò)詳細(xì)分析。

雖然特斯拉沒(méi)有給出新的技術(shù)方向,但對(duì)于智駕算法架構(gòu)的創(chuàng)新并沒(méi)有停下。

去年小鵬AI科技日上,他們發(fā)布了第二代VLA模型,相較于傳統(tǒng)VLA模型去掉了V(Vision,以下簡(jiǎn)稱為V)到L(Language,以下簡(jiǎn)稱為L(zhǎng))的轉(zhuǎn)譯過(guò)程,而是用V+L再到A(Action)的全新架構(gòu)替代。

細(xì)化來(lái)看,小鵬的第二代VLA模型中的L并不是完全被舍棄了,而是把現(xiàn)實(shí)世界中的語(yǔ)義信息和視覺(jué)信息進(jìn)行隱式Token化,同時(shí)用注意力交叉機(jī)制進(jìn)行對(duì)齊,最后輸出動(dòng)作決策?;蛟S正是這個(gè)原因,小鵬他們依然將其稱為VLA模型,而不是VA模型。

小鵬汽車第二代VLA模型架構(gòu),圖源小鵬汽車

在行業(yè)看來(lái),特斯拉并不是沒(méi)有給出方向,之后的智駕算法路線演進(jìn)有可能會(huì)無(wú)限收斂,包括端到端、VLA和世界模型三者的融合進(jìn)化,進(jìn)而在智駕體驗(yàn)上進(jìn)行持續(xù)完善和優(yōu)化。

正像蘇箐說(shuō)的那樣:“AI和AGI的基礎(chǔ)理論在未來(lái)三到五年可能不會(huì)有全新的突破,很大概率未來(lái)三年是在現(xiàn)有的系統(tǒng)上做極致的優(yōu)化,而不是理論內(nèi)核的重構(gòu),行業(yè)又進(jìn)入苦日子的階段了。”

這樣來(lái)看,無(wú)論是智駕功能的規(guī)模落地,還是智駕算法的技術(shù)突破,都存在肉眼可見(jiàn)的挑戰(zhàn)。但對(duì)于已經(jīng)到來(lái)的2026年,也是機(jī)遇和壓力并存的一年。

3、2026智駕行業(yè),向更高和更廣的物理AI發(fā)起沖擊

2025年最后一個(gè)月,智駕行業(yè)正式殺入“L3時(shí)代”。

去年12月15日,工業(yè)和信息化部在第401批《道路機(jī)動(dòng)車輛生產(chǎn)企業(yè)及產(chǎn)品公告》中,首次給予L3級(jí)有條件自動(dòng)駕駛車型附條件準(zhǔn)入許可。

公開(kāi)信息顯示,北汽極狐阿爾法S6(由阿爾法S更名)和長(zhǎng)安深藍(lán)SL03成為首批獲準(zhǔn)車型,將分別在北京、重慶的指定高速與快速路段開(kāi)展上路試點(diǎn)。

工信部許可兩款L3級(jí)自動(dòng)駕駛車型產(chǎn)品,截圖自工信部官網(wǎng)

小鵬和理想緊隨其后。前者宣布已在廣州市獲得L3級(jí)自動(dòng)駕駛道路測(cè)試牌照,并啟動(dòng)常態(tài)化測(cè)試;后者則是宣布已在北京市獲得L3級(jí)自動(dòng)駕駛道路測(cè)試牌照,并持續(xù)開(kāi)展常態(tài)化L3級(jí)道路測(cè)試。

除了以上四家車企之外,據(jù)21世紀(jì)經(jīng)濟(jì)新聞報(bào)道,截至去年底比亞迪、廣汽和華為乾崑也已經(jīng)在深圳、廣州等城市開(kāi)展高速L3路測(cè)。另?yè)?jù)最新消息,吉利汽車在這兩天獲得了杭州市全域L3級(jí)自動(dòng)駕駛道路測(cè)試牌照。

不過(guò),北汽、長(zhǎng)安的“產(chǎn)品準(zhǔn)入”與小鵬、理想和比亞迪們的“測(cè)試牌照”屬兩類許可,前者意味著相關(guān)產(chǎn)品已具備在現(xiàn)實(shí)道路條件下運(yùn)行的L3能力,后者則側(cè)重特定路段技術(shù)驗(yàn)證。

更重要的是,“產(chǎn)品準(zhǔn)入”并不代表普通消費(fèi)者就可以體驗(yàn),而是需要在嚴(yán)格限定條件下進(jìn)行上路試點(diǎn)。從長(zhǎng)安和北汽兩款車的試點(diǎn)道路環(huán)境和范圍就能看到,都屬于高速和城快這樣的封閉道路,且開(kāi)啟功能后最高時(shí)速被限定在50km/h和80km/h,以及不允許變道。

但在法律法規(guī)上,這次有了更清晰的認(rèn)定,如果在L3試點(diǎn)過(guò)程中發(fā)生事故,擔(dān)責(zé)的將是車企,被視為讓L3的落地向前推進(jìn)了許多。

L3之外,像小鵬為代表的部分車企,甚至準(zhǔn)備從L2直接跨越到L4,計(jì)劃在今年推動(dòng)L4自動(dòng)駕駛的落地,以及卓馭、地平線、黑芝麻智能、Nullmax和Momenta等智駕企業(yè),也都在這兩年喊出了要推進(jìn)L3乃至L4落地的發(fā)展目標(biāo)。

這樣看,這次試點(diǎn)L3雖然依舊很謹(jǐn)慎,但像以上車企和智駕企業(yè)們這樣的蜂擁向前,在飛說(shuō)智行看來(lái),這些玩家除了要完善L2輔助駕駛體驗(yàn)之外,L3乃至L4的落地競(jìng)速賽應(yīng)該會(huì)在今年正式打響。

除了朝L3向高沖擊之外,智駕行業(yè)的玩家們?cè)诮衲赀€準(zhǔn)備打一場(chǎng)生態(tài)對(duì)抗戰(zhàn)。

在去年底的卓馭品牌盛典2025上,沈劭劼宣布他們將構(gòu)建空間智能移動(dòng)基座,引領(lǐng)自主移動(dòng)機(jī)器人時(shí)代。需要注意的是,這里的“移動(dòng)機(jī)器人”并不是只局限于機(jī)器人本身,而是更廣義的移動(dòng)物理領(lǐng)域。

比如他們已啟動(dòng)重卡高速NOA項(xiàng)目,并與徐工、陜汽、重汽三大業(yè)界頭部企業(yè)確立合作,首批重卡車型將于2026年上半年正式量產(chǎn),以便提升干線物流的安全與效率水平。

此外,沈劭劼也透露他們正聯(lián)合商用車頭部企業(yè),共同設(shè)計(jì)和定義無(wú)人物流車,應(yīng)用于礦山、港口等場(chǎng)景的智能化轉(zhuǎn)型。

這意味著卓馭正在基于在乘用車輔助駕駛的長(zhǎng)期布局,以及空間智能移動(dòng)基座能力,向輔助駕駛重卡和無(wú)人物流車領(lǐng)域延伸邊界,在未來(lái)他們也很有可能會(huì)布局機(jī)器人業(yè)務(wù)。

同為智駕企業(yè)的黑芝麻智能和地平線,在去年相繼舉辦了大會(huì),前者在去年11月的機(jī)器人平臺(tái)產(chǎn)品發(fā)布會(huì)上,發(fā)布了面向機(jī)器人產(chǎn)業(yè)的SesameX多維智能計(jì)算平臺(tái),并通過(guò)Kalos、Aura、Liora三款核心計(jì)算模組來(lái)為整個(gè)機(jī)器人產(chǎn)業(yè)裝上“全腦”。

地平線則是在他們的技術(shù)生態(tài)大會(huì)上喊出了“向高同行”的口號(hào),這不只是為了智駕業(yè)務(wù),也是對(duì)他們的機(jī)器人業(yè)務(wù)所喊出,畢竟旗下的地瓜機(jī)器人上市產(chǎn)品超過(guò)100款,連接著超100家上下游合作伙伴與10萬(wàn)余名開(kāi)發(fā)者。

卓馭、黑芝麻智能和地平線這些智駕企業(yè),之所以能擴(kuò)展自身的業(yè)務(wù)邊界,來(lái)布局機(jī)器人、無(wú)人物流車等這些生態(tài)業(yè)務(wù),共同點(diǎn)在于都是擁有豐富的智能駕駛算法研發(fā),感知到?jīng)Q策融合開(kāi)發(fā)和數(shù)據(jù)獲取、處理等經(jīng)驗(yàn),而這些經(jīng)驗(yàn)也是具身智能機(jī)器人研發(fā)和落地的基礎(chǔ)。

正因這樣,在業(yè)內(nèi)看來(lái)今年應(yīng)該還會(huì)有其他智駕企業(yè)進(jìn)入到這場(chǎng)生態(tài)對(duì)抗戰(zhàn)中,從而讓這場(chǎng)生態(tài)戰(zhàn)變得更加激烈。

就像二戰(zhàn)時(shí),各個(gè)大國(guó)比拼的是誰(shuí)能更快造出原子彈,誰(shuí)就能搶到?jīng)Q定戰(zhàn)爭(zhēng)的優(yōu)勢(shì)一樣,目前智駕行業(yè)也已進(jìn)入到這樣的淘汰戰(zhàn)場(chǎng)中,無(wú)論是奔向L3和L4、還是發(fā)展產(chǎn)業(yè)生態(tài),大家的目標(biāo)都是實(shí)現(xiàn)物理AI的更快落地。

因此,對(duì)于車企們,還是智駕企業(yè)們來(lái)說(shuō),接下來(lái)比拼的就是誰(shuí)能不受干擾和集中資源更快地奔向目標(biāo)。畢竟在這場(chǎng)更加無(wú)限透明的戰(zhàn)局中,時(shí)間就是每一個(gè)玩家手中最有力的武器。

(本文頭圖來(lái)源于《奧本海默》劇照。)

本文系作者 飛說(shuō)智行 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

15:24

本周新增范式智能、斯比特等4家上市輔導(dǎo)備案企業(yè)

15:23

本周新增寶蓋新材、雙林股份等3家境外上市備案企業(yè)

15:10

日本民眾舉行抗議集會(huì),敦促日本政府就強(qiáng)闖使館事件道歉

15:07

華創(chuàng)證券:四重維度透視中國(guó)寬基指數(shù)的“中游制造”成色

15:01

國(guó)內(nèi)兆瓦級(jí)液氫燃料航空發(fā)動(dòng)機(jī)首次整機(jī)性能達(dá)標(biāo)

14:30

河南:聚焦老年用品研發(fā)生產(chǎn)培育龍頭企業(yè)和產(chǎn)業(yè)集群,建設(shè)高標(biāo)準(zhǔn)養(yǎng)老產(chǎn)業(yè)園區(qū)

14:28

河南:到2027年養(yǎng)老服務(wù)等領(lǐng)域民政服務(wù)供給不斷優(yōu)化

14:02

宇樹(shù)科技王興興:具身智能GPT時(shí)刻大概還需兩到三年

14:01

阿塞拜疆首都地區(qū)降水量打破百年紀(jì)錄

13:54

蒙古國(guó)執(zhí)政黨選定總理候選人

13:32

本周南向資金凈買入251億港元,泡泡瑪特凈買入超36億港元

13:17

沙特每日700萬(wàn)桶石油繞過(guò)霍爾木茲

13:16

中東兩大鋁廠遇襲,恐影響全球供應(yīng)鏈

12:58

全國(guó)累計(jì)器官捐獻(xiàn)志愿登記人數(shù)超過(guò)733萬(wàn)

12:46

宇樹(shù)科技具身智能體驗(yàn)館亞洲首店將于5月底落地上海

12:44

洛杉磯10萬(wàn)人參加“不要國(guó)王”抗議,多人被捕

12:37

今年前兩月霍爾果斯口岸果蔬出口增長(zhǎng)29.3%

11:48

中國(guó)首臺(tái)商用12兆伏串列加速器成功下線

11:40

美副總統(tǒng)稱無(wú)意滯留伊朗,將很快撤出

11:39

中關(guān)村兩院具身通用智能基座模型與社會(huì)模擬器等科研成果發(fā)布

掃描下載App