圖源理想汽車官微
從技術(shù)角度看,把VLM引入端到端架構(gòu)中,就可基于感知信息和導(dǎo)航數(shù)據(jù)做出推理,并生成“前方路口遇紅燈,會(huì)減速停車”的意圖描述,這不僅給予研發(fā)工程師一個(gè)優(yōu)化架構(gòu)的窗口,對(duì)于車主用戶來(lái)說(shuō),也是更人性化的智駕交互。
正因這樣,才有了智駕行業(yè)在去年初對(duì)VLM架構(gòu)的追逐熱潮。只不過(guò),VLM很快也被認(rèn)為只是一個(gè)過(guò)渡架構(gòu)。
因?yàn)閺募軜?gòu)上看,VLM只是覆蓋了傳統(tǒng)端到端的感知到?jīng)Q策流程,缺乏對(duì)于最后控制輸出的理解,導(dǎo)致端到端架構(gòu)依然存在多模塊的協(xié)作,消耗過(guò)多算力的同時(shí),整體效率還不高。
在這背景下,VLA架構(gòu)應(yīng)運(yùn)而生。相較于VLM,VLA補(bǔ)全了動(dòng)作特征的對(duì)齊,讓感知到?jīng)Q策、再到動(dòng)作輸出全部集成到一個(gè)完整的神經(jīng)網(wǎng)絡(luò)中,既實(shí)現(xiàn)了一段式端到端的完整性,又保證了高效和非“黑箱”特性。
按照元戎啟行CEO周光的話來(lái)說(shuō),VLA既有全程可求導(dǎo)的端到端神經(jīng)網(wǎng)絡(luò)形式,又有大語(yǔ)言模型的推理能力。由于VLA補(bǔ)足了傳統(tǒng)端到端架構(gòu)的諸多不足,由此該架構(gòu)的誕生也被行業(yè)稱為“端到端2.0時(shí)代”。
![]()
圖源元戎啟行
為了在這個(gè)新技術(shù)時(shí)代中爭(zhēng)奪到優(yōu)勢(shì),玩家們紛紛快速涌入。
在去年三月的英偉達(dá)GTC大會(huì)上,理想發(fā)布了MindVLA模型,通過(guò)語(yǔ)言模型把3D編碼器和邏輯推理結(jié)合,給出駕駛決策的同時(shí),還要對(duì)周圍環(huán)境和自車駕駛行為進(jìn)行編碼,基于Diffusion模型優(yōu)化出最佳的駕駛軌跡,從而成為其官方口中的“貼心的專職司機(jī)”。
正因如此,當(dāng)理想他們?cè)谌ツ?月正式向用戶推送VLA模型時(shí),將其稱為“司機(jī)大模型”。幾乎在同時(shí),元戎啟行也發(fā)布了他們的VLA大模型,并宣布會(huì)先搭載在5款產(chǎn)品上,累計(jì)覆蓋約20萬(wàn)輛車。
從進(jìn)場(chǎng)時(shí)間看,元戎啟行也很早。去年上海車展上,他們就宣布正在基于火山引擎算力的支持,加速推動(dòng)VLA模型的迭代開(kāi)發(fā)。
同在去年8月,小鵬汽車在全新P7的發(fā)布會(huì)上,也端出了他們的VLA+VLM模型,為了讓該模型在車端進(jìn)行部署,小鵬為全新P7搭載了三顆圖靈AI芯片,總算力達(dá)到了2250 TOPS。
除了以上玩家之外,在最近2026 CES展上,智駕企業(yè)Nullmax宣布成功完成VLA模型在黑芝麻華山A2000上的深度適配與驗(yàn)證。
![]()
圖源黑芝麻智能官微
就在VLA模型陣營(yíng)規(guī)模越來(lái)越大時(shí),以世界模型為技術(shù)路線的陣營(yíng)隨之出現(xiàn)。
其中以華為乾崑為代表,在去年4月發(fā)布了ADS 4輔助駕駛系統(tǒng),采用了其自研的WEWA架構(gòu),主要由云端運(yùn)行的World Engine世界引擎和車端運(yùn)行的World Action Model 世界行為模型組成。
提到世界模型,很多人并不陌生,因?yàn)槔硐?、小鵬、零跑和商湯絕影等國(guó)內(nèi)玩家為了做數(shù)據(jù)自動(dòng)標(biāo)注和算法仿真訓(xùn)練已經(jīng)早已布局。
但按照華為乾崑他們的介紹,車端的世界行為模型WA,并不是簡(jiǎn)單從云端模型修剪而生,而是基于視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)等感知數(shù)據(jù),經(jīng)過(guò)Token化后訓(xùn)練出的原生基模型。
VLA和世界模型兩條路線,都不完美。
在世界模型路線的擁躉們看來(lái),由于VLA架構(gòu)中存在大語(yǔ)言模型,不僅會(huì)增大車端的算力要求,同時(shí)對(duì)于輔助駕駛所需要的空間感知和推理能力比較弱;而VLA路線的堅(jiān)定者則認(rèn)為,世界模型由于缺少了語(yǔ)言推理能力,在面對(duì)復(fù)雜路況時(shí)會(huì)很難處理好。
由此,從去年下半年開(kāi)始智駕行業(yè)中就展開(kāi)了端到端、VLA和世界模型的三種技術(shù)路線優(yōu)劣之爭(zhēng)。
而就在這個(gè)關(guān)鍵節(jié)點(diǎn),特斯拉時(shí)隔三年再次公開(kāi)了他們?cè)谥悄荞{駛技術(shù)路線的新進(jìn)展,正當(dāng)大家期待特斯拉能像之前那樣給出新的“奮斗目標(biāo)”時(shí),卻發(fā)現(xiàn)特斯拉已不是智駕行業(yè)標(biāo)準(zhǔn)答案了。
去年ICCV大會(huì)上,特斯拉公布了他們的技術(shù)路線,應(yīng)該是把現(xiàn)有端到端、VLA和世界模型都融合了,去支持他們自動(dòng)駕駛和機(jī)器人未來(lái)的發(fā)展。飛說(shuō)智行曾在《深度 | 特斯拉已不是智駕行業(yè)“標(biāo)準(zhǔn)答案”》一文中對(duì)此進(jìn)行過(guò)詳細(xì)分析。
雖然特斯拉沒(méi)有給出新的技術(shù)方向,但對(duì)于智駕算法架構(gòu)的創(chuàng)新并沒(méi)有停下。
去年小鵬AI科技日上,他們發(fā)布了第二代VLA模型,相較于傳統(tǒng)VLA模型去掉了V(Vision,以下簡(jiǎn)稱為V)到L(Language,以下簡(jiǎn)稱為L(zhǎng))的轉(zhuǎn)譯過(guò)程,而是用V+L再到A(Action)的全新架構(gòu)替代。
細(xì)化來(lái)看,小鵬的第二代VLA模型中的L并不是完全被舍棄了,而是把現(xiàn)實(shí)世界中的語(yǔ)義信息和視覺(jué)信息進(jìn)行隱式Token化,同時(shí)用注意力交叉機(jī)制進(jìn)行對(duì)齊,最后輸出動(dòng)作決策?;蛟S正是這個(gè)原因,小鵬他們依然將其稱為VLA模型,而不是VA模型。
![]()
小鵬汽車第二代VLA模型架構(gòu),圖源小鵬汽車
在行業(yè)看來(lái),特斯拉并不是沒(méi)有給出方向,之后的智駕算法路線演進(jìn)有可能會(huì)無(wú)限收斂,包括端到端、VLA和世界模型三者的融合進(jìn)化,進(jìn)而在智駕體驗(yàn)上進(jìn)行持續(xù)完善和優(yōu)化。
正像蘇箐說(shuō)的那樣:“AI和AGI的基礎(chǔ)理論在未來(lái)三到五年可能不會(huì)有全新的突破,很大概率未來(lái)三年是在現(xiàn)有的系統(tǒng)上做極致的優(yōu)化,而不是理論內(nèi)核的重構(gòu),行業(yè)又進(jìn)入苦日子的階段了。”
這樣來(lái)看,無(wú)論是智駕功能的規(guī)模落地,還是智駕算法的技術(shù)突破,都存在肉眼可見(jiàn)的挑戰(zhàn)。但對(duì)于已經(jīng)到來(lái)的2026年,也是機(jī)遇和壓力并存的一年。
2025年最后一個(gè)月,智駕行業(yè)正式殺入“L3時(shí)代”。
去年12月15日,工業(yè)和信息化部在第401批《道路機(jī)動(dòng)車輛生產(chǎn)企業(yè)及產(chǎn)品公告》中,首次給予L3級(jí)有條件自動(dòng)駕駛車型附條件準(zhǔn)入許可。
公開(kāi)信息顯示,北汽極狐阿爾法S6(由阿爾法S更名)和長(zhǎng)安深藍(lán)SL03成為首批獲準(zhǔn)車型,將分別在北京、重慶的指定高速與快速路段開(kāi)展上路試點(diǎn)。
![]()
工信部許可兩款L3級(jí)自動(dòng)駕駛車型產(chǎn)品,截圖自工信部官網(wǎng)
小鵬和理想緊隨其后。前者宣布已在廣州市獲得L3級(jí)自動(dòng)駕駛道路測(cè)試牌照,并啟動(dòng)常態(tài)化測(cè)試;后者則是宣布已在北京市獲得L3級(jí)自動(dòng)駕駛道路測(cè)試牌照,并持續(xù)開(kāi)展常態(tài)化L3級(jí)道路測(cè)試。
除了以上四家車企之外,據(jù)21世紀(jì)經(jīng)濟(jì)新聞報(bào)道,截至去年底比亞迪、廣汽和華為乾崑也已經(jīng)在深圳、廣州等城市開(kāi)展高速L3路測(cè)。另?yè)?jù)最新消息,吉利汽車在這兩天獲得了杭州市全域L3級(jí)自動(dòng)駕駛道路測(cè)試牌照。
不過(guò),北汽、長(zhǎng)安的“產(chǎn)品準(zhǔn)入”與小鵬、理想和比亞迪們的“測(cè)試牌照”屬兩類許可,前者意味著相關(guān)產(chǎn)品已具備在現(xiàn)實(shí)道路條件下運(yùn)行的L3能力,后者則側(cè)重特定路段技術(shù)驗(yàn)證。
更重要的是,“產(chǎn)品準(zhǔn)入”并不代表普通消費(fèi)者就可以體驗(yàn),而是需要在嚴(yán)格限定條件下進(jìn)行上路試點(diǎn)。從長(zhǎng)安和北汽兩款車的試點(diǎn)道路環(huán)境和范圍就能看到,都屬于高速和城快這樣的封閉道路,且開(kāi)啟功能后最高時(shí)速被限定在50km/h和80km/h,以及不允許變道。
但在法律法規(guī)上,這次有了更清晰的認(rèn)定,如果在L3試點(diǎn)過(guò)程中發(fā)生事故,擔(dān)責(zé)的將是車企,被視為讓L3的落地向前推進(jìn)了許多。
L3之外,像小鵬為代表的部分車企,甚至準(zhǔn)備從L2直接跨越到L4,計(jì)劃在今年推動(dòng)L4自動(dòng)駕駛的落地,以及卓馭、地平線、黑芝麻智能、Nullmax和Momenta等智駕企業(yè),也都在這兩年喊出了要推進(jìn)L3乃至L4落地的發(fā)展目標(biāo)。
這樣看,這次試點(diǎn)L3雖然依舊很謹(jǐn)慎,但像以上車企和智駕企業(yè)們這樣的蜂擁向前,在飛說(shuō)智行看來(lái),這些玩家除了要完善L2輔助駕駛體驗(yàn)之外,L3乃至L4的落地競(jìng)速賽應(yīng)該會(huì)在今年正式打響。
除了朝L3向高沖擊之外,智駕行業(yè)的玩家們?cè)诮衲赀€準(zhǔn)備打一場(chǎng)生態(tài)對(duì)抗戰(zhàn)。
在去年底的卓馭品牌盛典2025上,沈劭劼宣布他們將構(gòu)建空間智能移動(dòng)基座,引領(lǐng)自主移動(dòng)機(jī)器人時(shí)代。需要注意的是,這里的“移動(dòng)機(jī)器人”并不是只局限于機(jī)器人本身,而是更廣義的移動(dòng)物理領(lǐng)域。
比如他們已啟動(dòng)重卡高速NOA項(xiàng)目,并與徐工、陜汽、重汽三大業(yè)界頭部企業(yè)確立合作,首批重卡車型將于2026年上半年正式量產(chǎn),以便提升干線物流的安全與效率水平。
此外,沈劭劼也透露他們正聯(lián)合商用車頭部企業(yè),共同設(shè)計(jì)和定義無(wú)人物流車,應(yīng)用于礦山、港口等場(chǎng)景的智能化轉(zhuǎn)型。
這意味著卓馭正在基于在乘用車輔助駕駛的長(zhǎng)期布局,以及空間智能移動(dòng)基座能力,向輔助駕駛重卡和無(wú)人物流車領(lǐng)域延伸邊界,在未來(lái)他們也很有可能會(huì)布局機(jī)器人業(yè)務(wù)。
同為智駕企業(yè)的黑芝麻智能和地平線,在去年相繼舉辦了大會(huì),前者在去年11月的機(jī)器人平臺(tái)產(chǎn)品發(fā)布會(huì)上,發(fā)布了面向機(jī)器人產(chǎn)業(yè)的SesameX多維智能計(jì)算平臺(tái),并通過(guò)Kalos、Aura、Liora三款核心計(jì)算模組來(lái)為整個(gè)機(jī)器人產(chǎn)業(yè)裝上“全腦”。
地平線則是在他們的技術(shù)生態(tài)大會(huì)上喊出了“向高同行”的口號(hào),這不只是為了智駕業(yè)務(wù),也是對(duì)他們的機(jī)器人業(yè)務(wù)所喊出,畢竟旗下的地瓜機(jī)器人上市產(chǎn)品超過(guò)100款,連接著超100家上下游合作伙伴與10萬(wàn)余名開(kāi)發(fā)者。
卓馭、黑芝麻智能和地平線這些智駕企業(yè),之所以能擴(kuò)展自身的業(yè)務(wù)邊界,來(lái)布局機(jī)器人、無(wú)人物流車等這些生態(tài)業(yè)務(wù),共同點(diǎn)在于都是擁有豐富的智能駕駛算法研發(fā),感知到?jīng)Q策融合開(kāi)發(fā)和數(shù)據(jù)獲取、處理等經(jīng)驗(yàn),而這些經(jīng)驗(yàn)也是具身智能機(jī)器人研發(fā)和落地的基礎(chǔ)。
正因這樣,在業(yè)內(nèi)看來(lái)今年應(yīng)該還會(huì)有其他智駕企業(yè)進(jìn)入到這場(chǎng)生態(tài)對(duì)抗戰(zhàn)中,從而讓這場(chǎng)生態(tài)戰(zhàn)變得更加激烈。
就像二戰(zhàn)時(shí),各個(gè)大國(guó)比拼的是誰(shuí)能更快造出原子彈,誰(shuí)就能搶到?jīng)Q定戰(zhàn)爭(zhēng)的優(yōu)勢(shì)一樣,目前智駕行業(yè)也已進(jìn)入到這樣的淘汰戰(zhàn)場(chǎng)中,無(wú)論是奔向L3和L4、還是發(fā)展產(chǎn)業(yè)生態(tài),大家的目標(biāo)都是實(shí)現(xiàn)物理AI的更快落地。
因此,對(duì)于車企們,還是智駕企業(yè)們來(lái)說(shuō),接下來(lái)比拼的就是誰(shuí)能不受干擾和集中資源更快地奔向目標(biāo)。畢竟在這場(chǎng)更加無(wú)限透明的戰(zhàn)局中,時(shí)間就是每一個(gè)玩家手中最有力的武器。
(本文頭圖來(lái)源于《奧本海默》劇照。)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論