左邊長租的V11 HW3 Model3,右邊短租3小時的V12 HW4 Model Y
V12的體驗主要在San Jose市(圣荷西,加州南部城市)進行的,體驗了4-5個小時。期間包括:非常接近國內城市市中心的復雜路段;多岔路的機場路,人車混雜和并且有較高的異形減速帶;Target和Costco繁忙的停車場,大量車輛與行人需要FSD進行交互;硅谷晚高峰上下高速,超級多車道需要排隊、變道,通過立交橋下巨大路口等等。
整體感受上,無論是轉向控制,還是與其他交通參與者的交流、長尾問題處理等,都非常絲滑、很“像人”。當然,它也有些不夠完美的地方。
1、V12的速度與轉向控制
V12和V11相比,最顯著的提升就是速度和轉向控制非常的絲滑平順。即使是坐在后排,在紅綠燈啟停以及路口轉彎過程中幾乎都感覺不到任何頓挫。
在速度控制上V12新增的Auto Speed模式使得FSD在速度控制上更加擬人,特別是在繁忙的城市路段使用Auto Speed與使用設定最高限速的模式相比可以獲得相對更好的體驗。不過V12.3在很多情況下給人感覺速度偏慢,這對于一些習慣快速駕駛的司機或乘客可能會不習慣。
與之相比,V11在速度控制上還較為生硬,一旦有機會便會盡可能迅速加速達到設定限速,給人感覺略微機械。特別是在一些社區(qū)小路,窄路以及惡劣天氣下,這種生硬的速度控制有時候會讓即使是我這樣有著豐富自動駕駛功能測試經(jīng)驗的從業(yè)者也感到一絲絲驚慌感。
2、路上與其他參與者交互
隨著體驗的漸漸深入就會發(fā)現(xiàn)V12采用的端到端訓練方法使得V12在一些難以明確用規(guī)則描述的場景細節(jié)處理上取得了巨大的進步。
例如繞行的時機與幅度,是否減速讓行以及減速的具體程度等等細節(jié),整體駕駛體驗非常擬人,流暢自然。
在遇到路邊閃雙閃的Amazon送貨卡車時,V12能夠毫不猶豫地判斷出對向無車,借道繞行,整個過程流暢自然,毫不遲疑;
面對右前方的騎行人的場景,V11會對騎行人過度小心,規(guī)劃出一條非常離譜的大幅繞行路線。而V12在面對類似情況的時候顯然更加從容淡定,繞行幅度非常接近人類駕駛員的選擇,速度控制和果斷程度也非常合理,并沒有異常急剎的情況出現(xiàn);
在直行遇到前方遠處左轉的車輛時,V11的反應是明顯減速。雖然規(guī)避了碰撞風險,但是減速幅度很大,有明顯頓挫感,會給乘客造成不舒適感覺,還增大了被后車追尾風險。而V12在遇到類似狀況時候似乎能夠準確判斷出前方車輛線路和速度,以一個非常合適的減速讓車上乘客幾乎無感的同時又留出了足夠的安全冗余空間。
在Stanford(斯坦福大學)附近,V11對騎行人過分小心,在紅綠燈路口規(guī)劃了非常詭異的繞行路線,最終導致侵占左側車空間接管。
3、V12如何掉頭、過環(huán)島
此外,V12相對V11還增加了很多新的能力,例如掉頭、靠邊停車、泊入車位等等,在我親身體驗中就經(jīng)歷了4次掉頭,三次成功的靠邊停車。

實測掉頭成功
另外V12在環(huán)島和停車場的處理上也比V11要有了顯著的提升。環(huán)島前讓車與否的決策更加果斷,在停車場中與行人的交互變得十分流暢安全,幾乎不會有異常狀態(tài)引起行人異樣的反應。甚至有一次在Target停車場,一位行人從我左側A柱穿行,在我還沒有注意到她的情況下,V12就柔和減速完成了一個完美的讓行。
美國有很多橫向穿行速度較快的無保護轉彎,依據(jù)美國交通習慣轉彎車輛要盡量不影響到高速行駛的其他車輛完成轉彎,甚至導致穿行車輛稍微減速的行為也會被鳴笛警告。因此無保護轉彎時機的選擇就非常重要,也對自動駕駛系統(tǒng)感知距離有著非常嚴格要求。
在這點上,至少我的幾次體驗V12表現(xiàn)都比較成功,能夠耐心等待時機,并且速度控制也較V11更為優(yōu)秀。有時候能夠不完全剎停,保持蠕行,還能較早進行預加速,保持通行高效。
4、視覺的測距能力
國內一些車企由于配置了前向激光雷達,對尺寸的測量非常精準,在狹窄狀態(tài)下通行能力十分強悍,甚至超過普通人類司機。
這次V12體驗中也遇到了美國城市里比較常見的路邊停車導致道路過窄,但V12非常果斷的從狹窄的道路上和對向會車通過。這一點之前在V11的測試視頻里就有發(fā)現(xiàn),所以可能并不算是提升,但是實際體驗的時候還是非常驚艷。
特別是,考慮到了FSD是純視覺,對尺寸的把握是純視覺的弱項,能做到這樣窄路果斷通行十分不易,而端到端訓練至少保持了這樣的能力,甚至在通行決策和速度控制上比V11更加優(yōu)秀一點。
5、長尾場景處理
在長尾Corner Case的處理上V12也有著非常優(yōu)秀的表現(xiàn)。在San Jose市中心測試過程曾遇到一位將椅子放在滑板上在路中間前后穿行的小哥。FSD準確識別到他的存在并且平穩(wěn)地減速避免了與其進行近距離交互,最終這個小哥被附近的警車注意到,驅離了路面;
測試中還有遇到自車車道有紙殼箱子、輪胎碎片等異形障礙物的場景,這些障礙物車機都沒有顯示檢測結果或者只以Occupancy的形式顯示。但是實際行駛中V12都能夠順利小幅偏移繞行了障礙物,沒有發(fā)生刮蹭磕碰;
最后一段測試由于是在San Jose晚高峰,車流非常密集,高速岔路上也啟用了流量控制信號等。這類信號燈是我第一次見到,他們分別有三個紅綠燈控制三條匯入車道,三個紅綠燈亮暗并不同步,而是根據(jù)主路車流情況分別控制紅綠。
而V12同樣可以理解三個紅綠燈分別控制的車道,在自己車道紅燈時等待,變綠后立即加速匯入主路,毫無遲疑。這說明V12雖然是端到端系統(tǒng),但對于紅綠燈的理解非常細節(jié),可以理解分時控制的燈以及他們控制的具體車道關系并正確應對。
6、V12開始智慧涌現(xiàn)?
上面的情況都證明著FSD V12是一個能力非常強的自動駕駛系統(tǒng),然而更令人驚訝的是V12一定程度地展現(xiàn)了我認為接近智慧涌現(xiàn)的一些現(xiàn)象。這是讓我感覺到V12的廣泛發(fā)布可能成為自動駕駛的“ChatGPT時刻”的一個重要原因。
我們在測試過程中,導航規(guī)劃了一個路口前掉頭的導航路線,中間是一個很寬的Suicide Lane(兩個方向左轉車輛都會進入的車道)車流密集,且V12目前還不能使用倒車檔完成三點掉頭,所以在路中間完成掉頭十分困難。
![]()
試駕時的suiside lane,藍色為導航路線,綠色為V12自主變動的路線
就在接近導航路線給出的掉頭位置附近,我們車上的乘客都在等待V12是否能完成這個十分困難的掉頭的時候。V12發(fā)現(xiàn)了道路右側有一個很小的路邊停車場,他果斷違背了導航路線,右轉進入停車場之后左轉繞出,打算通過右轉加左轉來代替一個標準掉頭動作。
雖然最后在停車場出口處V12因為某種原因系統(tǒng)提示接管(后猜測有可能是在停車場出口Suicide Lane是雙實線,導致系統(tǒng)覺得無法合法完成動作報接管,這也是我在整個V12體驗過程中唯一一次系統(tǒng)原因報接管)。
其實之前早在V12.2的早期版本就有過類似情況,不過親身經(jīng)歷了這樣的駕駛小聰明還是非常的驚喜,也說明了此類情況在如今的V12上已經(jīng)不是小概率事件。
對于目前主流自動駕駛技術來講,沿著導航路線行駛無疑是規(guī)控模塊的最主要目標,自行偏離導航的行為幾乎不可接受。然而如果我們從第一性原理上來理解這個情況就會覺得非常合理,老馬說過“Physics is the law,everything else is a recommendation(物理學就是定律,其他都是建議)”。
對于駕駛任務來講,顯然行人、車輛、路障、道路邊緣這些絕對不該碰撞的物理實體顯然就是律法,不可違背。然而導航信息也只是引導你到達目的地的一種提示信息而已,安全到達目的地是第一目標,navigation也只是個recommendation,自然也可以背離導航路線,特別是導航繞遠甚至出錯的情況下。
7、V12測試總結
當然FSD V12雖然功能十分強大,但還遠不是完美的。我的最后一次V12測試大概持續(xù)了1小時50分鐘左右,由于全程坐在后座,對V12的情況做了更詳細的統(tǒng)計。最終結果如下,除開一些人為原因的接管(如更換目的地等),一共大概有5次接管:
1.到達機場靠邊停車后繼續(xù)行駛,有碰撞路邊緣風險接管;
2. Costco小環(huán)島,車流非常密集,有一輛車輛沒有讓行環(huán)島內車流,將頭探進了環(huán)島,雖然左側有足夠空間,V12并沒有表現(xiàn)出足夠明確的繞行意圖,有碰撞風險,接管;
3.前方跟車掉頭,前車開始時想左轉進入車庫,后猶豫改為掉頭,V12跟車受到影響,路線不佳,轉到了比較接近路邊緣的地方,轉彎半徑不夠了,由于無法倒車,無法通過,人工接管;
4.掉頭改右轉進入停車場后左轉出來的case,系統(tǒng)報接管;
5.Costco停車場,沒有到達右轉路口,過早右轉,猶豫,有撞路沿的趨勢,接管。
但需要說明的是,整個駕駛體驗處于San Jose晚高峰,車流量很大(可能還是達不到國內晚高峰程度),而且刻意找了很多相對困難場景進行測試,所以正常駕駛狀態(tài)接管率應該會比這更低。
總的來說,V12通過端到端訓練學習到了非常擬人的駕駛行為,使得其駕駛決策更加合理,符合人類預期。這種符合預期長期來看會給使用者建立起來非常大的對系統(tǒng)的信心,減少了由于謹慎和不信任造成的接管,也有助于讓更多大眾而不只是偏極客屬性的Early Adopter去接受FSD,這對于FSD的普及有著非常重要的意義。
當然,也可以看到,雖然V12整體上在功能,體驗,擬人性,甚至駕駛智慧上都有了長足的進步,但是由于有些策略更加激進,所以安全的接管也還是不少。隨著FSD功能逐漸完善,性能逐漸提升,接下去很可能Tesla自動駕駛的最主要攻關難題就會變成對接管,特別是安全接管的持續(xù)打磨優(yōu)化上了。
盡管有瑕疵,以及會遇到一些系統(tǒng)無法完美處理的情況,但整體上來看,用戶對V12的反饋是十分正面的。
Tesla FSD自從2020年10月推送用戶以來,一直代表著自動駕駛技術的最前沿,問世之初這種不依賴激光雷達和高精地圖,真正的哪里都能開的自動駕駛功能甚至對于行業(yè)內的從業(yè)者來說都有點匪夷所思。
接下來2021、2022兩年,Tesla通過AI Day公布了大量FSD的技術方案,幾乎是傳道般帶火了如今在量產(chǎn)自動駕駛行業(yè)里被大家奉為圭臬的數(shù)據(jù)閉環(huán)、共享主干的多頭網(wǎng)絡、BEV感知,乃至后續(xù)的占據(jù)網(wǎng)絡Occupancy Network。
然而,雖然技術方案領先行業(yè)三年以上,但是V12前一直為大家詬病的是:雖然有持續(xù)不斷的版本更新,每個版本都有詳細的Release Note列舉該版本更新的重要技術提升,然而用戶對FSD的進步體感上卻遠不如大家預期的明顯。
但到了V12階段,這個狀況改變。
V12號稱從相機Photon In,最終決策控制Control Out,但是Release Note卻只有短短的幾行而已,其中最關鍵的一句還是V12去掉了FSD傳家的30w行C++代碼,轉而用一個端到端的神經(jīng)網(wǎng)絡模型作為替代。
為什么轉變?yōu)槎说蕉四P偷捏w系,去掉了大量的高質量代碼,反而V12性能相比V11產(chǎn)生了巨大的飛躍呢,難道真如老馬一貫的理念所說Best part is no part,實際上Best code is no code?
![]()
FSD V12版本將城市駕駛技術棧改為端到端訓練的神經(jīng)網(wǎng)絡,從而替換掉30w行C++代碼
相信很多人對神經(jīng)網(wǎng)絡的可解釋性、可靠性一直存在懷疑。這無可厚非,畢竟神經(jīng)網(wǎng)絡具體如何工作是設計者也無法透徹了解的。
但事實是,自2012年Alexnet將基于人工神經(jīng)網(wǎng)絡的深度學習方法帶入公眾的焦點之后,漸漸地無論計算機視覺、自然語言處理,甚至AI作為一個整體,幾乎全部令人興奮的成果都來自于數(shù)據(jù)驅動的神經(jīng)網(wǎng)絡模型。
現(xiàn)如今基于數(shù)據(jù)驅動的大語言模型和以Diffusion Model、Sora為代表的生成式AI效果和能力有多么驚人相信我也無需加以贅述了。而針對神經(jīng)網(wǎng)絡可控性,安全性為中心人們也在不停地摸索一系列數(shù)據(jù)驅動的最佳實踐方法。
因此稍微從宏觀一點的視角就能發(fā)現(xiàn),數(shù)據(jù)驅動的純粹的端到端技術范式正在不斷占領傳統(tǒng)代碼的生存空間。而這種新的技術范式的出現(xiàn)也成為了AI得以高速發(fā)展的關鍵,可能早晚你都要相信,根據(jù)Karpathy軟件2.0的理論,是的,“Best code actually is no code”。
對不起各位程序員同行,神經(jīng)網(wǎng)絡參數(shù)構成的代碼確實比我們能夠寫出更好的代碼。從這個角度看,Tesla V12選擇全面擁抱數(shù)據(jù)驅動和端多端的訓練,并取得非常顯著的性能提升,這一切事實也就不那么讓人驚訝了。
實際上Tesla一直在提升其自動駕駛技術棧中端到端的“純度”。
V10.9后Tesla就將車道線感知的后處理部分代碼去掉,改為由模型直接輸出車道線實例;而根據(jù)AI Day分享的技術方案細節(jié),在傳統(tǒng)中由C++編寫的規(guī)則為主導的規(guī)劃控制模塊中,Tesla也早已經(jīng)混入了大量Learning Based候選軌跡生成和基于神經(jīng)網(wǎng)絡的決策規(guī)劃reward model。
然而雖然Tesla三年來一直在努力迭代自己的技術方案,雖然Elon一次又一次地宣傳某某版本的FSD又引入了多么重大的革新,因此是一個多么革命性的版本,用戶對性能提升的體感卻一直不明顯。
究其原因正是因為Tesla很多技術的迭代更新都針對的是整個技術棧的中上游,即感知、預測等環(huán)節(jié)。最后最影響用戶體感的還是與控制行車功能的決策規(guī)劃模塊,而無論混合了多少數(shù)據(jù)驅動的端到端元素,這個模塊在V12以前還一直是以規(guī)則為主的C++代碼所主宰。
而當智駕場景越來越復雜,真實世界的情況越來越多變,無論有多少坐在辦公室里的頂尖程序員,傳統(tǒng)軟件規(guī)則的復雜度上來后,維護和提升這塊代碼的綜合性能將變得越來越緩慢而昂貴。
然而當V12打通了自動駕駛技術棧的最后一個環(huán)節(jié),使得整個系統(tǒng)端到端可導,與人類駕駛行為的哪怕一丁點微小誤差也會通過梯度反向傳播一直傳遞到整個系統(tǒng)的每一個上游環(huán)節(jié),讓他們進行自我迭代優(yōu)化,從而最終使得系統(tǒng)輸出的駕駛行為更加擬人,更加自然。
而如果把之前通過對上游模塊的優(yōu)化提升用戶體驗比作隔靴搔癢,那這種對輸出端信號的直接優(yōu)化就毫無疑問達到了直擊用戶體驗靈魂的效果,這樣看來V12體驗相比之前版本的跨越式提升就變得那么的合理了。
除此之外正如通過純粹的端到端數(shù)據(jù)驅動誕生了ChatGPT這樣讓我們第一次感受到了“智能”以及AGI似乎并不那么的遙不可及的產(chǎn)品,那么V12之于自動駕駛我認為可以相當于GPT3甚至GPT3.5之于自然語言處理,它讓我第一次感覺了自動駕駛系統(tǒng)也可以正如偏離導航的case中體現(xiàn)的那樣聰明,靈活。
ChatGPT可以很輕松的通過過去一直被認為不可逾越的圖靈測試,然而我們如果有一個駕駛方面的圖靈測試,即僅僅通過駕乘感受,乘客幾乎無法分辨出到底是AI在開車還是人類司機,那么我認為V12已經(jīng)很有可能通過這樣的駕駛圖靈測試了。
一個人對V12的體驗評價好壞在于其是否享受了技術帶來的便利,然而從更宏觀的維度上來看,用戶整體的體驗評價才能更好反映技術本身。那么V12到底是不是真的相對之前的版本產(chǎn)生了巨大的進步呢?我們一起來看看數(shù)據(jù)統(tǒng)計怎么說。
根據(jù)Tesla FSD Tracker的統(tǒng)計數(shù)字(來自于FSD用戶主動上傳申報):
![]()
城市中多少里程發(fā)生一次關鍵接管的數(shù)據(jù)
![]()
各個版本與地點相關的持續(xù)性問題的統(tǒng)計數(shù)字
相比之前版本,V12.3版本在城市每次關鍵接管前行駛里程這項關鍵數(shù)據(jù)上提升巨大。無關鍵接管行駛里程從大約100多英里提升到了386.7英里。
而每個版本與地點相關的持續(xù)性問題統(tǒng)計上,12.3.1目前只有4個問題(之前剛發(fā)布后的相當長一段時間里這個數(shù)字甚至一直是0)。
從統(tǒng)計數(shù)字的角度,V12確實是一次巨大的跨越式進步。
對于未來展望,由于上面說的V12端到端的技術架構是直接對用戶體驗最直接的規(guī)劃控制輸出進行優(yōu)化,我預計FSD V12后,用戶能體感到的系統(tǒng)性能將會提升非常快。
從我在硅谷測試后的一周里,V12已經(jīng)連續(xù)推出了V12.3.1和V12.3.2.1兩個版本。前者將推送用戶范圍擴大到了包括加拿大在內的整個北美地區(qū)的絕大多數(shù)FSD激活用戶;后一個版本則更新了用戶期待已久的端到端Autopark功能和Smart Summon/Banish功能。似乎確實如預期一樣,F(xiàn)SD的迭代進步正在加速。
同時,老馬最近接連公布了要給北美每一輛車一個月的FSD免費試用機會,還要求為每一位收到Tesla交付車輛的用戶提供FSD的試駕體驗??梢钥闯?,Elon和Tesla對FSD的信心空前高漲,已經(jīng)開始大范圍推廣FSD功能。
再結合傳聞中最早2024年夏季FSD將進入中國市場,2025年上半年登陸歐洲的消息,F(xiàn)SD似乎有望成為Tesla利潤的新的增長極。
大力推廣FSD不僅有助于提高FSD的購買率,從而提高Tesla的盈利能力,推廣FSD甚至還有可能促進新車的銷量,畢竟目前為止Tesla仍舊是唯一能夠讓用戶體驗到FSD功能的車型。
![]()
馬斯克要求每輛交付的Tesla都必須讓用戶去體驗下最新的FSD版本
根據(jù)FSD的迭代速度,我個人預計FSD很快就會Feature Complete(增加倒車檔,增加Summon/Banish還有自動泊車,開放中國,歐洲市場)。
而下一步,Tesla就必須開始對FSD功能的穩(wěn)定性、安全性繼續(xù)努力了,畢竟雖然今天FSD已經(jīng)能夠解決99%的駕駛場景,然而要真正做到無人,做到Robotaxi還必須繼續(xù)去不斷推動FSD朝著小數(shù)點后更多的9邁進。
到時候單純的端到端Imitation Learning(沒有實際資料表明Tesla FSD V12只使用Imitation Learning,這里只是個人猜測)是否足夠,是否需要引入Reinforcement Learning,甚至是大語言模型和生成式AI,亦或是需要重新找回部分規(guī)則代碼,目前都未可知,只能等待時間給我們答案。
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論