理想汽車智能駕駛研發(fā)副總裁郎咸朋

新能源汽車的下半場,智能化果然是主旋律。價格戰(zhàn)之外,各家智駕能力的比拼,也成為搶占用戶心智的新戰(zhàn)場。

作為造車新勢力的代表之一,理想在7月份月銷過5萬輛,去年營收超千億,銷量上已經實現(xiàn)了“遙遙領先”,但在智駕上的動作一直并不激進,或者可以有有些保守。

那么,作為智駕上的“差生”或者說“后進生”,理想接下來的智駕策略是什么?為什么大家都在切入端到端?現(xiàn)在爆火的端到端智駕新故事,理想又會如何來講?端到端之后,智駕還能拼什么?

近日,鈦媒體App與理想智能駕駛研發(fā)副總裁郎咸朋有了一次深入的溝通,對于理想的智駕以及端到端,也有了全面的了解。

快速迭代不是“Follow別人

眾所周知,理想在造車新勢力里面,智駕并不是其標簽。隨著銷量穩(wěn)定上來,智能化開始成為新能源汽車主要競爭高地,理想也開始加碼在智駕領域的布局和投入。

有人說,理想拿出端到端+VLM大模型的智駕技術,意在追趕特斯拉、華為的智駕能力。

對此,郎咸朋表示,“我們看問題就看本質,表面上看起來我們不停地在迭代,或者說跟別人學,或者自己探索,但實際上我們不是一個專門follow別人的公司,我們有自己對這個技術和對產品的本質理解。”

那么,問題來了,端到端到底是什么?其實就是End-to-End Deep Learning(端到端深度學習),簡言之,就是要建立一個完整的學習系統(tǒng),直接從原始數(shù)據(jù)中不斷學習,并生成所需的輸出,不需要人為將任務分解成多個中間步驟。

在簡單一點來理解,就是采用端到端的這套智駕方案,通過不斷給它喂養(yǎng)數(shù)據(jù),它會自己思考學習成長,不斷長大變強。這也是為什么大家現(xiàn)在都在追逐端到端智駕到根本原因。

據(jù)郎咸朋介紹,去年一年,理想做了三次技術的研發(fā)迭代,最先用的都是NPN神經地圖先驗(‌Neural Map Prior)這種帶有場景的方案,然后又轉換到無圖的方案,最后才迭代到現(xiàn)在的端到端方案。

如此頻繁地迭代技術路線,不斷地推倒重來,是否會造成智駕能力的落后?

郎咸朋認為,從本質上看,無論是NPN(神經先驗網(wǎng)絡)還是重圖的方案,它最大的問題是只要你用圖你就做不了全國,想要解決它,那就只能做無圖,所以就切到無圖了。但不管是分段式,還是模塊化的無圖方案,它都有上限在哪,都還有人的規(guī)則在里面,無法做到非常擬人的駕駛體驗。

“理想并不是為了做端到端而去做端到端,而是把無圖、有圖這些技術方案全部都做完一遍,領悟到這些技術特點之后,才堅定地選擇下一步要走端到端這套方案。”郎咸朋說道。

翻譯一下就是,理想其實也一直在思考如何實現(xiàn)自動駕駛,如何讓當下的高階輔助駕駛有更好的體驗,在技術上經過不斷地探索之后,發(fā)現(xiàn)原來的方式是無法真正做到自動駕駛,這也是為什么后面在端到端上有了系統(tǒng)1+系統(tǒng)2的思考。

在郎咸朋看來,端到端最大的改變不是一個模型還是兩個模型的問題,而是從端到端開始,才真正地用人工智能的方式去做自動駕駛。之前的串聯(lián)式的端到端、分小模塊的這種做自動駕駛的方式,其實本質上它還是一個產品,更偏傳統(tǒng)一點的產品研發(fā)思路。

怎么來理解呢?就是原來做自動駕駛的思路,是先定義需求,然后根據(jù)需求來拆解成很多場景,場景再拆分為很多的研發(fā)模塊,最后用人制定的規(guī)則去實現(xiàn),這里面可能用到小模型。研發(fā)出來之后,再根據(jù)場景去做測試評價,有問題再改,沒問題就交付。

在這個過程中,會有哪些問題呢?

如果場景有限,比如高速NOA場景,這種道路結構比較簡單,但擴展到城市之后,它的場景就出現(xiàn)了爆炸式的變化,跟高速場景完全不一樣。如果繼續(xù)用以前的方式去設計場景、去設計規(guī)則、去實現(xiàn)驗證,這里面的每一步就會遇到很大挑戰(zhàn)。

因為場景是無窮無盡的,一旦還用原來的方式去做自動駕駛,那自動駕駛的能力邊界就顯而易見了,只能按照你的設計達到某種能力,而超出能力之外的東西,它無法做到。

簡單來說,按照原來用規(guī)則來做智能駕駛的開發(fā)思路,必須要在一個確定性的環(huán)境下來研發(fā)。即使問題比較復雜,也想把它拆解得非常確定,然后再去研發(fā)做測試。而自動駕駛是沒法用規(guī)則式來做的。

郎咸朋對此的理解是未來自動駕駛,我們面臨的是一個不確定的變化的復雜的世界,如果還用一些確定性的模式去做這個事情,那就肯定是有問題的。

“所以從端到端開始,它的變化并不是說一個模型、兩個模型這么簡單,而是它整個的思維,就是研發(fā)的流程和方式發(fā)生了巨大的改變,這里面沒有任何的規(guī)則,我能做的是喂給他高質量的數(shù)據(jù),再加上訓練提升模型的能力,讓它能做出更好的規(guī)劃和決策。”郎咸朋總結道。

智駕團隊規(guī)模不會超兩千人

端到端的流行,或者說人工智能的快速發(fā)展,讓智駕領域的研發(fā)人才也開始出現(xiàn)了變化。

端到端這套方案,讓整個研發(fā)流程變得相對簡單了,主要就是挑選數(shù)據(jù)、訓練模型、評估模型、世界模型。

理想的這套智駕方案是“端到端+VLM+世界模型”,其中最大的特點是采用了雙系統(tǒng)的理論,快系統(tǒng)做出及時的處理響應,慢系統(tǒng)對應復雜的思考邏輯判斷,雙系統(tǒng)共同地組成了人類認知和思維的機制。

具體來看,理想的這套智駕方案,其系統(tǒng)一就是快系統(tǒng),應用端到端模型來實現(xiàn),主要是挑選數(shù)據(jù)、訓練數(shù)據(jù);系統(tǒng)二則是慢系統(tǒng),采用VLM的視覺語言大模型來實現(xiàn),主要是其能像人一樣的思考能力,更好理解復雜道路情況,應對未知場景。經過預研和研發(fā),目前理想的這兩套系統(tǒng)都已實現(xiàn)量產上車。

世界模型,在理想內部稱其為系統(tǒng)三,它是一個考試系統(tǒng),系統(tǒng)一+系統(tǒng)二的能力由系統(tǒng)三去評價和認證。

原來自動駕駛系統(tǒng)的評價與測試,都是由人來執(zhí)行完成的,不管是跑大的路測還是跑場地的測試都是由人去評價的,但人是評價不過來的。而系統(tǒng)三則能夠取代人去考核系統(tǒng)一和系統(tǒng)二的能力,通過考核之后,就迭代上線,然后進入下一輪的考核。

流程變簡單了,相對應需要的人也變少了。郎咸朋坦言,除了研發(fā)這些系統(tǒng)平臺的過程需要人,其實并沒有很多人參與到實際的一些東西上來,會大大減少人的使用,確實用不了那么多人。

“我們可能會比特斯拉現(xiàn)在的人多一些,但是也不會達到一兩千人的規(guī)模。”郎咸朋說道。

實際上,理想智能駕駛研發(fā)部門的人員數(shù)量,相對蔚來、小鵬、華為等是最少的,據(jù)相關數(shù)據(jù)統(tǒng)計,截至今年5月,華為、小鵬、蔚來智駕團隊人數(shù)分別超過7000人、3000人和1300人。而根據(jù)媒體的一些報道,截至6月初,理想智駕部門員工總人數(shù)已被削減到了800人以內。

不過,自動駕駛最重要的是什么?是人才與資金嗎?郎咸朋的回答是,長期來看,算力和數(shù)據(jù)都很重要,但前期對人才這塊,算法更重要。

在他看來,沒有數(shù)據(jù),將來算法的訓練、驗證,都是沒有基礎的。但在模型迭代的基礎上,最重要的方式是怎么去找到更優(yōu)質的數(shù)據(jù),這個數(shù)據(jù)除了量要足夠大,質量也要足夠好。 

端到端之后,智駕還能拼什么?

當大家都開始做端到端,站在了同一起跑線上,那么,智駕還能拼什么?

在郎咸朋看來,真正到了人工智能時代,大家其實就拼兩件事,一是你有沒有足夠多的高質量的數(shù)據(jù);二是你有沒有與之相匹配的充足的訓練算力的集群。

總而言之,自動駕駛到最后拼的就是算力和數(shù)據(jù),但這兩件事,門檻都非常高。如果企業(yè)的資金儲備不足以支撐每年訓練的花費,那就不可能玩到后邊的L3或L4;如果車企的這個車的保有量不夠多,數(shù)據(jù)其實也無法支撐它的訓練需求。

據(jù)郎咸朋透露,目前理想自動駕駛每年投在訓練花費上是10億人民幣,預估將來花費要到每年10億美金。

郎咸朋指出,“這只是訓練的算力,還不包括其他的人員各種費用。如果未來你一年拿不出10億美金來做訓練,可能將來會在自動駕駛的競爭當中淘汰。

理想L系列產品都是套娃,但套娃對于自動駕駛來說,郎咸朋認為是有極大的好處,所有的攝像頭規(guī)格和安裝的位置都是一致的,數(shù)據(jù)都可以復用。

但有的廠商,它的產品可能有轎車、SUV等,傳感器可能也都不太一樣,對于這些廠商來說,數(shù)據(jù)的復用確實會是一個問題。

而關于智駕,郎咸鵬認為,一方面要有遠期的考慮和探索,另一方面也要有現(xiàn)在的交付和產品迭代。對于公司來說,智駕是一個產品。公司做任何一個產品,目的還是為了盈利,為了去獲得更好的現(xiàn)金流,更好的利潤,從而讓企業(yè)有更好的發(fā)展。

如何證明自己的智駕能力是行業(yè)第一梯隊?在郎咸朋看來,“用戶實打實地掏錢買你,我覺得這是最有說服力的。最終還是要看搭載AD max車型的銷量,這將決定理想的智駕能力是不是在市場上領先,這是最硬核的指標。

其實,理想AD PRO、AD max兩款產品,價格僅相差3萬元,主要差別就在智能駕駛的硬件和功能上,其他都一樣。

簡言之,對于郎咸朋來說,如果在理想的總銷量中,搭載高階智駕版本的AD max車型占比較高,那就說明理想的智駕做得還是成功的。

這樣來看,后面車企在智駕上的卷,還是會回歸到卷銷量上。只有越來越多的用戶選擇智駕版,才能證明你的智駕功能是做得真的好用。如果用戶都不選智駕版,即便真的做得很好,又如何來證明呢?

畢竟,智駕能力到底強不強,不是誰的嗓門大誰就強,還是需要拉出來遛遛才知道。(本文首發(fā)于鈦媒體App,作者|張敏)

本文系作者 敏行 授權鈦媒體發(fā)表,并經鈦媒體編輯,轉載請注明出處、作者和本文鏈接。
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

快報

更多

18:36

伊朗與巴基斯坦兩國外長通電話,討論地區(qū)局勢

18:35

2025年玩具(不含潮玩)國內市場零售總額達1035.3億元

18:08

全國豬價跌破5元,創(chuàng)歷史新低

18:07

時代天使2025年實現(xiàn)收入3.7億美元,同比增長37.8%

17:57

電魂網(wǎng)絡:擬投資4920萬元取得上海漫魂51%股權

17:51

美國1天超3000場反戰(zhàn)示威

17:28

雀巢12噸巧克力被盜

17:11

伊朗官員表示將“果斷反擊”美軍奪島

17:08

伊朗議長稱武裝部隊“正等著美軍地面行動”,并將“懲罰”其地區(qū)盟友

17:05

三安光電:董事長及總經理擬增持公司股份

16:58

全球多地爆發(fā)示威抗議,民眾高呼“不要戰(zhàn)爭”

16:55

中信證券:配置上建議繼續(xù)堅守中國優(yōu)勢制造業(yè),靜待4月決斷

16:38

美國土安全部資金中斷進入第44天,創(chuàng)美國史上最長政府部分“停擺”紀錄

16:17

北京啟動智能網(wǎng)聯(lián)新能源汽車商業(yè)保險開發(fā)應用,統(tǒng)一適配L2至L4全級別智能網(wǎng)聯(lián)新能源汽車

16:16

恒林股份發(fā)布AI體感工學白皮書,加速布局AI智能家居

16:15

中國國家創(chuàng)新指數(shù)綜合排名世界第9位,較上年提升1位

16:05

朗新科技:2025年歸母凈利潤1.05億元,同比扭虧為盈

16:05

錫業(yè)股份:2025年歸母凈利潤19.66億元,同比增長36.14%

16:04

摩恩電氣:2025年歸母凈利潤1058.2萬元,同比下降40.79%

15:50

宇信科技:2025年歸母凈利潤4.32億元,同比增長13.69%

掃描下載App