小鵬汽車(chē)首席科學(xué)家郭彥東在2018科技生活節(jié)
7月29日,由鈦媒體集團(tuán)舉辦的“鈦媒體 2018T-EDGE 科技生活節(jié)”在北京·751東區(qū)故事正式拉開(kāi)序幕。 小鵬汽車(chē)首席科學(xué)家郭彥東博士從整車(chē)廠商的視角同與會(huì)人員探討,如何造更懂中國(guó)人的智能汽車(chē)。
郭彥東從特斯拉高級(jí)輔助駕駛系統(tǒng)被一顆橘子騙過(guò)這樣一個(gè)案例引入,直言,在出現(xiàn)高級(jí)輔助駕駛功能之后,有的司機(jī)會(huì)出現(xiàn)過(guò)度依賴(lài)的現(xiàn)象。另外,從統(tǒng)計(jì)角度來(lái)看,盡管輔助駕駛市場(chǎng)一直在增長(zhǎng),而美國(guó)的交通事故致死數(shù)量在2015年,2016年不降反增。
因此,小鵬汽車(chē)做出了這樣一個(gè)思考:如何能讓人工智能技術(shù)真正提升用戶(hù)體驗(yàn)跟車(chē)輛安全性,比如用智能的感知與決策把獨(dú)立的輔助駕駛功能有機(jī)結(jié)合起來(lái)。具體來(lái)說(shuō),根據(jù)車(chē)外環(huán)境、天氣、場(chǎng)景的理解來(lái)調(diào)節(jié)與選擇行車(chē)功能。更重要的一個(gè)場(chǎng)景是,在車(chē)和人互動(dòng)的過(guò)程中,讓車(chē)去更好的理解人的狀態(tài)。不光是注意力方面,還包括司機(jī)的疲勞、情緒,做一個(gè)正向的反饋循環(huán),來(lái)提升用戶(hù)的體驗(yàn)。
為達(dá)到這一愿景,小鵬汽車(chē)從數(shù)據(jù)、人工智能平臺(tái)、量產(chǎn)車(chē)入手,構(gòu)建閉環(huán)智能進(jìn)化能力。
第一是大數(shù)據(jù)平臺(tái)。從整車(chē)廠的角度,小鵬汽車(chē)收集了大量的數(shù)據(jù),包括:1、互聯(lián)網(wǎng)大數(shù)據(jù)。2、仿真大數(shù)據(jù)。3、自有車(chē)隊(duì),或者測(cè)試車(chē)隊(duì)大數(shù)據(jù)。4、中國(guó)用戶(hù)大數(shù)據(jù)。
郭彥東博士特別強(qiáng)調(diào)真實(shí)中國(guó)用戶(hù)數(shù)據(jù)的重要性:
“ 可以說(shuō),中國(guó)用戶(hù)的真實(shí)數(shù)據(jù),不管從真實(shí)度上,還是成本效率上,還是對(duì)場(chǎng)景的覆蓋度、數(shù)據(jù)量上,都遠(yuǎn)遠(yuǎn)的優(yōu)于仿真和自有車(chē)隊(duì)的數(shù)據(jù)體量。在人工智能尤其是深度學(xué)習(xí)的大環(huán)境下,其實(shí)誰(shuí)坐擁了數(shù)據(jù),誰(shuí)就有可能會(huì)有最先進(jìn)、最完善的技術(shù)體系。這個(gè)也是整車(chē)廠商有的一個(gè)優(yōu)勢(shì)。我們從大量的用戶(hù)中搜集用戶(hù)的反饋,用這個(gè)數(shù)據(jù)不停的調(diào)教和更新我們的智能車(chē)系統(tǒng)。”
第二,人工智能平臺(tái)。郭彥東博士表示,在智能車(chē)的場(chǎng)景中,往往最有價(jià)值的就是所謂的長(zhǎng)尾(long-tail)數(shù)據(jù)。這些數(shù)據(jù)發(fā)生的頻次很低,很有可能你開(kāi)很久的車(chē)才會(huì)有一次、兩次發(fā)生,但是這些事情的種類(lèi)、類(lèi)別、數(shù)量會(huì)非常多,這個(gè)就要求人工智能平臺(tái)有快速處理小樣本長(zhǎng)尾數(shù)據(jù)的能力。
第三,量產(chǎn)車(chē)場(chǎng)景。小鵬汽車(chē)布局全球,也是中國(guó)最大規(guī)模的單車(chē)研發(fā)投入。這樣也保證,最新、最強(qiáng)的算法能夠在車(chē)上跑起來(lái),能夠把用戶(hù)的一些行為實(shí)時(shí)反饋回來(lái)。
基于閉環(huán)智能進(jìn)化,小鵬汽車(chē)致力于打造更懂中國(guó)人的智能汽車(chē)。包括更懂“路上的”中國(guó)人:理解中國(guó)人的駕駛文化,中國(guó)政策法規(guī),中國(guó)行車(chē)/道路環(huán)境,最重要的是更懂“車(chē)?yán)锏?rdquo;中國(guó)人,包括司機(jī)/乘客的識(shí)別,注意力,情緒的感知,從而提供無(wú)縫的,個(gè)性化的,適應(yīng)中國(guó)人的智能化駕駛體驗(yàn)。
總結(jié)而言,小鵬汽車(chē)要成為 “更懂路上的中國(guó)人、更懂車(chē)?yán)锏闹袊?guó)人”的智能汽車(chē)。
自動(dòng)駕駛,在中國(guó)有它獨(dú)特的挑戰(zhàn),以及獨(dú)特的機(jī)遇。我從整車(chē)廠商的視角,來(lái)跟大家分享一下我們的經(jīng)驗(yàn)和體會(huì)。我今天想從小鵬汽車(chē)發(fā)展中的一些思考和努力,跟大家探討一下如何造更懂中國(guó)人的智能汽車(chē)。
我今天的分享從一個(gè)橘子開(kāi)始,大家在圖上看到,一個(gè)橘子被卡在了方向盤(pán)上面。這其實(shí)是一張?zhí)厮估膱D片,說(shuō)的是,特斯拉的“自動(dòng)駕駛限制”被1顆橘子破解。![]()
特斯拉高級(jí)輔助駕駛被一顆橘子騙過(guò)
我們知道,特斯拉的輔助駕駛系統(tǒng),實(shí)際上要求,司機(jī)必須要手持方向盤(pán)。
那么,它是通過(guò)什么來(lái)檢測(cè)司機(jī)是不是手持方向盤(pán)的呢?
其實(shí),在特斯拉的方向盤(pán)里面有一個(gè)壓力傳感器。有些用戶(hù)不愿意去遵守特斯拉公司這樣的一個(gè)規(guī)定,就把這個(gè)橘子放在方向盤(pán)上面,從而成功的騙過(guò)了特斯拉汽車(chē)。
這個(gè)是一個(gè)很小事件,但是我們從這個(gè)橘子上也看到了一些挺有意思的事情。
第一,我們現(xiàn)在尤其是非營(yíng)運(yùn)的大眾消費(fèi)車(chē),包括特斯拉在內(nèi),其實(shí)做的都是輔助駕駛,或者高級(jí)輔助駕駛。它其實(shí)是對(duì)司機(jī)的注意力、手持方向盤(pán)是有要求的。
第二,用戶(hù)在有了輔助駕駛功能汽車(chē)之后,有些用戶(hù)會(huì)過(guò)度的信任駕駛系統(tǒng)。另外,從統(tǒng)計(jì)意義上來(lái)講,也存在這樣一件事情——高級(jí)輔助駕駛市場(chǎng)越來(lái)越大,一直在持續(xù)增長(zhǎng),但是很不幸的是,我們看到在美國(guó)的數(shù)據(jù)顯示,在美國(guó)的交通中的致死數(shù)量其實(shí)在2014年之后到2015年有一個(gè)拐點(diǎn),2015年是不降反升的,2016年最新的數(shù)據(jù)是比2015年的致死數(shù)量更高。
沒(méi)有人有一個(gè)非常明確的答案說(shuō)這到底是為什么,但是,我們可以從其中延伸出一些探討。
一方面,可能是因?yàn)橹悄苁謾C(jī)大規(guī)模普及,大家更愿意用手機(jī),在開(kāi)車(chē)的過(guò)程中看手機(jī),回短信、回消息。
另一方面,有一些說(shuō)法是,因?yàn)橛辛溯o助駕駛功能的出現(xiàn),有些司機(jī)不愿意關(guān)注駕駛過(guò)程中的一些交通情況。甚至?xí)驗(yàn)殚L(zhǎng)時(shí)間的不關(guān)注,引發(fā)疲勞現(xiàn)象。怎么去解決這個(gè)問(wèn)題呢?
我們今天都在講無(wú)人車(chē)、智能車(chē)。那么,智能怎么幫我們提升車(chē)的一些體驗(yàn)跟安全性,這是我們的一些思考。
有很多輔助駕駛功能,都包括車(chē)道線輔助、緊急剎車(chē)、盲點(diǎn)檢測(cè)等等技術(shù),甚至很多都可以有供應(yīng)商提供了。我們希望能讓人工智能技術(shù)真正提升用戶(hù)體驗(yàn)跟車(chē)輛安全性,比如用智能的感知與決策把這些獨(dú)立的輔助駕駛功能有機(jī)結(jié)合起來(lái),這個(gè)車(chē)才是一個(gè)真正的智能車(chē),才能夠提高用戶(hù)的體驗(yàn)。我舉幾個(gè)例子,一方面是車(chē)外的一些感知,比如天氣,比如說(shuō)場(chǎng)景的識(shí)別、事件識(shí)別和預(yù)測(cè)。
例如,一個(gè)司機(jī)在路上看到一輛校車(chē)停在路邊,車(chē)門(mén)打開(kāi)了,他會(huì)知道可能有小朋友從車(chē)?yán)锱艹鰜?lái)。但是什么時(shí)候我們的輔助駕駛功能車(chē),搭載了智能模塊以后也能做出類(lèi)似的判斷呢?這才是我們樂(lè)于看到的一個(gè)事情。
另外,我覺(jué)得,跟車(chē)外的一些情況預(yù)測(cè)和判斷、智能感知比起來(lái),車(chē)內(nèi)的感知可能顯得更重要。
我舉幾個(gè)例子,包括乘客、司機(jī)的識(shí)別,包括我剛才說(shuō)的注意力、情緒的識(shí)別。
我們能不能在人和車(chē)互動(dòng)的過(guò)程中,讓車(chē)去更好的理解司機(jī)的狀態(tài)?不光是他的注意力,包括他的疲勞、情緒,做一個(gè)正向的反饋循環(huán),來(lái)提升用戶(hù)的體驗(yàn),這個(gè)是我們的近期愿景。
所以,我們核心就是要把這些功能智能化,然后提升用戶(hù)體驗(yàn)。它的基礎(chǔ)就是智能感知。
下面,我想和大家分享一下,我們小鵬汽車(chē)是怎樣實(shí)現(xiàn)這個(gè)愿景的。
我們有三大模塊,第一是大數(shù)據(jù),我們的智能車(chē),始于大數(shù)據(jù),訓(xùn)練和優(yōu)化在人工智能訓(xùn)練平臺(tái)上,成熟在量產(chǎn)車(chē)平臺(tái)。量產(chǎn)車(chē)平臺(tái)是我們作為整車(chē)廠商一個(gè)獨(dú)特的優(yōu)勢(shì)我們OTA最新的算法模型在量產(chǎn)車(chē)上,然后我們?cè)購(gòu)牧慨a(chǎn)車(chē)?yán)锩媸占⒉杉嗟闹袊?guó)用戶(hù)真實(shí)數(shù)據(jù),來(lái)完成這樣一個(gè)閉環(huán)迭代的過(guò)程。
我從數(shù)據(jù)、人工智能平臺(tái)、量產(chǎn)車(chē)從這三個(gè)方面,來(lái)跟大家分別探討一下。
第一,數(shù)據(jù)為王。
小鵬汽車(chē)作為整車(chē)廠商,作為一個(gè)真正做量產(chǎn)車(chē)產(chǎn)品的公司,我們最關(guān)心的、最重視的就是我們的數(shù)據(jù)。
我們的數(shù)據(jù)來(lái)自于下面4個(gè)主要的來(lái)源:
我主要說(shuō)一下互聯(lián)網(wǎng)大數(shù)據(jù)和中國(guó)真實(shí)用戶(hù)的大數(shù)據(jù)。
一是互聯(lián)網(wǎng)大數(shù)據(jù)。最近這20年,整個(gè)人類(lèi)其實(shí)做了一件很有意義的事情,就是把他們的行為、信息、知識(shí)都做了互聯(lián)網(wǎng)化。我們現(xiàn)在想要找一些信息,在互聯(lián)網(wǎng)上直接做簡(jiǎn)單的搜索就可以馬上得到,是因?yàn)槲覀兇罅康娜祟?lèi)信息都已經(jīng)在互聯(lián)網(wǎng)上有所體現(xiàn)了,都已經(jīng)在互聯(lián)網(wǎng)上被數(shù)字化了。
我可以和大家分享一個(gè)更細(xì)節(jié)的數(shù)字,我們也跟很多技術(shù)供應(yīng)商去探討,一些很頂級(jí)的技術(shù)供應(yīng)商,可能一年收集10個(gè)億的圖片,但是這個(gè)圖片的量對(duì)于互聯(lián)網(wǎng)數(shù)據(jù)來(lái)說(shuō),可能是一周,甚至遠(yuǎn)遠(yuǎn)不到一周的時(shí)候,互聯(lián)網(wǎng)上就有這么多圖片產(chǎn)生了。這個(gè)做過(guò)搜索引擎的人最有體會(huì)的,包括我自己。
互聯(lián)網(wǎng)數(shù)據(jù)量非常之大,對(duì)早期算法的演進(jìn)意義重大。但是它有它的挑戰(zhàn),就是說(shuō),這部分?jǐn)?shù)據(jù)可能跟無(wú)人駕駛、智能車(chē)想要的數(shù)據(jù)分布有一些不一樣的地方,標(biāo)注也有一些困難,需要用一些辦法,比如遷移學(xué)習(xí)把互聯(lián)網(wǎng)的知識(shí)轉(zhuǎn)移到智能車(chē)上去。
為了達(dá)到這樣的一個(gè)目的,我們也關(guān)注另外3個(gè)主要數(shù)據(jù)來(lái)源:1、仿真大數(shù)據(jù)。2、自有車(chē)隊(duì)數(shù)據(jù)。3、來(lái)自于用戶(hù)的真實(shí)數(shù)據(jù)。
尤其是中國(guó)用戶(hù)的真實(shí)數(shù)據(jù),不管從真實(shí)度上,還是成本效率上,還是對(duì)場(chǎng)景的覆蓋度、數(shù)據(jù)量上,都遠(yuǎn)遠(yuǎn)的優(yōu)于仿真和自有車(chē)隊(duì)的數(shù)據(jù)體量。在人工智能尤其是深度學(xué)習(xí)的大環(huán)境下,其實(shí)誰(shuí)坐擁了數(shù)據(jù),誰(shuí)就有可能會(huì)有最先進(jìn)、最完善的技術(shù)體系。這個(gè)也是整車(chē)廠商有的一個(gè)優(yōu)勢(shì)。我們從大量的用戶(hù)中搜集用戶(hù)的反饋,用這個(gè)數(shù)據(jù)不停的調(diào)教和更新我們的智能車(chē)系統(tǒng)。
第二,我們有了數(shù)據(jù)以后,如何去做。我們搭建人工智能平臺(tái),用大量的數(shù)據(jù)訓(xùn)練多個(gè)深度學(xué)習(xí)模型。
但是,我們想強(qiáng)調(diào)的是在智能車(chē)的場(chǎng)景中,往往最有價(jià)值的就是所謂的長(zhǎng)尾(long-tail)數(shù)據(jù)。就是說(shuō)這些數(shù)據(jù)發(fā)生的頻次很低,很有可能你開(kāi)很久的車(chē)才會(huì)有一次、兩次發(fā)生,但是這些事情的種類(lèi)、類(lèi)別、數(shù)量會(huì)非常多,想要讓我們的車(chē)輛適應(yīng)盡可能多的場(chǎng)景,就要求我們的人工智能平臺(tái)有快速處理這樣一個(gè)長(zhǎng)尾(long-tail)數(shù)據(jù)的能力。
這有幾個(gè)挺有意思的例子,比如我從加州回來(lái)之前在路上。因?yàn)樘鞖庖埠芎?,前面是一個(gè)油罐車(chē),這個(gè)油罐車(chē)很干凈,它把后面的車(chē),包括我自己的車(chē)倒影在油罐車(chē)的油罐上面去了。
如果你對(duì)這個(gè)場(chǎng)景沒(méi)有一個(gè)特殊的理解和處理的話(huà),很多世界上最好的計(jì)算機(jī)視覺(jué)算法,都有可能誤認(rèn)為倒影是真實(shí)的車(chē)道線與車(chē)輛。
特斯拉曾經(jīng)發(fā)生過(guò)一件很慘痛的事故,特斯拉的車(chē)沒(méi)有成功的把一輛白色的大貨車(chē)認(rèn)成車(chē),認(rèn)為是一片云彩,也撞上去了。
右下角就更有意思了,尤其是坐在前排的觀眾,可以馬上發(fā)現(xiàn),這其實(shí)是一個(gè)披著cosplay衣服的行人走在路上,人類(lèi)司機(jī)都可以完成識(shí)別是一個(gè)行人。但是計(jì)算機(jī)視覺(jué),由于這個(gè)人穿了一件cosplay的衣服,可能算法不一定能成功檢測(cè)到是一個(gè)人。
這就對(duì)我們?nèi)斯ぶ悄軐W(xué)習(xí)平臺(tái)提出的問(wèn)題——當(dāng)樣本不是那么常見(jiàn)、頻次很低的時(shí)候,如何快速學(xué)習(xí)呢?
其實(shí)在業(yè)界有很多這種類(lèi)似的方法、技術(shù)已經(jīng)被研發(fā)出來(lái)了,比如微軟的custom vision,我本人也曾參加了custom vision的核心研究工作。將來(lái)也會(huì)針對(duì)小鵬汽車(chē)的特殊場(chǎng)景定制和打造可以快速迭代,應(yīng)對(duì)小樣本學(xué)習(xí)的人工智能學(xué)習(xí)平臺(tái)。
第三個(gè)我想分享的是我們有了數(shù)據(jù),有了人工智能訓(xùn)練平臺(tái),我們有一個(gè)獨(dú)特的場(chǎng)景,就是量產(chǎn)車(chē)場(chǎng)景。
首先我們想說(shuō)我們有一個(gè)全球化的企業(yè)布局,我們?cè)诠韫?、廣州、北京、上海、肇慶、鄭州等等地方,也都有我們的研發(fā)和生產(chǎn)中心,小鵬也是中國(guó)最大規(guī)模的單車(chē)研發(fā)投入。
包括我們現(xiàn)在也跟世界上最好的芯片廠商有緊密的合作,也簽署了戰(zhàn)略合作協(xié)議,我們將會(huì)搭載世界上算力最強(qiáng)的人工智能芯片之一,這樣也保證我們最新的算法能夠在車(chē)上跑起來(lái),能夠把用戶(hù)的一些行為能夠?qū)崟r(shí)的反饋回來(lái)。
有了這樣一個(gè)閉環(huán)的智能進(jìn)化能力之后,我們也想更多的探討一下在中國(guó)的場(chǎng)景怎么打造我們的差異化,更懂中國(guó)人。
更懂中國(guó)人,我們其實(shí)把它分兩個(gè)層面來(lái)理解:
第一層面,更懂路上的中國(guó)人。
其實(shí)我們路上有這樣那樣的行為,包括開(kāi)遠(yuǎn)光燈也好,有時(shí)候人車(chē)混流也好,需要學(xué)習(xí)的其實(shí)是人的行為,人的文化,也還有人制定的政策和法規(guī)。我可能稍微多說(shuō)一點(diǎn)的就是右上角的圖,右上角的圖是對(duì)比圖,就是車(chē)輛等紅燈時(shí)的一些行為,對(duì)比圖的右邊也是我回來(lái)之前在加州拍的一張圖片,等紅燈的時(shí)候大家看到,其實(shí)在美國(guó)車(chē)跟車(chē)之間的距離是比較遠(yuǎn)的,但在對(duì)比圖的左側(cè)我們看到,在中國(guó)駕駛場(chǎng)景當(dāng)中,在等紅燈的時(shí)候,車(chē)跟車(chē)的距離非常之近,哪怕非常之近的時(shí)候都有車(chē)加塞進(jìn)來(lái),這個(gè)環(huán)境當(dāng)中,這個(gè)事對(duì)智能的要求,就已經(jīng)超出了普通的物體檢測(cè)提到的要求。它其實(shí)學(xué)的是人的行為人的文化,學(xué)的是人的政策和法規(guī)。
其他幾個(gè)例子包括中文的路牌、中國(guó)特色路牌,包括密集交通、人車(chē)混流,甚至中國(guó)一些特色天氣下的處理,等等都給我們更懂“路上的”中國(guó)人提到一些機(jī)遇和挑戰(zhàn)。
第二層面,更懂車(chē)?yán)锏闹袊?guó)人。
更懂車(chē)?yán)锏闹袊?guó)人,我也把它分這么兩個(gè)層次討論:
1、更懂車(chē)?yán)锏闹袊?guó)人,最簡(jiǎn)單的就是要求智能車(chē)聽(tīng)得懂中國(guó)話(huà),認(rèn)得到中國(guó)人,符合中國(guó)的駕駛習(xí)慣。
2、“懂你”。“懂你”指的是說(shuō),懂在車(chē)?yán)锏倪@一個(gè)中國(guó)人,這一個(gè)中國(guó)司機(jī)我們要懂他。為了實(shí)現(xiàn)這樣一個(gè)目的,第一我們要人臉識(shí)別,知道開(kāi)車(chē)的是誰(shuí),他有什么樣用戶(hù)的畫(huà)像。第二我們需要對(duì)用戶(hù)的情緒狀態(tài)有這樣的感知,為什么有這樣的感知呢,情緒信號(hào)其實(shí)是對(duì)我們調(diào)教車(chē)的用戶(hù)體驗(yàn)的一個(gè)非常強(qiáng)的信號(hào)。
最后,我想談一談標(biāo)準(zhǔn)化的問(wèn)題。
現(xiàn)在國(guó)際上有兩套無(wú)人駕駛的法規(guī),包括美國(guó)NHTSA和SAE,都有兩套這樣的規(guī)則,或者兩套分類(lèi)的標(biāo)準(zhǔn)。
這兩套分類(lèi)的標(biāo)準(zhǔn),其實(shí)一定程度上偏定性的描述,缺乏一些定量的規(guī)定,這是其一。
其二像我剛才說(shuō)的,我們絕大部分整車(chē)廠商或者消費(fèi)類(lèi)的車(chē)輛集中商,現(xiàn)在都集中在L2沖刺L3的階段,大家都聚焦在這個(gè)層次上。而營(yíng)運(yùn)類(lèi)的車(chē)輛,絕大部分都聚焦在L4,因?yàn)樗薅▓?chǎng)景(不管運(yùn)人還是運(yùn)貨)集中在L4的階段做。
所以,我們想把這個(gè)標(biāo)準(zhǔn)化的東西提出來(lái)有兩個(gè)原因。
我們認(rèn)為這個(gè)標(biāo)準(zhǔn)化的規(guī)則,應(yīng)該制定的更加細(xì)分一些、定量一些,這樣有這么一套標(biāo)準(zhǔn)、體現(xiàn)車(chē)跟車(chē)之間的差異化,能夠促進(jìn)車(chē)企之間的良性競(jìng)爭(zhēng),推動(dòng)整個(gè)行業(yè)的發(fā)展。
我們也希望這樣的標(biāo)準(zhǔn)化,不僅只是由美國(guó)主導(dǎo)和提出,包括這兩套標(biāo)準(zhǔn)全部都是由美國(guó)主導(dǎo)的,我們也希望中國(guó)能夠參加到這個(gè)標(biāo)準(zhǔn)的制定中去,為世界的智能車(chē)發(fā)展貢獻(xiàn)一份力量。
人車(chē)共存,我們認(rèn)為車(chē)是為人服務(wù)的,不管L2、L3還是L4,人和車(chē)一定是共存在路上的,車(chē)和人之間的相互理解是非常重要的,在人車(chē)共存的前提下,我們想提出的口號(hào)是以人為本,人工智能車(chē)核心是提升人的體驗(yàn)。(本文首發(fā)鈦媒體)
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論