圖片來(lái)源@視覺(jué)中國(guó)

鈦媒體注:本文來(lái)源于微信公眾號(hào)億歐汽車(ID:EO-AUTO),作者 | 郭懷毅,鈦媒體經(jīng)授權(quán)發(fā)布。

如果說(shuō)以大模型為代表的人工智能將決定自動(dòng)駕駛,那么,誰(shuí)來(lái)決定大模型呢?  毫無(wú)疑問(wèn),這個(gè)答案就是——數(shù)據(jù)。

到2030年,全球自動(dòng)駕駛數(shù)據(jù)標(biāo)注市場(chǎng)規(guī)模將比現(xiàn)在擴(kuò)大6倍,從21億美元增長(zhǎng)到127.5億美元,逼近千億元人民幣。對(duì)于極度需要數(shù)據(jù)支撐的大模型和自動(dòng)駕駛產(chǎn)業(yè)來(lái)說(shuō),數(shù)據(jù)服務(wù)商正在迎來(lái)歷史性的機(jī)遇。

但正所謂福兮禍所依,教會(huì)徒弟,餓死師傅的故事似乎正在數(shù)據(jù)服務(wù)產(chǎn)業(yè)上演。數(shù)據(jù)服務(wù)們提供的數(shù)據(jù)質(zhì)量越高,數(shù)量越多,大模型的成長(zhǎng)速度就越快,人工智能標(biāo)注對(duì)人工標(biāo)注構(gòu)成的挑戰(zhàn)就越大。

一場(chǎng)貪食蛇游戲開始了。

“你需要一個(gè)像素、一個(gè)像素,沿著車輛的輪廓圈出來(lái)。”

2022年,曾有媒體親自到無(wú)人駕駛汽車數(shù)據(jù)標(biāo)注平臺(tái)體驗(yàn)了幾天標(biāo)注員的工作。和外界想象的簡(jiǎn)單畫個(gè)圈就完成標(biāo)注不同,“像素級(jí)”的標(biāo)注要求工作人員精確勾勒出目標(biāo)輪廓。

如果是標(biāo)注激光雷達(dá)數(shù)據(jù),工作人員將會(huì)更加辛苦,有些操作手冊(cè)就有60多頁(yè)。所以,標(biāo)注工作會(huì)消耗大量的時(shí)間。3至6個(gè)小時(shí),一個(gè)新手也只能標(biāo)注完成40張圖片中的數(shù)據(jù)。即使是專業(yè)的標(biāo)注工作者,完成50張圖片的標(biāo)注也需要至少四個(gè)小時(shí)。

雖然標(biāo)注工作繁瑣且辛苦,但是對(duì)于智能電動(dòng)汽車,特別是自動(dòng)駕駛產(chǎn)業(yè)來(lái)說(shuō),數(shù)據(jù)的標(biāo)注和整理是必不可少的一環(huán)。

2023年底,小鵬汽車董事長(zhǎng)、CEO何小鵬就曾表示,汽車品類將從軟件定義汽車逐步進(jìn)化至人工智能(AI)定義汽車的時(shí)代,AI正在重新定義智能電動(dòng)汽車的技術(shù)架構(gòu)以及車企的商業(yè)模式,并將成為成功車企的必備核心能力。

在何小鵬的判斷中,AI將是決定未來(lái)汽車產(chǎn)業(yè)發(fā)展的決定因素。那么,什么又將決定AI的發(fā)展呢?答案是:數(shù)據(jù)。

華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰就曾表示:“大模型時(shí)代,數(shù)據(jù)決定AI智能的高度。”

事實(shí)上,各大車企和自動(dòng)駕駛企業(yè)早就著手采集數(shù)據(jù),并以此訓(xùn)練基于端到端大模型的自動(dòng)駕駛。據(jù)毫末智行數(shù)據(jù)智能科學(xué)家賀翔估算,在端到端的自動(dòng)駕駛開發(fā)過(guò)程中,數(shù)據(jù)就會(huì)占據(jù)80%以上的研發(fā)成本。

所以,自動(dòng)駕駛數(shù)據(jù)服務(wù)產(chǎn)業(yè)的爆發(fā),也就有了堅(jiān)實(shí)的市場(chǎng)基礎(chǔ)。據(jù)第三方調(diào)研機(jī)構(gòu)Research and Markets預(yù)測(cè),到2030年,全球自動(dòng)駕駛數(shù)據(jù)標(biāo)注市場(chǎng)規(guī)模將比現(xiàn)在擴(kuò)大6倍,從21億美元增長(zhǎng)到127.5億美元。

在這樣的背景之下,中國(guó)的自動(dòng)駕駛數(shù)據(jù)服務(wù)產(chǎn)業(yè),也正在隨著中國(guó)智能汽車產(chǎn)業(yè)的快速增長(zhǎng)而爆發(fā)。

 數(shù)據(jù)服務(wù)商,崛起進(jìn)行時(shí)

2022年,因?yàn)樯虡I(yè)落地的前景渺茫,全球自動(dòng)駕駛產(chǎn)業(yè)集體進(jìn)入了寒冬之中。傳統(tǒng)的行業(yè)龍頭Mobileye股指一度縮水超過(guò)一半,大眾和福特汽車共同投資數(shù)十億美元的自動(dòng)駕駛初創(chuàng)企業(yè)Argo更是直接倒閉。

但是,當(dāng)Open AI發(fā)布基于生成式Transformer大語(yǔ)言模型(LLM)的ChatGPT后,智能駕駛行業(yè)似乎迎來(lái)了轉(zhuǎn)角的曙光。理想汽車創(chuàng)始人、CEO李想馬上就捕捉到了ChatGPT帶來(lái)的機(jī)遇,并得出“AI技術(shù)路徑逐漸清晰”的結(jié)論。

2023年8月, 馬斯克親自開啟一場(chǎng)特斯拉完全自動(dòng)駕駛能力(下稱:FSD)Beta V12的直播,引發(fā)百萬(wàn)人線上圍觀。據(jù)悉,F(xiàn)SD Beta V12正是特斯拉有史以來(lái)收割的端到端自動(dòng)駕駛系統(tǒng)。

“特斯拉的技術(shù)路線,其實(shí)和Open AI的ChatGPT是一樣的。”此前,清華大學(xué)計(jì)算機(jī)系教授、清華大學(xué)人工智能研究院視覺(jué)智能研究中心主任鄧志東在接受億歐汽車專訪時(shí)就表示,應(yīng)該爭(zhēng)取利用大語(yǔ)言模型為中國(guó)的自動(dòng)駕駛產(chǎn)業(yè)賦能。

為了快速搭建屬于自己的端到端自動(dòng)駕駛能力,各大車企都已下場(chǎng)投入,重金研發(fā)。與此同時(shí),自動(dòng)駕駛數(shù)據(jù)的重要性也自然水漲船高。畢竟,沒(méi)有質(zhì)量俱佳的自動(dòng)駕駛數(shù)據(jù),就無(wú)從訓(xùn)練端到端的自動(dòng)駕駛大模型。

而且,自動(dòng)駕駛數(shù)據(jù)因?yàn)閳?chǎng)景比較特殊,車企對(duì)數(shù)據(jù)的質(zhì)量要求也更高,這就對(duì)相關(guān)企業(yè)提出了更高的技術(shù)要求。數(shù)據(jù)標(biāo)注服務(wù)商—整數(shù)智能CEO林群書就曾公開表示,因?yàn)閲?guó)內(nèi)車企都在對(duì)標(biāo)特斯拉的數(shù)據(jù)閉環(huán)方案,數(shù)據(jù)服務(wù)商如果想服務(wù)這個(gè)場(chǎng)景,就需要有專門的自動(dòng)化標(biāo)注平臺(tái)、專業(yè)標(biāo)注工具以及一整套完整的解決方案。

其次,中國(guó)自動(dòng)駕駛場(chǎng)景的復(fù)雜度遠(yuǎn)超歐美,相應(yīng)的數(shù)據(jù)標(biāo)注整理難度和數(shù)據(jù)體量也大幅增加。曾有標(biāo)注企業(yè)的高管對(duì)媒體表示,海外客戶的需求,只要將人和障礙物標(biāo)注出來(lái)即可,但國(guó)內(nèi)客戶往往要求標(biāo)注路上的所有細(xì)節(jié)且精確程度要求很高。

在龍貓數(shù)據(jù)CEO昝智看來(lái),國(guó)內(nèi)車企之所以對(duì)數(shù)據(jù)服務(wù)商的要求如此之高,因?yàn)閿?shù)據(jù)標(biāo)注質(zhì)量決定了各家主機(jī)廠在自動(dòng)駕駛競(jìng)爭(zhēng)中成敗的關(guān)鍵,一旦質(zhì)量不達(dá)標(biāo),就要推翻重來(lái),現(xiàn)在所有主機(jī)廠都耗不起這個(gè)時(shí)間。

最后,因?yàn)楦鞔筌嚻蠖加凶约旱囊惶讛?shù)據(jù)標(biāo)準(zhǔn),這就導(dǎo)致數(shù)據(jù)標(biāo)注不斷重復(fù)。哪怕是相同的道路數(shù)據(jù),也要根據(jù)不同企業(yè)的標(biāo)準(zhǔn)進(jìn)行標(biāo)注,自動(dòng)駕駛數(shù)據(jù)服務(wù)商的業(yè)務(wù)量自然更多。

正因?yàn)樯鲜鲆蛩兀鞔筌嚻蠖荚诩哟髷?shù)據(jù)標(biāo)注領(lǐng)域的資金投入力度。有媒體報(bào)道稱,國(guó)內(nèi)多家主機(jī)廠已將2023年數(shù)據(jù)標(biāo)注的投入預(yù)算從百萬(wàn)級(jí)別直接飆升到了數(shù)千萬(wàn)級(jí)別。

隨著行業(yè)需求的爆發(fā),自動(dòng)駕駛數(shù)據(jù)服務(wù)企業(yè)也在最近兩年完成多筆融資。

據(jù)億歐汽車不完全統(tǒng)計(jì),自2020年以來(lái),已有12家自動(dòng)駕駛數(shù)據(jù)服務(wù)商完成不同程度的融資。其中9家是在2022年和2023年完成了最新一輪融資。

其中,海天瑞聲更是在2021年8月登陸科創(chuàng)版。截至3月5日收盤,海天瑞聲市值為39.07億元人民幣。值得注意的是,作為美國(guó)人工智能領(lǐng)域的頭部數(shù)據(jù)服務(wù)商,硅谷獨(dú)角獸Scale AI估值曾達(dá)73億美元,約合人民幣525.36億元。

隨著大模型深度賦能自動(dòng)駕駛,數(shù)據(jù)服務(wù)商的市場(chǎng)前景進(jìn)一步市場(chǎng)認(rèn)可。但是,大模型和自動(dòng)駕駛產(chǎn)業(yè)的發(fā)展也正在對(duì)數(shù)據(jù)服務(wù)商構(gòu)成挑戰(zhàn)。

 一場(chǎng)貪食蛇游戲?

吃掉更多的食物,長(zhǎng)成更大的體型,最后被自己毀滅。作為一款經(jīng)典手機(jī)游戲,貪食蛇的邏輯早已被外界熟知。

隨著大模型的發(fā)展,數(shù)據(jù)服務(wù)商似乎也面臨著貪食蛇游戲的邏輯和結(jié)局。服務(wù)商提供的數(shù)據(jù)質(zhì)量越優(yōu)、數(shù)量越多,大模型的成熟度就越高。但是反過(guò)來(lái),越成熟的大模型就越有可能完成數(shù)據(jù)的自動(dòng)標(biāo)注,從而取代數(shù)據(jù)服務(wù)商的角色。

2023年,美國(guó)工程院院士、智源研究院原理事長(zhǎng)張宏江院士在一場(chǎng)有關(guān)大模型的演講中就曾表示,隨著算法的進(jìn)步,數(shù)據(jù)層面發(fā)生了非常明顯的改變。從人工標(biāo)注,到開放的數(shù)據(jù)集分享,現(xiàn)在發(fā)展到數(shù)據(jù)自動(dòng)標(biāo)注和深層研究,這是國(guó)內(nèi)數(shù)據(jù)標(biāo)注領(lǐng)域正在的現(xiàn)實(shí)。

在和多家自動(dòng)駕駛企業(yè)溝通的過(guò)程中,億歐汽車同樣發(fā)現(xiàn),使用AI標(biāo)注數(shù)據(jù)已經(jīng)被廣泛應(yīng)用。

“現(xiàn)在,大模型的能力已經(jīng)很強(qiáng)了,我們完全可以找一個(gè)開源并且能力強(qiáng)的大模型,通過(guò)它來(lái)提高數(shù)據(jù)標(biāo)注的效率。”一家自動(dòng)駕駛初創(chuàng)企業(yè)的高層對(duì)億歐汽車表示,以前特斯拉的標(biāo)注團(tuán)隊(duì)就超過(guò)千人,但是現(xiàn)在借助大模型,我們現(xiàn)在根本不需要這么多人。

2023年4月,在??低暤腝1財(cái)報(bào)會(huì)議上,曾有投資者詢問(wèn)過(guò)類似的問(wèn)題。對(duì)此,??低暦矫姹硎荆?ldquo;用同樣的人力投入,數(shù)據(jù)標(biāo)注的數(shù)量可以提升10倍。”如果反過(guò)來(lái)理解??低曔@句話,那也就是說(shuō),借助大模型,完成同樣的工作量只需要以前10%的人力。

商湯絕影產(chǎn)品總監(jiān)Larry在接受媒體采訪時(shí),也表示目前商湯絕影智能駕駛主要模型訓(xùn)練所依賴的標(biāo)注已經(jīng)大部分采用大模型自動(dòng)標(biāo)注技術(shù),全自動(dòng)標(biāo)注和半自動(dòng)標(biāo)注(采用人工抽樣質(zhì)檢)基本已經(jīng)代替了人工標(biāo)注,成本和時(shí)間周期均大幅下降。

面對(duì)自己“喂養(yǎng)”出來(lái)的大模型,人工標(biāo)注的未來(lái)在哪里呢?

“我是自動(dòng)標(biāo)注的絕對(duì)支持者。”博登智能CEO趙捷曾表示,他雖然支持人工智能的自動(dòng)標(biāo)注,但自動(dòng)標(biāo)注并不意味著無(wú)人標(biāo)注。他做了一個(gè)比喻,現(xiàn)在擁有自動(dòng)化生產(chǎn)線的工廠并不是無(wú)人工廠。

一家自動(dòng)駕駛初創(chuàng)公司的算法工程師也對(duì)億歐汽車表示,目前對(duì)AI標(biāo)注更多的還是取代初級(jí)標(biāo)注工作,更復(fù)雜的一些項(xiàng)目離不開人工,或者需要人工配合AI才能完成工作。

“整個(gè)數(shù)據(jù)服務(wù)市場(chǎng)將重新洗牌。”海天瑞聲CEO王曉東曾表示,大模型時(shí)代的到來(lái)會(huì)讓研發(fā)能力弱,資源少的企業(yè)被快速淘汰,數(shù)據(jù)服務(wù)市場(chǎng)的集中度會(huì)進(jìn)一步提升。由此可見(jiàn),面對(duì)來(lái)自人工智能標(biāo)注的挑戰(zhàn),數(shù)據(jù)服務(wù)商必須及時(shí)調(diào)整自己以適應(yīng)大模型時(shí)代的數(shù)據(jù)標(biāo)注業(yè)務(wù)。  

 結(jié)語(yǔ) 

雖然面臨著人工智能帶來(lái)的挑戰(zhàn),但現(xiàn)階段人工標(biāo)注依舊會(huì)存在,再疊加自動(dòng)駕駛和大模型產(chǎn)業(yè)的快速發(fā)展,數(shù)據(jù)服務(wù)市場(chǎng)的規(guī)模還會(huì)進(jìn)一步增長(zhǎng)。

龍貓數(shù)據(jù)CEO昝智就曾預(yù)測(cè),機(jī)會(huì)窗口要到2030年才能完全釋放出來(lái)。

但是,目前數(shù)據(jù)服務(wù)行業(yè)的發(fā)展依舊面臨著眾多挑戰(zhàn)。除了人工智能標(biāo)注之外,數(shù)據(jù)保護(hù)手段的欠缺也是行業(yè)必須面對(duì)的問(wèn)題。曾有媒體報(bào)道稱,一家AI大廠的負(fù)責(zé)人曾表示,在中國(guó),你能花錢買到的數(shù)據(jù),別人也可以買到。誰(shuí)花錢做了高質(zhì)量數(shù)據(jù),別人就可以用低成本拿到,反之亦然。

在億歐汽車接觸的多家自動(dòng)駕駛企業(yè)中,很多企業(yè)都選擇在公司內(nèi)部標(biāo)注和梳理最核心的數(shù)據(jù),而不是將其交給第三方。

所以,如何能夠在處理數(shù)據(jù)的過(guò)程中保護(hù)相關(guān)企業(yè)的權(quán)益,從而最大發(fā)揮專業(yè)的自動(dòng)駕駛數(shù)據(jù)服務(wù)商的能量,是全行業(yè)都必須共同面對(duì)和急需解決的問(wèn)題。

本文系作者 億歐 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱與中東3國(guó)達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無(wú)人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長(zhǎng)發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國(guó)最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬(wàn)-5.48萬(wàn)元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉(cāng)庫(kù)并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國(guó)務(wù)卿和歐盟官員被曝就烏克蘭問(wèn)題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬(wàn)次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國(guó)首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國(guó)務(wù)院食安辦、市場(chǎng)監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問(wèn)題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來(lái)西亞說(shuō)伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國(guó)創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國(guó)和菲律賓舉行南海問(wèn)題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬(wàn)人受影響

2026-03-28 17:04

美國(guó)加州禁止官員借內(nèi)幕消息在預(yù)測(cè)市場(chǎng)牟利

2026-03-28 17:02

北京“超現(xiàn)場(chǎng)”生態(tài)共同體建設(shè)暨全國(guó)覆蓋啟動(dòng)

掃描下載App