免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

【鈦坦白】閱面科技趙京雷:從算法到視覺模塊,開啟本能化的機(jī)器視界

計(jì)算機(jī)視覺涵蓋的領(lǐng)域非常廣,包含的功能也非常多。哪些視覺功能適合作為云服務(wù)提供,哪些視覺功能應(yīng)該集成進(jìn)設(shè)備前端呢?

繼“讓機(jī)器聽懂你的聲音”,鈦坦白又請來六位鈦客,探討如何讓機(jī)器看懂這個(gè)世界。本文根據(jù)閱面科技創(chuàng)始人、CEO趙京雷在鈦坦白的分享整理。

趙京雷是上海交通大學(xué)人工智能博士,前阿里巴巴北京算法研究中心負(fù)責(zé)人、高級算法專家,專注人工智能領(lǐng)域算法和產(chǎn)品研發(fā)超過15年。

以下是趙京雷在鈦坦白的分享:

大家晚上好,非常榮幸有這樣的機(jī)會在鈦坦白和大家交流。前面聽了幾位創(chuàng)始人的分享,在群里面也看到了這么多從事計(jì)算機(jī)視覺研究以及對這個(gè)領(lǐng)域感興趣的朋友。給我的感受是,計(jì)算機(jī)視覺在各個(gè)領(lǐng)域的應(yīng)用正在快速爆發(fā)中。

這一波的人工智能創(chuàng)業(yè)潮和移動互聯(lián)網(wǎng)以及O2O的創(chuàng)業(yè)潮不太一樣,各種垂直行業(yè)的機(jī)會很多。我個(gè)人認(rèn)為,AI行業(yè)很難形成一家獨(dú)大,贏家通吃的局面,另外市場也非常大,需求也很強(qiáng)。不同的視覺公司正在從不同的領(lǐng)域形成各自的突破,都存在非常大的機(jī)會。

簡單介紹一下閱面科技,我們從2014年底開始籌備,公司正式成立是在2015年7月份,目前我們的總部在上海,在北京、南京、美國設(shè)有研發(fā)分部。閱面科技主要專注在深度學(xué)習(xí)和嵌入式視覺,為消費(fèi)級以及民用智能產(chǎn)品提供基于深度學(xué)習(xí)的低成本視覺解決方案。

視覺功能的層次和基礎(chǔ)設(shè)施

談到嵌入式視覺,顧名思義,我們更多是希望算法能夠慢慢沉淀為成熟的視覺模塊,能夠在設(shè)備端不依賴于服務(wù)器,本地化和實(shí)時(shí)化的運(yùn)行。當(dāng)然與前端視覺模塊相對應(yīng)還有云服務(wù)。人工智能發(fā)展到一定階段,一定會沉淀為比較基礎(chǔ)的實(shí)施,就像移動互聯(lián)網(wǎng)的發(fā)展軌跡一樣。這種基礎(chǔ)設(shè)施的沉淀和成熟,會讓人工智能技術(shù)拿來即用。

計(jì)算機(jī)視覺基礎(chǔ)設(shè)施形式可以是云,也可以是集成在設(shè)備前端的視覺模塊。計(jì)算機(jī)視覺其實(shí)涵蓋的領(lǐng)域非常多,包含的各種各樣的功能也非常多。哪些視覺功能適合作為云服務(wù)提供,哪些視覺功能應(yīng)該集成進(jìn)設(shè)備前端呢?這個(gè)其實(shí)是從我們開始籌備這家公司就在思考的問題。答案隱藏于對我們?nèi)祟愖陨硪曈X能力形成過程的思考。

如下圖所示,人類在長大的過程中,視覺能力經(jīng)歷了不同的層面的形成過程。有一些視覺能力是每一個(gè)人生下來就具備的。比如,孩子可能剛剛學(xué)會走路,或者是剛剛會爬的時(shí)候,就具備的這樣一些視覺能力,我們把他稱之為本能層的視覺能力。比如孩子知道身邊沒人了,他就害怕。知道爸爸媽媽來了,有人過來照顧他了,他會覺得很開心。這種能力我們稱之為對人感知的視覺能力。另外一塊比如說孩子即便是剛學(xué)會爬,也不會把頭往墻上去撞。孩子知道哪里是可以行走的,哪里是不可以行走的,這種能力我們稱之為對空間感知的視覺能力。人感能力和空間感知能力都是本能層視覺能力。

另外還有很多的視覺能力是靠我們后天不斷的學(xué)習(xí)才得到的。比如,對物品的識別,認(rèn)識前面的物品是一個(gè)手機(jī),是一個(gè)電腦,還是一個(gè)杯子等等。另外比如說識字,也是一種后天通過不斷的學(xué)習(xí)得到的視覺能力。這一層的視覺能力稱之為習(xí)得層視覺能力。

另外還有一些視覺能力,可能是比較專業(yè)的人士才會具備的,比如說通過醫(yī)學(xué)圖片來判斷上面會不會有一個(gè)病灶,這只有專業(yè)的醫(yī)生才能做到。另外比如說任給一個(gè)植物照片,說出植物的名字,這只有植物學(xué)家能夠做到。這一層能力稱之為專業(yè)層視覺能力。

不同層面的視覺能力,具有不同的特性,隨著技術(shù)的成熟,會沉淀為不同層面的基礎(chǔ)設(shè)施。比如下圖所示:本能層的視覺能力,更多的是動態(tài)的,最基本的視覺理解層面的東西,未來會沉淀為即插即用的前端處理模塊;習(xí)得層的視覺能力,更多的是靜態(tài)的圖像識別,未來更多會沉淀為公有云服務(wù);而專業(yè)層的視覺能力,未來更多會沉淀為垂直的行業(yè)服務(wù)或解決方案。

閱面科技在做的視覺模塊,主要是對應(yīng)于本能層這塊,我們是希望能夠把未來的比較基礎(chǔ)的比如說像對人感知,對空間感知這樣的基礎(chǔ)能力做成比較標(biāo)準(zhǔn)化的前端的視覺模塊。因?yàn)橹灰窍M(fèi)和民用的場景的各種機(jī)器和設(shè)備,一定是和人打交道的,一定是和人的生活空間打交道的,一定離不開這些本能層的視覺能力。

為什么是視覺模塊,而不是SDK?

說到這里,可能大家會有個(gè)疑問,是不是我們把算法做成SDK讓我們的前端設(shè)備去集成就行了?為什么還要沉淀為這種軟硬件一體的視覺模塊呢?

相比較于算法的SDK,視覺模塊有以下的這樣幾個(gè)特點(diǎn):

  • 視覺模塊的集成可以不考慮被嵌入設(shè)備本身的計(jì)算能力,做到即插即用。比如機(jī)器人也好,或者是其他帶攝像頭的設(shè)備也好,通過集成一個(gè)對人感知模塊,可以馬上具備對人感知的綜合能力,比如:有沒有人,人在哪里,各自的移動軌跡,分別是誰,等等。
  • 視覺模塊可以屏蔽掉硬件的適配問題,不受攝像頭選型、芯片架構(gòu)、操作系統(tǒng)類型的影響。
  • 最重要的是,算法模塊是和行業(yè)緊密結(jié)合的,可以把這個(gè)行業(yè)相關(guān)的,若干不同的算法集成在一起,多算法協(xié)同作業(yè),以最有效率,最具有擴(kuò)展性的,最低成本的一種方式,幫助這個(gè)行業(yè)去快速解決問題。

嵌入式視覺領(lǐng)域,非常典型的一家公司是以色列的Mobileye。Mobileye的IQ系列視覺模塊專為自動駕駛行業(yè)構(gòu)建,集成了自動駕駛行業(yè)里面所需的一系列算法,一體化的提供給這個(gè)行業(yè)。行業(yè)的客戶的比如說像車廠可以迅速的基于這個(gè)模塊去搭建他自己的自動駕駛產(chǎn)品。IQ系列視覺模塊的基礎(chǔ)和核心,毫無疑問,一定是里邊集成的視覺算法,比如各種人、車的檢測和識別算法。

算法的成熟,其實(shí)是一個(gè)非常非常漫長的過程。我們都知道Mobileye在自動駕駛領(lǐng)域目前絕對領(lǐng)先,更多的是它們的基礎(chǔ)算法經(jīng)過了多年的優(yōu)化。視覺算法的優(yōu)化不是一兩個(gè)月就能達(dá)到的,一般來講,從一個(gè)實(shí)驗(yàn)室級別的算法到一個(gè)工業(yè)級的算法,沒有一年半以上的優(yōu)化時(shí)間,是不太可能達(dá)到出色水平的。

拿最普通的人臉檢測算法來舉例。假設(shè)有公司找到兩個(gè)非常不錯(cuò)的人才去做這樣一件事,要求是能在普通的手機(jī)設(shè)備上能夠?qū)崟r(shí)運(yùn)行。出于速度考慮,他可能首先會想到使用比較傳統(tǒng)的方法,比如NPD之類的。如果足夠優(yōu)秀,1個(gè)月左右可以完成第一版實(shí)驗(yàn)室級別的算法。然后,各種各樣的問題就來了,比如在FDDB上能跑到多少?側(cè)面檢測角度能支持多少?平面內(nèi)旋轉(zhuǎn)能支持多少?多人同時(shí)檢測速度是否成比下降?頭頂有大燈的情況下能否檢測出來?逆光的情況下能否檢測出來?表情夸張的時(shí)候能否檢測出來?嚴(yán)重遮擋的時(shí)候能否檢測出來?距離是否可以支持的足夠遠(yuǎn)?第一個(gè)版本,幾乎上面列的任何一個(gè)問題都是遠(yuǎn)遠(yuǎn)不能滿足要求的。后面,每一個(gè)點(diǎn)的優(yōu)化其實(shí)都是一個(gè)坑,跳進(jìn)去可能就爬不上來。最終可能面臨很多無法解決的問題,這時(shí)候你開始對模型懷疑,考慮換模型,比如說換成深度學(xué)習(xí)模型。事實(shí)確實(shí)是這樣的,深度學(xué)習(xí)算法在遇到上面這些問題上魯棒性要好很多,但還是要反復(fù)不斷的進(jìn)行優(yōu)化。

除了算法的精度優(yōu)化之外,是不是可以做到讓這樣的深度學(xué)習(xí)算法依賴的計(jì)算資源很小,運(yùn)算速度足夠快?比如深度學(xué)習(xí)算法實(shí)現(xiàn)以后,算法包可能非常大,只能借助于GPU或者在臺式機(jī)上勉勉強(qiáng)強(qiáng)能夠跑起來。在這個(gè)基礎(chǔ)之上,怎么樣在不降低精度的情況下,優(yōu)化模型,讓模型可以在嵌入式設(shè)備跑起來,這決定了模塊化的成本。各種各樣的方法,比如說像多值化、定點(diǎn)化,包括各種矩陣計(jì)算的優(yōu)化,每一個(gè)都是非常大的坑,跳進(jìn)去是不是能爬得上來,都是一個(gè)未知數(shù)。我相信每一個(gè)視覺公司,每一個(gè)算法公司,在底層算法的成熟上一定會經(jīng)歷這樣的一個(gè)漫長的熬人的過程,這樣一個(gè)從實(shí)驗(yàn)室級別算法到工業(yè)級算法的優(yōu)化過程。

具體到閱面科技,我們在底層算法的成熟基礎(chǔ)上,已經(jīng)形成了模塊化的系列產(chǎn)品線,主要包括人臉識別模塊、人感模塊和空間感知模塊。簡單介紹一下,人感視覺模塊,稱之為Human Sensing Module,里面集成了對人進(jìn)行感知的系列算法閉環(huán),包含檢測有沒有人、幾個(gè)人、人在哪里、運(yùn)動軌跡、姿態(tài)、分別是誰,以及有沒有和我產(chǎn)生交互。這個(gè)模塊可以通過普通攝像頭,即插即用。目前,我們的模塊化的產(chǎn)品,很多是針對行業(yè)的解決方案。我們還是圍繞我們最開始成立公司的初衷,圍繞人、人的生活圈,在消費(fèi)和民用相關(guān)領(lǐng)域展開服務(wù)。第一個(gè)領(lǐng)域,稱之為泛機(jī)器人,也可以稱為智能機(jī)器行業(yè)。第二個(gè)領(lǐng)域,是智慧家庭和智慧社區(qū)。智能機(jī)器方面,以增量市場為主,比如各種嵌入攝像頭的設(shè)備等。在智慧社區(qū)這塊,更多是針對現(xiàn)有的一些存量市場,比如像樓宇對講系統(tǒng)、門禁系統(tǒng)、各種各樣的IP攝像頭等。

算法前端化的兩個(gè)重要問題

前面我大概講了一下,我們在構(gòu)建我們的產(chǎn)品和商業(yè)模式上的一些想法和一些思路。接下來和大家一起探討兩個(gè)比較具體的算法前端化的一個(gè)問題,也是我自己經(jīng)常思考的兩個(gè)問題。

  • sensor的選擇(攝像頭選型問題)

目前我們推出的一些模塊,主要都是基于單目RGB攝像頭,也就是隨處可見的最普通的攝像頭。任何一個(gè)攝像頭,只要30萬象素以上都可以集成我們的模塊馬上獲得模塊所提供的視覺認(rèn)知能力。

我們來對比一下前端視覺的可能幾種選型:首先看一下單目RGB和雙目RGB的不同。我們還是拿Mobileye做為例子,我們都知道,Mobileye基于單目RGB實(shí)現(xiàn)。自動駕駛領(lǐng)域,其實(shí)是一個(gè)對距離,對深度非常敏感的領(lǐng)域。自動駕駛需要知道前面車、人的距離,包括其他方面的景深。我們?nèi)绻恢肋@家公司的存在,可能粗粗一想,會認(rèn)為雙目攝像頭在自動駕駛領(lǐng)域是必不可缺的。但是Mobileye給的答案是單目攝象頭,是因?yàn)樗夹g(shù)上沒辦法做雙目嗎?顯然不是。Mobileye認(rèn)為,即便在自動駕駛的這種場景下,其實(shí)更多的是要做識別,而深度以及距離信息其實(shí)可以通過單目結(jié)合攝像頭內(nèi)參等信息精確獲取。

總體來講,在對識別需求更多的場景里邊,單目是一個(gè)比較佳的選擇,不管是從成本上還是實(shí)際的效果上。那種比較遠(yuǎn)距離的,三維空間的避障方面,比如無人機(jī)領(lǐng)域,可能雙目是一個(gè)比較好的選擇。其他的sensor類型,諸如TOF以及結(jié)構(gòu)光Sensor,其實(shí)可以類比于雙目RGB攝像頭,都只是構(gòu)建深度的一個(gè)手段,本身都不具備識別功能。

  • 芯片選型問題

到底使用什么樣的芯片去承載深度學(xué)習(xí)算法的計(jì)算?目前,我們底層的深度學(xué)習(xí)算法,都是可以不依賴于GPU或其他加速設(shè)備,僅僅依賴于低端的CPU運(yùn)行的,這使得我們模塊成本可以做到很低。

芯片之爭,在整個(gè)人工智能領(lǐng)域現(xiàn)在是非常激烈。2016年其實(shí)發(fā)生很多領(lǐng)域的并購案,像因特爾收購了Altera和Movidius,分別是做FPGA和神經(jīng)網(wǎng)絡(luò)架構(gòu)芯片。軟銀收購了ARM這樣的傳統(tǒng)CPU架構(gòu)芯片公司。另外,GPU企業(yè)Nvidia在2016年借助深度學(xué)習(xí)風(fēng)潮迅速圈錢。

粗粗算來,在前端模塊上有很多種選擇,比如像英偉達(dá)的嵌入式端GPU TK1或者TX1;FPGA企業(yè)推出的各種各樣的FPGA;當(dāng)然還有傳統(tǒng)的CPU;還有國內(nèi)現(xiàn)在也有不少公司在做的,被稱之為新一代的計(jì)算架構(gòu)的芯片, VPU或者稱之為NPU也好,也就是為神經(jīng)網(wǎng)絡(luò)加速而優(yōu)化的計(jì)算芯片;另外,還有針對某些行業(yè)的特定模塊在未來其實(shí)可以變成ASIC,比如說像Mobileye的IQ系列模塊,其實(shí)已經(jīng)變成了一款視覺專用芯片。

不同的芯片,在現(xiàn)在支持的領(lǐng)域可能不太一樣,比如說像GPU這種,能力比較強(qiáng)一點(diǎn),但是功耗比較高,可能適合于更加軍用、政府用這種對成本不太敏感的場景,F(xiàn)PGA其實(shí)也是這樣的。另外,VPU或稱為NPU,真能做出來還是可以對整個(gè)這個(gè)行業(yè)推動比較大。但這個(gè)做出來以后,到底是以一種什么樣的形式呈現(xiàn),這個(gè)目前還不得而知。目前而言,我們還看到另外一種變數(shù),就是這種深度學(xué)習(xí)的加速能力,其實(shí)沒有變成所謂的VPU、NPU,而是被整合到我們以前可能都想不到的地方,比如說DSP,然后和CPU結(jié)合起來提供整體的一個(gè)計(jì)算能力。

那么ASIC,也就是專用芯片呢?個(gè)人認(rèn)為不一定是一個(gè)必然的結(jié)果。專用芯片是某種程度上節(jié)省成本,構(gòu)建行業(yè)壁壘的一種手段,不一定是一個(gè)必然的結(jié)果,有可能做到模塊這一層就夠了??傮w來講,其實(shí)還是像剛才講的,各種各樣的前端芯片選型,還是和具體的行業(yè)以及應(yīng)用領(lǐng)域有關(guān)。

人工智能領(lǐng)域在2016年變得非常的火熱,我覺得這種火熱來自于兩個(gè)方面,一方面就是技術(shù)進(jìn)步使我們已經(jīng)能夠看到很多智能應(yīng)用的落地,另一方面,是人工智能帶給我們很多的未知數(shù)和不確定性。正是這些未知數(shù),撬動了行業(yè)以及資本的熱度。人工智能到底在行業(yè)應(yīng)用里邊能應(yīng)用到怎樣一個(gè)程度,到底能給我們生活帶來什么樣的改變,目前是沒有答案的,但改變是必然的。

移動互聯(lián)網(wǎng)的紅利過去以后,各行各業(yè)都面臨效率提升和成本下降的進(jìn)一步需求。技術(shù)的進(jìn)步將為這種需求的滿足帶來強(qiáng)大驅(qū)動力。我們最希望看到的是通過人工智能企業(yè)的一起努力,讓人工智能的技術(shù)迅速沉淀為基礎(chǔ)設(shè)施。這樣的話,我們將迎來人工智能時(shí)代的真正主角,也就是讓更多行業(yè)出來的人,拿起AI的武器,迅速去改變我們的世界。(本文獨(dú)家首發(fā)鈦媒體,根據(jù)閱面科技創(chuàng)始人、CEO趙京雷在鈦坦白上的分享整理)

………………………………………………

鈦坦白第28期“AI已來,讓機(jī)器看懂這個(gè)世界”,六位鈦客的精彩分享已經(jīng)結(jié)束,干貨會陸續(xù)發(fā)布:http://m.chcmb.cn/tag/1508094

鈦坦白2017年,精彩分享繼續(xù)!

推薦鈦客、贊助、合作:請與鈦坦白負(fù)責(zé)人佳音聯(lián)系,郵箱jiayinge@tmtpost.com

本文系作者 葛佳音 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報(bào)

更多

20:34

大風(fēng)、降水來襲,長江江蘇段部分區(qū)域?qū)嵤┡R時(shí)交通管制

19:59

國航C919正式投入北京—廈門、北京—哈爾濱兩條航線運(yùn)營

19:57

中鋁國際:2025年歸母凈利潤2.58億元,同比增長16.47%

19:19

伊朗稱已打擊與美軍工有關(guān)聯(lián)的兩家企業(yè)

18:36

伊朗與巴基斯坦兩國外長通電話,討論地區(qū)局勢

18:35

2025年玩具(不含潮玩)國內(nèi)市場零售總額達(dá)1035.3億元

18:08

全國豬價(jià)跌破5元,創(chuàng)歷史新低

18:07

時(shí)代天使2025年實(shí)現(xiàn)收入3.7億美元,同比增長37.8%

17:57

電魂網(wǎng)絡(luò):擬投資4920萬元取得上海漫魂51%股權(quán)

17:51

美國1天超3000場反戰(zhàn)示威

17:28

雀巢12噸巧克力被盜

17:11

伊朗官員表示將“果斷反擊”美軍奪島

17:08

伊朗議長稱武裝部隊(duì)“正等著美軍地面行動”,并將“懲罰”其地區(qū)盟友

17:05

三安光電:董事長及總經(jīng)理擬增持公司股份

16:58

全球多地爆發(fā)示威抗議,民眾高呼“不要戰(zhàn)爭”

16:55

中信證券:配置上建議繼續(xù)堅(jiān)守中國優(yōu)勢制造業(yè),靜待4月決斷

16:38

美國土安全部資金中斷進(jìn)入第44天,創(chuàng)美國史上最長政府部分“停擺”紀(jì)錄

16:17

北京啟動智能網(wǎng)聯(lián)新能源汽車商業(yè)保險(xiǎn)開發(fā)應(yīng)用,統(tǒng)一適配L2至L4全級別智能網(wǎng)聯(lián)新能源汽車

16:16

恒林股份發(fā)布AI體感工學(xué)白皮書,加速布局AI智能家居

16:15

中國國家創(chuàng)新指數(shù)綜合排名世界第9位,較上年提升1位

掃描下載App