OPPO語音語義科學(xué)家 郝杰

智能手機(jī)產(chǎn)業(yè)發(fā)展至今,無論是終端產(chǎn)品還是芯片廠商,都將AI的能力放在了戰(zhàn)略性的地位,AI正在從底層硬件到用戶體驗(yàn)等各個(gè)環(huán)節(jié)賦能智能手機(jī)。

作為全球銷量位居前列的智能手機(jī)廠商,OPPO當(dāng)然也對(duì)AI高度重視。一方面OPPO已經(jīng)在手機(jī)中給用戶帶來了包括AI拍照、語音助手、識(shí)屏、翻譯等功能;另一方面,OPPO今年正式成立研究院,聚焦在AI、5G等新興技術(shù)的預(yù)研。

在12月15日的 2018 T-EDGE 全球創(chuàng)新大會(huì)上,來自O(shè)PPO研究院的語音語義科學(xué)家郝杰詳細(xì)表達(dá)了OPPO對(duì)于未來AI技術(shù)發(fā)展的觀點(diǎn),主要涵蓋三個(gè)方面:

首先,OPPO認(rèn)為AI不僅是一種能力,也是一種思維,智能手機(jī)本身恰好是AI落地的最佳載體之一。比如,OPPO早在2012年的時(shí)候開創(chuàng)美顏技術(shù),通過傳統(tǒng)的圖像處理、人工的特征工程和分類算法實(shí)現(xiàn)的?,F(xiàn)在通過引入深度學(xué)習(xí)技術(shù),可以讓美顏方案更加精細(xì)化,比如說算法可以很容易的識(shí)別出用戶的性別、年齡、膚色、膚質(zhì),千人千面地給用戶提供定制化的服務(wù)。

“還有近期上市的OPPO R17智能手機(jī),有了深度學(xué)習(xí)、AI超清引擎等技術(shù)之后,夜景拍攝的效果得到了顯著提升,我們可以看到在夜景下圖片的邊緣和細(xì)節(jié)更加清晰,噪點(diǎn)能得到很好的控制。還有暗光下拍攝亮度不夠這些問題也都得到了很好的解決。我們發(fā)現(xiàn)這是人工智能技術(shù)和攝影藝術(shù)的完美結(jié)合。” 

其次,他表示AI是服務(wù)產(chǎn)品的途徑,技術(shù)要落地在產(chǎn)品之上,才能給用戶帶來切實(shí)的價(jià)值。而這一過程并不容易,需要企業(yè)經(jīng)過反復(fù)的測(cè)試和驗(yàn)證。

“給大家舉個(gè)例子,F(xiàn)ind X 是OPPO今年發(fā)布的旗艦手機(jī),主打3D結(jié)構(gòu)光和人臉解鎖功能,這也是Android世界中的第一款搭載3D結(jié)構(gòu)光人臉解鎖的手機(jī)。為了這個(gè)功能我們探索了用戶的各種使用場(chǎng)景、不同的光線環(huán)境、攝像頭升降速度,綜合考慮傳感器、系統(tǒng)、軟件和設(shè)計(jì)方面的各種需求之后,經(jīng)過幾十次快速迭代,終于可以把這款屏占比高達(dá)93.8%的全面屏手機(jī)送到用戶手中。”

第三,就是要始終堅(jiān)持用戶需求和前沿技術(shù)雙驅(qū)動(dòng)的創(chuàng)新路徑。比如,OPPO Hyper Boost加速引擎,從系統(tǒng)、游戲、應(yīng)用三個(gè)方面給用戶提供全場(chǎng)景、系統(tǒng)級(jí)的全面流暢體驗(yàn)。 

“系統(tǒng)方面,我們采用了全新的行為感知和系統(tǒng)調(diào)度的理念,提供超過50多種的優(yōu)化方案,系統(tǒng)啟動(dòng)的速度可以提升30%以上,界面切換更加流暢;游戲方面,如王者榮耀多核多線程技術(shù)最早就是基于OPPO R11這款手機(jī)做的優(yōu)化;應(yīng)用方面,針對(duì)淘寶、微信等App的幾十個(gè)場(chǎng)景都做了優(yōu)化,例如淘寶購物車頁面進(jìn)入速度提升48.21%;微信進(jìn)出會(huì)話頁面流暢度提升29.8%;手機(jī)QQ 打開聊天頁面速度提升67% 以上等等。”

最后,郝杰還分享了OPPO未來對(duì)于AI方面的暢想。首先是增強(qiáng)現(xiàn)實(shí)AR技術(shù);其次是AI的多模態(tài)融合;第三是是軟硬件和算法的深度結(jié)合。而支持這些未來技術(shù)研究的,是OPPO研究院,以及其分布在全球各地的六大研究所。

以下是OPPO語音語義科學(xué)家郝杰在 2018 T-EDGE 創(chuàng)新大會(huì)上的演講全文,略經(jīng)鈦媒體編輯:

很高興今天在這里跟大家做簡短的交流,為大家解釋一下OPPO對(duì)于AI的一些觀點(diǎn),我自己25年前開始搞語音識(shí)別,但是AI、大數(shù)據(jù)、深度學(xué)習(xí)這些概念從來沒有像最近這三年這么火,這些新技術(shù)已經(jīng)成為了整個(gè)行業(yè)的高頻的熱詞。

主持人做開場(chǎng)白的時(shí)候提到汽車導(dǎo)航的功能特點(diǎn),我感覺到他有輕微的調(diào)侃和抱怨,我想說的是兄弟你應(yīng)該滿足,因?yàn)楝F(xiàn)在的汽車導(dǎo)航比十多年前已經(jīng)好很多。

2004年的時(shí)候,我?guī)ьI(lǐng)我以前的團(tuán)隊(duì)做成了我們中國汽車市場(chǎng)上前裝導(dǎo)航器的第一套語音導(dǎo)航系統(tǒng),那時(shí)候比現(xiàn)在還要簡單,所以我們的用戶永遠(yuǎn)很難得到充分的滿足的。

OPPO是一家全球領(lǐng)先的智能終端公司。到目前為止,我們開展手機(jī)業(yè)務(wù)已10年,也得到數(shù)億用戶的喜愛。如果每個(gè)OPPO的用戶像我一樣每天使用手機(jī)在幾個(gè)小時(shí)的話,那我們每天的用戶總時(shí)長會(huì)高達(dá)幾十億小時(shí)。這些終端設(shè)備上每天都會(huì)發(fā)生海量的用戶行為、產(chǎn)生大量的用戶數(shù)據(jù),它就像一個(gè)汪洋大海,需要我們劃動(dòng)人工智能的小船,來為用戶提供精準(zhǔn)的、個(gè)性化的服務(wù)。

AI是一種能力,也是一種思維

OPPO的使命是讓不凡的心盡享至美科技。首先是我們希望給用戶帶來美的產(chǎn)品和體驗(yàn),OPPO手機(jī)未來也會(huì)和人工智能結(jié)合越來越緊密,給用戶帶來極致的體驗(yàn)。

上月底,OPPO公司召開了面向內(nèi)部的第一屆科技展,OPPO創(chuàng)始人兼CEO陳明永先生發(fā)表了他的觀點(diǎn),他認(rèn)為AI不應(yīng)該是一門玄學(xué),AI是一種能力,也是一種思維,有了AI我們可以打造出更加極致的產(chǎn)品。

智能手機(jī)本身恰好是AI落地的最佳載體之一,但是智能手機(jī)AI體驗(yàn)?zāi)壳斑€有非常大的改善空間。OPPO會(huì)非常積極的擁抱人工智能,把人工智能技術(shù)落地在我們的手機(jī)和周邊產(chǎn)品上,我們會(huì)密切的關(guān)注AI方面的前沿研究和應(yīng)用成果。

我們來看一個(gè)例子,2012年的時(shí)候,我們?cè)谛袠I(yè)內(nèi)率先推出了智能手機(jī)的前置美顏功能,當(dāng)時(shí)我們調(diào)研市場(chǎng)的時(shí)候發(fā)現(xiàn),用戶不僅希望拍出的照片很清晰,而且希望這個(gè)照片很好看。那個(gè)時(shí)候我們的技術(shù)還沒有使用現(xiàn)在這么火爆的深度學(xué)習(xí),用的是人工的特征工程、以及傳統(tǒng)的圖像處理和分類算法。

盡管如此,這樣的美顏功能在當(dāng)時(shí)市場(chǎng)上也取得了極大成功,現(xiàn)在有深度學(xué)習(xí)人工智能的加持,我們可以把美顏功能做的更加極致,比如說算法可以很容易的識(shí)別出用戶的性別、年齡、膚色、膚質(zhì),千人千面的給用戶提供美顏服務(wù)。

第二個(gè)例子是近期上市的OPPO R17智能手機(jī),有了深度學(xué)習(xí)、AI超清引擎等技術(shù)之后,夜景拍攝的效果得到了顯著提升,我們可以看到在夜景下圖片的邊緣和細(xì)節(jié)更加清晰,天空中的噪點(diǎn)能得到很好的控制,云層得到了很好的保留和展現(xiàn),暗光下拍攝也有了足夠的亮度,給用戶呈現(xiàn)出溫柔的夜色。我們發(fā)現(xiàn)這是人工智能技術(shù)和攝影藝術(shù)的完美結(jié)合。

技術(shù)不是終點(diǎn),是服務(wù)產(chǎn)品的途徑

另外一個(gè)觀點(diǎn)是:我們認(rèn)為技術(shù)不是終點(diǎn),而是服務(wù)于產(chǎn)品的途徑。極致的產(chǎn)品體驗(yàn)才是我們的目標(biāo),技術(shù)要落地在產(chǎn)品之上,給用戶帶來切實(shí)的價(jià)值,解決用戶痛點(diǎn),這才算是有用的技術(shù)。

從技術(shù)到產(chǎn)品之間是一個(gè)漫長的道路,需要非常艱苦的打磨,我們就相當(dāng)于奔跑在這條漫長道路上的老司機(jī),開著車?yán)覀兊漠a(chǎn)品伙伴,把他們拉到存在用戶痛點(diǎn)的地方,讓他們?nèi)ネ诰蛐枨蠼鉀Q痛點(diǎn),創(chuàng)造用戶價(jià)值。

再給大家舉個(gè)例子,F(xiàn)ind X 是OPPO今年發(fā)布的旗艦手機(jī),主打3D結(jié)構(gòu)光和人臉解鎖功能,這也是Android世界中的第一款搭載3D結(jié)構(gòu)光人臉解鎖的手機(jī)。為了這個(gè)功能我們探索了用戶的各種使用場(chǎng)景、不同的光線環(huán)境、用戶手勢(shì)、攝像頭升降速度,綜合考慮傳感器、系統(tǒng)、軟件和設(shè)計(jì)方面的各種需求之后,經(jīng)過幾十次快速迭代,終于可以把這款屏占比高達(dá)93.8%的全面屏手機(jī)送到用戶手中。

用戶需求和前沿技術(shù)雙驅(qū)動(dòng)

第三個(gè)觀點(diǎn)是:在打磨產(chǎn)品研發(fā)產(chǎn)品的過程中,堅(jiān)持用戶需求和前沿技術(shù)雙驅(qū)動(dòng)的方法論,讓人工智能為手機(jī)注入更多人性化體驗(yàn),一方面深刻洞察需求、挖掘出剛需,另一方面要洞察產(chǎn)品背后的技術(shù)的原理,用技術(shù)邏輯去實(shí)現(xiàn)它。

通過這樣雙驅(qū)動(dòng)的過程,智能手機(jī)這個(gè)產(chǎn)品就存在非常大的進(jìn)步空間,從算力、算子、框架、算法、數(shù)據(jù)到應(yīng)用,再從應(yīng)用反饋到算法和模型上,完成數(shù)據(jù)閉環(huán)。

還有兩個(gè)例子,首先是AI智慧相冊(cè)。當(dāng)用戶拍攝很多照片之后,我們會(huì)根據(jù)時(shí)間、地點(diǎn)、主題人物等等這些重要的標(biāo)簽進(jìn)行梳理分類,用戶在查找照片的時(shí)候,可以很快很方便的找到,我們希望用戶看到照片的時(shí)候不僅僅是看到照片而是一段段美好的回憶,產(chǎn)品打磨中我們要非常深刻的洞察到用戶的心理,帶給用戶非常極致的體驗(yàn),不僅要滿足用戶對(duì)功能上需求,也要滿足情感上的一些訴求。

另外一個(gè)例子是剛剛推出的OPPO的全面加速引擎Hyper Boost,從系統(tǒng)、游戲、應(yīng)用方面給用戶提供全面流暢的體驗(yàn)。

系統(tǒng)方面,我們采用了全新的行為感知和系統(tǒng)調(diào)度的理念,提供超過50多種的優(yōu)化方案,系統(tǒng)啟動(dòng)的速度可以提升30%以上,界面切換更加流暢;游戲方面,如王者榮耀多核多線程技術(shù)最早就是基于OPPO R11這款手機(jī)做的優(yōu)化;應(yīng)用方面,針對(duì)淘寶、微信等App的幾十個(gè)場(chǎng)景都做了優(yōu)化,例如淘寶購物車頁面進(jìn)入速度提升48.21%;微信進(jìn)出會(huì)話頁面流暢度提升29.8%;手機(jī)QQ 打開聊天頁面速度提升67% 以上等等。

OPPO對(duì)未來AI的暢想

最后分享一下OPPO在未來對(duì)于AI方面的暢想。

首先是增強(qiáng)現(xiàn)實(shí)AR技術(shù)。它能融合現(xiàn)實(shí)和虛擬兩個(gè)世界,為客戶打開視覺交互新體驗(yàn),AR不僅是IoT的延伸,給用戶帶來沉浸式的新體驗(yàn),還能解放用戶的雙手帶來全新的交互方式。

其次是AI的多模態(tài)融合。在手機(jī)上我們通過視覺技術(shù),可以拍照翻譯、拍照支付,所見即所得,而且可以很快速方便的連通這個(gè)事物背后的服務(wù)和內(nèi)容,通過聽覺技術(shù)可以實(shí)現(xiàn)語音的交流,可以用語音控制手機(jī)或者音箱,獲得內(nèi)容信息。通過實(shí)現(xiàn)情景智能,我們可以讓手機(jī)更懂得用戶,在特定場(chǎng)景下理解我們想買什么東西、想點(diǎn)播什么音樂,各種生活服務(wù)隨手可得。

最后是軟硬件和算法的深度結(jié)合。包括云上和端上算法的深度結(jié)合,比如目前語音助手和智能音箱存在的痛點(diǎn),用戶使用它的時(shí)候必須先喚醒它才能對(duì)話,這個(gè)交互就不夠自然,讓用戶感覺,人是設(shè)備的助理,設(shè)備還不是一個(gè)很體貼人的助理。未來的語音助理做到非常聰明的時(shí)候,應(yīng)該是用戶不需要喚醒它。語音喚醒背后的技術(shù)是語音關(guān)鍵詞的捕捉,上個(gè)世紀(jì)末,在一句話中的同時(shí)捕捉多個(gè)關(guān)鍵詞的算法就已經(jīng)成熟了,至今卻沒有在硬件設(shè)備上廣泛使用。這既是一個(gè)機(jī)會(huì)也是一個(gè)方向。

隨著5G的到來,云服務(wù)和設(shè)備端AI算力的提升,還會(huì)發(fā)生各種各樣的深度整合,到那時(shí)候我們帶給用戶的體驗(yàn)將會(huì)更加極致。

針對(duì)AI等研究方向,OPPO公司也成立了自己的研究院,目前在世界各地共布局了六大研究所。研究院承載著兩項(xiàng)使命,首先是作為新技術(shù)研究和創(chuàng)新的載體,其次是作為對(duì)外技術(shù)合作的窗口。所以,我們也非常歡迎和業(yè)界伙伴進(jìn)行廣泛的交流,并期待有深入的合作。謝謝大家!

(本文首發(fā)鈦媒體,編輯李玉鵬整理)

轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
聲明:文章內(nèi)容僅供參考、交流、學(xué)習(xí)、不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • oppo手機(jī)三四線城市比較受歡迎。

    回復(fù) 2018.12.16 · via android

快報(bào)

更多

22:59

以色列一工業(yè)區(qū)遭襲,危險(xiǎn)物質(zhì)泄漏

22:22

海南自由貿(mào)易港民營企業(yè)座談會(huì)舉行

22:12

中國科學(xué)院院士:全固態(tài)電池或至少再等5年

22:11

今年以來逾1370萬人次旅客訪港

22:08

下周(3月30日-4月5日)市場(chǎng)大事預(yù)告

22:06

民調(diào)顯示美國選民對(duì)特朗普“不滿意率”創(chuàng)新高

21:43

納比勒·法赫米將擔(dān)任新一任阿盟秘書長

21:07

群核科技通過港交所聆訊:2025年實(shí)現(xiàn)盈利,沖刺“全球空間智能第一股”

21:05

油價(jià)飆升埃及多措施節(jié)能,埃及上調(diào)公共交通票價(jià)

21:05

英矽智能與禮來達(dá)成AI藥物研發(fā)合作,交易總值最高可達(dá)27.5億美元

21:04

3月29日新聞聯(lián)播速覽20條

21:01

中國銀河證券:中長期仍看好科技板塊產(chǎn)業(yè)驅(qū)動(dòng)與周期板塊漲價(jià)線索的雙主線

20:34

大風(fēng)、降水來襲,長江江蘇段部分區(qū)域?qū)嵤┡R時(shí)交通管制

19:59

國航C919正式投入北京—廈門、北京—哈爾濱兩條航線運(yùn)營

19:57

中鋁國際:2025年歸母凈利潤2.58億元,同比增長16.47%

19:19

伊朗稱已打擊與美軍工有關(guān)聯(lián)的兩家企業(yè)

18:36

伊朗與巴基斯坦兩國外長通電話,討論地區(qū)局勢(shì)

18:35

2025年玩具(不含潮玩)國內(nèi)市場(chǎng)零售總額達(dá)1035.3億元

18:08

全國豬價(jià)跌破5元,創(chuàng)歷史新低

18:07

時(shí)代天使2025年實(shí)現(xiàn)收入3.7億美元,同比增長37.8%

1

掃描下載App