圖片來源:視覺中國(guó)

在鈦媒體在線課“鈦坦白”第47期,我們邀請(qǐng)了三位鈦客分享對(duì)于人機(jī)交互方式中的語音交互的看法。本期鈦客之一、騰訊物聯(lián)云語音云總經(jīng)理毛華,負(fù)責(zé)騰訊的物聯(lián)和語音技術(shù)的產(chǎn)品研發(fā)和生態(tài)建設(shè)。自2011年加入騰訊以來,先后負(fù)責(zé)騰訊手機(jī)管家、應(yīng)用寶、QQ物聯(lián)、視頻云、語音云的產(chǎn)品規(guī)劃與建設(shè),在互聯(lián)網(wǎng)產(chǎn)品與創(chuàng)業(yè)方面擁有超過17年的行業(yè)經(jīng)驗(yàn)。

本文節(jié)選自毛華在鈦坦白的分享。如果您還不是鈦媒體Pro用戶,希望查看鈦坦白所有干貨,進(jìn)入鈦坦白九個(gè)專業(yè)群交流,并查看更豐富的專業(yè)數(shù)據(jù)和信息,可點(diǎn)擊:http://m.chcmb.cn/pro 注冊(cè)。

以下根據(jù)毛華在鈦坦白的分享實(shí)錄整理:

非常感謝佳音,也感謝鈦媒體,可以有這樣的機(jī)會(huì)跟群里的各位朋友交流。

先介紹一下騰訊云小微。騰訊云是一個(gè)智能服務(wù)平臺(tái),主要由兩大平臺(tái)組成:一是小微硬件開放平臺(tái),各類硬件都可以接入這個(gè)平臺(tái);二是小微Skill開放平臺(tái),讓接入的這些硬件具備一些能力。

小微硬件開放平臺(tái)可以接入的硬件形式多樣,種類也不限,大部分聯(lián)網(wǎng)的硬件都可以接入,目前支持Android和Linux兩大操作系統(tǒng)。而且接入非常簡(jiǎn)單,小微提供SDK,硬件只需要接入這個(gè)SDK,經(jīng)過簡(jiǎn)單的配置即可實(shí)現(xiàn)所有語音輸入與內(nèi)容輸出的能力。我們最快的接入案例是一個(gè)Android機(jī)器人,只用了兩天時(shí)間就完成了所有的能力接入。

小微Skill開放平臺(tái)則可以接入大量的內(nèi)容與服務(wù),以便讓硬件具備更多的能力。比如為智能音箱設(shè)備提供QQ通信、音樂、FM、物聯(lián)等能力,用一個(gè)QQ或微信帳號(hào)即可實(shí)現(xiàn)內(nèi)容與服務(wù)的聯(lián)動(dòng)。我們希望通過小微智能服務(wù)平臺(tái)幫助硬件快速實(shí)現(xiàn)聽覺和視覺的能力,無論是音箱、小屏設(shè)備、機(jī)頂盒電視機(jī),還是汽車、機(jī)器人、冰箱等設(shè)備都可以快速接入,并具備小微語音和視覺的能力。

小微背后是騰訊在人工智能領(lǐng)域的積累

騰訊其實(shí)有很多Ai技術(shù)儲(chǔ)備,只是都在為各自的業(yè)務(wù)提供能力,比如語音識(shí)別和語義分析,微信在過去的幾年里一直在打磨并應(yīng)用于微信內(nèi),比如優(yōu)圖的人臉識(shí)別已經(jīng)做到了全球第一,并應(yīng)用于天天P圖和視頻監(jiān)控等領(lǐng)域,比如QQ物聯(lián)在過去的2年多時(shí)間里接入大量的智能硬件設(shè)備。就是因?yàn)橛辛诉@些技術(shù)積累,小微智能服務(wù)平臺(tái)只用了1個(gè)月時(shí)間就實(shí)現(xiàn)了從0到1的智能語音音箱Demo,如此之快的原因就在于,小微的框架用的是QQ物聯(lián)平臺(tái),語音能力用的是微信的語音識(shí)別與語義分析,再結(jié)合微信的QQ音樂、企鵝FM、騰訊視頻、K歌等帶有大量版權(quán)的內(nèi)容,完成了從0到1的搭建。大公司有個(gè)優(yōu)勢(shì),就是把資源一整合,一個(gè)新的東西就出來了,不過從Demo到平臺(tái)穩(wěn)定易用還有一堆的事情要做。

接入小微,就可以自帶很多資源,具體來說分這么幾部分:

一是帶有大量版權(quán)的內(nèi)容,音樂(QQ音樂是中國(guó)最大的正版音樂庫,四大唱片公司中有3大公司的版權(quán)在騰訊),企鵝FM里有廣泛的有聲讀物內(nèi)容包括相聲故事評(píng)書等,還有騰訊文學(xué)(閱文集團(tuán)是中國(guó)最大的文學(xué)版權(quán)方),騰訊視頻也是最大的版權(quán)擁有方,以及其他如新聞、動(dòng)漫、股票等內(nèi)容。

二是所投資的內(nèi)容與服務(wù)公司的業(yè)務(wù)很廣泛 ,如滴滴出行、58同城、美團(tuán)、醫(yī)療、新東方英語等,這些都為設(shè)備提供了很多有價(jià)值的服務(wù),如在設(shè)備上用語音打車或叫家政服務(wù)或在帶屏設(shè)備上進(jìn)行語音互動(dòng)等。

三是QQ、微信的通信能力,每個(gè)接入的設(shè)備都可以是通信工具,實(shí)現(xiàn)與QQ或微信的電話、消息的互通。
四是物聯(lián)能力,Skill開放平臺(tái)不僅可以直接連接QQ物聯(lián)上的設(shè)備,也允許其他物聯(lián)平臺(tái),如美國(guó)的Ayla物聯(lián)平臺(tái)、中國(guó)的機(jī)智云等通過Skill開放平臺(tái)接入,從而實(shí)現(xiàn)語音對(duì)設(shè)備的控制。

小微背后的騰訊團(tuán)隊(duì)

小微涉及到騰訊公司好幾個(gè)團(tuán)隊(duì)的協(xié)作,包括微信人工智能團(tuán)隊(duì)、AI Lab和優(yōu)圖團(tuán)隊(duì)。微信與AI Lab負(fù)責(zé)相關(guān)技術(shù)如語音識(shí)別、語義分析、翻譯、百科等,其他內(nèi)容團(tuán)隊(duì)提供海量的內(nèi)容。小微其實(shí)就是把騰訊內(nèi)部的這些人工智能團(tuán)隊(duì)的一些優(yōu)秀的成果集合到小微里為大家提供服務(wù),無論是語音相關(guān)的能力還是圖像相關(guān)的能力,接入我們的平臺(tái)就可以實(shí)現(xiàn)一站式服務(wù),從語音的識(shí)別到語義的分析以及內(nèi)容的返回再到TTS播放。

我們的理解是:未來硬件會(huì)是一個(gè)瘦終端,對(duì)硬件本身的要求會(huì)很低,而真正的能力都在云端。比如一個(gè)小盒子,也許只需要兩個(gè)麥克風(fēng)、一個(gè)小喇叭、一個(gè)WiFi模塊外加一個(gè)外殼就行,在深圳這樣的設(shè)備也許成本只需30元就搞定了,但是它所具備的能力卻相當(dāng)大。有的App也許不需要App的外殼,把內(nèi)容和服務(wù)抽取出來,比如滴滴可以沒有App只有服務(wù),有人做了一個(gè)硬件的殼,加上2G網(wǎng)絡(luò),對(duì)著設(shè)備叫車,然后車就來了,這個(gè)硬件就是App。內(nèi)容可以有多個(gè)不同的外殼,但內(nèi)容無處不在。

鈦坦白群友互動(dòng)

1.智能音箱喚醒詞問題的探討

群友A:有個(gè)知名媒體人最近發(fā)了篇文章,吐槽每次使用智能音箱前都需要大喊一句命令,比如“叮咚叮咚”“小微小微”,這樣的交互比較不自然。

群友B:這個(gè)“命令”的字段可以修改吧?

毛華:是的,這里的自然順暢與實(shí)際應(yīng)用場(chǎng)景有關(guān)系。

群友A:就算修改,也是要一個(gè)命令。

群友B:最好是日常用語,這種“叮叮當(dāng)當(dāng)”比較奇怪,出廠預(yù)設(shè)幾個(gè)供用戶選擇。

毛華:?jiǎn)拘言~就像人的名字,語音互動(dòng)就像是兩個(gè)人交流,但如果在場(chǎng)的有三個(gè)人,都閉上眼睛說話,誰都不知道跟誰在說話,所以需要具體用名字來指向,喚醒詞就是這個(gè)名字,你在說話前先喊一下這個(gè)人的名字,對(duì)方才知道是在跟他說話,不過有些是有上下文關(guān)系,可以省略部分場(chǎng)景下的喚醒詞。

2.智能音箱誤喚醒的技術(shù)調(diào)整

群友A:音箱的聲音特別大的時(shí)候,你召喚它,它聽不見你跟它說話會(huì)不理你,這個(gè)時(shí)候要把音箱的聲音調(diào)小,它才能識(shí)別人的語言。

毛華:?jiǎn)拘押驼`喚醒是對(duì)Array的考驗(yàn),我試過一個(gè)7mic的Array,做得很不錯(cuò),12米帶噪音環(huán)境下使用效果不錯(cuò),不過未量產(chǎn),希望這樣有能力的公司以后能為語音能力做出更多貢獻(xiàn)。

群友B:7mic聽起來有點(diǎn)多,看來未來也需要硬件的整合能力啊。

毛華:我本人認(rèn)為,在中國(guó)音箱產(chǎn)品未必是最好的形態(tài),中國(guó)對(duì)音箱的需求不一樣,中國(guó)人對(duì)藍(lán)牙音箱和耳機(jī)的需求很大。

群友A:現(xiàn)在語音主要實(shí)現(xiàn)功能強(qiáng)大,未來實(shí)現(xiàn)語音性能多樣化,比如HIFI音質(zhì),這樣會(huì)越來越淡化硬件,因?yàn)樵诤笈_(tái)或云端就都被語音整合好了。

群友C:但是目前經(jīng)過印證的智能家居中,音箱被公認(rèn)是比較容易做的起來的,所以亞馬遜、谷歌、蘋果都在發(fā)力。

毛華:中國(guó)與美國(guó)不一樣,美國(guó)是大house,中國(guó)是公寓,對(duì)于音樂的理解也不一樣。

群友A:亞馬遜語音也是一個(gè)偶然的產(chǎn)物吧。

毛華:我的理解就是一個(gè)偶然產(chǎn)物。

群友D:同意您的觀點(diǎn),音箱不是最好的場(chǎng)景。家庭智能解決的是連接,語音非關(guān)鍵。

3.智能音箱如何識(shí)別用戶身份?

群友A:如果小孩子喚醒了小微,下了一個(gè)訂單或者叫了一輛車,實(shí)際上并不需要,這個(gè)場(chǎng)景怎么避免?

毛華:這個(gè)跟小孩拿了手機(jī)買游戲幣是一樣的問題,不過我們可以有聲紋,聲紋用于身份驗(yàn)證。

群友A:如果我希望小孩正常使用,比如聽歌什么的,是不是還要設(shè)置不同的權(quán)限,比如家長(zhǎng)模式?

毛華:我們有歌單,歌單通過QQ或微信帳號(hào)綁定,同時(shí)綁定聲紋。這樣每個(gè)人都可以聽到自己的歌單,出來的內(nèi)容是自己QQ音樂里的,并且可以通過聲紋進(jìn)行認(rèn)證。

4.語音交互質(zhì)量的評(píng)判標(biāo)準(zhǔn)

群友A:關(guān)于語音交互質(zhì)量,騰訊有沒有評(píng)判標(biāo)準(zhǔn)?

毛華:這里特別要提只有少量?jī)?nèi)容的才可以做到各種識(shí)別能力的提升,交互質(zhì)量在于返回的內(nèi)容是否符合用戶的預(yù)期,我們有自動(dòng)化測(cè)試。

群友A:怎樣的標(biāo)準(zhǔn)呢?對(duì)或者錯(cuò)?怎么算對(duì)?

毛華:對(duì)錯(cuò)的評(píng)判有的有標(biāo)準(zhǔn)答案,有的沒有,沒有的情況下會(huì)進(jìn)行人肉判斷,請(qǐng)幾路專家打分。

群友A:語義理解有很高的技術(shù)門檻,聽見了不等于聽懂了,還存在同音詞問題。

毛華:這跟語境有關(guān),上下文和語境是AI的一個(gè)關(guān)鍵點(diǎn),語音識(shí)別率的提升只是時(shí)間問題,隨著麥克風(fēng)陣列和算法的提升,識(shí)別能力必然可以提升,相信明年就會(huì)不一樣。

群友B:語義理解我們提了四個(gè)標(biāo)準(zhǔn):1.差異性,“你干嘛”和“你干嘛的”要能分開;2.同一性,“你公司在哪里”“貴司在什么地方”要能理解語義相似性;3.模糊性,“小明的生日是哪天”要能正確理解;4.一致性,就是前后說話要一致。

毛華:你說的很專業(yè),但這些都不是什么太大的問題,語義要有糾錯(cuò)能力,比如用Siri,我說“我要去西溪樂谷”,它只知道“西溪肋骨”,但是訊飛和小微就知道是”西溪樂谷”,這是因?yàn)樗肋@個(gè)意圖是要去一個(gè)地方,這個(gè)地方叫樂谷,不是要去身上的肋骨,我們首先要識(shí)別意圖是干什么,然后在意圖下理解更多的關(guān)鍵信息,這里就需要糾錯(cuò)能力。

群友C:標(biāo)準(zhǔn)是不是后面可以再加兩個(gè),一個(gè)是語音反饋的節(jié)奏,就像我們?nèi)撕腿藢?duì)話,說不同事情,語速和節(jié)奏是很自然的;第二個(gè)標(biāo)準(zhǔn)是語音表達(dá)能否更人性化,更自然一些,現(xiàn)在滿滿的機(jī)械感。

毛華:你說的是TTS,就是把文本轉(zhuǎn)成語音,這個(gè)目前實(shí)現(xiàn)得還可以,但還有很大的提升空間,目前語言交互的聲音語調(diào)基本還算是人話,但還需要提升,特別是沒有那些感嘆詞,比如“呵呵”“嘻嘻”,不太自然,如果能有感嘆詞那些語調(diào)就會(huì)自然很多。

群友B:人名、地名都很難處理。

毛華:我們?nèi)匀恍枰獙W(xué)習(xí),如果你要打電話或發(fā)消息給誰,就要對(duì)應(yīng)的人名。QQ、微信的聯(lián)系人就更神奇了,什么符號(hào)都有,這個(gè)用語音就沒辦法了,只能判斷其中可讀部分的詞了。

5.騰訊內(nèi)部如何高效協(xié)同?

群友A:多個(gè)團(tuán)隊(duì)一起做小微,對(duì)于騰訊這樣的大企業(yè)內(nèi)部協(xié)同會(huì)比較難吧?怎么處理的呢?

毛華:合作的著眼點(diǎn)在于是否達(dá)到雙贏,這點(diǎn)很重要。要站在對(duì)方角度思考能你給他帶去了什價(jià)值么。如果有價(jià)值,合作就一定很順。合作不順一定是沒有替對(duì)方思考。

群友B:應(yīng)該有一個(gè)專門負(fù)責(zé)整合的團(tuán)隊(duì)吧?

毛華:戰(zhàn)略的同學(xué)會(huì)幫忙整合,但只限于幫忙撮合。

群友C:騰訊是同一品類都有兩個(gè)不同的團(tuán)隊(duì)在做,看誰最終被市場(chǎng)認(rèn)可嗎?

毛華:只要有團(tuán)隊(duì)之間的利益共享都有可能合作好。內(nèi)部競(jìng)爭(zhēng)也是必不可少的,但都是良性競(jìng)爭(zhēng)。

6.語音互動(dòng)大生態(tài)探討

群友A:語音互動(dòng)上下游的產(chǎn)業(yè)鏈可以大致介紹一下嗎?

毛華:我的理解是左右游,左邊是硬件,右邊是Skill,這是一個(gè)大生態(tài)。

群友A:對(duì)于Skill,我的理解應(yīng)該可以分很多步驟或叫做交互,可以講解一下嗎?以及每個(gè)步驟或交互的關(guān)鍵技術(shù)、機(jī)會(huì)等。

毛華:理論上可以有多個(gè)步驟,但不建議多于3個(gè)。首先語音交互的著眼點(diǎn)是效率,如果需要互動(dòng)3次才能得到答案就沒有效率了。就像打電信的服務(wù)電話10000號(hào),撥進(jìn)去一串問題,一項(xiàng)服務(wù)要等很久才知道下一步要做什么,效率非常低,也會(huì)讓人很不耐煩。多輪交互只是在部分關(guān)鍵點(diǎn)信息缺失時(shí)才用到,比如“今天天氣怎么樣”,沒有提到城市,就會(huì)反問“請(qǐng)問你要了解哪個(gè)城市的天氣情況?”,語音交互的著眼點(diǎn)一定是效率優(yōu)先。

但語音也并非總是最有效率的交互形式,比如要查天氣,如果打開手機(jī)就需要好幾個(gè)步驟,此時(shí)用語音效率最高,說一句話一下就得到了結(jié)果。但是得到結(jié)果之后呢?要從天氣的第一個(gè)字開始聽到最后一個(gè)字可能需要10多秒,而用屏幕出來一個(gè)太陽加溫度,可能眼睛一掃,2秒就知道了所有信息,而此時(shí)屏幕視覺的效率最高,所以語音要與屏幕結(jié)合才能達(dá)到最高的效率。

群友A:這個(gè)似乎和硬件的產(chǎn)業(yè)鏈含義不太一樣,硬件有平臺(tái)、系統(tǒng)、器件、材料、生產(chǎn)再加上各個(gè)部分的應(yīng)用或軟件架構(gòu)等多個(gè)環(huán)節(jié),從而組成整合硬件產(chǎn)品。

毛華:一定是不一樣的,硬件在語音生態(tài)中只是一環(huán),硬件本身還有產(chǎn)業(yè)鏈。

群友A:語音生態(tài)都有哪些內(nèi)容,每個(gè)內(nèi)容的關(guān)鍵技術(shù)和機(jī)會(huì)所在呢?

毛華:理論上內(nèi)容可以有非常多,應(yīng)用寶上的每個(gè)APP都可以是語音的內(nèi)容,Skill本身可以理解為是一個(gè)APP。

群友B:這個(gè)APP已經(jīng)不止軟件了,包括實(shí)物,就是一個(gè)載體。

毛華:是的,包括內(nèi)容 、服務(wù)、其它硬件(被控制的設(shè)備,比如燈)。

7.騰訊在語音生態(tài)中扮演的角色

群友A:我創(chuàng)業(yè)做了一個(gè)和騰訊小微一樣的東西,一套原本用于車載中控屏的系統(tǒng),在我加入后覺得不要碰百年歷史的汽車供應(yīng)商體系,不碰硬件,改到共享汽車和共享單車市場(chǎng),原本可以幫到真格投資的ofo和途歌共享汽車免于投資打水漂,現(xiàn)在看來騰訊出手,我們就沒得玩了。

毛華:這是一個(gè)大生態(tài),我認(rèn)為創(chuàng)業(yè)公司可以做其中一環(huán),但不適合大生態(tài),這里最關(guān)鍵的不是技術(shù)本身,而是生態(tài)內(nèi)容服務(wù)能力。

群友B:騰訊這邊是以提供云服務(wù)和平臺(tái)為主,會(huì)有自己的硬件產(chǎn)品嗎?

毛華:騰訊有團(tuán)隊(duì)在做硬件,但小微是一個(gè)平臺(tái),無論對(duì)內(nèi)還是對(duì)外都是一樣的支持。

群友C:語音生態(tài)騰訊會(huì)自己做,還是會(huì)聯(lián)合(幫助)創(chuàng)業(yè)企業(yè)一起做?騰訊希望在里面作為什么角色?

毛華:一定是聯(lián)合,小微是一個(gè)開放平臺(tái),左邊連硬件,右邊連Skill,無論左邊還是右邊,都是合作伙伴的,我們只是搭建了一個(gè)平臺(tái),通過語音的技術(shù)和圖像的技術(shù)把硬件與Skill連接起來。

8.語音交互的努力方向、未來機(jī)會(huì)所在

群友A:語音交互涉及到的各種技術(shù),努力方向是什么?未來機(jī)會(huì)所在又是什么?

毛華:語音識(shí)別現(xiàn)在其實(shí)做得比較不錯(cuò)了,但垂直領(lǐng)域的語義還需要加強(qiáng),語義與大數(shù)據(jù)是分不開的,在大數(shù)據(jù)基礎(chǔ)上才可以做好語義的分析與內(nèi)容的輸出,未來的機(jī)會(huì)是做垂直領(lǐng)域的服務(wù)。

群友B:可用、安全、整合、強(qiáng)大、普及、標(biāo)準(zhǔn),我覺得這是語音當(dāng)前做的事情和未來的一些機(jī)會(huì)所在。 

毛華:目前語音設(shè)備離智慧還有一定的差距,要達(dá)到大家理解的智慧還有很長(zhǎng)一段路要走。需要大家的共同參與,讓設(shè)備學(xué)習(xí)更多的知識(shí)才可以,當(dāng)前還不具備這樣的條件。騰訊最大的優(yōu)勢(shì)是可以學(xué)習(xí)用戶行為,以此來了解用戶,從而反過來為用戶服務(wù)。

群友C:用戶普遍沒用使用語音交互的習(xí)慣怎么辦呢?

毛華:隨著遠(yuǎn)場(chǎng)語音拾取能力的提升,使用場(chǎng)景也會(huì)越來越多,習(xí)慣也就會(huì)有了,總之習(xí)慣建立在效率之上,什么樣的交互效率最高,就有機(jī)會(huì)改變習(xí)慣。

群友D:就語音人工智能而言,對(duì)CP來說,現(xiàn)在最好的創(chuàng)業(yè)方向是哪一個(gè)或哪幾個(gè)?

毛華:CP還是關(guān)注自己有哪些優(yōu)勢(shì)資源吧,我認(rèn)為兒童類的應(yīng)該有機(jī)會(huì),有了語音后就可以互動(dòng)了,比如跟我念dog,然后語音識(shí)別后給個(gè)準(zhǔn)確判斷,就實(shí)現(xiàn)兒童英語的互動(dòng)學(xué)習(xí)了,當(dāng)然其他內(nèi)容也可以。

群友E:作為智能手機(jī)類產(chǎn)品經(jīng)理,如何和人工智能結(jié)合起來呢?未來發(fā)展上有哪些建議呢?

毛華:手機(jī)還是最好的AI承載設(shè)備,我相信以后的手機(jī)會(huì)具備遠(yuǎn)場(chǎng)語音能力,同時(shí)手機(jī)可以收集用戶很多行為和位置信息,從而反過來為用戶提供服務(wù)。華為手機(jī)就可以提醒你到公司的路況怎么樣了,三星S8手機(jī)每天睡覺前還提醒你要不要看看明天的安排,手機(jī)短信收到了訂機(jī)票的信息,手機(jī)就會(huì)提醒你要不要訂個(gè)酒店。

群友E:看來,手機(jī)硬件設(shè)備需要主動(dòng)與優(yōu)勢(shì)的人工智能應(yīng)用聯(lián)合起來,就像騰訊的各個(gè)專業(yè)部門統(tǒng)籌起來,做成小微,這樣才能有更優(yōu)的價(jià)值。

(本文獨(dú)家首發(fā)鈦媒體,根據(jù)騰訊物聯(lián)云語音云總經(jīng)理毛華在鈦坦白上的分享整理) 

……………………………………………………   

鈦坦白第47期:語音交互——更自然的人機(jī)交互方式  

今晚7點(diǎn),分享繼續(xù)~

本文系作者 葛佳音 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容
  • 語音交互 是現(xiàn)階段人工智能技術(shù)應(yīng)用比較多的幾個(gè)場(chǎng)景之一 。還包括人臉識(shí)別 圖像識(shí)別等場(chǎng)景。語音方面 目前國(guó)內(nèi)技術(shù)比較成熟的有科大 百度 云知聲等

    置頂
    回復(fù) 2017.07.26 · via iphone
  • 語音交互有學(xué)問

    置頂
    回復(fù) 2017.07.27 · via android
  • 社會(huì)的進(jìn)步,思維改變,不要停留

    置頂
    回復(fù) 2017.07.27 · via android
  • 等語音交互比較難解決的問題能一一解決的話,那么類似咪咕靈犀,siri這樣的軟件發(fā)展將是爆發(fā)式的。

    回復(fù) 2017.07.28 · via pc

快報(bào)

更多

07:32

A股限售股解禁一覽:237.72億元市值限售股今日解禁

07:29

華泰證券:關(guān)注低估值、低擁擠度的交集和高油價(jià)潛在受益行業(yè)

07:28

夏秋新航季航線網(wǎng)絡(luò)持續(xù)優(yōu)化,國(guó)際航線進(jìn)一步拓展完善

07:09

一季度業(yè)績(jī)預(yù)告加速披露,近九成公司預(yù)喜

07:08

港股IPO活力持續(xù)釋放,科技賽道成資本“新寵”

07:06

美聯(lián)儲(chǔ)4月維持利率不變的概率為97.9%

07:01

港股IPO動(dòng)態(tài):今日華沿機(jī)器人等5股上市

07:01

A股IPO動(dòng)態(tài):今日悅龍科技上市

2026-03-29 22:59

以色列一工業(yè)區(qū)遭襲,危險(xiǎn)物質(zhì)泄漏

2026-03-29 22:22

海南自由貿(mào)易港民營(yíng)企業(yè)座談會(huì)舉行

2026-03-29 22:12

中國(guó)科學(xué)院院士:全固態(tài)電池或至少再等5年

2026-03-29 22:11

今年以來逾1370萬人次旅客訪港

2026-03-29 22:08

下周(3月30日-4月5日)市場(chǎng)大事預(yù)告

2026-03-29 22:06

民調(diào)顯示美國(guó)選民對(duì)特朗普“不滿意率”創(chuàng)新高

2026-03-29 21:43

納比勒·法赫米將擔(dān)任新一任阿盟秘書長(zhǎng)

2026-03-29 21:07

群核科技通過港交所聆訊:2025年實(shí)現(xiàn)盈利,沖刺“全球空間智能第一股”

2026-03-29 21:05

油價(jià)飆升埃及多措施節(jié)能,埃及上調(diào)公共交通票價(jià)

2026-03-29 21:05

英矽智能與禮來達(dá)成AI藥物研發(fā)合作,交易總值最高可達(dá)27.5億美元

2026-03-29 21:04

3月29日新聞聯(lián)播速覽20條

2026-03-29 21:01

中國(guó)銀河證券:中長(zhǎng)期仍看好科技板塊產(chǎn)業(yè)驅(qū)動(dòng)與周期板塊漲價(jià)線索的雙主線

4

掃描下載App