從2011年10月4日,蘋(píng)果在iPhone4s機(jī)型上開(kāi)創(chuàng)性地配置Siri語(yǔ)音控制功能,并相繼在2012年宣布支持中文語(yǔ)音識(shí)別和互動(dòng)開(kāi)始,語(yǔ)音助手浪潮首先在手機(jī)端應(yīng)用掀起。
經(jīng)過(guò)五年的發(fā)展,原本通過(guò)手動(dòng)的人機(jī)交互模式已衍生出許多口令式應(yīng)用場(chǎng)景,與此同時(shí),在炙手可熱的智能家居市場(chǎng)中,以語(yǔ)音交互為基礎(chǔ)的人機(jī)互動(dòng)模式也逐步成為標(biāo)準(zhǔn)性功能配置。
雖然,語(yǔ)音交互領(lǐng)域儼然被吹捧為又一智能藍(lán)海、智能領(lǐng)域的入口之一,國(guó)內(nèi)外科技大佬也因此沒(méi)少在其投錢(qián)。
然而,回到現(xiàn)實(shí)應(yīng)用場(chǎng)景里,我們當(dāng)中有多少人真的像手動(dòng)觸屏操作那樣信任語(yǔ)音助手?一天中有多少次開(kāi)啟過(guò)語(yǔ)音互動(dòng)功能?從我們身邊的用戶和自身的使用習(xí)慣看,用戶對(duì)語(yǔ)音操控仍然極度缺乏信任。
當(dāng)今語(yǔ)音技術(shù)格局
從語(yǔ)音智能生態(tài)系統(tǒng)來(lái)看,主要有基于Nuance的蘋(píng)果Siri與三星S-Voice、谷歌Android的Google Now、微軟Windows Phone的Cortana三大版圖。專注于中文語(yǔ)音智能領(lǐng)域而言:
以傳統(tǒng)的語(yǔ)音技術(shù)提供商科大訊飛為首,無(wú)論在技術(shù)還是市場(chǎng)者占有領(lǐng)先地位,已知的合作廠商如京東微聯(lián)、錘子科技、長(zhǎng)虹、創(chuàng)維、三星等家電廠商;
騰訊,百度兩大科技巨頭也通過(guò)其團(tuán)隊(duì)實(shí)力的優(yōu)越性展現(xiàn)了后來(lái)者居上的姿態(tài);
蘇州思必馳,捷通華聲,云知聲等相對(duì)較年輕的技術(shù)服務(wù)商在整體識(shí)別率十分搶眼;以及一些背靠其他學(xué)術(shù)或技術(shù)團(tuán)隊(duì)的小公司也正在積聚力量。
基礎(chǔ):手機(jī)使用場(chǎng)景
從iPhone的Siri開(kāi)始,通過(guò)語(yǔ)音助手在手機(jī)上實(shí)現(xiàn)讀短信、介紹餐廳、詢問(wèn)天氣、設(shè)置鬧鐘、自然語(yǔ)言輸入、調(diào)用天氣預(yù)報(bào)、日程安排、搜索資料等功能已不再新鮮,通過(guò)后期的技術(shù)迭代,學(xué)習(xí)新的聲音和語(yǔ)調(diào),提供對(duì)話式的應(yīng)答等能力也不在話下。
同時(shí),在應(yīng)用類層面,如微信、新浪微博、語(yǔ)音搜索、365日歷、掌閱、91熊貓看書(shū)以及各大導(dǎo)航類應(yīng)用也全面引入了語(yǔ)音識(shí)別、語(yǔ)義理解等功能。
潛力:家居物聯(lián)網(wǎng)
隨著物聯(lián)時(shí)代的興起,家居物聯(lián)這塊藍(lán)海市場(chǎng)也吸引了眾多科技公司的押注,而其最基本的接入方式。
在國(guó)外,三大科技大佬已開(kāi)始布局,蘋(píng)果就在今年6月初的蘋(píng)果全球開(kāi)發(fā)者大會(huì)(WWDC)上,推出了自家首個(gè)智能家居平臺(tái)Homekit,其亮點(diǎn)也正是整合了Siri——具有語(yǔ)音控制功能,對(duì)于借用第三方應(yīng)用或其它硬件而實(shí)現(xiàn)智能操控的國(guó)內(nèi)智能家居系統(tǒng)無(wú)疑更容易打動(dòng)用戶。
與此同時(shí),微軟近日也宣布將把微軟語(yǔ)音助手Cortana引入家庭自動(dòng)化設(shè)備制造商Insteon在Windows Phone的應(yīng)用程序中。
而谷歌早在去年也通過(guò)收購(gòu)收購(gòu)Nest Labs成功進(jìn)軍智能家居市場(chǎng),并在今年5月份的谷歌I/O開(kāi)發(fā)者大會(huì)上推出了以Android為核心的Brillo系統(tǒng),以及Google Now新的智能應(yīng)用功能。
國(guó)內(nèi)市場(chǎng)方面,借由語(yǔ)音交互功能作為物聯(lián)家居的入口、以及通過(guò)類似布丁機(jī)器人等家庭機(jī)器人的人機(jī)語(yǔ)音互動(dòng)入駐智能家居等模式也屢見(jiàn)不鮮。
所謂的“標(biāo)配”真的實(shí)用嗎?
如果僅從配置要求方面而言,如上所述,語(yǔ)音智能技術(shù)確實(shí)已成為主流,但根據(jù)相關(guān)數(shù)據(jù)顯示這一功能的使用率并不高。
在大多數(shù)情況下,語(yǔ)音交互變成了消遣娛樂(lè)的“游戲”,并未成為真正幫助人們操控設(shè)備的工具。究其原因,筆者認(rèn)為主要在以下幾個(gè)方面:
1. 語(yǔ)音識(shí)別率、語(yǔ)義理解力不足。雖然國(guó)外有迭代數(shù)次的蘋(píng)果Siri語(yǔ)音助手、以及谷歌、微軟等硬實(shí)力派的加盟,但據(jù)業(yè)界人士表示,從目前語(yǔ)音識(shí)別率提升至99%甚至100%的路還很長(zhǎng)。這主要是語(yǔ)音易受場(chǎng)合、情緒、身體狀況、內(nèi)容上下文等影響的特性決定;
2. 中文語(yǔ)音的復(fù)雜性。由于中文的復(fù)雜性,其語(yǔ)音、語(yǔ)調(diào)、方言等多重因素的影響,造成漢語(yǔ)語(yǔ)音識(shí)別比英語(yǔ)在準(zhǔn)確性更具挑戰(zhàn),以及在不同的語(yǔ)境內(nèi)使用不同的字和語(yǔ)氣,甚至包括隱語(yǔ)之類的東西,在英文里都是很少有的,所以偏重英文識(shí)別性能的外國(guó)技術(shù)在中文語(yǔ)音識(shí)別和語(yǔ)義理解方面顯得“水土不服”,而這一點(diǎn)也需我國(guó)自主技術(shù)廠商的努力;
3. 缺少極為匹配的應(yīng)用場(chǎng)景。雖然智能語(yǔ)音功能已在車載、智能家居、手機(jī)端等場(chǎng)景中實(shí)現(xiàn),但更多的情況是為了添加語(yǔ)音互動(dòng)功能而硬造出的應(yīng)用場(chǎng)景;與此同時(shí),不同機(jī)型在語(yǔ)音識(shí)別率、反應(yīng)速度、功耗方面差異巨大且存在諸多問(wèn)題,這一點(diǎn)使得智能語(yǔ)音功能在產(chǎn)品應(yīng)用上更顯雞肋;
4. 此外,為使用戶更好地實(shí)現(xiàn)語(yǔ)音操作的過(guò)渡和轉(zhuǎn)化,在語(yǔ)音技術(shù)與觸控、體感等其他操控方式的結(jié)合也顯得十分重要,如果簡(jiǎn)單地將之定位于觸摸、按鍵等主流操作方式的替代品,必將導(dǎo)致較低的市場(chǎng)接受。
目前的語(yǔ)音操控仍面臨很多亟待解決的問(wèn)題,用戶實(shí)際應(yīng)用情況并不像其產(chǎn)品覆蓋面那樣廣泛,即所謂的語(yǔ)音智能還并不能稱之為真正的標(biāo)配。
但不可否認(rèn),語(yǔ)音交互已作為人機(jī)交互發(fā)展的重要方向,正逐步滲入到我們的日常生活與應(yīng)用當(dāng)中,引起了智能硬件行業(yè)的變革。
而誰(shuí)能率先為智能語(yǔ)音交互創(chuàng)造更人性化的操作體驗(yàn),在其算法的準(zhǔn)確率、反應(yīng)時(shí)間以及處理性能進(jìn)行實(shí)質(zhì)性的突破,定將為智能領(lǐng)域的發(fā)展創(chuàng)造豐厚的附加值。
【鈦媒體作者介紹:智東西;微信公眾號(hào):zhidxcom】






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
體驗(yàn)性錯(cuò)是關(guān)鍵。
傳統(tǒng)語(yǔ)音,減少資費(fèi)、減少偷扣費(fèi)現(xiàn)象,用戶便不會(huì)減少
騰訊有用戶就不會(huì)倒閉,有你這種狗也不會(huì)倒閉
從KNN到隱含馬爾科夫,語(yǔ)音識(shí)別已經(jīng)很久沒(méi)有新的算法誕生了,靠這些古董算法,加一點(diǎn)優(yōu)化肯定無(wú)法滿足現(xiàn)在的需求了
很明顯,你把電子競(jìng)技和游戲混為一談。
騰訊就知道死不要臉的山寨,搞壟斷,憑借龐大的用戶群,山寨別人的東西卻比別人火,讓國(guó)內(nèi)敢于創(chuàng)新的公司沒(méi)有飯吃,這是對(duì)中國(guó)游戲產(chǎn)業(yè)的一種破壞
百度云服務(wù),阿里的大數(shù)據(jù),騰訊的LBS,這些靠時(shí)間和用戶沉淀下來(lái)的數(shù)據(jù)和服務(wù),才是他們立足之本。把目光局限在假貨,盜版?可笑!
都沒(méi)怎么用過(guò)
來(lái)了一個(gè)
開(kāi)始了,我最近物聯(lián)戰(zhàn)略布局的三塊中的第一塊快完成了,其中一塊和這個(gè)有關(guān)。不過(guò)基本構(gòu)思以完成。戰(zhàn)略還在寫(xiě)。