免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

智能語音助手背后,哈曼瞄準了麥克風(fēng)陣列的生意

凡是涉及到語音交互的環(huán)節(jié),都離不開對聲音的采集和提取,具體到智能音箱中,這是一種被稱為“麥克風(fēng)陣列”的技術(shù)。

智能語音助手不是什么新鮮的事物,但它的載體智能音箱成為智能家居的爆品不過是近兩年的事情,這得益于兩個方面,首先是人工智能的發(fā)展誕生了實際的應(yīng)用場景,其次則是聲學(xué)識別、語音識別等技術(shù)的逐漸成熟。

無論是音箱還是其他消費電子產(chǎn)品,凡是涉及到語音交互的環(huán)節(jié),都離不開對聲音的采集和提取,具體到智能音箱中,這是一種被稱為“麥克風(fēng)陣列”的技術(shù),同時幾乎也是Amazon Echo 和 Google Home 此類產(chǎn)品唯一涉及到硬件層面的創(chuàng)新。 

剛剛過去的CES ASIA期間,哈曼發(fā)布了全新的遠程語音識別解決方案 SONIQUE™,它將提供有別于傳統(tǒng)手動輸入的語音輸入技術(shù),瞄準的正是消費類語音電子產(chǎn)品對于麥克風(fēng)陣列的需求。 

從近場識別到遠場識別 

幾年前,語音交互最典型的代表就是以蘋果Siri為代表的智能手機,在這個相對簡單且識別距離較近的場景,麥克風(fēng)系統(tǒng)可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。 

但是一旦麥克風(fēng)距離較遠,收音環(huán)境就會受到大量噪聲、混音甚至反射帶來的干擾,導(dǎo)致對聲音信號采集和提取的準確率大幅下降,從而影響語音識別的準確率。

“iPhone配備了號稱目前世上最好的麥克風(fēng),但是如果開揚聲器從2米外去打電話,基本上除了噪聲什么也聽不見”,哈曼嵌入式音響事業(yè)部負責(zé)人劉蒼松認為,“當(dāng)用戶逐漸從手機開始切換到類似Echo等的時候,實際上麥克風(fēng)的工作環(huán)境也變了。”

消費級麥克風(fēng)陣列的興起伴隨著智能語音助手的大范圍應(yīng)用,最主要的變化其實是用戶場景的遷移,這也推動了麥克風(fēng)陣列領(lǐng)域從近場識別到遠場識別的技術(shù)大躍進,一旦遠場語音交互成為主流,那將和觸屏的方式產(chǎn)生真正的差異化。

哈曼嵌入式音響事業(yè)部副總裁兼總經(jīng)理---劉蒼松先生

哈曼嵌入式音響事業(yè)部負責(zé)人劉蒼松向鈦媒體編輯介紹,“語音識別從近場識別到遠場識別跨越的難度非常大,比如從識別聲音的距離來看,從2米到3米距離提升50%,但是成本可能增加了兩倍,越往上越成幾何級增長,是不成比例的,就像發(fā)燒音箱一樣,10萬的音響可能只比1萬的音響音質(zhì)提升了一點點。”

哈曼的多種解決方案

麥克風(fēng)陣列有很好的抑制噪聲和語音增強的能力,又不需要麥克風(fēng)時刻指向聲源方向,所以它被越來越廣泛地用到智能音箱乃至其他需要語音交互的場景下。

不過從技術(shù)角度看,麥克風(fēng)數(shù)量不同導(dǎo)致它所具備的特征有所差異,也就誕生了多種應(yīng)用,哈曼嵌入式音響事業(yè)部負責(zé)人劉蒼松表示,根據(jù)特定的用戶需求,SONIQUE™ 可提供三種不同的解決方案。

第一種為雙麥語音解決方案。主要面向以家用電子為主的消費類電子應(yīng)用,可以靈活地應(yīng)用于消費類音響,電視機頂盒以及網(wǎng)絡(luò)路由器等設(shè)備,雙麥配置可支持最遠 4 米的高清遠距離拾音需求。

第二種配置為四麥語音解決方案。主要面向高端家用電子產(chǎn)品、企業(yè)級應(yīng)用以及機器人,可支持最遠 6 米的高清遠距離拾音需求。 

第三種為七麥語音解決方案。主要面向?qū)π阅芤蟾叩钠髽I(yè)級應(yīng)用和機器人。通過搭配系列音效算法,七麥語音解決方案可支持最遠 8 米的高清遠距離拾音需求。

雙麥、多麥,哪個更主流

談及智能音箱,不得不提 Amazon Echo 和 Google Home 這兩款產(chǎn)品,如果單純從硬件層面來看,二者好像都沒有什么可炫耀的資本,唯一不同是 Amazon Echo 采用的是6+1環(huán)形麥克風(fēng)陣列,而Google Home 只采用了2個麥克風(fēng)陣列。

Harman Kardon Invoke

在前不久的微軟Build大會上,微軟發(fā)布了與哈曼合作的智能音箱 Harman Kardon Invoke,作為對標亞馬遜和谷歌的產(chǎn)品,Harman Kardon Invoke 同樣可以實現(xiàn)播放音樂、管理日歷和活動、設(shè)置提醒、檢查流量等功能,區(qū)別在于 Harman Kardon Invoke 采用的是哈曼 SONIQUE™ 七麥的解決方案。 

雙麥克和多麥克陣列的一個主要區(qū)別,是成本不同。雙麥克風(fēng)陣列的 Google Home 售價129美元,采用的是6+1環(huán)形麥克風(fēng)陣列 Amazon Echo售價為179.99美元,兩者相差了50美金。

但同時哈曼嵌入式音響事業(yè)部負責(zé)人劉蒼松也解釋道,“其實成本并不是單純由麥克風(fēng)的數(shù)量決定,實際單個麥克風(fēng)的硬件成本很低,多麥克風(fēng)陣列的難度在于體系更復(fù)雜,需要花費大量時間在材料、工藝、軟件上去調(diào)教,是軟硬件一體化的系統(tǒng)工程。”

對于目前的智能語音類產(chǎn)品來說,也不存在哪個更主流的問題,而是更強調(diào)應(yīng)用場景。“雙麥克風(fēng)陣列產(chǎn)品應(yīng)用的場景相對簡單,命令也不復(fù)雜,對成本要求低,比如電燈開關(guān)、窗簾開關(guān),而類似Echo這樣的產(chǎn)品則是對識別的準確性要求高,但在數(shù)量上都達不到雙麥克的出貨量”,劉蒼松表示。

做人工智能設(shè)備的耳朵和嘴巴

哈曼主要為汽車市場、大眾消費市場以及專業(yè)市場設(shè)計、生產(chǎn)和提供各類音響與信息娛樂系統(tǒng)解決方案及軟件服務(wù)。哈曼嵌入式音響事業(yè)部隸屬于哈曼四大業(yè)務(wù)群之一的消費類音響,主要為消費類企業(yè)用戶提供全方位的音響解決方案,為B2B性質(zhì)的部門。

哈曼嵌入式音響事業(yè)部負責(zé)人劉蒼松也表示,“哈曼在麥克風(fēng)領(lǐng)域有超過60年的歷史,幾十年前唱片音樂流行的時候,世界上一級的錄音室都是哈曼的設(shè)備,哈曼現(xiàn)在做智能語音麥克風(fēng)陣列的技術(shù),是水到渠成自然而然的技術(shù)積累而做的一個產(chǎn)品。”

對于在這個領(lǐng)域的定位,哈曼也同樣十分清晰,劉蒼松給鈦媒體編輯舉了一個十分形象的例子,“哈曼的角色就像是人工智能設(shè)備的耳朵和嘴巴,當(dāng)你對智能音箱說‘我餓了’,這個聲音會通過麥克風(fēng)陣列進行降噪并收集,哈曼的解決方案負責(zé)收集用戶的輸入結(jié)果,主要是前端聲音的采集和反饋時候聲音的表達。”

哈曼的麥克風(fēng)陣列擔(dān)當(dāng)了智能語音入口的性質(zhì),“至于人工智能如何思考,自然語言理解、搜索結(jié)果反饋等下一步的服務(wù)提供則是由那些互聯(lián)網(wǎng)公司提供。”劉蒼松表示道。 

但這個過程中不能忽略的是,語音識別率是在云端測試得到的結(jié)果,因此這兩個系統(tǒng)必須匹配在一起才能得到最好的效果,為此哈曼進行了非常廣泛的合作。

截至目前,SONIQUE™ 遠程語音識別解決方案已經(jīng)能夠支持開源的主流語音引擎集成,包括亞馬遜 Alexa 以及微軟Cortana,并預(yù)計在近期內(nèi)與更多語音引擎廠商開展合作,列表中的名單包括百度、科大訊飛、蘋果 Siri,并且還在持續(xù)增加。(本文首發(fā)鈦媒體,記者/李玉鵬)

轉(zhuǎn)載請注明出處、作者和本文鏈接。
聲明:文章內(nèi)容僅供參考、交流、學(xué)習(xí)、不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 麥克風(fēng)陣列現(xiàn)在其實已經(jīng)蠻成熟了,現(xiàn)在就是講技術(shù)應(yīng)用到各個方面,其實下面評論的問題也很好避免,例如加聲紋識別或者軟件增加喚醒詞功能。我們也不可否認AI在日常生活中發(fā)揮的作用越來越大了,語音交互的軟件方面像科大訊飛的靈犀,siri這樣的如果進一步發(fā)掘深層次的應(yīng)用就更好了。

    回復(fù) 2017.06.13 · via pc

快報

更多

22:08

下周(3月30日-4月5日)市場大事預(yù)告

22:06

民調(diào)顯示美國選民對特朗普“不滿意率”創(chuàng)新高

21:43

納比勒·法赫米將擔(dān)任新一任阿盟秘書長

21:07

群核科技通過港交所聆訊:2025年實現(xiàn)盈利,沖刺“全球空間智能第一股”

21:05

油價飆升埃及多措施節(jié)能,埃及上調(diào)公共交通票價

21:05

英矽智能與禮來達成AI藥物研發(fā)合作,交易總值最高可達27.5億美元

21:04

3月29日新聞聯(lián)播速覽20條

21:01

中國銀河證券:中長期仍看好科技板塊產(chǎn)業(yè)驅(qū)動與周期板塊漲價線索的雙主線

20:34

大風(fēng)、降水來襲,長江江蘇段部分區(qū)域?qū)嵤┡R時交通管制

19:59

國航C919正式投入北京—廈門、北京—哈爾濱兩條航線運營

19:57

中鋁國際:2025年歸母凈利潤2.58億元,同比增長16.47%

19:19

伊朗稱已打擊與美軍工有關(guān)聯(lián)的兩家企業(yè)

18:36

伊朗與巴基斯坦兩國外長通電話,討論地區(qū)局勢

18:35

2025年玩具(不含潮玩)國內(nèi)市場零售總額達1035.3億元

18:08

全國豬價跌破5元,創(chuàng)歷史新低

18:07

時代天使2025年實現(xiàn)收入3.7億美元,同比增長37.8%

17:57

電魂網(wǎng)絡(luò):擬投資4920萬元取得上海漫魂51%股權(quán)

17:51

美國1天超3000場反戰(zhàn)示威

17:28

雀巢12噸巧克力被盜

17:11

伊朗官員表示將“果斷反擊”美軍奪島

1

掃描下載App