訊飛未來智能公司CEO馬嘯給出了肯定的答案:“我認為未來的TWS耳機會被分為兩類:一類是作為手機的配件,替代目前的3.5mm耳機以及其他形態(tài)的藍牙耳機,滿足用戶的娛樂需求;另一類將會是聚焦應用場景的功能性TWS產(chǎn)品,比如之前大家看到的骨傳導耳機、運動耳機都屬于這一范疇,而訊飛未來智能公司則要打造基于語音交互功能實現(xiàn)應用擴展的‘辦公耳機’品類,滿足用戶的生產(chǎn)力需求。”
包括馬嘯在內(nèi)的訊飛未來智能公司團隊,其中很多員工都有科大訊飛的工作經(jīng)歷,而這也成為了訊飛未來智能能夠在智能硬件領域站穩(wěn)腳跟的基礎。得益于科大訊飛此前在語音識別、語義識別方面的技術(shù)積累和領先優(yōu)勢,訊飛未來智能團隊可以在短時間形成對智能硬件賽道的快速賦能,而馬嘯所說的發(fā)展機遇,也正是基于TWS耳機便攜優(yōu)勢的語音場景。
“在蘋果推出Siri之后,我們就注意到了智能語音交互所擁有的發(fā)展?jié)摿?,雖然早期的智能助手被很多用戶戲稱為‘智障助手’,但我們認為這個問題的癥結(jié)并不在助手或者說語音交互形態(tài)。”馬嘯表示,早期大家對于語音助手的過高期待值,反而成為了其應用普及的最大絆腳石。
從目前便攜智能設備的整體發(fā)展趨勢來看,想要用語音完全替代觸控交互,是不切實際的想法。以最簡單的劃動、點擊操作為例,每次動作與結(jié)果的交互反饋已經(jīng)非常高效,這顯然要比說出語音指令要方便的多。
而且語音交互的應用場景也并沒有大家所想象的那么寬泛,無論是處于公司、咖啡館還是火車上,都并不適合與機器進行語音交互,因為你在發(fā)出語音的同時,也會對周圍的人產(chǎn)生影響。因此,訊飛未來智能公司將目光投入在智能語音領域的同時,也對產(chǎn)品使用場景進行了劃分。
![]()
“當你把TWS耳機日常應用的各種場景進行逐一剝離之后,你會看到有一些地方與語音的契合度是非常高的,比如疫情環(huán)境帶來的辦公方式改變,在線上辦公、移動開會的時候,語音的溝通顯然要比文字更加高效,而這就是訊飛未來智能公司目前專注的領域,即為這些金融圈精英、白領人士,提供一個便捷的‘工具性’產(chǎn)品。”馬嘯表示。
訊飛未來智能推出的iFLYBUDS系列產(chǎn)品,被其定位為“會議耳機”,與其他TWS主打音質(zhì)、佩戴或外形設計不同,它主打的功能是通話、會議錄音以及語音轉(zhuǎn)文字。實際上,在錄音場景,用戶其實有著很強的硬件需求,最早的錄音機、錄音筆再到這兩年的智能錄音設備,都表明了這個市場的發(fā)展空間是始終存在的。
另一方面,隨著半導體行業(yè)的發(fā)展,人們身邊智能設備的算力都在提升,具體到TWS領域內(nèi),現(xiàn)在的處理芯片性能已經(jīng)產(chǎn)生了冗余,即便廠家加入了主動降噪、通話降噪、低延遲優(yōu)化、多設備連接等功能后,其處理能力依然沒有被完全釋放,因此訊飛未來智能公司才能將錄音、文字轉(zhuǎn)譯等功能融入其中。
這些功能應用除了在采訪等專業(yè)場景,如今很多生活場景也需要錄音進行輔助,但iOS系統(tǒng)在錄音方面有著自己的限制,安卓系統(tǒng)的錄制質(zhì)量、可錄音應用的覆蓋范圍,也非常地有限。訊飛未來智能公司的TWS產(chǎn)品,則在耳機中設立了兩套工作流,聲音會被分為兩路,一條聲音信息用于用戶通訊,另一條聲音鏈路則會用于聲音記錄及轉(zhuǎn)寫,形成生產(chǎn)力。
“你可能會覺得,在TWS產(chǎn)品中加個錄音功能,這并不是一件很高門檻的事情,但實際上是需要對芯片層進行深度的二次開發(fā)才能實現(xiàn)的。并且這項功能還有很大的場景擴展價值”馬嘯告訴鈦媒體App。
對聲音的提取其實只是產(chǎn)品的基礎功能,而訊飛未來智能TWS耳機的殺手锏則在于“聲音處理”,在線上辦公過程中,電話會議的文字量往往是非常驚人的,以普通人每分鐘120~200字的語速計算,1個小時的電話會議,形成的文字量就會超過1萬字,如果某個產(chǎn)品只提供給用戶1小時的錄音文件,對于用戶的工作而言幫助是很小的。
![]()
即便用戶通過軟件進行文字轉(zhuǎn)譯,那么呈現(xiàn)在其面前的也會是一篇1萬字的文字稿,并且當中不會有任何的段落標識,并且包含大量的語氣詞、重復詞。目前,訊飛未來智能的TWS耳機產(chǎn)品,已經(jīng)能夠做到在對語音進行文字轉(zhuǎn)換的同時,自動區(qū)分講話者,并且對重復詞、語氣詞進行自動識別與刪除。還支持中文、中英混合、英語、日語、等7種語言以及國內(nèi)12種方言的語音識別,以及針對專業(yè)領域詞匯的理解。
除卓越的軟硬件實力之外,訊飛未來智能已經(jīng)將“數(shù)據(jù)”變成了自身的護城河。訊飛未來智能已經(jīng)搭建了一套支持多垂直場景交互的運營平臺——未來智能AI平臺,平臺上累積近100萬小時的電話數(shù)據(jù),有效支持了服務平臺的場景打磨。
這些數(shù)據(jù),讓訊飛未來智能的智能交互平臺能夠為用戶帶來更好的服務體驗,本身成為了一道賽道門檻。不同于傳統(tǒng)的耳機廠商,數(shù)據(jù)的閉環(huán),讓訊飛未來智能的耳機在銷售后仍然能夠連接用戶,從而形成粘性。據(jù)馬嘯介紹,iFLYBUDS的用戶APP活躍度始終保持在70%,記錄上云率95%。
馬嘯在采訪中提到,下一步訊飛未來智能將會進一步訓練強化自己的AI模型,實現(xiàn)對成段文字提取關(guān)鍵詞的能力,再向后發(fā)展,則有望通過AI智能,直接讓錄音形成紀要形式的文本。而AI的能力,也會是訊飛未來智能公司在TWS領域的核心競爭力之一。
當下很多企業(yè)在入局TWS行業(yè)的時候,都是在利用品牌力破圈,至于產(chǎn)品與技術(shù)方面,更多地是用主流的算法、硬件方案組裝而成。馬嘯表示,訊飛未來智能則希望能夠利用自己的“軟實力”實現(xiàn)破局,此前科大訊飛的語音技術(shù)基礎,再加上面向會議場景的語音數(shù)據(jù)積累,這些算法和數(shù)據(jù)層面的實力,才是他眼中訊飛未來智能公司的核心競爭力。
在初代產(chǎn)品發(fā)布后,馬嘯也在全國開始了路演,他提到:“我們的第一波用戶群體相對集中,主要是白領人群,尤其是金融從業(yè)者、律師、記者等職業(yè)。我接觸這些用戶的時候發(fā)現(xiàn),他們一般都有兩個特點:首先,這些用戶往往都已經(jīng)擁有像Airpods這樣的耳機產(chǎn)品,iFLYBUDS往往是它的第二個耳機,其次,他們接觸到iFLYBUDS基本都是通過主動尋找或圈內(nèi)朋友推薦而不是被廣告、推廣所吸引。”
這些處于金融圈的精英群體,所需要的就是一個高效、可靠的會議錄音轉(zhuǎn)寫工具,而iFLYBUDS的出現(xiàn),則直接解決了他們的痛點,也因此在圈內(nèi)快速火爆起來。這也就說明了目前訊飛未來智能所處“辦公耳機”領域的特殊性,這部分用戶群體往往有比較高的消費力,同時它們對錄音這樣的特殊應用場景的需求始終存在,訊飛未來智能能夠在早期獲得市場關(guān)注也是得益于此。
![]()
未來除了完善目前已經(jīng)布局的“會議耳機”和“運動耳機”產(chǎn)品線,訊飛未來智能還會針對出國人群、老年人等有特殊需求的用戶群體推出翻譯耳機、老人耳機等有著較強針對性的產(chǎn)品。正如馬嘯所說:“目前公司所在AI智能領域積累的技術(shù),其應用前景是非常廣泛的,對于訊飛未來智能而言,通過專注于垂直應用場景中的新需求,將能夠不斷創(chuàng)造TWS領域的科技新消費品,不斷發(fā)現(xiàn)新的藍海市場。”(本文首發(fā)鈦媒體App 作者/鄧劍云 編輯/項歐)
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論