【常寧/ 鈦媒特約】如今技術(shù)的發(fā)展已經(jīng)遠(yuǎn)遠(yuǎn)超出我們的想象,像智能手機能識別到最近的商店、公交車站等等已經(jīng)不算什么新鮮事兒了。研究人員并不滿足智能手機是人的輔助工具,他們希望智能手機不只是冷冰冰的機器,而是有情商,能洞察人的情緒,成為人的親密伙伴。
美國羅徹斯特大學(xué)的一個研究團隊就在做這樣的事情,他們的項目叫做Bridge,目的是為了開發(fā)能從人類語音、面部表情或身體姿勢中探測出情緒的方法。并且該團隊已經(jīng)開發(fā)出一個新軟件,它不需要收集說話的內(nèi)容信息,僅通過分析說話語氣就可以知道人的情緒,比如悲傷、幸福、害怕和厭惡等。也就是說,它跟人說什么內(nèi)容沒有關(guān)系,而是能洞察人是怎么說的。
新軟件對語音情緒的判斷精確度可達到81%,而以往研究的準(zhǔn)確度只有大約55%,所以新軟件在準(zhǔn)確度方面有很大突破。研究人員在剛剛閉幕的IEEE語音技術(shù)研討會上對該軟件進行了展示。
說什么內(nèi)容不重要 怎么說才重要?
情感和情緒是人的一種復(fù)雜心理狀態(tài)的體驗,而這種體驗是隨著人自身的生理和周圍環(huán)境的影響而變化的。許多現(xiàn)有的情感和情緒探測方法主要是以人主觀的自我陳述作為基礎(chǔ)數(shù)據(jù),整個過程耗時耗力,且準(zhǔn)確性不高。目前研究已經(jīng)發(fā)現(xiàn),語言中韻律的變化與人們的情感和情緒有很大的聯(lián)系,所以研究人員想利用這一點來開發(fā)出能自動探測人類情緒的方法。
情緒會影響人的說話方式,比如通過人說話的聲音大小和音高就能大概判斷人的情緒狀態(tài)。要想教計算機去理解人們的情緒,那么首先要認(rèn)識人是如何通過聲音表達情緒的。
所以,在新軟件的情緒探測系統(tǒng)中,研究人員利用語音信號處理方法來提取語音特征,并且給語音確立了12種特殊的語音特征,比如語音的音高、音量、活力等,這些語音特征都能被統(tǒng)計出來,并作為測量標(biāo)準(zhǔn)。隨后研究人員會根據(jù)這些特征繪制出語音的波形、頻譜、共振峰,以此來發(fā)現(xiàn)語音信號中與情緒情感相關(guān)聯(lián)的模式,并將語音進行分類,最終教計算機判斷出語音中包含的情緒。
首款情緒探測App原型出現(xiàn)?
Wendi Heinzelman是羅徹斯特大學(xué)電子與計算機工程教授,也是該團隊的負(fù)責(zé)人。她的學(xué)生Na Yang已經(jīng)基于該研究開發(fā)出一款app原型,在記錄并分析用戶的聲音后,這款app會顯示出用戶是處于高興或悲傷的情緒中。不過這款app的功能還是還是非常簡單。
Heinzelman表示,雖然處于早期階段,但要作出一款更復(fù)雜app也不是什么難事兒。他們將繼續(xù)開發(fā)可以推向市場的情緒探測app,比如可根據(jù)用戶的聲音了解用戶的情緒,然后播放符合用戶心境的音樂等等。并且她認(rèn)為他們的新方法要比之前的任何研究方法都更有效。
但這款軟件還是存在一定的問題,那就是在多人聊天談話中,系統(tǒng)容易受到干擾,對情緒的判斷準(zhǔn)確性就會下降,這也是Heinzelman的團隊下一步要解決的問題。
相比Siri的機械化 新軟件更貼心?
業(yè)界對語音分析的研究早已開始,但在準(zhǔn)確率方面一直表現(xiàn)不佳,就連備受關(guān)注的蘋果Siri也差強人意。所以談到這里,肯定有人會將新軟件與蘋果的Siri來比較。
Siri在回答人們所提的問題方面,確實有吸引人之處,但回答準(zhǔn)確率并不太高。據(jù)去年7月份美國投資銀行派杰(Piper Jaffray)的分析師對Siri進行的一次測試顯示,在鬧市區(qū),Siri問題理解準(zhǔn)確度為83%,回答準(zhǔn)確度為62%。在安靜的房間內(nèi),Siri問題理解準(zhǔn)確度為89%,回答準(zhǔn)確度為68%。從這些數(shù)字來看,Siri的語音分析水平并不是很高。
但是,Siri只停留在根據(jù)人們提問的問題進行詞語分析,進而來匹配答案,在程度上多少有些機械化。
新技術(shù)也屬于語音分析的范疇,然而與Siri不同的是,它不需要去解釋語音的內(nèi)容或像其他語音技術(shù)去捕捉圖像,所以不會涉入太多復(fù)雜條件,更容易操作,準(zhǔn)確性也更強。所以,這種情緒探測系統(tǒng)可能會更具吸引力。而且,新技術(shù)要解決的是更高級的情感問題,希望盡可能的感受到人的情緒,而不是簡單的分析詞語。因此,從這方面來講,新軟件似乎更勝一籌,更人性化和貼心。
商用價值有空間?
未來,醫(yī)療研究人員可以在移動設(shè)備上利用這種情緒探測和感知技術(shù),用于監(jiān)護病人或?qū)θ说男袨檫M行研究。另外,目前業(yè)界一直在研究比較復(fù)雜的情景感知系統(tǒng),而情緒探測技術(shù)將會成為情景感知系統(tǒng)研究的入口點。而情景感知系統(tǒng)將會是未來消費電子產(chǎn)品或服務(wù)的重要功能,并且也是未來推動移動廣告發(fā)展的重要技術(shù)。這一點來講,其商用價值有極大的開發(fā)空間。
更多該技術(shù)的具體介紹可查看羅徹斯特大學(xué)網(wǎng)站






快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論