-->

免费看在线a黄视频|99爽99操日韩毛片儿|91停婷在线无码观看|日韩三级片小视频|一级黄片免费播放|欧美成人视频网站导航|亚洲日韩欧美七区|国产视频在线观看91|人成视频免费在线播放|国产精品成人在线免费观看

違規(guī)提示

請您遵循相關(guān)法律法規(guī),避免再次出現(xiàn)類似問題

如有任何疑問,請聯(lián)系support@tmtpost.com

關(guān)閉
第五課:聲紋識別技術(shù)的研究進(jìn)展
溫正棋 / 人機(jī)交互技術(shù)的發(fā)展
第五課:聲紋識別技術(shù)的研究進(jìn)展

第五課:聲紋識別技術(shù)的研究進(jìn)展

小欣:這節(jié)課,溫老師會為我們講解聲紋識別的研究原理。

溫正棋:說話人識別也就是聲紋識別,簡單介紹一下現(xiàn)有的I-vector系統(tǒng)以及如何將DNN應(yīng)用到對應(yīng)的I-vector系統(tǒng),同時我們也跟蹤了最近end to end的一種方法。

基于Ivector系統(tǒng)通過UBM模型來訓(xùn)練數(shù)據(jù),然后訓(xùn)練得到混合高斯模型,通過統(tǒng)計量的提取比如零階、一階、二階我們來訓(xùn)練它的差異空間T從而提取出它的Ivector。

最后考慮到不同的補(bǔ)償方式進(jìn)行信道補(bǔ)償使性能更加完善,同時我們在合成端、最后識別端也可以考慮不同系統(tǒng)的融合提高最終的準(zhǔn)確率。

將DNN用到說話人識別主要是針對Ivector的系統(tǒng)。UBM訓(xùn)練是一個無監(jiān)督的訓(xùn)練方式不考慮音速相關(guān)的信息,因此就不考慮每個人說話音速在聲學(xué)空間上的不同。

我們可以將這部分信息運用到說話人識別中,將前面提到的Ivector需要的臨界統(tǒng)計量通過DNN模型的輸出進(jìn)行替換。在訓(xùn)練Ivector的過程中考慮每個人音速、發(fā)音音速相關(guān)的不同特征,這樣會更好的對說話人進(jìn)行識別。

DNN還有一種應(yīng)用形式采用bottleneck特征替換掉原來的MFCC、PLP相關(guān)的特征,這也是從音速區(qū)分性、每個人發(fā)音音速不一樣來考慮的。

小欣:下節(jié)課,溫老師會為我們講解未來人機(jī)交互的研究方向。

【版權(quán)歸鈦媒體所有,未經(jīng)許可不得轉(zhuǎn)載】

分享課程:
大家都在學(xué)
72問 有聲書系列 / 中國經(jīng)濟(jì)2021
精品小課 揭秘黃金投資:2022年以來上漲表現(xiàn)最好的資產(chǎn)之一
精品小課 阿里人力資源體系課

Oh! no

您是否確認(rèn)要刪除該條評論嗎?

全部課程 ( 6 )
倒序播放

00:00
/
00:00
X1.0

注冊郵箱未驗證

我們已向下方郵箱發(fā)送了驗證郵件,請查收并按提示驗證您的郵箱。

如果您沒有收到郵件,請留意垃圾郵件箱。

更換郵箱

您當(dāng)前使用的郵箱可能無法接收驗證郵件,建議您更換郵箱

賬號合并

經(jīng)檢測,你是“鈦媒體”和“商業(yè)價值”的注冊用戶。現(xiàn)在,我們對兩個產(chǎn)品因進(jìn)行整合,需要您選擇一個賬號用來登錄。無論您選擇哪個賬號,兩個賬號的原有信息都會合并在一起。對于給您造成的不便,我們深感歉意。