-->
第一課:人機(jī)交互的基礎(chǔ)認(rèn)知
小欣:大家好,歡迎收聽“鈦媒體72問”專家分享課《坦白講》。我是主持人小欣,在課程中我將會(huì)陪伴大家探索行業(yè)大咖對(duì)于前沿領(lǐng)域的深度剖析與思考?,F(xiàn)在就和我一起開始了解今天要進(jìn)行課程的嘉賓吧!
今天的主講人是極限元技術(shù)副總裁溫正棋,他畢業(yè)于中國科學(xué)院自動(dòng)化研究所,在語音的合成、識(shí)別、說話人識(shí)別等領(lǐng)域都有著多年深入研究經(jīng)驗(yàn),并結(jié)合深度學(xué)習(xí)技術(shù)開發(fā)了多款語音應(yīng)用產(chǎn)品。本期課程將會(huì)分為六大節(jié),第一節(jié)溫正棋老師會(huì)為我們講解關(guān)于人機(jī)交互的一些基礎(chǔ)認(rèn)知。
溫正棋:從整個(gè)交互系統(tǒng)接入用戶的輸入信息開始包括語音、人臉、多模態(tài)情感相關(guān)的信息,我們在對(duì)話系統(tǒng)里對(duì)輸入的信息進(jìn)行理解,通過這個(gè)對(duì)話產(chǎn)生輸出,最后用文字、語音合成展現(xiàn)出來,這就是整個(gè)流程。其中我們最主要關(guān)注的是語音部分以及對(duì)話系統(tǒng)部分,其他的多模態(tài)今天的分享不會(huì)涉及太多。
對(duì)國內(nèi)研究語音相關(guān)的團(tuán)隊(duì)進(jìn)行概括。首先是科研院所,科研院所主要包括高校和科學(xué)院。比如科學(xué)院里有聲學(xué)所、自動(dòng)化所。高校里面研究比較多的清華、北大、西工大、科大、上海交大等,這些都是在語音圈里占有較高位置的老牌隊(duì)伍。
再有就是語音公司,語音技術(shù)公司包括我們比較熟悉的科大訊飛、云知聲、思必馳、捷通華聲。最后一個(gè)就是互聯(lián)網(wǎng)企業(yè),互聯(lián)網(wǎng)公司包括BAT、搜狗等擁有強(qiáng)大的語音技術(shù)團(tuán)隊(duì)來支撐著其本身的很多業(yè)務(wù)。
在應(yīng)用對(duì)話系統(tǒng)時(shí),首先從語音輸入開始要有一些前端處理,包括硬件和軟件的前期處理。接下來是語音內(nèi)容、說話人識(shí)別等相關(guān)的內(nèi)容進(jìn)行判別,對(duì)話系統(tǒng)根據(jù)輸入信息來進(jìn)行對(duì)話邏輯的分析以及對(duì)應(yīng)語言的產(chǎn)生。最后由語音合成系統(tǒng)來合成語音。
在這里重點(diǎn)介紹一下前端處理、語音識(shí)別、說話人識(shí)別語音合成等相關(guān)技術(shù)。
小欣:下節(jié)課,溫老師會(huì)為我們講解前端處理技術(shù)的研究進(jìn)展。
【版權(quán)歸鈦媒體所有,未經(jīng)許可不得轉(zhuǎn)載】

您是否確認(rèn)要?jiǎng)h除該條評(píng)論嗎?
賬號(hào)合并
經(jīng)檢測,你是“鈦媒體”和“商業(yè)價(jià)值”的注冊用戶?,F(xiàn)在,我們對(duì)兩個(gè)產(chǎn)品因進(jìn)行整合,需要您選擇一個(gè)賬號(hào)用來登錄。無論您選擇哪個(gè)賬號(hào),兩個(gè)賬號(hào)的原有信息都會(huì)合并在一起。對(duì)于給您造成的不便,我們深感歉意。
不錯(cuò)