基于深度學(xué)習(xí)的說話人識(shí)別研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-09 格式：pdf 頁數(shù)：117 大?。?.39MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩116頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、在現(xiàn)代社會(huì)，人們獲取信息越來越容易，手段越來越多，隨之產(chǎn)生的是隱私保護(hù)更為迫切，因此對(duì)加密的要求也越來越高。如今，除了傳統(tǒng)的指紋加密、字符加密等外，利用語音來識(shí)別身份作為加密的方式也引起了人們的興趣，因而說話人識(shí)別也越來越受到重視。本文主要研究說話人識(shí)別中的說話人確認(rèn)，即判斷某段語音是否為指定的說話人所說，且核心研究是文本相關(guān)的說話人確認(rèn)（要求注冊(cè)和測試時(shí)的說話人和說話內(nèi)容都正確才可通過），同時(shí)會(huì)有少部分文本無關(guān)實(shí)驗(yàn)和研究。在說話人確認(rèn)

2、技術(shù)中，作為最經(jīng)典的GMM-UBM系統(tǒng)和目前最先進(jìn)的i-vector系統(tǒng)，前者實(shí)現(xiàn)方式簡單易操作但性能很難拔尖，后者在文本無關(guān)的說話人系統(tǒng)中表現(xiàn)優(yōu)越但在文本相關(guān)的說話人系統(tǒng)中卻不如GMM-UBM。2006年Hinton提出了深度信念網(wǎng)絡(luò)無監(jiān)督訓(xùn)練算法，使得深度學(xué)習(xí)作為一個(gè)新的領(lǐng)域出現(xiàn)在機(jī)器學(xué)習(xí)研究中。深度學(xué)習(xí)在語音識(shí)別等領(lǐng)域的成功應(yīng)用，也引起了說話人識(shí)別領(lǐng)域的關(guān)注。本文將研究深度學(xué)習(xí)模型在說話人確認(rèn)系統(tǒng)中的應(yīng)用，基于GMM-UBM和i-

3、vector兩個(gè)基線框架下融入深度學(xué)習(xí)模型。
　　在GMM-UBM框架下，研究對(duì)象是深度特征，即由深度學(xué)習(xí)模型隱層輸出的再經(jīng)過一些前端處理后的特征，尤其是深度特征與頻譜特征拼接形成的tandem深度特征。在文本相關(guān)條件下，本文首次全面地將深度特征包括tandem深度特征用于GMM-UBM說話人確認(rèn)中，而且取得了較高地性能提升，最好的結(jié)果EER提升了50％以上。同時(shí)，文本無關(guān)條件下的實(shí)驗(yàn)也驗(yàn)證了深度特征的有效性。
　　在i-v

4、ector框架下，主要針對(duì)其在文本相關(guān)條件下的性能不足，提出了兩種完全在深度神經(jīng)網(wǎng)絡(luò)框架下提取說話人向量的方法：經(jīng)聯(lián)合訓(xùn)練說話人網(wǎng)絡(luò)和文本內(nèi)容網(wǎng)絡(luò)而得到的j-vector和基于神經(jīng)網(wǎng)絡(luò)基分解的s-vector。其中j-vector取得了文本相關(guān)的說話人系統(tǒng)性能上的進(jìn)一步提升，超過了基于tandem深度特征的GMM-UBM系統(tǒng)。另外，針對(duì)文本無關(guān)的i-vector系統(tǒng)，本文在利用深度神經(jīng)網(wǎng)絡(luò)優(yōu)化i-vector提取上進(jìn)行了一定的嘗試。

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于深度學(xué)習(xí)的說話人識(shí)別研究.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

基于深度學(xué)習(xí)的說話人識(shí)別研究.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載