基于GMM的說話人語音識別研究與實踐.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-10 格式：pdf 頁數(shù)：64 大?。?.61MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩63頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、說話人識別作為語音信號處理技術(shù)的一個代表和重要組成部分，近幾年來，日益成為當(dāng)今的一個研究熱點，在電子商務(wù)、消費、銀行等遠(yuǎn)程客戶服務(wù)的身份認(rèn)證，軍事安全領(lǐng)域的說話人身份自動檢測認(rèn)證中具有極大的應(yīng)用價值和廣泛的應(yīng)用前景。它是一種基于生物特征信息的身份識別方法，通過對說話人的語音進行分析，從而對說話人身份做出正確識別和判斷的一項研究。依據(jù)判別方式的不同(一對多，一對一)，說話人識別可以分為說話人辨認(rèn)和說話人確認(rèn)。隨著交互技術(shù)和信息技術(shù)的飛速發(fā)

2、展，說話人識別開始越來越受到大家的關(guān)注。
　　本論文主要做的工作如下：
　　首先，本文針對說話人識別的前端處理方面進行了相關(guān)研究，得出并實現(xiàn)了一個比較合理的處理算法；
　　其次，討論不同語音特征向量的提取方法，最終得出針對說話人識別而言比較合理的特征向量：美爾倒譜系數(shù)(MFCC)。在成功提取出MFCC的前提下，討論了MFCC各維參數(shù)對最終結(jié)果的貢獻(xiàn)；
　　再次，在識別模型的訓(xùn)練方面，主要研究高斯混

3、合模型的模型訓(xùn)練，在這種訓(xùn)練方法中，主要討論了最大似然估計算法，期望-最大化算法以及最大模型距離法；
　　再其次，在性能研究方面，研究了不同高斯混合密度下說話人辨認(rèn)系統(tǒng)的識別率，認(rèn)為高斯密度個數(shù)的選擇與訓(xùn)練語音數(shù)據(jù)量具有相關(guān)性。同時驗證了其他其它幾個與識別率有關(guān)的參數(shù)因素與系統(tǒng)性能關(guān)系；
　　最后，搭建了一個說話人識別系統(tǒng)用于試驗測試，驗證了一些參數(shù)對性能的影響，同時使用了多線程并行處理技術(shù)，以此縮短識別時間：并提出

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于GMM的說話人語音識別研究與實踐.pdf

文檔簡介

溫馨提示

最新文檔

評論

基于GMM的說話人語音識別研究與實踐.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載