版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、說話人識別是根據(jù)說話人所發(fā)語音,確定出說話人是誰的過程,也就是基于聲音這個生物特征作為身份認(rèn)證依據(jù)的識別技術(shù)。說話人識別具有廣泛的應(yīng)用前景,如保安、公安司法、軍事、財經(jīng)和信息服務(wù)等領(lǐng)域。其研究具有越來越重要的社會意義和實用價值,因而在國際和國內(nèi)都受到了極大的關(guān)注。 根據(jù)不同的應(yīng)用場合,說話人識別可以分為說話人辯認(rèn)和說話人確認(rèn)。本論文就說話人識別中的說話人辨認(rèn)問題,采用基于因子分析的概率統(tǒng)計模型方法,從與文本無關(guān)的角度,對語音端點
2、檢測、基于FAHMM和FAGMM的說話人模型、基于最大似然估計(MLE)的EM算法和基于區(qū)分性訓(xùn)練的MCE算法等各方面進(jìn)行了較深入的研究。 首先,詳細(xì)討論了說話人確認(rèn)中兩種最常用到的基于概率統(tǒng)計的說話人模型:隱馬爾柯夫模型(HMM)和高斯混合模型(GMM)。仔細(xì)分析了HMM和GMM作為說話人模型的優(yōu)越之處及其意義。在對HMM和GMM的概念進(jìn)行了詳細(xì)的討論后,我們重點分析了影響其識別性能的一個關(guān)鍵問題,即模型的訓(xùn)練算法。主要介紹了
3、常規(guī)的基于最大似然估計的Baum-Welch算法。 接著,探討了語音信號的端點檢測及噪聲魯棒性問題。在強噪聲環(huán)境下,現(xiàn)有的算法無法檢測到準(zhǔn)確的端點,研究自適應(yīng)于環(huán)境噪聲的語音端點檢測方法是解決噪聲背景下說話人識別和語音識別的關(guān)鍵。為了提高端點檢測的正確率,選擇合適的聲學(xué)特征也至關(guān)重要。我們以表征語音信號復(fù)雜程度的近似熵(Approximate Entropy, ApEn)為聲學(xué)特征,嘗試性地提出了一種在噪聲環(huán)境下的端點檢測方法,
4、即通過分析語音信號的近似熵來進(jìn)行。實驗表明,在強噪聲環(huán)境下,該方法能夠比較準(zhǔn)確地檢測語音信號的端點。 為了解決說話人識別中的幀內(nèi)相關(guān)問題,從模型端出發(fā),引入因子分析的降維統(tǒng)計方法,結(jié)合目前的主流模型HMM和GMM分別對說話人進(jìn)行建模,即FAHMM和FAGMM,并在我們自己錄制的50個人(30個男性,20個女性)的數(shù)據(jù)集上,對這兩個模型進(jìn)行了與文本無關(guān)的說話人辨認(rèn)實驗: 在基于FAHMM的實驗中,討論了三種不同的參數(shù)共享方
5、式下說話人識別的性能。實驗表明:FAHMM相對于采用對角陣形式的HMM,能夠更好的解決特征矢量幀內(nèi)相關(guān)問題;在相同的實驗條件下,采用共享觀測矩陣的FAHMM能夠得到更好的識別性能,相對于HMM,誤識率相對下降了30%。 在基于FAGMM的系統(tǒng)中,我們推導(dǎo)了FAGMM的期望最大訓(xùn)練算法和最小分類錯誤算法。實驗結(jié)果表明,F(xiàn)AGMM在同一測試數(shù)據(jù)集上的識別性能比GMM要好。而且通過可區(qū)分性算法,即最小分類錯誤算法使得系統(tǒng)的性能得到進(jìn)一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于因子分析的說話人確認(rèn).pdf
- 基于聯(lián)合因子分析的耳語音說話人識別研究.pdf
- 基于因子分析和支持向量機的耳語說話人識別.pdf
- 基于概率統(tǒng)計模型的說話人確認(rèn)的研究.pdf
- MMCE算法在因子分析概率統(tǒng)計模型中的應(yīng)用.pdf
- 基于因子分析的說話人分離技術(shù)研究.pdf
- 基于統(tǒng)計模型的說話人識別研究與實現(xiàn).pdf
- 基于因子分析的與文本無關(guān)的說話人辯認(rèn)方法研究.pdf
- 多元統(tǒng)計因子分析
- 說話人識別情感合成問題的概率模型研究.pdf
- 基于混合高斯模型的說話人識別.pdf
- 基于概率統(tǒng)計模型的雷達(dá)目標(biāo)HRRP識別.pdf
- 基于高斯混合模型的說話人識別研究.pdf
- 基于高斯混合模型的說話人識別算法研究.pdf
- 基于軌線模型和VQ模型的說話人識別研究.pdf
- 基于PLDA模型的說話人識別方法研究.pdf
- 基于高斯混合模型的說話人識別技術(shù)研究.pdf
- 基于模型聚類的說話人識別方法研究.pdf
- 基于特征模糊度分析的說話人識別.pdf
- 基于小波分析的說話人識別研究.pdf
評論
0/150
提交評論