基于空間分離和丟失數(shù)據(jù)的語音識別算法研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-05 格式：pdf 頁數(shù)：71 大?。?.92MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩70頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、目前常用的魯棒語音識別研究主要是基于測試環(huán)境和訓(xùn)練環(huán)境的失配問題提出的，例如魯棒語音特征參數(shù)提取、特征補(bǔ)償和模式自適應(yīng)的方法，這些魯棒性算法的研究出發(fā)點(diǎn)都是要保證測試特征參數(shù)和訓(xùn)練特征參數(shù)模型的一致性。
　　而人耳聽覺系統(tǒng)的語音信號處理系統(tǒng)具有較強(qiáng)的魯棒性，能夠在極其嘈雜的聲學(xué)環(huán)境下實(shí)現(xiàn)準(zhǔn)確的語音感知和識別。相關(guān)研究指出人耳聽覺感知過程可以分為兩個(gè)階段:第一，聲學(xué)信號的切分(segmentation)過程，第二，屬于同一聲學(xué)目標(biāo)的

2、感知成分的組合(grouping)過程，從而形成不同聲源連貫的數(shù)據(jù)流(coherent stream)。也就是說聽覺系統(tǒng)的感知過程，實(shí)際上是聽覺場景中不同聲源信號的重組織過程，混合聲信號中屬于同一聲源的分量組織到一個(gè)數(shù)據(jù)流中，從而得到不同聲源的數(shù)據(jù)流，使得人耳的聽覺系統(tǒng)可以區(qū)分不同的聲源。在此基礎(chǔ)上，再進(jìn)行進(jìn)一步的處理。因此從人耳聲信號處理的機(jī)制出發(fā)，對基于語音分離的魯棒識別方法進(jìn)行研究。
　　考慮到由于基于方位信息的語音分離與語

3、音信號內(nèi)容、說話人無關(guān)，同時(shí)基于空間方位信息的語音分離無需建立源信號參數(shù)的統(tǒng)計(jì)模型。由于空間分離后，特征參數(shù)存在數(shù)據(jù)丟失的問題，因此本論文將基于空間分離的語音分離方法和基于丟失數(shù)據(jù)的語音識別方法進(jìn)行了結(jié)合，提出了融合空間方位分離和丟失數(shù)據(jù)的孤立詞識別算法。本論文的主要工作如下:
　　(1)對語音識別系統(tǒng)的基本結(jié)構(gòu)進(jìn)行了概述，包括預(yù)處理、特征提取與HMM語音模型。具體分析了現(xiàn)有魯棒語音識別技術(shù)在信號空間、特征空間與模型空間所包含的代

4、表性的技術(shù)。并由此引入本文的重點(diǎn)研究內(nèi)容:基于丟失數(shù)據(jù)的語音識別技術(shù)。
　　(2)分析了現(xiàn)有魯棒識別系統(tǒng)經(jīng)常使用的語音特征參數(shù)，包括倒譜域中的梅爾倒譜系數(shù)(MFCC)和線性預(yù)測倒譜系數(shù)(LPCC)?；趤G失數(shù)據(jù)技術(shù)的基本原理，本文研究了另外兩種頻域中的參數(shù):基于梅爾濾波器組的FBANK參數(shù)和基于Gammatone濾波器組的子帶RateMap參數(shù)，并基于HMM通過Matlab進(jìn)行仿真測試，實(shí)驗(yàn)表明，這兩種參數(shù)可以應(yīng)用于基于丟失數(shù)據(jù)的

5、語音識別系統(tǒng)之中。
　　(3)實(shí)現(xiàn)了基于空間分離和丟失數(shù)據(jù)技術(shù)的語音識別系統(tǒng)?；诳臻g信息的語音分離算法基于語音信號的稀疏性生成不同聲源的二元掩膜，這種判決方式會(huì)產(chǎn)生目標(biāo)聲源頻域成分丟失的問題。本文研究了兩種算法對丟失的數(shù)據(jù)部分進(jìn)行處理。一種是完全忽略數(shù)據(jù)的丟失部分，僅使用未丟失的數(shù)據(jù)進(jìn)行語音識別，即邊緣概率技術(shù)。另一種是通過特定的方法恢復(fù)數(shù)據(jù)的丟失部分，得到完整的數(shù)據(jù)用來進(jìn)行語音識別，即數(shù)據(jù)估計(jì)技術(shù)。仿真實(shí)驗(yàn)表明兩種技術(shù)在低信噪

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于空間分離和丟失數(shù)據(jù)的語音識別算法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

基于空間分離和丟失數(shù)據(jù)的語音識別算法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載