版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于基于VC和Matlab的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)研究的實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)研究_DTWVC和Matlab的混合編程共同運(yùn)用于語(yǔ)音識(shí)別,可以借助VC實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的采集,同時(shí)通過(guò)Matlab強(qiáng)大的矩陣計(jì)算功能,簡(jiǎn)便化的編程方法,實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的識(shí)別處理。其中,VC主要做語(yǔ)音信號(hào)的采集,通過(guò)借助于微軟提供的WindowsMultimediaAPI開發(fā)了在線實(shí)時(shí)語(yǔ)音采集程序,實(shí)現(xiàn)了人機(jī)在線實(shí)時(shí)交互。2語(yǔ)音識(shí)別系統(tǒng)概述語(yǔ)音信號(hào)的一般處理過(guò)程如圖1所示,
2、其中首先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理DTW,其中預(yù)處理包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等。然后是信號(hào)特征量的提取,本文對(duì)信號(hào)的特征量進(jìn)行Mel頻率倒譜系數(shù)(MelFrequencyCepstrumCoefficients)處理。最后通過(guò)對(duì)已經(jīng)建立好的參數(shù)模板進(jìn)行對(duì)比,測(cè)試的依據(jù)是失真度最小準(zhǔn)測(cè),如本文用到的動(dòng)態(tài)時(shí)間規(guī)整:DTW(DynamicTimeWarping)。圖1語(yǔ)音識(shí)別過(guò)程基本流程圖3語(yǔ)音信號(hào)的采集語(yǔ)音信號(hào)的兩個(gè)過(guò)程為:
3、對(duì)語(yǔ)音信號(hào)進(jìn)行實(shí)時(shí)的采集,對(duì)采集的語(yǔ)音信號(hào)做出識(shí)別。本文對(duì)語(yǔ)音信號(hào)的采集是通過(guò)VC調(diào)用Microsoft的Windows系統(tǒng)中提供了多媒體應(yīng)用MultimediaAPI函數(shù)主要有以下幾個(gè):獲取音頻設(shè)備信的函數(shù)waveInGetNumDevs(),該函數(shù)用于獲取當(dāng)前系統(tǒng)中所安裝的音頻輸入設(shè)備的數(shù)目。查詢音頻設(shè)備的能力函數(shù)waveInOpen(),該函數(shù)的作用是打開波形輸入輸入設(shè)備。通過(guò)CALLBACK_FUNCTION命令來(lái)打開設(shè)備。錄音
4、緩沖區(qū)的組織WAVEHDR結(jié)構(gòu),一般都是設(shè)置雙緩存區(qū)對(duì)語(yǔ)音信號(hào)進(jìn)行平穩(wěn)緩沖論文網(wǎng)站。開始和停止錄音時(shí)用到waveInStart()和waveInStop()兩個(gè)函數(shù)。4用Matlab實(shí)現(xiàn)語(yǔ)音識(shí)別過(guò)程4.1端點(diǎn)檢測(cè)從背景噪聲中找出語(yǔ)音的開始和終止點(diǎn)這是在很多語(yǔ)音處理應(yīng)用中的基本問(wèn)題。端點(diǎn)檢測(cè)對(duì)于語(yǔ)音識(shí)別有著重要的意義。本文主要采用短時(shí)能量與短時(shí)平均過(guò)零率雙門限結(jié)合的方式,來(lái)對(duì)漢語(yǔ)語(yǔ)音的起止點(diǎn)進(jìn)行檢測(cè)。短時(shí)能量和過(guò)零率分別確定兩個(gè)門限信號(hào)必
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于MATLAB的車牌識(shí)別系統(tǒng)研究.pdf
- 基于HMM的語(yǔ)音識(shí)別系統(tǒng)研究.pdf
- 基于MATLAB的虹膜識(shí)別系統(tǒng)研究.pdf
- 基于FPGA實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn).pdf
- 基于小波變換和DTW算法的ECG身份識(shí)別系統(tǒng)研究.pdf
- 基于DTW的語(yǔ)音識(shí)別研究.pdf
- 基于DSP5509A的DTW語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于VC的廣告語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)研究.pdf
- 基于改進(jìn)DTW算法的嵌入式語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn).pdf
- 基于DTW和WMFCC的語(yǔ)音識(shí)別技術(shù)的研究.pdf
- 基于DSP的車載語(yǔ)音識(shí)別系統(tǒng)研究.pdf
- 基于DSP智能駕駛的語(yǔ)音識(shí)別系統(tǒng)研究.pdf
- 基于HMM的漢語(yǔ)數(shù)字語(yǔ)音識(shí)別系統(tǒng)研究.pdf
- 基于單片機(jī)的語(yǔ)音識(shí)別系統(tǒng)研究.pdf
- 基于matlab的車牌識(shí)別系統(tǒng)
- 基于HMM的嵌入式語(yǔ)音識(shí)別系統(tǒng)研究.pdf
- 基于 matlab 的車牌識(shí)別系統(tǒng)(論文和源碼)
- 基于機(jī)器視覺的棒材實(shí)時(shí)識(shí)別系統(tǒng)研究.pdf
- 基于VC++的車牌識(shí)別系統(tǒng).pdf
- 基于VQ和DTW相結(jié)合的語(yǔ)音識(shí)別算法研究.pdf
評(píng)論
0/150
提交評(píng)論