版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近二十年來,語音識(shí)別技術(shù)取得很大的進(jìn)步,逐漸從實(shí)驗(yàn)室走進(jìn)市場中。專家預(yù)計(jì),在未來10年內(nèi),語音識(shí)別相關(guān)的技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。雖然目前的語音識(shí)別技術(shù)取得了很大的進(jìn)步,但是在較大詞匯量、高實(shí)時(shí)性、系統(tǒng)消耗資源比較低和較高的識(shí)別率等方面還存在可很大的研究價(jià)值。在日常生活中,語音技術(shù)在控制服務(wù)機(jī)器人領(lǐng)域得到很大的應(yīng)用和發(fā)展,研究語音控制服務(wù)機(jī)器人運(yùn)動(dòng)具有很大的價(jià)值和應(yīng)用前景。本文介紹的語音控制系統(tǒng)
2、就是應(yīng)用語音識(shí)別技術(shù)來實(shí)現(xiàn)服務(wù)機(jī)器人的運(yùn)動(dòng)。
首先,本文介紹了研究內(nèi)容的相關(guān)的歷史背景和國內(nèi)外的研究現(xiàn)狀,這其中包括分析了服務(wù)機(jī)器人運(yùn)動(dòng)控制、語音識(shí)別、語音端點(diǎn)檢測(cè)和語音特征降維的研究現(xiàn)狀。
其次,本文介紹了對(duì)語音數(shù)據(jù)進(jìn)行預(yù)處理的方法,主要包括語音信號(hào)的預(yù)加重、分幀、加窗和端點(diǎn)檢測(cè)。本章提出了基于對(duì)數(shù)能量譜熵的端點(diǎn)檢測(cè)方法,由于其計(jì)算簡單可應(yīng)用于中低端嵌入式平臺(tái),為后面將控制程序移植到安卓手機(jī)打下了基礎(chǔ)。然后,本章介
3、紹了提取語音的梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC)的方法,為后面的語音識(shí)別提供有效的語音信號(hào)特征數(shù)據(jù)。
第三,本章主要介紹了隱馬爾科夫模型(HMM)的三個(gè)算法,比較了動(dòng)態(tài)時(shí)問規(guī)整算法(Dynamic Time Warping,DTW)和隱馬爾科夫模型(HMM)的優(yōu)缺點(diǎn)。根據(jù)服務(wù)機(jī)器人語音控制系統(tǒng)的語音識(shí)別對(duì)象為非特定人的實(shí)際情況,本文選定隱馬爾科夫模型(HMM)作
4、為服務(wù)機(jī)器人語音控制系統(tǒng)的語音識(shí)別算法。
第四,由于語音特征參數(shù)存在數(shù)據(jù)冗余、維數(shù)高的問題,導(dǎo)致隱馬爾科夫模型訓(xùn)練時(shí)間長,本文通過用主成分分析法(Principal Component Analysis,PCA)對(duì)語音特征參數(shù)(MFCC)進(jìn)行降維。由于在大詞匯量語音識(shí)別過程中,系統(tǒng)的計(jì)算量過大和占用內(nèi)存過多從而導(dǎo)致識(shí)別時(shí)間過長,本文提出了基于k均值聚類分組算法,此處對(duì)降維后語音特征參數(shù)(MFCC)進(jìn)行K均值聚類分組,從而得到穩(wěn)
5、定的分組特征參數(shù)。
第五,本章介紹設(shè)計(jì)的服務(wù)機(jī)器人語音控制系統(tǒng),該系統(tǒng)的開發(fā)是在eclipse平臺(tái)上利用JAVA語言編程進(jìn)行,第一部分主要是開發(fā)系統(tǒng)的控制界面,第二部分是開發(fā)語音數(shù)據(jù)處理和語音識(shí)別算法程序。
第六,在本章中介紹了算法的仿真和數(shù)據(jù)分析,并手動(dòng)調(diào)試服務(wù)機(jī)器人語音控制系統(tǒng)。實(shí)驗(yàn)結(jié)果表明:提出基于對(duì)數(shù)能量譜熵的端點(diǎn)檢測(cè)方法提高了端點(diǎn)檢測(cè)的準(zhǔn)確性。在保證準(zhǔn)確率基本不變的情況下,通過對(duì)語音特征參數(shù)的PCA降維和語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 輪椅機(jī)器人語音識(shí)別、控制技術(shù)的研究.pdf
- 服務(wù)機(jī)器人語音唇讀人機(jī)交互技術(shù)研究.pdf
- 輪椅機(jī)器人語音識(shí)別控制系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 移動(dòng)機(jī)器人語音控制技術(shù)研究.pdf
- 移動(dòng)機(jī)器人語音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 機(jī)器人語音識(shí)別算法的研究外文翻譯
- 機(jī)器人語音變調(diào)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于HMM算法的仿人機(jī)器人語音識(shí)別技術(shù)的研究.pdf
- 移動(dòng)機(jī)器人語音識(shí)別控制仿真系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 網(wǎng)絡(luò)化智能控制系統(tǒng)研究——網(wǎng)絡(luò)機(jī)器人語音識(shí)別技術(shù)研究
- 網(wǎng)絡(luò)化智能控制系統(tǒng)研究——網(wǎng)絡(luò)機(jī)器人語音識(shí)別技術(shù)研究.pdf
- 基于HMM的機(jī)器人語音識(shí)別系統(tǒng)的研究.pdf
- 服務(wù)機(jī)器人語音交互及視覺伺服控制研究.pdf
- 四足機(jī)器人語音控制系統(tǒng)研究與實(shí)現(xiàn).pdf
- 噪聲環(huán)境下移動(dòng)機(jī)器人語音控制技術(shù)研究.pdf
- 機(jī)器人語音交互系統(tǒng)的研究與設(shè)計(jì).pdf
- 基于DSP的機(jī)器人語音命令識(shí)別系統(tǒng)研制.pdf
- 家用機(jī)器人語音識(shí)別及人機(jī)交互系統(tǒng)的研究.pdf
- 基于DSP的機(jī)器人語音識(shí)別及控制系統(tǒng)設(shè)計(jì).pdf
- 智能服務(wù)機(jī)器人表情識(shí)別技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論