2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、語音識別技術了開創(chuàng)人機交互的新紀元,它被廣泛應用于工業(yè)、軍事、商業(yè)、金融、服務、醫(yī)療、日常生活等很多領域。在實際應用中,由于環(huán)境不匹配,導致識別系統(tǒng)的性能急劇惡化。因而,語音識別的環(huán)境魯棒性成為目前魯棒語音識別研究的熱點和難點。論文先后研究了目前語音識別以及魯棒語音識別技術、人耳的聽覺特性、語音識別中采用的估計準則、噪聲環(huán)境對語音識別影響的途徑,并根據(jù)人耳的感知特性、不同頻帶信號及噪聲的功率譜差異,以及噪聲對不同頻帶識別模型影響的不同,

2、先后采用不同的模型框架、估計準則、匹配方法、可信度信息分析,提出多種魯棒語音識別算法,改進了現(xiàn)有的魯棒語音識別算法。 模型分析與補償技術是目前噪聲環(huán)境下魯棒語音識別研究的重要途徑。在大量的理論分析與研究的基礎上,論文研究了基于 Fletcher-Allen 規(guī)則的子帶框架下的語音識別算法。提出了并行子帶 HMM 最大后驗概率自適應非線性類估計算法和非線性最大后驗統(tǒng)計匹配魯棒語音識別算法。在并行子帶 HMM 最大后驗概率自適應非線

3、性類估計算法中提出了 MAP 估計、環(huán)境映射以及 BP 網(wǎng)絡聯(lián)合做非線性映射分類的方法。該算法在信號信息可信度上采用了信噪比分析,算法中還提出了有效反映噪聲環(huán)境的先驗信息估計方法。在非線性最大后驗統(tǒng)計匹配算法中,提出了依信噪比進行 MAP 統(tǒng)計匹配并聯(lián)合非線性映射進行分類的算法。實驗表明,研究獲得了不同程度識別性能的改進。 基于聽覺特性流組合的研究,論文研究了基于噪聲污染假定的多帶魯棒語音識別算法。論文研究了多帶異步處理模式下的

4、魯棒語音識別算法。首先,論文提出了多帶最大似然魯棒語音識別算法。該算法提出基于多帶模式進行最大似然估計以及線性判別分析或聯(lián)合信噪比及模型近似度判決分析的魯棒語音識別方法。論文根據(jù)多帶分析的特點,還提出了判決多帶最大后驗多變換算法以及它的簡化算法(平均估計和 JamesStein 估計)。該算法采用多帶處理、判別分析、MAP 估計,以及信息多變換等,從多種角度提取識別信息獲得了非常好的性能。論文還提出了聯(lián)合信噪比和模型近似度判別分析的思想

5、和具體處理方法,并對提出的幾種可靠信息合并準則進行了比較實驗。 研究表明,魯棒語音識別應該是基于可信信息抽取的,也就是說不同頻帶信號的處理模式應該是同步、異步交織進行。為此,論文在前面多帶異步處理的基礎上,提出了多帶同步魯棒語音識別算法,可以看到同步信息的利用可以大大簡化模型。然后綜合同步、異步問題的研究,提出了同步一異步語音識別模型,并聯(lián)合對語音信號隨機刪除下語音識別性能的分析,研究了時變一頻變噪聲環(huán)境下的基于信噪比可信度判決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論