復雜聲學環(huán)境下的麥克風陣列語音定位研究.pdf_第1頁
已閱讀1頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、麥克風陣列可廣泛應用于音/視頻會議系統(tǒng)、語音增強、人機接口、機器人等領(lǐng)域。語音定位技術(shù)是麥克風陣列信號處理的主要內(nèi)容之一。麥克風陣列定位算法分為基于時延估計的定位算法和基于角度估計的定位算法?;诮嵌裙烙嫷亩ㄎ凰惴▽υ春蛡鞲衅髂P陀休^大依賴性,多用于窄帶、平穩(wěn)信號的定位估計,且由于其運算量較大,并不適合說話人定位的實際應用。基于時延估計的定位算法對源信號特性和傳感器模型要求比較寬泛,且其計算量較小、適應性強,因此廣泛應用于說話人語音定位

2、系統(tǒng)。傳統(tǒng)的時延估計定位算法多假設(shè)于理想聲學環(huán)境,而麥克風陣列應用的音/視頻會議等場合常面臨復雜的聲學環(huán)境,這導致了傳統(tǒng)的定位算法無法適用。與傳統(tǒng)的聲源定位相比,麥克風陣列說話人語音定位系統(tǒng)常面臨復雜的聲學環(huán)境,如房間混響干擾,有色噪聲干擾,空間噪聲干擾,非高斯噪聲干擾以及麥克風位置誤差等。
   本文圍繞這些問題,分別針對語音定位系統(tǒng)中的時延估計、聲源定位和語音檢測三部分功能,提出了一些新的算法,實現(xiàn)了復雜聲學環(huán)境下的說話人定

3、位。本文的創(chuàng)新工作如下:
   (1)針對傳統(tǒng)信道盲辨識方法抗噪性能較差的問題,提出了抗噪信道盲辨識框架,并給出了基于雙麥克風的信道盲辨識方法。延遲特征值分解算法。該算法利用延遲相關(guān)矩陣來盲辨識算法,對有色噪聲有較好的抑制作用。
   (2)在抗噪信道盲辨識的框架下,針對混響和有色噪聲下的時延估計問題,提出了自適應延遲特征值分解算法。該算法通過對房間沖激響應進行辨識來抑制混響,同時采用延遲相關(guān)矩陣來抑制有色噪聲。實驗結(jié)果

4、表明,該算法在混響和有色噪聲環(huán)境下可以給出穩(wěn)健的時延估計。
   (3)針對混響和空間噪聲,提出了基于三麥克風的自適應延遲特征值分解時延估計算法。該算法通過對雙聲源三麥克風系統(tǒng)進行盲辨識來估計時延,并利用延遲相關(guān)矩陣來實現(xiàn)對空間噪聲的抑制。
   (4)同時考慮時延估計誤差和麥克風陣列位置誤差,提出了線性校正總體最小二乘定位算法。該算法采用總體最小二乘誤差準則,可以有效地抑制陣列位置誤差,并且由于加入了位置參數(shù)的二次約束

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論