多帶激勵聲碼器關鍵算法的研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：117 大?。?.67MB 人氣指數(shù)：12 舉報 版權申訴

已閱讀1頁，還剩116頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、多帶激勵(MBE)聲碼器在理論上支持高質量的語音合成,是目前在低碼率范圍內研究最普遍的一種語音模型,具有廣泛應用前景。然而MBE聲碼器在實際參數(shù)估計、參數(shù)量化、無線傳輸和語音合成過程中均很有可能會引入誤差,進而影響語音質量,尤其在低碼率應用和信源信道雙重噪聲干擾的情況下語音質量存在很大落差,相關算法有待改進。本文主要針對參數(shù)估計和語音合成過程所涉及的關鍵算法進行改進。
　　由于傳統(tǒng)雙路徑基音跟蹤算法對約束方程的門限取固定經(jīng)驗值,導

2、致基音估計的魯棒性差。首先構造全新的差值不等式作為約束方程,以降低建立門限自適應調整模型的難度。然后通過分析標準基音周期及其倍/次基音所對應的單幀擬合誤差之間的最大差值關系來研究在單幀意義上的倍/次基音干擾特性,推廣得到差值門限過低會降低對倍基音干擾的抑制能力而差值門限過高則會引入更多次基音錯誤的因果關系。從而提出雙門限和全范圍兩種自適應雙路徑基音跟蹤算法,相應的差值門限分別根據(jù)先前幀基音周期長短的統(tǒng)計結果和前一幀的倍基音錯誤識別信息進

3、行更新。實驗結果顯示,以上兩種算法對應基音估計的嚴重錯誤概率(GER)均普遍下降,尤其對于女聲,當信噪比(SNR)為-5dB時女聲基音估計的GER的平均性能改善分別達到82.13％和82.19%,雖然對應基音估計的一般錯誤均值(ME)均普遍增加,但是幅度很小,ME的性能損失相對GER的性能改善而言非常微弱。實驗結果表明,以上兩種算法對不同講話者和不同程度高斯白噪聲干擾均具有較強的適應能力,尤其在嚴重的高斯白噪聲干擾的情況下基音估計準確性

4、的改善更加明顯。
　　子帶劃分不可避免會增加清濁音誤判的概率,現(xiàn)有的常用子帶劃分方式只憑經(jīng)驗進行劃分,產(chǎn)生的失真影響較大,因此結合子帶清濁音誤判所導致的失真影響與子帶能量必然有關的性質,提出一種基于譜分布特性的子帶劃分方式,根據(jù)當前幀的諧波結構以及諧波能量分布,按照兼顧各個子帶之間的帶寬平衡和能量平衡的原則進行劃分。另外,背景噪聲會降低子帶信號的濁音度,傳統(tǒng)子帶清濁音判決算法存在魯棒性差的問題,因此提出一種基于相關增強的子帶清濁音

5、判決算法:通過對不同背景環(huán)境和SNR的帶噪語音以及純凈語音的清濁音聚類采用Fisher最佳投影矢量進行映射,得到新的更具可辨識性的清音聚類和濁音聚類,從而增強特征值與清濁音之間的相關性;同時采用以先前幀子帶清濁音狀態(tài)、清濁音狀態(tài)在時間上的相關系數(shù)矩陣作為先驗概率輸入信息的最大后驗概率判決準則,從而引入相鄰幀清濁音之間的相關性。實驗結果表明,上述優(yōu)化算法的判決性能從整體上得到改善,在不同背景環(huán)境下均具有較強的抗噪聲能力,語音聽覺質量提高。

6、
　　低碼率MBE聲碼器通常采用線性預測(LP)全極點模型來逼近MBE譜幅度矢量并最終將其等效為線譜頻率(LSF)參數(shù)形式。當MBE譜密度序列過于稀疏或存在頻域采樣偏移時不能用于準確估計自相關序列,導致LP譜與MBE譜之間的逼近誤差較大,因此提出一種MBE譜密度內插修正方案,將MBE譜密度序列擴展為頻域均勻分布且頻率充分取樣的序列,并校準LP增益以避免由MBE譜密度內插造成的不同語音幀之間總功率不同程度的波動。另外,LSF系數(shù)提取

7、算法不能確保實際LSF系數(shù)是升序的,因此提出一種LSF系數(shù)優(yōu)化方案,分別在兩個方向上進行局部微調,并直接將兩者平均作為LSF系數(shù)的最終結果。實驗結果表明,上述改進算法能夠有效降低LP譜包絡估計誤差并避免合成語音出現(xiàn)局部異常尖峰,語音聽覺質量提高。
　　低碼率MBE聲碼器通常采用重新生成方式得到濁音諧波相位信息,現(xiàn)有的相位生成算法容易引起語音波形失衡,相應語音信號的峰均比偏高,從而導致信號飽和失真概率增加或系統(tǒng)待機時間縮短,因此提出

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多帶激勵聲碼器關鍵算法的研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

多帶激勵聲碼器關鍵算法的研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載