版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、本文以特征波形內(nèi)插(CWI)編碼算法為核心,對2.4kbps以下的低速率語音編碼進(jìn)行研究,從語音編碼模型和數(shù)據(jù)壓縮兩方面出發(fā),力圖在更低的編碼速率下提高語音合成質(zhì)量。本文的研究工作主要包括:
(1)對線譜頻率(LSF)參數(shù)采用瞬時分解方法實現(xiàn)數(shù)據(jù)壓縮。對修正嚴(yán)格瞬時分解算法進(jìn)行改進(jìn),提出了一種有限誤差的修正嚴(yán)格瞬時分解算法。該算法重新規(guī)定事件插入法則,增加事件消除機(jī)制,使分解誤差只受預(yù)設(shè)誤差門限控制,實現(xiàn)靈活調(diào)節(jié)輸出事件速
2、率的目的。對LSF參數(shù)量化時,新算法能在相同編碼速率下,獲得比傳統(tǒng)算法更低的平均譜失真。
(2)針對瞬時分解算法在對LSF參數(shù)數(shù)據(jù)壓縮時出現(xiàn)編碼速率波動的問題,提出了一種自適應(yīng)事件速率的瞬時分解算法。自適應(yīng)算法檢測短時事件速率,預(yù)測所需事件速率對應(yīng)的誤差門限,通過短時速率的不斷更新,最終使事件的輸出速率穩(wěn)定在預(yù)設(shè)事件速率附近,從而穩(wěn)定編碼速率,提高了瞬時分解算法的實用性。
(3)對瞬時分解算法的事件函數(shù)進(jìn)行優(yōu)
3、化。本文通過等級提升算法改進(jìn)事件函數(shù)形狀的生成機(jī)制。新算法不僅使兩事件間的累計重建誤差達(dá)到最小,同時也保證了事件函數(shù)的凸性。與傳統(tǒng)事件函數(shù)構(gòu)造方法相比,優(yōu)化后的瞬時分解算法能夠更好地擬合原LSF參數(shù)軌跡,增強(qiáng)分解效果。
(4)由于傳統(tǒng)CWI算法對特征波形相位信息的忽略,以及對特征波形的整體對齊,往往造成語音高頻諧波分量丟失,從而導(dǎo)致語音的噪聲感。為提高合成語音的質(zhì)量,提出了一種基于多帶的2.4kbps特征波形內(nèi)插算法。該算
4、法引入語音多帶清濁音標(biāo)志;并以此為依據(jù)對波形內(nèi)插編碼模型中的慢漸變波形和快漸變波形的相位譜進(jìn)行估計,在語音合成時則對特征波形采取部分對齊的方法。與傳統(tǒng)算法相比,新算法明顯提高了語音的清晰度。與標(biāo)準(zhǔn)2.4kbps混合激勵線性預(yù)測語音編碼算法相比,該算法合成語音質(zhì)量亦略顯優(yōu)勢。
(5)為進(jìn)一步降低編碼速率,提出了一種基于非負(fù)矩陣分解的1kbps波形內(nèi)插語音編碼算法。該算法對特征波表面的幅度矩陣進(jìn)行非負(fù)矩陣分解,以獲得局部特征矩
5、陣,并對該局部特征矩陣進(jìn)行約束和改進(jìn),使優(yōu)化后局部特征更加突出,對應(yīng)的基矢量進(jìn)一步稀疏,從而有利于對權(quán)矢量的量化,以實現(xiàn)對特征波表面的高效編碼。新算法同時加入清濁音標(biāo)志,對特征波表面的相位譜進(jìn)行估計,以更好的提高合成語音質(zhì)量。實驗表明,新算法能夠在1kbps的低編碼速率條件下,獲得與1.2kbps混合激勵線性預(yù)測語音編碼算法相近的合成語音質(zhì)量,取得了較好的效果。
(6)對語音的頻帶分割進(jìn)行探討,提出了一種基于諧波和噪聲能量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 低速率波形內(nèi)插語音編碼關(guān)鍵技術(shù)的研究.pdf
- 自適應(yīng)低速率語音編碼關(guān)鍵技術(shù)研究.pdf
- 低速率語音編碼的研究.pdf
- 高保真低速率音頻編碼關(guān)鍵技術(shù)研究.pdf
- 超低速率語音編碼的研究.pdf
- 低速率語音編碼隱寫技術(shù)研究.pdf
- 低速率語音編碼器研究.pdf
- 超低速率語音編碼算法研究.pdf
- 甚低速率語音編碼算法研究.pdf
- 低速率語音編碼傳輸方案.pdf
- 基于MELP低速率語音編碼.pdf
- 基于DSP的低速率語音編碼研究.pdf
- 低速率語音編碼MELP算法的研究.pdf
- 低速率WI語音編碼中基音檢測技術(shù)研究.pdf
- 低速率多帶激勵線性預(yù)測語音編碼技術(shù)的研究.pdf
- 甚低速率波形內(nèi)插語音編碼研究.pdf
- 基于語音識別與合成的低速率語音編碼研究.pdf
- 基于線性預(yù)測編碼的低速率語音編碼算法的研究.pdf
- 變速率語音算法關(guān)鍵技術(shù)的研究.pdf
- 基于保密通信的極低速率語音編碼技術(shù)的研究.pdf
評論
0/150
提交評論