單通道語音水印與語音增強算法研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-06 格式：pdf 頁數(shù)：154 大?。?4.57MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩153頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、本文主要研究了單通道中的語音水印和語音增強算法。語音水印屬于信息隱藏(Information Hiding)的范疇，它在信息安全中扮演著越來越重要的角色，既可以保證信息在傳輸中的完整性，還可以應(yīng)用于版權(quán)保護、身份認(rèn)證、數(shù)字取證、隱蔽通信、帶寬擴展、遺留系統(tǒng)增強等領(lǐng)域。而語音增強屬于信息恢復(fù)(Information Retrieve)的范疇，增強的類型包括譜增強、信號增強和特征增強等。因為在實際環(huán)境中干擾和噪聲總是存在的，所以增強信號往往

2、是必須的，以便進一步加工、處理信息。使用語音增強技術(shù)的好處很多，例如可以改善有背景噪聲時語音通信的聽覺體驗，提高高噪聲背景下語音識別的識別率，幫助聽力受損人士進行更好的溝通。因此，對語音水印算法和語音增強算法的深入研究具有重要的學(xué)術(shù)意義和長遠的經(jīng)濟與社會價值。
　　語音水印和語音增強一直都是研究的熱點，但是在實際研究中仍有諸多難點。比如，在語音水印的研究中有兩個難點。一是魯棒性，現(xiàn)有的水印算法對抗PSTN網(wǎng)絡(luò)的信道攻擊很困難。二是

3、嵌入容量，現(xiàn)有的水印算法在窄帶語音中實現(xiàn)數(shù)據(jù)的高速率隱藏很困難。再比如，盡管語音增強是語音信號處理中的基本問題，并且已經(jīng)有多種算法被提出，但是在如何充分利用語音本身的特征、有效去除非平穩(wěn)噪聲、去掉人為噪聲等方面依然存在若干研究難點。為了解決上述問題，本文將對語音水印算法和語音增強算法進行了深入研究。
　　本文的主要工作包括兩部分。第一部分是研究語音水印算法。首先，針對PSTN信道，基于擴頻通信和感知濾波原理，提出了能夠?qū)箮V波

4、、重量化、壓擴攻擊的魯棒水印算法。其次，利用語音中低頻部分能量高、高頻部分能量低，以及人耳對高頻部分聽覺的不敏感性，基于子帶語音替換和譜包絡(luò)約束，設(shè)計了具有高嵌入容量的水印算法。第二部分為語音增強算法。首先，基于自回歸模型，推導(dǎo)了模型參數(shù)估計的性能下界，并設(shè)計了能漸進達到下界的迭代維納濾波來估計譜包絡(luò)。其次，結(jié)合自回歸模型和線譜頻率跟蹤，利用語音幀間的時間相關(guān)性來增強語音。通過使用卡爾曼濾波器改進了譜包絡(luò)估計，使得語音增強算法可以適應(yīng)平

5、穩(wěn)與非平穩(wěn)噪聲環(huán)境，并且減少了音樂噪聲。最后，基于實諧模型推導(dǎo)了其參數(shù)估計的性能下界，并且利用基音估計和梳狀濾波，改進了譜估計。
　　本文的具體研究內(nèi)容和主要貢獻如下:
　　1.在分析了PSTN聲帶信道攻擊的基礎(chǔ)上，提出了一種基于擴頻和感知濾波的PSTN聲帶語音水印算法。該算法改進了產(chǎn)生、嵌入與提取水印信號的方法。為了對抗帶通濾波攻擊，產(chǎn)生水印信號時采用了曼徹斯特非歸零碼作為擴頻碼的脈沖波形，嵌入和提取水印時利用子帶技術(shù)修正

6、了心理聲學(xué)模型和聽覺感知濾波器的設(shè)計。為了對抗線路卡攻擊，設(shè)計了針對帶水印信號的預(yù)處理算法。本文還推導(dǎo)了該算法的理論嵌入容量。實驗結(jié)果表明，本文算法對帶通濾波、重量化、壓擴等攻擊具有魯棒性，并有較高的系統(tǒng)容量和良好的聽覺效果。在聯(lián)合攻擊下，當(dāng)速率為25bps時，誤碼率性能小于0.005，聽覺感知評價的分?jǐn)?shù)超過了4。
　　2.利用人耳對高頻語音部分的聽覺不敏感特性，提出了基于子帶替換和譜包絡(luò)約束的窄帶語音水印算法。為了確定子帶替換的

7、頻率范圍，給出了對第三共振峰頻率高斯性的評價方法及其概率密度函數(shù)的參數(shù)估計方法。為了保證水印信號的不可感知性，使用了功率門限法對水印作尺度變換和譜包絡(luò)約束。為了適應(yīng)時變信道和減少誤比特率，嵌入時在隱藏消息序列中加入了訓(xùn)練序列，提取時引入了均衡。另外，從理論上分析了以嵌入容量和誤比特率為指標(biāo)的水印系統(tǒng)性能。實驗結(jié)果表明，建議的水印算法容量高于傳統(tǒng)算法，達到1.2kbps，還能夠?qū)苟喾N攻擊，并具有良好的聽覺效果。
　　3.提出了以自

8、回歸建模為基礎(chǔ)的語音譜增強方法，它可以轉(zhuǎn)化為帶噪自回歸過程的參數(shù)估計和最優(yōu)濾波問題。為了評估參數(shù)估計的性能，在頻域中推導(dǎo)了漸進克萊姆-勞下界。為了增強譜估計，建議了一個基于最大似然準(zhǔn)則的迭代估計算法和一個基于最大后驗準(zhǔn)則的迭代維納濾波器。實驗結(jié)果表明，本文建議的算法精確地估計出了模型參數(shù)，收斂速度快且漸進達到了克萊姆-勞下界，適用于低階和高階自回歸過程的參數(shù)譜估計。另外，在輸入信噪比為0～5dB時，增強的信號最多可獲得3dB的增益。

9、r>　　4.建議了一種使用線譜頻率跟蹤、以自回歸模型為基礎(chǔ)的語音增強方法。通過從帶噪語音中估計出的模型參數(shù)可以重構(gòu)純凈語音。具體地，通過跟蹤線譜頻率的時間軌跡來估計譜包絡(luò)，改進了對失真短時譜幅度的估計。算法先對帶噪語音進行預(yù)處理，以便通過線性預(yù)測分析更加準(zhǔn)確地估計出譜增益。通過卡爾曼濾波跟蹤線譜頻率軌跡，譜包絡(luò)的估計也得到了改進?？柭鼮V波器的參數(shù)估計通過碼本映射和最大似然估計得到。對該方法的評價包括語譜圖、客觀評價和主觀評價。實驗結(jié)果

10、顯示，與傳統(tǒng)算法相比較，本章采用的方法在各種噪聲條件下都改善了增強的效果。比如，采用PESQ指標(biāo)時，該算法獲得了0.3-0.7分的提高。另外，該算法還減少了音樂噪聲。
　　5.提出了以實諧多正弦模型為基礎(chǔ)的語音譜增強方法，它可以轉(zhuǎn)化為對帶噪實諧多正弦模型的參數(shù)估計問題。為了評估參數(shù)估計的性能，推導(dǎo)了漸進克萊姆-勞下界。為了更精確地估計參數(shù)，建議了一個基于周期估計和梳狀濾波的預(yù)處理算法。實驗結(jié)果表明，與不使用預(yù)處理的參數(shù)估計相比，使

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

單通道語音水印與語音增強算法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

單通道語音水印與語音增強算法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載