2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩153頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、本文主要研究了單通道中的語音水印和語音增強算法。語音水印屬于信息隱藏(Information Hiding)的范疇,它在信息安全中扮演著越來越重要的角色,既可以保證信息在傳輸中的完整性,還可以應(yīng)用于版權(quán)保護、身份認(rèn)證、數(shù)字取證、隱蔽通信、帶寬擴展、遺留系統(tǒng)增強等領(lǐng)域。而語音增強屬于信息恢復(fù)(Information Retrieve)的范疇,增強的類型包括譜增強、信號增強和特征增強等。因為在實際環(huán)境中干擾和噪聲總是存在的,所以增強信號往往

2、是必須的,以便進一步加工、處理信息。使用語音增強技術(shù)的好處很多,例如可以改善有背景噪聲時語音通信的聽覺體驗,提高高噪聲背景下語音識別的識別率,幫助聽力受損人士進行更好的溝通。因此,對語音水印算法和語音增強算法的深入研究具有重要的學(xué)術(shù)意義和長遠的經(jīng)濟與社會價值。
  語音水印和語音增強一直都是研究的熱點,但是在實際研究中仍有諸多難點。比如,在語音水印的研究中有兩個難點。一是魯棒性,現(xiàn)有的水印算法對抗PSTN網(wǎng)絡(luò)的信道攻擊很困難。二是

3、嵌入容量,現(xiàn)有的水印算法在窄帶語音中實現(xiàn)數(shù)據(jù)的高速率隱藏很困難。再比如,盡管語音增強是語音信號處理中的基本問題,并且已經(jīng)有多種算法被提出,但是在如何充分利用語音本身的特征、有效去除非平穩(wěn)噪聲、去掉人為噪聲等方面依然存在若干研究難點。為了解決上述問題,本文將對語音水印算法和語音增強算法進行了深入研究。
  本文的主要工作包括兩部分。第一部分是研究語音水印算法。首先,針對PSTN信道,基于擴頻通信和感知濾波原理,提出了能夠?qū)箮V波

4、、重量化、壓擴攻擊的魯棒水印算法。其次,利用語音中低頻部分能量高、高頻部分能量低,以及人耳對高頻部分聽覺的不敏感性,基于子帶語音替換和譜包絡(luò)約束,設(shè)計了具有高嵌入容量的水印算法。第二部分為語音增強算法。首先,基于自回歸模型,推導(dǎo)了模型參數(shù)估計的性能下界,并設(shè)計了能漸進達到下界的迭代維納濾波來估計譜包絡(luò)。其次,結(jié)合自回歸模型和線譜頻率跟蹤,利用語音幀間的時間相關(guān)性來增強語音。通過使用卡爾曼濾波器改進了譜包絡(luò)估計,使得語音增強算法可以適應(yīng)平

5、穩(wěn)與非平穩(wěn)噪聲環(huán)境,并且減少了音樂噪聲。最后,基于實諧模型推導(dǎo)了其參數(shù)估計的性能下界,并且利用基音估計和梳狀濾波,改進了譜估計。
  本文的具體研究內(nèi)容和主要貢獻如下:
  1.在分析了PSTN聲帶信道攻擊的基礎(chǔ)上,提出了一種基于擴頻和感知濾波的PSTN聲帶語音水印算法。該算法改進了產(chǎn)生、嵌入與提取水印信號的方法。為了對抗帶通濾波攻擊,產(chǎn)生水印信號時采用了曼徹斯特非歸零碼作為擴頻碼的脈沖波形,嵌入和提取水印時利用子帶技術(shù)修正

6、了心理聲學(xué)模型和聽覺感知濾波器的設(shè)計。為了對抗線路卡攻擊,設(shè)計了針對帶水印信號的預(yù)處理算法。本文還推導(dǎo)了該算法的理論嵌入容量。實驗結(jié)果表明,本文算法對帶通濾波、重量化、壓擴等攻擊具有魯棒性,并有較高的系統(tǒng)容量和良好的聽覺效果。在聯(lián)合攻擊下,當(dāng)速率為25bps時,誤碼率性能小于0.005,聽覺感知評價的分?jǐn)?shù)超過了4。
  2.利用人耳對高頻語音部分的聽覺不敏感特性,提出了基于子帶替換和譜包絡(luò)約束的窄帶語音水印算法。為了確定子帶替換的

7、頻率范圍,給出了對第三共振峰頻率高斯性的評價方法及其概率密度函數(shù)的參數(shù)估計方法。為了保證水印信號的不可感知性,使用了功率門限法對水印作尺度變換和譜包絡(luò)約束。為了適應(yīng)時變信道和減少誤比特率,嵌入時在隱藏消息序列中加入了訓(xùn)練序列,提取時引入了均衡。另外,從理論上分析了以嵌入容量和誤比特率為指標(biāo)的水印系統(tǒng)性能。實驗結(jié)果表明,建議的水印算法容量高于傳統(tǒng)算法,達到1.2kbps,還能夠?qū)苟喾N攻擊,并具有良好的聽覺效果。
  3.提出了以自

8、回歸建模為基礎(chǔ)的語音譜增強方法,它可以轉(zhuǎn)化為帶噪自回歸過程的參數(shù)估計和最優(yōu)濾波問題。為了評估參數(shù)估計的性能,在頻域中推導(dǎo)了漸進克萊姆-勞下界。為了增強譜估計,建議了一個基于最大似然準(zhǔn)則的迭代估計算法和一個基于最大后驗準(zhǔn)則的迭代維納濾波器。實驗結(jié)果表明,本文建議的算法精確地估計出了模型參數(shù),收斂速度快且漸進達到了克萊姆-勞下界,適用于低階和高階自回歸過程的參數(shù)譜估計。另外,在輸入信噪比為0~5dB時,增強的信號最多可獲得3dB的增益。

9、r>  4.建議了一種使用線譜頻率跟蹤、以自回歸模型為基礎(chǔ)的語音增強方法。通過從帶噪語音中估計出的模型參數(shù)可以重構(gòu)純凈語音。具體地,通過跟蹤線譜頻率的時間軌跡來估計譜包絡(luò),改進了對失真短時譜幅度的估計。算法先對帶噪語音進行預(yù)處理,以便通過線性預(yù)測分析更加準(zhǔn)確地估計出譜增益。通過卡爾曼濾波跟蹤線譜頻率軌跡,譜包絡(luò)的估計也得到了改進??柭鼮V波器的參數(shù)估計通過碼本映射和最大似然估計得到。對該方法的評價包括語譜圖、客觀評價和主觀評價。實驗結(jié)果

10、顯示,與傳統(tǒng)算法相比較,本章采用的方法在各種噪聲條件下都改善了增強的效果。比如,采用PESQ指標(biāo)時,該算法獲得了0.3-0.7分的提高。另外,該算法還減少了音樂噪聲。
  5.提出了以實諧多正弦模型為基礎(chǔ)的語音譜增強方法,它可以轉(zhuǎn)化為對帶噪實諧多正弦模型的參數(shù)估計問題。為了評估參數(shù)估計的性能,推導(dǎo)了漸進克萊姆-勞下界。為了更精確地估計參數(shù),建議了一個基于周期估計和梳狀濾波的預(yù)處理算法。實驗結(jié)果表明,與不使用預(yù)處理的參數(shù)估計相比,使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論