語音變調(diào)算法研究及其在語音合成中的作用.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著信息技術(shù)和多媒體技術(shù)的發(fā)展,普通的音視頻素材已經(jīng)不能滿足人們生產(chǎn)活動和娛樂生活的需求。應(yīng)運而生的語音變調(diào)技術(shù),是在保持音頻文件播放速度不變的前提下,按照某種算法對說話人的音調(diào)進行調(diào)整,從而實現(xiàn)音調(diào)的升高或降低,而語音音調(diào)的不同主要是由基音頻率和共振峰頻率來決定,因此音調(diào)的改變可以通過改變原始語音信號的基音頻率和共振峰頻率來實現(xiàn)。目前存在的語音變調(diào)方法都還不是很完善,還存在著各種各樣的缺點。
   語音合成技術(shù)是隨著人們對人機

2、交互提出要求而發(fā)展起來的一種語音信號處理技術(shù),是將計算機輸出的或人為輸入的一些非語音信息如文字、數(shù)字、標(biāo)點符號等轉(zhuǎn)換為清晰自然可懂的語音輸出,這種技術(shù)又稱為文語轉(zhuǎn)換技術(shù)(簡稱TTS)。較早的文語轉(zhuǎn)換系統(tǒng)在合成模塊一般采用參數(shù)合成法,其中共振峰合成法和LPC合成法應(yīng)用較多。對參數(shù)合成法的研究起步比較早,所以參數(shù)合成法已具有相對成熟的理論基礎(chǔ),而且實現(xiàn)起來較簡單,但實際合成的連續(xù)語音不自然,有明顯的機器腔。二十世紀九十年代初,基音同步疊加技

3、術(shù)的研究開始興起,并成功運用到了TTS系統(tǒng)中?;敉蒋B加(PSOLA)技術(shù)不同于簡單的波形拼接技術(shù),它在對語音基元拼接的時候,首先對音頻文件分析得到基音標(biāo)注,然后以基音周期為單位對拼接單元的基頻、音長和音強等韻律特征做出適合的調(diào)整,在不改變原始語音基元音質(zhì)的基礎(chǔ)上,靈活地改變語音的韻律特征。本文通過分析研究現(xiàn)有語音合成方法存在的優(yōu)缺點,在PSOLA算法的基礎(chǔ)上,提出了一種時長和基頻分步處理的語音合成方法,并通過實驗證實了其有效性。

4、r>   本文主要工作如下:
   1、對現(xiàn)有變調(diào)方法作了分類分析,主要分析了3種典型方法的變調(diào)原理和特點,即時域同步疊加固定合成法(SOLA-FS)、頻域插值法和相位聲碼器法,并通過分析研究指出了它們的優(yōu)缺點。然后在SOLA-FS算法的基礎(chǔ)上,提出了一種改進的基于SOLA-FS的變調(diào)方法,仿真實驗發(fā)現(xiàn)該變調(diào)方法不僅能在保持音頻播放時間不變的前提下改變音調(diào),而且降低了算法復(fù)雜度,并在一定程度上減少了噪音,并給出了改進前后運行時

5、間的比較,以及改進前后對應(yīng)的語譜圖。實驗發(fā)現(xiàn)改進的SOLA-FS方法在自然度上的優(yōu)勢明顯優(yōu)于其他變調(diào)方法,然后給出了三種不同變調(diào)算法下變調(diào)結(jié)果的主觀測聽對比。結(jié)果表明:不論對語音音調(diào)的升高還是降低,在相同變調(diào)系數(shù)下,改進的SOLA-FS方法均具有最好的變調(diào)效果。
   2、將改進的SOLA-FS變調(diào)方法與波形拼接技術(shù)相結(jié)合,提出了一種音高、時長分步處理的語音韻律拼接合成方法,既保持了語音拼接單元的清晰度和自然度,也在一定程度上提

6、高了合成語音的韻律修改能力。文中給出了在不同的音高調(diào)整參數(shù)下,傳統(tǒng)的TD-PSOLA方法與時頻分步合成法在基頻修改時所對應(yīng)的合成語音的時域圖和基頻軌跡圖,并在最后給出了算法復(fù)雜度的比較。實驗證明,傳統(tǒng)的TD-PSLOA方法在音高修改時,其合成語音對應(yīng)的基頻軌跡的包絡(luò)與語音樣本的基頻包絡(luò)有較大出入,尤其是當(dāng)基頻修改幅度較大時,會造成疊加單元的混疊或遺漏,從而影響合成語音的效果。而時頻分步法在音高修改時,其合成語音對應(yīng)的基頻包絡(luò)相對語音樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論