參數(shù)化統(tǒng)計語音合成的自然度研究——面向遠程醫(yī)療服務(wù)的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、中國的老齡化進程加速,使得現(xiàn)有醫(yī)療服務(wù)模式無法滿足老年人日益增長的醫(yī)療服務(wù)需求。遠程醫(yī)療服務(wù)是解決這一問題的有效手段。利用機器智能分析用戶長期生理數(shù)據(jù),自動發(fā)送健康管理報告和提醒短信,進行遠程管理,已成為發(fā)展趨勢。對于大部分老年人,文字短信或報告閱讀不便。本文主要研究把文字報告轉(zhuǎn)換成高自然度語音報告,目的是在遠程醫(yī)療服務(wù)系統(tǒng)中引入語音信息反饋方式,為老人提供更好的服務(wù)體驗。
  參數(shù)化統(tǒng)計語音合成系統(tǒng)是目前比較主流的合成系統(tǒng)。本文

2、基于該類型系統(tǒng),以高自然度語音合成為目標(biāo),開展基頻提取算法比較、譜特征參數(shù)選擇和情感語音合成三方面的研究工作。
  基頻和譜特征是影響合成語音自然度的兩個重要聲學(xué)參數(shù)?;l是一個描述語音激勵源的特征,本文對比研究AMDF和STRAIGHT兩種基頻提取算法對合成語音自然度的影響,實驗結(jié)果表明采用STRAIGHT算法提取得到的基頻更加準(zhǔn)確,有助于改善合成語音的音質(zhì)。譜特征主要反映語音的聲道特性,本文通過主客觀評測方法,對比研究線性預(yù)測

3、系數(shù)、線譜對系數(shù)、Mel倒譜系數(shù)、Mel廣義倒譜系數(shù)、基于Mel廣義倒譜線譜對系數(shù)五種譜特征參數(shù),對合成語音自然度的影響。主觀評測表明采用線譜合成語音自然度較好,客觀評測表明采用Mel倒譜合成語音自然度較好。
  賦予合成語音情感變化,使合成語音更好的模擬自然語音,對合成語音自然度有著重要影響。本文分別提取語音信號的基頻、時長、能量、共振峰等情感特征,在分析六種情感語音信號:中性、驚奇、高興、恐懼、憤怒、悲傷的情感特征基礎(chǔ)上,總結(jié)

4、情感特征的變化趨勢,制定情感特征修改規(guī)則,并采用PSOLA算法修改中性語音的情感特征,合成出情感語音。通過主客觀方法評測合成語音的情感和自然度,實驗結(jié)果表明合成語音可以較好的表達高興、憤怒和悲傷情感,有助于提高合成語音的自然度。
  本文根據(jù)自然度研究的實驗結(jié)果,構(gòu)建一個高自然度語音合成工具,選用STRAIGHT算法提取基頻,選用線譜對譜特征參數(shù)合成中性語音,同時結(jié)合語音的情感表達。實現(xiàn)了將健康報告轉(zhuǎn)換成高自然度語音報告,并對報告

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論