版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、說(shuō)話人識(shí)別是一類基礎(chǔ)問(wèn)題,該問(wèn)題可以細(xì)分為兩類:說(shuō)話人辨別問(wèn)題和說(shuō)話人確認(rèn)問(wèn)題。根據(jù)對(duì)語(yǔ)音文本的依賴程度不同,說(shuō)話人識(shí)別又分為文本相關(guān)型、文本無(wú)關(guān)型、文本提示型。識(shí)別說(shuō)話人包括訓(xùn)練/登記和測(cè)試/驗(yàn)證兩個(gè)階段,訓(xùn)練階段建立合法說(shuō)話人(即目標(biāo)說(shuō)話人)特征模板,測(cè)試階段則計(jì)算待識(shí)別說(shuō)話人的測(cè)試語(yǔ)音數(shù)據(jù)與合法說(shuō)話人特征模板的相似度,并得出判斷結(jié)果。
在最近20多年的研究中,說(shuō)話人識(shí)別普遍關(guān)注語(yǔ)音信號(hào)的音源,發(fā)音系統(tǒng),韻律特征。而語(yǔ)音中
2、的呼吸信號(hào)在研究中并沒有受到關(guān)注,甚至將其作為噪音項(xiàng)進(jìn)行剔除。通過(guò)本文的觀察和研究發(fā)現(xiàn),呼吸信號(hào)具有其獨(dú)特性,是呼吸系統(tǒng)意義上的生理指紋。它是人體自然而然產(chǎn)生的,持續(xù)時(shí)間短,發(fā)生頻率低且處理簡(jiǎn)單,呼吸特征是人體與生俱來(lái)的,具有唯一,穩(wěn)定的特點(diǎn)。基于呼吸信號(hào)的這些特點(diǎn),本文提出了一種基于呼吸特征的說(shuō)話人識(shí)別方案—“BreathID”,它具有文識(shí)別準(zhǔn)確率高、文本無(wú)關(guān)、輕量級(jí)且可實(shí)現(xiàn)對(duì)用戶透明的優(yōu)點(diǎn)。
“BreathID”分為3個(gè)部
3、分:呼吸邊界分離,特征提取和選擇,特征匹配。本文通過(guò)CDF統(tǒng)計(jì)分析和實(shí)證研究,選擇梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,簡(jiǎn)稱MFCC)作為說(shuō)話人的呼吸特征。文中提出了基于一組簡(jiǎn)單向量操作的輕量級(jí)的分類算法,最后通過(guò)該分類算法進(jìn)行相似度匹配,做出說(shuō)話人決策。
“BreathID”的實(shí)驗(yàn)分為兩個(gè)部分,第一部分是對(duì)50個(gè)用戶收集數(shù)據(jù)進(jìn)行實(shí)驗(yàn),評(píng)估“BreathID”的總體性能。實(shí)驗(yàn)
4、結(jié)果如下:說(shuō)話人辨別實(shí)驗(yàn)中,方案的錯(cuò)誤辨別率(False Identification Rate:簡(jiǎn)稱FIR)為0.04%;說(shuō)話人確認(rèn)實(shí)驗(yàn)中,方案的錯(cuò)誤接受率(False Acceptance Rate:簡(jiǎn)稱FAR)為0.12%,錯(cuò)誤拒絕率(False Rejection Rate:簡(jiǎn)稱FAR)為0.15%。第二部分通過(guò)另外20個(gè)用戶的數(shù)據(jù)在不同的實(shí)用場(chǎng)景中對(duì)“BreathID”的一致性進(jìn)行評(píng)估,包括文本無(wú)關(guān)性,用戶狀態(tài)(靜坐和走路),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于非線性方法的語(yǔ)音信號(hào)前端處理研究.pdf
- 基于matlab的語(yǔ)音信號(hào)處理
- 基于數(shù)學(xué)形態(tài)學(xué)的語(yǔ)音信號(hào)處理方法研究.pdf
- 聽覺模型與語(yǔ)音信號(hào)處理方法的研究.pdf
- 基于matlab語(yǔ)音信號(hào)處理設(shè)計(jì)
- 低信噪比語(yǔ)音信號(hào)增強(qiáng)處理方法的研究.pdf
- 語(yǔ)音信號(hào)增強(qiáng)方法的研究.pdf
- 語(yǔ)音信號(hào)處理技術(shù)研究.pdf
- 信號(hào)處理課程設(shè)計(jì)---基于matlab的語(yǔ)音信號(hào)處理
- 開題報(bào)告---語(yǔ)音信號(hào)處理
- 基于壓縮感知的語(yǔ)音信號(hào)重構(gòu)方法研究.pdf
- 應(yīng)用DIVA模型處理中文語(yǔ)音信號(hào)方法的研究.pdf
- 基于dsp的語(yǔ)音信號(hào)處理系統(tǒng)設(shè)計(jì)
- 信號(hào)處理課程設(shè)計(jì)基于matlab的語(yǔ)音信號(hào)分析和處理
- 語(yǔ)音信號(hào)前端處理技術(shù)研究.pdf
- 基于小波變換的語(yǔ)音信號(hào)增強(qiáng)方法研究.pdf
- 基于壓縮感知的語(yǔ)音信號(hào)處理及優(yōu)化研究.pdf
- 語(yǔ)音信號(hào)處理課程設(shè)計(jì)
- 基于聽覺神經(jīng)原理的語(yǔ)音信號(hào)處理.pdf
- 語(yǔ)音信號(hào)稀疏表示方法研究.pdf
評(píng)論
0/150
提交評(píng)論