版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、語音檢索是指對于用戶輸入的查詢請求,從語音庫中檢索并返回滿足該請求的語音片段。隨著科技的日益進(jìn)步和互聯(lián)網(wǎng)的飛速發(fā)展,人們接觸到的多媒體信息也呈指數(shù)增長,這其中廣播新聞?wù)Z音占據(jù)了很大的比重,且易獲取,具有重要的科研價(jià)值。而利用語音檢索技術(shù)可以幫助人們在海量的多媒體數(shù)據(jù)中迅速找到自己感興趣的內(nèi)容,因此本課題有著重要的研究意義和實(shí)用價(jià)值。
語音檢索技術(shù)其實(shí)是語音識別技術(shù)與信息檢索技術(shù)的有機(jī)結(jié)合,然而簡單的技術(shù)結(jié)合會導(dǎo)致檢索性能嚴(yán)重依
2、賴于識別系統(tǒng)的識別精度。因此在識別系統(tǒng)性能一定的情況下,研究者將精力集中在多候選的識別結(jié)果形式上,常見的多候選識別形式有N-best、網(wǎng)格 Lattice和混淆網(wǎng)絡(luò),其中N-best未包含所有的候選結(jié)果,而 Lattice結(jié)構(gòu)含較多冗余且不利于建立索引,因而往往使用結(jié)構(gòu)更緊湊的混淆網(wǎng)絡(luò)形式。另外,在識別基元的選擇上,以詞為基元無法避免集外詞問題,因此在漢語語音檢索技術(shù)的研究中常采用基于音節(jié)的網(wǎng)格結(jié)構(gòu)。
本課題首先利用上下文相關(guān)
3、技術(shù)對識別系統(tǒng)中的聲學(xué)模型進(jìn)行訓(xùn)練,重點(diǎn)分析了模型訓(xùn)練過程中參數(shù)共享策略及高斯混合數(shù)的影響,并結(jié)合語言模型建立了大詞匯連續(xù)語音識別系統(tǒng),接著利用向量空間模型在 One Best識別形式上完成了語音檢索基線系統(tǒng)。而對于包含多候選結(jié)果的網(wǎng)格形式,利用前向后向算法計(jì)算出每個候選項(xiàng)的后驗(yàn)概率,在此基礎(chǔ)上進(jìn)行聚類、剪枝等操作,生成了結(jié)構(gòu)更加節(jié)湊的混淆網(wǎng)絡(luò),并通過改進(jìn)的向量空間模型建立索引,搭建語音檢索系統(tǒng)。此外,本文對檢索系統(tǒng)的基元進(jìn)行對比研究,
4、如果以詞為基元,則無法解決集外詞查詢問題,且系統(tǒng)的召回率較低;而以音節(jié)為基元,又會降低檢索系統(tǒng)的準(zhǔn)確率,因此本文提出一種基于后向融合的多基元混合檢索系統(tǒng)。
實(shí)驗(yàn)表明,采用上下文相關(guān)的聲學(xué)建模技術(shù)可以很好的適應(yīng)發(fā)音環(huán)境的變化,提高了識別系統(tǒng)的準(zhǔn)確率和魯棒性;改進(jìn)的向量空間模型能更好的體現(xiàn)特征向量在文檔中所占的比重,可以提高檢索系統(tǒng)的檢索精度;而多基元混合檢索系統(tǒng)的使用不僅可以從根本解決集外詞問題,而且能使系統(tǒng)在準(zhǔn)確率和召回率上達(dá)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專項(xiàng)客戶新聞自動檢索方法研究與應(yīng)用.pdf
- 專項(xiàng)主題新聞自動檢索方法研究與應(yīng)用.pdf
- 客戶負(fù)面新聞自動檢索方法的研究與應(yīng)用.pdf
- 新聞廣播語音自動摘要技術(shù)研究.pdf
- 參考文獻(xiàn)的自動檢索方法研究.pdf
- 血管內(nèi)超聲圖像序列自動檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 面向新聞?wù)Z料的漢語語音關(guān)鍵詞檢測技術(shù)研究.pdf
- 面向語音檢索的漢語關(guān)鍵詞識別技術(shù)研究及應(yīng)用.pdf
- 基于混淆網(wǎng)絡(luò)的漢語語音檢索技術(shù)研究.pdf
- 面向自由曲面自動檢測加工系統(tǒng)的關(guān)鍵技術(shù)研究.pdf
- 面向問答系統(tǒng)的段落檢索技術(shù)研究.pdf
- 面向視頻檢索的高效哈希技術(shù)研究.pdf
- 變形蠕蟲自動檢測技術(shù)研究.pdf
- 齒輪超聲自動檢測技術(shù)研究.pdf
- 面向移動GIS的語音識別技術(shù)研究.pdf
- 面向公安偵查應(yīng)用的圖像檢索技術(shù)研究.pdf
- 廣播語音的自動標(biāo)注系統(tǒng).pdf
- 基于系統(tǒng)融合的語音查詢項(xiàng)檢索技術(shù)研究.pdf
- 多態(tài)蠕蟲自動檢測技術(shù)研究.pdf
- 基于內(nèi)容的新聞視頻檢索關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論