唇讀的靜動態(tài)特征表示方法研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、唇讀(Lipreading)研究試圖賦予計算機根據(jù)唇部運動辨別說話內容和根據(jù)唇部運動規(guī)律辨別人物身份的能力。該研究具有重要的科學意義和應用價值。從學科建設和發(fā)展的角度,唇讀作為一個科學問題,是一個典型的圖像模式分析、理解和分類計算的問題,涉及模式識別,計算機視覺,智能人機交互,認知科學等多個學科。同時,作為生物特征識別技術之一的基于唇讀的說話人識別技術則在公共安全、信息安全等領域具有潛在的應用前景。
  目前,唇讀在說話內容識別上

2、還沒有獲得理想的識別性能,其中一個重要的原因就是沒有對唇區(qū)特征區(qū)域給出很好的定義和有效的特征表示。本文重點探討了特征表示的一些技術和關鍵問題,對唇區(qū)的特征區(qū)域標定,靜、動態(tài)特征表示方面進行了專門研究。本文主要的研究工作如下:
  1.提出了基于統(tǒng)計的自適應特征區(qū)域標定方法。特征區(qū)域的標定是唇讀特征表示的第一步,本文提出的標定方法首先通過手動標定唇的“紅色區(qū)域”,然后對其范圍進行統(tǒng)計,得到以中心點為基準的最大尺寸,并將統(tǒng)計信息反饋給

3、預處理模塊,由預處理模塊自動對特征區(qū)域重新標定,由此可以使標定尺寸自適應于不同的圖片集。這種方法在本文的所有特征表示方法上取得了性能提升。
  2.基于靜態(tài)圖像的特征表示的研究中,本文對PCA、DCT、Gabor方法在唇讀中的應用進行了深入研究和實驗對比。針對目前的特征表示方法沒有泛化能力的問題進行了探討,引入一種新的特征描述子:局部二值模式,提出局部二值模式在唇讀中的應用方法,該方法具有良好的泛化能力和較快的計算速度,在未來的實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論