視頻中文字檢測技術研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著網(wǎng)絡技術的發(fā)展,數(shù)字化圖像和視頻增長非???。隨著移動數(shù)碼相機以及手機等的普及,各種拍攝來的自然場景的數(shù)字圖像也是到處可見。為了方便管理海量的視頻和圖像信息,使用戶能夠快速得定位自己感興趣的視頻和圖像內(nèi)容。產(chǎn)生了許多視頻和圖像處理及理解的實際需求,進而推動了人們對視頻和圖像內(nèi)容的分析和研究。在視頻內(nèi)容分析方面,研究者主要對視頻內(nèi)容的結構化分析和檢索技術比較關注;在圖像內(nèi)容分析方面,研究者對場景中獲取內(nèi)容的分析、監(jiān)控尤為關注。在上述兩個

2、領域中,文字作為一種重要的高層語意信息而顯示出其重要的作用。此外,還可將提取出的文字從原圖像中去除,同時修復被文字所遮擋的背景區(qū)域,進而添加上多語種的文字,這對于不同語種間的視頻及圖像交流和視頻及圖像的再次使用也是很有意義的。
   文字行檢測實際上也是一種模式識別。不同于其它的典型模式,例如單個漢字的模式,文字行的大小、形狀、顏色等都沒有固定的模式。而且在很多情況下,文字所處的背景非常復雜。這些都給文字檢測帶來非常大的困難。所

3、以傳統(tǒng)的直接檢測圖像模式的方法是不能用來檢測文字的。本文在對國內(nèi)外研究現(xiàn)狀和所涉及的基本技術綜述的基礎上,就視頻中文字檢測算法做出深入探討,并提出了兩種文字檢測的方法,第一種文字檢測方法是利用邊緣檢測和局部直方圖來定位文字區(qū)域。首先,用邊緣檢測的方法粗略定位可能的文字區(qū)域。然后用局部直方圖對提取出來的粗略文字區(qū)域進行精確的定位,最后利用文字行的結構信息進行過濾,去除似文本的“假”文字區(qū)域。這個算法對于背景不是很復雜的視頻有比較好的檢測效

4、果。第二種文字檢測方法運用了文字的內(nèi)在結構屬性和視頻幀的時間冗余信息來檢測文字區(qū)域。首先,根據(jù)文字的內(nèi)在屬性設計幾個文字檢測器,文字有橫筆畫、豎筆畫、對角筆畫,相應的文字檢測器也有橫筆畫文字檢測器、豎筆畫文字檢測器、對角筆畫文字檢測器等。這些文字檢測器能夠比較精確得將文字像素提取出來,然后將提取出來的文字像素連接成侯選文字區(qū)域。不同于以往的文字檢測方法,在本算法中,視頻幀的冗余信息被用于文字檢測階段,而非文字增強階段。最后通過基于密度的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論