基于語義特征的視覺關注點檢測.pdf_第1頁
已閱讀1頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、當人類看到任意大小復雜的圖像的時,有著一種能夠快速識別圖像中顯著區(qū)域的能力,也正是因為這種能力,人類可以快速從一幅具有的大量信息圖片中篩選出自己所需要的信息。于是為了能夠讓機器人也能夠的模擬人的這種視覺機制,從而可以讓計算機也能擁有著同人類相似的篩選信息的能力,人眼視覺關注點檢測逐漸成為一個熱門的研究領域。而所謂人眼關注點檢測就是讓計算機或者是機器人來模擬人的視覺關注系統(tǒng),從而能夠讓計算機或者機器人選擇出一幅圖片中人眼所關注的區(qū)域,從而

2、最終得到一幅關注點顯著圖,顯著圖中的像素值的大小表明是否屬于人眼關注點的大小概率,從而用于進一步的圖像特征,如目標識別,人工智能等方面。
  基于此,本文循序漸進的提出了三種人眼關注點檢測的模型,分別從傳統(tǒng)方法和深度神經(jīng)網(wǎng)絡的角度來深入探究如何利用圖像中的各個等級的特征來指導模型對于圖像進行人眼關注點檢測。首先,在本文所提出的第一種的傳統(tǒng)的方法中,先采用了圖像中的低層特征對圖像進行初步的關注點檢測,從而大致預測出圖片中的人眼所關注

3、的區(qū)域,然后再對圖像進行語義分割實現(xiàn)對于圖像中語義特征的提取。最后,再利用支持向量機對所提出的特征進行圖像融合和模型的訓練,從而獲得可以對圖像進行人眼關注點預測的傳統(tǒng)模型;第二種和第三種模型則是建立在深度神經(jīng)網(wǎng)絡的基礎上的模型,這兩種模型均利用了深度神經(jīng)網(wǎng)絡中的卷積層可以自動的從圖像中由低到高的提出圖像中的各等級的特征的特性來進行人眼關注點檢測模型的建立。除此之外,本文所提出的基于全卷積網(wǎng)絡的關注點檢測模型在網(wǎng)絡訓練完成之后,還將得到輸

4、出的結果進行閾值化處理,除去圖片中的噪聲,然后把網(wǎng)絡輸出的結果圖和方法一中的關注點的初步檢測圖通過支持向量機進行圖片的融合從而得到最終的模型。最后本文提出的第三種模型則是基于循環(huán)全卷積網(wǎng)絡的循環(huán)思想建立起來的人眼關注點的檢測模型。在模型的建立過程中通過分析全卷積網(wǎng)絡中各個卷積層所提出特征的等級的不同和這些特征在人眼關注點模型所起到的作用的不同,對全卷積網(wǎng)絡的網(wǎng)絡結構進行了改進,從而得到一個新的循環(huán)全卷積網(wǎng)絡.
  在實驗部分,本文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論