視頻輸入聽覺顯示的導盲系統(tǒng)關鍵技術研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-11 格式：pdf 頁數：135 大?。?.49MB 人氣指數：12 舉報 版權申訴

已閱讀1頁，還剩134頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、人自出生以來，即靠視覺來觀察周圍環(huán)境并獲取知識，人類有90％的信息來自視覺，視覺的損傷給人類的生活帶來極大的不幸。隨著全球人口的老齡化，盲人和視力低下的人數不斷攀升。因此研究人員一直在不斷探索用其他的感覺器官來獲得視覺信息的方法。通過其他感覺器官獲得視覺信息的關鍵是將視覺信息變成其他感覺器官能夠感知的信號，完成這一功能的裝置即為導盲系統(tǒng)。
　　隨著計算機視覺技術的進步和數字圖像處理算法的完善，視頻輸入聽覺顯示（Video Inpu

2、t and Auditory Display，VIAD）的導盲系統(tǒng)以其輸入信息豐富、無創(chuàng)傷等優(yōu)點，得到了研究人員的廣泛關注。而現有的VIAD導盲系統(tǒng)的核心算法主要存在下面兩方面的問題:第一，多數以障礙物的檢測為核心，忽視了圖像中非障礙物的信息，也忽略了盲人對“聽”到的信息的推理能力;第二，多數算法以圖像的初級特征為映射對象，這種初級特征映射的方式使合成的聲音很復雜，盲人很難學習和掌握。
　　針對上述問題，本文以視頻序列中的靜態(tài)圖像

3、特征為映射對象，研究對于VIAD導盲系統(tǒng)更加有效的圖像處理方法和聽覺顯示方式，降低盲人學習和使用導盲系統(tǒng)的難度，為盲人提供更加豐富的圖像信息。本文主要完成了下列工作:
　　(1)針對圖像分割中目標類和背景類數目的不平衡性，提出了具有動態(tài)懲罰因子的支持向量機(Support Vector Machine with Dynamic Penalty Factors，DC-SVM)模型。將懲罰因子的選擇與每一類的訓練樣本占總訓練樣本的比率

4、直接相關。該模型能夠有效提高數目較少的類的分類正確率。應用DC-SVM模型進行圖像分割，去除圖像中的背景信息，將圖像中的目標映射為復合頻率的聲音信號。盲人經過學習和訓練之后，能夠通過聽這種聲音感知來自外界環(huán)境的主要信息。
　　(2)針對各向異性擴散沖擊濾波器(Anisotropic Diffusion with Shock Filter,ADSF)模型在圖像增強過程中產生的圖像細節(jié)模糊的問題，提出了一種梯度控制的各向異性擴散沖擊濾

5、波器(Gradient Controlled Anisotropic Diffusion with ShockFilter, GCADSF)模型。該模型通過一個隨梯度的模單調遞減的指數函數控制擴散項沿垂直于圖像梯度方向的擴散程度，在增強邊緣、濾除噪聲的同時很好的保護了圖像細節(jié)信息。為了滿足多尺度樂音顯示算法對圖像的要求，將提升小波變換與GCADSF算法相結合，實現了圖像的降維增強。降維增強后的圖像通過多尺度樂音顯示算法映射為電子音符。這

6、種導盲算法聽感良好，長時間使用不會造成疲勞。
　　(3)根據初級視覺皮層的感受野特性，提出了一種基于邊緣基函數重構的圖像邊緣檢測方法。將圖像分解為ICA基函數的線性組合，用典型的邊緣圖像進行訓練，獲得ICA邊緣基函數，利用邊緣基函數重構獲得邊緣圖像。由于ICA基函數很好的模擬了初級視覺皮層的感受野特性，因此這種方法檢測的邊緣更加符合人眼的視覺特性。將小波變換和Canny算法相結合，提出了一種基于小波變換和Canny算法的邊緣檢測方

7、法。對圖像小波變換的低頻成分應用Canny算法檢測圖像邊緣，在降低圖像維度的同時，有效的抑制了圖像中噪聲的影響。二值化的邊緣圖像通過MIDI樂音顯示算法映射為不同音色和音調的MIDI樂音。這種導盲算法在幫助盲人識別圖像中的幾何圖形時取得了較高的識別率。
　　(4)將Itti視覺注意模型引入到導盲算法的研究中，認為引起人的視覺注意的區(qū)域(Region of Interest，ROI)包含圖像的重要信息。提取這些ROI區(qū)域的顏色、位置

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

視頻輸入聽覺顯示的導盲系統(tǒng)關鍵技術研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

視頻輸入聽覺顯示的導盲系統(tǒng)關鍵技術研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載