2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  畢 業(yè) 論 文</b></p><p>  2013 年 4 月</p><p> 題 目圖像二值化中閾值選取方法的研究</p><p><b>  摘要</b></p><p>  在人類獲取的信息中,視覺(jué)信息約占60%,聽(tīng)覺(jué)約占20%,其它約占20%。由此

2、可見(jiàn),視覺(jué)信息對(duì)人類非常重要。同時(shí),圖像是人類獲取視覺(jué)信息的主要途徑。圖像二值化是圖像預(yù)處理中的一項(xiàng)重要技術(shù),在模式識(shí)別、光學(xué)字符識(shí)別、醫(yī)學(xué)成像等方面都有重要應(yīng)用。</p><p>  論文介紹了圖像及數(shù)字圖像處理技術(shù)的一些概念和相關(guān)知識(shí),對(duì)Matlab7.0 軟件的發(fā)展和軟件在圖像處理中的應(yīng)用做了簡(jiǎn)要介紹,還介紹了灰度圖像二值化方法以及利用Matlab7.0軟件工具進(jìn)行算法的實(shí)現(xiàn)。</p><

3、;p>  課題重點(diǎn)實(shí)現(xiàn)了圖像分割技術(shù)中灰度圖像二值化方法,如Otsu算法、Bernsen算法,并對(duì)這些算法運(yùn)行的實(shí)驗(yàn)結(jié)果進(jìn)行分析與比較。</p><p>  關(guān)鍵詞:圖像處理,二值化,Matlab,Otsu算法,Bernsen算法</p><p><b>  Abstract</b></p><p>  Human beings obta

4、in a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images a

5、re the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image pre-processing, is widely-employed in pattern recognition, optical character recognition, medical ima

6、ging and so forth. </p><p>  In this paper, some notions and relative knowledge in digital image processing technology are introduced; then, the development of Matlab7.0 and its application in image processi

7、ng briefly introduced; in addition, the method of grayscale image binarization and how to implement these algorithms based on Matlab7.0 are presented. This paper mainly implements the grayscale image binarization method

8、in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and compa</p><p>  Key words: Image processing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm</p>

9、<p><b>  目 錄</b></p><p><b>  摘要I</b></p><p>  AbstractII</p><p><b>  目 錄III</b></p><p>  第一章 緒 論1</p><p>  1

10、.1 圖像與數(shù)字圖像1</p><p>  1.2 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀2</p><p>  1.3 灰度圖像二值化原理及意義5</p><p>  第二章 軟件工具——MATLAB6</p><p>  2.1 MATLAB概述6</p><p>  2.2 MATLAB的工作環(huán)境6</

11、p><p>  2.3 MATLAB圖像處理工具箱8</p><p>  2.4 工具箱實(shí)現(xiàn)的常用功能9</p><p>  第三章 圖像二值化方法11</p><p>  3.1 課題研究對(duì)象11</p><p>  3.2 二值化方法研究動(dòng)態(tài)14</p><p>  3.3 全局閾值法

12、18</p><p>  3.4 局部閾值法19</p><p>  第四章 Otsu方法和Bernsen方法20</p><p>  4.1 Otsu算法分析20</p><p>  4.2 Otsu方法流程圖22</p><p>  4.3 Bernsen算法分析23</p><p&

13、gt;  4.4 Bernsen方法流程圖23</p><p>  第五章 Otsu方法和Bernsen方法實(shí)驗(yàn)比較25</p><p>  5.1 Otsu方法實(shí)驗(yàn)結(jié)果分析25</p><p>  5.2 Bernsen方法實(shí)驗(yàn)結(jié)果分析27</p><p>  5.3 0tsu方法和Bernsen方法實(shí)驗(yàn)結(jié)果比較29</p&

14、gt;<p><b>  5.4 結(jié)論30</b></p><p><b>  參考文獻(xiàn)31</b></p><p><b>  致謝31</b></p><p><b>  第一章 緒 論</b></p><p>  1.1 圖像與

15、數(shù)字圖像</p><p>  圖像就是用各種觀測(cè)系統(tǒng)觀測(cè)客觀世界獲得的且可以直接或間接作用與人眼而產(chǎn)生視覺(jué)的實(shí)體。視覺(jué)是人類從大自然中獲取信息的最主要的手段。據(jù)統(tǒng)計(jì),在人類獲取的信息中,視覺(jué)信息約占60%,聽(tīng)覺(jué)信息約占20%,其他方式加起來(lái)才約占20%。由此可見(jiàn),視覺(jué)信息對(duì)人類非常重要。同時(shí),圖像又是人類獲取視覺(jué)信息的主要途徑,是人類能體驗(yàn)的最重要、最豐富、信息量最大的信息源。 </p><

16、p>  通常,客觀事物在空間上都是三維的(3D)的,但是從客觀景物獲得的圖像卻是屬于二維(2D)平面的。</p><p>  圖像存在方式多種多樣,可以是可視的或者非可視的,抽象的或者實(shí)際的,適于計(jì)算機(jī)處理的和不適于計(jì)算機(jī)處理的。但就其本質(zhì)來(lái)說(shuō),可以將圖像分為以下兩大類。</p><p>  模擬圖像。包括光學(xué)圖像、照相圖像、電視圖像等。比如人在顯微鏡下看到的圖像就是一幅光學(xué)模擬圖像

17、。對(duì)模擬圖像的處理速度快,但精度和靈活性差,不易查找和判斷。</p><p>  數(shù)字圖像。數(shù)字圖像是將連續(xù)的模擬圖像經(jīng)過(guò)離散化處理后得到的計(jì)算機(jī)能夠辨識(shí)的點(diǎn)陣圖像。在嚴(yán)格意義上講,數(shù)字圖像是經(jīng)過(guò)等距離矩形網(wǎng)格采樣,對(duì)幅度進(jìn)行等間隔量化的二維函數(shù)。因此,數(shù)字圖像實(shí)際上就是被量化的二維采樣數(shù)組。</p><p>  一幅數(shù)字圖像都是由若干個(gè)數(shù)據(jù)點(diǎn)組成的,每個(gè)數(shù)據(jù)點(diǎn)稱為像素(pixel)。比如

18、一幅128×400,就是指該圖像是由水平方向上128列像素和垂直方向上400行像素組成的矩形圖。每一個(gè)像素具有自己的屬性,如顏色(color)、灰度(gray scale)等,顏色和灰度是決定一幅圖像表現(xiàn)的關(guān)鍵因素。其中顏色量化等級(jí)包括單色、四色、16色、128色、24位真彩色等,量化等級(jí)越高,則量化誤差越小,圖像的顏色表現(xiàn)力越強(qiáng)。同樣,灰度是單色圖像中像素亮度的表征,量化等級(jí)越高,表現(xiàn)力越強(qiáng)。但是隨著量化等級(jí)的增加,數(shù)據(jù)量將

19、大大增加,使得圖像處理的計(jì)算量和復(fù)雜度相應(yīng)的增加。</p><p>  與模擬圖像相比,數(shù)字圖像具有以下顯著優(yōu)點(diǎn):</p><p>  精度高。目前的計(jì)算機(jī)技術(shù)可以將一幅模擬圖像數(shù)字化為任意的二維數(shù)組,即數(shù)字圖像可以由無(wú)限個(gè)像素組成,每個(gè)像素的亮度可以量化為12位(即4096個(gè)灰度級(jí)),這樣的精度是數(shù)字圖像處理與彩色照片的效果相差無(wú)幾。</p><p>  處理方便

20、。數(shù)字圖像在本質(zhì)上是一組數(shù)據(jù),所以可以用計(jì)算機(jī)對(duì)他進(jìn)行任意方式的修改,如放大、縮小、改變顏色、復(fù)制和刪除某一部分等。</p><p>  重復(fù)性好。模擬圖像,如照片,即便是使用非常好的底片和相紙,也會(huì)隨著時(shí)間的流逝而褪色、發(fā)黃,而數(shù)字圖像可以存儲(chǔ)在光盤中,上百年后再用計(jì)算機(jī)重現(xiàn)也不會(huì)有絲毫的改變。</p><p>  1.2 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀</p><p

21、>  數(shù)字圖像處理就是采用一定的算法對(duì)數(shù)字圖像進(jìn)行處理,以獲得人眼視覺(jué)或者某種接受系統(tǒng)所需要的圖像處理過(guò)程。圖像處理的基礎(chǔ)是數(shù)字,主要任務(wù)是進(jìn)行各種算法設(shè)計(jì)和算法實(shí)現(xiàn)。</p><p>  目前,圖像處理技術(shù)已經(jīng)在許多不同的應(yīng)用領(lǐng)域中得到重視,并取得了巨大成就。根據(jù)應(yīng)用領(lǐng)域要求的不同,數(shù)字圖像處理技術(shù)可以分為許多分支技術(shù)。重要的分支技術(shù)有:</p><p>  圖像變換。圖像陣列很大

22、時(shí),若直接在空域中處理,計(jì)算量將很大。為此,通常采用各種圖像變換方法,如傅立葉變換、沃爾什變換、離散余弦變換、小波變換等間接處理技術(shù),將空域處理轉(zhuǎn)換到變換域處理,這樣可以有效地減少計(jì)算量,提高處理性能。</p><p>  圖像增強(qiáng)與復(fù)原。主要目的是增強(qiáng)圖像中的有用信息,削弱干擾和噪聲,使圖像更加清晰,或者將其轉(zhuǎn)換為更適合人或機(jī)器分析的形式。圖像增強(qiáng)并不是要求真實(shí)地反映原始圖像,而圖像復(fù)原則要求盡量消除或減少獲取

23、圖像過(guò)程中所產(chǎn)生的某些退化,使圖像能夠反映原始圖像的真實(shí)面貌。</p><p>  圖像壓縮編碼。在滿足一定保真度條件下,對(duì)圖像信息進(jìn)行編碼,可以壓縮圖像信息量,簡(jiǎn)化圖像的邊式,從而大大壓縮圖像描述的數(shù)據(jù)量,以便存儲(chǔ)和傳輸;圖像壓縮在不同應(yīng)用背景下可以采用不失真壓縮和失真壓縮。</p><p>  圖像分割。圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一,是為了將圖像中有意義的特征提取出來(lái)。它是進(jìn)

24、一步進(jìn)行圖像識(shí)別、分析和理解的基礎(chǔ)。圖像的有意義特征包括圖像的邊緣、區(qū)域等。</p><p>  圖像分析。對(duì)圖像中的不同對(duì)象進(jìn)行分割、分類、識(shí)別、描述和解釋。</p><p>  圖像識(shí)別。圖像識(shí)別屬于模式識(shí)別的范疇,其主要內(nèi)容是在圖像經(jīng)過(guò)某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像分割和提取,從而進(jìn)行判別分類。圖像分類常用的經(jīng)典識(shí)別方法有統(tǒng)計(jì)模式分類和句法模式分類。近年來(lái),新發(fā)展起來(lái)的模

25、糊模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識(shí)別中越來(lái)越受到重視。</p><p>  圖像隱藏。是指媒體信息的相互隱藏,常見(jiàn)的有數(shù)字水印和圖像的信息偽裝等。</p><p>  以上圖像處理內(nèi)容也并非孤立存在的,往往相互聯(lián)系,而一個(gè)實(shí)用的圖像處理系統(tǒng)通常需要將幾種圖像處理技術(shù)結(jié)合起來(lái),才能得到所需要的結(jié)果。例如,圖像變換是圖像編碼技術(shù)的基礎(chǔ),而圖像增強(qiáng)與復(fù)原一般又是圖像處理的最終目的,也可以作

26、為進(jìn)一步圖像處理工作的準(zhǔn)備;通過(guò)圖像分割得到的圖像特征既可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎(chǔ)。</p><p>  不同的圖像處理技術(shù)應(yīng)用與不同的領(lǐng)域,發(fā)展出不同的分支學(xué)科,如遙感圖像處理、醫(yī)學(xué)圖像處理等,其他如計(jì)算機(jī)圖形學(xué)、模式識(shí)別、人工智能和機(jī)器人視覺(jué)等學(xué)科領(lǐng)域也與圖像處理有著密切的關(guān)系。</p><p>  圖像處理技術(shù)的發(fā)展大致經(jīng)歷了初創(chuàng)期、發(fā)展期、普及期和實(shí)用化期4個(gè)

27、階段。初創(chuàng)期開(kāi)始于20世紀(jì)60年代,當(dāng)時(shí)的圖像采用像素型光柵進(jìn)行少秒顯示,大多采用中、大型機(jī)對(duì)其處理。在這一時(shí)期,由于圖像存儲(chǔ)成本高、處理設(shè)備昂貴,其應(yīng)用面很窄。進(jìn)入20世紀(jì)70年代的發(fā)展期,開(kāi)始大量采用中、小型機(jī)進(jìn)行處理,圖像處理也逐漸改用光柵掃描方式,特別是CT和衛(wèi)星遙感圖像的出現(xiàn),對(duì)圖像處理技術(shù)的發(fā)展起到了很好的推動(dòng)作用。到了20世紀(jì)80年代,圖像處理技術(shù)進(jìn)入普及期,此時(shí)的微機(jī)已經(jīng)能夠擔(dān)當(dāng)起圖形圖像處理的任務(wù)。超大規(guī)模集成電路(V

28、ery Large Scale Integration, VLSI)的出現(xiàn)更使處理速度大大提高,設(shè)備造價(jià)也進(jìn)一步降低,極大地促進(jìn)了圖形圖像系統(tǒng)的普及和應(yīng)用。20世紀(jì)90年代是圖像處理技術(shù)的實(shí)用化時(shí)期,圖像處理的信息量巨大,對(duì)處理速度的要求極高。</p><p>  針對(duì)現(xiàn)有的實(shí)際應(yīng)用,數(shù)字圖像處理具有以下特點(diǎn)。</p><p>  信息量大,要求處理速度比較快。目前,數(shù)字圖像處理的信息大多

29、是二維信息,處理信息量很大。比如一幅128×128低分辨率的黑白圖像,要求64Kbit的數(shù)據(jù)量;對(duì)高分辨率彩色512×512圖像,則要求128Kbit數(shù)據(jù)量;如果要處理30幀/s的視頻圖像,則每秒要求處理500Kbit~22.5Mbit數(shù)據(jù)量。因此對(duì)計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。</p><p>  占用頻帶較寬。與語(yǔ)音信息相比,數(shù)字圖像占用的頻帶要大幾個(gè)數(shù)量級(jí)。如電視圖像的帶寬約56

30、MHz,而語(yǔ)音帶寬僅為4KHz左右。所以數(shù)字圖像在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本高,且對(duì)頻帶壓縮技術(shù)提出了更高的要求。</p><p>  數(shù)字圖像中各個(gè)像素間的相關(guān)性強(qiáng),壓縮潛力大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá)0.9以上。一般而言,相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性還要大。</p&g

31、t;<p>  圖像質(zhì)量評(píng)價(jià)受主觀因素影響。數(shù)字圖像處理后的圖像一般需要給人觀察和評(píng)價(jià),而人的視覺(jué)系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺(jué)性能、人的情緒、愛(ài)好以及知識(shí)狀況影響很大,因此評(píng)價(jià)結(jié)果受人的主觀因素影響較大。為此,如何客觀評(píng)價(jià)圖像質(zhì)量還有待進(jìn)一步深入的研究。另外,計(jì)算機(jī)視覺(jué)是模仿人的視覺(jué),人類的感知原理必然嚴(yán)重影響計(jì)算機(jī)視覺(jué)的研究。</p><p>  圖像處理技術(shù)綜合性強(qiáng)。數(shù)字圖像處理技術(shù)中設(shè)計(jì)的基礎(chǔ)

32、知識(shí)和專業(yè)技術(shù)相當(dāng)廣泛,通常涉及通信技術(shù)、計(jì)算機(jī)技術(shù)、電子技術(shù)、電視技術(shù)以及更多的數(shù)學(xué)、物理等方面的基礎(chǔ)知識(shí)。例如,圖像編碼的理論基礎(chǔ)是信息論和抽象數(shù)學(xué)的結(jié)合,而圖像識(shí)別則需要掌握隨機(jī)過(guò)程和信號(hào)處理方面的知識(shí)。此外,不少課題還需要更加專業(yè)的知識(shí),如小波變換、神經(jīng)網(wǎng)絡(luò)、分形理論等。</p><p>  另外,圖像處理是一門應(yīng)用性很強(qiáng)的學(xué)問(wèn),必須與計(jì)算機(jī)技術(shù)的發(fā)展相適應(yīng)。隨著電子技術(shù)和計(jì)算機(jī)技術(shù)的不斷提高和普及,數(shù)字

33、圖像處理技術(shù)進(jìn)入高速發(fā)展時(shí)期。</p><p>  1.3 灰度圖像二值化原理及意義</p><p>  灰度圖像是指只含亮度信息,不含色彩信息的圖像。將彩色圖像轉(zhuǎn)化成為灰度圖像的過(guò)程稱為圖像的灰度化處理。彩色圖像中的每個(gè)像素的顏色有R、G、B三個(gè)分量決定,而每個(gè)分量有255種值可取,這樣一個(gè)像素點(diǎn)可以有1600多萬(wàn)的顏色的變化范圍。而灰度圖像是R、G、B三個(gè)分量相同的一種特殊的彩色圖像,

34、一個(gè)像素點(diǎn)的變化范圍為255種,所以在數(shù)字圖像處理中一般先將各種格式的圖像轉(zhuǎn)變成灰度圖像以使后續(xù)的圖像的計(jì)算量變得少一些?;叶葓D像的描述與彩色圖像一樣仍然反映了整幅圖像的整體和局部的色度和亮度等級(jí)的分布和特征。圖像的灰度化處理可先求出每個(gè)像素點(diǎn)的R、G、B三個(gè)分量的平均值,然后將這個(gè)平均值賦予給這個(gè)像素的三個(gè)分量。</p><p>  圖像的二值化處理就是將圖像上的點(diǎn)的灰度置為0或1,也就是使整個(gè)圖像呈現(xiàn)出明顯的

35、黑白效果。即將128個(gè)亮度等級(jí)的灰度圖像通過(guò)適當(dāng)?shù)拈撝颠x取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。</p><p>  在數(shù)字圖像處理中,二值化圖像占有非常重要的地位,特別是在實(shí)用的圖像處理中,以二值圖像處理實(shí)現(xiàn)而構(gòu)成的系統(tǒng)是很多的,要進(jìn)行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像,這樣子有利于再對(duì)圖像做進(jìn)一步處理時(shí),圖像的集合性質(zhì)只與像素的值為0或1的點(diǎn)的位置有關(guān),不再涉及像素的多級(jí)

36、值,使處理變得簡(jiǎn)單,而且數(shù)據(jù)的處理和壓縮量小。二值圖像在圖像分析中應(yīng)用非常廣泛,二值圖像就是指只有兩個(gè)灰度級(jí)的圖像,二值圖像具有存儲(chǔ)空間小,處理速度快,可以方便地對(duì)圖像進(jìn)行布爾邏輯運(yùn)算等特點(diǎn)。更重要的是,在二值圖像的基礎(chǔ)上,還可以進(jìn)一步對(duì)圖像處理,獲得該圖像的一些幾何特征或者其他更多特征。</p><p>  第二章 軟件工具——MATLAB</p><p>  2.1 MATLAB概述&

37、lt;/p><p>  MATLAB是Matrix Laboratory的縮寫,是由美國(guó)MathWorks公司推出的計(jì)算機(jī)軟件,經(jīng)過(guò)多年的逐步發(fā)展與不斷完善,現(xiàn)已成為國(guó)際公認(rèn)的最優(yōu)秀的科學(xué)計(jì)算與數(shù)學(xué)應(yīng)用軟件之一,是近幾年來(lái)在國(guó)內(nèi)外廣泛流行的一種可視化科學(xué)計(jì)算軟件。它集數(shù)值分析,矩陣運(yùn)算,信號(hào)處理和圖形顯示于一體,構(gòu)成了一個(gè)方便的,界面友好的用戶環(huán)境,而且還具有可擴(kuò)展性特征。</p><p> 

38、 MathWorks公司針對(duì)不同領(lǐng)域的應(yīng)用,推出了信號(hào)處理,控制系統(tǒng),神經(jīng)網(wǎng)絡(luò),圖像處理,小波分析,魯棒控制,非線性系統(tǒng)控制設(shè)計(jì),系統(tǒng)辨識(shí),優(yōu)化設(shè)計(jì),統(tǒng)計(jì)分析等30多個(gè)具有專門功能的工具箱,這些工具箱是由該領(lǐng)域內(nèi)的學(xué)術(shù)水平較高的專家編寫的,無(wú)需用戶自己編寫所用的專業(yè)基礎(chǔ)程序,可直接對(duì)工具箱進(jìn)行運(yùn)用。同時(shí),工具箱內(nèi)的函數(shù)源程序也是開(kāi)放性的,多為M文件,用戶可以查看這些文件的代碼并進(jìn)行更改,MALAB支持用戶對(duì)其函數(shù)進(jìn)行二次開(kāi)發(fā),用戶的應(yīng)用

39、程序也可以作為新的函數(shù)添加到相應(yīng)的工具箱中。</p><p>  MATLAB中的數(shù)字圖像是以矩陣形式表示的,這意味著MATLAB強(qiáng)大的矩陣運(yùn)算能力用于圖像處理非常有利,矩陣運(yùn)算的語(yǔ)法對(duì)MATLAB中的數(shù)字圖像同樣適用。</p><p>  2.2 MATLAB的工作環(huán)境</p><p>  MATLAB的工作環(huán)境簡(jiǎn)單明了,易于操作,使用的MATLAB軟件一般是6.

40、x版本。其工作環(huán)境包括五個(gè)部分:命令窗口(Command Window),MATLAB的主窗口用戶可以直接在此窗口輸入命令,系統(tǒng)將自動(dòng)顯示信息;啟動(dòng)平臺(tái)(Launch Pad),當(dāng)用戶需要啟動(dòng)某個(gè)工具箱的應(yīng)用程序時(shí),可以在啟動(dòng)平臺(tái)中實(shí)現(xiàn)。工作空間(Workspace),MATLAB工作空間作為一個(gè)獨(dú)立的窗口,其操作相當(dāng)方便。它包含著用戶已建立的變量,而且變量在工作空間中是以矩陣的形式存儲(chǔ);命令歷史記錄(Command History),

41、主要顯示在命令中已執(zhí)行過(guò)的命令;當(dāng)前路徑窗口(Current Directory),主要顯示當(dāng)前工作在什么路徑下進(jìn)行,包括M文件的打開(kāi)路徑,雙擊M文件名打開(kāi)該文件進(jìn)行編輯。如圖2.1所示。</p><p>  圖2.1 MATLAB6.X</p><p>  論文中使用的MATLAB軟件為7.0版本,如圖2.2所示。</p><p>  圖2.2 MATLAB7.0

42、</p><p>  MATLAB7.0針對(duì)編程環(huán)境、代碼效率、數(shù)據(jù)可視化、數(shù)學(xué)計(jì)算、文件I/O操作等方面都有進(jìn)行不斷升級(jí)、增加了新功能。為此、相對(duì)于以前的版本,也具有一些新的特性。就其開(kāi)發(fā)環(huán)境方面來(lái)說(shuō):</p><p>  重新設(shè)計(jì)的桌面環(huán)境,針對(duì)多文檔界面提供了簡(jiǎn)便的管理和訪問(wèn)方法,允許用戶自定義桌面外貌,創(chuàng)建常用命令的快捷方式。</p><p>  增強(qiáng)數(shù)組編

43、輯器(Array Editor)和工作空間瀏覽器(Workspace Browser)功能,用于數(shù)據(jù)的顯示、編輯和處理。</p><p>  在當(dāng)前目錄瀏覽器(Current Directory Browser)工具中,增加了代碼效率分析、覆蓋度的分析等功能。</p><p>  增加了M-Lint編碼分析,能輔助用戶完成程序性能分析,提高程序執(zhí)行效率。</p><p&

44、gt;  對(duì)M文件編輯器(M-Editor)進(jìn)行了功能增強(qiáng),可以支持多種格式的源代碼文件可視化編輯,如C/C++、HTML、Java等。</p><p>  2.3 MATLAB圖像處理工具箱</p><p>  數(shù)字圖像處理工具箱函數(shù)包括以下15類:</p><p>  (1) 圖像顯示函數(shù);</p><p>  (2) 圖像文件輸入、輸出

45、函數(shù);</p><p>  (3) 圖像幾何操作函數(shù);</p><p>  (4) 圖像像素值及統(tǒng)計(jì)函數(shù);</p><p>  (5) 圖像分析函數(shù);</p><p>  (6) 圖像增強(qiáng)函數(shù);</p><p>  (7) 線性濾波函數(shù);</p><p>  (8) 二維線性濾波器設(shè)計(jì)函數(shù);&l

46、t;/p><p>  (9) 圖像變換函數(shù);</p><p>  (10) 圖像鄰域及塊操作函數(shù);</p><p>  (11) 二值圖像操作函數(shù);</p><p>  (12) 基于區(qū)域的圖像處理函數(shù);</p><p>  (13) 顏色圖操作函數(shù);</p><p>  (14) 顏色空間轉(zhuǎn)換函數(shù)

47、;</p><p>  (15) 圖像類型和類型轉(zhuǎn)換函數(shù)。</p><p>  MATLAB圖像處理工具箱支持四種圖像類型,分別為真彩色圖像、索引圖像、灰度圖像、二值圖像,由于有的函數(shù)對(duì)圖像類型有限制,這四種類型可以用工具箱的類型轉(zhuǎn)換函數(shù)相互轉(zhuǎn)換。MATLAB可操作的圖像文件包括BMP、HDF、JPEG、PCX、TIFF、XWD等格式。</p><p>  2.4

48、工具箱實(shí)現(xiàn)的常用功能</p><p>  就圖像處理的基本過(guò)程討論工具箱所實(shí)現(xiàn)的常用功能。</p><p><b>  常用圖像操作:</b></p><p>  圖像的讀寫與顯示操作:用imread()讀取圖像,imwrite()輸出圖像,把圖像顯示于屏幕有imshow(),image()等函數(shù)。imcrop()對(duì)圖像進(jìn)行剪裁,圖像的插值縮放

49、可用imresize()函數(shù)實(shí)現(xiàn),旋轉(zhuǎn)用imrotate()實(shí)現(xiàn)。</p><p><b>  圖像增強(qiáng)功能:</b></p><p>  圖像增強(qiáng)是數(shù)字圖像處理過(guò)程中常用的一種方法,目的是采用一系列技術(shù)去改善圖像的視覺(jué)效果或?qū)D像轉(zhuǎn)換成一種更適合于人眼觀察和機(jī)器自動(dòng)分析的形式。常用的圖像增強(qiáng)方法有以下幾種:</p><p>  灰度直方圖均衡

50、化。均勻量化的自然圖像的灰度直方圖通常在低灰度區(qū)間上頻率較大,低的圖像中較暗區(qū)域中細(xì)節(jié)看不清楚,采用直方圖修整可使原圖灰度集中的區(qū)域拉開(kāi)或使灰度分布均勻,從而增大反差,使圖像的細(xì)節(jié)清晰,達(dá)到增強(qiáng)目的。直方圖均衡化可用histeq()函數(shù)實(shí)現(xiàn)。 </p><p>  灰度變換法。照片或電子方法得到的圖像,常表現(xiàn)出低對(duì)比度即整個(gè)圖像較亮或較暗,為此需要對(duì)圖像中的每一像素的灰度級(jí)進(jìn)行標(biāo)度變換,擴(kuò)大圖像灰度范圍,以達(dá)到改

51、善圖像質(zhì)量的目的。這一灰度調(diào)整過(guò)程可用imadjust()函數(shù)實(shí)現(xiàn)</p><p>  平滑與銳化濾波。平滑技術(shù)用于平滑圖像中的噪聲,基本采用在空間域上的求平均值或中值,或在頻域上采取低通濾波。因在灰度連續(xù)變化的圖像中,我們通常認(rèn)為與相鄰像素灰度相差很大的突變點(diǎn)為噪聲點(diǎn),灰度突變代表了一種高頻分量,低通濾波則可以削弱圖像的高頻成分,平滑了圖像信號(hào),但也可能使圖像目標(biāo)區(qū)域的邊界變得模糊。而銳化技術(shù)采用的是頻域上的高

52、通濾波方法,通過(guò)增強(qiáng)高頻成分而減少圖像中的模糊,特別是模糊的邊緣部分得到了增強(qiáng),但同時(shí)也放大了圖像的噪聲。在MATLAB中,各種濾波方法都是在空間域中通過(guò)不同的軍紀(jì)模板即濾波算子實(shí)現(xiàn),可用fspecial()函數(shù)創(chuàng)建預(yù)定義的濾波算子,然后用filter2()或conv2()函數(shù)在實(shí)現(xiàn)卷積運(yùn)算的基礎(chǔ)上進(jìn)行濾波。</p><p>  邊緣檢測(cè)和圖像分割功能</p><p>  邊緣檢測(cè)是一種重

53、要的區(qū)域處理方法,邊緣是所要提取目標(biāo)和背景的分界線,提取出邊緣才能將目標(biāo)和背景區(qū)分開(kāi)來(lái)。如果一個(gè)像素落在邊界上,那么它的鄰域?qū)⒊蔀橐粋€(gè)灰度級(jí)變化的帶。對(duì)這種變化最有用的兩個(gè)特征就是灰度的變化率和方向。邊緣檢測(cè)算子可以檢查每個(gè)像素的鄰域并對(duì)灰度變化率進(jìn)行量化,也包括對(duì)方向的確定,其中大多數(shù)是基于方向倒數(shù)掩模求卷積的方法。</p><p>  MATLAB工具箱提供的edge()函數(shù)可針對(duì)sobel算子、prewit

54、t算子、Roberts算子、log算子和canny算子實(shí)現(xiàn)邊緣檢測(cè)的功能。基于灰度的圖像分割方法也可以用簡(jiǎn)單的MATLAB代碼實(shí)現(xiàn)。</p><p><b>  圖像變換功能</b></p><p>  圖像變換技術(shù)是圖像處理的重要工具,常運(yùn)用于圖像壓縮、濾波、編碼和后續(xù)的特征抽取或信息分析過(guò)程。MATLAB工具箱提供了常用的變換函數(shù),如fft2()與ifft2()函

55、數(shù)分別實(shí)現(xiàn)二維快速傅立葉變換與其逆變換,dct2()與idct2()函數(shù)實(shí)現(xiàn)二維離散余弦變換與其逆變換,Radon()與iradon()函數(shù)實(shí)現(xiàn)Radon變換與逆Radon變換。</p><p>  除以上基本圖像處理功能,MATLAB還提供了如二值圖像的膨脹運(yùn)算dilate()函數(shù)、腐蝕運(yùn)算erode()函數(shù)等基本數(shù)學(xué)形態(tài)學(xué)與二值圖像的操作函數(shù)。</p><p>  第三章 圖像二值化方

56、法</p><p>  3.1 課題研究對(duì)象</p><p>  論文主要研究BMP格式的灰度圖像文件。BMP(Bitmap Picture)文件格式是Windows系統(tǒng)交換圖形、圖像數(shù)據(jù)的一種標(biāo)準(zhǔn)格式。BMP圖像的數(shù)據(jù)由四個(gè)部分組成,如表3.1所示。</p><p>  表3.1 BMP圖像文件結(jié)構(gòu)</p><p>  第一部分為位圖文件頭

57、BITMAPFILEHEADER,它是個(gè)結(jié)構(gòu)體,其定義如下:</p><p>  typedef struct tagBITMAPFILEHEADER { </p><p>  WORD bfType;</p><p>  DWORD bfSize;</p><p>  WORD bfReserved1;</p>&

58、lt;p>  WORD bfReserved2;</p><p>  DWORD bfOffBits;</p><p>  } BITMAPFILEHEADER;</p><p>  這個(gè)結(jié)構(gòu)的長(zhǎng)度是固定的,為14個(gè)字節(jié)(WORD為無(wú)符號(hào)16位二進(jìn)制整數(shù),DWORD為無(wú)符號(hào)32位二進(jìn)制整數(shù))。</p><p>  第二部分為位圖信

59、息頭BITMAPINFOHEADER,也是一個(gè)結(jié)構(gòu),其定義如下: </p><p>  typedef struct tagBITMAPINFOHEADER { </p><p>  DWORD biSize; </p><p>  LONG biWidth;</p><p>  LONG biHeight; </p>

60、<p>  WORDbiPlanes;</p><p>  WORD biBitCount; </p><p>  DWORD biCompression; </p><p>  DWORDbiSizeImage;</p><p>  LONG biXPelsPerMeter;</p><p>

61、;  LONG biYPelsPerMeter;</p><p>  DWORD biClrUsed;</p><p>  DWORD biClrImportant;</p><p>  } BITMAPINFOHEADER;</p><p>  這個(gè)結(jié)構(gòu)的長(zhǎng)度是固定的,為40個(gè)字節(jié)(LONG為32位二進(jìn)制整數(shù))。其中,biCompr

62、ession的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,這都是一些Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多,一般僅討論biCompression的有效值為BI_RGB,即不壓縮的情況。</p><p>  第三部分為調(diào)色板(Palette),當(dāng)然,這里是對(duì)那些需要調(diào)色板的位圖文件而言的。真彩色圖像是不需要調(diào)色板的,BITMAPINFOHEADER后

63、直接是位圖數(shù)據(jù)。調(diào)色板實(shí)際上是一個(gè)數(shù)組,共有biClrUsed個(gè)元素(如果該值為零,則有2的biBitCount次方個(gè)元素)。數(shù)組中每個(gè)元素的類型是一個(gè)RGBQUAD結(jié)構(gòu),占4個(gè)字節(jié),其定義如下:</p><p>  typedef struct tagRGBQUAD { </p><p>  BYTE rgbBlue;</p><p>  BYTE

64、rgbGreen;</p><p>  BYTE rgbRed;</p><p>  BYTE rgbReserved;</p><p>  } RGBQUAD;</p><p>  第四部分就是實(shí)際的圖像數(shù)據(jù)。對(duì)于用到調(diào)色板的位圖,圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值,對(duì)于真彩色圖像,圖像數(shù)據(jù)就是實(shí)際的R、G、B值。下面

65、就2色、16色、128色和真彩色位圖分別介紹。</p><p>  對(duì)于2色位圖,用1位就可以表示該像素的顏色(一般0表示黑色,1表示白色),所以一個(gè)字節(jié)可以表示8個(gè)像素。對(duì)于16色位圖,用4位就可以表示一個(gè)像素的顏色,所以一個(gè)字節(jié)可以表示2個(gè)像素。對(duì)于128色位圖,一個(gè)字節(jié)剛好可以表示1個(gè)像素。</p><p>  下面有兩點(diǎn)值得注意:</p><p>  (1)

66、 每一行的字節(jié)數(shù)必須是4的整倍數(shù),如果不是,則需要補(bǔ)齊。</p><p>  (2) BMP文件的數(shù)據(jù)存放是從下到上,從左到右的,也就是說(shuō),從文件中最先讀到的是圖像最下面的一行的左邊的第一個(gè)像素,然后是左邊的第二個(gè)像素,接下來(lái)是倒數(shù)第二行左邊第一個(gè)像素,左邊第二個(gè)像素。依次類推,最后得到的是最上面的最右邊的一個(gè)像素。</p><p>  DIB(Device Independent Bit

67、map)圖像格式是設(shè)備無(wú)關(guān)位圖文件,描述圖像能力基本與BMP相同,并且能夠運(yùn)行多種硬件平臺(tái),只是文件格式較大。</p><p>  3.2 二值化方法研究動(dòng)態(tài)</p><p>  作為一種高效智能的人機(jī)交互手段,身份證的快速識(shí)別技術(shù)可以廣泛的應(yīng)用于公民身份核查、暫住人口調(diào)查、旅店業(yè)登記核查、罪犯追逃等公安業(yè)務(wù)當(dāng)中,大大提高了工作人員的錄入速度,減少了用戶的等待時(shí)間,提高了工作效率。由于身份

68、證圖像背景復(fù)雜,由激光防偽陰影網(wǎng)格線及各種版面噪聲構(gòu)成;且因激光防偽標(biāo)志和打印條件的千差萬(wàn)別,再加上身份證圖像質(zhì)量偏差,給身份證的字符識(shí)別帶來(lái)了很大的困難。必須經(jīng)過(guò)預(yù)處理,除去大量的噪聲信號(hào),才能更好的進(jìn)行字符的定位、分割,以及識(shí)別。而二值化是預(yù)處理中非常重要的一步,也是最為關(guān)鍵的一步,它直接影響到OCR 系統(tǒng)的性能。研究者在分析和討論了多種圖像二值化的優(yōu)缺點(diǎn)后,在吸取各種方法優(yōu)點(diǎn)的基礎(chǔ)上,提出了一種新的身份證掃描圖像的二值化方法——嵌

69、入式多閾值動(dòng)態(tài)自適應(yīng)的二值化方法。</p><p>  圖像二值化是圖像處理中的一項(xiàng)基本技術(shù),也是很多圖像處理技術(shù)的預(yù)處理過(guò)程。在顆粒分析、模式識(shí)別技術(shù)、光學(xué)字符識(shí)別(OCR)、醫(yī)學(xué)數(shù)據(jù)可視化中的切片配準(zhǔn)等應(yīng)用中,圖像二值化是它們進(jìn)行數(shù)據(jù)預(yù)處理的重要技術(shù)。由于圖像二值化過(guò)程將會(huì)損失原圖像的許多有用信息,因此在進(jìn)行二值化預(yù)處理過(guò)程中,能否保留原圖的主要特征非常關(guān)鍵。在不同的應(yīng)用中,圖像二值化時(shí)閾值的選擇是不同的。因

70、此,自適應(yīng)圖像閾值的選取方法非常值得研究。研究者對(duì)圖像二值化方法進(jìn)行了討論,在此基礎(chǔ)上提出了一個(gè)新的圖像二值化算法。該算法基于數(shù)學(xué)形態(tài)學(xué)理論,較好地保留了圖像二值化時(shí)原圖的邊緣特征。</p><p>  激光雕刻中圖像處理的二值化處理激光雕刻是近十幾年隨著激光技術(shù)的發(fā)展而產(chǎn)生的一種新的雕刻技術(shù),它與計(jì)算機(jī)圖形學(xué)、圖像處理等學(xué)科的結(jié)合,應(yīng)用在各種材料上進(jìn)行文字、圖案加工。如何能得到光滑且能真實(shí)反映原圖像的雕刻圖像是

71、其中的主要問(wèn)題,但是激光器的開(kāi)關(guān)只有兩種狀態(tài),因此,圖像的二值化處理就成為了關(guān)鍵性技術(shù),其中閾值的選取是決定二值化圖像好壞的因素?,F(xiàn)實(shí)世界中黑白二值圖像很少用,大多數(shù)圖像都是灰度圖像或是彩色圖像。要使這些圖像適用于激光雕刻中,就需要對(duì)其進(jìn)行二值化處理,研究者針對(duì)激光雕刻總結(jié)了適用于雕刻的二值化處理方法,然而沒(méi)有一種方法適合于所有圖像雕刻的,因而實(shí)際中要選擇一種合適的二值化處理方法,使得得到的二值圖像效果最好。</p>&l

72、t;p>  在信息社會(huì)中人的身份識(shí)別得到廣泛關(guān)注。指紋識(shí)別技術(shù)除了在傳統(tǒng)的法律公安上得到應(yīng)用之外,還有更廣闊的應(yīng)用前景,如計(jì)算機(jī)用戶的確認(rèn)、訪問(wèn)網(wǎng)絡(luò)資源的口令、銀行ATM 機(jī)和信用卡的使用、各類智能IC 卡的雙重確認(rèn),以及雇員證明、海關(guān)身份鑒定、家用電子門鎖等一個(gè)完整的自動(dòng)指紋識(shí)別系統(tǒng)(AFIS) 包括指紋采集、指紋圖像預(yù)處理、指紋特征提取和比對(duì)等幾個(gè)模塊。在自動(dòng)指紋識(shí)別系統(tǒng)中,指紋圖像的預(yù)處理是正確進(jìn)行特征提取、比對(duì)等操作的基礎(chǔ)

73、,而二值化是指紋圖像預(yù)處理中必不可少的一步。目前,國(guó)內(nèi)外學(xué)者在這方面已經(jīng)做了大量的工作,常用的二值化方法有固定閾值法、自適應(yīng)閾值法、局部自適應(yīng)閾值法等。由于指紋圖像是一種方向性很強(qiáng)的圖像,這些方法僅僅利用了指紋圖像的灰度信息,而忽略了指紋圖像的方向信息,因此這些方法對(duì)指紋圖像的二值化效果并不十分理想。爾后提出了一種改進(jìn)的二值化方法:利用梯度法求取塊方向圖,將其量化成8個(gè)標(biāo)準(zhǔn)方向,以塊方向代替點(diǎn)方向并利用灰度信息對(duì)指紋圖像進(jìn)行二值化。最后

74、將該方法和局部自適應(yīng)閾值二值化方法及改進(jìn)前的方法進(jìn)行比較,可以發(fā)現(xiàn):采用該方法二值化效果有了明顯提高,對(duì)于不同質(zhì)量的指紋圖像有著令人滿意的</p><p>  結(jié)合Canny 算子的圖像二值化方法,對(duì)經(jīng)典的二值化方法Otsu 算法和Bernsen 算法中存在的缺點(diǎn)進(jìn)行了分析后提出圖像二值化方法,該方法綜合考慮了邊緣信息和灰度信息,通過(guò)邊緣附近種子點(diǎn)在高閾值二值化圖像中的填充和低閾值圖像對(duì)它的修補(bǔ)而得到二值化結(jié)果圖

75、像,較好地解決了經(jīng)典二值化方法中存在的抗噪能力差、邊緣粗糙、偽影現(xiàn)象等缺點(diǎn),實(shí)驗(yàn)結(jié)果證明,該方法能夠較好地解決低對(duì)比度圖像和目標(biāo)像素灰度不均勻圖像的二值化問(wèn)題。</p><p>  采用信號(hào)匹配的支票圖像二值化提出了一種基于信號(hào)匹配的低信噪比圖像的信號(hào)提取方法,解決類似支票日期域的這種既有復(fù)雜背景,又有印章噪聲干擾的圖像二值化問(wèn)題。這種二值化方法完全不同于傳統(tǒng)的方法,它從信號(hào)處理的角度出發(fā),利用了部分先驗(yàn)知識(shí)和理

76、想狀態(tài)下的投影輪廓信號(hào),再通過(guò)用不同閾值分割的投影信號(hào)與之匹配,匹配度最大時(shí)的閾值即為圖像分割的最佳閾值。 本方法比其他的傳統(tǒng)的二值化方法更具有自適應(yīng)性和魯棒性,通過(guò)大量的實(shí)驗(yàn)數(shù)據(jù),以及與常用的其他算法進(jìn)行的比較得到了驗(yàn)證。</p><p>  基于灰度的車牌圖像二值化算法不均勻光照下的圖像二值化是數(shù)字圖像處理中的一個(gè)難題,汽車牌照自動(dòng)識(shí)別系統(tǒng)工作在復(fù)雜的光照環(huán)境下,經(jīng)常會(huì)出現(xiàn)車牌光照不均的現(xiàn)象,給圖像二值化帶來(lái)

77、困難。為此,研究者提出一種解決辦法,首先使用同態(tài)濾波去掉車牌圖像的不均勻光照的影響,然后使用改進(jìn)的Bernsen 算法對(duì)車牌圖像進(jìn)行二值化。實(shí)驗(yàn)表明,使用該算法能有效地克服不均勻光照的影響,二值化效果良好,車牌識(shí)別率得到顯著的提高;針對(duì)常用車牌識(shí)別二值化算法存在的問(wèn)題,提出了基于分形維數(shù)的二值化的方法。根據(jù)分形維數(shù)反映圖像復(fù)雜程度的定義,通過(guò)計(jì)算兩次突變的分維數(shù),來(lái)確定圖像的灰度值范圍,并利用該灰度值范圍確定閾值。并通過(guò)實(shí)驗(yàn),表明利用分

78、形維數(shù)所得到的閾值進(jìn)行二值化處理較傳統(tǒng)方法有較大改進(jìn),且該方法解決了在自然光和不同光照背景下對(duì)車牌識(shí)別的干擾問(wèn)題,也可以從復(fù)雜背景中提取出傾斜的車牌;偏白或泛白背景的車牌圖像二值化方法,在車輛牌照識(shí)別系統(tǒng)中,由于攝像機(jī)畸變、動(dòng)態(tài)范圍太窄、車輛牌照被污染等原因,灰度化的車輛牌照?qǐng)D像背景變得模糊,接近于字體的灰度或者動(dòng)態(tài)范圍不高,使得前景字體跟背景難以分開(kāi)。該文采用高帽與低帽形態(tài)濾波增強(qiáng)車牌</p><p>  基于

79、自組織特征映射(SOFM)神經(jīng)網(wǎng)絡(luò)的圖像融合二值化方法介紹了SOFM 神經(jīng)網(wǎng)絡(luò)的特點(diǎn)及學(xué)習(xí)算法,根據(jù)SOFM 的聚類確定圖像第一閾值作為循環(huán)迭代的初始值,對(duì)整幅圖像進(jìn)行循環(huán)迭代得到第二閾值,使用第二閾值對(duì)原始圖像進(jìn)行二值化,得到第一幅待融合圖像;通過(guò)改進(jìn)的Bernsen方法對(duì)原始圖像進(jìn)行二值化,得到第二幅待融合圖像;最后根據(jù)圖像灰度值選小的原則作為圖像融合方法,得到最終的二值化圖像。該方法既能有效地消除偽影,又能較好地分離字符和文字。模

80、擬實(shí)驗(yàn)結(jié)果表明,該方法的二值化效果明顯優(yōu)于Bernsen方法和Otsu方法,且具有良好的適應(yīng)性。</p><p>  基于貝葉斯算法的二值化算法。針對(duì)在圖像二值化過(guò)程中動(dòng)態(tài)選取閾值難的問(wèn)題,在分析了全局閾值法和局部閾值法各自優(yōu)缺點(diǎn)的基礎(chǔ)上。提出了一種基于貝葉斯算法的全局閾值法和局部閾值法相結(jié)合的二值化方法。經(jīng)實(shí)驗(yàn)證明,該方法既能夠有效地消除光照不均勻?qū)D像的影響,較好地保留目標(biāo)圖像的細(xì)節(jié),又能夠有效地消除偽影,提

81、高處理速度。</p><p>  在模式識(shí)別中,二值化效果的好壞直接影響著識(shí)別效果,首先通過(guò)改進(jìn)的Bernsen方法對(duì)原始圖像進(jìn)行二值化,得到第一幅源圖像;然后根據(jù)自組織神經(jīng)網(wǎng)絡(luò)計(jì)算閾值,對(duì)圖像進(jìn)行二值化,得到第二幅源圖像;再根據(jù)灰度值最小的原則作為圖像融合方法,得到最終的二值化圖像,最后給出模擬實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該方法是有效的。提出了一種新的圖像二值化方法。</p><p>  圖像的帶

82、參數(shù)的二值化方法。該方法不僅在實(shí)現(xiàn)傳統(tǒng)的黑白二值化方面。有強(qiáng)于Windows的繪圖軟件的黑白二值化功能。而且可以實(shí)現(xiàn)任意灰度間隔的二值化。因此該方法除能用于任意灰度起點(diǎn)的一般意義上的二值化外.特別適宜于圖像的挖掘和隱藏。</p><p>  圖像處理中閾值法計(jì)算簡(jiǎn)單,具有較高的運(yùn)算效率,是圖像分割中廣泛采用的方法,主要分為全局閾值法和局部閾值法。針對(duì)顆粒圖像,提出了一種基于形態(tài)學(xué)的最大類間方差Otsu二值化算法,

83、實(shí)驗(yàn)證明,該算法這一算法能較好地保留原圖像中的特征,二值化后的圖像效果不錯(cuò)。</p><p>  數(shù)碼管圖像的目標(biāo)和背景分離不明顯,直方圖分布較復(fù)雜。針對(duì)該問(wèn)題,提出基于拉普拉斯高斯(Laplacian of Gaussian,LOG)算子邊緣檢測(cè)的全局二值化方法對(duì)其進(jìn)行處理,該方法通過(guò)提取圖像邊緣部分的像素灰度獲得圖像二值化的閾值。處理結(jié)果表明,與傳統(tǒng)的幾種方法相比,該方法能夠快速選取良好的二值化閾值,較好地區(qū)

84、分目標(biāo)和背景,在相當(dāng)大模板寬度內(nèi)圖像二值化的結(jié)果都令人滿意。</p><p>  遺傳算法是當(dāng)前許多科學(xué)實(shí)驗(yàn)領(lǐng)域廣泛應(yīng)用的一種非線性并行算法。一種基于遺傳算法的灰度圖二值化方法研究了遺傳算法在數(shù)字圖像的灰度圖二值化中的應(yīng)用,提出了一種新的灰度圖二值化方法。該方法通過(guò)對(duì)每個(gè)子群體的優(yōu)化計(jì)算和動(dòng)態(tài)改進(jìn)的適應(yīng)度函數(shù),確定新的分割閾值。實(shí)驗(yàn)驗(yàn)證該方法對(duì)于噪聲干擾的一般質(zhì)量圖像有著良好的效果。</p><

85、;p>  基于邊緣特征的二值化閾值選取方法,閾值選取是圖象處理與分析的基礎(chǔ)。針對(duì)幾種常用的圖像二值化自動(dòng)選取閾值方法,通過(guò)計(jì)算機(jī)仿真對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了比較研究。在此基礎(chǔ)上,提出了一種新的圖像二值化算法。該算法著重于在圖像二值化時(shí)保留圖像的邊緣特征。實(shí)驗(yàn)結(jié)果表明,這個(gè)基于邊緣特征檢測(cè)算子的算法能很好地保留原圖的邊緣特征,并能處理低質(zhì)量的圖像。</p><p>  圖像二值化是指用灰度變換來(lái)研究灰度圖像的一種常用

86、方法,即設(shè)定某一閾值將灰度圖像的像素分成大于閾值的像素群和小于閾值的像素群兩部分。例如輸人灰度圖像函數(shù)為,輸出二值圖像函數(shù)為,則</p><p><b>  (3-1)</b></p><p>  閾值(threshold )是把目標(biāo)和背景區(qū)分開(kāi)的標(biāo)尺,選取適當(dāng)?shù)拈撝稻褪羌纫M可能保存圖像信息,又要盡可能減少背景和噪聲的干擾,這是選擇閾值的原則。</p>

87、<p>  灰度圖像的二值化處理有很多種方法,主要分為全局閾值法和局部閾值法。</p><p><b>  3.3 全局閾值法</b></p><p>  全局閾值法是指在二值化過(guò)程中只使用一個(gè)全局閾值的方法。它將圖像的每個(gè)像素的灰度值與進(jìn)行比較,若大于,則取為前景色(白色);否則,取為背景色。根據(jù)文本圖像的直方圖或灰度空間分布確定一個(gè)閾值,以此實(shí)現(xiàn)灰度文

88、本圖像到二值圖像的轉(zhuǎn)化。其中全局閾值法又可分為基于點(diǎn)的閾值法和基于區(qū)域的閾值法。閾值分割法的結(jié)果很大程度上依賴于對(duì)閾值的選擇,因此該方法的關(guān)鍵是如何選擇合適的閾值。</p><p>  典型的全局閾值方法包括Otsu方法、最大熵方法等。全局閾值法算法簡(jiǎn)單,對(duì)于目標(biāo)和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對(duì)于由于光照不均勻、噪聲干擾較大等原因使直方圖分布不呈雙峰的圖像,二值化效果明顯變差。</p&g

89、t;<p>  為了滿足圖像處理應(yīng)用系統(tǒng)自動(dòng)化及實(shí)時(shí)性要求,圖像二值化的閾值的選擇最好由計(jì)算機(jī)自動(dòng)來(lái)完成。下面列舉幾個(gè)閾值的自動(dòng)選擇算法:</p><p>  (1) 平均灰度值法:以圖像中所有像素灰度值的平均值為閾值。</p><p>  (2) 大津法:又稱最大類間差法,是基于整幅圖像的統(tǒng)計(jì)特性,實(shí)現(xiàn)閾值的自動(dòng)選取。其原理是把圖像直方圖用某一灰度值分割成兩類,分別計(jì)算這兩

90、類的像素點(diǎn)數(shù)和灰度平均值,然后計(jì)算它們的類間方差。當(dāng)被分割成的兩類類間方差最大時(shí),此灰度值就作為圖像二值化處理的閾值。大津法的使用范圍比較廣,不論圖像的直方圖有無(wú)明顯的雙峰,都能得到較滿意的結(jié)果,在很多領(lǐng)域得到了應(yīng)用和發(fā)展。但此方法依然存在一些不足,主要表現(xiàn)在:若目標(biāo)與背景之間灰度差不明顯,可能出現(xiàn)大塊黑色區(qū)域,甚至丟失整幅圖像的信息;僅利用一維灰度直方圖分布,沒(méi)有結(jié)合圖像的空間相關(guān)信息,處理效果不好;當(dāng)圖像中有斷裂現(xiàn)象或者背景有一定噪

91、聲時(shí),無(wú)法得到預(yù)期效果。 </p><p>  (3) 邊緣算子法:采用Laplace算子、Robert算子、Sober算子等對(duì)像素點(diǎn)進(jìn)行灰度級(jí)增強(qiáng)或減弱的變換。對(duì)于灰度均勻分布的區(qū)域內(nèi)的像素點(diǎn),這些算子對(duì)其進(jìn)行灰度減弱;對(duì)于在邊緣附近的像素點(diǎn),這些算子對(duì)其進(jìn)行灰度增強(qiáng)。 </p><p><b>  3.4 局部閾值法</b></p><p&

92、gt;  由當(dāng)前像素灰度值與該像素周圍點(diǎn)局部灰度特征來(lái)確定像素的閾值。例如可以將原圖像劃分為一些不相交的小塊,將各塊圖像的灰度均值作為該部塊圖像的閾值,在局部上采用上面的整體閾值法。</p><p>  對(duì)于目標(biāo)和背景比較清楚的圖像,全局閾值化方法可以取得較好結(jié)果。但是如果圖像的背景不均勻,或目標(biāo)灰度變化率比較大,全局方法便不再適用。局部閾值法是用像素灰度值和此像素鄰域的局部灰度特性來(lái)確定該像素的閾值的。當(dāng)照明不

93、均勻、有突發(fā)噪聲,或者背景灰度變化較大時(shí),局部閾值確定技術(shù)必須根據(jù)像素的坐標(biāo)位置關(guān)系自動(dòng)確定不同閾值,實(shí)施動(dòng)態(tài)的自適應(yīng)二值化處理。局部閾值選取一般將圖像劃分為若干子圖像,在每個(gè)子圖像區(qū)域上使用整體閾值法,從而可以構(gòu)成整幅圖像的局部閾值法(根據(jù)每個(gè)子圖像確定相應(yīng)的閾值,具體的閾值確定方法同全局閾值的確定類似)。用這種方法分割后的圖像在不同子圖像的邊界處有灰度的不連續(xù)分布,因此必須采用平滑技術(shù)來(lái)消除灰度的不連續(xù)性。 </p>

94、;<p>  局部閾值法一般用于識(shí)別干擾比較嚴(yán)重、品質(zhì)較差的圖像,相對(duì)整體閾值方法有更廣泛的應(yīng)用,但也存在缺點(diǎn)和問(wèn)題,如實(shí)現(xiàn)速度慢、不能保證字符筆畫連通性以及容易出現(xiàn)偽影現(xiàn)象(即在背景域受到噪音干擾得到筆畫結(jié)果)等。比較典型的局部二值化算法有Bernsen方法、多閾值的梯度強(qiáng)度法、基于紋理圖像的方法、最大方差法等。</p><p>  第四章 Otsu方法和Bernsen方法</p>

95、<p>  4.1 Otsu算法分析</p><p>  Otsu 在1979 年提出的最大類間方差法(有時(shí)也稱之為大津法),該方法的基本思想是:設(shè)閾值將圖像分割成兩組,一組灰度對(duì)應(yīng)目標(biāo),另一組灰度對(duì)應(yīng)背景,則這兩組灰度值的類內(nèi)方差最小,兩組的類間方差最大。對(duì)圖像Image,記為目標(biāo)與背景的分割閾值,目標(biāo)像素?cái)?shù)占圖像比例為,平均灰度為;背景像素?cái)?shù)占圖像比例為,平均灰度為。圖像的總平均灰度為:。從最小灰度

96、值到最大灰度值遍歷,當(dāng)使得值 最大時(shí)即為分割的最佳閾值。對(duì)大津法可作如下理解:該式實(shí)際上就是類間方差值,閾值分割出的目標(biāo)和背景兩部分構(gòu)成了整幅圖像,而目標(biāo)取值,概率為 ,背景取值,概率為,總均值為,根據(jù)方差的定義即得該式。因方差是灰度分布均勻性的一種度量,方差值越大說(shuō)明構(gòu)成圖像的兩部分差別越大,當(dāng)部分目標(biāo)點(diǎn)錯(cuò)分為背景或部分背景點(diǎn)錯(cuò)分為目標(biāo)點(diǎn)都會(huì)導(dǎo)致兩部分差別變小,因此使類間方差最大的分割意味著錯(cuò)分概率最小。記為圖像點(diǎn)處的灰度值,灰度級(jí)為

97、,不妨假設(shè)取值。記為灰度值為k的頻率,則有:</p><p><b>  (4-1)</b></p><p>  假設(shè)用灰度值t為閾值分割出的目標(biāo)與背景分別為:和,于是目標(biāo)部分比例:</p><p>  , (4-2)</p><p><b>  目標(biāo)部分

98、點(diǎn)數(shù):</b></p><p><b>  (4-3)</b></p><p><b>  背景部分比例:</b></p><p><b>  (4-4)</b></p><p><b>  背景部分點(diǎn)數(shù):</b></p><

99、;p><b>  (4-5)</b></p><p><b>  目標(biāo)均值:</b></p><p><b>  (4-6)</b></p><p><b>  背景均值:</b></p><p><b>  (4-7)</b>

100、</p><p><b>  總均值:</b></p><p><b>  (4-8)</b></p><p>  大津法指出求圖像最佳閾值g的公式為:</p><p><b>  (4-9)</b></p><p>  該式右邊括號(hào)內(nèi)實(shí)際上就是類間方差

101、值,閾值g分割出的目標(biāo)和背景兩部分構(gòu)成了整幅圖像,而目標(biāo)值,概率為,背景取值,概率為,總均值為,根據(jù)方差的定義即得該式。因此方差是灰度分布均勻性的一種度量,方差值越大,說(shuō)明構(gòu)成圖像的兩部分差別越大,當(dāng)部分目標(biāo)錯(cuò)分為背景或部分背景錯(cuò)分為目標(biāo)都會(huì)導(dǎo)致兩部分差別變小,因此使類間方差最大的分割意味著錯(cuò)分概率最小,這便是大津法的真正含義。其實(shí),換一種思想也能很好的理解大津方法。和,可以分別代表目標(biāo)和背景的中心灰度,則代表整幅圖像的中心灰度,要使目

102、標(biāo)和背景得到最好的分割,當(dāng)然希望分割出的目標(biāo)盡量遠(yuǎn)離圖像中心,即或盡量大,背景也盡量遠(yuǎn)離中心,即或盡量大,由于希望兩者都大,于是有:</p><p><b>  兩者之加權(quán)和最大:</b></p><p><b>  (4-10)</b></p><p><b>  兩者之積最大:</b></p

103、><p><b>  (4-11)</b></p><p>  注意到有,且,因此有:,可見(jiàn)二者等價(jià)。</p><p>  4.2 Otsu方法流程圖</p><p>  Otsu方法流程圖如圖4.1所示。</p><p>  4.3 Bernsen算法分析</p><p> 

104、 局部閾值法把灰度閾值選取為隨像素位置變化而變化的函數(shù),它是一種動(dòng)態(tài)選擇閾值的自適應(yīng)方法。</p><p>  設(shè)圖像在像素點(diǎn)處的灰度值為,考慮以像素點(diǎn)為中心的窗口,(表示窗口的邊長(zhǎng)),則Bernsen算法可以描述如下:</p><p>  計(jì)算圖像中各個(gè)像素點(diǎn)的閾值</p><p><b>  (4-12)</b></p>&l

105、t;p>  對(duì)圖像中各像素點(diǎn)用值逐點(diǎn)進(jìn)行二值化。</p><p><b>  (4-13)</b></p><p>  用存儲(chǔ)灰度圖像的值,設(shè)為,把邊界擴(kuò)展成 extend矩陣。</p><p>  4.4 Bernsen方法流程圖</p><p>  首先讀取原圖像的大小為。由于中的元素不是每個(gè)都是在窗口的中心

106、,所以需要對(duì)灰度圖像進(jìn)行擴(kuò)展。首先創(chuàng)建一個(gè)的矩陣extend,把矩陣中的像素,而第一行和最后一行,第一列和最后一列的填充依據(jù)是以它靠近的行或列為對(duì)稱軸進(jìn)行填充。遍歷從到的像素,并取以當(dāng)前像素為中心的窗口的最大像素max和最小像素min,依據(jù)公式求出閾值。把灰度圖像矩陣賦值于另一矩陣,以免改變當(dāng)前得到的灰度圖像矩陣。遍歷該矩陣,對(duì)當(dāng)前灰度值與比較,如果大于賦予1,判為目標(biāo)像素類,否則賦予0,作為背景像素類。顯示得到的二值圖像。</p

107、><p>  Bernsen方法流程圖如圖4.2所示。</p><p>  第五章 Otsu方法和Bernsen方法實(shí)驗(yàn)比較</p><p>  本設(shè)計(jì)只是對(duì)于bmp格式灰度圖像進(jìn)行研究。用Otsu方法和Bernsen方法對(duì)圖像進(jìn)行二值化處理,以下為研究對(duì)象的幾張?jiān)紙D像如圖5.1所示。</p><p>  (a) (b)

108、 (c)</p><p>  (d) (e) (f)</p><p><b>  圖5.1 原圖</b></p><p>  (a) lena原始圖像(128×128); (b)peppers原始圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論