廈門大學計算機專業(yè)本科畢業(yè)論文_第1頁
已閱讀1頁,還剩28頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p><b>  本科畢業(yè)論文</b></p><p>  (科研訓練、畢業(yè)設(shè)計)</p><p>  題 目:基于顏色特征的圖像檢索</p><p><b>  方法研究與實現(xiàn)</b></p><p><b>  姓 名: </b></p>

2、<p>  學 院:信息科學與技術(shù)</p><p><b>  系:計算機</b></p><p>  專 業(yè):計算機</p><p>  年 級:2004</p><p>  學 號:04120074</p><p>  指導教師(校內(nèi)): 職稱:

3、教授</p><p>  指導教師(校外) 職稱:</p><p>  年 月 日</p><p>  基于顏色特征的圖像檢索方法研究與實現(xiàn)</p><p>  【摘要】本文介紹了一個基于改進的加權(quán)顏色直方圖的圖象檢索系統(tǒng)。</p><p>  本系統(tǒng)通過將基于改進的加權(quán)的局域顏色直方圖

4、的圖像檢索方法和全局直方圖的圖像檢索方法相結(jié)合,提高查全率和查準率。其中,基于分塊局域直方圖的檢索方法利用了圖像中間部分的重要性,將圖像平均劃分成3×3個子塊,取中間一塊的圖像,計算其與參考位圖相應(yīng)位置的顏色特征距離,再計算原圖的顏色直方圖與參考位圖的顏色特征距離,分別賦予權(quán)值后得出的值就是圖像之間內(nèi)容的相似程度。本文引入歐氏距離的相似性度量方法實現(xiàn)圖像檢索。實驗表明,該方法具有較好的查全率和查準率。</p>&

5、lt;p>  【關(guān)鍵字】圖像檢索,顏色特征,顏色直方圖,相似性度量方法</p><p>  CONTENT-BASED IMAGE RETRIEVAL SYSTEM</p><p>  LEARN AND REALIZATION</p><p><b>  ABSTRACT</b></p><p>  This i

6、mage retrieval system is based on a improved weighted color histogram. </p><p>  With combining the improved image retrieval algorithem of based on the weighted central-block color histogram and the image re

7、trieval algorithem of overall histogram, the recall rate and the rate of search is improved . Using the importance of the image of the middle part, the retrieval method based on the block local histogram divide a pictur

8、e into an average of 3 × 3 sub-blocks. Choose the middle one , calculate the colour feature distance between the middle block of original image and the mi</p><p>  The experiments show that the method h

9、as a better recall rate and the rate of search.</p><p>  Keywords: Image Retrieval, features of color,color histogram, similar methods of measurement</p><p><b>  目錄</b></p>&l

10、t;p>  摘要--------------------------------------------------------------I</p><p>  ABSTRACT----------------------------------------------------------II</p><p>  緒論------------------------------

11、-------------------------1</p><p>  1.1 課題研究的目的和意義---------------------------------------1 </p><p>  1.2 圖像檢索系統(tǒng)的關(guān)鍵技術(shù)----------------------------------------</p><p>  1.3 國內(nèi)

12、外研究現(xiàn)狀---------------------------------------------</p><p>  1.4 本文所作的主要工作-----------------------------------------</p><p>  基于顏色特征的圖像檢索--------------------------------------</p><p>

13、  2.1 顏色模型---------------------------------------------------</p><p>  2.1.1 RGB模型</p><p>  2.1.2 HSV模型</p><p>  2.1.3 CMY 模型</p><p>  2.1.4 L*a*b模型</p><p>

14、;  2.2 顏色特征的提取與表達-----------------------------------</p><p>  2.2.1全局顏色直方圖</p><p>  2.2.2基于分塊顏色直方圖法</p><p>  2.2.3累加直方圖</p><p>  2.2.4局部累加直方圖</p><p>  2.3

15、圖像特征的相似性匹配---------------------------------------</p><p>  2.3.1直方圖相交法</p><p>  2.3.2歐式距離方法</p><p><b>  2.3.3模糊方法</b></p><p>  圖像檢索系統(tǒng)的設(shè)計--------------------

16、---------------------</p><p><b>  3.1 系統(tǒng)設(shè)計</b></p><p><b>  3.1.1算法分析</b></p><p><b>  3.2 系統(tǒng)的實現(xiàn)</b></p><p>  3.3 一個圖像檢索實例</p>

17、<p><b>  第一章 緒論</b></p><p>  課題研究的目的和意義</p><p>  隨著多媒體技術(shù)的快速發(fā)展,計算機硬件技術(shù)的不斷更新,以圖片、圖表、動畫和視頻為形式的信息發(fā)布量日益龐大,隨之出現(xiàn)了大量龐大的不同內(nèi)容的圖像信息庫。數(shù)字圖像的應(yīng)用包括國防軍事、工業(yè)制造、醫(yī)療衛(wèi)生、新聞媒體、大眾娛樂等各方面。人們在工作生活中越來越多地接觸到

18、大量的各種各樣的圖像信息。</p><p>  首先,在科學計算、可視化、工程制圖及其他眾多的應(yīng)用領(lǐng)域如數(shù)字圖書館、天氣預報、知識產(chǎn)權(quán)保護、天氣預報、醫(yī)療圖像管理、犯罪預防、軍事觀察和地球資源觀察系統(tǒng)、宇宙探測、交通檢測等領(lǐng)域,每天都有數(shù)量非常巨大的圖像信息在不斷產(chǎn)生與使用。</p><p>  其次,隨著Internet的發(fā)展,網(wǎng)絡(luò)的應(yīng)用和發(fā)展對社會各個領(lǐng)域產(chǎn)生了巨大影響,特別是WEB的

19、興起,網(wǎng)絡(luò)上傳輸?shù)男畔⒄灾笖?shù)級增長。作為一種全新的媒體和公共資源,越來越多的圖像信息出現(xiàn)在Web站點上,但是它們都是無序、無索引的,在這樣的環(huán)境下尋找感興趣的資料是非常耗時的。因此,人們對信息檢索工具和系統(tǒng)的依賴將會日益增加。</p><p>  面對信息量如此巨大的圖像信息,熱門迫切需要一種有效的檢索方法。傳統(tǒng)的圖像檢索技術(shù)是基于文本索引的圖像檢索,通過用文本描述圖像的語義,然后再這些圖像文本標注基礎(chǔ)上應(yīng)用成

20、熟的文本搜索算法,為用戶搜索預期的圖像。雖然檢索比較準確而且速度很快,但是隨著圖像數(shù)據(jù)庫規(guī)模的增大(如數(shù)十萬以上),這種檢索消耗的時間大大增加,而且人工標注具有主觀性和不確定性。鑒于上述因素,人們提出了一種新的圖像檢索技術(shù)--基于圖像內(nèi)容的檢索CBIR(contented-based image retrieval),它不需要用戶的參與,而利用圖像自身的特征,如顏色、紋理、形狀等特征來進行檢索,具有較強的客觀性?;趦?nèi)容的圖像檢索是一種

21、實用性很強的技術(shù),有著廣闊的前景,涉及到社會和生活的方方面面。</p><p>  圖像檢索系統(tǒng)的關(guān)鍵技術(shù)</p><p>  目前,對于通用的靜止圖像檢索,用于檢索的特征主要有顏色(Color)、紋理(Texture)、形狀(Shape)等,其中顏色、紋理、形狀應(yīng)用尤為普遍;活動視頻檢索脫胎于序列圖像分析中的技術(shù)。本文主要研究對靜止圖像檢索,其中數(shù)據(jù)庫是專用的圖像庫。</p>

22、<p>  對于目標圖像和檢索圖像進行顏色空間轉(zhuǎn)換、亮度圖像的邊緣提取和二值分割、提取目標區(qū)域的顏色特征。顏色內(nèi)容包含兩個一般的概念,一個對應(yīng)于全局顏色分布,一個對應(yīng)于局部顏色信息。按照全局顏色分布來索引圖像可以通過計算每種顏色的像素的個數(shù)并構(gòu)造顏色灰度直方圖來實現(xiàn),這對檢索具有相似的總體顏色內(nèi)容的圖像是一個很好的途徑。局部顏色信息是指局部相似的顏色區(qū)域,它考慮了顏色的分類與一些初級的幾何特征。比如Smith等提出了顏色集

23、合(color set)方法來抽取空間局部顏色信息并提供顏色區(qū)域的有效索引。</p><p>  運用顏色直方圖進行檢索有如下三種方式:</p><p> ?。?)指明顏色組成--該法需要用戶對圖像中的顏色非常敏感,而且使用起來也不方便,檢索的查準率和查全率并不高,因此暫時不做進一步開發(fā)。</p><p> ?。?)指明一幅示例圖像--通過與用戶確定的圖像的顏色直方

24、圖的相似性匹配得到查詢結(jié)果,這是該課題研究方法的根本。</p><p> ?。?)指明圖像中一個子圖--分割圖像為各個小塊,然后利用選擇小塊來確定圖像中感興趣的對象的輪廓,通過建立更復雜的顏色關(guān)系(如顏色對方法)來查詢圖像,該方法是進一步優(yōu)化檢索的一個設(shè)想。</p><p>  在顏色空間選取方面,最常用的顏色空間是RGB顏色空間。通常,人們采用歐氏距離來刻畫兩種顏色之間的差異,RGB空間

25、存在的一個嚴重問題是其中所計算出來的兩種顏色之間的距離無法正確表征人們實際所感知到的這兩種顏色之間的真實差異。</p><p>  HSI空間比較直觀并且符合人的視覺特性。HSI顏色模型有兩個重要的特點作為基礎(chǔ)。首先,I分量與彩色信息無關(guān),其次H和S分量與人感受彩色的方式緊密相連,其中H分量尤其影響人類的視覺判斷。這些特點使得HSI模型非常適合基于人視覺系統(tǒng)對彩色感知特性的圖像處理。</p><

26、;p>  得到圖像特征的統(tǒng)計直方圖后,不同圖像間的特征匹配可借助計算直方圖間的距離來進行。一般意義上直方圖匹配方法有直方圖相交法,直方圖匹配法,歐氏距離法,中心矩法,累積直方圖匹配法共6種。本文重點討論歐氏距離法,并將其作為系統(tǒng)編程實現(xiàn)的主要方法。</p><p>  所以,顏色特征的圖像檢索關(guān)鍵技術(shù)路徑如圖一:</p><p>  圖1-1 顏色特征的圖像檢索關(guān)鍵技術(shù)路徑</

27、p><p><b>  國內(nèi)外研究現(xiàn)狀</b></p><p>  基于內(nèi)容的圖像檢索技術(shù)開始于上世紀90年代初期,目前已有十幾年歷史,是當前研究的熱點,許多著名雜志如IEEE Trans. On PAMI 、IEEE Trans. On Image processing 等紛紛設(shè)專刊介紹該領(lǐng)域研究的最新成果,著名的國際會議如:IEEE conference of CVP

28、R 、 ACM conference on multimedia等紛紛設(shè)立專題交流最新的研究成果。各大研究機構(gòu)和公司都推出了他們的系統(tǒng),在商用領(lǐng)域,IBM 首先研制出了QBIC系統(tǒng);在學術(shù)研究領(lǐng)域,MIT的Photobook系統(tǒng),新加坡國立大學的CORE系統(tǒng),美國哥倫比亞大學的VisualSEEK系統(tǒng),加利福尼亞大學Santa Barbara分校的Netra、伊利諾依大學的MARS、CMU的Infomedia以及哥倫比亞大學的Video

29、Q等。下面主要介紹這些系統(tǒng)概況:</p><p><b>  1.QBIC系統(tǒng) </b></p><p>  IBM Almaden研究中心研究開發(fā)的,是基于內(nèi)容檢索系統(tǒng)的典型代表。QBIC系統(tǒng)允許使用例子圖像、用戶構(gòu)建的草圖和圖畫、選擇的顏色和紋理模式、鏡頭和目標運動和其他圖形信息等,對大型圖像和視頻數(shù)據(jù)庫進行查詢。 </p><p>  2

30、.Photobook系統(tǒng) </p><p>  MIT的媒體實驗室在1994年開發(fā)研制的。圖像在裝入時按人臉、形狀或紋理特性自動分類,圖像根據(jù)類別通過顯著語義特征壓縮編碼。 </p><p><b>  3.CORE系統(tǒng) </b></p><p>  新加坡國立大學開發(fā)的一個基于內(nèi)容的檢索機。其顯著技術(shù)特色包括: 多種特征提取方法、多種基于內(nèi)容

31、檢索方法、使用自組織神經(jīng)網(wǎng)絡(luò)對復雜特征度量、建立基于內(nèi)容索引的新方法以及對多媒體信息進行模糊檢索的新技術(shù)。 </p><p>  4.VisualSEEK系統(tǒng) </p><p>  美國哥倫比亞大學圖像和高級電視實驗室開發(fā)的。它實現(xiàn)了互聯(lián)網(wǎng)上的"基于內(nèi)容"的圖像/視頻檢索系統(tǒng),提供了一套工具供人們在Web上搜索和檢索圖像和視頻。</p><p>

32、<b>  本文所作的主要工作</b></p><p>  從圖一的技術(shù)路徑分析,結(jié)合設(shè)計要求,我們需要對要素工作具體化,目的是使系統(tǒng)試驗簡單高效而不失代表性。如下:</p><p>  顏色空間選取 —— 面向硬件的RGB空間和面向視覺的HSI 空間;</p><p>  顏色特征的表達 —— 全局直方圖,全局累加直方圖,局部累加直方圖;&l

33、t;/p><p>  相似性度量 —— 歐氏距離計算方法。</p><p>  基于顏色特征的圖像檢索</p><p>  圖像是通過顏色表現(xiàn)出來的,顏色是圖像最重要的屬性。所以,對于基于內(nèi)容的圖像檢索來說圖像采取哪種顏色表示方式就顯得尤為重要。本章的主要任務(wù)是分析不同的顏色空間表示方式以及適合于圖像檢索系統(tǒng)的顏色空間。</p><p><

34、b>  2.1顏色模型</b></p><p>  圖像是通過顏色表現(xiàn)出來的,顏色是彩色圖像的最顯著的特征,與其它特征相比,顏色特征具有非常穩(wěn)定,對于旋轉(zhuǎn)、平移、尺度變化都不敏感,表現(xiàn)出很強的魯棒性,又由于顏色特征計算簡單,因此基于顏色的查詢成為現(xiàn)有基于內(nèi)容的圖像檢索系統(tǒng)中應(yīng)用最基本的方法。而如何選取合適的顏色特征,以及對顏色特征如何進行有效的抽取將關(guān)系到最終的顏色特征的相似性比較和檢索的效果。

35、</p><p>  顏色模型是指某個三維顏色空間中的一個可見光子集,它包含某個顏色域的所有顏色。顏色模型的用途是在某個顏色域內(nèi)方便的指定顏色。由于每一個顏色域都是可見光的子集,所以任何一個顏色模型都無法包含所有的可見光。</p><p>  常見的顏色模型包括RGB(紅、綠、藍);HSV(色調(diào)、飽和度、亮度);CMYK(青、洋紅、黃、黑);以及CIE組織的L*a*b等。</p>

36、;<p>  2.1.1 RGB模型</p><p>  面向硬設(shè)備的最常用顏色模型是RGB模型。在RGB模型中,所有顏色都可看作是3個基本顏色,即紅(R,red),綠(G,green)和藍(B,blue)的不同組合。將這三種顏色成分分別人為地分成0到255共256個等級,0表示沒有刺激量,255表示刺激量達到最大值。R、G、B均為255時表示白光,均為0時表示黑色。這樣,我們就能表示出256

37、15;256×256(約1600萬)種顏色。</p><p>  如圖2-1所示,采用三維直角坐標系,紅、綠、藍為原色,各個原色混合在一起產(chǎn)生復合色。絕大部分的可見光譜可以用紅、綠、藍R(、G、B)三色光按不同比例和強度的混合來表示。在顏色重疊的位置,產(chǎn)生青色、洋紅和黃色。因為RGB顏色合成產(chǎn)生白色,它們也稱為加色。將所有顏色加在一起產(chǎn)生白色,也就是說,所有光被反射回眼睛。加色用于光照、視頻和顯示器。&

38、lt;/p><p>  RGB顏色模型通常采用單位立方體來表示,在正方體的主對角線上,各原色的強度相等,產(chǎn)生由暗到明的白色,也就是不同的灰度值。(0,0,0)為黑色,(l,1,1)為白色。正方體的其它六個角點分別為紅、黃、綠、青、藍和品紅,需要注意的一點是,RGB顏色模型所覆蓋的顏色域取決于顯示設(shè)備熒光點的顏色特征,是與硬件相關(guān)的。在顯示屏上顯示顏色定義時,往往采用這種模式。圖像如用于電視、幻燈片、網(wǎng)絡(luò)、多媒體,一般

39、使用RGB模式。</p><p>  圖2-1 RGB顏色模型</p><p>  雖然RGB彩色模型被廣泛應(yīng)用于CRT設(shè)備顯示彩色圖像,但它并不是一個均勻視覺的顏色空間,不符合人對顏色的感知心理,而且,RGB顏色空間上的距離并不代表人眼視覺上的顏色知覺差異。但在對彩色圖像進行特征提取時,需要用數(shù)量來描述顏色的差別,因此需要用另一種符合人的視覺心理的視覺彩色模型來表示顏色。</p&

40、gt;<p>  2.1.2 HSV模型</p><p>  HSv空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此被廣泛應(yīng)用于計算機視覺領(lǐng)域[25]。它把彩色信號表示為三種屬性:色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(value),其中亮度又稱LightneSS或Intensity,所以HSV空間還有HLS和HIS這兩種叫法。</p>

41、<p>  HSV模型的色調(diào)H表示從一個物體反射過來的或透過物體的光的波長,更一般地說,色調(diào)是由顏色名稱來辨別的,如紅、橙、黃、綠等,它用角度-180~180或O~360來度量。亮度V是顏色的明暗程度,通常用百分比度量,O%為最暗的黑色,而100%為最亮的白色。飽和度S指顏色的深淺程度,即在純色中包含的白色光的成份。例如同樣是紅色,也會因顏色濃度不同而分為深紅色、粉紅色和淺紅色。飽和度S也用百分比來度量,從濃度最小的O%到濃

42、度完全飽和的100%。色調(diào)H和飽和度S分量合起來定義了顏色的色度(Chromatieity)特性。HSV顏色模型用Munsell三維空間坐標系統(tǒng)表示,其示意圖如圖2-2所示。</p><p>  2-2 HSV顏色模型</p><p>  Munsen顏色空間具有以下己經(jīng)被人的眼睛所證實的特點:</p><p>  1.坐標之間的心理感知獨立性(Pereeptua

43、lIndependenee),即人可以獨立感知各顏色分量的變化。</p><p>  2.線性伸縮性(LinearSealability),人眼可感知的顏色差異與HSV顏色分量的相應(yīng)值上的歐幾里德距離(EuelideanDIStanee)是成比例的。因為HSV顏色空間根據(jù)色調(diào)H的值來區(qū)分不同的顏色,因此在HSV的三個分量中,H分量是尤為重要的,它可以很好地模擬人類對顏色的識別和記憶過程。</p>&

44、lt;p>  2.1.3CMY模型</p><p>  以紅、綠、藍的補色青(eyan)、品紅(Magenta)、黃(Yellow)為原色構(gòu)成的CMY顏色模型,常用于從白光中濾去某種顏色,又被稱為減性原色系統(tǒng)。CMY顏色模型對應(yīng)的直角坐標系的子空間與RGB顏色模型所對應(yīng)的子空間幾乎完全相同。差別僅在于前者的原點為白,而后者的原點為黑。前者是定義在白色中減去某種顏色來定義一種顏色,而后者是通過從黑色中加入顏色

45、來定義一種顏色。CMY模型以打印在紙張上油墨的光線吸收特性為基礎(chǔ),當白光照射到半透明油墨上時,部分光譜被吸收,部分被反射回眼睛。理論上,青(Cyna)、品紅(Magenta)、和黃(Yelolw)色素能夠合成吸收所有的顏色并產(chǎn)生黑色。因為所有打印油墨都會包含一些雜質(zhì),這三種油墨實際上產(chǎn)生一種土灰色,必須與黑色(K)油墨混合才能產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色稱為四色印刷。減色(CMY)和加色(RGB)是互補色,每對減色產(chǎn)生一種加色

46、,反之亦然。如圖2-3所示。</p><p>  2-3 CMY顏色模型</p><p>  2.1.4L*a*b模型</p><p>  L*a*b顏色模型是在1931年國際照明委員會(CIE)制定的顏色度量國際標準的基礎(chǔ)上建立的。1976年,這種模型被重新修訂并命名為CIE L*a*b。L*a*b顏色設(shè)計為與設(shè)備無關(guān),不管使用什么設(shè)備創(chuàng)建或輸出圖像,這種顏色模

47、型產(chǎn)生的顏色都保持一致。L*a*b顏色由亮度或光亮度分量(L)和兩個色度分量組成:即a分量(從綠到紅)和b分量(從藍到黃)。</p><p>  2.2顏色特征的提取與表達</p><p>  1991年Swain和Ballard首次提出了基于顏色直方圖的特征表示,其核心思想是在一定的顏色空間中對圖像中各種顏色出現(xiàn)的頻數(shù)進行統(tǒng)計。具體做法是,在給定的顏色空間基礎(chǔ)上,統(tǒng)計每種顏色分量的像素數(shù)

48、占圖像總像素數(shù)的比例,從而得到圖像各種顏色分量的比例分布—直方圖,最后把直方圖作為圖像的顏色特征進行圖像檢索。由于圖像的顏色直方圖具有尺度不變性和旋轉(zhuǎn)不變性,因此被廣泛采用。</p><p>  顏色直方圖是顏色信息的函數(shù),它表示圖像中具有同顏色級別的像素的個數(shù),其橫坐標是顏色級別,縱坐標是顏色出現(xiàn)的頻率(像素的個數(shù))。但是,直方圖也存在著缺陷。首先,顏色直方圖只包含了圖像中某一顏色值出現(xiàn)的頻數(shù),而丟失了像素點所

49、在的位置信息。而且,雖然對任意一幅圖像都能唯一的給出與它對應(yīng)的直方圖,但不同的圖像卻有可能具有相同的直方圖特征,也就是直方圖與圖像之間并非一一對應(yīng)的,而是一對多的關(guān)系。這些缺點都會影響直方圖特征檢索的有效性。</p><p>  2.2.1 全局顏色直方圖</p><p>  全局直方圖是一種經(jīng)常被采用的顏色特征,已在很多圖像檢索系統(tǒng)中得到應(yīng)用。設(shè)C(x,y)為RGB空間一幅彩色圖像,其顏

50、色直方圖的定義為:</p><p>  其中,M、N為圖像C(x,y)垂直和水平方向上的像素數(shù)目,并簡稱為</p><p>  圖像的高和寬;而k為變換空間的顏色數(shù)。</p><p>  2.2.2 基于分塊顏色直方圖法</p><p>  采用的分塊方法是把圖像分成單獨的N×N塊,并且圖像分塊太大則失去分塊的意義,不能充分包含顏色

51、的分布信息,分塊太小則會增加檢索過程的計算量。經(jīng)試驗比較分析,對二維空間進行3×3劃分是較有效的劃分方案。</p><p>  2.2.3累加直方圖</p><p>  當圖像中的特征并不能取遍所有可取值時,統(tǒng)計直方圖中會出現(xiàn)一些零值。這些零值的出現(xiàn)會對計算直方圖的相交帶來很大影響,從而使得算出的匹配值并不能正確的反映兩圖間的顏色差別。</p><p> 

52、 累加直方圖是以顏色作為橫坐標,從坐標原點到該顏色的所有顏色的像素出現(xiàn)的頻數(shù)為縱坐標繪出的圖形。這樣圖像的累加直方圖向量H可以定義為:</p><p>  表示C1~Ck種顏色的像素的累加頻數(shù):</p><p>  我們已經(jīng)計算出圖像的一般直方圖,可以方便地計算圖像累加直方圖。這樣,最后得到的累加直方圖特征向量為:</p><p>  2.2.4局部累加直方圖<

53、;/p><p>  在HSI空間里,H=0基本對應(yīng)紅色,H=pi/3基本對應(yīng)黃色,H=2pi/3基本對應(yīng)綠色。這樣在H軸上黃色與紅色間,黃色與綠色間距相等。但從人的視覺感知來講,黃色與紅色間,黃色與綠色間本無所謂哪兩個更相似。這表明色度信號的分布從視覺意義上講,并不滿足累加直方圖應(yīng)用的前提。所以,對色彩比較復雜的自然景物圖像,一般累加直方圖算法在檢索中就會將不同色度的信號混淆起來。</p><p&

54、gt;  另外,一幅圖像的顏色一般非常多,尤其是真彩色圖像,因此直方圖矢量的維數(shù)會非常高。如果能采用局部累加后降維,則計算量要少得多。</p><p>  系統(tǒng)設(shè)計中,我們采用Pi/3為區(qū)間的長度,將H軸共分成6個不重疊的局部區(qū)間[60k, 60(k+1)],k=0,1,…5,通過分別計算每個局部區(qū)間的累加直方圖進行檢索。</p><p>  上述方法都保留了顏色在圖像中出現(xiàn)的概率信息,但

55、也丟失了很多顏色的空間信息,因此不同的圖像有可能具有相同顏色特征表示。許多人提出了顏色索引的改進方法---局部顏色特征索引。從劃分局部區(qū)域的角度來說可分為:基于固定塊的圖像分割、基于手工的區(qū)域分割、采用交互的半自動的區(qū)域分割以及一些自動的顏色分割方法。局部區(qū)域中的顏色信息可以表示為平均顏色、主顏色、顏色直方圖和二進制顏色集等來表示。設(shè)計系統(tǒng)中暫不做討論。</p><p>  2.3圖像特征的相似性匹配</p

56、><p>  在基于文本的檢索方法中采用的是文本的精確匹配,而基于內(nèi)容的圖像檢索則是通過計算查詢圖像和圖像庫中候選圖像之間在視覺特征上的相似度匹配進行。因此,定義一個合適的視覺特征相似度度量方法對檢索的效果有很大的影響。視覺特征大豆可以表示成向量的形式,常用的相似度方法也是向量空間模型,即將視覺特征看作是向量空間中的點,通過計算兩個點直接的接近程度來衡量圖像特征間的相似度。常見的方法有:直方圖相交法、直方圖歐氏距離、

57、直方圖余弦距離、二值集hammimg距離、直方圖二次距離度量、二值集二次距離、直方圖Mahalanobis距離。以下只簡要介紹系統(tǒng)中常用的直方圖的交、直方圖歐氏距離兩種距離度量方法。</p><p>  2.3.1直方圖相交法</p><p>  度量直方圖距離的一種經(jīng)典方法就是直方圖相交法。直方圖的相交是指兩個直方圖在每個bin(維度)中共有的像素數(shù)量。具體做法是,根據(jù)顏色索引檢索出查詢

58、圖像的顏色直方圖,將其與圖像庫中的每一圖像的直方圖取交集,根據(jù)交集的值來選出最佳匹配圖像。</p><p>  在直方圖相交法中,令HQ(K)和HR(K)分別為查詢圖像Q和數(shù)據(jù)庫圖像R的特征統(tǒng)計直方圖,則二者之間的匹配值為:</p><p>  直方圖交集方法能對兩幅圖像進行詳細的比較,然而對于許多合成的圖像,如商標等,它們有大量的一致顏色,三維直方圖只有幾個域的值很高,而其它許多域的顏色

59、信息變化有限。因而,對于這樣的圖像進行過細的比較是不必要的。又由于在掃描圖像時容易產(chǎn)生一些噪音,所以這種過細的比較容易產(chǎn)生錯誤的結(jié)果。</p><p>  2.3.2歐氏距離方法</p><p>  我們可以利用歐基里德距離公式(Euclidean Distance)來計算距離。對于兩個 N維直方圖x,y,兩者的歐氏距離可以表示如下:</p><p>  此距離公式

60、雖然簡單,但是與特定的顏色分布無關(guān),因此我們可以引入相關(guān)權(quán)值A(chǔ),這里A是一個維矩陣,此時距離公式可以表述如下:</p><p>  為了簡化計算,將直方圖x,y規(guī)范化使其滿足:</p><p>  矩陣,權(quán)表示顏色i與顏色j之間的相似度。若取z=x-y,則有</p><p>  ,取定了距離公式后,我們需要確定A的取值,且要保證此矩陣A能夠使,我們用表示顏色i與顏色

61、j在RGB顏色空間的距離。</p><p><b>  取。</b></p><p><b>  有 </b></p><p><b>  因為.</b></p><p><b>  2.3.3模糊方法</b></p><p> 

62、 1965年,Zadeh提出了他著名的模糊集理論,從此創(chuàng)建了一個新的學科——模糊數(shù)學。</p><p>  模糊集理論是對傳統(tǒng)集合理論的一種推廣,在傳統(tǒng)集合理論中,一個元素或者屬于一個集合,或者不屬于一個集合;而對于模糊集來說,每一個元素都是以一定的程度屬于某個集合,也可以同時以不同的程度屬于幾個集合。對人們現(xiàn)實生活中大量使用的一些含義確定但又不準確的語言表達,比如“今天天氣很熱”、“車速過高,需要適當踩剎車”等

63、,用模糊數(shù)學可以很好的表達。</p><p>  第三章 圖像檢索系統(tǒng)的設(shè)計</p><p><b>  3.1系統(tǒng)設(shè)計</b></p><p><b>  3.1.1算法分析</b></p><p>  顏色直方圖存在一定的缺陷,同樣的一個對象在不同的背景中得到的兩幅圖片,它們的顏色直方圖可

64、能有很大的差別,在計算相似度時認為不相似(特別是對象在圖像中所占的比例很少時)。一般來說,處于圖像中間的部分對圖像起著重要的作用,而四周僅僅是圖像背景。因此,本文采用的全局顏色直方圖與較簡易的分塊關(guān)鍵直方圖相結(jié)合的方法設(shè)計方法。將圖像平均分成九塊,因此取圖像正中部分以獲取分塊關(guān)鍵直方圖信息,并給這一部分像素分配較大的權(quán)值。如圖3-1。</p><p>  圖3-1(a)

65、 圖3-1(b)</p><p>  這種基于位置劃分的改進顏色直方圖建立步驟為:</p><p> ?。?)根據(jù)上面提出的分塊方法,計算圖像中心區(qū)域的關(guān)鍵顏色直方圖H1</p><p> ?。?)計算整幅圖像的顏色直方圖H2,新的顏色直方圖可以表示為:</p><p>  H = 4 × H2 /9 + 6 × H

66、1 </p><p>  這樣取值的目的是突出了圖像中間位置像素的重要性而弱化了背景區(qū)域像素,這就</p><p>  達到了不同位置的像素根據(jù)重要性分配不同權(quán)值的目的。</p><p>  3.1.2系統(tǒng)結(jié)構(gòu)框圖</p><p>  系統(tǒng)的整個業(yè)務(wù)流程可以用如下框圖表示:</p><p>  圖3

67、-2 基于彩色特征的圖像檢索系統(tǒng)業(yè)務(wù)流程</p><p>  我們可以從系統(tǒng)框圖中抽象出三個層次或者功能模塊:</p><p><b>  顏色空間內(nèi)特征提取</b></p><p>  對圖像數(shù)據(jù)進行特征提取,提取用戶感興趣的、適合檢索要求的特征。顏色空間實現(xiàn)為RGB。對于圖像全局的特征表達為全局顏色直方圖,對于圖像局部的特征表達為局部累計

68、直方圖。</p><p><b>  圖像匹配</b></p><p>  在選取了特征之后,需要選擇或?qū)ふ疫m當?shù)呐袆e準則,從而判斷出待識別的圖像的特征與數(shù)據(jù)庫中的哪些圖像的特征最接近。該系統(tǒng)使用的相似度量方法為歐氏距離法。</p><p><b>  結(jié)果輸出</b></p><p>  將滿足一

69、定相似性條件的一組候選結(jié)果按相似度大小排列后返回給用戶。</p><p>  3.2 系統(tǒng)性能分析</p><p>  本次設(shè)計在XP系統(tǒng)下使用 Visual C++6.0 作為開發(fā)環(huán)境,圖像庫下載了J.Z.Wang的SIMPLIcity系統(tǒng)測試庫,從該庫的1000幅圖片中抽取100張圖片作為測試庫,根據(jù)歐式距離升序排列前16個樣本。該系統(tǒng)的實現(xiàn),沒有采用數(shù)據(jù)庫的形式,直接以文件夾的形式調(diào)

70、用圖像庫。</p><p><b>  圖3-3 檢索結(jié)果</b></p><p>  查全率和查準率是基于內(nèi)容的圖像檢索系統(tǒng)性能的兩個重要的指標。查全率是檢索結(jié)果中相關(guān)的圖像與圖像庫中總的相關(guān)圖像的比,它反映了系統(tǒng)檢索相關(guān)圖像的能力。查準率檢索結(jié)果中相關(guān)的圖像與顯示給用戶的圖像數(shù)目,它反映了系統(tǒng)拒絕無關(guān)圖像的能力。查全率和查準率可以通過下面的式子表示:</p&

71、gt;<p><b>  查全率 = n/N</b></p><p><b>  查準率 = n/T</b></p><p>  其中n表示查詢相關(guān)圖像,N表示圖像庫中與查詢圖像相關(guān)的總的圖像,T表示列表出的圖像數(shù)目。</p><p>  本文從公交車,恐龍,大象,玫瑰花,土著,馬匹等6個圖庫中各抽取16張組

72、成一個96張的檢索庫。因此N = 16, T = 96。</p><p><b>  總結(jié)與展望</b></p><p>  4.1 論文工作總結(jié)</p><p>  本文的主要研究內(nèi)容及結(jié)論在于:</p><p>  廣泛查閱和深入研究了國內(nèi)外基于內(nèi)容的圖像檢索技術(shù)的歷史、最新發(fā)展及其應(yīng)用狀況。</p>

73、<p>  詳細分析了圖像的顏色模型、顏色特征提取方法和顏色空間分布特征提取方法,并總結(jié)了常見的相似度匹配算法。</p><p>  本文提出了一種基于改進的加權(quán)顏色直方圖的圖象檢索系統(tǒng),設(shè)計并實現(xiàn)了一個圖像檢索原型系統(tǒng)。</p><p>  本文在實現(xiàn)所提出的算法時,采用了RGB顏色空間來表示圖像的顏色特征,使用局域的關(guān)鍵直方圖和全局顏色直方圖的歐式距離加權(quán)求和,對所得結(jié)果冒泡

74、排序。圖像檢索取得較好的效果。</p><p>  檢索系統(tǒng)調(diào)用MFC,運用豐富的類庫可以使系統(tǒng)具有更強大的可擴展性。例如Cimage類便實現(xiàn)了多種格式圖像同系統(tǒng)的I/O。</p><p>  參考文獻(References)</p><p>  [1]求是科技,蘇彥華等 ,《Visual C++ 數(shù)字圖像識別技術(shù)典型案例》.人民郵電出版社 </p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論