人臉檢測關鍵技術研究與實現(xiàn)【畢業(yè)設計】_第1頁
已閱讀1頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、<p>  本科畢業(yè)設計(論文)</p><p><b>  (二零 屆)</b></p><p>  人臉檢測關鍵技術研究與實現(xiàn)</p><p>  所在學院 </p><p>  專業(yè)班級 計算機科學與技術 </p>

2、<p>  學生姓名 學號 </p><p>  指導教師 職稱 </p><p>  完成日期 年 月 </p><p>  摘要:人臉識別技術,是生物識別技術中一個非常重要的領域。這一技術有著廣闊的應用前景和迫切的顯示需

3、求。但由于人臉模式的多樣性和圖像獲取過程中的不確定性都導致人臉的檢測和識別是一項十分困難的工作。其中,人臉檢測是人臉識別系統(tǒng)的基礎。并且近幾年來,由于人臉檢測在人臉處理和分析中的地位,人臉檢測已經(jīng)引起了越來越多研究者的注意,并逐漸發(fā)展成為一個相對獨立的研究方向。雖然在研究方法和手段上出現(xiàn)了各種各樣的人臉檢測算法,但是還存在許多不足。因此,本文主要致力于人臉檢測關鍵技術的研究與實現(xiàn)。</p><p>  本文的重點

4、就是利用Matlab建立起一個人臉檢測平臺。選用相關方法對大量圖片樣本進行人臉特征值的提取并轉(zhuǎn)換為數(shù)字圖像樣本的工作。把樣本分成學習和測試兩組數(shù)據(jù),在人臉的識別部分,采用泛化能力很強的支持向量機(SVM)技術,對學習數(shù)據(jù)進行練習并研究,再利用測試數(shù)據(jù)進行人臉檢測的實現(xiàn)。</p><p>  關鍵詞:人臉檢測;支持向量機技術(SVM);數(shù)字圖像;Matlab</p><p>  Face D

5、etection and Implementation of Key Technologies</p><p>  Abstract:Human face recognition is a very important field in biological technology. It has a wide application prospect and urgent current demand. Howe

6、ver, the uncertainty in the course of obtaining face image and the variety of face modes cause the difficulty of face detection and recognition. Among them, face detection is the basis of face recognition system. In thes

7、e years, face detection has caused more and more scholars' attention and developed into a relatively independent research directio</p><p>  The focus of this paper is to build a platform for face detecti

8、on by use matlab. Then choose the relevant method to extraction the face eigenvalue in large picture samples and convert them to the digital image samples. Divided the samples into two sets of data named study and test,

9、in the face recognition part, to learn to practice and study the data, re-use test data for implementation of face detection by use a strong generalization ability of support vector machine (SVM) technology.</p>&

10、lt;p>  Key words: Face Detection; Support Vector Machine (SVM); Digital Image; Matlab</p><p><b>  目錄</b></p><p><b>  1 引言1</b></p><p>  1.1 課題研究的背景和意義

11、1</p><p>  1.2 人臉檢測識別技術研究的現(xiàn)狀與發(fā)展動態(tài)1</p><p>  1.3 人臉檢測識別技術的應用2</p><p>  1.4 人臉檢測識別技術的目前存在的困難3</p><p>  1.5 論文中的安排3</p><p>  2 人臉檢測方法概述4</p>

12、<p>  2.1 膚色區(qū)域分割法5</p><p>  2.2 模板匹配的方法5</p><p>  2.3 基于啟發(fā)式模型的方法5</p><p>  2.4 基于統(tǒng)計模型的方法6</p><p>  3 人臉判別方法研究7</p><p>  3.1人臉判別方法的選擇7</

13、p><p>  3.1.1 基于人工神經(jīng)網(wǎng)絡的方法7</p><p>  3.1.2 基于特征臉的方法7</p><p>  3.1.3 基于支持向量機的方法8</p><p>  3.2 判別方法比較8</p><p>  4 支持向量機理論概述10</p><p>  4.1

14、 支持向量機的前提研究10</p><p>  4.2 對學習機的研究10</p><p>  4.2.1 機器學習的基本問題11</p><p>  4.2.2 經(jīng)驗風險最小化12</p><p>  4.2.3 復雜性與推廣能力12</p><p>  4.3 統(tǒng)計學習理論13</p&

15、gt;<p>  4.3.1 VC維14</p><p>  4.3.2 結(jié)構風險最小化15</p><p>  4.4 支持向量機16</p><p>  5 人臉檢測的實現(xiàn)18</p><p>  5.1 人臉樣本的提取18</p><p>  5.2 基于SVM下的分類19&

16、lt;/p><p>  5.3 主要程序代碼19</p><p>  5.4實驗截圖20</p><p><b>  結(jié)束語21</b></p><p>  致謝錯誤!未定義書簽。</p><p><b>  參考文獻22</b></p><p&

17、gt;<b>  1 引言</b></p><p>  1.1 課題研究的背景和意義</p><p>  隨著科技的不斷進步,人臉檢測的應用也會越加廣泛,在現(xiàn)今我們可以看到在視屏會議、圖像與視屏檢索、智能人機交互等方面都有重要的作用??梢赃@么說,只要有將人臉作為內(nèi)容的視屏或者圖像必然會使用到人臉檢測技術。人臉檢測問題最初來源于人臉識別,人臉自動識別的研究最早可以追

18、溯到20世紀60-70年代。經(jīng)過幾十年的曲折發(fā)展,人臉自動識別已經(jīng)有了一些較為成功的方法,目前正日趨成熟。早期的人臉識別研究主要針對具有強約束條件的人臉圖像(如無背景或背景簡單的圖像),往往假設人臉位置已知貨很容易獲得,因此人臉檢測問題并未受到重視。在20世紀90年代以后,隨著網(wǎng)路安全的電子商務等應用需要的劇增人臉識別成為最有潛力的生物身份鑒別方式,出現(xiàn)了實際的人臉識別系統(tǒng)和商用產(chǎn)品,這種應用背景要求自動人臉識別系統(tǒng)能夠?qū)σ话悱h(huán)境圖像具

19、有一定的適應能力,由此所面臨的一系列問題使得人們對人臉檢測的各個重要方面引起了極大的研究興趣,并逐漸獨立分離出來[1,2]。</p><p>  人臉是常見而復雜的視覺模式,人臉所反映的視覺信息在人與人交流和交往中有著重要的作用和意義,對人臉進行處理和分析在視屏監(jiān)控、出入口控制、視屏會議以及人跡交互等領域都有著廣泛的應用前景,因此是模式識別和計算機視覺領域持續(xù)的研究熱點。對人臉進行處理和分析包括人臉識別、人臉跟蹤

20、、姿態(tài)估計和表情識別等,早期的人臉處理和分析一般都假設已知圖像中的人臉的位置和大小,但對于一個人臉自動處理和分析系統(tǒng)而言,人臉檢測是關鍵性的第一步,人臉檢測算法的精度直接影響著整個系統(tǒng)的性能。</p><p>  近幾年來,由于人臉檢測在人臉處理和分析中的地位,人臉檢測已經(jīng)引起了越來越多研究者的注意,并逐漸發(fā)展成為一個相對獨立的研究方向,其研究方法和等手段上也逐漸成熟出現(xiàn)了各種各樣實用的人臉檢測算法[3]。 &l

21、t;/p><p>  1.2 人臉檢測識別技術研究的現(xiàn)狀與發(fā)展動態(tài)</p><p>  人們很早就對人類的面部帶給我們的而信息感興趣,并且也作了一些早期的研究[4]。人臉檢測問題的探索開始于八十年代末、九十年代初,這一課題吸引了越來越多的研究者的興趣,并在近10年多取得了一定的研究成果。但是由于人臉是一個極為普通而又十分復雜的模式。它所蘊含的信息量非常的大,所以他和一般的物體的檢測有較大的區(qū)

22、別。</p><p>  在國外許多國家進行了人臉檢測技術的研究,著名的研究機構有美國的MIT麻省理工學院的多媒體實驗室和人工智能實驗室,卡內(nèi)基美隆大學的CUM的Human-Computer Interface Institute,SRI(斯坦福大學)研究中心,Microsoft Research的Vision Technology Grope以及英國的Department ofEngineering in u

23、nversity of Cambridge等??v觀這些國家的有關文獻,人臉檢測的的方法主要分為基于顯示特征的方法和基于隱式特征的方法。所謂的特征法就是集合了人臉的膚色、紋理、臉部輪廓等等,通過這些顯示的特征來達到檢測的目的。而隱式法就是把人臉與非人臉作為兩個類別分別進行學習,從而得到判別人臉的數(shù)據(jù)以及標準,再來判定出測試數(shù)據(jù)中的人臉與非人臉。</p><p>  在國內(nèi)進行人臉檢測研究的主要機構有哈工大、中科院計

24、算機所、清華大學、北京工業(yè)大學等。其中哈工大實現(xiàn)了一個復雜背景下的多級結(jié)構的人臉檢測與跟蹤系統(tǒng);清華大學對膚色進行了較為系統(tǒng)的分析;北京工業(yè)大學的研究著重在基于人臉器官的的特征;中科院研制的“面像檢測與識別核心技術”的成功案例標志著我國在這方面的研究水平已經(jīng)達到了國際領先水平[5]。</p><p>  人臉的復雜模式,并且受到多種因數(shù)的影響。找到一種行之有效的方法進行人臉建模,是人臉檢測的關鍵。國內(nèi)外相關文獻中

25、提出的許多方法,概括而言,目前的技術可分為基于特征的方法(Feature-based)和基于模板的方法(Template-based)。在未來,人們已經(jīng)認識到將多種技術綜合起來,利用多種的信息可以提高人臉檢測的速度,這也必將是未來的發(fā)展趨勢。今后,將支持向量機、多模態(tài)信息融合的方法以及與各種技術相融合的方法也必將是研究者近期的研究方向[6]。</p><p>  1.3 人臉檢測識別技術的應用</p>

26、;<p>  雖然在古代,人們就懂得使用人體的生物特征的測量來鑒別身份。但是真正意義上的生物識別技術興起于20世紀末。隨著信息技術的迅猛發(fā)展和人類生活空間的不斷擴大,現(xiàn)在對人類自身的身份識別的準確性、安全性與實用性都提出了更高的要求,于是現(xiàn)在的身份識別物如:鑰匙、證件、銀行卡、包括用戶名和密碼等已經(jīng)不能滿足人們的需求,而生物識別的單一性、穩(wěn)定性、簡潔性、可靠性等諸多的優(yōu)點都是將這一技術推上歷史舞臺的原因。今后,其在商務、物

27、業(yè)身份認證、軍事、司法、醫(yī)學、銀行、網(wǎng)絡安全等領域都有很大的發(fā)展前景[7]。而在生物識別技術中,人臉特征在提取上的具有主動性、非侵犯性和用戶友好性等優(yōu)點讓它在于其他生物特性的競爭中脫穎而出。在以后需求量的擴大和法律的完善之下,人臉識別技術必將得到長足的發(fā)展,越來越多的研究者會參與到這個領域中[8]。</p><p>  1.4 人臉檢測識別技術的目前存在的困難</p><p>  人臉檢

28、測問題的目前存在的困難在于[9]:</p><p>  人臉由于外貌、表情、膚色等不同而存在很大的差異,具有模式可變性;</p><p>  人臉上可能存在眼鏡、胡須、假睫毛等附屬物而時檢測變得更有難度;</p><p>  作為三維物體的人臉影像不可避免地會受到光照的影響,光照的不均勻、偏光等因素都極大的破壞了人臉特征空間分布的規(guī)律性;</p>&l

29、t;p>  自然景物中存在大量與人臉相似的圖像,如老式的房屋、枯樹葉的外表面等,這些復雜背景都極易與人臉圖像相混淆。</p><p>  1.5 論文中的安排</p><p>  論文中的研究的方法與技術路線:先通過對支持向量機(SVM)原理的學習研究,然后結(jié)合膚色建模、膚色分割、邊緣分割等相關技術,設計算法并在Matlab工具中運行相應程序和使用有關方程,通過實驗將靜態(tài)圖像進行人

30、臉匹配提取,對大量的人臉圖像樣本進行人臉識別測試,得出實驗結(jié)果,進而論證該算法是否有較好的高效性和準確性。</p><p>  研究難點:弄懂支持向量機的基本原理和如何運用,如何選取現(xiàn)有的相關提取特征的技術之一,跟有效的分析不同情況下的人臉識別的關鍵點,確定識別點,再根據(jù)相應的分割技術屏除不是人臉的區(qū)域等,及大量的人臉樣本的建立、轉(zhuǎn)換和測試。最后還要考慮如何優(yōu)化這些工作,比較處理結(jié)果,得出結(jié)論和見解。</p

31、><p>  預期達到的目標:在靜態(tài)圖像的背景下檢測圖像中有無人臉,通過與學習樣本結(jié)果的比較,從而判斷人臉是否存在。</p><p>  2 人臉檢測方法概述</p><p>  人臉檢測的問題從不同的角度可分成很多種方法。按照圖像源來分可分為金泰圖像和動態(tài)圖像;按色彩來分科分為彩色圖像和灰度圖像;按圖像的背景復雜度來分科分為簡單背景和復雜背景等等??傊?,人臉檢測的過

32、程實際上就是對人臉各種信息進行綜合判斷的過程。下面我們就簡單的說明一下現(xiàn)有的幾種人臉檢測算法的思想,當然以下的分類的標準也不是絕對的,而且結(jié)合了幾種思想為一體的人臉檢測方法也必然成為以后的一種趨勢。 以下是一個大概的人臉檢測的分類表:</p><p>  表1人臉檢測問題的分類</p><p>  2.1 膚色區(qū)域分割法 </p><p>  在一般的圖像中,膚色

33、是人臉中一個顯著的特征。對輸入的圖像,我們首先會進行圖像分割,也就是大概的區(qū)分出人臉部分和非人臉部分,繼而得到二值化的分割結(jié)果,然后對已經(jīng)分割出來的圖像進行區(qū)域標記,并且去除一些較少的區(qū)域,得到人臉候選的樣本區(qū),同時利用幾何特征或者灰度特征對其是否是人臉進行判斷,以排除其它類似的物體。其中的區(qū)域分割和驗證在很多地方都是會緊密結(jié)合的。類聚—歸并—驗證是一種最普遍的解決方法。它是將相似的膚色像素按照一定的條件進行類聚,然后利用一定的規(guī)則歸并

34、,最后利用其它的特征來進行驗證。這是一種最基本的方法,還有其它的一些方法還可以利用膚色模板或者混合特征等來形成特征項,以便來驗證圖像中是否為人臉。</p><p>  2.2 模板匹配的方法</p><p>  如果使用模板匹配方法都是要事先定義一個標準的人臉模板,然后再利用這個模板對后來輸入的圖像進行相似度的匹配,最后計算出一個似然度閻值,用這個值去判斷再輸入的圖像中是否有人臉。不過這

35、個人臉模板可以是一個固定的模板,也可以是一個有變量的曲線函數(shù)。綜合諸多文獻,可以得出一般會采用平均臉模板匹配法、雙眼—人臉模板法等比較簡單實用的方法。不過同多另一些文獻我們也的得知了,Yuille等人提出了一種可變形的的人臉模板,采用了一些優(yōu)化的算法,對函數(shù)進行極小化來驗證是否有人臉。也有人提出過利用廣義的Hong變換思想研究出了一種匹配人像邊緣曲線可變形模板提高了其通用性。還有人也提出過一種由粗到細的面部提取法,解決了一般模板中參數(shù)的

36、最初值必須確定的問題,提高了其靈活性[10]。</p><p>  2.3 基于啟發(fā)式模型的方法</p><p>  基于啟發(fā)式模型也稱為知識建模方法。該方法在對人臉樣本圖像的分析基礎上,再對人臉圖像的灰度、邊緣、紋理、幾何形狀等特征建立起一個模板庫。在進行人臉檢測的的時候,先從這個模板庫中提取這些信息來匹配要進行檢測的圖像中是否有人臉。根據(jù)很多文獻的綜合得出Govindaraju等人提

37、出過認知模型方法,將人臉模型建立為兩條直線,通過弧線的變化來判定人臉。Yang等也提出過利用馬賽克圖來進行人臉的檢測,根據(jù)五官的結(jié)構構成一定比例的劃分出符合的馬賽克圖來驗證人臉是否存在。Kouzani等人也提出過利用人工神經(jīng)網(wǎng)絡來進行檢測[11]。不過,這些方法中的利用人臉五官分布特征的模板方法在檢測復雜背景下的圖像中的人臉時,能提高檢測的速度,但是如果要近一步提高檢測的正確性,需要綜合更多的特征項,這也是對圖像理解這一塊內(nèi)容需要解決的

38、一個難題和提升的方向。</p><p>  2.4 基于統(tǒng)計模型的方法</p><p>  由于人臉的復雜性,讓研究者對人臉特征的準確描述有一定的難度。所以,產(chǎn)生出了一種叫做基于統(tǒng)計模型的方法。此方法利用大量的“人臉”與“非人臉”樣本進行訓練并構造相應的分類器,通過對分類器中的已有樣本的匹配和判別來實現(xiàn)人臉檢測。這類方法中有分為基于特征空間的方法、基于神經(jīng)網(wǎng)絡的方法、基于概率模型的方法、

39、基于支持向量機的方法等。</p><p>  3 人臉判別方法研究</p><p>  在人臉檢測的過程中,對于人臉判別的方法的研究也是非常重要的。在以下我們就通過對現(xiàn)有的的幾種經(jīng)典的判別方法進行簡單的介紹,在分析各種方法中,得出基于支持向量機的方法的優(yōu)點,重點對此方法進行研究與實踐并相應的做出描述。</p><p><b>  人臉判別方法的選擇<

40、;/b></p><p>  3.1.1 基于人工神經(jīng)網(wǎng)絡的方法</p><p>  基于人工神經(jīng)網(wǎng)絡的方法事實上就是對人類大腦系統(tǒng)的一種形象地描述,它本質(zhì)上是一種數(shù)學模型,即可以用電路來實現(xiàn),也可以用電腦來進行模擬化,并且它也屬于人工智能的一個研究領域。人類使用它對聽覺、視覺、思考等方面進行處理,在數(shù)據(jù)壓縮、模式匹配等方面也有很好的使用。隨著科學技術的發(fā)展,此方法也更多的運用到了

41、人臉判別中,如:Demers等人提出的采用PCA方法來提取人臉圖像特征,并用相關的神經(jīng)網(wǎng)絡進一步壓縮特征,最后使用一個MLP來實現(xiàn)人臉識別。Laurence等人也通過一個多級的SOM實現(xiàn)了樣本的類聚,將神經(jīng)網(wǎng)絡CNN用到人臉識別中。CNN會對每個像素及其相鄰像素之間的相關性,對圖像的平移、旋轉(zhuǎn)和變形都具有一定的魯棒性。Lin等人則采用基于概率決策的神經(jīng)網(wǎng)絡方法。Gutta等人也提出了將RBF與樹分類器結(jié)合起來進行人臉識別的混合分類器結(jié)構

42、,后來他們基于PBF神經(jīng)額昂羅進行了針對部分人臉的識別研究,結(jié)果表明利用部分人臉也可以有效地識別人臉,Er等采用PCA進行維數(shù)壓縮,再利用LDA抽取特征,然后基于RBF進行人臉識別[12]。</p><p>  神經(jīng)網(wǎng)絡識別方法利用其強大的非線性處理能力,在圖像處理領域內(nèi)逐漸的被世人所關注,特別是在上訴中提到的各種方法,也是被使用的頻率最高的好方法。特別是其中的RBF方法,它具有較好的光照不變性、表情不變性等優(yōu)勢

43、,是人臉識別系統(tǒng)中比較完善且使用效果明顯的方法之一。</p><p>  3.1.2 基于特征臉的方法</p><p>  基于特征臉的方法是從PCA中導出的一種人臉識別和描述技術。PCA實際上市K—L展開的網(wǎng)絡遞推實現(xiàn),K—L變換時圖像壓縮中的izhong最優(yōu)正交變換,其生成的矩陣一般為訓練樣本的總體散步矩陣。而特征臉方法就是把有人臉的圖像區(qū)域看成是一個隨機向量,采用K—L變換得到其相

44、應的基底。載對應得到較大的特征基底就是最高度與人臉相似的形狀,這個形狀就被稱之為特征臉。利用這些產(chǎn)生的基底可以對人臉進行相應的描述、表達等功能處理,正因為如此可以進行人臉識別和合成。</p><p>  在以前傳統(tǒng)的特征臉方法的基礎上,有研究者發(fā)現(xiàn)特征值較大的特征臉并不一定是分類性能最優(yōu)的方向,而且對于上述方法而言,外在因素帶來的影響和人臉本身帶來的差異是無法區(qū)分的,這就表明了特征臉在很大的程度上會受到外在因素的

45、嚴重影響。后來通過了一系列的研究表明,此方法會隨著越來越多的可變因素的加入,其識別的準確性越來越低,因此這種方法在許多方面還存在著很多的缺陷。但是雙子空間法、fisher臉方法等的誕生,使得特征臉方法改善了很多[13]。</p><p>  總而言之,特征臉方法是從人臉圖像的整體為出發(fā)點對圖像的整體進行識別和匯總,具有不用提取眼睛、嘴巴、鼻子等特征項的優(yōu)勢,方便實現(xiàn)起來也比較簡便。最為諸多方法中一種最小的分類器,

46、在光照條件變化不大時更能顯示出其效果,反之則其功能也會隨之下降。</p><p>  3.1.3 基于支持向量機的方法</p><p>  基于支持向量機的方法(SuportVectorMachines,SVM)是在統(tǒng)計學習理論的基礎上發(fā)展起來的一種新的學習機器,能夠較好地解決人臉檢測中的小樣本、非線性、高維數(shù)、局部極將小點等實際問題,其與常用的人臉檢測算法相結(jié)合,對于人臉檢測技術的研究

47、具有重要意義。為了解決小樣本的學習問題,Osuna等剛首先將支持向量機(Support VectorMachine。SVM)引入人臉檢測中。SVM是daVapnikl251提出的一種基于結(jié)構風險最小化原理的統(tǒng)計學習算法,其基本思想是通過用內(nèi)積函數(shù)定義的非線性變換,將輸入空間變換到一個高維的線性空間,然后在這個空間中求最優(yōu)分類面。支持向量機的最大特點是根據(jù)Vapnik結(jié)構風險最小化原則,盡量提高學習機的泛化能力,而且支持向量機算法是一個凸

48、優(yōu)化問題,因此其局部最優(yōu)解一定是全局最優(yōu)解[14]。</p><p>  3.2 判別方法比較</p><p>  上述中的優(yōu)勢使得支持向量機的以有效克服其它學習算法,雖然它和神經(jīng)網(wǎng)絡的方法都是基于統(tǒng)計的判別方法,也是兩種最常用的使用辦法,但是神經(jīng)網(wǎng)絡的方法保證了其置信范圍不會變,最小化經(jīng)驗風險;而支持向量機方法的訓練卻能保持經(jīng)驗風險不變,最小化置信的范圍。但是,如神經(jīng)網(wǎng)絡學習算法存在的

49、過學習問題和局部極值問題,都在支持向量機方法中得到很好的解決,既不會出現(xiàn)“過學習”的現(xiàn)象,也不會出現(xiàn)“欠學習”的現(xiàn)象,這也是它為什么會成為國際上機器學習領域新的研究熱點,更加的具有推廣力的原因之一。而特征臉的的方法主要的優(yōu)點事在于人臉的表示方面,所以此方法很少用到人臉的識別中。</p><p>  從大量的資料和研究得出,其余兩種方法和支持向量機方法向比較下更具有一定的優(yōu)勢,所以本文中人臉檢測的人臉識別部分使用支

50、持向量機的方法來實現(xiàn)。</p><p>  4 支持向量機理論概述</p><p>  4.1 支持向量機的前提研究</p><p>  支持向量機(Support Vector Machine)是九十年代才出現(xiàn)的一種新的方法,已有初步表現(xiàn)出很多性能高于現(xiàn)有的方法。利用支持向量機訓練得到的分類器擁有良好的推廣能力,即使訓練樣本很少,分類器的預測準確率也會很高。支

51、持向量機是建立在統(tǒng)計學習理論(Statistical Learning Theory)基礎之上的。統(tǒng)計學習理論是一種專門研究有限樣本情況下機器學習規(guī)律的理論,它建立在一套較堅實的理論基礎之上,為解決有限樣本學習問題提供了一個統(tǒng)一的框架結(jié)構;它能把現(xiàn)有的方法進行綜合并融入其中,是最有可能幫助解決許多原來難以解決的問題(比如神經(jīng)網(wǎng)絡結(jié)構選擇問題、局部極小點問題等)。在許多研究者中,是Osuna等人先將支持向量機(Support Vector

52、Machine,SvM)融入人臉檢測中去[15]。圖1正是Osuna系統(tǒng)的SVM分類器。在本章中我們也會對該方法的前提基礎作一定的描述,從而理解推導出支持向量機的方法。</p><p>  圖1 Osuna系統(tǒng)的SW分類器</p><p>  4.2 對學習機的研究</p><p>  有研究者對學習機的闡述是:“如果一個系統(tǒng)能夠通過執(zhí)行某種過程而改進它的性能,

53、這就是學習”。從這可看出,對一個系統(tǒng)而言,學習是一個過程,并且通過學習還能改變系統(tǒng)的性能[16]。過程、系統(tǒng)與改變系統(tǒng)性能是學習的三個關鍵點。隨著科技的發(fā)展,從計算科學方面看,上述的解讀是遠遠不夠的,人們更關心對不同系統(tǒng)實現(xiàn)機器學習的過程,以及改變性能后的效果。圖2給出了一個簡單的學習系統(tǒng)模型。</p><p>  圖2 學習系統(tǒng)模型</p><p>  4.2.1 機器學習的基本問題

54、</p><p>  機器學習的根本目就是根據(jù)給定的訓練樣本求對某系統(tǒng)輸入輸出之間依賴關系的估計,使它能夠?qū)ξ粗敵鲎鞒霰M可能準確的預測和判斷??梢砸话愕乇硎緸椋鹤兞縴與x,存在著一些未知的依賴關系,即遵循某一未知的聯(lián)合概率F(x,y)(x和y之間的確定性關系可以看作是其特例),機器學習問題就是根據(jù)雕個獨立同分布觀測樣本</p><p>  ,,…… (1)</p>&

55、lt;p>  在一組函數(shù)中求一個最優(yōu)的函數(shù)對依賴關系進行估計,使期望風險</p><p><b>  (2)</b></p><p>  最小。其中,作為預測函數(shù)集,w為函數(shù)的廣義參數(shù)??梢员硎救魏?lt;/p><p>  函數(shù)集。是用對y進行預測而造成的損失,損失函數(shù)是評價預測確程度的一種度量。這里考慮的預測是根據(jù)某個假設推斷出的結(jié)果。因而

56、損失函數(shù)是與假設密切相關的,其含義是當預測準確無誤時,損失值為零(無損失發(fā)生)。當然實際上還常常要求當預測有誤差時,或者至少當誤差達到一定程度時,其損失值不為零。不同類型的學習問題有不同形式的損失函數(shù)。預測函數(shù)也稱作學習函數(shù)、學習模型或?qū)W習機器。</p><p>  有三類基本的機器學習問題,即模式識別、函數(shù)逼近和概率密度估計。對模式識別</p><p>  問題,輸出y是類別標號,兩類情

57、況下或者,預測函數(shù)稱作指示函數(shù),損失函數(shù)可定義為</p><p><b> ?。?)</b></p><p>  使風險最小就是Bayes決策中使錯誤率最小。在函數(shù)逼近問題中,y是連續(xù)變量(這里假設為單值函數(shù)),損失函數(shù)可定義為</p><p><b>  (4)</b></p><p>  即采用

58、最小平方誤差準則。而對概率密度估計問題,學習的目的是根據(jù)訓練樣本確定x的概率密度。記估計的密度函數(shù)為p(x,w),則損失函數(shù)可以定義為</p><p><b>  (5)</b></p><p>  4.2.2 經(jīng)驗風險最小化</p><p>  在上面的問題表述中,學習的目標在于使期望風險最小化,但是,由于我們可以利用的信息只有公式1和2根

59、本無法計算所謂的期望風險,所以傳統(tǒng)的學習方法中使用了所謂經(jīng)驗風險最小化(Empirical Risk Minimization,ERM)準則,即用樣本定義經(jīng)驗風險</p><p><b>  (6)</b></p><p>  作為對公式2的估計,設計學習算法使它最小化。對損失函數(shù)的公式3,經(jīng)驗風險就是訓練樣本錯誤率;對公式4的損失函數(shù),經(jīng)驗風險就是平方訓練誤差;而采

60、用公式5損失函數(shù)的EPM準則就等價于最大似然方法。</p><p>  事實上,用經(jīng)驗風險最小化準則來代替期望風險最小化并沒有經(jīng)過充分的理論論證,只是直觀上合理的想當然做法,但這種思想?yún)s在多年的機器學習研究中占據(jù)了主要地位.人們多年來將大部分注意力集中到如何更好地最小化經(jīng)驗風險上.而實際上,即使可以假定當以趨向于無窮大時公式6趨近于公式2,在很多問題中的樣本數(shù)目也離無窮大相去甚遠。其實,下面我們會討論到,在有限樣

61、本下經(jīng)驗風險最小化準則得到的結(jié)果并不一定能是真實的風險也較小。</p><p>  4.2.3 復雜性與推廣能力</p><p>  經(jīng)驗風險最小化準則不成功的一個例子是神經(jīng)網(wǎng)絡的過學習問題。開始,很多注意力都集中在如何使(w)更小,但很快就發(fā)現(xiàn)。訓練誤差小并不總能導致好的預測效果。某些情況下,訓練誤差過小反而會導致推廣能力的下降,即真實風險的增加,這就是過學習問題。</p>

62、<p>  之所以會出現(xiàn)過學習現(xiàn)象,一是因為樣本不充分,二是學習機器設計不合理,這兩個問題是互相關聯(lián)的。設想一個簡單的例子,假設有一組實數(shù)樣本(x,y),y取值在[0,1]之間,那么不論樣本是依據(jù)什么模型產(chǎn)生的,只要用函數(shù)f(x,a)=sin(ax)去擬合它們(a是待定參數(shù)),總能夠找到一個a使訓練誤差為零,但顯然得到的“最優(yōu)”函數(shù)并不能正確代表真實的函數(shù)模型。究其原因,是試圖用一個十分復雜的模型去擬合有限的樣本,如圖3,

63、導致喪失了推廣能力。</p><p><b>  圖3 過學習現(xiàn)象</b></p><p>  由此可看出,有限樣本情況下,</p><p>  1.經(jīng)驗風險最小并不一定意味著期望風險最?。?lt;/p><p>  2.學習機器的復雜性不但應與所研究的系統(tǒng)有關,而且要和有限數(shù)目的樣本相適應。</p><

64、p>  這就是有限樣本下學習機器的復雜性和推廣能力之間的矛盾。有限樣本情況下學習精度和推廣能力之間的矛盾幾乎是不可調(diào)和的,采用復雜的學習機器容易使學習誤差更小,但卻往往喪失了推廣能力.因此,需要一種能夠指導我們在小樣本情況下建立有效的學習和推廣方法的理論。統(tǒng)計學習理論的發(fā)展和完善為此問題的解決提供了堅實的理論基礎和有效的學習方法。</p><p>  4.3 統(tǒng)計學習理論</p><p

65、>  與傳統(tǒng)統(tǒng)計學相比,統(tǒng)計學習理論是一種專門研究小樣本情況下機器學習規(guī)律的理論.該理論針對小樣本統(tǒng)計問題建立了一套新的理論體系,在這種體系下的統(tǒng)計推理規(guī)則不僅考慮了對漸近性能的要求,而且追求在現(xiàn)有有限信息的條件下得到最優(yōu)結(jié)果。vapnik等人從六、七十年代開始致力于此方面研究,到九十年代中期,隨著其理論的不斷發(fā)展和成熟,也由于神經(jīng)網(wǎng)絡等學習方法在理論上缺乏實質(zhì)性進展,統(tǒng)計學習理論開始受到越來越廣泛的重視。</p>

66、<p>  統(tǒng)計學習理論主要內(nèi)容包括四個方面:</p><p>  1.經(jīng)驗風險最小化準則下統(tǒng)計學習一致性的條件。</p><p>  2.在這些條件下關于統(tǒng)計學習方法推廣性的界的結(jié)論。</p><p>  3.在這些界的基礎上建立的小樣本歸納推理準則,即結(jié)構風險最小化準則。</p><p>  4.實現(xiàn)新的準則的實際方法,即支持向

67、量機。</p><p>  其中,最有指導性的理論結(jié)果是推廣性的界,與此相關的一個核心概念是vc維(Vapnik-Chervonenkis Dimension)。</p><p>  4.3.1 VC維</p><p>  函數(shù)集的vc維是統(tǒng)計學習理論中的一個核心概念。vc維反映了函數(shù)集的容量。在模式識別中,研究的是指示函數(shù)集的vc維。一個指示函數(shù)集的vc維,是能

68、夠被集合中的函數(shù)以所有可能的種方式分成兩類的向量的最大數(shù)目h(也就是能夠被這個函數(shù)集打散的向量的最大數(shù)目).如果對任意的n,總存在一個n個向量的集合可以被函數(shù)集打散,那么函數(shù)集的vc維就是無窮大.統(tǒng)計學習理論指出,是函數(shù)集的vc維(而不是其自由參數(shù)個數(shù))影響了學習機的推廣性能。vc維越大則學習機器越復雜(容量越大)。這樣,就可以通過控制函數(shù)集的vc維來控制學習機的推廣性能,而不必考慮所謂的“維數(shù)災難”問題。目前尚沒有通用的關于任意函數(shù)集

69、vc維計算的理論,只對一些特殊的函數(shù)集知道其vc維.比如在萬維實數(shù)空間中線性分類器和線性實函數(shù)的vc維是n+l。對于一些比較復雜的學習機器(如神經(jīng)網(wǎng)絡),其vc維除了與函數(shù)集(神經(jīng)網(wǎng)結(jié)構)有關外,還受學習算法等的影響,其確定更加困難。</p><p>  圖4 vc維示意圖</p><p>  (直線集能夠以種方式將3個樣本分開,則直線集的vc維即為3)</p><p

70、>  4.3.2 結(jié)構風險最小化</p><p>  經(jīng)驗風險最小化原則在樣本有限時是不合理的,我們需要同時最小化經(jīng)驗風險和置信范圍。其實,在傳統(tǒng)方法中,選擇學習模型和算法的過程就是調(diào)整置信范圍的過程,如果模型比較適合現(xiàn)有的訓練樣本(相當于h/n值適當),則可以取得比較好的效果。但因為缺乏理論指導,這種選擇只能依賴先驗知識和經(jīng)驗,造成了如神經(jīng)網(wǎng)絡等方法對使用者“技巧”的過分依賴。</p>&

71、lt;p>  統(tǒng)計學習理論提出了一種新的策略,即把函數(shù)集構造為一個函數(shù)子集序列,使各個子集按照vc維的大小(亦即的大小)排列。設函數(shù)的集合s具有一定的結(jié)構,這一結(jié)構是由一系列嵌套的函數(shù)子集組成的,它們滿足,且VC維依次遞減,即。結(jié)構風險最小化實現(xiàn)了在對給定數(shù)據(jù)逼近的精度和逼近函數(shù)的復雜性之間的一種折衷。隨著子集序號雄的增加,經(jīng)驗風險的最小值減小,但決定置信范圍的項卻增加。結(jié)構風險最小化原則通過選擇子集甌,在子集間折衷考慮經(jīng)驗風險和

72、置信范圍,使得在所選擇的子集中,最小化經(jīng)驗風險會取得實際風險的最好的界,如圖5所示。這種思想稱作結(jié)構風險最小化(StructuralRisk Minimization),即SRM準則。</p><p>  實現(xiàn)SRM原則可以有兩種思路,一是在每個子集中求最小經(jīng)驗風險,然后選擇使最小經(jīng)驗風險和置信范圍之和最小的子集。顯然這種方法比較費時,當子集數(shù)目很大甚至是無窮時甚至根本不可行。此外還有第二種思路,即設計函數(shù)集的某

73、種結(jié)構使每個子集中都能取得最小的經(jīng)驗風險(如使訓練誤差為o),然后只需選擇適當?shù)淖蛹怪眯欧秶钚。瑒t這個子集中使經(jīng)驗風險最小的函數(shù)就是最優(yōu)函數(shù)。支持向量機方法就是這種思想的具體實現(xiàn)。</p><p>  圖5 結(jié)構風險最小化</p><p>  4.4 支持向量機</p><p>  支持向量機簡稱SVM,是統(tǒng)計學習理論中最年輕的內(nèi)容,也是最實用的部分。SWl

74、是一種新的非常有發(fā)展前景的分類技術,可以替代多層感知機,RBF神經(jīng)網(wǎng)絡和多項式神經(jīng)網(wǎng)絡等已有的學習算法。其核心內(nèi)容是在1992到1995年聞提出的,目前仍處在不斷發(fā)展的階段。</p><p>  SVW以結(jié)構風險最小化準則為理論基礎,通過適當?shù)倪x擇函數(shù)子集以及該函數(shù)子集中的判別函數(shù),使得學習機器的實際風險達到最小,保證了通過有限訓練樣本的小誤差分類器,對獨立測試集的測試誤差仍然較小。因而,是一個具有最優(yōu)分類能力和

75、推廣能力的學習機器。</p><p>  支持向量機主要解決分類問題和回歸問題,其中分類問題又包括兩類問題和多類問題。本文利用支持向量機做人臉檢測主要是兩類問題,所以重點介紹兩類問題。</p><p>  可以用數(shù)學語言將兩類問題描述如下:</p><p>  根據(jù)給定的訓練集,其中。,尋找X=上的一個實值函數(shù)g(x),以便用決策函數(shù)</p><

76、p><b> ?。?)</b></p><p>  推斷任一模式x相對應的y值。由此可見,求解分類問題,實質(zhì)上就是找到一個把上的點分成兩部分的規(guī)則。</p><p>  按照分類函數(shù)把樣本分開的程度將分類問題可分為三種類型:(如圖6—8所示是二維的情況,在n維空間中就會形成超平面)。 圖6 線性可分問題圖 圖7 近似線性可分問題

77、 圖8 實質(zhì)線性不可分問題</p><p>  1.線性可分問題,用一條直線把訓練集正確的分開,沒有錯分點(如圖6)。</p><p>  2.近似線性可分問題,用一條直線也能大體的把訓練集分開(如圖7)。</p><p>  3.實質(zhì)線性不可分問題,用直線劃分產(chǎn)生誤差較大,用非線性學習機劃分(如圖8)。</p><p>  

78、5 人臉檢測的實現(xiàn)</p><p>  人臉檢測實現(xiàn)流程圖:</p><p>  5.1 人臉樣本的提取</p><p>  人臉樣本的提取是通過對圖片庫中眾多的人臉樣本進行二維數(shù)組的轉(zhuǎn)換,再提取能判斷人臉的特征值。并且對數(shù)據(jù)進行整理,分別再分成學習數(shù)據(jù)樣本和測試數(shù)據(jù)樣本。</p><p>  5.2 基于SVM下的分類</p&g

79、t;<p>  人臉的分類工作主要通過以下語句實現(xiàn),主要運用調(diào)用rbf函數(shù)。對已分好的學習數(shù)據(jù)樣本先運行,得到一個基于SVM的分類圖,得出一個判斷是否有人臉存在的標準化值,再把測試數(shù)據(jù)樣本放入進行對比,從而判斷出是否有人臉。</p><p>  svmStruct = svmtrain(datatrain,groupstrain,'Kernel_Function','rbf&

80、#39;,'RBF_Sigma', 1,'showplot',true);</p><p>  classes_normal = svmclassify(svmStruct,datatest1,'showplot',true);</p><p>  number_normal = size(find(classes_normal == 0),

81、1);</p><p>  rate_normal = number_normal/size(datatest1,1);</p><p>  5.3 主要程序代碼</p><p>  clear all; </p><p>  close all;</p><p>  load proj2_0114;</p&g

82、t;<p>  datatrain = [traindata(:,1),traindata(:,2)];</p><p>  datatest1 = [svm_data_normal(:,1),svm_data_normal(:,2)];</p><p>  datatest2 = [svm_data_porn(:,1),svm_data_porn(:,2)];</p&

83、gt;<p>  cp = classperf(groupsOfSample);</p><p>  groupstrain = groupsOfSample;</p><p>  opts = svmsmoset('Display','final','MaxIter',20000,'KernelCacheLimit&#

84、39;,1000);</p><p>  alt_opts = svmsmoset(opts,'Display','iter','KKTViolationLevel',.05);</p><p>  svmStruct = svmtrain(datatrain,groupstrain,'Kernel_Function',

85、9;rbf','RBF_Sigma', 1,'showplot',true);</p><p>  classes_normal = svmclassify(svmStruct,datatest1,'showplot',true);</p><p>  number_normal = size(find(classes_normal

86、== 0),1);</p><p>  rate_normal = number_normal/size(datatest1,1);</p><p><b>  實驗截圖</b></p><p>  圖9 部分人臉樣本圖像及其人臉特征值</p><p>  圖10 訓練樣本結(jié)果</p><p>

87、;<b>  結(jié)束語</b></p><p>  選擇這個題目的原因是因為人臉檢測技術關鍵技術的研究和相關技術的實現(xiàn)在我們的平時生活中已經(jīng)越加的重要,今后的許多領域的發(fā)展也必須依靠其生存。通過自己完成一個簡單的人臉檢測的系統(tǒng)設計,讓我對其中所蘊含的知識有了更深刻的學習和了解,并且在這個過程中讓自己能夠又學習了一種編程工具的使用。</p><p>  經(jīng)過幾個月的資料積

88、累和編程實踐,終于完成了這個人臉檢測系統(tǒng)。通過這次鍛煉,讓我對自己在自學和動手實踐方面都有了很大的提高,在思維方面也有了很大的進步,拓寬了自己的思維方向。</p><p>  基于支持向量機的方法的系統(tǒng)有著廣闊的前景,大大改善傳統(tǒng)的人臉檢測方法。本系統(tǒng)基本完成了所須的功能,實現(xiàn)了對靜態(tài)圖像中人臉的識別和判斷。</p><p>  本文中也通過理論聯(lián)系實際,結(jié)合目前的發(fā)展現(xiàn)狀,對使用向量機的

89、實現(xiàn)方法作了詳盡的分析,同時使用Matlab開發(fā)工具達到了預期的目的和實現(xiàn)了對人臉的檢測工作。這個軟件已經(jīng)可以進行基本的人臉檢測工作,可以完美的運用了向量機方法本質(zhì)特性,也可以充分的體現(xiàn)出起初的設計思想。</p><p>  但是由于經(jīng)驗、能力、時間以及技術上的欠缺的關系,本系統(tǒng)還有很多不完善的地方,還存在很多缺點,如對人臉檢測的效率、誤差、復雜度等方面沒有進行進一步的研究和實現(xiàn);</p><

90、p>  使用Matlab工具中還有一些細節(jié)的地方處理不好,對其中的編程語言深入理解以及熟練運用方面還需努力。為了自己的心血沒有白流,所以即使畢業(yè)設計結(jié)束了,以后編程中也會繼續(xù)補充它們,繼續(xù)完善這個系統(tǒng)。</p><p><b>  參考文獻</b></p><p>  [1]Hjelmas E and Low B K.Computer Vision anf Im

91、age understanding,Face detection:a survey, 2001, 83(1).</p><p>  [2]Yang M-H, kriegman D.Ahuja N.Detecting face in image:a survey,IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(1).&l

92、t;/p><p>  [3]梁路宏,艾海舟,徐光佑,張鈸等.人臉檢測研究綜述[J].計算機學報,2002,25(5).</p><p>  [4]劉萬春,賈云得,徐一華等.基于膚色的人臉實時跟蹤方法[J].北京理工大學學報,2000,20(4).</p><p>  [5]張永新.基于SVM的人臉檢測算法研究論文[D].西北大學,2009.</p><

93、;p>  [6]Vapnik V.The Mature of Statistical Learning Theory,Springer,1995.</p><p>  [7]陳澤宇,威飛虎.基于級聯(lián)神經(jīng)網(wǎng)絡的人臉檢測方法的研究[J].紅外與毫米波學報, 2000,19(1).</p><p>  [8]梁路宏,艾海舟,徐光佑等.基于膚色和模板的人臉檢測[J].軟件學報,2001,12

94、(12).</p><p>  [9]王嶸.基于支持向量機的人臉檢測系統(tǒng)的設計與實現(xiàn)論文[D]. 天津師范大學,2007.</p><p>  [10]寧桂英,周永權.基于雙種群的小生境差分進化算法陰[J].計算機應用與軟件,2009,26(3):29—31.</p><p>  [11]吳亮紅,王耀南,周少武等.雙群體偽并行差分進化算法研究及應用[J].控制理論與

95、應用,2007,24(3):453—458.</p><p>  [12]付忠良.圖像閾值選取方法的構造[J].中國圖象圖形學報,2000,5(6).</p><p>  [13]劉明寶,高文.復雜背景下的人臉檢測與跟蹤系統(tǒng)[J].計算機研究與發(fā)展,1997,34(SI):54—58.</p><p>  [14]Sung K K Poggio T.Examplc-

96、BasedLcaming for View-Based Human Face Detection,Technical Report AI Memo 1521,Massachusetts Inst.of Tcchnology AI Lab,1994.</p><p>  [15] 姚鴻勛,劉明寶,高文等.基于彩色圖像的色系坐標變換的面部定位與跟蹤法[J].計算機學報,2000,23(2).</p>&

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論