版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p> 存檔日期:_____________________ 存檔編號:______________________</p><p> 徐 州 師 范 大 學(xué) 科 文 學(xué) 院 </p><p> 本科生畢業(yè)論文(設(shè)計)</p><p> 論文題目: 人臉檢測系統(tǒng)設(shè)計 </p><p>
2、姓 名: 萬 潔 </p><p> 學(xué) 號: 078333101 </p><p> 專 業(yè): 自 動 化 </p><p> 班 級: 07 自 動 化 </p><p&g
3、t; 指導(dǎo)老師: 李 旭 超 </p><p><b> 科文學(xué)院教務(wù)部印刷</b></p><p><b> 摘 要</b></p><p> 隨著信息技術(shù)的高速發(fā)展,個人身份識別、安檢、多媒體信息檢索和智能人機(jī)交互系統(tǒng)等應(yīng)用需求,人臉檢測系統(tǒng)具有越來越廣泛的實用價值和研究意義,
4、成為模式識別領(lǐng)域研究的熱點。本文在研究國內(nèi)外相關(guān)研究成果和最新研究進(jìn)展的基礎(chǔ)上,對應(yīng)用上需要解決的人臉檢測方法進(jìn)行了研究。其主要目的是將人臉部分從背景圖像中分離出來。一個對一般環(huán)境圖像具有一定適應(yīng)能力的人臉識別系統(tǒng),通常需要一個魯棒的、高效的、實時的人臉檢測系統(tǒng)。</p><p> 彩色圖像中,膚色是人臉的重要信息。由于它不依賴于面部的細(xì)節(jié)特征,因此具有相對的穩(wěn)定性。在色度空間中,人臉的膚色分布表現(xiàn)出良好的聚類
5、特性。利用膚色特征可以快速拋棄大量背景因素迅速得到目標(biāo)區(qū)域。</p><p> 本文以完成人臉識別前期準(zhǔn)備為目標(biāo),利用膚色的聚類特性,設(shè)計并實現(xiàn)了一</p><p> 個復(fù)雜背景下的人臉檢測。論文包括兩方面內(nèi)容:人臉檢測和光照補償,其中人臉檢測是后一項的基礎(chǔ)。人臉檢測:首先研究了膚色在YCbCr色彩空間呈現(xiàn)的聚類特性,給出膚色在此空間的高斯分布模型。然后利用高斯模型對彩色圖像進(jìn)行相似度
6、計算。經(jīng)過閾值分割、孔洞著色、區(qū)域驗證等步驟,最終得到人臉區(qū)域。光照補償:實驗表明光照對人臉檢測方法有較大影響,色溫偏差和亮度偏差會使檢測率大幅下降。本文采用基于全局白平衡的色溫補償方法和基于復(fù)合變換的亮度補償方法,對光照進(jìn)行補償。實驗結(jié)果表明這兩個方法能對光照進(jìn)行有效的補償。</p><p> 本文通過自行拍攝和網(wǎng)上下載的方法獲取了若干個圖像文件對算法進(jìn)行了測試。實驗結(jié)果表明本文提出的人臉檢測算法具有較高的檢
7、測速度和檢測率。</p><p> 關(guān)鍵詞:人臉檢測;膚色模型;高斯模型;光照補償</p><p><b> Abstract</b></p><p> With the rapid development of information technology, personal identity recognition, security
8、, multimedia information retrieval and intelligent human-computer interaction systems,F(xiàn)ace Detection with more and more extensive practical value,has become a hot research field of pattern recognition.</p><p&
9、gt; This paper do some research on face detection based on the achievements of previous researchers.Its main purpose is to face part separated from the background image. A general environment of image has certain the a
10、bility to adjust the face recognition system, usually need a robust and efficient, real-time face detection system. </p><p> In color image, color is face important information. Because it does not depend
11、on facial details characteristic, therefore there with relative stability. Color space, in the face of skin distribution exhibited good clustering features. The skin color feature can quickly abandoned lots of background
12、 factors obtained rapidly target area. </p><p> This paper to complete face recognition of preparation as the goal, USES color clustering features, design and realization. A complex background face detectio
13、n. Papers included two respects content: face detection and light compensation, including after face detection is a foundation. Face detection: first studied color YCbCr color space presents in the clustering features, g
14、ive skin color in this space of the gaussian distribution model. But using the gaussian model on the color image similarit</p><p> This article through to shoot and download methods for obtaining a number o
15、f image files on the algorithm was tested. Experimental results show that the proposed face detection algorithm has higher detection rate and the detection rate. </p><p> Key word: face detection;skin model
16、;gaussian model; light compensation </p><p><b> 目 錄</b></p><p><b> 摘 要I</b></p><p> AbstractII</p><p><b> 1 緒論1</b></p>
17、;<p> 1.1 課題研究背景及意義1</p><p> 1.1.1人臉檢測國內(nèi)外發(fā)展現(xiàn)狀:1</p><p> 1.1.2 人臉檢測研究的意義2</p><p> 1.2人臉檢測常遇的困難因素3</p><p> 1.3 論文的主要工作4</p><p> 1.4本文的結(jié)構(gòu)安排
18、5</p><p> 2人臉檢測技術(shù)方法綜述6</p><p> 2.1基于啟發(fā)式模型的人臉檢測6</p><p> 2.2基于膚色模型的人臉檢測8</p><p> 2.3 基于統(tǒng)計模型的人臉檢測8</p><p> 2.4 本章小結(jié)10</p><p> 3基于膚色模型
19、的彩色圖像人臉檢測11</p><p> 3.1膚色模型概述與建立11</p><p> 3.2 顏色空間的選擇11</p><p> 3.3 建立膚色模型15</p><p> 3.3.1模型選取16</p><p> 3.3.2樣本統(tǒng)計18</p><p> 3.4膚
20、色分割過程19</p><p> 3.4.1 相似度計算19</p><p> 3.4.2閾值分割20</p><p> 3.4.3孔洞著色22</p><p> 3.4.4 區(qū)域的驗證26</p><p> 3.5 本章小結(jié)27</p><p> 4人臉檢測算法中的光照
21、補償策略與系統(tǒng)的實現(xiàn)28</p><p><b> 4.1 引言28</b></p><p> 4.2 光照條件判斷29</p><p> 4.3 色溫補償30</p><p> 4.4 亮度補償32</p><p> 4.4.1 非線性變換32</p><
22、;p> 4.4.2 復(fù)合變換33</p><p> 4.5系統(tǒng)實現(xiàn)流程圖37</p><p> 4.6 本章小結(jié)38</p><p><b> 5總結(jié)與展望39</b></p><p><b> 5.1 總結(jié)39</b></p><p><b&
23、gt; 5.2 展望39</b></p><p><b> 致謝41</b></p><p><b> 參考文獻(xiàn)42</b></p><p><b> 附錄45</b></p><p><b> 1 緒論</b></p
24、><p> 1.1 課題研究背景及意義</p><p> 1.1.1人臉檢測國內(nèi)外發(fā)展現(xiàn)狀</p><p> 人臉檢測這一問題最初是作為自動人臉識別系統(tǒng)的定位環(huán)節(jié)而被提出的, 它是自動人臉識別系統(tǒng)中的一個關(guān)鍵環(huán)節(jié)。早在上個世紀(jì)六七十年代,就有學(xué)者對人臉識別與檢測的問題進(jìn)行了初步的探索與研究。最初的人臉識別以人臉特征點間的距離、比率等參數(shù)為特征,建立了一個半自動人臉
25、識別系統(tǒng)。早期人臉識別研究主要有兩大方向:一是基于人臉幾何特征的方法,即人臉器官歸一化的點間距離和比率以及人臉的一些特征點,例如眼角、嘴角、鼻尖等部位所構(gòu)成的二維拓?fù)浣Y(jié)構(gòu);二是模板匹配的方法,即利用計算機(jī)模板和圖像灰度的相關(guān)性來實現(xiàn)識別功能。Berto 在 1993 年對這兩種方法作了較全面的介紹和比較后認(rèn)為,模板匹配的方要法優(yōu)于幾何特征的方法。</p><p> 到了二十世紀(jì)九十年代,人臉識別成為科研熱點。但
26、是人臉識別所采用的人臉庫還很小,最常用的人臉庫僅包括100幅左右的人臉圖像,例如MIT庫、Yale庫、CMU庫等人臉庫,它們均為小型庫;而且人臉庫之間的輸入條件各異,不同的識別算法之間很難進(jìn)行比較。為了促進(jìn)人臉識別進(jìn)行深入研究和實用化,美國國防部發(fā)起了建立人臉識別技術(shù)工程,它包括一個通用人臉庫和一套通用測試標(biāo)準(zhǔn)。 不過該庫中包括有軍人的圖片不能在美國以外獲得,故其他國家的研究只能采用本地的人臉庫,如英國的Manchester人臉庫。目前
27、的人臉識別主要有兩個方向:一是基于整體特征的研究方法;二是基于局部特征分析的方法。</p><p> 近幾年隨著電子商務(wù)等應(yīng)用的發(fā)展,人臉識別已逐漸成為最有潛力的生物身份驗證手段, 這種應(yīng)用背景下要求自動人臉識別系統(tǒng)能夠?qū)σ话悱h(huán)境圖像具有一定的適應(yīng)能力, 由此所面臨的一系列實用性問題使得人臉檢測也開始作為一個獨立的課題受到研究者的重視。人臉檢測的問題在近十年中得到了廣泛的關(guān)注和長足的發(fā)展,國內(nèi)外很多研究學(xué)者提出
28、了很多種人臉檢測的方法,并在不同的領(lǐng)域取得了一定的成果。但對于尋找一種能夠普遍適用于各種復(fù)雜情況的且準(zhǔn)確率很高的檢測算法,還有很大的距離。</p><p> 現(xiàn)今,國外的主要研究單位有美國的麻省理工媒體實驗室(MIT Media lab) 、卡耐基梅隆大學(xué)的人機(jī)交互學(xué)院(Human computer interface institute)、微軟研究院的視覺技術(shù)研究組(Vision Technology Gro
29、up)、英國劍橋大學(xué)工程系(Department of Engineering)等,我國的研究單位主要有中科院自動化所、中科院計算所、哈爾濱工業(yè)大學(xué)、清華大學(xué)、浙江大學(xué)等等。MPEG-7標(biāo)準(zhǔn)組織也已經(jīng)建立了人臉識別草案小組,人臉檢測算法也是一項征集的內(nèi)容。隨著人臉檢測技術(shù)研究的深入,國際上發(fā)表的有關(guān)論文數(shù)量也大幅度增加,如IEEE FG(IEEE人臉與手勢自動識別國際會議)、ICIP(圖像處理國際會議)、CVPR(計算機(jī)視覺與模式識別會
30、議)等一些重要國際會議上每年都有大量關(guān)于人臉檢測的論文,占有關(guān)人臉研究論文的近1/3之多。從整體來看這一方向涉及了數(shù)字圖像處理、計算機(jī)視覺、人工智能等多個學(xué)科領(lǐng)域,同時這一領(lǐng)域適應(yīng)了現(xiàn)代計算機(jī)網(wǎng)絡(luò)發(fā)展和現(xiàn)代通信發(fā)展的需要,無論是從學(xué)術(shù)性還是從實用性來看,均具有極高的研究與應(yīng)用價值。從目前已有的研究來看,</p><p> 1.1.2 人臉檢測研究的意義 </p><p> 首先在這里給
31、出人臉檢測的定義:人臉檢測是指對于任意一幅給定的圖像,采用一定的策略對其進(jìn)行搜索以確定其中是否含有人臉,如果是則返回一臉的位置、大小和姿態(tài)。人臉檢測作為人臉信息處理中的一項關(guān)鍵技術(shù), 近些年來已成為模式識別與計算機(jī)視覺領(lǐng)域內(nèi)一項受到普遍重視,且研究十分活躍的課題。人臉檢測技術(shù)在很多方面都有重要的應(yīng)用,如: </p><p><b> 1、身份鑒定</b></p><p&
32、gt; 人臉身份鑒定技術(shù)是生物識別技術(shù)中重要一種,以其直接性,唯一性,方便性等特點在公安,海關(guān),交通,金融,社會保險,醫(yī)療及其它民用安全控制系統(tǒng)等領(lǐng)域具有較為廣闊的發(fā)展前景和很高的社會經(jīng)濟(jì)效益。</p><p><b> 2、智能監(jiān)控 </b></p><p> 在傳統(tǒng)的視頻監(jiān)控系統(tǒng)(如閉路電視系統(tǒng))中,工作人員需要不斷監(jiān)控屏幕去發(fā)現(xiàn)可疑的事件和目標(biāo),因此工作量
33、很大而且效率也很低。在采用人臉檢測技術(shù)的智能監(jiān)控系統(tǒng)中,計算機(jī)可以在分割、檢測出人物目標(biāo)時自動通知工作人員的介入,從而減輕工作人員的負(fù)擔(dān)并且提高效率;計算機(jī)還可以對這些目標(biāo)的運動模式進(jìn)行一些自動分析,以確定是否為可疑目標(biāo)。</p><p><b> 3、多媒體信息檢索</b></p><p> 隨著因特網(wǎng)技術(shù)的迅速普及,以及網(wǎng)上多媒體信息(如圖像,視頻)日益豐富,
34、使得目前所能應(yīng)用的信息資源已經(jīng)非常豐富和龐大, 而快速有效地尋找感興趣的相關(guān)信息已經(jīng)變得日趨困難, 采用關(guān)鍵字和描述文本檢索的方式已經(jīng)無法勝任現(xiàn)有的需求,于是基于內(nèi)容的多媒體信息檢索技術(shù)應(yīng)運而生,內(nèi)容為人臉的圖像和視頻檢索是其中非常重要的部分。</p><p><b> 4、人機(jī)交互</b></p><p> 在人機(jī)交互中,計算機(jī)把關(guān)于用戶身份、狀態(tài)、意圖的信息從
35、圖像中抽取出來,然后做出相應(yīng)響應(yīng),比方說觀察一個人的面部表情,然后采用不同的方式進(jìn)行問題處理。</p><p> 在上述幾個方面, 人臉識別、 辨認(rèn)、 定位以及追蹤等都與人臉檢測密切相關(guān)。人臉定位的目的是為了確定圖像中人臉的位置。假設(shè)一幅圖像中只存在一張臉,則面部特征檢測的目的是檢測特征的存在和位置,如眼睛、鼻子、鼻孔、眉毛、嘴唇、 耳朵等。人臉識別或辨認(rèn)是將輸入圖像與數(shù)據(jù)庫中的圖像對比, 如果存在,報告匹配結(jié)
36、果。人臉識別的目的是為了檢驗輸入圖像中的個體的身份,而人臉追蹤方法是實時地、連續(xù)地估計在圖像序列中的人臉的位置和可能的方向。面部表情識別涉及識別人類的情感狀態(tài),如高興、悲傷、喜惡等。 </p><p> 任何一幅人臉圖像處理系統(tǒng)的第一步是人臉在圖像中的位置,然而從單張圖片中檢測出人臉是一項具有挑戰(zhàn)性的工作,因為人臉在大小、位置、方向、姿勢方面是可變的, 人臉表情、牙齒相接觸的方式、光照等,也會改變?nèi)四樀恼w外觀
37、。</p><p> 1.2人臉檢測常遇的困難因素</p><p> 人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化地結(jié)構(gòu)體,因此人臉檢測是一個復(fù)雜的具有挑戰(zhàn)性的模式檢測問題,其主要的難點有兩方面:一方面是由于人臉內(nèi)在的變化所引起,另一方面是由于外在條件所引起的變化,具體可歸納為以下幾個方面:</p><p> ?。?)面部表情:臉部的外觀直接受到面部表情的影響。 </
38、p><p> ?。?)姿勢:人臉圖像因為相機(jī)和人臉的相對位置而產(chǎn)生變化(正面,45度角,側(cè)面,顛倒)。另外,一些臉部特征如人眼或鼻子可能部分或完全被遮擋。</p><p> ?。?)存在或缺少結(jié)構(gòu)化成分:臉部特征如上唇胡須,下巴胡須,眼鏡等并不是每個人臉中都有。并且這些成分的變化很多,比如形狀,顏色,大小等。</p><p> ?。?)遮擋:人臉可能部分被別的物體遮擋住
39、。在一幅有一群人的圖像中,一些人臉可能被別的臉擋住。</p><p> ?。?)圖像朝向:人臉圖像直接因為照相機(jī)的光軸轉(zhuǎn)動而變化。</p><p> ?。?)圖像條件:當(dāng)圖像被建立時,各種光線(光譜,光源分布,強(qiáng)度)和相機(jī)特質(zhì)(感應(yīng)器,鏡頭)都影響人臉的外觀。</p><p> 1.3 論文的主要工作</p><p> 目前,隨著圖像采集
40、技術(shù)的飛速發(fā)展以及計算機(jī)處理速度的不斷提高,彩色圖像在各種應(yīng)用中逐漸占據(jù)了主流地位。彩色圖像包含的信息要比灰度圖像豐富的多,對色彩信息的利用已經(jīng)越來越廣泛的應(yīng)用在計算機(jī)視覺研究領(lǐng)域。彩色圖像中,膚色是人臉的重要信息,由于它不依賴于面部的細(xì)節(jié)特征,對于旋轉(zhuǎn)、表情、姿態(tài)等變化情況都能適用,因此具有相對的穩(wěn)定性。在色度空間中,人臉的膚色分布能表現(xiàn)出良好的聚類特性。利用膚色特征可以快速拋棄大量背景因素迅速得到目標(biāo)區(qū)域。</p>&
41、lt;p> 本文以完成人臉識別的前期準(zhǔn)備為目標(biāo),利用膚色的聚類特性,設(shè)計并實現(xiàn)了一個復(fù)雜背景下的人臉檢測,論文包括以下內(nèi)容:</p><p> (1)膚色分割過程:在比較色彩空間對膚色聚類性質(zhì)的基礎(chǔ)上,建立了膚色分布的高斯模型并計算各點的膚色相似度。然后對膚色相似度進(jìn)行閾值分割,圖像被分割為背景和類膚色區(qū)域。再把所有的類膚色區(qū)域標(biāo)定和驗證,排除其中的非人臉區(qū)域,最后得到人臉區(qū)域。</p>
42、<p> ?。?)光照補償:由于膚色受光照的影響比較大,因此在進(jìn)行膚色分割前需要消除光照的影響。本文采用了全局白平衡的方法進(jìn)行色溫的補償,用基于復(fù)合變換的方法進(jìn)行亮度補償。為了能夠自動補償,本文對光照條件進(jìn)行了判斷。</p><p> 1.4本文的結(jié)構(gòu)安排</p><p> 全文共分為五章,具體安排如下: </p><p> 第一章 緒論,簡要介紹
43、了人臉檢測技術(shù)產(chǎn)生的國內(nèi)外背景和意義,以及人臉檢測技術(shù)的應(yīng)用范圍,如:身份鑒定、視頻檢索、智能監(jiān)控、人機(jī)交互等領(lǐng)域,強(qiáng)調(diào)了人臉測技術(shù)研究的重要意義;最后給出了本文的主要研究內(nèi)容和論文的組織結(jié)構(gòu)。</p><p> 第二章 人臉檢測技術(shù)綜述,對現(xiàn)有的人臉檢測算法進(jìn)行了分類:基于啟發(fā)式方法、基于膚色方法和基于統(tǒng)計的方法。詳細(xì)地分析了一些具有代表性的方法的特點,并對這三類人臉檢測算法進(jìn)行了性能評價和小結(jié)。</
44、p><p> 第三章 彩色圖像中的膚色分割技術(shù),包括膚色特征,色彩空間理論,膚色</p><p><b> 模型分類和建立。</b></p><p> 第四章 基于不同光照條件下膚色模型的人臉檢測算法,從三類不同光照模</p><p> 型入手,分析不同光照環(huán)境對人臉檢測系統(tǒng)的膚色匹配環(huán)節(jié)影響,實驗從主觀和<
45、;/p><p> 客觀上驗證了算法的有效性。</p><p> 第五章 總結(jié)與展望,總結(jié)了全文內(nèi)容和工作,并對需要進(jìn)一步研究的問題</p><p><b> 進(jìn)行了展望。 </b></p><p> 2人臉檢測技術(shù)方法綜述</p><p> 人臉檢測是指在輸入圖像中確定是否有人臉存在的過程
46、。人臉檢測系統(tǒng)的輸入是可能包含人臉的圖像,輸出是關(guān)于圖像中是否存在人臉以及人臉的位置、大小等信息的參數(shù)化描述。人臉檢測的對象從廣義上講既包括整張人臉,也包括某個面部器官,例如眼睛、鼻子、嘴巴、眉毛等。檢測的內(nèi)容除了從一幅背景圖像中將被檢測對象分割出來以外,還包括確定其位置、方向、大小、甚至形狀等。</p><p> 綜上所述,人臉檢測問題所包含的問題十分的廣泛,從不同的角度可以有多種分類方法,本論文所討論的主要
47、是靜止圖像中的人臉檢測問題。根據(jù)對人臉檢測算法發(fā)展和現(xiàn)狀的研究,我們可將人臉檢測主流算法分為三類進(jìn)行簡單的介紹與分析,分別為:基于啟發(fā)式模型的方法、基于膚色模型的方法以及基于統(tǒng)計理論的方法。</p><p> 2.1基于啟發(fā)式模型的人臉檢測</p><p> 基于啟發(fā)式模型的方法首先抽取幾何形狀、灰度、紋理等特征,然后檢驗它是否符合人臉的先驗知識。通過檢測出不同的人臉幾何特征位置,根據(jù)
48、它們之的空間幾何關(guān)系來定位人臉,所謂人臉的幾何特征指的是人類面部器官在幾何體現(xiàn)的特征?;趩l(fā)式模型的方法可細(xì)分為以下三個方面:基于先驗知識的方法、基于局部特征的方法和基于模板的方法。</p><p> ?。?)基于先驗知識的方法:是將人臉面部器官之間的關(guān)系編碼準(zhǔn)則化的人臉檢測方法。該方法是一種自上而下的方法,根據(jù)人臉面部器官的對稱性、灰度差異性等先驗知識,制定出一系列的準(zhǔn)則,當(dāng)圖像中的待測區(qū)域符合準(zhǔn)則,則被檢測
49、為人臉區(qū)域。</p><p> Yang 等人在1994年提出的基于鑲嵌圖的人臉檢測方法是基于先驗知識方法的典型例子。此方法是利用4×4鑲嵌圖將人臉分塊,根據(jù)每一塊的灰度值制定準(zhǔn)則來進(jìn)行判定的。他們將系統(tǒng)分成三級,利用不同精度的二次采樣產(chǎn)生三級不同分辨率圖像。針對不同分辨率的圖像采用不同準(zhǔn)則進(jìn)行判定,如:在低分辨率圖像里的準(zhǔn)則主要體現(xiàn)了人臉的大體輪廓,而在高分辨率圖像里的準(zhǔn)則主要體現(xiàn)了人臉的細(xì)節(jié)特征。
50、雖然Yang的方法在檢測性能方面不是很突出,但是這種由粗至細(xì)的檢測思想對以后的研究工作卻產(chǎn)生了積極深刻的影響。盧春雨等對鑲嵌圖方法進(jìn)行了改進(jìn),并提出了3x3的廣義三分圖方法。此方法充分利用了人臉器官的自然分布,這樣可以更直觀的利用人臉的先驗知識來制定準(zhǔn)則,使得鑲嵌圖子塊對臉形的自適應(yīng)操作成為可能,并且取得了較好的實驗結(jié)果。</p><p> ?。?)基于局部特征的方法:此方法著眼于檢測面部的一些不變的特征,如眼睛
51、、鼻子、嘴巴等等。此法首先在整個圖像中搜索一組人臉的局部特征,然后通過它們之間的幾何關(guān)系組合成候選人臉區(qū)域。與基于先驗知識的方法不同,此方法是自底而上的,首先利用各種手段尋找上述的不變特征,然后綜合找到的這些不變特征來確定待檢測區(qū)域是否有人臉存在。</p><p> Graf等首先利用帶通濾波器選擇出一段頻率,然后依據(jù)形態(tài)學(xué)的知識設(shè)定一系列的閾值來找出眼睛、嘴巴等區(qū)域,最后依照以上位置來檢測出人臉。王延江等利用
52、膚色方法分割出人臉的候選區(qū)域后,然后再利用小波分解對每一個侯選區(qū)域進(jìn)行人臉特征分析,若所檢測到的區(qū)域特征分布相似于某一預(yù)先定義的人臉模型,則確認(rèn)該區(qū)域代表人臉。這種方法的主要問題是由于圖像噪聲等因素的影響,造成人臉局部特征不太明顯,這使得根據(jù)局部特征組合人臉的算法失效。</p><p> (3)基于模板的方法可分為兩類:即預(yù)定模板和變形模板。預(yù)定模板方法是首先制定出標(biāo)準(zhǔn)的模板,然后計算出待檢測區(qū)域和模板的相關(guān)值
53、,當(dāng)相關(guān)值符合制定的準(zhǔn)則時就判定待檢測區(qū)域內(nèi)有人臉。變形模板首先制定出模板參數(shù),然后根據(jù)檢測區(qū)域的數(shù)據(jù)對參數(shù)進(jìn)行修改直至收斂,以達(dá)到檢測出人臉面部器官位置的目的。</p><p> 梁路宏等提出多模板匹配的方法,預(yù)制人眼和不同長寬比的五種人臉模板,首先用人眼模板進(jìn)行初步篩選,然后再用人臉模板進(jìn)行檢測以適應(yīng)不同的臉形。此方法對單人臉的檢測有比較好的效果。Cootes等提出的主動形狀模型(ASM)與主動表觀模型(A
54、AM)是變形模板中很經(jīng)典的兩種方法,現(xiàn)在很多學(xué)者仍以此為基礎(chǔ),進(jìn)行更加深入的研究。2004年,Cootes又提出了一種新的統(tǒng)計形狀模型法,稱為平滑統(tǒng)計形狀模型方法。此方法是利用卷積函數(shù)取代傳統(tǒng)形狀模型方法的坐標(biāo)點來表示人臉的輪廓和關(guān)鍵部位的。該文最后指出,此方法在對變形物體的建模和表達(dá)方面將會有廣闊的應(yīng)用價值。</p><p> 2.2基于膚色模型的人臉檢測</p><p> 膚色是人
55、臉表面所具有的一種重要信息,由于它不依賴于面部的細(xì)節(jié)特征,能適應(yīng)人臉旋轉(zhuǎn)、表情等各種變化,具有相對的穩(wěn)定性,并且和大多數(shù)背景物體的顏色相區(qū)別,因此基于膚色模型的人臉檢測方法是比較常用的方法之一,也是最容易理解的。它的主要手段是利用人臉膚色與周圍環(huán)境的差異,通過膚色將人臉與背景環(huán)境區(qū)分開來。</p><p> 經(jīng)研究發(fā)現(xiàn):(1)在灰度圖像下兩個外形相似的圖像很可能在顏色空間下相差巨大;(2)不同人種的人臉膚色能在
56、顏色空間中聚成相異的緊湊的類;(3)影響膚色值變換的最主要因素是亮度而不是色度;根據(jù)以上這些性質(zhì),人們在研究中經(jīng)常使用的顏色空間有RGB(三基色)、rgb(亮度歸一化三基色)、HIS(色調(diào)、飽和度、亮度)、YCbCr(CCR601編碼方式的色度模型)以及UCS(CIE提出的一種均勻色標(biāo)體系)。</p><p> 目前,在各種顏色空間中,均有人提出過膚色模型,這些膚色模型各有特點,有的只是對色調(diào)敏感,有的對色調(diào)不
57、敏感而受亮度影響較大,因此只有綜合使用幾種膚色模型,這樣才能達(dá)到比較好的效果。本文在第三章將重點介紹膚色模型。</p><p> 2.3 基于統(tǒng)計模型的人臉檢測</p><p> 基于統(tǒng)計模型的人臉檢測就是指基于統(tǒng)計理論的人臉檢測方法,它的核心思想是統(tǒng)計特征的提取。利用統(tǒng)計分析與機(jī)器學(xué)習(xí)的方法來查找出人臉樣本與非人臉樣本各自的統(tǒng)計特征,再使用各自的特征構(gòu)建分類器,也就是說將人臉區(qū)域看作
58、是一類模式,即模板特征;使用大量的人臉與非人臉樣本訓(xùn)練并構(gòu)造分類器,通過判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▉韺崿F(xiàn)人臉的檢測。基于統(tǒng)計特征的人臉檢測方法主要分為以下幾種:</p><p> (1)基于特征子空間的方法;它將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分人臉與非人臉兩類模式。子空間方法主要包括兩類:主成分分析(PCA)方法和線性判別分析(LDA)方法。主成分分析(PCA)方法
59、是KL(Karhunen.Loeve)變換的別稱。此方法將樣本圖像進(jìn)行KL變換來消除原來各分量之間的相關(guān)性,取變換后所得到的最大的若干個特征向量來表示原來的圖像,保留了原來圖像差異的最大信息,這若干個特征向量就稱作為主成分。</p><p> Turk等將PCA方法用于人臉檢測與識別技術(shù),他們將人臉圖像投影到一個由若干個最大的特征向量張成的子空間里。與基于外在特征的人臉檢測相比,這些特征向量不對應(yīng)特定的面部器官
60、,例如眼睛、鼻子、嘴巴等。若要顯示某個特定的人臉,只要通過對這些特征向量加權(quán)求和便可得到。因此這些特征向量也被稱為“特征臉”,該方法也常被稱為特征臉方法。</p><p> 線性判別分析方法中典型的有Yang等人提出的Fisher線性判別(FLD)方法,他們首先使用自組織映射將人臉與非人臉樣本各分為25個類,然后再計算各類的類間離散度與類內(nèi)離散度,利用兩者的比值求出投影矩陣。與本征臉方法相比較,F(xiàn)LD同時考慮了
61、類間與類內(nèi)的離散度,選取的投影方向優(yōu)于本征臉方法,因此得到了比較優(yōu)良的檢測的效果。</p><p> ?。?)人工神經(jīng)網(wǎng)(ANN)方法是通過學(xué)習(xí)的方法把模式的統(tǒng)計特性隱含在ANN的結(jié)構(gòu)和參數(shù)之中。由于人工神經(jīng)網(wǎng)絡(luò)高度的自適應(yīng)性,因此它對于圖像的容忍度相當(dāng)高,對于平移、變形、噪聲甚至局部殘缺的圖像都能保持一定的識別率,有時候還可能會達(dá)到傳統(tǒng)方法很難達(dá)到的效果。Rowley等在1996年把基于神經(jīng)網(wǎng)絡(luò)的人臉檢測系統(tǒng)分
62、為兩個階段:第一個階段是基于神經(jīng)網(wǎng)絡(luò)的分類器,此分類器的輸入是規(guī)定尺寸的檢測區(qū)域,輸出為1到-1的數(shù),由此來判斷檢測區(qū)域是否為人臉;第二階段是合并重復(fù)檢測并判別,由于訓(xùn)練樣本以及分類器等因素,在圖像中以人臉為中心的一定區(qū)域內(nèi)會產(chǎn)生重復(fù)檢測。此方法只針對正面垂直人臉的檢測。1998年,Rowley等又提出了改進(jìn)方法,使得該系統(tǒng)可以檢測圖像中按任意角度旋轉(zhuǎn)的人臉。</p><p> 人工神經(jīng)網(wǎng)絡(luò)用于人臉檢測雖然有它
63、獨特的地方,但也有致命的缺點,一方面是用于訓(xùn)練輸入的樣本維數(shù)過高,計算量比較大,不容易收斂,且搜索的過程比較慢,不容易達(dá)到實時;另外一個問題則是很難找到一個標(biāo)準(zhǔn)的非人臉的樣本,來適用于各種情況。</p><p> (3)支持向量機(jī)(SVM)是由V N.Vapnikt在1995年提出的一種新的統(tǒng)計學(xué)習(xí)理論。他指出經(jīng)驗風(fēng)險最小并不能保證期望風(fēng)險最小,提出了結(jié)構(gòu)風(fēng)險最小化原理(SRM),給出了核心概念VC維,指出為了
64、最小化期望風(fēng)險必須同時最小化經(jīng)驗風(fēng)險和VC維。</p><p> 梁路宏等使用模板匹配法先進(jìn)行粗選,然后采用SVM分類器進(jìn)行分類,在模板匹配限定的子空間內(nèi)采用“自舉”方法收集“非人臉”樣本訓(xùn)練,有效降低了訓(xùn)練的難度。祝海龍等采用小波變換的方法提取人臉特征,大大的降低了特征矢量的維數(shù),并用交叉檢驗的方法有效的解決了支持向量機(jī)訓(xùn)練時的參數(shù)估計問題。通過實驗得到了較高的檢測性能。</p><p&g
65、t; ?。?)隱馬爾可夫模型(HMM)是一種存在兩種機(jī)理的隨機(jī)過程;其一是有限狀態(tài)的馬爾可夫鏈,其二是序列的觀察值。由于不能直接得到馬爾可夫鏈的狀態(tài),而只能通過觀察值來觀察,因此稱為隱馬爾可夫鏈。</p><p> 陳茂林等提出了自組織HMM的人臉檢測方法。采用多種偏轉(zhuǎn)角度的人臉樣本對HMM進(jìn)行訓(xùn)練,并得到其參數(shù)的初步估計。接著裁剪那些狀態(tài)之間的弱連接,將網(wǎng)絡(luò)自組織成多路徑的左右模型(MPLR)。最后利用EM算
66、法重新估計參數(shù)。</p><p> ?。?)Boosting方法是可以將弱分類器組合成為強(qiáng)分類器的統(tǒng)計學(xué)習(xí)方法。其基本思想是對訓(xùn)練失敗的訓(xùn)練樣本賦以較大的權(quán)值,使學(xué)習(xí)算法在后續(xù)的學(xué)習(xí)中集中對比較難的訓(xùn)練樣本進(jìn)行學(xué)習(xí),最后將由算法挑選出來的若干個弱分類器加權(quán)相加組成強(qiáng)分類器。</p><p><b> 2.4 本章小結(jié)</b></p><p>
67、 本章主要介紹了人臉檢測技術(shù)綜述,總結(jié)了目前人臉檢測與識別技術(shù)中存在的主要方法,評述了各種方法的優(yōu)缺點以及人臉檢測方法的發(fā)展方向。本章只是對目前應(yīng)用于人臉檢測與識別的技術(shù)作了選擇性的介紹,經(jīng)過幾十年的研究與發(fā)展,人臉檢測和識別技術(shù)取得了很大的進(jìn)步,但這并不意味著這兩個問題己經(jīng)是被解決了的成熟技術(shù)問題,相反,人臉檢測和識別研究目前仍面臨諸多的挑戰(zhàn),具體算法的實現(xiàn)也有很多因素需要研究,研究更加穩(wěn)定而實用的人臉檢測與識別的核心算法,提供更加
68、有效的影響檢測和識別性能的關(guān)鍵問題解決方案,仍然是相關(guān)領(lǐng)域內(nèi)的重點研究對象。</p><p> 3基于膚色模型的彩色圖像人臉檢測</p><p> 3.1膚色模型概述與建立</p><p> 目前,隨著信息技術(shù)的發(fā)展,色彩信息已經(jīng)越來越廣泛的應(yīng)用于計算機(jī)等視覺研究領(lǐng)域。在彩色圖像中,膚色是人臉的重要信息。當(dāng)光照條件不改變時,膚色對于旋轉(zhuǎn)、姿態(tài)、表情等變化不敏感
69、,并且不依賴于面部的細(xì)節(jié)特征變化,具有相對的穩(wěn)定性,并且和大多數(shù)背景物體的顏色能比較容易的相區(qū)別開來。所有,基于膚色的算法非常適合解決復(fù)雜背景下彩色圖像中的人臉檢測問題。利用膚色特征可以快速拋棄大量背景并得到有可能存在人臉的皮膚區(qū)域,基于膚色特征的方法具有計算速度快以及穩(wěn)定性好的優(yōu)點。</p><p> 本章根據(jù)實際應(yīng)用環(huán)境對彩色圖像中人臉檢測算法進(jìn)行研究,并將膚色特征引入人臉檢測算法中,首先對原始彩色圖像進(jìn)行
70、預(yù)處理,對存在色偏的圖像進(jìn)行光照補償。然后利用膚色表現(xiàn)出來的聚類特性建立膚色模型,并利用膚色模型盡可能的排除背景中非膚色成分,之后再對提取的膚色區(qū)域進(jìn)行預(yù)處理,利用所設(shè)計的人臉判別標(biāo)準(zhǔn)分割出可能的候選人臉區(qū)域。最后利用模板匹配,對各種不同的彩色圖片進(jìn)行實驗處理,最終找出人臉?biāo)趨^(qū)域。</p><p> 3.2 顏色空間的選擇</p><p> 下面簡單介紹一下已有的膚色模型:</
71、p><p> ?。?)RGB色彩空間的膚色模型(紅、綠、藍(lán)三基色模型)</p><p> 由于彩色圖像是多光譜圖像的一種特殊的情況,對應(yīng)于人類視覺的三基色即紅、綠、藍(lán)三個波段,是對人眼光譜量化性質(zhì)的近似結(jié)果。因此利用R、G、B三基色這三個分量來表征顏色也是很自然的一種格式。大多數(shù)圖像采集設(shè)備都是以電荷耦合器件(CCD)技術(shù)為核心的,直接感知色彩的R、G、B三個分量,這也使得三基色模型成為圖像
72、成像、顯示、打印等設(shè)備的基礎(chǔ),具有非常重要的作用。RGB顏色空間模型主要應(yīng)用于CRT監(jiān)視器和圖形刷新等設(shè)備中。盡管該顏色空間是最普遍的,但是由于R、G、B三色之間存在強(qiáng)烈的相關(guān)性,所有在大多數(shù)的膚色分割中一般都沒有直接利用RGB彩色空間,而是利用其變化后的彩色空間進(jìn)行分割的。在RGB色系坐標(biāo)中,每一個數(shù)字圖像中像素點的顏色都可以用三維空間中的第一象限中的一個點來表示。當(dāng)RGB顏色空間的任何顏色分量都為零,表示為黑色;三個分量達(dá)到最大值時
73、,表示為白色;而當(dāng)三個分量相等時,則產(chǎn)生灰度像素點。這個模型是基于笛卡爾坐標(biāo)系統(tǒng),三個軸分別為R、G、B,見圖3-1。我們感興趣的部分是個正方體。原點對應(yīng)黑色,離原點最遠(yuǎn)的頂點對應(yīng)白色。在這個模型中,從黑到白的灰度值分布在從原點到離原點最遠(yuǎn)頂點間的連線上,</p><p> 圖3-1 RGB色彩空間</p><p> 從上邊的膚色模型定義中可以看出,這種模型是通過分別統(tǒng)計RGB三種分量
74、的數(shù)值特征取得的,基本是線性關(guān)系,并且沒有考慮光照等因素,所以,針對有復(fù)雜光照的圖像其檢測效果并不理想。在RGB色彩空間表達(dá)中,色度信息與亮度信息是混合在一起的。由于周圍環(huán)境光照的改變,亮度可能使人臉的檢測變得更加復(fù)雜,使得膚色分割的結(jié)果不可靠,因此RGB色彩空間不適合用于膚色檢測。</p><p> (2)亮度歸一化rgb膚色模型</p><p> 若在RGB色彩空間中有兩個像素點(
75、R1,G1,B1)和(R2,G2,B2),如果它們存在如下比例關(guān)系:</p><p> R1/R2=G1/G2=B1/B2 (3-1)</p><p> 則我們可認(rèn)為這兩點存在相同的顏色,不同的亮度。人臉圖像中不同區(qū)域的膚色差異主要體現(xiàn)在亮度上,通過色彩的亮度歸一化,可以縮小膚色差異,亮度歸一化我們可采用如下公式:</p>&
76、lt;p><b> (3-2)</b></p><p> 其中r+g+b=1。上述公式定義了從RGB色彩空間到色度空間的映象,即從一個三維空間到二維空間的變換。歸一化空間中的r、g、b只去處了R、G、B中的相對亮度成分,r、g、b中仍存在著亮度信息。所以這種算法的亮度適應(yīng)性較差。</p><p> (3)HSV空間模型(色度、飽和度、亮度模型)</p
77、><p> 這是Munseu提出的色彩系統(tǒng)模型,這種模型經(jīng)常為藝術(shù)家所使用。這種格式反映了人類觀察色彩的方式,同時它也有利于圖像的處理。色調(diào)(Hue)、飽和度S(Saturation)、亮度(Value)模型描述了顏色的三個基本特征。在對彩色信息的利用中,這種格式的優(yōu)點在于它將亮度V與反映色彩本質(zhì)特性的兩個參數(shù),即色度H和飽和度S分開。當(dāng)我們提取一類物體在色彩方面的特性時,經(jīng)常需要了解其在某一色彩空間的聚類特性,而
78、這一聚類特性往往體現(xiàn)在了色彩的本質(zhì)特性上,但其又經(jīng)常受到光照明暗等條件的干擾與影響。光照暗給物體顏色帶來的直接影響的就是亮度分量,因此,若我們能夠?qū)⒘炼确至繌纳手刑崛〕鋈?,而只用反映色彩本質(zhì)的色度和飽和度來進(jìn)行聚類分析,就會獲得比較好的效果。這正是HSV格式在彩色圖像處理和計算機(jī)視覺的研究中經(jīng)常被使用到的原因。</p><p> HSV色彩空間和RGB色彩空間之間存在著非線性的轉(zhuǎn)換關(guān)系。換言之,HSV色彩空間
79、和RGB色彩空間只是同一物理量的不同表示法,因而它們之間存在著轉(zhuǎn)換關(guān)系,轉(zhuǎn)換關(guān)系如下:</p><p> ?。?)首先對RGB色彩空間進(jìn)行歸一化處理,即利用公式(3-2)進(jìn)行轉(zhuǎn)換,將RGB值歸一化到[0,1]之間;</p><p> ?。?)再利用公式(3-3)(如下所示)進(jìn)行轉(zhuǎn)換即可。其中H的取值范圍為[0,2],用弧度值表示,s和V的取值范圍均為[0,1]。</p>&l
80、t;p> ?。?)令max=Max(r,g,b),min=Min(r,g,b),則:</p><p><b> V=max</b></p><p><b> =</b></p><p> = (3-3)</p><p> HSV空間具有將色度與亮度分離的特點,但是H
81、SV空間同樣也存在以下幾個不足:由RGB空間向HSV空間的非線性映射計算復(fù)雜度比較高,計算效率比較低;HSV色彩空間中存在奇異點,即當(dāng)飽和度S值為零時,而色度H沒有定義;在奇異點附近R、G、B值的微小變化會引起H、S、V值的明顯變化,即飽和度S越小,顏色越淺時,則色調(diào)H值越不穩(wěn)定。故HSV空間同樣不適用于作為膚色分割的基空間。</p><p> (4)基于YCbCr(或稱YUV)空間的膚色模型</p>
82、;<p> YCbCr是一種常見的膚色模型,是從YUV色彩空間衍生而來的。這種色彩空間是以演播室的質(zhì)量標(biāo)準(zhǔn)為目標(biāo)的CCIR601編碼方案中采用的彩色表示模型,被廣泛的應(yīng)用在電視的色彩顯示等領(lǐng)域。在此色彩空間里,Y是亮度信息,即灰度值,Cb、Cr是色度信息,它同樣具有HIS格式中將亮度分量分離的優(yōu)點。但由于它可以從RGB格式線性變化得到,所以直接應(yīng)用于物體色彩聚類分析的情況不多, YcbCr(256級)色彩空間與RGB(2
83、4位)色彩空間的轉(zhuǎn)換關(guān)系如下:</p><p> ?。?)RGB轉(zhuǎn)換為YCbCr</p><p> ?。?-4) </p><p> ?。?)YCbCr轉(zhuǎn)換為RGB</p><p><b> (3-5)</b></p><p> 3.2.1聚類性比較<
84、;/p><p> 在RGB色彩空間表達(dá)中,色度信息和亮度信息是混合在一起的。由于周圍光照環(huán)境的改變,亮度可能使人臉的檢測變得更加困難,這使得膚色分割的結(jié)果不可靠,因此RGB色彩空間并不是理想之選。</p><p> HSV空間與YCbCr空間都具有將色度與亮度分離的特點,但是HSV空間存在以下缺點:</p><p> ?。?)三個分量H、s、V是由三基色R、G、B經(jīng)
85、過非線性變換得到的,因此計算起來復(fù)雜度高,計算效率也較低。</p><p> (2)HSV色彩空間中存在著奇異點,即色點在V軸上時,其S值為零,而H則沒有定義。而且在奇異點附近R、G、B值的微小變化會引起H、S、V值的明顯變化。也就是,飽和度S越小,顏色越淺時,則色調(diào)H值越不穩(wěn)定。</p><p> 與HSV色彩空間相比,YCbCr色彩空間具有以下優(yōu)點:</p><
86、p> ?。?)YcbCr空間具有與人類視覺感知過程相類似的構(gòu)成原理。</p><p> ?。?)YCbCr顏色模型被廣泛地應(yīng)用在電視顯示等領(lǐng)域中,也是許多視頻壓縮編碼,如MPEG、JPEG等標(biāo)準(zhǔn)中普遍采用的顏色表示格式。</p><p> ?。?)YCbCr色彩空間具有與HSV等其它一些色彩格式相類似的將色彩中的亮度分量分離出來的優(yōu)點;</p><p> ?。?/p>
87、4)YCbCr的計算過程和空間坐標(biāo)表示形式比較簡單,與RGB之間的換算關(guān)系簡單,避免了非線性空間的奇異性。</p><p> (5)YCbCr色彩空間是離散的,采用YCbCr空間易于實現(xiàn)聚類算法;</p><p> (6)膚色在YCbCr色彩空間的聚類性較好。</p><p> 故本文最終選擇了YCbCr色彩空間。</p><p>
88、3.3 建立膚色模型</p><p> 所謂膚色模型,即是用一種代數(shù)的或查找表等形式來表示哪些像素的顏色屬于膚色,或者表征出某一像素的顏色與膚色的相似程度。用膚色模型對膚色進(jìn)行檢測時主要分為兩個階段:即模型的建立與模型的運用。模型的建立主要是通過對大量膚色像素集進(jìn)行統(tǒng)計分析,然后確定模型中的參數(shù);模型的運用,主要是通過已建立的膚色模型來判別所輸入的像素或區(qū)域是否為膚色,或者給出其與膚色的相似程度。后一階段與兩類
89、分類器的設(shè)計相類似。</p><p><b> 3.3.1模型選取</b></p><p> 常用的膚色模型主要有以下兩種:</p><p> ?。?)色彩空間中的聚類模型</p><p> 這種方法主要是通過色彩格式的變換,使得膚色在某一色彩或變形的色彩空間</p><p> 中呈現(xiàn)良好
90、的聚類特性,然后將這一聚特類在色彩空間中的分布區(qū)域用一種簡單的代數(shù)解析式加以表達(dá)。</p><p> 這類模型以Anil K Jain等建立的CbCr橢圓聚類方法最為典型。如圖3-2,Anil K.Jain用一個橢圓來近似膚色區(qū)域。因為在Y值不同的地方,取CbCr子平面的投影會得到不同的結(jié)果,所以不能簡單地把Y分量排除。Anil K·Jain采用對YCbCr色彩格式進(jìn)行分段非線性色彩變換,用4個邊界來
91、限制膚色聚類區(qū)域來更好地適應(yīng)亮度過明或過暗的區(qū)域。</p><p><b> 圖3-2橢圓模型</b></p><p> 具體推導(dǎo)過程參考文獻(xiàn)。膚色在變換后的Cb’Cr’空間里聚集緊密,可用一個橢圓來近似這一塊膚色區(qū)域。它的解析表達(dá)式為:</p><p> +=1 (3-6)</p>&l
92、t;p><b> 其中, =</b></p><p> 解析式中的常量分別為:</p><p><b> (3-7)</b></p><p> 將像素點的Cb,Cr值代入公式(3-6)左邊表達(dá)式,若值大于1即在橢圓外,就可判定該點不是膚色點。若值小于1,該點則為膚色點。</p><p>
93、;<b> ?。?)高斯模型</b></p><p> 這種方法主要是利用了統(tǒng)計學(xué)的原理,認(rèn)為像膚色這樣符合正態(tài)分布的隨機(jī)樣本在特征空間中的分布應(yīng)該是符合高斯分布的,而高斯分布的數(shù)學(xué)表達(dá)形式簡單且直觀,又是統(tǒng)計學(xué)中研究得比較深入的一種正態(tài)模型,所以對其加以利用具有一定的優(yōu)越性。如圖3-3所示:</p><p><b> 圖3-3 高斯模型</b&g
94、t;</p><p> 橢圓模型是一種二值膚色像素定位,依據(jù)其幾何形狀的邊界來區(qū)分膚色與非膚色。這類幾何模型存在以下三個缺點:</p><p> (1)幾何邊界不能把有效的膚色像素都包含進(jìn)去;</p><p> ?。?)邊界一旦確定,則圖像分割就確定下來,不能根據(jù)圖像的特征動態(tài)分割;</p><p> (3)幾何邊界附近的點被割斷,分割
95、的圖像不連續(xù)。</p><p> 高斯模型是通過計算像素的概率值構(gòu)成連續(xù)的數(shù)據(jù)信息并得到一個膚色概率圖,根據(jù)數(shù)值大小來完成膚色的確認(rèn),克服了幾何模型的缺點,同時也不需要考慮神經(jīng)網(wǎng)絡(luò)模型中關(guān)于非膚色樣本難以準(zhǔn)確提取的問題。</p><p> 本篇論文選取了高斯模型,并用以下二維高斯模型函數(shù)來表達(dá)膚色分布:</p><p><b> ?。?-8)</
96、b></p><p> 式中為樣本象素在YCbCr顏色空間的值,為膚色在YCbCr顏色空間中的樣本均值,C為膚色相似度模型的協(xié)方差矩陣。</p><p><b> ?。?-9)</b></p><p><b> ?。?-10)</b></p><p><b> ?。?-11)<
97、;/b></p><p><b> 3.3.2樣本統(tǒng)計</b></p><p> 為了確定函數(shù)中參數(shù),本文采集了大量膚色樣本來計算它們的統(tǒng)計特征。這些圖片是來自網(wǎng)上和自行采集的。為了使膚色區(qū)域更集中,只選取了亞裔人的膚色(黃皮膚),且光照條件比較好的圖像。</p><p><b> 圖3-4 膚色樣本</b>&
98、lt;/p><p> 特征統(tǒng)計在MATLAB中完成。共抽取圖像中56000個膚色點,先完成色彩空間的轉(zhuǎn)換,再計算均值矢量腳協(xié)方差矩陣具體采用的公式如下:</p><p> , (3-12)</p><p> , (3-13)</p><p><b> (3-14)</b></p
99、><p><b> (3-15)</b></p><p> 得到的統(tǒng)計特征值為:</p><p><b> 3.4膚色分割過程</b></p><p> 膚色分割過程如下所示:</p><p> 圖3-5 膚色分割過程</p><p> 3.4
100、.1 相似度計算</p><p> 將圖像中的各像素由RGB空間轉(zhuǎn)化為YCbCr空間,然后代入公式(3-8),則可計算出彩色圖像中的各個像素屬于膚色的可能性大小,即相似度大小。</p><p> 但由于這個公式?jīng)]有高斯函數(shù)前的系數(shù),故所得的值域并不在范圍內(nèi),所以,在計算各值后需要進(jìn)行歸一化處理。做法是將每個P(Cb,Cr)除以該圖像中最大的P(Cb,Cr),用這個商來作為該點的相似度。
101、最大的P(Cb,Cr)自然是為1。因此,實際得到的相似度大小并不是相似于通過樣本取得的經(jīng)驗值,它和圖像本身也是有關(guān)系的。為了更好地觀察相似度分布情況,可以將相似度值域轉(zhuǎn)化為整數(shù)值,然后以灰度圖顯示出來。</p><p><b> 3.4.2閾值分割</b></p><p> 在進(jìn)行閾值分割前,首先要對圖像進(jìn)行濾波來減少圖像高頻噪聲的影響。采用</p>
102、<p><b> 的低通濾波模板是:</b></p><p> 膚色分割即為二值化各像素,用0代表背景,1代表膚色。相似度的灰度圖只是為了方便觀察,二值化的各對象仍是歸一化后的各相似度值,這主要是因為相似度值是以雙精度數(shù)據(jù)類型存儲的,具有更高的精度。二值化圖像可通過選取適當(dāng)?shù)拈撝但@得。二值化處理過程可具體表述為:設(shè)原圖像為,閾值為,則經(jīng)過閾值運算后,轉(zhuǎn)化成為二值圖像,即:&l
103、t;/p><p><b> (3-16)</b></p><p> 要想從復(fù)雜背景中分辨出目標(biāo)并將其形狀完整地提取出來,則閾值的選擇是關(guān)鍵。若閾值選取過高,則過多的目標(biāo)點被誤歸為背景;閾值選得過低,則會出現(xiàn)相反的境況。為此,國內(nèi)外學(xué)者針對這一課題進(jìn)行了廣泛深入的研究和大量試驗工作,并提出了各種各樣的閾值處理技術(shù),包括全局閾值、自適應(yīng)閾值、最佳閾值等等。</p&g
104、t;<p> 全局閾值:是指整幅圖像使用同一個閾值作分割處理,適用于背景和前景有明</p><p><b> 顯對比的圖像。</b></p><p> 自適應(yīng)閾值:指在許多情況下,物體和背景的對比度在圖像中不是各處都一樣的,</p><p> 這時就很難用統(tǒng)一的一個閾值將物體與背景分開。這時我們可以根據(jù)圖像的局部特征分別采
105、用不同的閾值進(jìn)行圖像分割。實際處理時,需要按照具體問題將圖像分成若干子區(qū)域分別選擇閾值,或者可以動態(tài)地根據(jù)一定的鄰域范圍選擇每點處的閾值,進(jìn)行圖像分割。</p><p> 最佳閾值:指閾值的選擇需要根據(jù)具體的問題來確定,一般通過實驗來確定。對于給定的圖像,可以通過分析直方圖的方法確定最佳閾值,例如:當(dāng)直方圖明顯</p><p> 呈現(xiàn)雙峰情況時,可選擇兩個峰值的中點作為最佳閾值。<
106、;/p><p> 全局閾值法由于被檢測圖像存在著背景復(fù)雜、光照條件不同和干擾過多等造成的圖像質(zhì)量差異,若閾值取得過高或者過低,都會產(chǎn)生對膚色和背景的較嚴(yán)重的誤判,影響到分割的效果,經(jīng)常造成漏檢。而自適應(yīng)闕值分割方法雖然在檢測中不</p><p> 易造成漏檢,但每次循環(huán)中都要對連通區(qū)域進(jìn)行依次判斷,檢測速度很慢。由于相似度的直方圖是呈M型的,存在雙峰,其中一個是膚色集中區(qū)域,另一個是非膚色
107、集</p><p> 中區(qū)域。因此,本文選取了最佳閾值的分割方法。</p><p> 最佳閾值并不是固定在雙峰的中間值,而是設(shè)在谷底的拐點處。這個點的意義</p><p> 代表了膚色區(qū)域減少而非膚色區(qū)域大量增加。其具體的做法是:首先設(shè)定閾值為0.60,每次以O(shè).05的間隔減少,直到O.10。并記下每次閾值變化時屬于膚色像素數(shù)量的變化,然后找出屬于膚色像素數(shù)量
108、變化最小時的那個閾值作為最佳閾值。此時若我們再將該閾值減小,屬于膚色像素的數(shù)量就會急劇增加,實際上是偽膚色大量加。因此,閾值設(shè)在這里是比較合適的。實驗表明,閾值的取值范圍大約在之間,而每幅圖像的實際閾值是不定的,這主要與圖像的背景顏色等因素有關(guān)。</p><p> 下面是對兩幅圖像的閾值分割效果,其中(a)是原圖,(b)是相似度圖,(c)二值圖。圖像是通過攝像頭拍攝的,大小為320*240。</p>
109、<p><b> ?。╝)</b></p><p><b> ?。╞)</b></p><p><b> (c)</b></p><p><b> 圖3-6 閾值分割</b></p><p><b> 3.4.3孔洞著色<
110、;/b></p><p> 孔洞著色是人臉檢測的一個重要環(huán)節(jié),孔洞著色的主要功能是將二值圖像中各個區(qū)域填上不同的顏色,在進(jìn)行著色的過程中,附帶完成了濾波和計數(shù)的功能。濾波是基于面積的,將面積小于20像素的區(qū)域刪除,這是形態(tài)學(xué)濾波不能達(dá)到的,計數(shù)是統(tǒng)計區(qū)域內(nèi)部孔洞個數(shù),對背景而言其內(nèi)部孔洞是各可疑人臉區(qū)域,對人臉區(qū)域而言其內(nèi)部孔洞是部分特征器官和膚色溢出區(qū)域。著色過程的實現(xiàn)較復(fù)雜一些,這里將進(jìn)行詳細(xì)的細(xì)述。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 本科生畢業(yè)論文(設(shè)計)
- 本科生畢業(yè)論文(設(shè)計)附件
- 本科生畢業(yè)論文(設(shè)計)模板
- 2013屆本科生畢業(yè)論文設(shè)計
- 成人本科生畢業(yè)論文(設(shè)計)
- 本科生畢業(yè)論文(設(shè)計)文獻(xiàn)綜述
- 本科生畢業(yè)論文(設(shè)計)封面.doc
- 本科生畢業(yè)論文(設(shè)計)撰寫規(guī)范
- 本科生畢業(yè)論文(設(shè)計)開題報告
- 本科生畢業(yè)論文(設(shè)計)封面.doc
- 本科生畢業(yè)論文(設(shè)計)封面.doc
- 本科生畢業(yè)論文(設(shè)計)基本規(guī)范
- 本科生畢業(yè)論文(設(shè)計)撰寫規(guī)范
- 本科生畢業(yè)論文(設(shè)計)封面.doc
- 本科生畢業(yè)論文管理系統(tǒng)的設(shè)計與開發(fā)【畢業(yè)論文】
- 2014屆本科生畢業(yè)論文設(shè)計
- 本科生畢業(yè)論文(設(shè)計)封面.doc
- 本科生畢業(yè)論文
- 本科生畢業(yè)論文管理系統(tǒng)
- 本科生畢業(yè)論文
評論
0/150
提交評論