2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩51頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章  圖像信息基本知識一、 人眼視覺特性 引起視覺的外周感受器官是眼,它由含有感光細胞的視網(wǎng)膜和作為附屬結(jié)構(gòu)的折光系統(tǒng)等部分組成。人眼的適宜刺激是波長370-740nm的電磁波;在這個可見光譜的范圍內(nèi),人腦通過接受來自視網(wǎng)膜的傳入信息,可以分辨出視網(wǎng)膜像的不同亮度和色澤,因而可以看清視野內(nèi)發(fā)光物體上反光物質(zhì)的輪廓、形狀、顏色、大小、遠近和表面細節(jié)等情況。,自然界形形色色的物體以及文字、圖形等形象,通過視覺系統(tǒng)在

2、人腦得到反映。據(jù)估計,在人腦獲得的全部信息中,大約有95%以上來自視覺系統(tǒng),因而眼無疑是人體最重要的感覺器官。,1.    人眼構(gòu)造簡介  人眼的基本結(jié)構(gòu)如下圖所示。,人眼的結(jié)構(gòu)和照相機相似:瞳孔的直徑可在2-8毫米間調(diào)節(jié)--光圈;扁球形彈性透明體(晶狀體)--透鏡;使不同距離的景物在視網(wǎng)膜上成像,視細胞受到光的刺激產(chǎn)生電脈,電脈沖沿著神經(jīng)纖維傳遞到視神經(jīng)中樞,由于各細胞產(chǎn)生的電脈沖不同,大腦就形成了景象

3、的感覺。,當(dāng)用光學(xué)原理分析眼的折光特性時,首先遇到的一個困難是,眼球并非一個薄透鏡或單球面折光體,而是由一系列曲率半徑和折光指數(shù)都不相同的折光體所組成的折光系統(tǒng)。 研究表明,正常成人眼處于安靜而不進行調(diào)節(jié)的狀態(tài)時,它的折光系統(tǒng)的后主焦點的位置,正好是其視網(wǎng)膜所在的位置。,這一解剖關(guān)系對于理解正常眼的折光成像能力十分重要。它說明,凡是位于眼前方6m以外直至無限遠處的物體,由于由它們發(fā)出或反射出的光線在到達眼的折光系統(tǒng)時已近于平行,

4、因而都可以在視網(wǎng)膜上形成基本清晰的像,這正如放置于照相機主焦點處的底片,可以拍出清晰的遠景一樣。,當(dāng)然,人眼不是無條件的看清任何遠處的特體,例如,人眼可以看清楚月亮(或其他更遠的星體)和它表面較大的陰影,但不能看清楚月球表面更小的物體或特征。,為什么?,造成后一限制的原因有二:一是,如果來自某物體的光線過弱,或它們在空間傳播時被散射或吸收,那么它們到達視網(wǎng)膜時已減弱到不足以興奮感光細胞的程度,這樣就不可能被感知;二是,如果物體過小或

5、它們離眼的距離過大,則它們在視網(wǎng)膜上形成的大小,將會小到視網(wǎng)膜分辨能力的限度以下,因而也不能感知。,如果安靜狀態(tài)的眼的折光能力正好把6m以外的物體成像在視網(wǎng)膜上,那么來自較6m為近的物體的光線將是不同程度呈輻射狀的,它們在折射后的成像位置將在主焦點,亦即視網(wǎng)膜的位置之后;由于光線到達視網(wǎng)膜時尚未聚焦,因而物像是模糊的,由此也只能引起一個模糊的視覺形象。 但正常眼在看近物時為什么也十分清楚?,這是由于眼在看近物時已進行了調(diào)節(jié),使進

6、入眼內(nèi)的光線經(jīng)歷較強的折射,結(jié)果也能成像在視網(wǎng)膜上。人眼的調(diào)節(jié)亦即折光能力的改變,主要是靠晶狀體形狀的改變。,,眼調(diào)節(jié)前后睫狀體位置和晶狀體形狀的改變,為什么買電影往往不要前幾排的票?為什么我要戴眼鏡才看得清楚?,瞳孔和瞳孔對光反應(yīng)   瞳孔指虹膜中間的開孔,是光線進入眼內(nèi)的門戶;它在亮光處縮小,在暗光處散大?! ⊥状笮‰S光照強度而變化的反應(yīng),是一種神經(jīng)反射,稱為瞳孔對光反射。引起此反射的感受器就是視網(wǎng)膜,傳入纖維在視神經(jīng)中,但這

7、部分纖維在進入中樞后不到達外側(cè)膝狀體,而在在中腦的頂蓋前區(qū)換神經(jīng)元,然后到同側(cè)和對側(cè)的動眼神經(jīng)核,傳出纖維主要是動眼神經(jīng)中的副交感纖維,效應(yīng)器也主要是瞳孔約肌。,有關(guān)“視網(wǎng)膜的結(jié)構(gòu)和兩種感光換能系統(tǒng) ”、“視桿細胞的感光換能機制 ”、“視錐系統(tǒng)的換能和顏色視覺 ”、“視網(wǎng)膜的信息處理 ”等不作介紹,感興趣的同學(xué)可查閱相關(guān)文獻,2.     人眼視覺模型(1)   點擴展函數(shù)和

8、調(diào)制轉(zhuǎn)移函數(shù)沖激函數(shù)經(jīng)過光學(xué)系統(tǒng)后的成像     稱為點擴展函數(shù)(PSF)或沖激響應(yīng)函數(shù);經(jīng)線性移不變系統(tǒng)后得到的圖像   是原圖像    與點擴展函數(shù)   的卷積;    稱為光學(xué)系統(tǒng)的調(diào)制轉(zhuǎn)移函數(shù)(MTF);    和   可以表征一個線性移不變的光學(xué)系統(tǒng),,,,,,,,(2)  人眼視覺模型  人眼類似一個光學(xué)系統(tǒng)。由于神經(jīng)系統(tǒng)的調(diào)節(jié),它又不是普通意義上的光學(xué)系統(tǒng)。建立視覺模型就是力圖用線性光學(xué)系統(tǒng)的概念來解

9、釋某些視覺特性,并可進行一些定量的分析和預(yù)測。,1)作為一個光學(xué)器件,從空間頻率的角度來說,是一個低通型線性系統(tǒng)。表明:人眼的分辨力是有限的。(瞳孔一定的幾何尺寸及視細胞有一定的大小。)2)人眼對于亮度的響應(yīng)具有對數(shù)性質(zhì)。人眼正是通過這一對數(shù)性質(zhì)來接受寬達  倍的亮度范圍。人所能覺察到的亮度增量的度量是以B為底的對數(shù)增量形式,而不是線性增量:,,,3)由于神經(jīng)系統(tǒng)的作用,從空間頻率的角度來說,人眼又具有帶通型線性系統(tǒng)的特性,又稱為側(cè)抑

10、制效應(yīng)。加權(quán)求和運算將有帶通濾波器的效應(yīng)。4)從時間上說,人眼對亮度的響應(yīng)有一定的延時。這是由神經(jīng)系統(tǒng)時間響應(yīng)上的限制引起的。,人從亮處進入暗室時,最初看不清楚任何東西,經(jīng)過一定時間,視覺敏感度才逐漸增主,恢復(fù)了在暗處的視力,這稱為暗適應(yīng)。相反,從暗處初來到亮光處,最初感到一片耀眼的光亮,不能看清物體,只有稍待片刻才能恢復(fù)視覺,這稱為明適應(yīng)。,(3)人眼調(diào)制轉(zhuǎn)移函數(shù)和對數(shù)-線性系統(tǒng) 圖像處理中大量是靜止圖像,因此上述模型中的1)

11、,2),3)三個子系統(tǒng)將起作用?! 榱说窒搜蹖α炼软憫?yīng)的對數(shù)性質(zhì),測試人眼視覺系統(tǒng)的實際亮度應(yīng)當(dāng)是指數(shù)性的,這樣人眼視覺系統(tǒng)可以“線性化”,直接可測出調(diào)制轉(zhuǎn)移函數(shù)?! ×涟翟诳臻g上作正弦變化條紋圖像的物理對比度和感覺對比度之比隨空間頻率變化而變化的曲線,稱為調(diào)制轉(zhuǎn)移函數(shù)(MTF)。,3 . 視覺系統(tǒng)對顏色的感知 可見光的波長范圍為380nm~780nm,大多數(shù)自然光都是由不同波長的光組合而成。 人的視網(wǎng)膜有對紅、

12、綠、藍顏色敏感程度不同的三種錐體細胞,另外還有一種在光功率極端低的條件下才起作用的桿狀體細胞,因此顏色只存在于眼睛和大腦中。顏色是視覺系統(tǒng)對可見光的感知結(jié)果。 紅、綠和藍三種錐體細胞對不同頻率的光的感知程度不同,對不同亮度的感知程度也不同,因此不同組成成分的可見光就呈現(xiàn)出不同的顏色.,視覺系統(tǒng)對顏色和亮度的響應(yīng)特性曲線(各個波長的光的強度相等),上面的顏色響應(yīng)曲線表明,人類眼睛對藍光的靈敏度遠遠低于對紅光和綠光的靈敏度。亮度

13、響應(yīng)曲線表明人眼對波長為550nm左右的黃綠色最為敏感。,許多具有不同光譜分布的光產(chǎn)生的視覺效果(顏色)是一樣的。即光譜與顏色的對應(yīng)是多對一的。 光譜分布不同而看上去相同的兩種顏色稱為條件等色(匹配等色)。 絕大部分可見光譜對眼睛的刺激效果都可以用紅(700nm),綠(546.1),藍(435.8nm)三色光按不同比例和強度的混合來等效表示。(三刺激理論),匹配任意可見光所需的三原色光比例曲線,從人的主觀感覺角度,顏色包含三

14、個要素:(1)色調(diào)(hue):色調(diào)反映顏色的類別,如紅色、綠色、藍色等。色調(diào)大致對應(yīng)光譜分布中的主波長。,(2)飽和度(Saturation) 飽和度是指彩色光所呈現(xiàn)顏色的深淺或純潔程度。對于同一色調(diào)的彩色光,其飽和度越高,顏色就越深,或越純;而飽和度越小,顏色就越淺,或純度越低。高飽和度的彩色光可因摻入白光而降低純度或變淺,變成低飽和度的色光。100%飽和度的色光就代表完全沒有混入白光的純色光。,(3)明亮度(luminan

15、ce) 明亮度是光作用于人眼時引起的明亮程度的感覺。一般來說,彩色光能量大則顯得亮,反之則暗。 大量試驗表明,人的眼睛能分辨128種不同的色調(diào),10-30種不同的飽和度,而對亮度非常敏感。人眼大約可以分辨35萬種顏色。,4. 顏色模型 顏色模型(color model)是用來精確標(biāo)定和生成各種顏色的一套規(guī)則和定義。 某種顏色模型所標(biāo)定的所有顏色就構(gòu)成了一個顏色空間。 顏色空間通常用三維模型表示

16、,空間中的顏色通常使用代表三個參數(shù)的三維坐標(biāo)來指定,對于人來說,可以通過色調(diào)、飽和度和亮度來定義顏色(HSL顏色模型); 對于顯示設(shè)備來說,可以用紅、綠、藍磷光體的發(fā)光量來描述顏色(RGB顏色模型); 對于打印設(shè)備來說,可以使用青色、品紅、黃色和黑色顏料的用量來指定顏色(CMYK顏色模型)。,(1) RGB顏色模型 理論上絕大部分可見光譜都可用紅、綠和藍 (RGB) 三色光按不同比例和強度的混合來表示?!=

17、R(紅色的百分比)+G(綠色的百分比)+ B(藍色的百分比)    如 L=0.3R+0.6G+0.1R   當(dāng)然,這里的系數(shù)只是近似的,它具體的值依賴于顯示器所采用的磷粉標(biāo)準(zhǔn),以NTSC視頻信號標(biāo)準(zhǔn),則三個系數(shù)依次為:0.299、0.587、0.144 RGB模型稱為相加混色模型,用于光照、視頻和顯示器。例如,顯示器通過紅、綠和藍熒光粉發(fā)射光線產(chǎn)生彩色。,(2) CMYK顏色模型在理論上,絕大多數(shù)顏色都可以用三種基本顏料(

18、青色cyan、品紅magenta、和黃色yellow)按一定比例混合得到。理論上,青色、品紅和黃色三種基本色素等量混合能得到黑色。但實際上,因為所有打印油墨都會包含一些雜質(zhì),這三種油墨混合實際上產(chǎn)生一種土灰色,必須與黑色 (K) 油墨混合才能產(chǎn)生真正的黑色,所以再加入黑色作為基本色形成CMYK顏色模型。CMYK模型稱為相減混色模型。,RGB彩色空間和CMY彩色空間的表示法,顏色模型的空間表示,(3)HSL顏色模型在HSL模型中,H

19、定義色調(diào);S定義顏色的深淺程度或飽和度;L定義亮度。RGB模型和CMYK模型主要是面向設(shè)備的,而HSL模型更容易被人理解和控制。,(4)YIQ顏色模型 我們也可以將RGB顏色模型轉(zhuǎn)化為亮度-色度空間。在NTSC視頻信號中使用了YIQ顏色模型。這是一種由RGB轉(zhuǎn)化來的亮度-色度模型,該模型中Y代表了光源的亮度,而色度則包含在I、Q兩個參數(shù)里。在參數(shù)I中包含了橙-青的色彩信息,Q中包含了綠-品紅的色彩信息?!∮捎谌搜蹖τ诹炼鹊拿舾谐潭?/p>

20、大于對于色度的敏感程度,因此將最大的帶寬分給Y信號,并且由于Y信號包含了亮度信號,所以在黑白電視機中就只使用Y信號。,下面是RGBYIQ的變換公式:,(5)YUV顏色模型 YUV顏色模型和YIQ顏色模型類似。 事實上YUV只是一類顏色模型(YCrCb)的總稱。其中Y的定義是相同的,色度信息也是組合在Cr、Cb中,其中Cr代表了光源中的紅色分量,Cb代表了光源中的藍色分量,因此它的變換公式:,5 “眼見為實”嗎?,,,馬赫帶效應(yīng),

21、雖然條帶強度恒定,但實際感覺到了一幅帶有毛邊(特別是靠近邊界處)的亮度圖形。,二、  圖像質(zhì)量評價可懂度逼真度1.圖像質(zhì)量評估方法與標(biāo)準(zhǔn)當(dāng)前對圖像質(zhì)量的評估方法主要分成兩類:主觀評價和客觀測量。主觀評價的方法與標(biāo)準(zhǔn)已相對完善,而客觀測量則處于熱點研究中。,1)主觀評價 主觀評價的方法是將待評價的圖像序列播放給評論者觀看,并記錄他們的打分,然后對所有評論者的打分進行統(tǒng)計,得出平均分作為評價結(jié)果。,很顯然,主觀評價有幾

22、個顯著的不足之處: (1)觀察者一般需要是一個群體,并且經(jīng)過培訓(xùn)以準(zhǔn)確判定主觀評測分,人力和物力投入大,為時較長;(2)圖像內(nèi)容與情節(jié)千變?nèi)f化,觀察者個體差異大,容易發(fā)生主觀上的偏差;(3)主觀評價無法進行實時監(jiān)測;(4)僅僅只有平均分,如果評測分數(shù)低,無法確切定位問題出在哪里。,2)客觀測量 客觀測量基于仿人眼視覺模型的原理對圖像質(zhì)量進行客觀評估,并給出客觀評價分。近幾年,隨著人們對人眼視覺系統(tǒng)研究的深入,客觀測量

23、的方法和工具不斷被開發(fā)出來,其測量結(jié)果也與主觀評價較吻合。國際上也成立了ITU-R視頻質(zhì)量專家組(ITU-RVQEG:VideoQualityExperts Group)專門研究和規(guī)范圖像質(zhì)量客觀測量的方法和標(biāo)準(zhǔn)。,VQEG規(guī)定了兩個簡單的技術(shù)參數(shù):峰值信噪比(PSNR)和均方差(MSE)。此外,還有許多圖像質(zhì)量模型,這些模型在測量圖像質(zhì)量時都基于人眼視覺特性。下圖是一種典型的基于解碼圖像與基準(zhǔn)圖像差值的圖像質(zhì)量客觀測量模型。,,三、

24、    圖像噪聲 1.   噪聲的定義:  不可預(yù)測,只能用概率統(tǒng)計方法來認識的隨機誤差。圖像噪聲:妨礙人們視覺器官對所接收的信源信息理解的因素?!?由于噪聲定義為隨機誤差,因而對噪聲的描述方法可以借用隨機過程的描述,即用其概率分布函數(shù)和概率密度分布函數(shù)。這種描述是困難的,甚至不可能的。實際應(yīng)用中往往采用數(shù)字特征來描述。 但是,噪聲問題不能完全看作是一個純科學(xué)或純數(shù)學(xué)問題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論