2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩104頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)互聯(lián)網(wǎng)的興起,大量的多媒體信息特別是圖像被上傳到互聯(lián)網(wǎng)上并且數(shù)目仍在不斷的增加,這些信息將人們帶入了圖片大數(shù)據(jù)時(shí)代。為了挖掘海量圖像數(shù)據(jù)中的有效信息及其中所蘊(yùn)含的經(jīng)濟(jì)和社會(huì)價(jià)值,涉及到與圖像相關(guān)的諸多技術(shù),圖像理解是其中較重要的一環(huán)。傳統(tǒng)的用于圖像理解的方法主要是基于詞袋模型,即首先提取圖像的底層特征表示,然后構(gòu)建一個(gè)編碼詞典,最后將圖像底層特征依據(jù)編碼詞典進(jìn)行映射得到圖像的直方圖特征表示。雖然該方法廣泛應(yīng)用于

2、圖像理解的相關(guān)方向如圖像中的物體識(shí)別和圖像檢索,并取得了一定的效果,但是基于詞袋模型的表示方法會(huì)將圖像中蘊(yùn)含的結(jié)構(gòu)信息丟失,導(dǎo)致圖像特征表示的辨別性和魯棒性存在一定的局限性。
  區(qū)別于基于詞袋模型的圖像特征表示方法,本論文提出了一種新的構(gòu)建圖像特征表示的方法,該方法將與圖像相關(guān)的結(jié)構(gòu)信息融合到圖像的特征表示中,以此來(lái)提高圖像特征表示的辨別性和魯棒性。本論文提出了三種不同形式的結(jié)構(gòu)信息的嵌入視覺(jué)特征表示方法,并將其分別應(yīng)用于圖像理

3、解領(lǐng)域中的圖像檢索,圖像分類(lèi)和圖像語(yǔ)義標(biāo)注中。
  第一種方法是在基于輪廓圖像的圖像檢索和分類(lèi)的應(yīng)用中,不同于傳統(tǒng)的方法直接提取輪廓圖像的特征點(diǎn)并構(gòu)建特征描述符,在本論文中,提出了將輪廓圖像所描述的物體的本身所具有的結(jié)構(gòu)對(duì)稱(chēng)性嵌入到圖像的視覺(jué)特征表示中,從而構(gòu)建出包含物體對(duì)稱(chēng)結(jié)構(gòu)的圖像視覺(jué)特征表示。該特征表示能夠有效的提高特征描述符的辨別性和魯棒性。在實(shí)驗(yàn)中,將該嵌入對(duì)稱(chēng)結(jié)構(gòu)的視覺(jué)特征表示應(yīng)用于輪廓圖像的分類(lèi)和檢索上,實(shí)驗(yàn)結(jié)果表明

4、該方法能夠有效的提高輪廓圖像的檢索和分類(lèi)的準(zhǔn)確度證明了結(jié)構(gòu)信息嵌入特征表示中的有效性。
  第二種方法是在基于視覺(jué)屬性的圖像檢索的應(yīng)用中,不同于傳統(tǒng)的方法僅考慮視覺(jué)屬性查詢(xún)?cè)~與其他相關(guān)視覺(jué)屬性之間的共存性,在本論文提出的方法中,首先將視覺(jué)屬性結(jié)構(gòu)之間的互斥和共存性嵌入到視覺(jué)屬性的特征表達(dá)之中。然后利用該嵌入結(jié)構(gòu)信息的圖像特征表示,提出了一種基于特征重建的圖像檢索框架,該框架能夠有效的保留圖像的結(jié)構(gòu)特征從而能夠有效的提高圖像檢索的穩(wěn)

5、定性和魯棒性。實(shí)驗(yàn)結(jié)果證明該方法能夠有效的降低查詢(xún)關(guān)鍵詞的歧義性,提高圖像檢索的準(zhǔn)確度。
  第三種方法是在基于弱監(jiān)督的圖像標(biāo)注的應(yīng)用中,由于圖像中包含有多個(gè)物體,因此傳統(tǒng)的基于詞袋的特征表示方法具有歧義性,進(jìn)而無(wú)法表示圖像中不同物體之間的結(jié)構(gòu)關(guān)系,最后使得圖像標(biāo)注結(jié)果的不準(zhǔn)確。本論文提出一種將語(yǔ)義標(biāo)簽的結(jié)構(gòu)相關(guān)性信息嵌入到圖像特征表示之中的方法,從而克服原始特征表示存在的歧義性。實(shí)驗(yàn)結(jié)果表明該嵌入語(yǔ)義標(biāo)簽的結(jié)構(gòu)性特征表示能夠有效

6、的提高圖像特征表示的辨別性和泛化能力,進(jìn)行能夠推動(dòng)圖像標(biāo)注的查全性和準(zhǔn)確率的提升。
  本論文為了驗(yàn)證視覺(jué)特征的結(jié)構(gòu)性在圖像理解中的作用,考慮到不同的應(yīng)用場(chǎng)景下圖像特征中嵌入不同層次的結(jié)構(gòu)性信息:底層信息中的物體本身的對(duì)稱(chēng)結(jié)構(gòu),中層特征信息中的視覺(jué)屬性的相關(guān)性結(jié)構(gòu)以及高層物體標(biāo)簽信息之間的語(yǔ)義結(jié)構(gòu)。通過(guò)不同的實(shí)驗(yàn)結(jié)果證明本文所提出的嵌入結(jié)構(gòu)性信息的視覺(jué)特征表示能夠有效的提高特征表示的辨別性和魯棒性,同時(shí)實(shí)驗(yàn)結(jié)果也表明了嵌入結(jié)構(gòu)性信

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論