版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近年來,隨著Internet的快速發(fā)展和普及,在網(wǎng)絡(luò)上存儲、傳播著海量的信息和數(shù)據(jù),尤其是圖像和視頻。因而,按照語義快速方便地分類和檢索圖像越來越重要。但是,由于光照、尺度、旋轉(zhuǎn)、視角、姿態(tài)等變化,正確地識別場景和物體類別難度依然很大。此外,由于人們對圖像的視覺感知不同所造成的視覺歧義,對識別算法提出了新的要求。本文主要研究如何快速準(zhǔn)確地識別場景和物體類別。
首先,本文設(shè)計(jì)了一個實(shí)用場景和物體類別識別系統(tǒng)并提出了一種新的多重特
2、征通道圖像表示。為了勝任不同的場景和物體類別識別任務(wù),本系統(tǒng)首先從給定圖像中提取多個特征“通道”,每個特征通道利用詞包模型計(jì)算圖像或子圖像的視覺單詞直方圖,并通過空間金字塔引入單詞之間的位置信息。各個特征通道的主要區(qū)別在于詞包模型中采用哪種特征檢測器/特征描述符組合,因而具有不同水平的辨識能力和不變性。這種多重特征通道圖像表示為有效地組織和利用各種稀疏或稠密特征檢測器、局部特征描述符提供了一個統(tǒng)一的框架。對于每個特征通道,該系統(tǒng)然后使用
3、基于直方圖交叉核或x2核的支持向量機(jī)計(jì)算圖像屬于各個可能類別的得分。最后利用邏輯推理或統(tǒng)計(jì)推理的方法,綜合所有特征通道的識別結(jié)果得到測試圖像的識別結(jié)果?;诙嘀靥卣魍ǖ赖膶?shí)用場景和物體類別識別方法計(jì)算復(fù)雜性低、通用性強(qiáng),而且對基準(zhǔn)場景和物體圖像庫的平均識別率高于大多數(shù)流行方法,表明了該方法的有效性和合理性。
其次,本文研究了不同特征通道的組合問題,提出了四種規(guī)則(統(tǒng)稱為x-max):max-max、sum-max、prod-m
4、ax和classifier-max。x-max通過不同的方式組合各“單”特征通道的識別結(jié)果,進(jìn)而得到圖像的最終類別。其中,max-max、sum-max和prod-max分別由各單特征通道得分的極大值、算術(shù)平均值和幾何平均值確定測試圖像屬于某個可能類別的得分;而classifier-max根據(jù)第一級分類器得到的各單特征通道的識別結(jié)果,由第二級分類器確定測試圖像屬于某個可能類別的得分。在x-max中,最后得分最高的類便是測試圖像的識別結(jié)果
5、。與場景和物體類別識別中兩種最流行的特征組合規(guī)則(多核學(xué)習(xí)和線性規(guī)劃提升)相比,x-max規(guī)則的優(yōu)點(diǎn)有三:一是它基于分布式組合的思想,魯棒性高,每個組合節(jié)點(diǎn)處理負(fù)擔(dān)小,并便于并行處理;二是擴(kuò)展性強(qiáng),當(dāng)加入新的特征通道時,只需學(xué)習(xí)與新特征通道有關(guān)的分類器,毋需重新從頭開始學(xué)習(xí)所有分類器;三是計(jì)算復(fù)雜性低,適用于識別大型場景和物體圖像庫。對五個基準(zhǔn)圖像庫的實(shí)驗(yàn)結(jié)果表明,與多核學(xué)習(xí)和線性規(guī)劃提升相比,使用x-max組合多重特征通道,時間復(fù)雜度
6、降低了1-2個數(shù)量級,平均識別準(zhǔn)確率高于多核學(xué)習(xí),并接近線性規(guī)劃提升。
最后,本文提出了一種新的基于金字塔主題直方圖(PHOTO)和AdaBoost分類器的場景和物體類別識別算法。概率隱語義分析(pLSA)在文本語義分析和處理中用來挖掘文本文檔的主題。本文在pLSA模型的基礎(chǔ)上,通過空間金字塔引入位置信息,利用EM算法計(jì)算圖像金字塔中各個單元格的主題混合系數(shù)向量,并拼接形成一個“長”向量(稱為金字塔主題直方圖(PHOTO))用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于場景相關(guān)信息的物體識別方法的研究.pdf
- 非類別限定的物體識別學(xué)習(xí)模型構(gòu)建.pdf
- 基于視角和類別流形的目標(biāo)跟蹤識別.pdf
- 復(fù)雜場景下基于深度學(xué)習(xí)的物體檢測與識別算法研究.pdf
- 室內(nèi)場景物體同時識別與建模.pdf
- 基于Kinect的場景分割和目標(biāo)識別研究.pdf
- 基于物體的相似性預(yù)測未知物體所處場景的研究.pdf
- 基于物體候選區(qū)域和改進(jìn)隨機(jī)蕨的室內(nèi)物體識別算法研究.pdf
- 基于深度學(xué)習(xí)的場景識別研究.pdf
- 基于物體檢測的場景分類方法研究.pdf
- 基于內(nèi)容的視頻場景分割.pdf
- 基于場景內(nèi)與物體語義相關(guān)的聲音對場景的解碼研究.pdf
- 基于場景的姓名識別.pdf
- 基于視頻的場景分析和異常行為識別.pdf
- 基于內(nèi)容的視頻場景分析方法研究.pdf
- 基于特征匹配的物體識別研究.pdf
- 基于輪廓的物體識別算法研究.pdf
- 基于圖像的物體識別算法研究.pdf
- 基于Shape Context的物體識別.pdf
- 基于機(jī)器學(xué)習(xí)的物體識別.pdf
評論
0/150
提交評論