版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著多媒體技術(shù)和互聯(lián)網(wǎng)的快速發(fā)展,不同模態(tài)的多媒體數(shù)據(jù)隨之急劇增長,同時(shí)用戶對于多媒體數(shù)據(jù)的檢索需求也變得更加多樣化。對比傳統(tǒng)的單一模態(tài)媒體數(shù)據(jù)的檢索方式,通過對不同模態(tài)的媒體數(shù)據(jù)進(jìn)行分析和處理,不僅能夠更好地表達(dá)用戶的檢索意圖,而且對于多模態(tài)媒體數(shù)據(jù)的語義理解也起到了重要作用。然而,由于在低層內(nèi)容特征上的異構(gòu)性和不可度量性,使得傳統(tǒng)的多媒體檢索方法不能適用于多模態(tài)媒體數(shù)據(jù)。因此,如何有效地管理和檢索多模態(tài)媒體數(shù)據(jù)成為目前多媒體檢索領(lǐng)域
2、的研究熱點(diǎn)。
根據(jù)多模態(tài)媒體數(shù)據(jù)間存在著緊密的語義關(guān)聯(lián)這一特性,本文以多媒體數(shù)據(jù)的高層語義概念特征為出發(fā)點(diǎn),結(jié)合機(jī)器學(xué)習(xí)、多模態(tài)信息融合與分析等技術(shù),對多模態(tài)媒體信息檢索進(jìn)行了深入的研究。主要研究工作包括:
(1)針對視頻信息的語義概念檢測,提出了一種基于極限學(xué)習(xí)機(jī)的多模態(tài)分類器合并方法。首先,分別使用三種不同的可視化特征來訓(xùn)練相對應(yīng)的三個(gè)基于極限學(xué)習(xí)機(jī)的語義概念分類器,然后使用一種有效的基于概率的融合方法將語義概念
3、分類器的預(yù)測結(jié)果進(jìn)行合并。最后,通過分析語義概念之間的上下文來得到語義關(guān)聯(lián)信息,并利用這些關(guān)聯(lián)信息來修正合并后的預(yù)測結(jié)果。通過大量的實(shí)驗(yàn)表明提出的方法能夠有效地提高語義概念檢測的準(zhǔn)確性。同時(shí),基于極限學(xué)習(xí)機(jī)的分類器能以極快的速度進(jìn)行學(xué)習(xí)和預(yù)測,大大提高了語義概念檢測的性能。
(2)針對不確定的視頻語義表達(dá),提出了一種基于多信息融合的方法,其中包括推理和融合兩個(gè)階段。在推理階段,充分利用語義概念之間的上下文關(guān)聯(lián)信息和視頻鏡頭之間
4、的時(shí)間關(guān)聯(lián)信息,選出對應(yīng)于用戶查詢最相關(guān)的候選概念集。在融合階段,通過計(jì)算候選概念的推斷概率,使其與概念檢測器的結(jié)果進(jìn)行融合,以達(dá)到對視頻鏡頭中的語義概念進(jìn)行修正的目的。通過大量的實(shí)驗(yàn)表明,提出的方法能夠有效解決視頻鏡頭中不確定的語義表達(dá)問題,同時(shí)改善了語義視頻檢索的準(zhǔn)確性。
(3)針對大規(guī)模的跨媒體檢索,首先利用多模態(tài)媒體對象之間的語義關(guān)聯(lián)來建模一個(gè)多模態(tài)語義關(guān)系圖。其次將多模態(tài)語義關(guān)系圖中的所有媒體對象映射到一個(gè)同構(gòu)的語義
5、空間中。最后,通過分析多模態(tài)媒體對象的分布特性,提出了一種有效的索引MK-tree,以此來管理語義空間中的媒體對象,同時(shí)改善跨媒體檢索的性能。通過在大規(guī)模的真實(shí)跨媒體數(shù)據(jù)集上的實(shí)驗(yàn)表明,提出的方法能極大地改善跨媒體檢索的有效性和準(zhǔn)確性。
(4)針對社交圖像檢索,首先,通過利用社交網(wǎng)絡(luò)中不同模態(tài)的信息來構(gòu)建一個(gè)社交關(guān)系圖。其次,當(dāng)用戶給定查詢關(guān)鍵字,在構(gòu)建的社交關(guān)系圖上執(zhí)行一種有效的查詢關(guān)鍵字算法,同時(shí)基于相關(guān)分?jǐn)?shù)得到候選結(jié)果。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多模態(tài)圖像檢索技術(shù).pdf
- 多模態(tài)視頻信息檢索.pdf
- 多模態(tài)媒體數(shù)據(jù)分析關(guān)鍵技術(shù)研究.pdf
- 多媒體信息綜合檢索的關(guān)鍵技術(shù)研究.pdf
- 結(jié)合ITQ的跨模態(tài)的多媒體信息檢索.pdf
- 醫(yī)學(xué)影像案例多模檢索的模態(tài)關(guān)聯(lián)建模技術(shù)研究.pdf
- 基于多特征信息融合的圖像檢索技術(shù)研究.pdf
- 融合CCA和Adaboost的跨模態(tài)多媒體信息檢索.pdf
- 檔案信息檢索技術(shù)研究.pdf
- 融合多模式信息特定音頻檢索技術(shù)研究.pdf
- 先進(jìn)眼科多模態(tài)成像技術(shù)研究.pdf
- 多模態(tài)人體行為識別技術(shù)研究.pdf
- 面向大規(guī)模多模態(tài)圖像檢索的關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn).pdf
- 基于感知信息的多模態(tài)生物特征融合技術(shù)研究.pdf
- 視頻多模態(tài)信息處理的關(guān)鍵技術(shù)研究.pdf
- 多模態(tài)影像腦部疾病檢索研究.pdf
- 私有信息檢索技術(shù)研究.pdf
- 信息檢索相關(guān)技術(shù)研究.pdf
- 多模態(tài)醫(yī)學(xué)圖像融合技術(shù)研究.pdf
- 基于概念檢索的智能信息檢索技術(shù)研究.pdf
評論
0/150
提交評論