2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩110頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多媒體信息分析與檢索是當(dāng)前信息領(lǐng)域研究的熱點(diǎn)之一。隨著數(shù)字化技術(shù)的發(fā)展,數(shù)字多媒體資源特別是視頻產(chǎn)品越來越豐富。多媒體具有蘊(yùn)涵信息量大、直觀和印象深刻等優(yōu)點(diǎn),已經(jīng)逐漸成為網(wǎng)絡(luò)和個人電腦上最重要的信息載體,傳統(tǒng)的基于文本的信息檢索技術(shù)很難對多媒體信息進(jìn)行有效的結(jié)構(gòu)化分析和快速檢索。多媒體信息分析與檢索通過對多媒體從低層特征到高層語義進(jìn)行處理、分析的過程獲取其內(nèi)容并根據(jù)內(nèi)容進(jìn)行檢索。由此可見,多媒體信息分析與檢索具有重要的理論意義和應(yīng)用價(jià)值

2、。體育節(jié)目是觀眾最喜歡的視頻之一,然而觀眾和體育專業(yè)人士在冗長的體育節(jié)目中很難定位其中的重要內(nèi)容。視頻摘要是對視頻內(nèi)容的概括,能夠簡潔表現(xiàn)視頻的重要內(nèi)容,目的在于幫助人們更快捷、更方便定位視頻的重要內(nèi)容,是多媒體信息分析與檢索研究中的重要研究工作?;趬嚎s域處理可以實(shí)時(shí)生成視頻摘要。為此,本論文從靜態(tài)摘要、動態(tài)摘要和基于語義的摘要三個方面來討論壓縮域體育視頻摘要技術(shù),研究內(nèi)容涉及交互式壓縮域關(guān)鍵視頻對象選擇模型:壓縮域攝像機(jī)運(yùn)動估計(jì)和交

3、互式壓縮域關(guān)鍵幀選擇模型;壓縮域重放場景檢測和基于重放場景的壓縮域體育視頻摘要;基于本體的壓縮域語義體育視頻摘要模型。在對現(xiàn)有方法分析的基礎(chǔ)上,獲得以下主要研究成果: 1、提出一種開放的交互式壓縮域關(guān)鍵視頻對象選擇模型。引入交互計(jì)算模型將壓縮域關(guān)鍵視頻對象選擇模型擴(kuò)展為基于交互計(jì)算的壓縮域關(guān)鍵對象選擇模型。將壓縮域關(guān)鍵視頻對象選擇算法形式化為壓縮域關(guān)鍵視頻對象選擇模型,證明該模型滿足歸納法準(zhǔn)則;用緊湊和全面策略分別表示關(guān)鍵視頻對

4、象間內(nèi)容不相關(guān)性和關(guān)鍵視頻對象準(zhǔn)確表達(dá)視頻信息這兩種行為,將用戶選擇這些策略的過程形式化為交互式壓縮域關(guān)鍵視頻對象選擇模型,證明該交互式模型滿足余歸納法準(zhǔn)則。交互式壓縮域關(guān)鍵視頻對象選擇方法是一個開放系統(tǒng),不僅可以根據(jù)不同的策略選取相應(yīng)的關(guān)鍵視頻對象,而且緊湊策略的失真率比[Kirn2002]的方法低0.8%,全面策略的失真率比[Kim2002]的方法低3.8%。 2、以攝像機(jī)運(yùn)動參數(shù)為特征,提出一種開放的交互式壓縮域關(guān)鍵幀選擇

5、模型。基于M估計(jì)進(jìn)行外點(diǎn)過濾,基于極線距離約束驗(yàn)證去除外點(diǎn)的正確性,并利用BFGS方法獲得攝 像機(jī)運(yùn)動參數(shù)的最佳估計(jì)。并以攝像機(jī)運(yùn)動參數(shù)為特征,提出基于最短路徑約束的最小化失真率方法和基于最小化失真率約束的最短路徑方法,這兩種方法分別對應(yīng)緊湊和全 面策略。將壓縮域關(guān)鍵幀選擇算法形式化為壓縮域關(guān)鍵幀選擇模型,證明該模型滿足歸納法準(zhǔn)則;將用戶選擇緊湊和全面策略的過程形式化為交互式壓縮域關(guān)鍵幀選擇模型,證明該交互式模型滿足余歸納法準(zhǔn)則。用

6、戶可以根據(jù)偏好選擇不同的策略,同時(shí),緊湊和全面策略的失真率分別比[Porter2003]的方法低8.5%和9.1%。因此交互式壓縮域關(guān)鍵幀選擇方法具有良好的開放性。 3、提出一種有效的基于重放場景組織兩層壓縮域體育視頻摘要的方法。利用壓縮域的宏塊、運(yùn)動矢量特征進(jìn)行重放場景檢測,基于攝像機(jī)和顏色信息根據(jù)重放鏡頭檢測原精彩片段,從而組織體育視頻摘要。重放場景檢測的查全率為91.2%,查準(zhǔn)率為100%,而目重放場景檢測算法可以識別高速

7、攝像機(jī)產(chǎn)生的重放鏡頭,克服了[Koblal999]方法的不足。檢測原精彩片段的算法主要針對文[yasugi2001]中未考慮攝像機(jī)縮放運(yùn)動進(jìn)行了改進(jìn)。基于重放場景提出一種新的兩層體育視頻摘要瀏覽模式,第一層為關(guān)鍵場景,給用戶提供了視頻內(nèi)容的概括:第二層為關(guān)鍵鏡頭,為動態(tài)和靜態(tài)摘要瀏覽方式的結(jié)合。 4、提出一種基于本體的壓縮域語義體育視頻摘要模型。引入OWL本體描述語言對體育視頻本體進(jìn)行描述,并由此提出基于壓縮域的層次化視頻摘要策

8、略。在三級層次化摘要中,關(guān)鍵場景展現(xiàn)了體育視頻的全面語義信息,關(guān)鍵鏡頭展示了視頻中的重要動作,關(guān)鍵幀顯示了鏡頭的細(xì)節(jié)。因此三級層次化摘要能夠在不同的層次表示視頻的重要信息。進(jìn)一步,我們對體育視頻進(jìn)行語義建模,運(yùn)用Tableau算法進(jìn)行推理,基于視頻注釋信息生成語義體育視頻摘要。由于目前視頻摘要研究側(cè)重于基于低層語義特征,基于本體的體 育視頻摘要建立了推理機(jī)制,不失為語義體育視頻摘要的有益嘗試,同時(shí)與文[Zhu2003]相比,我們提出的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論