版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、社交媒體(Social Media)是目前互聯(lián)網(wǎng)最流行的應(yīng)用之一,是人們發(fā)布和訪問各種內(nèi)容的重要平臺,擁有海量的用戶和內(nèi)容。當一個熱門事件發(fā)生時,通常都會引起社交媒體中的用戶關(guān)注,從而產(chǎn)生豐富的與此事件相關(guān)的內(nèi)容數(shù)據(jù)(例如微博、評論等),包括文本、圖像和視頻等。由于其交互性和開放性等特點,社交媒體產(chǎn)生的數(shù)據(jù)通常是大量的、冗余的、充滿噪聲的,從而導(dǎo)致人們很難提煉關(guān)于某個事件的主要方面和觀點傾向。本文針對社交媒體的事件,通過開發(fā)自動化的方法
2、來生成畫報式的內(nèi)容摘要,從而方便用戶快速、準確、全面地瀏覽整個事件。
論文在總結(jié)和分析現(xiàn)有相關(guān)工作的基礎(chǔ)上,結(jié)合文本信息處理、多媒體內(nèi)容分析和社交媒體數(shù)據(jù)分析等研究領(lǐng)域中事件的概念,給出了社交媒體中的事件定義。據(jù)此定義,基于事件相關(guān)的社交媒體文檔(包括了圖像、文本及其他社交媒體數(shù)據(jù))的抽取方法,論文給出了事件畫報式摘要的形式化描述。
圖像和文本是兩種不同的異質(zhì)媒體,為了更好地度量兩者之間的匹配程度,論文提出一種基于核
3、典型關(guān)聯(lián)分析(Kernel Canonical Correlation Analysis,KCCA)的圖像聚類方法。該方法利用顏色矩、灰度共生矩陣和梯度方向直方圖三種圖像特征、以及貝葉斯概率模型進行文本建模,然后通過圖像檢索開放數(shù)據(jù)集Div400建立圖像和文本之間的對應(yīng)關(guān)系,進而在自己創(chuàng)建的Flickr圖像數(shù)據(jù)集上實現(xiàn)圖像聚類。實驗環(huán)節(jié)中,論文針對多媒體數(shù)據(jù)的特性,提出了一些數(shù)據(jù)預(yù)處理的有效方法,并分別在事件圖像數(shù)據(jù)集和圖像檢索標準數(shù)據(jù)
4、集上測試了本章所提算法,分別得到了80.60%和72.82%的聚類準確率,從而驗證了算法的有效性。
在代表性圖像和關(guān)鍵詞提取、以及圖文匹配環(huán)節(jié)上,論文提出了事件圖像的摘要準則:視覺相似度、文本相似度和主題覆蓋度,以及各自的量化指標。論文使用了一種改進的TextRank算法來提取關(guān)鍵詞,并引入單詞可見度模型、結(jié)合傳統(tǒng)的tf-idf模型進行圖文匹配。在本章的第四小節(jié)中,論文采用了一些嘗試性的方法從事件不同方面和不同的用戶觀點兩方面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 視頻摘要自動生成技術(shù)研究.pdf
- 專題摘要自動生成技術(shù)研究.pdf
- 視頻摘要自動生成技術(shù)研究
- 基于內(nèi)容的層次視頻摘要生成技術(shù)研究.pdf
- 官方微博的事件提取及其摘要技術(shù)研究.pdf
- 面向足球比賽的視頻摘要生成技術(shù)研究.pdf
- 基于特征聚類的視頻摘要生成技術(shù)研究.pdf
- 基于內(nèi)容的視頻摘要生成關(guān)鍵技術(shù)研究.pdf
- 突發(fā)事件下公路應(yīng)急指揮預(yù)案生成技術(shù)研究.pdf
- 摘要自動生成技術(shù)研究及其在提案管理的應(yīng)用.pdf
- 微博事件的圖文摘要生成方法研究.pdf
- 基于標簽傳播的數(shù)據(jù)庫模式摘要生成技術(shù)研究.pdf
- 面向傳輸?shù)囊曨l結(jié)構(gòu)化與摘要生成技術(shù)研究.pdf
- 突發(fā)事件網(wǎng)絡(luò)輿情自動摘要關(guān)鍵技術(shù)研究.pdf
- 嵌入式圖形界面自動生成技術(shù)研究.pdf
- 面向微博的事件摘要生成算法研究與實現(xiàn).pdf
- 敦煌壁畫的交互式線描生成技術(shù)研究.pdf
- 事件流上復(fù)雜事件檢測技術(shù)研究.pdf
- 分布式復(fù)雜事件處理關(guān)鍵技術(shù)研究.pdf
- 分布式事件流管理平臺關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論