基于事件-時間關聯(lián)模型的新聞話題檢測與動態(tài)演化跟蹤.pdf_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯(lián)網技術的飛速發(fā)展,信息的傳播與交互方式都有了徹底的改變,網絡信息呈爆炸式地增長,成為人們獲取訊息的主要途徑。面對海量無序的網絡新聞,如何對各個話題進行準確且智能化地識別與組織,已經成為網絡信息處理領域的重要研究課題。話題檢測與跟蹤(Topic Detection and Tracking,TDT)正是面向這一課題提出的研究方向,主要任務是自動檢測時序新聞報道流中的新話題并實時跟蹤已知話題的后續(xù)相關報道,將各種新聞信息組織起來再呈

2、現(xiàn)給用戶。
  本文首先針對話題檢測(Topic Detection,TD)任務提出基于事件-時間關聯(lián)模型(Event-Time Relation Model,ETRM)的話題檢測方法。ETRM模型依據(jù)話題和報道中事件內容及其時間屬性的關聯(lián)特征而構建,依賴時間屬性對話題中事件進行切分和提取,而后組織成事件報道集對話題進行描述。新事件檢測是話題檢測研究中的重要環(huán)節(jié),其任務是識別新聞話題的種子事件,并為后續(xù)話題跟蹤任務提供話題的初始質

3、心。本文基于ETRM對新事件檢測任務進行探究,提出改進的話題檢測策略:利用時間信息建立話題模型的事件索引;在新事件的判定過程中遵循同時同事的原則并引入時間頻率因素;針對論述種子事件的新聞報道,對其相關于舊話題的概率進行相應的調整,以提高新舊話題判定的準確性。經過實驗測評,證明基于ETRM的話題檢測方法有效改進了話題檢測系統(tǒng)的相關性判定效率及其準確率。
  話題跟蹤任務也是話題檢測與跟蹤領域中重要的應用研究之一,它直接針對時序新聞報

4、道流進行特定新聞話題后續(xù)相關報道的識別與挖掘。本文依據(jù)新聞報道動態(tài)地隨時間變化的特性,提出一種基于時間特征演變模型的自適應話題跟蹤算法:在傳統(tǒng)的向量空間模型中引入特征項的時間信息對話題進行描述,通過特征項的時間差信息計算時間相關度,并將其與余弦夾角公式結合應用,對報道與話題的相關性判定機制進行改進。此外,針對傳統(tǒng)的話題跟蹤過程中出現(xiàn)的漂移現(xiàn)象,在話題模型特征項自學習更新的同時基于時間相關度進行相應權重調整,借以及時準確地捕捉話題的焦點。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論