版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著Web2.0的迅速發(fā)展,越來越多的網(wǎng)民習慣通過論壇(BBS)、博客(Blog)等網(wǎng)絡(luò)載體對一些事物或事件發(fā)表自己的觀點。這些存儲分散、觀點各異的離散文本(Discrete Text)構(gòu)成了一種包羅萬象的網(wǎng)絡(luò)輿情。對離散文本中所包含的情感極性進行定性定量分析,是掌握網(wǎng)民對相關(guān)事物或事件的態(tài)度和網(wǎng)絡(luò)輿情的重要途徑。在此基礎(chǔ)上,對隨時間變化的輿情進行聚類分析,并將其結(jié)果可視化,可以直觀地呈現(xiàn)輿情發(fā)展趨勢,這是許多領(lǐng)域共同關(guān)注的熱點問題。
2、
綜上所述,以情感極性分析為線索、以聚類分析為依據(jù)、以觀點挖掘為策略、最終實現(xiàn)輿情分析之目標。
目前,對中文文本的觀點挖掘研究較晚,很多基礎(chǔ)性工作仍然在進行中。針對網(wǎng)絡(luò)離散文本的輿情分析研究工作也僅處于起步階段,本文針對離散文本的特點,對離散文本進行輿情聚類分析。
本文選取離散文本中的博客文本標題和摘要作為研究對象。博客文本情感表達豐富,并且其極性分布非常分散,因此獲得博客文本的核心語義或者集中
3、概念難度較大;而標題和摘要包含的情感詞較少,所表達的概念相對集中。因此選取博客搜索結(jié)果的標題和摘要作為最終研究對象是加速聚類收斂的重要措施。
本文實驗主要分為博客文本輿情聚類分析和聚類結(jié)果評價兩個部分。其中,博客文本輿情聚類分析包含基于概念的輿情聚類分析模型和聚類結(jié)果可視化。本文通過改進傳統(tǒng)的向量空間模型(VSM),引入詞語的概念,采用基于概念的向量空間模型來表示博客文本(標題和摘要),提高文本表示精度。分別使用基于概念和
4、傳統(tǒng)的向量空間模型表示文本,采用k-means算法進行聚類分析,并可視化和評價聚類結(jié)果。其中傳統(tǒng)向量空間模型作為對比組來評價基于概念的輿情聚類分析模型性能。聚類結(jié)果評價采用Ground Truth模型,選取常用的三個度量精度(Precision)、熵(Entropy)和邊緣索引(Rand Index)來評價聚類結(jié)果。
實驗證明基于概念的向量空間模型比傳統(tǒng)基于詞語的向量空間模型在離散文本輿情聚類上具有更好的性能。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Web文本聚類技術(shù)及聚類結(jié)果可視化研究.pdf
- 面向增量式文本聚類的層次可視化方法研究.pdf
- 基于SOM聚類的WEB文本挖掘及其結(jié)果的可視化研究.pdf
- 基于確定話題和情感極性的博客文本聚類研究.pdf
- 基于SOM的可視化聚類研究.pdf
- 數(shù)據(jù)聚類及可視化技術(shù).pdf
- ECG波形可視化聚類策略研究.pdf
- 基于圖的聚類集成與數(shù)據(jù)可視化研究
- 屬性選擇可視化技術(shù)與聚類算法的研究.pdf
- 基于圖的聚類集成與數(shù)據(jù)可視化研究.pdf
- 面向PDM的可視化聚類系統(tǒng)研究與開發(fā).pdf
- 基于Flex的聚類信息可視化技術(shù).pdf
- 基于流形學習的數(shù)據(jù)聚類與可視化.pdf
- 基于SOM聚類的數(shù)據(jù)可視化系統(tǒng)研究與實現(xiàn).pdf
- 基于CNM聚類的無向圖可視化研究.pdf
- 聚類過程可視化和結(jié)果語義描述的研究.pdf
- 基于SOM的可視化聚類挖掘應用研究.pdf
- 微博輿情可視化系統(tǒng)的研究與實現(xiàn).pdf
- 基于企業(yè)輿情數(shù)據(jù)可視化模型研究.pdf
- 話題跟蹤和可視化技術(shù)在涉農(nóng)網(wǎng)絡(luò)輿情系統(tǒng)中的應用研究.pdf
評論
0/150
提交評論