版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、中文微博情感評測報告,浙江工商大學 計算機與信息工程學院報告人:陳威指導老師:施寒瀟,提綱,研究背景及意義任務預備任務分析與實施總結,背景,在Web2.0大背景下,微博作為用戶發(fā)言、相互交流的重要途徑,具有數(shù)量大、更新快的特點,是從中發(fā)掘用戶觀點以及情感傾向的可靠來源。針對微博的自然語言處理研究已成為當前一個新的研究熱點和前沿課題,而情感分析就是其中一個熱點話題。,微博情感分析,情感分析,包括觀點挖掘、觀點分析、主客觀分析等。
2、情感分析的目的是從文本中挖掘用戶表達的觀點以及情感傾向。主要技術:(1)情感詞典與規(guī)則相結合的方法(2)機器學習,意義,過濾不合法網(wǎng)絡輿論信息,營造良好的網(wǎng)絡環(huán)境監(jiān)督輿論的走勢,輔助社會管理實現(xiàn)商品個性化推薦對社會計算的研究有重要的意義,提綱,研究背景及意義任務預備任務分析與實施總結,任務清單,任務一:觀點句判定任務二:分析情感傾向 任務三:提取情感要素,技術準備,分類器:SVM 、 CRF情感詞典擴充:加入網(wǎng)絡用語
3、和表情符號 中文分詞技術:海量云分詞,提綱,研究背景及意義任務預備任務分析與實施總結,任務處理流程,構建特征集,人工標注訓練語料,訓練集及訓練模型生成,,,預測集生成及預測,,人工標注,利用本團隊自主開發(fā)的標注工具標注嚴格按照主辦方提供的標注規(guī)則,從樣列文件中選取1219條具有代表性的微博進行標注標注內容包括:是否為觀點句、情感傾向性、情感要素,訓練語料,任務一:人工標注的1219條微博任務二:任務一訓練語料中451
4、條為觀點句的微博,任務一特征集,任務二特征集,訓練模型生成,網(wǎng)絡用語、表情特征提取,提取特征,訓練模型,格式轉換,分詞,SVM訓練,人工標注語料,海量分詞格式,分詞結果,訓練集,格式轉換,預測集生成,網(wǎng)絡用語、表情特征提取,提取特征,格式轉換,分詞,待預測微博,海量分詞格式,分詞結果,預測集,格式轉換,預處理,預測集生成及預測細節(jié),任務一分詞前預處理 : 過濾類似 “我感到很高興”這樣的主觀抒發(fā)情感句,并定為非觀點句。任務二預測集生成
5、:根據(jù)任務一的預測結果,從中提取預測為觀點句的微博使用SVM對預測集進行預測,評測結果,任務三流程,分詞,特征提取,CRF訓練及預測,結構化標注,情感要素提取,,,,,任務三特征集,訓練集生成,使用與任務二相同的人工標注集作為訓練語料結構化標注:TP-B 表示情感要素開始詞,TP-E 表示情感要素結束詞SO為情感詞,BG為背景,情感要素確定,標注為SO,即情感詞,作為微博情感傾向標注為TP-B或TP-E,則可能是情感要素沒有標
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中文微博情感分類研究.pdf
- 中文微博情感分析技術研究.pdf
- 面向中文微博的情感分類研究.pdf
- 中文微博的情感分析和應用.pdf
- 中文微博評論的情感傾向分析.pdf
- 中文微博細粒度情感判別研究.pdf
- 面向中文微博的情感分類方法研究.pdf
- 基于中文微博的情感分析研究.pdf
- 基于情感詞典的中文微博情感傾向分析研究.pdf
- 面向中文微博文本的情感分類研究.pdf
- 中文微博情感傾向性分析研究.pdf
- 面向中文微博的情感信息抽取方法研究.pdf
- 面向目標的中文微博情感分析研究.pdf
- 基于中文微博的情感分類技術研究.pdf
- 中文微博情感詞典的構建研究與應用.pdf
- 基于依存分析的中文微博情感分析匯報人
- [工程科技]《dnf》評測報告
- esu22評測報告
- esu22評測報告
- 基于情感詞典與句型分類的中文微博情感分析研究.pdf
評論
0/150
提交評論