2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、中文微博情感評測報告,浙江工商大學 計算機與信息工程學院報告人:陳威指導老師:施寒瀟,提綱,研究背景及意義任務預備任務分析與實施總結(jié),背景,在Web2.0大背景下,微博作為用戶發(fā)言、相互交流的重要途徑,具有數(shù)量大、更新快的特點,是從中發(fā)掘用戶觀點以及情感傾向的可靠來源。針對微博的自然語言處理研究已成為當前一個新的研究熱點和前沿課題,而情感分析就是其中一個熱點話題。,微博情感分析,情感分析,包括觀點挖掘、觀點分析、主客觀分析等。

2、情感分析的目的是從文本中挖掘用戶表達的觀點以及情感傾向。主要技術(shù):(1)情感詞典與規(guī)則相結(jié)合的方法(2)機器學習,意義,過濾不合法網(wǎng)絡輿論信息,營造良好的網(wǎng)絡環(huán)境監(jiān)督輿論的走勢,輔助社會管理實現(xiàn)商品個性化推薦對社會計算的研究有重要的意義,提綱,研究背景及意義任務預備任務分析與實施總結(jié),任務清單,任務一:觀點句判定任務二:分析情感傾向 任務三:提取情感要素,技術(shù)準備,分類器:SVM 、 CRF情感詞典擴充:加入網(wǎng)絡用語

3、和表情符號 中文分詞技術(shù):海量云分詞,提綱,研究背景及意義任務預備任務分析與實施總結(jié),任務處理流程,構(gòu)建特征集,人工標注訓練語料,訓練集及訓練模型生成,,,預測集生成及預測,,人工標注,利用本團隊自主開發(fā)的標注工具標注嚴格按照主辦方提供的標注規(guī)則,從樣列文件中選取1219條具有代表性的微博進行標注標注內(nèi)容包括:是否為觀點句、情感傾向性、情感要素,訓練語料,任務一:人工標注的1219條微博任務二:任務一訓練語料中451

4、條為觀點句的微博,任務一特征集,任務二特征集,訓練模型生成,網(wǎng)絡用語、表情特征提取,提取特征,訓練模型,格式轉(zhuǎn)換,分詞,SVM訓練,人工標注語料,海量分詞格式,分詞結(jié)果,訓練集,格式轉(zhuǎn)換,預測集生成,網(wǎng)絡用語、表情特征提取,提取特征,格式轉(zhuǎn)換,分詞,待預測微博,海量分詞格式,分詞結(jié)果,預測集,格式轉(zhuǎn)換,預處理,預測集生成及預測細節(jié),任務一分詞前預處理 : 過濾類似 “我感到很高興”這樣的主觀抒發(fā)情感句,并定為非觀點句。任務二預測集生成

5、:根據(jù)任務一的預測結(jié)果,從中提取預測為觀點句的微博使用SVM對預測集進行預測,評測結(jié)果,任務三流程,分詞,特征提取,CRF訓練及預測,結(jié)構(gòu)化標注,情感要素提取,,,,,任務三特征集,訓練集生成,使用與任務二相同的人工標注集作為訓練語料結(jié)構(gòu)化標注:TP-B 表示情感要素開始詞,TP-E 表示情感要素結(jié)束詞SO為情感詞,BG為背景,情感要素確定,標注為SO,即情感詞,作為微博情感傾向標注為TP-B或TP-E,則可能是情感要素沒有標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論