版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著互聯(lián)網(wǎng)的迅速普及,互聯(lián)網(wǎng)應(yīng)用越來(lái)越簡(jiǎn)易,使得上網(wǎng)人數(shù)與同俱增?;ヂ?lián)網(wǎng)生活呈現(xiàn)出多元化,復(fù)雜化的趨勢(shì),越來(lái)越多的人們開(kāi)始關(guān)注互聯(lián)網(wǎng),開(kāi)始通過(guò)互聯(lián)網(wǎng)來(lái)發(fā)出自己的聲音,而且形式不一,比如,微博,論壇,博客,BBS等。人們通過(guò)這些媒體發(fā)表自己對(duì)其他的人或事件的評(píng)價(jià),看法,這些評(píng)價(jià)看法常常帶有明顯的傾向性信息,如何讓計(jì)算機(jī)自動(dòng)準(zhǔn)確提取這些有用的傾向性信息,這個(gè)問(wèn)題吸引了大量的研究學(xué)者,逐漸就演化成了文本的傾向性分析課題。
文本傾
2、向性分析研究目前已經(jīng)成為自然語(yǔ)言處理領(lǐng)域的研究熱點(diǎn)之一。文本傾向性分析具有重要研究意義,在學(xué)術(shù)領(lǐng)域,商業(yè)領(lǐng)域,管理領(lǐng)域等都有著巨大的使用價(jià)值。
中文文本的情感傾向性研究相對(duì)于英文的情感傾向性研究起步較晚,很多問(wèn)題還需要全方位的研究,中文情感傾向性分析有很多子課題,本文在研究了大量的基礎(chǔ)資料后,分別選擇了兩個(gè)子課題,中文句子的情感傾向性識(shí)別和中文文本的主客觀分類,并且進(jìn)行了一系列的實(shí)驗(yàn)研究。
本文的主要工作是:
3、
1.研究了中文句子的情感傾向性識(shí)別課題
中文句子的情感傾向性識(shí)別課題的主要研究?jī)?nèi)容是讓計(jì)算機(jī)可以有效的判斷給出的中文句子是褒義還是貶義的,并且給出其傾向性程度。文本傾向性識(shí)別的一個(gè)重要的基礎(chǔ)性工作是句子傾向性識(shí)別,從目前的研究論文可以看出,提取實(shí)體間關(guān)聯(lián)難度很大,這個(gè)問(wèn)題在主觀性文本信息的提取上表現(xiàn)的更加嚴(yán)重。而有針對(duì)性的提取傾向性信息的研究,目前進(jìn)行的還比較少?;谶@個(gè)問(wèn)題,本文在綜合大量資料的基礎(chǔ)上,提
4、出了一種基于情感詞語(yǔ)義加權(quán)的句子情感傾向性識(shí)別方法。本文通過(guò)實(shí)驗(yàn)驗(yàn)證了該算法的可行性以及有效性。
2.研究了中文文本的主客觀分類課題
人們?cè)谫I一種產(chǎn)品或者選擇一項(xiàng)服務(wù)之前,都想在互聯(lián)網(wǎng)上獲得該項(xiàng)產(chǎn)品或者服務(wù)的用戶評(píng)價(jià),以便參考,從而決定是否購(gòu)買。因此文本的主客觀分析是一個(gè)非常重要的,具有可觀的研究?jī)r(jià)值的基礎(chǔ)性課題。中文文本的主客觀分析的主要目的是讓計(jì)算機(jī)可以自動(dòng)的準(zhǔn)確的識(shí)別出待分析的中文文本是屬于主觀文本還是
5、客觀文本。只有主觀性的文本才能體現(xiàn)出某種情感傾向信息。該課題也可以看做是一個(gè)特殊的分類問(wèn)題,分類的依據(jù)是文本是否包含情感傾向。由于中文語(yǔ)言的多樣性,語(yǔ)義的豐富性,主客觀句的特征并不明顯,基于統(tǒng)計(jì)的分析方法難以很好的反映中文的語(yǔ)義內(nèi)涵,而基于語(yǔ)義的分析方法需要大量的專家知識(shí),并且存在著主客觀區(qū)分知識(shí)難以抽取,難以表示的問(wèn)題?;谶@個(gè)問(wèn)題,本文提出了一種基于語(yǔ)義的TriPos模式的中文文本主客觀分析的方法。本文通過(guò)實(shí)驗(yàn)驗(yàn)證了該算法的可行性以
6、及有效性。
本文的主要?jiǎng)?chuàng)新點(diǎn)是:
1.提出了一種基于情感詞語(yǔ)義加權(quán)的句子情感傾向性識(shí)別方法
該方法采用遺傳學(xué)基因的思想,把情感詞看做基因,在不同的上下文環(huán)境中呈現(xiàn)出不同的情感傾向性,首先確定情感詞的靜態(tài)顯性,界定情感詞的轄域,構(gòu)建情感詞分析器,在情感詞轄域內(nèi)針對(duì)可以影響情感詞情感傾向性的各種類型的因素進(jìn)行分析,得出最終的情感詞情感傾向,進(jìn)而采用相應(yīng)句式的分析方法得出整個(gè)句子的情感傾向性。從實(shí)驗(yàn)的
7、結(jié)果來(lái)看,本文提出的基于情感詞語(yǔ)義加權(quán)的句子情感傾向性識(shí)別方法在褒義和貶義句子的傾向性識(shí)別上分別取得了不錯(cuò)的判全率和判準(zhǔn)率,并且F值能達(dá)到0.95以上,充分說(shuō)明本文提出的算法的有效性。
2.提出了一種基于語(yǔ)義的TriPos模式的中文文本主客觀分析的方法
該方法通過(guò)語(yǔ)義和規(guī)則相結(jié)合的處理方式對(duì)文本進(jìn)行處理。首先通過(guò)對(duì)大量的標(biāo)注語(yǔ)料的分析,使用卡方統(tǒng)計(jì)方法,獲取一個(gè)TriPos的語(yǔ)義模式庫(kù),然后利用這個(gè)語(yǔ)義模式庫(kù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中文新聞文本傾向性分析研究.pdf
- 中文文本情感傾向性分類研究.pdf
- 中文微博情感傾向性分析研究.pdf
- 中文WEB文本傾向性分類研究.pdf
- 基于淺層語(yǔ)義的文本傾向性分析研究.pdf
- 中文Web文本情感傾向性分析技術(shù)的研究.pdf
- 文物保護(hù)領(lǐng)域網(wǎng)絡(luò)文本傾向性分析研究.pdf
- 基于評(píng)價(jià)對(duì)象及其情感特征的中文文本傾向性分類研究.pdf
- 文本傾向性分析技術(shù)的相關(guān)研究.pdf
- 中文微影評(píng)文本情感傾向性識(shí)別技術(shù)研究.pdf
- 基于動(dòng)態(tài)基準(zhǔn)的文本傾向性分析.pdf
- 基于詞語(yǔ)的藏文文本中情感傾向性的研究
- 基于語(yǔ)義的文本傾向性分析與研究.pdf
- 文本傾向性分析中的分類方法研究.pdf
- 文本情感傾向性分析系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于模板匹配的文本傾向性研究.pdf
- 基于語(yǔ)義的BLOG社區(qū)文本傾向性分析.pdf
- 評(píng)論文本情感傾向性分析技術(shù)研究.pdf
- 基于EDT的中文網(wǎng)絡(luò)文本主題情感傾向性分析與研究.pdf
- 面向網(wǎng)絡(luò)評(píng)論信息的文本情感傾向性分析.pdf
評(píng)論
0/150
提交評(píng)論