版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)通訊工具的普及以及微信、微博等社交平臺(tái)的廣泛應(yīng)用,以提高交流效率或者表達(dá)某種情感為目的的、采用包含有自創(chuàng)、縮略詞語(yǔ)、特定符號(hào)及其獨(dú)立或者相互交叉組成的的網(wǎng)絡(luò)文本應(yīng)運(yùn)而生;這類文本中被不同年齡段、行業(yè)及具有不同的閱歷及知識(shí)背景網(wǎng)民所頻繁的使用和廣泛傳播的詞語(yǔ)、符號(hào)及其組合被稱為網(wǎng)絡(luò)語(yǔ)言,其大多反映的是社會(huì)熱點(diǎn)話題和廣泛社會(huì)生活現(xiàn)狀。將網(wǎng)絡(luò)語(yǔ)言中的網(wǎng)絡(luò)新詞及顏文字進(jìn)行快速有效的發(fā)現(xiàn)識(shí)別、標(biāo)識(shí)含義及并入詞集,對(duì)信息處
2、理系統(tǒng)在面向網(wǎng)絡(luò)文本、網(wǎng)絡(luò)語(yǔ)言進(jìn)行處理時(shí),對(duì)提高語(yǔ)義整體理解、社會(huì)熱點(diǎn)分析及用戶情感表達(dá),互聯(lián)網(wǎng)監(jiān)控、企業(yè)決策和社會(huì)學(xué)研究都有重要的意義。
論文首先對(duì)微博語(yǔ)料進(jìn)行預(yù)處理并分詞得到“散串”語(yǔ)料;然后,基于候選詞內(nèi)部組成結(jié)構(gòu),通過(guò)采用互信息統(tǒng)計(jì)模型向候選詞內(nèi)部組成元素右鄰元擴(kuò)展統(tǒng)計(jì)的方法建立了候選詞集;向右鄰元擴(kuò)展統(tǒng)計(jì)的措施解決了基于互信息統(tǒng)計(jì)模型用于新詞發(fā)現(xiàn)時(shí)只能統(tǒng)計(jì)兩組成元素的局限性,同時(shí)規(guī)避了影響新詞發(fā)現(xiàn)研究準(zhǔn)確性能的N元重
3、疊問(wèn)題;依據(jù)語(yǔ)料文本短小,候選詞外部位置特征及行文規(guī)則,采用外部統(tǒng)計(jì)量制定了基于候選詞外部鄰接量過(guò)濾規(guī)則和計(jì)算方法,最終實(shí)現(xiàn)網(wǎng)絡(luò)新詞發(fā)現(xiàn)和識(shí)別。構(gòu)建出了基于互信息模型向右鄰元擴(kuò)展統(tǒng)計(jì)+外部鄰接量統(tǒng)計(jì)過(guò)濾的網(wǎng)絡(luò)新詞發(fā)現(xiàn)方法。
統(tǒng)計(jì)與分析了大規(guī)模已知顏文字的結(jié)構(gòu)和符號(hào)組成特點(diǎn),基于顏文字內(nèi)部構(gòu)造元素的耦合度、核心組成元素的左右鄰結(jié)合度等信息進(jìn)行統(tǒng)計(jì)識(shí)別;基于顏文字表達(dá)的人類面部特征元素進(jìn)行匹配識(shí)別,并采用隱馬爾可夫模型對(duì)整體識(shí)別結(jié)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于微博的社交網(wǎng)絡(luò)特征分析.pdf
- 炒作微博的特征分析與識(shí)別研究.pdf
- 基于微博數(shù)據(jù)的網(wǎng)絡(luò)輿情分析.pdf
- 微博網(wǎng)絡(luò)水軍識(shí)別技術(shù)研究.pdf
- 基于微博數(shù)據(jù)的網(wǎng)絡(luò)輿情分析
- 基于微博的網(wǎng)絡(luò)輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于微博社交網(wǎng)絡(luò)結(jié)構(gòu)的虛擬社區(qū)識(shí)別研究.pdf
- 基于情感分析的微博謠言識(shí)別模式研究.pdf
- 微博傳播語(yǔ)境下的網(wǎng)絡(luò)語(yǔ)言:權(quán)力賦予與權(quán)威消解——以新浪微博為例
- 微博傳播語(yǔ)境下的網(wǎng)絡(luò)語(yǔ)言:權(quán)力賦予與權(quán)威消解——以新浪微博為例.pdf
- 微博語(yǔ)言研究.pdf
- 基于網(wǎng)絡(luò)分析的微博用戶特性研究.pdf
- 基于復(fù)雜網(wǎng)絡(luò)分析的微博社區(qū)發(fā)現(xiàn).pdf
- 微博情感分析的心理預(yù)警模型與識(shí)別研究.pdf
- 基于微博平臺(tái)的社交網(wǎng)絡(luò)輿情分析方法.pdf
- 實(shí)名sns社交網(wǎng)絡(luò)與微博的特征分析
- 基于MapReduce的微博水軍識(shí)別技術(shù)研究與實(shí)現(xiàn).pdf
- 微博語(yǔ)言的語(yǔ)用研究.pdf
- 基于網(wǎng)絡(luò)推手的微博營(yíng)銷模式.pdf
- 基于語(yǔ)言網(wǎng)絡(luò)的微博特征發(fā)現(xiàn)和話題關(guān)鍵詞提取.pdf
評(píng)論
0/150
提交評(píng)論