版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、中文句子級(jí)別的基本分析技術(shù)能為自然語(yǔ)言處理相關(guān)應(yīng)用提供基礎(chǔ)的支撐,它主要由詞法、句法和語(yǔ)義分析三部分組成。其中詞法分析包含分詞和詞性標(biāo)注兩個(gè)級(jí)聯(lián)的任務(wù);句法分析有短語(yǔ)結(jié)構(gòu)和依存結(jié)構(gòu)句法分析兩種主流的分析手段;而對(duì)于語(yǔ)義分析,本文著重于語(yǔ)義依存分析。這些任務(wù)之間是存在著層次關(guān)系的,對(duì)于一個(gè)句子本文首先要進(jìn)行分詞,然后是詞性標(biāo)注,緊接著是短語(yǔ)結(jié)構(gòu)或者依存結(jié)構(gòu)句法分析,最后是語(yǔ)義依存分析。
傳統(tǒng)的分析方法一般按照層次順序依次使用各個(gè)
2、任務(wù)最先進(jìn)的模型進(jìn)行處理,這種方法被稱為串行分析的方法。它存在兩個(gè)方面的問(wèn)題:第一點(diǎn)是錯(cuò)誤蔓延問(wèn)題,即低層的錯(cuò)誤會(huì)進(jìn)一步擴(kuò)散到高層;第二點(diǎn)是每層局部?jī)?yōu)化,因此低層的任務(wù)無(wú)法充分使用高層的信息。這兩個(gè)問(wèn)題使得聯(lián)合分析模型的方法得到了廣泛的關(guān)注,它將多個(gè)層級(jí)相鄰的任務(wù)放在一個(gè)統(tǒng)一的模型中來(lái)處理,從而避免這兩個(gè)問(wèn)題,因此能夠提高各個(gè)任務(wù)的分析性能;同時(shí)它還可以使得自然語(yǔ)言處理的研究人員能更好的理解各個(gè)任務(wù)之間的相互關(guān)系。本論文對(duì)聯(lián)合分析模型展
3、開(kāi)了四個(gè)方面的研究工作,分別如下所示:
首先,針對(duì)詞法中的分詞詞性標(biāo)注,本文對(duì)提升其聯(lián)合分析模型的領(lǐng)域移植能力進(jìn)行了研究。領(lǐng)域移植問(wèn)題最有效的解決方法是標(biāo)注少量規(guī)模的目標(biāo)領(lǐng)域語(yǔ)料,本文在標(biāo)注語(yǔ)料的具體方式上進(jìn)行改進(jìn),提出將句子標(biāo)注和詞典標(biāo)注相結(jié)合,使得在固定的標(biāo)注代價(jià)下,分詞詞性標(biāo)注聯(lián)合分析模型的領(lǐng)域移植能力進(jìn)一步增強(qiáng)。實(shí)驗(yàn)結(jié)果表明這種結(jié)合的方法能取得更好的領(lǐng)域移植效果。
其次,針對(duì)詞性標(biāo)注和依存句法,本文對(duì)提高其聯(lián)
4、合分析模型的效率進(jìn)行了研究。本文使用一種模型融合和過(guò)訓(xùn)練相結(jié)合的方法,一方面通過(guò)模型融合可以使得聯(lián)合分析模型精度進(jìn)一步提高但是其解碼速度也進(jìn)一步的下降,而另一方面通過(guò)過(guò)訓(xùn)練可以使得一個(gè)速度快但是精度低的聯(lián)合分析模型在前面融合模型的幫助下,準(zhǔn)確率大幅度提升,從而得到一個(gè)分析速度提升十倍以上而且精度沒(méi)有任何的損失的聯(lián)合分析模型。
緊接著,針對(duì)分詞詞性標(biāo)注和句法分析,本文利用大部分中文詞語(yǔ)存在著內(nèi)部結(jié)構(gòu)這一特點(diǎn),提出字級(jí)別的中文句法
5、分析方法,從而非常自然的將詞法分析和句法分析聯(lián)合在一起,得到了中文詞法句法大統(tǒng)一的聯(lián)合分析模型。實(shí)驗(yàn)結(jié)果表明,這種字級(jí)別的分析方法能有效的提升中文詞法句法的性能,取得了目前最好的結(jié)果。
最后,針對(duì)句法分析和語(yǔ)義分析,本文依托于依存分析這一手段,使得語(yǔ)義分析和句法分析的聯(lián)合變得非常方便,從而得到了句法依存和語(yǔ)義依存的聯(lián)合分析模型。由于中文語(yǔ)義依存分析的方法以前很少被用作于語(yǔ)義分析,因此本文首先從理論和實(shí)驗(yàn)兩方面表明語(yǔ)義依存分析作
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中文句法語(yǔ)義分析及其聯(lián)合學(xué)習(xí)機(jī)制研究.pdf
- 中文詞法分析技術(shù)的研究與實(shí)現(xiàn).pdf
- 俄語(yǔ)構(gòu)詞法語(yǔ)義研究.pdf
- 漢語(yǔ)動(dòng)詞“買”的句法語(yǔ)義分析.pdf
- 動(dòng)詞“開(kāi)”的句法語(yǔ)義研究
- “這么”的句法語(yǔ)義功能研究.pdf
- 動(dòng)詞“開(kāi)”的句法語(yǔ)義研究.pdf
- “使”字句的句法語(yǔ)義研究.pdf
- -像-字句句法語(yǔ)義研究.pdf
- 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的中文詞法分析研究.pdf
- 基于領(lǐng)域知識(shí)庫(kù)的中文詞法分析.pdf
- 網(wǎng)絡(luò)被字句的句法語(yǔ)義研究.pdf
- 漢語(yǔ)“著呢”的句法語(yǔ)義特征研究.pdf
- 動(dòng)結(jié)式的多義現(xiàn)象及其句法語(yǔ)義分析.pdf
- 漢語(yǔ)動(dòng)詞重疊的句法語(yǔ)義研究.pdf
- “說(shuō)不上x(chóng)”格式的句法語(yǔ)義研究
- 動(dòng)量詞和動(dòng)量短語(yǔ)的句法語(yǔ)義分析.pdf
- 統(tǒng)計(jì)中文詞法分析及其強(qiáng)化學(xué)習(xí)機(jī)制的研究.pdf
- 漢語(yǔ)關(guān)系小句的句法語(yǔ)義研究.pdf
- 英語(yǔ)名詞短語(yǔ)人稱指向句法語(yǔ)義研究.pdf
評(píng)論
0/150
提交評(píng)論