基于場景化知識表示的自然語言處理及其在自動文本校對中的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩150頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、自然語言處理就是用計(jì)算機(jī)處理自然語言,以理解自然語言中表達(dá)的知識和含義,或者將知識用自然語言表達(dá)出來。因而綜合知識表示的自然語言模型是自然語言處理研究的一個核心問題。然而目前尚缺乏一種從知識的語言表達(dá)的角度而設(shè)計(jì)的自然語言模型。本文從分析人使用語言表達(dá)知識的自然過程出發(fā),提出了一種知識語言表達(dá)的總體模型,并據(jù)此提出了場景化知識表示體系。同時(shí),將該語言模型和知識表示體系應(yīng)用于基于語義的特殊領(lǐng)域文本校對中,取得了良好的效果。 作者認(rèn)

2、為,人使用自然語言表達(dá)其認(rèn)知的一個核心步驟是提取認(rèn)知中的關(guān)鍵信息。這些關(guān)鍵信息同樣也是人進(jìn)行邏輯思考的基礎(chǔ)。作者分析了自然語言表達(dá)知識時(shí)所需要的各類關(guān)鍵信息,并采用場景的形式來組織這些信息,從而形成了場景化知識表示的結(jié)構(gòu)。從知識中提取出關(guān)鍵信息被稱為知識的場景化分析。它主要包括三個步驟,即:組成識別、特征識別和場景識別。它們分別提取出知識的組成信息、知識的組成元素的特征信息以及它們在特定場景中的角色信息。 在此基礎(chǔ)上,我們研究了

3、基于知識場景結(jié)構(gòu)的形式化推理方法,包括:繼承推理、例證推理和否定推理。同時(shí)也定義了將場景知識結(jié)構(gòu)轉(zhuǎn)換為一階謂詞邏輯表達(dá)式的轉(zhuǎn)換規(guī)則,為使用自動推理的方法進(jìn)行語義判斷提供了基礎(chǔ)。 以知識的場景化描述為核心,提出了使用語言描述知識的的總體模型。在該模型中,知識的語言描述共包括五種主要的方式:名稱描述、指代描述、主類描述、內(nèi)在結(jié)構(gòu)描述和相關(guān)知識描述。其中前三種描述方式統(tǒng)稱為詞匯化描述,因?yàn)樗鼈兙苯邮褂迷~匯來表達(dá)知識。后兩種統(tǒng)稱為結(jié)構(gòu)

4、化描述。其中,內(nèi)在結(jié)構(gòu)描述通過對知識的場景化分析,將知識的場景結(jié)構(gòu)通過語言轉(zhuǎn)換模板轉(zhuǎn)換為語言的序列結(jié)構(gòu)。這種描述方式主要產(chǎn)生語言中的句子結(jié)構(gòu)。相關(guān)知識描述則使用知識的相關(guān)知識對它進(jìn)行描述。其方式和過程與內(nèi)在結(jié)構(gòu)描述相同。它主要產(chǎn)生語言中的短語、定語從句、插入語等結(jié)構(gòu)。 在這一模型的基礎(chǔ)上,作者還分析了漢語中的各種句型和短語結(jié)構(gòu),提出了相應(yīng)的語法場景模板和語言轉(zhuǎn)換模板。通過這些模板,可以實(shí)現(xiàn)知識的場景化表示與自然語言之間的雙向轉(zhuǎn)換

5、,從而使場景化知識表示成為一種真正適用于自然語言處理的知識表示體系。 針對自然語言理解的需要,本文一方面提出了使用語言轉(zhuǎn)換模板進(jìn)行語句分析的基本思路,另一方面又提出了兩種對傳統(tǒng)句法分析算法的改進(jìn),即:基于禁入?yún)^(qū)的Chart算法以及基于知識弱相容性的句法分析語義輔助方法。同時(shí)本文還制定了將句法結(jié)構(gòu)轉(zhuǎn)換為場景知識結(jié)構(gòu)的樹轉(zhuǎn)換規(guī)則。 最后,作者以上述理論和方法為基礎(chǔ),編寫了針對特殊領(lǐng)域的語義校對軟件。該軟件通過對文章中語句的句

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論