版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、“人文計(jì)算”是一個(gè)將現(xiàn)代信息技術(shù)融入到傳統(tǒng)人文社會(huì)科學(xué)研究中的交叉研究領(lǐng)域。隨著“互聯(lián)網(wǎng)+”概念的興起,數(shù)字化浪潮持續(xù)推進(jìn),“人文計(jì)算”已成為情報(bào)學(xué)、語言學(xué)和中文信息處理領(lǐng)域的重要研究課題。近幾年來,情報(bào)語言學(xué)界更是涌現(xiàn)了一批古籍?dāng)?shù)字化、古漢語文獻(xiàn)語料庫資源建設(shè)等人文計(jì)算領(lǐng)域的新項(xiàng)目。當(dāng)前,現(xiàn)代漢語相關(guān)的信息處理研究已經(jīng)深入到篇章層面,但古代漢語相關(guān)的信息處理大多仍停留在字處理的階段,因而,對(duì)古代漢語詞匯級(jí)層面的相關(guān)知識(shí)進(jìn)行探索,對(duì)于我
2、們完善現(xiàn)有的古漢語信息處理研究體系具有十分重要的現(xiàn)實(shí)意義。本文中的上古文獻(xiàn)指的是先秦時(shí)期的古漢語文獻(xiàn),在研究過程中,運(yùn)用了語料庫、人文計(jì)算、機(jī)器統(tǒng)計(jì)模型、復(fù)雜網(wǎng)絡(luò)等領(lǐng)域的相關(guān)知識(shí),開展了古漢語文獻(xiàn)詞匯級(jí)層面的知識(shí)挖掘工作。
本文的總體研究目標(biāo)就是融合數(shù)字人文的思想開展先秦古漢語詞匯級(jí)層面的知識(shí)挖掘研究,運(yùn)用情報(bào)語言學(xué)領(lǐng)域內(nèi)的多種研究方法,探尋上古文獻(xiàn)語料庫中蘊(yùn)含的有用知識(shí),研究結(jié)果一方面可以幫助人們探索漢語言的發(fā)展歷史和規(guī)律,
3、另一方面為古漢語信息處理以及情報(bào)知識(shí)發(fā)現(xiàn)服務(wù)。
本文的研究都是基于由25部具有代表性的先秦古文獻(xiàn)所構(gòu)建的上古漢語語料庫開展的,主要研究內(nèi)容包括如下三個(gè)部分:一是進(jìn)行上古文獻(xiàn)的古漢語語料庫構(gòu)建標(biāo)注研究,這部分首先介紹了這25部先秦古文獻(xiàn)的基本情況,接著分別介紹了古漢語語料庫、古漢語分詞、古漢語詞性標(biāo)注以及命名實(shí)體識(shí)別的相關(guān)知識(shí),最后選取語料庫中的部分上古文獻(xiàn)進(jìn)行了簡(jiǎn)單的字詞分布統(tǒng)計(jì),并對(duì)其中的內(nèi)部規(guī)律作了分析;二是基于條件隨機(jī)場(chǎng)
4、模型與古漢語語言規(guī)則相結(jié)合的方法進(jìn)行古漢語的分詞及詞性訓(xùn)練模型研究,這部分首先詳細(xì)介紹了條件隨機(jī)場(chǎng)模型的相關(guān)知識(shí)以及如何對(duì)古漢語語料進(jìn)行預(yù)處理、如何選取特征模板,然后針對(duì)上古漢語語料庫設(shè)計(jì)了基于條件隨機(jī)場(chǎng)模型的封閉性測(cè)試及開放性測(cè)試兩組對(duì)比實(shí)驗(yàn),在這兩組對(duì)比實(shí)驗(yàn)的基礎(chǔ)上又開展了子實(shí)驗(yàn),最終顯示,封閉性測(cè)試得到的調(diào)和平均數(shù)(F)的數(shù)值在99%左右,開放性測(cè)試得到的調(diào)和平均數(shù)(F)的數(shù)值在90%左右,兩組實(shí)驗(yàn)都取得了比較理想的效果;三是運(yùn)用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 出土上古文獻(xiàn)的神話傳說研究.pdf
- 古文獻(xiàn)中所見山西方言歷史詞匯研究.pdf
- 安徽考古文獻(xiàn)
- 《左傳》征引古文獻(xiàn)研究.pdf
- 婦科腫瘤中醫(yī)古文獻(xiàn)整理及特色療法挖掘研究.pdf
- 基于中醫(yī)古文獻(xiàn)挖掘治療前列腺腫瘤相關(guān)用藥規(guī)律.pdf
- 考古文獻(xiàn)《詩經(jīng)》異文辨析.pdf
- 古文獻(xiàn)植物名實(shí)考略.pdf
- 中國古文獻(xiàn)學(xué)獎(jiǎng)學(xué)金
- 中國古文獻(xiàn)獎(jiǎng)學(xué)金評(píng)獎(jiǎng)條例
- 避諱及避諱對(duì)古文獻(xiàn)的影響.pdf
- 古文獻(xiàn)植物名實(shí)考略_8154.pdf
- 咽胃合病的古文獻(xiàn)及臨床調(diào)查研究.pdf
- 中醫(yī)藥古文獻(xiàn)檢索系統(tǒng)研究.pdf
- 中醫(yī)古文獻(xiàn)皮膚癌的用藥規(guī)律及外治法的研究.pdf
- 古文獻(xiàn)文字圖像分割與差異性比對(duì)算法研究.pdf
- 七上古文基礎(chǔ)知識(shí)期末復(fù)習(xí)
- 帕金森病患者便秘的古文獻(xiàn)整理及臨床研究.pdf
- 滿都海夫人事跡蒙古文獻(xiàn)考
- 七上古文基礎(chǔ)知識(shí)期末復(fù)習(xí)(2)
評(píng)論
0/150
提交評(píng)論