版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、目前,知識服務(wù)作為一種新的服務(wù)模式已經(jīng)成為信息服務(wù)領(lǐng)域的重點研究對象。作為知識服務(wù)的重要基礎(chǔ)研究領(lǐng)域之一,以詞匯為代表的詞匯知識系統(tǒng)(簡稱,詞系統(tǒng)?)的研究成為當(dāng)前知識服務(wù)研究領(lǐng)域的熱點和重點。而詞匯知識系統(tǒng)的動態(tài)更新問題是詞匯知識系統(tǒng)研究中重點待解決的問題。尤其隨著Internet的發(fā)展,對該問題解決方案的需求尤為迫切。一方面,Internet的發(fā)展,把信息的交互和傳遞推向制高點。信息每天以海量增加,新詞匯的產(chǎn)生速度越來越快。新詞匯的
2、大量產(chǎn)生和廣為流行,成為新時期漢語詞匯發(fā)展的一個突出現(xiàn)象。另一方面,目前不同行業(yè)領(lǐng)域存在各種各樣的、不同類型的詞匯知識庫。通過調(diào)研我們發(fā)現(xiàn),盡管這些詞匯知識庫在詞匯量大小、領(lǐng)域、詞關(guān)系的詳盡程度等方面各不相同,但他們有一點是相同的:這些詞匯知識系統(tǒng)普遍存在更新手段相對落后、更新緩慢,無法與日益加快的詞匯的產(chǎn)生速度相適應(yīng)的問題。鑒于以上問題,筆者試圖圍繞詞匯知識系統(tǒng)的動態(tài)更新做了一部分探索性工作。 本題目來源于國家“十一五”科技支
3、撐計劃項目《科技文獻(xiàn)信息服務(wù)系統(tǒng)關(guān)鍵技術(shù)研究及應(yīng)用示范》中的子課題:《知識組織系統(tǒng)的集成及服務(wù)體系研究與實現(xiàn)》。在國家“十一五”規(guī)劃中規(guī)定了十個重點領(lǐng)域,本文以這十個重點領(lǐng)域為詞匯收集領(lǐng)域,將與該十個領(lǐng)域相關(guān)的敘詞表、分類法和行業(yè)術(shù)語表集成到一起,形成詞匯知識系統(tǒng)。本文圍繞此詞匯知識系統(tǒng)的動態(tài)更新構(gòu)建了三個軟件工具:基于構(gòu)詞能力和構(gòu)詞模式的新詞發(fā)現(xiàn)系統(tǒng)、基于關(guān)聯(lián)規(guī)則挖掘的候選主題詞發(fā)現(xiàn)系統(tǒng)和基于相似度計算的詞關(guān)系構(gòu)建系統(tǒng)。 基于
4、構(gòu)詞能力和構(gòu)詞模式的新詞發(fā)現(xiàn)系統(tǒng)目的在“新詞”發(fā)現(xiàn)。借鑒單個漢字的構(gòu)詞能力和構(gòu)詞模式,提出了詞的構(gòu)詞能力和構(gòu)詞模式公式,以此為規(guī)則并與詞頻統(tǒng)計的方式相結(jié)合,實現(xiàn)了“新詞”的發(fā)現(xiàn)。 基于關(guān)聯(lián)規(guī)則挖掘的候選主題詞發(fā)現(xiàn)系統(tǒng)目的在詞和詞關(guān)系。通過Apriori算法挖掘出詞匯知識系統(tǒng)中的主題詞和期刊二次文獻(xiàn)中的關(guān)鍵詞間的強(qiáng)關(guān)聯(lián)關(guān)系,我們稱跟詞匯知識系統(tǒng)中的主題詞密切相關(guān)的關(guān)鍵詞為候選主題詞。通過候選主題詞的發(fā)現(xiàn),一面可以實現(xiàn)詞匯知識系統(tǒng)的
5、更新,另一方面因為發(fā)現(xiàn)了主題詞和候選主題詞間強(qiáng)關(guān)聯(lián)關(guān)系,所以也實現(xiàn)了詞關(guān)系的發(fā)現(xiàn)。 基于相似度計算的詞關(guān)系構(gòu)建系統(tǒng)目的在詞關(guān)系。相似度計算在自動問答、情報檢索、文本聚類等應(yīng)用中都是一個關(guān)鍵問題。本系統(tǒng)通過基于《同義詞詞林》的相似度計算,按照詞匯知識系統(tǒng)中主題詞間關(guān)系,構(gòu)建了候選主題詞間的詞關(guān)系。目前的詞關(guān)系僅限于相關(guān)關(guān)系,范疇較廣,有待在以后的工作中繼續(xù)對其深化,進(jìn)一步挖掘出更加專指、更加明確的詞關(guān)系。 以上三個工具的構(gòu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 無線定位服務(wù)系統(tǒng)構(gòu)建與實現(xiàn)方法研究.pdf
- 運(yùn)輸工具動態(tài)調(diào)度優(yōu)化方法及系統(tǒng).pdf
- 基于數(shù)據(jù)庫與知識庫的知識發(fā)現(xiàn)方法及工具實現(xiàn)研究.pdf
- 面向動態(tài)需求的產(chǎn)品定制系統(tǒng)構(gòu)建方法研究.pdf
- Web性能測試的方法研究與工具實現(xiàn).pdf
- 崗位知識推送系統(tǒng)實現(xiàn)方法與應(yīng)用研究.pdf
- 專家知識與仿真系統(tǒng)的結(jié)合方法研究與原型系統(tǒng)實現(xiàn).pdf
- 學(xué)科工具構(gòu)建平臺的設(shè)計與實現(xiàn).pdf
- 水泥熟料生產(chǎn)培訓(xùn)系統(tǒng)的動態(tài)監(jiān)測方法研究與實現(xiàn).pdf
- 高校知識管理與系統(tǒng)構(gòu)建研究.pdf
- 信息系統(tǒng)動態(tài)知識更新的矩陣方法研究.pdf
- 知識聯(lián)盟與企業(yè)動態(tài)競爭優(yōu)勢構(gòu)建研究.pdf
- 基于動態(tài)本體知識庫的問答系統(tǒng)的研究與實現(xiàn).pdf
- 對象-關(guān)系映射的同步方法研究與工具實現(xiàn).pdf
- 情境建模方法和支撐工具的研究與實現(xiàn).pdf
- 基于Web Services的知識導(dǎo)航系統(tǒng)構(gòu)建與實現(xiàn).pdf
- 構(gòu)建強(qiáng)健人事電子政務(wù)系統(tǒng)的方法與實現(xiàn).pdf
- 動態(tài)可重構(gòu)系統(tǒng)形式化驗證工具與原型平臺的設(shè)計與實現(xiàn).pdf
- 動態(tài)防御系統(tǒng)的研究與實現(xiàn).pdf
- SaaS應(yīng)用構(gòu)建方法的研究與實現(xiàn).pdf
評論
0/150
提交評論