版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、知識(shí)發(fā)現(xiàn)可靠性是知識(shí)發(fā)現(xiàn)領(lǐng)域中一個(gè)重要但容易忽視的主題。隨著知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用,有一個(gè)問(wèn)題逐漸引起人們的關(guān)注,即在什么條件下知識(shí)發(fā)現(xiàn)是可靠的,或者說(shuō)在什么條件下所發(fā)現(xiàn)的知識(shí)是可靠的。近年來(lái)在知識(shí)發(fā)現(xiàn)可靠性方面的研究,大多關(guān)注于某一具體數(shù)據(jù)挖掘模型下的可靠性問(wèn)題。而對(duì)于不同模型問(wèn)存在的可靠性共同主題,比如數(shù)據(jù)質(zhì)量、評(píng)估方法等等,迄今為止仍沒(méi)有一項(xiàng)系統(tǒng)性研究。針對(duì)知識(shí)發(fā)現(xiàn)可靠性的共同主題,進(jìn)行分階段、系統(tǒng)化的總結(jié)和梳理,已成為
2、知識(shí)發(fā)現(xiàn)可靠性研究的一大迫切需要。
在知識(shí)發(fā)現(xiàn)技術(shù)所應(yīng)用的各個(gè)領(lǐng)域,有一個(gè)領(lǐng)域特別需要知識(shí)發(fā)現(xiàn)可靠性的研究,即中醫(yī)藥領(lǐng)域。作為中華民族重要文化財(cái)富和學(xué)術(shù)成就的中醫(yī)藥,近年來(lái)面臨著生存和發(fā)展的挑戰(zhàn)。如何把這一挑戰(zhàn)化為中醫(yī)藥發(fā)展的契機(jī),利用知識(shí)發(fā)現(xiàn)技術(shù)促進(jìn)中醫(yī)藥的跨越式發(fā)展,已成為中醫(yī)藥研究人員的一項(xiàng)重要課題。近年來(lái)的中醫(yī)藥信息化工作已為知識(shí)發(fā)現(xiàn)創(chuàng)造了有利條件。然而,由于中醫(yī)藥數(shù)據(jù)自然語(yǔ)言性強(qiáng),數(shù)據(jù)表達(dá)涵義豐富,表達(dá)方式多樣化
3、,而且在數(shù)據(jù)質(zhì)量上還面臨較大問(wèn)題,在具備這些特征的數(shù)據(jù)上所進(jìn)行的知識(shí)發(fā)現(xiàn),相比其他領(lǐng)域來(lái)講,就更加需要關(guān)注和研究知識(shí)發(fā)現(xiàn)可靠性問(wèn)題。
在這一背景下,本文圍繞中醫(yī)藥知識(shí)發(fā)現(xiàn)可靠性這一主題,從知識(shí)發(fā)現(xiàn)整個(gè)生命周期的各個(gè)階段對(duì)可靠性因素進(jìn)行探討,提出了知識(shí)發(fā)現(xiàn)可靠性框架PBRF-KD。針對(duì)中醫(yī)藥知識(shí)發(fā)現(xiàn)中比較突出的可靠性問(wèn)題,重點(diǎn)探討中醫(yī)藥知識(shí)發(fā)現(xiàn)中的結(jié)構(gòu)性因素、表達(dá)性因素和信任性因素三大問(wèn)題。本文的研究工作與貢獻(xiàn)包括如下幾個(gè)方
4、面:
1)提出了基于過(guò)程的知識(shí)發(fā)現(xiàn)可靠性框架
針對(duì)現(xiàn)有知識(shí)發(fā)現(xiàn)可靠性研究模型相關(guān)的特點(diǎn),提出了一個(gè)與模型/應(yīng)用無(wú)關(guān)的知識(shí)發(fā)現(xiàn)可靠性框架PBRF-KD,該框架采用基于過(guò)程的思路對(duì)知識(shí)發(fā)現(xiàn)整個(gè)流程中的各個(gè)階段和可靠性因素進(jìn)行了梳理,歸納出了7種可靠性相關(guān)因素。該框架為知識(shí)發(fā)現(xiàn)項(xiàng)目設(shè)立了整套與可靠性相關(guān)的藍(lán)本。
2)提出了結(jié)構(gòu)相關(guān)的可靠性因素的優(yōu)化方法
分析了中醫(yī)藥知識(shí)發(fā)現(xiàn)中與結(jié)構(gòu)相關(guān)的
5、可靠性因素,主要指數(shù)據(jù)完整性。針對(duì)文本型字段的完整性問(wèn)題,提出了基于順序半相關(guān)度量的中醫(yī)藥文本缺失字段填補(bǔ)方法。針對(duì)中醫(yī)藥文獻(xiàn)類別標(biāo)簽缺失的問(wèn)題,提出了基于M-Similarity的多標(biāo)簽文本分類方法。
3)提出了表達(dá)相關(guān)的可靠性因素的優(yōu)化方法
分析了中醫(yī)藥知識(shí)發(fā)現(xiàn)中與表達(dá)相關(guān)的可靠性因素,包括表達(dá)粒度和表達(dá)一致性。針對(duì)表達(dá)粒度,提出了基于規(guī)則的表達(dá)粒度細(xì)分方法。針對(duì)表達(dá)一致性,提出了基于本體的表達(dá)一致化方法
6、。該套方法有助于提高中醫(yī)藥與表達(dá)相關(guān)的可靠性。
4)提出了信任相關(guān)的可靠性因素的優(yōu)化方法
分析了中醫(yī)藥知識(shí)發(fā)現(xiàn)中與信任相關(guān)的可靠性因素,主要指數(shù)據(jù)可信度。針對(duì)中醫(yī)藥特有的數(shù)據(jù)可信度問(wèn)題,提出了基于歷史文獻(xiàn)認(rèn)可度的數(shù)據(jù)可信度衡量方法,和基于互聯(lián)網(wǎng)知名度的數(shù)據(jù)可信度衡量方法。此外,基于這兩種可信度衡量方法,提出了基于數(shù)據(jù)可信度的加權(quán)頻繁模式挖掘算法,并在消渴方和脾胃方數(shù)據(jù)集上獲得了有意義的結(jié)果。該套方法有助于提高
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于中醫(yī)藥非相關(guān)文獻(xiàn)知識(shí)發(fā)現(xiàn)的研究.pdf
- 中醫(yī)藥領(lǐng)域知識(shí)關(guān)系發(fā)現(xiàn)方法研究與應(yīng)用.pdf
- 中醫(yī)藥知識(shí)
- 中醫(yī)藥信息語(yǔ)義集成與知識(shí)發(fā)現(xiàn)若干問(wèn)題研究.pdf
- 中醫(yī)藥健康知識(shí)
- 中醫(yī)藥文獻(xiàn)語(yǔ)義關(guān)系圖發(fā)現(xiàn)
- 中醫(yī)藥知識(shí)淺談
- 中醫(yī)藥文獻(xiàn)語(yǔ)義關(guān)系圖發(fā)現(xiàn)
- 中醫(yī)藥文獻(xiàn)語(yǔ)義關(guān)系圖發(fā)現(xiàn)
- 中醫(yī)藥文獻(xiàn)語(yǔ)義關(guān)系圖發(fā)現(xiàn)
- 中醫(yī)藥知識(shí)宣傳資料
- 中醫(yī)藥知識(shí)工程應(yīng)用.pdf
- 中醫(yī)藥養(yǎng)生知識(shí)
- 中醫(yī)藥法知識(shí)競(jìng)賽題庫(kù)_中醫(yī)藥法知識(shí)競(jìng)賽試題及答案
- 中醫(yī)藥知識(shí)與苷肽
- 中醫(yī)藥知識(shí)競(jìng)賽題庫(kù)
- 中醫(yī)藥知識(shí)宣傳材料
- 中醫(yī)藥健康知識(shí)講座
- 兒童中醫(yī)藥管理項(xiàng)目知識(shí)
- 中醫(yī)藥健康知識(shí)講座
評(píng)論
0/150
提交評(píng)論