中醫(yī)藥信息語義集成與知識發(fā)現(xiàn)若干問題研究.pdf_第1頁
已閱讀1頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、中醫(yī)藥文化源遠流長,至今已有五千多年的歷史。中醫(yī)藥理論博大精深,積累了海量數(shù)據(jù),卻分散龐雜,且往往數(shù)據(jù)豐富但知識貧乏,這對中醫(yī)藥信息的充分利用、中醫(yī)藥診療經驗的總結、中醫(yī)藥知識體系的豐富和發(fā)展形成了重重障礙。因此,如何集成大量散在的中醫(yī)藥信息和設計適應中醫(yī)藥特色的知識發(fā)現(xiàn)算法便成為迫切需要解決的問題。并逐步演化為中醫(yī)藥學結合計算機技術開展跨學科研究的熱點。主要內容包括: (1)中醫(yī)藥信息語義集成體系研究:針對中醫(yī)藥信息集成需求,

2、提出一個融合網(wǎng)格、本體、數(shù)據(jù)倉庫、知識發(fā)現(xiàn)、信息抽取和數(shù)據(jù)流監(jiān)測等技術的三層語義集成體系,并采用GT3.2實現(xiàn)了一個基于網(wǎng)格的中醫(yī)藥信息語義集成系統(tǒng)TCM-SGrid(TraditionalChineseMedicineinformationSemanticintegrationsystembasedonGrid)。 (2)中醫(yī)藥信息語義集成方法研究:引入語義相似性棧,并按其自底向上順序分層探討了計算實體(本文指概念和屬性)間相

3、似性的啟發(fā)規(guī)則,在此基礎上分別設計了一個領域本體間自動映射算法及一個綜合考察“服務本體語義相似性”和“動態(tài)服務質量滿足程度”兩項指標的網(wǎng)格服務發(fā)現(xiàn)算法,解決了TCM-SGrid系統(tǒng)中領域本體的異構和基于語義模型的網(wǎng)格服務發(fā)現(xiàn)等語義集成方法問題。 (3)中醫(yī)藥概念識別研究:為加速TCM-SGrid所集成的中醫(yī)藥文本信息的整理和結構化,中醫(yī)藥領域概念的自動有效識別變得尤為重要。為了克服中醫(yī)藥領域訓練樣例少和CRF(Condition

4、alRandomField)模型過度擬合等缺點,本研究采用不確定性、樣例代表性、批量樣例多樣性三項指標作為訓練樣例的選擇標準,設計了基于2-pool多標準主動學習的CRF算法,實現(xiàn)了文本信息中中醫(yī)藥領域概念的有效識別。 (4)中醫(yī)方劑數(shù)據(jù)挖掘研究:選擇TCM-SGrid系統(tǒng)中集成的方劑作為數(shù)據(jù)集,將基于互信息的特征選擇遺傳算法融入CMAR(ClassificationbasedonMultipleAssociationRules

5、)算法,通過規(guī)則組強度來構建多關聯(lián)分類模型,設計了面向中醫(yī)方劑高維數(shù)據(jù)集的多關聯(lián)分類算法I-CMAR,該算法在內存占用、運行時間、分類精度等指標上均優(yōu)于其他同類算法。 (5)中西醫(yī)病理、生理因素在線相關性研究:引入基于醫(yī)療傳感器網(wǎng)絡的數(shù)據(jù)流管理模型,提出一種面向高維數(shù)據(jù)的在線典型相關性(CCA)分析算法QuickCCA,針對傳統(tǒng)CCA計算中的性能瓶頸,在系統(tǒng)內存資源受限情況下,采用不等概率的列采樣技術實現(xiàn)實時流數(shù)據(jù)約減,形成概要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論