基于SOM的神經(jīng)網(wǎng)絡(luò)聚類方法在臨床檢驗(yàn)知識(shí)發(fā)現(xiàn)中的適用性研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目的:
  臨床檢驗(yàn)是醫(yī)生進(jìn)行疾病診斷、制定治療方案和評(píng)價(jià)治療效果的基本手段之一。然而,有研究表明,目前臨床上很多檢驗(yàn)項(xiàng)目是不必要或者是不適當(dāng)?shù)?。?dǎo)致這種現(xiàn)象的原因有很多,其中一個(gè)主要原因是醫(yī)生在臨床檢驗(yàn)決策時(shí)缺乏系統(tǒng)的知識(shí)支持。本課題針對(duì)這一具體問題展開研究,探索自組織映射(Self-organizingMaps,SOM)神經(jīng)網(wǎng)絡(luò)聚類在臨床檢驗(yàn)歷史數(shù)據(jù)知識(shí)發(fā)現(xiàn)中的適用性,挖掘?qū)<医?jīng)驗(yàn)基礎(chǔ)上的、能代表多數(shù)人意見的臨床檢驗(yàn)項(xiàng)目的應(yīng)用

2、規(guī)律(知識(shí)),以期為臨床檢驗(yàn)知識(shí)發(fā)現(xiàn)提供適宜的方法,為臨床檢驗(yàn)項(xiàng)目的合理選擇和規(guī)范應(yīng)用提供參考依據(jù),為SOM神經(jīng)網(wǎng)絡(luò)聚類方法在醫(yī)學(xué)領(lǐng)域相關(guān)研究中的應(yīng)用提供新思路。
  方法:
  1.采用SQL查詢語言,從西安市最大的兩所三級(jí)甲等綜合醫(yī)院的醫(yī)院信息系統(tǒng)和實(shí)驗(yàn)室信息系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)中,提取出2009-2011年內(nèi)科門診患者的部分就診數(shù)據(jù),并對(duì)這些數(shù)據(jù)進(jìn)行連接、轉(zhuǎn)換、清洗、篩選。依據(jù)文獻(xiàn),選擇患者年齡、性別、3年臨床實(shí)驗(yàn)室檢驗(yàn)項(xiàng)

3、目數(shù)、接診醫(yī)生職稱、付費(fèi)方式、初步診斷特征、臨床檢驗(yàn)項(xiàng)目為聚類變量。
  2.從清洗、轉(zhuǎn)換好的數(shù)據(jù)庫(kù)中,提取出2009-2011年初步診斷特征為腹痛、發(fā)熱、關(guān)節(jié)痛的5,756名內(nèi)科門診患者的聚類變量數(shù)據(jù),建立SOM神經(jīng)網(wǎng)絡(luò)聚類模型和k-means聚類模型。采用不同參數(shù)、不同步長(zhǎng)訓(xùn)練網(wǎng)絡(luò),確定SOM神經(jīng)網(wǎng)絡(luò)聚類的步長(zhǎng)和神經(jīng)元個(gè)數(shù);依據(jù)SOM神經(jīng)網(wǎng)絡(luò)聚類數(shù)確定k-means聚類的類別數(shù)。采用c檢驗(yàn)對(duì)每種模型中每類患者的性別、付費(fèi)方式、

4、接診醫(yī)師職稱等特征的類間差異進(jìn)行比較,采用2c分割檢驗(yàn)方法進(jìn)一步對(duì)類間差異進(jìn)行兩兩比較;采用單因素方差分析對(duì)每類患者的年齡、3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)等計(jì)量資料類間差異進(jìn)行比較,采用SNK-q檢驗(yàn)進(jìn)一步對(duì)類間差異進(jìn)行兩兩比較。同時(shí),分別計(jì)算兩種方法聚類結(jié)果的DBI指數(shù)(Davies–BouldinIndex),初步評(píng)價(jià)不同方法聚類結(jié)果的區(qū)分度和聚類效果。
  3.依據(jù)聚類結(jié)果,結(jié)合每類患者臨床檢驗(yàn)項(xiàng)目實(shí)際應(yīng)用情況,確定每類患者的臨床檢

5、驗(yàn)推薦方案(前5位)。邀請(qǐng)15名臨床專家對(duì)兩種模型聚類結(jié)果中每位患者采用該類臨床檢驗(yàn)推薦方案的合適性進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果分為合適或不合適,計(jì)算兩種模型聚類結(jié)果的合適率,并計(jì)算SOM神經(jīng)網(wǎng)絡(luò)和k-means聚類結(jié)果的一致率和Kappa值,評(píng)價(jià)兩模型聚類結(jié)果的一致性。依據(jù)比較和評(píng)價(jià)結(jié)果,綜合分析k-means聚類模型和SOM神經(jīng)網(wǎng)絡(luò)聚類模型在臨床檢驗(yàn)項(xiàng)目知識(shí)發(fā)現(xiàn)中的適應(yīng)性。
  4.從清洗、轉(zhuǎn)換好的數(shù)據(jù)庫(kù)中,提取出2009-2011年內(nèi)

6、科門診患者中前十位初步診斷特征,分別為結(jié)締組織病、強(qiáng)直性脊柱炎、呼吸道感染、慢性胃炎、癲癇、肝損害、乙型病毒性肝炎、前列腺炎、類風(fēng)濕性關(guān)節(jié)炎和腹痛,共15,999名患者的聚類變量數(shù)據(jù)。以這十類患者的聚類變量數(shù)據(jù)建立SOM神經(jīng)網(wǎng)絡(luò)聚類模型。建模過程中采用不同的參數(shù)和步長(zhǎng)訓(xùn)練網(wǎng)絡(luò),依據(jù)數(shù)據(jù)集聚簇分布特征圖確定最終聚類類別數(shù),依據(jù)數(shù)據(jù)集屬性分類特征圖確定“聰明屬性”。采用2c檢驗(yàn)對(duì)每種模型聚類結(jié)果中每類患者的性別、付費(fèi)方式、接診醫(yī)師職稱等特征

7、的類間差異進(jìn)行比較,采用單因素方差分析對(duì)每類患者的年齡、3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)等計(jì)量資料類間差異進(jìn)行比較;采用條圖對(duì)聚類結(jié)果進(jìn)行可視化描述,概括每類患者的特征。
  5.計(jì)算SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果的DBI指數(shù),從定量角度評(píng)價(jià)SOM神經(jīng)網(wǎng)絡(luò)的聚類效果。依據(jù)聚類結(jié)果中每類患者臨床檢驗(yàn)項(xiàng)目的實(shí)際應(yīng)用情況,以前5位檢驗(yàn)項(xiàng)目為該類患者臨床檢驗(yàn)推薦方案;并在每類患者中抽取50例患者信息,反饋給20位臨床專家,專家依據(jù)患者的性別、年齡、初步診斷

8、特征評(píng)判每個(gè)患者應(yīng)用其所在類臨床檢驗(yàn)推薦方案的合適性,判定結(jié)果為合適或不合適兩類。計(jì)算每種聚類結(jié)果的合適率,評(píng)價(jià)聚類結(jié)果的臨床意義。
  以上k-means聚類、方差分析、2c檢驗(yàn)均在SPSS16.0統(tǒng)計(jì)學(xué)軟件中完成;SOM神經(jīng)網(wǎng)絡(luò)的建立在MatlabR2009b軟件包中的SOMToolBox工具箱基礎(chǔ)上編程實(shí)現(xiàn)。
  結(jié)果:
  1.采用SOM神經(jīng)網(wǎng)絡(luò)對(duì)初步診斷特征為腹痛、發(fā)熱、關(guān)節(jié)痛的5,756名患者進(jìn)行聚類,聚類

9、結(jié)果為3類。3類患者的性別、付費(fèi)方式、接診醫(yī)師職稱構(gòu)成差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05)。Ⅰ類患者中男性、非教授號(hào)、全自費(fèi)患者所占比例較大,Ⅲ類患者中教授號(hào)比例較多;3類患者的年齡和3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05),且任意兩類患者間差異均有統(tǒng)計(jì)學(xué)意義(P<0.05),Ⅱ類患者的年齡最大,平均為58.48±9.35歲,Ⅲ類患者的3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)最多,平均為2.87±1.85項(xiàng)。
  2.為方便與SO

10、M神經(jīng)網(wǎng)絡(luò)聚類結(jié)果進(jìn)行比較,定義k-means聚類數(shù)目為3,聚類得到的3類患者的性別、付費(fèi)方式、接診醫(yī)師職稱的構(gòu)成差異均有統(tǒng)計(jì)學(xué)意義(P<0.05),Ⅰ類患者中男性、非教授號(hào)患者比例較大,Ⅲ類患者中女性比例較大;不同類患者間的年齡和3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05),任意兩類間年齡差異均有統(tǒng)計(jì)學(xué)意義,Ⅲ類患者年齡最大,平均為61.81±8.47歲;除Ⅰ類和Ⅱ類間3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)差異有統(tǒng)計(jì)學(xué)意義外,其余兩類間

11、差異均無統(tǒng)計(jì)學(xué)意義(P>0.05)。
  3.通過SOM神經(jīng)網(wǎng)絡(luò)聚類和k-means聚類兩種模型的聚類結(jié)果比較發(fā)現(xiàn),SOM神經(jīng)網(wǎng)絡(luò)聚類各類中初步診斷特征分布比例差異最大,DBI指數(shù)最小(DBI=0.82),區(qū)分度更高。專家評(píng)價(jià)結(jié)果顯示,SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果總合適率為61.29%,k-means聚類結(jié)果總合適率為50.69%;SOM神經(jīng)網(wǎng)絡(luò)與k-means聚類結(jié)果一致率為77.87%,Kappa值為0.556。
  4.采用

12、SOM神經(jīng)網(wǎng)絡(luò)對(duì)前十位臨床初診患者數(shù)據(jù)進(jìn)行聚類,聚類結(jié)果數(shù)目為8類。對(duì)8類患者性別、接診醫(yī)生職稱和付費(fèi)方式的構(gòu)成比較發(fā)現(xiàn),各類患者間差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05);對(duì)每類患者的年齡和3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)進(jìn)行比較發(fā)現(xiàn),各類患者間差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05)。
  5.通過模型聚類結(jié)果比較發(fā)現(xiàn),患者性別、年齡、3年累計(jì)臨床檢驗(yàn)項(xiàng)目數(shù)、初步診斷特征四個(gè)屬性對(duì)聚類模型的貢獻(xiàn)較大,為聚類的“聰明屬性”。
  6.運(yùn)用D

13、BI指數(shù)對(duì)SOM神經(jīng)網(wǎng)絡(luò)聚類結(jié)果進(jìn)行評(píng)價(jià),DBI指數(shù)為0.86。專家對(duì)聚類結(jié)果概括出的每類患者的臨床檢驗(yàn)推薦方案評(píng)價(jià)結(jié)果顯示,總合適率為76.4%。
  結(jié)論:
  1.在臨床檢驗(yàn)的數(shù)據(jù)挖掘中,SOM神經(jīng)網(wǎng)絡(luò)和k-means聚類結(jié)果一致性較好,但SOM神經(jīng)網(wǎng)絡(luò)聚類中各類特征更加明顯,區(qū)分度和臨床實(shí)際應(yīng)用的合適率更高。因此,本研究認(rèn)為SOM神經(jīng)網(wǎng)絡(luò)聚類的學(xué)習(xí)能力較k-means模型強(qiáng),聚類效果更好,更適用于臨床檢驗(yàn)項(xiàng)目知識(shí)發(fā)現(xiàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論