基于DNA微陣列數(shù)據(jù)的癌癥分類技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩129頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著人類基岡組計劃的基本完成,生命科學(xué)的進程進入了后基因組時代,在后基因組時代,研究的重點從對單個基因的研究上升到了對整個基因組功能和動態(tài)變化規(guī)律的研究,從而產(chǎn)生了對海量生物信息進行處理的需求。DNA微陣列(也稱基因芯片)技術(shù)的出現(xiàn)是后基因組時代的一個主要標(biāo)志,同時也是目前生物信息學(xué)研究的主要領(lǐng)域之一。通過此技術(shù),可以同時檢測成千上萬個基因在生物體內(nèi)的活性,為從分子層次上對疾病,尤其是癌癥進行診斷、分型、致病機理的研究以及藥物的快速開發(fā)

2、提供了極大的便利。但是由于實驗成本的限制,使得微陣列數(shù)據(jù)集通常包含的樣本數(shù)較少,因此造成了其高維小樣本的特點。如何從這些高維小樣本數(shù)據(jù)中挖掘有用的生物學(xué)信息并使用這些信息對癌癥的檢測與分型提供有效的指導(dǎo),便成為了機器學(xué)習(xí)與模式識別領(lǐng)域研究的當(dāng)務(wù)之急。本文主要圍繞癌癥微陣列數(shù)據(jù)分類問題開展研究,具體研究成果主要包括:
   (1)纏繞型特征基因選擇方法通常具有以下兩個缺點:收斂速度過慢和易陷入局部最優(yōu)。故此提出了兩種基于群集智能的

3、特征基岡選擇方法:基于蟻群的特征基因選擇方法和基于改進的離散粒子群的特征基岡選擇方法。前者實現(xiàn)簡單,且可以快速的獲取一個較優(yōu)解,有效地解決了現(xiàn)有方法收斂速度過慢的問題。而后者則通過增加一條簡單的規(guī)則使算法可以巧妙地避開局部最優(yōu)解,具有更強的尋優(yōu)能力。
   (2)針對現(xiàn)有的選擇性集成分類方法通常具有較高時間復(fù)雜度的問題,提出了一種基于相關(guān)分析的集成分類方法,其通過將差異的選擇從分類器層轉(zhuǎn)換到訓(xùn)練子集層這一巧妙的策略有效地降低了計

4、算的復(fù)雜度,同時可以保持分類的準確率并節(jié)省存儲的開銷,具有較強的實用性。
   (3)提出了一種基于可信分析的多類微陣列數(shù)據(jù)分類方法。該方法的思想是首先使用“一對多”支持向量機對樣本進行分類,然后評估分類結(jié)果的可信性,對可信度低的樣本采用一種稱為基于質(zhì)心距離的類別優(yōu)先級評估方法進行評判。該方法的優(yōu)勢在于提高了分類的精度,且并未在計算復(fù)雜度方面有顯著地增加。
   (4)考慮微陣列數(shù)據(jù)集小樣本的特性,提出了一種基于無標(biāo)簽樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論