版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、人類基因組計劃的實施,產(chǎn)生了大量的生物醫(yī)學(xué)數(shù)據(jù)。生物信息學(xué)是基于信息科學(xué)的理論和方法,利用計算機(jī)技術(shù),分析和研究生物醫(yī)學(xué)數(shù)據(jù)的新興學(xué)科?;诨虮磉_(dá)譜,在分子水平上對腫瘤進(jìn)行分析和研究,是當(dāng)前生物信息學(xué)研究的重要課題。本文應(yīng)用人工智能的方法,對腫瘤基因表達(dá)譜進(jìn)行了分析和研究,取得的研究成果主要有: 第一:提出了一種腫瘤基因表達(dá)數(shù)據(jù)殘缺值處理的方法。本文以GEO數(shù)據(jù)庫中的GSE4045系列結(jié)腸癌數(shù)據(jù)為研究對象。設(shè)定數(shù)據(jù)中樣本的殘缺
2、值個數(shù)閾值為α,去掉殘缺值個數(shù)大于α的樣本,殘缺值等于與殘缺值樣本類別相同的同一基因的均值。對處理后的數(shù)據(jù)進(jìn)行聚類分析,結(jié)果顯示出很好的聚類有效性。 第二:本文建立了一種通過評價備選特征基因子集的分類性能來確定腫瘤基因表達(dá)數(shù)據(jù)特征基因的方法,并基于胃癌基因表達(dá)譜提取了胃癌特征基因集合。首先應(yīng)用分類信息指數(shù)、Relief、T檢驗、秩和檢驗算法,通過“腫瘤基因表達(dá)數(shù)據(jù)殘缺值的處理-數(shù)據(jù)標(biāo)準(zhǔn)化-搜索差異表達(dá)基因-去冗余分析”等步驟,提
3、取數(shù)據(jù)中的備選特征基因,再采用SVM分類器評價備選特征基因子集對樣本的分類正確率。分類正確率最高,元素個數(shù)最多的備選特征基因子集即為特征基因。本文以Hippo.Y等提供的胃癌基因表達(dá)數(shù)據(jù)為研究對象,應(yīng)用本標(biāo)準(zhǔn)確定了特征基因提取的算法和可有效應(yīng)用于聚類分析的特征基因。分析結(jié)果可視化程度好,可解釋性強(qiáng),具有很好的統(tǒng)計學(xué)和生物學(xué)意義。 第三:應(yīng)用邊介數(shù)聚類算法提取了結(jié)腸癌基因網(wǎng)絡(luò)的模塊結(jié)構(gòu),并用模塊度函數(shù)對聚類效果進(jìn)行了定性評價。邊介
4、數(shù)聚類算法是一種基于圖論的算法,計算網(wǎng)絡(luò)中通過某條邊的最短路徑的條數(shù)即邊介數(shù),找出邊介數(shù)最大的邊并將其刪除,從而使網(wǎng)絡(luò)逐步聚成不同的子網(wǎng)絡(luò)。這些子網(wǎng)絡(luò)對應(yīng)生物網(wǎng)絡(luò)的功能模塊。本文首先對聚類的有效性進(jìn)行了研究,利用模塊度函數(shù)比較了已知聚類結(jié)果的Zachary空手道俱樂部網(wǎng)絡(luò)的邊介數(shù)聚類和層次聚類的結(jié)果,證明了邊介數(shù)聚類算法的有效性,也解決了無監(jiān)督聚類算法需要設(shè)定聚類數(shù)的問題。本文采用的邊介數(shù)聚類算法借鑒了Girvan和Newman提出的社
5、區(qū)發(fā)現(xiàn)算法。利用邊介數(shù)聚類算法對GSE4045系列結(jié)腸癌數(shù)據(jù)進(jìn)行了分析,通過檢索GO數(shù)據(jù)庫驗證了邊介數(shù)聚類所得基因模塊具有相似或相同的功能類,從而進(jìn)一步證明了算法的可行性和有效性。 本文的研究工作得到了國家自然科學(xué)基金(No.60234020)的支持,相關(guān)研究成果已被DCDIS國際期刊(SCI刊源)、WCCI2008(EI刊源)和中文核心期刊《北京工業(yè)大學(xué)學(xué)報》正式錄用。本文研究工作的意義在于通過發(fā)現(xiàn)相似性預(yù)測未知基因的功能,為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于基因表達(dá)譜的腫瘤分類特征基因選擇研究.pdf
- 基于基因表達(dá)譜數(shù)據(jù)的腫瘤分類研究.pdf
- 基于基因表達(dá)譜的腫瘤數(shù)據(jù)分類研究.pdf
- 基因表達(dá)譜的腫瘤特征基因提取研究分析
- 腫瘤基因表達(dá)譜分類的特征基因選擇研究.pdf
- 基于基因表達(dá)譜的腫瘤放療敏感基因識別方法研究.pdf
- 基于腫瘤基因表達(dá)譜數(shù)據(jù)的分類算法研究.pdf
- 腫瘤基因表達(dá)譜分類方法研究.pdf
- 基于SVM和AdaBoost的腫瘤基因表達(dá)譜分類研究.pdf
- 基于維數(shù)約簡的腫瘤基因表達(dá)譜數(shù)據(jù)研究.pdf
- 基于稀疏性理論的腫瘤基因表達(dá)譜分類.pdf
- 腫瘤基因表達(dá)譜數(shù)據(jù)聚類的譜方法研究.pdf
- 基于基因表達(dá)譜的基因挖掘算法研究.pdf
- 腫瘤表達(dá)譜基因芯片篩選膽囊癌腫瘤相關(guān)基因的研究.pdf
- 腫瘤基因表達(dá)譜數(shù)據(jù)特征選擇方法研究.pdf
- 基于腫瘤基因表達(dá)譜數(shù)據(jù)的特征提取方法.pdf
- 基于電路理論的腫瘤基因表達(dá)調(diào)控網(wǎng)絡(luò)的研究.pdf
- 基于基因表達(dá)譜的信息基因提取算法.pdf
- 基于Laplace譜的基因表達(dá)譜數(shù)據(jù)分類研究.pdf
- 變應(yīng)性鼻炎基因表達(dá)譜及其相關(guān)基因研究.pdf
評論
0/150
提交評論