版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基因表達(dá)數(shù)據(jù)提供了大量基因表達(dá)的信息,這些為理解生命的本質(zhì)起著重要作用。基因表達(dá)數(shù)據(jù)常見的處理方法包括識(shí)別差異表達(dá)的基因,聚類,雙向聚類和構(gòu)建基因調(diào)控網(wǎng)絡(luò)等等。盡管用這些方法也能夠挖掘出隱藏在基因表達(dá)數(shù)據(jù)里面的部分信息,但所獲得的信息相對而言還是較少,例如在癌癥的研究中,雖然使用了許多先進(jìn)的方法,數(shù)據(jù)和手段來研究這些疾病,如癌癥和腫瘤基因圖譜(TCGA)數(shù)據(jù)庫等等,但是當(dāng)前對付癌癥依舊沒有較好的策略,這表明研究者對相關(guān)疾病還沒有獲得全部
2、的生物信息,需要反思當(dāng)前這些方法存在的問題。在基因表達(dá)數(shù)據(jù)中,絕大部分基因的表達(dá)是沒有明顯變化的,只有很少的一部分基因是差異表達(dá)的。在這些差異表達(dá)的基因中,有一部分基因的表達(dá)是上調(diào)的,另外一部分基因是下調(diào)的,這些上調(diào)基因與下調(diào)基因是否存在關(guān)聯(lián)?如果基因集V的兩個(gè)子集V1和V2在部分實(shí)驗(yàn)條件或時(shí)間點(diǎn)中具有相反的表達(dá)趨勢,而且每個(gè)子集之內(nèi)的基因都具有相似的表達(dá)趨勢,那么就說子集V1和子集V2是一個(gè)負(fù)相關(guān)表達(dá)模式,簡稱負(fù)相關(guān)模式,如果這個(gè)負(fù)相
3、關(guān)模式在其他多個(gè)數(shù)據(jù)集中也存在,那么就說這個(gè)負(fù)相關(guān)模式是保守的(不變的)。基因表達(dá)譜中的負(fù)相關(guān)模式很少有學(xué)者進(jìn)行深入系統(tǒng)探索。針對這些問題,本論文嘗試從負(fù)相關(guān)的思路出發(fā),對基因表達(dá)數(shù)據(jù)中上調(diào)和下調(diào)基因之間的這種相反變化趨勢,結(jié)合生物信息學(xué)的方法和生物學(xué)的理論,從以下幾個(gè)不同方面進(jìn)行深入系統(tǒng)的探討。其主要研究內(nèi)容和結(jié)果如下:
?。?)設(shè)計(jì)識(shí)別負(fù)相關(guān)模式的算法:
?、僭O(shè)計(jì)了基于形式概念分析技術(shù)的負(fù)相關(guān)雙向聚類算法(NCFCA
4、算法),通過與其他算法比較表明,NCFCA算法在平均平衡率,平均皮爾森相關(guān)系數(shù)和聚類得分方面均優(yōu)于其他算法,能更多地識(shí)別出數(shù)目平衡的負(fù)相關(guān)模式。
?、跒榱四芴幚磔^大的基因表達(dá)數(shù)據(jù),本文利用CPU的多核并行技術(shù),設(shè)計(jì)了基于形式概念分析技術(shù)的并行負(fù)相關(guān)雙向聚類算法(NCFCA2算法),與NCFCA算法比較,NCFCA2算法在運(yùn)行時(shí)間方面均大大優(yōu)于以前的NCFCA算法。
?。?)三個(gè)不同數(shù)據(jù)集中負(fù)相關(guān)模式及其保守性(不變性)研
5、究:
?、賹CFCA算法應(yīng)用于酵母菌細(xì)胞周期的alpha26,alpha30和alpha38三個(gè)時(shí)間過程的數(shù)據(jù)集,選取這三個(gè)數(shù)據(jù)集中的800個(gè)細(xì)胞周期調(diào)控基因通過分析處理之后發(fā)現(xiàn):微小染色體維持蛋白基因與核心組蛋白基因會(huì)形成負(fù)相關(guān)模式,而且這個(gè)負(fù)相關(guān)模式均發(fā)現(xiàn)于alpha26,alpha30和alpha38三個(gè)數(shù)據(jù)集。傳統(tǒng)的觀點(diǎn)認(rèn)為,負(fù)相關(guān)的兩組基因一般來說沒有功能上的相似性,然而將這兩組基因一起做基因集富集分析之后發(fā)現(xiàn),它們
6、表達(dá)相反的基因之間也具有顯著的功能相似性,這就表明參與同一生物學(xué)過程的兩組基因也可能具有相反的表達(dá)趨勢。將NCFCA算法應(yīng)用于酵母菌10個(gè)其它細(xì)胞周期過程的表達(dá)數(shù)據(jù)之后發(fā)現(xiàn),在這10個(gè)數(shù)據(jù)集中也發(fā)現(xiàn)微小染色體維持蛋白基因與核心組蛋白基因也能形成負(fù)相關(guān)模式。同時(shí)在最近出版的兩個(gè)高精度瓦片測序的基因數(shù)據(jù)集中也證實(shí)了這一觀點(diǎn)。這些發(fā)現(xiàn)表明這兩組基因形成的負(fù)相關(guān)模式可能是保守的。進(jìn)一步分析它們的調(diào)控關(guān)系表明:這兩組基因形成保守的負(fù)相關(guān)模式的主要
7、原因很可能是由Clb-CDK1激酶是通過一個(gè)共調(diào)控和一個(gè)負(fù)調(diào)控來實(shí)現(xiàn)的,Clb-CDK1是在細(xì)胞周期過程的不同時(shí)期上調(diào)或下調(diào)這兩組基因的表達(dá)。
?、趯CFCA2算法應(yīng)用于酵母菌的2010.Shapira04和GSE26169這兩個(gè)氧化應(yīng)激響應(yīng)數(shù)據(jù)集,從這兩個(gè)數(shù)據(jù)集中各自選取所有通路基因的表達(dá)數(shù)據(jù)進(jìn)行分析之后發(fā)現(xiàn):淀粉和蔗糖代謝通路中的部分基因和嘌呤代謝通路中的部分基因的表達(dá)曲線也是負(fù)相關(guān)的。也就是說,在環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)中兩組通
8、路的基因也會(huì)形成負(fù)相關(guān)模式。將NCFCA2算法應(yīng)用于酵母菌10個(gè)其它環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)集中分析之后發(fā)現(xiàn),這兩條通路中的部分基因也會(huì)形成負(fù)相關(guān)模式。這些發(fā)現(xiàn)表明這兩條通路基因之間的負(fù)相關(guān)模式可能是保守的。通過研究它們的生物學(xué)調(diào)控關(guān)系表明,這兩條通路形成保守的負(fù)相關(guān)模式的原因很可能是由雷帕霉素受體復(fù)合物1(TORC1)在蛋白酶體的輔助下是通過一個(gè)共調(diào)控和一個(gè)負(fù)調(diào)控來實(shí)現(xiàn)的。
?、蹖CFCA2算法應(yīng)用于酵母菌的熱休克響應(yīng)和氧化應(yīng)激響應(yīng)
9、的表達(dá)數(shù)據(jù)集,將這兩個(gè)數(shù)據(jù)集中基因的表達(dá)值按照方差由大到小排序,通過分別選取這兩個(gè)數(shù)據(jù)集中排名前1000的基因進(jìn)行分析之后,發(fā)現(xiàn)核糖體蛋白基因與熱休克響應(yīng)基因;核糖體蛋白基因與氧化應(yīng)激響應(yīng)基因的表達(dá)曲線均是負(fù)相關(guān)的。將NCFCA2算法應(yīng)用于酵母菌其它的環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)集中分析之后發(fā)現(xiàn),在這些數(shù)據(jù)集中核糖體蛋白基因和其它環(huán)境應(yīng)激響應(yīng)的基因也能形成負(fù)相關(guān)模式。這些發(fā)現(xiàn)表明這個(gè)負(fù)相關(guān)模式可能是保守的。進(jìn)一步研究它們的生物學(xué)調(diào)控關(guān)系表明,核糖體
10、蛋白基因與不同環(huán)境應(yīng)激響應(yīng)基因形成的負(fù)相關(guān)模式,很可能也是由雷帕霉素受體復(fù)合物1(TORC1)在蛋白酶體的輔助下也是通過一個(gè)共調(diào)控和一個(gè)負(fù)調(diào)控共同作用,調(diào)控核糖體蛋白基因與環(huán)境應(yīng)激響應(yīng)基因的表達(dá)來實(shí)現(xiàn)的。
綜合以上研究結(jié)果,表明NCFCA算法和NCFCA2算法能用較少的時(shí)間和空間花費(fèi),有效地識(shí)別基因表達(dá)數(shù)據(jù)中的負(fù)相關(guān)模式,特別是識(shí)別數(shù)目平衡的負(fù)相關(guān)模式。這些負(fù)相關(guān)模式經(jīng)過信息冗余過濾和基因集富集分析之后,發(fā)現(xiàn)只有少量負(fù)相關(guān)模式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 負(fù)相關(guān)序列的收斂性.pdf
- 負(fù)相關(guān)加權(quán)和的收斂性.pdf
- 變應(yīng)性鼻炎基因表達(dá)譜及其相關(guān)基因研究.pdf
- 家蠶免疫系統(tǒng)相關(guān)基因的鑒定及其誘導(dǎo)表達(dá)模式研究.pdf
- HRG-1基因的表達(dá)及其功能的相關(guān)性研究.pdf
- 中華絨螯蟹(Eriocheirsinensis)生殖相關(guān)基因的克隆及其表達(dá)模式研究.pdf
- 妊娠相關(guān)蛋白A的表達(dá)及其基因多態(tài)性與子癇前期的相關(guān)性研究.pdf
- 羅非魚性別分化相關(guān)基因縱向表達(dá)模式的研究.pdf
- 負(fù)相關(guān)模擬電路的演化模型研究.pdf
- 文昌魚miR-183和miR-216基因簇的表達(dá)模式和保守性研究.pdf
- 茶樹類胡蘿卜素累積及其相關(guān)基因表達(dá)模式研究.pdf
- 高粱抗絲黑穗病相關(guān)LRR-RLK基因克隆及其表達(dá)模式研究.pdf
- 政治聯(lián)系與企業(yè)稅負(fù)相關(guān)性分析.pdf
- 黑腹果蠅基因間與基因內(nèi)microRNA的表達(dá)及進(jìn)化保守性分析.pdf
- 負(fù)相關(guān)演化電路仿生容錯(cuò)機(jī)制研究.pdf
- 中華絨螯蟹的基因表達(dá)譜及生殖相關(guān)基因的克隆、表達(dá)模式研究.pdf
- ZNF217基因在卵巢漿液性囊腺癌的表達(dá)及其相關(guān)研究.pdf
- mba論文羅非魚性別分化相關(guān)基因縱向表達(dá)模式的研究pdf
- DYSTROPHIN基因的MLPA檢測及其相關(guān)基因UTROPHIN的表達(dá)調(diào)控研究.pdf
- 抗病相關(guān)基因轉(zhuǎn)化馬鈴薯及其表達(dá)的初步研究.pdf
評(píng)論
0/150
提交評(píng)論