版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、真核細(xì)胞中,基因表達(dá)精準(zhǔn)的時(shí)間和空間調(diào)控對(duì)于不同生物學(xué)進(jìn)程尤為關(guān)鍵。其中,眾多的DNA反應(yīng)活動(dòng)受到不同順式調(diào)控元件的協(xié)同調(diào)控,如轉(zhuǎn)錄啟動(dòng)子、增強(qiáng)子和絕緣子等。由于染色質(zhì)折疊,空間染色質(zhì)結(jié)構(gòu)使得增強(qiáng)子能夠在三維空間中作用于距離自身數(shù)十甚至上百Kb堿基的靶啟動(dòng)子并調(diào)控相關(guān)基因的表達(dá)。增強(qiáng)子-啟動(dòng)子相互作用在組織特異性基因表達(dá)調(diào)控中起關(guān)鍵作用并可能導(dǎo)致人類相關(guān)疾病的發(fā)生。近年來(lái),大量高通量染色體構(gòu)象捕獲技術(shù)的發(fā)展使人們深入研究這些相互作用成為
2、可能,比如:染色體構(gòu)象捕獲(3C),4C(circular3C),5C(3C-carboncopy),Hi-C(3C variant)和ChIA-PET。與此同時(shí),隨著各種高通量測(cè)序技術(shù)的發(fā)展,各個(gè)實(shí)驗(yàn)平臺(tái)產(chǎn)生了大量基因組信號(hào)的深測(cè)序文件,這些組學(xué)數(shù)據(jù)使人們?cè)诓煌幕蚪M范圍內(nèi)研究遠(yuǎn)程相互作用和不同類基因組信號(hào)之間的調(diào)控關(guān)系成為可能。
本文開發(fā)了新的計(jì)算方法并用來(lái)識(shí)別人類四個(gè)細(xì)胞系GM12878,H1-hESC,HeLa-S3
3、和K562中遠(yuǎn)程增強(qiáng)子-啟動(dòng)子相互作用。我們不僅發(fā)現(xiàn)了許多潛在的影響遠(yuǎn)程互作用識(shí)別的重要基因組信號(hào),還分析了它們的位置,分布,關(guān)聯(lián)等屬性。最后,我們通過(guò)多種模型研究了組蛋白修飾,轉(zhuǎn)錄因子,增強(qiáng)子RNA,DNA甲基化等多種基因組信號(hào)與遠(yuǎn)端增強(qiáng)子靶基因的表達(dá)調(diào)控關(guān)系,并在遠(yuǎn)端增強(qiáng)子調(diào)控靶基因的機(jī)制中發(fā)現(xiàn)了組蛋白修飾,轉(zhuǎn)錄因子等不同類基因組信號(hào)對(duì)應(yīng)不同的調(diào)控特點(diǎn)。論文主要的研究?jī)?nèi)容概括如下:
一、基于前人構(gòu)建的5C技術(shù)數(shù)據(jù)庫(kù),我們從
4、不同類別的信號(hào)中提取增強(qiáng)子,啟動(dòng)子,loop區(qū)域的對(duì)應(yīng)特征,比如轉(zhuǎn)錄因子,組蛋白修飾,DNA甲基化,增強(qiáng)子RNA,核小體位置,染色質(zhì)狀態(tài),拓?fù)潢P(guān)聯(lián)域等等。然后組合上述特征,提出BRCFS特征選擇方法和隨機(jī)森林分類器在人類四個(gè)細(xì)胞系中預(yù)測(cè)遠(yuǎn)程增強(qiáng)子-啟動(dòng)子相互作用。和Roy等的結(jié)果比較,我們的10折交叉檢驗(yàn)AUPR精度提高了11%-16%,獨(dú)立檢驗(yàn)的AUPR精度提高了4%-8%。通過(guò)分析識(shí)別中的特征重要性,我們發(fā)現(xiàn)了很多潛在特征的重要作用
5、,比如:增強(qiáng)子RNA,核小體位置等。并且我們發(fā)現(xiàn)loop區(qū)域的特征對(duì)遠(yuǎn)程互作用的識(shí)別起著很大的作用;另外,不同類信號(hào)對(duì)于遠(yuǎn)程互作用的識(shí)別具有調(diào)控區(qū)域特異性和細(xì)胞系特異性。最后我們發(fā)現(xiàn)這些重要的特征在正負(fù)集樣本中有很大的分布差異。
二、考慮到遠(yuǎn)程增強(qiáng)子-啟動(dòng)子相互作用受到不同基因組信號(hào),序列元件以及DNA空間結(jié)構(gòu)等多方面協(xié)同作用;我們整合轉(zhuǎn)錄因子,組蛋白修飾,DNA甲基化,增強(qiáng)子RNA,核小體位置,DNA結(jié)構(gòu)屬性,轉(zhuǎn)錄因子結(jié)合模
6、體等信號(hào)特征,開發(fā)了一種更加高效的方法去預(yù)測(cè)增強(qiáng)子-啟動(dòng)子相互作用。基于增強(qiáng)子,啟動(dòng)子,loop區(qū)域的組合特征,我們使用隨機(jī)森林和梯度提升算法在人類細(xì)胞系中對(duì)增強(qiáng)子-啟動(dòng)子相互作用進(jìn)行了有效的預(yù)測(cè)?;谕瑯拥臄?shù)據(jù)庫(kù),與Roy等的結(jié)果比較,我們?cè)谕粋€(gè)細(xì)胞系中10折交叉檢驗(yàn)結(jié)果提高了15%-24%;在新的細(xì)胞系中獨(dú)立檢驗(yàn)的結(jié)果提高了9%-14%。期間,我們綜合學(xué)習(xí)了不同類型重要特征的貢獻(xiàn)特點(diǎn),并進(jìn)一步發(fā)現(xiàn)了DNA結(jié)構(gòu)屬性,轉(zhuǎn)錄因子結(jié)合模體
7、對(duì)于遠(yuǎn)程相互作用識(shí)別的重要貢獻(xiàn)。我們對(duì)重要的基因組信號(hào)特征做了偏相關(guān)網(wǎng)絡(luò)模型分析,并發(fā)現(xiàn)了它們之間重要的關(guān)聯(lián)屬性。
三、在人類四個(gè)細(xì)胞系中,我們使用多種回歸模型研究了增強(qiáng)子靶基因表達(dá)水平與不同基因組信號(hào)的關(guān)系,這些信號(hào)包括11種組蛋白修飾,大于120種轉(zhuǎn)錄因子,染色質(zhì)可及性,增強(qiáng)子RNA,DNA甲基化和核小體位置。通過(guò)結(jié)果分析,我們發(fā)現(xiàn)基因表達(dá)的預(yù)測(cè)值和觀測(cè)值之間有很強(qiáng)的關(guān)聯(lián)性。然而,有增強(qiáng)子調(diào)控的基因樣本集的關(guān)聯(lián)系數(shù)比無(wú)調(diào)控
8、的基因樣本集要高很多,說(shuō)明遠(yuǎn)程增強(qiáng)子會(huì)協(xié)同多類基因組信號(hào)促進(jìn)相關(guān)基因的表達(dá)。
四、通過(guò)分析不同信號(hào)對(duì)遠(yuǎn)端增強(qiáng)子靶基因表達(dá)水平的貢獻(xiàn)能力,我們發(fā)現(xiàn)遠(yuǎn)端增強(qiáng)子調(diào)控的基因中,轉(zhuǎn)錄因子在增強(qiáng)子和啟動(dòng)子區(qū)域?qū)虮磉_(dá)水平具有較強(qiáng)的影響;而組蛋白修飾在啟動(dòng)子和loop調(diào)控區(qū)域?qū)虮磉_(dá)水平具有較強(qiáng)的影響。對(duì)比同一個(gè)細(xì)胞系正負(fù)數(shù)據(jù)集中不同信號(hào)特征的重要性分值變化,我們發(fā)現(xiàn)很多組蛋白修飾和部分特異性的轉(zhuǎn)錄因子發(fā)生了很大的變化,說(shuō)明這些特征協(xié)同
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人類啟動(dòng)子識(shí)別算法研究.pdf
- 攜帶前列腺特異性膜抗原(PSMA)啟動(dòng)子-增強(qiáng)子的重組質(zhì)粒構(gòu)建及啟動(dòng)子-增強(qiáng)子調(diào)控活性的篩選.pdf
- 生物信息學(xué)方法研究CTCF在基因組拓?fù)浣Y(jié)構(gòu)和增強(qiáng)子與啟動(dòng)子相互作用中的功能.pdf
- 人類RNA聚合酶Ⅱ啟動(dòng)子識(shí)別研究.pdf
- 多細(xì)胞系選擇性啟動(dòng)子的預(yù)測(cè)與分析.pdf
- pre-B細(xì)胞中CTCF介導(dǎo)沉默子Sis和增強(qiáng)子Ei相互作用并抑制VJ重排.pdf
- 植物啟動(dòng)子識(shí)別算法研究.pdf
- hMAM基因啟動(dòng)子與增強(qiáng)子調(diào)控自殺基因HSV-TK靶向殺傷乳腺癌細(xì)胞.pdf
- 基于隨機(jī)森林的外顯子剪接增強(qiáng)子識(shí)別.pdf
- PSMA增強(qiáng)子-啟動(dòng)子驅(qū)動(dòng)shRNA靶向干擾核干因子治療前列腺癌的研究.pdf
- 真核啟動(dòng)子識(shí)別算法研究
- 馬鈴薯增強(qiáng)子捕獲系的創(chuàng)建及鑒定.pdf
- 孤立子相互作用的研究.pdf
- 真核啟動(dòng)子識(shí)別算法研究.pdf
- AtMYB2轉(zhuǎn)錄因子與CMO基因啟動(dòng)子相互作用的研究.pdf
- 基于深度學(xué)習(xí)的增強(qiáng)子調(diào)控序列識(shí)別研究.pdf
- 輻射后HepG2細(xì)胞IER5與Cdc25B啟動(dòng)子的相互作用.pdf
- SV40增強(qiáng)子修飾的hTERT核心啟動(dòng)子靶向轉(zhuǎn)錄熒光素酶載體的構(gòu)建和鑒定.pdf
- 前列腺特異性抗原啟動(dòng)子-增強(qiáng)子重組質(zhì)粒篩選及特異性的體外鑒定.pdf
- 31156.atgt3b轉(zhuǎn)錄因子與cmo、badh基因啟動(dòng)子相互作用分析
評(píng)論
0/150
提交評(píng)論