版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、目前,隨著檢測(cè)全基因組的表達(dá)、甲基化、拷貝數(shù)等分子改變的高通量技術(shù)的發(fā)展,發(fā)現(xiàn)了大量的在癌組織中發(fā)生了表達(dá)、甲基化、拷貝數(shù)改變的基因,使得我們能夠更系統(tǒng)地分析癌癥的發(fā)病機(jī)理。在分析各種高通量組學(xué)數(shù)據(jù)時(shí),一個(gè)基本的任務(wù)是要預(yù)先進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,而各種標(biāo)準(zhǔn)化算法都假設(shè)疾病中差異基因的比例很小及差異上、下調(diào)的基因數(shù)目大致相等。由于基因可能在復(fù)雜疾病中發(fā)生了廣泛而相關(guān)的分子改變,這種廣泛采用的不可靠的標(biāo)準(zhǔn)化假設(shè)很可能會(huì)對(duì)篩選差異表達(dá)基因等下游
2、分析有重大的影響。因此,本論文全面分析了在主要數(shù)據(jù)庫(kù)中收集的關(guān)于各種癌型的基因表達(dá)、甲基化和拷貝數(shù)等高通量組學(xué)數(shù)據(jù),通過比較在癌癥與正常樣本中這些分子改變的分布差異,評(píng)價(jià)幾種主要的標(biāo)準(zhǔn)化方法,分析其影響生物學(xué)信號(hào)的偏倚程度。
首先,我們論證了基因在癌組織中廣泛差異表達(dá)的特性,而目前在基因表達(dá)譜實(shí)驗(yàn)中發(fā)現(xiàn)差異基因的低重復(fù)性現(xiàn)象實(shí)際上反映了癌相關(guān)基因廣泛差異表達(dá)的特征。我們以基因表達(dá)改變的方向作為測(cè)度來分析基因在癌癥樣本相對(duì)正常樣
3、本中的特定的上下調(diào)表達(dá)模式。結(jié)果顯示:對(duì)于在研究同種癌型的不同表達(dá)譜數(shù)據(jù)中識(shí)別的差異表達(dá)基因的改變方向是高度一致的,即基因在疾病樣本相對(duì)正常樣本的表達(dá)改變方向比較穩(wěn)定,具有特定的改變方向。然后,我們分析了癌相關(guān)高通量數(shù)據(jù)標(biāo)準(zhǔn)化方法的合理性。結(jié)果顯示:至少在癌癥研究中,將疾病組與正常組樣本一起標(biāo)準(zhǔn)化使得所有芯片的探針信號(hào)強(qiáng)度具有同樣的分布會(huì)使得篩選差異表達(dá)基因等后續(xù)分析產(chǎn)生嚴(yán)重的偏倚。在癌表達(dá)譜數(shù)據(jù)中包含大量上調(diào)表達(dá)的基因,采用這些傳統(tǒng)假
4、設(shè)的標(biāo)準(zhǔn)化方法會(huì)失查很多癌相關(guān)的上調(diào)差異表達(dá)基因并且產(chǎn)生很多假的下調(diào)差異表達(dá)基因。同時(shí),我們發(fā)現(xiàn)在關(guān)于同一癌型的不同的原始數(shù)據(jù)中篩選出的差異表達(dá)基因的改變方向高度一致,提示在原始數(shù)據(jù)中自然存在著有效的生物學(xué)信號(hào)。因此,發(fā)展新的統(tǒng)計(jì)方法提高統(tǒng)計(jì)效能去挖掘在原始數(shù)據(jù)中有效生物學(xué)信號(hào)是可能的。對(duì)癌甲基化譜和拷貝數(shù)譜也進(jìn)行了類似的研究,結(jié)果顯示:癌癥與正常樣本中的甲基化譜原始信號(hào)值的中值沒有顯著差異,采用標(biāo)準(zhǔn)化數(shù)據(jù)額外找到的差異甲基化基因的改變
5、方向可以在關(guān)于同種癌型的獨(dú)立數(shù)據(jù)集中顯著一致地呈現(xiàn),反映它們是有效的生物學(xué)信號(hào)。所以,可以采用標(biāo)準(zhǔn)化方法處理甲基化譜數(shù)據(jù),但需要去除在標(biāo)準(zhǔn)化數(shù)據(jù)及非標(biāo)準(zhǔn)化數(shù)據(jù)中甲基化改變方向不一致的基因。在癌拷貝數(shù)譜數(shù)據(jù)中,我們發(fā)現(xiàn)了與癌表達(dá)譜類似的現(xiàn)象,即在癌拷貝數(shù)譜中存在大量的拷貝數(shù)擴(kuò)增基因,提示在原始數(shù)據(jù)中提取癌相關(guān)生物學(xué)信號(hào)可能更為合理。最后,我們還分析了cDNA芯片數(shù)據(jù)的一個(gè)重要的預(yù)處理問題,即對(duì)應(yīng)同一條Unigene的多個(gè)探針的檢測(cè)值之間的
6、相關(guān)性問題。結(jié)果顯示:探針注釋數(shù)據(jù)更新后,重復(fù)檢測(cè)探針值之間的高相關(guān)比例顯著提高,而大部分負(fù)相關(guān)的重復(fù)探針檢測(cè)值沒有通過差異表達(dá)篩選,說明盡管存在探針檢測(cè)技術(shù)變異等因素,通過篩選差異表達(dá)基因還是能夠相當(dāng)可靠地捕捉與癌相關(guān)的生物學(xué)信號(hào)。因此,基于差異表達(dá)基因的后續(xù)分析(尤其是篩選富集差異基因的功能模塊)可以得到可靠的生物學(xué)結(jié)論。
本文系統(tǒng)地分析了在癌組織中基因表達(dá)、甲基化和拷貝數(shù)改變的系統(tǒng)性特征,并據(jù)此論證了目前通常采用的數(shù)據(jù)標(biāo)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于高通量數(shù)據(jù)篩選癌相關(guān)生物標(biāo)記的可重復(fù)性研究.pdf
- 基于高通量組學(xué)數(shù)據(jù)的癌癥驅(qū)動(dòng)基因和信號(hào)通路識(shí)別.pdf
- 基于高通量轉(zhuǎn)錄組數(shù)據(jù)的大菱鲆SNP標(biāo)記篩選及相關(guān)功能基因的研究.pdf
- 19500.高通量基因組數(shù)據(jù)的處理、分析與建模
- 數(shù)據(jù)標(biāo)準(zhǔn)化
- 基于高通量RNa-seq數(shù)據(jù)轉(zhuǎn)錄組拼接的算法研究.pdf
- 高通量ELISA檢測(cè)HBV系統(tǒng)化標(biāo)準(zhǔn)化研究及重慶地區(qū)HBV流行病學(xué)調(diào)查分析.pdf
- 高通量數(shù)據(jù)特征選擇算法研究.pdf
- 基于高通量數(shù)據(jù)對(duì)宮頸癌和肝癌標(biāo)志物的研究.pdf
- 基于高通量測(cè)序的微生物基因組學(xué)研究.pdf
- 基于高通量測(cè)序技術(shù)的全基因組甲基化研究.pdf
- 基于高通量測(cè)序半夏珠芽轉(zhuǎn)錄組研究.pdf
- 川牛膝全基因組高通量測(cè)序及初步數(shù)據(jù)分析.pdf
- 高通量組學(xué)方法在海綿共生微生物研究中的應(yīng)用.pdf
- 高通量測(cè)序數(shù)據(jù)存儲(chǔ)系統(tǒng)
- 高通量測(cè)序
- 基于高通量轉(zhuǎn)錄組測(cè)序的序列比對(duì)算法研究.pdf
- 高通量DNA甲基化數(shù)據(jù)的特征挖掘算法開發(fā)及分析.pdf
- 基于高通量測(cè)序分析預(yù)測(cè)羽扇豆醇與miRNA相關(guān)的抑癌路徑.pdf
- 聯(lián)合多種高通量表達(dá)譜數(shù)據(jù)分析篩選胃癌相關(guān)基因的研究.pdf
評(píng)論
0/150
提交評(píng)論