一種全基因組關(guān)聯(lián)分析模型的建立及在基因組選擇中的應(yīng)用.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：119 大?。?8.33MB 人氣指數(shù)：12 舉報 版權(quán)申訴

一種全基因組關(guān)聯(lián)分析模型的建立及在基因組選擇中的應(yīng)用.pdf_第1頁

已閱讀1頁，還剩118頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、全基因組關(guān)聯(lián)分析的應(yīng)用到目前已經(jīng)有近10年時間，在解析人類復(fù)雜疾病及動植物復(fù)雜性狀的調(diào)控機制等方面發(fā)揮了巨大作用。在農(nóng)業(yè)發(fā)展中，從首個基因組選擇模型的提出到現(xiàn)在，已經(jīng)有17年時間?；蚪M選擇已經(jīng)在動物育種，尤其是奶牛育種中發(fā)揮出巨大的作用。隨著基因分型技術(shù)價格的降低，全基因組選擇技術(shù)也將在植物育種中占據(jù)重要位置。遺傳轉(zhuǎn)化技術(shù)，基因組編輯技術(shù)以及全基因組選擇技術(shù)將是未來育種領(lǐng)域三大主要技術(shù)。
　　基因組選擇將是精準農(nóng)業(yè)必要的技術(shù)基礎(chǔ)

2、。全基因組關(guān)聯(lián)分析和基因組選擇技術(shù)在應(yīng)用過程中，也遇到一些問題。隨著對復(fù)雜性狀的深入理解，目前的關(guān)聯(lián)分析模型具有一定的局限性。包括:復(fù)雜性狀由多基因控制，但現(xiàn)在常用的模型是單位點模型；對稀有等位基因的檢測能力不強，通常直接忽略稀有等位基因；遺傳效應(yīng)通常包括加性效應(yīng)，顯性效應(yīng)和上位互作效應(yīng)等，但目前常見的是加性效應(yīng)模型，包含非加性效應(yīng)的模型較少；上位效應(yīng)檢測能力較低，時間復(fù)雜度較高，用時較長；群體結(jié)構(gòu)和其他潛在未知的關(guān)聯(lián)會導(dǎo)致假陽性；微效

3、多基因效應(yīng)和連鎖不平衡導(dǎo)致統(tǒng)計上P值膨脹；遺傳力丟失問題等；在基因組選擇技術(shù)發(fā)展中，線性模型，貝葉斯類模型和機器學(xué)習(xí)模型是最主要的三類模型。線性模型中目前最常用基因組最佳無偏估計(gBLUP)模型，其他方法大多是基于此模型的優(yōu)化，但與該模型相比，很少在各種條件下都顯著的提高；針對不同的數(shù)據(jù)，貝葉斯類模型的準確率與線性模型可能會有一些差異，但很少觀察到準確率明顯降低。但貝葉斯類模型的時間復(fù)雜度較高，對于百萬級別的標記，將會因其所需的時間過

4、長而導(dǎo)致失去應(yīng)用的價值;機器學(xué)習(xí)類方法也具有同樣的問題；在軟件方面，目前有基于R語言的各種軟件包，和基于Linux系統(tǒng)的命令行軟件，但是缺少能夠方便育種工作者使用的圖形化界面軟件。
　　本研究的目標在于:開發(fā)一種多位點關(guān)聯(lián)分析模型，提高加性模型的檢測能力并且降低模型的假陽性率；并通過優(yōu)化算法，實現(xiàn)對加性效應(yīng)和上位互作效應(yīng)的聯(lián)合分析。使用R語言對該模型進行編程，并將該R軟件包發(fā)布在公共平臺；對基因組選擇準確率偏差的研究。在研究中發(fā)現(xiàn)

5、，對于基因組選擇準確率，不同的研究人員存在兩種不同的理解，而這種差異可能會產(chǎn)生一定的偏差，將對準確率計算重新定義并比較它們之間的區(qū)別和可能產(chǎn)生的偏差；提供一種基因組選擇圖形化界面軟件。將根據(jù)現(xiàn)有的研究基礎(chǔ)，使用JAVA語言開發(fā)一種進行基因組選擇分析的圖形化軟件的同時，再使用R語言重新編寫，提供對應(yīng)的R軟件包，以方便育種家及相關(guān)科研工作者使用。本研究以一個酵母F2群體為對象，對關(guān)聯(lián)分析模型進行測試，進而系統(tǒng)分析模型的表現(xiàn)；并對一個由中美3

6、6個重組自交系(RILs)組成的玉米NAM群體的開花期相關(guān)表型進行了分析等；利用擬南芥，玉米，小鼠和松樹四個物種的數(shù)據(jù)對基因組選擇準確率的偏差進行了研究。本研究的主要結(jié)果如下:
　　1.一種新的多位點混合效應(yīng)關(guān)聯(lián)分析模型(HDGENE)。該模型首先利用逐步回歸對基因組進行單位點檢測，然后利用多位點混合效應(yīng)模型EM-Bayesian LASSO對顯著的位點進行檢測，從而可以控制假陽性；EM-Bayesian LASSO模型依然顯著的

7、位點，將作為協(xié)變量加入到逐步回歸模型中進行迭代，該步驟可以提高分析的檢測能力。因此，HDGENE模型既可以提高檢測能力，也可以降低假陽性。為了提高模型對大數(shù)據(jù)的處理能力，首先通過利用基因組的連鎖不平衡，對基因型數(shù)據(jù)進行降維;其次，對逐步回歸模型進行了算法優(yōu)化，降低算法運行時間。優(yōu)化后的模型，可以實現(xiàn)全基因組兩位點上位互作分析。
　　2.EM-Baysian LASSO模型的檢測能力。通過對復(fù)雜表型的模擬，在模擬的情形下，EM-Ba

8、ysian LASSO模型具有80.6％的檢測能力(Power);而且EM-Baysian LASSO模型對大于5％的位點具有較強的檢測能力，接近100％，標記解釋的表型方差越低，檢測能力越差;同時，發(fā)現(xiàn)EM-BLASSO模型對效應(yīng)值的估計是有偏的。
　　3.HDGENE加性模型具有較高的Power。利用酵母F2群體模擬的表型分析發(fā)現(xiàn)，HDGENE平均檢測Power達到71.9％;同時具有與EM-Bayesian LASSO模型相

9、同的特點，對效應(yīng)較高的位點具有良好的檢測能力。但是位點解釋的表型方差越低，檢測的Power就越低。同時，HDGENE加性模型的假陽性率(FDR)較低，僅7.0％;且假陽性位點解釋的表型方差低于1％。
　　4.HDGENE加性模型與現(xiàn)有模型的QTCAT模型相比，QTCAT模型的Power為52.2％，明顯低于HDGENE模型，同時假陽性率為8.8％，略高于HDGENE模型。
　　5.HDGENE上位效應(yīng)模型具有較高的Power

10、。同樣利用酵母F2群體的進行模擬，模擬數(shù)據(jù)分析表明，HDGENE上位效應(yīng)模型檢測的Power達到87.8％，高于R/QTL軟件包中互作模型的75.7％;但同時假陽性率達到13.9％，高于R/QTL的3.2％。
　　6.上位效應(yīng)對玉米的開花期有一定的貢獻。玉米NAM群體的開花期數(shù)據(jù)分析表明，雖然利用混合模型估計的遺傳力較低，但是利用HDGENE模型發(fā)現(xiàn)較多的互作，并且檢測到11對互作位點，它們解釋的表型方差均在10％以上。
　

11、　7.基因組選擇準確率的重新定義。根據(jù)交叉驗證的特性，對重新定義了兩種準確率，分別為Hold和Instant準確率。并發(fā)現(xiàn)Hold及Instant準確率都存在理論上的偏差，實際使用過程中，在一定條件下可以使用Instant準確率;在特定條件下，為了避免較大的偏差，需要對Instant準確率進行校正。
　　8.iGS軟件的開發(fā):基于JAVA語言開發(fā)了基因組選擇圖形化界面軟件;同時編寫了R軟件包。該軟件包括gBLUP，EM-Bayes

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

一種全基因組關(guān)聯(lián)分析模型的建立及在基因組選擇中的應(yīng)用.pdf

文檔簡介

溫馨提示

最新文檔

評論

一種全基因組關(guān)聯(lián)分析模型的建立及在基因組選擇中的應(yīng)用.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載