2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩118頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、全基因組關(guān)聯(lián)分析的應(yīng)用到目前已經(jīng)有近10年時(shí)間,在解析人類復(fù)雜疾病及動(dòng)植物復(fù)雜性狀的調(diào)控機(jī)制等方面發(fā)揮了巨大作用。在農(nóng)業(yè)發(fā)展中,從首個(gè)基因組選擇模型的提出到現(xiàn)在,已經(jīng)有17年時(shí)間?;蚪M選擇已經(jīng)在動(dòng)物育種,尤其是奶牛育種中發(fā)揮出巨大的作用。隨著基因分型技術(shù)價(jià)格的降低,全基因組選擇技術(shù)也將在植物育種中占據(jù)重要位置。遺傳轉(zhuǎn)化技術(shù),基因組編輯技術(shù)以及全基因組選擇技術(shù)將是未來(lái)育種領(lǐng)域三大主要技術(shù)。
  基因組選擇將是精準(zhǔn)農(nóng)業(yè)必要的技術(shù)基礎(chǔ)

2、。全基因組關(guān)聯(lián)分析和基因組選擇技術(shù)在應(yīng)用過(guò)程中,也遇到一些問(wèn)題。隨著對(duì)復(fù)雜性狀的深入理解,目前的關(guān)聯(lián)分析模型具有一定的局限性。包括:復(fù)雜性狀由多基因控制,但現(xiàn)在常用的模型是單位點(diǎn)模型;對(duì)稀有等位基因的檢測(cè)能力不強(qiáng),通常直接忽略稀有等位基因;遺傳效應(yīng)通常包括加性效應(yīng),顯性效應(yīng)和上位互作效應(yīng)等,但目前常見的是加性效應(yīng)模型,包含非加性效應(yīng)的模型較少;上位效應(yīng)檢測(cè)能力較低,時(shí)間復(fù)雜度較高,用時(shí)較長(zhǎng);群體結(jié)構(gòu)和其他潛在未知的關(guān)聯(lián)會(huì)導(dǎo)致假陽(yáng)性;微效

3、多基因效應(yīng)和連鎖不平衡導(dǎo)致統(tǒng)計(jì)上P值膨脹;遺傳力丟失問(wèn)題等;在基因組選擇技術(shù)發(fā)展中,線性模型,貝葉斯類模型和機(jī)器學(xué)習(xí)模型是最主要的三類模型。線性模型中目前最常用基因組最佳無(wú)偏估計(jì)(gBLUP)模型,其他方法大多是基于此模型的優(yōu)化,但與該模型相比,很少在各種條件下都顯著的提高;針對(duì)不同的數(shù)據(jù),貝葉斯類模型的準(zhǔn)確率與線性模型可能會(huì)有一些差異,但很少觀察到準(zhǔn)確率明顯降低。但貝葉斯類模型的時(shí)間復(fù)雜度較高,對(duì)于百萬(wàn)級(jí)別的標(biāo)記,將會(huì)因其所需的時(shí)間過(guò)

4、長(zhǎng)而導(dǎo)致失去應(yīng)用的價(jià)值;機(jī)器學(xué)習(xí)類方法也具有同樣的問(wèn)題;在軟件方面,目前有基于R語(yǔ)言的各種軟件包,和基于Linux系統(tǒng)的命令行軟件,但是缺少能夠方便育種工作者使用的圖形化界面軟件。
  本研究的目標(biāo)在于:開發(fā)一種多位點(diǎn)關(guān)聯(lián)分析模型,提高加性模型的檢測(cè)能力并且降低模型的假陽(yáng)性率;并通過(guò)優(yōu)化算法,實(shí)現(xiàn)對(duì)加性效應(yīng)和上位互作效應(yīng)的聯(lián)合分析。使用R語(yǔ)言對(duì)該模型進(jìn)行編程,并將該R軟件包發(fā)布在公共平臺(tái);對(duì)基因組選擇準(zhǔn)確率偏差的研究。在研究中發(fā)現(xiàn)

5、,對(duì)于基因組選擇準(zhǔn)確率,不同的研究人員存在兩種不同的理解,而這種差異可能會(huì)產(chǎn)生一定的偏差,將對(duì)準(zhǔn)確率計(jì)算重新定義并比較它們之間的區(qū)別和可能產(chǎn)生的偏差;提供一種基因組選擇圖形化界面軟件。將根據(jù)現(xiàn)有的研究基礎(chǔ),使用JAVA語(yǔ)言開發(fā)一種進(jìn)行基因組選擇分析的圖形化軟件的同時(shí),再使用R語(yǔ)言重新編寫,提供對(duì)應(yīng)的R軟件包,以方便育種家及相關(guān)科研工作者使用。本研究以一個(gè)酵母F2群體為對(duì)象,對(duì)關(guān)聯(lián)分析模型進(jìn)行測(cè)試,進(jìn)而系統(tǒng)分析模型的表現(xiàn);并對(duì)一個(gè)由中美3

6、6個(gè)重組自交系(RILs)組成的玉米NAM群體的開花期相關(guān)表型進(jìn)行了分析等;利用擬南芥,玉米,小鼠和松樹四個(gè)物種的數(shù)據(jù)對(duì)基因組選擇準(zhǔn)確率的偏差進(jìn)行了研究。本研究的主要結(jié)果如下:
  1.一種新的多位點(diǎn)混合效應(yīng)關(guān)聯(lián)分析模型(HDGENE)。該模型首先利用逐步回歸對(duì)基因組進(jìn)行單位點(diǎn)檢測(cè),然后利用多位點(diǎn)混合效應(yīng)模型EM-Bayesian LASSO對(duì)顯著的位點(diǎn)進(jìn)行檢測(cè),從而可以控制假陽(yáng)性;EM-Bayesian LASSO模型依然顯著的

7、位點(diǎn),將作為協(xié)變量加入到逐步回歸模型中進(jìn)行迭代,該步驟可以提高分析的檢測(cè)能力。因此,HDGENE模型既可以提高檢測(cè)能力,也可以降低假陽(yáng)性。為了提高模型對(duì)大數(shù)據(jù)的處理能力,首先通過(guò)利用基因組的連鎖不平衡,對(duì)基因型數(shù)據(jù)進(jìn)行降維;其次,對(duì)逐步回歸模型進(jìn)行了算法優(yōu)化,降低算法運(yùn)行時(shí)間。優(yōu)化后的模型,可以實(shí)現(xiàn)全基因組兩位點(diǎn)上位互作分析。
  2.EM-Baysian LASSO模型的檢測(cè)能力。通過(guò)對(duì)復(fù)雜表型的模擬,在模擬的情形下,EM-Ba

8、ysian LASSO模型具有80.6%的檢測(cè)能力(Power);而且EM-Baysian LASSO模型對(duì)大于5%的位點(diǎn)具有較強(qiáng)的檢測(cè)能力,接近100%,標(biāo)記解釋的表型方差越低,檢測(cè)能力越差;同時(shí),發(fā)現(xiàn)EM-BLASSO模型對(duì)效應(yīng)值的估計(jì)是有偏的。
  3.HDGENE加性模型具有較高的Power。利用酵母F2群體模擬的表型分析發(fā)現(xiàn),HDGENE平均檢測(cè)Power達(dá)到71.9%;同時(shí)具有與EM-Bayesian LASSO模型相

9、同的特點(diǎn),對(duì)效應(yīng)較高的位點(diǎn)具有良好的檢測(cè)能力。但是位點(diǎn)解釋的表型方差越低,檢測(cè)的Power就越低。同時(shí),HDGENE加性模型的假陽(yáng)性率(FDR)較低,僅7.0%;且假陽(yáng)性位點(diǎn)解釋的表型方差低于1%。
  4.HDGENE加性模型與現(xiàn)有模型的QTCAT模型相比,QTCAT模型的Power為52.2%,明顯低于HDGENE模型,同時(shí)假陽(yáng)性率為8.8%,略高于HDGENE模型。
  5.HDGENE上位效應(yīng)模型具有較高的Power

10、。同樣利用酵母F2群體的進(jìn)行模擬,模擬數(shù)據(jù)分析表明,HDGENE上位效應(yīng)模型檢測(cè)的Power達(dá)到87.8%,高于R/QTL軟件包中互作模型的75.7%;但同時(shí)假陽(yáng)性率達(dá)到13.9%,高于R/QTL的3.2%。
  6.上位效應(yīng)對(duì)玉米的開花期有一定的貢獻(xiàn)。玉米NAM群體的開花期數(shù)據(jù)分析表明,雖然利用混合模型估計(jì)的遺傳力較低,但是利用HDGENE模型發(fā)現(xiàn)較多的互作,并且檢測(cè)到11對(duì)互作位點(diǎn),它們解釋的表型方差均在10%以上。
 

11、 7.基因組選擇準(zhǔn)確率的重新定義。根據(jù)交叉驗(yàn)證的特性,對(duì)重新定義了兩種準(zhǔn)確率,分別為Hold和Instant準(zhǔn)確率。并發(fā)現(xiàn)Hold及Instant準(zhǔn)確率都存在理論上的偏差,實(shí)際使用過(guò)程中,在一定條件下可以使用Instant準(zhǔn)確率;在特定條件下,為了避免較大的偏差,需要對(duì)Instant準(zhǔn)確率進(jìn)行校正。
  8.iGS軟件的開發(fā):基于JAVA語(yǔ)言開發(fā)了基因組選擇圖形化界面軟件;同時(shí)編寫了R軟件包。該軟件包括gBLUP,EM-Bayes

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論