2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著儀器和分析技術(shù)快速發(fā)展,蛋白質(zhì)組學(xué)有了新的進展,并成為最重要的生命科學(xué)領(lǐng)域之一,其實驗數(shù)據(jù)龐大,要求高通量計算來提高多肽鑒定得分,從而提高蛋白鑒定準確度。而液相色譜中多肽的保留時間信息始終沒有得到很好的利用,保留時間是色譜分析中重要的參數(shù),如果能夠更好地利用此參數(shù)可以提高多肽鑒定質(zhì)量,從而提高蛋白質(zhì)的鑒定可靠性。本文試圖利用這些信息抓住多肽保留行為的特點,運用化學(xué)計量學(xué),化學(xué)信息學(xué)中常用的方法PLS,KPLS,SVR等建立多肽保留時

2、間的QSAR模型,提高多肽鑒定質(zhì)量,從而提高蛋白質(zhì)鑒定的數(shù)量和質(zhì)量。 本文研究的對象多肽與其他化合物不同,多肽是由20種氨基酸組成,反映它們結(jié)構(gòu)的數(shù)據(jù)目前并沒有直接顯示,許多學(xué)者都是假設(shè)多肽的各種物化性質(zhì)是通過組成它們的氨基酸的性質(zhì)加和來反映的。本文以文獻中搜集到的3個數(shù)據(jù)集為研究對象逐級深入地研究多肽結(jié)構(gòu)和保留時間的關(guān)系,并提出了變量優(yōu)化的方法和新的局部變量,創(chuàng)造性地以局部變量結(jié)合全局變量建立QSAR模型,為QSAR的研究開

3、辟了新的研究方向,并建立了共識模型,得到0.96以上的相關(guān)性系數(shù),遠遠高于文獻值。 具體研究步驟如下:首先大規(guī)模的搜集20種氨基酸的物化性質(zhì),以及多肽研究中新產(chǎn)生的各種組合變量。以數(shù)據(jù)集1——復(fù)旦大學(xué)張祥民實驗室所得136個多肽為研究對象,通過變量篩選后運用PLS,KPLS,SVR對其建模預(yù)報。同時因為單個氨基酸的保留時間來自文獻,與136個多肽的保留時間的實驗條件不同,所以剔除了這個變量再次建模預(yù)報,并運用共識模型預(yù)報所得的

4、相關(guān)性系數(shù)達到0.83優(yōu)于文獻值0.81。但這個結(jié)果遠遠沒有達到本文的要求,故希望尋找新的更多的多肽數(shù)據(jù)集,尋找潛在的新的變量,特別是嘗試局部變量在多肽結(jié)構(gòu)與保留時間關(guān)系中的應(yīng)用。 接著以數(shù)據(jù)集2——346個多肽為研究對象,提出了與位置有關(guān)的變量和與性質(zhì)強度有關(guān)的變量,利用PLS,KPLS,SVR,共識模型等方法建模預(yù)報,所得相關(guān)性系數(shù)0.96以上由于文獻所得的0.92。 最后以數(shù)據(jù)集3——834個多肽為驗證對象,用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論