化學(xué)信息學(xué)新算法及在化學(xué)、生物與食品科學(xué)中的應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩242頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來,隨著信息科學(xué)、計算機(jī)科學(xué)與互聯(lián)網(wǎng)的高速發(fā)展,一種新的交叉學(xué)科-化學(xué)信息學(xué)(Chemoinformatics)也迅速成長起來了?;瘜W(xué)信息學(xué)是一門利用信息學(xué)的方法來解決化學(xué)的問題,同時得到有關(guān)化學(xué)本質(zhì)規(guī)律的的學(xué)科。化學(xué)信息學(xué)的研究范圍十分廣泛,內(nèi)容豐富,例如化學(xué)試驗(yàn)設(shè)計與優(yōu)化、定量校正理論、分析信號處理、化學(xué)模式識別、模型與參數(shù)估計、人工智能等?;瘜W(xué)信息學(xué)產(chǎn)生于科學(xué)家們對化學(xué)知識規(guī)律的不斷需要的過程中。 化合物結(jié)構(gòu)與性質(zhì)/活

2、性定量關(guān)系(quantitative structure-property/activity relationship,QSPR/QSAR)是化學(xué)信息學(xué)研究中的一個重要應(yīng)用分支。該方法是指將化合物的結(jié)構(gòu)參數(shù)同其生物活性數(shù)據(jù)以一定的數(shù)學(xué)模型相聯(lián)系起來的定量關(guān)系。QSPR/QSAR的研究最初應(yīng)用于生物領(lǐng)域是為了適應(yīng)合理設(shè)計生物活性分子的需要而發(fā)展起來的。由于計算機(jī)技術(shù)的發(fā)展和應(yīng)用,QSPR/QSAR的研究提高到了一個新的水平,且日趨成熟,其

3、應(yīng)用范圍也迅速擴(kuò)大,研究涉及生物,化學(xué),藥物科學(xué),以及食品科學(xué)等諸多學(xué)科。人們期望用一個成功的數(shù)學(xué)模型,能從分子水平上理解其微觀結(jié)構(gòu)同其宏觀性質(zhì)/活性之間的關(guān)系,根據(jù)已有的知識,探求化合物性質(zhì)/活性與結(jié)構(gòu)的相互作用規(guī)律,從而推論呈現(xiàn)化合物某些性質(zhì)的影響因素,然后為設(shè)計,篩選或預(yù)測具有人們期望性質(zhì)的化合物提供信息。 化學(xué)信息學(xué)的發(fā)展為化學(xué)各分支學(xué)科的發(fā)展提供了多種解決問題的新思路,新方法。本學(xué)位論文主要對化學(xué)信息學(xué)研究中的一些新算

4、法進(jìn)行了探討,并把這些新算法成功應(yīng)用于QSAR/QSPR研究領(lǐng)域中。該論文共包括五章節(jié)內(nèi)容,每一個章節(jié)的具體內(nèi)容如下所示: 第一章:簡述了化學(xué)信息學(xué)的基本概念和研究現(xiàn)狀,以及多種化學(xué)信息學(xué)算法,也詳細(xì)講述了化學(xué)信息學(xué)研究的分支之一--QSAR,包括QSAR演變歷史,基本原理以及實(shí)現(xiàn)的步驟等等。 第二章:主要討論了Quantitative structure-retention relationship(QSRR)方法在多

5、肽色譜保留行為預(yù)測的應(yīng)用研究。具體內(nèi)容如下:(1)基于線性和非線性建模方法對反相液相色譜(RPIC)的101種多肽保留時間進(jìn)行了定量結(jié)構(gòu)保留關(guān)系建模研究。最佳多元線性回歸(BMIR)方法用來選擇與保留行為最為密切的分子描述符,并建立線性模型。另外兩種非線性回歸方法(徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN)和投影尋蹤回歸(PPR))用來構(gòu)建非線性模型。RBFNN和PPR模型的訓(xùn)練集的相關(guān)系數(shù)(R2)分別為0.9787和0.9881;均方根誤差(R

6、MSE)為0.5666和0.4207。結(jié)果表明,RBF神經(jīng)網(wǎng)絡(luò)和投影尋蹤回歸將是蛋白質(zhì)組研究中一種簡單且有效的工具,并有望應(yīng)用于其他類似的研究領(lǐng)域。(2)新穎的化學(xué)信息學(xué)方法-局部懶惰回歸(LLR)首次應(yīng)用于預(yù)測278個多肽在固定金屬親和色譜(鎳柱)的保留行為研究。該工作分別用BMLR,PPR和LLR三種方法建立線性和非線性QSRR模型。最佳的LLR模型的訓(xùn)練集和測試集的R2分別為0.9446和0.9252。該工作證明新穎機(jī)器學(xué)習(xí)算法L

7、LR是一個非常有前途的研究工具,它可用于色譜保留行為研究領(lǐng)域,為協(xié)助設(shè)計和分離純化蛋白質(zhì)和多肽發(fā)揮一定的作用。 第三章主要描述了QSAR方法在農(nóng)業(yè)和食品科學(xué)領(lǐng)域的應(yīng)用研究,具體內(nèi)容如下:(1)三種機(jī)器學(xué)習(xí)方法:遺傳算法.多元線性回歸(GA-MLR),最小二乘支持向量機(jī)(LS-SVM),PPR用于100個稻瘟病抑制劑噻唑啉衍生物的殺菌活性研究。線性模型GA-MLR和非線性模型LS-SVM和PPR都得到了良好的預(yù)測結(jié)果,但非線性模型

8、提供了更加精確的預(yù)測能力。結(jié)果表明,非線性LS-SVM和PPR方法可以更加準(zhǔn)確地模擬噻唑啉分子結(jié)構(gòu)與殺菌活性之間的關(guān)系,能夠成為研究稻瘟病抑制劑良好的建模工具。此外,這項研究為稻瘟病抑制劑的設(shè)計和開發(fā)提供了一種新的,簡單而且有效的辦法,同時得到的與其密切相關(guān)的分子結(jié)構(gòu)信息。(2)運(yùn)用定量結(jié)構(gòu)保留關(guān)系方法對藏紅花內(nèi)43種芳香組分的SPME-GC-MS保留時間進(jìn)行了預(yù)測。應(yīng)用最佳多元線性回歸(BMIR)和投影尋蹤回歸(PPR)方法分別建立了

9、線性和非線性模型,兩種方法均得到了較好的結(jié)果:線性模型的訓(xùn)練集和測試集的相關(guān)系數(shù)(R2)分別為0.9434和0.8725,非線性模型則給出了較好的預(yù)測結(jié)果分別為0.9806和0.9456。通過對模型的穩(wěn)定性和預(yù)測能力的比較,可以看出非線性PPR方法可以較好的應(yīng)用到SPME-GC-MS保留行為研究領(lǐng)域內(nèi),同時該工作又可以為其他植物和中草藥的分離研究提供一種簡便有效的方法。 第四章主要討論了定量構(gòu)效關(guān)系在生命科學(xué)和醫(yī)藥研究領(lǐng)域內(nèi)的應(yīng)

10、用,主要有以下幾部分組成:(1)利用QSRR方法對55種藥物在固相人工膜色譜內(nèi)的保留指數(shù)進(jìn)行了線性和非線性建模研究。在該工作中,線性BMLR方法被用來選取與保留指數(shù)最為相關(guān)的參數(shù),同時建立線性回歸模型;利用選取的描述符,應(yīng)用PPR和LLR方法來建立更加準(zhǔn)確的預(yù)測模型。通過模型對比,我們發(fā)現(xiàn)LLR作為一種新的建模方法,體現(xiàn)出較完美的預(yù)測能力,其訓(xùn)練集和測試集的預(yù)測結(jié)果為:復(fù)相關(guān)系數(shù)(R2),0.9540,0.9305;均方根誤差(RMSE

11、),0.2418,0.3949。結(jié)果顯示,新型LLR建模方法在QSRR方法研究中表現(xiàn)出了較好的預(yù)測能力,同時該方法定會成功的應(yīng)用于其它類似的色譜研究領(lǐng)域內(nèi)。(2)利用線性和非線性建模方法研究了80個N-羥基-a-苯磺酰乙酰胺(N-hydroxy-a-phenylsulfonylacetamide derivatives,HPSAs)衍生物對三種類型的基質(zhì)金屬蛋白酶的抑制活性。其中線性BMLR方法用來選取關(guān)鍵的結(jié)構(gòu)參數(shù),同時建立線性模型對

12、所選化合物的抑制活性進(jìn)行了預(yù)測;然后以全局格式搜索PPR方法利用選取的參數(shù)建立非線性回歸模型。最終,線性和非線性模型均能提供較為滿意的預(yù)測結(jié)果。在該工作中,非線性PPR方法首次與格式搜索(GS)方法相結(jié)合并成功應(yīng)用于對HPSAs的抑制活性的建模研究,得到了令人滿意的預(yù)測結(jié)果。該方法的成功為其他模型參數(shù)的優(yōu)化與選取提供了一種捷徑。(3)利用線性回歸方法和非線性回歸方法-格式搜索支持向量機(jī)(GS-SVM)和PPR方法對MT3褪黑激素結(jié)合位點(diǎn)

13、的親和性進(jìn)行了研究。在該工作中,遺傳算法被用來選取與研究對象最為相關(guān)的結(jié)構(gòu)參數(shù),并建立線性回歸模型對MT3褪黑激素結(jié)合位點(diǎn)的親和性進(jìn)行預(yù)測;利用選取的五個結(jié)構(gòu)變量,采用非線性回歸方法GS-SVM和PPR方法建立更加準(zhǔn)確的模型。通過模型對比,我們發(fā)現(xiàn)非線性PPR方法能夠?qū)T3褪黑激素結(jié)合位點(diǎn)的親和性具有比較準(zhǔn)確的預(yù)測能力。該方法的建立,為設(shè)計和開發(fā)新型MT3褪黑激素的新型配體提供了一種新型的研究方法。 第五章:QSAR方法在化學(xué)

14、感應(yīng)系統(tǒng)相對靈敏度的預(yù)測研究。在本章中,BMLR,SVM和LLR三種方法用來完成64種VOCs的氣味檢測閥值(ODTs)和鼻腔辛辣味閥值(NPTs)相對敏感性的QSAR建模研究,所得的預(yù)測結(jié)果和相應(yīng)的實(shí)驗(yàn)數(shù)據(jù)基本吻合。相比之下,LLR方法能夠獲得更好的預(yù)測能力,因此,它在QSAR研究中是一種有效的機(jī)器學(xué)習(xí)算法。此外,本研究還確定了一些重要的分子結(jié)構(gòu)信息,它們與VOC的相對敏感性密切相關(guān)。這些信息可以用來選擇或制造一些新型的化學(xué)傳感器,同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論