版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來(lái),隨著信息科學(xué)、計(jì)算機(jī)科學(xué)與互聯(lián)網(wǎng)的高速發(fā)展,一種新的交叉學(xué)科-化學(xué)信息學(xué)(Chemoinformatics)也迅速成長(zhǎng)起來(lái)了?;瘜W(xué)信息學(xué)是一門(mén)利用信息學(xué)的方法來(lái)解決化學(xué)的問(wèn)題,同時(shí)得到有關(guān)化學(xué)本質(zhì)規(guī)律的的學(xué)科?;瘜W(xué)信息學(xué)的研究范圍十分廣泛,內(nèi)容豐富,例如化學(xué)試驗(yàn)設(shè)計(jì)與優(yōu)化、定量校正理論、分析信號(hào)處理、化學(xué)模式識(shí)別、模型與參數(shù)估計(jì)、人工智能等?;瘜W(xué)信息學(xué)產(chǎn)生于科學(xué)家們對(duì)化學(xué)知識(shí)規(guī)律的不斷需要的過(guò)程中。 化合物結(jié)構(gòu)與性質(zhì)/活
2、性定量關(guān)系(quantitative structure-property/activity relationship,QSPR/QSAR)是化學(xué)信息學(xué)研究中的一個(gè)重要應(yīng)用分支。該方法是指將化合物的結(jié)構(gòu)參數(shù)同其生物活性數(shù)據(jù)以一定的數(shù)學(xué)模型相聯(lián)系起來(lái)的定量關(guān)系。QSPR/QSAR的研究最初應(yīng)用于生物領(lǐng)域是為了適應(yīng)合理設(shè)計(jì)生物活性分子的需要而發(fā)展起來(lái)的。由于計(jì)算機(jī)技術(shù)的發(fā)展和應(yīng)用,QSPR/QSAR的研究提高到了一個(gè)新的水平,且日趨成熟,其
3、應(yīng)用范圍也迅速擴(kuò)大,研究涉及生物,化學(xué),藥物科學(xué),以及食品科學(xué)等諸多學(xué)科。人們期望用一個(gè)成功的數(shù)學(xué)模型,能從分子水平上理解其微觀結(jié)構(gòu)同其宏觀性質(zhì)/活性之間的關(guān)系,根據(jù)已有的知識(shí),探求化合物性質(zhì)/活性與結(jié)構(gòu)的相互作用規(guī)律,從而推論呈現(xiàn)化合物某些性質(zhì)的影響因素,然后為設(shè)計(jì),篩選或預(yù)測(cè)具有人們期望性質(zhì)的化合物提供信息。 化學(xué)信息學(xué)的發(fā)展為化學(xué)各分支學(xué)科的發(fā)展提供了多種解決問(wèn)題的新思路,新方法。本學(xué)位論文主要對(duì)化學(xué)信息學(xué)研究中的一些新算
4、法進(jìn)行了探討,并把這些新算法成功應(yīng)用于QSAR/QSPR研究領(lǐng)域中。該論文共包括五章節(jié)內(nèi)容,每一個(gè)章節(jié)的具體內(nèi)容如下所示: 第一章:簡(jiǎn)述了化學(xué)信息學(xué)的基本概念和研究現(xiàn)狀,以及多種化學(xué)信息學(xué)算法,也詳細(xì)講述了化學(xué)信息學(xué)研究的分支之一--QSAR,包括QSAR演變歷史,基本原理以及實(shí)現(xiàn)的步驟等等。 第二章:主要討論了Quantitative structure-retention relationship(QSRR)方法在多
5、肽色譜保留行為預(yù)測(cè)的應(yīng)用研究。具體內(nèi)容如下:(1)基于線性和非線性建模方法對(duì)反相液相色譜(RPIC)的101種多肽保留時(shí)間進(jìn)行了定量結(jié)構(gòu)保留關(guān)系建模研究。最佳多元線性回歸(BMIR)方法用來(lái)選擇與保留行為最為密切的分子描述符,并建立線性模型。另外兩種非線性回歸方法(徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN)和投影尋蹤回歸(PPR))用來(lái)構(gòu)建非線性模型。RBFNN和PPR模型的訓(xùn)練集的相關(guān)系數(shù)(R2)分別為0.9787和0.9881;均方根誤差(R
6、MSE)為0.5666和0.4207。結(jié)果表明,RBF神經(jīng)網(wǎng)絡(luò)和投影尋蹤回歸將是蛋白質(zhì)組研究中一種簡(jiǎn)單且有效的工具,并有望應(yīng)用于其他類(lèi)似的研究領(lǐng)域。(2)新穎的化學(xué)信息學(xué)方法-局部懶惰回歸(LLR)首次應(yīng)用于預(yù)測(cè)278個(gè)多肽在固定金屬親和色譜(鎳柱)的保留行為研究。該工作分別用BMLR,PPR和LLR三種方法建立線性和非線性QSRR模型。最佳的LLR模型的訓(xùn)練集和測(cè)試集的R2分別為0.9446和0.9252。該工作證明新穎機(jī)器學(xué)習(xí)算法L
7、LR是一個(gè)非常有前途的研究工具,它可用于色譜保留行為研究領(lǐng)域,為協(xié)助設(shè)計(jì)和分離純化蛋白質(zhì)和多肽發(fā)揮一定的作用。 第三章主要描述了QSAR方法在農(nóng)業(yè)和食品科學(xué)領(lǐng)域的應(yīng)用研究,具體內(nèi)容如下:(1)三種機(jī)器學(xué)習(xí)方法:遺傳算法.多元線性回歸(GA-MLR),最小二乘支持向量機(jī)(LS-SVM),PPR用于100個(gè)稻瘟病抑制劑噻唑啉衍生物的殺菌活性研究。線性模型GA-MLR和非線性模型LS-SVM和PPR都得到了良好的預(yù)測(cè)結(jié)果,但非線性模型
8、提供了更加精確的預(yù)測(cè)能力。結(jié)果表明,非線性LS-SVM和PPR方法可以更加準(zhǔn)確地模擬噻唑啉分子結(jié)構(gòu)與殺菌活性之間的關(guān)系,能夠成為研究稻瘟病抑制劑良好的建模工具。此外,這項(xiàng)研究為稻瘟病抑制劑的設(shè)計(jì)和開(kāi)發(fā)提供了一種新的,簡(jiǎn)單而且有效的辦法,同時(shí)得到的與其密切相關(guān)的分子結(jié)構(gòu)信息。(2)運(yùn)用定量結(jié)構(gòu)保留關(guān)系方法對(duì)藏紅花內(nèi)43種芳香組分的SPME-GC-MS保留時(shí)間進(jìn)行了預(yù)測(cè)。應(yīng)用最佳多元線性回歸(BMIR)和投影尋蹤回歸(PPR)方法分別建立了
9、線性和非線性模型,兩種方法均得到了較好的結(jié)果:線性模型的訓(xùn)練集和測(cè)試集的相關(guān)系數(shù)(R2)分別為0.9434和0.8725,非線性模型則給出了較好的預(yù)測(cè)結(jié)果分別為0.9806和0.9456。通過(guò)對(duì)模型的穩(wěn)定性和預(yù)測(cè)能力的比較,可以看出非線性PPR方法可以較好的應(yīng)用到SPME-GC-MS保留行為研究領(lǐng)域內(nèi),同時(shí)該工作又可以為其他植物和中草藥的分離研究提供一種簡(jiǎn)便有效的方法。 第四章主要討論了定量構(gòu)效關(guān)系在生命科學(xué)和醫(yī)藥研究領(lǐng)域內(nèi)的應(yīng)
10、用,主要有以下幾部分組成:(1)利用QSRR方法對(duì)55種藥物在固相人工膜色譜內(nèi)的保留指數(shù)進(jìn)行了線性和非線性建模研究。在該工作中,線性BMLR方法被用來(lái)選取與保留指數(shù)最為相關(guān)的參數(shù),同時(shí)建立線性回歸模型;利用選取的描述符,應(yīng)用PPR和LLR方法來(lái)建立更加準(zhǔn)確的預(yù)測(cè)模型。通過(guò)模型對(duì)比,我們發(fā)現(xiàn)LLR作為一種新的建模方法,體現(xiàn)出較完美的預(yù)測(cè)能力,其訓(xùn)練集和測(cè)試集的預(yù)測(cè)結(jié)果為:復(fù)相關(guān)系數(shù)(R2),0.9540,0.9305;均方根誤差(RMSE
11、),0.2418,0.3949。結(jié)果顯示,新型LLR建模方法在QSRR方法研究中表現(xiàn)出了較好的預(yù)測(cè)能力,同時(shí)該方法定會(huì)成功的應(yīng)用于其它類(lèi)似的色譜研究領(lǐng)域內(nèi)。(2)利用線性和非線性建模方法研究了80個(gè)N-羥基-a-苯磺酰乙酰胺(N-hydroxy-a-phenylsulfonylacetamide derivatives,HPSAs)衍生物對(duì)三種類(lèi)型的基質(zhì)金屬蛋白酶的抑制活性。其中線性BMLR方法用來(lái)選取關(guān)鍵的結(jié)構(gòu)參數(shù),同時(shí)建立線性模型對(duì)
12、所選化合物的抑制活性進(jìn)行了預(yù)測(cè);然后以全局格式搜索PPR方法利用選取的參數(shù)建立非線性回歸模型。最終,線性和非線性模型均能提供較為滿(mǎn)意的預(yù)測(cè)結(jié)果。在該工作中,非線性PPR方法首次與格式搜索(GS)方法相結(jié)合并成功應(yīng)用于對(duì)HPSAs的抑制活性的建模研究,得到了令人滿(mǎn)意的預(yù)測(cè)結(jié)果。該方法的成功為其他模型參數(shù)的優(yōu)化與選取提供了一種捷徑。(3)利用線性回歸方法和非線性回歸方法-格式搜索支持向量機(jī)(GS-SVM)和PPR方法對(duì)MT3褪黑激素結(jié)合位點(diǎn)
13、的親和性進(jìn)行了研究。在該工作中,遺傳算法被用來(lái)選取與研究對(duì)象最為相關(guān)的結(jié)構(gòu)參數(shù),并建立線性回歸模型對(duì)MT3褪黑激素結(jié)合位點(diǎn)的親和性進(jìn)行預(yù)測(cè);利用選取的五個(gè)結(jié)構(gòu)變量,采用非線性回歸方法GS-SVM和PPR方法建立更加準(zhǔn)確的模型。通過(guò)模型對(duì)比,我們發(fā)現(xiàn)非線性PPR方法能夠?qū)T3褪黑激素結(jié)合位點(diǎn)的親和性具有比較準(zhǔn)確的預(yù)測(cè)能力。該方法的建立,為設(shè)計(jì)和開(kāi)發(fā)新型MT3褪黑激素的新型配體提供了一種新型的研究方法。 第五章:QSAR方法在化學(xué)
14、感應(yīng)系統(tǒng)相對(duì)靈敏度的預(yù)測(cè)研究。在本章中,BMLR,SVM和LLR三種方法用來(lái)完成64種VOCs的氣味檢測(cè)閥值(ODTs)和鼻腔辛辣味閥值(NPTs)相對(duì)敏感性的QSAR建模研究,所得的預(yù)測(cè)結(jié)果和相應(yīng)的實(shí)驗(yàn)數(shù)據(jù)基本吻合。相比之下,LLR方法能夠獲得更好的預(yù)測(cè)能力,因此,它在QSAR研究中是一種有效的機(jī)器學(xué)習(xí)算法。此外,本研究還確定了一些重要的分子結(jié)構(gòu)信息,它們與VOC的相對(duì)敏感性密切相關(guān)。這些信息可以用來(lái)選擇或制造一些新型的化學(xué)傳感器,同
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 化學(xué)計(jì)量學(xué)新算法及其在分析化學(xué)和生物信息學(xué)中的應(yīng)用.pdf
- 化學(xué)信息學(xué)方法研究及其在環(huán)境、生物學(xué)中的應(yīng)用.pdf
- 一些化學(xué)信息學(xué)方法在離子液體和生物學(xué)中的應(yīng)用研究.pdf
- 化學(xué)生物信息學(xué)新方法及其在醫(yī)藥研究中的應(yīng)用.pdf
- 化學(xué)信息學(xué)
- 天然產(chǎn)物化學(xué)與食品科學(xué)的關(guān)系
- 化學(xué)信息學(xué)中的數(shù)據(jù)挖掘.pdf
- 食品科學(xué)本科 生物化學(xué)知識(shí)點(diǎn)總結(jié)
- 氧化還原酶輔因子使用偏好的生物信息學(xué)與化學(xué)信息學(xué)研究.pdf
- 信號(hào)處理方法在波譜分析及生物信息學(xué)中的應(yīng)用研究.pdf
- 化學(xué)計(jì)量學(xué)在食品防腐劑中的應(yīng)用研究.pdf
- 基于集成學(xué)習(xí)算法的若干生物信息學(xué)應(yīng)用研究.pdf
- 核磁共振及其成像技術(shù)在食品科學(xué)中的應(yīng)用研究.pdf
- 28880.氧氣對(duì)代謝進(jìn)化的影響:化學(xué)信息學(xué)與生物信息學(xué)的綜合研究
- 45725.化合物表征及其在化學(xué)信息學(xué)中的應(yīng)用
- 生物信息學(xué)在分子診斷中的應(yīng)用
- 生物信息學(xué)中的算法問(wèn)題
- 數(shù)據(jù)挖掘的建模及在生物信息學(xué)中的應(yīng)用研究.pdf
- 機(jī)器學(xué)習(xí)算法在生物信息學(xué)中的應(yīng)用.pdf
- 生物信息學(xué)中的模式發(fā)現(xiàn)算法研究.pdf
評(píng)論
0/150
提交評(píng)論