QSAR研究中提高模型預(yù)測能力的新方法探討及其在藥物化學(xué)中的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩255頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、科學(xué)的發(fā)展是服務(wù)于現(xiàn)實生活的。人們經(jīng)常會以“到底有什么實際用途”、“與現(xiàn)實生活有什么關(guān)系”或者“能否解決實際問題”來衡量一個新鮮事物。定量結(jié)構(gòu)活性關(guān)系(Quantitative Structure-Activity Relationship,QSAR)研究也不例外,其在解決實際問題中的實用性一直備受關(guān)注。QSAR發(fā)展至今,應(yīng)用已經(jīng)非常廣泛,其研究對象包括化合物的生物活性、毒性、藥代動力學(xué)參數(shù)和生物利用度以及分子的各種理化性質(zhì)和環(huán)境行為等

2、,研究領(lǐng)域涉及生物、藥學(xué)、化學(xué)以及環(huán)境科學(xué)等諸多學(xué)科。人們期望通過各種QSAR模型從分子水平上理解化合物的微觀結(jié)構(gòu)與其宏觀活性之間的關(guān)系,為設(shè)計、篩選或預(yù)測具有人們期望的性質(zhì)的化合物提供信息。 在眾多的應(yīng)用中,利用模型預(yù)測未經(jīng)實驗測定甚至未合成的新化合物的相關(guān)活性,是QSAR模型最重要的用途之一。但是要用于預(yù)測新化合物,QSAR模型必須具有較高且可信的外部預(yù)測能力。因此本論文從建立QSAR模型的各個步驟考慮,試圖解決目前QSAR

3、研究中某些還有待完善的問題,重點研究了定量構(gòu)效關(guān)系研究中化合物低能構(gòu)象的選擇問題、提出了幾種新的建模策略、引入新的建模方法,旨在盡可能地提高QSAR模型的可靠性以及外部預(yù)測能力。同時,將具有很好預(yù)測能力的定量構(gòu)效關(guān)系模型用于活性化合物的設(shè)計和篩選。 論文第一章對定量結(jié)構(gòu)活性關(guān)系研究進行了概述。從QSAR的發(fā)展歷史、研究現(xiàn)狀到發(fā)展趨勢,從模型的建立、檢驗到應(yīng)用,都進行了詳細的闡述,并重點討論了模型的驗證問題。另外為了對QSAR建模

4、方法有清晰的認識,本章從不同角度對各種QSAR方法進行了分類歸納; 論文第二章討論了二維QSAR研究中的一個基本問題--化合物構(gòu)象對于定量構(gòu)效關(guān)系模型的影響。旨在分析不同能量優(yōu)化方法所得到的低能構(gòu)象的差別、對最終QSAR模型的影響有多大?;谑裁礃拥臉?gòu)象對于建立最終模型的至關(guān)重要,這也是一個QSAR研究的基礎(chǔ)。通過對三組復(fù)雜程度不同的化合物進行研究后,得出了以下主要結(jié)論:(1)進行分子的三維結(jié)構(gòu)優(yōu)化時所用的初始構(gòu)象能夠影響模型的

5、最終結(jié)果,并且分子結(jié)構(gòu)越復(fù)雜影響越大;(2)構(gòu)象搜索能夠給出能量較低的分子狀態(tài),它可以協(xié)助分子力學(xué)或半經(jīng)驗等優(yōu)化方法很快很容易的找到全局最優(yōu)的低能構(gòu)象;(3)如果所建立的QSAR模型用于新化合物的預(yù)測,則新化合物最好與訓(xùn)練集數(shù)據(jù)使用同樣的優(yōu)化方法; 第三章介紹本文提出的兩種新穎的一致性建模分析方法:WCM和改進的CDFS。一致性建模分析是一種新型的建模方法,但目前用來建立一致性模型的方法都是平均策略(ACM)。實際上不同的子模型

6、包含的信息不同,對于最終活性的貢獻也不同。因此本文提出一種更加合理的加權(quán)策略(WCM),考慮用多元線性回歸的方法給子模型不同的權(quán)重,并且提出了Q2引導(dǎo)的子模型選擇策略(QGMS)來指導(dǎo)子模型的選擇過程。這兩種策略用于一系列丙二酰輔酶A脫羧酶抑制劑的定量構(gòu)效關(guān)系研究,WCM模型的表現(xiàn)優(yōu)于ACM和最佳單個模型,模型的擬合能力和預(yù)測能力都有很大提高,且模型更加穩(wěn)定可靠,可解釋性增強。 CDFS是另一種一致性建模思路。CDFS方法將數(shù)

7、據(jù)集進行多次分組分別建模,然后取模型的公共描述符建立最終模型。該方法的缺點是很難保證所得到的若干訓(xùn)練集的代表性。本文提出利用科學(xué)的分組方法得到具有代表性的訓(xùn)練數(shù)據(jù),基于該數(shù)據(jù)利用不同的描述符組合進行建模,描述符出現(xiàn)頻率越高說明其包含的結(jié)構(gòu)信息越重要,然后取出現(xiàn)頻率高的描述符建立最終模型。該方法用于169個噻唑類淋巴細胞特異性激酶抑制劑的定量構(gòu)效關(guān)系研究,最終得到了包含八個公共描述符的模型,得到了很好的結(jié)果; 第四章指出了局部建模

8、local lazy regression(LLR)方法中一個問題,并且提出了相應(yīng)的解決辦法。在局部建模分析中,如何確定最優(yōu)的臨近點數(shù)量(k)對模型的預(yù)測是至關(guān)重要的,目前使用的方法是利用抽一法交互驗證(LOO-CV)的Q2來自動決定。而LOO-CV只是一種內(nèi)部檢驗技術(shù),不能說明模型的外部預(yù)測能力,因此建立模型進行預(yù)測的可靠性值得懷疑。本文提出通過監(jiān)測局部模型的外部預(yù)測能力來提高LLR預(yù)測的可靠性和準確性,并用于黑色素濃縮激素受體1拮抗

9、劑的定量構(gòu)效關(guān)系研究,提高了模型的預(yù)測能力和預(yù)測可信度,得到了很好的結(jié)果; 第五章應(yīng)用兩種新型的非線性建模方法最小二乘支持向量機(LS-SVMs)和基因表達式編程(GEP)進行建模分析,使模型的擬合能力和預(yù)測能力都有一定的提高。本論文中,(1)LS-SVMs方法用于羥吲哚類細胞周期依賴性激酶(CDK)抑制劑的分類,模型分類正確率比線性判別分析(LDA)模型有很大提高;(2)LS-SVMs方法用于44個人類肝臟糖原磷酸化酶(h1G

10、Pa)抑制劑,模型的抽一法交互驗證表明LS-SVMs模型更加穩(wěn)定,非線性模型的預(yù)測能力比多元線性回歸(MLR)模型更強,且在此工作中驗證了QSAR研究中進行描述符選擇的必要性;(3)LS-SVMs方法用于吡嗪-吡啶類血管內(nèi)皮生長因子受體2(VEGFR-2)抑制劑的定量構(gòu)效關(guān)系研究,模型的預(yù)測能力比線性MLR模型有很大程度的提高;(4)非線性GEP方法用于62個MCHR1拮抗劑的QSAR研究,所得GEP模型的擬和能力尤其是外部預(yù)測能力都比

11、線性MLR方法有很大提高,Rext2從線性的0.756提高到0.819; 第六章重在討論模型的應(yīng)用--數(shù)據(jù)庫挖掘和虛擬篩選。提出了一個新穎的QSAR/docking混合策略對淋巴細胞特異酶Lck抑制劑進行QSAR研究,所建模型用于虛擬篩選化合物數(shù)據(jù)庫,最終篩選出兩個磺酰基脲類衍生物,它們與Lck激酶活性位點的結(jié)合模式與文獻報道的已知抑制劑非常相似,并且具有較高的預(yù)測活性。其中關(guān)鍵的磺?;搴褪杷鶊F子結(jié)構(gòu)可以作為Lck抑制劑結(jié)構(gòu)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論