藥物發(fā)現(xiàn)的虛擬篩選方法

上傳人：奔*** IP屬地：河北更新時間：2024-01-06 格式：ppt 頁數(shù)：97 大?。?.99MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩96頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、藥物發(fā)現(xiàn)的虛擬篩選方法,第一節(jié) 概述,計算機模擬與化學(xué)合成、生物測試的結(jié)合構(gòu)成了后基因組時代新藥研究的新策略。從已有的化合物，包括合成化合物和天然產(chǎn)物中尋找藥物或先導(dǎo)化合物，是藥物發(fā)現(xiàn)的一個重要途徑。到目前為止，人們只是針對大約500 種疾病的治療靶點，篩選了現(xiàn)已發(fā)現(xiàn)的2 000 多萬種有機化合物中大約10%的化合物，但仍然有大量的潛在活性化合物未被發(fā)現(xiàn)。,隨著科學(xué)技術(shù)的發(fā)展，各種先進技術(shù)應(yīng)運而生（X 射線晶體衍射法、多維核磁共振法、掃

2、描隧道顯微技術(shù)等），使得越來越多生物靶標(biāo)（蛋白質(zhì)、核酸、多糖等）的空間結(jié)構(gòu)被解析。同時計算機科學(xué)的發(fā)展又極大地提高了計算和分析的速度和精度。因此，自上世紀(jì)90 年代起，合理藥物設(shè)計就逐漸成為一種實用技術(shù)接融入到藥物研發(fā)的各個環(huán)節(jié)。,一、合理藥物設(shè)計,成功例子,奈非那韋（nelfinavir）抗艾滋病藥物 HIV-1蛋白酶抑制劑依馬替尼（imatinib）治療慢性骨髓型白血病藥物,二、數(shù)據(jù)庫空間,研究對

3、象化學(xué)信息學(xué)：小分子生物信息學(xué)：小分子結(jié)構(gòu)單元構(gòu)成的基因和蛋白質(zhì)等大分子，本質(zhì)上都是化學(xué)物質(zhì)。計算方法基于回歸的聚類分析；支持向量機；神經(jīng)網(wǎng)絡(luò)；遺傳算法等。發(fā)揮作用方面核酸和蛋白質(zhì)功能和結(jié)構(gòu)；小分子配體和蛋白質(zhì)受體的相互作用；酶催化等方面。,化學(xué)信息學(xué)和生物信息學(xué)的共同點,是相互依存，相互影響，需結(jié)合在一起，才能解決大多數(shù)的實際問

4、題！,虛擬篩選的時間：在化合物組合庫合成和/或篩選之前。虛擬篩選的空間：在計算機上進行模擬設(shè)計和篩選。虛擬篩選的方法：直接方法：基于分子對接（molecular docking）的虛擬篩選間接方法：基于藥效基團（pharmacophore）的虛擬篩選,虛擬篩選（virtual screening, VS）,虛擬篩選技術(shù)是藥物設(shè)計方

5、法的延伸和推廣，廣義地講只要是基于某種提問形式，從現(xiàn)有的小分子數(shù)據(jù)庫中，搜尋符合條件的化合物都可以稱之為虛擬篩選。這其中包括基于某些分子特性的數(shù)據(jù)庫搜索、基于分子對接的數(shù)據(jù)庫搜索、基于藥效團的數(shù)據(jù)庫搜索等，其目的是從幾十乃至上百萬個分子中篩選出新的先導(dǎo)化合物。由于實體的藥物篩選需要構(gòu)建大規(guī)模的化合物庫，提取或培養(yǎng)大量實驗必須的靶酶或者靶細(xì)胞，并且需要復(fù)雜的設(shè)備支持，因而進行實體的藥物篩選要投入巨額資金。而虛擬藥物篩選是將藥物篩選的過程在

6、計算機上模擬，對化合物可能的活性作出預(yù)測，這樣就能夠集中目標(biāo)，大大降低實驗篩選化合物的數(shù)量，從而縮短研發(fā)周期、節(jié)約經(jīng)費開支。雖然早在20 世紀(jì)70 年代虛擬篩選技術(shù)已經(jīng)得到應(yīng)用，但由于技術(shù)本身的不成熟，使得在新藥開發(fā)上仍然主要依靠傳統(tǒng)的實驗篩選。近年來，隨著虛擬藥物篩選成功地發(fā)現(xiàn)了一些有開發(fā)價值的先導(dǎo)化合物，這項技術(shù)又重新引起大家的重視。,化學(xué)信息學(xué),產(chǎn)生的背景組合化學(xué)和高通量篩選，出現(xiàn)了巨大的信息，需要快速收集、存儲、分析和

7、處理，隨著信息技術(shù)向化學(xué)領(lǐng)域的滲透，形成了新的交叉學(xué)科——化學(xué)信息學(xué)。研究內(nèi)容化合物信息在計算機中的表示化合物數(shù)據(jù)庫的建立、使用和管理化合物相似性、多樣性及分子類藥性分析化合物定量構(gòu)效關(guān)系,化學(xué)信息學(xué) Chemoinformatics，chemical informatics，Cheminformatics，chemi-informatics,利用計算機信息處理技術(shù)對化學(xué)分子結(jié)構(gòu)和相關(guān)信息

8、進行管理的一種綜合性技術(shù)和學(xué)科應(yīng)用化學(xué)信息學(xué)可促進化學(xué)信息的獲取、轉(zhuǎn)化與共享,一、化學(xué)信息的表示方法,化學(xué)分子,一維結(jié)構(gòu)：化合物名稱（俗名）；線性符號表示法。,二維結(jié)構(gòu)：原子用元素符號，鍵用短線，即化合物結(jié)構(gòu)式。為平面結(jié)構(gòu)。,三維結(jié)構(gòu)：原子的空間位置、相互間距離、鍵角和二面角等。,分子表面：建立在三維結(jié)構(gòu)基礎(chǔ)上，能與分子的三維結(jié)構(gòu)一一對應(yīng)。,苯丙氨酸分子結(jié)構(gòu)表征層次,,,,（一）一維結(jié)構(gòu)表示,SMILES（簡化分子線性輸入系統(tǒng)）編

9、碼的基本原則,原子通常以大寫元素符號表示（省略氫原子），芳香結(jié)構(gòu)原子則以小寫表示。相鄰原子依次排放在一起，單鍵通常省略，雙鍵和三鍵分別以“=”和“#”表示，芳香鍵以“：”表示，也可省略。分支部分放在括號內(nèi)，環(huán)則打開，并賦予斷開鍵兩端的原子以相同的數(shù)值。雙鍵“/”表示順式，“\”表示反式。原子順時針排列用@表示，逆時針排列用@@表示。,甲烷 CH4

10、 C乙醇 C2H5OH CCO氰化氫 HCN C#N環(huán)已烷 C6H12 C1CCCCC1吡啶 C5H5N n1ccccc1異丁

11、酸 (CH3)2CHCO2H CC(C)C(=O)O反式二溴甲烷 Br/C=C/Br 或Br\C=C\Br順式二溴甲烷 Br\C=C/Br 或Br/C=C\BrL-丙氨酸 N[C@@H](C)C(=O)OD-丙氨酸 N[C@H](C)C(=O)O,舉例說明,苯丙氨酸,,,,NC(Cc1ccccc1)C(

12、O)=O,,C/C=C\C=\[C@@H](O)C#N,SMILES編碼的立體化學(xué)信息表示,SLN編碼（Sybyl線性標(biāo)記法）的規(guī)則,原子以其元素符號表示，氫原子也要顯示；單鍵省略，雙鍵、三鍵和芳香鍵分別以“=” “#”和“：”表示；分支也采用括號表示；環(huán)也打開，依靠環(huán)上一個預(yù)先定義好的具有唯一編號的原子及@符號來識別，如環(huán)己烷表示為C[15]H2CH2CH2CH2CH2CH2@15;原子和鍵的屬性（如電荷、立體化學(xué)性質(zhì)等）可通過

13、方括號[ ]或尖括號在該原子后標(biāo)記出；對大分子的原子，可使用縮寫，如氨基酸可以用其三個字母縮寫形式表示。,（二）二維結(jié)構(gòu)表示,1、圖論基礎(chǔ)和圖的矩陣表示一個簡單的圖由頂點（V）和邊（E）組成，因此圖被定義為一個三元組, φ為映射函數(shù)。在下面一個簡單的無向圖中， V={1，2，3，4}， E={e1，e2，e3，e4， e5， e6}。,圖也可用矩陣表示：設(shè)G=為無向圖，令mij等于頂點vi與邊ej的關(guān)聯(lián)次數(shù)，

14、則稱（mij）n*m為G的關(guān)聯(lián)矩陣，記為M(G)。,用圖表示苯丙氨酸的結(jié)構(gòu),2、化合物結(jié)構(gòu)的矩陣表示（1）鄰接矩陣（以乙醛為例）,（2）距離矩陣：表示了相應(yīng)原子之間的距離：幾何距離（用Å表示），拓?fù)渚嚯x（兩原子之間連接的鍵的個數(shù)）（3）鍵矩陣：矩陣元素為相連接的兩個原子之間的鍵級。雙鍵：2，三鍵：3。（4）關(guān)聯(lián)矩陣：是

15、一個n×m的矩陣。頂點（原子）作為列（n），邊（化學(xué)鍵）作為行（m），如果邊在頂點內(nèi)，則相應(yīng)的元素置為1。,3、連接表,20世紀(jì)80年代開始，成為化合物在計算機中表示的最主要方法。首先對每個原子進行編號并列表然后在另一表格中列出鍵的信息，鍵級用整數(shù)表示，1表示單鍵，2表示雙鍵。,（三）三維結(jié)構(gòu)表示,1、直接坐標(biāo)法用迪卡爾

16、坐標(biāo)直接存儲每個原子的三維坐標(biāo)（x,y,z）,2、內(nèi)坐標(biāo)法,每個原子位置以與其他原子間的3個相對位置關(guān)系表示——相對距離、鍵角、二面角,（四）分子存儲格式及其相互轉(zhuǎn)換,基本存儲分子的元素組成、原子坐標(biāo)、原子連接關(guān)系其他存儲分子子結(jié)構(gòu)信息，適用于生物大分子原子電荷信息，調(diào)用時不必再計算確定特定原子化學(xué)環(huán)境的原子類型信息,二、化合物數(shù)據(jù)庫的生產(chǎn)和管理,目前有很多商業(yè)化合物數(shù)據(jù)庫可以利用 MDL藥物數(shù)據(jù)報告（MDDR）含有115

17、000個類藥性化合物。美國國家癌癥研究所（NCI）數(shù)據(jù)庫含有250000個化合物。,MDL ISIS化學(xué)數(shù)據(jù)庫管理系統(tǒng),ISIS系統(tǒng)提供了基于Oracle 數(shù)據(jù)庫系統(tǒng)的各類化學(xué)信息系統(tǒng)的管理和開發(fā)工具，可以同時管理化學(xué)結(jié)構(gòu)、化學(xué)反應(yīng)、生物活性及譜圖等多種化學(xué)信息。ISIS已應(yīng)用于全球超過80%的化學(xué)與制藥企業(yè)，已成為事實上的化學(xué)信息管理系統(tǒng)的工業(yè)標(biāo)準(zhǔn)。,ISIS (Integrated Scientif

18、ic Information Management System)——MDL的綜合性結(jié)構(gòu)和反應(yīng)管理軟件,由三個主要模塊組成：(1) 化學(xué)信息管理系統(tǒng)：ISIS/HOST——主服務(wù)器應(yīng)用程序，進行通訊連接，集中數(shù)據(jù)庫數(shù)據(jù)并作處理(2) 化學(xué)信息生成和管理軟件：ISIS/BASE——用于生成局部數(shù)據(jù)庫及處理信息(3) 化學(xué)畫圖軟件：ISIS/DRAW——用于輸入結(jié)構(gòu)式和搜尋詢問條件,2D結(jié)構(gòu)輸入,——計算機繪制化學(xué)結(jié)構(gòu)式首先輸入原

19、子和鍵的骨架結(jié)構(gòu)，原子數(shù)、電荷會自動變?yōu)樯舷聵?biāo) 軟件的模板中收集大量分子片段可智能分析結(jié)構(gòu)式，處理結(jié)構(gòu)式的編碼和變換還可有附加功能，如自動命名、化學(xué)計算、光譜分析等,三維結(jié)構(gòu)的轉(zhuǎn)化,3D結(jié)晶結(jié)構(gòu)參數(shù)轉(zhuǎn)入3D數(shù)據(jù)庫,軟件將2D化學(xué)結(jié)構(gòu)迅速地轉(zhuǎn)為3D模型,三、分子相似性和多樣性分析,分子相似性和多樣性分析方法的原則：結(jié)構(gòu)相似的分子有著相似的性質(zhì)或活性。作用：在識別新的具有與已知化合物相同性質(zhì)或活性的化合物時具有十分重要的作用。

20、數(shù)據(jù)庫的化學(xué)多樣性（chemical diversity）：數(shù)量巨大的、結(jié)構(gòu)不同的貯藏和檢索系統(tǒng)——適用于先導(dǎo)化合物發(fā)現(xiàn) 數(shù)據(jù)庫的化學(xué)相似性（chemical similarity）適用于先導(dǎo)化合物優(yōu)化評價方法：通過計算分子的描述符，并比較化合物描述符的近似程度。,分子描述符,概念：在相似性和多樣性分析中，需要建立化合物結(jié)構(gòu)和它們生物活性或者理化性質(zhì)的映射，分子

21、描述符就是其中的一種映射。作用：通常一個或多個描述符可以用來描述分子的結(jié)構(gòu)、性質(zhì)等，如lgP在一定程度上反映了分子穿透細(xì)胞膜的能力；拓?fù)渲笖?shù)描述了結(jié)構(gòu)的復(fù)雜性。描述符的內(nèi)容是由兩方面決定的，一是化合物的分子表示，二是計算描述符的算法。,分子描述的分類,分子相似性分析方法,基于定性特征的和基于定量特征的。對于兩個化合物A和B， a是A所具有而B不具有的特征數(shù)目 b是B

22、所具有而A不具有的特征數(shù)目 c是兩者共同的特征數(shù)目 d為兩者都不具有的特征數(shù)目 c和d表示了化合物A和B之間的相似性 a和b表示了化合物A和B之間的多樣性所有的特征數(shù)目為n=a+b+c+d這樣，可以建立一種直觀的相似性評價方法：考察所有匹配的特征數(shù)目c+d在所有特征數(shù)目（c+d）+（a+b）中所占的比例，即（c+d）/（a+b+c+d）。這也被稱作為簡單匹配系數(shù)。可以看出，A和B均不具有的特

23、征并沒有表達任何信息，所以，d可以從上面的方法中刪除，得到了Tanimoto相似度計算公式。,,化學(xué)多樣性的定量表達——Tanimoto系數(shù),用化學(xué)空間中電荷和電勢等描述符比較不同分子的性質(zhì) TC = c /(a+b+c) a為A中基礎(chǔ)片斷的描述符的數(shù) b為B中基礎(chǔ)片斷的描述符的數(shù)目 c為

24、A和B中共有的基礎(chǔ)片斷的描述符的數(shù)目相同分子TC = 1；分子沒有共同描述符時TC = 0,相似性搜尋,根據(jù)分子相似性原理，可以在數(shù)據(jù)庫中搜尋與目標(biāo)分子具有一定相似性的分子，即相似性搜尋。步驟： 1、目標(biāo)選擇 2、描述符選擇和編碼 3、相似性評價方法選擇 4、搜尋語句的輸入 5、相似性打分,四、互聯(lián)網(wǎng)上的化學(xué)信息資源,（一）化學(xué)搜索引擎1、大型通用搜索引擎：Google、百度等。

25、2、專門用于搜索化學(xué)信息的引擎：ChemFinder, MetaXchem…..（二）互聯(lián)網(wǎng)上的化學(xué)數(shù)據(jù)庫1、文獻數(shù)據(jù)庫（CA、Medline）2、化合物數(shù)據(jù)庫（Gmelin, CSD）3、綜合數(shù)據(jù)庫（Beilstein、PDB）,常用化合物數(shù)據(jù)庫,FCD (Fine Chemicals Directory)—— MDL 維護。收載約90 000化合物和20 000化合物數(shù)據(jù)，包括化學(xué)系統(tǒng)名、俗稱、分子式、分子量、供應(yīng)商、價格、

26、CAS登錄號、純度等。可通過結(jié)構(gòu)式或其它任何數(shù)據(jù)檢索ACD (Available Chemicals Directory) ——MDL維護。FCD數(shù)據(jù)庫加上可大批量供貨的化學(xué)品信息。目前有25萬個化合物CSD（Cambridge Structure Database) —— 20多萬個結(jié)晶的3D結(jié)構(gòu)實驗數(shù)據(jù)及相關(guān)數(shù)據(jù),常用數(shù)據(jù)庫的網(wǎng)址,生物信息學(xué)(bioinformatics),基于數(shù)學(xué)、生命科學(xué)、化學(xué)和計算機科學(xué)的交叉學(xué)科. 利用

27、計算機信息處理技術(shù)對大量生物大分子作信息獲取、加工、儲存、分類、檢索與統(tǒng)計分析，揭示生物大分子的分子結(jié)構(gòu)、功能、同源性和進化關(guān)系. 推動生命科學(xué)的發(fā)展，為創(chuàng)新藥物的研究和開發(fā)奠定基礎(chǔ).,生物信息學(xué)的應(yīng)用,核酸序列分析指直接從基因組序列中獲取信息，同時為后者提供數(shù)據(jù)；蛋白質(zhì)序列分析中，大部分是對同源蛋白序列進行比對分析，以得到不同蛋白質(zhì)之間的序列相關(guān)性，從而推測蛋白質(zhì)功能等。二者分析方法一致。,生物大分子結(jié)構(gòu)預(yù)測,虛擬篩選,生物大分子包

28、括DNA、RNA、蛋白質(zhì)和脂類。它們的結(jié)構(gòu)預(yù)測指建立精確的三維構(gòu)象，這對于生物大分子功能的闡明十分重要。而尚無晶體結(jié)構(gòu)數(shù)據(jù)的生物大分子，可采用分子模擬的方法預(yù)測大分子的三維結(jié)構(gòu)。,在進行生物活性篩選之前，在計算機上對化合物分子進預(yù)篩選，以降低實際篩選化合物數(shù)目，同時提高先導(dǎo)化合物發(fā)現(xiàn)效率。,藥物發(fā)現(xiàn)中的生物信息學(xué)方法,一、核酸和蛋白質(zhì)的序列分析,(一) 單個序列分析根據(jù)單個氨基酸物化性質(zhì)推測整個蛋白質(zhì)的性質(zhì)

29、，也可對序列進行統(tǒng)計分析，預(yù)測二級結(jié)構(gòu)出現(xiàn)可能性. 20種氨基酸的疏水參數(shù),根據(jù)統(tǒng)計值：Glu經(jīng)常出現(xiàn)在α-螺旋中；Val常在β-折疊中發(fā)現(xiàn); Pro通常不出現(xiàn)于α-螺旋中和β- 折疊中而傾向于在回折中……,（數(shù)值=1代表偏好處于平均；＞1代表偏好大于平均；＜1代表偏好小于平均）,(二) 雙重序列比較——序列比對,序列對比可以用各種矩陣表達并作相似性打分兩個殘基越

30、相似則打分值越高.,(三) 多重序列比對,多重序列比對可更多揭示相關(guān)蛋白質(zhì)序列中的保守區(qū)域，進而分析蛋白質(zhì)的結(jié)構(gòu)和功能?？刹捎枚喾N統(tǒng)計算法進行多重序列比對。,二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測,蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的意義,蛋白質(zhì)的二級結(jié)構(gòu)有α螺旋、β折疊、β轉(zhuǎn)角等。因為每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向，而且所有蛋白質(zhì)中約85%的氨基酸殘基處于上述3種基本二級結(jié)構(gòu)狀態(tài)，所以從序列預(yù)測蛋白質(zhì)二級結(jié)構(gòu)是可行的。,1、Chou-Fasman方

31、法2、GOR方法3、基于氨基酸疏水性的方法,蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的方法,主要預(yù)測方法,1、從頭預(yù)測法（ab initio prediction）,采用理論計算（分子力學(xué)、分子動力學(xué)、量子化學(xué)）方法，直接從分子和原子參數(shù)計算出蛋白質(zhì)分子的穩(wěn)定構(gòu)象，理論上最理想的方法，但計算量極大，對于實際分子的計算超過能力范圍,2、穿針引線法,根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維結(jié)構(gòu)——基于知識的預(yù)測可應(yīng)用于進化非常疏遠(yuǎn)的結(jié)構(gòu)預(yù)測未知蛋白序

32、列與折疊庫中已知結(jié)構(gòu)的蛋白序列作匹配計算，將序列吻合的三維結(jié)構(gòu)模塊串連起來，得到整個蛋白三維結(jié)構(gòu),同源蛋白模建法homologous model building比較分子模擬法comparative molecular modeling同源模建 homology modeling同源蛋白法 protein homology,根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維結(jié)構(gòu)——基于知識的預(yù)測同源蛋白有著相似的來源、相似

33、的結(jié)構(gòu)和生物功能。通過比較蛋白序列的相似性，按同源蛋白的三維結(jié)構(gòu)為模板，構(gòu)建未知蛋白的結(jié)構(gòu)一般要求同源性在30%以上，特別是在結(jié)合區(qū)域同源性要好,步驟,（1）根據(jù)未知蛋白質(zhì)的序列，尋找同源蛋白（2）二重或多重序列對比步驟（3）找出共同的二級結(jié)構(gòu)區(qū)域，構(gòu)建骨架（4）對初始模型作能量優(yōu)化（5）判斷結(jié)構(gòu)合理性,三、代表性生物信息學(xué)數(shù)據(jù)庫,（一）核酸數(shù)據(jù)庫GenBank——NIH所屬國家生物技術(shù)信息中心NCBINucleic Ac

34、id Database（NDB）—— 由European Molecular Biology Laboratory（ EMBL）創(chuàng)建，現(xiàn)由英國劍橋的歐洲生物信息學(xué)研究所（ European Bioinformatics Institute, EBI）維護DNA Data Bank of Japan（DDBJ）——日本國立遺傳學(xué)研究所的日本信息生物學(xué)中心（ Center for Information Biology, CIB）開發(fā)維

35、護三大庫可交互,（二）蛋白質(zhì)數(shù)據(jù)庫,PDB （ Protein Data Bank at Brookhaven National Laboratories ） —— 美國 Research Collaboration for Structural Bioinformatics, RCSB開發(fā)維護的多肽、酶、病毒、碳水化合物和核酸的三維結(jié)構(gòu)數(shù)據(jù),基于藥效基團搜索的方法,藥效團的概念早在1909 年就由Ehrilich 提出，特

36、指載有活性必須特征原子的分子框架?，F(xiàn)在泛指生物活性分子（一般指小分子）中對活性起重要作用的“藥效特征元素”的空間排列形式。這些“藥效特征元素”可以是某些具體的原子或原子團，比如氧原子、苯環(huán)等；也可以指特定的功能結(jié)構(gòu)，如疏水基團、氫鍵給體、氫鍵受體等。在得到某類抑制劑的藥效團模型后，就可以以藥效團作為提問結(jié)構(gòu)進行數(shù)據(jù)庫搜索，從數(shù)據(jù)庫中篩選得到符合該藥效團的候選分子，而在這些候選分子中可能包含新的先導(dǎo)化合物。,（1）初篩：其作用是先篩去那些

37、不能與提問結(jié)構(gòu)匹配的分子，減少進入下一個階段的候選分子數(shù)。大多數(shù)軟件都把在該藥效團中出現(xiàn)較多的原子或基團作為約束條件，含有這些基團的則通過初篩，否則被淘汰。（2）二維子結(jié)構(gòu)匹配：其目的是確定測試分子中藥效模式間的連接方式是否符合提問結(jié)構(gòu)，這是一個較為耗時的過程。（3）三維結(jié)構(gòu)搜索：在通過二維子結(jié)構(gòu)匹配證明其包含藥效團以后，就需要驗證它在數(shù)據(jù)庫中的構(gòu)象和藥效特征元素是否滿足空間限制條件，如果滿足則該分子是一個命中結(jié)構(gòu)。,基于藥效團的搜

38、索一般包含3 個基本步驟,基于藥效團的搜索軟件,CATALYST 是由美國Accelrys 公司面向藥物研究領(lǐng)域的綜合性開發(fā)軟件，由于這一軟件為藥效團模擬提供了完善的解決方案，使得CATALYST 成為近年來在基于藥效團模型的藥物開發(fā)方面使用最廣泛的軟件。它能將抽象的藥效特征元素與靈活的幾何約束條件相結(jié)合，尤其在定義藥效團模型時，能夠表達重要的化學(xué)概念。在進行基于藥效團模型的數(shù)據(jù)庫搜索時，其一維限制條件與某些數(shù)據(jù)相聯(lián)系，如分子量、lgP

39、、pKa 等，從而把搜索限定在某些數(shù)值范圍內(nèi)；二維約束支持定義包含子結(jié)構(gòu)或排除子結(jié)構(gòu)，如包含芳香環(huán)，不包含羰基等；三維檢索時，對每個分子在生理條件下可能采取的各種構(gòu)象進行搜索。為實現(xiàn)最佳的檢索性能，CATALYST 經(jīng)過了高度優(yōu)化，即使最抽象的（化學(xué)表達）檢索也不例外。,UNITY 是另一搜索化學(xué)或生物數(shù)據(jù)庫的搜索系統(tǒng)，由美國Tripos 公司開發(fā)。包括2D（搜索特殊片段）、相似性、3D（搜索特征的三維結(jié)構(gòu)或藥效團）、柔性（允許小分子

40、通過改變鍵角、二面角等方式符合3D 條件）搜索。UNITY 在進行藥效團搜索時，支持3D/Flex 搜索，檢索的藥效團特征包括給體原子（donor atom）、受體原子（accept atom）、給體位點（donor site）、受體位點（accept site）以及疏水中心（hydrophobic center）等。在對小分子數(shù)據(jù)庫進行藥效團搜索時，采用的特征限制條件可以是具體的原子或基團，如上述的給體原子、受體原子、疏水中心；也可以

41、是某些配體將與之發(fā)生作用的位點，即給體位點和受體位點等。,基于藥效基團的結(jié)構(gòu)搜尋,1、二維藥效基團搜尋,以平面的提問結(jié)構(gòu)搜尋化合物結(jié)構(gòu)式,（1）二維子結(jié)構(gòu)搜尋,搜尋具有與提問結(jié)構(gòu)相同子結(jié)構(gòu)的化合物分子,（2）二維相似性搜尋,搜尋與提問結(jié)構(gòu)某些特征相似的化合物分子,2、三維藥效基團搜尋,搜尋具有與相同作用基團和空間排布的化合物分子,[例] 新抗生素的尋找,[例] D2/D3受體選擇性拮抗劑藥效基團模型,多巴胺D2類受體為抗帕金森癥和安定類

42、藥物的靶點D3/D4受體可能與精神分裂癥有關(guān)D2受體選擇性拮抗劑——取代哌嗪/哌啶類,D3受體選擇性拮抗劑——苯酰胺類和四氫萘類,藥效基團模型的建立,挑選26個D2受體選擇性和22個D3受體選擇性的化合物分別作為訓(xùn)練集，分別產(chǎn)生D2受體D3受體模型以Catalyst 將結(jié)構(gòu)式轉(zhuǎn)化為三維構(gòu)象，用Best conformational analysis進行構(gòu)象優(yōu)化用Catalyst/HypoGen產(chǎn)生藥效基團。選擇5個結(jié)構(gòu)特征

43、作為藥效基團單元：HB Acceptor，HB Donor， HYDPHOBIC ， HYDROPHOB aromatic ， RING AROMATIC 為D2/D3受體選擇性拮抗劑分別產(chǎn)生了10個得分從高到低的Hypothesis,藥效基團模型的可信度,對于D2受體和D3受體產(chǎn)生的藥效團模型，每個藥效基團模型的得分與理想模型的得分差值均大于40，說明數(shù)據(jù)關(guān)聯(lián)的可能性較大所建立的D2受體和D3受體藥效團模型可用于虛擬篩選,未知化合

44、物的活性預(yù)測,以未知化合物作為驗證集大部分預(yù)測值與實驗值處于同一個數(shù)量級，并反映D2/D3受體的選擇性,D2（左）和D3（右）受體拮抗劑藥效基團MAPPING圖,[例] Muscarinic M3 受體拮抗劑的篩選,過敏性腸道綜合癥與慢性阻塞性氣管病均與受體Muscarinic M3 有關(guān)。1999 年，Marriott 等采用基于藥效團搜索的方法進行了Muscarinic M3 受體拮抗劑的篩選。他們從文獻中選出3 個已知的抑制劑，

45、利用DISCO 程序構(gòu)建藥效團模型，最終有2 個四點模型用于數(shù)據(jù)庫搜索（圖）。數(shù)據(jù)庫搜索使用UNITY 程序，數(shù)據(jù)庫為自己課題組所構(gòu)建，2 個藥效團模型篩選得到177 個完全不同的分子，生物活性檢測發(fā)現(xiàn)其中有3 個分子具有較高的活性。,[例]對MC 增生抑制劑的篩選,腎小球毛細(xì)血管中的血管系膜細(xì)胞（mesangial cell，MC）的增生與許多血管疾病的發(fā)生有關(guān)。2001年，Kurogi 等采用基于藥效團的數(shù)據(jù)庫搜索對MC 增生抑制劑

46、進行了篩選，研究組從現(xiàn)有抑制劑出發(fā)，藥效團識別采用CATALYST，構(gòu)建了包含7 個藥效特征元素的藥效團模型。然后CATALYST 搜索了包含47 045 個分子的數(shù)據(jù)庫，得到41 個命中結(jié)構(gòu)，生物活性檢測其中4 個化合物具有明顯的MC 增生抑制活性。,三、基于定量構(gòu)效關(guān)系的虛擬篩選,定量構(gòu)效關(guān)系方法及篩選,定量構(gòu)效關(guān)系（quantitative structure-activity relationship，QSAR）研究方法在現(xiàn)

47、代藥物設(shè)計方法中占有重要的地位，也是應(yīng)用最為廣泛的藥物設(shè)計方法。其目的是采用數(shù)理統(tǒng)計的方法研究和揭示化合物的活性與其分子理化性質(zhì)之間的定量變化規(guī)律。傳統(tǒng)的二維定量構(gòu)效關(guān)系方法，如Hansh 法、模式識別Free-Wilson 法、電子拓?fù)浞ǖ仍缫褳榇蠹宜熘?。隨著QSAR 理論及統(tǒng)計方法的發(fā)展，反映更加豐富信息的三維定量構(gòu)效關(guān)系方法如比較分子場分析（CoMFA）方法、距離幾何法及分子形狀分析方法等都迅速得到了廣泛應(yīng)用。,基于定量構(gòu)效關(guān)系

48、篩選的方法也是最早發(fā)展起來的虛擬篩選方法，并已由平面的2D 發(fā)展至空間的3D 模式。利用軟件（如Tripos 公司的CoMFA 或Accelrys 公司的CATALYST）分析一系列已知化合物的各種性質(zhì)、理化指標(biāo)，構(gòu)建定量構(gòu)效關(guān)系。在構(gòu)效關(guān)系確定之后，即可應(yīng)用于搜索各類數(shù)據(jù)庫，篩選常使用的有Cerius2 中的Diversity 模塊。,實例,磺酰脲類除草劑最初開發(fā)在20 世紀(jì)70 年代，當(dāng)時由于目標(biāo)受體ALS 酶的三維結(jié)構(gòu)尚不確

49、定，南開大學(xué)李正名教授課題組從配體出發(fā)，選定了32 個化合物進行構(gòu)效關(guān)系研究。利用分子模擬與設(shè)計軟件包SYBYL 中的CoMFA 構(gòu)建了相應(yīng)的三維定量構(gòu)效關(guān)系模型。利用此模型以及Cerius2 的Diversity 模塊進行數(shù)據(jù)庫的虛擬篩選及活性預(yù)測，并挑選出20 個預(yù)測活性高的化合物進行合成，取得了較好的結(jié)果。,四、基于藥代動力學(xué)的虛擬篩選,在傳統(tǒng)的藥物設(shè)計流程中，對于候選化合物最關(guān)心的往往是其能否與靶酶的活性位點結(jié)合，至于這個化

50、合物能否在腸道溶解、透過細(xì)胞膜達到有效部位等問題考慮的并不多。這也直接導(dǎo)致了在過去20 年，世界前50 強制藥企業(yè)每年平均花費75 億美元僅開發(fā)出21 個上市新藥，而真正能上市的藥物與候選藥物的比例始終保持在1/10，其中原因絕大部分出在藥代動力學(xué)或安全（化合物毒性）問題上。因此，在藥物研制的早期階段對化合物的藥代動力學(xué)和毒性進行全面的評價也是十分重要的。,得到藥代動力學(xué)模型通常包含3 個步驟：（1）利用小型化技術(shù)（miniatur

51、ization）制作一系列體外培養(yǎng)基。（2）借助計算機虛擬篩選一系列化合物，并對這些培養(yǎng)基進行評價。（3）對預(yù)測模型進行實際檢驗并修正，從而這些虛擬模型將最終取代真實體內(nèi)或體外實驗，成為篩選的模型。,Chris Lipinski 及其合作者通過高通量篩選以及組合化學(xué)取樣，分析了WDI 中的2 245 個藥物。為了查明普通口服藥物的共同特性，總結(jié)出了著名的Chris Lipinski “5 規(guī)則”，包括分子量不能超過500、油水分配系

52、數(shù)CLogP 小于5 等。,基于藥代動力學(xué)篩選較快捷，主要針對整個數(shù)據(jù)庫，通常先于藥效團篩選、對接篩選。因此篩選條件應(yīng)盡量完善，否則很可能剔除潛在先導(dǎo)化合物。除上述“5 規(guī)則”之外，可極化表面積（PSA，一般應(yīng)小于140.2）、在生理條件下油水分配系數(shù)、溶解度、在小腸及腦滲透率都應(yīng)是被考慮的篩選條件，這樣才能保證整個虛擬篩選過程準(zhǔn)確性、高效性。,除了上述4 種篩選方法外，還有其它數(shù)據(jù)庫搜索技術(shù)，如子結(jié)構(gòu)匹配篩選、相似性搜索等，這些技術(shù)都

53、已經(jīng)在一些虛擬篩選實例中得到應(yīng)用。,虛擬藥物篩選面臨的問題,（1）整個化學(xué)空間十分龐大，人們對于絕大部分化合物的生物性質(zhì)還不是很清楚或知之甚少。因此所篩選的數(shù)據(jù)庫通常是依據(jù)經(jīng)驗選擇自己所了解的庫，從而給篩選結(jié)果帶來很大的局限性。（2）受體模型經(jīng)常是一個十分復(fù)雜的結(jié)構(gòu)，例如蛋白質(zhì)、多糖，包含成千上萬個原子，而且在正常體液中一般處于流動狀態(tài)，因此時刻都在改變其構(gòu)象。假如以某個受體采用基于分子對接的篩選，則必須考慮受體構(gòu)象以及配體構(gòu)象的變化

54、情況。然而分子的構(gòu)象數(shù)隨著柔性鍵的數(shù)目成指數(shù)增長，并且虛擬篩選通常面對的是包含眾多數(shù)目化合物的數(shù)據(jù)庫，因此計算量十分巨大。在現(xiàn)有的計算條件下，仍是一個值得考慮的問題。（3）結(jié)合自由能是評價藥物與受體結(jié)合的指標(biāo)，雖然結(jié)合自由能的計算較為復(fù)雜，但是用熱力學(xué)積分法計算同類配體與受體的結(jié)合自由能還是可行的。然而數(shù)據(jù)庫中小分子數(shù)量很多，而且相互之間基本無關(guān)聯(lián)，因而計算如此多的小分子與受體結(jié)合自由能的計算量是十分驚人的。,結(jié)語,虛擬篩選是創(chuàng)新藥物

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

藥物發(fā)現(xiàn)的虛擬篩選方法

文檔簡介

溫馨提示

最新文檔

評論

藥物發(fā)現(xiàn)的虛擬篩選方法

文檔簡介

溫馨提示

最新文檔

評論

免費下載