2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、藥物發(fā)現(xiàn)的虛擬篩選方法,第一節(jié) 概述,計算機模擬與化學(xué)合成、生物測試的結(jié)合構(gòu)成了后基因組時代新藥研究的新策略。從已有的化合物,包括合成化合物和天然產(chǎn)物中尋找藥物或先導(dǎo)化合物,是藥物發(fā)現(xiàn)的一個重要途徑。到目前為止,人們只是針對大約500 種疾病的治療靶點,篩選了現(xiàn)已發(fā)現(xiàn)的2 000 多萬種有機化合物中大約10%的化合物,但仍然有大量的潛在活性化合物未被發(fā)現(xiàn)。,隨著科學(xué)技術(shù)的發(fā)展,各種先進技術(shù)應(yīng)運而生(X 射線晶體衍射法、多維核磁共振法、掃

2、描隧道顯微技術(shù)等),使得越來越多生物靶標(biāo)(蛋白質(zhì)、核酸、多糖等)的空間結(jié)構(gòu)被解析。同時計算機科學(xué)的發(fā)展又極大地提高了計算和分析的速度和精度。因此,自上世紀(jì)90 年代起,合理藥物設(shè)計就逐漸成為一種實用技術(shù)接融入到藥物研發(fā)的各個環(huán)節(jié)。,一、合理藥物設(shè)計,成功例子,奈非那韋(nelfinavir) 抗艾滋病藥物 HIV-1蛋白酶抑制劑依馬替尼(imatinib) 治療慢性骨髓型白血病藥物,二、數(shù)據(jù)庫空間,研究對

3、象 化學(xué)信息學(xué):小分子 生物信息學(xué):小分子結(jié)構(gòu)單元構(gòu)成的基因和蛋白質(zhì)等大分子,本質(zhì)上都是 化學(xué)物質(zhì)。計算方法 基于回歸的聚類分析;支持向量機;神經(jīng)網(wǎng)絡(luò);遺傳算法等。發(fā)揮作用方面 核酸和蛋白質(zhì)功能和結(jié)構(gòu);小分子配體和蛋白質(zhì)受體的相互作用;酶催化 等方面 。,化學(xué)信息學(xué)和生物信息學(xué)的共同點,是相互依存,相互影響,需結(jié)合在一起,才能解決大多數(shù)的實際問

4、題!,虛擬篩選的時間: 在化合物組合庫合成和/或篩選之前。虛擬篩選的空間: 在計算機上進行模擬設(shè)計和篩選。虛擬篩選的方法: 直接方法:基于分子對接(molecular docking)的虛擬篩選 間接方法:基于藥效基團(pharmacophore)的虛擬篩選,虛擬篩選(virtual screening, VS),虛擬篩選技術(shù)是藥物設(shè)計方

5、法的延伸和推廣,廣義地講只要是基于某種提問形式,從現(xiàn)有的小分子數(shù)據(jù)庫中,搜尋符合條件的化合物都可以稱之為虛擬篩選。這其中包括基于某些分子特性的數(shù)據(jù)庫搜索、基于分子對接的數(shù)據(jù)庫搜索、基于藥效團的數(shù)據(jù)庫搜索等,其目的是從幾十乃至上百萬個分子中篩選出新的先導(dǎo)化合物。由于實體的藥物篩選需要構(gòu)建大規(guī)模的化合物庫,提取或培養(yǎng)大量實驗必須的靶酶或者靶細(xì)胞,并且需要復(fù)雜的設(shè)備支持,因而進行實體的藥物篩選要投入巨額資金。而虛擬藥物篩選是將藥物篩選的過程在

6、計算機上模擬,對化合物可能的活性作出預(yù)測,這樣就能夠集中目標(biāo),大大降低實驗篩選化合物的數(shù)量,從而縮短研發(fā)周期、節(jié)約經(jīng)費開支。雖然早在20 世紀(jì)70 年代虛擬篩選技術(shù)已經(jīng)得到應(yīng)用,但由于技術(shù)本身的不成熟,使得在新藥開發(fā)上仍然主要依靠傳統(tǒng)的實驗篩選。近年來,隨著虛擬藥物篩選成功地發(fā)現(xiàn)了一些有開發(fā)價值的先導(dǎo)化合物,這項技術(shù)又重新引起大家的重視。,化學(xué)信息學(xué),產(chǎn)生的背景 組合化學(xué)和高通量篩選,出現(xiàn)了巨大的信息,需要快速收集、存儲、分析和

7、處理,隨著信息技術(shù)向化學(xué)領(lǐng)域的滲透,形成了新的交叉學(xué)科——化學(xué)信息學(xué)。研究內(nèi)容 化合物信息在計算機中的表示 化合物數(shù)據(jù)庫的建立、使用和管理 化合物相似性、多樣性及分子類藥性分析 化合物定量構(gòu)效關(guān)系,化學(xué)信息學(xué) Chemoinformatics,chemical informatics,Cheminformatics,chemi-informatics,利用計算機信息處理技術(shù)對化學(xué)分子結(jié)構(gòu)和相關(guān)信息

8、進行管理的一種綜合性技術(shù)和學(xué)科應(yīng)用化學(xué)信息學(xué)可促進化學(xué)信息的獲取、轉(zhuǎn)化與共享,一、化學(xué)信息的表示方法,化學(xué)分子,一維結(jié)構(gòu):化合物名稱(俗名);線性符號表示法。,二維結(jié)構(gòu):原子用元素符號,鍵用短線,即化合物結(jié)構(gòu)式。為平面結(jié)構(gòu)。,三維結(jié)構(gòu):原子的空間位置、相互間距離、鍵角和二面角等。,分子表面:建立在三維結(jié)構(gòu)基礎(chǔ)上,能與分子的三維結(jié)構(gòu)一一對應(yīng)。,苯丙氨酸分子結(jié)構(gòu)表征層次,,,,(一)一維結(jié)構(gòu)表示,SMILES(簡化分子線性輸入系統(tǒng))編

9、碼的基本原則,原子通常以大寫元素符號表示(省略氫原子),芳香結(jié)構(gòu)原子則以小寫表示。相鄰原子依次排放在一起,單鍵通常省略,雙鍵和三鍵分別以“=”和“#”表示,芳香鍵以“:”表示,也可省略。分支部分放在括號內(nèi),環(huán)則打開,并賦予斷開鍵兩端的原子以相同的數(shù)值。雙鍵“/”表示順式,“\”表示反式。原子順時針排列用@表示,逆時針排列用@@表示。,甲烷 CH4

10、 C乙醇 C2H5OH CCO氰化氫 HCN C#N環(huán)已烷 C6H12 C1CCCCC1吡啶 C5H5N n1ccccc1異丁

11、酸 (CH3)2CHCO2H CC(C)C(=O)O反式二溴甲烷 Br/C=C/Br 或Br\C=C\Br順式二溴甲烷 Br\C=C/Br 或Br/C=C\BrL-丙氨酸 N[C@@H](C)C(=O)OD-丙氨酸 N[C@H](C)C(=O)O,舉例說明,苯丙氨酸,,,,NC(Cc1ccccc1)C(

12、O)=O,,C/C=C\C=\[C@@H](O)C#N,SMILES編碼的立體化學(xué)信息表示,SLN編碼(Sybyl線性標(biāo)記法)的規(guī)則,原子以其元素符號表示,氫原子也要顯示;單鍵省略,雙鍵、三鍵和芳香鍵分別以“=” “#”和“:”表示;分支也采用括號表示;環(huán)也打開,依靠環(huán)上一個預(yù)先定義好的具有唯一編號的原子及@符號來識別,如環(huán)己烷表示為C[15]H2CH2CH2CH2CH2CH2@15;原子和鍵的屬性(如電荷、立體化學(xué)性質(zhì)等)可通過

13、方括號[ ]或尖括號在該原子后標(biāo)記出;對大分子的原子,可使用縮寫,如氨基酸可以用其三個字母縮寫形式表示。,(二)二維結(jié)構(gòu)表示,1、圖論基礎(chǔ)和圖的矩陣表示 一個簡單的圖由頂點(V)和邊(E)組成,因此圖被定義為一個三元組, φ為映射函數(shù)。在下面一個簡單的無向圖中, V={1,2,3,4}, E={e1,e2,e3,e4, e5, e6}。,圖也可用矩陣表示:設(shè)G=為無向圖,令mij等于頂點vi與邊ej的關(guān)聯(lián)次數(shù),

14、則稱(mij)n*m為G的關(guān)聯(lián)矩陣,記為M(G)。,用圖表示苯丙氨酸的結(jié)構(gòu),2、化合物結(jié)構(gòu)的矩陣表示(1)鄰接矩陣(以乙醛為例),(2)距離矩陣:表示了相應(yīng)原子之間的距離:幾何距離(用Å表示), 拓?fù)渚嚯x(兩原子之間連接的鍵的個數(shù)) (3)鍵矩陣:矩陣元素為相連接的兩個原子之間的鍵級。 雙鍵:2,三鍵:3。(4)關(guān)聯(lián)矩陣:是

15、一個n×m的矩陣。 頂點(原子)作為列(n),邊(化學(xué)鍵)作為行(m), 如果邊在頂點內(nèi),則相應(yīng)的元素置為1。,3、連接表,20世紀(jì)80年代開始,成為化合物在計算機中表示的最主要方法。首先對每個原子進行編號并列表然后在另一表格中列出鍵的信息,鍵級用整數(shù)表示,1表示單鍵,2表示雙鍵。,(三)三維結(jié)構(gòu)表示,1、直接坐標(biāo)法 用迪卡爾

16、坐標(biāo)直接存儲每個原子的三維坐標(biāo)(x,y,z),2、內(nèi)坐標(biāo)法,每個原子位置以與其他原子間的3個相對位置關(guān)系表示——相對距離、鍵角、二面角,(四)分子存儲格式及其相互轉(zhuǎn)換,基本存儲分子的元素組成、原子坐標(biāo)、原子連接關(guān)系其他存儲分子子結(jié)構(gòu)信息,適用于生物大分子原子電荷信息,調(diào)用時不必再計算確定特定原子化學(xué)環(huán)境的原子類型信息,二、化合物數(shù)據(jù)庫的生產(chǎn)和管理,目前有很多商業(yè)化合物數(shù)據(jù)庫可以利用 MDL藥物數(shù)據(jù)報告(MDDR)含有115

17、000個類藥性 化合物。 美國國家癌癥研究所(NCI)數(shù)據(jù)庫含有250000個 化合物。,MDL ISIS化學(xué)數(shù)據(jù)庫管理系統(tǒng),ISIS系統(tǒng)提供了基于Oracle 數(shù)據(jù)庫系統(tǒng)的各類化學(xué)信息系統(tǒng)的管理和開發(fā)工具,可以同時管理化學(xué)結(jié)構(gòu)、化學(xué)反應(yīng)、生物活性及譜圖等多種化學(xué)信息。ISIS已應(yīng)用于全球超過80%的化學(xué)與制藥企業(yè),已成為事實上的化學(xué)信息管理系統(tǒng)的工業(yè)標(biāo)準(zhǔn)。,ISIS (Integrated Scientif

18、ic Information Management System)——MDL的綜合性結(jié)構(gòu)和反應(yīng)管理軟件,由三個主要模塊組成:(1) 化學(xué)信息管理系統(tǒng):ISIS/HOST——主服務(wù)器應(yīng)用程序,進行通訊連接,集中數(shù)據(jù)庫數(shù)據(jù)并作處理(2) 化學(xué)信息生成和管理軟件:ISIS/BASE——用于生成局部數(shù)據(jù)庫及處理信息(3) 化學(xué)畫圖軟件:ISIS/DRAW——用于輸入結(jié)構(gòu)式和搜尋詢問條件,2D結(jié)構(gòu)輸入,——計算機繪制化學(xué)結(jié)構(gòu)式 首先輸入原

19、子和鍵的骨架結(jié)構(gòu),原子數(shù)、電荷會自動變?yōu)樯舷聵?biāo) 軟件的模板中收集大量分子片段 可智能分析結(jié)構(gòu)式,處理結(jié)構(gòu)式的編碼和變換 還可有附加功能,如自動命名、化學(xué)計算、光譜分析等,三維結(jié)構(gòu)的轉(zhuǎn)化,3D結(jié)晶結(jié)構(gòu)參數(shù)轉(zhuǎn)入3D數(shù)據(jù)庫,軟件將2D化學(xué)結(jié)構(gòu)迅速地轉(zhuǎn)為3D模型,三、分子相似性和多樣性分析,分子相似性和多樣性分析方法的原則:結(jié)構(gòu)相似的分子有著相似的性質(zhì)或活性。作用:在識別新的具有與已知化合物相同性質(zhì)或活性的化合物時具有十分重要的作用。

20、數(shù)據(jù)庫的化學(xué)多樣性(chemical diversity): 數(shù)量巨大的、結(jié)構(gòu)不同的貯藏和檢索系統(tǒng)——適用于先導(dǎo)化合物發(fā)現(xiàn) 數(shù)據(jù)庫的化學(xué)相似性(chemical similarity) 適用于先導(dǎo)化合物優(yōu)化評價方法:通過計算分子的描述符,并比較化合物描述符的近似程度。,分子描述符,概念:在相似性和多樣性分析中,需要建立化合物結(jié)構(gòu)和它們生 物活性或者理化性質(zhì)的映射,分子

21、描述符就是其中的一種映射。 作用:通常一個或多個描述符可以用來描述分子的結(jié)構(gòu)、性質(zhì)等, 如lgP在一定程度上反映了分子穿透細(xì)胞膜的能力;拓?fù)渲笖?shù)描述 了結(jié)構(gòu)的復(fù)雜性。 描述符的內(nèi)容是由兩方面決定的,一是化合物的分子表示,二是計 算描述符的算法。,分子描述的分類,分子相似性分析方法,基于定性特征的和基于定量特征的。對于兩個化合物A和B, a是A所具有而B不具有的特征數(shù)目 b是B

22、所具有而A不具有的特征數(shù)目 c是兩者共同的特征數(shù)目 d為兩者都不具有的特征數(shù)目 c和d表示了化合物A和B之間的相似性 a和b表示了化合物A和B之間的多樣性 所有的特征數(shù)目為n=a+b+c+d這樣,可以建立一種直觀的相似性評價方法:考察所有匹配的特征數(shù)目c+d在所有特征數(shù)目(c+d)+(a+b)中所占的比例,即(c+d)/(a+b+c+d)。這也被稱作為簡單匹配系數(shù)。可以看出,A和B均不具有的特

23、征并沒有表達任何信息,所以,d可以從上面的方法中刪除,得到了Tanimoto相似度計算公式。,,化學(xué)多樣性的定量表達——Tanimoto系數(shù),用化學(xué)空間中電荷和電勢等描述符比較不同分子的性質(zhì) TC = c /(a+b+c) a為A中基礎(chǔ)片斷的描述符的數(shù) b為B中基礎(chǔ)片斷的描述符的數(shù)目 c為

24、A和B中共有的基礎(chǔ)片斷的描述符的數(shù)目相同分子TC = 1;分子沒有共同描述符時TC = 0,相似性搜尋,根據(jù)分子相似性原理,可以在數(shù)據(jù)庫中搜尋與目標(biāo)分子具有一定相似性的分子,即相似性搜尋。步驟: 1、目標(biāo)選擇 2、描述符選擇和編碼 3、相似性評價方法選擇 4、搜尋語句的輸入 5、相似性打分,四、互聯(lián)網(wǎng)上的化學(xué)信息資源,(一)化學(xué)搜索引擎1、大型通用搜索引擎:Google、百度等。

25、2、專門用于搜索化學(xué)信息的引擎:ChemFinder, MetaXchem…..(二)互聯(lián)網(wǎng)上的化學(xué)數(shù)據(jù)庫1、文獻數(shù)據(jù)庫(CA、Medline)2、化合物數(shù)據(jù)庫(Gmelin, CSD)3、綜合數(shù)據(jù)庫(Beilstein、PDB),常用化合物數(shù)據(jù)庫,FCD (Fine Chemicals Directory)—— MDL 維護。收載約90 000化合物和20 000化合物數(shù)據(jù),包括化學(xué)系統(tǒng)名、俗稱、分子式、分子量、供應(yīng)商、價格、

26、CAS登錄號、純度等。可通過結(jié)構(gòu)式或其它任何數(shù)據(jù)檢索ACD (Available Chemicals Directory) ——MDL維護。FCD數(shù)據(jù)庫加上可大批量供貨的化學(xué)品信息。目前有25萬個化合物CSD(Cambridge Structure Database) —— 20多萬個結(jié)晶的3D結(jié)構(gòu)實驗數(shù)據(jù)及相關(guān)數(shù)據(jù),常用數(shù)據(jù)庫的網(wǎng)址,生物信息學(xué)(bioinformatics),基于數(shù)學(xué)、生命科學(xué)、化學(xué)和計算機科學(xué)的交叉學(xué)科. 利用

27、計算機信息處理技術(shù)對大量生物大分子作信息獲取、加工、儲存、分類、檢索與統(tǒng)計分析,揭示生物大分子的分子結(jié)構(gòu)、功能、同源性和進化關(guān)系. 推動生命科學(xué)的發(fā)展,為創(chuàng)新藥物的研究和開發(fā)奠定基礎(chǔ).,生物信息學(xué)的應(yīng)用,核酸序列分析指直接從基因組序列中獲取信息,同時為后者提供數(shù)據(jù);蛋白質(zhì)序列分析中,大部分是對同源蛋白序列進行比對分析,以得到不同蛋白質(zhì)之間的序列相關(guān)性,從而推測蛋白質(zhì)功能等。二者分析方法一致。,生物大分子結(jié)構(gòu)預(yù)測,虛擬篩選,生物大分子包

28、括DNA、RNA、蛋白質(zhì)和脂類。它們的結(jié)構(gòu)預(yù)測指建立精確的三維構(gòu)象,這對于生物大分子功能的闡明十分重要。而尚無晶體結(jié)構(gòu)數(shù)據(jù)的生物大分子,可采用分子模擬的方法預(yù)測大分子的三維結(jié)構(gòu)。,在進行生物活性篩選之前,在計算機上對化合物分子進預(yù)篩選,以降低實際篩選化合物數(shù)目,同時提高先導(dǎo)化合物發(fā)現(xiàn)效率。,藥物發(fā)現(xiàn)中的生物信息學(xué)方法,一、核酸和蛋白質(zhì)的序列分析,(一) 單個序列分析 根據(jù)單個氨基酸物化性質(zhì)推測整個蛋白質(zhì)的性質(zhì)

29、,也可對序列進行統(tǒng)計分析,預(yù)測二級結(jié)構(gòu)出現(xiàn)可能性. 20種氨基酸的疏水參數(shù),根據(jù)統(tǒng)計值:Glu經(jīng)常出現(xiàn)在α-螺旋中;Val常在β-折疊中發(fā)現(xiàn); Pro通常不出現(xiàn)于α-螺旋中和β- 折疊中而傾向于在回折中……,(數(shù)值=1代表偏好處于平均;>1代表偏好大于平均;<1代表偏好小于平均),(二) 雙重序列比較——序列比對,序列對比可以用各種矩陣表達并作相似性打分兩個殘基越

30、相似則打分值越高.,(三) 多重序列比對,多重序列比對可更多揭示相關(guān)蛋白質(zhì)序列中的保守區(qū)域,進而分析蛋白質(zhì)的結(jié)構(gòu)和功能??刹捎枚喾N統(tǒng)計算法進行多重序列比對。,二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測,蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的意義,蛋白質(zhì)的二級結(jié)構(gòu)有α螺旋、β折疊、β轉(zhuǎn)角等。因為每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向,而且所有蛋白質(zhì)中約85%的氨基酸殘基處于上述3種基本二級結(jié)構(gòu)狀態(tài),所以從序列預(yù)測蛋白質(zhì)二級結(jié)構(gòu)是可行的。,1、Chou-Fasman方

31、法2、GOR方法3、基于氨基酸疏水性的方法,蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的方法,主要預(yù)測方法,1、從頭預(yù)測法(ab initio prediction),采用理論計算(分子力學(xué)、分子動力學(xué)、量子化學(xué))方法,直接從分子和原子參數(shù)計算出蛋白質(zhì)分子的穩(wěn)定構(gòu)象,理論上最理想的方法,但計算量極大,對于實際分子的計算超過能力范圍,2、穿針引線法,根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維結(jié)構(gòu)——基于知識的預(yù)測可應(yīng)用于進化非常疏遠(yuǎn)的結(jié)構(gòu)預(yù)測未知蛋白序

32、列與折疊庫中已知結(jié)構(gòu)的蛋白序列作匹配計算,將序列吻合的三維結(jié)構(gòu)模塊串連起來,得到整個蛋白三維結(jié)構(gòu),同源蛋白模建法homologous model building比較分子模擬法comparative molecular modeling同源模建 homology modeling同源蛋白法 protein homology,根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維結(jié)構(gòu)——基于知識的預(yù)測同源蛋白有著相似的來源、相似

33、的結(jié)構(gòu)和生物功能。通過比較蛋白序列的相似性,按同源蛋白的三維結(jié)構(gòu)為模板,構(gòu)建未知蛋白的結(jié)構(gòu)一般要求同源性在30%以上,特別是在結(jié)合區(qū)域同源性要好,步驟,(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白(2)二重或多重序列對比步驟(3)找出共同的二級結(jié)構(gòu)區(qū)域,構(gòu)建骨架(4)對初始模型作能量優(yōu)化(5)判斷結(jié)構(gòu)合理性,三、代表性生物信息學(xué)數(shù)據(jù)庫,(一)核酸數(shù)據(jù)庫GenBank——NIH所屬國家生物技術(shù)信息中心NCBINucleic Ac

34、id Database(NDB)—— 由European Molecular Biology Laboratory( EMBL)創(chuàng)建,現(xiàn)由英國劍橋的歐洲生物信息學(xué)研究所( European Bioinformatics Institute, EBI)維護DNA Data Bank of Japan(DDBJ)——日本國立遺傳學(xué)研究所的日本信息生物學(xué)中心( Center for Information Biology, CIB)開發(fā)維

35、護三大庫可交互,(二)蛋白質(zhì)數(shù)據(jù)庫,PDB ( Protein Data Bank at Brookhaven National Laboratories ) —— 美國 Research Collaboration for Structural Bioinformatics, RCSB開發(fā)維護的多肽、酶、病毒、碳水化合物和核酸的三維結(jié)構(gòu)數(shù)據(jù),基于藥效基團搜索的方法,藥效團的概念早在1909 年就由Ehrilich 提出,特

36、指載有活性必須特征原子的分子框架?,F(xiàn)在泛指生物活性分子(一般指小分子)中對活性起重要作用的“藥效特征元素”的空間排列形式。這些“藥效特征元素”可以是某些具體的原子或原子團,比如氧原子、苯環(huán)等;也可以指特定的功能結(jié)構(gòu),如疏水基團、氫鍵給體、氫鍵受體等。在得到某類抑制劑的藥效團模型后,就可以以藥效團作為提問結(jié)構(gòu)進行數(shù)據(jù)庫搜索,從數(shù)據(jù)庫中篩選得到符合該藥效團的候選分子,而在這些候選分子中可能包含新的先導(dǎo)化合物。,(1)初篩:其作用是先篩去那些

37、不能與提問結(jié)構(gòu)匹配的分子,減少進入下一個階段的候選分子數(shù)。大多數(shù)軟件都把在該藥效團中出現(xiàn)較多的原子或基團作為約束條件,含有這些基團的則通過初篩,否則被淘汰。(2)二維子結(jié)構(gòu)匹配:其目的是確定測試分子中藥效模式間的連接方式是否符合提問結(jié)構(gòu),這是一個較為耗時的過程。(3)三維結(jié)構(gòu)搜索:在通過二維子結(jié)構(gòu)匹配證明其包含藥效團以后,就需要驗證它在數(shù)據(jù)庫中的構(gòu)象和藥效特征元素是否滿足空間限制條件,如果滿足則該分子是一個命中結(jié)構(gòu)。,基于藥效團的搜

38、索一般包含3 個基本步驟,基于藥效團的搜索軟件,CATALYST 是由美國Accelrys 公司面向藥物研究領(lǐng)域的綜合性開發(fā)軟件,由于這一軟件為藥效團模擬提供了完善的解決方案,使得CATALYST 成為近年來在基于藥效團模型的藥物開發(fā)方面使用最廣泛的軟件。它能將抽象的藥效特征元素與靈活的幾何約束條件相結(jié)合,尤其在定義藥效團模型時,能夠表達重要的化學(xué)概念。在進行基于藥效團模型的數(shù)據(jù)庫搜索時,其一維限制條件與某些數(shù)據(jù)相聯(lián)系,如分子量、lgP

39、 、pKa 等,從而把搜索限定在某些數(shù)值范圍內(nèi);二維約束支持定義包含子結(jié)構(gòu)或排除子結(jié)構(gòu),如包含芳香環(huán),不包含羰基等;三維檢索時,對每個分子在生理條件下可能采取的各種構(gòu)象進行搜索。為實現(xiàn)最佳的檢索性能,CATALYST 經(jīng)過了高度優(yōu)化,即使最抽象的(化學(xué)表達)檢索也不例外。,UNITY 是另一搜索化學(xué)或生物數(shù)據(jù)庫的搜索系統(tǒng),由美國Tripos 公司開發(fā)。包括2D(搜索特殊片段)、相似性、3D(搜索特征的三維結(jié)構(gòu)或藥效團)、柔性(允許小分子

40、通過改變鍵角、二面角等方式符合3D 條件)搜索。UNITY 在進行藥效團搜索時,支持3D/Flex 搜索,檢索的藥效團特征包括給體原子(donor atom)、受體原子(accept atom)、給體位點(donor site)、受體位點(accept site)以及疏水中心(hydrophobic center)等。在對小分子數(shù)據(jù)庫進行藥效團搜索時,采用的特征限制條件可以是具體的原子或基團,如上述的給體原子、受體原子、疏水中心;也可以

41、是某些配體將與之發(fā)生作用的位點,即給體位點和受體位點等。,基于藥效基團的結(jié)構(gòu)搜尋,1、二維藥效基團搜尋,以平面的提問結(jié)構(gòu)搜尋化合物結(jié)構(gòu)式,(1)二維子結(jié)構(gòu)搜尋,搜尋具有與提問結(jié)構(gòu)相同子結(jié)構(gòu)的化合物分子,(2)二維相似性搜尋,搜尋與提問結(jié)構(gòu)某些特征相似的化合物分子,2、三維藥效基團搜尋,搜尋具有與相同作用基團和空間排布的化合物分子,[例] 新抗生素的尋找,[例] D2/D3受體選擇性拮抗劑藥效基團模型,多巴胺D2類受體為抗帕金森癥和安定類

42、藥物的靶點D3/D4受體可能與精神分裂癥有關(guān)D2受體選擇性拮抗劑——取代哌嗪/哌啶類,D3受體選擇性拮抗劑——苯酰胺類和四氫萘類,藥效基團模型的建立,挑選26個D2受體選擇性和22個D3受體選擇性的化合物分別作為訓(xùn)練集,分別產(chǎn)生D2受體D3受體模型 以Catalyst 將結(jié)構(gòu)式轉(zhuǎn)化為三維構(gòu)象, 用Best conformational analysis進行構(gòu)象優(yōu)化用Catalyst/HypoGen產(chǎn)生藥效基團。選擇5個結(jié)構(gòu)特征

43、作為藥效基團單元:HB Acceptor,HB Donor, HYDPHOBIC , HYDROPHOB aromatic , RING AROMATIC 為D2/D3受體選擇性拮抗劑分別產(chǎn)生了10個得分從高到低的Hypothesis,藥效基團模型的可信度,對于D2受體和D3受體產(chǎn)生的藥效團模型,每個藥效基團模型的得分與理想模型的得分差值均大于40,說明數(shù)據(jù)關(guān)聯(lián)的可能性較大所建立的D2受體和D3受體藥效團模型可用于虛擬篩選,未知化合

44、物的活性預(yù)測,以未知化合物作為驗證集大部分預(yù)測值與實驗值處于同一個數(shù)量級,并反映D2/D3受體的選擇性,D2(左)和D3(右)受體拮抗劑藥效基團MAPPING圖,[例] Muscarinic M3 受體拮抗劑的篩選,過敏性腸道綜合癥與慢性阻塞性氣管病均與受體Muscarinic M3 有關(guān)。1999 年,Marriott 等采用基于藥效團搜索的方法進行了Muscarinic M3 受體拮抗劑的篩選。他們從文獻中選出3 個已知的抑制劑,

45、利用DISCO 程序構(gòu)建藥效團模型,最終有2 個四點模型用于數(shù)據(jù)庫搜索(圖)。數(shù)據(jù)庫搜索使用UNITY 程序,數(shù)據(jù)庫為自己課題組所構(gòu)建,2 個藥效團模型篩選得到177 個完全不同的分子,生物活性檢測發(fā)現(xiàn)其中有3 個分子具有較高的活性。,[例]對MC 增生抑制劑的篩選,腎小球毛細(xì)血管中的血管系膜細(xì)胞(mesangial cell,MC)的增生與許多血管疾病的發(fā)生有關(guān)。2001年,Kurogi 等采用基于藥效團的數(shù)據(jù)庫搜索對MC 增生抑制劑

46、進行了篩選,研究組從現(xiàn)有抑制劑出發(fā),藥效團識別采用CATALYST,構(gòu)建了包含7 個藥效特征元素的藥效團模型。然后CATALYST 搜索了包含47 045 個分子的數(shù)據(jù)庫,得到41 個命中結(jié)構(gòu),生物活性檢測其中4 個化合物具有明顯的MC 增生抑制活性。,三、基于定量構(gòu)效關(guān)系的虛擬篩選,定量構(gòu)效關(guān)系方法及篩選,定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)研究方法在現(xiàn)

47、代藥物設(shè)計方法中占有重要的地位,也是應(yīng)用最為廣泛的藥物設(shè)計方法。其目的是采用數(shù)理統(tǒng)計的方法研究和揭示化合物的活性與其分子理化性質(zhì)之間的定量變化規(guī)律。傳統(tǒng)的二維定量構(gòu)效關(guān)系方法,如Hansh 法、模式識別Free-Wilson 法、電子拓?fù)浞ǖ仍缫褳榇蠹宜熘?。隨著QSAR 理論及統(tǒng)計方法的發(fā)展,反映更加豐富信息的三維定量構(gòu)效關(guān)系方法如比較分子場分析(CoMFA)方法、距離幾何法及分子形狀分析方法等都迅速得到了廣泛應(yīng)用。,基于定量構(gòu)效關(guān)系

48、篩選的方法也是最早發(fā)展起來的虛擬篩選方法,并已由平面的2D 發(fā)展至空間的3D 模式。利用軟件(如Tripos 公司的CoMFA 或Accelrys 公司的CATALYST)分析一系列已知化合物的各種性質(zhì)、理化指標(biāo),構(gòu)建定量構(gòu)效關(guān)系。在構(gòu)效關(guān)系確定之后,即可應(yīng)用于搜索各類數(shù)據(jù)庫,篩選常使用的有Cerius2 中的Diversity 模塊。,實 例,磺酰脲類除草劑最初開發(fā)在20 世紀(jì)70 年代,當(dāng)時由于目標(biāo)受體ALS 酶的三維結(jié)構(gòu)尚不確

49、定,南開大學(xué)李正名教授課題組從配體出發(fā),選定了32 個化合物進行構(gòu)效關(guān)系研究。利用分子模擬與設(shè)計軟件包SYBYL 中的CoMFA 構(gòu)建了相應(yīng)的三維定量構(gòu)效關(guān)系模型。利用此模型以及Cerius2 的Diversity 模塊進行數(shù)據(jù)庫的虛擬篩選及活性預(yù)測,并挑選出20 個預(yù)測活性高的化合物進行合成,取得了較好的結(jié)果。,四、 基于藥代動力學(xué)的虛擬篩選,在傳統(tǒng)的藥物設(shè)計流程中,對于候選化合物最關(guān)心的往往是其能否與靶酶的活性位點結(jié)合,至于這個化

50、合物能否在腸道溶解、透過細(xì)胞膜達到有效部位等問題考慮的并不多。這也直接導(dǎo)致了在過去20 年,世界前50 強制藥企業(yè)每年平均花費75 億美元僅開發(fā)出21 個上市新藥,而真正能上市的藥物與候選藥物的比例始終保持在1/10,其中原因絕大部分出在藥代動力學(xué)或安全(化合物毒性)問題上。因此,在藥物研制的早期階段對化合物的藥代動力學(xué)和毒性進行全面的評價也是十分重要的。,得到藥代動力學(xué)模型通常包含3 個步驟:(1)利用小型化技術(shù)(miniatur

51、ization)制作一系列體外培養(yǎng)基。(2)借助計算機虛擬篩選一系列化合物,并對這些培養(yǎng)基進行評價。(3)對預(yù)測模型進行實際檢驗并修正,從而這些虛擬模型將最終取代真實體內(nèi)或體外實驗,成為篩選的模型。,Chris Lipinski 及其合作者通過高通量篩選以及組合化學(xué)取樣,分析了WDI 中的2 245 個藥物。為了查明普通口服藥物的共同特性,總結(jié)出了著名的Chris Lipinski “5 規(guī)則”,包括分子量不能超過500、油水分配系

52、數(shù)CLogP 小于5 等。,基于藥代動力學(xué)篩選較快捷,主要針對整個數(shù)據(jù)庫,通常先于藥效團篩選、對接篩選。因此篩選條件應(yīng)盡量完善,否則很可能剔除潛在先導(dǎo)化合物。除上述“5 規(guī)則”之外,可極化表面積(PSA,一般應(yīng)小于140.2)、在生理條件下油水分配系數(shù)、溶解度、在小腸及腦滲透率都應(yīng)是被考慮的篩選條件,這樣才能保證整個虛擬篩選過程準(zhǔn)確性、高效性。,除了上述4 種篩選方法外,還有其它數(shù)據(jù)庫搜索技術(shù),如子結(jié)構(gòu)匹配篩選、相似性搜索等,這些技術(shù)都

53、已經(jīng)在一些虛擬篩選實例中得到應(yīng)用。,虛擬藥物篩選面臨的問題,(1)整個化學(xué)空間十分龐大,人們對于絕大部分化合物的生物性質(zhì)還不是很清楚或知之甚少。因此所篩選的數(shù)據(jù)庫通常是依據(jù)經(jīng)驗選擇自己所了解的庫,從而給篩選結(jié)果帶來很大的局限性。(2)受體模型經(jīng)常是一個十分復(fù)雜的結(jié)構(gòu),例如蛋白質(zhì)、多糖,包含成千上萬個原子,而且在正常體液中一般處于流動狀態(tài),因此時刻都在改變其構(gòu)象。假如以某個受體采用基于分子對接的篩選,則必須考慮受體構(gòu)象以及配體構(gòu)象的變化

54、情況。然而分子的構(gòu)象數(shù)隨著柔性鍵的數(shù)目成指數(shù)增長,并且虛擬篩選通常面對的是包含眾多數(shù)目化合物的數(shù)據(jù)庫,因此計算量十分巨大。在現(xiàn)有的計算條件下,仍是一個值得考慮的問題。(3)結(jié)合自由能是評價藥物與受體結(jié)合的指標(biāo),雖然結(jié)合自由能的計算較為復(fù)雜,但是用熱力學(xué)積分法計算同類配體與受體的結(jié)合自由能還是可行的。然而數(shù)據(jù)庫中小分子數(shù)量很多,而且相互之間基本無關(guān)聯(lián),因而計算如此多的小分子與受體結(jié)合自由能的計算量是十分驚人的。,結(jié)語,虛擬篩選是創(chuàng)新藥物

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論