《分子对接与药物虚拟筛选1.ppt》由会员分享,可在线阅读,更多相关《分子对接与药物虚拟筛选1.ppt(49页珍藏版)》请在三一办公上搜索。
1、7.4 分子对接,分子对接方法在药物设计中取得巨大的成功,已经成为基于结构药物设计的最重要的方法之一,分子对接的最初思想起源于Fisher E提出的“锁和钥匙模型”。即受体与配体的相互识别首要条件是空间结构的匹配,配体 受体 复合物,受体配体的锁和钥匙模型,Oh boy!What a perfect match,这类方法首先要建立大量化合物(例如几十至上百万个化合物)的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”(docking),通过不断优化小分子化合物的位置(取向)以及分子内部柔性键的二面角(构象),寻找小分子化合物与靶标大分子作用的最佳构象,计算其相互作用及结合能。在库中所
2、有分子均完成了对接计算之后,即可从中找出与靶标分子结合的最佳分子(前50名或前100名),分子对接的基本原理,药物与受体的结合强度取决于结合的自由能变化,G结合=H结合-TS结合=-RT ln Ki,大部分的分子对接法忽略了全部的熵效应,而在焓效应也只考虑配体与受体的相互作用能,即:,Einteraction=Evdw+Eelectrostatic+Eh-bond,7.4.1 分子对接的基本方法,(一)刚性的分子对接方法,这种方法是最初的分子对接的方法,在对接中,小分子和蛋白质两种都保持刚性。,(1)基于最大团搜索的方法(Clique-Search Based Approaches),对接两个
3、刚性分子可以理解为分子在空间的匹配问题,这种匹配可以是一种形状上的互补或相互作用。如氢键受体与氢键给体的互补。搜索在三维空间中有效的条件下的最大匹配,受体的活性位点,配体,有效匹配的距离图集,受体配体的示意图,字母代表特征部分如氢键等,相应的有效匹配的图集如右,三个环性顶点组织的三角形为这个图集的一个最大团(clique),Dock对接程序中刚性对接的算法就是基于这种思想,Dock利用球集来表示受体活性位点和配体的形状,一系列的球集填充在受体活性位点的表面,这些球集代表能被配体占据的体积。配体可以用球集表示或者用自己的原子表示,在Dock程序中,四个有效匹配的对应点被考虑,先考虑配体中第一个球
4、集与活性位点的球集的匹配,第二个点则满足d,其中d为第二个匹配点中配体和受体的球心与第一个点球心的距离,第三个点又必需满足与前两个球心的距离限制,以上过程一直进行到找不到更多匹配点为止。,(2)基于几何哈希技术“geometric hashing”的方法,第一部分中,几何哈希表从被对接的一个配体或一系列配体中构建。哈希矩阵含有配体名字和能调整配体在空间方向的参考框架。,第二部分即识别阶段,蛋白质的特征用来识别哈希矩阵,每一次匹配表示蛋白质的特征与哈希矩阵中已定义好方位的配体相匹配,具有大量匹配信息的哈希矩阵代表着具有几个吻合特征的配体和方位,(3)基于pose clustering的方法,这种
5、方法与几何哈希的方法相类似,也是一种基于模式识别的方法。,在LUDI模型中,如图所示,对每一个作用基团,定义作用中心和作用表面。受体的作用表面近似地用离散的点表示,和对应的配体的中心目标点相匹配。,三个氢键受体的作用表面,Pose clustering 算法中的作用点,(二)柔性对接的方法,(1)构象的系综方法,Flexibase用来储存小分子库中每个分子的一系列不同构象,用距离几何和能量最小化的方法产生构象,每个分子根据rmsd的差异选择25个系列构象。每个构象采用FLOG刚性对接的方法进行对接。,(2)片段的方法,片断的方法是处理小分子柔性的最通用的方法,配体分割成一些小的片断,这些片断可
6、以认为是刚性构象或一个小的构象系综。一般,有两种方法来处理:第一种方法是把一个片段放入受体的作用位点,然后加上余下的片段,这种方法称为连续构建“incremental construction”.第二种方法把所有或一部分片段独立地放入受体的作用位点,再重新连接至到构成一个完整的配体分子,这种策略称为“放置&加”“place&join”,第一个连续构建的算法是Kuntz发展的Dock程序,首先,一个单独的锚碎片通过手工选择对接进受体的活性结合位点,并且考虑了氢键的作用。其次这个锚的优势位置主要包含有有大量匹配氢键对,高打分值,和低相似性。接着,一种回溯的算法(backtracking algor
7、ithm)用来搜索整个配体在结合位点的非重叠放置空间,在当前位置加上一个碎片后,优化的方法用来减少立体的张力和改善氢键的几何构型。最后的位置通过过滤,优化和基于力场的方法来打分评价。FlexX也是一个基于连续构建算法的对接程序,(3)遗传算法和进化规划,遗传算法开始应用到分子对接技术,其特点为:,第一步,一个称为染色体的线性表示符能够描述构型的所有自由度,找到这个染色体描述符是算法中最困难的一步。第二步,确定一个一个类似如打分函数的目标函数。,著名的GOLD软件包括了这种算法,(4)基于分子模拟的方法,模拟退火的方法,Autodock程序就采用了这种方法,分子动力学的方法,Monte Carl
8、o模拟,一种统计力学的方法,这种算法中最重要的两部分是自由度的描述和能量的评价,合适的自由度描述可以避免较高能量的构象,用键角、扭曲角等内座标来描述配体的柔性比用笛卡儿空间的三维座标描述要强,同样,能量的评价也是最耗时,这一步时间必须足够的长。,评价:打分函数,每一个对接的算术都会采用平衡了时效和精确度的简单自由能预测方法,现在的打分函数主要包括三种:基于经验的回归参数的方法;基于分子力场的方法和基于知识的方法、基于知识的打分函数。,(1)基于力场的方法,只考虑热焓对能量的贡献,不考虑熵的影响,一般情况下,采用标准力场的非键作用能如真空静电和范德华作用能用作打分函数,如DOCK程序中采用AMB
9、ER的能量函数:,(2)基于经验的打分函数,基于经验的打分函数用多元回归的方法拟合各种物理参数对结合自由能的贡献,如FlexX程序中采用下列函数,所采用的方程包括,配体旋转键的个数、氢键、离子键,疏水和芳香环的堆积作用,以及亲水作用。这种方法能快速直接地估算结合自由能,,(3)基于知识的打分函数 最初应用于蛋白质结构预测,打分函数用统计力学的方法得自蛋白质配体的复合物结构,结合自由能用函数为分子间距离的平均能的加和来计算。基于知识的打分函数是一种比较有前途的方法,7.4.3虚拟筛选的具体流程,包括4个步骤:受体模型的建立;小分子库的产生;计算机筛选和命中化合物的后处理。,第一步,受体模型的建立
10、:,蛋白质结构的准备是虚拟筛选的重要一步。虚拟筛选的蛋白靶标的结构可以从PDB库(http:/www.rcsb.org/pdb/index.html)中直接下载使用,也可以通过和家族中同源蛋白的序列、结构信息比较,同源模建而得,1)大分子结构获取,2)接着是结合位点的描述,选择合适的配体结合口袋对分子对接至关重要,一种是直接从配体受体复合物结构中抽出;,选择口袋有两种方式:,如果没有复合物结构,则需要根据生物功能如结合、突变等实验信息来手动选择结合部位,第二步,建立小分子数据库,二维结构用结构转换程序如CORINA、CONCORD实现三维结构的转化。,建好的三维结构加氢加电荷后,便可以用于对接
11、程序。,第三步,对接和打分,这一步是虚拟筛选的核心步骤。,对接操作就是把每个小分子放到受体蛋白的配体结合位点,优化配体构像和位置,使之与受体有最佳的结合作用,给最佳结合构象打分,对所有化合物根据打分排序,然后从化合物库中挑出打分最高的小分子。,最后一步是命中化合物的后处理,通过计算分子的类药性质ADME/T(吸收absorption、器官分布distribution、体内代谢metabolism、排泄excretion 和毒性toxicity)性质的估算,排除那些不具有类药性质的分子。,可以利用一些经验规则如“五规则”等,快速排除那些不适合进一步药物开发的分子。,通过以上四步处理,大部分分子从
12、化合物库中剔除,形成一个合理大小的化合物库,仅对这些适合成药的化合物或购买、或合成、或分离得到,然后再进行实际的生物测试。,对接方法尚需解决的问题:,分子的柔性,溶剂化效应,打分函数,7.4.4分子对接的应用,(一)配体对CDK2,CDK4激酶选择性的研究,细胞周期蛋白依赖性蛋白激酶(cyclin-dependent kinases,CDKs)是一类Ser/Thr 蛋白激酶,直接参与调控细胞分裂周期,顾名思义,CDK只在周期蛋白Cyclin活化下才能工作.现在已经发现了13种CDK蛋白激酶和25种周期蛋白Cyclin,但它们具体的生物功能还不十分明了。其中CDK2、CDK5、CDK6已经解析出
13、晶体结构,但CDKs的一级序列存在高的同源性,它们之间一级序列的高同源性暗示了三维结构的相似性,CDK1、CDK2、CDK4、CDK6是基于CDKs结构化学治疗癌症的主要靶标。至今为止,文献报告的CDKs抑制剂有多种,尽管化合物结构各异,但所有CDKs的小分子抑制剂有一些共同的特点:,(1)一般小的分子量(600);(2)平面、疏水性的多环化合物;(3)主要通过和ATP竞争来占据酶的ATP结合口袋;(4)主要通过疏水和氢键作用和酶结合;(5)配体与CDK2作用时,一般与Leu83和Glu81形成氢键。,NU6102(6-cyclohexylmethyl-2-(4-sulfamoylanilin
14、o)purine)是第一个基于活化状态的CDK2-cyclin A复合物结构的高效的小分子抑制剂。实验表明NU6102对CDK2和CDK4有着不同的选择活性,对CDK2有一个较高的亲和力Ki=6nM,但是对CDK4的亲和力比较低Ki=1600nM,为了解释这种选择性差异的起源,小分子NU6102的结构,CDK2NU6102的作用模式图,解决思路:,采用同源模建、分子对接、分子动力学模拟和自由能计算来阐明配体和激酶的作用机理。,由于CDK4的三维结构还没有解析出来,所以我们通过序列联配、同源模建的方法得到CDK4的结构,在通过分子对接的方法得到NU6102CDK4的复合物结构。,CDK2和CDK
15、4的序列联配,序列同源性45.6%,通过分子对接得到CDK4NU6102的作用模式,通过CDK4NU6102复合物和CDK2NU6102复合物结构对比,可以很清楚地看到造成NU6102亲和力差别的主要原因是在CDK2NU6102复合物中,Asp86位起了一个很重要的识别作用,它与配体的磺胺基形成了两个稳定的氢键,并且通过能量分解的方法也可以得到导致配体活性差异主要识别基团在磺胺基,(二)SARS冠状病毒3C-like蛋白酶抑制剂的设计,熊兵等人结合同源模建、分子虚拟筛选的方法设计了抗SARS冠状病毒3C-like蛋白酶的抑制剂。,SARS冠状病毒3Clike蛋白酶在SARS病毒其他功能蛋白的形
16、成过程中起重要作用,阻断SARS病毒3Clike蛋白酶的作用可以阻止SARS病毒的复制,并最终达到治疗SARS的目的,在TGEV的主蛋白酶三维晶体结构的基础上,构建了SARS病毒的3Clike蛋白酶三维结构,SARS病毒的3C-like蛋白酶的三维模建结构,通过序列联配和采用MOLCAD/SYBYL活性位点分析,表明SARS病毒3C-like蛋白酶和TGEV主蛋白酶两者的结合口袋比较类似,同一结构家族的组织蛋白酶抑制剂分别与SARS冠状病毒3C-like蛋白酶和TGEV的主蛋白酶的复合物模型如图723,从图中可以看出两者的作用模式也是十分类似。,SARS病毒3C-like蛋白酶和TGEV主蛋白
17、酶与抑制剂结合图,在SARS病毒3C-like蛋白酶活性位点确定之后,再通过查询MDDR数据库得到了73个蛋白酶抑制剂的小分子数据,对SARS病毒3C-like蛋白酶和TGEV的主蛋白酶进行了分子对接参数的调节和优化。,结果表明大多数分子与两个蛋白酶的结合相似,并且对DOCK打分进行相关性分析,表明结合能力较为一致,,在优化好的3Cl蛋白酶的三维结构模型和DOCK对接程序参数的基础上,对含有数十万多个小分子化合物库,用DOCK 4.0初筛,从每一个数据库筛选结果中选择DOCK打分前1000名的分子,进一步做类药性分析和多种评价函数包括SYBYL中的Cscore打分函数和Autodock的经验自
18、由能评价方法进行打分,再根据药物化学家的经验来进行人工挑选,最终对每个数据库选择100个分子进行生物测试,这次虚拟筛选找到300个可能具有抗SARS冠状病毒的候选化合物,发现了7个具有高活性的化合物,进一步的细胞水平的实验,发现5-HT受体拮抗剂具有明显的抗SARS病毒感染和保护细胞的作用,其EC50值小于10mg/L,这一研究成果已经申请专利,7.4.5 DOCK具体操作实例,DOCK流程图,DOCK具体操作步骤,(一)大分子的准备,在Sybyl6.8中将原始PDB中的配体、水、离子及结合因子等删除,然后把缺失的残基和原子补全,分别存成protein.pdb和protein.mol2文件,其
19、中protein.pdb不加氢、不分配电荷;protein.mol2文件加全氢,并分配电荷,电荷一般可选择KOLLMANALL ATOM或KOLLMAN UNITED ATOM电荷。另外还需做exclude.pdb,该PDB包含除组成活性口袋以外的残基,(二)小分子的准备,小分子加氢和Gasteiger Marsili电荷,并进行简单的能量优化,将得到的所有小分子存成一个MOL2文件database.mol2,(三)用autoMS产生表面点,得protein.ms和INSPH文件,其中protein.ms为口袋的表面点文件,INSPH为球集生成程序sphgen的输入文件。autoMS prot
20、ein.pdb,(四)用sphgen产生表征口袋形状的球集,得到protein.sph文件,该文件即为球集文件。用showsphere程序由protein.sph生成sphere.pdb,用Sybyl或Weblab等程序观看球集的分布。,(五)用showbox产生一表征网格范围的文件box.pdb,(六)计算打分用的网格文件,首先建立grid4的输入文件grid.in,所需文件还有protein.mol2和box.pdb,然后用以下命名生成网格文件:grid4 i grid.in,(七)建立dock的输入文件dock.in,所需文件还有protein.sph、database.mol2和网格文件,然后进行dock:dock4 i dock.in,(八)Dock完毕后得到结果文件result.info和result.mol2,以及保留恢复文件result.rst。,(九)中途非正常退出,可以用如下命令继续:dock4 i dock.in-r,