《药物及生物活性小分子发现与分子设计_课件.ppt》由会员分享,可在线阅读,更多相关《药物及生物活性小分子发现与分子设计_课件.ppt(23页珍藏版)》请在三一办公上搜索。
1、药物及生物活性小分子发现与分子设计,3,1,2,4,SwissTargetPrediction,DDI-CPI,SEPPA 2.0,ProTox,5,总结与展望,SwissTargetPrediction,映射活性小分子的目标分子可以预测潜在机理和副作用,用于生物活性小分子靶点预测,生物活性小分子连接到蛋白或者大尺寸目标分子来调节生物活性:,SwissTargetPrediction,用于生物活性小分子靶点预测,特点:结合2D和3D相似性测量;预测可针对五个不同生命体;数据集包括280381个小分子与2686个目标相互作用,其中66的目标是人类的;,3D相似性计算:18维特征实数向量:每个分子
2、通过ChemAxon molconvert工具生成20个同分异构体;超过20个时,选择能量最低的构象;不足20个时,则选择全部构象;Manhattan距离:构象x和y特征的曼哈顿距离计算公式:最终的3D相似值计算公式:dij是2020组里最小曼哈顿距离,所以s1是其中最大值。,SwissTargetPrediction,用于生物活性小分子靶点预测,2D相似性计算:指纹描述分子:分子指纹是一个多“位(bit)”的编码,每一位代表着某种预定义的子结构;如果该子结构在某分子中存在;其分子指纹的对应位就是1,否则就是0;谷本(Tanimoto)系数定量:Tanimoto系数介于0,1之间;如果A和B完
3、全相同,交集等于并集,值为1;如果没有任何关联,交集为空,值为0;对于分子指纹进行按位计算。,FP3分子指纹,SwissTargetPrediction,用于生物活性小分子靶点预测,交叉验证:在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差;K折交叉验证:初始采样分割成K个子样本,一个单独的子样本被保留作为验证模型的数据,其他K-1个样本用来训练,交叉验证重复K次,10折交叉验证最为常用;留一验证:只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料,SwissTargetPrediction,用于生物活性小分子靶点预测
4、,Prostaglandin G/H synthase 前列腺素合成酶Estrogen receptor 雌激素接收体,Chlorotrianisene,妇女因雌激素缺乏所引起的症状男性前列腺增生,抑制尿酸转运蛋白重吸收,Microtubule-associated protein tau微管相关蛋白Muscleblind-like protein 盲肌蛋白,Lesinurad,Selexipag,Cannabinoid receptor 大麻素受体Adenosine receptor 腺苷受体,PGI2(前列环素)激动剂,目的:药物-药物相互作用(DDIs)可能导致严重的副作用,一些DDIs
5、和药物-蛋白相互作用有关,因此分析药物-蛋白相互作用组(CPI)结构来预测DDIs是有价值的;创新点:根据上传分子的CPI构象,预测DDIs;不集中在单一药物-蛋白相互作用,而是考虑了对于所有目标分子优势:同时预测PK(药代动力学)蛋白和PD(药效动力学)蛋白导致的DDIs;预测模型的生物学原理简单;交叉验证和独立验证中预测精度高,AUC达到0.85;错误的配体-蛋白复合物偶联能被该预测方法最小化;,根据药物-蛋白相互作用组预测药物联合作用,DDI-CPI,ROC曲线和P-R曲线:ROC曲线:以真阳性率为纵坐标,假阳性率(1-特异度)为横坐标;P-R曲线:以精确度为纵坐标,召回率(真阳性率)为
6、横坐标;根据曲线位置或曲线下面积(AUC)进行比较。,真阳性率(召回率):TPR=TP/(TP+FN)被正确判定的正例占总的正例的比重,假阳性率(1-特异度):FPR=FP/(FP+TN)被错误判定的负例占总的负例的比重,真阴性率(特异度):TNR=TN/(FP+TN)衡量类别0 的判定能力,精确度:Precision=TP/(TP+FP)被判定的正例中真正的正例样本的比重,根据药物-蛋白相互作用组预测药物联合作用,DDI-CPI,逻辑回归模型:,根据药物-蛋白相互作用组预测药物联合作用,DDI-CPI,Sigmoid函数,表示取1的概率,的求解理论依据:极大似然估计;方法:梯度下降法,三个步
7、骤循环更新,Version 1.0 Version 2.0改进:采用逻辑回归模型代替先前的简单相加模型;在集聚系数和倾向系数外,添加了ASA(可及表面积)和综合氨基酸指数。优点:相较SEPPA1.0,在灵敏度相同的情况下,SEPPA2.0假阳性率显著下降。PEPITO,SEPPA 1.0,DiscoTope-2,B-pred 和 Bpredictor五种服务器与SEPPA2.0进行比较,SEPPA2.0平衡精度最高,AUC值最高。Bpredictor和 Epitopa 只能在给定阈值显示最佳效果。SEPPA2.0在平衡灵敏度和特异性、降低假阳性率的同时保证较高的预测精度。,用于蛋白抗原空间表位
8、预测,SEPPA 2.0,(a).抗原表位预测的结果页(b).抗原残基的抗原性预测分数(c).比较SEPPA图解和相关表位区域,目的:为了减少实验成本和之后药物开发失败的风险,使用计算机模拟药物毒性具有强大优势;创新点:分析已知半数致死量(LD50)化合物的2D相似性和有毒碎片识别优势:预测方法快速;每个季度数据更新、服务器升级简单快速;外部数据集检验表明ProTox比其它毒性预测性能更好,计算机模拟啮齿动物口服毒性,ProTox,用交叉验证检验ProTox 相对TOPKAT R的性能。整体命中率和单独ProTox 命中率毒性分类,FP24(橘色),ECFP4 指纹(黄色)和 TOPKAT R(蓝色)。对于 FP24和 ECFP4分别用0.7和0.5的Tanimoto相似性阈值。,药物预测可以减少实验成本;预测方法主要是相似性的识别,非常依赖于已知药物的特性,但是耗时非常短;在预测非常新的药物时结果较差,可以结合分子动力学模拟进行预测,对于已知性质要求低,但运算速度非常慢。,总结与展望,谢 谢,