深度学习解密:蛋白质配体结合亲和力预测的新纪元!

2024-01-10
今天给大家讲一篇2024年1月在Journal of Cheminformatics 上发表的运用深度学习方法预测蛋白配体结合亲和力的综述。本文回顾了基于结构的深度学习方法在药物发现中的应用,并讨论了分子表示方法、不同模型架构及模型可解释性等方面的重要性。通过一个分类体系对不同模型的打分和筛选能力进行了一系列评估,以此来揭示现有AI方法对基于结构的药物发现所带来的潜在益处。蛋白质-配体相互作用研究背景蛋白质-配体相互作用指的是蛋白质与小分子化合物之间的相互作用。化合物会与蛋白特定的结合位点发生相互作用,从而形成稳定的蛋白质-配体复合物。分子对接作为一种常见的计算化学方法,用于预测蛋白质与配体之间的结合方式。它能够有效地确定蛋白质-配体复合物的结合位姿,为药物设计提供了一定的帮助。然而,预测蛋白质与配体之间的结合亲和力仍然是一个备受挑战的问题。从亲和力指标中能够获得关于蛋白质与配体相互作用强度的关键信息,并且在药物的虚拟筛选和再利用中发挥着重要作用,为准确设计具有特定生物活性的化合物提供了重要的指导。模型介绍2.1  PLBAP模型架构(基于原子卷积模块)通过设计了多个原子卷积神经网络来预测蛋白配体绑定亲和力。如图1A所示,每个分子的输入为原子坐标及原子的类型,并用复合物和蛋白与配体之间的能量差来估计结合亲和值。其估值表示为。其中原子卷积神经网络(ACNN)模块包括原子类型卷积层和维度分别为32,32,16的三个全链接层。接着,通过将该表征通过聚合函数来预测能量差,从而将原子级别的信息提升到分子水平。图1原子卷积模块的特征提取方法2.2  PLBAP模型架构(基于图卷积模块)首先将配体及绑定位点中的原子构建了节点、化学键的特征矩阵以及邻接矩阵。在邻接矩阵中,非共价相互作用的值比共价键的值要低(图2A)。输入的分子经过多个图卷积模块将节点的邻居节点的特征进行聚合以更新节点的表示。这个过程可以通过多轮的消息传递来实现,每一轮都通过聚合邻居节点的信息来更新节点的特征。这有助于模型在不同层次上捕捉分子结构的局部和全局特征,提高对分子特征提取的完整性。具体而言,每个图卷积模块包含三个维度为128、128和32的卷积层和三个全连接层并聚合,最后将它们输入到一个全连接输出结合亲和力(图2B)。图2 图卷积模块的特征提取方法实验结果3.1模型性能评估作者将PDBbind Refined 集合作为训练集,Core 集合作为验证集,CSAR-HiQ数据集作为外部测试集,并评估了四种方法预测亲和力的性能,评价指标为预测结合亲和力与真实结合亲和力的Pearson相关系数和均方根误差(RMSE)。较高的PC和较低的RMSE表示较好的预测性能。如图3所示,基于网格的CNN架构易于过拟合。此外,在外部测试集中,图卷积模块的预测性能相较于其他方法更有优势。图3 模型预测性能评估3.2 筛选性能评估作者选择了DUD-E数据集上两个靶标用于评估模型的筛选性能,肌肉糖原磷酸化酶(PYGM)表皮生长因子受体(EGFR)。PYGM数据集有114个活性化合物和4045个阴性样本,并用AutoDOCK Vina为它们生成蛋白配体复合物。筛选效果如图4所示,当阴阳比增大时,富集率急剧下降。其中基于网格的CNN模块在筛选性能上具有一定的优势(top 1%时EF超过40),有望帮助药化专家加速潜在药物分子的筛选。图4筛选性能评估结论基于(PLBAP)模型来预测蛋白质与配体之间的结合亲和力可有效加速药物筛选中的效率。其中原子卷积神经网络模块适合大批量数据的计算。然而在打分或筛选任务上表现效果不佳。网格卷积模块利用了分子结构和体素化信息来提取表征,不过由于不满足旋转不变性使得在筛选任务中缺乏优势。分子图卷积模块可以更灵活地捕获分子拓扑结构,使其在筛选任务中具有竞争力。在未来,通过完善分子图的表示方法,并增强模型的可解释性,有助于在药物筛选方面提供更加智能、高效的解决方法。参考文献Cummings, M. D. & Sekharan, S. Structure-based macrocycle design in small-molecule drug discovery and simple metrics to identify opportunities for macrocyclization of small-molecule ligands. J. Med. Chem. 62, 6843–6853 (2019)版权信息本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。本文为原创内容,未经授权禁止转载,授权后转载亦需注明出处。有问题可发邮件至sixiali@stonewise.cn关注我,更多资讯早知道↓↓↓
更多内容,请访问原始网站
文中所述内容并不反映新药情报库及其所属公司任何意见及观点,如有版权侵扰或错误之处,请及时联系我们,我们会在24小时内配合处理。
机构
-
适应症
-
靶点
药物
-
来和芽仔聊天吧
立即开始免费试用!
智慧芽新药情报库是智慧芽专为生命科学人士构建的基于AI的创新药情报平台,助您全方位提升您的研发与决策效率。
立即开始数据试用!
智慧芽新药库数据也通过智慧芽数据服务平台,以API或者数据包形式对外开放,助您更加充分利用智慧芽新药情报信息。