生物大分子结构及其预测在药物设计中的机遇与挑战

2024-02-21
在药物开发的过程中,结构生物学一直扮演着不可或缺的角色。冷冻电镜(cryo-electron microscopy, cryo-EM)、X射线晶体学(X-Ray)和核磁共振(Nuclear Magnetic Resonance Spectroscopy, NMR)等技术使研究人员能够观察蛋白质的折叠方式以及药物分子与其靶标结合的方式,为通过识别结合口袋和潜在的变构位点来调节蛋白质功能提供了坚实的基础,激发了广泛而有创造性的思考。然而,尽管结构生物学功能强大,为药物研发带来了便利,但仍然可能引起误导。最近,来自美国加利福尼亚大学旧金山分校(UCSF)和美国Disruptive Biomedical LLC公司的研究人员系统讨论了目前结构生物学在助力药物设计中面临的四个基本挑战:预测结果与实际情况存在差异;单一结构难以表示振动和摆动等动态性;体外实验结果具有误导性;药物与非靶标之间的相互作用。他们指出解决这些问题将大大增强结构生物学在药物开发中的作用。首先,面临的第一个挑战是预测结果与实际情况存在一定的差异。近年来,AlphaFold成为结构生物学领域的一项突破性研究成果,2023年DeepMind公司的科学家因发明AlphaFold而获得拉斯克奖。AlphaFold2通过“解决”蛋白质结构预测问题颠覆了结构生物学领域。然而,这里的“解决”指的是预测模型与实验测定的“真实结构”在CASP(结构预测关键评估)竞赛所使用的标准下高度相似。值得注意的是,实验测定的“真实结构”除了在实验生成的信号噪声之外还存在一些不准确性。例如,在X射线晶体学中,实验数据通常测量得非常精确(通常误差小于5%),但相对于实验数据,根据这些数据所提炼出的结构却具有较大的残余误差(通常大于20%)。因此,在实验数据分辨率降低的情况下,添加先验知识,如几何约束,变得尤其重要。因此,“真实”可能不仅仅在于与原子坐标的比较,尤其是当结构基于低分辨率数据时。相反,与密度图(甚至是原始衍射图或显微图像)的比较可能揭示更深层次的真相。最近的研究开始直接比较AlphaFold2模型与实验得到的晶体学密度图。在许多情况下,预测结果与实验图高度吻合。通过对AlphaFold2模型进行与实验数据的优化,可以解决一些全局尺度失真和结构域定向问题,同时还能改善对局部主链和侧链构象的预测。然而,大部分高置信度的预测与实验图相比,其差异要大于独立确定的实验结构的差异。这些发现不仅强调了计算预测结果应直接与实验数据对比,还促使我们思考如何在药物发现中最大程度地利用计算预测模型。模型之间的差异可能反映了对蛋白质构象能量图谱中较少探索的部分的偏倚。此外,目前尚不清楚将预测模型引入正交计算技术(如长时间分子动力学模拟)的价值。尽管依旧存在一些担忧,但AlphaFold2及相关方法已经在药物发现领域产生了巨大影响,涵盖了从被认为不具挑战性的领域(如DNA构建设计)到广受关注的领域(如将人工智能模型生成的配体模型到预测的结合口袋)的大量研究领域。因此,计算模型在减少药物发现早期阶段的不确定性方面具有巨大潜力。AlphaFold代码库的发布引发了结构生物信息学的“寒武纪大爆发”(如利用AlphaFold Multimer预测蛋白质复合物)。然而,对AlphaFold下一阶段发展的担忧依然存在,因为方法的发布形式已经从预印本、GitHub和期刊转移到了公司博客文章,而博客通常没有附带的方法说明。在没有公开的方法的情况下,我们很难判断结构预测准确性是否正在接近一个较高的平台期。当达到这样的平台期时,我们需要知道其中多少是由于我们对“真实”的错误定义所导致的。如果我们想要进一步提高结构预测准确性,可能需要更直接地针对实验数据对模型进行训练,而不是基于精炼后的结构数据。此外,我们还认识到结构是对实验数据的建模,然而实验数据实际上代表了许多(运动中的)分子的平均水平,这可能会带来新的能力的解锁,开启新的研究领域。第二个重要挑战是单一结构难以表示振动和摆动等动态性的问题。费曼曾在原子和分子层面解释过生命活动,他指出“一切生物活动都可以通过原子的振动和摆动来理解”。事实上蛋白质并非静态结构,而是在执行功能时经历多种形态变化。在药物发现的结构生物学层面,我们不能仅仅从传统的静态视角理解大分子结构,还需重视其动态性。虽然有些蛋白质较为简单,可以在基于结构的药物设计中视为静态,但大分子的动态性也不能被忽视,这方面的经典案例也有很多。以碳酸酐酶为例,其活性位点残基His 64的侧链可能发生旋转,从而改变结合口袋形状,这一形态的改变对于优化青光眼药物多索胺至关重要。即便是这种简单的侧链运动目前也是难以预测的,这也揭示了一个重要原因:在药物发现过程中,无论配体是否被认为类药,都需要与任何种类的配体快速形成共复合物。此外,“触碰”蛋白表面是寻找可结合位点和隐秘口袋的有效方法,然而这种策略可能制造出一些静态结构无法结合的化合物,却能成功结合,这便是由于蛋白质受体的内在动态性所导致的。尽管我们意识到单一静态结构可能误导药物发现,但要使当前的人工智能技术了解多个真实结构并生成概率集合仍然是一项挑战。当前的生成模型能够从潜在空间生成结构,该潜在空间可能与系统的基础能量景观相关。但目前的模拟方法应用困难,因为蛋白质动态状态下的状态转换通常是缓慢且罕见的。因此,我们需要更符合实验数据的方式完善数据集,以促使在蛋白质静态结构和动态结构集合预测方面取得突破。与基于结构的药物设计优化表面互补性和静电作用类似,未来的蛋白建模方法将开启基于集合的药物设计,能够可预测地调整药物设计中的多个性质(结合配体的熵贡献和停留时间)。第三个重要挑战是体外实验可能带来误导性信息的问题。在药物发现领域,目前在体外进行蛋白质纯化是一种非常常见的实验手段。然而,将蛋白质从其细胞环境中纯化可能无法充分反映蛋白质在生理条件下的真实状态,因而可能导致一些误导性问题。例如,重组表达可能会遗漏对于理解蛋白质功能至关重要的一些翻译后修饰(例如磷酸化或糖基化)。近年,AlphaFold2预测的令人兴奋的发现之一是该模型在某种程度上“意识到”了纯物理学预测可能遗漏蛋白质在其天然环境中的某些部分。通过在预测结构中填充假体基团(例如血红素)、金属和代谢产物,并进行微调后“移植”到模型中,我们可以模拟蛋白质在生理状态下的结构。此外,近年随着药物研究的重点逐渐转向包含多蛋白复合物、蛋白质-RNA相互作用以及富含无序蛋白质的细胞凝聚体在内的复杂生物系统,依靠单一蛋白质结构的信息变得越来越容易产生误导。包括冷冻电镜单颗粒分析、核磁共振和X射线晶体衍射的主流结构生物学方法都是在脱离细胞环境进行实验的,这也是目前主流的实验方法所共同存在缺陷。随着新兴技术的发展,尤其是冷冻电子断层扫描(cryo-Electron Tomography, cryo-ET)技术,使得能够直接在细胞内观察蛋白质结构成为可能,将为解析细胞原位结构提供更准确的信息,从而拓宽结构生物学的应用范围,提高其在药物发现中的价值。最后一个重要挑战是药物分子可能与许多不同的蛋白质分子发生相互作用。在临床药物研发过程中,所有的药物研发人员都将面对一个令人沮丧的现实:无论我们认为我们的化合物设计得有多么出色,它们都会与体内许多其他蛋白质或核酸发生相互作用,干扰这些生物分子的正常功能。尽管有时药物与多个生物分子结合可能提升其疗效,但这种多靶标效应更有可能导致不良反应。这些不良反应有两种形式:(1)直接与非靶标结合导致毒性;(2)与非靶标结合降低了药物达到期望靶标的能力。因此,能够避免与非靶标结合的药物将更有效、更安全地在体内分布,使其在疾病相关组织中积累到足够高的浓度,并有效调节靶标功能。此外,药物与主要负责控制这些药物代谢和药代动力学特性(DMPK)的酶、转运蛋白、通道和受体的相互作用也带来了额外的挑战。药物通常结合到血浆蛋白上,阻止它们到达预定组织;它们可能阻塞或成为各种泵和转运蛋白的底物,改变它们在体内的分布;它们有时也会干扰异源物质感应器,如启动识别外源物质的转录程序的PXR;它们经常会干扰细胞色素P450等酶,从而改变它们自身和其他药物的代谢。这些药物分子本身是细胞色素P450和其他代谢酶的底物,一旦改变,就无法执行它们被分配的拯救生命的功能。综上所述,我们戏谑地将可能影响药代动力学特性的蛋白质称为“避免组”(avoidome)。对“避免组”有充分了解或许可以在一定程度上规避一些上述问题。然而,令人遗憾的是,目前绝大多数“避免组”蛋白的靶点尚未确定。此外,其中很多蛋白是复杂的机器,包含多个结构域且表现出较强结构动态性,它们的结合口袋可能很大且特异性较差,即使是结构相似的化合物也可能有不同的结合方式。因此,要充分了解如何最佳地组织药物与这些非靶标结合,需要了解涵盖不同结合配体和蛋白构象状态的多个结构。在药物设计过程中,我们应该像对待预期靶标的基于结构的设计一样重视“避免组”。这些蛋白质结构为我们提供了许多思路,并提供了展示前沿结构解析技术的机会。最重要的是,对药物如何与“避免组”靶标相互作用的详细了解将极大地加速药物研发,通过对这些“避免组”蛋白结构的解析,药物研究者可以设计出更加安全有效的药物分子,减少其与非目标分子相互作用的可能。综上,在医药领域,寻找能够改变医学实践的药物是唯一的真理。这种药物能够预防、缓解或治愈疾病,并且在实际应用中具有良好的耐受性。尽管医药企业投入了大量资金,众多科研人员也付出了辛勤努力,每年新药问世的数量仍然相对有限。尽管我们前文提到的四个重要挑战为新药研发带来了各种限制,但深思熟虑地应用结构信息一直以来都在药物发现中展现出巨大的实用价值。2024年标志着美国食品药品监督管理局(FDA)批准多佐胺用于医疗用途的30周年,这也是首个受益于基于结构设计的药物。在过去的三十年中,多佐胺为许多患有青光眼的患者带来了福音。未来十年技术的蓬勃发展将有助于我们克服上述挑战,大大提高药物发现的效率,并推动未来药物的发现。因此,我们建议将机器学习的重心放在解决这四个挑战上,这将为实验学科的不断进步提供有益补充,从而加速药物研发领域的发展。参考文献Fraser JS, Murcko MA. Structure is beauty, but not always truth. Cell. 2024 Feb 1;187(3):517-520. doi: 10.1016/j.cell.2024.01.003. PMID: 38306978.识别微信二维码,添加生物制品圈小编,符合条件者即可加入生物制品微信群!请注明:姓名+研究方向!版权声明本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(cbplib@163.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。
更多内容,请访问原始网站
文中所述内容并不反映新药情报库及其所属公司任何意见及观点,如有版权侵扰或错误之处,请及时联系我们,我们会在24小时内配合处理。
机构
-
适应症
靶点
立即开始免费试用!
智慧芽新药情报库是智慧芽专为生命科学人士构建的基于AI的创新药情报平台,助您全方位提升您的研发与决策效率。
立即开始数据试用!
智慧芽新药库数据也通过智慧芽数据服务平台,以API或者数据包形式对外开放,助您更加充分利用智慧芽新药情报信息。