众所周知,蛋白质是生命的基石。对蛋白质独特的三维结构以及其动力学性质的探索不仅有助于我们解读生命密码,更有助于加速药物研发。近期,深势科技将基于神经网络的强化动力学方法(Reinforced Dynamics, RiD)进一步应用于拥有更高维集合变量(Collective Variables, CVs)的体系中,这一研究将推进蛋白质结构采样、结构精修或环区优化等工作的进行,让研究人员能够通过计算方法向蛋白质的天然状态更近一步。
(论文:Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics)
此项成果于近日登上Nature旗下专注于计算科学的顶级期刊《自然-计算科学》(Nature Computational Science),该期刊关注最新计算方法的发展及其如何在各学科中解决实际问题。论文题为《利用自适应强化动力学对高维自由能面进行高效采样》(Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics),据了解,文章中使用了超过100个集合变量加速采样进程,此前的采样方法从未处理过如此高维的集合变量。该文章作者目前均在深势科技团队。这是继12月8日推出蛋白质结构预测工具Uni-Fold,并开源训练、推理代码后,深势科技团队的又一重磅成果。
(RiD工作流,RiD方法应用在超过100个集合变量的体系上)
神经网络加持下,对蛋白结构的"精雕细琢"再进一步
几十年来,科学家们通过各种实验手段解析了十几万个蛋白质结构,但这相较于已经测序的数十亿计蛋白质来说还远远不够。实验方法成本高、周期长,因此能否用计算方法还原蛋白质生理状态并加速研究工作成为计算生物学中最具挑战性的问题之一。
尽管在2020年的国际蛋白质结构预测顶级竞赛CASP(Critical Assessment of protein Structure Prediction)中,来自DeepMind的AI算法AlphaFold2的表现引发生物界巨大轰动。但相比于蛋白质真实的生理状态,AlphaFold2的预测结果仍需要进一步的蛋白结构精修。
目前在蛋白质结构优化中,基于经典分子动力学(Molecular Dynamics, MD)的优化方案在近两期的CASP上都取得了优异的结果。但是,经典分子动力学模拟方法在蛋白质体系中采样效率低,而传统增强采样算法又面临着计算量大、难以选取集合变量以及维数灾难的问题。强化动力学(Reinforced Dynamics,RiD)方法则可以借助神经网络,处理几十甚至上百维的集合变量,使其能够应用在复杂体系中。RiD方法在蛋白质结构优化问题上处理了超过100个集合变量,让经典分子动力学方法无法得到的蛋白质天然结构在强化动力学方案下成为现实。
(在R0974s1, R0986s1 和 R1002-D2 三个案例中的蛋白结构精修结果)
在CASP13比赛中三个典型例子(R0974s1, R0986s1 和 R1002-D2)上,RiD做到了大幅提升。相比于初始结构,RiD优化后的结构平均提升了14.6点GDT-HA分数,其中最高分数分别达到了92.4,82.6和79.7。同时,优化结果具有良好的鲁棒性(图a和b)。特别地,在R1002-D2的例子上,经典分子动力学模拟只采样的很小的区域(图c 紫红色区域),RiD可以从初始结构(图c 黑色X,图d)经过去折叠(图e),最终模拟到天然状态结构(图c 蓝色X,图f)。
蛋白质在生物体内是不断运动的,目前描述蛋白质构象系综的最佳方式之一是借助分子模拟手段。对于生物大分子体系的高效采样是分子模拟的一个关键问题,RiD作为这一问题的出色解决方案,为多个领域的突破带来可能。对于药物设计而言,RiD能够在更多的场景发挥重要作用:探寻构象变化中的隐藏口袋和别构口袋,困难药物靶点中固有无序蛋白的构象采样,抗体环区优化等。对于药物科研人员来说,这些难题的解决能有效提升药物研发效率。
为了方便学术开发与应用,深势科技团队已将RiD方法重构为开源软件供用户使用(https://github.com/deepmodeling/rid-kit)。同时深势科技也针对药物设计场景,对RiD进行了进一步的开发和优化,集成于旗下一站式计算辅助药物设计平台Hermite中。用户可通过Hermite-ProteinRefine对输入的蛋白质进行结构优化,获得更接近天然状态的蛋白结构。
(Hermite界面-通道蛋白在膜里面)
去年,深势科技核心成员的工作开辟了“AI+物理模型+高性能计算”的科学计算新范式,一举斩获“计算应用领域诺贝尔奖”、国际高性能计算应用领域最高奖项“戈登·贝尔奖”。 如今RiD的诞生与应用,也是深势科技团队“AI+物理模型+高性能计算”组合拳的极佳体现,也是新一代分子模拟算法在药物设计领域落地,实现效率与精度统一的例证之一。深势科技致力于运用领跑行业的分子模拟技术,为人类文明最基础的生命、能源、材料科学与工程研究打造新一代微尺度工业设计和仿真平台。
Hermite作为根植于云计算的临床前计算机辅助药物设计平台,能为药物开发人员提供数据、算法、算力三位一体的一站式解决方案。除RiD模块外,Hermite上已集成多个重量级功能,例如近期上线的蛋白质结构预测工具Uni-Fold,在药物优化阶段比较不同分子与蛋白靶点结合活性差别的Uni-FEP,等等。
在结构生物学领域,利用Uni-Fold、RiD等AI+计算模拟的算法,并结合冷冻电镜等实验手段,深势科技正致力于打造一套模拟—AI—实验三者联合驱动的结构生物学解决方案,为基于结构的药物设计提供更高的起点,加速科学家们的药物发现进程。