在全球新型冠状病毒感染人数累计超过400万人的今天,疫苗作为抵御病毒的终极武器,全球科学家都正在加速攻坚。疫苗的快速研发十分迫切。
AI算法能否在生物疫苗研发中起作用?百度研究院重磅推出全球首个mRNA疫苗基因序列设计算法LinearDesign,是专门用于优化mRNA序列设计的高效算法。针对新型冠状病毒mRNA疫苗,LinearDesign能在16分钟内大大提升疫苗设计的稳定性和蛋白质表达水平。从而有效解决了mRNA疫苗研发中最重要的稳定性问题,加速疫苗研发速度。
这无疑是令整个业界振奋的消息,为全球疫苗研发提振信心。
从生物学角度看,疫苗的研制有多个方向,如DNA疫苗、mRNA疫苗、蛋白质疫苗等。疫苗的基本原理是通过激活人体免疫细胞,使其能够识别特定的病毒蛋白质结构,达到免疫效果。相较于传统的蛋白质疫苗,mRNA疫苗省去了蛋白质疫苗需要体外培育抗原的环节,大大减少了生产周期,研发速度快,成为最有希望的预防工具。
但mRNA疫苗的制约也很明显,一个突出难题就是由于mRNA本身稳定性不足而容易被分解,在保存、运输过程中及体内表达时失效。稳定性也成了mRNA疫苗研发面临的重大挑战,是困扰全球科研机关、防疫机构和生物医学公司的难题。
世界mRNA疫苗研发竞赛领头羊、美国Moderna公司最新论文研究表明,mRNA序列的二级结构越多,其基因序列就越稳定,并且蛋白质翻译效率越高。因此当下面临的问题,是需要在10的632次方个mRNA序列中找到能够翻译成特定蛋白质(抗原),同时又具有稳定的二级结构的序列。
这个数字是什么概念?举个例子,假设有个超级计算机一秒可以计算一个mRNA序列的二级结构,那么即使从宇宙形成开始算到现在(约130-140亿年),可能连所有可能的mRNA序列的亿万分之一都没算完。
LinearDesign算法解决了这一“世界性”难题。它是应用计算机科学领域经典算法——动态规划算法,来将这一问题的搜索时间从亿万亿年降低到分钟级。在新型冠状病毒的刺突蛋白序列上的计算机模拟实验表明,LinearDesign能够设计出结构最稳定的序列,而且设计时间只需要1个半小时。如果采用线性时间近似算法,所需时间可以进一步缩短到16分钟,而与最优解的能量差距(衡量稳定性的指标,能量越低越稳定)只有0.6%。这两种设计相比于自然界天然存在的新型冠状病毒刺突蛋白mRNA序列要稳定的多(能量降低了150%)。
研究出LinearDesign算法,百度研究院继续向全球疫苗研发机构及研究中心等免费开放,并在arXiv发布了相关论文,助力新型冠状病毒疫苗研发。
LinearDesign算法出炉的背后,还原出一个全球学术界、科技公司、生物疫苗公司共同抗疫的故事。
新算法LinearDesign是基于1月底百度研究院对外开放的线性时间算法LinearFold升级。LinearFold预测RNA二级结构的速度堪称全球最快,整个分析时间能够从55分钟缩短至27秒,提速120倍。
LinearFold对外开放后,备受业内关注。RNA设计领域世界知名专家、斯坦福大学生物化学系Rhiju Das教授,关注到目前mRNA疫苗研发存在一个巨大挑战,即mRNA疫苗稳定性问题。针对这一问题Das教授提议一种解决方案:通过人海战术,用百度一月份公开的LinearFold算法为结构分析引擎,发起疫苗设计的公开竞赛(OpenVaccine Challenge),找到适合生产疫苗的比较稳定的mRNA序列。
百度研究院提出了另外一种更直接的解决方法,即通过算法直接设计出更稳定的mRNA疫苗序列。这个算法提出后,引起了世界顶级RNA生物学专家、美国罗切斯特大学David Mathews教授的兴趣,一起参与了这个项目,并且David Mathews教授高度评价这个算法:“LinearDesign是一种算法,它设计了一组结构更稳定的序列,并使用优化的密码子。此算法高效的运行速度是优化序列设计的关键,这些序列可以通过实验检验它们作为疫苗的效果。”
新冠肺炎疫苗研发已成为全球性课题,人工智能技术与生物、医药等行业深度融合,从技术角度提供全新的解题方法。LinearDesign算法,正来源于百度与全球生物、医药专家的思想碰撞,这也是一次AI与生物行业融合的成功尝试。除了当下的新型冠状病毒mRNA疫苗,LinearDesign算法也同样适用于其他mRNA疫苗的研发。可以预见,该算法将在高效研发疫苗方面发挥极大作用。
百度作为此次AI战“疫”的排头兵,持续释放技术原力,通过免费开放LinearFold、LinearDesign等算法助力抗疫效率提升。
目前,百度已与中国疾病预防控制中心病毒病预防控制所签署战略合作协议,联合设立“中国CDC应急技术中心-百度基因测序工作站”。此外,中国疾病预防控制中心后续还将使用百度LinearDesign算法设计的mRNA疫苗序列进行体外实验,验证疫苗的稳定性和蛋白质表达效率。未来,百度将继续以AI技术助力全球抗疫事业。