能否花更少的成本,提前数年时间研发一款新药?
这看起来有些“过于美好”的愿望,正随着国内生物医药领域的技术发展,以及AI巨头的纷纷入场变为现实。近日,百度又有“新动态”,其飞桨图学习框架(PGL)携手生物计算平台螺旋桨(PaddleHelix),在图神经网络国际权威榜单OGB(Open Graph Benchmark)多项分子性质预测任务中亮丽登顶,荣获ogbg-molhiv、ogbg-molpcba两项任务第一,在AI药物发现领域取得新的技术突破。
而能在OGB登顶实则意义深远。与斯坦福、纽约大学、加州大学洛杉矶分校、康奈尔大学、亚马逊等众多顶级机构同台竞技、并脱颖而出,也使得百度的技术实力获得国际瞩目与认可。事实上,OGB作为目前公认最权威的图学习相关基准测试数据集,由斯坦福大学图神经网络权威团队建立,面向不同的图学习任务分别提供了丰富的数据集,对图神经网络研究者有极强的吸引力。这也是百度继去年9月,飞桨图学习框架发布融合标签传递和图神经网络的统一模型 UniMP(Unified Message Passing),登顶图神经网络权威榜单三项榜首后再一次问鼎。
(百度登顶OGB两项榜单第一)
近年来,伴随着技术发展和基础设施改善,AI的力量突破了医院和科室的高墙,让医生资源、诊疗方案、药物研究等得以高速发展,其中作为现代药物研发中关键一环的化合物生物活性筛选,同样被注入了AI的能量。化合物的生物活性筛选主要目的是在大量候选化合物中,发现针对某种药物靶点具有活性的分子。通过AI技术加持进行药物的虚拟筛选有望代替传统的活性筛选方法,加速中间步骤从而大幅度降低研发成本。
OGB上的HIV和PCBA数据集就包含了多种生物活性实验;其中,HIV数据集关注不同化合物是否能够抑制HIV病毒在细胞内的复制,PCBA数据集关注不同化合物针对100多种疾病靶点的有效性。成功预测化合物这类性质对于发现针对多种疾病的有效药物具有重要意义。百度基于飞桨图学习框架,使用深度图神经网络,配合生物计算平台螺旋桨对药物发现领域的理解,设计自监督学习任务学习化合物分子表示,并应用到分子性质预测中,其利用分子表示学习、图学习技术等核心技术,帮助百度刷新榜单。
这次百度登顶的背后离不开飞桨图学习框架和螺旋桨两大“主力”的支持。据介绍,飞桨图学习框架基于飞桨框架动态图全新升级,具有高效、支持超大规模图训练、易用、预制多种主流图学习模型等特色。飞桨图学习框架在百度的内外部业务也是颇受欢迎,全面覆盖推荐系统、搜索引擎、智能地图等相关业务场景,在去年11月的COLING 协办的 TextGraphs2020 比赛中也夺得冠军,展示领先实力。
另一位“主力”螺旋桨则是基于百度深度学习平台(飞桨)的生物计算平台,其提供的核心技术能够重点满足生物医药、疫苗设计和精准医疗方面的AI需求。螺旋桨生物计算平台还将保持着开源开放的原则,帮助生物学、药物化学、计算机交叉学科背景的学习者、研究者和合作伙伴更便利地构建AI算法模型。
不难感受到,AI等尖端技术在生物医药领域的引擎作用将更加凸显,不仅使生物医药成为AI技术落地的重要场景,也将推动乃至引领未来相关领域的创新爆发。而在这其中,以百度为首的众多先进AI企业依然用AI技术搭建属于中国的技术堡垒,不断让世界看到了中国科技力量的活跃之势,也让人工智能更好的泛于大众、惠于大众。未来,百度的“科技力” 有望助理生物医药开发,攻克艾滋病等危害人类健康的顽疾,发挥出推动“科技强国”的关键作用。