滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Nature子刊 | NUS、字节首次将AI元学习引入脑成像领域

时间：2022-05-26 14:52:21 来源：互联网编辑：星辉 发表评论无障碍通道

近期，新加坡国立大学、字节跳动智能创作新加坡团队等机构合作的一项技术成果被全球顶级学术期刊Nature的子刊Nature Neuroscience收录。这项研究首次将人工智能领域的元学习方法引入到神经科学及医疗领域，能在有限的医疗数据上训练可靠的AI模型，提升基于脑成像的精准医疗效果。

研究背景

脑成像技术是神经科学发展的一个重要领域，能够直接观察大脑在信息处理和应对刺激时的神经化学变化、从而对疾病的诊断和治疗提供重要参照。理论上，基于脑成像的机器学习模型可应用于预测个人(individual)的一些非脑成像(non-brain-imaging)的表征特性(phenotypes) ，例如，流动智力 (fluid intelligence)、临床结果(clinical outcomes)等，从而促进针对个人的精准医疗( precision medicine)。

一个现实的问题在于，虽然现在已经有英国生物银行(UK Biobank)这样的大规模人类神经科学数据集，在研究临床人群或解决重点神经科学的问题时，几十到上百人的小规模数据样本依旧是常态。在精确标注的医疗数据量有限的情况下，很难训练出一个可靠的机器学习模型来预测个人表征特性。

论文提出一个新的思路来解决这一数据匮乏所带来的根本限制：在给定一个大规模(N>10,000)的带有多种表征特性标注的脑成像数据集，可以将在该数据集上训练的机器学习模型迁移到一个独立的小规模(N<200)的带有新的表征特性的数据集上，从而使得在新的数据集上训练的模型能够准确预测新的表征特性。

方法

研究者通过对先前的小样本数据分析发现，个体的认知、心理健康、人口统计学和其他健康属性等表征特性与大脑成像数据之间存在一种内在的相关性。这意味着，小数据集当中的某些独特表型可能与大规模数据集当中的某些预先存在的特定表型相关，利用这种相关性，研究者提出了一个新的基于元学习的元匹配方法建立了一种框架机制，可利用大规模脑成像数据集来促进对小数据集当中一些全新的、未知的表型的预测，从而训练出可靠的用于表征特性预测的机器学习模型。

论文提出了一种新的元匹配(meta-matching)方法，来解决小规模数据集上的表征特性预测模型的训练问题。元匹配是一种高度灵活的学习框架，可以用于各种不同的机器学习方法。论文主要研究了将元匹配方法应用于核岭回归(kernel ridge regression, KRR)以及全连接的深度神经网络(DNN).

在元匹配的学习框架中，大规模的训练数据被分为元训练集 (training meta-set) 以及元测试集 (testing meta-set)。这两个数据集包含不同的个体和表征特性标注。元训练集被用来训练DNN预测模型，而元测试集则用来评估当前DNN模型在新的表征特性上的预测准确率(也即泛化性能)。特别的，随机挑选的K个(K<5)个体数据被选作测试样本。而在元测试集上表现最好的一个DNN输出节点(output node)将被保留，而其他节点被移除。之后在该K个测试个体数据，微调(fine-tune)该保留的节点以及DNN模型之前与该节点相连的隐藏层参数。注意与一般的元学习或者微调策略不同的是，这里只微调DNN模型中的一个子网络，而不是微调整个模型参数。该过程将被重复M次，直到DNN模型在元测试集上预测稳定为止。

在完成上述的元训练过程以后，得到的DNN模型已具有了较强的在新的预测任务上的泛化能力。该模型可以直接迁移到新的表征特性数据集上，用少量的标注样本进行训练，即可有较好的预测性能。

实验设置

论文在英国生物银行(UK Biobank)和人类连接组计划(Human Connectome Project)数据集上进行了测评。所有数据的使用均已经过了相关研究部门批准。其中 UK Biobank 包含36,848名参与者的结构MRI以及静息fMRI脑成像数据，以及被筛选出的67个非脑成像的表征特性。而HCP包含 1,019 名参与者的结构MRI以及静息fMRI数据，以及被筛选出的58个表征特性。所筛选的表征特性涵盖了意识(cognition)、情绪(emotion)以及个人特质(personality)。

UK Biobank数据集被用作训练集，用于使用元匹配来训练预测模型。其被随机分为元训练集(26,848名参与者，33个表征特性)以及元测试集(10,000名参与者，34个表征特性)。而HCP数据集则被用作测试集、测试预测模型在新的表征特性上的预测准确率。其被随机分为K个参与者用于训练以及(1,019-K)个参与者用来测试。其中K取值为19,20,50,100和200.

△ 图. HCP表据集表形特性示例

实验结论

上述方法已经在英国生物银行(UK Biobank)的 36,848 名参与者和来自人类连接组计划(Human Connectome Project)的 1,019 名参与者的样本评估中显示出有效性。

在BioBank测试集上性能超过经典的核岭回归（KRR）

下图展示了在UK Biobank元测试集基于Pearson’s相关系数的准确性比较。在所有的样本数量设置上(K值)，所提出的元匹配方法在34个表征特性准确率大幅超过经典的KRR方法 (伪发现率FDR q<0.05). 例如在fMRI研究中常见的样本数量K=20 (20-shot)，基本的DNN meta-matching 方法准确率超过KRR 100% (0.124 vs. 0.052). 而如果采用coefficient of determinant (COD)作为性能指标，DNN meta-matching方法则超过KRR 400% .

在HCP小规模新数据集上显著超过KRR

为了测试元匹配在全新的测试集上的表现，论文进一步测试了其在HCP数据集上的性能。发现同样的，所提出的元匹配方法准确率大幅超过经典的KRR方法。例如在K=20时，元匹配方法准确率超过KRR 100% (0.123 vs. 0.047). 而在K=100时，以COD为指标，元匹配方法准确率超过KRR 800%.

讨论与总结

考虑到所提出的元匹配方法是利用表征特性之间的相关性来辅助预测，其背后的预测机制有可能是非因果的。然后该研究的主要目标是提高预测准确率，并且即使是非因果预测，所得到的预测模型也有很多的应用场景。例如，抗抑郁药物至少要4周以上才会起效，而少于50%的病人会对第一次给药反应良好。因此，即使是非因果的预测，提高表征特性的预测能力在临床上仍具有巨大价值。

论文所提出的元匹配方法，是基于机器学习领域中的元学习，多任务学习以及迁移学习等。例如在DNN模型上先训练再微调可认为是迁移学习的一种形式。但是，值得注意的是，实验表明最大的准确率提升是来自于论文提出的核心算法—元匹配。当然，更先进的机器学习算法有希望在这个方向上带来更大的预测准确率的提升。

虽然最初的脑成像数据集来自于年轻健康的成年人，现在有越来越多的数据集侧重不同的人群，例如老年人、儿童、不同的疾病等。论文提出的方法在将来也可以用于其他人群数据集的表征特性预测，例如最近的ABCD数据集包含了精神健康症状。

字节跳动智能创作团队是字节跳动音视频创新技术和业务中台，覆盖了机器学习、计算机视觉、图形学、语音、拍摄编辑、特效、客户端、服务端工程等技术领域，在部门内部实现了前沿算法—工程系统—产品全链路的闭环，旨在以多种形式向公司内部各业务线以及外部合作客户提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案。

智能创作基础研究团队旨在探索前沿机器学习以及计算机视觉、自然语言处理技术，解决人工智能领域里的挑战性问题。

Nature Neuroscience是神经生物学领域最顶级的刊物之一，该杂志发表的论文涉及神经科学的各个领域，包括分子、细胞、系统、行为、认知和计算研究。(文章来源：量子位)

作者：王蜂

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

12-19

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

12-19

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

12-19

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

12-19

闪极AI拍拍镜震撼上市！国内首款量产，售价仅999元起

12-19

苹果中国AI大模型合作引关注，字节腾讯谁将脱颖而出？

值得一题的是，12月19日，北京智源人工智能研究院（智院研究员）发布国内外100余个开源和商业闭源模型多份评测结果，作为今年英伟达全球第二大买家、拥有23万张GPU的字节跳动豆包大模型名列前茅，语言模型结果…

12-19

张一鸣私募新动作，重心已悄然转向大模型与AI战略？

12-19

算力硬件引领市场热潮，豆包概念股能否持续走强？

12-19

市场分化算力硬件爆发，抖音微信小店概念股活跃，后市如何演绎？

12-19

北证50深V反转，AI硬件与微信小店成市场新宠？

12-19

OpenAI Canvas大升级：React渲染与文本格式化新工具来袭

12-19

OpenAI新招！ChatGPT热线电话服务上线，老年机座机也能聊

12-19

AMD苏姿丰领投，Liquid AI崛起：机器人之母带队，AI赛道再掀狂澜

12-19

AI创业热潮下，清北复交毕业生都偏爱在哪座城市扎根？

12-19

小红书搜索量激增，百度MEG能否避免重蹈极越覆辙？

12-19

点击查看更多 +

全站最新

TCL万象分区技术：Mini LED电视画质跃升的新篇章

挪威电动车热销，特斯拉陶琳：寒冷地区电动车可完全替代燃油车

宝马Skytop M8 Targa限量版来袭，概念车终成真！

芜湖造心脏，驱动国家级无人直升机救援平台展雄风！

《黑神话：悟空》获赞，海信E8共绘中国文化出海新篇章

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

热门内容

本栏最新

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

讯飞智作斩获猎云网2024“年度生成式AI创新”大奖，AIGC未来可期

荣耀MagicOS 9.0升级全解析：新功能适配进度与长焦拍照优化进行时

闪极AI“拍拍镜”来袭：智能眼镜新体验，售价999元起接入大模型

闪极AI拍拍镜震撼上市！国内首款量产，售价仅999元起

算力硬件引领市场热潮，豆包概念股能否持续走强？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.