LeCun团队新突破，自监督学习再进化，MMCR如何更进一步？

时间：2024-10-17 07:24:55 来源：ITBEAR作者：柳晴雪编辑：瑞雪 发表评论无障碍通道

【ITBEAR】近日，来自斯坦福大学、麻省理工学院（MIT）、纽约大学以及meta-FAIR等机构的研究团队，通过全新研究对最大流形容量表示法（MMCR）的可能性进行了重新定义。这一成果为多视图自监督学习（MVSSL）领域带来了新的突破。

MVSSL作为一种强大的无监督学习方法，通过创建多个数据视图并以类似监督的方式学习表示。而MMCR作为一种与众不同的方法，在不明确使用对比、不执行聚类、不利用蒸馏、也不明确减少冗余的情况下，其效果却能媲美甚至超越其他领先的MVSSL方法。

研究人员在这项新研究中，对MMCR进行了深入探索，并将其与信息论原理联系起来，进一步揭示了其深层次机制。他们证明了MMCR可以激励学习嵌入的对齐和均匀性，同时最大化视图之间的互信息下界，从而将MMCR的几何视角与MVSSL中的信息论视角紧密结合。

论文地址示意图

为了更好地利用MMCR，研究人员还对预训练损失的非单调变化进行了数学预测和实验确认，发现了类似于双下降的行为，并揭示了计算上的scaling law。这些发现使得研究人员能够更准确地预测预训练损失，并将其作为梯度步长、批量大小、嵌入维度和视图数量的函数。

值得注意的是，这项研究还证明了MMCR不仅适用于图像数据，在多模态图像文本数据上同样表现出色。这一成果为MMCR的应用拓展了新的领域，也为多模态学习提供了新的思路和方法。

MMCR最初由纽约大学数据科学中心的研究人员于2023年提出，该方法源于神经科学中的有效编码假说。最初的MMCR框架通过调整“流形容量”将这一想法扩展到了人工神经网络。而此次研究则将MMCR的几何基础与信息论原理相结合，进一步探索了其更深层次机制。

通过高维概率分析，研究人员发现MMCR可以激励表示的最大化，对应于同一数据的两个视图的两个嵌入共享的互信息的下限。这一发现为理解MMCR的嵌入分布提供了新的视角。

研究人员还在实验中观察到了MMCR的双下降现象，即预测最大流形容量表示的预训练损失在其预训练过程中表现出非单调的双下降样行为。这一发现为MMCR的优化和应用提供了新的指导。

在计算scaling laws方面，研究人员发现MMCR预训练百分比误差与点数、嵌入维度和视图数量之间存在幂律缩放关系。这一发现为不同超参数下的MMCR训练提供了可比较的基准，也为优化MMCR的计算效率提供了新的思路。

在多模态数据应用方面，研究人员将MMCR应用于图像文本对的学习，取得了显著的效果。这一成果为多模态学习提供了新的方法和技术支持，也为MMCR的应用拓展了新的领域。

总的来说，这项研究对MMCR进行了全面的探索和重新定义，揭示了其深层次机制和应用潜力。未来，随着对MMCR的进一步研究和应用拓展，我们有望在更多领域看到其出色的表现。

10 月 17 日消息，华为 WATCH GT4 系列和华为 WATCH Ultimate 系列智能手表于今年 8月开启新特性体验官招募，招募通过的用户可获推“新特性”版本升级。新特性版本的更新…

10 月 17 日消息，极米 Z6X 第五代投影仪现已上架京东开售，该款投影仪拥有 500CVIA 流明亮度、配备 150°一体式云台，首发 1799 元。据介绍，极米 Z6X 第五代投影仪采用…

研究团队还成功攻破了在高级加密标准（AES）中占重要地位的其他算法，如 Present、Rectangle 和 Gift-64 分组密码。研究人员表示：“我们的研究结果表明，D-Wave 量子技术能够高效攻…

10 月 16 日消息，久负盛名的 macOS 系统清理工具“CleanMyMac”今天宣布推出“全新设计版本”，引入了新的 UI界面和扩展功能，旨在“为 Mac 提供更全面的维护工具”。新版 …

10 月 16 日消息，在今晚举行的发布会上，徕芬发布了扫振电动牙刷 SE，这款电动牙刷已在电商平台开售，到手价 239 元。徕芬扫振电动牙刷 SE 号称“新手的第一支电动牙刷”，采用一体化无缝设…

10 月 16 日消息，据 SonyAlphaRumors 爆料，索尼将于 11 月底举行 α 系列新品发布会。SonyAlphaRumors 预计索尼届时至少会发布一款全新的 E 卡口全画幅无反…

10 月 15 日消息，iQOO 22.5W 和 45W 的自带线充电宝现已在京东开售，采用黄黑配色，22.5W 版售价 149元，45W 版售价 199 元。两款充电宝均为 20000mAh …

。来源：金融界AI电报…

以美团闪购为代表的即时零售依托互联网交易平台，线上下单、线下配送、即时履约，开创了零售业态发展的新模式，在畅流通、促消费、保民生等方面发挥重要作用。高速增长来自即时零售供给生态的不断进化，作为这一进程中出现的…

天眼查知识产权信息显示，近日，百度在线网络技术有限公司申请注册四枚“百度网盘AI修图”商标，国际分类为教育娱乐、科学仪器、办公用品、网站服务，当前商标状态均为等待实质审查。据媒体报道，今年8月，2024上海…

10月16日，百度(BIDU)盘中上涨2.03%，截至22:50，报95.88美元/股，成交1.25亿美元。财务数据显示，截至2024年06月30日，百度收入总额654.44亿人民币，同比增长0.37%；归…

IT之家 10 月 17 日消息，华为 WATCH GT4 系列和华为 WATCH Ultimate 系列智能手表于今年 8月开启新特性体验官招募，招募通过的用户可获推“新特性”版本升级。新特性版本的更新…

现在西数第一次把SMR叠瓦盘做到了创纪录的30TB、32TB，这就是“Ultrastar DC HC690”系列。西数在不断改进SMR之后，推出了自己的增强版“UltraSMR”，去年Ultrastar D…

如果使用最新发布的创纪录容量的32TB SMR叠瓦式硬盘Utlrasta DCHC690，系统总容量分别可达惊人的3264TB、1920TB。一是Ultrasta DC HC590，容量24/26TB，…

【懂车之道产品】近日，懂车之道获悉，宝马M4CS正式发布，新车增加了轻量化套件，动力也有所提升。下面，和大家一起来看看新车的产品力如何？外观上，新车采用了家族式超大鼻孔进气格栅，在格栅内部则是用横向Y字造型，…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.