滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

清华瑞莱携手升级大模型安全，RealSafe-R1引领开源AI新标杆

时间：2025-02-24 19:18:20 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，清华大学携手瑞莱智慧公司，共同发布了一款名为RealSafe-R1的大语言模型。该模型是对DeepSeek R1的深度优化与强化训练成果，不仅保持了卓越的性能稳定性，更在安全性方面实现了质的飞跃，超越了诸如Claude3.5和GPT-4o等被广泛认为安全性较高的闭源大模型，为开源大模型的安全发展提供了创新性的路径。

DeepSeek作为国产开源大模型的佼佼者，其在自然语言处理和多任务推理领域展现出的强大实力令人瞩目，尤其在处理复杂问题和创造性任务时更是表现出色。然而，即便是如此优秀的模型，在面对如越狱攻击等安全挑战时，也暴露出了局限性。恶意设计的输入可能会误导模型，导致生成不安全或不符合预期的响应。这一安全问题并非DeepSeek独有，而是开源大模型普遍面临的难题，根源在于安全对齐机制的不足。

针对这一问题，清华大学与瑞莱智慧的联合团队提出了创新的解决方案——基于模型自我提升的安全对齐方式。这一方法将安全对齐与内省推理相结合，使大语言模型能够通过具备安全意识的思维链分析，自主识别并规避潜在风险，从而实现模型自身能力的进化。该方案不仅适用于DeepSeek系列模型，还可广泛应用于其他开源或闭源模型。

基于上述创新方法，团队对DeepSeek-R1系列模型进行了后训练，成功推出了RealSafe-R1系列大模型。实验数据表明，RealSafe-R1在安全性方面取得了显著提升，有效增强了模型对各种越狱攻击的抵抗力，同时减轻了安全与性能之间的冲突，整体表现优于Claude3.5和GPT-4o等闭源大模型。这一成果不仅丰富了DeepSeek生态，更为大语言模型的安全发展树立了新的标杆。

瑞莱智慧首席执行官田天表示：“大模型的安全性瓶颈是制约人工智能产业高质量发展的关键因素。只有通过持续投入和创新，补齐安全短板，我们才能为政务、金融、医疗等严肃场景的应用提供更为可靠的坚实基座。”据悉，RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开放，这将为开源大模型的安全性加固提供有力支持，进一步推动人工智能技术的广泛应用与发展。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

国家知识产权局重拳出击，驳回63件DeepSeek商标恶意抢注申请

02-24

百度App大升级，经典标语“百度一下，你就知道”重磅回归！

02-24

YY携手DeepSeek，全新AI产品YYDS来袭，直播体验再升级！

02-24

DeepSeek开源FlashMLA，GPU优化解码内核获5500星标

三言科技消息上周，DeepSeek宣布将于本周连续开源5个代码库。今天上午开源了首个代码库FlashMLA。FlashMLA是针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，…

02-24

阿里豪掷3800亿！未来三年全力押注云与AI，行业格局将如何改写？

02-24

启明星辰：大模型时代，安全服务组合筑牢智能基建底线

02-24

基石智算DeepSeek一体机：企业AI应用部署新利器，高效便捷一键启动

02-24

阿里豪掷3800亿！云与AI硬件基建大升级，未来已来？

02-24

AI竞赛白热化：DeepSeek领跑一时，美企后来居上引新战局

02-24

百度App大升级，经典标语“百度一下，你就知道”重归，AI功能全面焕新！

02-24

商汤科技DeepSeek企业版正式上线，免费版也迎来国产化适配与算力升级

02-24

马斯克Grok 3正式上线，能否撼动AI大模型格局？

02-24

开源模型市场份额将超越闭源模型？

One of the most discussed topics at the GDC was the DeepSeekopen-source large model, which has garnere…

02-24

百度App全新升级，AI搜索功能大飞跃，DeepSeek与文心大模型强强联合！

02-24

百度App大升级，经典标语“百度一下，你就知道”重归开屏页！

02-24

点击查看更多 +

全站最新

手机也能离线用DeepSeek？实测可行，隐私安全再升级！

华为余承东预告神秘新机，首款原生鸿蒙Pocket 3即将面世？

宝马淡定布局：2033年量产固态电池电车，对手奔驰已抢先路试

宝马5系四驱试驾体验：安全与智驾并存，驾驶乐趣再升级

奇瑞风云T8全球上市，重塑10万级混动SUV标杆，引领国民出行新潮流！

LG全球首发40英寸P2P车载巨屏，索尼本田Afeela率先搭载引领驾驶新体验

热门内容

本栏最新

国家知识产权局重拳出击，驳回63件DeepSeek商标恶意抢注申请

百度App大升级，经典标语“百度一下，你就知道”重磅回归！

YY携手DeepSeek，全新AI产品YYDS来袭，直播体验再升级！

DeepSeek开源FlashMLA，GPU优化解码内核获5500星标

阿里豪掷3800亿！未来三年全力押注云与AI，行业格局将如何改写？

启明星辰：大模型时代，安全服务组合筑牢智能基建底线

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.