近期,据Information网站报道,meta公司,即Facebook的母公司,已成立四个专项研究团队,深入探索国产大模型DeepSeek的核心机制。此举旨在通过分析DeepSeek的工作原理,来优化meta自家的大模型Llama。
值得注意的是,就在不久前,DeepSeek-R1推理大模型正式面世。据官方披露,DeepSeek-R1在后训练阶段大规模运用了强化学习技术,即便在标注数据极为有限的情况下,也显著提升了模型的推理能力。在数学、代码编写以及自然语言推理等多项任务上,DeepSeek-R1的性能已可媲美OpenAI的GPT-1正式版。
更令人瞩目的是,Deepseek应用在发布后迅速走红,不仅在中国地区的苹果应用商店免费下载排行榜上夺得榜首,更是在美国地区的应用商店免费下载榜上超越了ChatGPT,展现出强大的市场吸引力和用户基础。