近日,AI领域迎来了一项重大突破,Anthropic公司发布了其首个混合推理模型Claude 3.7 Sonnet,这一创新成果在扩展思考模式方面表现卓越,被誉为迄今为止最强大的模型。据新智元报道,Claude 3.7 Sonnet在最新的编码测试中展现出了非凡的实力,超越了o3-mini和DeepSeek R1等竞争对手,成为AI编码领域的新标杆。
Claude 3.7 Sonnet作为Anthropic推出的首款混合推理模型,不仅代表了Claude系列的最高智能水平,更以其近乎即时的响应速度和可扩展的、逐步的思考模式赢得了业界的广泛关注。这一模型能够迅速响应并展示详细的思考步骤,这些步骤对用户而言是完全透明的。
Claude 3.7 Sonnet在编码和前端网页开发方面取得了显著提升。用户不仅可以获得几乎即时的响应,还可以通过API精细控制模型的思考时间。Anthropic还推出了一款名为Claude Code的命令行工具,这款工具旨在帮助开发人员更智能地进行编码工作。
目前,Claude Code仅作为有限的研究预览版提供给开发人员使用,它允许开发人员直接从终端将大量的工程任务委托给Claude处理。这一创新工具不仅提高了开发效率,还为AI在软件工程领域的应用开辟了新的道路。
在多项基准测试中,Claude 3.7 Sonnet凭借其“扩展思考”模式在数学、物理、指令执行和编程等方面刷新了SOTA记录。与上一代Claude 3.5 Sonnet相比,Claude 3.7 Sonnet在数学和编码能力方面提升了10%以上。除了数学领域,Claude 3.7 Sonnet(64k扩展思考)几乎完全超越了o3-mini和DeepSeek R1,与Grok 3不相上下。在SWE-bench上,Claude 3.7 Sonnet更是创下了70.3%的高分,充分证明了其作为最强“软件工程AI”的实力。
现在,广大用户可以在Claude.ai平台上免费体验Claude 3.7 Sonnet。无论是Web、iOS还是Android用户,都可以轻松访问这一强大的AI模型,享受其带来的高效和便捷。