探索 AI 写代码极致: Claude Opus 4.1 模型登场

IT之家8月6日消息，Anthropic公司今天（8月6日）发布公告，宣布推出ClaudeOpus4.1模型，相比较今年5月推出的Claude4系列模型，主要改进了编码、推理和执行指令的能力。

Anthropic表示，ClaudeOpus4.1在SWE-benchVerified上（用于评估软件工程准确性）提升到了74.5%，作为对比，ClaudeSonnet3.7的准确率为62.3%，而ClaudeOpus4的准确率为72.5%。具体来说，更新后的模型在“深度研究和数据分析技能，尤其是在细节追踪和代理搜索方面”表现得更加出色。

与Opus4相比，Opus4.1在大多数功能上都有所提升，特别是在多文件代码重构方面表现尤为突出。IT之家附上相关数据如下：

RakutenGroup发现，Opus4.1不做不必要的调整或引入新的错误，能够精确地在大型代码库中定位并修正错误。

Windsurf报告称，Opus4.1在其初级开发者基准测试中，比Opus4表现提高了标准差的一个单位，这一性能飞跃与从Sonnet3.7到Sonnet4的跳跃相当。

最新的模型今日起面向Claude客户开放，可以通过ClaudeCode、Anthropic的API、亚马逊Bedrock和谷歌云的VertexAI使用。

同时，Anthropic在社交媒体上表示，计划在未来几周内发布“对我们模型的重大改进”，因此可以期待Claude系列模型的更多升级。OpenAI也预计将在本周发布新消息。