Anthropic 刚刚发布了 Claude Opus 4.7,并向所有用户和 API 开放访问,价格与 Opus 4.6 保持一致。文章开头把这次升级定性为一次面向真实工作流的强化,而不是单纯追求参数或噱头。它最核心的变化,是更适合高难度、长周期任务。相比旧版本,4.7 在处理复杂任务时更严谨,也更愿意先自检再输出结果。文章提到,这会让一些原本需要人工盯着的高强度编程任务,更适合直接交给它执行。

视觉能力也是这次更新的重要部分。新版本支持更高分辨率的图像输入,适合处理复杂截图、图表和信息抽取。与此同时,它对指令的执行更严格,这意味着旧版本可用的 prompt,在 4.7 上可能会出现新的行为,需要重新调优。文章还列出了多项 benchmark 结果,说明它在金融 Agent、代码编写、文档推理和长上下文等方向都比 4.6 更强。作者特别强调,它在 GDPval-AA 这类衡量经济价值知识工作的指标上达到了当前最优水平。

除了模型本身,这次发布还带来了新的控制和配套能力。Anthropic 增加了介于 high 和 max 之间的 xhigh 努力等级,让开发者能更细地控制推理强度。Claude Code 也把默认努力等级提高到了 xhigh。API 侧新增了 Task Budgets 公测,方便管理长任务中的 token 消耗。文章还提到 Claude Code 增加了 /ultrareview 代码审查功能,为开发者提供了更强的审查工具。

安全方面,Opus 4.7 使用了 Project Glasswing 下的新防护措施,并刻意压制了网络攻击能力。文章说明,如果是合法渗透测试或漏洞研究的安全人员,可以申请 Cyber Verification Program。最后,作者提醒这版模型使用了更新的 tokenizer,同样输入可能会消耗更多 token,尤其是在高努力等级的多轮 agent 场景下,实际成本需要先做测量再决定是否全量切换。整体来看,这是一版更强、更稳、也更偏向生产环境的 Claude 升级。