被吐槽 “降智” 1 个月后,Anthropic 正式发布 Claude Opus 4.7:工程能力大幅回血

在经历了长达一个月的 “模型退化” 争议后,Anthropic 终于在 2026 年 4 月 16 日悄然推出 Claude Opus 4.7,以一次硬核升级回应开发者社区的集中不满。

这不仅是一次常规迭代,更是一场信任修复之战


一、前情提要:Opus 4.6 为何引发大规模吐槽?

Opus 4.6 上线初期口碑尚可,但随后大量开发者反馈:

  • 复杂工程任务频繁中途放弃

  • 倾向给出看似合理实则错误的答案

  • 面对数据冲突时强行圆场,不承认能力边界

  • 可靠性大幅下降,无法用于生产环境

多位资深工程师公开表示:Opus 4.6 已不再适合执行高可信度的开发与分析任务。

而 Anthropic 选择用直接发布新版本的方式,作为最沉默也最直接的回应。


二、Opus 4.7 核心升级:工程能力全面回归

官方定位:软件工程能力显著增强,并新增 xhigh 最高努力等级。

关键提升(真实可感知)

  1. 编码能力大幅增强

    • 官方基准:编码任务提升 13%

    • 生产级自主完成率 提升 3 倍

    • Cursor 内部测试:编码成功率从 58% → 70%

  2. 更 “诚实” 的模型行为

    面对数据不足 / 矛盾时,不再强行编造答案,而是明确告知无法回答,可信度显著提升。

  3. 超高分辨率视觉

    支持 3.75 兆像素 图像输入,图表、图纸、长截图理解更强。

  4. 全新分词器

    理解精度提升,但可能导致同等文本下 token 消耗略有上升

价格保持不变

  • 输入:$5 / 百万 token

  • 输出:$25 / 百万 token


三、两周一更:Anthropic 的双线竞争格局

近两个月,Anthropic 保持约两周一次重大更新,在产品层面全速冲刺。

与此同时,公司还在推进更敏感的方向:

  • 面向企业安全的 Mythos Preview

  • 聚焦网络安全的 Project Glasswing

  • 高攻防能力模型,已引起美国官方高度关注

这意味着 Anthropic 同时在打两场仗:

  1. 面向开发者与企业的产品战争

  2. 关于 AI 安全与能力边界的政策博弈

Opus 4.7 正是其 **“足够强、可商用、可控”** 的公开主力型号。


四、对开发者生态的影响

Opus 4.7 的发布,迅速获得主流开发工具的认可:

  • Cursor 第一时间接入,成为核心编程模型

  • Hex 评价为 “目前测评过最可靠的模型”

行业共识正在形成:

AI 正从创意助手走向可靠执行者,而稳定性与可信度,将成为下一阶段的核心壁垒。


五、总结:一次及时的 “口碑救场”

Opus 4.7 用真实可测的提升,止住了 Opus 4.6 带来的信任滑坡。

但对用户来说,一次升级不够,稳定、可预期、持续可靠才是长期关键。

在越来越卷的 AI 模型赛道上,Anthropic 用速度与质量证明:它依然是企业级与工程场景最有竞争力的玩家之一。