在经历了长达一个月的 “模型退化” 争议后,Anthropic 终于在 2026 年 4 月 16 日悄然推出 Claude Opus 4.7,以一次硬核升级回应开发者社区的集中不满。
这不仅是一次常规迭代,更是一场信任修复之战。
一、前情提要:Opus 4.6 为何引发大规模吐槽?
Opus 4.6 上线初期口碑尚可,但随后大量开发者反馈:
-
复杂工程任务频繁中途放弃
-
倾向给出看似合理实则错误的答案
-
面对数据冲突时强行圆场,不承认能力边界
-
可靠性大幅下降,无法用于生产环境
多位资深工程师公开表示:Opus 4.6 已不再适合执行高可信度的开发与分析任务。
而 Anthropic 选择用直接发布新版本的方式,作为最沉默也最直接的回应。
二、Opus 4.7 核心升级:工程能力全面回归
官方定位:软件工程能力显著增强,并新增 xhigh 最高努力等级。
关键提升(真实可感知)
-
编码能力大幅增强
-
官方基准:编码任务提升 13%
-
生产级自主完成率 提升 3 倍
-
Cursor 内部测试:编码成功率从 58% → 70%
-
-
更 “诚实” 的模型行为
面对数据不足 / 矛盾时,不再强行编造答案,而是明确告知无法回答,可信度显著提升。
-
超高分辨率视觉
支持 3.75 兆像素 图像输入,图表、图纸、长截图理解更强。
-
全新分词器
理解精度提升,但可能导致同等文本下 token 消耗略有上升。
价格保持不变
-
输入:$5 / 百万 token
-
输出:$25 / 百万 token
三、两周一更:Anthropic 的双线竞争格局
近两个月,Anthropic 保持约两周一次重大更新,在产品层面全速冲刺。
与此同时,公司还在推进更敏感的方向:
-
面向企业安全的 Mythos Preview
-
聚焦网络安全的 Project Glasswing
-
高攻防能力模型,已引起美国官方高度关注
这意味着 Anthropic 同时在打两场仗:
-
面向开发者与企业的产品战争
-
关于 AI 安全与能力边界的政策博弈
Opus 4.7 正是其 **“足够强、可商用、可控”** 的公开主力型号。
四、对开发者生态的影响
Opus 4.7 的发布,迅速获得主流开发工具的认可:
-
Cursor 第一时间接入,成为核心编程模型
-
Hex 评价为 “目前测评过最可靠的模型”
行业共识正在形成:
AI 正从创意助手走向可靠执行者,而稳定性与可信度,将成为下一阶段的核心壁垒。
五、总结:一次及时的 “口碑救场”
Opus 4.7 用真实可测的提升,止住了 Opus 4.6 带来的信任滑坡。
但对用户来说,一次升级不够,稳定、可预期、持续可靠才是长期关键。
在越来越卷的 AI 模型赛道上,Anthropic 用速度与质量证明:它依然是企业级与工程场景最有竞争力的玩家之一。
