Claude Opus 4.7
编程 / 视觉 / Agentic 三维升级
SWE-bench Pro 64.3% 领跑、视觉分辨率扩大到 3.75 MP、新增 xhigh effort 档位、原生 1M context,与 Opus 4.6 完全同价($5/$25 per MTok)
核心亮点
93 任务编程基准相对 4.6 +13%,其中 4 任务 4.6 和 Sonnet 4.6 都解不出
领先 GPT-5.4 6.6 点、Gemini 3.1 Pro 10.1 点,agentic 编程代际升级
图片长边从约 800px 上升到 2576px(3.75 MP),computer-use 场景质的飞跃
$5 input / $25 output per MTok,和 4.6 完全一致,没有涨价
编程能力飞跃:28 家厂商背书
从长程自主任务到复杂工具调用,Opus 4.7 把'必须盯着看'的代码活变成'放手让它跑'
GitHub:93 任务 +13%
在 GitHub 内部 93 任务编程基准上,Opus 4.7 比 Opus 4.6 高 13%,其中 4 个任务 4.6 和 Sonnet 4.6 都搞不定
Cursor:CursorBench 70%
Cursor 内部基准从 Opus 4.6 的 58% 提升到 70%
Notion:准确率 +14%,tool 错误减至 1/3
Notion 准确率提升 14%,token 消耗更少,工具调用错误降至 1/3;首个通过 Notion 隐含需求测试的模型
Cognition (Devin):几小时连贯工作
Opus 4.7 能连贯工作几个小时,不会卡在难题上放弃
Rakuten:生产任务 3x
Rakuten-SWE-Bench 上 Opus 4.7 解决的生产任务是 Opus 4.6 的 3 倍
⭐ Imbue:自主构建 Rust TTS
Opus 4.7 自主从零构建完整 Rust TTS 引擎,包括神经网络、SIMD 内核、浏览器 demo,并用语音识别器反向验证输出与 Python 参考一致
视觉能力突破
图片长边从原约 800px 提升到 2576px(3.75 MP),是此前 Claude 模型的 3 倍多。直接送图到 API 即可,无需 API 参数开关
Computer-use Agent 读密集截图
高分辨率让 agent 能在一次视野里读懂更多 UI 细节,减少滚屏/重取次数
复杂图表数据抽取
多层嵌套的图表、表格、仪表盘,细节坐标轴标签可读性大幅改善
文档 OCR 与版式识别
带小字、脚注、手写批注的 PDF / 扫描件,可一次性抽取文本和结构
UI 截图像素级对照
设计稿 vs 实现对比、UI 回归检测等需要高分辨率像素比对的场景
同期上线的新能力
新 effort 档位:xhigh
在 high 和 max 之间新增一档 xhigh,更细粒度地平衡推理深度和 latency。Claude Code 默认已拉到 xhigh
/ultrareview 深度代码审查
Claude Code 新增命令,独立 review 会话把改动从头到尾过一遍,找 bug 和设计问题
Task budgets(API 公测)
开发者可以给 Claude 设置 token 预算,让它在长任务里自主分配优先级
Auto mode 下放 Max 用户
工具调用前分类器判断安全性,安全的直接放行,危险的拦下来让 Claude 换方案
迁移指南(⭐重点)
从 Opus 4.6 升到 Opus 4.7 是直接替换(model ID 改为 claude-opus-4-7),但有 4 个点值得提前规划
1. Tokenizer 换代
新 tokenizer 下,同样的输入文本 token 数约为旧版 1.0-1.35 倍(取决于内容类型)。token 预算要按新值评估,不要直接套用旧数字
2. 指令跟随更严格
Opus 4.7 逐字执行指令,不再'善意解读'。老 prompt 可能产生意外结果,升级时 prompt 和 harness 要重新调
3. Thinking API 迁移
thinking={type:"enabled", budget_tokens:N} 已 deprecated,推荐 thinking={type:"adaptive"} 配合 effort 参数
4. 清理老 beta header
effort-2025-11-24、fine-grained-tool-streaming-2025-05-14、interleaved-thinking-2025-05-14 等 beta header 已正式上线,可以移除
client.messages.create(
model="claude-opus-4-7",
thinking={"type": "enabled", "budget_tokens": 10000}
)
client.messages.create(
model="claude-opus-4-7",
thinking={"type": "adaptive"},
effort="xhigh" # new in 4.7
)
与 GPT-5.4 / Gemini 3.1 Pro 对比
同价位旗舰模型横评(基于 Anthropic 官方公布的基准数据)
| 指标 | Opus 4.7 | GPT-5.4 | Gemini 3.1 Pro |
|---|---|---|---|
| SWE-bench Pro | 64.3% | 57.7% | 54.2% |
| Input $ / MTok | $5 | 参考 OpenAI | 参考 Google |
| Output $ / MTok | $25 | 参考 OpenAI | 参考 Google |
| Context window | 原生 1M | 272K / 1M beta | 1M |
| Max output | 128K tokens | — | — |
QCode.cc 如何帮你用上 Opus 4.7
国内稳定 API 代理,官方同价,即开即用
官方同价 $5/$25
QCode.cc 按 Anthropic 官方定价计费,不做任何倍率加价
支持 effort / thinking 新参数
完整透传 xhigh effort、adaptive thinking 等 Opus 4.7 新参数
一键切换 4.6 / 4.7
model ID 从 claude-opus-4-6 改到 claude-opus-4-7 即可,无需改其他配置
国内直连,稳定低延迟
多节点智能路由 + 熔断兜底,避免官方 API 在国内访问的不稳定性