Claude Opus 4.7是什么
Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型,为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出,SWE-bench Pro 得分提升至 64.3%,视觉分辨率支持提升至 2,576 像素(约 3.75 兆像素),具备自我验证与长程自主执行能力。模型现已全面上线 Claude 全系产品、API 及 Amazon Bedrock 等主流云平台。

Claude Opus 4.7的主要功能
高难度编程:在 SWE-bench Pro 测试中得分 64.3%,可自主处理复杂长时软件开发任务并自我验证结果。
超高分辨率视觉:支持长边 2,576 像素(约 375 万像素)的图像输入,是前代模型的 3 倍以上。
自主纠错机制:在汇报最终结果前主动检查逻辑错误,内部修正后再输出,减少人工介入。
长程任务执行:可连贯运行数小时的多步骤复杂工作流,保持稳定性和一致性。
多模态理解:精准解读密集截图、复杂技术图表、化学结构及像素级视觉细节。
智能工具调用:支持 MCP-Atlas 等扩展工具链,工具调用错误率降低约 1/3。
文件系统记忆:跨多会话长任务中记住关键笔记,减少重复上下文输入。
新增 effort 档位:新增
xhigh档位(位于high与max之间),Claude Code 默认采用此档位。Task Budgets:支持为长任务设置 token 预算,由模型自主分配资源。
Ultrareview 命令:Claude Code 新增独立审查会话,深度检查代码改动与潜在问题。
如何使用Claude Opus 4.7
- 平台访问:
Claude 网页/App:直接在模型选择器切换至 Opus 4.7 即可使用。
API 调用:模型 ID 为
claude-opus-4-7,通过 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 或 Microsoft Foundry 调用。Claude Code:已默认将 effort 档位提升至
xhigh,输入/ultrareview可启动深度代码审查。
- API 关键参数设置:
effort 档位:通过
effort参数控制响应规模,选项为low/medium/high/xhigh/max。编程与 agentic 场景建议使用high或xhigh起步。task budgets(公测):设置长任务 token 预算,让模型自主分配资源,与 effort 参数配合使用更精细。
thinking 参数:已弃用
thinking: {type: "enabled", budget_tokens: N},改为使用thinking: {type: "adaptive"}配合effort参数。
- 高分辨率视觉:直接上传长边不超过 2,576 像素的原图,无需自行压缩,模型自动处理高分辨率输入。
- Claude Code 特有指令:
输入
/ultrareview启动独立审查会话,对代码改动进行深度检查(Pro 和 Max 用户每月限免 3 次)。Auto mode 已下放至 Max 用户,可在
--dangerously-skip-permissions与默认模式间提供中间档安全选项。
Claude Opus 4.7的关键信息和使用要求
模型定位:Opus 4.6 的直接升级版,Anthropic 最新旗舰模型,现已全面上线 Claude 全系产品、API、Amazon Bedrock、Google Cloud Vertex AI 及 Microsoft Foundry。
核心升级:高难度软件工程任务能力显著提升(SWE-bench Pro 达 64.3%),视觉分辨率支持长边 2,576 像素(约 375 万像素,为前代 3 倍以上),具备自我验证与长程自主执行能力。
定价策略:维持 Opus 4.6 价格,输入 $5/百万 token,输出 $25/百万 token,模型 ID 为
claude-opus-4-7。新增档位:在
high与max之间新增xhigheffort 档位,Claude Code 默认已切换至此档位。Tokenizer 变更:新 tokenizer 下相同文本的 token 数约为旧版的 1.0–1.35 倍,需预留更高 token 预算。
Claude Opus 4.7的核心优势
高难度编程突破:在 SWE-bench Pro 测试中得分 64.3%,较 4.6 提升 11 个百分点,可自主处理最复杂的软件工程任务。
自我验证机制:在汇报结果前主动检查逻辑错误并内部修正,显著降低人工介入频率,提升长任务可靠性。
视觉感知跃升:支持 2,576 像素长边(约 375 万像素)的高分辨率图像,视觉感知基准从 54.5% 跃升至 98.5%。
长程任务稳定性:可连贯运行数小时的多步骤复杂工作流,不会因中途难题而放弃,保持执行一致性。
严格指令遵循:对指令的字面执行精度大幅提升,减少模糊解读,确保按用户意图精确完成。
工具调用效率:工具调用错误率降低约三分之一,token 使用效率在多步 agentic 场景中显著优化。
Claude Opus 4.7的项目地址
- 项目官网:https://www.anthropic.com/news/claude-opus-4-7
Claude Opus 4.7的同类竞品对比
| 评测维度 | Claude Opus 4.7 | GPT-5.4 | Gemini 3.1 Pro |
|---|---|---|---|
| Agentic coding (SWE-bench Pro) | 64.3% | 57.7% | 54.2% |
| Agentic coding (SWE-bench Verified) | 87.6% | — | 80.6% |
| Agentic terminal coding (Terminal-Bench 2.0) | 69.4% | 75.1% | 68.5% |
| Multidisciplinary reasoning (Humanity’s Last Exam w/ tools) | 54.7% | 58.7% | 51.4% |
| Agentic search (BrowseComp) | 79.3% | 89.3% | 85.9% |
| Scaled tool use (MCP-Atlas) | 77.3% | 68.1% | 73.9% |
| Agentic computer use (OSWorld-Verified) | 78.0% | 75.0% | — |
| Agentic financial analysis (Finance Agent v1.1) | 64.4% | 61.5% | 59.7% |
| Graduate-level reasoning (GPQA Diamond) | 94.2% | 94.4% | 94.3% |
| Visual reasoning (CharXiv w/ tools) | 91.0% | — | — |
| Multilingual Q&A (MMLU) | 91.5% | — | 92.6% |
Claude Opus 4.7的应用场景
- 高难度软件开发:支持处理复杂的软件工程任务,如大规模代码重构、复杂算法实现,可自主运行数小时并在汇报前自我验证结果,GitHub 实测任务解决率提升 13%。
- 高分辨率视觉分析:模型能解读密集 UI 截图、技术图表、化学结构及像素级视觉细节,适用于计算机视觉代理、自动化渗透测试和生命科学专利工作流。
- 长程自主工作流:自动执行跨多会话的复杂多步骤任务,如深度数据分析、研究报告生成,能够在长时间运行中保持一致性和连贯性,减少人工介入。
- 金融与商业分析:模型能进行严谨的财务建模、投资分析和专业演示文稿生成,在 Finance Agent v1.1 基准测试中得分 64.4%,可产出严谨的分析模型和高质量商业交付物。
