Claude Opus 4.7 – Anthropic 推出的最新旗舰大模型

Al项目 2026-04-17 12:00:45 AI导航网

Claude Opus 4.7是什么

Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型,为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出,SWE-bench Pro 得分提升至 64.3%,视觉分辨率支持提升至 2,576 像素(约 3.75 兆像素),具备自我验证与长程自主执行能力。模型现已全面上线 Claude 全系产品、API 及 Amazon Bedrock 等主流云平台。

Claude Opus 4.7的主要功能

  • 高难度编程:在 SWE-bench Pro 测试中得分 64.3%,可自主处理复杂长时软件开发任务并自我验证结果。

  • 超高分辨率视觉:支持长边 2,576 像素(约 375 万像素)的图像输入,是前代模型的 3 倍以上。

  • 自主纠错机制:在汇报最终结果前主动检查逻辑错误,内部修正后再输出,减少人工介入。

  • 长程任务执行:可连贯运行数小时的多步骤复杂工作流,保持稳定性和一致性。

  • 多模态理解:精准解读密集截图、复杂技术图表、化学结构及像素级视觉细节。

  • 智能工具调用:支持 MCP-Atlas 等扩展工具链,工具调用错误率降低约 1/3。

  • 文件系统记忆:跨多会话长任务中记住关键笔记,减少重复上下文输入。

  • 新增 effort 档位:新增 xhigh 档位(位于 highmax 之间),Claude Code 默认采用此档位。

  • Task Budgets:支持为长任务设置 token 预算,由模型自主分配资源。

  • Ultrareview 命令:Claude Code 新增独立审查会话,深度检查代码改动与潜在问题。

如何使用Claude Opus 4.7

  • 平台访问
    • Claude 网页/App:直接在模型选择器切换至 Opus 4.7 即可使用。

    • API 调用:模型 ID 为 claude-opus-4-7,通过 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 或 Microsoft Foundry 调用。

    • Claude Code:已默认将 effort 档位提升至 xhigh,输入 /ultrareview 可启动深度代码审查。

  • API 关键参数设置
    • effort 档位:通过 effort 参数控制响应规模,选项为 low / medium / high / xhigh / max。编程与 agentic 场景建议使用 highxhigh 起步。

    • task budgets(公测):设置长任务 token 预算,让模型自主分配资源,与 effort 参数配合使用更精细。

    • thinking 参数:已弃用 thinking: {type: "enabled", budget_tokens: N},改为使用 thinking: {type: "adaptive"} 配合 effort 参数。

  • 高分辨率视觉:直接上传长边不超过 2,576 像素的原图,无需自行压缩,模型自动处理高分辨率输入。
  • Claude Code 特有指令
    • 输入 /ultrareview 启动独立审查会话,对代码改动进行深度检查(Pro 和 Max 用户每月限免 3 次)。

    • Auto mode 已下放至 Max 用户,可在 --dangerously-skip-permissions 与默认模式间提供中间档安全选项。

Claude Opus 4.7的关键信息和使用要求

  • 模型定位:Opus 4.6 的直接升级版,Anthropic 最新旗舰模型,现已全面上线 Claude 全系产品、API、Amazon Bedrock、Google Cloud Vertex AI 及 Microsoft Foundry。

  • 核心升级:高难度软件工程任务能力显著提升(SWE-bench Pro 达 64.3%),视觉分辨率支持长边 2,576 像素(约 375 万像素,为前代 3 倍以上),具备自我验证与长程自主执行能力。

  • 定价策略:维持 Opus 4.6 价格,输入 $5/百万 token,输出 $25/百万 token,模型 ID 为 claude-opus-4-7

  • 新增档位:在 highmax 之间新增 xhigh effort 档位,Claude Code 默认已切换至此档位。

  • Tokenizer 变更:新 tokenizer 下相同文本的 token 数约为旧版的 1.0–1.35 倍,需预留更高 token 预算。

Claude Opus 4.7的核心优势

  • 高难度编程突破:在 SWE-bench Pro 测试中得分 64.3%,较 4.6 提升 11 个百分点,可自主处理最复杂的软件工程任务。

  • 自我验证机制:在汇报结果前主动检查逻辑错误并内部修正,显著降低人工介入频率,提升长任务可靠性。

  • 视觉感知跃升:支持 2,576 像素长边(约 375 万像素)的高分辨率图像,视觉感知基准从 54.5% 跃升至 98.5%。

  • 长程任务稳定性:可连贯运行数小时的多步骤复杂工作流,不会因中途难题而放弃,保持执行一致性。

  • 严格指令遵循:对指令的字面执行精度大幅提升,减少模糊解读,确保按用户意图精确完成。

  • 工具调用效率:工具调用错误率降低约三分之一,token 使用效率在多步 agentic 场景中显著优化。

Claude Opus 4.7的项目地址

  • 项目官网:https://www.anthropic.com/news/claude-opus-4-7

Claude Opus 4.7的同类竞品对比

评测维度Claude Opus 4.7GPT-5.4Gemini 3.1 Pro
Agentic coding (SWE-bench Pro)64.3%57.7%54.2%
Agentic coding (SWE-bench Verified)87.6%80.6%
Agentic terminal coding (Terminal-Bench 2.0)69.4%75.1%68.5%
Multidisciplinary reasoning (Humanity’s Last Exam w/ tools)54.7%58.7%51.4%
Agentic search (BrowseComp)79.3%89.3%85.9%
Scaled tool use (MCP-Atlas)77.3%68.1%73.9%
Agentic computer use (OSWorld-Verified)78.0%75.0%
Agentic financial analysis (Finance Agent v1.1)64.4%61.5%59.7%
Graduate-level reasoning (GPQA Diamond)94.2%94.4%94.3%
Visual reasoning (CharXiv w/ tools)91.0%
Multilingual Q&A (MMLU)91.5%92.6%

Claude Opus 4.7的应用场景

  • 高难度软件开发:支持处理复杂的软件工程任务,如大规模代码重构、复杂算法实现,可自主运行数小时并在汇报前自我验证结果,GitHub 实测任务解决率提升 13%。
  • 高分辨率视觉分析:模型能解读密集 UI 截图、技术图表、化学结构及像素级视觉细节,适用于计算机视觉代理、自动化渗透测试和生命科学专利工作流。
  • 长程自主工作流:自动执行跨多会话的复杂多步骤任务,如深度数据分析、研究报告生成,能够在长时间运行中保持一致性和连贯性,减少人工介入。
  • 金融与商业分析:模型能进行严谨的财务建模、投资分析和专业演示文稿生成,在 Finance Agent v1.1 基准测试中得分 64.4%,可产出严谨的分析模型和高质量商业交付物。

© 版权声明

相关文章