Grok 4.3是什么
Grok 4.3 是 xAI 推出的最新旗舰推理模型,主打 Agentic 工作流与极致性价比。模型约 5000 亿参数,API 支持 100 万 token 上下文及原生视频理解,可生成 PDF、PPT 等结构化文档。评测中其 Intelligence Index 达 53 分,GDPval-AA 暴涨 321 分,IFBench 以 81% 登顶全榜。API 定价极具竞争力,输入 $1.25、输出 $2.50 每百万 token,较上一代降低约六成,测评成本仅为 Claude Opus 4.7 的 1/12。

Grok 4.3的主要功能
Agentic 推理引擎:推理模式始终开启,专为多步 Agent 任务设计,支持复杂工作流自动化与长文档分析,无输出 token 上限。
超长上下文处理:API 端支持 100 万 token 上下文窗口,消费者端保留 200 万 token,可一次性处理整本书或海量代码库。
原生多模态理解:支持文本、图像及视频输入,可识别视频中的物体、描述事件序列并回答特定时间戳问题。
结构化文档生成:可直接生成并下载原生 PDF、PowerPoint 和 Excel 文件,无需借助外部插件或转换工具。
内置代码执行环境:支持编写、运行代码并直接产出可下载文件,适合数据分析、脚本自动化等开发场景。
网络与 X 平台搜索:内置实时联网搜索能力,可调用 X 平台数据,确保回答基于最新信息。
语音克隆与合成:同步上线 Custom Voices API,支持 25+ 语言的语音克隆、语音识别(STT)与语音合成(TTS)。
桌面自动化 Agent(Grok Computer):可跨应用执行多步任务链,实现桌面级自动化操作。
开发者工具链:支持函数调用、结构化输出、Prompt 缓存、MCP 远程工具接入,兼容 OpenRouter 等第三方网关。
如何使用Grok 4.3
消费者网页/APP 端使用:订阅 SuperGrok Heavy($300/月)后,在 Grok 聊天界面点击模型切换菜单,选择「Grok 4.3 (beta)」即可开始对话,支持文本、图片上传及实时联网搜索。
API 官方接入:前往 xAI 开发者平台,注册账号并获取 API Key,调用模型名称
grok-4.3或grok-4.3-latest,按标准 OpenAI 兼容格式发送请求,支持 us-east-1 和 eu-west-1 两个区域。第三方网关调用:通过 OpenRouter、Vercel AI Gateway 或 Puter.js 等平台接入,无需直接管理 xAI 官方接口,适合已有第三方 AI 网关集成的开发者。
长文档分析:利用 100 万 token(API)或 200 万 token(消费者端)的上下文窗口,直接上传整份 PDF、代码库或长文,让模型进行全文摘要、提取关键信息或多轮深度追问。
视频内容理解:上传视频文件或提供视频链接,Grok 4.3 可自动识别画面物体、描述事件时间线并回答特定时间戳的问题。
代码执行与文件生成:在对话中要求模型编写代码并运行,或指定生成 PDF、PPT、Excel 等结构化文档,模型会直接返回可下载的文件。
Agent 自动化任务:通过 Grok Computer 功能或 API 的函数调用 / MCP 工具接入,设置多步任务链,让模型跨应用执行自动化操作,如数据抓取、报表生成、邮件处理等。
语音克隆与合成:调用同步上线的 Custom Voices API,上传音频样本克隆声音,或使用 25+ 语言的 TTS/STT 能力进行语音交互。
Prompt 缓存降本:在 API 调用中启用 Prompt 缓存功能,对重复使用的长上下文进行缓存,缓存费率仅 $0.20/百万 token,大幅降低长文本处理成本。
Grok 4.3的关键信息和使用要求
发布时间与版本状态:Beta 版率先上线,目前 API 已全面开放,消费者端仍处于早期测试阶段
参数规模:约 5000 亿参数(0.5T),马斯克确认 1T 参数的 Grok 4.4 正在训练中,预计 5 月初发布
上下文窗口:API 端支持 100 万 token,消费者端支持 200 万 token;请求超过 20 万总 token 后触发更高上下文定价
知识截止:2025 年 12 月,训练数据覆盖至该时间点
推理模式特性:始终开启(Always-on),无法手动关闭或调节,所有请求均经过深度推理,适合复杂任务但响应速度相对较慢
API 定价:输入 $1.25 / 百万 token,输出 $2.50 / 百万 token,缓存 $0.20 / 百万 token;跑完整套 benchmark 测评成本仅约 $395
速率与区域限制:每分钟 1800 请求、1000 万 token;当前仅开放 us-east-1 和 eu-west-1 两个区域
模型别名:API 调用时模型名称为
grok-4.3或grok-4.3-latest消费者端订阅门槛:目前仅限 SuperGrok Heavy($300/月)付费会员使用,预计 5 月中下旬向标准订阅者开放
API 接入渠道:需 xAI 官方 API Key,也可通过 OpenRouter、Vercel AI Gateway、Puter.js 等第三方平台调用
多模态输入要求:支持文本、图像、视频输入,但视频理解功能需通过 API 或最新客户端使用
输出能力:支持文本、代码及原生 PDF/PPT/Excel 文件生成,无输出 token 上限
企业功能要求:如需函数调用、结构化输出、Prompt 缓存、MCP 远程工具等高级功能,需通过官方 API 接入而非仅使用消费者端
Grok 4.3的核心优势
极致性价比:API 输入 $1.25、输出 $2.50 / 百万 token,较上一代便宜约六成;跑完整套 benchmark 测评成本仅 $395,是 Claude Opus 4.7 的 1/12,被 Artificial Analysis 评价为「帕累托前沿」上的模型。
超长上下文:API 支持 100 万 token、消费者端支持 200 万 token,可一次性吞入整本书、海量代码库或长视频,且不设输出 token 上限。
Agentic 推理能力:推理模式始终开启,GDPval-AA 真实工作评测暴涨 321 分至 1500 分,对上一代胜率超 87%,擅长营销文案、财务模型、PPT 等实际经济任务。
顶尖指令跟随:IFBench 以 81% 准确率登顶全榜第一,τ²-Bench Telecom 客服 Agent 任务达 98% 并列第一,对复杂指令的理解与执行能力极强。
原生多模态与文档生成:首次支持视频输入理解,可直接生成原生 PDF、PPT、Excel 文件,无需插件转换,打通「分析→产出」闭环。
Grok 4.3的同类竞品对比
| 对比维度 | Grok 4.3 | Claude Opus 4.7 | GPT-5.5 (xhigh) |
|---|---|---|---|
| 所属公司 | xAI (马斯克) | Anthropic | OpenAI |
| 参数规模 | ~0.5T (500B) | 未公开 | 未公开 |
| Intelligence Index | 53 分 (第10名) | 57 分 (第4名) | 60 分 (第1名) |
| GDPval-AA (Agent任务) | 1500 Elo / ~50% | ~63% | ~64% (榜首) |
| IFBench (指令跟随) | 81% (全榜第1) | ~76% | ~77% |
| Terminal-Bench Hard | 38% | ~58% | ~61% |
| 上下文窗口 | 1M (API) / 2M (消费者) | 200K | 256K |
| API 输入价格 | $1.25 / 百万 token | $5 / 百万 token | $5 / 百万 token |
| API 输出价格 | $2.50 / 百万 token | $25 / 百万 token | $30 / 百万 token |
Grok 4.3的应用场景
超长文档深度分析:基于 100 万(API)/ 200 万(消费者端)token 的超长上下文,一次性上传整本书、法律合同、学术论文或海量代码库,进行全文摘要、关键信息提取、跨章节关联分析或多轮深度追问。
视频内容智能解析:上传视频文件后,模型可自动识别画面中的物体与场景、按时间线描述事件序列,并精准回答「第 3 分钟出现了什么」这类带时间戳的细粒度问题,适用于安防监控、课程学习、媒体素材审阅。
Agentic 商业任务自动化:基于 GDPval-AA 评测中暴涨 321 分的 Agent 能力,可自动完成营销文案撰写、财务模型搭建、商业 PPT 制作、竞品调研报告生成等真实经济活动任务,串联多步推理直接产出可用成果。
代码开发与环境执行:通过内置代码执行环境,让模型编写 Python/SQL 等代码并直接运行,输出数据分析结果、可视化图表或可下载脚本文件,适合快速原型验证、数据清洗、自动化脚本开发。
原生结构化文档生成:直接生成可下载的 PDF、PowerPoint、Excel 文件,无需借助外部插件,适用于一键生成汇报材料、数据报表、合同模板、培训手册等正式文档。
智能客服与工具调用:可部署为高复杂度客服 Agent,结合函数调用与 MCP 工具接入,自动查询数据库、调用 API、处理工单并给出精准回复。
