Sage是什么
Sage是商汤绝影推出的端侧多模态智能体基座大模型,采用MoE架构,总参数32B、激活参数仅3B,模型已在英伟达Orin X平台部署。在PinchBench评测中任务完成率达94%,超越Claude-Opus-4.6、GPT-5.4等云端旗舰。Sage搭载SCOUT与ERL两项后训练技术,支持复合指令解析、多系统联动与主动感知,为智能座舱提供云端级Agent能力。

Sage的主要功能
- 复合指令解析:支持一次性解析用户多意图复合指令,自动联动空调、导航、影音等车载系统完成任务闭环。
- 主动感知服务:结合传感器实时感知乘员状态与路况,主动触发儿童模式、路线调整等场景化服务。
- 多模态座舱理解:依托原生车载数据,实现座舱语义与视觉理解,精准识别车内环境与用户需求。
- 工具调用与任务闭环:支持长链路工具调用与多步推理,在τ2-bench基准上实现80分,具备真正的智能体执行能力。
- 端侧实时响应:Orin X平台首字响应约0.5秒,单Token延迟0.03秒,生成吞吐80 tk/s,无需依赖云端。
Sage的技术原理
- MoE稀疏激活架构:总参数32B,激活参数仅3B,通过稀疏激活机制在端侧有限算力下实现高效推理。
- SCOUT分级协同学习:采用”小模型探路、大模型吸收”的分级协同机制,在复杂任务训练中节省约60% GPU小时消耗。
- ERL可擦除强化学习:模型自动识别推理链中的错误步骤并擦除重生成,阻断偏差扩散,复杂任务完成率提升20%。
- 一体化多模态架构:融合视觉、语言与传感器数据的原生训练体系,针对车载场景构建差异化理解能力。
如何使用Sage
模型现已在英伟达 Orin X 端侧平台实现部署。
Sage的关键信息和使用要求
- 模型架构: MoE架构,总参数32B,激活参数3B。
- 部署平台: 已在英伟达Orin X端侧平台实现部署。
- 评测成绩: PinchBench最佳任务完成率94%,超越Claude-Opus-4.6、GPT-5.4等主流模型。
- 硬件产品: 北京车展期间推出搭载Sage的SageBox。
- 适用对象: 主要面向车企、Tier 1供应商及端侧智能体开发者。
- 网络要求: 端侧部署,无需依赖云端网络连接即可运行。
- 框架兼容: 支持接入OpenClaw、Hermes等主流Agent框架。
Sage的核心优势
- 端侧性能领先:用3B激活参数在PinchBench上达到94%任务完成率,超越众多大参数云端旗舰模型。
- 极致效率比:相比MiMo-v2-Pro(激活42B),Sage激活算力仅为其1/14,显存占用约1/31,性能高出6.6个百分点。
- 训练成本优化:SCOUT技术节省约60%复杂任务训练GPU小时,降低模型后训练成本。
- 推理纠错能力:ERL技术实现推理过程中错误步骤的自动识别与擦除,从源头阻断任务失败。
- 原生车载数据优势:Human Semantic Understanding测试获91.5分,领先同级端侧模型32%,深度理解座舱场景。
- 量产可行性:已在Orin X平台验证部署,具备车规级量产条件。
Sage的同类竞品对比
| 对比维度 | Sage | Google Gemma 4 | MiMo-v2-Pro |
|---|---|---|---|
| 发布方 | 商汤绝影 | 小米 | |
| 总参数量 | 32B | 同量级端侧 | 超1T |
| 激活参数量 | 3B | 未披露 | 42B |
| PinchBench完成率 | 94% | 83.9% | 87.4% |
| MMLU Pro | 75.8 | 69.2 | – |
| GPQA Diamond | 77.3 | 58.5 | – |
| τ2-bench | 80.7 | 42.1 | – |
| Human Semantic Understanding | 91.5 | 69.5 | – |
| 部署平台 | 英伟达Orin X | 端侧 | 端侧 |
| 核心定位 | 端侧智能体基座 | 端侧通用模型 | 端侧推理模型 |
Sage的应用场景
- 智能座舱交互: 用户通过自然语言发出复合指令,Sage一次性解析并联动空调、导航、音乐等多个车载系统完成服务闭环。
- 儿童安全守护: 后排传感器检测到儿童乘坐时,Sage主动触发儿童模式,自动锁定车窗、切换适龄内容并限制音量。
- 智能出行规划: 结合实时路况与用户需求,Sage主动推荐最优路线并在拥堵时提供备选方案,实现从被动响应到主动服务的转变。
- 舱驾一体服务: 作为舱驾融合方案的核心AI支撑,Sage打通座舱交互与驾驶感知,提供全场景智能体服务。
© 版权声明
本站文章版权归AI导航网所有,未经允许禁止任何形式的转载。
