Sage – 商汤绝影推出的端侧多模态智能体基座大模型

Al项目 2026-04-22 18:00:12 AI导航网

Sage是什么

Sage是商汤绝影推出的端侧多模态智能体基座大模型,采用MoE架构,总参数32B、激活参数仅3B,模型已在英伟达Orin X平台部署。在PinchBench评测中任务完成率达94%,超越Claude-Opus-4.6、GPT-5.4等云端旗舰。Sage搭载SCOUT与ERL两项后训练技术,支持复合指令解析、多系统联动与主动感知,为智能座舱提供云端级Agent能力。

Sage的主要功能

  • 复合指令解析:支持一次性解析用户多意图复合指令,自动联动空调、导航、影音等车载系统完成任务闭环。
  • 主动感知服务:结合传感器实时感知乘员状态与路况,主动触发儿童模式、路线调整等场景化服务。
  • 多模态座舱理解:依托原生车载数据,实现座舱语义与视觉理解,精准识别车内环境与用户需求。
  • 工具调用与任务闭环:支持长链路工具调用与多步推理,在τ2-bench基准上实现80分,具备真正的智能体执行能力。
  • 端侧实时响应:Orin X平台首字响应约0.5秒,单Token延迟0.03秒,生成吞吐80 tk/s,无需依赖云端。

Sage的技术原理

  • MoE稀疏激活架构:总参数32B,激活参数仅3B,通过稀疏激活机制在端侧有限算力下实现高效推理。
  • SCOUT分级协同学习:采用”小模型探路、大模型吸收”的分级协同机制,在复杂任务训练中节省约60% GPU小时消耗。
  • ERL可擦除强化学习:模型自动识别推理链中的错误步骤并擦除重生成,阻断偏差扩散,复杂任务完成率提升20%。
  • 一体化多模态架构:融合视觉、语言与传感器数据的原生训练体系,针对车载场景构建差异化理解能力。

如何使用Sage

模型现已在英伟达 Orin X 端侧平台实现部署。

Sage的关键信息和使用要求

  • 模型架构: MoE架构,总参数32B,激活参数3B。
  • 部署平台: 已在英伟达Orin X端侧平台实现部署。
  • 评测成绩: PinchBench最佳任务完成率94%,超越Claude-Opus-4.6、GPT-5.4等主流模型。
  • 硬件产品: 北京车展期间推出搭载Sage的SageBox。
  • 适用对象: 主要面向车企、Tier 1供应商及端侧智能体开发者。
  • 网络要求: 端侧部署,无需依赖云端网络连接即可运行。
  • 框架兼容: 支持接入OpenClaw、Hermes等主流Agent框架。

Sage的核心优势

  • 端侧性能领先:用3B激活参数在PinchBench上达到94%任务完成率,超越众多大参数云端旗舰模型。
  • 极致效率比:相比MiMo-v2-Pro(激活42B),Sage激活算力仅为其1/14,显存占用约1/31,性能高出6.6个百分点。
  • 训练成本优化:SCOUT技术节省约60%复杂任务训练GPU小时,降低模型后训练成本。
  • 推理纠错能力:ERL技术实现推理过程中错误步骤的自动识别与擦除,从源头阻断任务失败。
  • 原生车载数据优势:Human Semantic Understanding测试获91.5分,领先同级端侧模型32%,深度理解座舱场景。
  • 量产可行性:已在Orin X平台验证部署,具备车规级量产条件。

Sage的同类竞品对比

对比维度SageGoogle Gemma 4MiMo-v2-Pro
发布方商汤绝影Google小米
总参数量32B同量级端侧超1T
激活参数量3B未披露42B
PinchBench完成率94%83.9%87.4%
MMLU Pro75.869.2
GPQA Diamond77.358.5
τ2-bench80.742.1
Human Semantic Understanding91.569.5
部署平台英伟达Orin X端侧端侧
核心定位端侧智能体基座端侧通用模型端侧推理模型

Sage的应用场景

  • 智能座舱交互: 用户通过自然语言发出复合指令,Sage一次性解析并联动空调、导航、音乐等多个车载系统完成服务闭环。
  • 儿童安全守护: 后排传感器检测到儿童乘坐时,Sage主动触发儿童模式,自动锁定车窗、切换适龄内容并限制音量。
  • 智能出行规划: 结合实时路况与用户需求,Sage主动推荐最优路线并在拥堵时提供备选方案,实现从被动响应到主动服务的转变。
  • 舱驾一体服务: 作为舱驾融合方案的核心AI支撑,Sage打通座舱交互与驾驶感知,提供全场景智能体服务。

© 版权声明

相关文章