Qwen3.7 Preview – 阿里通义推出的下一代旗舰大模型预览版

Al项目 2026-05-19 18:00:21 AI导航网

Qwen3.7 Preview是什么

Qwen3.7 Preview 是阿里通义千问团队推出的下一代旗舰大模型预览版,包含Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两个版本。模型在智能体编程、世界知识和指令遵循方面显著提升,在 LMSYS Chatbot Arena 榜单中助力阿里跃升至文本领域第 6、视觉领域第 5。Max 主打极致复杂推理与编程能力,Plus 侧重百万级长上下文与 Agentic Coding 的均衡体验

Qwen3.7 Preview的主要功能

  • Qwen3.7 Max Preview
    • 旗舰级复杂推理:在 SWE-bench Pro、Terminal-Bench 等主流编程基准上表现领先,支持高难度软件工程任务与多步骤逻辑推理。
    • 世界知识与指令遵循:世界知识覆盖显著增强,可精准理解并执行复杂指令,降低知识幻觉与误执行风险。
    • 原生多模态理解:支持文本、图像、视频输入,视觉推理能力跻身全球前五,实现跨模态信息融合。
    • 超长上下文处理:支持 256K Token 上下文窗口,可完成代码库级分析与长文档深度理解,无需分段输入。
    • 混合推理模式:支持思考模式与非思考模式无缝切换,灵活匹配不同任务复杂度,兼顾深度与效率。
  • Qwen3.7 Plus Preview
    • 百万 Token 原生上下文:可一次性处理整个代码仓库或超长篇文档,实现端到端的长文本推理与信息提取。
    • Agentic Coding 自主编程:在复杂工程环境中自主规划、执行与优化开发任务,支持多轮交互式代码生成与调试。
    • 效果与成本均衡:更低推理成本实现接近 Max 版的综合性能,适合高频调用与企业级生产部署场景。
    • 多模态原生推理:支持文本、图像、视频混合输入,实现跨模态信息融合与结构化输出,满足内容创作需求。
    • 企业级 Agentic AI 优化:支持大规模生产环境部署,与阿里云百炼生态深度集成,提供稳定可靠的商用接入体验。

Qwen3.7 Preview的技术原理

  • MoE 混合专家架构:基于混合专家模型架构,以较少激活参数实现高密度模型性能,在同等算力下获得更强推理能力。
  • 大规模强化学习优化:训练阶段通过自动扩展测试样例提升代码执行成功率,强化模型在编程与复杂任务中的可靠性。
  • 长时序强化学习(Long-Horizon RL):鼓励模型通过多轮交互解决复杂任务,支持持续学习与策略优化,提升 Agent 自主决策能力。
  • 思考预算控制机制:支持动态调整推理深度,用户可根据任务需求配置思考 Token 预算,平衡响应质量与速度。
  • 保留思维链(Preserve Thinking):在 Agent 任务中保留完整推理过程,确保多轮交互的连续性与可追溯性,便于调试与审计。

如何使用Qwen3.7 Preview

  • 访问 Arena 评测平台:访问 Arena 官网 https://arena.ai/,Qwen3.7 Preview 已登陆该平台供公开横向评测。
  • 选择模型版本 在 Arena 模型列表中选用 Qwen3.7-Max-Preview(极致推理)或 Qwen3.7-Plus-Preview(均衡体验)。
  • 开始对话测试:输入文本问题验证语言理解与指令遵循能力,或通过多模态任务测试视觉能力。
  • 横向对比评估:在同一平台与其他顶级模型并行对比。

Qwen3.7 Preview的核心优势

  • 双版本并行策略:Max 主攻极致复杂推理与编程,Plus 聚焦百万 Token 长上下文与 Agentic Coding,覆盖分层需求。

  • 全球榜单排名:在 LMSYS Chatbot Arena 中助力阿里跃升至文本第 6、视觉第 5,编程与多模态实力获国际认可。

  • 编程基准领先:在 SWE-bench Pro、Terminal-Bench 等主流编程评测中表现优异,支持高难度软件工程任务。

  • 超长上下文窗口:Max 支持 256K Token,Plus 原生支持百万级 Token,可端到端处理代码仓库与超长文档。

  • 混合推理架构:单个模型内无缝切换思考模式与非思考模式,灵活匹配不同任务复杂度与成本需求。

  • 原生多模态理解:支持文本、图像、视频混合输入,视觉推理能力跻身全球第一梯队。

Qwen3.7 Preview的同类竞品对比

对比维度Qwen3.7 PreviewGPT-5.5DeepSeek V4
模型定位双版本并行(Max/Plus),覆盖极致性能与性价比综合能力最强,实时检索与工具调用领先长上下文性价比之选,开源可本地部署
Arena 排名文本第 6、视觉第 5(阿里实验室)文本/视觉头部领先未进入前五
编程能力SWE-bench Pro 等基准国产领先综合编程能力强代码生成与数学推理优秀
上下文长度Max 256K / Plus 1M Token标准上下文128K Token(可扩展)
推理模式思考/非思考无缝切换支持深度推理支持 thinking 模式
实时检索依赖外部工具原生实时网络搜索,准确性高需外部检索工具辅助
价格策略Plus ¥2/百万Token 起,Max 阶梯定价$5-30/百万Token,成本较高开源免费/API 低价
部署方式阿里云百炼/Qwen StudioOpenAI API/ChatGPT开源权重/本地部署/API
多模态支持原生文本/图像/视频全模态支持文本为主,部分多模态

Qwen3.7 Preview的应用场景

  • 智能软件开发:基于 SWE-bench Pro 领先的编程能力,辅助代码生成、调试与仓库级项目分析,支持高难度软件工程任务。

  • 代码仓库级分析:用 Plus 百万 Token 或 Max 256K 上下文窗口,一次性理解整个代码库结构,实现端到端的架构梳理与优化建议。

  • 企业知识管理:处理超长合同、研报、技术文档的深度理解与关键信息提取,无需分段输入即可保持全局逻辑连贯性。

  • 多模态内容分析:融合文本、图像、视频输入进行跨模态推理,适用于视觉内容理解、视频摘要生成与多媒体资料审核。

  • 自动化智能体构建:依托 Agentic Coding 与混合推理模式,构建可自主规划、多轮交互并调用外部工具的复杂业务自动化流程。

© 版权声明

相关文章