Qwen3.7 Preview – 阿里通义推出的下一代旗舰大模型预览版

Al项目 2026-05-19 18:00:21 AI导航网

Qwen3.7 Preview是什么

Qwen3.7 Preview 是阿里通义千问团队推出的下一代旗舰大模型预览版，包含Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview两个版本。模型在智能体编程、世界知识和指令遵循方面显著提升，在 LMSYS Chatbot Arena 榜单中助力阿里跃升至文本领域第 6、视觉领域第 5。Max 主打极致复杂推理与编程能力，Plus 侧重百万级长上下文与 Agentic Coding 的均衡体验

Qwen3.7 Preview的主要功能

Qwen3.7 Max Preview
- 旗舰级复杂推理：在 SWE-bench Pro、Terminal-Bench 等主流编程基准上表现领先，支持高难度软件工程任务与多步骤逻辑推理。
- 世界知识与指令遵循：世界知识覆盖显著增强，可精准理解并执行复杂指令，降低知识幻觉与误执行风险。
- 原生多模态理解：支持文本、图像、视频输入，视觉推理能力跻身全球前五，实现跨模态信息融合。
- 超长上下文处理：支持 256K Token 上下文窗口，可完成代码库级分析与长文档深度理解，无需分段输入。
- 混合推理模式：支持思考模式与非思考模式无缝切换，灵活匹配不同任务复杂度，兼顾深度与效率。
Qwen3.7 Plus Preview
- 百万 Token 原生上下文：可一次性处理整个代码仓库或超长篇文档，实现端到端的长文本推理与信息提取。
- Agentic Coding 自主编程：在复杂工程环境中自主规划、执行与优化开发任务，支持多轮交互式代码生成与调试。
- 效果与成本均衡：更低推理成本实现接近 Max 版的综合性能，适合高频调用与企业级生产部署场景。
- 多模态原生推理：支持文本、图像、视频混合输入，实现跨模态信息融合与结构化输出，满足内容创作需求。
- 企业级 Agentic AI 优化：支持大规模生产环境部署，与阿里云百炼生态深度集成，提供稳定可靠的商用接入体验。

Qwen3.7 Preview的技术原理

MoE 混合专家架构：基于混合专家模型架构，以较少激活参数实现高密度模型性能，在同等算力下获得更强推理能力。
大规模强化学习优化：训练阶段通过自动扩展测试样例提升代码执行成功率，强化模型在编程与复杂任务中的可靠性。
长时序强化学习（Long-Horizon RL）：鼓励模型通过多轮交互解决复杂任务，支持持续学习与策略优化，提升 Agent 自主决策能力。
思考预算控制机制：支持动态调整推理深度，用户可根据任务需求配置思考 Token 预算，平衡响应质量与速度。
保留思维链（Preserve Thinking）：在 Agent 任务中保留完整推理过程，确保多轮交互的连续性与可追溯性，便于调试与审计。

如何使用Qwen3.7 Preview

访问 Arena 评测平台：访问 Arena 官网 https://arena.ai/，Qwen3.7 Preview 已登陆该平台供公开横向评测。
选择模型版本 在 Arena 模型列表中选用 Qwen3.7-Max-Preview（极致推理）或 Qwen3.7-Plus-Preview（均衡体验）。
开始对话测试：输入文本问题验证语言理解与指令遵循能力，或通过多模态任务测试视觉能力。
横向对比评估：在同一平台与其他顶级模型并行对比。

Qwen3.7 Preview的核心优势

双版本并行策略：Max 主攻极致复杂推理与编程，Plus 聚焦百万 Token 长上下文与 Agentic Coding，覆盖分层需求。
全球榜单排名：在 LMSYS Chatbot Arena 中助力阿里跃升至文本第 6、视觉第 5，编程与多模态实力获国际认可。
编程基准领先：在 SWE-bench Pro、Terminal-Bench 等主流编程评测中表现优异，支持高难度软件工程任务。
超长上下文窗口：Max 支持 256K Token，Plus 原生支持百万级 Token，可端到端处理代码仓库与超长文档。
混合推理架构：单个模型内无缝切换思考模式与非思考模式，灵活匹配不同任务复杂度与成本需求。
原生多模态理解：支持文本、图像、视频混合输入，视觉推理能力跻身全球第一梯队。

Qwen3.7 Preview的同类竞品对比

对比维度	Qwen3.7 Preview	GPT-5.5	DeepSeek V4
模型定位	双版本并行（Max/Plus），覆盖极致性能与性价比	综合能力最强，实时检索与工具调用领先	长上下文性价比之选，开源可本地部署
Arena 排名	文本第 6、视觉第 5（阿里实验室）	文本/视觉头部领先	未进入前五
编程能力	SWE-bench Pro 等基准国产领先	综合编程能力强	代码生成与数学推理优秀
上下文长度	Max 256K / Plus 1M Token	标准上下文	128K Token（可扩展）
推理模式	思考/非思考无缝切换	支持深度推理	支持 thinking 模式
实时检索	依赖外部工具	原生实时网络搜索，准确性高	需外部检索工具辅助
价格策略	Plus ¥2/百万Token 起，Max 阶梯定价	$5-30/百万Token，成本较高	开源免费/API 低价
部署方式	阿里云百炼/Qwen Studio	OpenAI API/ChatGPT	开源权重/本地部署/API
多模态支持	原生文本/图像/视频	全模态支持	文本为主，部分多模态