
Qwen3.6-Max-Preview主要特性包括:
- 相比 Qwen3.6-Plus 显著提升的智能体编程能力
- 更强的世界知识和指令遵循
- 更优的真实场景智能体与知识可靠性表现
您可以在 Qwen Studio(https://chat.qwen.ai/) 进行交互对话,并且即将通过阿里云百炼 API 以qwen3.6-max-preview 的名称调用。
以下展示了 Qwen3.6-Max-Preview 与主流前沿模型的评测对比。相比 Qwen3.6-Plus,预览版在智能体编程方面取得显著提升(如 SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8),世界知识更强(SuperGPQA +2.3、QwenChineseBench +5.3),指令遵循也更优(ToolcallFormatIFBench +2.8)。在权威三方评测Artificial Analysis刚刚更新的大模型榜单中,Qwen3.6-Max-Preview性能表现超过GLM5.1、MiniMax-M2.7等模型,登顶最佳国产模型。

Qwen3.6-Max-Preview将通过阿里云百炼 API 提供,模型名称为 qwen3.6-max-preview。您也可以在 Qwen Studio 上即时体验。
阿里云百炼支持行业标准协议,兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API,以及兼容 Anthropic 的 API 接口。
本次发布支持 preserve_thinking 功能:在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。
Qwen3.6-Max-Preview 是我们下一代旗舰模型的早期预览版,在智能体编程、世界知识和指令遵循方面相比 Qwen3.6-Plus 均有显著提升。它在六项主要编程基准上取得最高分——SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode——相比前代有大幅进步。同时在知识(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表现更优。
作为预览版,Qwen3.6-Max-Preview 仍在积极开发中。我们将持续迭代模型,后续版本将带来进一步提升。欢迎社区反馈,期待看到大家的创造,敬请关注!
本文来自转载 ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

