阿里云开源了专为编程智能体设计的混合专家模型Qwen3-Coder-Next。该模型总参数量为800亿,但每次推理仅激活30亿参数,显著降低了计算和显存需求。在权威基准SWE-Bench Verified上,其问题解决率超过70%,性能可媲美激活参数量大10-20倍的稠密模型。模型通过创新的“智能体训练配方”进行训练,使其能从环境交互中学习,具备长时程推理、熟练使用工具和从错误中恢复的能力。该模型部署友好,支持作为IDE插件、命令行智能体等多种应用场景,现已开源并提供API调用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

