阿里云开源了专为编程智能体设计的混合专家模型Qwen3-Coder-Next。该模型总参数量为800亿,但每次推理仅激活30亿参数,显著降低了计算和显存需求。在权威基准SWE-Bench Verified上,其问题解决率超过70%,性能可媲美激活参数量大10-20倍的稠密模型。模型通过创新的“智能体训练配方”进行训练,使其能从环境交互中学习,具备长时程推理、熟练使用工具和从错误中恢复的能力。该模型部署友好,支持作为IDE插件、命令行智能体等多种应用场景,现已开源并提供API调用。

文章版权声明 1 本网站名称:凉西西小圈
2 本站永久网址:https://www.xcxybbs.cn
3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长 QQ418005852进行删除处理。
4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
© 版权声明