通义千问团队正式发布Qwen3.5系列,并开源首个模型Qwen3.5-397B-A17B。该模型为原生视觉-语言模型,在推理、编程、智能体及多模态理解等多项基准评估中表现优异。其采用创新的混合架构,结合线性注意力与稀疏混合专家技术,总参数量达3970亿,但每次前向传播仅激活170亿参数,在保持强大能力的同时显著提升了推理效率与成本效益。模型支持的语言与方言从119种扩展至201种,增强了全球可用性。团队通过异构基础设施和可扩展的异步强化学习框架,实现了高效的多模态训练和3-5倍的端到端加速。用户现可通过官方平台体验Qwen3.5,其具备深度思考、联网搜索及代码解释等高级功能,为开发者和企业提供强大的生产力工具。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

