美团LongCat团队正式开源其升级版模型LongCat-Flash-Thinking-2601。该模型在智能体搜索、工具调用及推理等核心评测中达到开源模型领先水平,尤其在工具调用泛化能力上表现卓越,在随机复杂任务中性能超越Claude,可显著降低新工具适配成本。模型创新推出“重思考模式”,通过并行思考与总结归纳的闭环迭代,提升复杂问题处理能力,并已在官网开放免费体验。评测显示,其在编程、数学推理、工具调用及搜索等多个维度全面领先。团队通过多环境强化学习与噪声注入训练,增强了模型在不确定环境中的稳健性。模型权重、代码及API已同步开源,供开发者试用与合作。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

