品玩1月19日讯,据美团LongCat官方消息,团队正式开源新一代模型LongCat-Flash-Thinking-2601。该模型在智能体搜索、工具调用及工具交互推理等核心评测中均达到开源模型SOTA水平,其工具调用泛化能力在随机复杂任务中性能超越Claude。
模型创新性地引入“重思考模式”,通过并行思考与总结归纳的闭环迭代,显著提升复杂决策可靠性。在数学推理、编程等多项权威评测中表现突出,尤其在AIME-25获满分。团队通过多环境强化学习与噪声稳健训练技术,使模型具备强大的实战泛化与抗干扰能力。
模型权重与代码已在GitHub、Hugging Face等平台开源,并提供官网在线体验与API调用服务,助力开发者低门槛应用智能体技术。





0 条评论
请「登录」后评论