品玩

科技创新者的每日必读

打开APP
关闭

MiniMax发布M2.7模型,开启AI自我进化新阶段

3月18日

品玩3月18日讯,MiniMax正式发布其M2系列模型的全新版本——M2.7。该模型的核心突破在于能够深度参与自身迭代,构建复杂的Agent Harness,并利用Agent Teams、复杂Skills与工具搜索等能力,开启了模型的自我进化过程。在研发中,M2.7被用于构建强化学习框架中的数十个复杂技能,实现了对自身训练、评测与优化流程的驱动与优化。

在软件工程领域,M2.7表现优异。其在SWE-Pro基准测试中得分达56.22%,接近Opus水平;在端到端项目交付基准VIBE-Pro上得分55.6%;在对复杂系统理解要求极高的Terminal Bench 2中得分57.0%。实际应用中,它能将线上生产故障恢复时间缩短至3分钟以内,并具备原生多智能体(Agent Teams)协作能力。

在专业办公领域,模型在涵盖多领域专业知识的GDPval-AA评测中ELO得分高达1495。其能够深度处理Word、Excel、PPT等办公文档,进行多轮高保真编辑,并能像分析师一样阅读金融年报、构建预测模型并生成完整的研究报告、PPT和Excel图表。在包含40个复杂技能的场景下,其技能遵循率仍保持在97%。

此外,M2.7显著加强了身份保持与情商能力,为互动娱乐场景的创新拓展了空间。该模型已在MiniMax Agent与开放平台全量上线。

取消 发布

下载品玩App,比99.9%的人更先知道关于「MiniMax」的新故事

下载品玩App

比99.9%的人更先知道关于「MiniMax」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测