品玩1月14日讯,据面壁智能官方消息,面壁智能联合清华、人大等学术机构,正式开源了智能体模型AgentCPM-Explore。该模型虽然仅拥有40亿参数,但在多项核心智能体评测基准上表现卓越,有望将原本需要大型云端模型处理的长程任务能力部署至手机、电脑等终端设备。
基准测试结果显示,AgentCPM-Explore的效能比出众。它在GAIA、WebWalker等八个权威智能体评测中,不仅取得了同等参数规模模型的最优性能,其整体表现甚至超越了部分80亿参数级别的模型,并与一些超过300亿参数的闭源大模型实力相当。
在深度研究任务评测Xbench-DeepResearch中,该小模型的表现甚至超越了包括OpenAI-o3、Claude-4.5-Sonnet在内的知名闭源大模型。这展现出其模型具备更高的能力密度。此外,此次开源不仅包含最终的SOTA模型,也公布了从基础模型进化为顶尖性能模型的全流程代码。





0 条评论
请「登录」后评论