品玩6月23日讯,据36氪报道,月之暗面(Moonshot AI)宣布发布自主智能体 Kimi-Researcher,该智能体目前正在进行内测。
其基于自研 Kimi k 系列模型内部版本,通过端到端智能体强化学习训练,擅长多轮搜索与推理,平均每项任务执行23个推理步骤、访问超200个网址,是国内少有的自研模型打造的Agent。
在HLE基准测试中中,Kimi-Researcher 以26.9%的Pass@1成绩刷新SOTA,Pass@4准确率达40.17%,且在xbench-DeepSearch等多个复杂基准测试中表现优异,平均Pass@1达69%,超越o3等带搜索工具的模型。
它还能解决动画电影识别、学术研究等实际问题。月之暗面计划未来数月开源其依赖的基础预训练模型及强化学习模型,展现端到端智能体强化学习在提升 Agent 智能方面的潜力。

0 条评论
请「登录」后评论