品玩12月31日讯,据智谱官方消息,智谱今天推出GLM-Zero 的初代版本 GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型。
GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面的表现大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI o1-preview 相当。
目前 GLM-Zero-Preview 已经上线使用:
- 用户可以在「智谱清言」(chatglm.cn)中的「Zero推理模型」智能体免费使用,支持上传文字或图片,模型会输出完整推理过程;
- 开发者可以在「智谱开放平台」(bigmodel.cn)中,通过 API 进行调用。
目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型还有不少的差距。未来,我们将持续优化迭代强化学习技术。很快,我们将会推出正式版 GLM-Zero,将深度思考的能力从数理逻辑扩展到更多更通用的技术。





0 条评论
请「登录」后评论