品玩3月6日讯,阿里云通义千问官方今日宣布,推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数的 DeepSeek-R1 媲美。
这一成果凸显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。此外,我们还在推理模型中集成了与 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
目前,QwQ-32B 已在 Hugging Face 和ModelScope 开源,并采用了 Apache 2.0 开源协议。

0 条评论
请「登录」后评论