品玩

科技创新者的每日必读

打开APP
关闭

超越 DeepSeek-R1,英伟达开源新推理模型

14小时前

品玩5月7日讯,据爱范儿报道,英伟达推出了 Llama-Nemotron 系列最新的三款模型,分别为LN-Nano 8B、LN-Super 49B和LN-Ultra 253B。

其中,LN-Ultra 模型通过大规模强化学习(RL)进一步超越了教师模型 DeepSeek-R1,成功突破了性能瓶颈。同时,LN-Ultra 还能在单个 8xH100 节点上运行,并具备更高的推理吞吐量。英伟达还首次推出了推理开关功能,允许用户通过简便的指令在标准聊天模式和推理模式之间动态切换,满足日常对话与复杂推理任务的需求。

性能表现上,LN-Nemotron 系列模型在多个基准测试中取得了领先表现,尤其在推理任务(如 GPQA-Diamond、AIME24、AIME25)和非推理任务(如指令遵循评估)上均显示出了卓越的能力。LN-Ultra 不仅超越了 DeepSeek-R1,还在多个领域的应用上展现了强大的泛化能力。

取消 发布

下载品玩App,比99.9%的人更先知道关于「英伟达」的新故事

下载品玩App

比99.9%的人更先知道关于「英伟达」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测