品玩

科技创新者的每日必读

打开APP
关闭

英伟达推出 Tensor RT-LLM,提高大模型运行速度

2023年10月18日

品玩10月18日讯,据英伟达官方消息,英伟达现已公布新款软件工具Tensor RT-LLM,提升大语言模型在本地PC平台上的性能。

英伟达曾在上个月推出面向数据中心的 Tensor RT-LLM,而这一次推出的版本面向家用电脑。TensorRT-LLM for Windows 是一个开源库,可加快最新人工智能大型语言模型(如 Llama 2 和 Code Llama)的推理性能,使其推理速度提升4倍。

英伟达还同时发布了帮助开发人员加速 LLM 的工具,包括使用 TensorRT-LLM 优化自定义模型的脚本、TensorRT 优化的开源模型以及展示 LLM 响应速度和质量的开发人员参考项目。

取消 发布

下载品玩App,比99.9%的人更先知道关于「英伟达」的新故事

下载品玩App

比99.9%的人更先知道关于「英伟达」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测