新加坡科技设计大学联手清华、微软研究院，推出大模型调优方法 Tuna-品玩

新加坡科技设计大学联手清华、微软研究院，推出大模型调优方法 Tuna

2023年10月24日

品玩10月24日讯，据 Arxiv 页面显示，一支由来自新加坡科技设计大学、微软研究院和清华大学的研究者所组成的研究团队今日发布了一款名为 Tuna 的提起有方法，让模型可以使用大语言模型的反馈进行指令调整。

研究团队使用其新颖的概率排名和上下文排名方法来微调指令调整后的 LLM，以增加生成更好响应的可能性。概率排名使指令调整后的模型可以从高阶大模型处继承高质量和低质量响应的相对排名。另一方面，使用上下文排名学习允许模型使用更强大模型的上下文理解能力来精炼其自己的响应分布。

据研究团队表示，Tuna 在Super Natural Instructions(119 个测试任务)、LMentry(25 个测试任务)、Vicuna QA 等任务上均表现出色。

下载品玩App，比99.9%的人更先知道关于「AI大模型」的新故事

下载品玩App

比99.9%的人更先知道关于「AI大模型」的新故事

AI阅读助手

以下有两点提示，请您注意：
1. 请避免输入违反公序良俗、不安全或敏感的内容，模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务，但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时，您需要自行判断并承担风险；
感谢您的理解与配合

该功能目前正处于内测阶段，尚未对所有用户开放。如果您想快人一步体验产品的新功能，欢迎点击下面的按钮申请参与内测申请内测