品玩11月4日讯,据 Github 页面显示,字节跳动豆包大模型团队近日联合香港大学,共同开源全新的 RLHF 框架HybridFlow。
资料显示,HybridFlow 是一款开源的训练模型,可以兼容各种训练和推理框架,支持不同的模型部署和多种 RL 算法实现。
实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。

字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
2024年11月4日品玩11月4日讯,据 Github 页面显示,字节跳动豆包大模型团队近日联合香港大学,共同开源全新的 RLHF 框架HybridFlow。
资料显示,HybridFlow 是一款开源的训练模型,可以兼容各种训练和推理框架,支持不同的模型部署和多种 RL 算法实现。
实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。
下载品玩App,比99.9%的人更先知道关于「豆包大模型」的新故事
下载品玩App
比99.9%的人更先知道关于「豆包大模型」的新故事
0 条评论
请「登录」后评论