品玩2月13日讯,字节豆包大模型团队近日提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。
实验结果表明,在参数和激活条件相同的情况下,UltraMem 在模型效果上超越了 MoE,并将推理速度提升了 2-6倍。此外,在常见 batch size 规模下,UltraMem 的访存成本几乎与同计算量的 Dense 模型相当。
目前,该论文已被 ICLR 2025 接收。

字节豆包大模型团队推出全新超稀疏架构,推理成本最高可降 83%
2月13日品玩2月13日讯,字节豆包大模型团队近日提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。
实验结果表明,在参数和激活条件相同的情况下,UltraMem 在模型效果上超越了 MoE,并将推理速度提升了 2-6倍。此外,在常见 batch size 规模下,UltraMem 的访存成本几乎与同计算量的 Dense 模型相当。
目前,该论文已被 ICLR 2025 接收。
下载品玩App,比99.9%的人更先知道关于「豆包大模型」的新故事
下载品玩App
比99.9%的人更先知道关于「豆包大模型」的新故事
0 条评论
请「登录」后评论