品玩2月6日讯,据美团官方消息,美团正式发布了LongCat-Flash-Lite模型。该模型采用混合专家架构的轻量化大模型,其总参数量为685亿,但在每次推理时仅激活29亿至45亿参数,从而实现了高效率。
官方宣称其性能超越了参数量等效的基准模型,并在同规模模型中展现出卓越的竞争力。模型通过应用YARN技术,可支持长达256K的上下文处理,能够高效应对长文档分析与大规模代码处理等复杂场景。
在系统优化方面,该模型显著提升了推理效率。在典型的输入输出负载下,其生成速度可达每秒500至700个token。美团同时宣布,将向开发者开放该模型的API接口。开发者可登录其开放平台申请使用,每日可获得5000万token的免费额度。





0 条评论
请「登录」后评论