品玩12月8日讯,美团LongCat团队今天正式发布并开源LongCat-Image图像生成模型。该模型以6B参数规模,致力于解决当前AI图像生成领域闭源模型无法定制、开源方案性能与轻量化难兼顾的困境,为业界提供了“高性能、低门槛、全开放”的新选择。
LongCat-Image采用文生图与图像编辑同源架构设计。其在图像编辑任务上,于ImgEdit-Bench、GEdit-Bench等权威评测中达到开源SOTA水平,实现高度可控编辑。针对中文文本渲染行业痛点,模型通过课程学习策略,精准覆盖8105个汉字,在ChineseWord评测中获90.7分,显著领先同类模型,有力支持商业设计需求。
综合主客观评测显示,该模型在图文对齐、视觉真实度等关键维度表现优异。美团宣布全面开源其多阶段训练模型,旨在构建透明、协作的开源生态。开发者可通过Hugging Face、GitHub等平台获取模型,亦可通过“LongCat APP”及官方网站体验一键生成功能,零门槛解锁AI创作潜能。





0 条评论
请「登录」后评论