品玩3月12日讯,据豆包大模型团队表示,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。
该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。具体来看,模型支持中英文指令的高精度理解与遵循,能生成高美感度的图像作品。针对字体渲染和海报设计等实际场景,生成文字崩坏率大幅降低,且字体变化呈现更自然、更具美感。对于国风图案与元素,比如国画、泥塑、文玩、旗袍、书法等,Seedream 2.0 也可输出高品质的呈现结果。
通过测试,团队发现 Seedream 2.0 面向英文提示词,其生成内容的结构合理性、文本理解准确性高于主流模型。

0 条评论
请「登录」后评论