品玩8月27日讯,据谷歌官方消息, DeepMind 现已推出 Gemini 2.5 Flash Image,这一先进图像模型在生成与编辑功能上表现卓越。它支持文本提示生成图像,能精准实现图像转换与编辑,如改变角色服装、场景等,保持角色一致性。
模型具备强大的融合能力,可合并多张图像,创作新内容。在图像修复与风格迁移方面,能去除物体、修复照片瑕疵,还能进行跨风格融合。在 LMArena 基准测试中,Gemini 2.5 Flash Image 成绩出色,延迟更低,性能领先。
为保障安全,模型通过过滤等手段减少有害内容,生成图像带有可见水印与 SynthID 数字水印。目前,该模型已在 Gemini 应用上线,开发者可通过 Gemini API、Google AI Studio 和 Vertex AI 试用,每百万输出 token 费用为 30 美元,单张图像成本约 0.039 美元。这一模型的发布,有望为图像创作领域带来新变革,助力设计师、创作者等群体提升工作效率与创意表现。

0 条评论
请「登录」后评论