品玩

科技创新者的每日必读

打开APP
关闭

Apple发布Pico-Banana-400K数据集 助力文本引导图像编辑研究

10月29日

品玩10月29日讯,据9to5MAC 报道,Apple近日发布Pico-Banana-400K数据集,含40万张精选图像,该数据集依托Google Gemini-2.5系列模型构建,相关研究论文《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》同步公开。

数据集采用非商业研究许可,仅限学术与AI研究使用,不可商用。其构建以OpenImages的真实照片为基础,涵盖35种编辑类型(分8类),经Gemini-2.5-Flash-Image(Nano-Banana)生成编辑图像后,由Gemini-2.5-Pro审核指令合规性与视觉质量。数据集包含单轮编辑、多轮编辑序列及成败结果偏好对。

尽管Apple承认Nano-Banana存在技术局限,但期望该数据集为下一代编辑模型提供训练与基准测试基础。研究论文可在arXiv查阅,数据集于GitHub免费开放。

取消 发布

下载品玩App,比99.9%的人更先知道关于「苹果」的新故事

下载品玩App

比99.9%的人更先知道关于「苹果」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测