品玩9月8日讯,据 Arxiv 页面显示,西蒙莎菲大学的研究者近日联手 Autodesk,推出一种名为 SLiMe 的新方法,利用视觉语言模型来完成图像分割任务。

论文显示,SLiMe 通过将问题转化为优化任务来实现在任意所需粒度上分割图像,仅使用一个标注样本。当用户给定一个训练图像及其分割掩码后,SLiMe 首先提取注意力图,然后利用提取到的注意力图,优化 Stable Diffusion 的文本嵌入,使每个嵌入学习训练图像中的单个分割区域。这些学到的嵌入随后在注意力图中突出显示分割区域,进而可以用来提取分割图。
研究显示, SLiMe 优于其他现有的单样本和少量样本分割方法。




0 条评论
请「登录」后评论