品玩1月2日讯,据 Arxiv 页面显示,清华大学近日联手哈佛研究团队,推出大语言模型系统 LangSplat。
论文显示,LangSplat 是一款检索模型,可以在三维空间中高效的搜索到相应的内容。该模型基于 3DGS 的 3D 语言场方法,特别引入了 SAM 和 CLIP,在开放词汇 3D 对象定位和语义分割任务上优于最先进的方法,同时比 LERF 快 199 倍。
研究人员使用 LERF 和 3D OVS 两个数据集对 LangSplat 进行测试,结果显示总体准确率分别达到了 84.3% 和 93.4%,而 LERF 分别为 73.6% 和 86.8%。

0 条评论
请「登录」后评论