品玩9月20日讯,据 HuggingFace 报道,Meta AI 近日发表论文,较少了一个名为 FoleyGen的音频生成系统。
FoleyGen 利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。
VGGSound 数据集上的实验结果表明, FoleyGen 在所有客观指标和人类评估方面都优于以前的系统。

Meta AI 推出 FoleyGen,用视频生成音频
2023年9月20日品玩9月20日讯,据 HuggingFace 报道,Meta AI 近日发表论文,较少了一个名为 FoleyGen的音频生成系统。
FoleyGen 利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。
VGGSound 数据集上的实验结果表明, FoleyGen 在所有客观指标和人类评估方面都优于以前的系统。
下载品玩App,比99.9%的人更先知道关于「META」的新故事
下载品玩App
比99.9%的人更先知道关于「META」的新故事
0 条评论
请「登录」后评论