品玩6月19日讯,谷歌 DeepMind 官方消息,它们正在开发为视频生成配乐的人工智能技术,该技术暂时被命名为 V2A。
DeepMind表示,V2A人工智能生成媒体拼图中必不可少的一部分。DeepMind 的 V2A 技术将配乐描述(例如 "水母在水下跳动、海洋生物、海洋")与视频配对,以创建音乐、音效甚至对话,这些都与视频中的人物和基调相匹配,并由 DeepMind 的深度防伪 SynthID 技术加水印。
DeepMind 表示,为 V2A 提供动力的人工智能模型是一个扩散模型,它是在声音、对话转录和视频剪辑的组合上训练出来的。

0 条评论
请「登录」后评论