品玩9月4日讯,据 HuggingFace 报道,百度的视觉技术研究团队近日发布论文,推出了一款视频生成模型产品 VideoGen。
论文显示,研究团队先通过图像生成模型用文本生成高质量图片,之后引入了一个以参考图像和文本提示为条件的高效级联潜在扩散模块,用于生成潜在视频,之后通过增强型视频解码器将潜在视频表示映射为高清视频。
研究显示,在定性和定量评估方面,VideoGen 为文本到视频的生成树立了新的标杆。

百度推出视频生成模型 VideoGen
2023年9月4日品玩9月4日讯,据 HuggingFace 报道,百度的视觉技术研究团队近日发布论文,推出了一款视频生成模型产品 VideoGen。
论文显示,研究团队先通过图像生成模型用文本生成高质量图片,之后引入了一个以参考图像和文本提示为条件的高效级联潜在扩散模块,用于生成潜在视频,之后通过增强型视频解码器将潜在视频表示映射为高清视频。
研究显示,在定性和定量评估方面,VideoGen 为文本到视频的生成树立了新的标杆。
下载品玩App,比99.9%的人更先知道关于「生成式模型」的新故事
下载品玩App
比99.9%的人更先知道关于「生成式模型」的新故事
0 条评论
请「登录」后评论