品玩8月11日讯,据昆仑万维官方消息,昆仑万维推出SkyReels-A3模型,基于“DiT(Diffusion Transformer)视频扩散模型+插帧模型进行视频延展+基于强化学习的动作优化+运镜可控”,其能实现任意时长的全模态音频驱动数字人创作。
用户上传人像图片与音频,搭配文本提示,即可让静态图像 “开口说话”、现有视频 “改台词” 且口型表情同步,还能生成含自然动作与运镜效果的视频。其支持固定镜头、推镜等 8 种运镜模式,强度可调节,适配广告、MV、直播等场景。
性能测试显示,该模型在唇形同步等指标上超越 OmniHuman 等同类模型,且通过技术优化将生成步数从 40 步减至 4 步,效率大幅提升。目前模型已上线,用户可登录官网体验,为内容创作提供低成本、高效能方案。

0 条评论
请「登录」后评论