品玩

科技创新者的每日必读

打开APP
关闭

字节跳动推出视频生成模型OmniHuman-1.5

12小时前

品玩8月28日讯,据 Github 页面显示,字节跳动近日推出视频生成模型OmniHuman-1.5。

OmniHuman-1.5 可基于单张图像和一段语音轨道,生成与语音节奏、韵律及语义内容一致的富有表现力的角色动画,还可通过可选文本提示进一步优化。受大脑 “系统 1 与系统 2” 认知理论启发,我们的架构将多模态大语言模型与扩散 Transformer 相结合,模拟两种不同思维模式:缓慢、审慎的规划与快速、直觉的反应。这种强大的协同作用使其能够生成超一分钟的视频,具备高度动态的动作、连续的镜头移动以及复杂的多角色互动。

取消 发布

下载品玩App,比99.9%的人更先知道关于「GitHub」的新故事

下载品玩App

比99.9%的人更先知道关于「GitHub」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测