品玩9月11日讯,据 The Decoder 报道,Stability AI推出专业音频生成模型Stable Audio 2.5,借助Adversarial Relativistic-Contrastive(ARC)后训练技术,实现复杂音乐结构的高效生成。
在英伟达H100 GPU上,模型可在2秒内完成最长3分钟的音频创作,支持前奏、发展、尾声等多段落结构,并集成音频修复功能,允许用户上传现有音频进行续写。
该模型同步推出移动端轻量版Stable Audio Open Small,可在手机端7秒内生成11秒立体声。为确保商用合规,Stable Audio 2.5基于licensed数据集训练,并通过版权识别系统限制用户上传版权受限内容。

0 条评论
请「登录」后评论