品玩5月16日讯,据 MiniMax 消息,MiniMax 现已推出基于AR Transformer 模型的高质量 TTS 系统MiniMax Speech 02。
MiniMax Speech 02具有足够强的泛化能力,能够轻松驾驭32语种、不同口音、不同情绪的人声。该模型系统的核心创新之处在于其内在的 Zero-Shot能力,其命为Intrinsic Zero-Shot Text-to-Speech with a Learnable Speaker Encoder。
在国际权威的 Artificial Analysis 上,MiniMax Speech 02也通过全球用户测评,位列全球第一。

0 条评论
请「登录」后评论