品玩

科技创新者的每日必读

打开APP
关闭

火山引擎发布豆包语音模型2.0 实现语义与情感双突破

16小时前

品玩10月16日讯,火山引擎正式推出豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)与声音复刻模型2.0(Doubao-Seed-ICL 2.0),依托豆包大语言模型全新架构,实现语音从“文本朗读”到“理解式情感表达”的跨越。

此次升级核心在于深度语义与上下文理解能力的突破。语音合成模型可覆盖多轮对话语境,精准呈现语气、停顿与情绪变化,支持语速、声线等指令的精细化控制;声音复刻模型在秒级还原声线基础上,新增情感演绎能力,可适配小说配音、对话交互等多场景。

针对教育场景专项优化后,模型对小初高全学科复杂公式符号的朗读准确率达90%,远超行业平均水平。目前两款模型已上线火山引擎语音控台,服务OPPO、洋葱学园等客户,覆盖对话助手、教育辅助等多元场景。

取消 发布

下载品玩App,比99.9%的人更先知道关于「火山引擎」的新故事

下载品玩App

比99.9%的人更先知道关于「火山引擎」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测