品玩

科技创新者的每日必读

打开APP
关闭

通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力

2025年12月15日

品玩12月15日讯,据通义大模型官方消息,通义百聆宣布其语音大模型Fun-CosyVoice3与Fun-ASR完成重大升级并同步开源。此次升级聚焦核心性能与实用性,为开发者与企业提供更强大的语音AI工具。

Fun-CosyVoice3:实时、精准的语音合成

模型首包延迟降低50%,实现“输入即发声”。中英混说错误率大幅下降56.4%,并支持9种语言、18种方言及情感控制。其开源版本Fun-CosyVoice3-0.5B具备优秀的zero-shot音色克隆能力。

Fun-ASR:强悍抗干扰的语音识别

该模型在嘈杂环境下准确率达93%,新增歌词与说唱识别功能。支持31种语言自由混说与多种中文方言,流式识别首字延迟仅160毫秒。轻量化版本Fun-ASR-Nano-0.8B同步开源,推理成本更低。

模型已在魔搭、HuggingFace及GitHub等平台开源,支持本地部署与二次开发。

取消 发布

下载品玩App,比99.9%的人更先知道关于「通义大模型」的新故事

下载品玩App

比99.9%的人更先知道关于「通义大模型」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测