面壁智能联合清华发布VoxCPM语音模型性能达业界顶尖-品玩

面壁智能联合清华发布VoxCPM语音模型性能达业界顶尖

2025年9月19日

品玩9月18日讯，据面壁智能官方消息，面壁智能与清华大学深圳国际研究生院联合发布端到端语音生成模型VoxCPM-0.5B，其语音自然度、音色相似度及韵律表现力均达业界SOTA水平。

该模型采用层次化语言建模与局部扩散生成技术，支持零样本声音克隆，仅需极少数据即可复刻独特声线，且能处理中英双语、公式符号音频及自定义发音修正。在权威评测中，VoxCPM的词错率与音色相似度超越同类模型，单张RTX 4090显卡上推理速度达RTF≈0.17，支持流式输出。

目前，VoxCPM已在GitHub、Hugging Face等平台开源，并提供线上体验平台，其技术突破为智能语音交互、内容创作等场景提供了高性能解决方案。

下载品玩App，比99.9%的人更先知道关于「面壁智能」的新故事

下载品玩App

比99.9%的人更先知道关于「面壁智能」的新故事

AI阅读助手

以下有两点提示，请您注意：
1. 请避免输入违反公序良俗、不安全或敏感的内容，模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务，但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时，您需要自行判断并承担风险；
感谢您的理解与配合

该功能目前正处于内测阶段，尚未对所有用户开放。如果您想快人一步体验产品的新功能，欢迎点击下面的按钮申请参与内测申请内测