品玩

科技创新者的每日必读

打开APP
关闭

面壁智能开源VoxCPM 2,重塑高保真语音生成新范式

4月10日

品玩4月10日讯,面壁智能近日宣布,联合OpenBMB及清华大学人机语音交互实验室,正式发布并开源新一代2B参数语音基础模型VoxCPM 2。该模型突破了传统多模型协作的限制,以单一架构集成了多语种支持、音色设计、通用音色克隆及48kHz高保真音质四大核心能力,为AI语音应用提供了高效的端到端解决方案。

VoxCPM 2显著扩展了语言边界,覆盖全球30种语言,重点优化了东南亚8国主流语种,并支持四川话、粤语等9种中国方言。模型采用扩散自回归连续表征技术,实现了“文字即声音”的音色设计与高拟真度语音克隆,能够精准还原情感起伏与呼吸细节。此外,其48kHz采样率达到了影视级音频标准,大幅提升了语音生成的表现力与沉浸感。

作为一款完全免费开源的模型,VoxCPM 2支持原生Torch推理及全参数微调,旨在降低开发门槛,赋能视频创作、有声书及出海业务等多场景应用,推动高保真语音技术的普及与落地。

取消 发布

下载品玩App,比99.9%的人更先知道关于「面壁智能」的新故事

下载品玩App

比99.9%的人更先知道关于「面壁智能」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测