品玩

科技创新者的每日必读

打开APP
关闭

首个大规模四川话语音语料库WenetSpeech-Chuan开源发布

2月5日

品玩2月5日讯,据音频语音与语言处理研究组消息,西北工业大学ASLP实验室联合希尔贝壳、中国电信人工智能研究院等机构,正式开源发布首个大规模多维标注四川话语音语料库WenetSpeech-Chuan。该语料库涵盖10,000小时语音数据,覆盖9大领域,并创新性提供ASR转录、说话人属性、语音质量等多维度标注。

研究团队自主研发Chuan-Pipeline数据处理框架,创新采用LLM-GER转录纠错技术,显著提升方言识别准确率。实验表明,基于该语料库训练的模型在ASR与TTS任务中达到开源系统最优性能,部分指标媲美商业系统。

此项工作有效解决了四川话研究资源匮乏的难题,为推进方言语音技术公平发展提供重要基础支撑。语料库、基准测试及技术报告已在GitHub全面开源。

取消 发布

下载品玩App,比99.9%的人更先知道关于「语音」的新故事

下载品玩App

比99.9%的人更先知道关于「语音」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测