品玩

科技创新者的每日必读

打开APP
关闭

通义实验室推出Fun-ASR 1.5,实现方言与古诗词工业级语音识别

8小时前

品玩4月20日讯,据阿里通义实验室官方消息,通义实验室正式发布语音识别大模型Fun-ASR 1.5,标志着语音技术在多方言与多文化理解领域取得重大突破。该模型基于统一架构,单模型即可无缝覆盖30种语言及汉语七大方言体系,典型方言场景字错误率相对下降56.2%,其中5种方言准确率突破90%。

Fun-ASR 1.5在技术上实现四大核心升级。一是深度适配20余种地区口音,涵盖中原、西南、粤语等复杂方言场景;二是支持30种主流语言自由混说识别,无需预设语种;三是专项优化古诗词识别,字符级准确率达97%;四是强化文本归一化能力,智能处理标点、数字及日期格式,输出规范文本。

目前,该模型已通过阿里云百炼平台上线API服务,广泛应用于县域教育、地方政务及跨国协作等场景。Fun-ASR 1.5的推出,推动语音识别从“听得清”迈向“听得懂”的工业级新阶段。

取消 发布

下载品玩App,比99.9%的人更先知道关于「通义大模型」的新故事

下载品玩App

比99.9%的人更先知道关于「通义大模型」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测