品玩4月20日讯,据阿里通义实验室官方消息,通义实验室正式发布语音识别大模型Fun-ASR 1.5,标志着语音技术在多方言与多文化理解领域取得重大突破。该模型基于统一架构,单模型即可无缝覆盖30种语言及汉语七大方言体系,典型方言场景字错误率相对下降56.2%,其中5种方言准确率突破90%。
Fun-ASR 1.5在技术上实现四大核心升级。一是深度适配20余种地区口音,涵盖中原、西南、粤语等复杂方言场景;二是支持30种主流语言自由混说识别,无需预设语种;三是专项优化古诗词识别,字符级准确率达97%;四是强化文本归一化能力,智能处理标点、数字及日期格式,输出规范文本。
目前,该模型已通过阿里云百炼平台上线API服务,广泛应用于县域教育、地方政务及跨国协作等场景。Fun-ASR 1.5的推出,推动语音识别从“听得清”迈向“听得懂”的工业级新阶段。





0 条评论
请「登录」后评论