品玩9月10日讯,据阿里巴巴消息,Qwen团队发布语音识别模型Qwen3-ASR-Flash。该模型基于Qwen3-Omni构建,支持11种语言自动检测及转录,涵盖中文、英文、阿拉伯语、法语等,还支持多种中国方言及不同地区英语口音。
在复杂声学环境及语言模式下,它展现出高准确率。在标准中文公开测试中,错误率仅3.97%;处理中文口音时,错误率为3.48%;英文识别错误率3.81%。识别歌词时,其错误率仅4.51%,远超同类产品。
该模型具有灵活的上下文偏差功能,用户输入任意格式背景文本,都能获取定制化结果。目前,用户可通过ModelScope、HuggingFace和阿里云百炼API免费体验。

0 条评论
请「登录」后评论