品玩11月12日讯,据Meta 官方消息,Meta FAIR 团队正式发布 Omnilingual ASR 全语种语音识别模型套件,支持 1600 余种语言转录,含 500 种首次实现 AI 覆盖的低资源语言,78% 语言的字符错误率(CER)低于 10,性能达行业领先水平。
该系统采用社区驱动框架,用户可通过少量音频文本样本扩展新语言,同步开源 70 亿参数 wav2vec 2.0 模型、含 350 种语言的转录语料库及语言探索演示工具。此举旨在缩小数字鸿沟,打破跨语言沟通壁垒,相关资产均以开源许可向全球开发者开放。





0 条评论
请「登录」后评论