品玩

科技创新者的每日必读

打开APP
关闭

微软发布MAI-Transcribe-1 刷新语音转文本基准测试纪录

3小时前

品玩4月3日讯,据 the-decoder 报道,微软近期正式推出语音转文本模型MAI-Transcribe-1,该模型在FLEURS基准测试中表现出卓越性能。在涵盖的25种语言中,该模型击败了Scribe v2、Whisper-large-V3、GPT-Transcribe及Gemini 3.1 Flash-Lite等竞品,实现了最低的词错误率。微软强调,该模型具备强大的环境适应能力,能够有效处理背景噪音、低质量音频以及重叠语音等复杂录音条件。

目前,微软正将该模型集成至Coprilot Voice及Microsoft Teams产品线中。开发者可通过Microsoft Foundry及Microsoft AI Playground进行公测体验。技术参数显示,该模型推理速度较Azure此前的Fast服务提升2.5倍,定价为每音频小时0.36美元。结合MAI-Voice-1及语言模型,该系统亦可构建具备对话能力的语音智能体。

值得注意的是,Cohere与Mistral近期亦发布了性能相当的开源替代方案,显示出该领域技术竞争的加剧趋势。微软此次发布进一步巩固了其在企业级语音服务市场的技术优势。

取消 发布

下载品玩App,比99.9%的人更先知道关于「微软」的新故事

下载品玩App

比99.9%的人更先知道关于「微软」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测