品玩

科技创新者的每日必读

打开APP
关闭

苹果发布降噪大模型DLM,纠正ASR系统中的错误

2024年5月28日

品玩5月28日讯,据 Analytics indiamag报道,苹果公司近日推出降噪语音模型 DLM,这是一种使用大量合成数据训练的按比例纠错模型实现了 SOTA 自动语音识别 (ASR) 性能。

单个 DLM 可应用于不同的 ASR,其性能大大优于传统的基于 LM 的波束搜索重排。这些结果表明,设计良好的纠错模型有可能取代传统的 LM,从而将 ASR 系统的准确性提高到一个新的水平。

纠错模型面临的一个重大挑战是需要大量有监督的训练示例,而典型的 ASR 数据集中的训练示例数量有限。DLM 通过使用 TTS 系统生成合成音频来解决这一问题,然后将合成音频输入 ASR 系统,创建与原始文本配对的假设,形成训练数据集。这种方法允许使用更大的语言语料库来扩展训练数据。

取消 发布

下载品玩App,比99.9%的人更先知道关于「苹果」的新故事

下载品玩App

比99.9%的人更先知道关于「苹果」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测