品玩

科技创新者的每日必读

打开APP
关闭

Sarvam AI推出面向印度多语环境的语音识别系统Sarvam Audio

2月5日

品玩2月5日讯,据yourstory 报道印度AI初创公司Sarvam AI近日发布Sarvam Audio,一款专为应对印度多语言、语码混用及多文字体系现实而设计的语音识别系统。该系统不仅提供转录,更支持上下文感知、说话人区分(diarisation)及推理时可切换的五种输出模式,包括规范文本、罗马化输出及智能翻译等。

创始人Dr. Vivek Raghavan与Dr. Pratyush Kumar表示,Sarvam Audio旨在减少后处理,提升客服、物流、金融等场景中语音接口的生产就绪度。系统通过利用对话历史提升嘈杂环境下的识别准确率,并允许开发者按需选择输出格式,简化工程流程。

目前,Sarvam已开放在线体验平台供开发者测试不同输出风格,推动语音技术在印度大规模企业应用中的落地。

取消 发布

下载品玩App,比99.9%的人更先知道关于「印度」的新故事

下载品玩App

比99.9%的人更先知道关于「印度」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测