品玩5月8日讯,Krisp近日宣布,正式发布VIVA 2.0语音AI基础设施层,旨在解决语音智能体在复杂环境下的交互难题。该更新引入了新一代实时模型,在语音转文字(STT)前处理音频信号,显著降低错误率并提升对话自然度。
VIVA 2.0核心升级包括Turn Prediction v3,可仅凭音频预测对话轮次结束,避免打断用户;以及首创的Interrupt Prediction v1,能区分用户插话意图与背景附和。此外,新增TTS、口音及性别检测器,使AI能识别合成语音并适应不同说话特征。
目前,VIVA SDK年处理流量超120亿分钟,集成于Daily、Vapi等130多款产品。Telnyx CEO David Casem表示,该方案从源头提升了信号质量。Krisp高管Robert Schoenfield强调,VIVA让AI能适应真实世界的交互环境。





0 条评论
请「登录」后评论