品玩2月10日讯,据实况网报道,声网与美团、xbench联合发布了AI语音外呼行业的首个评测基准VoiceAgentEval。
其评估语料库完全基于真实的外呼业务数据构建,摒弃传统固定脚本,覆盖六大业务领域的30个子场景。评测采用文本与语音双维度评估体系,不仅考核AI对话的逻辑正确性,也全面评估其在语音交互中的综合表现。
为严格测试AI的任务遵循与通用交互能力,该框架还通过用户模拟器构建了150种虚拟对话场景进行压力测试。据悉,基于这一新标准,目前已初步甄选出在该场景中综合性能排名前三的模型,为行业设立了明确的技术标杆。





0 条评论
请「登录」后评论