品玩5月23日讯,据爱范儿报道,由阿里国际联合上海人工智能实验室、北京语言大学一起打造的,首个应用型 AI 翻译测评榜单 TransBench 在 OpenCompass 上线。
据介绍,TransBench 与传统的翻译测评体系相比,增加了幻觉率、文化禁忌词、敬语规范等指标,首次针对行业的细分领域构建评测数据和评测方法。
TransBench 中,将包括「全面的通用标准」「行业垂直标准」「跨文化特性标准」三大测试标准。目前,TransBench 的测评方法进行了开源,同时也已发布了首期测评结果。

0 条评论
请「登录」后评论