品玩

科技创新者的每日必读

打开APP
关闭
业界动态

总分第一!翻译第一!讯飞星火大模型传媒方向评测居首

shuohang

发布于 2024年7月4日

7 月 3 日,经北京大学、清华大学、浙江大学、中国传媒大学等高校教授的学术指导,北京智源研究院、中国经济传媒协会联合新京报共同发布的《大语言模型传媒方向能力测评调研报告》备受关注。测评报告涵盖了包括讯飞星火、文心一言、通义千问在内的 9 大国内主流大模型产品。

报告的评估体系涵盖了文本生成、事实核查与价值观判断、媒体信息检索、翻译能力以及长文本处理等五个关键能力维度,全面反映了媒体行业对 AI 技术的需求和期待。值得注意的是,如果将本次测评报告中所有五项维度的平均分进行横向比较,大模型的翻译能力得分 6.42 排名第一,可见传媒从业者对于大模型进行翻译工作的成效相较其他工作满意度更高。在这一单项评测中,讯飞星火得分 6.84 排名第一。

作为人工智能「国家队」成员,科大讯飞星火大模型在传媒方向能力评测中取得这一成绩并不意外,尤其在智能翻译方面,科大讯飞有着深厚的技术积累和持续的技术创新。在刚刚举行的国家科学技术奖励大会中,科大讯飞主导的《多语种智能语音技术及产业化》项目摘得国家科学技术进步奖一等奖,这是深度学习引发的新一代人工智能全球浪潮以来,人工智能项目首次荣获中国科技领域最高荣誉。

值得一提的是,本次贝壳财经峰会大模型评测报告的评测版本为讯飞星火 V3.5,而在 6 月 27 日,科大讯飞全新发布了讯飞星火大模型 V4.0,宣布全面对标 GPT-4 Turbo,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越,在国内外中英文 12 项大模型主流测试集中,讯飞星火在其中 8 个测试集排名第一。

讯飞星火 V4.0 带来底座能力提升的同时,全新发布的星火企业智能体平台也成为备受传媒行业欢迎的大模型产品。智能体平台的「任务链」功能可以自动链接外部权威信源,「知识库」功能可以自动链接企业内部知识系统,打通内外信息鸿沟。媒体人士表示:「无论内部信息的纵向挖掘,还是外部信息的横向整合,智能体平台不仅提升媒体行业工作效率,对于从业人员的工作方式也将带来深远影响。」

下载品玩App,比99.9%的人更先知道关于「业界动态」的新故事

下载品玩App

比99.9%的人更先知道关于「业界动态」的新故事

iOS版本 Android版本
立即下载
shuohang

这家伙很懒,什么也没留下,却只想留下你!

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测