品玩

科技创新者的每日必读

打开APP
关闭
业界动态

权威工业大模型榜单发布:北电数智骄阳·工业大模型综合排名第一,两项子任务第一

2025年过半,工业大模型发展已进入关键转型阶段,正从早期的技术概念验证快速过渡到实际场景的规模化落地阶段。在此背景下,国产工业大模型全面进入能力正赛,竞争格局趋向多元化。

鸠鸠

发布于 23小时前

2025年过半,工业大模型发展已进入关键转型阶段,正从早期的技术概念验证快速过渡到实际场景的规模化落地阶段。在此背景下,国产工业大模型全面进入能力正赛,竞争格局趋向多元化。

7月24日,国内权威第三方评测机构 SuperCLUE 发布中文原生工业大模型测评基准 SC-Industry(SuperCLUE-Industry)最新榜单,掀起了AI及工业领域的广泛热议。在众多实力强劲的参评模型中,北电数智骄阳·工业大模型以83.44分的总分综合排名第一,领先Hunyuan T1、Kimi K2、o4 mini等国内外主流大模型,成为本次榜单的核心亮点之一。

图注:SuperCLUE 发布工业大模型能力象限

SuperCLUE 是行业权威的通用大模型综合性测评基准,专注于中文大模型测评;SC-Industry立足中文语义环境与工业场景,充分贴合国内制造业的术语体系与应用需求,全面地衡量工业大模型除知识库之外解决行业具体问题的应用能力,兼具工业领域模型的通用性与可拓展性。

SC-Industry评测从基础能力和应用能力两大维度出发,聚焦工业常规问答、工业数据分析、工业文档问答、工业智能体Agent、工业理解计算、工业代码生成六大能力,对大模型进行效果评估。通过构建专用测评集,SC-Industry结合评估流程、评估标准、评分规则,将文本输入送入超级模型,并对每一维度的评估结果与人类一致性进行分析。

根据榜单测评结果,骄阳·工业大模型在整体总分第一之外,“应用能力”综合测评结果获90.07分,同样位居榜首。在“工业数据分析” 细分维度上,「骄阳」获得90.38的最高分,能够对表格类数据进行出色分析并提供深刻洞察。在“工业智能体Agent”上,骄阳·工业大模型以89.97分领跑,其在一定的工业环境中展现出强大的自主或半自主执行任务能力,能有效做出决策,并与其他系统进行交互以优化或辅助工业流程,特别是在多轮任务规划与工具调用中表现卓越,这对于复杂工业流程的落地至关重要。

SuperCLUE在报告中指出,产业级应用能力成为新分水岭。骄阳·工业大模型凭借在工业数据分析上的强势表现,得到了业界领先的90.07分,首次登顶。这一方面说明在工业任务能力方面,国产模型正在突围;另一方面表明在基础能力趋同的情况下,工业数据分析与智能体表现将成为拉开差距的关键。

北电数智的骄阳·工业大模型能够拿下榜首,其能力可见一斑。据SuperCLUE分析,在基础能力趋同的情况下,工业数据分析与智能体表现成为此次拉开评分差距的关键。而在“工业数据分析”和“工业智能体Agent”两大细分维度上,骄阳·工业大模型均获得测评最高分。

北电数智以产业协同、技术突破双轮驱动破局,一方面推动建立工业数据标准和开放协议体系,运用可信数据空间技术实现数据的安全共享;另一方面重点研发场景化微调数据生成和复杂任务强化学习等核心技术,有效提升模型的行业认知能力。目前,骄阳·工业大模型已成功构建“精准的垂类认知、高质量数据治理体系、严格的安全合规管控机制”三大优势,展现了北电数智在垂类大模型领域的阶段性研发成果,也体现了依托北京电控深厚工业基因的差异化竞争能力。

值得一提的是,在即将到来的2025 WAIC世界人工智能大会上,北电数智将正式发布骄阳·工业大模型,并聚焦工业企业最关注的“AI+生产、AI+产品、AI+运营、AI+基础设施”等核心业务场景,分享创新能力和标杆实践。届时,让我们一同期待骄阳·工业大模型带来更多的惊喜与突破。

下载品玩App,比99.9%的人更先知道关于「业界动态」的新故事

下载品玩App

比99.9%的人更先知道关于「业界动态」的新故事

iOS版本 Android版本
立即下载
鸠鸠

这家伙很懒,什么也没留下,却只想留下你!

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测