从堆砌规模到模态融合,大模型行业的市场竞争逻辑已经逐渐发生转变,由技术或产品的单点比拼,转向涵盖生态建设、行业赋能等多维度的竞赛。
11月6日,在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞发布了基于全国产算力的讯飞星火X1.5深度推理大模型,率先在国产算力平台上攻克了MoE(混合专家)模型全链路训练效率难题。
据悉,星火X1.5模型端到端性能达到国际竞品效率的93%以上,在模型参数规模相对较小的情况下对标国际主流大模型,推理效率相比上一代星火X1也提升了100%。
国际方面,OpenAI在今年8月刚刚发布GPT-5,冲上大模型竞技场榜首,在文本、编程、数学等全方面排名第一,据称达到“博士级别的智能”;谷歌也于同月推出其最强推理模型Gemini 2.5 Deep Think,在国际数学奥林匹克上达到金牌水平。全球AI竞争正在进入新一轮加速期。
星火X1.5采用MoE架构,总参数量达到2930亿,激活参数为300亿,推理效率较前代翻倍。这意味着在保持高性能的同时,大大降低了计算资源需求。
在核心技术指标上,星火X1.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大能力上全面对标国际主流大模型。其中数学能力方面,星火X1.5在2025年新高考全国卷数学测试中以145分领先GPT-5等;多语言能力覆盖超过130个语种,其中拉美、东盟等14个重点语言效果上领先,整体性能达到GPT-5的95%以上。
这样的技术突破,背后离不开讯飞攻克的两大技术难题:一是长思维链强化学习训练效率,实现深度推理训练效率从30%提升至84%;二是MoE模型全链路训练效率,实现大幅提升。
两大突破均基于全国产算力平台实现,这对于在芯片供应受限背景下,发展自主可控的AI产业具有重要意义。
语音大模型一直是讯飞的强项领域。在原创技术突破方面,讯飞全球首发非自回归语音大模型架构,不同于传统的自回归模型需要按顺序进行,这一新架构打破了语音识别的顺序依赖,能够并行地、一次性地输出整个文本序列,极大解放了计算效率。
相较同尺寸的自回归模型,新架构的语音大模型效果相对提升16%,推理成本下降520%,使得大规模部署高质量的语音AI服务变得极其经济可行,为技术普及扫清了关键障碍。
科大讯飞董事长刘庆峰在发布会上指出,AI红利的兑现需要攻克自主可控、软硬一体、行业纵深和个性化这四大关键核心。
作为算力基石,AI芯片几乎直接决定了AI大模型的推理速度和上限。国产AI芯片产业面临的最大挑战之一,便是软件生态的建设。
对此,科大讯飞主动成为连接上层应用和底层硬件的桥梁,一面与国产芯片厂商进行联合创新,一面构建统一的软件平台,降低开发者门槛,同时还通过开源和开放平台反哺底层生态,实现真正的自主可控。
在软硬一体方面,讯飞发布了融合AI与麦克风阵列、扬声器阵列、摄像头阵列、视觉呈现等的软硬件一体解决方案。讯飞智能办公本X5、AI翻译耳机、双屏翻译机2.0等在复杂噪声环境下的识别准确率分别高达95.08%、97.1%和98.69%。
在个性化层面,讯飞重点展示了两大创新技术:个性化记忆与百变声音复刻。个性化记忆能力使星火X1.5能够通过构建用户个性化记忆库,实现对用户长期画像、近期反馈、短期对话的综合理解;百变声音复刻技术则基于星火语音大模型,可利用一句录音复刻任意音色,用一条指令创造任意风格的声音。
这些突破不仅展示了技术实力,更为AI在教育、医疗、办公等领域的深度应用奠定了基础。例如星火医疗大模型基于超7.7万家基层医疗机构数据,可将诊断和利率提升9个百分点,病历撰写时间减半。
科大讯飞星火X1.5的发布,正值国家推动高质量发展和科技自立自强的关键时期。AI作为国家战略科技力量,在推动产业升级和社会进步中扮演着越来越重要的角色。 国务院《关于深入实施“人工智能+”行动的意见》明确指出,推动产业全要素智能化发展,助力传统产业改造升级。
科大讯飞的实践表明,坚持自主创新与开放合作相结合,是中国AI产业发展的有效路径。通过技术突破、场景落地和生态共建,国产大模型正在全球AI竞争中开辟一条特色发展道路。




0 条评论
请「登录」后评论