近日,第六届CSIG图像图形技术挑战赛总决赛在第十三届国际图象图形学学术会议(ICIG 2025)期间举行。挑战赛共设七个赛道,吸引了国内外高校、科研机构及企业的2879支队伍参赛,金山办公支持的“2025算法挑战赛-多模态文档解析大赛”是其中的重要赛道。
现场,以个人身份参赛的“复兴-Team”以0.8735分的成绩夺得一等奖,来自南京大学的“好好好”团队以0.8658分的成绩获得二等奖,来自华南理工大学的“超新星”团队和以个人身份参赛的“Decalogue”并列三等奖。
“金山办公希望通过支持此类高水平技术赛事,推动多模态文档理解技术的发展,挖掘和培养更多优秀人才,推动协同办公行业向更高效、更智能的方向发展,加速技术创新与应用落地。”金山办公副总裁姚冬表示。姚冬在算法研究、技术实施与产品化方面具有丰富经验,他还担任了本次多模态文档解析大赛的评委。
(图为第十三届国际图象图形学学术会议现场)
以赛事聚焦关键研究,产学研共促文档解析技术应用落地
随着人工智能技术持续赋能百业千行,文档中信息的解析、切片和召回能力,已成为激活组织和个人知识的基础,这也让文档解析技术(包含OCR技术,光学字符识别)成为协同办公乃至人工智能赛道关注的焦点。
“本次大赛专注于文档解析赛道,要求参赛者开发出能够同时处理文本、图像、公式、表格等多种元素类型的算法模型,考验其在布局检测、文字识别、公式还原、表格结构重建以及阅读理解等多个维度的能力。比赛采用六项核心指标加权汇总的评审机制,确保了最终结果的公平、客观和可信。”金山办公算法总监段纪伟在现场介绍了赛事情况。
(图为总决赛颁奖典礼)
金山办公支持的文档解析大赛成功吸引了97所高校的215支队伍参加,参赛高校数量较上年增长44.8%。最终,以个人身份参赛的“复兴-Team”以0.8735分的优异成绩荣获一等奖,来自南京大学的“好好好”团队以0.8658分紧随其后,获得二等奖,来自华南理工大学的“超新星”团队和以个人身份参赛的“Decalogue”并列三等奖。这些团队将获得大赛颁发的一、二、三等奖奖金,及WPS AI会员资格、阿里云服务器资源等奖励。
挑战赛总决赛由中国图象图形学学会理事、竞赛与培训工作委员会主任、华中科技大学教授桑农主持。总决赛评委团由安徽大学教授汤进、中国科学院空天信息创新研究院研究员王超、云南大学教授钱文华、中山大学教授谢晓华以及中国矿业大学教授姚睿等专家组成。
WPS 365自研文档解析算法、表格信息召回准确率业界领先
从最初的简单字符提取,到近年来兴起的多模态大模型,文档解析技术已逐步融入版面理解、语义识别与结构还原等多项任务。该技术在文档和字幕识别、物流分拣、资料检索等领域得到广泛应用,并持续推动大模型训练语料的积累。
(图为金山办公算法总监段纪伟在总决赛现场发言)
金山办公算法总监段纪伟在现场指出,当前文档解析技术正逐步从基于深度学习的方法向基于多模态大模型的方法过渡,同时从单任务单模型范式向端到端多模态大模型范式转变。然而,该领域仍面临诸多挑战,包括文档复杂解析难度较大、稀缺数据适配性较差以及性能与效率要求较高等问题。因此,产学研各界应紧密合作,共同推动技术转化与应用落地。
经过多年技术积累,WPS 365的自研算法已具备国内领先的文档解析能力,能够精准识别PDF文档中的图片、表格等信息,大幅提升问答精度。特别是在表格信息召回方面,该算法的召回准确率高达95%,显著领先于业界水平。
今年6月,金山办公携手华中科技大学共同推出了名为Monkey OCR的文档解析模型。据研究团队提供的数据,Monkey OCR在处理复杂文档(如包含公式和表格的文档)时表现尤为出色,其性能相较于行业平均水平分别提升了15.0%和8.6%。在英文文档解析任务中,其3B参数模型更是超越了主流的72B模型,平均性能达到了SOTA级别(即在基准测试中表现最优)。尽管发布尚不足一个月,该模型的GitHub Stars数量已攀升至2.6k,目前已突破6.2k。
基于技术带来的范式转变,金山办公近年来在人工智能领域动作频频。2023年,金山办公推出WPS AI 1.0聚焦“工具赋能”,将AI能力嵌入WPS组件,奠定了超6亿月活设备的用户基础;2024年,推出WPS AI 2.0,基于此WPS 365构建“企业大脑”,促进“组织知识激活与挖掘”;2025年,推出WPS AI 3.0版本,打造“人与AI助理多轮对话、持续修改”的全新交互范式。截至6月30日,WPS AI月活跃用户数已突破2951万,
为支撑人工智能、协同办公等战略落地,金山办公选择真金白银地投入。2025上半年研发投入达9.59亿元,同比增长18.70%,研发费用率约36%,研发费率相比2024上半年提高2至3个点。同时,金山办公重视与高校、学会的共建合作,将持续探索更多的“产学研”合作机制,为推动人工智能产学研一体化发展贡献力量。




0 条评论
请「登录」后评论