品玩9月5日讯,据OpenDataLab官方消息,为解决企业级大模型应用中非结构化数据解析难题,OpenDataLab与钉钉基于智能文档解析引擎MinerU,联合推出面向企业用户的文档解析工具DLU(Document Language Understanding)。该工具将于近期开源,旨在降低AI应用开发门槛,加速AI技术在各行业落地。
作为上海AI实验室旗下项目,MinerU在GitHub已获超4万星标,其2.0版本以0.98B参数实现比肩72B主流大模型的解析性能。DLU继承了MinerU的技术优势,不仅支持Office、PDF等主流格式,还兼容钉钉自有文档、AI表格等特殊格式,可精准提取图表、公式、化学分子式等复杂元素,转化为适合大模型训练的高质量语料。
未来DLU将深度融入钉钉办公协同生态,支持从文档创建、解析到定制化模型训练的全流程闭环。OpenDataLab创始人何聪辉表示,希望将其打造成“数据工具中的PyTorch”,而钉钉CTO朱鸿则强调,开源DLU将助力企业筑牢智能化转型的数据根基,推动千行百业数字化升级。

0 条评论
请「登录」后评论