品玩

科技创新者的每日必读

打开APP
关闭

智谱AI发布专业级OCR模型GLM-OCR,性能达SOTA水平

2月3日

品玩2月3日讯,智谱AI近日正式开源专业级OCR模型GLM-OCR,该模型以0.9B参数量实现轻量化设计,在权威文档解析榜单OmniDocBench V1.5中以94.6分取得当前最优性能。其在文本识别、公式解析、表格重构及信息抽取等任务中表现卓越,部分能力接近通用大模型Gemini-3-Pro。

模型针对代码文档、手写体、印章识别、多语言混排等高难度场景进行专项优化,展现强大鲁棒性。依托自研CogViT视觉编码器与GLM-0.5B解码器架构,支持vLLM等推理工具,显著降低算力开销,适合高并发与边缘部署。

GLM-OCR已同步开源完整工具链,提供在线体验平台与API服务,定价低至0.2元/百万Tokens。该模型将为金融、物流、教育等领域提供高精度文档解析支持,助力行业数字化升级。

取消 发布

下载品玩App,比99.9%的人更先知道关于「智谱」的新故事

下载品玩App

比99.9%的人更先知道关于「智谱」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测