品玩2月3日讯,智谱AI近日正式开源专业级OCR模型GLM-OCR,该模型以0.9B参数量实现轻量化设计,在权威文档解析榜单OmniDocBench V1.5中以94.6分取得当前最优性能。其在文本识别、公式解析、表格重构及信息抽取等任务中表现卓越,部分能力接近通用大模型Gemini-3-Pro。
模型针对代码文档、手写体、印章识别、多语言混排等高难度场景进行专项优化,展现强大鲁棒性。依托自研CogViT视觉编码器与GLM-0.5B解码器架构,支持vLLM等推理工具,显著降低算力开销,适合高并发与边缘部署。
GLM-OCR已同步开源完整工具链,提供在线体验平台与API服务,定价低至0.2元/百万Tokens。该模型将为金融、物流、教育等领域提供高精度文档解析支持,助力行业数字化升级。




0 条评论
请「登录」后评论