品玩

科技创新者的每日必读

打开APP
关闭

百度发布新一代文字识别模型PP-OCRv5

9月15日

品玩9月15日讯,百度在Hugging Face发布新一代文字识别解决方案PP-OCRv5。该模型专为缓解大型视觉语言模型局限性而设计,具备高效、准确、轻量等特性。

PP-OCRv5参数量仅0.07B,能在CPU及边缘设备实现高性能,其移动版本在特定CPU上每秒可处理超370个字符。在OCR特定基准测试中,该模型性能优于Gemini 2.5 Pro等通用型VLM模型,在中英文及拼音文本识别上表现出色。它支持简体中文、繁体中文、英文、日文、拼音五种文字类型,可识别超40种语言,并能提供精确文本行边界框坐标,便于结构化数据提取。

PP-OCRv5由图像预处理、文本检测、文本行方向、文本识别四个核心组件构成,为文字识别领域带来新突破 。

取消 发布

下载品玩App,比99.9%的人更先知道关于「百度」的新故事

下载品玩App

比99.9%的人更先知道关于「百度」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测