品玩

科技创新者的每日必读

打开APP
关闭

百度开源多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking

7小时前

品玩11月11日讯,百度文心正式发布并开源多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking。该模型基于ERNIE-4.5-VL-28B-A3B架构,仅激活3B参数,在视觉语言理解、跨模态推理等任务中表现优异,媲美顶级大模型性能。

模型通过中期训练引入海量高质量视觉-语言数据,强化跨模态语义对齐能力,并结合大规模多模态强化学习策略提升推理稳定性。其新增的视觉定位与“图像思考”功能,支持工具调用与复杂场景交互,在文档解析、学科计算、视频分析等场景中实现突破。

模型以Apache 2.0协议开源,提供预训练权重、推理代码及全流程部署工具,已登陆Hugging Face、GitHub等平台,助力多模态智能应用开发。

取消 发布

下载品玩App,比99.9%的人更先知道关于「百度」的新故事

下载品玩App

比99.9%的人更先知道关于「百度」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测