品玩5月13日讯,面壁智能联合清华大学与OpenBMB开源社区,正式发布并开源新一代端侧多模态大模型MiniCPM-V 4.6。该模型以1.3B的轻量级参数规模,实现了性能与效率的双重突破,在Artificial Analysis等权威榜单评测中超越阿里Qwen3.5-0.8B、谷歌Gemma4-E2B-it等同尺寸模型,登顶全球同尺寸性能榜首。
MiniCPM-V 4.6通过架构创新,将端侧运行内存需求降至6GB,推理吞吐量达到Qwen3.5-0.8B的1.5倍,计算成本仅为后者的1/43,重新定义了“智能密度”。其采用的LLaVA-UHD v4技术实现了图像编码计算量锐减50%,并首创4倍/16倍混合Token压缩模式,让开发者可根据场景在性能与速度间灵活切换。
目前,MiniCPM-V 4.6已全面支持iOS、Android及HarmonyOS系统,并在Hugging Face、GitHub等社区开源。该模型配套了从微调到部署的全链路工具,开发者仅需一张消费级显卡即可完成微调,大幅降低了多模态应用的开发门槛。





0 条评论
请「登录」后评论