谷歌发布医疗AI模型MedGemma 1.5 4B，新增CT与MRI处理能力-品玩

品玩1月14日讯，据谷歌官方消息，谷歌正式发布新一代开源医疗AI模型“MedGemma 1.5 4B”及配套语音识别模型“MedASR”。其中，MedGemma 1.5 4B作为轻量级模型，最大的亮点是支持本地部署，并扩展了其对三维医学影像的处理能力。

与此前仅支持文本和X光、病理切片等二维影像的前代模型相比，MedGemma 1.5 4B新增了对计算机断层扫描（CT）和磁共振成像（MRI）数据的兼容与处理能力。基准测试显示，其在多项文本和影像任务上的准确率均高于其前代产品MedGemma 1 4B，部分表现甚至优于参数更大的27B版本。

同时发布的MedASR是一款专精于医疗术语的语音识别模型。谷歌数据显示，其在转录胸部X光片相关对话时的错误率仅为5.2%，表现优于行业其他通用模型。其转录结果可直接作为MedGemma模型的输入，二者结合可形成从语音到分析的工作流。该系列模型已衍生出超过500款定制化版本，展现出较强的社区拓展性。