品玩1月14日讯,据谷歌官方消息,谷歌正式发布新一代开源医疗AI模型“MedGemma 1.5 4B”及配套语音识别模型“MedASR”。其中,MedGemma 1.5 4B作为轻量级模型,最大的亮点是支持本地部署,并扩展了其对三维医学影像的处理能力。
与此前仅支持文本和X光、病理切片等二维影像的前代模型相比,MedGemma 1.5 4B新增了对计算机断层扫描(CT)和磁共振成像(MRI)数据的兼容与处理能力。基准测试显示,其在多项文本和影像任务上的准确率均高于其前代产品MedGemma 1 4B,部分表现甚至优于参数更大的27B版本。
同时发布的MedASR是一款专精于医疗术语的语音识别模型。谷歌数据显示,其在转录胸部X光片相关对话时的错误率仅为5.2%,表现优于行业其他通用模型。其转录结果可直接作为MedGemma模型的输入,二者结合可形成从语音到分析的工作流。该系列模型已衍生出超过500款定制化版本,展现出较强的社区拓展性。





0 条评论
请「登录」后评论