品玩3月4日讯,据 siliconangle 报道,Google 正式发布Gemini 3.1 Flash-Lite,作为其Gemini系列中最新一代轻量级多模态AI模型。该模型专为高吞吐、低复杂度任务设计,在成本与速度上显著优化:输入价格为每百万token 0.25美元,输出为1.50美元,远低于Gemini 3.1 Pro。
性能方面,Gemini 3.1 Flash-Lite在内部测试中较前代Gemini 2.5 Flash提速45%,首token响应时间缩短至2.5倍更快。其支持最多100万token的上下文输入,可生成长达64,000 token的文本,包括可执行代码,适用于生成BI仪表盘等可视化资产。
在11项基准测试中,该模型在6项中表现最优,超越GPT-5 mini与Claude 4.5 Haiku,并在博士级科学问答集GPAQ Diamond中取得领先。尽管在高难度HLA基准上得分为16%(Gemini 3.1 Pro为44.4%),其定位明确聚焦于翻译、内容审核、原型生成等高并发场景。
目前,Gemini 3.1 Flash-Lite已在Google Cloud Vertex AI平台开放预览,并集成于Google AI Studio,供开发者通过自然语言快速构建应用。





0 条评论
请「登录」后评论