品玩5月12日讯,据 TechCrunch 报道,谷歌为 Gemini API 推出新功能implicit caching,将使其模型成本降低。
据悉,implicit caching 通过 Gemini API 传递给模型的 “重复上下文 ”可以节省 75% 的成本。该功能目前支持Gemini 2.5 Pro 和 2.5 Flash 模型。
Gemini 2.5 模型默认已启用隐式缓存,如果 Gemini API 对模型的请求命中缓存,隐式缓存就会传递节省的成本。

谷歌为 Gemini 推出新功能,降低 AI 成本
5月12日品玩5月12日讯,据 TechCrunch 报道,谷歌为 Gemini API 推出新功能implicit caching,将使其模型成本降低。
据悉,implicit caching 通过 Gemini API 传递给模型的 “重复上下文 ”可以节省 75% 的成本。该功能目前支持Gemini 2.5 Pro 和 2.5 Flash 模型。
Gemini 2.5 模型默认已启用隐式缓存,如果 Gemini API 对模型的请求命中缓存,隐式缓存就会传递节省的成本。
下载品玩App,比99.9%的人更先知道关于「GEMINI」的新故事
下载品玩App
比99.9%的人更先知道关于「GEMINI」的新故事
0 条评论
请「登录」后评论