详情
谷歌发布突破性Gemini功能,大幅降低AI成本,引领行业创新
智能科技前沿网
更新日期:2025-06-27 09:15:12

品玩5月12日讯,据 TechCrunch 报道,谷歌为 Gemini API 推出新功能implicit caching,将使其模型成本降低。

据悉,implicit caching 通过 Gemini API 传递给模型的 “重复上下文 ”可以节省 75% 的成本。该功能目前支持Gemini 2.5 Pro 和 2.5 Flash 模型。

Gemini 2.5 模型默认已启用隐式缓存,如果 Gemini API 对模型的请求命中缓存,隐式缓存就会传递节省的成本。