2026年04月03日 14:25:55
谷歌更新Gemini API定价 按推理使用分档计费
财联社4月3日电,谷歌近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priority)、批量(Batch)和缓存(Caching)版。其中,弹性推理档位通过利用非高峰闲置算力资源,提供标准价格五折优惠,目标延迟为1至15分钟,但不提供延迟保证。批量API档位同样提供标准费率五折优惠,延迟最长可达24小时。缓存档位计费依据缓存词元(Token)数量与存储时长,推荐用于搭载复杂系统指令的对话机器人、长视频文件重复分析,以及大规模文档集查询等场景。优先档位定价则比标准价格高出75%至100%,延迟可控制在毫秒至秒级。谷歌建议该档位用于实时客服聊天机器人、实时欺诈检测及业务关键型智能助手等场景。
收藏
71.3W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
关联话题
1.61W 人关注
6.61W 人关注
关于我们|网站声明|联系方式|用户反馈|网站地图|友情链接|举报电话:021-54679377转617举报邮箱:editor@cls.cn财联社举报
财联社 ©2018-2026上海界面财联社科技股份有限公司 版权所有沪ICP备14040942号-9沪公网安备31010402006047号互联网新闻信息服务许可证:31120170007沪金信备 [2021] 2号