谷歌因API请求量翻倍,收紧Gemini平台资源供应
由于开发者、企业及科技巨头对人工智能计算能力的需求持续攀升,谷歌正在调整其Gemini人工智能平台的资源分配策略。此举的背景是,2025年3月至8月期间,Gemini API的请求量实现了翻倍增长。
需求激增背后的压力
这一需求的爆发式增长,直接威胁到谷歌现有AI计算容量的承载能力。作为回应,谷歌被迫重新审视其核心资源——原始人工智能计算力的分配方式,以应对日益紧张的市场局面。
“从3月到8月,Gemini API的请求量翻了一倍。”这一数据揭示出,在不到半年的时间里,面向开发者的AI服务需求已出现快速膨胀。
资源配置逻辑拆解
所谓“资源供应收紧”,主要涉及谷歌对Gemini平台底层算力、带宽及API调用配额的管理。当请求量超过预期上限时,系统会优先保障核心客户的访问,而对非核心用户或低优先级的应用场景实施限流或排队机制。
- 资源分配调整:谷歌正在优化算力调度,以确保高优先级业务不受影响。
- 市场影响:此举可能加剧开发者和中小企业获取AI算力资源的竞争,间接提高使用门槛。
背景与影响
Gemini API请求量的翻倍,反映出全球AI应用正从实验阶段加速走向规模化部署。随着企业客户和科技巨头大量接入AI模型,任何单一平台的算力供给都面临压力测试。
业内人士指出,短期内,这种资源紧张将促使部分开发者寻求替代方案或调整使用策略。
谷歌对Gemini应用实施算力额度限制 影响Meta等客户AI项目推进
据知情人士透露,谷歌在今年3月前后告知Meta,无法足额供应其所需的Gemini模型算力额度。由于Meta对谷歌模型的需求远高于其他客户,因此受到的影响最为明显。此举打乱并推迟了Meta多项内部人工智能项目的推进节奏。
算力限制波及多家客户
除Meta之外,其他谷歌客户也受到算力不足影响,但程度相对有限。受该算力限制,叠加公司整体压缩人工智能成本的战略,Meta已要求员工节约调用AI令牌,提升使用效率。
自2026年5月17日起,谷歌对Gemini应用实施了基于算力额度的使用限制。这类似于手机流量套餐:用户不再拥有无限请求,而是需在每周滚动更新的5小时刷新窗口内使用,并且每周有使用上限。
这些限制适用于广泛范围,而不仅限于一家公司。谷歌已记录了速率限制和支出层级,旨在确保在该公司所称的快速增长阶段,所有客户都能公平使用API。
谷歌选择需求管理而非扩建基础设施
谷歌选择实施使用量限制而非单纯扩大基础设施,这正说明了其经济考量。即使对于拥有谷歌资源的公司而言,要满足不受约束的人工智能需求所需的资本支出也令人望而生畏,因此有必要在短期内采取需求管理措施。
算力额度可理解为一种预分配的请求配额,类似于手机流量套餐中每月固定流量,超出后不再提供服务。这种机制旨在平衡有限算力资源与不断增长的需求。
算力瓶颈拖累产业扩张
这起事件再次凸显,即使全球科技巨头持续投入数千亿美元兴建数据中心并采购人工智能芯片,整体基础设施仍难以追上生成式人工智能快速扩张所带来的需求,算力供给仍是目前产业发展的重要瓶颈。
谷歌云端事业最新财报也反映相同问题。在截至2026年3月底的2026财年第一季,谷歌云营收达200亿美元,但Alphabet CEO皮查伊当时表示,算力限制使谷歌云无法承接更多客户需求,也让该部门积压订单较前一季接近倍增。
