Uber提前耗尽年度AI预算,科技巨头面临智能体时代的成本挑战
AI智能体的部署与应用成为今年科技产业的热点,然而,大规模应用所带来的成本压力正迅速显现。近期,出行服务巨头Uber因过快消耗AI预算而采取严格管控措施的消息,引发了行业对智能经济成本模型的深度思考。
彭博社援引Uber发言人确认,公司已对员工使用的智能体式编程工具设定消费上限,包括Claude Code、Cursor等。新限制规定,每名员工在每款工具上每月最多消耗1500美元的token额度。
据TechCrunch报道,Uber此前曾积极鼓励员工使用AI工具,甚至通过排行榜等方式推动内部采用。然而,公司今年前几个月就已耗尽全年的AI预算。这一转变迫使管理层重新审视财务问题,包括成本分摊与控制机制。目前,公司未公开年度AI预算的具体总额。不同工具的额度相互独立,员工可通过内部仪表板监控使用情况,特殊需求可申请超额使用。
Uber的举措在硅谷并非个例。几乎在同一时间,微软旗下的GitHub Copilot也转向了基于token消耗的新计费模式,引发了开发者社区的讨论。两者的区别在于,Uber将成本控制直接落实到个人层面,使AI开销从一项笼统的公司预算,转变为每个员工在日常工作中都能清晰感知的具体边界。
智能体范式重构成本模型:从可控消耗到指数级增长
传统的大模型应用多集中于单次对话、简单问答等轻量场景,其token消耗具有单次性、固定性的特点,整体用量存在清晰上限,便于企业进行年度预算的规划与管控。
然而,随着行业全面进入智能体时代,AI的应用形态发生了根本性重构。自主决策、多轮迭代、场景联动与持续运算成为核心特征。智能体不再是简单响应指令的工具,而是能够自主拆解复杂任务、反复试错、协调多流程的智能主体。这种工作模式直接导致了token消耗量呈现几何级数乃至指数级的增长。
在实际应用中,无论是OpenClaw还是其他同类智能体,一个简单的指令就可能触发数十万token的瞬时消耗。对于像Uber这样业务场景复杂、全链路数字化的平台型企业而言,在调度、客服、运维、数据分析等全场景部署智能体,将产生海量且持续的算力与token消耗。这种消耗没有固定上限,完全随业务运转而动态叠加,使得基于传统模式的年度预算体系迅速失效。
投入产出比失衡:海量消耗与回报不及预期
更核心的问题在于token投入与商业回报之间的严重失衡。当前AI智能体的逻辑推理与规划能力仍处初级阶段,在执行任务时容易陷入“死循环”或进行大量无效推演。例如,智能体可能为完成一个次要子任务而调用海量无关数据,或在多智能体协作中产生无意义的内部消耗。
其底层表现便是大量token被无效燃烧。企业为此支付了高昂成本,但业务效率并未获得实质性提升,收入端也未见相应增长。这种情形类似于工厂引进了昂贵的自动化设备,但其大部分时间却在空转或生产废品,导致运营成本激增而产出效益停滞。对于企业管理者而言,当AI未能成为利润增长引擎,反而转变为纯粹的财务报表费用项时,重新评估其部署策略便成为必然选择。
Token经济的根本矛盾:边际成本递减法则的失效
回顾科技产业发展史,硬件制造与软件开发通常遵循“规模经济”原则,即随着产量或用户规模的扩大,分摊的固定成本下降,边际成本趋向于零。这一规律支撑了过去几十年互联网商业模式的快速扩张。
然而,在基于大模型的token经济中,这一经典经济学法则似乎失效了。大模型的每一次推理都需要GPU进行高强度实时计算,其成本是刚性的算力消耗。使用一次即产生一次成本,使用规模扩大则成本线性甚至超线性叠加,难以通过规模效应摊薄。这意味着,当AI作为基础设施被深度集成后,企业实际上是在一种“按流量计费”的模式下运营,缺乏成本护城河。规模化部署反而可能带来更高的财务风险。
回归理性:重构成本逻辑与价值评估体系
过去一段时期,行业内存在“先上再说”的普遍心态,许多企业接入AI是出于对技术落后的担忧,而非明确的价值路径规划。这在技术探索期或许可行,但当进入大规模应用与成本兑现阶段,这种思维则可能带来经营风险。
当前,AI产业已告别单纯追求技术先进性与场景覆盖率的初级阶段。未来的竞争核心将转向应用效能、成本控制与投资回报率。企业必须摒弃盲目跟风的惯性思维,回归产业经营的本质。
具体而言,企业需建立精细化的AI使用管控体系,聚焦高价值、高回报的应用场景,果断淘汰无效或低效的智能体应用,最大限度减少无意义的算力内耗。同时,应持续优化应用模式,通过技术复用、场景集约与算力共享等方式,探索构建具备边际成本递减潜力的AI商业化模型。
归根结底,AI技术应服务于企业的核心盈利目标。任何无法持续创造商业价值的AI应用都难以长期存续。市场的最终选择,将是企业回归理性,只为那些能真正带来效率提升与收入增长的AI能力与算力资源付费。
责任编辑:zx0600
