为了让智能体能真正干活,处理更大工作负载,云大厂可以说是使出了“十八般武艺”。这不,为了让用户有更多“配额”,解决智能体的规模化应用和高频交互问题,亚马逊云科技悄悄干了一件事,那就是将Amazon Bedrock AgentCore中的Runtime的“配额”提升了5倍。
熟悉亚马逊云科技的人都知道,围绕Agentic AI战略,这个“云计算一哥”给出了五层技术架构。主要包括:AI基础设施层、模型层、数据和知识层、Agentic平台层、智能体与应用层。其中,Amazon Bedrock AgentCore属于第四层的平台层,其价值在于提供统一的智能体运行环境和开发工具,同时也提供记忆、规则、评估和治理等能力。
为了让用户在Runtime中跑起来,亚马逊云科技会给用户提供一定的“配额”,此次扩大用户的使用量,意图很明显——应该是为了留住更多用户。这和过去云计算的玩法大同小异,一旦用户对应用形成依赖,之后随着业务的扩张,消耗资源的量也会增加。
至于,亚马逊云科技增加的这个“配额”,是否能对用户构成“吸引力”?我们一起来分析下具体的配额变化!
数字变化
亚马逊云科技在最新发布中明确写到,从现在开始,将在部分区域以及其他区域实施最新配额政策。可以看得出,该政策对美国东西部用户更友好,但在其他区域,也比之前有5倍的提升。Agent可处理的交互速度提升了8倍,由原来的每秒 25 个 token提升至现在的每秒 200 个 token(覆盖所有支持的区域),足以使企业应对用户的高并发请求。
以下为默认配额变化:
另外,为助力企业在业务需求高峰期快速扩容AI应用,亚马逊云科技进一步优化容器部署能力,将新建AI智能体会话的速率提升4倍,对应限制从原有的100 TPM(每分钟事务数)上调至400 TPM。
谁更需要?
有人可能会问了,数字背后的变化逻辑是什么?答案是:用户应用在推动!
亚马逊云科技正在把“默认值”从“实验室规模”调整到“生产规模”。以前你做一个PoC,1,000个并发会话绰绰有余。但当你的智能体开始服务数万用户、处理跨系统长流程任务时,这个数字就是天花板了。
换句话来说,对于那些还处于Agent探索期的用户来说,这种增加配额的体验并不明显。但对于那些重AI应用的用户来说,这个多出的配额可以说是“刚需”啦。
用Avasant研究总监Gaurav Dewan的话来说,新策略的推出,对于运行高并发、交易密集型AI工作负载的企业将带来深远影响,可以从更高的默认配额中获益最多。影响场景包括:客户服务和联络中心、软件工程与DevOps自动化、IT运维、金融服务流程自动化、医疗行政、供应链协调以及安全运营等,在这些场景中,AI智能体往往需要大规模并发运行。
因为,这些场景都有一个共同点:智能体不是“问一句答一句”,而是需要持续运行、跨系统交互、长时间保持状态的任务,它们对配额的消耗是指数级增长状态。
配额背后的策略
需要强调的一点是,增加额度,不是亚马逊云科技的“突发奇想”,而是以客户为中心,提供了更贴近市场的策略方案。
Forrester首席分析师Charlie Dai指出,本次AgentCore Runtime配额的全面上调,正是头部云厂商对行业趋势的精准判断。当下,企业AI应用的核心变化早已不是智能体数量的简单增长,而是从单点任务型Copilot,全面转向服务海量用户的多Agent生产级部署。
这一趋势直接带来了远超早期预设的运行压力,更高的并发请求、更长的Agent任务生命周期,以及复杂度指数级提升的多Agent编排逻辑,原有默认配额体系早已无法适配。
Gartner高级首席分析师Ashish Banerjee进一步补充,对于正处于从试点向生产跃迁阶段的企业而言,更高的默认配额能从根源上消除规模化过程中的核心运维摩擦。
“在企业环境中,要想提升配额就得走申请流程,这意味着你需要提交支持工单,并且要提供业务理由,这才能通过审核。对于着急部署的项目来说,这会带来数天甚至数周的等待时间,直接拖慢项目上线节奏,甚至会增加额外开销。” 一家叫做Kanerika的 IT咨询公司的一位叫做Amit Chandak的首席分析官 ,也印证了这一行业痛点。
更关键的是,配额不仅仅是流程和成本的问题,还有整个技术架构问题,技术团队通常会围绕默认上限来设计架构。更高的默认值会拓宽团队的创新试错空间,无需触发特殊审批流程就能探索更复杂的AI方案,这不仅优化日常运营效率,更会从底层影响企业AI架构的长期选型。更关键的是,生产环境中突发的配额耗尽,会直接中断面向客户的核心应用与多智能体工作流,造成难以预估的业务损失。
如何理解配额增加对技术架构的影响?举个例子,如果一个团队默认只能跑1,000个会话,他们设计的系统就是为1,000个会话优化的。他们不会去想5,000个会话的架构,因为“反正也用不了”。默认配额本质上是一个心理锚点,它决定了你愿意探索的边界在哪里。亚马逊云科技把锚点往后挪了5倍,意味着团队可以名正言顺地思考更大规模的架构了。
Agent Infra成熟的信号
还有一个信息点是,亚马逊云科技并不是唯一一个在调整Agent基础设施的厂商,微软也在调整。只不过,亚马逊云科技与微软的战略打法不太一样。
微软在Azure Foundry Agent Service上的做法与亚马逊云科技不同,Runtime在设计上就是固定的,即使提出配额申请也无法增加。但是在模型部署层,微软提供了充分的灵活性,那里的配额是可调节的,而不是放Agent Runtime层。亚马逊云科技和微软存在着明显的架构差异性,前者在Runtime层面提高并发会话的下限,而后者的Runtime层设计是锁死的。
翻译过来的意思是,微软的策略是“模型层灵活、Runtime固定”,亚马逊云科技在Bedrock AgentCore上的策略是“Runtime层直接给你更多空间”。两种哲学,两种选择。亚马逊云科技的选择意味着,当你的Agent需要大规模并发时,不用去改模型部署策略,直接在Runtime层面就能撑住。
巨头在Runtime上的疯狂内卷,其实是Agent Infra成熟的一个典型信号,为企业智能体大规模落地提供了坚实的地基。
数据显示:2025年,企业应用中仅有5%集成了AI Agent功能。而根据Gartner预测,到2026年底这一数字将飙升至40%。
5倍配额增长的背后,不是模型能力的突变,而是基础设施的成熟。亚马逊云科技在用实际行动回答一个核心问题:当企业把AI从“实验室玩具”变成“生产工具”时,基础设施层先给你接住了,剩下的就看你的业务能跑多快了。