Agentic AI时代,CPU如何重回智算中心C位?
创始人
2026-06-10 08:06:05
0

来源:市场资讯

(来源:环球网资讯)

来源:环球网

【环球网科技报道 记者 林梦雪】当大模型从“被动回答”进化为能够自主规划、调用工具并执行多步任务的“智能体(Agent)”,AI数据中心的底层架构正在经历一场震荡。

面对活跃智能体数量超200%的激增预期,以及随之而来的“内存与闪存焦虑”,数据中心该如何重构?未来的AI算力又将如何交付?近日,在英特尔至强6+新品发布会暨数据中心创新日期间,多位与会者谈到,在Agentic AI时代,CPU不再是GPU的“配角”,而是重新回到了智算中心的C位。

算力结构之变:从“GPU独奏”到“CPU指挥的交响乐”

过去两年,AI数据中心的绝对主角是GPU。但在Agentic AI时代,这一局面正在被颠覆。

“前沿AI模型的训练就像是一场GPU独奏协奏曲,但随着智能体AI的兴起,我们需要整个计算平台协同作战。这是一场涵盖多种工作负载的真正‘交响乐’。”英特尔公司全球副总裁兼首席市场营销官Brett Hannath在开场致辞中打了个比方,“CPU的角色,就是这场交响乐团的指挥。”

这种“指挥”作用的凸显,源于智能体工作负载的本质变化。金山云计算研发负责人杨峰提出:“在Agent架构中,CPU实际上变成了指挥者和大脑。它要思考任务怎么编排、知识库怎么检索、工具怎么调用。这些Agent运行的任务,实际上是所有GPU请求的驾驭者。”

算力配比数据也发生了反转。英特尔市场营销集团副总裁、中国区总经理郭威透露,目前数据中心内CPU与GPU的比例已经从去年的1:8、1:4,回升到了1:2,未来甚至可能达到1:1。

但这并非简单的单机硬件堆叠。腾讯云计算产品运营总监周驰说道:“不要把它看作是单台服务器内部的比例,应该从全球的业务量去比。”周驰指出,当前AI应用出现了强烈的“破圈”现象,从开发者延伸到了律师、农民甚至10岁的小朋友。“这种破圈导致大量原本ROI不合算的日常琐碎业务被自动化。这些海量、高并发的小脚本不需要很多GPU,但极度依赖CPU的调度能力。从全球装机量来看,CPU的需求正迎来爆发式增长。”

破解“存储焦虑”:QAT与IAA成为普及智能体的“金钥匙”

智能体在运行中需要维持长周期的上下文记忆,这直接导致了KV Cache(键值缓存)容量的指数级爆发。

“以100万Token上下文为例,1个用户的KV Cache就需要近10GB,且随用户数线性增长。”新华三集团存储产品线首席产品经理王其勇指出,KV Cache正在驱动存储行业迎来新范式,对高端SSD和内存的需求呈现出“奇货可居”的状态。

面对昂贵的闪存和内存,如何降低Token的生产成本?英特尔数据中心集团副总裁兼中国区总经理陈葆立给出了破局思路:“机会是留给有准备的人的。我们多年前布局的QAT(压缩加速)和IAA(内存分析加速)技术,正好成了今天打开Agentic AI普及大门的两把‘金钥匙’。”

英特尔中国区技术部总经理高宇进一步解释了这两项技术:“QAT可以在KV Cache存入SSD前进行硬件级压缩,压缩比至少达到50%,直接砍掉一半的闪存开销;而IAA则对内存数据进行实时硬件级压缩与解压,在不增加加载延迟的前提下,大幅节省宝贵的内存资源。”

这一技术红利已在头部云厂商中落地。阿里云智能集团块存储研发总监谷跃胜分享道:“在协同优化后,我们使用新的QAT引擎替换了过往的软件压缩,压缩带宽提升了400%,同时减少了75%的通用CPU核数占用。”新华三也顺势推出了AI原生存储X20000,通过自研X Cache推理加速软件,将Token生产效率最高提升了10倍。

商业模式走向“Agent as a Service”

当底层算力被重构,云厂商向客户交付AI能力的方式也在发生根本性改变。

周驰提到,腾讯云正在践行的全新商业模式:“未来客户不需要关心需要多大的内存、多少核的CPU。我们推出了to B的ClawPro和to C的LightVela,对企业而言,员工可以一键认领一个Agent;对个人而言,就是领养一只‘虾’。我们屏蔽了底层虚拟机的概念,提供的是包含安全、审计、系统打通在内的完整智能体运行环境。”

这种“Agent as a Service”的模式,对数据安全提出了极高要求。火山引擎AICC产品研发负责人张尧指出,大模型向云端演进是必然趋势,但隐私数据上云面临合规挑战。为此,火山引擎依托英特尔至强处理器的TDX(可信域扩展)机密计算技术,构筑了公有云AI安全底座。“TDX在CPU层面创建受保护的信任域,确保模型权重与用户敏感数据在推理过程中免受窃取,真正实现数据‘可用而不可见’。”

从288核的至强6+能效核处理器,到Crescent Island数据中心GPU,再到E835以太网控制器,英特尔在发布会上展示的不仅是单一芯片的升级,而是涵盖“算力、存力、连接力、保障力”的系统级重塑。

“如果把AI数据中心当作未来世界的超级工厂,它的产出是Token,驱动GPU集群、CPU集群和高性能存储集群这三台机器的,都可以是英特尔至强处理器。”高宇说道。

相关内容

热门资讯

日菲划界,中国反手画了一个圈 近日,菲律宾总统小马科斯访日期间,日菲双方不仅同意启动《军事情报保护协定》谈判、进一步强化安全合作,...
基于物联网的地埋式智能一体化提... 随着我国海绵城市建设和黑臭水体治理的深入推进,城市水务基础设施正面临从“规模扩张”向“提质增效”的转...
Cladue深夜炸场!史上最强... 北京时间 6 月 10 日凌晨,Anthropic 在没有任何预热的情况下,放出了旗下最强大模型 C...
心智观察所 | 药明康德出手:... 【文/观察者网 心智观察所】 2026年6月9日一早,药明康德发布了一份措辞强硬的公告。 就在前...
鸡蛋价格大涨,10年同期最高 “什么,鸡蛋价格又涨了?”老田在地铁里刷到这条新闻后,几乎下意识地打开手机里的生鲜APP,快速滑到“...
女警私盖公章赊购烟茶酒,诈骗1... 6月10日,安徽定远县调查组发布通报:近日,有媒体报道我县闫某艳诈骗案,引发关注。对于个别民警违法犯...
两部门:推动人形机器人与具身智... 工业和信息化部、国务院国资委近日正式启动2026年度人形机器人与具身智能实景实训专项行动,推动人形机...
智能眼镜成偷拍“神器”?用算法... 来源:中青评论 让先进的智能技术服务于人,而不是成为伤害他人权利的“武器”。 6月8日,乐奇Roki...
女子2万多的金手镯被朋友买了个... 近日,浙江嘉兴平湖的李女士报警,她说自己戴了好几年的黄金手镯,被小姐妹调包了。李女士给民警出示了购买...
男子称排队7年等到公租房,办好... 深圳市民陈先生向记者爆料,自己排队近七年才等到公租房名额,办好入住手续后,才得知这套房源里此前有独居...