来源:市场资讯
(来源:环球网资讯)
来源:环球网
【环球网科技报道 记者 林梦雪】当大模型从“被动回答”进化为能够自主规划、调用工具并执行多步任务的“智能体(Agent)”,AI数据中心的底层架构正在经历一场震荡。
面对活跃智能体数量超200%的激增预期,以及随之而来的“内存与闪存焦虑”,数据中心该如何重构?未来的AI算力又将如何交付?近日,在英特尔至强6+新品发布会暨数据中心创新日期间,多位与会者谈到,在Agentic AI时代,CPU不再是GPU的“配角”,而是重新回到了智算中心的C位。
算力结构之变:从“GPU独奏”到“CPU指挥的交响乐”
过去两年,AI数据中心的绝对主角是GPU。但在Agentic AI时代,这一局面正在被颠覆。
“前沿AI模型的训练就像是一场GPU独奏协奏曲,但随着智能体AI的兴起,我们需要整个计算平台协同作战。这是一场涵盖多种工作负载的真正‘交响乐’。”英特尔公司全球副总裁兼首席市场营销官Brett Hannath在开场致辞中打了个比方,“CPU的角色,就是这场交响乐团的指挥。”
这种“指挥”作用的凸显,源于智能体工作负载的本质变化。金山云计算研发负责人杨峰提出:“在Agent架构中,CPU实际上变成了指挥者和大脑。它要思考任务怎么编排、知识库怎么检索、工具怎么调用。这些Agent运行的任务,实际上是所有GPU请求的驾驭者。”
算力配比数据也发生了反转。英特尔市场营销集团副总裁、中国区总经理郭威透露,目前数据中心内CPU与GPU的比例已经从去年的1:8、1:4,回升到了1:2,未来甚至可能达到1:1。
但这并非简单的单机硬件堆叠。腾讯云计算产品运营总监周驰说道:“不要把它看作是单台服务器内部的比例,应该从全球的业务量去比。”周驰指出,当前AI应用出现了强烈的“破圈”现象,从开发者延伸到了律师、农民甚至10岁的小朋友。“这种破圈导致大量原本ROI不合算的日常琐碎业务被自动化。这些海量、高并发的小脚本不需要很多GPU,但极度依赖CPU的调度能力。从全球装机量来看,CPU的需求正迎来爆发式增长。”
破解“存储焦虑”:QAT与IAA成为普及智能体的“金钥匙”
智能体在运行中需要维持长周期的上下文记忆,这直接导致了KV Cache(键值缓存)容量的指数级爆发。
“以100万Token上下文为例,1个用户的KV Cache就需要近10GB,且随用户数线性增长。”新华三集团存储产品线首席产品经理王其勇指出,KV Cache正在驱动存储行业迎来新范式,对高端SSD和内存的需求呈现出“奇货可居”的状态。
面对昂贵的闪存和内存,如何降低Token的生产成本?英特尔数据中心集团副总裁兼中国区总经理陈葆立给出了破局思路:“机会是留给有准备的人的。我们多年前布局的QAT(压缩加速)和IAA(内存分析加速)技术,正好成了今天打开Agentic AI普及大门的两把‘金钥匙’。”
英特尔中国区技术部总经理高宇进一步解释了这两项技术:“QAT可以在KV Cache存入SSD前进行硬件级压缩,压缩比至少达到50%,直接砍掉一半的闪存开销;而IAA则对内存数据进行实时硬件级压缩与解压,在不增加加载延迟的前提下,大幅节省宝贵的内存资源。”
这一技术红利已在头部云厂商中落地。阿里云智能集团块存储研发总监谷跃胜分享道:“在协同优化后,我们使用新的QAT引擎替换了过往的软件压缩,压缩带宽提升了400%,同时减少了75%的通用CPU核数占用。”新华三也顺势推出了AI原生存储X20000,通过自研X Cache推理加速软件,将Token生产效率最高提升了10倍。
商业模式走向“Agent as a Service”
当底层算力被重构,云厂商向客户交付AI能力的方式也在发生根本性改变。
周驰提到,腾讯云正在践行的全新商业模式:“未来客户不需要关心需要多大的内存、多少核的CPU。我们推出了to B的ClawPro和to C的LightVela,对企业而言,员工可以一键认领一个Agent;对个人而言,就是领养一只‘虾’。我们屏蔽了底层虚拟机的概念,提供的是包含安全、审计、系统打通在内的完整智能体运行环境。”
这种“Agent as a Service”的模式,对数据安全提出了极高要求。火山引擎AICC产品研发负责人张尧指出,大模型向云端演进是必然趋势,但隐私数据上云面临合规挑战。为此,火山引擎依托英特尔至强处理器的TDX(可信域扩展)机密计算技术,构筑了公有云AI安全底座。“TDX在CPU层面创建受保护的信任域,确保模型权重与用户敏感数据在推理过程中免受窃取,真正实现数据‘可用而不可见’。”
从288核的至强6+能效核处理器,到Crescent Island数据中心GPU,再到E835以太网控制器,英特尔在发布会上展示的不仅是单一芯片的升级,而是涵盖“算力、存力、连接力、保障力”的系统级重塑。
“如果把AI数据中心当作未来世界的超级工厂,它的产出是Token,驱动GPU集群、CPU集群和高性能存储集群这三台机器的,都可以是英特尔至强处理器。”高宇说道。
上一篇:普瑞得电子取得电镀金属覆膜放卷装置专利,实现覆膜作业连续生产
下一篇:李在明,惨赢