黄仁勋将揭晓“世界前所未见”新芯片
创始人
2026-03-11 22:03:18
0

来源:21世纪经济报道

3月中旬将在加州圣何塞召开的NVIDIA的GTC大会,是AI领域最受瞩目的盛会之一。此前黄仁勋宣布,将推出一款“世界前所未见”的全新芯片。

此言一出,资本市场热议纷起。目前比较主流的判断是,此次计划于GTC发布的芯片,最有可能的形态是融入Groq LPU(语言处理单元)设计的全新推理产品。

之所以不太可能是“加速插件”,云岫资本AI/智能制造组董事庄昌磊对记者分析称,“如果作为现有GPU的插件,其数据传输仍然要经过PCIe或NVLink等外部接口,这本身就会引入新的延迟,部分抵消SRAM的低延迟优势。”

其进一步补充,“更理想的方案是像Cerebras那样,打造一个专为推理设计的、以SRAM为中心的全新计算架构。”

推理时代来临

随着“小龙虾”(OpenClaw)为代表的新一代Agent应用爆火,全球算力需求结构正发生明显变化,市场重心也从训练转向推理。

据德勤《2026科技、传媒和电信行业预测》,到2026年,“推理”(即运行AI模型)将占据全部AI计算能力的三分之二。而且,未来将出现价值数十亿美元的推理专用优化芯片,会部署在数据中心和企业服务器中,且部分芯片的功耗将与通用AI芯片相当甚至更高。

近日,记者获悉,对于此次大会,业界推测最大的亮点,除了预计英伟达将正式揭晓Rubin及下一代Feynman架构GPU的核心技术细节外,还认为其极有可能会推出整合了LPU技术的全新推理芯片。

作为整合了Groq团队LPU技术的全新推理芯片系统,这或将是英伟达首次在核心AI算力产品线中大规模引入外部架构。

中信证券称,此前NVIDIA推出Rubin CPX针对Prefill降本需求,在对Groq收购后,本次或将推出LPU或“类LPU”芯片来实现Decode提效。

在推理过程中,模型一般要需经历两阶段。首先,在pre-fill阶段处理用户输入;其次,在decode阶段,逐Token生成输出结果。

实际影响用户推理体验的关键,在于decode阶段的生成速度与延迟。在基于GPU的推理架构中,由于大量模型参数存放于HBM中,计算核心与HBM之间需要进行频繁数据搬运,会影响模型decode阶段的时效性。

而Groq LPU是专为推理加速设计,采用离计算核心更近的存储单元SRAM来存储模型参数,比如230MB片上SRAM可提供高达80TB/s的内存带宽,数据处理速度远超GPU架构。

不过,从物理设计看,用SRAM完全替代HBM并不可行。

庄昌磊解释,面对当前动辄千亿、万亿参数的大模型,纯SRAM方案在容量上完全无法胜任。那么,英伟达可能如何创新?

答案很可能不是“替代”,而是“堆叠”。庄昌磊表示,“根据产业消息,英伟达可能采用类似AMD 3D V-Cache的技术,通过台积电的SoIC(集成芯片系统)混合键合技术,将专为推理加速设计的、包含大量SRAM的LPU单元(语言处理单元),直接3D堆叠在GPU核心晶圆上。”

供应链或生变

对于3D堆叠方案,AMD等头部厂商已有布局。2021年AMD公布3D垂直缓存(3D V-Cache)技术,可将额外的7nm SRAM缓存垂直堆叠在Ryzen计算小芯片的顶部,大幅增加L3缓存数量。2024年7月,富士通介绍旗下MONAKA处理器采用3D SRAM技术,计划2027年出货。

这一方案会否走向主流?

“片上SRAM存在工艺缩放比逻辑电路慢等问题,导致在单枚芯片上SRAM占用的面积较大、成本提升。基于此,部分投资者认为SRAM架构难以成为AI芯片内存的主要方案。”东方证券则认为,SRAM 3D堆叠方案可通过垂直堆叠存储单元的方法来提升密度以规避传统SRAM容量受面积密度限制的问题,若AI推理中需要实现更高容量的SRAM,3D堆叠方案有望拓展应用。

中信证券也认为,未来的GPU与NPU都有可能采用3D堆叠SRAM的方式,实现访存带宽的飞跃,吸收LPU的优势,同时保持原有的软件生态无需变动,保留GPU和NPU的原有优势。

庄昌磊指出,复杂的AI芯片可能同时需要两者:先用SoIC堆叠LPU和GPU核心,再把这个堆叠好的立方体通过CoWoS与HBM封装在一起。对于一些特定的、不需要HBM容量的纯推理芯片,确实可以完全依靠3D堆叠SRAM来构建,从而绕开CoWoS,“但这部分芯片面向的是细分市场,量级难以撼动HBM+CoWoS的主流地位。”

而SRAM 3D堆叠(如台积电SoIC)需要在晶圆制造阶段就进行精确的晶圆对晶圆键合,技术和工艺与前端制造深度耦合。这会进一步将价值从后道封装前移。

一方面,先进制程的价值被进一步放大。庄昌磊指出,为了在垂直堆叠中获得最高的互联密度和能效,最底层的计算晶圆必须采用最先进的工艺(如A16),这加剧了行业对尖端工艺的依赖。

“另一方面,如果高端芯片的价值不断向前道制造和与之绑定的先进封装集中,本土封测厂可能面临被‘挤出’高端市场的风险。”庄昌磊认为,这也为本土封测厂带来了差异化竞争机遇,如为不需要最尖端工艺的芯片提供成熟且高性价比的3D堆叠方案,或是在3D堆叠芯片的测试、散热、可靠性分析等后端环节建立新的技术壁垒。

相关内容

热门资讯

不止是科技革命!马斯克预言:2... 2026年初,得州奥斯汀的特斯拉超级工厂里,一排排人形机械臂正不知疲倦地挥舞。就在前不久的一场深度播...
颠覆认知:人类寻找了几十年的,... 我们实际上一直在寻找生活在系外行星上的地球生命。 围绕类日恒星HD 10180运行的行星系统(想象...
新密市原国土资源局党委书记常西... 新密市原国土资源局党委书记常西珍涉嫌严重违纪违法,目前正接受新密市纪委监委纪律审查和监察调查。
内存暴涨,华强北姐弟半年猛赚4... 华强北走出的千亿帝国。 文 | 华商韬略 大南 2025年,金价上涨65%,铜价上涨42%,白银上涨...
阿里:电商再沦陷,AI 才是大... 外卖和 AI 两条战线上双线出击的$阿里巴巴(BABA.US),今晚(3.19)美股盘前发布了 26...
能源战争一触即发,内塔尼亚胡打... 据凤凰卫视报道,伊朗新年“诺鲁兹节”临近,该国安全局势却日趋紧张。短短24小时内,伊朗三名高官接连遇...
力保“背骨仔”初选?郑丽文澄清... 海峡导报综合报道 国民党前发言人萧敬严日前宣布投入新北市议员选举,但被质疑“大罢免”期间不但没有出力...
伊朗伊斯兰革命卫队发言人遇袭身... 总台记者当地时间3月20日获悉,伊朗伊斯兰革命卫队发言人遇袭身亡。(总台记者 李健南 王政)
河南人请注意!即日起碰一下消费... 为进一步激发消费市场活力,推动支付便利化与智慧消费场景深度融合,3月20日至29日,支付宝“疯狂碰友...
信阳农林学院原党委书记李水,被... 经中共河南省委批准,河南省纪委监委对信阳农林学院原党委书记李水严重违纪违法问题进行了立案审查调查。经...