甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心
创始人
2025-10-20 21:41:04
0

新智元报道

编辑:艾伦

【新智元导读】甲骨文于上周发布全球最大云端AI超级计算机「OCI Zettascale10」,由80万块NVIDIA GPU组成,峰值算力高达16 ZettaFLOPS,成为OpenAI「星际之门」集群的算力核心。其独创Acceleron RoCE网络实现GPU间高效互联,显著提升性能与能效。该系统象征甲骨文在AI基础设施竞争中的强势布局。

甲骨文在2025年AI World大会上发布OCI Zettascale10超级集群。

在拉斯维加斯举办的AI World 2025大会上,甲骨文高调推出了一台号称全球最大规模的云端AI超级计算机——OCI Zettascale10。

这个庞然大物横跨多个数据中心,由多达80万块NVIDIA GPU芯片构成,峰值计算性能被宣称可达惊人的16 ZettaFLOPS(即每秒1021次以上浮点运算)。

如此天文数字意味着平均每块GPU可贡献约20 PetaFLOPS算力,接近英伟达最新一代Grace Hopper(Blackwell架构GB300)芯片的水平。

甲骨文此举无疑是在急速升温的AI算力军备竞赛中放出「大招」,试图在云端AI基础设施版图上占据一席之地。

OpenAI巨型集群的动力之源

这套Zettascale10系统已经成为OpenAI庞大算力需求的幕后功臣。

据悉,甲骨文与OpenAI在德州阿比林(Abilene)共建了「星际之门」旗舰AI超级计算集群,而OCI Zettascale10正是其算力骨干。

OpenAI基础设施部门副总裁Peter Hoeschele表示,甲骨文定制的RoCE高速网络架构在「千兆瓦级」规模下最大化了整体性能,同时将大部分能耗都用在了计算上。

换言之,甲骨文研发的这套RDMA over Converged Ethernet网络(代号Acceleron)将海量GPU紧密连接成一个整体,使得OpenAI的大模型训练能够在如此庞大的芯片阵列上高效运转。

正因有了与OpenAI的深度合作背书,Zettascale10一亮相便自带「实战」光环,它已经在为当今业界最严苛的一些AI工作负载提供动力。

Acceleron网络架构揭秘

如此规模的GPU「巨阵」要高效运转,奥秘就在于甲骨文独创的Acceleron RoCE网络架构。

简单来说,Acceleron让每块GPU的网络接口卡(NIC)都充当一个小型交换机,一次可连接到多个隔离的网络交换平面。

这种多平面、扁平化的网络设计大幅降低了GPU之间的通信延迟,并确保即使某一路由出现故障时,训练作业也能自动切换到其它路径继续运行,不至于被迫中断。

相比传统三级交换结构,Acceleron减少了网络层级,使GPU对GPU的直连延迟更加一致,整体性能更具可预测性。

此外,该架构引入了线性可插拔光学模块(LPO)和线性接收光学组件(LRO)等新技术,在不降低400G/800G带宽的前提下削减了网络的能耗与冷却成本。

甲骨文称这种创新网络既提高了效率又降低了成本,让客户可以用更少的电力完成同样的AI训练任务;

NVIDIA公司高管Ian Buck也认可道,正是这种全栈优化的「计算结构」(compute fabric)提供了将AI从实验推进到工业化所需的基础。

峰值神话与现实考验

甲骨文计划在2026年下半年正式向客户提供Zettascale10集群服务,目前这一系统已开始接受预订。

然而,对于16 ZFLOPS的惊人算力,不少业内观察者持保留态度。

该数据尚未经独立机构验证,而且很可能是基于理论峰值算力而非持续实效得出。

据业内报道,甲骨文宣称的16 ZFLOPS有可能利用了极低精度的AI计算指标(例如FP8甚至4比特稀疏运算)来实现。

实际的大模型训练通常需要使用更高精度(如BF16或FP8)的数值格式以保证模型收敛效果,因此16 ZFLOPS这个数字更多体现了甲骨文硬件在理想情况下的上限潜力,而非日常工作负载下可持续交付的性能。

这台「云端巨无霸」真正的实战表现还有待时间检验,只有等到系统明年投入使用,各种基准测试与用户实际反馈才能揭晓它能否如宣称般高效且可靠。

云端AI竞赛的挑战与展望

甲骨文并非孤军奋战。

当前,微软、谷歌、亚马逊等云计算巨头也在争相构建各自的大规模AI集群,它们或采购海量GPU,或研发自家AI加速硬件,云端AI算力版图正迅速扩张。

甲骨文此次押下重注推出Zettascale10,一方面巩固了与OpenAI的战略联盟,另一方面也是向业界宣示其在AI时代不容忽视的新实力。

然而在市场前景上,甲骨文依然面临如何吸引客户的问题。

为此,该公司还发布了新的「多云通用积分」计划,允许运营商用统一的预付积分在甲骨文云及AWS、Azure、Google等多家云服务间自由调配甲骨文数据库和OCI服务。

这项举措旨在降低客户迁移门槛、提高平台黏性,为甲骨文云生态争取更大的用户基础。

OCI Zettascale10的出现展示了云服务商为满足AI空前算力需求所做的大胆探索。

等到明年这套系统真正落地,我们才能知道甲骨文能否凭借这一云端「巨无霸」在激烈的AI基础设施竞赛中抢得先机,并兑现其关于高效、规模和可靠性的承诺。

参考资料:

https://www.oracle.com/news/announcement/ai-world-oracle-unveils-next-generation-oci-zettascale10-cluster-for-ai-2025-10-14/

相关内容

热门资讯

无信号通话时代来了!电信联通跨... 近日,通信行业迎来历史性突破——中国电信与中国联通在山东成功打通业界首个跨运营商可溯源 VoWiFi...
美特使对以总理发出警告:勿破坏... △美国中东问题特使威特科夫(资料图)当地时间20日,总台记者获悉,美国中东问题特使威特科夫和库什纳当...
突破物联边界 eSIM技术迈入... 突破物联边界 eSIM技术迈入商用新阶段 杨洁 刘丽靓 中国证券报 2025-10-20 08:1...
原创 2... 家人们,年底了想换台vivo,结果一看X系列、S系列,还有子品牌iQOO,是不是瞬间选择困难症就犯了...
第三届中国—东盟传媒与新闻传播... 10月18日,以“人工智能时代中国—东盟传媒变革与新闻传播教育发展”为主题的第三届“中国—东盟传媒与...
特朗普儿子回应父亲与印尼总统外... 在本月于埃及举行的加沙停火峰会上,美国总统特朗普与印尼总统普拉博沃的私下谈话因麦克风未关被外泄。对话...
原创 中... 美国的旅行者1号简直是太空长跑冠军,1977年9月5日从佛罗里达卡纳维拉尔角发射出去,搭着大力神火箭...
郑丽文:相信“九二共识”、反对... 图源:台媒20日,即将上任的中国国民党新任党主席郑丽文接受广播节目《千秋万事》专访,针对是否考虑未来...
3岁小孩被养成野人,家长却说是... 这是一个人类小孩。但他赤身裸体,蓬头垢面。他似乎不会像人类那样直立行走,总是四肢着地,用狗的姿势在地...
支付宝回应“内斗”传闻 蚂蚁集团于今年6月推出“AI健康管家AQ”应用,旨在整合支付宝账号体系与平台医疗服务资源,构建从AI...