中国电信商用智算超节点推理性能实现新突破
创始人
2025-08-19 08:21:07
0

来源:人民邮电报

随着人工智能业界大模型从稠密架构向以DeepSeek为代表的多专家混合模型(MoE)架构演进,基于高端智算能力的云上推理成为当前技术演进的趋势和必然需求,高效率推理性能成为智算资源提供领先者的核心竞争力。

近日,中国电信广东公司联合中国电信研究院、华为,基于中国电信粤港澳大湾区(韶关)算力集群,上线全球首个商用昇腾超节点智算集群,采用中国电信研究院自研“翼芯”智算测试与适配优化平台,针对多种推理场景开展了大模型性能优化及测试。通过对主流模型与超节点系统迭代适配调优,不同场景下的推理性能均实现了大幅提升;其中DeepSeek 671B满血版模型达到单卡推理吞吐性能2122Tokens/s,刷新了业界纪录。

昇腾超节点系统创新应用全总线架构,采用高速互联技术,将384张910C智算卡紧密耦合,形成大型算力单元。该架构在大幅降低模型并行通信时延的同时,还需要解决好资源调度与并行策略设置复杂性变高的问题;需要针对不同业务场景的资源和并发策略进行灵活设置,才能最大程度发挥算力单元整体性能,将算力单元与大模型的亲和度提升至最佳。

本次中国电信和华为合作,完成翼芯测试平台与昇腾384卡超节点对接优化,针对13项基准性能、6类典型场景推理性能,采用5类典型资源配置开展自动化测试;同时尝试采用算子融合替换、PD分离调度、KV cache优化、集合通信优化、并行策略优化等多维度的调优策略,不断将吞吐性能提升到最大。经充分优化后,DeepSeek 671B模型在多种场景下的单卡吞吐性能较优化前提升2.5~4.3倍;在保证TTFT为1.28s、TPOT为50ms的服务质量指标下,单卡吞吐性能达到2122Tokens/s,较业界前期测试最佳性能提升9.2%。

本次超节点优化和性能指标刷新,展示了中国电信对智算系统整体优化核心技术的深刻理解与实践创新能力。超节点可以根据客户实际需要,灵活配置智算资源池资源,更高效地服务于复杂推理、多智能体协同等新业务场景。

下一阶段,中国电信将开展更多场景的超节点形态优化研究和验证测试,持续推动国产智算基础设施建设和技术创新,全面助力人工智能产业高质量发展。 (陈新豪 师春雨)

相关内容

热门资讯

月嫂喂奶致新生儿窒息,抢救20... 封面新闻记者 石伟“孩子出生第二天,就被医院介绍的月嫂喂奶导致窒息。医院说已经没有必要抢救了。”9月...
乌军证实:一架苏-27战机坠毁... 【环球网报道】乌克兰媒体11日报道称,乌军一架苏-27战机坠毁,飞行员死亡。据乌克兰《基辅邮报》等媒...
财政部:“十四五”时期财政民生... 今天下午,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会。发布会上,财政部部长蓝...
财政部:过去4年我国对世界经济... 今天(12日)下午,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会。财政部部长蓝...
河南高院通报5起危害食品安全犯... 2025年全国食品安全宣传周以“尚德守法 共享食安”为主题,于9月11日启动。9月12日,大河报·豫...
光伏电站监测系统有什么作用?实... 来源:云境天合科技 【TH-BGF11S,山东云境天合气象环境监测仪器设备厂,品质保障】并网光伏发电...
蓝佛安:今年新增减税降费及退税... 【大河财立方消息】 9月12日,国务院新闻办公室举行“高质量完成‘十四五’规...
“无人机风波”下俄白联合军演启... 据凤凰卫视报道,波兰总理图斯克9月9日宣布,因俄罗斯与白俄罗斯本月12日起在白俄罗斯举行联合军演,波...
美媒爆料:哈里斯说这话,拜登圈... 美国前副总统哈里斯在她即将出版的新书中打破以往对前总统拜登的忠诚态度,称拜登2024年决定寻求连任是...
世界第二网红来了天津也得摊煎饼... 世界第二网红来了天津也得摊煎饼  【世界第二网红来了天津也得摊煎饼】近日,天津街头迎来一位特殊客人—...