华为数据存储、中科弘云发布AI推理加速联合解决方案
创始人
2025-12-23 19:42:18
0

IT之家 12 月 23 日消息,华为数据存储与中科弘云今日发布了 AI 推理加速联合解决方案

该方案以华为 OceanStor A 系列存储为数据底座,结合中科弘云智算互联网云服务平台 HyperCN 平台,优化长序列推理体验。

该方案深度融合华为 OceanStor A 系列存储、华为 UCM 推理记忆数据管理技术以及中科弘云 HyperCN 平台能力,通过 KV Cache 多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程 AI 工具链,将智能算力输送至业务一线。该联合方案的核心优势如下:

  • 异构管理:支持平台、计算与存储的协同联动,适配英伟达、华为昇腾、寒武纪等多元 AI 算力,兼容 MindSpore / vLLM/SGLang 等主流框架,并通过 Kubernetes 与华为 OceanStor A 系列存储实现无缝对接。
  • 算力调度:对算力资源进行细粒度切分与池化处理,按需灵活调度,实现资源利用率最大化;具备集群作业调度、运维监控、故障恢复等功能,支持分钟级任务恢复与系统健康监测。
  • 推理加速:依托华为 UCM 技术,将 KV Cache 持久化至华为 OceanStor A 系列存储,实现推理记忆全量保存,减少重复计算;此外,融合 Prefix Cache、GSA 稀疏加速等算法,显著降低首 Token 时延(TTFT),使长序列推理吞吐与体验实现倍数级提升。
  • 端到端 AI 工具链:覆盖数据管理标注、算法开发、大小模型训练推理、智能体开发等全流程,支持传统机器学习与深度学习开发,实现 AI 资产的统一建设与集中管理。

经实测,在智能问答的典型推理场景中,该方案实现首 Token 时延(TTFT)降低 57.5%,且序列长度越长,优化效果越显著;在长文档推理场景中,结合 GSA 稀疏加速算法,当序列长度为 39K 时,并发能力提升 86%,推理吞吐提升 36%,提升推理效率与体验。

IT之家从合作公告获悉,该联合方案目前已在能源电力、智能制造、国家实验室等关键行业启动试点应用。

相关内容

热门资讯

这个世界太荒唐,尤其是最近这几... 这个世界太荒唐,尤其是最近这几天。感觉霍尔木兹海峡,现在像装了拉链一样。一会拉开,一会又拉上,开合的...
“领福利”弹窗竟是境外间谍在搜... “观看广告领取福利”“观看广告解锁免费时长”……这些弹窗广告在网络场景中十分常见。然而,国家安全机关...
严重升级!“欧洲小妹”连续狠怼... 特朗普与意大利总理梅洛尼的“口水战争”北京时间周六严重升级,被梅洛尼回怼激怒的特朗普发帖再度贬损梅洛...
中科晶禾申请晶圆对准装置专利,... 国家知识产权局信息显示,天津中科晶禾电子科技有限责任公司申请一项名为“一种晶圆对准装置及其对准方法、...
iQOO Z11x购买性价比高... 一台"把预算花在你真正用得到的地方"的千元机,往往比什么都想要却什么都一般的机器更值。 一、千元档购...
原创 S... 美银策略团队援引全球资金流向监测机构 EPFR 最新周度数据发布市场报告,截至 6 月 17 日当周...
高管确认三星S27首发Exyn... 快科技6月20日消息,三星计划在明年上半年正式发布年度旗舰Galaxy S27系列,该系列将全球首发...
伊朗谈判代表团已抵达瑞士,专机... 当地时间6月20日晚,伊朗谈判代表团抵达瑞士苏黎世,准备与美国在比尔根山进行会谈。据伊朗媒体报道,代...
美财长被曝曾对泽连斯基爆粗口,... 由《纽约时报》记者玛吉·哈伯曼和乔纳森·斯旺撰写的《政权更迭》一书爆料,美国财政部长贝森特曾建议特朗...
美国芝加哥发生枪击事件,至少1... △芝加哥市19日晚发生枪击事件的现场据当地警方20日发布的消息,美国芝加哥市19日晚发生一起枪击事件...