国内首款推理加速存储AS3000G7发布
创始人
2025-07-30 16:21:45
0

人民网成都7月30日电 (赵祖乐)近日,2025(第二届)产融合作大会在四川宜宾举行。会上,浪潮存储营销总监张业兴代表浪潮存储正式发布国内首款推理加速存储AS3000G7。

该产品凭借“以存代算”的技术创新,有效破解KV Cache重复计算带来的算力和时延损耗难题,为大模型推理场景提供突破性解决方案,加速推动大模型在金融、科研等领域的规模化落地。

作为国内首款推理加速存储产品,AS3000G7有四大核心优势,具体如下:

降低响应延迟。将历史Token缓存至AS3000G7存储层,下轮对话从NVMe SSD硬盘中拉取历史token的KV Cache,减少GPU重复计算带来的资源消耗,TTFT降低90%。

承载更多并发。TTFT在400ms以内的前提下,系统可支持的吞吐量(Token/s)可达原方案5倍,单位GPU资源可承载更多推理请求。

降低GPU功耗。TTFT的降低与并发的提升,单Token平均功耗下降60%,在承载同等规模token负载时,GPU服务器整机功耗降低。

生态兼容适配。广泛兼容国产与海外芯片的异构算力平台,深度适配vLLM框架下的deepseek等主流大模型,优化推理体验。

随着大模型推理需求的持续攀升,AS3000G7的推出恰逢其时。其通过“以存代算”的技术创新突破KV Cache重计算瓶颈,为AI规模化应用筑牢存储根基。未来,随着多模态与实时交互场景的普及以及存储与计算的协同优化,KV Cache“以存代算”将成为降本增效的核心竞争力,为智能时代的推理存储构建新基准。

相关内容

热门资讯

少林寺新住持履职第二日:部分收... 少林寺新住持履职第二日,引发广泛关注。令人欣喜的是,部分收费项目悄然消失。曾让游客略有微词的一些不合...
“创客中国”郑州十强出炉!新能... 7月30日,第十届“创客中国”郑州分赛“十强” 诞生。今日黄河迎宾馆内,在300余名业界代表的见证下...
AI投资转向垂类融合 细分赛道... 来源:证券时报 证券时报记者 李明珠 近年来,人工智能(AI)已成为创投机构竞相布局的核心赛道。进入...
“竹节草”滞留陆地到8月2日?... 复活的“竹节草”是个慢性子。登陆后,它移动缓慢,水量充沛,“洒水”时间长,给上海带来的风雨影响可能更...
许昌发展乡村富民产业:探索“胖... 【大河财立方消息】 7月31日消息,许昌市人民政府办公室日前印发《许昌市乡村富民产业发展行动方案(2...
央行开展2832亿元7天期逆回... 【大河财立方消息】 7月31日,中国人民银行以固定利率、数量招标方式开展了2832亿元逆回购操作。投...
台风“竹节草”擦边河南!周口高... 万众瞩目的台风 “竹节草”,终究还是和河南打了个擦边球。昨天( 7月30日),当它在上海二次登陆,为...
台风“竹节草”来袭,浙江移动全... 潮新闻客户端 记者 柳蓬 台风“竹节草”裹挟着狂风暴雨直扑浙江沿海。浙江移动提前响应、闻“汛”而动,...
炮轰黄仁勋,决裂奥特曼!170... 新智元报道 编辑:英智 【新智元导读】一场家庭变故,塑造了这位硅谷顶级CEO。一项晚了四年的医学突...