专题报道 | 存力革命新引擎:AI与云时代的存储芯片技术创新
创始人
2025-08-29 13:41:47
0

AI与云时代下,存储芯片亟待走出一条革新之路。

当云计算步入“算力-存力-运力”协同共生的关键阶段,当PB级数据洪流与AI大模型万亿级参数训练和每秒上万token推理需求相叠加,存力已经从计算的“支撑底座”跃升为“创新引擎”。作为先进存力核心载体的存储芯片,其技术突破将有力促进云服务的质量和效益,也影响着AI训练和推理的效率和成本。这对传统存储技术体系提出多重挑战,存力发展新航道有待开辟。

日前,聚焦“算网一体化中的存力挑战”,工信智媒体(通信世界)以 “存力革命新引擎:AI与云时代的存储芯片技术创新”为讨论主题,邀请信通院、运营商、忆恒创源以及平头哥半导体等行业专家进行座谈,深入分析AI与云时代下存力发展的重重困境,探索存储芯片技术的创新曙光,以及存算网生态协同带来的无限机遇。

01

AI与云时代:

存力供需的大变局

当前,随着AI与云规模化扩张,高频实时场景逐渐深化,存力需满足的核心性能指标也呈现“三高一动态”特征

  • 高IOPS支撑多租户并发访问

  • 高带宽适配大数据传输

  • 高可靠保障核心业务连续性

  • 动态扩展能力匹配云资源按需分配特性

这使得传统存储技术体系“应接不暇”,供需失衡成为制约算力效率释放的关键瓶颈。

从技术侧来看,中国信通院云大所数据中心部工程师高伟绚介绍,因为传统架构里,存储和计算是分离的,很多时候算力受存储 I/O 瓶颈制约,导致算力利用率下降。AI时代存力需匹配算力的低时延、高带宽、高并发等需求,产业正在进行近存计算等技术探索,推动存算协同优化。

联通数字科技有限公司智算运维服务总监刘宏伟看来,存力在供给侧可能更关注存储产品的技术指标和性能提升,而需求侧更关注实际业务场景中的应用效果和成本效益。他指出,当前的主要瓶颈包括性价比不足,如海量数据带来的容量成本和高并发读写要求;数据传输瓶颈,如存算分离架构下数据搬运延迟高;元数据管理瓶颈,海量数据下元数据处理效率影响整体性能;异构架构协同瓶颈,不同类型的计算和存储设备之间的兼容性和协同效率有待提高。

不同场景的存力诉求差异显著且日益精细化。不同计算对存储的需求不同,但总体来看就是计算的发展速度要比存储的发展速度快,所以需要通过各种方式不断‘压榨’存储性能。”中国移动数智化部高级项目总监高从文指出。“例如,目前的热点技术GPU直通技术,就是绕过CPU直接访问各类存储设备,以提升带宽和延迟性能。我们也在ODCC存储特设组开展了相关研究。”

02

SSD进阶:

跨越目标与现实的鸿沟

在AI与云时代的存力需求变局中,政策层面的量化目标为产业发展锚定了清晰方向。

工信部等六部门联合印发的《算力基础设施高质量发展行动计划》明确,到2025年,先进存储容量占比达到30%以上。而SSD作为先进存力的核心载体,无疑是实现这一目标的关键抓手。但SSD如何从“替代机械硬盘”走向“定义先进存力标准”仍存在多重鸿沟。

从技术路径看,“全闪替代HDD”已成为行业共识,但成本控制与性能释放的平衡是核心难点。中国移动云存储首席架构师周宇提出,应该让存储主动去贴合计算,在性能优化方面,可以考虑用先进SSDFTPDNS等存储方式;聚焦成本与效能平衡,可以探索用相对低成本的QLC做冷数据存储,替代HDD不仅如此,还可通过自研SPU芯片管理更多SSD,打造高密服务器,在推进国产化的同时降低全闪存储成本、提升效能。

对此,天翼云基础硬件总监庞玮认为,先进存力从应用角度来看,更希望它能够帮助应用以及业务解决一些核心痛点。在不同场景下,不同介质选择也各有侧重,应根据存储分级匹配数据价值与介质特性。例如通算场景用QLC、SSD、消费级颗粒降成本,智算场景用HBM、SCM(非易失性内存)满足高性能需求。

具体到SSD主控芯片在设计研发时应该如何适应先进存力需求,平头哥半导体产品总监周冠锋介绍,SSD具有大量可定制开发的技术点,可以通过芯片和固件方面的技术,一方面可以尽量不增加成本的同时,对可靠性、时延等加以优化,另一方面可以通过软硬结合的架构创新和算法创新,提升NAND的利用率和适用性,从而优化存储成本。“这需要主控、SSD公司、NAND三者共同的努力。”

具体来看,如时延的优化,SSD时延由主控芯片内在时延、NAND固有时延、后台操作时延等多种因素影响。以镇岳510为例,主控芯片内部实现IO命令和数据DMA的全自动化,实现了全路径表项操作的硬件加速,从而大幅降低芯片的内在时延。此外,凭借NAND的suspend/resume和镇岳510的最优电压预测技术,可进一步有效降低NAND固有时延。

正如SSD的进阶离不开产业链协同,忆恒创源产品总监朱磊强调,从SSD厂商的角度来说,多样化的负载,要求我们更加注重产品在多场景下的性能优化,将各方面都做到极致。同时,忆恒创源还与OEM等存储厂商紧密配合,双方产品深度适配,借助存储架构层面、文件系统等层面的进一步优化,充分发挥存储性能,为用户提供更具成本与性能优势的存储方案。

值得一提的是,当前“东数西算”工程作为优化算力布局的国家战略,为存力发展带来新机遇的同时,也提出了跨域存储的严苛要求,成为检验存储芯片适配能力的“试金石”。

与会专家一致认为,“东数西算”不仅带来了跨域时延与数据调度难题,也对存储芯片的适配性提出更高标准。对此,存储芯片一方面需要支持存储设备与国产云服务器高度兼容,保障跨地域部署的稳定性;另一方面需具备灵活的资源调度能力,支持热点数据在东西部节点间流畅实现动态迁移。

03

破解三角平衡:

技术创新与业务精准匹配

应对AI与云时代发展,不同行业对于存储的时延、可靠性、成本这三个关键要素,有着截然不同的优先级考量,如何在这三者之间找到相对平衡,成为一直困扰整个行业的难题。

目前行业比较明确的是,不同行业的场景特性决定了存储需求的差异化优先级。高伟绚认为,金融领域,尤其是金融核心交易/清算确实非常看重时延与可靠性,而金融数据湖也会很关注成本;大规模温冷数据存储场景则优先考虑成本,时延要求相对较低。不存在绝对的“全优”更多是在“时延-可靠性-成本多目标权衡通过利用多种技术追求相对最优。

在算力需求最为集中的运营商领域,“时延-可靠性-成本”的平衡难题就显得更为复杂。运营商既要用全闪架构满足金融、政务等核心用户的低时延、高可靠需求,又需控制成本以支撑个人用户云存储、边缘计算等业务,还需适配“东数西算”、AI训推等新兴场景的动态诉求,对存储技术的场景化适配能力提出极高挑战。

当前,运营商推进全闪数据中心,既是响应AI与云时代存力需求的必然选择,也是自身业务转型与市场竞争的核心战略动作。

具体到运营商在推进全闪存数据中心时,如何平衡“可靠性”与“成本控制”。周宇分享道,可通过分层存储技术架构优化、资源协同调度策略与功能分级设计实现可靠性和成本控制的平衡。具体实现路径上,首先基于场景的分层存储架构,匹配可靠性与成本诉求;其次,借助智能副本与编码技术,在可靠性基础上压缩成本;再次,实施弹性资源池化与动态调度,降低冗余成本并保障服务连续性;最后,进行软硬件协同的绿色节能设计,从全生命周期控制成本。

刘宏伟则认为,对于核心业务,应优先考虑性能,确保高IOPS和低延迟,以满足业务的实时性需求;对于边缘业务,可适当降低性能要求,更关注成本。具体策略方面,SSD类型搭配上,可采用透明压缩TLC,与超越TLC寿命并接近TLC性能的高密度QLC结合,满足不同性能和成本需求;在容量规划优化方面,可根据业务增长趋势,合理规划存储容量,避免过度配置或容量不足。

当产品需求具象化到芯片设计角度,“时延、可靠性、成本”的三角平衡难题也是存储产品设计的核心影响因素。“使用规格更高的硬件,往往意味着增加成本。当然,我们也可以通过一些技术手段,在不增加硬件成本的前提下,对时延、产品可靠性加以优化朱磊讲道。

以忆恒创源PBlaze7 7A40 SSD为例,其使用的平头哥镇岳510主控芯片针对云业务场景优化,基于平头哥自研芯片架构,通过充分利用其高速缓存资源及内建的丰富加速模块,配合数据路径优化、映射表、GC算法优化等手段,有效减少I/O执行过程中的硬件资源调度,大幅缩短读写延迟并提高性能。同时,该SSD还具备智能中断聚合技术,可以有效降低对系统CPU的资源占用,让服务器可以更好地执行调度任务;预读机制的使用,也可以显著提高小压力下的顺序访问性能。

周冠锋补充道,目前全闪存储,包括分布式全闪、集中式全闪,不仅要求在系统架构、文件系统等方面做到高可靠,提供快照、多副本、EC等多种特性,也需要易于部署,易于故障定位以便于上线后的高效运维,这需要底层存储部件的支持。平头哥镇岳510,不仅可以全面支持各型全闪系统的高可靠、高能效、多NAND兼容等诉求,更支持了硬件级别的IO Statistics,可以有力提升全闪系统的故障定位能力。

04

生态协同:

探索存算网一体化新方向

长远来看,存算网一体化的实现,仍需破解协同研发的瓶颈,运营商的存算网协同能力需求有待于和存储生态的深度融合。

中国信通院云大所所长何宝宏认为,随着算网一体、存算一体发展,存储可以借鉴计算领域的“Scrapy”概念,通过网络实现规模化扩展。存力不足时可借助算力与网力补充,网络能力受限可通过存力与算力解决,三者协同是核心发展方向。

存算网一体化在场景落地中,离不开产业链的协同创新。回到存储芯片革新上,行业正通过“联合定制+标准共建”推动存储技术与产业需求深度匹配。

一是由运营商云主导标准制定,通过集采明确存储芯片的云适配标准,指导芯片厂商聚焦行业标准与需求进行场景创新,避免技术与实际需求脱节。

二是芯片厂商与云服务商联合定制,芯片厂商针对云存储场景优化并再与云服务商的存储架构、文件系统深度适配,最终实现“芯片性能-云架构效率”的最大化释放。

对此,刘宏伟提出了可计算存储概念,作为存算协同的理念之一,该理念思考的是如何降低存储系统整体TCO、提升资源利用率方便实现新一代SSD。

周冠锋建议搭建跨领域合作平台,聚合运营商、云服务商等需求,提炼共性功能融入芯片设计,从而发挥规模效应

“综合来看,无论是存算网协同发展,还是存力挑战的破解,从来不是某一家企业、某一项技术的‘独角戏’,而是运营商、芯片厂商、设备厂商、研究机构、行业用户共同搭建的‘生态合唱’。”工信智媒体(通信世界)总编辑刘启诚讲道。

积力之所举,则无不胜;众智之所为,则无不成。可以预见的是,未来的存算网体系,必将超越单一设备的性能堆砌,走向以数据为中心、以场景为导向的系统级创新。将目光投向存力,在这场跨越技术与时代的演进中,没有旁观者,只有同行者。而答案,或许就写在协同创新、开放共赢的道路之上。

相关内容

热门资讯

微信再开放520大额红包 律师... 微信再开放520大额红包 律师提醒  【微信再开放520大额红包 律师提醒】2025年8月29日,农...
周心怀任中石油总经理 2025年8月29日,中国石油天然气集团有限公司召开领导班子(扩大)会议。受中央组织部领导委托,中央...
家人涉嫌腐败丑闻,阿根廷总统米... 阿根廷总统米莱正面临执政以来的最大危机。由于米莱的妹妹、总统府秘书长卡琳娜·米莱上周被曝涉嫌腐败丑闻...
外交部:敦促美方、日方!不得部... 8月29日,外交部发言人郭嘉昆主持例行记者会。有记者提问,据报道,美军计划9月在日本举行联合演习期间...
河南省纪委监委:张家明严重违纪... 经中共河南省委批准,河南省纪委监委对商丘市人大常委会原党组书记、主任张家明严重违纪违法问题进行了立案...
英伟达与农业机器人公司合作,推... 英伟达近期宣布了一项令人瞩目的合作,合作对象为一家专注于农业机器人的创新企业。这家企业的明星产品——...
打造通感类低空经济样板区 本报太原讯 随着低空经济的快速发展,中国移动近年来全方位推进低空经济能力体系建设,在山西打造通感类低...
“外国游客被震醒:原来中国科技... 【文/观察者网 王恺雯】从街头的无人出租车,到无人机外卖、机器人服务员,这些“未来感”十足的场景在中...
李在明访美送一礼物 上面写6个... 李在明访美送一礼物 上面写6个汉字  【李在明访美送一礼物 上面写6个汉字】8月26日,韩国媒体披露...
八方通科技专注AI大模型与元宝... 在数字化转型浪潮中,企业对智能化和精准营销的需求日益增长。深圳市八方通科技开发有限公司凭借其在AI技...