“养龙虾”卡存储?ODCC存储焦点组有解法 | 2026ODCC春季全会
随着人工智能技术从训练迈向推理的规模化落地,数据中心存储面临着前所未有的挑战与重构。4月1日,ODCC存储焦点组召开研讨,汇聚了来自美团、英伟达、华为、三星、大普微、Solidigm、深圳佰维、超擎数智、信通院等业界专家。与会嘉宾围绕“大模型推理下的存储架构演进”这一核心议题,深入探讨了从底层介质寿命挖掘、硬件安全加密到上层KV Cache卸载、存算分离等全栈技术方案,旨在通过技术创新与标准共建,释放硬件资产价值,破解AI推理时代的算力与存储瓶颈。会议由美团服务器架构师胡泽志主持。

新技术与测试组组长:郭亮
【四大核心议题,层层递进引爆存储潜能】
本次会议的讨论聚焦于四个核心方向,从“价值极限挖掘”到“算力边界重构”,再到“硬核底座革新”与“智算质量护航”,共同开启了一场从介质到架构的颠覆性变革。
一、 价值极限挖掘:
打破寿命常规,释放硬件潜能
在可靠性与寿命挖掘方向,专家们挑战了传统的硬件退役标准。
《企业级NandFlash寿命极限测试与再服役边界》

胡泽志
美团-服务器架构师
项目基于8年实测数据,挑战SSD“P/E周期100%即报废”惯例。研究发现寿命消耗达426%的设备仍可正常运行,理论寿命可扩展至标称值230%。报告建议将经济服役边界重划至220%~300% P/E,并建立“绿黄红”三级动态健康评分体系,以释放被过度保守标准浪费的硬件资产价值。
《企业级NandFlash寿命极限测试与再服役边界》

张晨
深圳佰维-存储技术服务部总监
提出企业级SSD测试规范优化方案:一是性能测试分层策略,将周期从10天缩短至12小时;二是双轨评估方式,兼顾spec达标率与实测性能;三是规划3-5年演进路径,涵盖测试优化与标准制定,全面赋能产业高质量发展。
二、 重构算力边界:
KV Cache与存算分离的实战突围
针对AI推理场景,存储正从单纯的容量设备转变为关键资源层。
《AI应用中的SSD可靠性研究》

李军
中国信通院-资深专家
探讨SSD在AI大模型时代从容量设备向关键资源层的转变。重点分析LLM推理中的KV Cache卸载瓶颈及可靠性风险,并提出面向AI负载的选型建议、故障预测与联合治理策略,旨在解决AI应用中存储可靠性的新挑战。
《NVIDIA BlueField3 DPU-powered JBOF with Samsung SSD》

豆坤
三星-高级项目经理
三星与NVIDIA联合推出DPU驱动的JBOF架构,针对大模型推理KV Cache存储瓶颈提供新方案。依托BlueField-3 DPU与三星企业级SSD,通过Seamless FDP技术大幅降低写放大,实现微秒级延迟。目前已完成实验室验证,将面向LLM推理验证,解决传统存储痛点。
《推理一体机AI加速卡研究报告》

张光钰
华为-数据存储介质应用专家
针对AI推理一体机需求爆发及资源紧缺背景,提出兼顾成本、准确率与速度的AI加速卡方案。阐述IO能力、知识检索与记忆凝练等关键技术,并对演进方向进行前瞻分析,呼吁业界协同推进技术深耕与标准制定,以应对边缘智能体发展需求。
《面向推理场景的KV Cache存储方案测试》

段世茹
中国信通院-工程师
主要介绍了聚焦AI推理场景下的KV Cache存储方案的测试情况,基于DeepSeek-R1等大模型,在PD一体与分离架构下,对比原生vLLM与集成YRCache系统的性能表现,覆盖200Gbps至1.6T多种网络配置。结果表明,引入YRCache存储系统后,中端GDDR GPU的综合推理性能显著提升,大幅降低对昂贵算力的依赖,实现推理成本的革命性优化,为高性价比AI推理基础设施提供新路径。
《大规模推理效率革命:PD分离实战与最佳实践》

张浩然
超擎数智-解决方案技术经理
2026年是AI推理的元年,随着大模型应用加速走向产业落地,客户对算力效率、Token吞吐以及部署实施能力提出了更高要求。重点介绍了高性能网络如何赋能PD分离、KV Cache Offload技术,并结合实战经验,分享如何加速客户推理方案落地,降低实施门槛,释放更大业务价值。
三、 硬核底座革新:
异构介质融合与端到端安全
在新型介质与硬件技术领域,安全与性能并重成为共识。
《SLC+QLC双模NVMe SSD》

李根
大普微-解决方案架构师
SLC+QLC 双模 SSD 技术白皮书项目,针对当前 SLC 与 QLC 分离部署的瓶颈,聚焦双模 SSD 结构功能与应用场景,在 QLC SSD内部配置SLC空间,以 NS 分区,实现不同数据分散部署。有效提升负载均衡和性能,减少单个驱动器故障影响、提升带宽与存储空间利用率。项目将完成技术验证、多系统测试并输出规范成果,赋能数据中心存储升级。
《NVMe自加密盘(SED)》

单野林
大普微-研发工程师
NVMe 自加密盘(SED)是一种基于硬件的存储安全解决方案,通过内置的独立加解密引擎实现静态数据的全盘加密。本次立项聚焦SED 密钥体系架构与 TCG Opal 规范,融合国密算法,提出完整的SED的使用和测试方法,降低SED的使用门槛。解决数据泄露高风险问题及软件加密性能瓶颈,推动国产安全存储规模化落地。
《NVMe端到端数据保护(PI)》

邵蔚然
大普微-研发工程师
分享了PI的核心目的是为数据读写全过程提供端到端完整性保护,及时发现“静默错误”,提升企业级存储系统的可靠性与数据安全性。立项通过对PI技术的系统介绍和不同用户模型分析,针对数据库、分布式存储、虚拟化、存储阵列、文件系统等各类场景进行充分测试验证,为企业级存储构建可靠的数据完整性防线。
《基于DPU和solidigm csal的存算分离hdfs解决方案》

高伟
Solidigm-首席存储软件方案架构师
展示基于BlueField-3 DPU与CSAL的存算分离HDFS方案。该方案将RAID与纠删码计算卸载至DPU,实现高吞吐、低时延及显著的CPU卸载效果。相关成果已入选GTC 2026 Poster,CSAL亦荣获FAST 2026 Best Paper,体现其在新一代存储架构中的领先地位。
四、智算质量护航:
AI原生场景的测试范式升级
《面向AI场景的高性能内存测试研究》

李佳媛
中国信通院-工程师
聚焦AI场景下的高性能内存测试,结合智算与存力发展现状,分析高性能内存核心特性,指出现有测试规范与AI需求的适配差距,研究相关技术测试要点,搭建起多场景的高性能内存测试规范体系。
【荣誉时刻:技术创新先锋获表彰】
会议尾声,经现场与会专家的严格评审与投票,美团服务器架构师胡泽志凭借《企业级NandFlash寿命极限测试与再服役边界》的卓越研究项目,荣膺本场“最具人气项目经理(MVP)”称号。
本次ODCC存储焦点组会议不仅是技术观点的碰撞,更是AI推理时代存储新范式的宣言。从打破硬件寿命的思维定式,到攻克KV Cache与存算分离的性能瓶颈,再到构建端到端的安全防线,与会专家共同勾勒了“降本增效”的技术路径。
随着DeepSeek等大模型的广泛应用,存储已从数据的“搬运工”转变为AI推理的“加速器”。未来,业界将通过标准共建与技术创新,持续释放硬件资产价值,推动数据中心从“算力为王”向“存算协同”的高质量发展迈进,为AI推理的规模化落地提供坚实底座。
ODCC存储焦点组联系人
李老师 lijiayuan@caict.ac.cn
ODCC秘书处联系人
刘老师:13488889649 邮箱:liupengyun@caict.ac.cn


