NEWS INFORMATION新闻动态

关注微信公众号

首页  >   新闻动态  >   工作组动态

“养龙虾”卡存储?ODCC存储焦点组有解法 | 2026ODCC春季全会

2026-04-03

随着人工智能技术从训练迈向推理的规模化落地,数据中心存储面临着前所未有的挑战与重构。4月1日,ODCC存储焦点组召开研讨,汇聚了来自美团、英伟达、华为、三星、大普微、Solidigm、深圳佰维、超擎数智、信通院等业界专家。与会嘉宾围绕“大模型推理下的存储架构演进”这一核心议题,深入探讨了从底层介质寿命挖掘、硬件安全加密到上层KV Cache卸载、存算分离等全栈技术方案,旨在通过技术创新与标准共建,释放硬件资产价值,破解AI推理时代的算力与存储瓶颈。会议由美团服务器架构师胡泽志主持。

640.png

新技术与测试组组长:郭亮

【四大核心议题,层层递进引爆存储潜能】

本次会议的讨论聚焦于四个核心方向,从“价值极限挖掘”到“算力边界重构”,再到“硬核底座革新”与“智算质量护航”,共同开启了一场从介质到架构的颠覆性变革。

一、 价值极限挖掘:

打破寿命常规,释放硬件潜能

在可靠性与寿命挖掘方向,专家们挑战了传统的硬件退役标准。

《企业级NandFlash寿命极限测试与再服役边界》

640 (1).png

胡泽志

美团-服务器架构师

项目基于8年实测数据,挑战SSD“P/E周期100%即报废”惯例。研究发现寿命消耗达426%的设备仍可正常运行,理论寿命可扩展至标称值230%。报告建议将经济服役边界重划至220%~300% P/E,并建立“绿黄红”三级动态健康评分体系,以释放被过度保守标准浪费的硬件资产价值。

《企业级NandFlash寿命极限测试与再服役边界》

640 (2).png

张晨

深圳佰维-存储技术服务部总监

提出企业级SSD测试规范优化方案:一是性能测试分层策略,将周期从10天缩短至12小时;二是双轨评估方式,兼顾spec达标率与实测性能;三是规划3-5年演进路径,涵盖测试优化与标准制定,全面赋能产业高质量发展。

二、 重构算力边界:

KV Cache与存算分离的实战突围

针对AI推理场景,存储正从单纯的容量设备转变为关键资源层。

《AI应用中的SSD可靠性研究》

640 (3).png

李军

中国信通院-资深专家

探讨SSD在AI大模型时代从容量设备向关键资源层的转变。重点分析LLM推理中的KV Cache卸载瓶颈及可靠性风险,并提出面向AI负载的选型建议、故障预测与联合治理策略,旨在解决AI应用中存储可靠性的新挑战。

《NVIDIA BlueField3 DPU-powered JBOF with Samsung SSD》

640 (4).png

豆坤

三星-高级项目经理

三星与NVIDIA联合推出DPU驱动的JBOF架构,针对大模型推理KV Cache存储瓶颈提供新方案。依托BlueField-3 DPU与三星企业级SSD,通过Seamless FDP技术大幅降低写放大,实现微秒级延迟。目前已完成实验室验证,将面向LLM推理验证,解决传统存储痛点。

《推理一体机AI加速卡研究报告》

640 (5).png

张光钰

华为-数据存储介质应用专家

针对AI推理一体机需求爆发及资源紧缺背景,提出兼顾成本、准确率与速度的AI加速卡方案。阐述IO能力、知识检索与记忆凝练等关键技术,并对演进方向进行前瞻分析,呼吁业界协同推进技术深耕与标准制定,以应对边缘智能体发展需求。

《面向推理场景的KV Cache存储方案测试》

640 (6).png

段世茹

中国信通院-工程师

主要介绍了聚焦AI推理场景下的KV Cache存储方案的测试情况,基于DeepSeek-R1等大模型,在PD一体与分离架构下,对比原生vLLM与集成YRCache系统的性能表现,覆盖200Gbps至1.6T多种网络配置。结果表明,引入YRCache存储系统后,中端GDDR GPU的综合推理性能显著提升,大幅降低对昂贵算力的依赖,实现推理成本的革命性优化,为高性价比AI推理基础设施提供新路径。

《大规模推理效率革命:PD分离实战与最佳实践》

640 (7).png

张浩然

超擎数智-解决方案技术经理

2026年是AI推理的元年,随着大模型应用加速走向产业落地,客户对算力效率、Token吞吐以及部署实施能力提出了更高要求。重点介绍了高性能网络如何赋能PD分离、KV Cache Offload技术,并结合实战经验,分享如何加速客户推理方案落地,降低实施门槛,释放更大业务价值。

三、 硬核底座革新:

异构介质融合与端到端安全

在新型介质与硬件技术领域,安全与性能并重成为共识。

《SLC+QLC双模NVMe SSD》

640 (8).png

李根

大普微-解决方案架构师

SLC+QLC 双模 SSD 技术白皮书项目,针对当前 SLC 与 QLC 分离部署的瓶颈,聚焦双模 SSD 结构功能与应用场景,在 QLC SSD内部配置SLC空间,以 NS 分区,实现不同数据分散部署。有效提升负载均衡和性能,减少单个驱动器故障影响、提升带宽与存储空间利用率。项目将完成技术验证、多系统测试并输出规范成果,赋能数据中心存储升级。

《NVMe自加密盘(SED)》

640 (9).png

单野林

大普微-研发工程师

NVMe 自加密盘(SED)是一种基于硬件的存储安全解决方案,通过内置的独立加解密引擎实现静态数据的全盘加密。本次立项聚焦SED 密钥体系架构与 TCG Opal 规范,融合国密算法,提出完整的SED的使用和测试方法,降低SED的使用门槛。解决数据泄露高风险问题及软件加密性能瓶颈,推动国产安全存储规模化落地。

《NVMe端到端数据保护(PI)》

640 (10).png

邵蔚然

大普微-研发工程师

分享了PI的核心目的是为数据读写全过程提供端到端完整性保护,及时发现“静默错误”,提升企业级存储系统的可靠性与数据安全性。立项通过对PI技术的系统介绍和不同用户模型分析,针对数据库、分布式存储、虚拟化、存储阵列、文件系统等各类场景进行充分测试验证,为企业级存储构建可靠的数据完整性防线。

《基于DPU和solidigm csal的存算分离hdfs解决方案》

640 (11).png

高伟

Solidigm-首席存储软件方案架构师

展示基于BlueField-3 DPU与CSAL的存算分离HDFS方案。该方案将RAID与纠删码计算卸载至DPU,实现高吞吐、低时延及显著的CPU卸载效果。相关成果已入选GTC 2026 Poster,CSAL亦荣获FAST 2026 Best Paper,体现其在新一代存储架构中的领先地位。

四、智算质量护航:

AI原生场景的测试范式升级

《面向AI场景的高性能内存测试研究》

640 (12).png

李佳媛

中国信通院-工程师

聚焦AI场景下的高性能内存测试,结合智算与存力发展现状,分析高性能内存核心特性,指出现有测试规范与AI需求的适配差距,研究相关技术测试要点,搭建起多场景的高性能内存测试规范体系。

【荣誉时刻:技术创新先锋获表彰】

会议尾声,经现场与会专家的严格评审与投票,美团服务器架构师胡泽志凭借《企业级NandFlash寿命极限测试与再服役边界》的卓越研究项目,荣膺本场“最具人气项目经理(MVP)”称号。

本次ODCC存储焦点组会议不仅是技术观点的碰撞,更是AI推理时代存储新范式的宣言。从打破硬件寿命的思维定式,到攻克KV Cache与存算分离的性能瓶颈,再到构建端到端的安全防线,与会专家共同勾勒了“降本增效”的技术路径。

随着DeepSeek等大模型的广泛应用,存储已从数据的“搬运工”转变为AI推理的“加速器”。未来,业界将通过标准共建与技术创新,持续释放硬件资产价值,推动数据中心从“算力为王”向“存算协同”的高质量发展迈进,为AI推理的规模化落地提供坚实底座。

ODCC存储焦点组联系人

李老师 lijiayuan@caict.ac.cn

ODCC秘书处联系人

刘老师:13488889649 邮箱:liupengyun@caict.ac.cn

640 (13).png