NEWS INFORMATION新闻动态

关注微信公众号

首页  >   新闻动态  >   工作组动态

GTC26精彩回放 | ODCC技术成果惊艳亮相

2026-03-24

当地时间3月16日-19日,英伟达GTC 2026大会顺利召开。会上,黄仁勋指出,人工智能正从以单点算力竞争为核心的训练时代,全面迈入以“AI工厂”(AI Factory)和“智能体”(Agent)为核心的推理时代。

随着推理范式的深刻演进,业界关注焦点日益聚焦于推理系统在实际应用中能否提供稳定高效的吞吐能力、极致的时延表现以及可控的成本结构。尤其在长上下文理解、多轮对话、企业级知识库检索及复杂智能体工作流等典型场景中,KV Cache已成为制约系统性能的关键瓶颈,推理架构亦正经历由单体式部署向Prefill/Decode分离与分层调度模式的系统性变革。

作为长期深耕AI基础设施技术的权威行业组织,开放数据中心委员会(ODCC)受邀深度参与GTC 2026.不仅见证了技术趋势的变迁,更凭借在AI存储领域的深厚积累成为舞台上的重要角色。

核心亮点:ODCC入选技术成果惊艳亮相

凭借在 AI 存储领域的前沿技术探索与实践积累,ODCC 选送的AI存储技术方案成功入选本届 GTC 大会海报展览环节,该方案由英伟达、三星、Solidigm 等企业深度联合参与,集中展示了存储软硬件协同创新的最新成果。当地时间3月15日,于圣何塞会议中心海报展览馆,ODCC专家团队向全球同行展示在AI推理存储领域的最新突破与落地经验。

640.png

海报内容深度解读:基于DPU的存算分离架构

在此次GTC大会上,ODCC 隆重发布了其最新研究成果——基于DPU的新一代存算分离存储架构,旨在从根本上重构数据中心的存储范式,应对推理时代带来的多元化应用挑战。

640.jpg

为了真实展现该技术的落地效能,本研究通过三大方案进行了深度验证:

方案1:CSAL QLC——为AI推理应用提效

该方案将云存储加速软件(CSAL)集成至DPU,使QLC的小块4K写入性能提升20倍,为AI推理中的向量数据库和RAG应用提供高效存储支持。

方案2:主流分布式存储系统性能全面飞跃

BeeGFS方案:基于DPU的存算分离BeeGFS方案,模拟文件系统I/O行为,覆盖4K至4MB不同文件尺寸,在多线程、多队列深度组合下进行全面测试,三节点集群实现高达110GB/s的聚合吞吐性能,充分满足高性能计算的需求。

Ceph方案: 基于Ceph的方案利用三星PM1743的SR-IOV功能,实现单台机器内8块硬盘、64个OSD的高密度部署,提供32.46 GB/s的读取性能和4.89 GB/s的写入性能。

HDFS优化方案: 基于DPU的存算分离HDFS优化方案,与传统X86三副本架构在TestDFSIO基准测试中进行了对比,覆盖AI训练与推理场景的典型I/O模式,性能表现已基本达到等效水平。

方案3:XiRaid——重塑数据保护与性能标准

该方案采用XiRaid软件定义RAID技术,在6盘RAID 6配置下实现422万随机读取IOPS,实现统一的块级数据保护,并简化存储系统设计。

基于DPU的存算分离架构正展现出成为下一代数据中心标准配置的巨大潜力。从HDFS、BeeGFS到Ceph等主流分布式存储系统的成功验证表明,该方案具备广泛的适用性和高度的技术成熟度,能够为各类数据密集型工作负载带来显著性能提升。

ODCC AI存储实验室

基于这些前期的优秀研究成果,ODCC AI存储实验室联合产业链上下游合作伙伴,已正式成立并投入运营。面对推理时代带来的场景化数据响应挑战,实验室聚焦大模型推理中的关键制约因素——KV Cache,首次启动面向存储软硬件的专项协同测试工作。目前,首批测试任务已圆满完成,系统验证了高性能存储和网络在KV Cache卸载中的核心价值,有力推动了AI存储技术的标准化、规范化与规模化落地进程。

展望未来:

作为这一技术变革的深度参与者与坚定推动者,ODCC将持续深耕AI基础设施领域,从“算力”到“存力”,从“性能优化”到“成本重构”,ODCC将携手产业伙伴,以开放标准和协同创新,持续推动AI存储技术的规范化、规模化和产业化,为人工智能赋能千行百业提供坚实支撑。

联系人

段老师:16600265822 duanshiru@caict.ac.cn

谢老师:18800199616 xielina@caict.ac.cn

ODCC秘书处联系人

刘老师:13488889649 邮箱:liupengyun@caict.ac.cn

640 (1).png