《先进存力中心研究报告(2025年)》正式发布
在数字经济蓬勃发展的时代背景下,数据作为基础性战略资源和关键生产要素,数据要素价值释放成为推动经济社会高质量发展的核心动力。然而,一方面相较于逐年递增的数据产量,存力规模增速略显滞后,数据“应存未存”现象依然存在。另一方面,数据作为AI三大核心要素之一,其规模与质量直接影响AI技术应用与发展。在此背景下,先进存力中心应运而生,作为新型信息基础设施的重要组成部分,对于数据资源积累、数据资产转化、数据资本流通以及促进数字经济与实体经济深度融合具有深远意义。
近日,中国信息通信研究院(简称“中国信通院”)云计算与大数据研究所在2025中国算力大会先进数据存力论坛上发布《先进存力中心研究报告(2025年)》,中国信通院云计算与大数据研究所总工程师郭亮对报告进行了深入解读。
报告从基础设施建设、数据价值释放、产业应用赋能的全局视角出发,以新型信息基础设施演进为主线,分析当前AI发展对大规模高质量数据需求与数据“应存未存”之间的结构性矛盾,阐述先进存力中心运用“1+4+N”架构体系在破解多源异构数据汇聚、治理、流通、利用全生命周期瓶颈中的枢纽作用。提出以全闪化存力底座、跨域数据编织、存储内生安全、AI数据湖存储、数据分级治理、可信数据空间等关键技术为支撑,实现“规模聚数、高效治数、安全供数、产业用数”的数据价值闭环。同时,在新型信息基础设施体系中,先进存力中心可为算力中心持续供给高质量数据资源,形成“以存汇数、以数促算、以算兴业”的发展范式,助力我国在全球数据竞争中抢占战略制高点。
1 先进存力中心是以先进存力为底座,可提供数据从汇聚到应用的全周期服务能力的新型基础设施。
具体而言,先进存力中心是集先进存储设备、数据资源管理和数据安全防护等于一体,融合数据治理、开发流通等功能的新型基础设施。先进存力中心具备高可靠、高性能、高安全、绿色低碳等特征,提供数据托管、数据治理、数据供给与流通、数据开发与加工等服务能力,可实现规模聚数、高效治数、安全供数、产业用数,可为算力中心、大模型及数据交易提供高质量、高可信、高可用的数据供给,支撑数字经济创新。
先进存力中心定义与特征
来源:中国信通院
2 建设先进存力中心是破解当前我国数据“应存未存”困局的有效途径之一。
当前我国面临数据存储能力与生产规模不匹配的严峻挑战。2024年数据显示,全国数据年产量达41.06ZB,但存储总量仅为2.09ZB,数据留存率由2023年的2.89%降至2.80%。先进存力中心通过实现多源异构数据的高效汇聚与安全存储,为优化数据资源配置、避免高价值数据流失提供重要支撑。
3 先进存力中心利用AI数据湖存储技术实现多源多模态数据统一归集,为我国数字经济发展积累充分数据资源。
先进存力中心以AI数据湖存储作为先进存力底座,可实现多源异构数据的统一采集与预处理,支持结构化、半结构化及非结构化数据的批量同步与实时接入。在数据入湖阶段执行标准化映射与敏感字段脱敏标记,以分区分表形式存储于文件系统与数据库构成的湖仓一体架构。同步实现元数据自动捕获、注册与血缘构建,形成“数据-元数据-目录”一体化管理体系,为数据治理与授权加工提供可追踪、可审计的资源基础。
4 先进存力中心可将数据资源有效转化为行业高质量数据集,为打造人工智能强国夯实数据基础。
先进存力中心利用高效数据归集和存储能力,依托数据清洗、标注、特征融合等平台工具,将原始数据转化为具有行业特征的高质量数据集,为算力资源高效利用提供数据保障。同时,可采用存算资源协同调度为算力中心提供低延迟、高吞吐的训练数据流,充分发挥我国算力资源建设优势。
5 先进存力中心通过统一标准、质量控制、脱敏及血缘管理,将原始数据转化为可审计、可授权的数据资产。
先进存力中心在治理阶段依据统一的数据标准、模型和分层分类规范,对入湖原始数据进行字段级盘点、标准化映射、质量校验、脱敏处理和血缘注册,形成可检索、可授权、可计量、可审计的高质量数据集,并同步生成数据资产目录,为后续合规流通和价值释放提供可信依据。
报告目录
一、先进存力中心建设背景
(一)数据成为数字经济发展新阶段战略资源
(二)数据留存率与存力建设水平仍有待提升
二、先进存力中心定义与内涵
(一)先进存力中心定义内涵
(二)先进存力中心服务能力
(三)先进存力中心产业定位
(四)先进存力中心运营模式
三、先进存力中心建设意义
(一)多源多模态数据资源高效汇聚
(二)助力数据要素价值进一步释放
(三)为算力中心提供数据资源保障
四、先进存力中心关键技术
(一)全闪存储架构建设,突破数据应用效能瓶颈
(二)数据编织可视可管,打破分散数据孤岛效应
(三)虚拟资源智能调度,满足数据高效流通利用
(四)数据存储内生安全,保障数据资产高可用性
(五)AI数据湖存储技术,实现多源数据统一归集
(六)全域数据分级归类,强化数据资源高效治理
(七)构建可信数据空间,促进数据资产供给流通
(八)数据挖掘与AI赋能,夯实行业数智转型基础
五、先进存力中心应用场景
(一)行业高质量数据集构建,构筑企业全域知识运营基座
(二)医疗影像共享空间建设,打造影像数据共享管理中枢
(三)智能网联汽车数据管理,促进新能源产业数字化转型
(四)公共数据授权运营开放,建设数据要素托管流通枢纽
(五)城市全域数据汇聚治理,形成民意感知研判响应闭环
六、发展建议
(一)加强国家顶层规划,统筹先进存力中心建设布局
(二)鼓励技术研发攻关,推进存力与算力的协同创新
(三)完善存力建设体系,保障基础设施可持续性发展
(四)牢筑人才培育根基,支撑数据存力产业生态建设
郭亮
中国信通院云计算与大数据研究所总工程师,正高级工程师
主要负责算力方面的政府支撑、技术研究和标准制定工作,参与多项国家部委重点研发专项,支撑工信部、发改委、国管局等国家部委和多地政府算力基础设施相关政策制定。
王月
中国信通院云计算与大数据研究所数据中心部副主任,高级工程师
主要从事数据中心和算力相关政策、产业、技术与标准等方面研究工作,组织开展多项存储领域相关政策制定、标准研究、技术测试等工作。
何适
中国信通院云计算与大数据研究所工程师
主要从事算力基础设施、智能计算、存储等领域相关的技术研究、产业咨询、政策支撑和标准制定等工作。
版权声明:本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。
撰写团队联系方式:
中国信通院 云计算与大数据研究所
王月 18601152291 wangyue2@caict.ac.cn
何适 15910953232 heshi@caict.ac.cn
点击“https://mp.weixin.qq.com/s/NljN1GI1c-PGSalKUNkRRg”,下载报告。