算力能级提升行动 | 智能体算力研究正式启航
当前,人工智能产业正加速从模型训练向应用推理延伸,智能体作为大模型落地的核心载体,正从概念验证走向规模化部署。据行业研究数据显示,2026年我国日均Token消耗已达140万亿,智能体任务单次调用的Token消耗可达普通对话的10倍至1000倍,复杂场景下的Token消耗量会出现量级跃升。当大模型从“回答问题”进化到“执行任务”,底层算力基础设施面临的需求图谱正发生深刻改变。
一、智能体推理的负载特征与算力挑战
智能体完成任务的过程是一组持续、闭环的推理活动,与传统对话式推理形成三个维度的差异。
交互模式:从请求响应到任务闭环。 统推理以单次问答为基本单元,智能体则需经历规划、工具调用、反馈迭代等步骤,单任务模型调用次数通常在数十至上百轮。能力边界亦从模型推理扩展至系统推理,任务完成质量由规划、工具、记忆等组件的协同水平共同决定。交互模式的深化使算力消耗数量级攀升,且呈现心跳式持续消耗特征。
负载特征:从平稳承载到弹性适配。智能体负载具有突发并发特点,多智能体协同进一步放大并发规模。同时,长上下文与外部记忆的深度依赖,使KV Cache容量、向量数据库性能与存算网络协同成为新的瓶颈环节。上述变化对瞬时扩缩容、多租户隔离及存算协同调度提出更高要求。
供给结构:从统一供给到分层协同。 智能体任务的算力需求高度分化。轻量模型处理简单路由,强推理模型承担复杂规划,Embedding支撑检索,执行控制由规则引擎接管。算力供给由此从统一适配走向异构协同与分级调度,基础设施需具备算力分级路由与异构资源统一编排能力。

图 1智能体应用与传统推理业务的三维差异
二、启动智能体算力应用体系研究专项
上述变化指向一个核心命题:智能体需要的不单是更大规模的计算资源,而是异构算力、规模化缓存、弹性运力与状态记忆、工具编排等紧密协同的体系化支撑。传统以训练为中心的算力供给模式,在智能体推理场景下面临结构性适配压力。为应对智能体规模化部署对算力应用模式和供需结构提出的系统性挑战,中国信通院启动“智能体算力应用体系研究”专项,首批推进以下三项工作。
(一)研制《智能体算力需求分类与分级标准》
智能体任务包含对话问答、工具调用、工作流执行、多智能体协同等不同负载类型,在Token规模、推理步数、外部数据访问量、并发特征与实时性要求等方面差异显著。产业尚未形成从任务特征到资源需求映射的标准化分类体系,供需两侧对算力、存力、运力需求的沟通缺少统一参照。本标准拟建立面向智能体任务的分类框架,依据任务类型定义资源需求等级,为芯片设计、集群规划、成本测算等环节提供需求描述规范,推动算力资源配置从经验驱动走向数据驱动。
(二)研制《智能体推理算力体系评测标准》
智能体从验证走向生产部署,系统能力的可度量性成为规模化落地的先决条件。当前产业在任务完成率、端到端时延、工具调用成功率、多轮稳定性、异常恢复率及单任务成本等关键维度尚未形成统一的评测规范与可互认的度量基准,技术方案的横向比较与能力迭代缺少客观参照。本标准建立面向智能体推理负载的基础设施评测框架,围绕任务执行质量、系统稳定性、资源效率与安全合规等维度定义可量化指标体系,为产业提供可参照的能力度量基准。
(三)开展智能体推理算力效能测试
评测标准体系的有效性需在产业实践中持续校验。本项工作面向算力供给方,重点测试算力设施在典型智能体任务场景下的任务执行效率、资源利用有效性及长时运行稳定性。测试验证与标准研制并行推进,形成实践与理论相互校准的闭环。为明确测试验证的核心观测维度,现提出面向智能体的算力基础设施五层评测框架,从算力资源、模型服务、智能体运行、工具与记忆、安全与观测五个层面挖掘算力效能优化的关键需求。

图 2智能体推理效能评测框架
三、凝聚产业共识,共筑智能体推理新基座
智能体从对话走向执行,标志着人工智能正从信息交互工具进化为生产力工具。这一跨越推动算力产业从“资源规模驱动”迈向“应用效能驱动”,算力基础设施的体系化支撑能力将成为决定产业进程的关键变量。中国信通院愿与产业链各环节伙伴携手,在智能体规模化部署的关键窗口期,凝聚共识,协同发力,为人工智能与千行百业深度融合筑牢基座,为智能经济高质量发展注入持久动能。
联系人:
何老师 15910953232 heshi@caict.ac.cn
苏老师 13021269299 suhao@caict.ac.cn
王老师 18601152291 wangyue2@caict.ac.cn


