从“买设备”到“看Token”——中国信通院拟组织召开Token算力能力评价标准草案线下研讨会
大模型应用正从“能用”走向“好用、稳定用、规模用”。在这一过程中,用户不再只关心机房里有多少服务器、多少GPU/NPU和多少理论峰值算力,更关心在真实业务场景下能够持续产生多少可交付的Token服务能力、响应是否稳定、成本是否可控。围绕这一趋势,中国信通院持续开展《基于Token计量的算力能力评价技术要求》标准草案研究,并拟于下周四组织召开标准草案线下研讨会,面向产业链各方征集意见建议。
一、采购模式之变:从“买设备”到“买能力”
传统算力采购的核心逻辑通常围绕服务器、GPU/NPU、存储、网络等硬件资源展开,评价重点更多放在设备数量、卡数规模、峰值算力和基础配置上。随着大模型推理服务进入规模化应用阶段,客户真正需要的是这些设备能否在具体业务中稳定输出AI服务能力。
这一变化已经开始体现在市场实践中。公开信息显示,中国电信宁夏分公司2026年“Token工厂”生成能力服务集中采购项目,以“Token工厂”生成能力服务为采购对象,项目整体预估规模达到百亿元级,并通过多个标包组织采购。案例反映出运营商和大型客户的采购关注点正在从单纯购买硬件资源,转向购买可交付、可计量、可运营的AI生成能力服务。
换句话说,过去更多是“买多少台设备、多少张卡”,现在开始转向“能为业务稳定产出多少服务能力”。这也意味着,算力基础设施的评价方式需要从资源供给视角,进一步转向服务能力交付视角。
二、Token计量崛起:从技术单位到产业通用语言
Token可以简单理解为大模型“读懂问题、处理材料、生成答案”的基本颗粒。从国际和国内主流平台实践看,Token已经成为大模型服务的重要计量方式。OpenAI API、AWS Bedrock等国际模型服务平台,以及阿里云百炼、腾讯混元、百度千帆等国内模型服务平台,均已在模型调用、用量统计或价格说明中采用输入Token、输出Token或Token用量相关口径。Token不再只是技术概念,而是逐步进入产品定价、资源调度、成本核算和服务运营环节。
但仅有 Token 计量还不够。不同模型、不同 Tokenizer、不同上下文长度、不同推理框架和不同算力集群部署方式,都会影响Token处理和生成的效率。如果没有统一的评价边界和测试方法,企业之间很难对“同样花一分钱能产出多少服务能力”“同样一套设备能支撑多稳定的业务服务”形成可比判断。
三、标准体系构建:把看不见的AI服务能力变成可验证的评价框架
基于上述趋势,中国信通院围绕《基于Token计量的算力能力评价技术要求》开展标准草案研究,重点不是评价模型“回答得好不好”,也不是简单比较某一项峰值指标,而是面向大模型推理服务场景,评价算力集群能否稳定、高效、可复核地支撑Token服务产出。
通俗来说,此标准主要解决的是以下4个关键问题:
第一、测谁,即评价对象是芯片、整机、云平台还是算力集群;
第二、测什么,即输入、输出、场景、服务边界如何界定;
第三、怎么测,即在什么场景、什么负载、什么约束下观察服务表现;
第四、怎么用,即测试结果如何支撑采购选型、服务优化和产业协同。

图1 Token算力能力评价标准草案框架示意
从目标层级看,标准草案也强调“先界定边界,再解析机制,最后形成体系”的推进路径。底层需要统一输入Token、输出Token和评价对象边界,避免各说各话;中间层需要从业务场景和系统能力两个维度理解Token产出过程,既看用户侧需求,也看系统侧支撑;再向上识别计算、存储、互联、软件栈等算力侧影响因素;最终形成场景化评价引导、算力能力适配和标准研制验证的闭环框架。
这套框架的核心是把抽象的算力服务讲清楚:不只看理论算力有多大,也看在真实服务场景中能不能跑得稳、响应快、成本可控、结果可复核。

图2 面向算力集群的Token产出效率评价框架示意
四、Token指标的时代意义:推动算力服务从“资源供给”走向“能力交付”
Token指标的价值,不只是一个新的统计单位,更重要的是为大模型时代的算力服务建立了一套贴近业务结果的表达方式。
▶对于采购方来说,Token相关指标有助于从“买资源”转向“买能力”,更清楚地比较不同平台、不同集群、不同服务方案的实际交付效果;
▶对于服务商来说,Token评价有助于展示自身在部署优化、资源调度、稳定运行和成本控制方面的综合能力。
对于产业发展而言,Token评价体系能够在芯片、整机、云服务、模型应用、平台运营和测试验证之间建立共同语言,减少单纯围绕峰值算力、设备数量或单点性能进行比较带来的偏差,引导行业更加关注真实业务场景下的服务能力、资源效率和持续运营能力。
五、广邀产业链单位参编参会,共同完善标准草案
为进一步凝聚产业共识、完善标准草案内容,中国信通院拟于下周四组织召开《基于Token计量的算力能力评价技术要求》标准草案线下研讨会。
前期,研究团队已与华为、水利部、联想、壁仞、寒武纪、咪咕、蓝耘科技、海光信息、易点天下、锂氢丝路、九章云极、中国移动等产业链相关单位开展专题交流,围绕标准研究思路、评价对象边界、典型应用场景、测试实施路径和产业落地需求等内容听取意见建议,为后续线下研讨和草案完善奠定了基础。
现诚邀芯片、整机、云服务、模型应用、平台运营、测试验证、高校院所及相关产业链单位积极参与标准草案编制和线下研讨,共同围绕Token算力能力评价体系建设提出意见建议。中国信通院期待与各方进一步加强交流协作,推动形成更加科学、客观、可落地的评价方法,为大模型推理服务能力提升、算力基础设施高质量建设和人工智能产业规模化应用提供支撑。
联系人:
阮老师 18519220329 ruandi@caict.ac.cn
何老师 17801778925 hexudong@caict.ac.cn
吴老师 18810669396 wumeixi@caict.ac.cn


