中国信通院正式启动《基于Token计量的算力能力评价技术要求》标准研究工作,火热征集参与单位!
Token服务是支撑大模型规模化应用、提升算力资源配置效率的重要基础设施,对促进人工智能技术产业化、优化智能服务供给、赋能各行各业数字化转型具有基础性支撑作用。《“十五五”规划纲要》明确提出“加快人工智能基础设施建设,提升算力资源利用效率,完善大模型服务标准体系,推动生成式人工智能安全有序发展”,为以Token计量为基础的大模型算力服务体系建设指明了方向。
2026年政府工作报告提出“推动重点行业领域人工智能商业化规模化应用,培育智能原生新业态新模式”,当前,大模型技术加速迭代,多模型协同调度、Agent智能体等应用场景持续拓展,Token服务的运行效率、安全稳定性与场景适配能力,已成为制约大模型产业高质量发展的关键瓶颈。亟需建立统一、科学、全面的评价体系,规范行业发展、引领技术创新。
标准制定
中国信通院正式启动《基于Token计量的算力能力评价技术要求》标准研究工作。开展此项研究,旨在面向大模型推理与服务场景,构建基于Token计量的算力能力评价框架,形成可量化、可对比、可验证的技术要求,为算力设施建设、平台能力优化、模型服务提升和产业应用落地提供评价依据与方法支撑。
一方面,基于Token计量的算力服务贯穿大模型推理与应用全过程,是支撑产业生态高效运行的重要基础。具体来看从芯片、加速卡等硬件底座,到云服务、算力平台等基础设施,再到通用大模型、行业大模型等应用层,基于Token的算力服务贯穿大模型全生命周期。国内头部算力企业、云服务商、大模型厂商已在基于Token的算力服务优化、多模型适配等领域开展大量实践,为标准研究积累了丰富的实践经验。
另一方面,算力服务能力是企业核心竞争力的重要体现,而Token指标则是衡量其服务效能和资源利用水平的重要表征。高效的Token使用效率、精准的场景适配,能够帮助企业降低算力成本、提升投资回报率(ROI),在AI商业化竞争中占据优势。同时,金融、政务、制造、医疗等重点行业对大模型服务的安全性、稳定性、合规性提出了更高要求,需通过标准化手段,建立基于Token计量的算力能力评价标尺,保障行业大模型应用安全可靠落地。此外,随着多模型协同、混合部署等模式快速发展,Token服务的平台化运营、多租户管理、多模型纳管等能力愈发重要,成为算力基础设施现代化的重要标志。
评价体系
本标准拟围绕五大核心维度构建评价体系:一是Token使用效率维度,重点评价Output TPM、TTFT、Tokens/s、并发吞吐、批处理效率、缓存命中率、单卡 Token 输出速率等核心性能指标,通过专业测试工具全面评估算力资源利用效率和Token产出能力;二是投资回报率(ROI)维度,聚焦算力投入与业务产出的平衡,建立科学的投入产出评价指标,助力企业实现降本增效;三是服务质量与稳定性维度,围绕端到端时延、报错率、可用性、并发稳定性、峰值承载能力、长时间运行波动率等硬性指标,保障大模型服务的持续可靠供给;四是场景适配成熟度维度,针对通用Agent适配、结构化输出支持、业务场景覆盖度、模型切换灵活性、部署适配性等软性指标,评估Token服务对多元业务场景的适配能力;五是平台运营治理成熟度维度,涵盖监控看板、日志审计、告警能力、限流熔断、多租户隔离、权限管理、多模型纳管能力等,全面评价Token服务平台的运营治理水平。

征集
现广泛征集《基于Token计量的算力能力评价技术要求》标准研究参与单位,诚邀大模型厂商、算力芯片/加速卡企业、云服务商、AI基础设施提供商、重点行业应用单位及相关科研院所等产业链上下游主体积极参与,共同构建科学规范的基于Token计量的算力能力评价体系,推动大模型产业高质量、规模化、安全有序发展!
请有意参与的单位和专家联系我们,标准问卷可通过扫描下方二维码获取。

针对芯片厂商的问卷

针对模型厂商的问卷

针对云服务厂商的问卷
联系人:
阮老师 18519220329(微信同号)
何老师 17801778925(微信同号)
吴老师 18810669396(微信同号)


