[25'ODCC成果]OISA全向智感互联芯粒技术白皮书

2025-09-09

随着大模型等前沿人工智能技术呈指数级演进，全球算力需求正经历前所未有的爆发式增长。为满足AI模型对海量参数与数据的处理需求，通过数千乃至上万张加速卡构建超大规模高性能计算集群，已成为构建新一代智算中心的必然路径。然而，当算力规模迈向更高量级，GPU卡间互联效率瓶颈日益凸显，成为制约整体性能提升的关键桎梏。当前，业界主流的互联技术路线因其协议的私有化，存在生态壁垒，限制了技术开放与技术迭代。与此同时，传统的网络协议在应对AI负载特有的高并发、突发性通信模式时，常因无法支持原生内存语义而导致性能大幅衰减，难以满足大模型训练与推理场景下对极致时延和无损传输的严苛要求。

在此背景下，业界亟待一种全新的解决方案，不仅要在协议层面实现开放与高效，更要在芯片架构层面突破传统GPU卡间互联能力的限制。将互联功能从主芯片中解耦，通过专用的互联芯粒(Chiplet)与GPU主芯片进行异构集成，以先进封装技术构建支持更高维度Scale-up的计算系统，成为具有潜力的技术演进方向之一。

《OISA全向智感互联芯粒技术白皮书》的发布，标志着业界在应对智算时代GPU卡间互联挑战方面提供关键技术方案。本白皮书直面生态封闭与性能低效的产业核心痛点，前瞻性提出一套开放、统一且高效的支持OISA协议的Chiplet芯粒技术标准与实现范式。其核心理念在于，通过支持OISA协议的互联芯粒(Chiplet)与GPU主算力芯片进行先进封装，共同构成一个功能强大的计算复合体，从而支持一种更为灵活、可扩展的Scale-up系统构建方案。

该芯粒所承载的OISA协议，是为大规模AI计算负载量身定制的下一代互联方案。凭借其极致报文结构、原生内容语义、硬件级可靠重传以及内建的集合通信加速等一系列关键技术创新，可以为大规模GPU对等(Peer-to-Peer)架构下的内存交互，提供超高带宽、纳秒级时延的极致性能保障。

作为即将在九月开放数据中心大会上发布的重磅成果，OISA芯粒技术的问世，是GPU卡间互联技术的一次重大跃升，为构建更加开放、高效的智算基础设施注入强劲动力，全面激发我国在全球计算领域的创新潜能。

本成果将于今年9月的开放数据中心大会上正式发布！敬请期待！

微信图片_2025-09-09_114700_489.png