合见工软网络IP作为ETH-X传输层协议方案亮相2025 ODCC春季全会网络工作组会议
日前,2025开放数据中心委员会(以下简称ODCC)春季全会在扬州召开,中国数字EDA/IP龙头企业上海合见工业软件集团有限公司(简称“合见工软”)作为ODCC成员单位亮相大会。会上,合见工软副总裁杨凯分享了合见针对智算网络Scale-up课题ETH-X 传输层协议(PAXI)的创新设计。该协议设计不仅支持内存语义,更兼具低延迟、高带宽和高可靠性的优势,能够使用通用以太网交换机组网互联。同时合见工软还推出了标准的IP和VIP产品,涵盖传输层(PAXI IP)、标准200G/400G/800G MAC/PCS/FEC IP,并配套一套完整的组网验证方案,为智算芯片的高效互联设计提供了坚实有力的技术支撑。
随着大语言模型规模的持续增长和相关应用的广泛普及,智算芯片对算力的需求呈现指数级增长,进而推动了芯片底层互联技术的迅猛发展。在这一背景下,智算芯片的互联技术在带宽、延迟和互联结构等方面面临着前所未有的挑战。从传统的多卡直连到超节点组网,原有的卡间互联协议已难以应对日益增长的需求。随着高速Serdes技术的成熟,新型互联协议在智算芯片的Scale-Up组网中扮演了至关重要的角色。
NVIDIA使用NVLINK作为GPU Scale UP互联技术,也是其将数百个GPU互联成超级GPU的关键技术。针对超节点互联协议,国内外多家企业和组织提出了多种不同的Scale-Up协议。ETH-X协议的PAXI方案的推出,帮助国内GPU企业快速追赶业界领先厂商。
ETH-X Scale-Up传输层协议方案功能介绍
1. 基于AXI协议和以太网协议的芯片间高速低延迟互联接口;
2. 支持原生AXI4/APB3协议接口;
3. 提供3个WRR优先级的虚拟通道;
4. 基于信用的端到端流量控制机制;
5. 支持MACL2层重传,可支持通过以太网交换机的端到端重传;
6. 基于RS272 FEC数据块的L1层重传机制;
7. 支持双向延迟测量(往返时延);
8. 可配置的MAC目标地址动态映射;
9. 支持PFC(优先级流量控制)/Pause帧流量控制;
10. 支持超频工作模式;
11. 可配置的AXI OST数量.
通过Scale up提升算力和性能的关键困难之一就是延迟问题,通过ETH-X Scale-Up传输层协议方案可以从三个方面减少互联延迟,进行优化:
1. 减少访存次数 - 降低搬运内存数据的总延迟,减少NOC的压力;
2. 降低链路延迟 - 使用低延迟的FEC(RS272),简化MAC的功能;
3. 简化软件操作 - 使用内存语义的操作,多卡做统一编址可当作一卡管理。
Scale-Up协议的可靠性、完整性、可实现性、生态适配,都需要有效的研发手段和开发方式,相关IP需要在提供给芯片厂商使用的时候就能达到最好的状态。合见工软现可为ETH-X Scale-Up协议提供商业化标准IP,包括:标准传输层IP+标准以太网MAC/PCS/FEC,IP级别的仿真验证环境(VIP),及完整的技术文档。
同时,Scale-Up传输协议复杂度较高,针对芯片设计阶段,协议的可实现性、性能测试方案、组网的功能测试方案等,芯片厂商短时间内很难具备上述能力,阻碍芯片设计企业使用新的Scale-Up传输层。合见工软为芯片设计企业提供了成熟的ETH-X Scale-Up协议的组网验证原型平台,使用全速的400G接口对接51.2T交换机,实现多节点ETH-X 传输协议的组网验证。提供开放和易用的框架,快速结合客户的逻辑进行验证,同时提供可扩展的验证规模,支持8节点、16节点、最大到128节点验证规模。帮助GPU/AI芯片厂商快速完成协议的评估和相关IP的集成,解决新协议验证带来挑战,缩短芯片厂商研发时间,同时提供有效的软硬件协同开发平台,加速软件开发。
合见工软ETH-X Scale-Up组网验证平台
以太网超节点互联项目是ODCC网络工作组的关键项目之一。该项目由中国信通院、腾讯携手 GPU/CPU 芯片、服务器、交换机企业等多家合作伙伴共同推进,秉持开放创新原则,加速先进网络技术在算力中心领域的创新实践与应用落地。
联系人
合见工软 杨老师 18610817287
信 通 院 孙老师 15732071244
ODCC联系人
刘老师 13488889649(微信同号)
邮箱:liupengyun@caict.ac.cn