近日,UALink(Ultra Accelerator Link)联盟宣布推出四项新一代加速器互连技术规范,旨在为人工智能(AI)领域提供更高效、灵活的硬件解决方案。这些规范涵盖从数据链路到系统管理的多个层面,标志着加速器互连技术向标准化、模块化方向迈出重要一步。
其中,UALink通用规范2.0版本首次引入“网络内计算”概念,允许加速器在数据传输过程中直接完成部分计算任务。这一创新可显著降低分布式AI训练与推理的延迟,同时优化带宽利用率,尤其适用于处理复杂多任务负载的场景。例如,在大型语言模型训练中,该规范可通过减少数据中转次数,将系统整体效率提升约30%。
针对物理层与数据链路的升级,UALink 200G DL/PL规范2.0将相关标准从通用规范中独立出来。这种模块化设计使行业能够快速适配新型物理接口或更高传输速率,而无需修改其他协议层。联盟技术委员会成员解释称,此举可帮助硬件厂商缩短产品迭代周期,应对AI算力需求指数级增长的挑战。
在系统管理方面,UALink可管理性规范1.0构建了集中式控制与管理平面,支持gNMI、Yang、SAI和Redfish等开放协议。通过标准化API接口,运维人员可实现对多加速器集群的统一监控与资源调度,降低大型AI基础设施的运维复杂度。某云服务提供商测试显示,该规范可将集群故障定位时间从小时级缩短至分钟级。
针对芯粒(Chiplet)集成需求,UALink芯粒规范1.0定义了接口、封装尺寸、流控机制等关键参数,并完全兼容UCIe 3.0标准。这意味着芯片设计厂商可直接将UALink功能集成至多芯粒架构中,加速异构计算芯片的开发进程。某半导体企业透露,其基于该规范的新一代AI加速器已进入流片阶段,预计可降低40%的互连功耗。
UALink联盟董事会主席Kurtis Bowman表示:“AI工作负载的进化速度已超越传统互连技术的更新周期。此次规范更新为行业提供了关键技术支撑,使UALink解决方案能够更快融入各类AI架构。”他强调,联盟将持续通过开放标准推动AI基础设施创新,助力前沿应用落地。












