在近日举办的NVIDIA GTC 2025年10月大会(GTC DC)上,英伟达正式揭晓了其下一代数据中心处理器——NVIDIA BlueField-4 DPU。这款新品凭借多项突破性技术,迅速成为行业焦点。其核心亮点在于支持800G高速网络连接,并首次集成多达64个Arm架构核心的“Grace”CPU,标志着英伟达在DPU领域的技术跃升。
据官方披露,BlueField-4 DPU基于Rubin架构打造,计划于2026年初作为NVIDIA Vera Rubin平台的核心组件进入早期商用阶段。尽管完整规格尚未公布,但已确认其晶体管数量高达1260亿个,并搭载NVIDIA ConnectX-9网络技术,可全面兼容PCIe Gen6接口标准。这一设计不仅延续了英伟达在异构计算领域的优势,更通过集成高性能CPU与网络加速模块,为AI工厂构建了更高效的底层架构。
值得关注的是,BlueField-4采用的64核“Grace”CPU并非首次亮相。此前,该架构已应用于基于Arm Neoverse V2的处理器及GB10平台中,后者甚至融合了两种不同类型的Arm Cortex核心。此次将其引入DPU领域,体现了英伟达通过垂直整合强化生态控制力的战略意图。行业分析师指出,此举将显著提升数据处理与网络传输的协同效率,尤其在需要低延迟、高带宽的AI推理场景中表现突出。
在发布会现场,英伟达CEO黄仁勋特别强调了新一代网卡(NIC)对KV缓存(Key-Value Cache)处理的优化。他表示,尽管Rubin CPX更侧重于预填充阶段的性能提升,但KV缓存在大语言模型(LLM)的对话恢复等场景中至关重要。通过硬件级加速,BlueField-4可大幅降低此类任务的延迟,从而提升整体系统响应速度。这一特性对于需要实时交互的生成式AI应用而言,无疑具有里程碑意义。
从产业视角看,BlueField-4的推出进一步巩固了英伟达在AI基础设施领域的领导地位。尽管市场上已存在采用64核Arm架构的DPU产品,但英伟达凭借其完整的GPU-DPU-网络解决方案生态,仍具备显著竞争优势。尤其是在全球资本持续涌入英伟达GPU驱动的AI集群的背景下,BlueField-4的发布或将重新定义数据中心硬件的竞争格局,推动行业向更高集成度、更低能耗的方向演进。











