中科曙光3套万卡超集群落地郑州,国产AI算力迈入实战新阶段

   时间:2026-02-06 16:13 来源:天脉网作者:沈如风

在国家超算互联网郑州核心节点,3套由中科曙光打造的万卡超集群系统正式启动试运行。这一国产AI算力池不仅实现3万张加速卡协同部署,更以实际运营状态成为国内规模最大的同类设施,可全面支撑万亿参数模型训练、高通量推理及AI for Science等前沿场景的算力需求。

从概念验证到规模化落地,国产万卡集群仅用不到两个月便完成关键跨越。去年12月HAIC大会上首次亮相的scaleX系统,如今已突破高速互联网络、存算传耦合设计、高密度供电散热等核心技术瓶颈。中科曙光通过系统性创新,构建起覆盖硬件架构到资源调度的完整技术体系,为超大规模算力集群的稳定运行奠定基础。

面对全球智能算力需求的爆发式增长,生态兼容性成为破局关键。scaleX系统采用开放架构设计,不仅全面适配CUDA等主流开发环境,更支持多品牌国产加速卡混合部署。这种弹性扩展能力使其具备向十万卡、百万卡规模演进的潜力,有效降低企业迁移成本与使用门槛。国家超算互联网的接入,更让算力资源实现跨区域智能调度,形成覆盖全国的算力服务网络。

在应用落地层面,该系统已完成400余个主流大模型的适配优化,并通过国家超算互联网平台接入上千款AI应用。针对超大规模训练场景,系统可实现万亿参数模型的整机训练与毫秒级容错恢复;在高通量推理领域,已为多家互联网巨头提供核心业务支撑,推理效率较传统方案提升40%以上。在科研创新方面,该系统助力国内团队在材料研发大模型国际竞赛中夺冠,并将蛋白质研究效率提升千倍级。

为降低多学科交叉研究门槛,中科曙光同步推出OneScience科学大模型开发平台。该平台整合算力调度、模型训练、数据管理等全流程工具,使科研人员无需深度参与底层技术开发即可快速构建应用模型。目前平台已支撑生物医药、气象预测、新材料研发等多个领域的创新突破,形成"算力+应用+生态"的协同发展模式。

中科曙光高级副总裁李斌透露,郑州节点的上线仅是起点。未来将持续优化算力集群的能效比与稳定性,通过技术迭代与生态共建,推动国产智能算力深度融入智能制造、智慧城市、医疗健康等国民经济主战场,为数字经济高质量发展提供核心引擎。

 
 
更多>同类内容
全站最新
热门内容