华为Atlas 350携昇腾950PR登场:算力飙升,引领AI推理加速新潮流

   时间:2026-03-22 11:42 来源:快讯作者:任飞扬

在华为中国合作伙伴大会上,一款名为Atlas 350的AI训练推理加速卡正式亮相并宣布上市。这款加速卡搭载了华为最新推出的昇腾950PR处理器,凭借其强大的性能,迅速成为全场焦点。

昇腾950PR芯片于今年早些时候发布,采用SIMD架构,算力惊人。在FP8数据格式下,其算力可达1PFLOPS,而在FP4格式下更是高达2PFLOPS。该芯片支持多种数据格式,包括FP32、HF32、FP16等,互联带宽达到2TB/s,内存容量和带宽也分别达到了128GB和1.6TB/s。与前一代产品相比,昇腾950PR在低精度数据格式处理、向量算力、互联带宽以及自研HBM等方面均实现了显著提升。

与英伟达的H20芯片相比,昇腾950PR在HBM容量上更胜一筹,达到了112GB,是H20的1.16倍。同时,其多模态生成速度提升了60%,内存访问颗粒度从512字节减少到128字节,使得小算子的访存效率提升了4倍。这些优势使得Atlas 350加速卡在性能上有了质的飞跃。

Atlas 350加速卡的硬件参数同样令人瞩目。在FP4精度下,其算力高达1.56P,带宽达到了1.4TB/s。尽管功耗为600W,是H20的1.5倍,但考虑到其卓越的性能,这一功耗水平仍在可接受范围内。

华为昇腾计算业务总裁张迪煊表示,Atlas 350的单卡算力是英伟达H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品。这意味着,搭载Atlas 350的服务器能够支持更大规模的模型,实现更低的推理时延,从而提高计算速度和寄存器效率。

在实际应用中,Atlas 350加速卡已经展现出了强大的实力。在互联网推荐场景的实测中,该卡时延更低、响应更快,特别适合短视频、电商、广告推荐等高并发场景。同时,在大模型推理、文生图、文生视频等多模态场景中,其性能也与英伟达的L20相当。

基于Atlas 350等产品,华为昇腾还计划打造大、中、小三大核心算力场景,以满足不同客户的差异化需求。在此次大会上,昆仑、华鲲振宇等7家华为核心伙伴发布了基于Atlas 350的服务器整机产品,标志着昇腾950代际推理算力正式进入商用阶段。

其中,软通动力旗下的软通华方发布的“超强A860 A5”服务器备受关注。这款6U2路AI服务器产品搭载了鲲鹏920新型号处理器,可支持8块昇腾Atlas350加速卡,具有超强算力、灵活拓展和安全可靠等特点,适用于AI大语言模型训练和推理、AI加速计算、视频分析等多种应用场景。

科大讯飞也宣布将新一代星火大模型与昇腾910/950系列算力底座进行充分适配,为用户提供更加智能、高效的AI解决方案。华为昇腾还联合20家行业头部伙伴发布了2026昇腾AI应用场景解决方案,覆盖辅助办公、AI实训、电子病历等多个行业核心场景。

值得一提的是,近期基于OpenClaw的“养虾”热潮激发了相关AI一体机的需求。华为透露,过去一个多月已有十几家合作伙伴推出了基于昇腾的OpenClaw一体机。截至目前,昇腾已联合伙伴打造了400多款行业一体机,服务客户超过2700家,占据国内一体机市场80%以上的份额。

 
 
更多>同类内容
全站最新
热门内容