华为数据存储携手中科弘云 推出AI推理加速方案 赋能多行业应用

   时间:2025-12-23 19:47 来源:快讯作者:朱天宇

华为数据存储与中科弘云近日联合推出了一项AI推理加速解决方案,旨在通过软硬件深度协同优化,为长序列推理场景提供高效算力支撑。该方案以华为OceanStor A系列存储为核心数据底座,结合中科弘云自主研发的HyperCN智算互联网云服务平台,构建起覆盖数据存储、算力调度、推理加速的全栈能力体系。

在技术架构层面,方案创新性地融合了华为UCM推理记忆数据管理技术与中科弘云平台能力。通过KV Cache多级缓存管理机制,将推理过程中的关键数据持久化存储于OceanStor A系列设备,实现推理记忆的全量保存与快速调用。这种设计有效减少了重复计算开销,配合Prefix Cache与GSA稀疏加速算法,在长序列推理场景中可显著降低首Token生成时延(TTFT)。实测数据显示,在智能问答典型场景中,该方案使TTFT降低57.5%,且序列长度与优化效果呈正相关关系。

针对复杂算力环境,方案构建了异构资源管理体系。系统支持英伟达、华为昇腾、寒武纪等多品牌AI芯片的协同调度,兼容MindSpore、vLLM、SGLang等主流开发框架,并通过Kubernetes容器编排技术实现与存储系统的无缝对接。这种设计使得能源电力、智能制造等行业的用户能够灵活整合现有算力资源,避免硬件锁定带来的技术风险。

在算力调度方面,方案采用细粒度资源池化策略,可根据业务需求动态分配计算资源。系统具备集群作业调度、实时健康监测、故障自动恢复等运维能力,支持分钟级任务重启与系统自愈。特别是在长文档处理场景中,结合GSA稀疏加速算法后,当序列长度达到39K时,系统并发处理能力提升86%,整体推理吞吐量增长36%,有效提升了复杂模型的生产部署效率。

为降低AI开发门槛,方案提供覆盖全流程的端到端工具链,涵盖数据标注、模型训练、推理部署等关键环节。工具链同时支持传统机器学习与深度学习开发模式,实现AI资产的标准化管理。目前该方案已在国家实验室、能源电力、智能制造等领域启动试点应用,通过实际场景验证了其在复杂业务环境中的技术可行性。

 
 
更多>同类内容
全站最新
热门内容