寒武纪Day 0适配DeepSeek-V3.2-Exp,软硬件协同优化再升级

   时间:2025-09-30 09:09 来源:快讯作者:苏婉清

近日,人工智能领域迎来重要进展——深度求索公司(DeepSeek)正式推出DeepSeek-V3.2-Exp模型。该模型在V3.1-Terminus版本基础上,创新引入DeepSeek Sparse Attention稀疏注意力机制,重点针对长文本场景的训练与推理效率展开技术突破,通过优化算法结构显著提升计算资源利用率。

同步传来利好消息,寒武纪科技宣布完成对DeepSeek-V3.2-Exp模型的全面适配,并开源其自主研发的大模型推理引擎vLLM-MLU源代码。此举意味着开发者可直接在寒武纪软硬件一体化平台上部署该模型,体验新机制带来的性能提升。

作为AI芯片领域的领军企业,寒武纪持续深化"芯片+算法"协同创新战略。通过软硬件深度融合优化,其平台此前已实现DeepSeek系列模型业界领先的算力利用率。针对最新模型架构,研发团队采用Triton算子开发与BangC融合算子技术,结合计算通信并行策略,再次刷新计算效率纪录。

技术融合带来的效益显著。双方合作显示,DeepSeek Sparse Attention机制与寒武纪高效率计算架构的叠加效应,可使长序列场景下的训练与推理成本降低30%以上。这种软硬协同的解决方案,为金融分析、生物医药等需要处理超长文本的行业提供了更具性价比的技术路径。

目前,寒武纪已建立完整的模型适配工具链,支持从算子开发到性能调优的全流程自动化。开发者通过开源引擎可快速实现模型迁移,而企业用户则能直接获得经过验证的优化方案,这种开放生态策略正在重塑AI基础设施的技术标准。

 
 
更多>同类内容
全站最新
热门内容