​DeepSeek发布实验性大模型V3.2-Exp,引入DSA机制,API成本降超50%​

   时间:2025-09-30 15:15 来源:快讯作者:沈瑾瑜

DeepSeek 今日宣布推出实验性大模型 DeepSeek-V3.2-Exp,该模型在长文本处理领域实现了技术突破。通过引入自主研发的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,新模型在保持性能稳定的同时,显著提升了训练与推理效率。

作为 DeepSeek-V3.1-Terminus 的升级版本,V3.2-Exp 的核心创新在于首次实现了细粒度稀疏注意力机制。这种技术通过动态调整注意力权重,在处理超长上下文时能够精准聚焦关键信息,减少无效计算。据官方披露,DSA 机制在几乎不损失模型输出质量的前提下,将长文本场景下的资源消耗降低了约40%。

为验证新机制的实际效果,研发团队采用与前代模型完全相同的训练配置进行对比测试。公开评测数据显示,V3.2-Exp 在多项基准任务中的表现与 V3.1-Terminus 持平,部分复杂推理任务甚至略有提升。这一结果证明,稀疏化改造并未影响模型的核心能力,反而通过优化计算路径提升了整体效率。

技术升级带来的成本优势迅速转化为市场策略。DeepSeek 同步宣布将 API 服务价格下调超50%,开发者调用单次推理的成本降至行业最低水平之一。官方负责人表示,此举旨在降低 AI 技术应用门槛,推动自然语言处理技术在更多垂直领域的落地。

目前,DeepSeek 官方 App、网页端及小程序已完成版本更新,用户可无缝体验新模型带来的性能提升。技术社区普遍认为,这种通过架构创新实现效率跃升的路径,为大规模模型优化提供了新的研究方向。据内部人士透露,团队正基于 DSA 机制研发下一代通用大模型,预计将在年内推出更高效的版本。

 
 
更多>同类内容
全站最新
热门内容