DeepSeek近日宣布了其V3.1模型的重大更新及价格调整策略,这一消息迅速在用户群体中引起了广泛关注。
新版本V3.1的核心升级在于引入了混合推理架构,这一创新使得单个模型能够灵活切换至思考模式或非思考模式,极大地丰富了用户的使用场景。相较于前代DeepSeek-R1-0528,DeepSeek-V3.1-Think在思考效率上实现了显著提升,能够在更短时间内提供精准答案。
通过Post-Training优化技术,V3.1在工具使用与智能体任务中的表现也取得了长足进步,展现了更强大的Agent能力。官方App与网页端已同步完成升级,用户只需点击“深度思考”按钮,即可轻松切换模式。
API方面,DeepSeek同样进行了全面升级。“deepseek-chat”对应非思考模式,而“deepseek-reasoner”则对应思考模式,且两者上下文长度均扩展至128K,为用户提供了更广阔的信息处理空间。同时,为了兼容更多框架,V3.1还增加了对Anthropic API格式的支持,方便用户将其能力接入Claude Code框架。
然而,与这些令人振奋的升级一同到来的,还有价格调整的通知。DeepSeek宣布取消了之前的夜间优惠活动,V3.1的输入(缓存未命中)/百万tokens价格较V3版本上涨了200%,输出/百万tokens价格也上涨了150%。这一变动引发了部分用户的热议,有人调侃道:“以后加班研发,连优惠都没了。”
尽管价格有所上涨,但DeepSeek-V3.1在性能上的提升足以证明其价值。在AIME2025数学竞赛测试中,V3.1的准确率提升至87.5%,远超旧版R1的70%。在LiveCodeBench编程测试中,V3.1的表现几乎与OpenAI的o3-high持平,展现出了卓越的编程实力。
在市场上,DeepSeek-V3.1的价格相较于同类头部AI模型仍保持了较高的性价比。根据Artificial Analysis的最新排名,DeepSeek-V3.1已跃升至第13位,超越了Claude 4 Sonnet Thinking、Gemini 2.5 Flash、o3-mini等多个竞争对手。
DeepSeek还将V3.1定位为“迈向Agent时代的第一步”,明确表达了其在AI Agent领域的发力决心。通过官方测试,V3.1在代码修复、命令行终端复杂任务等多个方面均表现出色,相较于前代模型有了显著提升。同时,在多项搜索评测指标上,V3.1也取得了优异成绩,展现了其在多步推理和跨学科难题解决方面的强大能力。
V3.1在非思考模式下的输出长度也得到了有效控制,能够在保持模型性能的同时减少输出长度,提升了用户体验。在公告的结尾处,DeepSeek还留下了一个彩蛋:“UE8M0 FP8是针对即将发布的下一代国产芯片设计。”这一消息无疑为用户们留下了更多的想象空间。