月之暗面开源新模型Kimi-Dev-72B,超越DeepSeek R1成全球开源编程榜首

   时间:2025-06-17 22:32 来源:ITBEAR作者:柳晴雪

近期,软件开发领域迎来了一项重大创新,月之暗面团队推出了Kimi-Dev-72B,这是一款专为软件工程任务设计的全新开源代码大模型。

在备受瞩目的SWE-bench Verified编程基准测试中,Kimi-Dev-72B凭借其仅720亿的参数量,一举夺魁,超越了近期发布、参数量高达6710亿的新版DeepSeek-R1,成为全球最高水平的开源模型。

Kimi-Dev-72B通过大规模强化学习的精细调优,展现出了卓越的能力。它能够自主修复Docker中的真实存储库,并且只有在整个测试套件顺利通过后,才会获得奖励,这一机制确保了所提供的解决方案既正确又稳健。

该模型的设计理念和技术架构独树一帜,融合了BugFixer和TestWriter两大组件,形成了互补优势。这一组合不仅让模型在修复错误方面表现出色,同时在编写测试代码方面也游刃有余。

在训练过程中,Kimi-Dev-72B接受了约1500亿个高质量真实数据的洗礼,这些数据涵盖了广泛的Bug修复和单元测试场景,极大地增强了模型对实际开发环境的理解和适应能力。

强化学习阶段,模型专注于提升代码编辑能力,特别是在文件本地化和精细代码调整方面,展现出了令人瞩目的精准度和效率。

Kimi-Dev-72B的中期训练策略也起到了关键作用。通过这一阶段的训练,模型进一步巩固了对复杂软件问题的理解和处理能力。

目前,开发者们可以在Hugging Face和GitHub平台上轻松下载和部署Kimi-Dev-72B,包括模型权重、源代码等关键资源,这为软件开发领域带来了前所未有的便利和效率提升。

 
 
更多>同类内容
全站最新
热门内容