在编程领域的最新突破中,阿里巴巴开源了其通义千问系列中的全新AI编程大模型——Qwen3-Coder。这一模型的问世,标志着开源编程模型在能力上实现了飞跃,不仅超越了诸如GPT4.1等闭源模型,更与全球顶尖的编程模型Claude4比肩而立。
Qwen3-Coder作为千问系列中的首个混合专家MoE架构代码模型,其参数规模庞大,总计达到4800亿,其中激活参数为350亿。这一模型原生支持256K token的上下文长度,且具备扩展至1M长度的能力,为用户提供了广阔的操作空间。
在预训练阶段,Qwen3-Coder使用了代码占比高达70%的7.5T数据,并通过强化学习在编程任务及智能体任务上进行了后训练。这一训练策略显著提升了模型的通用能力、代码能力以及Agent能力。在WebArena和BFCL等评测中,Qwen3-Coder刷新了开源模型的纪录,超越了GPT4.1。而在SWE-Bench评测中,该模型同样表现出色,取得了开源模型中的最佳效果,与Claude4不相上下。
Qwen3-Coder凭借其卓越的Agent能力,在解决多步骤长任务时展现出强大的实力。它能够全局规划工作内容,自主调用各种工具进行深入钻研,最终解决复杂的编程任务。这一能力使得网页开发、AI搜索、深度研究等智能体应用变得更加智能和高效。实测数据显示,在执行任务时,Qwen3-Coder调用的工具数量远超Claude,效果令人瞩目。
对于程序员而言,Qwen3-Coder无疑是一款强大的助手。它能够轻松完成基础编程任务,如写代码、补全代码、修复Bug等,显著提升编程工作效率。代码测试、查询生成等工作在Qwen3-Coder的帮助下,从人工编写的数小时缩短至数分钟。该模型还降低了普通人入门编程的门槛,让AI氛围编程成为现实,用户只需一句话就能生成精妙复杂的3D物理模拟过程。
目前,Qwen3-Coder已在魔搭社区和HuggingFace等平台开源,全球开发者可免费下载使用。同时,该模型即将接入阿里巴巴的AI编程产品通义灵码,其API也已上线阿里云百炼。为了方便开发者更好地利用Qwen3-Coder,通义团队还开源了一款命令行工具Qwen Code。Qwen3-Coder的API可以与Claude Code、Cline等工具协同使用,为用户提供更多样化的编程体验。
千问系列编程模型自推出以来,便受到了全球开发者的热烈欢迎。截至目前,其全球下载量已突破2000万次,成为最受欢迎的开源编程模型之一。阿里巴巴内部也已开始大量使用AI编程技术,一汽集团、中国石油、建设银行、平安集团、南方航空、小鹏汽车等行业头部企业也纷纷接入千问AI编程模型,共同推动编程技术的创新与发展。