AI开发编程 开源项目
Qwen3-Coder

阿里开源最强 AI 编程模型

标签:

Qwen3-Coder 是千问系列首个采用混合专家 MoE 架构的代码模型,总参数 480B,激活 35B 参数。这是什么概念?简单来说,就是“大脑”更大,“肌肉”更灵活。它原生支持 256K token 上下文,配合 YaRN 技术可拓展到 1M,能吞下完整代码仓库和动态 PR,解决以往模型“短视”的尴尬。事实上,能够吃下、理解和记忆多少上下文,一直是编程模型的一个硬指标。

此次开源的版本为Qwen3-Coder-480B-A35B-Instruct模型,它是一个拥有480B参数的MoE模型,并激活了35B参数。该模型原生支持256K上下文长度,并可通过YaRN技术扩展至1M,提供了卓越的代码生成和Agent功能。

Qwen3-Coder 当前提供的就是最强版本:Qwen3-Coder-480B-A35B-Instruct,480B 参数激活 35B 参数的 MoE 模型,拥有卓越的代码和 Agent 能力。Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 媲美。

Qwen3-Coder

1、训练的秘密:数据、数据、还是数据

Qwen3-Coder 在 7.5T 的数据上预训练,70% 都是代码。更难得的是,它用 Qwen2.5-Coder 清洗和重写了低质数据,确保输入的每一口都是“营养餐”。后训练阶段,团队没有走竞赛刷榜的老路,而是用真实代码任务做大规模强化学习,自动生成测试样例,提升代码执行成功率,模型能力也随之提升。

2、真正的“Agent”:让 AI 做你的工具人

这次最大的突破,是 Qwen3-Coder 的 Agent 能力。它不只是写代码,更能自主规划、调用工具、解决多步骤复杂任务。在 WebArena、BFCL 等评测中,Qwen3-Coder 一举打破开源模型纪录,甚至超越 GPT4.1。在 SWE-Bench 任务上,表现可媲美 Claude4。

实测下来,Qwen3-Coder 能调用的工具数量是 Claude 的几倍,复杂任务处理得游刃有余。你可以让它帮你写代码、修 Bug、生成测试用例,甚至一句话生成 3D 物理模拟。AI 编程的门槛被大大降低,Vibe Coding 真的来了。

3. 开源、开放、可玩性爆棚

Qwen3-Coder 已在魔搭社区、HuggingFace 等平台开源,全球开发者可免费下载。API 已上线阿里云百炼,命令行工具 Qwen Code 也同步开源。你可以用 Qwen Code、Claude Code、Cline 等工具无缝集成 Qwen3-Coder,体验代理式编程的乐趣。

相关导航

暂无评论

暂无评论...