今天,我们正式发布 Qwen3-Coder,这是我们迄今为止最具代理能力的代码模型。
今天,我们隆重推出 Qwen3-Coder——迄今为止我们最强大的代码模型!
本次发布的 Qwen3-Coder-480B-A35B-Instruct是该系列当前的旗舰版本,采用 480B 参数(激活 35B 参数)的 MoE 架构,原生支持 256K 上下文,并可通过 YaRN 扩展至 1M token,在代码生成与 Agent 任务上表现卓越。
在 Agentic Coding(代理编程)、Agentic Browser-Use(浏览器交互)和 Agentic Tool-Use(工具调用)任务中,它不仅是开源领域的 SOTA,更能与 Claude Sonnet4一较高下!
与此同时,我们正式开源了专为代理式编程打造的命令行工具——Qwen Code!
• 基于 Gemini Code二次开发
• 优化了 prompt 设计和 工具调用协议
• 深度适配 Qwen3-Coder,充分释放其在 Agentic Coding任务上的潜力
此外,Qwen3-Coder能与 Claude Code、Cline等优秀社区工具无缝协作。作为一款通用基础模型,我们期待它在数字世界的每个角落大显身手——
Agentic Coding in the World!
预训练
在预训练阶段,我们通过多维度的Scaling策略持续优化,显著提升了Qwen3-Coder的代码能力:
【数据维度】
• 训练数据总量达7.5T,其中代码数据占比70%
• 在保持通用理解与数学推理能力的同时,实现专业级编程能力突破
【上下文维度】
• 原生支持256K超长上下文窗口
• 通过YaRN技术可扩展至1M token
• 特别针对代码仓库级处理及动态数据(如Pull Request)优化
• 为Agentic Coding提供强大的上下文理解支持
【数据质量维度】
• 创新性地采用Qwen2.5-Coder进行数据清洗
• 通过模型智能重写低质量数据
• 整体训练数据质量获得显著提升
后训练
Scaling Code RL: Hard to Solve, Easy to Verify
我们选择了一条不同于主流的技术路径:当社区普遍聚焦竞赛式代码生成时,我们坚定地认为**真实世界的代码任务天然适合执行驱动的强化学习范式**。
【技术突破】
• 首创面向多样化真实场景的Code RL训练框架
• 通过自动化测试用例扩展技术,构建超大规模高质量训练集
• 成功突破传统RL在代码领域的应用局限
【显著成效】
✓ 代码执行准确率实现质的飞跃
✓ 模型能力展现正向迁移效应
✓ 验证了"难解决但易验证"任务的特殊价值
【未来方向】
我们将持续探索具有以下特性的任务场景:
- 解决难度高(Hard to Solve)
- 验证成本低(Easy to Verify)
这类任务将成为强化学习在代码领域的最佳试验场。
Scaling Long-Horizon RL
在真实世界的软件工程任务(如SWE-Bench)中,模型需要具备**持续环境交互**和**自主决策**能力——这正是典型的**长周期强化学习(Long-Horizon RL)**挑战。为此,我们在Qwen3-Coder的后训练阶段创新性地引入了**Agent RL**框架:
【核心技术突破】
🔧 **环境交互引擎**
- 支持多轮工具调用与动态决策
- 通过奖励机制引导模型自主优化解决方案
⚡ **规模化环境系统**
- 首创可验证环境扩展架构
- 基于阿里云基础设施实现**20,000并发环境**实时运行
- 构建了目前最大规模的代码强化学习训练/评估体系
【里程碑成果】
🏆 在SWE-bench Verified基准测试中
• 达到开源模型**SOTA性能**
• 验证了Agent RL在复杂工程任务中的有效性
Code with Qwen3-Coder
Qwen Code
Qwen Code 是一个 CLI工具,修改自Gemini CLI,针对 Qwen3‑Coder系列的模型增强了解析器和工具支持。
step1:安装Qwen Code
确保已安装 Node.js 20 及以上版本,可以通过以下命令安装:
curl -qL https://www.npmjs.com/install.sh | sh
step2:通过 npm 管理器安装 Qwen Code
从 npm 包安装:
npm i -g @qwen-code/qwen-code
从源码安装:
git clone https://github.com/QwenLM/qwen-code
cd qwen-code && npm install && npm install -g .
step3:配置环境变量(使用 OpenAI SDK 调用 LLM)
Qwen Code 支持 OpenAI SDK 调用 LLM,你可以导出以下环境变量,或者简单地将其放在 .envfile 中。
export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"
export OPENAI_MODEL="qwen3-coder-plus"
现在,你可以通过简单地输入 「qwen 」来享受 Qwen-Code 和 Qwen 带来的编程体验。
Claude Code
除了 Qwen Code 之外,现在还可以将 Qwen3‑Coder 与 Claude Code 搭配使用。只需在 阿里云百炼平台 (http://bailian.console.aliyun.com) 申请 API Key,并安装 Claude Code,即可开始畅享编码体验。
npm install -g @anthropic-ai/claude-code
我们提供了两种接入方式,帮助你无缝地用 Qwen3‑Coder 进行编码。
方案 1:使用dashscope提供的代理 API
只需要将Anthropic的base url替换成dashscope上提供的endpoint即可。
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
至此,你就可以直接输入claude 开始使用 Qwen3-Coder & Claude Code
方案 2:使用 claude-code-config 自定义路由
claude-code-router是一个第三方的路由工具,用于为 Claude Code 灵活地切换不同的后端 API。dashscope平台提供了一个简单的扩展包 claude-code-config,可为 claude-code-router 生成包含 dashscope 支持的默认配置。
npm install -g @musistudio/claude-code-router
npm install -g @dashscope-js/claude-code-config
生成配置文件和插件目录:
ccr-dashscope
该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/中的配置。
最后,通过 ccr 开始使用 Claude Code:
ccr code
至此,你即可通过 ccr 使用 Claude Code 畅享 Qwen3‑Coder 的强大编码能力。祝开发顺利!
API
如果你想要通过百炼 API 平台(https://bailian.console.aliyun.com/)调用 Qwen3-Coder,欢迎使用以下示例代码进行测试。
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
prompt = "Help me create a web page for an online bookstore."
# Send request to qwen3-coder-plus model
completion = client.chat.completions.create(
model="qwen3-coder-plus",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": prompt}
],
)
# Print the response
print(completion.choices[0].message.content.strip())
下一步
我们仍在继续努力提升 Coding Agent 的效果,我们希望它能承担更多复杂软件工程中的繁琐任务,解放人类的生产力。Qwen3-Coder 仍有更多尺寸在路上,在保证良好效果的同时降低部署的开销。另外我们也在积极探索 Coding Agent 是否能够实现 self-improving,这是一个令人激动的话题。
没有评论:
发表评论