阿里推出了迄今为止最具代理性的代码模型Qwen3-Coder,Qwen3 -Coder有多种尺寸可供选择,首先
阿里推出了迄今为止最具代理性的代码模型Qwen3-Coder,Qwen3 -Coder有多种尺寸可供选择,首先推出的是最强大的版本:Qwen3-Coder-480B-A35B-Instruct。它具有以下主要增强功能:
在Agentic Coding、Agentic Browser-Use和其他基础编码任务的开放模型中表现出色,取得了与 Claude Sonnet 相当的成果。 长上下文功能原生支持256K 个令牌,可使用 Yarn 扩展至1M 个令牌,并针对存储库规模的理解进行了优化。 Agentic Coding支持大多数平台,例如Qwen Code、CLINE,具有专门设计的函数调用格式。
Qwen3-Coder
预训练
预训练仍有扩展空间——借助 Qwen3-Coder,我们正在从多个维度推进,以增强模型的核心功能:
扩展代币:7.5T 代币(70% 的代码率),在保留通用和数学能力的同时,具有出色的编码能力。
扩展上下文:本机支持 256K 上下文,并且可以通过 YaRN 扩展至 1M,针对 repo 规模和动态数据(例如,拉取请求)进行了优化,以增强 Agentic Coding。
扩展合成数据:利用 Qwen2.5-Coder 清理和重写噪声数据,显著提高整体数据质量。
训练后
扩展代码强化学习:难以解决,但易于验证
与社区普遍关注的竞技级代码生成不同,我们相信所有代码任务都天生适合执行驱动的大规模强化学习。因此,我们将代码强化学习的训练扩展到更广泛的真实编码任务。通过自动扩展多样化编码任务的测试用例,我们创建了高质量的训练实例,并成功释放了强化学习的全部潜力。这不仅显著提高了代码执行的成功率,也为其他任务带来了收益。这激励我们继续探索那些难以解决但易于验证的任务,将其作为大规模强化学习的沃土。
扩展长视野强化学习
使用 Qwen3-Coder 进行编码
Qwen代码
Qwen Code 是一款改编自 Gemini CLI 的研究用途 CLI 工具,增强了对 Qwen-Coder 模型的解析器和工具支持。
确保你已经安装了 nodejs 20+:
您可以通过以下命令安装它:
curl -qL https://www.npmjs.com/install.sh | sh
然后通过 npm 管理器安装 Qwen 代码:
npm i -g @qwen-code/qwen-code
另一种方法是从源安装:
git clone https://github.com/QwenLM/qwen-code.git cd qwen-code && npm install && npm install -g
Qwen Code 在调用 LLM 时支持 OpenAI SDK,您可以导出以下环境变量,或者简单地将它们放在.envfile.
export OPENAI_API_KEY="your_api_key_here" export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1" export OPENAI_MODEL="qwen3-coder-plus"
现在,只需输入:qwen!即可使用 Qwen-Code 和 Qwen 享受您的氛围编码!
Cline
将 Qwen3-Coder-480B-A35B-Instruct 配置为 cline 转到 Cline 配置设置 对于 API 提供程序,选择"OpenAI Compatible" 对于 OpenAI Compatible API 密钥,输入从 Dashscope 获取的密钥 选中"使用自定义基本 URL"并输入:https://dashscope-intl.aliyuncs.com/compatible-mode/v1
输入qwen3-coder-plus
相关链接
博客:https://qwenlm.github.io/blog/qwen3-coder/ 代码:https://github.com/QwenLM/Qwen3-Coder 模型:https://www.modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct 论文:https://arxiv.org/abs/2505.09388
Demo展示
感谢你看到这里,也欢迎点击关注下方公众号并添加公众号小助手加入官方读者交流群,一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术,欢迎一起交流学习💗~
没有评论:
发表评论