2026年2月16日星期一

阿里千问3。5开源

性能比肩GPT-5.2，成本降60%！除夕夜，阿里开源千问3.5-Plus，登顶全球最强开源大模型。它基于Transformer创新架构，获NeurIPS最佳论文，性能媲美GPT-5.2等顶级闭源模型。全尺寸开源，训练成本降90%，推理成本降60%，实测编程、建站、推理、数学等任务表现出色。

国内大模型，到底有多卷？

今天，2 月 16 日，除夕夜。

别人在准备年夜饭，阿里巴巴却在开源大模型，千问 Qwen3.5-Plus 官宣发布：

性能媲美 Gemini-3-pro、GPT-5.2 等顶级闭源模型，登顶全球最强开源大模型。

而真正自己部署过模型的人都知道，Qwen 系列有一个非常稀缺的标签：全尺寸开源。

在越来越多厂商只放轻量版、蒸馏版的时候，阿里还在坚持开源完整尺寸模型权重。

上一次开源的 Qwen3 系列的大模型，有多受欢迎，最直观的就是看 huggingface 的下载量，这比什么注册个账号就能点赞的数据，靠谱的多，毕竟一个将近 500GB 的模型权重文件，不是说下就下的。

再看看 DeepSeek 系列的下载量：

现在很多做大模型研究的公司和高校，基本上是左手一个 DeepSeek，右手一个 Qwen。

而 Qwen 之所以能长期站稳一线，不只是"规模大"，更关键的是：他们在 Transformer 经典架构上做了真正的结构级创新。

千问团队自研的门控技术（Gating 机制）相关成果，拿下了 2025 年 NeurIPS Best Paper：

NeurIPS 的含金量，不用多解释：这是全球 AI 顶级会议里的顶级奖项。

换句话说：这不是简单的"参数堆叠"，而是底层架构层面的硬创新。

所以你会发现，国内大模型现在的"卷"，已经不是拼谁先发布，而是拼谁能：

开源完整尺寸
性能追平甚至超越闭源
在顶级会议拿最佳论文
还能持续迭代

除夕夜发模型，这件事本身，就很"中国大模型"。

这样以小胜大的底层架构创新，带来了智能水平、训练和推理效率的大幅提升，**部署成本甚至大降 60%**！

这对于很多公司或者高校来讲，吸引力是"致命的"。

假设一家公司，部署一个模型，A100 机器 + 机房 + 电力 + 运维，一年成本在 150万 ~ 180万。

现在推理成本下降 60%，一年直接省下 90万 ~ 108 万。

而这还只是模型，更别提把模型包装进去的智能体了，60% 节约的都是"几千万级别"的成本。

一、千问 Qwen3.5-Plus 实测

最强"源神"发布即登顶，并且模型本身就是支持多模态理解的，既能处理文本，又能处理图片。

更夸张的是，这次升级的 Qwen3.5 可以实现训练成本暴降 90%，Qwen 3.5 仅用 397B 总参数，每次推理仅激活17B，却可以实现与 GPT-5.2、Gemini-3-pro 同级的性能表现。

OK，那咱们直接实测一下，大家应该都忙着吃年夜饭，应该没时间测，我替大家先"卷"为敬。

所有的官方链接，我都整理放到这里了，有需要的小伙伴自取。

Chat:

https://chat.qwen.ai

GitHub:

https://github.com/QwenLM/Qwen3.5

Qwen Code:

https://github.com/QwenLM/qwen-code

Hugging Face:

https://huggingface.co/collections/Qwen/qwen35

ModelScope:

https://modelscope.cn/collections/Qwen/Qwen35

Blog:

https://qwen.ai/blog?id=qwen3.5

官网一共上线了两个模型：

1、编程题

先来点简单的挑战 LeetCode 编程题，Hard 题目，数据流的中位数。

把题目塞给 Qwen3.5-Plus，这是它给出的 Python 实现代码。

这是复杂度分析，还有一些关键点说明。

代码拿去测试，轻松通过：

2、做网站

我试着做了一个很火的，3D 粒子交互网站。

直接输入提示词：帮我实现一个交互网站，Three.js 粒子星球与手势控制。

我需求描述的很简单，属于很懒不愿意细写提示词的，它是这样回复的：

Qwen3.5-Plus 提供了一个基础版的，如果想实现更高级的"隔空手势控制"，它也能帮我做，这是第一版的效果：

这是完全鼠标控制的转动和缩放。我让它继续优化，它详细列出了升级优化点：

这是最终的启动效果，手势控制缩放，旋转都轻松搞定了。

3、智力

Qwen3.5-Plus 的推理智力也是超绝，我给它了一个陷阱题。

我想去洗车，洗车店距离我家50米。

你说我应该开车过去还是走过去？

它先进行了逻辑推理，并评估可行方案，最后给出结论。

这是最终的答案干脆利落，开车过去，因为你要洗的是车。

最后，还不忘给你一个可爱的表情。

这什么意思？何意味？

我又出了一道题：

过年了，我想去买一只200斤的帝王蟹当作年夜饭，我应该怎么拿到家里？

开车过去，还是走过去？

它是先认真思考了，规划了一下，然后审视问题背后的逻辑。

然后识别出异常信息，还要保持友好引导对话。

简直太严谨了，为了不伤我，还融入了幽默感。

这是它给我的答复：先别纠结怎么拿，因为根本买不到！

它还祝我新年快乐，也不知道应该说，阿里的程序员，有心了，感谢。还是说 Qwen3.5-Plus，有心了，感谢。

4、数学难题

甚至这种，图 + 公示，这种复杂的数学题，都能解决了。

这回要是让 Qwen3.5-Plus 参加高考，不得至少得个 650 分以上？

二、絮叨

Qwen3.5-Plus 可以上传文件、图像、视频、音频各种附件，还有深入研究，网页开发等各种技能。

今天跟同样在卷的朋友聊天，看到阿里官宣，我们都第一时间在测了。

阿里太强了，Qwen 3.5-Plus 绝对赶上，甚至超过很多闭源大模型了。

今天就卷到这了，我先去干个饭了，祝大家除夕快乐哦，干杯~

没有评论:

发表评论

订阅：博文评论 (Atom)

AI I024