2026年2月16日星期一

阿里千问3。5开源

性能比肩GPT-5.2,成本降60%!除夕夜,阿里开源千问3.5-Plus,登顶全球最强开源大模型。它基于Transformer创新架构,获NeurIPS最佳论文,性能媲美GPT-5.2等顶级闭源模型。全尺寸开源,训练成本降90%,推理成本降60%,实测编程、建站、推理、数学等任务表现出色。

国内大模型,到底有多卷?

今天,2 月 16 日,除夕夜。

别人在准备年夜饭,阿里巴巴却在开源大模型,千问 Qwen3.5-Plus 官宣发布

图片

性能媲美 Gemini-3-pro、GPT-5.2 等顶级闭源模型,登顶全球最强开源大模型。

图片

而真正自己部署过模型的人都知道,Qwen 系列有一个非常稀缺的标签:全尺寸开源

在越来越多厂商只放轻量版、蒸馏版的时候,阿里还在坚持开源完整尺寸模型权重

上一次开源的 Qwen3 系列的大模型,有多受欢迎,最直观的就是看 huggingface 的下载量,这比什么注册个账号就能点赞的数据,靠谱的多,毕竟一个将近 500GB 的模型权重文件,不是说下就下的。

图片

再看看 DeepSeek 系列的下载量:

图片
图片
图片

现在很多做大模型研究的公司和高校,基本上是左手一个 DeepSeek,右手一个 Qwen。

而 Qwen 之所以能长期站稳一线,不只是"规模大",更关键的是:他们在 Transformer 经典架构上做了真正的结构级创新。

千问团队自研的门控技术(Gating 机制)相关成果,拿下了 2025 年 NeurIPS Best Paper

图片

NeurIPS 的含金量,不用多解释:这是全球 AI 顶级会议里的顶级奖项

换句话说:这不是简单的"参数堆叠",而是底层架构层面的硬创新。

所以你会发现,国内大模型现在的"卷",已经不是拼谁先发布,而是拼谁能:

  • 开源完整尺寸
  • 性能追平甚至超越闭源
  • 在顶级会议拿最佳论文
  • 还能持续迭代

除夕夜发模型,这件事本身,就很"中国大模型"。

这样以小胜大的底层架构创新,带来了智能水平、训练和推理效率的大幅提升,**部署成本甚至大降 60%**!

这对于很多公司或者高校来讲,吸引力是"致命的"

假设一家公司,部署一个模型,A100 机器 + 机房 + 电力 + 运维,一年成本在 150万 ~ 180万。

现在推理成本下降 60%,一年直接省下 90万 ~ 108 万。

而这还只是模型,更别提把模型包装进去的智能体了,60% 节约的都是"几千万级别"的成本。

一、千问 Qwen3.5-Plus 实测

最强"源神"发布即登顶,并且模型本身就是支持多模态理解的,既能处理文本,又能处理图片。

更夸张的是,这次升级的 Qwen3.5 可以实现训练成本暴降 90%,Qwen 3.5 仅用 397B 总参数,每次推理仅激活17B,却可以实现与 GPT-5.2、Gemini-3-pro 同级的性能表现。

OK,那咱们直接实测一下,大家应该都忙着吃年夜饭,应该没时间测,我替大家先"卷"为敬。

图片

所有的官方链接,我都整理放到这里了,有需要的小伙伴自取。

Chat:

https://chat.qwen.ai

GitHub:

https://github.com/QwenLM/Qwen3.5

Qwen Code:

https://github.com/QwenLM/qwen-code

Hugging Face:

https://huggingface.co/collections/Qwen/qwen35

ModelScope:

https://modelscope.cn/collections/Qwen/Qwen35

Blog:

https://qwen.ai/blog?id=qwen3.5

官网一共上线了两个模型:

图片

1、编程题

先来点简单的挑战 LeetCode 编程题,Hard 题目,数据流的中位数。

图片

把题目塞给 Qwen3.5-Plus,这是它给出的 Python 实现代码。

图片

这是复杂度分析,还有一些关键点说明。

图片

代码拿去测试,轻松通过:

图片

2、做网站

我试着做了一个很火的,3D 粒子交互网站。

直接输入提示词:帮我实现一个交互网站,Three.js 粒子星球与手势控制。

我需求描述的很简单,属于很懒不愿意细写提示词的,它是这样回复的:

图片

Qwen3.5-Plus 提供了一个基础版的,如果想实现更高级的"隔空手势控制",它也能帮我做,这是第一版的效果:

这是完全鼠标控制的转动和缩放。我让它继续优化,它详细列出了升级优化点:

图片

这是最终的启动效果,手势控制缩放,旋转都轻松搞定了。

3、智力

Qwen3.5-Plus 的推理智力也是超绝,我给它了一个陷阱题。

我想去洗车,洗车店距离我家50米。

你说我应该开车过去还是走过去?

它先进行了逻辑推理,并评估可行方案,最后给出结论。

图片

这是最终的答案干脆利落,开车过去,因为你要洗的是车。

图片

最后,还不忘给你一个可爱的表情。

图片

这什么意思?何意味?

我又出了一道题:

过年了,我想去买一只200斤的帝王蟹当作年夜饭,我应该怎么拿到家里?

开车过去,还是走过去?

它是先认真思考了,规划了一下,然后审视问题背后的逻辑。

图片

然后识别出异常信息,还要保持友好引导对话。

图片

简直太严谨了,为了不伤我,还融入了幽默感。

图片

这是它给我的答复:先别纠结怎么拿,因为根本买不到!

图片

它还祝我新年快乐,也不知道应该说,阿里的程序员,有心了,感谢。还是说 Qwen3.5-Plus,有心了,感谢。

4、数学难题

甚至这种,图 + 公示,这种复杂的数学题,都能解决了。

这回要是让 Qwen3.5-Plus 参加高考,不得至少得个 650 分以上?

二、絮叨

Qwen3.5-Plus 可以上传文件、图像、视频、音频各种附件,还有深入研究,网页开发等各种技能。

图片

今天跟同样在卷的朋友聊天,看到阿里官宣,我们都第一时间在测了。

图片

阿里太强了,Qwen 3.5-Plus 绝对赶上,甚至超过很多闭源大模型了。

今天就卷到这了,我先去干个饭了,祝大家除夕快乐哦,干杯~

图片

没有评论:

发表评论

Jaguar开源OA系统:可视化流程设计赋能中小企业数字化转型

基于Furion与Vue.js开发的企业级开源OA系统,提供可视化流程/表单设计、任务审批、流程监控等核心功能,支持商业化与二次开发,专注解决中小企业流程复杂、IT资源匮乏痛点,助力降本增效。 企业级OA开源!系统提供了可视化的流程设计、表单设计、任务审批、流程监控等核心功能...