性能比肩GPT-5.2,成本降60%!除夕夜,阿里开源千问3.5-Plus,登顶全球最强开源大模型。它基于Transformer创新架构,获NeurIPS最佳论文,性能媲美GPT-5.2等顶级闭源模型。全尺寸开源,训练成本降90%,推理成本降60%,实测编程、建站、推理、数学等任务表现出色。
国内大模型,到底有多卷?
今天,2 月 16 日,除夕夜。
别人在准备年夜饭,阿里巴巴却在开源大模型,千问 Qwen3.5-Plus 官宣发布:
性能媲美 Gemini-3-pro、GPT-5.2 等顶级闭源模型,登顶全球最强开源大模型。
而真正自己部署过模型的人都知道,Qwen 系列有一个非常稀缺的标签:全尺寸开源。
在越来越多厂商只放轻量版、蒸馏版的时候,阿里还在坚持开源完整尺寸模型权重。
上一次开源的 Qwen3 系列的大模型,有多受欢迎,最直观的就是看 huggingface 的下载量,这比什么注册个账号就能点赞的数据,靠谱的多,毕竟一个将近 500GB 的模型权重文件,不是说下就下的。
再看看 DeepSeek 系列的下载量:
现在很多做大模型研究的公司和高校,基本上是左手一个 DeepSeek,右手一个 Qwen。
而 Qwen 之所以能长期站稳一线,不只是"规模大",更关键的是:他们在 Transformer 经典架构上做了真正的结构级创新。
千问团队自研的门控技术(Gating 机制)相关成果,拿下了 2025 年 NeurIPS Best Paper:
NeurIPS 的含金量,不用多解释:这是全球 AI 顶级会议里的顶级奖项。
换句话说:这不是简单的"参数堆叠",而是底层架构层面的硬创新。
所以你会发现,国内大模型现在的"卷",已经不是拼谁先发布,而是拼谁能:
开源完整尺寸 性能追平甚至超越闭源 在顶级会议拿最佳论文 还能持续迭代
除夕夜发模型,这件事本身,就很"中国大模型"。
这样以小胜大的底层架构创新,带来了智能水平、训练和推理效率的大幅提升,**部署成本甚至大降 60%**!
这对于很多公司或者高校来讲,吸引力是"致命的"。
假设一家公司,部署一个模型,A100 机器 + 机房 + 电力 + 运维,一年成本在 150万 ~ 180万。
现在推理成本下降 60%,一年直接省下 90万 ~ 108 万。
而这还只是模型,更别提把模型包装进去的智能体了,60% 节约的都是"几千万级别"的成本。
一、千问 Qwen3.5-Plus 实测
最强"源神"发布即登顶,并且模型本身就是支持多模态理解的,既能处理文本,又能处理图片。
更夸张的是,这次升级的 Qwen3.5 可以实现训练成本暴降 90%,Qwen 3.5 仅用 397B 总参数,每次推理仅激活17B,却可以实现与 GPT-5.2、Gemini-3-pro 同级的性能表现。
OK,那咱们直接实测一下,大家应该都忙着吃年夜饭,应该没时间测,我替大家先"卷"为敬。
所有的官方链接,我都整理放到这里了,有需要的小伙伴自取。
Chat:
https://chat.qwen.ai
GitHub:
https://github.com/QwenLM/Qwen3.5
Qwen Code:
https://github.com/QwenLM/qwen-code
Hugging Face:
https://huggingface.co/collections/Qwen/qwen35
ModelScope:
https://modelscope.cn/collections/Qwen/Qwen35
Blog:
https://qwen.ai/blog?id=qwen3.5
官网一共上线了两个模型:
1、编程题
先来点简单的挑战 LeetCode 编程题,Hard 题目,数据流的中位数。
把题目塞给 Qwen3.5-Plus,这是它给出的 Python 实现代码。
这是复杂度分析,还有一些关键点说明。
代码拿去测试,轻松通过:
2、做网站
我试着做了一个很火的,3D 粒子交互网站。
直接输入提示词:帮我实现一个交互网站,Three.js 粒子星球与手势控制。
我需求描述的很简单,属于很懒不愿意细写提示词的,它是这样回复的:
Qwen3.5-Plus 提供了一个基础版的,如果想实现更高级的"隔空手势控制",它也能帮我做,这是第一版的效果:
这是完全鼠标控制的转动和缩放。我让它继续优化,它详细列出了升级优化点:
这是最终的启动效果,手势控制缩放,旋转都轻松搞定了。
3、智力
Qwen3.5-Plus 的推理智力也是超绝,我给它了一个陷阱题。
我想去洗车,洗车店距离我家50米。
你说我应该开车过去还是走过去?
它先进行了逻辑推理,并评估可行方案,最后给出结论。
这是最终的答案干脆利落,开车过去,因为你要洗的是车。
最后,还不忘给你一个可爱的表情。
这什么意思?何意味?
我又出了一道题:
过年了,我想去买一只200斤的帝王蟹当作年夜饭,我应该怎么拿到家里?
开车过去,还是走过去?
它是先认真思考了,规划了一下,然后审视问题背后的逻辑。
然后识别出异常信息,还要保持友好引导对话。
简直太严谨了,为了不伤我,还融入了幽默感。
这是它给我的答复:先别纠结怎么拿,因为根本买不到!
它还祝我新年快乐,也不知道应该说,阿里的程序员,有心了,感谢。还是说 Qwen3.5-Plus,有心了,感谢。
4、数学难题
甚至这种,图 + 公示,这种复杂的数学题,都能解决了。
这回要是让 Qwen3.5-Plus 参加高考,不得至少得个 650 分以上?
二、絮叨
Qwen3.5-Plus 可以上传文件、图像、视频、音频各种附件,还有深入研究,网页开发等各种技能。
今天跟同样在卷的朋友聊天,看到阿里官宣,我们都第一时间在测了。
阿里太强了,Qwen 3.5-Plus 绝对赶上,甚至超过很多闭源大模型了。
今天就卷到这了,我先去干个饭了,祝大家除夕快乐哦,干杯~
没有评论:
发表评论