2025年7月31日星期四

国产 AI 太狠了,GLM-4。5 发布就开源。

最近,国内大模型公司智谱开源了模型 GLM-4.5。

推理、代码、智能体综合能力达到开源模型 SOTA 水平

综合平均分 GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。目前在 Hungging face 热度登顶。

太顶了。

图片

补充:SOTA 是 state-of-the-art model 缩写,指在该项研究任务中,目前最好/最先进。

图片

01

直接看效果

我这里简单试了三个 prompt,确实 GLM-4.5 开源模型的效果还是挺惊艳的。

提示词帮我写一个能够发补帖子的博客论坛 demo,要求里面内容,可以新发布帖子。

Kimi-K2 的效果:同样的提示词,Kimi-K2 实现了基础的发帖功能,但是 UI 有些简陋。

Claude-4-Sonnet的效果: UI 太 Claude 了。。。而且点击发布贴子没有响应,我又重新生成了几次,有几次是可以的。

GLM-4.5 的效果:前端 UI 更是那个味儿,发贴功能是没问题的,更重要的是 GLM-4.5 会自动实现前后端的代码。

提示词:帮我开发一个 Google 搜索网站 Demo。

Kimi-K2 的效果:没有去直接开发,而是给到了一个实现方案指引。

Claude-4-Sonnet:UI 的还原是挺不错的,但是搜索「逛逛 GitHub」都是 Mock 的数据。

GLM-4.5 的效果:试了一下,我输入「逛逛 GitHub」真的能检索出内容,而且 UI 样式也是比较还原的。

有点惊艳到我。

提示词:帮我写一个炫酷的 PPT,介绍一下最新开源的 GLM-4.5

Kimi-K2 效果:输入上面提示词还是直接给一个指引而不是直接生成样式,于是我真正给 Kimi 输入的提示词又添加了一个(生成一个 html 的 ppt)

Claude-4-Sonnet效果:也挺不错,就是这个样式太 AI 味儿了。

GLM-4.5效果:不管是内容丰富度、准确性、美观性GLM-4.5 的表现还是非常 Nice 的。

我还测了几个 Case,GLM-4.5 的表现挺牛的。但是公众号文章最多只能上传 10 个视频,更多 Case 大家可以自己去试试。

地址:https://chat.z.ai/

02

开源地址

智谱 AI 已经正式在 Hugging Face 和 GitHub 平台公布这个新一代旗舰大模型 GLM-4.5,专为智能体应用打招的基础模型。

GitHub地址:https://github.com/zai-org/GLM-4.5huggingface地址:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
图片

GLM-4.5 采用混合专家(MoE)架构以更小的激活参数量(仅 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3)获得惊艳的表现。开源模型包括:

GLM-4.5:总参数量 3550 亿,激活参数为 320 亿;

GLM-4.5-Air:总参数量 1060 亿,激活参数为 120 亿;

值得注意的是,GLM-4.5 成功将复杂推理、代码生成与智能体能力实现原生融合,首次在单一模型中统一支持多样化 Agent 场景。

在Agentic、推理、代码生成等评测基准任务中表现亮眼。

图片

这技术突破,就是奔着 Agent 时代做应用基座模型去的

而且模型权重完全遵循 MIT License 全球最宽松的开源协议之一,给开发者极大的使用自由度。

03

超低成本、超快速度

新模型 API 已在 BigModel.cn 上线,价格低至开发者狂笑:
输入:0.8 元 / 百万Tokens
输出:2 元 / 百万Tokens
生成速度 > 100 tokens/秒,推理成本直接砍半,企业级部署不再肉疼。
图片
图片

兼容性拉满,无缝接入 Claude 代码框架,开发者可一键兼容已有 Claude 项目生态,几乎零迁移成本。

智谱在他们的技术博客中说,现有模型有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。

GLM-4.5 正是朝着'统一各种能力'这一目标努力,它能自主拆解任务、调用工具、完成闭环;

期待 Agent 时代,国产 AI 大模型大放异彩,给国产开源 AI 大模型点赞。

智谱这边目前在推一个面向程序员「50块就能包月爽用GLM-4.5,调用量无上限」的活动,可以扫码或者访问下面链接瞧瞧:

https://bigmodel.cn/tokenspropay?productIds=product-38cebb
图片

PS:我好多交流群里面,大家都在疯狂的用 GLM-4.5,效果真的是挺不错的,比之前的 GLM-4 模型强的不是一点半点。

快去亲自试试吧。

04

都看到这了,关注下吧。

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

#逛逛GitHub #AI大模型 #开源 #GitHub #GLM #智谱AI

没有评论:

发表评论

推荐:一个开源免费的团队 AI 编程助手!支持离线部署!很强!

推荐阅读: 6K Star!利用AI大模型,一键解说并剪辑视频!有点强! 强推:一个基于AI驱动的知识库搭建系统!强大好用! 大家好啊!我是老码 ! 每周为大家搜罗分享一些优秀开源项目、工具软件、AI工具等分享!喜欢的童鞋可以点个关注+在看,谢谢啦! 本文推荐一个 非常强的 ...