体验了2天的GLM-5后,我果断把claude模型换掉了
这几天放假在家,本来打算好好躺尸几天,什么都不想,什么都不干。
然而,GLM-5 发布了!
我正躺在床上刷手机,看到这个消息的瞬间,整个人直接从床上坐了起来。
从我的渠道得到的消息,都说 GLM-5 这次更新的模型很强悍,性能直逼 Claude Opus 4.5。更关键的是——GLM-5 是开源的!
躺不住了,是真的躺不住了。
要知道,在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。
我算是骨灰级的Vibe Coding玩家了,我知道,如果GLM-5性能逼近claude opus 4.5意味着什么。
用过Claude的都知道,我们就怕2个问题,1个是封号,另外一个是贵用不起。
为了用上Claude、我是想尽了办法。什么家庭静态IP、中转代理什么的。
平时对Claude依赖太多了,只要Claude code出问题,一天的开发任务都进行不下去了
GLM-5,真的能成为 Claude 的完美替代品吗?
让我们用实际测试来验证一下!
在使用 AI 写代码时,我最关心两个核心能力
前端审美能力
生成的界面是否美观、现代,能否达到专业设计师的水准
后端的工程能力
能否合理规划项目的分层结构 代码逻辑正确性,功能是否能完成
前端审美能力比拼
前端的审美能力,我直接使用下方的提示词进行测试
请使用网站设计skiils, 帮我开发个openclaw的网站首页落地页,主题是openclaw快速构建agent平台,要保证美观,具有设计感,不允许使用紫色
先来看看GLM-5的效果怎么
GLM-5写的代码,背景用了深色的渐变色,整体看起来科技感十足。
让我觉得惊艳的,是右侧的代码框,那个代码框里面的代码是一个一个蹦出来的,像是在写代码一样,很有科技感。
整体而言,我对这个设计非常满意。
我们再来看看Claude opus 4.5的效果怎么样
整体上看,GLM-5和Claude做出来的网页一样美观。
说起来,我有点震惊,为什么他们看起来那么相似。
不同的是他们的渐变色不一样!!!
后端工程能力比拼
后端工程能力对架构设计和模块化的要求更高,需要统筹考虑系统架构、不同模块间的协作以及整体技术方案。
我用下面的这个需求,来挑战GLM-5模型和claude opus 4.5模型
请帮我开发一个类似淘宝的电商网站,请设计好功能模块后,和我确认,我同意后再开始开发,所有都适用mock数据,让我能够直接看到效果
这个提示词虽然简短,但它要求模型先进行功能设计,而功能模块的设计过程恰好考察了模型的任务分解能力。
先来看看GLM-5模型的结果是咋样的
功能看起来很齐全,不过,我没有提示此里面说明使用什么技术框架,模型自动列出来让我选择
选择了对应的技术框架后,就慢慢等了
从拆解出来的要实现的模块来看,工作量还真不小,如果要人来做的话,没几个星期还真拿不下来
最后,咱们来看看结果
其实用GLM-5并不是一下子运行就成功了,在最后出现几个问题运行不起来,但GLM-5还是能够解决的。
然后来看看claude opus 4.5的模块功能看起来很齐全,不过claude opus 4.5拆解的更细致一些,还有实现的路径
同样的,在选择了技术框架后,就是继续静静地等待了。。。
最后看,claude opus 4.5是新的效果
功能都实现了,逻辑也正常,而且还是一次性过,这点比GLM-5强一些。
最终看来,GLM-5确实有一点点不如claude opus 4.5,但是从我的体验效果来看,他们确实已经和接近了。
GLM-5,claude的完美替代
从目前我体验的效果来看,GLM-5 真的是Claude的最完美的替代品了。
审美能力,工程能力都和Claude opus 4.5很接近
对我来说,最大的福报就是不用再担心 API 突然被封、Claude Code 说不能用就不能用了。这种稳定性,太珍贵了。
GLM-5 这次真的很豪气——这么强的模型,居然选择开源!现在在 Hugging Face 和 ModelScope 都能直接下载,这对开发者来说简直是天大的好消息。
最近我也在折腾 OpenClaw 和 GLM-5,刚好可以无缝用起来了。真心希望更多朋友能体验到这种"不被卡脖子"的自由感。
本次分享就到这里,希望大家都能用起来,一起享受开源的红利
没有评论:
发表评论