添加微信号:AIGC_Tech,公众号小助手会拉你进群!点击下方名片关注AIGC Studio公众号!
点击下方名片关注AIGC Studio公众号!获取最新AI前沿应用/AIGC实践教程!
与 GLM-4.5 相比,GLM-4.6 带来了几项关键改进:
更长的上下文窗口:上下文窗口已从 128K 扩展到 200K 个标记,使模型能够处理更复杂的代理任务。 卓越的编码性能:该模型在代码基准测试中取得更高的分数,并在 Claude Code、Cline、Roo Code 和 Kilo Code 等应用程序中展现出更佳的实际性能,包括在生成视觉精美的前端页面方面的改进。 高级推理: GLM-4.6推理性能明显提升,并支持推理过程中的工具使用,整体能力更强。 更强大的代理: GLM-4.6 在工具使用和基于搜索的代理方面表现出更强大的性能,并且在代理框架内更有效地集成。 精致的写作:在风格和可读性上更符合人类的偏好,并且在角色扮演场景中表现得更自然。
通过八个公开的基准测试评估了 GLM-4.6,涵盖了代理、推理和编码等多个方面。结果显示,GLM-4.6 的性能明显优于 GLM-4.5,并且与DeepSeek-V3.1-Terminus和Claude Sonnet 4等国内外领先的模型相比也更具竞争力。
推理
GLM-4.5 和 GLM-4.6 都使用相同的推理方法。可参考github了解更多详细信息。
https://github.com/zai-org/GLM-4.5
推荐评估参数
对于一般评估,建议使用1.0 的采样温度。
对于代码相关的评估任务(例如LCB),进一步建议设置:
top_p = 0.95 top_k = 40
相关链接
主页:https://chat.z.ai 论文:https://arxiv.org/pdf/2508.06471 官方文档:https://zhipu-ai.feishu.cn/wiki/Gv3swM0Yci7w7Zke9E0crhU7n7D
使用教程
在 Z.ai API 平台上调用 GLM-4.6 API
Z.ai API 平台提供两种 GLM-4.6 模型。完整的 API 文档和集成指南,参阅https://docs.z.ai/guides/llm/glm-4.6。此外,开发者也可以通过 OpenRouter 访问这两种模型。
将 GLM-4.6 与编码代理一起使用
GLM-4.6 现在可用于编码代理(Claude Code、Kilo Code、Roo Code、Cline 等)。
对于GLM 编码计划订阅者将自动升级到 GLM-4.6。如果之前已自定义应用程序配置(例如~/.claude/settings.json在 Claude Code 中),只需将模型名称更新为"glm-4.6"即可完成升级。
对于新用户:GLM 编码计划提供 Claude 级别的性能,但价格却低得多——只需七分之一的价格,即可获得三倍的使用配额。
立即开始构建:https://z.ai/subscribe。
在 Z.ai 上与 GLM-4.6 聊天
可通过Z.ai选择 GLM-4.6 模型选项访问 GLM-4.6。
在本地提供 GLM-4.6
GLM-4.6 的模型权重已在HuggingFace和ModelScope上公开发布。对于本地部署,GLM-4.6 支持包括 vLLM 和 SGLang 在内的推理框架。完整的部署说明可在上方 GitHub 仓库中找到。
感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~
没有评论:
发表评论