GLM-5.2:2026 年最强的开放权重编程模型
Zhipu 采用 MIT 许可、具备 1M 上下文的旗舰,在开放权重编程基准测试中名列前茅。这里有已核实的内容、它目前的处境,以及你今天能在 QCode 上使用什么。
GLM-5.2 确实令人印象深刻,但发布周的 API 需求导致了严重的限流,云端访问也带来了数据合规方面的考量。我们目前没有承载它的产能。如果我们能确保可靠、合规的产能,会考虑提供它 —— 在此之前,我们专注于今天已上线的模型。
GLM-5.2 速览
在 Hugging Face 上以 MIT 许可发布(zai-org/GLM-5.2)—— 可自托管。
一百万 token 的窗口,是上一代的四倍。
专家混合架构:256 个专家,每个 token 激活 8 个(约 40B 激活参数)。
在编程与智能体基准测试中排名第一的开放权重模型 —— 仍落后于 Claude Opus 4.8。
已核实的基准测试
来自 Zhipu 发布的官方数据 —— 表现强劲,但请结合背景解读。
来自 Zhipu 发布的官方数据。SWE-bench Pro 62.1 略胜 GPT-5.5(58.6)。请注意,SWE-bench Verified 和 Code Arena 的分数并未正式公布 —— 请忽略捏造的数字 —— 且 GLM-5.2 整体上仍落后于 Claude Opus 4.8,因此「最强开放权重」才是准确的定位。智能指数 51 来自第三方(Artificial Analysis)。
开放权重与云端 API 对比
运行 GLM-5.2 的两种方式 —— 各有截然不同的取舍。
自托管开放权重
MIT 许可允许你在自己的硬件上运行 GLM-5.2 —— 但一个 753B 的 MoE 模型需要相当可观的算力和工程投入。
厂商云端 API
启动最快,但发布周遭遇了严重限流,而将数据路由经过一家中国境内的提供商,会给受监管的工作负载带来合规方面的考量。
QCode 对 GLM-5.2 的立场
我们已评估过 GLM-5.2,并将其作为开放权重模型给予很高评价。但供应紧张、合规需要谨慎处理,所以我们尚未提供它。如果我们能确保可靠、合规的产能,会考虑加入它 —— 并会在这里明确说明。在那之前,我们更愿意为你推荐今天能服务好的模型。
你今天能在 QCode 上使用的模型
生产可用的模型,现在就能通过一个密钥获取。
Claude Opus 4.8
顶级智能体编程。
Codex(GPT-5.5)
终端原生的智能体工作流。
Gemini 3 Pro / 3.5 Flash
1M 上下文推理,快速多模态。
常见问题
GLM-5.2 在 QCode 上可用吗?
目前不可用。我们已评估过它并给予很高评价,但供应受限、合规需要谨慎,所以我们还没有承载它的产能。如果情况改变,我们会考虑加入它。今天你可以在 QCode 上使用 Claude Opus 4.8、Codex(GPT-5.5)和 Gemini。
GLM-5.2 真的是最好的编程模型吗?
它是最强的开放权重模型 —— SWE-bench Pro 62.1,领先 GPT-5.5 —— 但在专有模型领跑者中仍落后于 Claude Opus 4.8。「最强开放权重」是准确的;「整体最强」则不是。
我可以自托管 GLM-5.2 吗?
可以 —— 权重在 Hugging Face 上以 MIT 许可发布。但它是一个 753B 的专家混合模型,因此自托管需要相当可观的 GPU 产能和工程投入。
GLM-5.2 免费吗?
开放权重在 MIT 许可下免费。托管 API 访问是付费的 —— 第三方聚合平台列出的价格约为每百万输入/输出 token $0.95 / $3 —— 且在发布时遭遇了严重限流。