评估中 · 暂无产能

GLM-5.2：2026 年最强的开放权重编程模型

Zhipu 采用 MIT 许可、具备 1M 上下文的旗舰，在开放权重编程基准测试中名列前茅。这里有已核实的内容、它目前的处境，以及你今天能在 QCode 上使用什么。

#GLM-5.2 #开放权重 #编程 #基准测试

🧪

我们的状态：评估中 —— 暂无产能

GLM-5.2 确实令人印象深刻，但发布周的 API 需求导致了严重的限流，云端访问也带来了数据合规方面的考量。我们目前没有承载它的产能。如果我们能确保可靠、合规的产能，会考虑提供它 —— 在此之前，我们专注于今天已上线的模型。

GLM-5.2 速览

MIT

开放权重

在 Hugging Face 上以 MIT 许可发布（zai-org/GLM-5.2）—— 可自托管。

1M 上下文

一百万 token 的窗口，是上一代的四倍。

753B

753B MoE

专家混合架构：256 个专家，每个 token 激活 8 个（约 40B 激活参数）。

开放权重第一

在编程与智能体基准测试中排名第一的开放权重模型 —— 仍落后于 Claude Opus 4.8。

已核实的基准测试

来自 Zhipu 发布的官方数据 —— 表现强劲，但请结合背景解读。

62.1

SWE-bench Pro

81.0

Terminal-Bench 2.1

74.4

FrontierSWE

99.2

AIME 2026

91.2

GPQA-Diamond

76.8

MCP-Atlas

来自 Zhipu 发布的官方数据。SWE-bench Pro 62.1 略胜 GPT-5.5（58.6）。请注意，SWE-bench Verified 和 Code Arena 的分数并未正式公布 —— 请忽略捏造的数字 —— 且 GLM-5.2 整体上仍落后于 Claude Opus 4.8，因此「最强开放权重」才是准确的定位。智能指数 51 来自第三方（Artificial Analysis）。

开放权重与云端 API 对比

运行 GLM-5.2 的两种方式 —— 各有截然不同的取舍。

自托管开放权重

MIT 许可允许你在自己的硬件上运行 GLM-5.2 —— 但一个 753B 的 MoE 模型需要相当可观的算力和工程投入。

厂商云端 API

启动最快，但发布周遭遇了严重限流，而将数据路由经过一家中国境内的提供商，会给受监管的工作负载带来合规方面的考量。

QCode 对 GLM-5.2 的立场

我们已评估过 GLM-5.2，并将其作为开放权重模型给予很高评价。但供应紧张、合规需要谨慎处理，所以我们尚未提供它。如果我们能确保可靠、合规的产能，会考虑加入它 —— 并会在这里明确说明。在那之前，我们更愿意为你推荐今天能服务好的模型。

你今天能在 QCode 上使用的模型

生产可用的模型，现在就能通过一个密钥获取。

Claude Opus 4.8

顶级智能体编程。

Codex（GPT-5.5）

终端原生的智能体工作流。

Gemini 3 Pro / 3.5 Flash

1M 上下文推理，快速多模态。

常见问题

GLM-5.2 在 QCode 上可用吗？

目前不可用。我们已评估过它并给予很高评价，但供应受限、合规需要谨慎，所以我们还没有承载它的产能。如果情况改变，我们会考虑加入它。今天你可以在 QCode 上使用 Claude Opus 4.8、Codex（GPT-5.5）和 Gemini。

GLM-5.2 真的是最好的编程模型吗？

它是最强的开放权重模型 —— SWE-bench Pro 62.1，领先 GPT-5.5 —— 但在专有模型领跑者中仍落后于 Claude Opus 4.8。「最强开放权重」是准确的；「整体最强」则不是。

我可以自托管 GLM-5.2 吗？

可以 —— 权重在 Hugging Face 上以 MIT 许可发布。但它是一个 753B 的专家混合模型，因此自托管需要相当可观的 GPU 产能和工程投入。

GLM-5.2 免费吗？

开放权重在 MIT 许可下免费。托管 API 访问是付费的 —— 第三方聚合平台列出的价格约为每百万输入/输出 token $0.95 / $3 —— 且在发布时遭遇了严重限流。

今天就用一款生产可用的模型

立即注册以使用 Claude、Codex 和 Gemini —— 如果 GLM-5.2 哪天加入阵容，我们会在这里告诉你。

免费注册查看定价查看支持的模型