评估中 · 暂无产能

GLM-5.2:2026 年最强的开放权重编程模型

Zhipu 采用 MIT 许可、具备 1M 上下文的旗舰,在开放权重编程基准测试中名列前茅。这里有已核实的内容、它目前的处境,以及你今天能在 QCode 上使用什么。

#GLM-5.2 #开放权重 #编程 #基准测试
🧪
我们的状态:评估中 —— 暂无产能

GLM-5.2 确实令人印象深刻,但发布周的 API 需求导致了严重的限流,云端访问也带来了数据合规方面的考量。我们目前没有承载它的产能。如果我们能确保可靠、合规的产能,会考虑提供它 —— 在此之前,我们专注于今天已上线的模型。

GLM-5.2 速览

MIT
开放权重

在 Hugging Face 上以 MIT 许可发布(zai-org/GLM-5.2)—— 可自托管。

1M
1M 上下文

一百万 token 的窗口,是上一代的四倍。

753B
753B MoE

专家混合架构:256 个专家,每个 token 激活 8 个(约 40B 激活参数)。

#1
开放权重第一

在编程与智能体基准测试中排名第一的开放权重模型 —— 仍落后于 Claude Opus 4.8。

已核实的基准测试

来自 Zhipu 发布的官方数据 —— 表现强劲,但请结合背景解读。

62.1
SWE-bench Pro
81.0
Terminal-Bench 2.1
74.4
FrontierSWE
99.2
AIME 2026
91.2
GPQA-Diamond
76.8
MCP-Atlas

来自 Zhipu 发布的官方数据。SWE-bench Pro 62.1 略胜 GPT-5.5(58.6)。请注意,SWE-bench Verified 和 Code Arena 的分数并未正式公布 —— 请忽略捏造的数字 —— 且 GLM-5.2 整体上仍落后于 Claude Opus 4.8,因此「最强开放权重」才是准确的定位。智能指数 51 来自第三方(Artificial Analysis)。

开放权重与云端 API 对比

运行 GLM-5.2 的两种方式 —— 各有截然不同的取舍。

自托管开放权重

MIT 许可允许你在自己的硬件上运行 GLM-5.2 —— 但一个 753B 的 MoE 模型需要相当可观的算力和工程投入。

厂商云端 API

启动最快,但发布周遭遇了严重限流,而将数据路由经过一家中国境内的提供商,会给受监管的工作负载带来合规方面的考量。

QCode 对 GLM-5.2 的立场

我们已评估过 GLM-5.2,并将其作为开放权重模型给予很高评价。但供应紧张、合规需要谨慎处理,所以我们尚未提供它。如果我们能确保可靠、合规的产能,会考虑加入它 —— 并会在这里明确说明。在那之前,我们更愿意为你推荐今天能服务好的模型。

你今天能在 QCode 上使用的模型

生产可用的模型,现在就能通过一个密钥获取。

Claude Opus 4.8

顶级智能体编程。

Codex(GPT-5.5)

终端原生的智能体工作流。

Gemini 3 Pro / 3.5 Flash

1M 上下文推理,快速多模态。

常见问题

GLM-5.2 在 QCode 上可用吗?

目前不可用。我们已评估过它并给予很高评价,但供应受限、合规需要谨慎,所以我们还没有承载它的产能。如果情况改变,我们会考虑加入它。今天你可以在 QCode 上使用 Claude Opus 4.8、Codex(GPT-5.5)和 Gemini。

GLM-5.2 真的是最好的编程模型吗?

它是最强的开放权重模型 —— SWE-bench Pro 62.1,领先 GPT-5.5 —— 但在专有模型领跑者中仍落后于 Claude Opus 4.8。「最强开放权重」是准确的;「整体最强」则不是。

我可以自托管 GLM-5.2 吗?

可以 —— 权重在 Hugging Face 上以 MIT 许可发布。但它是一个 753B 的专家混合模型,因此自托管需要相当可观的 GPU 产能和工程投入。

GLM-5.2 免费吗?

开放权重在 MIT 许可下免费。托管 API 访问是付费的 —— 第三方聚合平台列出的价格约为每百万输入/输出 token $0.95 / $3 —— 且在发布时遭遇了严重限流。

今天就用一款生产可用的模型

立即注册以使用 Claude、Codex 和 Gemini —— 如果 GLM-5.2 哪天加入阵容,我们会在这里告诉你。