模型对比

Claude Sonnet 5 对比 Claude Opus 4.8

Anthropic 的全新中端模型 Sonnet 5 以约 40% 更低的价格逼近旗舰 Opus 4.8。本文讲清楚每个模型真正的优势所在、实际定价究竟如何,以及如何在两者之间进行路由。

#Claude Sonnet 5 #Claude Opus 4.8 #编程 #智能体
结论

默认用 Sonnet 5;最难的工作再上 Opus 4.8

把 Claude Sonnet 5 作为日常默认:它以中端价格提供速度与智能的最佳组合,Anthropic 也将其性能描述为接近 Opus 4.8。只在最难的编程、判断和网络安全任务上才升级到 Claude Opus 4.8,那里旗舰仍然领先。

Anthropic 未发布任何确切的基准数字,只有定性的「接近 Opus 4.8」表述,因此你在别处看到的任何硬性正面对比分数都应视为第三方估算,而非 Anthropic 官方结果。

两个模型,两种定位

Anthropic · Claude Sonnet 5

Claude Sonnet 5(模型 id claude-sonnet-5,发布于 2026-06-30)是 Anthropic 全新的中端模型,定位介于 Claude Haiku 4.5 和 Claude Opus 4.8 之间。它面向智能体和编程工作打造,默认开启自适应思考,是 Free 和 Pro 套餐的默认模型。Anthropic 称其性能以约 40% 更低的价格接近 Opus 4.8。

Anthropic · Claude Opus 4.8

Claude Opus 4.8 仍是 Anthropic 的前沿旗舰。它在最难的编程、判断和网络安全任务上继续领先,在那些场景下,多一点原始能力值得更高的价格。当任务确实处于前沿、且正确性比速度或成本更重要时,就用它。

规格对比

Sonnet 4.6 作参照,Sonnet 5 为新默认,Opus 4.8 为旗舰。

规格项 Sonnet 4.6 Sonnet 5 Opus 4.8
定位上一代中端新默认中端前沿旗舰
输入价格(每 MTok)$3$2 促销 / $3 标准$5
输出价格(每 MTok)$15$10 促销 / $15 标准$25
上下文窗口1M tokens1M tokens1M tokens
最大输出64K tokens128K tokens(300K beta)128K tokens
思考扩展思考自适应,默认开启自适应,默认开启
知识截止更早2026年1月较新

Sonnet 5 促销定价($2/$10)持续至 2026年8月31日;标准定价($3/$15)自 2026年9月1日起生效。来源:anthropic.com/news/claude-sonnet-5 及 platform.claude.com 文档。

基准:我们能诚实说清的部分

无 Anthropic 官方分数发布;仅有第三方估算

Anthropic 尚未发布 Claude Sonnet 5 的确切基准数字。其唯一的公开表述是定性的:性能「接近 Opus 4.8」。你看到的任何比较两者的 SWE-bench、Terminal-Bench 或 OSWorld 数字都是第三方估算,而非 Anthropic 官方结果,应谨慎看待。

从方向上看,第三方报告称 Opus 4.8 在智能体编程上仍以微弱优势领先,这与 Anthropic 自身的定位一致:Sonnet 5 逼近旗舰,而非追平或超越。在日常编程、重构和工具调用循环中,差距往往小到 Sonnet 5 的速度和价格在整体价值上胜出。

因此我们的建议依托于定性表述和真实世界的路由,而非某个单一的排行榜数字。Sonnet 5 逼近 Opus 4.8;Opus 4.8 在最难的长尾上领先。如果你需要一个硬性数字来做决策,就在你自己的任务上跑自己的评测——这胜过任何借来的基准。

各自的优势场景

Sonnet 5 的优势场景

  • 对成本敏感、高吞吐的工作负载:比 Opus 4.8 便宜约 40%,让长智能体循环和批处理作业保持可负担。
  • 速度与响应性:速度与智能的最佳组合,非常适合交互式编程和对话。
  • 日常编程和智能体工具调用,其能力接近 Opus 4.8,而价格差距具有决定性。
  • 默认可用:它是 Free 和 Pro 套餐的默认模型,也是 Sonnet 4.6 的推荐继任者。

Opus 4.8 的领先场景

  • 最难的编程任务:大规模架构改动、密集的多文件重构,以及微妙的调试。
  • 前沿判断:细微的权衡取舍和密集上下文推理,那些微小的能力优势至关重要。
  • 网络安全和安全敏感的工作,旗舰额外的余量可降低风险。
  • 任何值得付 $5/$25、而非 Sonnet 5 中端价格来站在最前沿的任务。

价格并排对比

Sonnet 5 比 Opus 4.8 便宜约 40%——但有一个重要的分词器注意事项。

价格(每 MTok) Sonnet 5 Opus 4.8
输入$2 促销 / $3 标准$5
输出$10 促销 / $15 标准$25
缓存读取$0.20 促销 / $0.30 标准旗舰费率

分词器注意事项: Sonnet 5 采用新的分词器,对同样的文本会比 Sonnet 4.6 多消耗约 30% 的 tokens,因此每次请求的实际成本高于标价所暗示的水平。促销价更准确地说是相对 Sonnet 4.6 的 $3/$15 大致成本中性,而非在相同文本上直接打 33% 折扣。相较 Opus 4.8,约 40% 的节省是真实的,但请把 token 膨胀纳入你自己的估算。促销费率持续至 2026年8月31日;标准费率自 2026年9月1日起生效。

一个简单的路由框架

默认走低端,只在任务值得时才升级。

1. 默认用 Sonnet 5

把大部分流量——对话、日常编程、智能体步骤、摘要、抽取——发给 Sonnet 5。它快、便宜,在大多数真实任务上接近 Opus 4.8。

2. 升级最难的长尾

当 Sonnet 5 卡住时,把请求提升到 Opus 4.8:前沿推理、大规模重构、微妙的 bug、安全敏感或高风险判断。一个在失败时用 Opus 4.8 重试的分层路由器,能以极低的成本获取大部分质量。

3. 测量,别猜

在你自己的工作负载上跟踪每个任务的成功率和成本。如果 Sonnet 5 达标,就保留它作默认;把 Opus 4.8 留给它能可测量地胜出的那些切片。

通过 QCode 同时使用两者

QCode 让你在 Claude Code 中用一个端点和一把密钥同时使用 Claude Sonnet 5 和 Claude Opus 4.8——只需切换一个环境变量即可切换模型,从而把简单工作路由到 Sonnet 5,把最难的长尾路由到 Opus 4.8。

Claude Code (Claude Sonnet 5)
export ANTHROPIC_BASE_URL="https://api.qcode.cc"
export ANTHROPIC_AUTH_TOKEN="$QCODE_KEY"
export ANTHROPIC_MODEL="claude-sonnet-5"
claude
Claude Code (Claude Opus 4.8)
export ANTHROPIC_BASE_URL="https://api.qcode.cc"
export ANTHROPIC_AUTH_TOKEN="$QCODE_KEY"
export ANTHROPIC_MODEL="claude-opus-4-8"
claude

常见问题

Claude Sonnet 5 比 Opus 4.8 更好吗?

整体上并非如此。Anthropic 将 Sonnet 5 定位为中端模型,其性能以约 40% 更低的价格接近 Opus 4.8,但 Opus 4.8 在最难的编程、判断和网络安全任务上仍然领先。Anthropic 未发布任何确切的基准数字,只有定性的「接近 Opus 4.8」表述。日常为了速度和成本默认用 Sonnet 5,任务确实处于前沿时再上 Opus 4.8。

Sonnet 5 和 Opus 4.8 的价格差距是多少?

Sonnet 5 便宜约 40%。在持续至 2026年8月31日的促销期内,为每百万输入 tokens $2、每百万输出 tokens $10,自 2026年9月1日起升至标准的 $3 / $15。Opus 4.8 为输入 $5 / 输出 $25。注意 Sonnet 5 的新分词器对同样的文本会多消耗约 30% 的 tokens,因此每次请求的实际差距小于标价所暗示的水平。

做智能体,Sonnet 5 和 Opus 4.8 哪个更好?

对大多数智能体和编程工作流,Sonnet 5 是默认选择:它兼具速度、自适应思考和低成本,让长的多步循环变得可负担。当智能体在前沿级推理、棘手重构或安全敏感工作上卡住时,把个别难步骤升级到 Opus 4.8。一个默认走 Sonnet 5、只把最难请求提升到 Opus 4.8 的分层路由器,通常能给出最佳的成本/质量权衡。

在 Claude Code 里我该用 Sonnet 5 还是 Opus 4.8?

两者都能在 Claude Code 里运行。凭借速度和更低的价格,Sonnet 5 是推荐的日常主力,也是 Free 和 Pro 套餐的默认模型。遇到最难的任务再切换到 Opus 4.8:大规模架构改动、微妙的调试、密集上下文判断,或额外前沿能力物有所值的网络安全工作。

通过一个端点运行 Sonnet 5 和 Opus 4.8

注册 QCode,把简单工作路由到 Sonnet 5,把最难的长尾路由到 Opus 4.8——无需改代码,只需一把密钥。