移行・アップグレードガイド

Claude Sonnet 5 vs Sonnet 4.6

モデル ID の差し替えはドロップインですが、3 つの破壊的変更と新しいトークナイザに驚かされるかもしれません。切り替える前に、API とリレー連携で何を変更すべきかを正確に解説します。

#Claude Sonnet 5 #Claude Sonnet 4.6 #API 移行 #トークナイザ

結論:モデル ID のドロップイン差し替え — ただしまずテストを

Claude Sonnet 5(2026年6月30日リリース)は Sonnet 4.6 の推奨される後継であり、より低い価格で Opus 4.8 クラスの品質に近づきます。モデル ID の差し替えは簡単ですが、その周辺のリクエスト仕様でつまずきます。

✅ ドロップインなもの

同じ Messages API、同じエンドポイント、同じ認証。モデル ID を claude-sonnet-4-6 から claude-sonnet-5(Bedrock:anthropic.claude-sonnet-5)に変更すれば、ほとんどのリクエストはそのまま動作します。コンテキストウィンドウはデフォルトで 1M トークンに拡大し(選択する小型バリアントはありません)、最大出力は 128K(output-300k-2026-03-24 batches ベータヘッダー経由で最大 300K)です。

⚠️ まずテストすべきもの

適応的思考がデフォルトで有効になったため、レイテンシと出力の形が変わります。手動の拡張思考の設定や、デフォルト以外の temperature/top_p/top_k は HTTP 400 を返すようになりました。また新しいトークナイザがトークン数を変えます。少量のトラフィックを Sonnet 5 にルーティングし、評価を実行してから段階的に拡大してください。移行を迫る強制期限はありません。

仕様差分:Sonnet 4.6 vs Sonnet 5

実際に連携に影響するフィールドを並べて比較します。

仕様 Claude Sonnet 4.6 Claude Sonnet 5
モデル IDclaude-sonnet-4-6claude-sonnet-5(日付なしスナップショット)
コンテキストウィンドウ標準の Sonnet 4.6 ウィンドウ1M トークン(デフォルト = 最大)
最大出力Sonnet 4.6 の出力上限128K(batches ベータヘッダー経由で 300K)
思考拡張思考を明示的に設定適応的思考がデフォルトで有効;effort は low→max(デフォルト high)
サンプリングパラメータtemperature / top_p / top_k を受け付けるデフォルト以外の値は HTTP 400 を返す — 省略してください
価格(入力 / 出力)$3 / $15(MTok あたり)2026年8月31日までは導入価格 $2 / $10、以降 $3 / $15
ライフサイクルステータスActive(暫定的な廃止は 2027年2月17日 以降)新しい推奨デフォルト

価格と仕様は anthropic.com/news/claude-sonnet-5 および platform.claude.com のドキュメントに準拠します。知識のカットオフは 2026年1月。導入価格は期間限定であり、恒久的なものではありません。

対処すべき 3 つの破壊的変更

これらはリクエスト仕様の違いで、グリーンなデプロイを HTTP 400 の壁や予期しない挙動に変えてしまうものです。本番でモデル ID を差し替える前に、3 つすべてを修正してください。

1 · 適応的思考がデフォルトで有効

Sonnet 5 は標準で適応的に推論するため、4.6 では選択していなかった思考フェーズがレスポンスに含まれることがあります。これによりレイテンシ、ストリーミングの形、トークン使用量が変化します。思考を手動でオン・オフするのではなく、effort レベル — low、medium、high、xhigh、max(デフォルト high)— で制御してください。

2 · 手動の拡張思考は 400 を返す

思考がデフォルトで適応的になったため、以前のモデルで行っていたような手動または拡張思考ブロックを明示的に設定すると、HTTP 400 を返すようになりました。リクエストビルダーから明示的な思考設定を削除し、代わりに effort パラメータに任せてください。

3 · デフォルト以外の temperature/top_p/top_k は 400 を返す

Opus 4.7 以降とまったく同じく、Sonnet 5 はデフォルト以外の temperature、top_p、top_k を HTTP 400 で拒否します。これらのフィールドをペイロードから取り除いてください(または省略してデフォルトのままにしてください)。デフォルトの temperature を自動的に注入する SDK ラッパーやリレーミドルウェアを監査してください。

新しいトークナイザ:同じテキストでトークン ~30% 増

これは最も気づきにくい変更であり、予算と切り詰めロジックを最も壊しやすいものです。

Sonnet 5 は新しいトークナイザを搭載しています。同一の入力文字列が、Sonnet 4.6 の場合よりおよそ 30% 多いトークンにエンコードされます。テキスト自体は何も変わりません — カウント方法が変わるのです。これによりすべてのリクエストの価格が再計算され、あらゆる max_tokens 予算の形が変わります。そのため $2/$10 の導入価格は、同じテキストに対する Sonnet 4.6 の $3/$15 と比べておおむねコスト中立と理解するのが最善であり、一律 33% の割引ではありません。

max_tokens がカバーするテキストが減る

出力トークンが密になるため、固定の max_tokens 値がカバーする生成テキストの文字数は減ります。構造化出力のために max_tokens を上限設定している場合は、上限を引き上げないと、4.6 では完了していた箇所でレスポンスが途中で切り詰められる可能性があります。

リクエストあたりのクレジットコストが上昇

同じコンテンツでも入力・出力のトークン数がともに ~30% 増えるため、リクエストあたりの実質的な支出は表示価格の差が示す以上に高くなります。価格の下落を純粋な節約と仮定するのではなく、実トラフィックでコストモデルを再計算してください。

再カウントすること、外挿しないこと

Sonnet 4.6 のトークン見積もりを再利用しないでください。本番の上限を確定する前に、count_tokens エンドポイントを Sonnet 5 に対して使い、プロンプト、コンテキストウィンドウの余裕、レート制限の予算を測り直してください。

1 つの差分で移行

移行全体は通常、モデル ID を変更し、サンプリングと手動思考のフィールドを削除するだけです。最小限のビフォー/アフターを示します。

変更前 — Sonnet 4.6
{
  "model": "claude-sonnet-4-6",
  "max_tokens": 4096,
  "temperature": 0.7,
  "top_p": 0.9,
  "messages": [...]
}
変更後 — Sonnet 5
{
  "model": "claude-sonnet-5",
  "max_tokens": 4096,
  // omit temperature / top_p / top_k
  // adaptive thinking is on by default
  "messages": [...]
}

同じエンドポイント、ヘッダー、認証トークンを維持してください。temperature、top_p、top_k を削除してください(デフォルト以外の値は 400)。明示的な拡張思考の設定を取り除き、代わりに effort パラメータを使ってください。長い出力が切り詰められないよう、新しいトークナイザに対して max_tokens を再確認してください。リレーでは、デフォルトの temperature を再注入しないよう、ミドルウェアで同じ編集を適用してください。

Sonnet 4.6 は廃止されていません — 強制移行はありません

Claude Sonnet 4.6(claude-sonnet-4-6)は Active のままです。Anthropic は暫定的な廃止を 2027年2月17日 以降としており、その日付は変更される可能性があります。Sonnet 5 が推奨される新しいデフォルトですが、期限はありません:自分のスケジュールで 5 を検証する間、4.6 を本番で稼働させ続け、評価がグリーンになったら切り替えてください。

移行 FAQ

Sonnet 4.6 から Sonnet 5 にアップグレードすべきですか?

ほとんどのワークロードでは、はい — Sonnet 5 はより低い表示価格で Opus 4.8 クラスの品質に近づき、推奨される後継です。ただし設定変更ではなくコード変更として扱ってください:モデル ID の差し替えはドロップインですが、適応的思考がデフォルトで有効になり、手動の拡張思考やデフォルト以外の temperature/top_p/top_k は HTTP 400 を返すようになりました。まず少量のトラフィックを移行し、評価を実行してから段階的に拡大してください。強制移行の期限はないので、時間をかけて構いません。

なぜ Sonnet 5 は同じテキストでより多くのトークンをカウントするのですか?

Sonnet 5 は新しいトークナイザを搭載しています。同一の入力文字列が、Sonnet 4.6 の場合よりおよそ 30% 多いトークンにエンコードされます。リクエストあたりの入力・出力トークン数が増え、max_tokens 予算がカバーする文字数が減り、リクエストあたりの実質クレジットコストは 1 トークンあたりの価格差が示す以上に高くなります。そのため $2/$10 の導入価格は、同じテキストに対する Sonnet 4.6 の $3/$15 と比べておおむねコスト中立と理解するのが最善であり、一律 33% の割引ではありません。

temperature、top_p、top_k のパラメータはまだ動作しますか?

いいえ。Opus 4.7 以降と同様に、Sonnet 5 はデフォルト以外の temperature、top_p、top_k を HTTP 400 で拒否します — これらのフィールドは単に省略してください。適応的思考がデフォルトで有効なため、明示的または手動の拡張思考の設定も HTTP 400 を返します。推論は effort レベル low / medium / high / xhigh / max(デフォルト high)で制御してください。モデル ID を切り替える前に、ハードコードされたサンプリングパラメータがないか、リクエストビルダーとリレーミドルウェアを監査してください。

Sonnet 4.6 はなくなりますか?

いいえ。Claude Sonnet 4.6 は Active のままで、暫定的な廃止は 2027年2月17日 以降であり、変更される可能性があります。Sonnet 5 が推奨される新しいデフォルトですが、強制移行の期限はありません — 5 を検証する間、4.6 を本番で稼働させ続けられます。

QCode で Claude Sonnet 5 に移行

1 つの API と Claude Code エンドポイントを通じて Sonnet 5 と Sonnet 4.6 を並べて実行 — モデル ID を差し替え、評価を比較し、準備ができたら段階的に拡大できます。