2026-05-28 Anthropic リリース

Claude Opus 4.8
より鋭い agentic 判断とコード欠陥 1/4

agentic タスクでの判断がより鋭く・信頼性が向上、コードに欠陥を残す確率は 4.7 比で 1/4、ネイティブ 1M コンテキスト — Opus 4.7 と完全同価格($5/$25 per MTok)

#Opus 4.8 #claude-opus-4-8 #agentic コーディング #高信頼コード #長時間タスク #移行必読

コアハイライト

+13%
コード欠陥 1/4

Opus 4.7 比でコードに欠陥を残す確率が 4 分の 1、agentic コーディングの信頼性が大きく向上

64.3%
Online-Mind2Web 84%

computer-use / ブラウザ agent タスクの成功率 84%、画面操作を伴う自律タスクで高い完遂力

3.75 MP
より鋭い agentic 判断

agentic タスクでの判断がより鋭く・信頼性が向上、Super-Agent ベンチマークで全ケースを端から端まで完遂した唯一のモデル

$5 / $25
同価格アップグレード

$5 入力 / $25 出力 per MTok、4.7 と完全同一、値上げなし

コーディング能力飛躍:欠陥率とエージェント信頼性の世代交代

長時間自律タスクから複雑なツール呼び出しまで、Opus 4.8 は「見張る必要あり」のコード作業を「放置で走る」に近づける

コード欠陥を残す確率 1/4

Opus 4.8 は前世代(Opus 4.7)比でコードに欠陥を残す確率が 4 分の 1、生成コードの信頼性が質的に向上

CursorBench:全 effort 階層で過去最高

CursorBench において、すべての effort レベルでこれまでの全 Opus モデルを上回るスコアを記録

Super-Agent:全ケース端から端まで完遂

Super-Agent ベンチマークで、全ケースを最初から最後まで完遂した唯一のモデル

より鋭い agentic 判断

agentic タスクでの判断がより鋭く、複雑な手順でも信頼性高く実行できる

Online-Mind2Web 84%

computer-use / ブラウザ agent タスクで成功率 84%、画面を操作する自律ワークフローで高い完遂力

⭐ 向上した正直性

honesty が改善し、わからない点や不確実な点をより誠実に扱う—自律実行における信頼の土台

Agentic 信頼性と長コンテキストの突破

コード欠陥率の大幅低下と判断の鋭さに加え、より優れた長コンテキスト処理と強力なマルチモーダルを両立。ネイティブ 1M コンテキストで大規模タスクを一括処理

Legal Agent Benchmark で 10% 突破

Legal Agent Benchmark で過去最高スコアを記録、全パス基準を初めて 10% 超えた最初のモデル

強力なマルチモーダル

画像とテキストを横断する強力なマルチモーダル処理、図表・スクリーンショット・文書を扱うシナリオに対応

より優れた長コンテキスト処理

ネイティブ 1M コンテキストと改善された長コンテキスト処理で、大規模リポジトリや長文書を安定して扱う

向上した正直性

honesty が改善し、不確実さを誠実に伝える—長時間の自律タスクで誤った断定を減らす

プラットフォーム機能(4.7 から継続)

xhigh

effort 階層:xhigh

high と max の間の xhigh 階層に加え adaptive thinking、推論深さと latency のトレードオフを細かく制御。Opus 4.8 は Claude Code Fast Mode のデフォルト

/ultrareview

/ultrareview 深いコードレビュー

Claude Code のコマンド、独立 review セッションで変更を最初から最後まで通し、バグと設計問題を発見

task_budgets

ネイティブ 1M コンテキスト

ネイティブ 1M コンテキストウィンドウ、大規模リポジトリや長文書を一括で扱える。QCode は 1M バリアント claude-opus-4-8[1m] も提供

auto_mode

Fast Mode デフォルト化

Opus 4.8 が Claude Code Fast Mode のデフォルトモデルに(従来は Opus 4.7)。Fast mode 価格は $10 入力 / $50 出力 per MTok

移行ガイド(⭐重要)

Opus 4.7 から Opus 4.8 への移行はドロップイン置換(model ID を claude-opus-4-8 に変更)、他の設定変更は不要

1. model ID を差し替えるだけ

model ID を claude-opus-4-7 から claude-opus-4-8 に変更するだけのドロップイン置換、その他の設定変更は不要

2. より鋭い agentic 判断に合わせる

Opus 4.8 は agentic タスクでの判断がより鋭く信頼性が高い。既存 harness は新しい挙動に合わせて軽く確認・調整を推奨

3. Thinking API(adaptive 推奨)

thinking={type:"enabled", budget_tokens:N} ではなく thinking={type:"adaptive"} + effort パラメータを推奨、xhigh 階層も利用可能

4. 1M コンテキストの活用

ネイティブ 1M コンテキストを活用。大規模コンテキストが必要な場合は 1M バリアント claude-opus-4-8[1m] を指定

コード例:Opus 4.8 へのドロップイン移行
❌ claude-opus-4-7
client.messages.create(
    model="claude-opus-4-7",
    thinking={"type": "enabled", "budget_tokens": 10000}
)
✅ claude-opus-4-8
client.messages.create(
    model="claude-opus-4-8",
    thinking={"type": "adaptive"},
    effort="xhigh"   # available since 4.7
)

GPT-5.4 / Gemini 3.1 Pro との比較

同価格帯の旗艦モデル比較(Anthropic 公式情報に基づく)

指標 Opus 4.8 GPT-5.4 Gemini 3.1 Pro
コード信頼性 欠陥率 4.7 比 1/4 でリード OpenAI 参照 Google 参照
Input $ / MTok $5 OpenAI 参照 Google 参照
Output $ / MTok $25 OpenAI 参照 Google 参照
Context window ネイティブ 1M 272K / 1M beta 1M
Agentic タスク Online-Mind2Web 84% / Super-Agent 全完遂

QCode.cc で Opus 4.8 を使う方法

公式価格・安定した開発者プラットフォーム、すぐに使える

公式同価格 $5/$25

QCode.cc は Anthropic 公式価格で課金、乗数加算なし

新パラメータ完全サポート

xhigh effort、adaptive thinking など Opus 4.8 のパラメータを完全透過、1M バリアント claude-opus-4-8[1m] も提供

ワンクリック 4.7 ↔ 4.8

model ID を claude-opus-4-7 から claude-opus-4-8 に変えるだけ、他設定変更不要

安定した低遅延

マルチノード・スマートルーティング + サーキットブレーカー、公式 API の不安定性を回避

今すぐ Opus 4.8 を試す

QCode.cc に登録、安定した Claude Opus 4.8 開発者プラットフォームを入手