🚀 2026-02-05 リリース

GPT-5.3-Codex — 自己進化するエージェント特化コーディングモデル

SWE-Bench Pro / Terminal-Bench / OSWorld / GDPval で業界新記録。実行中の対話型 steering。自分自身の学習に使われた初の Codex モデル。

タイムラインと位置付け

OpenAI は 2026-02-05 に GPT-5.3-Codex を 5.2-Codex の後継として公開。5.2-Codex のコーディング前線能力と GPT-5.2 の推論・専門知識を統合し、全体で 25% 高速化。Codex 全表面（macOS app / CLI / IDE 拡張 / Web）で利用可能。有料 ChatGPT プランで利用可、API 接続は OpenAI の安全審査完了に応じて段階的開放。

4 つの SOTA ベンチマーク

SWE-Bench Pro 56.8%（業界トップ）、Terminal-Bench 2.0 77.3%、OSWorld-Verified 64.7%、GDPval も新記録。SWE-Bench Pro は SWE-Bench Verified より実リポジトリ改修に近い厳しい基準。

リアルタイム steering と自己進化

モデル実行中に Codex macOS app で進捗を観察しながら追加指示やフィードバックを与え、推論ツリーを壊さず軌道修正できる。OpenAI は Codex チームが初期版で自身の学習・デプロイ・評価を支援したことも公表——自身を訓練するために使われた初の Codex モデル。

GPT-5.5 / Opus 4.8 との使い分け

GPT-5.5 は OpenAI の汎用フラッグシップで横断的に強い。GPT-5.3-Codex は同系統のコーディング特化分岐で長時間タスクで SOTA。Claude Opus 4.8 は Python/Django の深いリファクタリングと長コンテキスト RAG が強み。長時間コーディングなら 5.3-Codex、コード+調査の混合なら 5.5、Python 深掘りなら Opus 4.8。

FAQ

中国国内から直接アクセスできますか？

OpenAI 公式チャネルは中国本土からのアクセスが制限されます。QCode.cc の統一 API ゲートウェイ経由で GPT-5.5 と Codex 体系を国内から透明に利用できます。

5.2-Codex から今すぐ移行すべき？

長時間マルチステップタスクが主体ならイエス——ベンチマークが明確に向上し 25% 高速。短い補完が中心なら差は小さく現状維持で問題ありません。

リアルタイム steering の使い方は？

Codex macOS app / CLI で長時間タスク実行中、同じセッションに新しい指示や文脈を入力できます。モデルは現在の推論ツリーを壊さず新情報を取り込み、5.2-Codex からの主要な対話強化です。

QCode で GPT-5.3-Codex / GPT-5.5 / Opus 4.8 を一括接続

中国国内から主要コーディングモデルへ透明にアクセス、統一課金、各社個別契約不要。

QCode プランを今すぐ開始