GPT-5.3-Codex — 自己進化するエージェント特化コーディングモデル
SWE-Bench Pro / Terminal-Bench / OSWorld / GDPval で業界新記録。実行中の対話型 steering。自分自身の学習に使われた初の Codex モデル。
タイムラインと位置付け
OpenAI は 2026-02-05 に GPT-5.3-Codex を 5.2-Codex の後継として公開。5.2-Codex のコーディング前線能力と GPT-5.2 の推論・専門知識を統合し、全体で 25% 高速化。Codex 全表面(macOS app / CLI / IDE 拡張 / Web)で利用可能。有料 ChatGPT プランで利用可、API 接続は OpenAI の安全審査完了に応じて段階的開放。
4 つの SOTA ベンチマーク
SWE-Bench Pro 56.8%(業界トップ)、Terminal-Bench 2.0 77.3%、OSWorld-Verified 64.7%、GDPval も新記録。SWE-Bench Pro は SWE-Bench Verified より実リポジトリ改修に近い厳しい基準。
リアルタイム steering と自己進化
モデル実行中に Codex macOS app で進捗を観察しながら追加指示やフィードバックを与え、推論ツリーを壊さず軌道修正できる。OpenAI は Codex チームが初期版で自身の学習・デプロイ・評価を支援したことも公表——自身を訓練するために使われた初の Codex モデル。
GPT-5.5 / Opus 4.7 との使い分け
GPT-5.5 は OpenAI の汎用フラッグシップで横断的に強い。GPT-5.3-Codex は同系統のコーディング特化分岐で長時間タスクで SOTA。Claude Opus 4.7 は Python/Django の深いリファクタリングと長コンテキスト RAG が強み。長時間コーディングなら 5.3-Codex、コード+調査の混合なら 5.5、Python 深掘りなら Opus 4.7。
FAQ
中国国内から直接アクセスできますか?
OpenAI 公式チャネルは中国本土からのアクセスが制限されます。QCode.cc の統一 API ゲートウェイ経由で GPT-5.5 と Codex 体系を国内から透明に利用できます。
5.2-Codex から今すぐ移行すべき?
長時間マルチステップタスクが主体ならイエス——ベンチマークが明確に向上し 25% 高速。短い補完が中心なら差は小さく現状維持で問題ありません。
リアルタイム steering の使い方は?
Codex macOS app / CLI で長時間タスク実行中、同じセッションに新しい指示や文脈を入力できます。モデルは現在の推論ツリーを壊さず新情報を取り込み、5.2-Codex からの主要な対話強化です。
QCode で GPT-5.3-Codex / GPT-5.5 / Opus 4.7 を一括接続
中国国内から主要コーディングモデルへ透明にアクセス、統一課金、各社個別契約不要。
QCode プランを今すぐ開始