2025年4月16日に発表された“o‑シリーズ”最新版――フルツール連携と画像推論を武器に、ChatGPTを真のエージェントへと押し上げる2モデルのポイントを総まとめします。
OpenAI「o3」「o4‑mini」徹底解説
—2025年4月16日公開ブログのポイントを日本語でまとめる—
1. 概要 ― “考えてから動く”最新推論モデル
OpenAI は 2025 年 4 月 16 日、o シリーズの新モデル 「o3」 と 「o4‑mini」 を発表しました。どちらも ChatGPT 内の全ツール(Web ブラウジング、Python・ファイル解析、画像生成など)を 自律的に組み合わせて問題解決 できる初の推論モデルです。
o3 | o4‑mini | |
---|---|---|
位置付け | 最上位・高精度 | 軽量・高速・低コスト |
得意領域 | コーディング・数学・マルチモーダル | 数理・コーディング・高スループット |
代表ベンチマーク | Codeforces, SWE‑bench, MMMU などで SOTA | AIME 2024/25 最高スコア |
使用制限 | 従来と同等 | o3 より高い使用上限 |
注: o3 は従来モデル(o1)比で実課題の重大エラーを 20 % 削減。o4‑mini は o3‑mini より高精度かつ低コストです。
2. 主な技術的進歩
2.1 フルツール&エージェント的推論
- モデル自身が「いつ・どのツールを使うか」を判断し、数十秒~1 分以内に最終回答を生成。
- 画像を“思考過程”に直接組み込み、拡大・回転などの加工も推論チェーン内で実行。
2.2 大規模 RL で “考える時間”を拡張
- 強化学習 (RL) の計算量を 1 桁増やし、推論ステップを長くしても性能が伸び続けることを確認。
- ツール使用の RL 学習 により、「結果を出すための手順」そのものを最適化。
2.3 コスト vs. 性能フロンティアの更新
- 同一レイテンシ・コスト帯で o3 は o1 を完全に上回る。
- o4‑mini は o3‑mini 同等コストで高精度。大量呼び出し用途に最適。
3. ベンチマークハイライト(一部)
指標 | o1 | o3 | o4‑mini |
---|---|---|---|
AIME 2024 正答率 | 74.3 % | 91.6 % | 93.4 % |
MMMU 視覚問題 | 77.6 % | 86.8 % | 84.3 % |
Codeforces ELO | 1891 | 2706 | 2719 (mini) |
※「with tools」設定ではさらに向上。特に o3 は Python+Browsing 併用時に深い研究課題で 24.9 % → 26.6 % まで精度が上昇しています。
4. 安全性とガバナンス
- 拒否プロンプト を再構築し、バイオリスク・マルウェア・脱獄要求への防御を強化。
- 推論 LLM モニター を導入し、危険コンテンツの 99 % を自動検知。
- Preparedness Framework で「生物・化学」「サイバー」「自己改良」の 3 項目すべて High 未満 と評価。
5. 開発者・ユーザー向け提供形態
プラン | 提供開始 | 備考 |
---|---|---|
ChatGPT Plus / Pro / Team | 即日 | モデル選択に o3・o4‑mini |
ChatGPT Enterprise / Edu | 1 週間以内 | |
Free(Think モード) | o4‑mini を試用可 | |
API | 即日 | Chat Completions / Responses API 対応 |
o3‑pro | 数週間以内 | フルツール対応予定 |
6. 新実験「Codex CLI」
ターミナル上で動く軽量エージェント。
- ローカルコードへのアクセスやスクリーンショット入力を活用して マルチモーダル推論 を実現。
- GitHub で OSS 公開、プロジェクト支援として 最大 100 万ドル分の API クレジット も提供。
7. 今後のロードマップ
GPT 系の自然な対話力と o‑シリーズの高い推論力・ツール活用を一本化する方向へ。
近くリリース予定の o3‑pro がその第一歩となり、将来的には「会話+自律タスク実行」をシームレスにこなすモデルへ収斂していく見込みです。
8. まとめ
- o3 / o4‑mini は推論精度・コスト効率・ツール統合の三拍子がそろった新たなフラッグシップ。
- 大規模 RL による「長く考えるほど賢くなる」トレンドが実証され、視覚推論やエージェント的タスク実行が大幅に向上。
- 安全性も同時に強化され、企業利用のハードルがさらに低減。
生成 AI を戦略的に導入したい企業 にとって、両モデルは 高付加価値と運用コスト削減 を同時に実現する強力な選択肢となるでしょう。
参考:https://openai.com/index/introducing-o3-and-o4-mini/