エージェントの未来を感じるOpenAI o3,o4-miniがリリース!

2025年4月16日に発表された“o‑シリーズ”最新版――フルツール連携と画像推論を武器に、ChatGPTを真のエージェントへと押し上げる2モデルのポイントを総まとめします。

OpenAI「o3」「o4‑mini」徹底解説

—2025年4月16日公開ブログのポイントを日本語でまとめる—


1. 概要 ― “考えてから動く”最新推論モデル

OpenAI は 2025 年 4 月 16 日、o シリーズの新モデル 「o3」「o4‑mini」 を発表しました。どちらも ChatGPT 内の全ツール(Web ブラウジング、Python・ファイル解析、画像生成など)を 自律的に組み合わせて問題解決 できる初の推論モデルです。

o3o4‑mini
位置付け最上位・高精度軽量・高速・低コスト
得意領域コーディング・数学・マルチモーダル数理・コーディング・高スループット
代表ベンチマークCodeforces, SWE‑bench, MMMU などで SOTAAIME 2024/25 最高スコア
使用制限従来と同等o3 より高い使用上限

注: o3 は従来モデル(o1)比で実課題の重大エラーを 20 % 削減。o4‑mini は o3‑mini より高精度かつ低コストです。


2. 主な技術的進歩

2.1 フルツール&エージェント的推論

  • モデル自身が「いつ・どのツールを使うか」を判断し、数十秒~1 分以内に最終回答を生成。
  • 画像を“思考過程”に直接組み込み、拡大・回転などの加工も推論チェーン内で実行。

2.2 大規模 RL で “考える時間”を拡張

  • 強化学習 (RL) の計算量を 1 桁増やし、推論ステップを長くしても性能が伸び続けることを確認。
  • ツール使用の RL 学習 により、「結果を出すための手順」そのものを最適化。

2.3 コスト vs. 性能フロンティアの更新

  • 同一レイテンシ・コスト帯で o3 は o1 を完全に上回る
  • o4‑mini は o3‑mini 同等コストで高精度。大量呼び出し用途に最適。

3. ベンチマークハイライト(一部)

指標o1o3o4‑mini
AIME 2024 正答率74.3 %91.6 %93.4 %
MMMU 視覚問題77.6 %86.8 %84.3 %
Codeforces ELO189127062719 (mini)

※「with tools」設定ではさらに向上。特に o3 は Python+Browsing 併用時に深い研究課題で 24.9 % → 26.6 % まで精度が上昇しています。


4. 安全性とガバナンス

  • 拒否プロンプト を再構築し、バイオリスク・マルウェア・脱獄要求への防御を強化。
  • 推論 LLM モニター を導入し、危険コンテンツの 99 % を自動検知。
  • Preparedness Framework で「生物・化学」「サイバー」「自己改良」の 3 項目すべて High 未満 と評価。

5. 開発者・ユーザー向け提供形態

プラン提供開始備考
ChatGPT Plus / Pro / Team即日モデル選択に o3・o4‑mini
ChatGPT Enterprise / Edu1 週間以内
Free(Think モード)o4‑mini を試用可
API即日Chat Completions / Responses API 対応
o3‑pro数週間以内フルツール対応予定

6. 新実験「Codex CLI」

ターミナル上で動く軽量エージェント。

  • ローカルコードへのアクセスやスクリーンショット入力を活用して マルチモーダル推論 を実現。
  • GitHub で OSS 公開、プロジェクト支援として 最大 100 万ドル分の API クレジット も提供。

7. 今後のロードマップ

GPT 系の自然な対話力と o‑シリーズの高い推論力・ツール活用を一本化する方向へ。
近くリリース予定の o3‑pro がその第一歩となり、将来的には「会話+自律タスク実行」をシームレスにこなすモデルへ収斂していく見込みです。


8. まとめ

  • o3 / o4‑mini は推論精度・コスト効率・ツール統合の三拍子がそろった新たなフラッグシップ。
  • 大規模 RL による「長く考えるほど賢くなる」トレンドが実証され、視覚推論やエージェント的タスク実行が大幅に向上。
  • 安全性も同時に強化され、企業利用のハードルがさらに低減。

生成 AI を戦略的に導入したい企業 にとって、両モデルは 高付加価値と運用コスト削減 を同時に実現する強力な選択肢となるでしょう。


参考:https://openai.com/index/introducing-o3-and-o4-mini/

補足:利用回数の制限について