OpenAIは、エージェント型AIアプリケーションを構築するためのAPI「Responses API」におけるリモートMCPサーバのサポート、同APIで利用可能なビルトインツールの拡充を発表した、同APIの信頼性、可視性、プライバシーを向上させることが目的だ。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
OpenAIは2025年5月21日(米国時間)、エージェント型AI(人工知能)アプリケーションを構築するためのコアAPIプリミティブ(基本要素)「Responses API」の機能拡充を発表した。同APIの信頼性、可視性、プライバシーを向上させることが目的で、「リモートMCPサーバ」(MCP:Model Context Protocol)のサポート、「リーズニングサマリー」機能などが追加された。
Responses APIは2025年3月に、オープンソースのマルチエージェントワークフロー構築用軽量フレームワーク「Agents SDK」とともに発表された。ビルトインツールを利用してエージェントを簡単に作成できる点が特徴で、発表当時は「Web検索」「ファイル検索」「コンピュータ使用」などのビルトインツールが利用可能だった。それらに加え、「画像生成」「Code Interpreter」「強化されたファイル検索」といったツールが新たに利用可能になった。
リモートMCPサーバのサポートとこれらのツールは、「GPT-4o」「GPT-4.1」シリーズの汎用(はんよう)モデルや、「OpenAI o」シリーズのリーズニングモデル全体で利用可能だ。「o3」と「o4-mini」は、Responses APIによって思考の連鎖の中から直接ツールや関数を呼び出し、より文脈に合った関連性の高い回答を生成できるようになったという。
Agents SDKにおけるMCPサポートを基に、Responses APIでもリモートMCPサーバをサポート可能になった。これによって、開発者はわずか数行のコードで、任意のリモートMCPサーバでホストされているツールにOpenAIのAIモデルを接続できる。リモートMCPサーバツールの呼び出しに追加料金はかからず、Responses APIからの出力トークンのみが課金される。
OpenAIは「今後数カ月でリモートMCPサーバのエコシステムが急速に成長し、現在利用中のツールやデータソースに接続できるエージェントを構築する動きが活発化する」と予測している。
開発者は「Images API」だけでなく、Responses APIでもOpenAIの最新の画像生成モデル(gpt-image-1)にアクセスできるようになった。gpt-image-1はリアルタイムストリーミング(生成中の画像のプレビューを確認できる)と、マルチターン編集(モデルに段階的に画像を調整するよう促せる)をサポートしている。ただし、画像生成は「o3」でのみサポートされている点には注意が必要だ。
Responses APIでもCode Interpreterツールを使用できるようになった。「Python」コードの作成支援とチャット内でのコード実行に対応しており、データ分析、複雑な数学やコーディング問題の解決、モデルによる画像の深い理解と操作(画像による思考)の支援に有用だ。o3やo4-miniのようなモデルが思考の連鎖内でCode Interpreterを使用できるようになったことで、Humanity's Last Examなどのベンチマークでパフォーマンスが向上した。
開発者はOpenAIのリーズニングモデルでファイル検索ツールにアクセスできるようになった。ファイル検索により、開発者はユーザークエリに基づいて、文書の関連部分をモデルのコンテキストに取り込める。また、複数のベクトルストアを対象に、配列による属性フィルタリングを用いたファイル検索も可能になった。
バックグラウンドモードによって開発者は、タイムアウトなど接続の問題を心配することなく、o3やo1-proのようなモデル上で、実行に長時間かかるタスクを確実に実行できるようになった。バックグラウンドモードではこれらのタスクを非同期で開始し、開発者は応答オブジェクトをポーリングして、ステータスをチェックできる。
Responses APIは、モデル内部における思考の連鎖の簡潔な要約を自然言語で生成できるようになった。これにより、デバッグ、監査、より良いエンドユーザー体験の構築が容易になる。リーズニングサマリーは追加料金なしで利用できる。
ゼロデータ保持(ZDR)の対象となる顧客は、OpenAIのサーバにリーズニングアイテムを保存することなく、APIリクエスト間でリーズニングアイテムを再利用できるようになった。o3やo4-miniなどのリーズニングモデルでは、関数呼び出し間でリーズニングアイテムを再利用することで、インテリジェンスの向上、トークン使用量の減少、キャッシュヒット率の向上により、コストとレイテンシ(遅延)が低減される。
Copyright © ITmedia, Inc. All Rights Reserved.