Googleは2025年8月18日、同社が提供する開発者向けAPI「Gemini API」で利用できる「URLコンテキストツール」を公開した。URLを指定するだけでその内容を「AIの根拠情報」として直接取り込むことができる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Googleは2025年8月18日(米国時間)、「Gemini API」の「URLコンテキストツール」を一般公開した。Gemini APIは、GoogleのAI(人工知能)モデル「Gemini」をアプリケーションに組み込める開発者向けの仕組みだ。
URLコンテキストツールは、開発者がURLで追加の根拠情報をGeminiに渡すことで、特定のWebサイトやWeb上に公開されているドキュメントの内容に基づいて回答させることができる機能だ。Geminiは初期状態では直接インターネットへはアクセスしないが、URLコンテキストツールを使うことで指定したURLの内容を読み込んで詳しく分析できるようになる。
一般公開に合わせ、URLコンテキストツールの対応フォーマットも拡張された。PDFはテキスト抽出だけではなく、テーブルや表構造も理解し、レポートや論文、マニュアルを丸ごと根拠として扱えるようになった。画像は「PNG」「JPEG」「BMP」「WebP」といった形式を処理できるようになった。Geminiのマルチモーダル機能を活用すれば、チャートやダイヤグラムなどの分析も可能だ。「HTML」や「JSON」「XML」「CSV」「プレーンテキスト」「CSS」「JavaScript」などのファイルも引き続きサポートする。
GoogleはURLコンテキストツールのスケール条件や利用料金も更新した。レート制限(一定時間当たりの呼び出し回数の上限)は、選択するGeminiモデルごとに設定される。モデルに渡す追加情報の分量は標準のレートに基づいて課金される。そのため、「コストの見通しを立てやすくなる」と同社は説明する。
URLコンテキストツールの主なユースケースは以下の通りだ。
Googleによると、URLコンテキストツールを活用した事例として、ターミナルからGeminiにアクセスするAIエージェント「Gemini CLI」でのWebコンテンツ操作がある。URLコンテキストツールは、同ツールのドキュメントの他、Geminiを使ったアプリケーション開発ができるGoogleのAI開発環境「Google AI Studio」でも利用できる。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。