AWSが発表した、AIエージェントの本格展開における課題に対処する機能とはWebブラウザ操作ツールも

AIエージェントへの取り組みが活発化する中、AWSは本格運用を見据えたシステムの構築を助けるツール群を発表した。オープンをうたう一方で、同社ツールを活用することによる開発・運用負担の少なさをアピールしている。

» 2025年07月29日 08時24分 公開
[三木泉@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 生成AI(人工知能)に関する企業の取り組みが、シンプルなチャットbotからAIエージェントシステムに進んでおり、クラウドや生成AI関連のベンダーはこれを支える機能の強化を進めている。

 Amazon Web Services(AWS)は、AIエージェントシステムの本格導入と運用のためのカギとして、2025年7月に関連サービスを発表した。あらゆる主要なフレームワーク、言語モデル、オープンプロトコルをサポートしており、囲い込むつもりはないと強調している。

 AWSがAIエージェントシステムの構築で推進してきた技術の一つは、同社が開発し、オープンソースとして提供してきたSDKの「Strands Agents」。コード数行だけでエージェントを作れるとうたう。

 2025年7月には1.0にバージョンアップ。A2A(Agent to Agent)プロトコルやセッションマネジメント機能を新たにサポートし、マルチエージェントシステムが構築できるようになった。

 また、2025年7月16日(米国時間)には、本番運用を支える技術として「Amazon Bedrock AgentCore」(以下、AgentCore)のプレビュー版を発表した。単一あるいは複数のAIエージェントによるシステムの本格的な展開と運用を支援する、非常に重要なサービスだとAWSは強調する。より低レイヤーな部分の構築や管理負荷を軽減でき、開発者はAIエージェントアプリケーション自体の構築や最適化に専念できるとする。

 AgentCoreはプレビュー版の提供が開始されている。2025年9月16日までは無料だが、その後は料金が発生する。

 また、「AWS Marketplace」には「AIエージェントとツール」というカテゴリが新設され、既成のAIエージェントやツールの活用もしやすくなった。このカテゴリには競合企業のAIエージェントもリストされている。ツールでも、後述するAgentCoreのサービスと類似した機能を備えるものがある。ここでも、AWSはオープンさをアピールしている。

AgentCoreではブラウザ操作やMCP変換のツールも

 AgentCoreは「実用的なAIエージェントをセキュアに作っていくために必要な部品の集合体」だと、日本法人の小林正人氏(サービス&テクノロジー事業統括本部 技術本部長)は表現する。現時点で7つの機能を提供するが、それぞれは整合性こそあっても別個のツールと考えてよく、必要なものだけを使えるとする。料金体系についても、AgentCore全体としての利用料金はなく、機能ごとの従量課金となっている。

 まず、AIエージェントやツールのサーバレスな実行環境として提供されるのは「AgentCore Runtime」。セッションごとに専用のMicroVMが割り当てられて起動し、セッションが終了すると消える。このVM、セッション単位での隔離により、プロセスとデータのセキュリティを高めることができるという。各エージェントは最長で8時間稼働できる。

 AgentCore Runtimeでは、エージェントやツールの並列稼働もサーバを管理することなく自動的に行える。MicroVMを使っているためリソースの利用効率は高く、スケーリングも迅速に行えるとしている。

 日本法人によると、AgentCore Runtimeは他の機能を利用するために必須というわけではないという。

 AIエージェントにおけるコンテキスト保持のための“マネージドメモリ”サービスが「AgentCore Memory」。短期記憶(単一セッションにおけるやり取りの記憶)と長期記憶(複数セッションをまたがる記憶)を管理できる。ユーザー側でデータインフラを管理する必要はない。長期記憶は複数のセッションやエージェント間での共有が可能。短期記憶と長期記憶のいずれかのみを利用することもできる。

 Webブラウザの操作によるタスクの自動実行ツールとしては、「AgentCore Browser」を発表した。リモートブラウザ上で、文字の入力やスクロール、クリックなどの作業が行える。Webアプリケーションを使い、情報の抽出や入力をはじめとしたワークフローを自律的に行える。

 ブラウザは独立したコンテナ上で動き、セッションは利用ごとに初期化されることで、セキュリティを高めている。

 同様な機能を、OpenAIは2025年1月に「Operator」として発表し、その後「ChatGPT Agent」に統合している。ChatGPT Agentは同社の「Kua」という言語モデルと一体化している。対してAWSはブラウザ操作に特化した言語モデルおよびSDKとして「Nova Act」を提供しているが、AgentCore Browserは他のLLMと組み合わせることもできるという。

 数値計算などの言語モデルでは対応できないタスクでは、AI エージェントがコードを生成して処理することがある。こうしたコードの実行環境として用意されたのが「AgentCore Code Interpreter」。Python、JavaScript、TypeScriptなどのランタイムを利用でき、最長8時間の実行が可能という。隔離された環境であるため、他に影響を及ぼすことはないとしている。

 AIアプリケーションが外部のデータやツールに接続するための標準プロトコルとしてはMCP(Model Context Protocol)が急速な広がりを見せている。だが、利用したいデータソースやツールがMCPに対応しているとは限らない。こうしたケースをカバーするため、AWSは「AgentCore Gateway」を提供する。

 既存アプリケーションのAPI、Lambda 関数、サービスを数行のコードでMCP 互換ツールに変換し、ゲートウェイを通じてAIエージェントが活用できる。Slack、Jira、Zendesk、Salesforceなどとは1クリックで統合できるという。

 生成AIシステムの本番運用では、厳格なアクセス認証/認可が必須となる。こうした課題に対応する集中的なアイデンティティ管理サービスが「AgentCore Identity」。AIエージェントからツールやデータへのアクセスを、既存アイデンティティ管理サービスの活用によって制御できる。

 Microsoft Entra ID、Okta、Amazon Cognitoの他、OAuth対応サービスなどに対応する。OAuthトークンやAPIキーを集中管理する機能を備えている。

 「AgentCore Observability」はAIエージェントの動作を監視する機能。AIエージェントのワークフローを詳細に可視化し、中間出力のチェックができる。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。