AWSが発表した、AIエージェントの本格展開における課題に対処する機能とは：Webブラウザ操作ツールも

AIエージェントへの取り組みが活発化する中、AWSは本格運用を見据えたシステムの構築を助けるツール群を発表した。オープンをうたう一方で、同社ツールを活用することによる開発・運用負担の少なさをアピールしている。

» 2025年07月29日 08時24分公開

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　生成AI（人工知能）に関する企業の取り組みが、シンプルなチャットbotからAIエージェントシステムに進んでおり、クラウドや生成AI関連のベンダーはこれを支える機能の強化を進めている。

　Amazon Web Services（AWS）は、AIエージェントシステムの本格導入と運用のためのカギとして、2025年7月に関連サービスを発表した。あらゆる主要なフレームワーク、言語モデル、オープンプロトコルをサポートしており、囲い込むつもりはないと強調している。

　AWSがAIエージェントシステムの構築で推進してきた技術の一つは、同社が開発し、オープンソースとして提供してきたSDKの「Strands Agents」。コード数行だけでエージェントを作れるとうたう。

　2025年7月には1.0にバージョンアップ。A2A（Agent to Agent）プロトコルやセッションマネジメント機能を新たにサポートし、マルチエージェントシステムが構築できるようになった。

　また、2025年7月16日（米国時間）には、本番運用を支える技術として「Amazon Bedrock AgentCore」（以下、AgentCore）のプレビュー版を発表した。単一あるいは複数のAIエージェントによるシステムの本格的な展開と運用を支援する、非常に重要なサービスだとAWSは強調する。より低レイヤーな部分の構築や管理負荷を軽減でき、開発者はAIエージェントアプリケーション自体の構築や最適化に専念できるとする。

　AgentCoreはプレビュー版の提供が開始されている。2025年9月16日までは無料だが、その後は料金が発生する。

　また、「AWS Marketplace」には「AIエージェントとツール」というカテゴリが新設され、既成のAIエージェントやツールの活用もしやすくなった。このカテゴリには競合企業のAIエージェントもリストされている。ツールでも、後述するAgentCoreのサービスと類似した機能を備えるものがある。ここでも、AWSはオープンさをアピールしている。

AgentCoreではブラウザ操作やMCP変換のツールも

　AgentCoreは「実用的なAIエージェントをセキュアに作っていくために必要な部品の集合体」だと、日本法人の小林正人氏（サービス＆テクノロジー事業統括本部技術本部長）は表現する。現時点で7つの機能を提供するが、それぞれは整合性こそあっても別個のツールと考えてよく、必要なものだけを使えるとする。料金体系についても、AgentCore全体としての利用料金はなく、機能ごとの従量課金となっている。

　まず、AIエージェントやツールのサーバレスな実行環境として提供されるのは「AgentCore Runtime」。セッションごとに専用のMicroVMが割り当てられて起動し、セッションが終了すると消える。このVM、セッション単位での隔離により、プロセスとデータのセキュリティを高めることができるという。各エージェントは最長で8時間稼働できる。

　AgentCore Runtimeでは、エージェントやツールの並列稼働もサーバを管理することなく自動的に行える。MicroVMを使っているためリソースの利用効率は高く、スケーリングも迅速に行えるとしている。

　日本法人によると、AgentCore Runtimeは他の機能を利用するために必須というわけではないという。

　AIエージェントにおけるコンテキスト保持のための“マネージドメモリ”サービスが「AgentCore Memory」。短期記憶（単一セッションにおけるやり取りの記憶）と長期記憶（複数セッションをまたがる記憶）を管理できる。ユーザー側でデータインフラを管理する必要はない。長期記憶は複数のセッションやエージェント間での共有が可能。短期記憶と長期記憶のいずれかのみを利用することもできる。

　Webブラウザの操作によるタスクの自動実行ツールとしては、「AgentCore Browser」を発表した。リモートブラウザ上で、文字の入力やスクロール、クリックなどの作業が行える。Webアプリケーションを使い、情報の抽出や入力をはじめとしたワークフローを自律的に行える。

　ブラウザは独立したコンテナ上で動き、セッションは利用ごとに初期化されることで、セキュリティを高めている。

　同様な機能を、OpenAIは2025年1月に「Operator」として発表し、その後「ChatGPT Agent」に統合している。ChatGPT Agentは同社の「Kua」という言語モデルと一体化している。対してAWSはブラウザ操作に特化した言語モデルおよびSDKとして「Nova Act」を提供しているが、AgentCore Browserは他のLLMと組み合わせることもできるという。

　数値計算などの言語モデルでは対応できないタスクでは、AI エージェントがコードを生成して処理することがある。こうしたコードの実行環境として用意されたのが「AgentCore Code Interpreter」。Python、JavaScript、TypeScriptなどのランタイムを利用でき、最長8時間の実行が可能という。隔離された環境であるため、他に影響を及ぼすことはないとしている。

　AIアプリケーションが外部のデータやツールに接続するための標準プロトコルとしてはMCP（Model Context Protocol）が急速な広がりを見せている。だが、利用したいデータソースやツールがMCPに対応しているとは限らない。こうしたケースをカバーするため、AWSは「AgentCore Gateway」を提供する。

　既存アプリケーションのAPI、Lambda 関数、サービスを数行のコードでMCP 互換ツールに変換し、ゲートウェイを通じてAIエージェントが活用できる。Slack、Jira、Zendesk、Salesforceなどとは1クリックで統合できるという。

　生成AIシステムの本番運用では、厳格なアクセス認証／認可が必須となる。こうした課題に対応する集中的なアイデンティティ管理サービスが「AgentCore Identity」。AIエージェントからツールやデータへのアクセスを、既存アイデンティティ管理サービスの活用によって制御できる。

　Microsoft Entra ID、Okta、Amazon Cognitoの他、OAuth対応サービスなどに対応する。OAuthトークンやAPIキーを集中管理する機能を備えている。

　「AgentCore Observability」はAIエージェントの動作を監視する機能。AIエージェントのワークフローを詳細に可視化し、中間出力のチェックができる。

SpecialPR