AIエージェントへの取り組みが活発化する中、AWSは本格運用を見据えたシステムの構築を助けるツール群を発表した。オープンをうたう一方で、同社ツールを活用することによる開発・運用負担の少なさをアピールしている。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
生成AI(人工知能)に関する企業の取り組みが、シンプルなチャットbotからAIエージェントシステムに進んでおり、クラウドや生成AI関連のベンダーはこれを支える機能の強化を進めている。
Amazon Web Services(AWS)は、AIエージェントシステムの本格導入と運用のためのカギとして、2025年7月に関連サービスを発表した。あらゆる主要なフレームワーク、言語モデル、オープンプロトコルをサポートしており、囲い込むつもりはないと強調している。
AWSがAIエージェントシステムの構築で推進してきた技術の一つは、同社が開発し、オープンソースとして提供してきたSDKの「Strands Agents」。コード数行だけでエージェントを作れるとうたう。
2025年7月には1.0にバージョンアップ。A2A(Agent to Agent)プロトコルやセッションマネジメント機能を新たにサポートし、マルチエージェントシステムが構築できるようになった。
また、2025年7月16日(米国時間)には、本番運用を支える技術として「Amazon Bedrock AgentCore」(以下、AgentCore)のプレビュー版を発表した。単一あるいは複数のAIエージェントによるシステムの本格的な展開と運用を支援する、非常に重要なサービスだとAWSは強調する。より低レイヤーな部分の構築や管理負荷を軽減でき、開発者はAIエージェントアプリケーション自体の構築や最適化に専念できるとする。
AgentCoreはプレビュー版の提供が開始されている。2025年9月16日までは無料だが、その後は料金が発生する。
また、「AWS Marketplace」には「AIエージェントとツール」というカテゴリが新設され、既成のAIエージェントやツールの活用もしやすくなった。このカテゴリには競合企業のAIエージェントもリストされている。ツールでも、後述するAgentCoreのサービスと類似した機能を備えるものがある。ここでも、AWSはオープンさをアピールしている。
AgentCoreは「実用的なAIエージェントをセキュアに作っていくために必要な部品の集合体」だと、日本法人の小林正人氏(サービス&テクノロジー事業統括本部 技術本部長)は表現する。現時点で7つの機能を提供するが、それぞれは整合性こそあっても別個のツールと考えてよく、必要なものだけを使えるとする。料金体系についても、AgentCore全体としての利用料金はなく、機能ごとの従量課金となっている。
まず、AIエージェントやツールのサーバレスな実行環境として提供されるのは「AgentCore Runtime」。セッションごとに専用のMicroVMが割り当てられて起動し、セッションが終了すると消える。このVM、セッション単位での隔離により、プロセスとデータのセキュリティを高めることができるという。各エージェントは最長で8時間稼働できる。
AgentCore Runtimeでは、エージェントやツールの並列稼働もサーバを管理することなく自動的に行える。MicroVMを使っているためリソースの利用効率は高く、スケーリングも迅速に行えるとしている。
日本法人によると、AgentCore Runtimeは他の機能を利用するために必須というわけではないという。
AIエージェントにおけるコンテキスト保持のための“マネージドメモリ”サービスが「AgentCore Memory」。短期記憶(単一セッションにおけるやり取りの記憶)と長期記憶(複数セッションをまたがる記憶)を管理できる。ユーザー側でデータインフラを管理する必要はない。長期記憶は複数のセッションやエージェント間での共有が可能。短期記憶と長期記憶のいずれかのみを利用することもできる。
Webブラウザの操作によるタスクの自動実行ツールとしては、「AgentCore Browser」を発表した。リモートブラウザ上で、文字の入力やスクロール、クリックなどの作業が行える。Webアプリケーションを使い、情報の抽出や入力をはじめとしたワークフローを自律的に行える。
ブラウザは独立したコンテナ上で動き、セッションは利用ごとに初期化されることで、セキュリティを高めている。
同様な機能を、OpenAIは2025年1月に「Operator」として発表し、その後「ChatGPT Agent」に統合している。ChatGPT Agentは同社の「Kua」という言語モデルと一体化している。対してAWSはブラウザ操作に特化した言語モデルおよびSDKとして「Nova Act」を提供しているが、AgentCore Browserは他のLLMと組み合わせることもできるという。
数値計算などの言語モデルでは対応できないタスクでは、AI エージェントがコードを生成して処理することがある。こうしたコードの実行環境として用意されたのが「AgentCore Code Interpreter」。Python、JavaScript、TypeScriptなどのランタイムを利用でき、最長8時間の実行が可能という。隔離された環境であるため、他に影響を及ぼすことはないとしている。
AIアプリケーションが外部のデータやツールに接続するための標準プロトコルとしてはMCP(Model Context Protocol)が急速な広がりを見せている。だが、利用したいデータソースやツールがMCPに対応しているとは限らない。こうしたケースをカバーするため、AWSは「AgentCore Gateway」を提供する。
既存アプリケーションのAPI、Lambda 関数、サービスを数行のコードでMCP 互換ツールに変換し、ゲートウェイを通じてAIエージェントが活用できる。Slack、Jira、Zendesk、Salesforceなどとは1クリックで統合できるという。
生成AIシステムの本番運用では、厳格なアクセス認証/認可が必須となる。こうした課題に対応する集中的なアイデンティティ管理サービスが「AgentCore Identity」。AIエージェントからツールやデータへのアクセスを、既存アイデンティティ管理サービスの活用によって制御できる。
Microsoft Entra ID、Okta、Amazon Cognitoの他、OAuth対応サービスなどに対応する。OAuthトークンやAPIキーを集中管理する機能を備えている。
「AgentCore Observability」はAIエージェントの動作を監視する機能。AIエージェントのワークフローを詳細に可視化し、中間出力のチェックができる。
Copyright © ITmedia, Inc. All Rights Reserved.