Datadog、無料で30以上のSaaS、13のAWSサービスの障害をリアルタイムで確認できる「Updog.ai」を公開「公式発表を待たずに障害状況を把握できる」 その仕組みとは?

Datadogは、OpenAI、Zoom、GitHub、Slack、Stripeといった30以上の主要SaaSと13のAWSサービスの健全性を確認できるWebサイト「Updog.ai」を無料公開した。

» 2025年10月24日 09時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Datadogは2025年10月21日(米国時間)、主要SaaSプロバイダーやAmazon Web Services(AWS)サービスの健全性ステータスをリアルタイムで表示する無料のWebサイト「Updog.ai」を公開した。

 Updog.aiは、OpenAI、Zoom、GitHub、Slack、Stripeといった30以上の主要SaaSと「Amazon Simple Storage Service」(Amazon S3)や「AWS Lambda」など13のAWSサービスの健全性を単一のダッシュボードで提供する。

Updog.aiの画面 Updog.aiの画面

「公式発表を待たずに、障害の実態を把握できる」 その仕組みとは?

 Updog.aiの最大の特徴は、SaaSプロバイダーが管理、更新しているステータスページの情報に依存していない点だ。

 Datadogが持つ数千の組織から集約、匿名化された膨大なAPM(アプリケーションパフォーマンスモニタリング)テレメトリーデータと、異常なエラー発生を推定するベイジアンモデルを活用して、健全性を判定する。

 これにより、ITエンジニアは障害発生時、問題が自社システム固有のものなのか、広範囲で発生しているインシデントの影響を受けているのかを迅速に確認できるという。Datadogによると、「Amazon DynamoDB」で最近起きたパフォーマンス低下を、AWSが自身のステータスページを更新する32分前に検知した事例もあるという。

 またUpdog.aiはサービスの健全性について過去90日間のデータを提供する。特定のサービスで繰り返し発生している不具合などを特定し、アーキテクチャ設計やSaaS選定時の情報として活用できる。今後、GPUリソースの可用性、スポットインスタンスの中断予測、サイバー攻撃や攻撃ベクトル(経路)に関する情報公開にも取り組む計画だとしている。


 パブリッククラウドやSaaSへの依存度が高まるにつれ、外部サービスのパフォーマンス低下やインシデントが自社のビジネスに与える影響は無視できない状況となっている。

 障害発生時に迅速な原因の切り分けが求められる中、客観的な観測データに基づく情報は、インシデント対応の初動を判断する上で重要だ。サービスプロバイダーに依存しない情報源は、自社の監視体制を補完し、状況判断の精度を高める上で有効な手段の一つといえるだろう。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。