2025年10月22日、Amazon CloudWatchに新たな機能「インシデントレポート」が追加されました。この機能により、インシデント発生後の分析レポートが自動で生成されるようになり、運用チームの負担が大幅に軽減されます。

運用の効率化と品質向上を支えるこの新機能について、この記事でご紹介します。

■目次

  1. Amazon CloudWatchの新機能「インシデントレポート」 とは?
  2. 実際に使ってみた
  3. まとめ

1. Amazon CloudWatchの新機能「インシデントレポート」 とは?

インシデントレポートとは、その名の通り、インシデント発生後に自動でレポートを作成してくれる、CloudWatchの新しい機能です。障害対応に必要な情報を効率よくまとめてくれるため、運用チームの負担軽減や対応スピードの向上が期待できます。

インシデントレポートでは、障害発生時の重要なメトリクスやサービス設定、調査内容などを自動で収集し、詳細なレポートとしてまとめてくれます。レポートには、概要(エグゼクティブサマリー)、発生から復旧までのタイムライン、影響範囲の評価、そして再発防止に役立つ具体的な改善提案が含まれています。

2.実際に使ってみた

■設定環境

今回は、テスト用のAWSアカウントを使って、EC2インスタンスのCPU使用率を監視し、一定のしきい値を超えた場合にアラートを出すCloudWatchアラームの設定いたしました。

①調査グループの作成

CloudWatch>設定>このアカウント用に設定をクリックする

保持日数とアクセス許可を設定する

※今回はデフォルトの設定をそのまま使用します

「調査グループを作成」をクリックする

②Cloud Watchのアラーム 設定する

■アラーム設定条件

  • アラーム名: InvestigationOnAlarm-CPU-Test
  • メトリクス名: CPUUtilization
  • しきい値:CPU使用率が90%以上の場合アラート発報

CPU使用率が90%以上になった場合、アラートを発報する設定をする

次の画面で通知設定をし、「調査アクション」で①で作成した調査グループを設定する

次の画面でアラーム名を入力しアラートを作成する

③アラートが発報を確認し、インシデントレポートを作成する

CloudWatchの「調査」からアラートを確認する 

タイトル部分をクリックする

「 Hypotheses」(仮説)で今回のアラートの原因を確認し、「 Accepted 」(承認)をクリックする

<英語>

Manual EC2 instance reboot operation by user ユーザー名 triggered normal but resource-intensive boot processes that exceeded CPU monitoring thresholds. The reboot caused intensive EBS I/O activity during OS/application loading and CPU utilization spikes during system initialization, resulting in CloudWatch alarm activation during the expected boot sequence.

<日本語>

EC2 インスタンスを再起動したところ、通常の動作ではあるものの負荷の大きい起動処理が走り、CPU の監視しきい値を超えました。再起動の過程で OS やアプリケーションの読み込み時に EBS への大量の I/O が発生し、システム初期化中には CPU 使用率が急上昇しました。その結果、想定された起動シーケンス中に CloudWatch のアラームが発動しました。

「Incident report」をクリックする

④インシデントレポートが完成する

英語での作成のため翻訳し簡単にまとめると以下のように分析していた

EC2インスタンスの再起動時に、通常のリソース消費によってCPUアラームが発生しました。 これはサービス障害ではなく、想定されたシステムの挙動です。 今後の改善策として、監視の閾値やアラーム設定の見直しが推奨されています。

3.まとめ

従来、インシデント対応後には原因の特定や再発防止策の検討のため、詳細なレポートを手作業で作成する必要がありました。特に複雑な障害では、関係者間での情報共有やログ解析に多くの時間が費やされていました。

今回のアップデートにより、CloudWatchがインシデント発生時の関連メトリクスやログを自動で収集・分析し、レポートとしてまとめてくれるようになり、対応にかかる時間を大幅に短縮できるだけでなく、再発防止策の検討にも迅速に着手できるようになるので活用していきたいと思いました!

AWSコスト削減セミナー、参加受付中!

「気づかぬムダをどう見つけ、どう減らすか?」
そんな疑問に応える、AWSコスト削減に特化した無料ウェビナーシリーズを開催中です。

次回は、「RI/SPの活用と料金管理の見直し」をテーマに、コスト最適化に直結する4つの代表的な施策を解説します。
“契約”と“構成”の両面からAWSコストを最適化するポイントを30分で凝縮してお届けします。

AWSの利用料金、もう少し最適化できるかもしれません。

QuickSightを含むAWS活用をより効率的に進めたいなら、コスト面の最適化も重要です。SunnyPayをご利用いただくと、AWS利用料を一律5%割引しながら、サポートやセキュリティもそのまま維持できます。

Root譲渡不要、既存構成もそのまま。まずは資料で仕組みをご確認ください。