REL 6: ワークロードリソースをモニタリングするにはどうすればよいですか?

ログとメトリクスは、ワークロードの状態についての洞察を得るための強力なツールです。ワークロードは、しきい値を超えたり重大なイベントが発生したりしたときに、ログとメトリクスがモニタリングされて通知が送信されるように構成できます。モニタリングにより、ワークロードは、低パフォーマンスのしきい値を超えたときや障害が発生したときにそれを認識できるため、それに応じて自動的に復旧できます。

リソース

Using Amazon CloudWatch Metrics
Publishing Custom Metrics
Using Amazon CloudWatch Dashboards
Using Canaries (Amazon CloudWatch Synthetics)
Amazon CloudWatch Logs Insights Sample Queries
AWS Systems Manager Automation
What is AWS X-Ray?
Debugging with Amazon CloudWatch Synthetics and AWS X-Ray
The Amazon Builders' Library: Instrumenting distributed systems for operational visibility

ベストプラクティス:

改善計画

ワークロードのすべてのコンポーネントをモニタリングする (生成)

  • 可能な場合はログを有効にする: AWS には消費に使用できるモニタリングとログの情報があります。モニタリングとログを使用して、アラート、変更、および復旧プロセスを定義できます
  • すべてのデフォルトのメトリクスを使用する: すべてのサービスはデフォルトのメトリクスを生成します。メトリクスを評価して、各サービスのどのメトリクスでアラートが必要かを判断します。
    AWS Services That Publish CloudWatch Metrics
  • CloudWatch Synthetics により Canary テストを立ち上げることができます
    Amazon CloudWatch Logs Insights Sample Queries
  • 自分で使用するカスタムメトリクスを作成する: AWS は一部のメトリクスとメトリクスの組み合わせを生成しませんが、それらはカスタムメトリクスを使用して作成することができます
    Publish custom metrics
  • ログを収集する: ログの収集により、1 か所でログデータを確認してアラートを設定できます
  • メトリクスを定義および計算する (集計)

  • メトリクスを定義および計算する (集計): 特定のログイベントのカウントや、ログイベントのタイムスタンプから計算されたレイテンシーなどのメトリクスを計算するため、ログデータを保存し、必要に応じてフィルターを適用する
  • 通知を送信する (リアルタイム処理とアラーム)

  • リアルタイムの処理とアラームを実行する: 重要なイベントが発生すると、把握しておく必要のある組織が通知を受信します
  • レスポンスを自動化する (リアルタイム処理とアラーム)

  • AWS Systems Manager を使用して自動アクションを実行する: AWS Config は AWS リソースの設定を継続的にモニタリングおよび記録し、AWS Systems Manager Automation をトリガーして問題を修復できます
    AWS Systems Manager Automation
  • Amazon CloudWatch は、アラーム状態変更イベントを Amazon EventBridge に送信します。EventBridge ルールを作成してレスポンスを自動化する
    Creating an EventBridge Rule That Triggers on an Event from an AWS Resource
  • 応答を自動化する計画を作成して実行する
  • ストレージと分析

  • CloudWatch Logs Insights を使用すると、Amazon CloudWatch Logs でログデータをインタラクティブに検索して分析できます
    Analyzing Log Data with CloudWatch Logs Insights
    Amazon CloudWatch Logs Insights Sample Queries
  • Amazon CloudWatch Logs を使用して、Amazon Athena を使用してデータのクエリを実行できる Amazon S3 にログを送信します。
    How do I analyze my Amazon S3 server access logs using Athena?
  • 定期的にレビューを実施する

  • ワークロード用に複数のダッシュボードを作成する: 主要なビジネスメトリクスと、使用状況の変化に応じて予測されるワークロードの状態に最も関連性があるものとして特定した技術メトリクスを含む最上位のダッシュボードが必要です。また、検査が可能なさまざまなアプリケーション層や依存関係のダッシュボードを持っている必要があります。
    Using Amazon CloudWatch Dashboards
  • ワークロードダッシュボードの定期的な確認をスケジュールし、実施する: ダッシュボードの定期的な検査を行います。検査する深度に応じて異なる頻度とすることができます
  • システムを通じたリクエストのエンドツーエンドのトレースをモニタリングする

  • システムを通じたリクエストのエンドツーエンドのトレースをモニタリングする: AWS X-Ray は、アプリケーションが処理するリクエストに関するデータを収集するサービスです。データの表示、フィルタリング、インサイトの取得によって、問題や最適化の機会を特定するために使用できるツールを提供します。アプリケーションへのトレースされたリクエストについては、リクエストとレスポンスだけでなく、アプリケーションがダウンストリーム AWS リソース、マイクロサービス、データベース、HTTP ウェブ API に対して行う呼び出しに関する詳細情報も確認できます。
    What is AWS X-Ray?
    Debugging with Amazon CloudWatch Synthetics and AWS X-Ray