OPS 8: ワークロードの正常性をどのように把握しますか?

ワークロードメトリクスの定義、キャプチャ、分析をすると、適切なアクションを取れるようにワークロードイベントの可視性を高めることができます。

リソース

Build a Monitoring Plan
Creating Amazon CloudWatch Alarms
AWS Answers: Centralized Logging

ベストプラクティス:

改善計画

主要業績評価指標 (KPI) を特定する

  • 主要業績評価指標 (KPI) を特定する: ビジネスと顧客が求める成果に基づいて、主要業績評価指標 (KPI) を特定します。KPI を評価して、ワークロードの成功を判別します。
  • ワークロードのメトリクスを定義する

  • ワークロードのメトリクスを定義する: KPI の達成度を測定するため、ワークロードのメトリクスを定義します。ワークロードとその個々のコンポーネントの正常性を測定するため、ワークロードのメトリクスを定義します。メトリクスを評価して、ワークロードが必要な成果に達しているかを判定し、ワークロードの正常性を把握します。
    Publish custom metrics
    Searching and filtering log data
    Amazon CloudWatch metrics and dimensions reference
  • ワークロードメトリクスを収集および分析する

  • ワークロードメトリクスを収集および分析する: メトリクスのプロアクティブなレビューを定期的に行うと、傾向を把握し、適切な対応が必要な領域を特定できます。
    Using Amazon CloudWatch metrics
    Amazon CloudWatch metrics and dimensions reference
    Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
  • ワークロードメトリクスの基準値を設定する

  • ワークロードメトリクスの基準値を設定する : ワークロードメトリクスの基準値を設定すると、期待値を比較のための基準にすることができます。
    Creating Amazon CloudWatch alarms
  • ワークロードに対して予想されるアクティビティのパターンを知る

  • ワークロードに対して予想されるアクティビティのパターンを知る: ワークロードアクティビティのパターンを確立すると、行動が期待値から外れるタイミングを把握し、必要に応じて適切に対応できるようになります。
  • ワークロードの結果にリスクがある場合に警告する

  • ワークロードの結果にリスクがある場合に警告する: ワークロードの結果にリスクがある場合、必要に応じて適切な対応ができるよう、アラートを発生させます。
    What is Amazon CloudWatch Events?
    Creating Amazon CloudWatch alarms
    Invoking Lambda functions using Amazon SNS notifications
  • ワークロードの異常が検出された場合に警告する

  • ワークロードの異常が検出された場合に警告する: ワークロードの異常が検出された場合、必要に応じて適切な対応ができるよう、アラートを発生させます。
    What is Amazon CloudWatch Events?
    Creating Amazon CloudWatch alarms
    Invoking Lambda functions using Amazon SNS notifications
  • KPI とメトリクスの成果の達成度と有効性を検証する

  • KPI とメトリクスの成果の達成度と有効性を検証する : ワークロードオペレーションに対するビジネスレベルの視点を確立すると、ニーズを満足しているかどうかを判断したり、ビジネス目標を達成するために改善が必要な領域を特定したりできます。KPI とメトリクスの有効性を検証し、必要に応じて修正します。
    Using Amazon CloudWatch dashboards
    What is log analytics?