OPS 8: ワークロードの正常性をどのように把握しますか?
ワークロードメトリクスの定義、キャプチャ、分析をすると、適切なアクションを取れるようにワークロードイベントの可視性を高めることができます。
リソース
Build a Monitoring Plan
Creating Amazon CloudWatch Alarms
AWS Answers: Centralized Logging
ベストプラクティス:
-
主要業績評価指標 (KPI) を特定する: 希望するビジネス上の業績 (注文率、顧客定着率、営業費用に対する利益など) と顧客に関する成果 (顧客満足度など) に基づいて、主要業績評価指標 (KPI) を特定します。KPI を評価して、ワークロードの成功を判別します。
-
ワークロードのメトリクスを定義する: KPI の達成度を測定するワークロードメトリクスを定義します (たとえば、中止されたショッピングカート、注文数、コスト、価格、配分されたワークロード費用)。ワークロードの正常性 (インターフェイスの応答時間、エラー率、リクエスト数、完了したリクエスト、使用率など) を測定するワークロードのメトリクスを定義します。メトリクスを評価して、ワークロードが必要な成果に達しているかを判定し、ワークロードの正常性を把握します。
-
ワークロードメトリクスを収集および分析する: メトリクスのプロアクティブなレビューを定期的に行うと、傾向を把握し、適切な対応が必要な領域を特定できます。
-
ワークロードメトリクスの基準値を設定する: コンポーネントのパフォーマンスを比較し、過不足を特定する基準となる期待値として、メトリクスに対する基準値を設定します。改善、調査、および介入のしきい値を特定します。
-
ワークロードに対して予想されるアクティビティのパターンを知る: ワークロードアクティビティのパターンを確立して異常な動作を識別し、必要に応じて適切に対応できるようにします。
-
ワークロードの結果にリスクがある場合に警告する: ワークロードの結果にリスクがある場合、必要に応じて適切な対応ができるよう、アラートを発生させます。
-
ワークロードの異常が検出された場合に警告する: ワークロードの異常が検出された場合、必要に応じて適切な対応ができるよう、アラートを発生させます。
-
KPI とメトリクスの成果の達成度と有効性を検証する : ワークロードオペレーションに対するビジネスレベルの視点を確立すると、ニーズを満足しているかどうかを判断したり、ビジネス目標を達成するために改善が必要な領域を特定したりできます。KPI とメトリクスの有効性を検証し、必要に応じて修正します。
改善計画
主要業績評価指標 (KPI) を特定する
ワークロードのメトリクスを定義する
Publish custom metrics
Searching and filtering log data
Amazon CloudWatch metrics and dimensions reference
ワークロードメトリクスを収集および分析する
Using Amazon CloudWatch metrics
Amazon CloudWatch metrics and dimensions reference
Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
ワークロードメトリクスの基準値を設定する
Creating Amazon CloudWatch alarms
ワークロードに対して予想されるアクティビティのパターンを知る
ワークロードの結果にリスクがある場合に警告する
What is Amazon CloudWatch Events?
Creating Amazon CloudWatch alarms
Invoking Lambda functions using Amazon SNS notifications
ワークロードの異常が検出された場合に警告する
What is Amazon CloudWatch Events?
Creating Amazon CloudWatch alarms
Invoking Lambda functions using Amazon SNS notifications
KPI とメトリクスの成果の達成度と有効性を検証する
Using Amazon CloudWatch dashboards
What is log analytics?