OPS 9: Comment comprendre l'état de vos opérations ?

Définissez, capturez et analysez les métriques des opérations pour obtenir une visibilité sur les événements des opérations afin de pouvoir prendre des mesures appropriées.

Ressources

Build a Monitoring Plan
Detect and React to Changes in Pipeline State with Amazon CloudWatch Events
AWS Answers: Centralized Logging

Bonnes pratiques:

Plan d'amélioration

Identifier les indicateurs clés de performance

  • Identifier les indicateurs clés de performance: Identifiez les indicateurs de performance clés (KPI) en fonction des résultats désirés pour l'entreprise et le client. Évaluez les KPI pour déterminer la réussite des opérations.
  • Définir des métriques pour les opérations

  • Définir des métriques pour les opérations: Définissez les métriques des opérations pour mesurer la réalisation des KPI. Définissez les métriques des opérations pour mesurer l'état des opérations et leurs activités. Évaluez les métriques pour déterminer si les opérations atteignent les résultats souhaités et pour comprendre l'état des opérations.
    Publish custom metrics
    Searching and filtering log data
    Amazon CloudWatch metrics and dimensions reference
  • Collecter et analyser les métriques des opérations

  • Collecter et analyser les métriques des opérations: Effectuez des examens réguliers et proactifs des mesures afin d'identifier les tendances et de déterminer les cas où des réponses appropriées sont nécessaires.
    Using Amazon CloudWatch metrics
    Amazon CloudWatch metrics and dimensions reference
    Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
  • Établir des bases de références pour les métriques des opérations

  • Apprendre des modèles d'activité attendus des opérations: Définissez des modèles d'activité des opérations pour déterminer quand un comportement ne correspond pas aux valeurs attendues, afin de pouvoir répondre de manière appropriée si nécessaire.
  • Apprendre des modèles d'activité attendus des opérations

  • Apprendre des modèles d'activité attendus des opérations: Définissez des modèles d'activité des opérations pour déterminer quand un comportement ne correspond pas aux valeurs attendues, afin de pouvoir répondre de manière appropriée si nécessaire.
  • Signaler les menaces sur les résultats des opérations

  • Signaler les menaces sur les résultats des opérations: Déclenchez une alerte quand une menace pèse sur les résultats des opérations, afin de pouvoir répondre de manière appropriée si nécessaire.
    What is Amazon CloudWatch Events?
    Creating Amazon CloudWatch alarms
    Invoking Lambda functions using Amazon SNS notifications
  • Signaler la détection d'anomalies dans les opérations

  • Signaler la détection d'anomalies dans les opérations: Déclenchez une alerte quand des anomalies sont détectées dans les opérations, afin de pouvoir répondre de manière appropriée si nécessaire.
    What is Amazon CloudWatch Events?
    Creating Amazon CloudWatch alarms
    Invoking Lambda functions using Amazon SNS notifications
  • Valider la réalisation des résultats et l’efficacité des KPI et des métriques

  • Valider la réalisation des résultats et l’efficacité des KPI et des métriques : Créez une vue des activités des opérations au niveau de l'entreprise pour vous aider à déterminer si vous répondez aux besoins et permettre d'identifier les domaines ayant besoin d'être améliorés pour atteindre les objectifs commerciaux. Validez l'efficacité des KPI et des métriques et vérifiez-les si nécessaire.
    Using Amazon CloudWatch dashboards
    What is log analytics?