REL 6: Comment surveillez-vous les ressources de charge de travail ?

Les journaux et les métriques sont de puissants outils pour obtenir informations sur l'état de votre charge de travail. Vous pouvez configurer votre charge de travail de sorte à surveiller les journaux et les métriques et envoyer des notifications lorsque les seuils sont franchis ou que des événements significatifs se produisent. La surveillance permet à votre charge de travail de reconnaître quand des seuils de faible performance sont franchis ou quand des défaillances se produisent, en vue de sa reprise automatique.

Ressources

Using Amazon CloudWatch Metrics
Publishing Custom Metrics
Using Amazon CloudWatch Dashboards
Using Canaries (Amazon CloudWatch Synthetics)
Amazon CloudWatch Logs Insights Sample Queries
AWS Systems Manager Automation
What is AWS X-Ray?
Debugging with Amazon CloudWatch Synthetics and AWS X-Ray
The Amazon Builders' Library: Instrumenting distributed systems for operational visibility

Bonnes pratiques:

Plan d'amélioration

Surveiller tous les composants de la charge de travail (génération)

  • Activer la journalisation si disponible: AWS comporte des informations relatives à la surveillance et à la journalisation disponibles pour utilisation. La surveillance et la journalisation peuvent être utilisées pour définir les procédures d'alerte, de modification et de reprise.
  • Utiliser toutes les métriques par défaut: Chaque service génère des métriques par défaut. Évaluez les métriques pour identifier celles qui nécessitent des alertes pour chaque service.
    AWS Services That Publish CloudWatch Metrics
  • CloudWatch Synthetics vous permet d'obtenir des tests Canary.
    Amazon CloudWatch Logs Insights Sample Queries
  • Créer des métriques personnalisées pour votre propre utilisation: AWS ne génère pas certaines métriques et certaines combinaisons de métriques, mais vous pouvez les créer à l'aide de métriques personnalisées
    Publish custom metrics
  • Agréger vos journaux: L'agrégation de journaux permet de centraliser l'examen des données journaux et la configuration des alertes.
  • Définir et calculer des métriques (regroupement)

  • Définir et calculer des métriques (regroupement): Stockez les données des journaux et appliquez des filtres si nécessaire pour calculer les métriques, en particulier le décompte d'un événement de journal spécifique ou la latence calculée à partir des horodatages des événements de journaux
  • Envoyer des notifications (traitement et alarmes en temps réel)

  • Effectuer le traitement et l'envoi d'alarme en temps réel: Les organisations qui désirent être informées des événements significatifs reçoivent des notifications lorsque ceux-ci se produisent.
  • Automatiser les réponses (traitement et alarmes en temps réel)

  • Utiliser AWS Systems Manager pour effectuer des actions automatisées: AWS Config surveille et enregistre en permanence vos configurations de ressources AWS. Il peut déclencher AWS Systems Manager Automation pour résoudre les problèmes.
    AWS Systems Manager Automation
  • Amazon CloudWatch envoie les événements de changement d'état d'alarme à Amazon EventBridge. Créer des règles EventBridge pour automatiser les réponses
    Creating an EventBridge Rule That Triggers on an Event from an AWS Resource
  • Créer et exécuter un plan pour automatiser les réponses
  • Stockage et analyse

  • CloudWatch Logs Insights vous permet de rechercher et d'analyser de manière interactive vos données de journaux dans Amazon CloudWatch Logs
    Analyzing Log Data with CloudWatch Logs Insights
    Amazon CloudWatch Logs Insights Sample Queries
  • Utiliser Amazon CloudWatch Logs pour envoyer des journaux vers Amazon S3 où vous pouvez les utiliser ou Amazon Athena pour interroger les données
    How do I analyze my Amazon S3 server access logs using Athena?
  • Procéder à des examens réguliers

  • Créer plusieurs tableaux de bord pour la charge de travail: Vous devez disposer d'un tableau de bord de niveau supérieur qui contient les principales métriques commerciales, ainsi que les métriques techniques que vous avez identifiées comme étant les plus pertinentes pour l'état projeté de la charge de travail au fil de la variation de l'utilisation. Vous devez également avoir des tableaux de bord pour différents niveaux et dépendances d'application qui peuvent être inspectés.
    Using Amazon CloudWatch Dashboards
  • Planifier et effectuer des vérifications régulières des tableaux de bord de charge de travail: Effectuez une inspection régulière des tableaux de bord. Vous pouvez avoir des cadences différentes selon la profondeur à laquelle vous inspectez.
  • Surveiller le suivi de bout en bout des demandes via votre système

  • Surveiller le suivi de bout en bout des demandes via votre système: AWS X-Ray est un service qui collecte des données sur les demandes servies par votre application et fournit des outils que vous pouvez utiliser pour afficher, filtrer et obtenir des informations sur ces données afin d'identifier les problèmes et les circonstances opportunes d'optimisation. Pour toute demande suivie envoyée à votre application, vous pouvez consulter des informations détaillées non seulement sur la demande et la réponse, mais également sur les appels effectués par votre application vers des ressources AWS en aval, des microservices, des bases de données et des API Web HTTP.
    What is AWS X-Ray?
    Debugging with Amazon CloudWatch Synthetics and AWS X-Ray