Dieser Inhalt ist veraltet. Diese Version des Well-Architected Framework finden Sie jetzt unter: https://docs.aws.amazon.com/de_de/wellarchitected/2022-03-31/framework/reliability.html

REL 6: Was ist bei der Überwachung von Workload-Ressourcen zu beachten?

Protokolle und Metriken sind wertvolle Tools, um einen Einblick in den Zustand Ihrer Workloads zu gewinnen. Sie können Ihre Workload so konfigurieren, dass Protokolle und Metriken überwacht und bei Über- oder Unterschreiten von Schwellenwerten oder wichtigen Ereignissen Benachrichtigungen gesendet werden. Dank der Überwachung kann die Workload erkennen, wenn Schwellenwerte für eine niedrige Leistung unterschritten werden oder Ausfälle auftreten, sodass als Reaktion drauf eine automatische Wiederherstellung erfolgen kann.

Ressourcen

Using Amazon CloudWatch Metrics
Publishing Custom Metrics
Using Amazon CloudWatch Dashboards
Using Canaries (Amazon CloudWatch Synthetics)
Amazon CloudWatch Logs Insights Sample Queries
AWS Systems Manager Automation
What is AWS X-Ray?
Debugging with Amazon CloudWatch Synthetics and AWS X-Ray
The Amazon Builders' Library: Instrumenting distributed systems for operational visibility

Bewährte Methoden:

Verbesserungsplan

Überwachen aller Komponenten der Workload (Generierung)

  • Sicherstellen einer umfassenden Protokollierung: AWS stellt Überwachungs- und Protokollinformationen bereit. Mit deren Hilfe können Sie Warnungen sowie Änderungs- und Wiederherstellungsverfahren definieren.
  • Nutzen aller Standardmetriken: Jeder Service generiert Standardmetriken. Entscheiden Sie anhand einer Auswertung der Metriken, für welche Metriken zu den einzelnen Services Warnungen erforderlich sind.
    AWS Services That Publish CloudWatch Metrics
  • CloudWatch Synthetics ermöglicht die Einrichtung von Canary-Tests.
    Amazon CloudWatch Logs Insights Sample Queries
  • Erstellen eigener benutzerdefinierter Metriken: In AWS werden nicht alle Arten von Metriken oder Kombinationen davon generiert. Sie können dafür jedoch benutzerdefinierte Metriken erstellen.
    Publish custom metrics
  • Aggregieren der Protokolle: Indem Sie die Protokolle aggregieren, erhalten Sie einen zentralen Ort, an dem Sie Protokolldaten prüfen und Warnungen festlegen können.
  • Definieren und Berechnen von Metriken (Aggregierung)

  • Definieren und Berechnen von Metriken (Aggregierung): Speichern Sie Protokolldaten und wenden Sie gegebenenfalls Filter an, um Metriken zu berechnen. Dazu gehören z. B. die Anzahl eines bestimmten Protokollereignisses oder die Latenz, die aus den Zeitstempeln des Protokollereignisses berechnet wird.
  • Senden von Benachrichtigungen (Verarbeitung und Benachrichtigung in Echtzeit)

  • Verarbeitung und Benachrichtigung in Echtzeit: Sorgen Sie dafür, dass bei wichtigen Ereignissen die entsprechenden Organisationen benachrichtigt werden.
  • Automatisieren von Antworten (Verarbeitung und Benachrichtigung in Echtzeit)

  • Durchführen automatisierter Maßnahmen mit AWS Systems Manager: AWS Config überwacht und zeichnet Ihre Konfiguration von AWS-Ressourcen kontinuierlich auf und kann AWS Systems Manager Automation auslösen, um Probleme zu beheben.
    AWS Systems Manager Automation
  • Amazon CloudWatch sendet Änderungen des Alarmstatus an Amazon EventBridge. Erstellen Sie EventBridge-Regeln zur Automatisierung von Antworten.
    Creating an EventBridge Rule That Triggers on an Event from an AWS Resource
  • Erstellen Sie einen Plan zur Automatisierung von Antworten und führen Sie ihn aus.
  • Speicher und Analysen

  • Mit CloudWatch Logs Insights können Sie die Protokolldaten in Amazon CloudWatch Logs interaktiv durchsuchen und analysieren.
    Analyzing Log Data with CloudWatch Logs Insights
    Amazon CloudWatch Logs Insights Sample Queries
  • Senden Sie Protokolle mit Amazon CloudWatch Logs an Amazon S3. Dort können Sie die Daten mit Amazon Athena abfragen.
    How do I analyze my Amazon S3 server access logs using Athena?
  • Durchführen regelmäßiger Prüfungen

  • Erstellen mehrerer Dashboards für die Workload: Ein übergeordnetes Dashboard mit den wichtigsten Geschäftsmetriken ist unverzichtbar. Es sollte zudem die technischen Metriken enthalten, die Sie für den prognostizierten Zustand der Workload bei variabler Nutzung als die relevantesten eingestuft haben. Dashboards für verschiedene Anwendungsebenen und Abhängigkeiten, die untersucht werden können, sind ebenfalls empfehlenswert.
    Using Amazon CloudWatch Dashboards
  • Planen und regelmäßiges Überprüfen der Workload-Dashboards: Führen Sie regelmäßige Untersuchungen der Dashboards durch. Was die Gründlichkeit der Untersuchungen angeht, sind unterschiedliche Intervalle denkbar.
  • Überwachen der gesamten Nachverfolgung von Anfragen im System

  • Überwachen der gesamten Nachverfolgung von Anfragen im System: AWS X-Ray ist ein Service, der Daten zu Anfragen erfasst, die von Ihrer Anwendung verarbeitet werden. Zudem stellt er Tools bereit, mit denen Sie diese Daten anzeigen, filtern und auswerten können, um Probleme und Verbesserungsmöglichkeiten zu ermitteln. Für jede nachverfolgte Anfrage an die Anwendung können Sie detaillierte Informationen zur Anfrage und Antwort anzeigen. Informationen über Aufrufe, die die Anwendung an nachgelagerte AWS-Ressourcen, Microservices, Datenbanken und HTTP-Web-APIs durchführt, werden ebenfalls aufgeführt.
    What is AWS X-Ray?
    Debugging with Amazon CloudWatch Synthetics and AWS X-Ray