PERF 7: Wie lassen sich Ressourcen überwachen, um sicherzustellen, dass sie funktionieren?
Die Systemleistung kann sich mit der Zeit verschlechtern. Überwachen Sie die Systemleistung, um eine Verschlechterung frühzeitig zu erkennen und ihr entgegenzuwirken, etwa indem Sie interne oder externe Faktoren wie das Betriebssystem oder die Anwendungslast korrigieren.
Ressourcen
Cut through the chaos: Gain operational visibility and insight (MGT301-R1)
X-Ray Documentation
CloudWatch Documentation
Monitoring, Logging, and Performance APN Partners
Bewährte Methoden:
-
Leistungskennzahlen erfassen: Verwenden Sie einen Überwachungs- und Beobachtungs-Service, um leistungsbezogene Metriken aufzuzeichnen. Erfassen Sie beispielsweise Datenbanktransaktionen, langsame Abfragen, I/O-Latenz, den Durchsatz von HTTP-Anforderungen, Servicelatenz und andere wichtige Daten.
-
Kennzahlen bei Eintreten von Ereignissen oder Vorfällen analysieren: Ziehen Sie während eines Ereignisses oder Vorfalls oder als Reaktion darauf Überwachungs-Dashboards oder Berichte heran, um die Auswirkungen nachzuvollziehen und zu diagnostizieren. Diese Ansichten bieten Einblick in die Bereiche der Workload, die nicht die erwartete Leistung liefern.
-
Festlegen von Leistungskennzahlen (Key Performance Indicators, KPIs) zur Messung der Workload-Leistung: Identifizieren Sie die KPIs, die Aufschluss über die ordnungsgemäße Workload-Leistung geben. Bei einer API-basierten Workload kann die allgemeine Latenz von Reaktionen beispielsweise als Indikator für die Gesamtleistung dienen. Im Falle einer E-Commerce-Website kann die Anzahl der Einkäufe als KPI herangezogen werden.
-
Alarmbasierte Benachrichtigungen mit Überwachungstool generieren: Verwenden Sie basierend auf den von Ihnen definierten leistungsbezogenen wichtigen Kennzahlen (KPIs) ein Überwachungssystem, bei dem Alarme automatisch generiert werden, wenn sich die Messwerte außerhalb der erwarteten Grenzen bewegen.
-
Kennzahlen regelmäßig überprüfen: Überprüfen Sie als routinemäßige Wartungsmaßnahme oder als Reaktion auf Ereignisse oder Vorfälle, welche Kennzahlen erfasst werden. Ermitteln Sie anhand dieser Überprüfung, welche Metriken für die Behebung von Problemen maßgeblich waren und welche zusätzlichen Kennzahlen hilfreich wären, um Probleme zu identifizieren, zu beheben oder zu verhindern.
-
Proaktive Überwachung und Alarmgebung: Verwenden Sie wichtige Leistungskennzahlen (KPIs) in Kombination mit Überwachungs- und Warnsystemen, um eine proaktive Behandlung leistungsbezogener Probleme zu ermöglichen. Verwenden Sie Alarme, um automatisierte Aktionen auszulösen und auf diese Weise Probleme nach Möglichkeit zu beheben. Leiten Sie den Alarm an die Personen weiter, die die richtigen Maßnahmen einleiten können, falls keine automatisierte Reaktion möglich ist. Beispielsweise können Sie ein System nutzen, das erwartete Werte wichtiger Leistungskennzahlen (KPIs) prognostiziert und bei Überschreiten bestimmter Schwellenwerte einen Alarm ausgibt. Denkbar ist auch ein Tool, das Bereitstellungen automatisch anhält oder zurücksetzt, wenn sich KPIs außerhalb der erwarteten Werte befinden.
Verbesserungsplan
Leistungskennzahlen erfassen
Kennzahlen bei Eintreten von Ereignissen oder Vorfällen analysieren
Festlegen von Leistungskennzahlen (Key Performance Indicators, KPIs) zur Messung der
Workload-Leistung
Alarmbasierte Benachrichtigungen mit Überwachungstool generieren
Kennzahlen regelmäßig überprüfen
Proaktive Überwachung und Alarmgebung