OPS 7: Wie bringen Sie in Erfahrung, ob Sie für die Unterstützung eines Workloads bereit sind?
Bewerten Sie die betriebliche Bereitschaft Ihres Workloads, Prozesse und Verfahren sowie Ihrer Mitarbeiter, damit Sie die betrieblichen Risiken im Zusammenhang mit Ihrer Workload genau kennen.
Ressourcen
AWS Config
AWS Systems Manager Features
Bewährte Methoden:
-
Sicherstellen des Know-how der Mitarbeiter: Stellen Sie einen Mechanismus bereit, mit dem Sie prüfen können, ob Sie über ausreichend geschulte Mitarbeiter verfügen, die die betrieblichen Anforderungen erfüllen können. Schulen Sie Ihre Mitarbeiter und passen Sie die Mitarbeiterkapazität bei Bedarf an, damit Sie immer über genug Ressourcen verfügen.
-
Sicherstellen einer konsistenten Prüfung der betrieblichen Bereitschaft: Sorgen Sie dafür, dass Ihre Bereitschaft für den Betrieb eines Workload auf konsistente Art und Weise geprüft wird. Die Prüfungen müssen mindestens die operative Bereitschaft der Teams und des Workload sowie Sicherheitsaspekte umfassen. Implementieren Sie Prüfungsaktivitäten im Code und lösen Sie gegebenenfalls eine automatisierte Überprüfung als Reaktion auf Ereignisse aus, um Konsistenz und eine hohe Ausführungsgeschwindigkeit zu gewährleisten. Außerdem können Sie dadurch Fehler verringern, die durch manuelle Prozesse entstehen.
-
Verwenden von Runbooks zur Durchführung von Verfahren: Runbooks sind dokumentierte Verfahren, die ein bestimmtes Ergebnis verfolgen. Durch die Dokumentation von Verfahren in Runbooks schaffen Sie die Voraussetzung für die einheitliche und schnelle Reaktion auf gut bekannte Ereignisse. Implementieren Sie Runbooks als Code und lösen Sie gegebenenfalls die Ausführung von Runbooks als Reaktion auf Ereignisse aus, um Konsistenz zu gewährleisten und Reaktionen zu beschleunigen. Außerdem können Sie dadurch Fehler verringern, die durch manuelle Prozesse entstehen.
-
Verwenden von Playbooks zum Untersuchen von Fehlern: Ermöglichen Sie konsistente und schnelle Reaktionen auf unklare Probleme, indem Sie den Untersuchungsprozess in Playbooks dokumentieren. Playbooks bieten die vordefinierten Schritte, die ausgeführt werden, um die Faktoren zu identifizieren, die zu einem Problem beitragen. Die Ergebnisse aus jedem Prozessschritt sind die Grundlage für die nächsten Schritte. Nach diesem Muster wird vorgegangen, bis das Problem identifiziert oder eskaliert wird.
-
Treffen fundierter Entscheidungen für die Bereitstellung von Systemen und Änderungen: Bewerten Sie die Fähigkeiten des Teams zur Unterstützung des Workloads und die Einhaltung der Governance durch den Workload. Wägen Sie diese Aspekte gegen die Vorteile der Bereitstellung ab, wenn Sie vor der Entscheidung stehen, ob Sie ein System umstellen oder eine Änderung in der Produktion vornehmen sollten. Beschäftigen Sie sich eingehend mit den Vorteilen und Risiken, damit Sie fundierte Entscheidungen treffen können.
Verbesserungsplan
Sicherstellen des Know-how der Mitarbeiter
- Teamgröße: Stellen Sie sicher, dass Sie über genügend Teammitglieder verfügen, um die operativen Aktivitäten abzudecken, einschließlich der Rufbereitschaftsaktivitäten.
- Qualifikationen des Teams: Stellen Sie sicher, dass Ihre Teammitglieder die erforderlichen Schulungen zu AWS,
zum Workload und zu Ihren Einsatzmitteln zur Erfüllung der zugewiesenen Aufgaben erhalten.
AWS Events and Webinars
Welcome to AWS Training and Certification - Überprüfen der Kompetenzen: Überprüfen Sie die Größe und Qualifikation des Teams bei sich ändernden Betriebsbedingungen und Workloads, um sicherzustellen, dass ausreichende Fähigkeiten zur Aufrechterhaltung der operativen Leistung vorhanden sind. Nehmen Sie Anpassungen vor, um sicherzustellen, dass Teamgröße und -fähigkeit den betrieblichen Anforderungen für die vom Team unterstützten Workloads entsprechen.
Sicherstellen einer konsistenten Prüfung der betrieblichen Bereitschaft
AWS Systems Manager
AWS Config Rules dynamic compliance checking for cloud resources
How to audit your AWS resources for security compliance by using custom AWS Config Rules
How to track configuration changes to CloudFormation stacks using AWS Config
Amazon Inspector update assessment reporting, proxy support, and more
- Erstellen von Checklisten: Sorgen Sie dafür, dass Ihre Bereitschaft für den Betrieb eines Workloads auf konsistente Art und Weise geprüft wird. Erstellen Sie Checklisten für die betriebliche Bereitschaft und validieren Sie diese auf der Grundlage der Anforderungen Ihres Unternehmens sowie auf Basis Ihrer Entwicklungs-, Betriebs- und Governance-Anforderungen. Die Listen müssen sich mit folgenden Punkten befassen: Governance, Best Practices, Konfigurationsstandards, Wiederherstellungsverfahren, Überwachung, Wartungsprozeduren, Verfahren für IT-Abläufe und Personalgestaltung.
- Verwenden von Checklisten: Stellen Sie den Entwicklern Checklisten zur Verfügung, damit diese bei der Entwicklung die jeweiligen Standards einhalten. Haken Sie Checklisten beim Wechsel zwischen Lebenszyklusphasen und Umgebungen ab, damit Sie Probleme frühzeitig, wenn der Aufwand für die Behebung von Problemen geringer ist, erkennen können. Treffen Sie mit Hilfe der Ergebnisse der Checklisten fundierte Entscheidungen mit einer Abwägung der Vorteile und Risiken, wenn Sie Änderungen zwischen Umgebungen einführen möchten.
- Implementieren von Checklisten als Code und Auslösen der Checklisten-Ausführung als
Reaktion auf Ereignisse:
Implementieren Sie Checklisten als Code und lösen Sie möglichst die Ausführung von
Checklisten als Reaktion auf Ereignisse aus, um Reaktionen zu beschleunigen und einheitliche
Aktionen sicherzustellen. Außerdem können Sie dadurch Fehler verringern, die durch
manuelle Prozesse entstehen. Integrieren Sie eine automatisierte Checklisten-Ausführung
in Bereitstellungs-Pipelines.
AWS Config
What is AWS Config?
AWS Config: evaluating resources with Rules
Verwenden von Runbooks zur Durchführung von Verfahren
- Implementieren von Runbooks als Code:
Führen Sie Ihre Operationen als Code durch, indem Sie Ihre Runbooks als Code implementieren,
um Konsistenz zu gewährleisten und Fehler aufgrund manueller Prozesse zu reduzieren.
AWS Systems Manager Run Command
AWS Systems Manager Automation
What is AWS Lambda? - Auslösen von Runbooks als Reaktion auf Ereignisse:
Lösen Sie gegebenenfalls die Ausführung von Runbook-Code als Reaktion auf beobachtete
Ereignisse aus. Auf diese Weise können Sie die Reaktionsgeschwindigkeit erhöhen und
den Aufwand für die Reaktion verringern.
What is Amazon CloudWatch Events?
Creating a CloudWatch Events rule that triggers on an event
Creating a CloudWatch Events rule that triggers on an AWS API call using AWS CloudTrail
CloudWatch Events event examples from supported services
Using Amazon CloudWatch Alarms
Verwenden von Playbooks zum Untersuchen von Fehlern
- Implementieren von Playbooks als Code:
Führen Sie Ihre Operationen als Code aus, indem Sie Skripts für Ihre Playbooks erstellen,
um Konsistenz sicherzustellen und Fehler zu reduzieren, die durch manuelle Prozesse
verursacht werden. Playbooks können aus mehreren Skripts bestehen, die die verschiedenen
Schritte darstellen, die erforderlich sein können, um die zu einem Problem beitragenden
Faktoren zu identifizieren. Runbook-Aktivitäten können ausgelöst oder als Teil von
Playbook-Aktivitäten ausgeführt werden, können aber auch die Ausführung eines Playbook
als Reaktion auf festgestellte Ereignisse anfordern.
Automate your operational playbooks with AWS Systems Manager
AWS Systems Manager Run Command
AWS Systems Manager Automation
What is AWS Lambda?
What is Amazon CloudWatch Events?
Using Amazon CloudWatch Alarms
Treffen fundierter Entscheidungen für die Bereitstellung von Systemen und Änderungen