Dieser Inhalt ist veraltet. Diese Version des Well-Architected Framework finden Sie jetzt unter: https://docs.aws.amazon.com/de_de/wellarchitected/2022-03-31/framework/reliability.html

REL 13: Was ist bei der Planung der Notfallwiederherstellung zu beachten?

Vorhandene Sicherungen und redundante Workload-Komponenten sind der Ausgangspunkt Ihrer Strategie für die Notfallwiederherstellung. RTO und RPO sind die Ziele für die Wiederherstellung der Verfügbarkeit. Legen Sie diese Ziele entsprechend den geschäftlichen Anforderungen fest. Implementieren Sie eine Strategie, um diese Ziele zu erreichen, und berücksichtigen Sie Standorte und Funktionen von Workload-Ressourcen und -Daten.

Ressourcen

AWS re:Invent 2018: Architecture Patterns for Multi-Region Active-Active Applications (ARC209-R2)
AWS re:Invent 2019: Backup-and-restore and disaster-recovery solutions with AWS (STG208)
What Is AWS Backup?
Remediating Noncompliant AWS Resources by AWS Config Rules
AWS Systems Manager Automation
AWS CloudFormation: Detect Drift on an Entire CloudFormation Stack
Amazon RDS: Cross-region backup copy
RDS: Replicating a Read Replica Across Regions
S3: Cross-Region Replication
Route 53: Configuring DNS Failover
CloudEndure Disaster Recovery
How do I implement an Infrastructure Configuration Management solution on AWS?
CloudEndure Disaster Recovery to AWS
AWS Marketplace: products that can be used for disaster recovery
APN Partner: partners that can help with disaster recovery

Bewährte Methoden:

Verbesserungsplan

Definieren von Wiederherstellungszielen bei Ausfällen und Datenverlusten

  • Festlegen von Bedarfskategorien für die Workloads: Ermitteln Sie die Workloads, die den geschäftlichen Erfolg fördern und vorantreiben. Bestimmen Sie die Workloads, bei denen es sich um rein interne Tools handelt, und die Workloads, die extern sichtbare Tools sind. Identifizieren Sie die geschäftlichen Auswirkungen von Ausfallzeiten für die einzelnen Workloads. Erstellen Sie Kategorien (höchstens fünf) und optimieren Sie Ihre RTO- und RPO-Anforderungen.
  • Erfüllen der Wiederherstellungsziele mit definierten Wiederherstellungsstrategien

  • Festlegen von Strategien zur Erreichung des RTO und RPO für jede Kategorie: Falls für Ihre Workload eine Strategie für mehrere Regionen erforderlich ist, sollten Sie eine der folgenden Strategien wählen. Sie werden in der Reihenfolge zunehmender Komplexität und in der Reihenfolge von abnehmendem RTO und RPO aufgelistet. Mit Sicherungen und Wiederherstellungen in einer anderen AWS-Region lässt sich ein höherer Grad an Gewissheit erreichen, dass Daten bei Bedarf verfügbar sind. Für die anderen Strategien sollten Sie jedoch deren potenzielle Komplexität und Kosten im Vergleich zu dem abwägen, was Sie mit mehreren Availability Zones innerhalb einer AWS-Region erreichen können.
    AWS re:Invent 2019: Backup-and-restore and disaster-recovery solutions with AWS (STG208)
    Amazon RDS: Cross-region backup copy
    RDS: Replicating a Read Replica Across Regions
    S3: Cross-Region Replication
  • Testen der implementierten Notfallwiederherstellung

  • Workloads für die Wiederherstellung auslegen. Regelmäßig Testen der Wiederherstellungspfade: Mithilfe des Recovery Oriented Computing (ROC, wiederherstellungsorientiertes Computing) können Sie die für die Wiederherstellung förderlichen Merkmale in Systemen identifizieren. Hierzu zählen: Isolation und Redundanz, die systemweite Fähigkeit zum Zurücksetzen von Änderungen, das Überwachen und Ermitteln des Systemzustands, die Bereitstellung von Diagnosen, automatisierte Wiederherstellungen, ein modulares Design und die Möglichkeit von Neustarts. Erproben Sie den Wiederherstellungspfad, um sicherzustellen, dass die Wiederherstellung innerhalb des vorgegebenen Zeitraums erfolgt und der vorgegebene Zustand erreicht wird. Dokumentieren Sie während der Wiederherstellung auftretende Probleme in Ihren Runbooks und suchen Sie vor dem nächsten Test nach Lösungen dafür.
    The Berkeley/Stanford recovery-oriented computing project
  • Implementieren und Testen der Strategie für die Notfallwiederherstellung mit CloudEndure Disaster Recovery
    Testing the Disaster Recovery Solution with CloudEndure
    CloudEndure Disaster Recovery
    CloudEndure Disaster Recovery to AWS
  • Verwalten der Konfigurationsabweichungen am Standort oder in der Region der Notfallwiederherstellung

  • Sicherstellen, dass die Bereitstellung an Haupt- und Sicherungsstandorte erfolgt: Pipelines für die Bereitstellung von Anwendungen in der Produktion müssen die Anwendungen an alle Standorte verteilen, die in der Strategie für die Notfallwiederherstellung angegeben sind. Dazu gehören auch Entwicklungs- und Testumgebungen.
  • Aktivieren von AWS Config zum Verfolgen von Standorten mit möglichen Abweichungen: Erstellen Sie mithilfe von AWS Config-Regeln Systeme, die Ihre Strategien für die Notfallwiederherstellung durchsetzen und bei Erkennung von Abweichungen Alarme generieren.
    Remediating Noncompliant AWS Resources by AWS Config Rules
    AWS Systems Manager Automation
  • Bereitstellen der Infrastruktur mit AWS CloudFormation: AWS CloudFormation kann Abweichungen zwischen den Angaben in den CloudFormation-Vorlagen und der tatsächlichen Bereitstellung erkennen.
    AWS CloudFormation: Detect Drift on an Entire CloudFormation Stack
  • Automatisieren der Wiederherstellung

  • Automatisieren von Wiederherstellungspfaden: Wenn in Szenarien mit hoher Verfügbarkeit kurze Wiederherstellungszeiten erforderlich sind, sind menschliche Beurteilungen und Aktionen zu langsam. Das System sollte in jeder Situation in der Lage sein, eine Wiederherstellung durchzuführen.