Questo contenuto è obsoleto. Questa versione di Framework Well-Architected è ora disponibile all'indirizzo: https://docs.aws.amazon.com/it_it/wellarchitected/2022-03-31/framework/reliability.html

REL 13: Come si pianifica il disaster recovery?

Avere backup e componenti del carico di lavoro ridondanti in loco è l'inizio della strategia di disaster recovery. RTO e RPO sono i tuoi obiettivi per il ripristino della disponibilità. Imposta questi valori in base alle esigenze aziendali. Implementa una strategia per raggiungere questi obiettivi, prendendo in considerazione le posizioni e la funzione delle risorse e dei dati del carico di lavoro.

Risorse

AWS re:Invent 2018: Architecture Patterns for Multi-Region Active-Active Applications (ARC209-R2)
AWS re:Invent 2019: Backup-and-restore and disaster-recovery solutions with AWS (STG208)
What Is AWS Backup?
Remediating Noncompliant AWS Resources by AWS Config Rules
AWS Systems Manager Automation
AWS CloudFormation: Detect Drift on an Entire CloudFormation Stack
Amazon RDS: Cross-region backup copy
RDS: Replicating a Read Replica Across Regions
S3: Cross-Region Replication
Route 53: Configuring DNS Failover
CloudEndure Disaster Recovery
How do I implement an Infrastructure Configuration Management solution on AWS?
CloudEndure Disaster Recovery to AWS
AWS Marketplace: products that can be used for disaster recovery
APN Partner: partners that can help with disaster recovery

Best practice:

Piano di miglioramento

Definizione degli obiettivi di ripristino in caso di downtime e perdita di dati

  • Definizione di categorie di esigenza per i tuoi carichi di lavoro: Identifica il carico di lavoro che costituisce il principale motore e catalizzatore dell'azienda. Identifica i carichi di lavoro che sono solo strumenti interni e i carichi di lavoro che sono strumenti visibili esternamente. Identifica l'impatto sull'azienda dei tempi di inattività per ogni carico di lavoro. Crea cinque o meno categorie e perfeziona la serie dei tuoi requisiti di Recovery Time Objective (RTO) e Recovery Point Objective (RPO).
  • Utilizzo di strategie di ripristino definite per conseguire gli obiettivi di ripristino

  • Definizione di strategie per raggiungere il recovery time objective (RTO) e il recovery point objective (RPO) per ogni categoria: Se il carico di lavoro necessita di una strategia multi-regione, dovresti scegliere una delle seguenti strategie. Sono elencate in ordine crescente di complessità e in ordine decrescente di RTO e RPO. Il backup e il ripristino in un'altra regione AWS possono garantire ulteriormente che i dati saranno disponibili quando necessario, ma per le altre strategie è necessario valutare la complessità potenziale e confrontare i costi rispetto a ciò che è possibile ottenere utilizzando più zone di disponibilità all'interno di una regione AWS.
    AWS re:Invent 2019: Backup-and-restore and disaster-recovery solutions with AWS (STG208)
    Amazon RDS: Cross-region backup copy
    RDS: Replicating a Read Replica Across Regions
    S3: Cross-Region Replication
  • Esecuzione di test sull'implementazione del disaster recovery per convalidare l'implementazione

  • Progetta i carichi di lavoro per il ripristino. Esegui regolarmente test dei tuoi percorsi di ripristino: L'informatica orientata al ripristino (ROC, Recovery Oriented Computing) identifica le caratteristiche nei sistemi che migliorano il ripristino. Queste caratteristiche sono: isolamento e ridondanza, capacità a livello di sistema di ripristinare le modifiche, capacità di monitorare e determinare lo stato, capacità di fornire diagnostica, ripristino automatizzato, progettazione modulare e possibilità di riavvio. Esegui il percorso di ripristino per assicurarti di poter realizzare il ripristino nel tempo specificato allo stato specificato. Usa i tuoi runbook durante questo ripristino per documentare i problemi e trovare le loro soluzioni prima del test successivo.
    The Berkeley/Stanford recovery-oriented computing project
  • Usa CloudEndure Disaster Recovery per implementare e testare la tua strategia di DR
    Testing the Disaster Recovery Solution with CloudEndure
    CloudEndure Disaster Recovery
    CloudEndure Disaster Recovery to AWS
  • Gestione della deviazione di configurazione nel sito o nella regione del DR

  • Assicurati che le tue pipeline di distribuzione riforniscano sia i siti principali che di backup.: Le pipeline per la distribuzione di applicazioni in produzione devono essere distribuite in tutte le posizioni della strategia di disaster recovery specificate, inclusi gli ambienti di sviluppo e test.
  • Abilitazione di AWS Config per monitorare le potenziali posizioni di deviazione: Utilizza AWS Config per creare sistemi che applicano le tue strategie di disaster recovery e generano avvisi quando rilevano una deviazione.
    Remediating Noncompliant AWS Resources by AWS Config Rules
    AWS Systems Manager Automation
  • Utilizzo di AWS CloudFormation per distribuire l'infrastruttura: AWS CloudFormation è in grado di rilevare le deviazioni tra ciò che i modelli di CloudFormation specificano e ciò che viene effettivamente distribuito
    AWS CloudFormation: Detect Drift on an Entire CloudFormation Stack
  • Automatizzazione del ripristino

  • Automatizzazione dei percorsi di ripristino: Per tempi di ripristino brevi, non è possibile servirsi del giudizio umano e dell'azione per scenari di disponibilità elevata. Il sistema dovrebbe ripristinarsi automaticamente in ogni situazione.