此內容已過時。這個版本的 Well-Architected 框架現在可以在以下位置找到: https://docs.aws.amazon.com/zh_tw/wellarchitected/2022-03-31/framework/reliability.html

REL 13: 您如何規劃災難復原 (DR)?

備妥備份和冗餘工作負載元件是 DR 策略的開始。RTO 和 RPO 是您還原可用性的目標。根據業務需求設定這些目標。實作策略以滿足這些目標,考量工作負載資源和資料的位置和功能。

資源

AWS re:Invent 2018: Architecture Patterns for Multi-Region Active-Active Applications (ARC209-R2)
AWS re:Invent 2019: Backup-and-restore and disaster-recovery solutions with AWS (STG208)
What Is AWS Backup?
Remediating Noncompliant AWS Resources by AWS Config Rules
AWS Systems Manager Automation
AWS CloudFormation: Detect Drift on an Entire CloudFormation Stack
Amazon RDS: Cross-region backup copy
RDS: Replicating a Read Replica Across Regions
S3: Cross-Region Replication
Route 53: Configuring DNS Failover
CloudEndure Disaster Recovery
How do I implement an Infrastructure Configuration Management solution on AWS?
CloudEndure Disaster Recovery to AWS
AWS Marketplace: products that can be used for disaster recovery
APN Partner: partners that can help with disaster recovery

最佳實務:

改進方案

定義停機和資料遺失的復原目標

  • 為工作負載確定需求類別: 識別主要業務驅動因素和推動力的工作負載。識別僅限內部工具的工作負載和外部可見工具的工作負載。識別停機時間對各工作負載的業務影響。建立 5 個或更少的類別,然後縮小復原時間目標 (RTO) 和復原點目標 (RPO) 要求的範圍。
  • 使用定義的復原策略來滿足復原目標

  • 制定可達到每個類別之復原時間目標 (RTO) 和復原點目標 (RPO) 的策略: 如果工作負載需要建構多區域策略,您應該選擇下列其中一個策略。這些策略按複雜度遞增的順序列出,以及按 RTO 和 RPO 的遞減順序列出。備份和還原至另一個 AWS 區域可以進一步確保資料可在需要時使用,但對於其他策略而言,您應將複雜性和成本與使用 AWS 地區內的多個可用區域達成的成果加以衡量。
    AWS re:Invent 2019: Backup-and-restore and disaster-recovery solutions with AWS (STG208)
    Amazon RDS: Cross-region backup copy
    RDS: Replicating a Read Replica Across Regions
    S3: Cross-Region Replication
  • 測試災難復原實作以驗證實作

  • 為復原設計您的工作負載。定期測試您的復原路徑: 復原導向運算 (ROC) 可識別系統中能增強復原能力的特性。這些特性包括:隔離和冗餘,系統範圍內的回復變更能力,監控和確定運行狀態的能力,提供診斷、自動復原和模組化設計的能力,以及重新啟動的能力。練習復原路徑,以確保您可以在指定時間內完成復原到指定狀態。在復原過程中使用您的執行手冊,以記錄問題並在下一次測試前找出其解決方案。
    The Berkeley/Stanford recovery-oriented computing project
  • 使用 CloudEndure Disaster Recovery 實作和測試您的 DR 策略
    Testing the Disaster Recovery Solution with CloudEndure
    CloudEndure Disaster Recovery
    CloudEndure Disaster Recovery to AWS
  • 管理 DR 站點或區域的組態偏移

  • 確保您的交付管道同時交付到主要站點和備份站點。: 用於將應用程式部署到生產中的交付管道,應分發到所有指定的災難復原策略位置,包括開發和測試環境。
  • 啟用 AWS Config 追蹤潛在的偏移位置: 使用 AWS Config 規則建立系統,以執行災難復原策略,並在發現偏移時產生提醒。
    Remediating Noncompliant AWS Resources by AWS Config Rules
    AWS Systems Manager Automation
  • 使用 AWS CloudFormation 部署基礎設施: AWS CloudFormation 可以偵測 CloudFormation 範本指定項目與實際部署項目之間的偏移
    AWS CloudFormation: Detect Drift on an Entire CloudFormation Stack
  • 自動化復原

  • 自動執行復原路徑: 若復原時間較短,則人為判斷和行動無法用於可用性高的方案。系統應在每種情況下都能自動復原。