此內容已過時。這個版本的 Well-Architected 框架現在可以在以下位置找到: https://docs.aws.amazon.com/zh_tw/wellarchitected/2022-03-31/framework/performance-efficiency.html

PERF 7: 您如何監控資源來確保達成預期效能?

系統效能可能會隨時間降低。監控系統效能以識別效能降低情況,並修復內部或外部因素,如作業系統或應用程式負載。

資源

Cut through the chaos: Gain operational visibility and insight (MGT301-R1)
X-Ray Documentation
CloudWatch Documentation
Monitoring, Logging, and Performance APN Partners

最佳實務:

改進方案

記錄效能相關指標

  • 記錄效能資料: 確定與您的工作負載相關的效能指標並進行記錄。此資料有助於識別哪些元件會影響整體效能或工作負載效率。
  • 確定效能指標: 使用客戶體驗來確定最重要的指標。對於每個指標,確定目標、測量方法和優先級。使用這些資料點來建置警示和通知,以主動解決與效能相關的問題。
  • 分析事件或事故發生時的指標

  • 優先考慮關鍵使用者案例的體驗問題: 在為架構編寫關鍵使用者案例時,應包括效能需求,例如指定每個關鍵案例應執行的速度。對於這些關鍵案例,實作額外執行指令碼的使用者之旅,以確保您了解這些使用者案例會如何根據您的要求予以執行。
  • 建立用於測量工作負載效能的關鍵績效指標 (KPI)

  • 定義客戶體驗: 記錄客戶所需的效能體驗,包括客戶如何評價工作負載的效能。使用這些要求來建立 KPI,這些指標將指示系統的整體效能。
  • 測試使用者之旅: 使用生產資料的綜合或處理過的版本 (移除敏感或身份資訊) 進行負載測試。透過在整個應用程式中使用重新執行或預先程式化的使用者之旅來測試整個架構。
  • 使用監控來產生警示型通知

  • 監控指標: Amazon CloudWatch 可以收集架構中各種資源的指標。您可以收集和發佈自訂指標以顯示業務或衍生指標。使用 CloudWatch 或第三方監控服務設定警示,藉以指出何時違反閾值。
  • 定期審查指標

  • 不斷改進指標收集和監控: 作為對事故或事件的回應的一部分,評估哪些指標有助於解決問題,哪些指標可以幫助解決問題但未被追蹤。使用此方法提高所收集指標的品質,從而可以防止事故發生或更快地解決將來的事故。
  • 主動監控和警示

  • 在營運過程中監控效能: 實作可在工作負載執行時提供效能可見度的程序。建立監控儀表板,並建立效能期望的基準。