此內容已過時。這個版本的 Well-Architected 框架現在可以在以下位置找到: https://docs.aws.amazon.com/zh_tw/wellarchitected/2022-03-31/framework/reliability.html

REL 6: 如何監控工作負載資源?

日誌和指標是深入了解工作負載運作狀態的強大工具。您可以設定工作負載以監控日誌和指標,並在超過閾值或發生重大事件時傳送通知。監控可讓您的工作負載識別何時會超過低效能閾值或發生故障,以便自動復原來回應。

資源

Using Amazon CloudWatch Metrics
Publishing Custom Metrics
Using Amazon CloudWatch Dashboards
Using Canaries (Amazon CloudWatch Synthetics)
Amazon CloudWatch Logs Insights Sample Queries
AWS Systems Manager Automation
What is AWS X-Ray?
Debugging with Amazon CloudWatch Synthetics and AWS X-Ray
The Amazon Builders' Library: Instrumenting distributed systems for operational visibility

最佳實務:

改進方案

監控工作負載的所有元件 (產生)

  • 在可用的地方啟用記錄: AWS 具有可供使用的監控和日誌資訊。監控和日誌可用於定義提醒、變更和復原程序
  • 使用所有預設指標: 每個服務都會產生預設指標。評估指標,以決定每項服務上的哪些指標需要提醒。
    AWS Services That Publish CloudWatch Metrics
  • CloudWatch Synthetics 功能可讓您取得 Canary 測試
    Amazon CloudWatch Logs Insights Sample Queries
  • 建立自訂指標供自己使用: AWS 不會產生一些指標和指標組合,但是您可以使用自訂指標建立它們
    Publish custom metrics
  • 彙總您的日誌: 日誌彙總為您提供了一個查看日誌資料和設定提醒的地方
  • 定義和計算指標 (彙總)

  • 定義和計算指標 (彙總): 視需要儲存日誌資料並套用篩選條件以計算指標,例如特定日誌事件的計數,或是從日誌事件時間戳記計算的延遲
  • 傳送通知 (即時處理和警示)

  • 執行即時處理和警示: 當重大事件發生時,需要知道的組織會收到通知
  • 自動化回應 (即時處理和警示)

  • 使用 AWS Systems Manager 執行自動化動作: AWS Config 會持續監控和記錄您的 AWS 資源組態,並可觸發 AWS Systems Manager Automation 以修復問題
    AWS Systems Manager Automation
  • Amazon CloudWatch 會將警示狀態變更事件傳送到 Amazon EventBridge。建立 EventBridge 規則以自動化回應
    Creating an EventBridge Rule That Triggers on an Event from an AWS Resource
  • 建立和執行計畫以自動化回應
  • 儲存與分析

  • CloudWatch Logs Insights 可讓您以互動方式在 Amazon CloudWatch Logs 中搜尋和分析日誌資料
    Analyzing Log Data with CloudWatch Logs Insights
    Amazon CloudWatch Logs Insights Sample Queries
  • 使用 Amazon CloudWatch Logs 傳送日誌到您可以使用的 Amazon S3 或 Amazon Athena 查詢資料
    How do I analyze my Amazon S3 server access logs using Athena?
  • 定期進行審查

  • 為工作負載建立多個儀表板: 您必須擁有最上層儀表板,其中包含關鍵業務指標,以及經您確認與工作負載預估運作狀態最相關的 (因為用量不同) 技術指標。您也應該有可以檢查各種應用程式層和相依性的儀表板
    Using Amazon CloudWatch Dashboards
  • 排程及定期檢閱工作負載儀表板: 定期執行儀表板檢查。您對於檢查深度可能有不同規律
  • 透過您的系統監控請求的端對端追蹤

  • 透過您的系統監控請求的端對端追蹤: AWS X-Ray 是一種服務,可收集應用程式處理請求的相關資料,並提供可用於檢視、篩選和取得資料洞見的工具,以識別問題和優化機會。對於任何受追蹤的應用程式請求,您不僅可以查看關於請求和回應的詳細資訊,還可以查看應用程式對下游 AWS 資源、微型服務、資料庫和 HTTP Web API 發出的呼叫的詳細資訊
    What is AWS X-Ray?
    Debugging with Amazon CloudWatch Synthetics and AWS X-Ray