此內容已過時。這個版本的 Well-Architected 框架現在可以在以下位置找到: https://docs.aws.amazon.com/zh_tw/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 11: 您如何改善營運?

投入時間和資源持續逐漸改善,以加強營運的效果和效率。

最佳實務:

改進方案

建立持續改進程序

  • 定義持續改進的流程: 定期評估改進機會並確定優先級,以將精力集中在可以帶來最大收益的機會上。實作變更以改善結果,並進行評估以確定成功與否。如果結果未能達到目標,並且改進仍然是優先事項,則使用其他行動方案重複進行。您的營運流程應設立專門的時間和資源,用於持續逐漸改善。
  • 執行事件後分析

  • 使用程序判斷成因: 審查所有影響客戶的事件。建立程序來識別和記錄事件的成因,以便您可以制定緩解措施來限制或防止事件再次發生。另外,您還可以制定快速有效地做出回應的程序。根據目標受眾的不同以適當的方式告知根本原因。
  • 實作回饋迴圈

  • 回饋迴圈: 在您的營運活動中納入回饋捕獲程序,以確定需要改進的地方。
  • 執行知識管理

  • 知識管理: 確保存在的機制讓您的團隊成員可以及時探索他們所需的資訊、存取資訊,並識別其是否為最新且完整的資訊。維護機制,以識別所需的內容、需要重新整理的內容,以及應存檔的內容,以便該內容不再供其他人參考。
  • 定義改進驅動因素

  • 了解改進驅動因素: 僅在支援理想結果時才對系統進行變更。
  • 驗證洞見

  • 驗證洞見: 與企業擁有者和領域專家互動,確保您收集資料的意義得到眾人理解和同意。識別其他疑慮、潛在影響,並確定行動方案。
  • 執行營運指標審查

  • 營運指標審查: 與來自不同業務領域的跨團隊參與者定期進行營運指標的追溯性分析。與包括業務、開發和營運團隊在內的利害關係人進行互動,以驗證您從即時回饋和追溯性分析獲得的發現,並分享經驗教訓。利用這些洞見確定改進機會和可能的行動方案。
    Amazon CloudWatch
    Using Amazon CloudWatch metrics
    Publish custom metrics
    Amazon CloudWatch metrics and dimensions reference
  • 記錄和分享獲得的經驗

  • 記錄和分享獲得的經驗: 制定程序來記錄從執行營運活動和追溯性分析中學到的經驗教訓,以便其他團隊可以使用。
  • 分配改進時間

  • 分配改進時間: 在流程中投入時間和資源,以持續逐漸改善。實作變更以改進和評估結果,從而確定成功與否。如果結果未能達到目標,並且改進仍然是優先事項,則應採取替代行動方案。