此內容已過時。這個版本的 Well-Architected 框架現在可以在以下位置找到： https://docs.aws.amazon.com/zh_tw/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 11: 您如何改善營運？

投入時間和資源持續逐漸改善，以加強營運的效果和效率。

最佳實務:

建立持續改進程序: 定期評估改進機會並排定其優先順序，以專注於它們可在其中提供最大效益的工作。
執行事件後分析: 審查影響客戶的事件，並識別成因和預防性措施。使用此資訊來制定緩解措施，以限制或避免事件再次發生。制定可快速有效回應的程序。適當地傳達成因和為目標受眾量身打造的糾正措施。
實作回饋迴圈: 在程序和工作負載中包含回饋迴圈，以幫助您識別問題和需要改進的領域。
執行知識管理: 存在的機制讓您的團隊成員可以及時探索他們所需的資訊、存取資訊，並識別其是否為最新且完整的資訊。存在的機制是用來識別所需的內容、需要重新整理的內容，以及應存檔的內容，以便該內容不再供其他人參考。
定義改進驅動因素: 確定改進驅動因素，以幫助您評估改進機會並排定其優先順序。
驗證洞見: 與跨職能團隊和企業擁有者一起審查您的分析結果和回應。透過這些審查建立共識，確定其他影響並確定行動方案。適當調整回應。
執行營運指標審查: 與來自不同業務領域的跨團隊參與者定期進行營運指標的追溯性分析。透過這些審查確定改進機會、可能的行動方案並分享獲得的經驗。
記錄和分享獲得的經驗: 記錄並分享從執行營運活動中獲得的經驗，以便您可以在內部以及跨團隊使用它們。
分配改進時間: 在流程中投入時間和資源，以持續逐漸改善。

改進方案

建立持續改進程序

定義持續改進的流程: 定期評估改進機會並確定優先級，以將精力集中在可以帶來最大收益的機會上。實作變更以改善結果，並進行評估以確定成功與否。如果結果未能達到目標，並且改進仍然是優先事項，則使用其他行動方案重複進行。您的營運流程應設立專門的時間和資源，用於持續逐漸改善。

執行事件後分析

使用程序判斷成因: 審查所有影響客戶的事件。建立程序來識別和記錄事件的成因，以便您可以制定緩解措施來限制或防止事件再次發生。另外，您還可以制定快速有效地做出回應的程序。根據目標受眾的不同以適當的方式告知根本原因。

實作回饋迴圈

回饋迴圈: 在您的營運活動中納入回饋捕獲程序，以確定需要改進的地方。

即時回饋: 即時回饋來自執行的營運活動，在這些活動中，透過審核執行和結果，發現流程可以改進。回饋可以來自客戶、團隊成員或活動的自動輸出。當改進的工作量很少或收益很大時，應考慮立即實作。適當在待辦項目或問題系統中追蹤改進機會。例如，對於在中間裝置上暫存資料的流程，可以透過將資料直接放置到目標環境來優化。這將消除流程中的一個步驟以及對中間資源的需求。
追溯性分析: 定期進行追溯性分析，以從對營運成果和指標的審查中獲取回饋。使用趨勢來確定需要改進的地方。例如，審查部署失敗率，以識別何時會出現開發和部署活動的潛在問題。
Serverless big data analytics - Amazon Athena and Amazon QuickSight - 2017 AWS Online Tech Talks
View AWS CodeDeploy logs in Amazon CloudWatch console
Analyzing VPC flow logs with Amazon Kinesis Firehose, Amazon Athena, and Amazon QuickSight

執行知識管理

知識管理: 確保存在的機制讓您的團隊成員可以及時探索他們所需的資訊、存取資訊，並識別其是否為最新且完整的資訊。維護機制，以識別所需的內容、需要重新整理的內容，以及應存檔的內容，以便該內容不再供其他人參考。

定義改進驅動因素

了解改進驅動因素: 僅在支援理想結果時才對系統進行變更。

所需能力: 在評估改進機會時，評估所需的功能和能力。
What's New with AWS
不可接受的問題: 在評估改進機會時，評估不可接受的問題、錯誤和弱點。
AWS Latest Security Bulletins
AWS Trusted Advisor
合規要求: 在審查改進機會時，評估保持法規、政策的遵從性或保持受到第三方支援所需的更新和變更。
AWS Compliance
AWS Compliance Programs
AWS Compliance Latest News

驗證洞見

驗證洞見: 與企業擁有者和領域專家互動，確保您收集資料的意義得到眾人理解和同意。識別其他疑慮、潛在影響，並確定行動方案。

執行營運指標審查

營運指標審查: 與來自不同業務領域的跨團隊參與者定期進行營運指標的追溯性分析。與包括業務、開發和營運團隊在內的利害關係人進行互動，以驗證您從即時回饋和追溯性分析獲得的發現，並分享經驗教訓。利用這些洞見確定改進機會和可能的行動方案。
Amazon CloudWatch
Using Amazon CloudWatch metrics
Publish custom metrics
Amazon CloudWatch metrics and dimensions reference

記錄和分享獲得的經驗

記錄和分享獲得的經驗: 制定程序來記錄從執行營運活動和追溯性分析中學到的經驗教訓，以便其他團隊可以使用。

分享經驗: 制定程序來在團隊之間分享經驗教訓和相關成品。例如，透過可存取的 Wiki 分享更新的程序、指南、管控和最佳實務；透過公共儲存庫分享指令碼、程式碼和程式庫。
Delegating access to your AWS environment
Share an AWS CodeCommit repository
Easy authorization of AWS Lambda functions
Sharing an AMI with specific AWS Accounts
Speed template sharing with an AWS CloudFormation designer URL
Using AWS Lambda with Amazon SNS

分配改進時間

分配改進時間: 在流程中投入時間和資源，以持續逐漸改善。實作變更以改進和評估結果，從而確定成功與否。如果結果未能達到目標，並且改進仍然是優先事項，則應採取替代行動方案。