OPS 11: 您如何改善營運?
投入時間和資源持續逐漸改善,以加強營運的效果和效率。
最佳實務:
-
建立持續改進程序: 定期評估改進機會並排定其優先順序,以專注於它們可在其中提供最大效益的工作。
-
執行事件後分析: 審查影響客戶的事件,並識別成因和預防性措施。使用此資訊來制定緩解措施,以限制或避免事件再次發生。制定可快速有效回應的程序。適當地傳達成因和為目標受眾量身打造的糾正措施。
-
實作回饋迴圈: 在程序和工作負載中包含回饋迴圈,以幫助您識別問題和需要改進的領域。
-
執行知識管理: 存在的機制讓您的團隊成員可以及時探索他們所需的資訊、存取資訊,並識別其是否為最新且完整的資訊。存在的機制是用來識別所需的內容、需要重新整理的內容,以及應存檔的內容,以便該內容不再供其他人參考。
-
定義改進驅動因素: 確定改進驅動因素,以幫助您評估改進機會並排定其優先順序。
-
驗證洞見: 與跨職能團隊和企業擁有者一起審查您的分析結果和回應。透過這些審查建立共識,確定其他影響並確定行動方案。適當調整回應。
-
執行營運指標審查: 與來自不同業務領域的跨團隊參與者定期進行營運指標的追溯性分析。透過這些審查確定改進機會、可能的行動方案並分享獲得的經驗。
-
記錄和分享獲得的經驗: 記錄並分享從執行營運活動中獲得的經驗,以便您可以在內部以及跨團隊使用它們。
-
分配改進時間: 在流程中投入時間和資源,以持續逐漸改善。
改進方案
建立持續改進程序
執行事件後分析
實作回饋迴圈
- 即時回饋: 即時回饋來自執行的營運活動,在這些活動中,透過審核執行和結果,發現流程可以改進。回饋可以來自客戶、團隊成員或活動的自動輸出。當改進的工作量很少或收益很大時,應考慮立即實作。適當在待辦項目或問題系統中追蹤改進機會。例如,對於在中間裝置上暫存資料的流程,可以透過將資料直接放置到目標環境來優化。這將消除流程中的一個步驟以及對中間資源的需求。
- 追溯性分析:
定期進行追溯性分析,以從對營運成果和指標的審查中獲取回饋。使用趨勢來確定需要改進的地方。例如,審查部署失敗率,以識別何時會出現開發和部署活動的潛在問題。
Serverless big data analytics - Amazon Athena and Amazon QuickSight - 2017 AWS Online Tech Talks
View AWS CodeDeploy logs in Amazon CloudWatch console
Analyzing VPC flow logs with Amazon Kinesis Firehose, Amazon Athena, and Amazon QuickSight
執行知識管理
定義改進驅動因素
- 所需能力:
在評估改進機會時,評估所需的功能和能力。
What's New with AWS - 不可接受的問題:
在評估改進機會時,評估不可接受的問題、錯誤和弱點。
AWS Latest Security Bulletins
AWS Trusted Advisor - 合規要求:
在審查改進機會時,評估保持法規、政策的遵從性或保持受到第三方支援所需的更新和變更。
AWS Compliance
AWS Compliance Programs
AWS Compliance Latest News
驗證洞見
執行營運指標審查
Amazon CloudWatch
Using Amazon CloudWatch metrics
Publish custom metrics
Amazon CloudWatch metrics and dimensions reference
記錄和分享獲得的經驗
- 分享經驗:
制定程序來在團隊之間分享經驗教訓和相關成品。例如,透過可存取的 Wiki 分享更新的程序、指南、管控和最佳實務;透過公共儲存庫分享指令碼、程式碼和程式庫。
Delegating access to your AWS environment
Share an AWS CodeCommit repository
Easy authorization of AWS Lambda functions
Sharing an AMI with specific AWS Accounts
Speed template sharing with an AWS CloudFormation designer URL
Using AWS Lambda with Amazon SNS
分配改進時間