오래된 콘텐츠입니다. 이 버전의 Well-Architected Framework는 현재 다음 위치에서 찾을 수 있습니다. https://docs.aws.amazon.com/ko_kr/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 11: 운영을 어떻게 개선 시키나요?

시간과 리소스를 할애하여 점진적 개선을 지속적으로 수행하면 운영 효율성을 높일 수 있습니다.

모범 사례:

개선 계획

지속적인 개선을 위한 프로세스 마련:

  • 지속적인 개선을 위한 프로세스 정의: 개선 기회를 정기적으로 평가하고 우선 순위를 지정해 가장 큰 이점이 제공되는 영역에서 작업을 중점적으로 수행합니다. 변경 사항을 적용하여 성과를 개선하고, 평가를 통하여 성공 여부를 확정합니다. 성과가 목표에 미치지 못하지만 여전히 개선을 우선해야 한다면 다른 대안을 찾아서 해당 과정을 반복합니다. 개선 가능한 운영 프로세스를 지속적으로 개선하기 위해서는 전담 리소스와 시간을 할애해야 합니다.
  • 인시던트 사후 분석 수행

  • 프로세스를 사용하여 기여 요인 확인: 고객에게 영향을 미치는 모든 인시던트를 검토합니다. 재발을 제한하거나 방지하기 위한 완화책을 개발하고 빠르고 효과적인 대응을 위한 절차를 개발할 수 있도록 인시던트의 기여 요인을 식별하고 문서화하는 프로세스를 마련합니다. 적절한 경우 근본 원인을 알리고 목표 대상에게 맞춤화된 프로세스를 마련합니다.
  • 피드백 루프 구현

  • 피드백 루프: 실행 과정의 피드백을 파악하고 개선해야 할 영역을 확인할 수 있는 절차를 운영 활동에 포함합니다.
  • 지식 관리 수행

  • 지식 관리: 팀원이 적시에 원하는 정보를 검색하고 액세스하며, 최신 상태의 완전한 정보인지 식별하는 메커니즘을 제공합니다. 필요한 콘텐츠, 갱신이 필요한 콘텐츠, 더 이상 참조되지 않도록 보관해야 하는 콘텐츠를 식별하는 메커니즘을 보유합니다.
  • 개선 추진 요인 정의

  • 개선 추진 요인 파악: 원하는 결과를 명확히 한 경우에 한해서 시스템을 변경해야합니다.
  • 인사이트 확인

  • 인사이트 확인: 비즈니스 소유자 및 주제별 전문가와 협력하여 수집한 데이터의 의미에 대한 공통된 이해와 동의가 있는지 확인합니다. 추가 우려 사항, 잠재적 영향을 식별하고 조치 과정을 결정합니다.
  • 운영 지표 검토 수행

  • 운영 지표 검토: 다양한 실무 영역의 여러 팀 구성원들과 함께 운영 지표 후행 분석을 정기적으로 수행합니다. 실무 팀, 개발 팀, 운영 팀 등의 이해 관계자와 함께 즉각적인 피드백 및 후행 분석에서 발견된 사항을 확인하고 파악한 내용을 공유합니다. 그리고 이러한 인사이트를 활용하여 개선 기회와 진행 가능한 조치 과정을 확인합니다.
    Amazon CloudWatch
    Using Amazon CloudWatch metrics
    Publish custom metrics
    Amazon CloudWatch metrics and dimensions reference
  • 파악한 내용 문서화 및 공유

  • 파악한 내용 문서화 및 공유: 운영 활동을 통해 파악한 내용과 후행 분석 결과를 문서화하는 절차를 마련하여 다른 팀에서도 사용할 수 있도록 하십시오.
  • 개선을 위한 시간 할애:

  • 개선을 위한 시간 할애:: 프로세스 내에서 전담 리소스와 시간을 할애하여 가능한 범위 내에서 점진적 개선을 지속적으로 수행합니다. 변경 사항을 적용하여 결과를 개선하고, 평가를 통하여 성공 여부를 확정합니다. 결과가 목표에 미치지 못하지만 여전히 개선을 우선해야 한다면 다른 대안을 찾아서 진행합니다.