오래된 콘텐츠입니다. 이 버전의 Well-Architected Framework는 현재 다음 위치에서 찾을 수 있습니다. https://docs.aws.amazon.com/ko_kr/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 7: 서비스 운영을 지원할 준비가 되어있는지를 어떻게 알 수 있나요?

워크로드, 프로세스, 절차 및 직원의 운영 준비 상태를 평가하여 워크로드와 관련된 운영 위험을 파악합니다.

리소스

AWS Config
AWS Systems Manager Features

모범 사례:

개선 계획

직원의 역량 확보

  • 직원의 역량: 워크로드를 효과적으로 지원할 훈련을 받은 인력이 충분히 있는지 검증합니다.
  • 일관된 방식으로 운영 준비 검토

  • 일관된 방식으로 운영 준비 검토: 워크로드를 운영할 준비가 되었는지를 일관된 방식으로 검토합니다. 검토에서는 최소한 팀 및 워크로드의 운영 준비 상태와 보안 고려 사항을 파악해야 합니다. 고정된 요구 사항을 검토 요소로 선택할 수도 있고, 위험을 기반으로 하여 모든 요구 사항을 충족하지 않는 워크로드 작동 관련 결정을 내릴 수도 있습니다. 검토 요소는 워크로드/아키텍처/구현별로 다를 수 있습니다. 검토를 코드로 구현하고 해당하는 경우 이벤트 대응 과정에서 검토를 트리거하면 일관성을 유지하고, 실행 속도를 높이고, 수동 프로세스에서 발생하는 오류를 줄일 수 있습니다.
    AWS Systems Manager
    AWS Config Rules dynamic compliance checking for cloud resources
    How to audit your AWS resources for security compliance by using custom AWS Config Rules
    How to track configuration changes to CloudFormation stacks using AWS Config
    Amazon Inspector update assessment reporting, proxy support, and more
  • 런북을 사용하여 절차 수행:

  • 런북을 사용하여 표준 절차 수행: 런북은 특정 결과를 달성하기 위한 문서화된 절차입니다. 런북에 절차를 문서화하면 잘 알려진 이벤트에 일관된 방식으로 신속하게 대응할 수 있습니다. 런북에는 적절한 기술을 갖춘 직원이 원하는 결과를 얻기 위한 최소한의 정보가 포함되어야 합니다. 필요한 권한과 도구, 절차 수행 관련 제약 조건(예: 특정 유지 관리 기간), 실행 단계 등의 정보를 포함할 수 있습니다.
  • 플레이북을 사용하여 문제 조사

  • 플레이북을 사용하여 문제 파악: 플레이북은 문제 조사를 위한 문서화된 프로세스입니다. 플레이북에 프로세스를 문서화하면 장애 발생 시나리오에 일관되고 빠르게 대응할 수 있습니다. 플레이북은 적절한 기술을 보유한 팀원이 해당하는 정보를 수집하고, 장애의 잠재적 출처를 확인하고, 결함 위치를 구분하고, 발생 요인을 확인(근본 원인 분석 수행)하는 데 필요한 정보와 지침을 포함해야 합니다.
  • 정보에 입각하여 시스템 및 변경 사항 배포 결정 내리기

  • 정보에 입각하여 워크로드 및 변경 사항 배포 결정 내리기: 워크로드를 지원할 수 있는 팀의 능력과 워크로드의 거버넌스 준수 여부를 평가합니다. 배포의 이점을 기준으로 하여 이러한 평가를 수행해 시스템 또는 변경 사항을 프로덕션 환경으로 전환할지 여부를 결정합니다. 이점과 위험을 파악하고 정보에 입각한 결정을 내려야 합니다.