OPS 8: 워크로드가 정상인지 어떻게 판단하나요?
워크로드 지표를 정의, 파악 및 분석하면 워크로드 이벤트를 확인하여 적절한 조치를 취할 수 있습니다.
리소스
Build a Monitoring Plan
Creating Amazon CloudWatch Alarms
AWS Answers: Centralized Logging
모범 사례:
-
핵심 성과 지표 파악: 원하는 비즈니스 성과(예: 주문율, 고객 유지율, 이익 및 운영 지출 비교)과 고객 성과(예: 고객 만족도)를 기반으로 KPI(핵심 성과 지표)를 파악합니다. 그리고 KPI를 평가하여 워크로드의 성공 여부를 결정합니다.
-
워크로드 지표 정의: KPI 달성(예: 주문하지 않은 장바구니, 제출된 주문, 비용, 가격 및 할당된 워크로드 지출)을 측정하도록 워크로드 지표를 정의합니다. 워크로드 상태(예: 인터페이스 응답 시간, 오류 발생률, 제출된 요청, 완료된 요청 및 사용률)를 측정하도록 워크로드 지표를 정의합니다. 그런 다음 해당 지표를 평가해 워크로드에서 적절한 성과를 달성할 수 있는지를 확인하고 워크로드의 상태를 파악합니다.
-
워크로드 지표 수집 및 분석:: 지표를 정기적으로 사전 예방 차원에서 점검하여 추세를 확인하고 어느 부분에 적절한 대응이 필요한지를 파악합니다.
-
워크로드 지표 기준 설정:: 지표의 기준을 설정해 성능이 기준보다 높은/낮은 구성 요소를 확인하고 각 구성 요소의 성능을 비교할 수 있는 기준으로 필요한 값을 제공합니다. 개선, 조사 및 개입을 위한 임계값을 파악합니다.
-
워크로드의 예상 활동 패턴 파악: 필요한 경우 적절히 대응할 수 있도록 비정상적인 동작을 식별할 워크로드 활동 패턴을 설정합니다.
-
워크로드 성과가 위험한 상태이면 알림 생성:: 워크로드 성과가 위험한 상태이면 필요 시 적절히 대응할 수 있도록 알림을 생성합니다.
-
워크로드 이상이 감지되면 알림 생성: 워크로드에서 이상이 감지되면 필요 시 적절히 대응할 수 있도록 알림을 생성합니다.
-
성과 달성 여부와 KPI 및 지표의 효율성 확인: : 워크로드 운영을 실무 수준에서 확인할 수 있는 보기를 생성합니다. 그러면 요구를 충족하고 있는지를 확인할 수 있으며 업무 목표 달성을 위해 개선해야 하는 영역을 파악할 수 있습니다. 또한 KPI와 지표의 효율성을 확인하고 필요한 경우 KPI/지표를 수정합니다.
개선 계획
핵심 성과 지표 파악
워크로드 지표 정의
Publish custom metrics
Searching and filtering log data
Amazon CloudWatch metrics and dimensions reference
워크로드 지표 수집 및 분석:
Using Amazon CloudWatch metrics
Amazon CloudWatch metrics and dimensions reference
Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
워크로드 지표 기준 설정:
Creating Amazon CloudWatch alarms
워크로드의 예상 활동 패턴 파악
워크로드 성과가 위험한 상태이면 알림 생성:
What is Amazon CloudWatch Events?
Creating Amazon CloudWatch alarms
Invoking Lambda functions using Amazon SNS notifications
워크로드 이상이 감지되면 알림 생성
What is Amazon CloudWatch Events?
Creating Amazon CloudWatch alarms
Invoking Lambda functions using Amazon SNS notifications
성과 달성 여부와 KPI 및 지표의 효율성 확인:
Using Amazon CloudWatch dashboards
What is log analytics?