오래된 콘텐츠입니다. 이 버전의 Well-Architected Framework는 현재 다음 위치에서 찾을 수 있습니다. https://docs.aws.amazon.com/ko_kr/wellarchitected/2022-03-31/framework/performance-efficiency.html

PERF 7: 리소스 성능을 모니터링하려면 어떻게 해야 합니까?

시스템 성능은 시간이 지남에 따라 저하될 수 있습니다. 시스템 성능을 모니터링하여 성능 저하 상태를 식별하고 운영 체제 또는 애플리케이션 로드와 같은 내부 또는 외부 요인을 해결합니다.

리소스

Cut through the chaos: Gain operational visibility and insight (MGT301-R1)
X-Ray Documentation
CloudWatch Documentation
Monitoring, Logging, and Performance APN Partners

모범 사례:

개선 계획

성능 관련 지표 기록

  • 성능 데이터 기록: 워크로드에 관련된 성능 지표를 식별하고 기록합니다. 이 데이터는 워크로드의 전체 성능 또는 효율성에 영향을 미치는 구성 요소를 식별하는 데 도움이 됩니다.
  • 성능 지표 식별: 고객 경험을 사용하여 가장 중요한 지표를 식별합니다. 각 지표에 대해 목표, 측정 방식 및 우선 순위를 정합니다. 이러한 데이터 포인트를 사용하여 성능 관련 문제를 사전에 해결하기 위한 경보와 알림을 작성합니다.
  • 이벤트 또는 인시던트 발생 시의 지표 분석

  • 중요한 사용자 사례에 대한 경험 문제를 우선적으로 처리: 아키텍처에 중요한 사용자 사례를 작성할 때는 중요한 각 사례에 필요한 실행 속도를 지정하는 등의 성능 요구 사항을 포함합니다. 이러한 중요 사례의 경우 스크립트로 작성된 사용자 여정을 구현하여 이러한 사례의 성능이 요구 사항에 부합하는지 확인합니다.
  • 워크로드 성능을 측정하는 KPI(핵심 성능 지표) 설정

  • 고객 경험 정의: 워크로드 성능에 대한 고객의 판단 기준을 포함하여 고객이 요구하는 성능 경험을 문서화합니다. 이러한 요구 사항을 사용하여 시스템의 전반적인 성능을 나타내는 KPI를 설정합니다.
  • 사용자 여정 테스트: 로드 테스트에는 프로덕션 데이터의 통합 또는 제거 버전(민감한 정보 또는 식별 정보 제거)을 사용하십시오. 대규모 애플리케이션에서 재생 또는 사전 프로그래밍된 사용자 여정을 사용하여 전체 아키텍처를 실행합니다.
  • 모니터링을 사용하여 경보 기반 알림 생성

  • 지표 모니터링: Amazon CloudWatch는 아키텍처의 리소스 전반에서 지표를 수집할 수 있습니다. 사용자 지정 지표를 수집하고 게시하여 비즈니스 또는 파생 지표를 파악할 수 있습니다. CloudWatch 또는 타사 모니터링 서비스를 사용하여 임계값 위반 시점을 나타내는 경보를 설정합니다.
  • 정기적인 간격으로 지표 검토

  • 지표 수집 및 모니터링을 지속적으로 개선: 인시던트나 이벤트 대응의 일환으로 문제를 해결하는 데 도움이 되었던 지표와, 현재는 추적 중이지 않지만 도움이 되었을 수 있는 지표를 평가합니다. 이 방법을 사용하여 수집한 지표의 품질을 개선하면 사후 인시던트를 예방하거나 더 빨리 해결할 수 있습니다.
  • 사전 모니터링 및 경보 생성

  • 작업 중 성능 모니터링: 워크로드가 실행 중일 때 성능을 확인할 수 있는 프로세스를 구현합니다. 모니터링 대시보드를 구축하고 성능 기대치에 대한 기준을 설정합니다.