오래된 콘텐츠입니다. 이 버전의 Well-Architected Framework는 현재 다음 위치에서 찾을 수 있습니다. https://docs.aws.amazon.com/ko_kr/wellarchitected/2022-03-31/framework/reliability.html

REL 6: 워크로드 리소스는 어떻게 모니터링합니까?

로그와 지표는 워크로드의 상태를 파악할 수 있는 유용한 도구입니다. 로그 및 지표를 모니터링하여 임계값을 초과하거나 중요한 이벤트가 발생하면 알림을 보내도록 워크로드를 구성할 수 있습니다. 모니터링을 수행하면 워크로드가 저성능 임계값을 초과하거나 장애가 발생할 때를 인식하고 이에 대응하여 자동으로 복구할 수 있습니다.

리소스

Using Amazon CloudWatch Metrics
Publishing Custom Metrics
Using Amazon CloudWatch Dashboards
Using Canaries (Amazon CloudWatch Synthetics)
Amazon CloudWatch Logs Insights Sample Queries
AWS Systems Manager Automation
What is AWS X-Ray?
Debugging with Amazon CloudWatch Synthetics and AWS X-Ray
The Amazon Builders' Library: Instrumenting distributed systems for operational visibility

모범 사례:

개선 계획

워크로드의 모든 구성 요소 모니터링(생성)

  • 가능한 경우 로깅을 활성화합니다.: AWS는 서비스 사용에 대한 모니터링 정보 및 로그 정보를 제공합니다. 모니터링 및 로그를 사용하여 알림, 변경 및 복구 프로세스를 정의할 수 있습니다.
  • 모든 기본 지표 사용: 모든 서비스에서는 기본 지표를 생성합니다. 이 지표를 평가하여 각 서비스별로 알림이 필요한 지표를 결정합니다.
    AWS Services That Publish CloudWatch Metrics
  • CloudWatch Synthetics를 사용하면 Canary 테스트를 수행할 수 있습니다.
    Amazon CloudWatch Logs Insights Sample Queries
  • 용도에 맞게 지표 생성: 일부 지표나 지표 조합은 AWS에서 생성되지 않는데 이 경우는 맞춤 지표를 사용하여 만들 수 있습니다.
    Publish custom metrics
  • 로그 집계: 로그를 집계하면 로그 데이터를 확인하여 알림을 설정할 수있는 단일 공간을 확보할 수 있습니다.
  • 지표 정의 및 계산(집계)

  • 지표 정의 및 계산(집계): 로그 데이터를 저장하고 필요한 경우 필터를 적용하여 특정 로그 이벤트 수 또는 로그 이벤트 타임스탬프에서 계산된 지연 시간과 같은 지표를 계산합니다.
  • 알림 전송(실시간 처리 및 경보)

  • 실시간 처리 및 경보 수행: 중요한 이벤트가 발생할 때 알아야 하는 조직에 알림이 전송됩니다.
  • 응답 자동화(실시간 처리 및 경보)

  • AWS Systems Manager를 사용하여 자동화된 작업을 수행합니다.: AWS Config는 AWS 리소스 구성을 지속적으로 모니터링하고 기록하며 AWS Systems Manager Automation을 트리거하여 문제를 해결할 수 있습니다.
    AWS Systems Manager Automation
  • Amazon CloudWatch는 경보 상태 변경 이벤트를 Amazon EventBridge로 전송합니다. 응답을 자동화하는 EventBridge 규칙을 생성합니다.
    Creating an EventBridge Rule That Triggers on an Event from an AWS Resource
  • 응답 자동화를 위한 계획을 수립하고 실행합니다.
  • 저장 및 분석

  • CloudWatch Logs Insights를 사용하면 Amazon CloudWatch Logs의 로그 데이터를 대화식으로 검색하고 분석할 수 있습니다.
    Analyzing Log Data with CloudWatch Logs Insights
    Amazon CloudWatch Logs Insights Sample Queries
  • Amazon CloudWatch Logs를 사용하여 Amazon S3로 로그를 전송하 후, 로그 데이터를 사용하거나 Amazon Athena로 데이터를 쿼리할 수 있습니다.
    How do I analyze my Amazon S3 server access logs using Athena?
  • 정기적인 검토 시행

  • 워크로드에 대해 여러 대시보드 생성: 주요 비즈니스 지표는 물론, 다양한 사용량에서 예상되는 워크로드의 상태와 가장 관련성이 높은 것으로 확인된 기술 지표도 포함된 최상위 대시보드가 있어야 합니다. 또한 검사할 수 있는 다양한 애플리케이션 티어와 종속성에 대한 대시보드도 필요합니다.
    Using Amazon CloudWatch Dashboards
  • 워크로드 대시보드에 대한 정기적인 검토 일정 예약 및 수행: 대시보드를 정기적으로 검사합니다. 검사하는 세부 수준을 나타내는 다양한 카덴스를 구성할 수 있습니다.
  • 시스템을 통한 요청의 종단 간 추적 모니터링

  • 시스템을 통한 요청의 종단 간 추적 모니터링: AWS X-Ray는 애플리케이션이 처리하는 요청에 대한 데이터를 수집하고, 최적화 문제와 기회를 식별하기 위해 데이터를 보고, 필터링하고, 인사이트를 얻는 데 사용할 수 있는 도구를 제공하는 웹 서비스입니다. 애플리케이션에 대한 요청이 추척되면, 해당 요청 및 응답뿐 아니라 애플리케이션이 다운스트림 AWS 리소스, 마이크로서비스, 데이터베이스 및 HTTP 웹 API에 대해 수행한 호출과 관련하여 자세한 정보를 확인할 수 있습니다.
    What is AWS X-Ray?
    Debugging with Amazon CloudWatch Synthetics and AWS X-Ray