Esse conteúdo está desatualizado. Esta versão da Well-Architected Framework agora pode ser encontrada em: https://docs.aws.amazon.com/pt_br/wellarchitected/2022-03-31/framework/reliability.html

REL 6: Como você monitora recursos de carga de trabalho?

Os logs e as métricas são uma ferramenta poderosa para saber a integridade das suas cargas de trabalho. Você pode configurar sua carga de trabalho para monitorar logs e métricas e enviar notificações quando os limites forem ultrapassados ou em caso de eventos importantes. O monitoramento permite que sua carga de trabalho reconheça quando os limites de baixa performance são ultrapassados ou quando há falhas, para que ela possa se recuperar automaticamente em resposta.

Recursos

Using Amazon CloudWatch Metrics
Publishing Custom Metrics
Using Amazon CloudWatch Dashboards
Using Canaries (Amazon CloudWatch Synthetics)
Amazon CloudWatch Logs Insights Sample Queries
AWS Systems Manager Automation
What is AWS X-Ray?
Debugging with Amazon CloudWatch Synthetics and AWS X-Ray
The Amazon Builders' Library: Instrumenting distributed systems for operational visibility

Melhores práticas:

Plano de melhoria

Monitore todos os componentes da carga de trabalho (geração)

  • Habilitar o registro em log quando disponível: A AWS tem informações de monitoramento e log disponíveis para consumo. O monitoramento e os logs podem ser usados para definir processos de alerta, alteração e recuperação
  • Consuma todas as métricas padrão: Cada serviço gera métricas padrão. Avalie as métricas para decidir quais delas precisam de alertas em cada serviço.
    AWS Services That Publish CloudWatch Metrics
  • O CloudWatch Synthetics permite desenvolver testes Canário
    Amazon CloudWatch Logs Insights Sample Queries
  • Crie métricas personalizadas para seu próprio uso: A AWS não gera algumas métricas e combinações de métricas, mas você pode criá-las usando métricas personalizadas
    Publish custom metrics
  • Agregue seus logs: A agregação de log oferece um único local para consultar os dados de log e definir alertas
  • Defina e calcule as métricas (agregação)

  • Defina e calcule as métricas (agregação): Armazene os dados de log e aplique filtros quando necessário para calcular métricas como contagens de um evento de log específico ou latência calculada com base na data e hora dos eventos de log
  • Envie notificações (processamento e emissão de alarmes em tempo real)

  • Realize o processamento e a emissão de alarmes em tempo real: As organizações que precisam estar a par de tudo, recebem notificações quando ocorrem eventos importantes
  • Automatize respostas (processamento e emissão de alarmes em tempo real)

  • Use o AWS Systems Manager para executar ações automatizadas: O AWS Config sempre monitora e registra as configurações de recursos da AWS e pode acionar o AWS Systems Manager Automation para corrigir problemas
    AWS Systems Manager Automation
  • O Amazon CloudWatch envia eventos de alteração de estado de alarme para o Amazon EventBridge. Crie regras do EventBridge para automatizar respostas
    Creating an EventBridge Rule That Triggers on an Event from an AWS Resource
  • Crie e execute um plano para automatizar respostas
  • Armazenamento e estudo analítico

  • O CloudWatch Logs Insights permite pesquisar e analisar dinamicamente seus dados de log no Amazon CloudWatch Logs
    Analyzing Log Data with CloudWatch Logs Insights
    Amazon CloudWatch Logs Insights Sample Queries
  • Use o Amazon CloudWatch Logs para enviar logs ao Amazon S3, onde você pode usar o Amazon Athena para consultar os dados
    How do I analyze my Amazon S3 server access logs using Athena?
  • Faça revisões regularmente

  • Crie vários painéis para a carga de trabalho: Você deve ter um painel superior com as principais métricas de negócios e as métricas técnicas identificadas como as mais relevantes à integridade projetada da carga de trabalho conforme a variação do uso. Você também deve ter painéis para vários níveis e dependências do aplicativo que podem ser inspecionados
    Using Amazon CloudWatch Dashboards
  • Programe e realize revisões regulares dos painéis da carga de trabalho: Realize uma inspeção regular dos painéis. Você pode ter graus diferentes de profundidade para a inspeção
  • Monitore o rastreamento completo das solicitações por meio do seu sistema

  • Monitore o rastreamento completo das solicitações por meio do seu sistema: O AWS X-Ray é um serviço que coleta dados sobre as solicitações atendidas pelo seu aplicativo e fornece ferramentas que você pode usar para visualizar, filtrar e entender esses dados para identificar problemas e oportunidades de otimização. Para qualquer solicitação rastreada para seu aplicativo, você pode ver informações detalhadas sobre a solicitação e a resposta e também sobre as chamadas que seu aplicativo faz para recursos de downstream da AWS, microsserviços, bancos de dados e APIs HTTP da web
    What is AWS X-Ray?
    Debugging with Amazon CloudWatch Synthetics and AWS X-Ray