Esse conteúdo está desatualizado. Esta versão da Well-Architected Framework agora pode ser encontrada em: https://docs.aws.amazon.com/pt_br/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 9: Como você compreende a integridade de suas operações?

Defina, capture e analise as métricas de operações para obter visibilidade dos eventos de operações, para que você possa tomar as ações apropriadas.

Recursos

Build a Monitoring Plan
Detect and React to Changes in Pipeline State with Amazon CloudWatch Events
AWS Answers: Centralized Logging

Melhores práticas:

Plano de melhoria

Identifique os indicadores-chave de performance

  • Identifique os indicadores-chave de performance: Identifique os principais indicadores de performance (KPIs) com base nos negócios desejados e nos resultados dos clientes. Avalie KPIs para determinar o sucesso das operações.
  • Defina as métricas de operações

  • Defina as métricas de operações: Defina as métricas de operações para medir a obtenção de KPIs. Defina as métricas de operações para medir a integridade das operações e de suas atividades. Avalie as métricas para determinar se as operações estão alcançando os resultados desejados e para entender a integridade das operações.
    Publish custom metrics
    Searching and filtering log data
    Amazon CloudWatch metrics and dimensions reference
  • Colete e analise as métricas de operações

  • Colete e analise as métricas de operações: Faça revisões proativas regulares das métricas para identificar tendências e determine onde as respostas apropriadas são necessárias.
    Using Amazon CloudWatch metrics
    Amazon CloudWatch metrics and dimensions reference
    Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
  • Estabeleça as linhas de base das métricas de operações

  • Aprenda os padrões esperados de atividade para operações: Estabeleça os padrões de atividade de operações para determinar quando o comportamento está fora dos valores esperados, para que você possa responder adequadamente, se necessário.
  • Aprenda os padrões esperados de atividade para operações

  • Aprenda os padrões esperados de atividade para operações: Estabeleça os padrões de atividade de operações para determinar quando o comportamento está fora dos valores esperados, para que você possa responder adequadamente, se necessário.
  • Atente para quando os resultados das operações estiverem em risco

  • Atente para quando os resultados das operações estiverem em risco: Emita um alerta quando os resultados das operações estiverem em risco, para que você possa responder adequadamente, se necessário.
    What is Amazon CloudWatch Events?
    Creating Amazon CloudWatch alarms
    Invoking Lambda functions using Amazon SNS notifications
  • Atente para quando anomalias de operações forem detectadas

  • Atente para quando anomalias de operações forem detectadas: Emita um alerta quando forem detectadas anomalias de operações, para que você possa responder adequadamente, se necessário.
    What is Amazon CloudWatch Events?
    Creating Amazon CloudWatch alarms
    Invoking Lambda functions using Amazon SNS notifications
  • Valide a obtenção de resultados e a eficácia de KPIs e métricas.

  • Valide a obtenção de resultados e a eficácia de KPIs e métricas. : Crie uma visualização em nível de negócios de suas atividades operacionais para ajudá-lo a determinar se você está satisfazendo estas necessidades e para identificar áreas que precisam de melhorias para atingir as metas de negócios. Valide a eficácia dos KPIs e métricas e revise-os, se necessário.
    Using Amazon CloudWatch dashboards
    What is log analytics?