OPS 8: Como você compreende a integridade da sua carga de trabalho?
Defina, capture e analise as métricas da carga de trabalho para obter visibilidade destes eventos, para que você possa tomar as ações apropriadas.
Recursos
Build a Monitoring Plan
Creating Amazon CloudWatch Alarms
AWS Answers: Centralized Logging
Melhores práticas:
-
Identifique os indicadores-chave de performance: Identifique os indicadores-chave de performance (KPIs) com base nos resultados de negócios desejados (por exemplo, taxa de pedidos, taxa de retenção do cliente e lucro versus despesa operacional) e resultados do cliente (por exemplo, satisfação do cliente). Avalie os KPIs para determinar o sucesso da carga de trabalho.
-
Defina as métricas de carga de trabalho: Defina métricas de carga de trabalho para medir a realização de KPIs (por exemplo, carrinhos de compras abandonados, pedidos feitos, custo, preço e despesas de carga de trabalho alocadas). Defina métricas de carga de trabalho para medir a integridade da carga de trabalho (por exemplo, tempo de resposta da interface, taxa de erros, solicitações feitas, solicitações concluídas e utilização). Avalie as métricas para determinar se a carga de trabalho está alcançando os resultados desejados e para entender a sua integridade.
-
Colete e analise as métricas de carga de trabalho.: Faça revisões proativas regulares das métricas para identificar tendências e determine onde as respostas apropriadas são necessárias.
-
Estabeleça as linhas de base de métricas de carga de trabalho.: Estabeleça as linhas de base das métricas para fornecer valores esperados como base para comparação e identificação de componentes com performance inferior e superior. Identificar limites para melhoria, investigação e intervenção.
-
Aprenda os padrões esperados de atividade para carga de trabalho.: Estabeleça padrões de atividade de carga de trabalho para identificar comportamentos anômalos para que você possa responder adequadamente, se necessário.
-
Atente para quando os resultados da carga de trabalho estiverem em risco: Emita um alerta quando os resultados da carga de trabalho estiverem em risco, para que você possa responder adequadamente, se necessário.
-
Atente para quando anomalias de carga de trabalho forem detectadas: Emita um alerta quando forem detectadas anomalias na carga de trabalho, para que você possa responder adequadamente, se necessário.
-
Valide a obtenção de resultados e a eficácia de KPIs e métricas. : Crie uma visualização em nível de negócios de suas operações de carga de trabalho para ajudá-lo a determinar se você está satisfazendo estas necessidades e para identificar áreas que precisam de melhorias para atingir as metas de negócios. Valide a eficácia dos KPIs e métricas e revise-os, se necessário.
Plano de melhoria
Identifique os indicadores-chave de performance
Defina as métricas de carga de trabalho
Publish custom metrics
Searching and filtering log data
Amazon CloudWatch metrics and dimensions reference
Colete e analise as métricas de carga de trabalho.
Using Amazon CloudWatch metrics
Amazon CloudWatch metrics and dimensions reference
Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
Estabeleça as linhas de base de métricas de carga de trabalho.
Creating Amazon CloudWatch alarms
Aprenda os padrões esperados de atividade para carga de trabalho.
Atente para quando os resultados da carga de trabalho estiverem em risco
What is Amazon CloudWatch Events?
Creating Amazon CloudWatch alarms
Invoking Lambda functions using Amazon SNS notifications
Atente para quando anomalias de carga de trabalho forem detectadas
What is Amazon CloudWatch Events?
Creating Amazon CloudWatch alarms
Invoking Lambda functions using Amazon SNS notifications
Valide a obtenção de resultados e a eficácia de KPIs e métricas.
Using Amazon CloudWatch dashboards
What is log analytics?