PERF 7: Como você monitora seus recursos para garantir que eles estejam funcionando?
A performance do sistema pode diminuir com o tempo. Monitore a performance do sistema para identificar degradações e corrigir fatores internos ou externos, como a carga do aplicativo ou o sistema operacional.
Recursos
Cut through the chaos: Gain operational visibility and insight (MGT301-R1)
X-Ray Documentation
CloudWatch Documentation
Monitoring, Logging, and Performance APN Partners
Melhores práticas:
-
Registrar métricas relacionadas à performance: Use um serviço de monitoramento e observação para registrar métricas relacionadas à performance. Por exemplo, registre transações do banco de dados, consultas lentas, latência de E/S, taxa de transferência de solicitação HTTP, latência de serviço ou outros dados importantes.
-
Analisar as métricas quando ocorrem eventos ou incidentes: Em resposta a (ou durante) um evento ou incidente, use painéis ou relatórios de monitoramento para entender e diagnosticar o impacto. Essas visualizações fornecem insights sobre quais partes da carga de trabalho não estão apresentando os níveis de performance esperados.
-
Estabelecer indicadores-chave de performance (KPIs) para medir a performance da carga de trabalho: Identifique os KPIs que indicam se a performance da carga de trabalho está de acordo com o esperado. Por exemplo, uma carga de trabalho baseada em API pode usar latência de resposta geral como uma indicação da performance geral, e um site de comércio eletrônico pode optar por usar o número de compras efetuadas como KPI.
-
Usar monitoramento para gerar notificações baseadas em alarme: Usando os indicadores-chave de performance (KPIs) relacionados à performance que você definiu, use um sistema de monitoramento que gere alarmes automaticamente quando essas medidas estiverem fora dos limites esperados.
-
Analisar as métricas regularmente: Como manutenção de rotina, ou em resposta a eventos ou incidentes, analise as métricas que são coletadas. Use essas análises para identificar quais métricas foram essenciais para lidar com problemas e quais métricas adicionais ajudariam a identificar, resolver ou prevenir problemas caso estivessem sendo acompanhadas.
-
Monitorar e emitir alarmes de maneira proativa: Use os indicadores-chave de performance (KPIs), aliados a sistemas de monitoramento e alerta, para abordar proativamente problemas relacionados à performance. Sempre que possível, use alarmes para desencadear ações automatizadas visando corrigir problemas. Se a resposta automatizada não for possível, encaminhe o alarme para aqueles capazes de responder. Por exemplo, você pode ter um sistema capaz de prever os valores de indicadores-chave de performance (KPI) esperados e emitir um alarme quando eles ultrapassarem determinados limites, ou uma ferramenta capaz de interromper ou reverter automaticamente as implantações caso os KPIs estejam fora dos valores esperados.
Plano de melhoria
Registrar métricas relacionadas à performance
Analisar as métricas quando ocorrem eventos ou incidentes
Estabelecer indicadores-chave de performance (KPIs) para medir a performance da carga
de trabalho
Usar monitoramento para gerar notificações baseadas em alarme
Analisar as métricas regularmente
Monitorar e emitir alarmes de maneira proativa