PERF 7: ¿Cómo monitorea sus recursos para garantizar que estén rindiendo?
El rendimiento del sistema se puede degradar con el tiempo. Monitoree el rendimiento del sistema para identificar la degradación y solucionar los factores internos y externos, como el sistema operativo o la carga de la aplicación.
Recursos
Cut through the chaos: Gain operational visibility and insight (MGT301-R1)
X-Ray Documentation
CloudWatch Documentation
Monitoring, Logging, and Performance APN Partners
Prácticas recomendadas:
-
Registre las métricas relacionadas con el rendimiento: Utilice un servicio de monitoreo y observabilidad para registrar las métricas relacionadas con el rendimiento. Por ejemplo, el registro de las transacciones de bases de datos, consultas lentas, latencia de E/S, rendimiento de solicitud HTTP, latencia de servicio u otro dato clave.
-
Analice las métricas cuando ocurren eventos o incidentes: En respuesta a (o durante) un evento o incidente, utilice los paneles o reportes de monitoreo para comprender y diagnosticar el impacto. Estas visualizaciones ofrecen información sobre qué partes de la carga de trabajo no funcionan como se esperaba.
-
Establezca indicadores clave de rendimiento (KPI) para medir el rendimiento de la carga de trabajo: Identifique los KPI que indican si la carga de trabajo rinde según lo previsto. Por ejemplo, una carga de trabajo basada en las API puede utilizar latencia de respuesta general como una indicación del rendimiento general y un sitio de comercio electrónico podría elegir usar el número de compras como su KPI.
-
Utilice el monitoreo para generar notificaciones basadas en las alarmas: Con los indicadores clave de rendimiento (KPI) relacionados con el rendimiento que ha definido, utilice un sistema de monitoreo que genera alarmas automáticamente cuando estas medidas están fuera de los límites esperados.
-
Revise las métricas en intervalos regulares: Como rutina de mantenimiento o en respuesta a eventos o incidentes, revise que métricas se recopilan. Utilice estas revisiones para identificar que métricas eran claves en abordar los problemas y qué métricas adicionales, si se estuviera realizando un seguimiento, ayudarían a identificar, abordar o prevenir problemas.
-
Monitoree y active las alarmas de manera proactiva: Utilice los indicadores clave de rendimiento (KPI), combinados con los sistemas de monitoreo y alerta, para abordar de manera proactiva los problemas relacionados con el rendimiento. Utilice alarmas para desencadenar acciones automatizadas a fin de solucionar los problemas donde sea posible. Escale la alarma a aquellos que puedan responder si no es posible una respuesta automatizada. Por ejemplo, puede tener un sistema que puede predecir los valores esperados de los indicadores clave de rendimiento (KPI) y la alarma cuando alcanzan ciertos límites o una herramienta que automáticamente puede detener o revertir las implementaciones si los KPI están fuera de los valores esperados.
Plan de mejora
Registre las métricas relacionadas con el rendimiento
Analice las métricas cuando ocurren eventos o incidentes
Establezca indicadores clave de rendimiento (KPI) para medir el rendimiento de la
carga de trabajo
Utilice el monitoreo para generar notificaciones basadas en las alarmas
Revise las métricas en intervalos regulares
Monitoree y active las alarmas de manera proactiva