PERF 7: ¿Cómo monitorea sus recursos para garantizar que estén rindiendo?

El rendimiento del sistema se puede degradar con el tiempo. Monitoree el rendimiento del sistema para identificar la degradación y solucionar los factores internos y externos, como el sistema operativo o la carga de la aplicación.

Recursos

Cut through the chaos: Gain operational visibility and insight (MGT301-R1)
X-Ray Documentation
CloudWatch Documentation
Monitoring, Logging, and Performance APN Partners

Prácticas recomendadas:

Plan de mejora

Registre las métricas relacionadas con el rendimiento

  • Registre los datos de rendimiento: Identifique las métricas de rendimiento importantes para la carga de trabajo y regístrelas. Estos datos ayudan a identificar qué componentes impactan en el rendimiento general o la eficiencia de la carga de trabajo.
  • Identifique las métricas de rendimiento: Utilice la experiencia del cliente para identificar las métricas más importantes. Para cada métrica, identifique el objetivo, el enfoque de medición y la prioridad. Utilice estos puntos de datos para crear alarmas y notificaciones para abordar de manera proactiva los problemas relacionados con el rendimiento.
  • Analice las métricas cuando ocurren eventos o incidentes

  • Priorice las preocupaciones de la experiencia para las historias de usuario esenciales: Cuando escriba historias de usuarios esenciales para su arquitectura, incluya requisitos de rendimiento, como especificar con qué rapidez se debe ejecutar cada historia indispensable. Para estas historias esenciales, implemente trayectos de usuario con scripts adicionales para garantizar que conozca cómo estas historias funcionan según sus requisitos.
  • Establezca indicadores clave de rendimiento (KPI) para medir el rendimiento de la carga de trabajo

  • Defina la experiencia del cliente: Documente la experiencia de rendimiento solicitada por los clientes, incluido lo que opinan del rendimiento de la carga de trabajo. Utilice estos requisitos para establecer los indicadores clave de rendimiento (KPI), que indican cómo rinde el sistema en general.
  • Evalúe los trayectos de usuarios: Para las pruebas de carga, utilice versiones sintéticas o depuradas de los datos de producción (elimina la información confidencial o de identificación). Ejercite toda su arquitectura con los trayectos de usuario reproducidos o preprogramados a través de la aplicación a escala.
  • Utilice el monitoreo para generar notificaciones basadas en las alarmas

  • Monitoree las métricas: Amazon CloudWatch puede recopilar métricas de los recursos en su arquitectura. Puede recopilar y publicar métricas personalizadas para los negocios de superficie o métricas derivadas. Utilice CloudWatch o un servicio de monitoreo de terceros a fin de establecer alarmas que indiquen cuándo se sobrepasan los umbrales.
  • Revise las métricas en intervalos regulares

  • Mejore la recopilación y monitoreo de las métricas de manera constante: Como parte de la respuesta a incidentes o eventos, evalúe qué métricas fueron útiles para abordar el problema y qué métricas podrían haber ayudado que actualmente no se rastrean. Utilice este método para mejorar la calidad de las métricas que recopila, de esta manera puede evitar o resolver incidentes futuros más rápidamente.
  • Monitoree y active las alarmas de manera proactiva

  • Monitoree el rendimiento durante las operaciones: Implemente procesos que ofrezcan visibilidad en el rendimiento a medida que la carga de trabajo se ejecuta. Cree paneles de monitoreo y establezca una referencia para las expectativas de rendimiento.