REL 11. ¿Cómo diseña su carga de trabajo para que soporte los errores de los componentes?
Las cargas de trabajo con un requisito de alta disponibilidad y un tiempo de recuperación (MTTR) bajo deben diseñarse para que sean resilientes.
Prácticas recomendadas
REL11-BP01 Supervisión de todos los componentes de la carga de trabajo para detectar errores
REL11-BP03 Automatización de la reparación en todas las capas
REL11-BP04 Confianza en el plano de datos y no en el plano de control durante la recuperación
REL11-BP05 Uso de la estabilidad estática para evitar el comportamiento bimodal
REL11-BP06 Envío de notificaciones cuando los eventos afecten a la disponibilidad