CONFIABILIDADE 11. Como projetar a workload para resistir a falhas de componentes?
As cargas de trabalho que exigem alta disponibilidade e baixo Tempo médio até a recuperação (MTTR) devem ser projetadas visando a resiliência.
Práticas recomendadas
- REL11-BP01 Monitorar todos os componentes da workload para detectar falhas
- REL11-BP02 Failover para recursos íntegros
- REL11-BP03 Automatizar a reparação em todas as camadas
- REL11-BP04 Confiar no plano de dados e não no ambiente de gerenciamento durante a recuperação
- REL11-BP05 Usar estabilidade estática para evitar o comportamento bimodal
- REL11-BP06 Enviar notificações quando os eventos afetarem a disponibilidade
- REL11-BP07 Arquitetar o produto para cumprir as metas de disponibilidade e os acordos de nível de serviço (SLAs) de tempo de atividade