Esse conteúdo está desatualizado. Esta versão da Well-Architected Framework agora pode ser encontrada em: https://docs.aws.amazon.com/pt_br/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 7: Como você sabe que está pronto para oferecer suporte a uma carga de trabalho?

Avalie a prontidão operacional de sua carga de trabalho, processos/procedimentos e pessoal para entender os riscos operacionais relacionados.

Recursos

AWS Config
AWS Systems Manager Features

Melhores práticas:

Plano de melhoria

Garanta a capacidade de pessoal

  • Capacidade de pessoal: Valide se há pessoal treinado suficiente para oferecer suporte de forma eficaz a carga de trabalho.
  • Garanta uma análise consistente da prontidão operacional

  • Garanta uma análise consistente da prontidão operacional: Verifique se você tem uma análise consistente de sua prontidão para operar uma carga de trabalho. A análise deve incluir no mínimo a prontidão operacional das equipes, a carga de trabalho e as considerações de segurança. Os elementos de análise podem ser requisitos difíceis ou você pode tomar uma decisão baseada no risco de operar uma carga de trabalho que não atende a todos os requisitos. Os elementos de análise podem ser específicos para uma carga de trabalho, arquitetura ou podem depender da implementação. Implemente análises como código e acione análises em resposta a eventos, quando adequado, para garantir consistência, velocidade de execução e reduzir erros causados por processos manuais.
    AWS Systems Manager
    AWS Config Rules dynamic compliance checking for cloud resources
    How to audit your AWS resources for security compliance by using custom AWS Config Rules
    How to track configuration changes to CloudFormation stacks using AWS Config
    Amazon Inspector update assessment reporting, proxy support, and more
  • Use runbooks para executar procedimentos

  • Usar runbooks para executar procedimentos padrão: Os runbooks são os procedimentos documentados para alcançar resultados específicos. Habilite respostas consistentes e rápidas para eventos bem conhecidos, documentando procedimentos nos runbooks. Os runbooks devem conter as informações mínimas para que uma pessoa adequadamente qualificada atinja o resultado desejado. Por exemplo, permissões necessárias, ferramentas necessárias, restrições na execução do procedimento (por exemplo, janelas de manutenção específicas) e etapas de execução.
  • Usar playbooks para investigar problemas

  • Usar playbooks para identificar problemas: Os manuais são processos documentados para investigar problemas. Faça a documentação dos processos em playbooks para permitir respostas consistentes e rápidas em cenários de falha. Os playbooks devem conter as informações e diretrizes necessárias para que uma pessoa adequadamente qualificada colete as informações aplicáveis, identifique possíveis fontes de falha, isole as falhas e determine os fatores de contribuição (ou seja, análises de causa raiz).
  • Tome decisões informadas para implantar sistemas e mudanças

  • Tome decisões informadas para implantar cargas de trabalho e mudanças: Avalie os recursos da equipe para oferecer suporte à carga de trabalho e à conformidade da carga de trabalho com a governança. Avalie isso em relação aos benefícios da implantação ao determinar se deseja fazer a transição para um sistema ou mudar para produção. Compreenda os benefícios e riscos e tome decisões informadas.