OPS 7: ¿Cómo sabe que está listo para dar respaldo a una carga de trabajo?
Evalúe la disposición operativa de sus cargas de trabajo, procesos y procedimientos y personal con el fin de comprender los riesgos operativos relacionados con su carga de trabajo.
Recursos
AWS Config
AWS Systems Manager Features
Prácticas recomendadas:
-
Garantice la capacidad del personal: Cuente con un mecanismo para confirmar que dispone de la cantidad apropiada de personal capacitado a fin de ofrecer respaldo para las necesidades operativas. Entrene a su personal y ajuste su capacidad según sea necesario a fin de mantener un respaldo eficaz.
-
Garantice la revisión constante de la disposición operativa: Garantice que tenga una revisión constante de su disposición para operar una carga de trabajo. Las revisiones deben incluir, como mínimo, la disposición operativa de los equipos y la carga de trabajo y los requisitos de seguridad. Implemente actividades de revisión como código y active revisiones automáticas en respuesta a los eventos, cuando sea apropiado, a fin de garantizar la consistencia, la velocidad de ejecución y reducir los errores causados por los procesos manuales.
-
Utilice manuales de procedimiento para su ejecución: Los manuales de procedimientos consisten en procedimientos documentados para lograr resultados específicos. Permita respuestas rápidas y constantes para eventos que se comprendan bien a través de la documentación de los procedimientos en los manuales. Implemente manuales de procedimientos como código y active su ejecución en respuesta a los eventos, cuando sea apropiado, a fin de asegurar la consistencia, la velocidad de las respuestas y reducir los errores causados por los procesos manuales.
-
Utilice los manuales de estrategias para investigar los problemas: Habilite respuestas constantes y rápidas para los problemas que no se comprendan correctamente mediante la documentación del proceso de investigación en los manuales de estrategias. Los manuales de estrategias contienen los pasos predefinidos que se realizan para identificar los factores que contribuyen a una situación de error. Los resultados de cualquier paso en el proceso se utilizan para determinar los próximos pasos a seguir hasta que se identifique o escale el problema.
-
Tome decisiones fundamentadas para implementar sistemas y cambios: Evalúe las capacidades del equipo para admitir la carga de trabajo y la conformidad de la carga de trabajo con la gobernabilidad. Lleve a cabo esta evaluación en función de los beneficios de su implementación cuando determine si se debe realizar la transición de un sistema o de un cambio a la fase de producción. Comprenda los beneficios y los riesgos para tomar decisiones fundamentadas.
Plan de mejora
Garantice la capacidad del personal
- Tamaño del equipo: Garantice que cuenta con suficientes miembros de equipo para cubrir las actividades operativas, incluidas las tareas de turno.
- Capacidad del equipo: Garantice que los miembros de su equipo reciban suficiente capacitación sobre AWS,
las cargas de trabajo y las herramientas operativas para desempeñar sus tareas.
AWS Events and Webinars
Welcome to AWS Training and Certification - Revisión de las capacidades: Revise el tamaño y las destrezas del equipo a medida que cambian las condiciones operativas y las cargas de trabajo, para garantizar que haya suficiente capacidad para mantener la excelencia operativa. Realice ajustes para garantizar que el tamaño y las destrezas del equipo coincidan con los requisitos operativos para las cargas de trabajo que respalda.
Garantice la revisión constante de la disposición operativa
AWS Systems Manager
AWS Config Rules dynamic compliance checking for cloud resources
How to audit your AWS resources for security compliance by using custom AWS Config Rules
How to track configuration changes to CloudFormation stacks using AWS Config
Amazon Inspector update assessment reporting, proxy support, and more
- Cree listas de verificación: Garantice que tenga una revisión constante de su disposición para operar una carga de trabajo. Cree listas de verificación de la disposición operativa y verifíquelas con sus requisitos empresariales, operativos, de desarrollo y de gobernabilidad. Garantice que tengan en cuenta: gobernabilidad, prácticas recomendadas, estándares de configuración, procedimientos de restauración, monitoreo, procedimientos de mantenimiento, procedimientos de operaciones de TI y el personal.
- Utilice listas de verificación: Elabore listas de verificación accesibles para los desarrolladores, de esta manera pueden formular los estándares adecuados. Evalúe las listas de verificación en el momento de desplazarse entre las etapas del ciclo de vida y los entornos, de modo que pueda identificar los problemas con antelación cuando el nivel de esfuerzo para solucionarlos sea bajo. Utilice los resultados de las listas de verificación para tomar decisiones fundamentadas sobre los beneficios y los riesgos cuando considere la promoción de cambios entre entornos.
- Implemente listas de verificación como código y active su ejecución en respuesta a
los eventos:
Implemente listas de verificación como código y active su ejecución en respuesta a
los eventos, cuando sea apropiado, a fin de mejorar la velocidad, asegurar la consistencia
y reducir los errores causados por los procesos manuales. Integre la ejecución de
las listas de verificación automatizadas en la implementación de la canalización.
AWS Config
What is AWS Config?
AWS Config: evaluating resources with Rules
Utilice manuales de procedimiento para su ejecución
- Implemente manuales de procedimientos como código:
Ejecute sus operaciones como código con la implementación de los manuales de procedimientos
como código a fin de garantizar consistencia y reducir los errores causados por los
procesos manuales
AWS Systems Manager Run Command
AWS Systems Manager Automation
What is AWS Lambda? - Active los manuales de procedimientos en respuesta a eventos:
Cuando sea necesario, active la ejecución del código de los manuales de procedimientos
en respuesta a los eventos observados. Esto aumenta la velocidad de respuesta y reduce
el nivel de esfuerzo para responder.
What is Amazon CloudWatch Events?
Creating a CloudWatch Events rule that triggers on an event
Creating a CloudWatch Events rule that triggers on an AWS API call using AWS CloudTrail
CloudWatch Events event examples from supported services
Using Amazon CloudWatch Alarms
Utilice los manuales de estrategias para investigar los problemas
- Implemente manuales de estrategias como código:
Ejecute sus operaciones como código mediante scripts de los manuales de estrategias
a fin de garantizar consistencia y reducir los errores causados por los procesos manuales.
Los manuales de estrategias se pueden formar con múltiples scripts que representan
los diferentes pasos que pueden ser necesarios para identificar los factores que contribuyen
a un problema. Las actividades de los manuales de procedimientos se pueden activar
o realizar como parte de las actividades de los manuales de estrategias o pueden generar
la ejecución de un manual de estrategias en respuesta a eventos identificados.
Automate your operational playbooks with AWS Systems Manager
AWS Systems Manager Run Command
AWS Systems Manager Automation
What is AWS Lambda?
What is Amazon CloudWatch Events?
Using Amazon CloudWatch Alarms
Tome decisiones fundamentadas para implementar sistemas y cambios