OPS 7: Comment savoir si vous êtes prêt à assurer une charge de travail ?
Évaluez la disponibilité opérationnelle de votre charge de travail, des processus et des procédures, ainsi que le personnel pour comprendre les risques opérationnels liés à votre charge de travail.
Ressources
AWS Config
AWS Systems Manager Features
Bonnes pratiques:
-
Garantir les compétences du personnel: Mettez en place un mécanisme permettant de vérifier que vous disposez du personnel formé pour répondre aux besoins opérationnels. Formez le personnel et ajustez ses compétences pour maintenir un support efficace.
-
Garantir un examen cohérent de l'état de préparation opérationnelle: Veillez à appliquer une vérification cohérente de votre état de préparation à l’exploitation d’une charge de travail. Les vérification doivent porter, au minimum, sur l'état de préparation opérationnelle des équipes et la charge de travail, ainsi que sur les exigences en matière de sécurité. Mettez en place des activités d'évaluation dans le code et déclenchez une vérification automatique en réponse aux événements, le cas échéant, afin de garantir la cohérence, la vitesse d'exécution et de réduire les erreurs causées par les processus manuels.
-
Utiliser des runbooks pour effectuer des procédures: Les runbooks sont des procédures documentées destinées à obtenir des résultats spécifiques. Obtenez des réponses cohérentes et rapides à des événements bien compris en documentant les procédures dans des runbooks. Mettez en œuvre des runbooks en tant que code et déclenchez leur exécution en réponse à des événements, le cas échéant, pour assurer la cohérence, accélérer les réponses et réduire les erreurs causées par les processus manuels.
-
Utiliser des playbooks pour analyser les problèmes: Mettez en œuvre des réponses cohérentes et rapides aux questions qui ne sont pas bien comprises, en documentant le processus d'investigation dans des playbooks. Les playbooks sont les étapes prédéfinies exécutées pour identifier les facteurs contribuant à un scénario. Les résultats des étapes du processus sont utilisés pour déterminer les prochaines mesures à prendre jusqu'à ce que la question soit identifiée ou remontée.
-
Prendre des décisions avisées pour déployer des systèmes et des modifications: Évaluez les compétences de l'équipe pour prendre en charge la charge de travail et la conformité de cette dernière à la gouvernance. Évaluez-les par rapport aux avantages du déploiement pour déterminer s'il convient de faire passer un système ou une modification en production. Comprenez les avantages et les risques pour prendre des décisions avisées.
Plan d'amélioration
Garantir les compétences du personnel
- Taille de l'équipe: Veillez à disposer de suffisamment de personnel pour couvrir les activités opérationnelles, y compris des employés d’astreinte.
- Compétences de l’équipe: Assurez-vous que les membres de votre équipe soient suffisamment formés sur AWS, votre
charge de travail et les outils utilisés pour vos opérations pour effectuer leurs
tâches.
AWS Events and Webinars
Welcome to AWS Training and Certification - Vérifier les capacités: Vérifiez la taille de l'équipe et ses compétences au fur et à mesure que les conditions d'utilisation et les charges de travail évoluent, afin de maintenir l’excellence opérationnelle. Effectuez des ajustements pour veiller à ce que la taille de l'équipe et ses compétences satisfassent aux exigences opérationnelles pour les charges de travail gérées par l'équipe.
Garantir un examen cohérent de l'état de préparation opérationnelle
AWS Systems Manager
AWS Config Rules dynamic compliance checking for cloud resources
How to audit your AWS resources for security compliance by using custom AWS Config Rules
How to track configuration changes to CloudFormation stacks using AWS Config
Amazon Inspector update assessment reporting, proxy support, and more
- Créer des listes de contrôle: Veillez à appliquer une vérification cohérente de votre état de préparation à l’exploitation d’une charge de travail. Créez des listes de contrôle de disponibilité opérationnelle et validez-les en fonction de vos besoins en termes d'activités, de développement, d'opérations et de gouvernance. Veillez à inclure les facteurs suivants : gouvernance, bonnes pratiques, normes de configuration, procédures de restauration, surveillance, procédures de maintenance, procédures des opérations informatiques et dotation en personnel.
- Utiliser des listes de contrôle: Mettez les listes de contrôle à la disposition des développeurs afin qu'ils puissent travailler selon les normes appropriées. Évaluez les listes de contrôle lors des transitions entre les phases du cycle de vie et les environnements, pour identifier les problèmes au plus tôt et y remédier plus facilement. Utilisez les résultats des listes de contrôle afin de prendre des décisions avisées concernant les avantages et les risques lorsque vous envisagez de promouvoir des modifications entre les environnements.
- Mettre en place des listes de contrôle en tant que code et déclencher l'exécution
des listes de contrôle en réponse à des événements:
Mettez en place des listes de contrôle en tant que code et déclenchez l'exécution
de listes de contrôle en réponse à des événements, si possible, afin de garantir la
vitesse et la cohérence et de réduire les erreurs causées par les processus manuels.
Intégrez l'exécution automatisée des listes de contrôle dans les pipelines de déploiement.
AWS Config
What is AWS Config?
AWS Config: evaluating resources with Rules
Utiliser des runbooks pour effectuer des procédures
- Mettre en œuvre des runbooks en tant que code:
Effectuez vos opérations en tant que code en mettant en œuvre vos runbooks en tant
que code pour garantir la cohérence et réduire les erreurs causées par les processus
manuels.
AWS Systems Manager Run Command
AWS Systems Manager Automation
What is AWS Lambda? - Déclencher des runbooks en réponse à des événements:
Déclenchez l'exécution de code de runbooks en réponse à des événements observés, le
cas échéant. Cela accélère la réponse et réduit le niveau d'efforts nécessaires pour
répondre.
What is Amazon CloudWatch Events?
Creating a CloudWatch Events rule that triggers on an event
Creating a CloudWatch Events rule that triggers on an AWS API call using AWS CloudTrail
CloudWatch Events event examples from supported services
Using Amazon CloudWatch Alarms
Utiliser des playbooks pour analyser les problèmes
- Mettre en œuvre des playbooks en tant que code:
Effectuez vos opérations en tant que code scriptant vos playbooks afin d'en assurer
la cohérence et de limiter les erreurs causées par les processus manuels. Les playbooks
peuvent être composés de plusieurs scripts représentant les différentes étapes qui
pourraient être nécessaires pour identifier les facteurs contribuant à un problème.
Les activités Runbook peuvent être déclenchées ou effectuées dans le cadre d'activités
playbook, ou peuvent demander l'exécution d'un playbook en réponse à des événements
identifiés.
Automate your operational playbooks with AWS Systems Manager
AWS Systems Manager Run Command
AWS Systems Manager Automation
What is AWS Lambda?
What is Amazon CloudWatch Events?
Using Amazon CloudWatch Alarms
Prendre des décisions avisées pour déployer des systèmes et des modifications