Réponse aux incidents automatisée avec AWS CloudWatch et Lambda

ADVANCED
220 minutes
5 tâches

Cet atelier avancé vous guide dans le développement d'un système de réponse aux incidents automatisé en utilisant AWS CloudWatch Events et AWS Lambda. Vous allez mettre en œuvre une automatisation pilotée par des événements qui réagit aux changements d'état des instances EC2 en effectuant des actions de récupération automatisée. Cet atelier simule un scénario où un environnement de production dynamique nécessite des mécanismes de surveillance résilients et automatisés pour maintenir une haute disponibilité et un temps d'arrêt minimal. Vous explorerez des ressources intégrées comme SNS pour les alertes et SSM pour exécuter les tâches de gestion, en exerçant des compétences essentielles pour prévenir et atténuer les défaillances du système.

Scénario

Imaginez que vous travaillez pour TechInnovate, une entreprise de services cloud axée sur les plateformes d'analytique en temps réel. TechInnovate doit s'assurer que ses instances EC2 dans l'environnement de production se récupèrent automatiquement des pannes sans intervention manuelle. Votre tâche est de concevoir et implémenter un système de réponse aux incidents automatisé en utilisant AWS. Cette solution doit inclure la surveillance d'état EC2, des alertes automatiques via SNS, des actions de récupération automatisées avec Lambda et des tâches de gestion avec Systems Manager.

Objectifs d'Apprentissage

  • Configurer CloudWatch Events pour détecter les changements d'état EC2.
  • Déclencher des fonctions Lambda basées sur des événements pour gérer la récupération automatisée.
  • Utiliser SNS pour envoyer des notifications pour les changements d'état critiques.
  • Mettre en œuvre AWS Systems Manager pour des tâches de gestion lors des incidents.

tâches (5)

tâche 1: Configurer une règle d'événement CloudWatch pour les changements d'état EC2

30 min

tâche 2: Configurer la fonction Lambda pour les actions de récupération automatisée

40 min

tâche 3: Implémenter AWS Systems Manager pour les tâches de gestion pendant les incidents

50 min

tâche 4: Analyser les événements EC2 et ajuster l'architecture système en utilisant AWS CloudWatch Logs

40 min

tâche 5: Concevoir des processus d'amélioration continue en utilisant AWS CodePipeline

60 min

Prérequis

  • Familiarité avec les outils et services de gestion AWS
  • Compréhension de base d'AWS Lambda et de l'architecture pilotée par des événements
  • Connaissance d'AWS Systems Manager et de ses capacités

Compétences Testées

Automatisation pilotée par des événementsDéploiement de fonction AWS LambdaConfiguration des événements CloudWatchUtilisation du Patch Manager de Systems ManagerAnalyse des journaux CloudWatchIntégration AWS CodePipeline
    Réponse aux incidents automatisée avec AWS CloudWatch et Lambda - Hands-On Lab - CertiPass