Implémenter l'excellence opérationnelle avec les outils d'observabilité GCP

ADVANCED
240 minutes
5 tâches

Dans cet atelier, vous utiliserez les outils d'observabilité de Google Cloud Platform pour atteindre l'excellence opérationnelle. Vous mettrez en œuvre la surveillance et la journalisation pour une architecture de microservices exécutée sur Google Kubernetes Engine (GKE). L'accent sera mis sur la mise en place d'un environnement évolutif et fiable, avec alertes et tableaux de bord pour garantir une qualité opérationnelle continue. Des techniques avancées telles que le profilage et le benchmarking seront également explorées, fournissant une compréhension globale du maintien d'un cadre opérationnel optimal.

Scénario

Vous travaillez pour une entreprise technologique, CloudTech, qui fournit des services d'API évolutifs. CloudTech vise à améliorer son excellence opérationnelle afin de garantir des services ininterrompus à sa clientèle croissante. Ils ont besoin d'une configuration GKE robuste avec une meilleure observabilité pour réduire les temps d'arrêt et gérer de manière proactive les problèmes. Les SLAs actuels exigent une disponibilité de 99,9 % et une résolution des problèmes dans les 2 heures. Votre rôle consiste à mettre en place des outils d'opérations Cloud, configurer des alertes et veiller au respect des exigences des SLA.

Objectifs d'Apprentissage

  • Configurer GKE avec surveillance et journalisation.
  • Mettre en place des tableaux de bord et des alertes Cloud Monitoring pour la fiabilité du système.
  • Mettre en œuvre le profilage et le benchmarking avancés pour optimiser les performances.
  • Assurer la conformité avec les exigences du SLA via des métriques opérationnelles.

tâches (5)

tâche 1: Fournir un cluster GKE avec journalisation activée

40 min

tâche 2: Créer un tableau de bord Cloud Monitoring

50 min

tâche 3: Implémenter le profilage pour la performance de l'application

40 min

tâche 4: Optimiser l'application pour les métriques de performance

50 min

tâche 5: Concevoir des stratégies d'alerte pour la fiabilité opérationnelle

60 min

Prérequis

  • Compréhension des concepts Kubernetes et GKE
  • Connaissance des outils de surveillance et d'alerte cloud
  • Expérience de profilage de performances et d'optimisation d'application

Compétences Testées

Surveillance et journalisation de GKETableaux de bord de Cloud MonitoringIntégration de Cloud ProfilerStratégies de fiabilité opérationnelle

Références