Mission Longue – SRE / DevOps Expert Datadog (H/F)
Paris (hybride possible)
Mission longue durée
Contexte :
Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).
Profil recherché
5 à 8 ans d’expérience DevOps / SRE
Expertise avancée Datadog (indispensable)
Solide maîtrise AWS & Kubernetes
Expérience en gouvernance d’outil d’observabilité
Expérience en environnement média fortement appréciée
Certification Datadog appréciée
Environnement Technique
Cloud : AWS (100%)
Orchestration : Kubernetes
CI/CD & pratiques DevOps
Observabilité : Datadog (expertise avancée requise)
Vos missions
Gouvernance & Structuration Datadog
Définition des standards d’implémentation (naming, tagging, templates)
Mise en place d’une stratégie globale d’observabilité
Structuration des données remontées (logs, métriques, traces)
Normalisation des dashboards et monitors
Gestion des accès (RBAC), rôles et policies
Optimisation des coûts (ingestion logs/APM/custom metrics)
Monitoring & Observabilité avancée avec Datadog
Vous interviendrez notamment sur :
Monitoring & Metrics
Création et optimisation de monitors avancés (multi-alerting, composite monitors)
Mise en place de SLO / SLA / Error Budgets
Déploiement de métriques custom (DogStatsD)
Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)
Monitoring Kubernetes (nodes, pods, HPA, etc.)
Capacity planning & forecasting
Logs Management
Structuration des pipelines de logs
Création de processors (parsing, remapping, enrichment)
Définition des règles d’indexation & retention
Mise en place d’alertes sur logs critiques
Optimisation coûts ingestion logs
APM & Tracing
Implémentation APM sur applications
Analyse des traces distribuées
Identification des bottlenecks applicatifs
Suivi de latence, erreurs, throughput
Service mapping & dépendances
Real User Monitoring (RUM)
Monitoring expérience utilisateur
Analyse des performances frontend
Corrélation RUM ↔ backend traces
Sécurité & Compliance
Implémentation de Security Monitoring
Détection d’anomalies
Mise en place de règles de sécurité
Audit et suivi des accès
Automatisation & IaC
Gestion Datadog via Terraform
Industrialisation des monitors & dashboards
Intégration CI/CD
Mise en place d’alerting automatisé
Incident Management
Optimisation de l’alerting (réduction du bruit)
Mise en place d’alertes intelligentes
Intégration avec outils d’incident (PagerDuty, Slack, etc.)
Post-mortem & amélioration continue
Soft skills
Leadership technique
Capacité à structurer & standardiser
Vision stratégique de l’observabilité
Forte culture fiabilité / performance
Excellente communication
Merci à vous et belle journée 😉
Mission Longue – SRE / DevOps Expert Datadog (H/F)
Paris (hybride possible)
Mission longue durée
Contexte :
Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).
Profil recherché
5 à 8 ans d’expérience DevOps / SRE
Expertise avancée Datadog (indispensable)
Solide maîtrise AWS & Kubernetes
Expérience en gouvernance d’outil d’observabilité
Expérience en environnement média fortement appréciée
Certification Datadog appréciée
Environnement Technique
Cloud : AWS (100%)
Orchestration : Kubernetes
CI/CD & pratiques DevOps
Observabilité : Datadog (expertise avancée requise)
Vos missions
Gouvernance & Structuration Datadog
Définition des standards d’implémentation (naming, tagging, templates)
Mise en place d’une stratégie globale d’observabilité
Structuration des données remontées (logs, métriques, traces)
Normalisation des dashboards et monitors
Gestion des accès (RBAC), rôles et policies
Optimisation des coûts (ingestion logs/APM/custom metrics)
Monitoring & Observabilité avancée avec Datadog
Vous interviendrez notamment sur :
Monitoring & Metrics
Création et optimisation de monitors avancés (multi-alerting, composite monitors)
Mise en place de SLO / SLA / Error Budgets
Déploiement de métriques custom (DogStatsD)
Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)
Monitoring Kubernetes (nodes, pods, HPA, etc.)
Capacity planning & forecasting
Logs Management
Structuration des pipelines de logs
Création de processors (parsing, remapping, enrichment)
Définition des règles d’indexation & retention
Mise en place d’alertes sur logs critiques
Optimisation coûts ingestion logs
APM & Tracing
Implémentation APM sur applications
Analyse des traces distribuées
Identification des bottlenecks applicatifs
Suivi de latence, erreurs, throughput
Service mapping & dépendances
Real User Monitoring (RUM)
Monitoring expérience utilisateur
Analyse des performances frontend
Corrélation RUM ↔ backend traces
Sécurité & Compliance
Implémentation de Security Monitoring
Détection d’anomalies
Mise en place de règles de sécurité
Audit et suivi des accès
Automatisation & IaC
Gestion Datadog via Terraform
Industrialisation des monitors & dashboards
Intégration CI/CD
Mise en place d’alerting automatisé
Incident Management
Optimisation de l’alerting (réduction du bruit)
Mise en place d’alertes intelligentes
Intégration avec outils d’incident (PagerDuty, Slack, etc.)
Post-mortem & amélioration continue
Soft skills
Leadership technique
Capacité à structurer & standardiser
Vision stratégique de l’observabilité
Forte culture fiabilité / performance
Excellente communication
Merci à vous et belle journée 😉
Mission Longue – SRE / DevOps Expert Datadog (H/F)
Paris (hybride possible)
Mission longue durée
Contexte :
Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).
Profil recherché
5 à 8 ans d’expérience DevOps / SRE
Expertise avancée Datadog (indispensable)
Solide maîtrise AWS & Kubernetes
Expérience en gouvernance d’outil d’observabilité
Expérience en environnement média fortement appréciée
Certification Datadog appréciée
Environnement Technique
Cloud : AWS (100%)
Orchestration : Kubernetes
CI/CD & pratiques DevOps
Observabilité : Datadog (expertise avancée requise)
Vos missions
Gouvernance & Structuration Datadog
Définition des standards d’implémentation (naming, tagging, templates)
Mise en place d’une stratégie globale d’observabilité
Structuration des données remontées (logs, métriques, traces)
Normalisation des dashboards et monitors
Gestion des accès (RBAC), rôles et policies
Optimisation des coûts (ingestion logs/APM/custom metrics)
Monitoring & Observabilité avancée avec Datadog
Vous interviendrez notamment sur :
Monitoring & Metrics
Création et optimisation de monitors avancés (multi-alerting, composite monitors)
Mise en place de SLO / SLA / Error Budgets
Déploiement de métriques custom (DogStatsD)
Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)
Monitoring Kubernetes (nodes, pods, HPA, etc.)
Capacity planning & forecasting
Logs Management
Structuration des pipelines de logs
Création de processors (parsing, remapping, enrichment)
Définition des règles d’indexation & retention
Mise en place d’alertes sur logs critiques
Optimisation coûts ingestion logs
APM & Tracing
Implémentation APM sur applications
Analyse des traces distribuées
Identification des bottlenecks applicatifs
Suivi de latence, erreurs, throughput
Service mapping & dépendances
Real User Monitoring (RUM)
Monitoring expérience utilisateur
Analyse des performances frontend
Corrélation RUM ↔ backend traces
Sécurité & Compliance
Implémentation de Security Monitoring
Détection d’anomalies
Mise en place de règles de sécurité
Audit et suivi des accès
Automatisation & IaC
Gestion Datadog via Terraform
Industrialisation des monitors & dashboards
Intégration CI/CD
Mise en place d’alerting automatisé
Incident Management
Optimisation de l’alerting (réduction du bruit)
Mise en place d’alertes intelligentes
Intégration avec outils d’incident (PagerDuty, Slack, etc.)
Post-mortem & amélioration continue
Soft skills
Leadership technique
Capacité à structurer & standardiser
Vision stratégique de l’observabilité
Forte culture fiabilité / performance
Excellente communication
Merci à vous et belle journée 😉
SAPIENS Group Depuis 2003, nous nous efforçons de répondre aux nouvelles problématiques de nos clients. Pour ce faire Sapiens Group a créé quatre filiales : ITIL Consulting, Sapiens NTIC, Tenesea Formation et Wemagine. Expert dans chacun de ses domaines, nous saurons répondre à vos attentes que vous soyez à la recherche de conseil en déploiement de solutions métiers, de développement web, de formation pour vos collaborateurs ou de la gestion de votre campagne marketing. Le Groupe Sapiens une organisation souple, à dimension humaine. Flexibles, nous adaptons nos prestations aux besoins de nos clients. Il faut également savoir que nous nous distinguons par une forte indépendance technologique et financière, garantissant ainsi une transparence totale de notre expertise technologique. Depuis sa création, Sapiens Group connait une croissance organique de son chiffre d’affaire. Nous étions 60 personnes en 2010, 80 en 2011, à ce jour nous sommes plus de 100 collaborateurs. Ouvert et disponible, nous serons ravis de vous recevoir dans nos locaux à Paris, Toulouse, Nantes, Lille ou Lyon.