SRE / DevOps Expert Datadog (H/F)

Sapiens Group

Postuler

AWS Cloud

Datadog

Kubernetes

Terraform

CI/CD

infra

Paris, France

Télétravail : partial

Expérience : senior

contractor, permanent

Publié il y a 2 mois

Description du poste

Mission Longue – SRE / DevOps Expert Datadog (H/F)

Paris (hybride possible)

Mission longue durée

Contexte :

Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).

Profil recherché

5 à 8 ans d’expérience DevOps / SRE

Expertise avancée Datadog (indispensable)

Solide maîtrise AWS & Kubernetes

Expérience en gouvernance d’outil d’observabilité

Expérience en environnement média fortement appréciée

Certification Datadog appréciée

Environnement Technique

Cloud : AWS (100%)

Orchestration : Kubernetes

CI/CD & pratiques DevOps

Observabilité : Datadog (expertise avancée requise)

Vos missions

Gouvernance & Structuration Datadog

Définition des standards d’implémentation (naming, tagging, templates)

Mise en place d’une stratégie globale d’observabilité

Structuration des données remontées (logs, métriques, traces)

Normalisation des dashboards et monitors

Gestion des accès (RBAC), rôles et policies

Optimisation des coûts (ingestion logs/APM/custom metrics)

Monitoring & Observabilité avancée avec Datadog

Vous interviendrez notamment sur :

Monitoring & Metrics

Création et optimisation de monitors avancés (multi-alerting, composite monitors)

Mise en place de SLO / SLA / Error Budgets

Déploiement de métriques custom (DogStatsD)

Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)

Monitoring Kubernetes (nodes, pods, HPA, etc.)

Capacity planning & forecasting

Logs Management

Structuration des pipelines de logs

Création de processors (parsing, remapping, enrichment)

Définition des règles d’indexation & retention

Mise en place d’alertes sur logs critiques

Optimisation coûts ingestion logs

APM & Tracing

Implémentation APM sur applications

Analyse des traces distribuées

Identification des bottlenecks applicatifs

Suivi de latence, erreurs, throughput

Service mapping & dépendances

Real User Monitoring (RUM)

Monitoring expérience utilisateur

Analyse des performances frontend

Corrélation RUM ↔ backend traces

Sécurité & Compliance

Implémentation de Security Monitoring

Détection d’anomalies

Mise en place de règles de sécurité

Audit et suivi des accès

Automatisation & IaC

Gestion Datadog via Terraform

Industrialisation des monitors & dashboards

Intégration CI/CD

Mise en place d’alerting automatisé

Incident Management

Optimisation de l’alerting (réduction du bruit)

Mise en place d’alertes intelligentes

Intégration avec outils d’incident (PagerDuty, Slack, etc.)

Post-mortem & amélioration continue

Soft skills

Leadership technique

Capacité à structurer & standardiser

Vision stratégique de l’observabilité

Forte culture fiabilité / performance

Excellente communication

Merci à vous et belle journée 😉

Mission Longue – SRE / DevOps Expert Datadog (H/F)

Paris (hybride possible)

Mission longue durée

Contexte :

Profil recherché

5 à 8 ans d’expérience DevOps / SRE

Expertise avancée Datadog (indispensable)

Solide maîtrise AWS & Kubernetes

Expérience en gouvernance d’outil d’observabilité

Expérience en environnement média fortement appréciée

Certification Datadog appréciée

Environnement Technique

Cloud : AWS (100%)

Orchestration : Kubernetes

CI/CD & pratiques DevOps

Observabilité : Datadog (expertise avancée requise)

Vos missions

Gouvernance & Structuration Datadog

Définition des standards d’implémentation (naming, tagging, templates)

Mise en place d’une stratégie globale d’observabilité

Structuration des données remontées (logs, métriques, traces)

Normalisation des dashboards et monitors

Gestion des accès (RBAC), rôles et policies

Optimisation des coûts (ingestion logs/APM/custom metrics)

Monitoring & Observabilité avancée avec Datadog

Vous interviendrez notamment sur :

Monitoring & Metrics

Création et optimisation de monitors avancés (multi-alerting, composite monitors)

Mise en place de SLO / SLA / Error Budgets

Déploiement de métriques custom (DogStatsD)

Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)

Monitoring Kubernetes (nodes, pods, HPA, etc.)

Capacity planning & forecasting

Logs Management

Structuration des pipelines de logs

Création de processors (parsing, remapping, enrichment)

Définition des règles d’indexation & retention

Mise en place d’alertes sur logs critiques

Optimisation coûts ingestion logs

APM & Tracing

Implémentation APM sur applications

Analyse des traces distribuées

Identification des bottlenecks applicatifs

Suivi de latence, erreurs, throughput

Service mapping & dépendances

Real User Monitoring (RUM)

Monitoring expérience utilisateur

Analyse des performances frontend

Corrélation RUM ↔ backend traces

Sécurité & Compliance

Implémentation de Security Monitoring

Détection d’anomalies

Mise en place de règles de sécurité

Audit et suivi des accès

Automatisation & IaC

Gestion Datadog via Terraform

Industrialisation des monitors & dashboards

Intégration CI/CD

Mise en place d’alerting automatisé

Incident Management

Optimisation de l’alerting (réduction du bruit)

Mise en place d’alertes intelligentes

Intégration avec outils d’incident (PagerDuty, Slack, etc.)

Post-mortem & amélioration continue

Soft skills

Leadership technique

Capacité à structurer & standardiser

Vision stratégique de l’observabilité

Forte culture fiabilité / performance

Excellente communication

Merci à vous et belle journée 😉

Mission Longue – SRE / DevOps Expert Datadog (H/F)

Paris (hybride possible)

Mission longue durée

Contexte :

Profil recherché

5 à 8 ans d’expérience DevOps / SRE

Expertise avancée Datadog (indispensable)

Solide maîtrise AWS & Kubernetes

Expérience en gouvernance d’outil d’observabilité

Expérience en environnement média fortement appréciée

Certification Datadog appréciée

Environnement Technique

Cloud : AWS (100%)

Orchestration : Kubernetes

CI/CD & pratiques DevOps

Observabilité : Datadog (expertise avancée requise)

Vos missions

Gouvernance & Structuration Datadog

Définition des standards d’implémentation (naming, tagging, templates)

Mise en place d’une stratégie globale d’observabilité

Structuration des données remontées (logs, métriques, traces)

Normalisation des dashboards et monitors

Gestion des accès (RBAC), rôles et policies

Optimisation des coûts (ingestion logs/APM/custom metrics)

Monitoring & Observabilité avancée avec Datadog

Vous interviendrez notamment sur :

Monitoring & Metrics

Création et optimisation de monitors avancés (multi-alerting, composite monitors)

Mise en place de SLO / SLA / Error Budgets

Déploiement de métriques custom (DogStatsD)

Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)

Monitoring Kubernetes (nodes, pods, HPA, etc.)

Capacity planning & forecasting

Logs Management

Structuration des pipelines de logs

Création de processors (parsing, remapping, enrichment)

Définition des règles d’indexation & retention

Mise en place d’alertes sur logs critiques

Optimisation coûts ingestion logs

APM & Tracing

Implémentation APM sur applications

Analyse des traces distribuées

Identification des bottlenecks applicatifs

Suivi de latence, erreurs, throughput

Service mapping & dépendances

Real User Monitoring (RUM)

Monitoring expérience utilisateur

Analyse des performances frontend

Corrélation RUM ↔ backend traces

Sécurité & Compliance

Implémentation de Security Monitoring

Détection d’anomalies

Mise en place de règles de sécurité

Audit et suivi des accès

Automatisation & IaC

Gestion Datadog via Terraform

Industrialisation des monitors & dashboards

Intégration CI/CD

Mise en place d’alerting automatisé

Incident Management

Optimisation de l’alerting (réduction du bruit)

Mise en place d’alertes intelligentes

Intégration avec outils d’incident (PagerDuty, Slack, etc.)

Post-mortem & amélioration continue

Soft skills

Leadership technique

Capacité à structurer & standardiser

Vision stratégique de l’observabilité

Forte culture fiabilité / performance

Excellente communication

Merci à vous et belle journée 😉

A propos de l'entreprise

Sapiens Group, ()

SAPIENS Group Depuis 2003, nous nous efforçons de répondre aux nouvelles problématiques de nos clients. Pour ce faire Sapiens Group a créé quatre filiales : ITIL Consulting, Sapiens NTIC, Tenesea Formation et Wemagine. Expert dans chacun de ses domaines, nous saurons répondre à vos attentes que vous soyez à la recherche de conseil en déploiement de solutions métiers, de développement web, de formation pour vos collaborateurs ou de la gestion de votre campagne marketing. Le Groupe Sapiens une organisation souple, à dimension humaine. Flexibles, nous adaptons nos prestations aux besoins de nos clients. Il faut également savoir que nous nous distinguons par une forte indépendance technologique et financière, garantissant ainsi une transparence totale de notre expertise technologique. Depuis sa création, Sapiens Group connait une croissance organique de son chiffre d’affaire. Nous étions 60 personnes en 2010, 80 en 2011, à ce jour nous sommes plus de 100 collaborateurs. Ouvert et disponible, nous serons ravis de vous recevoir dans nos locaux à Paris, Toulouse, Nantes, Lille ou Lyon.

Postuler maintenant

Navigation

Liens utiles

Nous suivre

SRE / DevOps Expert Datadog (H/F)

Description du poste

A propos de l'entreprise