Vos missions en quelques mots
Missions :
• Déployer et opérer la plateforme de stockage objet compatible S3 en environnement cloud souverain multi-régions ; assurer la montée en charge et la tenue des SLO de disponibilité et de durabilité ;
• Garantir l’isolation multi-tenant, le chiffrement at-rest/in-transit et la conformité aux exigences SSI sur l’ensemble du périmètre objet ;
• Concevoir et opérer la chaîne de sauvegarde de bout en bout : politiques de backup, rétention, déduplication, chiffrement des sauvegardes, tiering vers le stockage froid ;
• Mettre en œuvre et tester les procédures de restauration et les Plans de Reprise d’Activité (PRA) ; piloter les exercices et formaliser les RETEX ;
• Déployer et opérer la pile d’observabilité sur le périmètre objet et backup : métriques, alertes, tableaux de bord;
• Conduire l’exploitation par les SLO et RETEX ;
• Participer à la gestion d’incidents (niveau N3/N4) et aux astreintes ;
• Contribuer aux choix technologiques sur le stockage objet (intégration dans la pile cloud) ;
• Contribuer au développement d’outils internes (automation, optimisation, outillage de la plateforme) et, le cas échéant, à des activités de recherche et développement (R&D) en lien avec les partenaires académiques ou industriels de l’opérateur ;
• Participer au recrutement et à la montée en compétences des ingénieurs stockage juniors.
Profil recherché
Nous cherchons un SRE stockage confirmé : 5 à 10 ans d’expérience en production sur des environnements de stockage distribué à grande échelle, avec une maîtrise avérée du stockage objet S3 et des problématiques de protection de la donnée.
Vous possédez de l’expérience professionnelle :
• Exploitation SRE d’une solution de stockage objet compatible S3 à grande échelle (e.g., Scality RING ou équivalent) : déploiement, optimisation, dimensionnement (bande passante, durabilité, coût/To) ; gestion d’incidents N3/N4 et participation aux astreintes ;
• Conception et opération d’une chaîne de sauvegarde complète : politiques de backup, rétention, restauration, PRA ; tests de résilience (perte de nœud, corruption silencieuse, restauration à froid) ; notions sur les supports d’archivage froid appréciées ;
• Observabilité du périmètre stockage objet et backup ;
• Culture SRE appliquée au stockage distribué.
Vous disposez également des compétences techniques suivantes :
• Maîtrise d’une solution de stockage objet compatible S3 en production : déploiement, optimisation, erasure coding, politiques de cycle de vie, versioning, cohérence ;
• Maîtrise de Linux avancée (optimisation I/O, kernel) et d’au moins un langage de programmation (Go, Python) et d’infrastructure-as-code (Terraform, Ansible) ;
• Compréhension des fondamentaux du stockage distribué : réplication, erasure coding, cohérence éventuelle, théorème CAP appliqué au stockage objet multi-sites ;
• Très bonne connaissance sécurité : isolation multi-tenant, chiffrement at-rest/in-transit, gestion des secrets, capacité à dialoguer avec une chaîne SSI.
Vous êtes :
• Rigoureux : Capacité à concevoir et maintenir des infrastructures critiques avec une attention méticuleuse aux détails, particulièrement dans les aspects de sécurité et de reproductibilité ;
• Innovant : Capacité à proposer des solutions techniques avancées et à implémenter des bonnes pratiques ;
• Ancré dans une culture d’analyse factuelle et d’amélioration continue.