En tant que Staff Data Scientist chez Qwant, vous êtes le·la lead technique transverse de la Data Science : vous portez en central les standards ML et la stratégie scientifique pour améliorer notre moteur de recherche. Pour cela, vous défrichez les sujets les plus exigeants (Information retrieval et rich context information retrieval), et suivez sa mise en œuvre dans les Squads. Votre expertise et votre sens du mentorat permettra l’émergence d’autres leaders techniques au sein des squads pour que nos standards et la qualité de nos produits soient toujours plus élevés.
Vous êtes hands-on. Vous codez encore, pour défricher de nouvelles approches et sur les sujets transverses : templates, ML platform, frameworks d’évaluation, log and learn, POCs sur les chantiers stratégiques. Vous travaillez en peer technique de l’Engineering Manager Data Science et du VP Data, avec des mandats distincts et complémentaires : eux portent le delivery, l’humain et le budget ; vous portez la trajectoire technique.
Notre stack cible (Data Platform, Iceberg, MLOps) est en cours de construction, et c’est précisément ce que vous venez aider à finir. Si vous cherchez une organisation où les standards sont déjà écrits, ce poste n’est pas pour vous. Si vous voulez être l’un·e des architectes de cette bascule, poser les fondations qui permettront à 6 Data Scientists et 2 MLOps de livrer plus vite et mieux, et avoir un impact massif sur un produit souverain à grande échelle… (Vous allez vous amuser).
Vos missions :
Vous définissez et portez les standards ML en promouvant et adaptant les Rules of ML (Zinkevich) à notre contexte Search & IA. En tant qu’architecte du Log & Learn, vous loggez les inputs des modèles à l’inférence afin de monitorer au-delà des seules sorties et de constituer des datasets issus de la production, tout en limitant les risques de train/serving skew. Vous co-construisez avec l’EM DS et la Data Platform les fondations qui fluidifient la mise en production : templates, plateforme ML, monorepo Python, frameworks d’évaluation (NDCG, A/B testing, side-by-side, golden sets, LLM-as-judge).
Vous défrichez les sujets complexes en mode hands-on en portant techniquement les chantiers transverses qui n’appartiennent à aucune squad (Web Search for AI, Learning without Bing, et leurs successeurs). Vous cadrez l’approche, livrez un POC ou une architecture de référence, puis accompagnez leur transmission aux squads.
Vous alignez les équipes autour de la qualité en vous assurant qu’une définition partagée existe entre Product, Research et Data Science de ce qu’est un bon résultat Search pour un visiteur, versus un bon retrieval pour un LLM. Vous ne définissez pas seul·e cette qualité ; vous garantissez qu’elle soit explicite, comprise et partagée par l’ensemble des équipes.
Vous accompagnez la montée en compétence des profils seniors vers des rôles de Lead technique en squad à travers le pair design, les RFC, les revues de code et de design, ainsi qu’un leadership technique incarné sur les sujets les plus exigeants. Le développement de carrière reste porté par l’EM ; vous contribuez, de votre côté, à faire grandir techniquement les équipes. Vous participez également activement aux recrutements via la conception et la conduite des entretiens techniques DS.
Vous arbitrez les choix technologiques et défendez la souveraineté technique en animant le tech radar DS et en faisant émerger explicitement les arbitrages build vs buy, avec une forte préférence pour les solutions open-source et européennes. Vous construisez les ponts cross-équipes avec Engineering, Product et Research, et remontez au VP Data les frictions organisationnelles que vous identifiez.
Vous ne vous reconnaissez pas à 100 % dans les critères ci-dessous ? Aucun problème, envoyez quand même votre CV ! Tous les critères ne sont pas éliminatoires : votre passion, votre curiosité et votre motivation nous aideront à vous faire grandir 😉
Vous justifiez de 8+ années d’expérience en Data Science / Machine Learning, avec un track record solide sur des sujets transverses et multi-équipes (Staff, Principal ou Lead senior sur un scope transverse).
Vous adoptez un mindset pragmatique : vous préférez un if/else qui résout 80 % du problème à un modèle qui en résout 85 % pour 10x plus de coût de maintenance. Vous savez également reconnaître lorsque la complexité est nécessaire, et l’assumer pleinement.
Vous comprenez les dynamiques d’organisation et l’importance de la collaboration pour faire avancer les sujets. Vous influencez par la qualité de votre raisonnement, de votre communication et de votre empathie, plus que par le titre. Vous êtes à l’aise pour challenger les équipes Product, Engineering et le leadership.
Vous disposez de solides expertises en Search (Information Retrieval, ranking, NLP, embeddings, LLM) ainsi que sur des problématiques à forte volumétrie et contraintes de latence (recommandation, ads). Vous maîtrisez les méthodologies d’évaluation ML offline et online, et savez les concevoir autant que les exécuter.
Vous maîtrisez parfaitement Python, SQL et l’écosystème ML (scikit-learn, XGBoost, PyTorch, Transformers). Vous restez hands-on : vous aimez coder et continuez à le faire avec plaisir.
Vous avez déjà mis en place des standards ML / MLOps au sein d’une équipe : logging, monitoring, gestion du train/serving skew, model registry, frameworks d’évaluation, retraining et promotion de modèles.
Bonus appréciés :
Vous avez une expérience avec notre stack cœur : Kubernetes, Kafka, Doris, Iceberg, Vespa AI.
Vous avez accompagné l’émergence de Leads techniques au sein d’une équipe via le mentorat.
Vous êtes familier·ère des Rules of ML de Zinkevich, ou d’un framework équivalent que vous avez déjà porté.
Vous avez une forte sensibilité aux enjeux de souveraineté numérique européenne.
Stack technique :
Index et ranking déployés sur Vespa AI
Datasets multimodaux; Tb (du gradient boosting trees aux modèles de langage)
Training sur cluster Kube, distribué sur des machines multi-GPUs
Tracking & registry : MLFlow
Logging : in-house data platform (Kafka, Iceberg, Doris, DBT, Metabase)