Nous recherchons un·e stagiaire Research Engineer en IA générative 3D pour un stage de fin d’études ou de M2 recherche au sein de notre équipe R&D, sous la supervision scientifique directe du CTO (ancien encadrant CIFRE, co-auteur ICCV/BMVC).
Le contexte de recherche
Notre axe R&D s’inscrit dans la trajectoire des modèles génératifs 3D foundation ouverte par des travaux récents comme CLAY (Zhang et al., SIGGRAPH 2024 : VAE multi-résolution + DiT latent, 1.5 B paramètres, géométrie + matériaux PBR joints) et la lignée TRELLIS (Microsoft Research : latents structurés sparse-voxel, génération en cascade structure, géométrie puis matériaux, 4 B paramètres pour TRELLIS-2). Ces papers définissent un nouveau plateau pour la génération 3D : modèles à grande échelle, représentations latentes compactes, contrôle riche depuis image, texte ou signaux 3D, génération conjointe géométrie + PBR.
Notre conviction : ces modèles foundation ouvrent un terrain de recherche immense, côté spécialisation pour la production (adaptation, contrôle fin, ancrage métier) comme côté briques aval qui exploitent leurs sorties pour livrer des assets utilisables en pipeline studio.
Le sujet de recherche
Le sujet de fond est sélectionné conjointement à ton arrivée, parmi deux axes :
Spécialisation et contrôle des modèles génératifs 3D foundation. Comment adapter un modèle E2E open source de la lignée TRELLIS / CLAY à une catégorie d’assets métier ciblée ? Quels régimes d’adaptation (finetuning, adapters, distillation, conditionnement, probing des représentations internes) préservent la généralité du pré-entraînement tout en améliorant mesurablement la qualité sur le domaine cible ? Quels signaux supervisent au mieux la spécialisation (perte géométrique, perte de rendu, perte perceptuelle, retour humain) ? Comment introduire des contrôles utilisables par un artiste (géométrie de référence, contraintes topologiques, palettes matériau) ?
Décomposition et raffinement par parts au-dessus des modèles foundation. Étude empirique d’une chaîne qui exploite la sortie d’un modèle génératif 3D foundation, la décompose en parts sémantiques cohérentes, puis raffine chaque part indépendamment (complétion géométrique de la matière occluse, retopologie part-aware, raffinement de matériaux). Où la chaîne casse-t-elle ? Comment garantir la cohérence aux frontières inter-parts ? Quelles briques limitent aujourd’hui le pipeline ? Comment exploiter les représentations latentes des modèles foundation pour conditionner la décomposition elle-même ?
Ce qu’on offre
Un vrai sujet de recherche, pas un stage d’appoint
Mentoring serré : supervision scientifique personnelle par le CTO
Stack moderne, sans legacy lourd : on construit la nouvelle génération d’outils
Bureaux à Perrache (Lyon 2), ambiance startup, déjeuners d’équipe, événements ponctuels
Possibilité d’embauche en CDI à la fin du stage si le fit est bon
Infos pratiques
Stage conventionné (PFE, M2 recherche, césure, PFE bis), 5 à 6 mois (négociable jusqu’à 8 mois)
Début : juillet à septembre 2026, flexible selon le calendrier de ton école
Lieu : Lyon (70 Quai Perrache, 69002), présentiel majoritaire, 1 jour de télétravail par semaine possible
Indispensable
Étudiant·e en dernière année d’école d’ingénieur (3A), M2 recherche, ou doctorant·e en césure, en CS / ML / vision / computer graphics
Solides bases en deep learning : tu as déjà implémenté, entraîné et débuggé des modèles non triviaux, et tu lis des papiers récents sans lutter
Pratique sérieuse de PyTorch (ou framework équivalent), Python pro
Première expérience R&D : stage en labo, projet de recherche encadré, contribution open source ML, publication étudiante… quelque chose de tangible
Goût pour la rigueur expérimentale : isoler une variable, construire une baseline, mesurer ce qui compte, raconter une histoire propre à partir de résultats
Autonomie scientifique : creuser un sujet seul·e, identifier les bons papiers, savoir quand demander de l’aide
Curiosité forte pour la 3D générative, la vision géométrique ou la synthèse d’images : tu suis l’actualité du domaine
Atouts qui font la différence
Background computer graphics ou geometry processing (mesh, point cloud, SDF, marching cubes, parameterization)
Expérience préalable en 3D generative AI (image-to-3D, diffusion 3D, autoregressive mesh, NeRF, gaussian splatting)
Familiarité avec les architectures VAE 3D + DiT ou set-based latent (lignée 3DShape2VecSet / CLAY) et/ou les latents structurés (lignée TRELLIS)
Pratique d’outils DCC (Blender, Maya) : pas un prérequis, mais utile pour dialoguer avec les artistes
Publication antérieure (workshop, conférence) ou contribution open source significative
Sensibilité artiste ou pratique personnelle de la 3D, du dessin, du jeu vidéo
Bon niveau d’anglais scientifique