Nouveau
Description du poste
Discovery Health, acteur majeur du secteur de la santé et du bien‑être, a pour mission d’améliorer et de protéger la vie des personnes grâce à des produits innovants qui encouragent des comportements plus sains. Dans le cadre de son expansion digitale, le groupe recherche un Data Scientist talentueux pour rejoindre son Data Science Lab, un environnement de recherche appliquée qui collabore avec des partenaires de renom tels que Discovery Health Digital, Quantium, Risk Intelligence et la London School of Economics.
Le laboratoire exploite plusieurs téraoctets de données structurées (dossiers médicaux, historiques de réclamations, données de souscription) et non structurées (textes de chat, enregistrements vocaux, images médicales) au sein d’une architecture big‑data moderne (Spark, Hadoop, Snowflake). Vous serez intégré(e) à une équipe pluridisciplinaire composée de data engineers, de data scientists seniors et de spécialistes métier. Votre rôle principal consistera à concevoir, développer et déployer des solutions de data science, de machine learning et d’intelligence artificielle visant à :
- Accroître l’engagement des membres grâce à des recommandations personnalisées et des campagnes de prévention ciblées ;
- Optimiser les processus opérationnels (détection de fraude, prévision de la demande, allocation des ressources) ;
- Améliorer les performances des produits (taux de conversion, rétention, satisfaction client).
Missions clés :
1. **Analyse et modélisation** : explorer les jeux de données, identifier les variables pertinentes, réaliser des analyses descriptives et inférentielles.
2. **Feature engineering** : créer, tester et sélectionner des variables dérivées, automatiser les pipelines de transformation.
3. **Développement de modèles** : concevoir des modèles statistiques (régression, séries temporelles) et de machine learning (tree‑based, réseaux de neurones, deep learning) adaptés aux cas d’usage.
4. **Évaluation et suivi** : mettre en place des métriques de performance, réaliser des validations croisées, monitorer la dérive des modèles en production.
5. **Mise en production** : construire des pipelines end‑to‑end (pré‑traitement, entraînement, déploiement) avec des outils tels que MLflow, Kubeflow ou Airflow ; assurer la scalabilité et la robustesse.
6. **Expérimentation** : concevoir et analyser des tests A/B, appliquer le uplift modelling pour mesurer l’impact réel des interventions.
7. **Innovation IA** : explorer les grands modèles de langage (LLM), les modèles d’optimisation et les agents autonomes afin de proposer des solutions de génération de texte, de classification sémantique ou de prise de décision automatisée.
8. **Collaboration** : travailler en étroite synergie avec les équipes produit, marketing, risques et IT, communiquer les résultats de façon claire aux parties prenantes non‑techniques.
Profil recherché : vous êtes diplômé(e) d’un master ou d’un doctorat en informatique, data science, mathématiques appliquées ou discipline équivalente, avec 2 à 4 ans d’expérience professionnelle en data science appliquée. Vous maîtrisez Python (pandas, scikit‑learn, TensorFlow/PyTorch), SQL, ainsi que les environnements Spark/Scala. Vous avez déjà déployé des modèles en production et êtes à l’aise avec les bonnes pratiques DevOps/ML‑Ops. Vous avez une forte capacité d’analyse, un esprit critique et une curiosité pour les nouvelles technologies IA. La maîtrise de l’anglais est indispensable ; le français est un atout.
Nous offrons :
- Un contrat CDI à temps plein dans un cadre hybride (2 jours de télétravail par semaine).
- Un salaire compétitif, complété par un package de bonus lié aux performances.
- Un environnement de travail stimulant, avec accès à des formations continues, conférences et certifications.
- Des avantages sociaux (assurance santé, programme de bien‑être, congés supplémentaires).
- La possibilité de contribuer à des projets à fort impact sociétal, au sein d’une entreprise reconnue pour son innovation dans le domaine de la santé.
Rejoignez-nous pour transformer les données en actions concrètes qui améliorent la vie de millions de personnes.