جديد
Remote
وصف الوظيفة
ContextCollective.work, start‑up innovante au cœur de la transformation du recrutement, conçoit une plateforme de sourcing IA de nouvelle génération destinée aux recruteurs. Notre ambition : offrir aux équipes RH des outils ultra‑performants, basés sur des données fiables, pour identifier les meilleurs talents en un temps record. Dans ce contexte de forte croissance, nous recherchons un(e) Data Engineer confirmé(e) pour piloter la conception, le déploiement et l’optimisation de nos pipelines de données, tant en mode batch que temps réel.
**Vos missions principales**
- Concevoir, développer et maintenir des pipelines de données scalables sur Azure (Data Factory, Synapse) et/ou GCP (BigQuery, Dataflow) ; assurer leur robustesse et leur performance.
- Optimiser les workflows ETL/ELT, en veillant à la réduction des coûts d’infrastructure et à la maîtrise des temps de latence.
- Modéliser les données pour l’analytique et le machine‑learning : création de schémas de data‑warehouses, data‑lakes et de jeux de données d’entraînement.
- Garantir la qualité, la traçabilité et la conformité des données (RGPD, normes de sécurité) grâce à la mise en place de contrôles automatisés et de processus de gouvernance.
- Collaborer étroitement avec les équipes Machine Learning et Produit pour préparer les jeux de données, valider les exigences fonctionnelles et itérer rapidement.
- Mettre en place la supervision (monitoring, alerting) des pipelines, analyser les métriques de performance et proposer des améliorations continues.
- Contribuer aux décisions d’architecture, de choix d’outils et d’infrastructure (Docker, CI/CD, orchestration Airflow ou Prefect, streaming Kafka / PubSub).
**Profil recherché**
Vous justifiez d’au moins 4 ans d’expérience en ingénierie de données, idéalement dans un environnement cloud (Azure ou GCP). Vous maîtrisez Python, SQL et Spark, ainsi que les outils d’orchestration (Airflow, Prefect). Vous avez déjà déployé des pipelines en temps réel (Kafka, Pub/Sub) et vous êtes à l’aise avec les concepts de data‑governance, de sécurité et de conformité. Vous êtes autonome, curieux(se) et capable de travailler en équipe pluridisciplinaire dans un mode agile. Une expérience en machine‑learning ou en data‑science est un plus.
**Ce que nous offrons**
- Un environnement de travail flexible : télétravail complet avec des réunions ponctuelles en présentiel (hybride) selon les besoins du projet.
- Une forte autonomie dès le premier jour : vous serez acteur(trice) clé de la stratégie data de la plateforme.
- Une culture d’ingénierie collaborative, orientée produit, où chaque idée compte.
- Des opportunités de formation continue (certifications cloud, conférences, workshops).
- Un package salarial attractif, complété par des avantages (mutuelle, tickets restaurant, budget formation).
- La chance de façonner l’infrastructure data d’une solution qui révolutionne le recrutement en Afrique et au-delà.
Rejoignez ContextCollective.work et participez à la création d’une plateforme qui redéfinit le sourcing de talents grâce à l’intelligence artificielle !