جديد
وصف الوظيفة
Joveo, leader européen de la publicité de recrutement propulsée par l’intelligence artificielle, recherche un(e) Ingénieur(e) RAG (Retrieval Augmented Generation) pour renforcer son offre de solutions basées sur les grands modèles de langage (LLM). Vous intégrerez une équipe produit innovante, en charge de la conception, du déploiement et de l’optimisation de pipelines de récupération d’information qui ancrent les réponses générées par les LLM dans des sources de données réelles, fiables et vérifiables.
**Missions principales**
- Concevoir et implémenter des pipelines de récupération end‑to‑end : segmentation des documents, génération d’embeddings, indexation, recherche vectorielle et filtrage par métadonnées.
- Sélectionner, configurer et optimiser des bases de vecteurs (Pinecone, Weaviate, pgvector, Qdrant) afin d’assurer un rappel élevé, une latence minimale et un coût maîtrisé en production.
- Développer des stratégies de récupération hybride combinant recherche sémantique et filtres structurés pour répondre aux exigences de précision et de conformité des clients.
- Orchestrer les prompts LLM (OpenAI, Anthropic, modèles open‑source) et assembler le contexte pertinent afin d’alimenter les modèles avec les informations les plus pertinentes.
- Mettre en place des cadres d’évaluation (RAGAS, métriques de précision, détection d’hallucinations) pour mesurer la qualité de la récupération et l’ancrage des réponses.
- Piloter le monitoring en temps réel des systèmes RAG en production, analyser les signaux d’utilisation et itérer continuellement les modèles et les pipelines.
- Collaborer étroitement avec les équipes produit, data science et engineering pour aligner les exigences fonctionnelles avec les contraintes techniques.
**Profil recherché**
Vous justifiez d’une expérience pratique de 3 à 5 ans sur des systèmes RAG en production, idéalement dans un contexte SaaS ou de plateforme IA. Vous maîtrisez les concepts d’embeddings, les architectures de recherche vectorielle et les techniques d’optimisation de la latence à grande échelle. Vous avez une solide expertise en Python et êtes à l’aise avec les frameworks d’orchestration LLM tels que LangChain, LlamaIndex ou DSPy. Vous avez déjà intégré des API LLM modernes (OpenAI, Anthropic, modèles open‑source) et vous êtes familier des bonnes pratiques d’évaluation de la récupération d’information et de la prévention des hallucinations. Votre approche est analytique, vous savez diagnostiquer les problèmes de qualité par des expérimentations systématiques et proposer des solutions pragmatiques.
**Ce que nous offrons**
- Un environnement de travail stimulant au sein d’une start‑up en forte croissance, avec des équipes multidisciplinaires et une culture d’innovation.
- Un poste en CDI, hybride (2 jours de présence au bureau, 3 jours de télétravail) basé à Casablanca.
- Un package salarial compétitif, des avantages sociaux et des opportunités de formation continue sur les technologies IA de pointe.
- La possibilité de contribuer à des projets à fort impact, qui transforment la façon dont les entreprises recrutent grâce à l’IA.
Rejoignez Joveo et participez à la construction de la prochaine génération de solutions de recrutement intelligentes, où la précision des données rencontre la puissance des modèles de langage.