Haldorix, un studio de startup, se consacre à transformer les défis opérationnels en opportunités business grâce à l'intelligence artificielle. En tant qu'MLOps Engineer – Edge AI Specialist, vous jouerez un rôle central dans la conception, le déploiement et la maintenance d'infrastructures d'intelligence artificielle en temps réel sur le terrain industriel.
Responsabilités principales :
- Architecture & Infrastructure : Concevoir une architecture edge/cloud hybride optimisée pour l'analyse vidéo en temps réel. Définir les spécifications matérielles (Jetson Orin, RTX A2000, Intel NUC) et assurer la communication fiable entre les serveurs edge et le cloud.
- Optimisation de modèles : Convertir et optimiser les modèles de deep learning pour les GPU embarqués en utilisant ONNX Runtime et TensorRT. Appliquer la quantification (INT8, FP16) et les techniques de pruning pour réduire la latence et la mémoire.
- Pipeline MLOps : Construire et maintenir une pipeline CI/CD adaptée au déploiement edge, incluant la conteneurisation des modèles, le contrôle de version, les mises à jour OTA automatisées et la surveillance proactive des performances.
- Orchestration & Déploiement : Déployer et gérer des flotte de serveurs edge via K3s/MicroK8s. Implémenter des déploiements déclaratifs (ArgoCD/Flux) et une gestion centralisée via KubeEdge ou AWS IoT Greengrass.
- Sécurité & Conformité : Garantir la localisation des données, le chiffrement de bout en bout (TLS/mTLS) et les pipelines d'anonymisation pour la conformité GDPR.
- Surveillance & Fiabilité : Mettre en place des tableaux de bord complets (Prometheus, Grafana, Loki) pour suivre les performances d'inférence, l'utilisation GPU et la disponibilité (>99%).
- Intégration LLM : Soutenir le déploiement d'un serveur LLM centralisé (Claude, GPT‑4 ou open‑source) alimentant des interfaces RAG et conversationnelles en temps réel.
- Opérations sur le terrain : Réaliser des installations sur site, des validations et des sessions de dépannage avec les équipes clients. Former les techniciens locaux et maintenir une documentation à jour pour la reproductibilité et l'évolutivité.
Profil recherché :
- 3 à 5 ans d'expérience dans le déploiement de modèles IA en production.
- Expertise avérée en MLOps, edge computing et environnements GPU embarqués.
- Maîtrise de TensorRT, ONNX Runtime, quantification (INT8/FP16) et pruning.
- Compétence en Python (PyTorch, TensorFlow, FastAPI) et outils DevOps (Docker, CI/CD, Ansible).
- Solide compréhension de Kubernetes/K3s, réseaux et administration Linux.
- Expérience avec Prometheus, Grafana et profilage GPU.
- Excellentes compétences en documentation et dépannage.
Compétences supplémentaires appréciées :
- Connaissance des plateformes NVIDIA Jetson et autres matériels AI embarqués.
- Expérience avec les systèmes de gestion de flotte (AWS IoT Greengrass, KubeEdge, Balena).
- Connaissance des pipelines Stable Diffusion et LLM (RAG, Pinecone, Weaviate, ChromaDB).
- Expérience en vision industrielle, IoT ou systèmes temps réel.
- Compréhension de la conformité GDPR et de l'anonymisation des données pour les systèmes IA on‑prem.
Avantages :
- Intégrer un studio de startup en pleine croissance, travaillant sur des projets IA industriels de pointe.
- Opportunité de travailler sur des solutions edge qui transforment la production industrielle.
- Collaboration avec des équipes multidisciplinaires et possibilité de formation continue.
- Rémunération compétitive (18 000 à 25 000 MAD par mois) et contrat CDI.
- Environnement hybride (Casablanca) favorisant l'équilibre travail‑vie personnelle.
Processus de recrutement :
- Entretien technique approfondi axé sur MLOps et edge AI.
- Étude de cas pratique sur la pipeline CI/CD et l'optimisation de modèles.
- Évaluation de la capacité à déployer et surveiller des systèmes edge en production.
Ce poste offre une occasion unique de contribuer à la transformation numérique de l'industrie marocaine tout en développant vos compétences techniques dans un environnement stimulant et innovant.