Recherche par mots clé
Recherche
    Laissez les employeurs vous trouver
    Home
    >
    MAROC
    >
    Haldorix
    >
    MLOps Engineer – Edge AI Specialist
    MLOps Engineer – Edge AI Specialist
    07/12/2025 par Haldorix
    Casablanca
    18000 - 25000 DH
    Hybride

    Haldorix est un studio de startups qui transforme les défis opérationnels terrain en opportunités business grâce à la technologie. Nous identifions des problématiques récurrentes dans l'industrie, le retail ou la logistique, et nous créons des solutions dédiées qui deviennent des produits à part entière. Chaque venture naît d'un besoin terrain validé et vise une création de valeur mesurable.

    Nous sommes actuellement à la recherche d’un MLOps Engineer – Edge AI Specialist pour rejoindre notre équipe à Casablanca. Vous serez responsable de la conception, du déploiement et de la maintenance d’une architecture hybride edge/cloud qui permet d’exécuter des modèles de vision par ordinateur et de génération de texte directement sur le terrain, tout en conservant une synchronisation fluide avec le cloud.

    Responsabilités principales

    • Architecture & Infrastructure: Concevoir et déployer une architecture edge/cloud optimisée pour l’analyse vidéo en temps réel. Définir les spécifications matérielles (Jetson Orin, RTX A2000, Intel NUC) et assurer la communication fiable entre les serveurs edge et le cloud.
    • Optimisation de modèles: Convertir et optimiser les modèles de deep learning (YOLOv8, Stable Diffusion, BERT) pour les GPU embarqués en utilisant ONNX Runtime, TensorRT, quantification (INT8, FP16) et pruning afin de réduire la latence et la mémoire.
    • Pipeline MLOps: Construire et maintenir un pipeline CI/CD adapté au déploiement edge, incluant la conteneurisation des modèles, le contrôle de version, les mises à jour OTA automatisées et la surveillance proactive.
    • Orchestration & Déploiement: Déployer et gérer des flotte de serveurs edge via K3s/MicroK8s, implémenter des déploiements déclaratifs (ArgoCD/Flux) et une gestion centralisée via KubeEdge ou AWS IoT Greengrass.
    • Sécurité & Conformité: Garantir la localisation des données, le chiffrement de bout en bout (TLS/mTLS) et les pipelines d’anonymisation pour la conformité GDPR.
    • Surveillance & Fiabilité: Mettre en place des tableaux de bord Prometheus, Grafana et Loki pour suivre les performances d’inférence, l’utilisation GPU et la disponibilité (>99%).
    • Intégration LLM: Supporter le déploiement d’un serveur LLM centralisé (Claude, GPT‑4 ou open‑source) pour les analyses RAG et les interfaces conversationnelles en temps réel.
    • Opérations sur le terrain: Installer, valider et dépanner sur site, former les techniciens locaux et maintenir une documentation à jour pour la reproductibilité et l’évolutivité.

    Profil recherché

    • 3 à 5 ans d’expérience dans le déploiement de modèles AI en production.
    • Maîtrise de MLOps, edge computing et environnements GPU embarqués.
    • Expérience avérée avec TensorRT, ONNX Runtime, quantification (INT8/FP16) et pruning.
    • Compétence en Python (PyTorch, TensorFlow, FastAPI) et outils DevOps (Docker, CI/CD, Ansible).
    • Bonne connaissance de Kubernetes/K3s, réseaux et administration Linux.
    • Expérience avec Prometheus, Grafana et profilage GPU.
    • Excellentes compétences en documentation et dépannage.
    • Connaissance de NVIDIA Jetson, Fleet Management Systems (AWS IoT Greengrass, KubeEdge, Balena).
    • Compréhension de Stable Diffusion, pipelines LLM (RAG, Pinecone, Weaviate, ChromaDB).
    • Expérience en vision industrielle, IoT ou systèmes temps réel.
    • Connaissance de la conformité GDPR et anonymisation de données sur site.

    Avantages

    • Intégrer un studio de startups qui évolue de prototypes à production.
    • Travailler sur des systèmes Edge AI de pointe déployés dans des sites industriels.
    • Collaborer avec une équipe agile mêlant AI, hardware et DevOps.
    • Acquérir une expérience pratique en optimisation d’inférence, benchmarking GPU et orchestration à grande échelle.
    • Contribuer à des gains de coût et de performance concrets dans la fabrication AI.

    Processus de recrutement

    1. Entretien AI Jobzyn (25–45 min).
    2. Entretien technique (1h) avec le Lead Developer ou Technical Architect.
    3. Test pratique (2–3h) simulant un cas de déploiement MLOps réel.
    4. Entretien final avec l’équipe NITRA et les partenaires Haldorix.

    Si vous êtes passionné par l’Edge AI, la production de modèles et l’optimisation GPU, envoyez votre candidature dès maintenant. Rejoignez une équipe qui transforme l’industrie grâce à l’intelligence artificielle.

    Offres d'emplois connexes
    Recherches populaires