Remote
Descripcion del puesto
Deel, leader mondial des solutions de gestion de la paie et des contrats pour les équipes distribuées, recherche un(e) Spécialiste Observabilité passionné(e) pour renforcer la fiabilité et la performance de sa plateforme SaaS cloud‑native. Vous intégrerez l’équipe SRE/DevOps et serez responsable de la conception, du déploiement et de l’évolution d’un écosystème d’observabilité complet, couvrant métriques, logs, traces et alertes, afin d’assurer une visibilité totale sur les services critiques et de garantir des niveaux de service (SLO) stricts.
**Missions principales**
- Concevoir et implémenter des architectures d’observabilité scalables sur Kubernetes (EKS) et AWS, en s’appuyant sur des solutions open‑source (Prometheus, Grafana, Loki, Jaeger) et services managés (CloudWatch, X‑Ray).
- Déployer et maintenir des stacks de monitoring auto‑hébergés, automatisés via Terraform, Ansible ou Helm, et les intégrer aux pipelines CI/CD (GitHub Actions, GitLab CI) pour des déploiements continus et sécurisés.
- Définir et suivre les indicateurs clés de performance (KPIs) et les SLO/SLA, mettre en place des alertes intelligentes (Alertmanager, PagerDuty) et des tableaux de bord opérationnels pour les équipes produit et support.
- Optimiser les coûts de monitoring en ajustant la granularité des métriques, la rétention des logs et la politique de sampling des traces, tout en garantissant la conformité aux exigences de sécurité et de confidentialité.
- Collaborer étroitement avec les équipes développeurs, produit et sécurité pour instaurer une culture d’observabilité dès la phase de conception (shift‑left) et favoriser le debugging rapide des incidents.
- Participer aux on‑calls d’astreinte, analyser les incidents, rédiger des post‑mortems détaillés et proposer des améliorations continues du système.
- Former et accompagner les équipes internes sur les bonnes pratiques d’observabilité, de monitoring et de gestion des incidents.
**Profil recherché**
Vous avez au moins 5 ans d’expérience dans la mise en place d’infrastructures d’observabilité pour des environnements cloud‑native à grande échelle. Vous maîtrisez Kubernetes (EKS, GKE ou AKS) et les services AWS (EC2, RDS, S3, CloudWatch, IAM). Vous êtes à l’aise avec les outils de collecte et de visualisation de données (Prometheus, Grafana, Loki, Jaeger, OpenTelemetry) et avez une solide expérience en infrastructure as code (Terraform, Helm, Ansible). Vous comprenez les concepts SRE, les SLO/SLA et les pratiques de gestion des incidents. Vous êtes autonome, curieux(se) et capable de travailler en équipe distribuée, avec d’excellentes compétences de communication en français et en anglais.
**Ce que nous offrons**
- Un environnement de travail 100 % remote avec des bureaux ponctuels à Casablanca pour les rencontres d’équipe.
- Un package salarial compétitif, des bonus basés sur la performance et des avantages sociaux (mutuelle, tickets restaurant, formation continue).
- Des opportunités de développement professionnel au sein d’une entreprise en forte croissance internationale.
- Une culture d’entreprise inclusive, axée sur l’innovation, la transparence et le bien‑être des collaborateurs.
Rejoignez Deel et contribuez à façonner l’avenir du travail à distance grâce à une plateforme fiable, sécurisée et ultra‑performante.