New
Job description
Andiamo, start‑up technologique en pleine croissance, recherche un(e) Ingénieur(e) Senior Fiabilité du Site (SRE) pour renforcer son équipe Platform. Vous intégrerez une équipe dynamique, orientée performance et innovation, dont la mission est de garantir la stabilité, l’évolutivité et la résilience de nos services cloud. Vous travaillerez en étroite collaboration avec les équipes de développement, de produit et d’opérations afin de concevoir, déployer et maintenir une infrastructure AWS robuste, automatisée et sécurisée.
**Vos principales missions**
- Concevoir, provisionner et gérer l’infrastructure AWS via Terraform (IaC) : clusters EKS, bases de données RDS, services serverless, réseaux VPC, etc. Vous assurerez la conformité aux meilleures pratiques de sécurité et d’optimisation des coûts.
- Piloter la conteneurisation des applications avec Docker et Kubernetes : création de chart Helm, définition de stratégies de scaling, mise en place de politiques de mise à jour sans interruption.
- Développer et améliorer les pipelines CI/CD (CircleCI, Jenkins, GitHub Actions) pour réduire les temps de cycle de build, test et déploiement, tout en garantissant la qualité et la traçabilité du code.
- Mettre en place des systèmes de monitoring, d’alerting et de logging (Prometheus, Grafana, ELK) afin de détecter proactivement les incidents et d’assurer un suivi post‑mortem rigoureux.
- Apporter un support de niveau 2/3 aux développeurs sur les environnements de développement, de pré‑production et de production : dépannage, optimisation des performances, résolution des problèmes de configuration.
- Promouvoir les pratiques DevOps et SRE au sein de l’organisation : formation, documentation, partage de connaissances et mise en place de SLO/SLA.
- Contribuer à l’innovation en explorant les usages de l’intelligence artificielle pour l’automatisation du monitoring, la prédiction d’incidents et l’optimisation des ressources cloud.
**Profil recherché**
- Minimum 10 ans d’expérience en tant que SRE ou dans un rôle similaire, avec un historique avéré de gestion de systèmes hautement disponibles et scalables.
- Maîtrise avancée de Terraform et de l’Infrastructure as Code sur AWS.
- Expertise confirmée en Docker et Kubernetes (EKS) : conception d’architectures conteneurisées, gestion du réseau et de la sécurité.
- Solides compétences en debugging et résolution d’incidents complexes dans des environnements multi‑cloud.
- Expérience pratique avec les outils CI/CD (CircleCI, Jenkins, GitHub Actions) et les pratiques de livraison continue.
- Passion pour l’IA et expérience concrète d’intégration d’outils d’IA ou de ML dans les processus d’opérations.
- Excellentes capacités de communication, esprit d’équipe et aptitude à travailler dans un contexte agile.
**Ce que nous offrons**
- Un environnement de travail hybride (3 jours en présentiel à Casablanca, 2 jours en remote) favorisant l’équilibre vie pro/vie perso.
- Un package salarial compétitif, complété par des bonus liés aux performances de l’infrastructure.
- Des opportunités de formation continue (certifications AWS, Kubernetes, Terraform, cours IA).
- Un accès à des outils de pointe et à une architecture cloud moderne.
- Une culture d’entreprise basée sur la transparence, l’innovation et la collaboration.
- Des espaces de travail modernes, des événements tech internes et des hackathons réguliers.
Rejoignez Andiamo et jouez un rôle clé dans la construction d’une plateforme cloud fiable, sécurisée et prête pour les défis de demain.