Nuevo
Descripcion del puesto
Webot Singapore, start‑up technologique en pleine expansion, recherche un(e) Ingénieur Fiabilité Site (SRE) senior pour rejoindre son équipe dynamique basée à Singapour. Vous serez le pilier de la stabilité et de la performance de nos services numériques, en assurant la disponibilité, la scalabilité et la sécurité de notre infrastructure multi‑région AWS.
**Vos missions principales**
- Concevoir, déployer et maintenir l’infrastructure cloud (AWS) en utilisant l’Infrastructure as Code (Terraform, CloudFormation) et garantir son organisation, sa sécurité et son évolutivité.
- Gérer les clusters Kubernetes (EKS) : planifier les mises à jour, automatiser les opérations quotidiennes et optimiser les ressources afin d’assurer une continuité de service sans interruption.
- Orchestrer les pipelines CI/CD avec Tekton et ArgoCD, mettre en place un workflow GitOps robuste, rédiger et maintenir les chartes Helm pour chaque micro‑service.
- Administrer la connectivité globale via CloudFront et Cloudflare, optimiser les performances réseau et assurer la résilience face aux pannes.
- Piloter la gestion des bases de données (RDS, DynamoDB, Redis) : planification de capacité, mise à jour de version, sauvegarde et restauration, tout en garantissant la conformité aux exigences de sécurité.
- Développer et enrichir l’observabilité du système avec Prometheus, Grafana et PagerDuty : création de dashboards, alerting, suivi des SLO/SLA et mise en place de runbooks.
- Répondre aux alertes, diagnostiquer les incidents, conduire les résolutions en temps réel et rédiger des post‑mortems détaillés pour identifier les causes profondes et proposer des actions correctives.
- Documenter les procédures, partager les bonnes pratiques avec les équipes de développement et former les nouveaux membres aux outils et processus SRE.
- Participer activement aux revues d’architecture, aux séances de planification de capacité et aux projets d’innovation visant à automatiser davantage les processus opérationnels.
**Profil recherché**
- Minimum 5 ans d’expérience en ingénierie de fiabilité ou DevOps, avec une expertise avérée sur AWS et Kubernetes (EKS).
- Maîtrise des outils d’IaC (Terraform, CloudFormation) et des pipelines GitOps (ArgoCD, Tekton, Helm).
- Solides compétences en scripting (Python, Bash) et en automatisation des tâches opérationnelles.
- Expérience confirmée en gestion de bases de données cloud (RDS, DynamoDB, Redis) et en optimisation de la performance réseau (CloudFront, Cloudflare).
- Connaissance approfondie des systèmes de monitoring et d’alerting (Prometheus, Grafana, PagerDuty) ainsi que des pratiques d’incident management et de rédaction de post‑mortems.
- Capacité à travailler sous pression, à prioriser les incidents critiques et à communiquer clairement avec les parties prenantes.
- Esprit d’équipe, curiosité technique et volonté d’apprendre continuellement les nouvelles technologies.
**Ce que nous offrons**
- Un environnement de travail stimulant où l’innovation et l’automatisation sont au cœur des projets.
- Un package salarial compétitif, des avantages sociaux complets et des possibilités de formation continue.
- Un mode de travail hybride : bureaux modernes à Singapour et flexibilité de télétravail.
- Une culture d’entreprise basée sur la confiance, la transparence et la reconnaissance des performances.
Rejoignez Webot Singapore et contribuez à façonner l’infrastructure de demain, tout en évoluant dans une équipe passionnée et engagée.