Le projet consiste à concevoir, développer et maintenir une plateforme backend évolutive et performante pour des solutions d’Intelligence Artificielle (IA) basées sur Google Cloud Platform (GCP). Vous serez responsable de la création d’API RESTful sécurisées, de la gestion de l’infrastructure cloud, de l’intégration de modèles LLM (Large Language Models) et de la mise en place d’une architecture d’orchestration robuste. Vous travaillerez en étroite collaboration avec les équipes produit, les data scientists et les clients pour garantir la qualité, la scalabilité et la performance des services.
Responsabilités principales :
- Concevoir et développer des API backend en Python, en utilisant FastAPI pour garantir une performance optimale et une documentation Swagger intégrée.
- Déployer et gérer des services cloud sur GCP, notamment Cloud Run, Cloud Build, Cloud Functions et Vertex AI, afin de créer une architecture serverless et scalable.
- Intégrer des bases de données NoSQL (Firestore) et en mémoire (Redis) pour stocker et récupérer les données de manière efficace.
- Mettre en place des pipelines CI/CD sur GitHub Actions pour automatiser les tests, la construction et le déploiement continu.
- Assurer la sécurité et la conformité des applications en appliquant les meilleures pratiques de sécurité cloud, y compris la gestion des identités, le chiffrement des données et la surveillance des logs.
- Collaborer avec les data scientists pour intégrer des modèles LLM, développer des pipelines de prompt engineering et orchestrer les flux de données entre les services cloud.
- Surveiller les performances et la santé des services à l’aide de Cloud Logging et Cloud Monitoring, et mettre en place des alertes pour garantir la disponibilité.
- Documenter les API, les processus de déploiement et les bonnes pratiques pour faciliter la maintenance et la montée en charge.
Compétences techniques requises :
- Maîtrise de Python et de FastAPI pour le développement d’API performantes.
- Expérience approfondie avec Google Cloud Platform (GCP) et ses services (Cloud Run, Cloud Build, Cloud Functions, Vertex AI, Firestore).
- Connaissance des bases de données NoSQL (Firestore) et en mémoire (Redis).
- Compétences en conteneurisation avec Docker et en automatisation CI/CD via GitHub Actions.
- Expérience avec l’intégration de modèles LLM, le prompt engineering et l’orchestration de flux de données.
- Maîtrise des outils de surveillance cloud (Cloud Logging, Cloud Monitoring) et de la gestion des logs.
- Connaissance de SQLAlchemy et Pydantic pour la gestion des modèles de données.
Environnement de travail :
- Contrat freelance à temps plein.
- Lieu de travail : Paris (présentiel).
- Collaboration étroite avec les équipes de Novancy et les clients pour assurer la livraison de solutions IA de haute qualité.
Profil recherché :
- Expérience avérée en développement backend et en déploiement d’applications cloud sur GCP.
- Capacité à travailler de manière autonome tout en collaborant efficacement avec des équipes multidisciplinaires.
- Bonne compréhension des principes d’architecture cloud, de la sécurité et de la scalabilité.
- Excellentes compétences en communication et en documentation technique.
Ce poste offre l’opportunité de travailler sur des projets d’envergure dans le domaine de l’IA et du cloud computing, tout en bénéficiant d’une flexibilité de travail en freelance. Si vous êtes passionné par le développement backend, le cloud et l’IA, et que vous souhaitez contribuer à des solutions innovantes à Paris, nous vous invitons à postuler dès maintenant.