ScalewayPublished about 15 hours
Logo Scaleway

Site Reliability Engineer (SRE) - Storage

Here's the job offer description formatted in Markdown, following your specifications:

🌟 NOTRE ADN 🌟

🌍 Rejoignez Scaleway pour construire le Cloud souverain européen !

Fondée en 1999, Scaleway est la filiale cloud du groupe Iliad, l’un des leaders européens des télécommunications. Notre mission ? Mettre en œuvre une industrie numérique plus responsable en aidant les développeurs et les entreprises à créer, déployer et adapter leurs applications sur n’importe quelle infrastructure.

📍 Basés à Paris, Lille, Toulouse, Bordeaux et Lyon, nous concevons et exploitons un écosystème cloud souverain utilisé quotidiennement par nos propres équipes et adopté par 25 000 clients (Photoroom, Mistral, H, Ministère de l'éducation nationale, Paris 8 Universités, Dysflexis, Lacroix, Little Big Connection, Mon Petit Placement, Radio France, Hachette Livres) pour :

✅ Une expérience fluide et intuitive
✅ Une redondance multi-AZ garantissant haute disponibilité et résilience
✅ Des datacenters neutres en carbone
✅ Des outils natifs pour architectures multi-cloud

Nos solutions couvrent tous les besoins, du bare metal à la conteneurisation en passant par les architectures serverless, offrant une alternative européenne performante pour tous types de clients et use cases.

🚀 Rejoignez une équipe de près de 600 passionnés, issus d’horizons variés, dans un environnement technologique, innovant et collaboratif !


🛠️ LE POSTE 🛠️

En tant que Site Reliability Engineer (SRE), vous jouerez un rôle clé pour assurer la robustesse et la performance de nos services.

Rattaché(e) à un Lead SRE (Engineering Manager), vous contribuerez à :

  • Améliorer en continu la fiabilité et l’évolutivité de nos plateformes.
  • Automatiser l’infrastructure pour optimiser les déploiements et réduire l’intervention humaine.
  • Collaborer avec les équipes Dev, Produit et Ops pour garantir des services performants et résilients.

Vous intégrerez également la SRE Guild, un collectif dédié aux meilleures pratiques et à l’innovation technique.


⚙️ Vos missions ⚙️

Automatisation & Outils

  • Développer des outils et frameworks pour fluidifier les déploiements et la gestion des infrastructures.
  • Automatiser les tâches répétitives pour améliorer l’efficacité et la fiabilité.

Monitoring & Alerting

  • Mettre en place des indicateurs clés (SLO, KPI) pour suivre la performance des services.
  • Optimiser les systèmes de monitoring et alerting afin de minimiser la fatigue d’alerte.

Gestion des incidents

  • Identifier, diagnostiquer et résoudre rapidement les incidents en production.
  • Analyser les causes profondes et implémenter des mesures préventives.

Ingénierie de la fiabilité

  • Appliquer les meilleures pratiques (tolérance aux pannes, load balancing, redondance) pour renforcer la résilience des systèmes.
  • Optimiser l’utilisation des ressources pour réduire la consommation énergétique et améliorer les performances.

Collaboration & Partage

  • Travailler en synergie avec les équipes Dev & Produit pour intégrer la fiabilité dès la conception.
  • Participer aux revues d’architecture et partager les bonnes pratiques SRE.

💻 VOTRE PROFIL 💻

Stack Technique

Langages : Python, Go, Rust
Infra & DevOps : GitLab, Linux, Kubernetes, Container images
Base de données : PostgreSQL
Monitoring : OpenMetrics, OpenTelemetry
Stockage : S3, CephFS, ZFS


🎓 Profil recherché 🎓

Indispensable

  • Expérience en Infrastructure as Code (IaC) et CI/CD.
  • Maîtrise des outils de monitoring et logging.
  • Bonne connaissance des systèmes Linux et du troubleshooting en production.
  • Capacité à travailler en anglais et en équipe.

Un plus

  • Expérience en développement (Go, Rust).
  • Sens du developer experience et appétence pour le coaching.
  • Expérience en stockage distribué (S3, CephFS, ZFS).

📜 LES COULISSES 📜

📝 Le process de recrutement 📝

Call de découverte avec un recruteur (30 min)
Entretien (1h) – Échange avec le Head of SRE sur vos compétences techniques et votre approche du rôle
Entretien avec les managers (1h) – En visio ou en présentiel pour approfondir votre expérience et votre fit avec l’équipe
Entretien RH & visite – Rencontre avec l’équipe RH, découverte de nos locaux et moment d’échange avec vos futurs collègues


🚀 Pourquoi rejoindre Scaleway ? 🚀

✔ Une scale-up française ambitieuse, soutenue par un grand groupe.
✔ Un environnement technique de pointe avec des défis passionnants.
✔ Une culture de l’innovation et du partage, où l’expertise et la créativité s’expriment pleinement.
✔ Un engagement fort pour un cloud plus responsable, avec des datacenters éco-conçus.

Prêt(e) à relever le défi ? Rejoignez-nous dès maintenant !

Si vous ne vous voyez pas cocher toutes les cases, n'hésitez pas à postuler tout de même. Ne vous limitez pas à une description de poste - on ne sait jamais !

🌐 Scaleway | Scaleway Blog | Scaleway sur X

Reference :scaleway-lever+Scaleway-Site-Reliability-Engineer-SRE-Storage

Skills

Backend
Go
Rust
Python
Soft skills
English
Tooling
Gitlab
Ops
Kubernetes
Data
PostgreSQL
Cloud
Serverless

Similar Jobs

brand cover
consultant.e cloud & devops lille
HoppRPermanent contract
HoppRPermanent contract
Lille, FR
& Remote
Hybrid remote
≥ 3 years experience
41k€ ➞ 60k€/year
Python
Kubernetes
Docker
6 days ago
brand cover
site reliability engineer - sre
ScalewayPermanent contract
ScalewayPermanent contract
Lille, FR& 4 others
No remote work
Juniors accepted
Python
Ansible
Bash
14 hours ago
brand cover
tech lead – developer tools (devtools)
ScalewayPermanent contract
ScalewayPermanent contract
Lille, FR& 6 others
& Remote
Hybrid remote
≥ 5 years experience
Terraform
Github
Gitlab
14 hours ago
brand cover
software engineer - serverless compute
ScalewayPermanent contract
ScalewayPermanent contract
Rouen, FR& 6 others
& Remote
Hybrid remote
≥ 5 years experience
Serverless
Gitlab
Go
14 hours ago
brand cover
development manager f/h
ValiuzPermanent contract
ValiuzPermanent contract
Lille, FR
& Remote
Hybrid remote
Juniors accepted
Project Management
Go
Machine Learning
2 days ago
brand cover
product manager nosql databases
ScalewayPermanent contract
ScalewayPermanent contract
Bordeaux, FR& 6 others
& Remote
Hybrid remote
Juniors accepted
NoSQL
Database
Management
3 days ago
brand cover
développeur(euse) java expérimenté(e)
SFEIRPermanent contract
SFEIRPermanent contract
Lille, FR
& Remote
Hybrid remote
Juniors accepted
48k€ ➞ 48k€/year
Java
Management
Claude Code
5 days ago
brand cover
genai engineer - lille
SFEIRPermanent contract
SFEIRPermanent contract
Lille, FR
& Remote
Hybrid remote
Juniors accepted
Google Cloud
Management
Claude Code
5 days ago
brand cover
développeur(euse) java confirmé(e)
SFEIRPermanent contract
SFEIRPermanent contract
Lille, FR
& Remote
Hybrid remote
≥ 3 years experience
Java
Google Cloud
Quarkus
5 days ago