Jobs.ca
Jobs.ca
Language
OVHcloud logo

Site Reliability Engineer

OVHcloud4 days ago
Remote
Hybrid
Montréal, QC
Mid Level
Full-Time

Top Benefits

Hybrid remote work policy
Employee stock ownership plan
Tenure recognition program

About the role

CDI

IT, Technologie & Produit

MONTRÉAL (QUÉBEC), CA, H3A 2N4

NOTRE PARCOURS DE RECRUTEMENT

1. Échange avec notre recruteuse/recruteur:

2. Entretien avec la/le responsable d'équipe:

3. Cas pratique (si pertinent) 4. Rencontre avec un pair, un membre de l'équipe ou de la direction 5. Débriefing ensemble

NOS AVANTAGES ET BÉNÉFICES

✔︎ Une politique de télétravail hybride
✔︎ Un plan d'actionnariat salarié
✔︎ Un programme de reconnaissance de l'ancienneté
✔︎ Des subventions vacances et sport
✔︎ Berceau et crèche d'entreprise*(selon site)*

Mais aussi :
✔︎ Des équipes multiculturelles
✔︎ Des locaux bien équipés
✔︎ Une plateforme de formation et de certification en ligne
✔︎ Une offre d'accompagnement médical et social digitalisée pour vous et votre famille

REJOINDRE L’AVENTURE OVHCLOUD

OVHcloud valorise la diversité des personnes qu’elle embauche et accompagne.
La diversité pour nous, c’est favoriser un milieu de travail où les différences individuelles sont reconnues, appréciées et respectées de façon à développer le plein potentiel et les forces de chacune et chacun.
Soyez libre d’être vous-même !

L'IA DANS L'ADN

L'intelligence artificielle réinvente nos métiers au quotidien.
Rejoignez-nous pour explorer ses immenses possibilités et coconstruire l'avenir !

LE DÉVELOPPEMENT DURABLE CHEZ OVHCLOUD, UN ENGAGEMENT PROFOND

Vous voulez contribuer à des projets uniques pour construire ensemble un service infonuagique libre ? Allons-y !
Chez OVHcloud, nous sommes animés par la même volonté, celle de construire l’avenir ensemble pour défendre la liberté d’innover.

Ingénieur SRE / VMware

Au sein de votre équipe #OneTeam

L’équipe est responsable de l’exploitation, de la fiabilité et de l’amélioration continue des plateformes de virtualisation VMware ainsi que des solutions de sauvegarde associées.

Dans un environnement orienté SRE et opérations cloud, l’équipe assure la gestion des incidents, l’évolution des plateformes et la fiabilité des services pour les solutions existantes, récentes et futures.

Vous intégrerez une équipe responsable des produits :

  • Managed VMware vSphere

  • Public VCFaaS

  • Private VCFaaS

Votre rôle consistera à assurer la stabilité des plateformes, contribuer à l’amélioration continue des services et participer aux activités d’exploitation et d’automatisation.

Vos principales responsabilités

  • Assurer le suivi quotidien de l’incidentologie sur les produits VMware et les solutions de backup (Veeam)

  • Participer à la gestion et la résolution des incidents de niveau 3

  • Analyser les causes racines des incidents (RCA) et mettre en place les actions correctives nécessaires

  • Contribuer à l’amélioration du produit Managed VMware vSphere, notamment via le développement de correctifs et d’automatisations

  • Participer aux tâches de migration, de mise à jour et aux projets d’évolution des plateformes VMware

  • Développer et maintenir des scripts ou correctifs simples à intermédiaires afin de réduire la récurrence des incidents

  • Participer aux rotations d’astreinte afin d’assurer la continuité du service

  • Contribuer à l’automatisation et à l’amélioration des opérations via des outils CI/CD

  • Collaborer avec les équipes techniques dans un environnement Agile

  • Participer à l’amélioration continue des processus SRE et opérationnels

Votre impact futur

Dans les 6 mois

  • Autonomie opérationnelle : gérer de façon indépendante les incidents N3 sur vSphere et Public VCFaaS, incluant l'analyse de root cause et la production de post-mortems.

  • Début des rotations d'astreintes.

  • Développement : prendre en charge des correctifs de code de complexité simple à intermédiaire (Go / Perl) sans supervision systématique.

  • Documenter les problemes via jira et prendre en charge tout le cycle du jira de sa création a sa resolution.

  • Prompt engineering : appliquer des workflows IA efficaces en contexte SRE et partager ses pratiques avec l'équipe.

Dans 1 an

  • Autonomie : gérer la majorité des incidents N3 de façon indépendante sur l'ensemble du périmètre (vSphere, Public et Private VCFaaS, Veeam), tout en ayant accès à du soutien au besoin.

  • Efficacité et qualité : atteindre constamment les indicateurs clés de performance (KPI) liés à la fiabilité et à la satisfaction client.

  • Connaissance des produits : développer une connaissance approfondie de l'ensemble du portfolio Cloud VMware et contribuer activement aux projets d'amélioration du produit.

Compétences requises

  • Expérience dans un environnement d’exploitation ou SRE

  • Bonne compréhension des méthodologies SRE et des pratiques d’exploitation

  • Expérience avec les environnements de virtualisation VMware

  • Connaissance des solutions de backup Veeam

  • Compréhension des langages Go et Perl

  • Maîtrise des outils et pratiques CI/CD

  • Maîtrise du prompt engineering dans un contexte opérationnel :

  • rédaction de system prompts efficaces

  • structuration de conversations multi-tours

  • utilisation de techniques avancées (few-shot, chain-of-thought, self-consistency)

  • Capacité à analyser des incidents complexes et diagnostiquer les causes racines

  • Travail en équipe et expérience dans un environnement Agile

  • Capacité à évoluer dans un environnement d’incidentologie et de production

  • Bilinguisme est nécessaire afin de répondre à des demandes de soutien à l'international

Atouts

  • Expérience avec VMware Cloud Foundation (VCF) ou d’autres solutions de virtualisation

  • Expérience avec les technologies de sauvegarde Veeam

Informations complémentaires

  • Participation à une rotation d’astreinte afin d’assurer un service 24/7/365

xxx

About OVHcloud

Software Development
1001-5000

OVHcloud is a global player and the leading European cloud provider operating over 450,000 servers within 43 data centers across 4 continents to reach 1,6 million customers in over 140 countries. Spearheading a trusted cloud and pioneering a sustainable cloud with the best price-performance ratio, the Group has been leveraging for over 20 years an integrated model that guarantees total control of its value chain: from the design of its servers to the construction and management of its data centers, including the orchestration of its fiber-optic network. This unique approach enables OVHcloud to independently cover all the uses of its customers so they can seize the benefits of an environmentally conscious model with a frugal use of resources and a carbon footprint reaching the best ratios in the industry. OVHcloud now offers customers the latest-generation solutions combining performance, predictable pricing, and complete data sovereignty to support their unfettered growth.

Similar jobs you might like