CODE
CODE
Styles personnalisés Hubspot

Ingénieur en fiabilité des systèmes

  • Temps plein

  • Bureau à Montréal

  • Modèle de travail hybride

Postulez maintenant

Lieu : Montréal, QC (hybride)

Type de contrat : Temps plein

Relève de : Ingénieur logiciel

Version française ci-dessous

À propos d'Optable

Optable est une plateforme canadienne financée par du capital-risque qui aide les éditeurs, les annonceurs et les entreprises du secteur des médias à gérer l'identité et les audiences à l'ère de la protection de la vie privée. Récemment récompensés par le prix Deloitte Technology Fast 50 dans la catégorie « Enterprise Industry Leaders », nous construisons un avenir où des agents IA automatiseront les flux de travail complexes de la publicité numérique. Nous sommes une start-up en pleine croissance qui privilégie l'exécution, l'innovation et une politique « zéro intolérance envers les comportements inappropriés ».

Le rôle

Nous recrutons notre premier ingénieur en fiabilité des sites (SRE) afin d'améliorer nos processus de déploiement et d'exploitation des logiciels en production. Vous travaillerez en étroite collaboration avec les équipes d'ingénierie et d'infrastructure cloud pour accélérer les déploiements, réduire les frictions liées aux mises à jour et rehausser nos normes en matière d'observabilité et de fiabilité. Il s'agit d'un poste d'ingénierie : vous développerez en Go pour la production et mettrez en place des automatisations qui rendront les mises à jour plus sûres et plus reproductibles.

Pourquoi ce poste est différent

Optable développe des produits basés sur l'IA, que nous utilisons en interne. Votre rôle sera essentiel pour garantir l'évolutivité et la sécurité de notre infrastructure technologique.

La plupart des entreprises ont du retard en matière d'IA. Celle-ci vous place à la pointe de l'innovation. Vous acquerrez une compréhension approfondie de la manière dont l'automatisation autonome transforme les entreprises et jouerez un rôle actif dans son développement.

Principales responsabilités

  • Contribuez à notre base de code Go, gRPC et protobuf
  • Améliorer et automatiser notre processus de déploiement et de mise en production (Kubernetes/Helm + CI/CD)
  • Mettre en place une validation automatisée des versions (indicateurs, tableaux de bord, alertes) afin de faciliter des déploiements canary et des promotions plus sûrs
  • Renforcer l'observabilité à l'échelle des services (métriques, traçabilité, profilage) et améliorer la qualité des alertes ainsi que le rapport signal/bruit
  • Collaborer avec les équipes sur les pratiques en matière de fiabilité (guides opérationnels, amélioration de la gestion des incidents, analyses rétrospectives) et les meilleures pratiques opérationnelles

Qualifications requises

  • Au moins 3 ans d'expérience pertinente en ingénierie (SRE, plateformes, infrastructure/logiciels ou backend, avec une forte implication dans les opérations)
  • Solide expérience de Golang en environnement de production
  • Expérience pratique de Kubernetes et Helm
  • Expérience avec Terraform (ou un outil d'infrastructure en tant que code équivalent) et les workflows CI/CD modernes
  • Connaissance des infrastructures cloud (de préférence GCP)
  • De solides compétences en communication, une grande autonomie et la capacité à mener des initiatives d'amélioration impliquant plusieurs équipes.

Qualifications préférées

  • Expérience en matière de surveillance de type Grafana/Prometheus, d'OpenTelemetry, de traçage, de profilage et de conception pratique d'alertes
  • Expérience dans la mise en œuvre de modèles de déploiement progressif (canary/blue-green) et de retour en arrière
  • Expérience dans la gestion des incidents et les procédures d'astreinte
  • Expérience avec Claude Code

Pourquoi Optable ?

  • Rémunération compétitive et plan d'actionnariat
  • Couverture d'assurance maladie complète
  • Modèle de travail hybride
  • Développement professionnel par le mentorat et l'accompagnement de carrière
  • Expérience pratique de l'IA agentique
  • Une petite équipe de direction, peu de bureaucratie, une politique anti-conflits
  • Déjeuners quotidiens au bureau

Ingénieur(e) en fiabilité des sites (SRE)
Lieu : Montréal, QC (mode de travail hybride)
Type de poste : Temps plein
Relève de : Ingénieur logiciel senior

À propos d’Optable

Optable est une plateforme canadienne soutenue par d’importants investisseurs qui aide les éditeurs, les annonceurs et les entreprises médiatiques à gérer les identités et les audiences à l’ère de la protection de la vie privée. Récemment récompensée par le prix Deloitte Technology Fast 50 dans la catégorie « Enterprise Industry Leaders », nous construisons un avenir où des agents d’IA automatisent les flux de travail complexes de la publicité numérique. Nous sommes une start-up en forte croissance qui valorise l’exécution, l’innovation et une politique « zéro crétin ».

Le rôle

Nous recrutons notre premier ingénieur(e) en fiabilité des sites (SRE) afin d’améliorer la manière dont nous déployons et exploitons nos logiciels en production. Vous travaillerez en étroite collaboration avec les équipes d’ingénierie et d’infrastructure cloud afin d’accélérer les déploiements, de réduire les frictions liées aux mises en production et d’améliorer nos normes en matière d’observabilité et de fiabilité.

Il s'agit d'un poste de développeur : vous écrirez du code Go en production et mettrez au point des automatisations visant à rendre les déploiements plus sûrs et reproductibles.

Pourquoi ce poste est différent

Optable développe des produits d'IA, que nous utilisons également en interne. Vous jouerez un rôle clé dans la maintenance d'une infrastructure technologique évolutive et sécurisée.

La plupart des organisations ont du retard en matière d’IA. Ce programme vous place à l’avant-garde. Vous acquerrez une compréhension approfondie de la transformation des organisations grâce à l’automatisation agentique et jouerez un rôle actif dans son évolution.

Principales responsabilités

  • Contribuer à notre base de code en Go, gRPC et protobuf
  • Améliorer et automatiser nos processus de déploiement et de mise en production (Kubernetes/Helm + CI/CD)
  • Mettre en place des validations automatiques des versions (indicateurs, tableaux de bord, alertes) afin de sécuriser les déploiements progressifs (canary) et les mises en production
  • Renforcer l'observabilité des services (indicateurs, traçabilité, profilage) et améliorer la qualité des alertes
  • Collaborer avec les équipes sur les procédures de fiabilité (guides opérationnels, gestion des incidents, analyses rétrospectives) et les meilleures pratiques opérationnelles

Compétences requises

  • Au moins 3 ans d'expérience pertinente en ingénierie (SRE, plateforme, infrastructure/logiciel ou backend avec des responsabilités opérationnelles importantes)
  • Solide expérience en Go (Golang) en environnement de production
  • Expérience pratique avec Kubernetes et Helm
  • Expérience avec Terraform (ou un outil IaC équivalent) et des workflows CI/CD modernes
  • Connaissance des infrastructures cloud (de préférence GCP)
  • Excellentes compétences en communication, autonomie et capacité à mettre en œuvre des améliorations au sein des différentes équipes

Compétences requises

  • Expérience avec Grafana/Prometheus, OpenTelemetry, le traçage, le profilage et la conception d’alertes efficaces
  • Expérience avec les stratégies de déploiement progressif (canary, blue-green) et les mécanismes de retour en arrière
  • Expérience en gestion des incidents et en astreinte
  • Expérience avec Claude Code

Pourquoi Optable

  • Salaire compétitif et participation au capital
  • Assurance maladie complète
  • Mode de travail hybride
  • Développement professionnel (mentorat et accompagnement de carrière)
  • Expérience pratique avec l'IA agentique
  • Une petite équipe expérimentée, peu de formalités administratives, une politique « zéro crétin »
  • Déjeuners quotidiens offerts au bureau

Postulez maintenant

Merci de nous avoir contactés
Oups ! Quelque chose s'est mal passé lors de l'envoi du formulaire.