Descrição
A Randstad Digital está a recrutar um Site Reliability Engineer para integração direta num cliente em Lisboa.Regime de trabalho Híbrido.
Conceber, implementar e monitorizar Indicadores de Nível de Serviço (Service Level Indicators - SLIs) e Objetivos de Nível de Serviço (Service Level Objectives - SLOs) para os nossos serviços de produção.Escrever código e scripts (por exemplo, Python, Go, Bash) para automatizar tarefas operacionais, o provisionamento do sistema e a remediação de incidentes.Atuar como um interveniente chave na resposta a incidentes de produção.Participar num regime de prevenção (on-call rotation) 24/7, liderar os esforços de diagnóstico (troubleshooting) e conduzir os incidentes até à resolução.Liderar e participar em análises pós-incidente "sem culpas" para identificar as causas raiz e implementar ações corretivas duradouras.Colaborar com as equipas de desenvolvimento para conceber, construir e implementar sistemas escaláveis, altamente disponíveis e tolerantes a falhas.Construir e manter soluções abrangentes de monitorização e registo (logging) (por exemplo, Prometheus, Grafana, ELK Stack, Datadog) para detetar e diagnosticar problemas de forma proativa.Monitorizar o desempenho e a utilização do sistema, prever a procura e planear as necessidades futuras de capacidade.Identificar e eliminar o trabalho operacional manual e repetitivo através da criação de soluções automatizadas e duradoura.
Licenciatura em engenharia informática, ciências da computação ou área similar.+ 5 anos de experiência em Engenharia de Fiabilidade de Sistemas (Site Reliability Engineering), engenharia de software ou administração de sistemas em grande escala.Forte experiência com plataformas cloud (AWS, Azure).Proficiência com ferramentas de Infraestrutura como Código (IaC) (por exemplo, Terraform, Ansible, CloudFormation).Experiência prática com ferramentas CI/CD (por exemplo, Jenkins, GitLab CI, GitHub Actions).Sólido entendimento de tecnologias de contentorização (Docker) e sistemas de orquestração (Kubernetes).Experiência com sistemas de controlo de versões, particularmente Git.Familiaridade com ferramentas de monitorização e logging (registo) (por exemplo, Prometheus, Grafana, ELK Stack).Uma abordagem sistemática e baseada em dados para a resolução de problemas e diagnóstico (troubleshooting).Experiência com regimes de prevenção (on-call rotations) e gestão de incidentes.
Meteorologia no dia de início
sexta-feira, 26 de dezembro — Parcialmente nublado · Máx 12° · Mín 6° · Chuva 15% (0mm) · Vento 7 km/h
Previsão para os dias seguintes
-
sáb, 27 dezAguaceirosMáx 11° · Mín 6°
-
dom, 28 dezParcialmente nubladoMáx 14° · Mín 9°
-
seg, 29 dezParcialmente nubladoMáx 14° · Mín 9°
-
ter, 30 dez—Máx 13° · Mín 8°
Detalhes
- Tipo de listagem
- Oferta de emprego
- Tipo horário
- Full-time
- Categoria
- Tecnologia
- Estado
- Aberto
- Localização
- 1600-100 Lisboa, Lisboa
- Início
- 14/12/2025