Analista Cloud/ SRE Pleno

Presencial

São Paulo

Pleno

Requisitos

7+ anos de experiência na carreira

Tarefas e Responsabilidades

Buscamos um SRE Sênior para atuar na operação, observabilidade, confiabilidade e desempenho de ambientes baseados em arquitetura de microsserviços. Será responsável por análise avançada, troubleshooting, automação e melhoria contínua de plataformas críticas. Atuará em parceria com times de engenharia, infraestrutura, segurança e produto para garantir alta disponibilidade, performance e resiliência.

 

 

 

 Responsabilidades

 • Realizar análises profundas e troubleshooting em ambientes distribuídos, microsserviços e aplicações de missão crítica.

 • Atuar no monitoramento ponta a ponta utilizando Dynatrace ou Datadog (APM, logs, métricas, dashboards, alertas).

 • Investigar causas raiz (RCA), propor e implementar ações corretivas e preventivas.

 • Participar da definição e evolução de SLOs, SLIs e SLAs, garantindo confiabilidade e qualidade contínua.

 • Conduzir melhorias de capacidade, desempenho e arquitetura para prevenção de incidentes recorrentes.

 • Automatizar rotinas operacionais, deploy e observabilidade utilizando ferramentas modernas (ex: Ansible, Terraform, GitHub Actions, pipelines CI/CD).

 • Apoiar incidentes críticos (Major Incidents) com postura analítica, agilidade e clareza na comunicação.

 • Implementar boas práticas de resiliência, fault tolerance, autoscaling, chaos engineering e engenharia de confiabilidade.

 • Trabalhar de forma próxima aos times de desenvolvimento para padronizar logs, métricas, tracing e práticas de DevOps/SRE.

 • Garantir governança operacional alinhada aos princípios de FinOps, segurança e compliance.

 


 

 Requisitos Técnicos

 • Experiência sólida como SRE, DevOps Engineer ou Reliability Engineer em ambientes complexos.

 • Domínio de APM com Dynatrace ou Datadog (obrigatório).

 • Forte capacidade de troubleshooting: análise de logs, profiling, traces distribuídos e consumo de recursos.

 • Conhecimento em containers e orquestração (Kubernetes, OpenShift).

 • Experiência com infraestrutura como código (Terraform, Ansible).

 • Conhecimento de CI/CD e pipelines de entrega.

 • Experiência com cloud (AWS, Azure ou GCP) e componentes nativos (EC2, EKS/AKS, Lambda/Functions, Gateways, Message Queues etc.).

 • Familiaridade com bancos de dados SQL e NoSQL (PostgreSQL, MySQL, MongoDB, Redis, Dynamo etc.).

 • Experiência com ferramentas de log (ELK, Loki, CloudWatch, Azure Monitor).

 • Programação/scripting para automação (Python, Shell, Go — diferencial).



 Diferenciais

 • Experiência prévia com Chaos Engineering.

 • Certificações em cloud, observabilidade ou SRE.

 • Experiência em arquiteturas de alta escala e ambientes financeiros.

 • Vivência com práticas de AIOps e automações


Inicialmente atuação 100% presencial, com possibilidade de atuação híbrida futuramente

Local: Av. Faria Lima/São Paulo

 

Compartilhar vaga:

Phone

Somente arquivo pdf com o tamanho máximo de 3mb.

Compartilhar vaga: