Analista Cloud/ SRE Pleno
Presencial
São Paulo
Pleno
Requisitos
7+ anos de experiência na carreira
Tarefas e Responsabilidades
Buscamos um SRE Sênior para atuar na operação, observabilidade, confiabilidade e desempenho de ambientes baseados em arquitetura de microsserviços. Será responsável por análise avançada, troubleshooting, automação e melhoria contínua de plataformas críticas. Atuará em parceria com times de engenharia, infraestrutura, segurança e produto para garantir alta disponibilidade, performance e resiliência.
Responsabilidades
• Realizar análises profundas e troubleshooting em ambientes distribuídos, microsserviços e aplicações de missão crítica.
• Atuar no monitoramento ponta a ponta utilizando Dynatrace ou Datadog (APM, logs, métricas, dashboards, alertas).
• Investigar causas raiz (RCA), propor e implementar ações corretivas e preventivas.
• Participar da definição e evolução de SLOs, SLIs e SLAs, garantindo confiabilidade e qualidade contínua.
• Conduzir melhorias de capacidade, desempenho e arquitetura para prevenção de incidentes recorrentes.
• Automatizar rotinas operacionais, deploy e observabilidade utilizando ferramentas modernas (ex: Ansible, Terraform, GitHub Actions, pipelines CI/CD).
• Apoiar incidentes críticos (Major Incidents) com postura analítica, agilidade e clareza na comunicação.
• Implementar boas práticas de resiliência, fault tolerance, autoscaling, chaos engineering e engenharia de confiabilidade.
• Trabalhar de forma próxima aos times de desenvolvimento para padronizar logs, métricas, tracing e práticas de DevOps/SRE.
• Garantir governança operacional alinhada aos princípios de FinOps, segurança e compliance.
Requisitos Técnicos
• Experiência sólida como SRE, DevOps Engineer ou Reliability Engineer em ambientes complexos.
• Domínio de APM com Dynatrace ou Datadog (obrigatório).
• Forte capacidade de troubleshooting: análise de logs, profiling, traces distribuídos e consumo de recursos.
• Conhecimento em containers e orquestração (Kubernetes, OpenShift).
• Experiência com infraestrutura como código (Terraform, Ansible).
• Conhecimento de CI/CD e pipelines de entrega.
• Experiência com cloud (AWS, Azure ou GCP) e componentes nativos (EC2, EKS/AKS, Lambda/Functions, Gateways, Message Queues etc.).
• Familiaridade com bancos de dados SQL e NoSQL (PostgreSQL, MySQL, MongoDB, Redis, Dynamo etc.).
• Experiência com ferramentas de log (ELK, Loki, CloudWatch, Azure Monitor).
• Programação/scripting para automação (Python, Shell, Go — diferencial).
Diferenciais
• Experiência prévia com Chaos Engineering.
• Certificações em cloud, observabilidade ou SRE.
• Experiência em arquiteturas de alta escala e ambientes financeiros.
• Vivência com práticas de AIOps e automações
Inicialmente atuação 100% presencial, com possibilidade de atuação híbrida futuramente
Local: Av. Faria Lima/São Paulo
Compartilhar vaga:
Compartilhar vaga: