Sobre a Getup
A Getup é especialista em tecnologias cloud-native com foco em Kubernetes. Nosso time certificado pela CNCF contribui ativamente para o ecossistema open source e aplica esse conhecimento em projetos de empresas de diferentes portes e setores. Desenvolvemos ferramentas próprias que tornam os ambientes prontos para produção, ajudando a monitorar boas práticas, detectar falhas de configuração e identificar vulnerabilidades.
O Desafio
Estamos em busca de uma pessoa SRE / DevOps Engineer Sênior para liderar iniciativas de confiabilidade, automação e segurança em ambientes Kubernetes. O trabalho envolve definição de padrões técnicos, construção de infraestrutura como código, evolução de práticas de observabilidade e otimização de custos, em parceria com equipes de desenvolvimento e operações.
Responsabilidades
- Operar, otimizar e administrar clusters Kubernetes (multi-cloud e on-prem).
- Projetar e manter Infraestrutura como Código (IaC) (Terraform e Ansible) e configuração de apps (Helm/Kustomize).
- Implementar GitOps (Argo CD/Flux) e pipelines CI/CD (GitHub Actions/GitLab CI/Azure DevOps etc.) pensando segurança desde o início.
- Definir e acompanhar SLIs/SLOs, error budgets e práticas de SRE (post-mortems, runbooks, playbooks).
- Construir observabilidade ponta a ponta (Prometheus, Grafana LGTM, OpenTelemetry, Elastic stack etc).
- Aplicar DevSecOps: hardening, policies (CEL / Kyverno), Network Policies, gestão de segredos, Scan de imagens (SBOM, assinatura, provenance).
- Conduzir FinOps: otimização de custo/performance, rightsizing, auto-scaling e estratégias de economia.
- Participar de resposta a incidentes e melhoria contínua de confiabilidade.
- Apoiar a padronização técnica (guides, templates, módulos IaC) e disseminação de boas práticas.
Requisitos Técnicos
- Kubernetes avançado (deploy, upgrade, troubleshooting de control plane e workloads).
- Linux e administração de sistemas em profundidade.
- IAC (Terraform) e configuração de aplicações (Helm/Kustomize).
- CI/CD e automação (pipelines, quality gates, segurança em build).
- Programação para automações e integrações (Python ou Go).
- Observabilidade (métricas, logs, tracing) e segurança (RBAC, policies, secrets, supply chain).
- Clouds (AWS/GCP/Azure) e operação de serviços gerenciados (EKS/GKE/AKS) ou Rancher/RKE.
- Sólida capacidade de diagnóstico e troubleshooting em produção.
- Autonomia para trabalhar 100% remoto.
- Experiência com Argo CD/Flux, OPA/Kyverno, Cosign/Sigstore, OpenTelemetry.
- Vivência com Rancher, Cilium/eBPF, Service Mesh (Istio/Linkerd).
- Práticas de hardening e compliance (CIS, NIST, PCI/ISO), policies e assessment de ambiente.
- Inglês técnico para leitura/escrita e interações com comunidade/open source.
Soft Skills Essenciais
- Comunicação excelente (clara, estruturada e objetiva; escrita e verbal).
- Trabalho em equipe e colaboração com perfis diversos (Dev, QA, Sec, Ops).
- Mentalidade de ensino: habilidade de compartilhar conhecimento, documentar e mentorar o time (com atenção especial a perfis juniores, ajudando na evolução técnica e autonomia).
- Accountability: priorização, autonomia e foco em entrega.
- Pensamento sistêmico e resolução de problemas baseada em dados.
- Curiosidade e melhoria contínua: aprender, experimentar, medir e iterar.