Engenheiro de dados Pleno

Remuneração mensal:

PJ R$ 7.500,00 - R$ 10.000,00 / mês

Remoto

(Qualquer lugar)

Pleno

Requisitos

3+ anos de experiência na carreira

BigData

Apache Airflow

Tarefas e Responsabilidades

Houer Consultoria

Site: http://houer.com.br

Somos uma plataforma de infraestrutura que impacta a vida de milhões de pessoas. Estruturamos e viabilizamos projetos de concessões, PPPs e de outras vertentes em diversas áreas de atuação. Temos projetos espalhados por todas as regiões do Brasil e total expertise para contribuir com o desenvolvimento de ações que busquem melhorias significativas para o futuro do mundo. Entendemos que é preciso pensar no futuro e nos impactos que deixaremos para as próximas gerações. Nossas ações visam, sobretudo, a vontade de contribuir com um mundo melhor e mais desenvolvido.


Responsabilidades e atribuições:

  • Pipeline e Big Data: Construir e otimizar pipelines de dados escaláveis (ETL-V) usando Spark e Delta Lake.
  • Transformação e Qualidade: Implementar lógica de transformação e modelos analíticos com dbt (Data Build Tool) nas camadas Preparation, Public e Trilhas.
  • Orquestração: Projetar e gerenciar fluxos de trabalho resilientes utilizando Apache Airflow.
  • Governança e Linhagem: Implementar e manter Open Metadata e Hive para registrar metadados e linhagem de dados fim a fim, vital para a certificação.
  • Certificação (OIA): Desenvolver controles de auditoria, testes de consistência (data reconciliation) e documentação técnica para comprovar a origem e integridade dos dados, das fontes ao BI (PostgreSQL/Metabase).
  • Infraestrutura Analítica: Otimizar o PostgreSQL para consumo por Business Intelligence, garantindo aderência aos requisitos de negócios.

Requisitos e Qualificações

  • Formação superior em TI ou área correlata.
  • Experiência comprovada como Engenheiro(a) de Dados.
  • Proficiência em Python e SQL avançado.
  • Conhecimento profundo de Apache Spark e Delta Lake.
  • Experiência prática com dbt (Data Build Tool).
  • Domínio na criação e gestão de DAGs no Apache Airflow.
  • Familiaridade com conceitos e ferramentas de Governança de Dados e Linhagem de Dados (Data Lineage).
  • Conhecimento robusto em arquitetura de sistemas distribuídos e segurança de dados.

Diferenciais

  • Governança e Big Data: Experiência com Arquitetura Data Lake (Delta Lake, Hudi ou Iceberg) e padrões de arquitetura medallion para garantia da qualidade dos dados.
  • Integração de Sistemas Legados: Conhecimento da arquitetura e comportamento de Sistemas Legados (Silos/Mainframe) para garantir a extração e ingestão correta de dados críticos na camada Raw.
  • Vivência anterior no setor público ou em sistemas de alta complexidade regulatória/auditoria.
  • Controles de Auditoria e Metadados: Vivência em ambientes de alta complexidade regulatória (Setor Público, Financeiro) e uso de ferramentas de Metadados e Linhagem (Open Metadata ou similares) para rastreabilidade e certificação (ISO/IEC 27001).
  • Experiência com Open Metadata ou similares.
  • Infraestrutura Cloud Nativa: Conhecimento prático em ambientes Cloud (AWS, GCP ou Azure) e orquestração de contêineres (Docker/Kubernetes).

Compartilhar vaga:

Phone

Somente arquivo pdf com o tamanho máximo de 3mb.

Compartilhar vaga: