📌 Sobre o Projeto
Somos uma empresa especializada na análise e negociação de precatórios. Buscamos um desenvolvedor para construir um crawler robusto, capaz de acessar sites de tribunais (ex.: TJSP, TRF3, e outros), automatizar a coleta de processos, baixar documentos (em especial PDFs) e extrair dados relevantes de forma estruturada.
🎯 Objetivo
Criar uma ferramenta que:
- Faça consultas automatizadas por número de processo, CPF/CNPJ ou classe processual;
- Baixe os documentos processuais disponíveis (petições, decisões, sentenças);
- Extraia informações relevantes desses documentos (partes, objeto, valores, fases processuais);
- Organize os dados em formato JSON ou salve em banco de dados relacional ou NoSQL;
- Seja escalável e mantenível, com controle de erros e logs básicos.
🧠 Requisitos Técnicos
- Domínio em Python
- Experiência com web scraping usando requests, BeautifulSoup, Selenium, Scrapy ou Playwright
- Conhecimento em extração de dados de PDFs (com bibliotecas como PyMuPDF, pdfplumber ou Apache Tika)
- Familiaridade com tratamento de CAPTCHAs e autenticação em sistemas públicos
- Experiência com bancos de dados (PostgreSQL, MySQL, MongoDB ou similar)
- Conhecimento básico sobre sistemas processuais (e-SAJ, PJe, Projudi, etc.) será considerado um diferencial
🎁 Desejável
- Experiência prévia com crawlers jurídicos ou projetos em legaltechs
- Conhecimento de estrutura de petições e movimentações processuais
- Vivência com controle de IPs/headers para evitar bloqueios em scraping
🛠️ Formato e Condições
- Projeto pontual com possibilidade de continuidade
- Pagamento via PJ (valor a combinar conforme experiência e escopo)
- Trabalho remoto
- Entregas organizadas em etapas com validação progressiva