📌 Sobre el Proyecto
Somos una empresa especializada en el análisis y negociación de precatórios. Buscamos un desarrollador para construir un crawler robusto, capaz de acceder a sitios web de tribunales (ej.: TJSP, TRF3, y otros), automatizar la recolección de procesos, descargar documentos (especialmente PDFs) y extraer datos relevantes de manera estructurada.
🎯 Objetivo
Crear una herramienta que:
- Realice consultas automatizadas por número de proceso, CPF/CNPJ o clase procesal;
- Descargue los documentos procesales disponibles (demandas, decisiones, sentencias);
- Extraiga información relevante de estos documentos (partes, objeto, valores, fases procesales);
- Organice los datos en formato JSON o guárdelos en una base de datos relacional o NoSQL;
- Sea escalable y mantenible, con control de errores y logs básicos.
🧠 Requisitos Técnicos
- Dominio en Python
- Experiencia con web scraping usando requests, BeautifulSoup, Selenium, Scrapy o Playwright
- Conocimiento en extracción de datos de PDFs (con bibliotecas como PyMuPDF, pdfplumber o Apache Tika)
- Familiaridad con tratamiento de CAPTCHAs y autenticación en sistemas públicos
- Experiencia con bases de datos (PostgreSQL, MySQL, MongoDB o similar)
- Conocimiento básico sobre sistemas procesales (e-SAJ, PJe, Projudi, etc.) se considerará una ventaja
🎁 Deseable
- Experiencia previa con crawlers jurídicos o proyectos en legaltechs
- Conocimiento de estructura de demandas y movimientos procesales
- Vivencia con control de IPs/headers para evitar bloqueos en scraping
🛠️ Formato y Condiciones
- Proyecto puntual con posibilidad de continuidad
- Pago vía PJ (valor a acordar según experiencia y alcance)
- Trabajo remoto
- Entregas organizadas en etapas con validación progresiva