Tarefas e Responsabilidades
RESPONSABILIDADES:
- Realizar análises estatísticas com supervisão e desenvolver modelos preditivos básicos a intermediários
- Implementar pipelines de dados e contribuir no desenvolvimento de soluções de machine learning
- Coletar, limpar e preparar dados para treinamento de modelos de forma independente
- Testar diferentes abordagens de modelagem e avaliar performance com métricas adequadas
- Participar ativamente de projetos com fine-tuning de SLMs
- Aplicar técnicas de engenharia de prompts e implementar sistemas RAG
- Documentar processos técnicos e apresentar resultados para stakeholders
- Colaborar com cientistas de dados mais experientes em projetos complexos
REQUISITOS OBRIGATÓRIOS:
- Formação: Graduação completa em Ciência da Computação, Estatística, Matemática, Engenharia ou áreas correlatas
- Pelo menos 1 ano de experiência profissional em ciência de dados ou áreas relacionadas
- Conhecimento sólido de Python para análise de dados (pandas, numpy, matplotlib/seaborn)
- Experiência prática com machine learning e bibliotecas como scikit-learn
- Conhecimento de estatística aplicada e técnicas de validação de modelos
- Familiaridade com pelo menos um framework de deep learning (PyTorch ou TensorFlow)
REQUISITOS DESEJÁVEIS:
- Conhecimento básico de NLP e processamento de texto
- Familiaridade com frameworks para LLMs (langchain, llama-index)
- Conhecimento de cloud computing (AWS, GCP ou Azure)
- Experiência com deploy básico de modelos (APIs REST)
SOFT SKILLS ESPERADAS:
- Comunicação clara e capacidade de explicar conceitos técnicos
- Trabalho em equipe e colaboração efetiva
- Proatividade na resolução de problemas e busca por soluções
- Capacidade de aprendizado rápido e adaptação a novas tecnologias
- Organização e atenção aos detalhes na documentação
PROJETOS/REALIZAÇÕES VALORIZADAS:
- Implementação de modelos de ML
- Desenvolvimento de soluções inovadoras com NLP/LLMs/SLMs