Data Platform Engineer (Search, Retrieval & ETL Architecture)

Remoto

(Qualquer lugar)

Sênior

Requisitos

6+ anos de experiência na carreira

Inglês avançado

ETL

Python

Tarefas e Responsabilidades

About Howdy


Howdy.com, founded in 2018 and headquartered in Austin, Texas, helps US companies who want to hire, manage, and retain their teams in Latin America (LatAm) directly but need help with multinational logistics, contracts, compliance, and culture. Companies that use Howdy.com get the best talent available in LatAm and gain access to an entire network and a thriving community of professionals who are changing the world. By partnering with Howdy.com, companies can expand their physical presence into some of the fastest-growing economies in LatAm.

Howdy.com is a member of Y Combinator and has garnered significant support from prominent investors, including Greycroft and Obvious Ventures. The company raised over $20 million in a series A venture capital round.


Our core values


#1 Sports Team: At Howdy, we win together. From players to support, everyone is vital to our success. We hire for excellence, prioritize teamwork, and strive for continuous improvement. We collaborate, seek advice, and actively contribute to Howdy's victories.


Altruism: Demonstrating altruism involves prioritizing the team and assuming the best in others. We communicate openly, provide honest feedback, and extend grace. Altruism is selfless service, focusing on supporting our players and team growth.


Curiosity: Being curious at Howdy means having the willingness to learn, adapt, and explore new ideas. We question existing beliefs, embrace humility, and see curiosity as our superpower. Demonstrating curiosity involves researching unfamiliar tasks, asking questions to understand the full picture, and seeking better ways to complete routine tasks.


Have Spirit: Having spirit at Howdy is about celebrating wins, building a sense of community, and bringing positivity. Demonstrating spirit involves attending events, getting to know teammates, participating in challenges, and proudly wearing the Howdy swag. Simply put, it's about bringing a super-fan spirit to work every day.


What This Role Is (and Is Not)

This is not a BI, analytics, or data warehouse role.

We are not building dashboards, star schemas, or Snowflake-centric reporting systems.

We are building an operational data and retrieval platform that powers an AI-driven matching and recommendation engine. This platform ingests messy real-world data, normalizes it deterministically, builds fast retrieval and ranking layers, and must remain correct, observable, and cost-efficient under constant change.

This role sits one level above traditional ETL: closer to platform engineering and backend architecture than to reporting or analytics.



What You’ll Work On

  • Design and own end-to-end data ingestion and processing pipelines for an online matching system.

  • Build and operate canonical data stores (source of truth) alongside derived retrieval indexes.

  • Design systems that support:

    • replay and backfills,
    • partial failures,
    • evolving schemas,
    • and changing ranking logic.

  • Optimize query and index performance, latency, throughput, and cost.

  • Ensure observability and reliability across ingestion, processing, and retrieval.

  • Work closely with product and AI teams on scoring, ranking, and retrieval strategies.

This role starts deeply hands-on and is expected to define the architectural backbone of the platform.



Core Skills We Are Looking For

  • Experience building production ETL pipelines for operational systems, not just analytics.

  • Strong understanding of streaming and batch processing (idempotency, retries, DLQs, backfills).

  • Deep familiarity with Postgres or similar relational databases as a canonical store.

  • Experience designing or operating search / retrieval systems, such as:

    • OpenSearch / Elasticsearch,
    • vector search,
    • or hybrid retrieval.

  • Solid grasp of performance trade-offs: indexing strategies, caching, latency budgets, and cost.

  • Experience designing data models for canonical entities and provenance, not only star schemas.

  • Strong instincts for reliability, observability, and failure modes.



Nice to Have

  • Vector search or ANN index experience.

  • Experience with recommendation, matching, or ranking systems.

  • Familiarity with LLM-powered pipelines and embeddings.

  • Experience operating systems that produce ranked results with explanations.



Signals of a Strong Fit

You naturally talk about:

  • latency vs freshness trade-offs,

  • source of truth vs derived indexes,

  • how to rebuild or resync data without downtime,

  • how to detect silent data corruption,

  • how to safely backfill data in production systems.



Signals This Is Probably Not the Right Role

  • You default immediately to star schemas or BI-first architectures.

  • Your primary experience is dashboards, analytics, or offline reporting.

  • You treat the data warehouse as the system of record.

You optimize mainly for historical analysis rather than online retrieval.



Some Benefits


💻Hardware and accessories to set you up for success

💰Personal health insurance benefit (family coverage not included)

🏋️Gym membership

🍹Community activities and events (either remote or on-site)

👨‍🏫Complimentary English lessons to help you grow both professionally and personally

🎁Birthday and anniversary presents

🏢Access to our offices or work remotely—your choice!

🌴Paid vacation and national holidays (according to your location)

🕐Flexible work schedule

Compartilhar vaga:

Phone

Somente arquivo pdf com o tamanho máximo de 3mb.

Compartilhar vaga: