Descrição de Vaga
| Código: | 1089 |
| Título da vaga: | Engenheiro de Dados (Híbrido) |
| Local: | São Paulo, SP |
| Nível Profissional: | Sênior |
| Áreas de Atuação Profissional: | TI - Arquitetura |
| Descrição: | Construir, operar e evoluir a infraestrutura de dados da Apostou — pipelines, integrações, camadas analíticas, governança e performance — de forma a sustentar, com qualidade e disponibilidade 24/7, todas as necessidades analíticas, preditivas e operacionais do negócio. Viver a cultura AI-Native, utilizando IA como extensão do trabalho técnico e suportando ativamente todas as áreas da operação (Lifecycle & CRM, Performance MKT, Ops, Tecnologia & Produto, Financeiro, Jurídico, Gente & Gestão) com os dados necessários para decisão, operação e automação. Atuar com obsessão pelo jogador, entendendo que cada pipeline de dados que opera estabiliza ou desestabiliza a experiência entregue na ponta. Responsabilidades: 01 Desenhar, implementar e manter pipelines de ingestão de dados (batch e streaming) a partir da plataforma NGX, CRM Smartico, provedores de jogos, gateways de pagamento, fontes externas e canais de atendimento. 02 Construir e evoluir o Data Warehouse / Data Lake da operação, com arquitetura moderna (camadas bronze, silver, gold) e governança de qualidade de dados ponta a ponta. 03 Implementar rotinas de ETL/ELT automatizadas usando ferramentas como Airflow, dbt, Fivetran ou equivalentes, garantindo SLA acordado com as áreas consumidoras. 04 Atender ativamente as demandas das demais áreas da operação — Lifecycle & CRM, Performance MKT, Ops, Tecnologia & Produto, Financeiro, Jurídico, Gente & Gestão — estruturando dados no formato que elas precisam. 05 Garantir integridade, segurança e compliance dos dados (LGPD, auditoria SPA, controle de acesso por papel, mascaramento de dados sensíveis) em parceria com Jurídico e Tecnologia. 06 Monitorar performance de queries, custos de processamento e confiabilidade das pipelines, atuando continuamente em otimização de infraestrutura cloud (AWS/GCP/Azure). 07 Colaborar com o Analista de Dados III na modelagem dimensional, criação de data marts e camadas semânticas para consumo analítico e autoatendimento. 08 Dar suporte ao Head AI/Dados na disponibilização de features engineering, feature stores e datasets tratados para modelos preditivos e sistemas de recomendação. 09 Desenvolver e manter APIs internas de dados para consumo por times de Produto, CRM e Marketing, com baixa latência e escalabilidade. 10 Documentar arquitetura, catálogo de dados, lineage e dicionários (Data Catalog) para garantir discoverability e autonomia das áreas. 11 Implementar observabilidade (logs, métricas, alertas) sobre pipelines e qualidade de dados, com dashboards de monitoramento proativo. 12 Participar com o Head AI/Dados e o PO/Scrum Master do mapeamento de dados e processos de cada área, traduzindo necessidades em backlog técnico. 13 Atuar como referência técnica para padrões de engenharia de dados, mentorar analistas e revisar código de pipelines críticos. 14 Utilizar IA como extensão do trabalho técnico — geração de código, revisão de queries, documentação, troubleshooting, detecção de anomalias em pipelines e aceleração de entrega. |
| Habilidades: | Formação Acadêmica: Graduação em Ciência da Computação, Engenharia de Software, Sistemas de Informação, Engenharia ou áreas correlatas. Pós / Especializações: Pós-graduação ou especialização em Engenharia de Dados, Big Data, Cloud Computing ou Data Engineering é diferencial. Experiência Mínima: Mínimo 5 anos em engenharia de dados, sendo ao menos 2 anos em arquitetura cloud de larga escala. Experiência em iGaming, fintech, e-commerce ou plataformas digitais de alto volume é diferencial significativo. Conhecimentos Técnicos: SQL avançado, Python, Spark, Kafka, Airflow, dbt, Snowflake/BigQuery/Redshift, AWS/GCP/Azure, Docker/Kubernetes, versionamento (Git), modelagem dimensional (Kimball/Data Vault), CI/CD para dados, governança (LGPD, data contracts, lineage, catálogo), observabilidade de pipelines, integração com CRM (Smartico) e com ferramentas de BI (Looker, Power BI, Metabase, Tableau). Certificações: Diferenciais: AWS Data Analytics Specialty, Google Professional Data Engineer, Databricks Certified Data Engineer, Snowflake SnowPro. Requisitos Técnicos: • Arquitetura de Data Lake / Data Warehouse moderno (Medallion Architecture). • Orquestração com Airflow, Dagster ou Prefect. • Stream processing (Kafka, Kinesis, Pub/Sub) para eventos em tempo real. • Modelagem dimensional (Star Schema, Data Vault, normalização e desnormalização). • Governança de dados (data contracts, data quality, lineage, catálogo). • Otimização de custos cloud e performance de queries. • Infraestrutura como código (Terraform, CloudFormation). • Integração com ferramentas de BI (Looker, Power BI, Metabase, Tableau). • Integração com plataformas de CRM (Smartico) e produto (NGX). • Uso de IA para geração de código, revisão de queries, documentação e troubleshooting. |