Lakehouse:
Pipeline na Prática
Em 5 semanas, você constrói um pipeline Lakehouse completo — do zero ao dashboard. Curso online ao vivo, 100% hands-on. Você não assiste — coda junto com o professor, com a stack que o mercado contrata em 2026.
Quantos se aplicam a você?
Marcou 2 ou mais? Esse curso foi feito pra você. Vamos resolver isso em 5 semanas.
Olakehouse — marketplace brasileiro fictício pra mexer de verdade
PySpark. Igual à vida real, sem o “Hello World” idealizado.5 ferramentas open source — todas em vagas reais de Eng. de Dados em 2026
MinIO
Data Lake S3-compatível rodando local. Onde os dados vivem.
Apache Iceberg
Tabelas com ACID, time travel e schema evolution sobre o Lake.
Apache Spark
Motor distribuído pra limpar, juntar e modelar dados em PySpark.
Apache Airflow
DAG diária com retry, sensors e observabilidade do pipeline.
Apache Superset
Dashboards interativos conectados via Spark Thrift às tabelas Gold.
Todas rodam em Docker, na sua máquina. Você sai do curso dominando as cinco.
Da matrícula ao dashboard, 5 semanas estruturadas
Sobe a stack
Docker compose, Medallion Architecture na prática. Sobe as 5 ferramentas e valida acesso aos UIs.
Carrega os dados
9 CSVs viram tabelas Iceberg versionadas no MinIO. Demo de ACID e time travel ao vivo.
Modela com Spark
Limpeza, joins e modelagem dimensional em PySpark. Sai com fato_vendas + 4 dimensões em estrela.
Automatiza no Airflow
DAG diária com retry, sensors e observabilidade. Orquestra o pipeline inteiro — agora roda sozinho.
Publica o dashboard
Superset conecta nas tabelas Iceberg via Spark Thrift. Dashboard de negócio publicado e apresentação ao vivo.
Por que este curso e não outro:
Você não assiste — você coda.
O professor compartilha tela e digita ao vivo. Você digita junto. Quem trava, todo mundo espera. Seu cérebro percorre o caminho inteiro, não só o olho.
Cenário brasileiro real.
9 tabelas, ~100MB, sujeira proposital pra limpar. Você resolve problemas reais de modelagem, qualidade e performance — não brinca com SELECT 1.
Stack que o mercado contrata em 2026.
Nada de Hadoop morto, nada de tutorial de 2018. Mesma stack que aparece em job descriptions de Engenheiro de Dados Sênior hoje.
Você sai com portfólio público.
Pipeline + dashboard no GitHub. Recrutador testa em 5 minutos e vê que é seu de verdade. Sem firula, é evidência.
Pra quem é — e pra quem NÃO é.
Este curso foi feito pra você se…
- É analista de dados querendo subir pra Engenharia de Dados
- É dev backend curioso sobre o stack analítico moderno
- É engenheiro junior e precisa de stack contemporâneo no portfólio
- É DBA migrando de SQL Server/Oracle pro mundo Big Data
Este curso NÃO é pra você se…
- Nunca programou em Python (exigimos intermediário)
- Nunca usou Docker (precisa estar instalado e funcionando)
- Quer curso 100% gravado pra ver no celular no trânsito
- Busca certificação acadêmica ou validação MEC
O que você precisa pra começar:
- Python intermediário — loops, funções, instalar pacote via pip
- SQL básico-intermediário — SELECT, JOIN, GROUP BY, subqueries
- Linha de comando Linux — navegar, editar arquivo, rodar comando
- Docker Desktop instalado e rodando
- Máquina com 16GB de RAM e 50GB livres em disco
- ~5h por semana de dedicação durante as 5 semanas
Além do curso, você leva:
Acesso vitalício
Às aulas gravadas. Revise quantas vezes quiser.
Discord da turma
Comunidade exclusiva — você, colegas e professor.
Cheat sheets
PySpark, SQL Iceberg e operators do Airflow.
Docker templates
Pra acelerar setups futuros no seu trabalho.
Certificado
De conclusão, após o projeto final aprovado.
Preço de comunidade · 3 lotes + referência de mercado
A Turma 1 é oferecida em primeira mão pra base do DSSBR e do GUBigData. A partir da Turma 2 (set/2026), o curso volta ao preço de mercado.
- Curso completo (20h)
- Ingresso DSSBR 2026 (R$ 520)
- Discord vitalício + cheat sheets
- Certificado de conclusão
- Curso completo (20h)
- Ingresso DSSBR 2026 (R$ 520)
- Discord vitalício + cheat sheets
- Certificado de conclusão
- Acesso à comunidade DSSBR/GUBigData
- Curso completo (20h)
- Ingresso DSSBR 2026 (R$ 520)
- Discord vitalício + cheat sheets
- Certificado de conclusão
- Curso completo (20h)
- Sem ingresso DSSBR
- Discord vitalício
- Certificado de conclusão
Bônus exclusivo da Turma 1: todo aluno recebe ingresso completo pro Data Science Summit Brasil 2026 (27-29 out, IEP Curitiba) — valor pré-venda R$ 520. Este bônus não existe nas próximas turmas.
7 dias de garantia incondicional.
Participe da primeira semana inteira. Se achar que não é pra você, devolvemos 100% do seu investimento. Sem pergunta, sem fricção, sem ressentimento.
“A gente só fica com seu dinheiro se você ficar com o conhecimento.”
Turma 1 começa em 22 de junho de 2026
- 40 vagas no total, distribuídas em 3 lotes (Founder · L1 · L2)
- Encontros ao vivo às terças e quintas, das 19h às 21h
- 5 semanas de duração total
- Material de apoio liberado no dia 0
- Bônus desta turma: ingresso DSSBR 2026 incluso
Perguntas frequentes
Preciso saber Spark ou Airflow antes?+
Funciona em Mac, Linux e Windows?+
E se eu perder uma aula ao vivo?+
É curso oficial Apache, MEC ou tem pós-graduação?+
O curso garante uma vaga depois?+
Quantos alunos por turma?+
Por que a Turma 1 tem preço de comunidade?+
O bônus DSSBR vale pra todas as turmas?+
Como funciona a entrega?+
Posso parcelar?+
Pronto pra parar de só falar de Lakehouse —
e começar a construir um?
Turma 1 (Comunidade): 22 de junho de 2026 · Lote 1 com 15 vagas · Bônus DSSBR exclusivo · 7 dias de garantia.
Pronto para colocar
dados em produção?
Conta em uma frase o problema. A gente responde com um plano em até 48h.