Última semana. Você conecta o Superset diretamente nas suas tabelas Iceberg, monta um dashboard de negócio publicável e apresenta o pipeline inteiro funcionando. Sai do curso com portfólio público e tudo no GitHub.
Pré-aula gravada ~15min
- Como o Superset se conecta a Iceberg via Spark Thrift Server (arquitetura em 1 slide)
- Diferença entre dataset, chart e dashboard no Superset
- 5 perguntas de negócio típicas que o Olakehouse permite responder — e que vão virar nossos gráficos hoje
- O que faz um dashboard ser "bom": menos é mais
Ao vivo · Parte 1 — Conectar Superset ao Lakehouse ~45min
- Subir o Spark Thrift Server —
start-thriftserver.sh no container Spark, expondo porta 10000
- Configurar database no Superset — driver
pyhive ou sqlalchemy-trino, URL hive://spark:10000/olakehouse
- Validar conexão — rodar
SELECT COUNT(*) FROM olakehouse.gold.fato_vendas no SQL Lab do Superset
- Registrar datasets —
gold.fato_vendas + 4 dimensões como datasets no Superset
Ao vivo · Parte 2 — Dashboard "Visão de Vendas Olakehouse" ~1h30
- Chart 1 — Big Number — receita total
- Chart 2 — Time series — receita diária ao longo de 2017–2018
- Chart 3 — Bar chart — top 10 categorias por receita
- Chart 4 — Mapa do Brasil — receita por UF
- Chart 5 — Scatter — dias de entrega vs nota média da review
- Montar o dashboard — arrastar os 5 charts, adicionar filtros (período, UF, categoria), salvar como
Visão de Vendas Olakehouse
- Compartilhar — gerar link público (read-only) ou exportar PDF
Ao vivo · Parte 3 — Apresentação final ~30min, rotativa
- Cada aluno tem 3min pra: subir o
docker compose up, rodar a DAG, mostrar o dashboard, apontar uma insight de negócio que descobriu nos dados
- Feedback rápido da turma + professor
- Entrega oficial dos certificados de conclusão
Não há desafio assíncrono — semana final
Em vez de desafio, a tarefa é finalizar o repo GitHub durante a semana:
- README explicando como subir e rodar o pipeline
- Pasta
dags/ com a DAG
- Pasta
transformacoes/ com os scripts Spark
- Pasta
dashboards/ com o JSON exportado do dashboard Superset
- Screenshot do dashboard no README
Entregável final do curso
1. Repositório GitHub público com o pipeline completo + instruções de execução. 2. Dashboard Superset com mínimo 4 charts e 1 filtro funcional. 3. Apresentação ao vivo de 3min mostrando o pipeline rodando. 4. Certificado de conclusão (emitido após entrega aprovada).