Escolar Documentos
Profissional Documentos
Cultura Documentos
+ +
50+ milhes
usurios ativos
01 primeira
arquitetura de
Dados
tudo comeou assim
e depois foi gerando dados no
Data Lake no S3
como analisar?
Location
em que bairro / cidade / estado / pas temos mais pontos de localizao
qual o comportamento da localizao indoor em determinado estabelecimento
erro / preciso mdia de localizao dado parmetros (WiFi, GPS, aplicativo, proximidade de estabelecimento)
Publisher
requests, impresses, fill rate, cliques, CTR, receita, eCPM (da base toda, por publisher, por app e por slot de anncio)
Ad Ops
tempo mdio de visita por estabelecimento
perfil sociodemogrfico impactado por campanha
quantos usurios que so X foram impactados por campanha C e foram ao estabelecimento E depois de tempo T e depois
Fazendo Data Science em larga escala
Entregar
Muda esse parmetro e roda de novo por favor
Por que demorava?
Presto on Parquet: 9s
SELECT COUNT(DISTINCT mad_id) WHERE DAY = 'YYYY/MM/DD'
~336x speedup
Desafios
Deixando apenas o "time de Dados" sabendo onde os dados esto e como usar
www.inlocomedia.com