Você está na página 1de 3

COLETA E ARMAZENAMENTO DE DADOS

Prof° Fabio Lopes

 Conceitos envolvidos em coleta de dados.


 Variedade e veracidade.
 Planejamento da coleta.
 Qualidade dos dados.
 Governança dos dados.

RESUMO TRILHA 1 - TRILHA 1: CONCEITOS DE COLETA DE DADOS

Devido a quantidade de informações disponíveis, devemos ter foco para chegar em algum
lugar. A tarefa do cientista de dados é montar um ambiente onde podemos encontrar a
resposta para 3 perguntas: Quem pode realmente ter os dados que eu preciso? Os dados serão
disponibilizados? Como posso tê-los em minhas mãos?

“Identificar e obter dados viáveis para Analytics é uma arte que envolve essas
questões.”

Formas de coletar dados:


Os 5 V’s do Big DATA

Velocidade: Um site como G1 que tem muitos acessos ao longo do dia e vários acessos rápidos
simultâneos

Volume: Quantidade de dados gerados através de uma ação, por exemplo, os log’s que o site
go G’ gera de todas as pessoas passaram pelo site em um período

Variedade: Dados estruturados ou não estruturados, pode ser uma tabela, ou um


texto/post/curtida/l

Veracidade: Trata-se da qualidade dos dados coletados, se entra lixo, sai lixo. É de extrema
importância que o dado seja bom

Valor: A busca pelos dados, precisa gerar valor ao negócio, para valer a pena desempenhar um
trabalho para tal.

Ciclo do DATA ONE, necessário planejar onde queremos chegar e verificar se irá agregar valor
ao negócio, depois disso, efetuar o plano de execução.

Você também pode gostar