Escolar Documentos
Profissional Documentos
Cultura Documentos
FLUXO DE DADOS
Sheila Dias
A revolução da informação representa uma
nítida transferência de PODER, de quem
detém o capital, para quem detém o
conhecimento.
Peter Drucker
(considerado o pai da Administração Moderna)
Dado, Informação e Conhecimento
▪ Os DADOS são os registros soltos, aleatórios, sem
quaisquer análise (Rezende, 2015).
▪ A INFORMAÇÃO seria qualquer estruturação ou
organização desses dados.
▪ O CONHECIMENTO envolve entendimento, por
alguém, de um padrão a ser seguido baseado em
informação.
Processa
DADOS mento CONHECIMENTO
https://www.shutterstock.com/home
O insumo básico do
conhecimento é o DADO,
que acrescido de contexto
se torna INFORMAÇÃO.
CONHECIMENTO é a
capacidade de agir e
prever o resultado,
baseado em informação e
repertório individual.
O que é ser Inteligente?
www.shutterstock.com
Inteligência é:
É a capacidade de
aprender com a
experiência, resolver
problemas e usar o
conhecimento para se
adaptar a novas
situações.
David Guy Myers Hope College - faculdade
particular de artes liberais, Michigan
O que é Business Intelligence (BI) ?
www.shutterstock.com
Business Intelligence (BI) é um termo abrangente que
inclui aplicativos, infraestrutura, ferramentas e práticas
que permitem:
o acesso e a análise das informações para melhorar e
otimizar decisões e desempenho das CORPORAÇÕES.
https://www.gartner.com/en/information-technology/glossary/business-intelligence-bi
(acessado em 26/07/2020)
Os sistemas de Business Intelligence (BI) podem ser
compreendidos como meios de transformação de dados [....]
Os dados coletados são extraídos, transformados e
carregados em estruturas informacionais, oferecendo assim,
desempenho e facilidade ao manipular os dados.
(Barbieri, 2011).
O que sabemos é uma
gota; o que ignoramos é
um oceano.
Isaac Newton
Requirements
&Realities
▪ Requisitos do negócio
▪ Perfil de Dados
Architecture
System
Implementation
E T L
Extract
https://www.shutterstock.com
38
“Construir um sistema de ETL é extraordinariamente difícil,
porque está sujeito a realidades inevitáveis”.
Ralph Kimball,2005
Tudo nasce na Extração.....
▪ O primeiro passo para o SUCESSO de um projeto é a
fase de extração
Fonte:(https://pt.slideshare.net/VithordaSilvaeSilva/self-service-bi-com-power-bi/10)
Extração
https://www.confluent.io/blog/building-real-time-streaming-etl-pipeline-20-minutes/
Acessado 09/08/2020
IMPLEMENTAÇÃO System
Implementation
E T L
Clean Conform
✓Correto
✓Sem Ambiguidade
✓Consistente
✓Completo
Transformação - Limpeza
✓O que é?
✓Consequências ?
✓Técnicas de Detecção?
Transformação - Limpeza
▪ Dados com Anomalias - O que é?
Um dado anômalo é
aquele que não se
encaixa no domínio do
resto dos dados que
são armazenados.
Transformação - Limpeza
▪ Dados com Anomalias - Consequências?
E T L
Deliver
(Kimball,2005)
Carga– Visão Data Warehouse
▪ Um data warehouse é um
sistema que extrai, limpa,
transforma, e carrega os
dados de fontes
operacionais (ETL) em uma
estrutura de
armazenamento de dados
dimensional e, em seguida,
apoia e implementa
consulta e análise para fins
de tomada de decisão.
(Kimball,2005) https://www.shutterstock.com
ETL – Visão Self Service BI
▪ Os dados podem ser
armazenados nos
repositório interno
das ferramentas
SSBI, que tem por
característica ter
alto poder de Fonte: https://blog.luz.vc/excel/como-habilitar-instalar-power-query-
excel/
compressão, índices
otimizados.
ETL - Visões
Fonte: https://www.timmitchell.net/post/2017/01/06/what-is-etl/
https://www.shutterstock.com
Fonte: https://blog.luz.vc/excel/como-habilitar-instalar-power-query-excel/
IMPLEMENTAÇÃO
A missão da equipe de
ETL
• A missão da equipe de ETL, no nível mais
alto, é o de construir os bastidores de uma
solução de analytics:
E – Extração
T – Transformação
L – Carga
• Extração: Mapeamento das
Fontes de Dados, Conectores e
estratégias de Janelas de Carga
• Transformação: Tratamentos
diversos, limpeza de dados,
filtros, regras de cálculo,
unificação de fontes, etc.
• Carga (Load):
Armazenamento de Dados,
persistência das informações
https://www.shutterstock.com coletadas e tratadas.
75
https://gartner.com.br
Data Lake
• É um termo recente, criado pelo CTO (Chief
Technical Officer) do Pentaho, James Dixon.
76
https://www.shutterstock.com
ETL – Visão Data Lake
http://www.jamesserra.com