Escolar Documentos
Profissional Documentos
Cultura Documentos
BIG DATA
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
implícita
NÃO
- Possuem padrões flexíveis e estruturas parciais ESTRUTURADOS
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
DATA WAREHOUSE
-Considerado um sistema de BD convencional
DATA MART
- São subdivisões da Data Warehouse
OLAP
- Online Analytical Processing
CARACTERÍSTICAS DO DATAWARE HOUSE
- Processo Analítico em Tempo Real - Não é volátil: não muda com facilidade
- Permite operar com grande quantidade de dados - É orientado por assunto: temas específicos
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
NOSQL: ARMAZENAMENTO;
Não armazenam dados em tabelas. Utilizam modelos
Manipular Banco de Dados distribuidos e não relacionais,
diferentes de armazenamento de dados.
em que não há estruturas de tabelas. Dados não
e escalabilidade.
TIPOS DE ARMAZENAMENTO
Chave-valor: mapeamento ou dicionário
semiestruturados
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
5V'S VALOR
VOLUME - Os dados são os bens mais preciosos de uma
- Combater as informações falsas (Fake News) - Dados possuem vários tamanhos, conteúdo, tipos...
tratados
VERACIDADE
- Para resolver isso são utilizadas ferramentas especiais
VELOCIDADE
- Relacionado à velocidade na criação dos dados
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
METADADOS VANTAGENS:
- Auxiliar em análises estatísticas e controle de
- Metadados são também Metainformação
informações
- “Meta” significa “além de”
- Facilitar a classificação sobre o tipo dos dados
- São informações sobre os dados (arquivos)
- Tornar mais fácil a organização dos dados
- Estão anexadas aos dados
- Facilitar o relacionamento entre os dados
- Considerado dados sobre os dados
- Basicamente, todos equipamentos geram metadados - Data, tamanho, formato, Local (aparelhos com GPS)...
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
AUTOMÁTICO:
DATA MINING
- Sistema autossuficiente na realização das atividades
-Representado pelo termo Data Mining
- Depende da supervisão humana no sistema
- Mineração: Extrair ou explorar algo
SEMIAUTOMÁTICO:
- Dados: Palavras isoladas, termos, que geram informações
-Precisa de ação humana para descoberta dos dados
- Agiliza a análise de “dados escondidos” e espalhados
-Precisa se supervisão humana e manipulação nos programas.
inteligência artificial...
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
ETL
Processo para alimentar os relatórios. ETL (Extract,
DATA WAREHOUSE:
Não são derivados Data Marts a partir de metadados.
Transform, Load). Em outras palavras, esse processo
Replicação é uma cópia que pode ser realizada do
realiza três operações.
próprio Enterprise Data Warehouse para diversas
transacional
FONTE DE DADOS:
Sistemas Legados, Point of Sale (POS),Aplicações web e
USUÁRIOS
(Ferramentas) OLAP-Relatórios, Mineração de dados e
textos, Aplicações.
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
20
15
10
0
Item 1 Item 2 Item 3 Item 4 Item 5
EXTRACT
TRANSFORM
LOAD
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
PROCESSO DE KDD
O processo de KDD (Knowledge Discovery in Databases) foi formalizado em 1989 em referência a procura de
conhecimento a partir de bases de dados. Seu objetivo principal é extrair conhecimento de grandes bases dados.
O processo de KDD é composto por cinco fases: seleção de dados, pré-processamento, transformação, mineração e
interpretação/avaliação.
Esse processo é aplicado na identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir
OBJETIVOS:
Provisão, Identificação Classificação e Otimização
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
PREDIÇÃO (PREVISÃO)
TAREFAS
-“Dizer antecipadamente o que vai acontecer”
DESCRIÇÃO -Apresenta consequências de uma ação ou omissão, como
- Descrever novos padrões e tendências
os dados se comportarão no futuro...
-Geralmente revelados pelos dados minerados
-Pode ser por regras já conhecidas ou por adivinhações
-Descrever novos aprendizados adquiridos com a mineração
-Se baseia em conceitos estatísticos e dados já
- Um sistema é capaz de aprender com a mineração
conhecidos
-Auxilia a empresa a se preparar para surpresas e acidentes
CLASSIFICAÇÃO
-Identifica as classes existentes e comparar com os dados
OUTLIERS
-Classes são “tipos de dados”
- Termo em Inglês para EXCEÇÕES
-Auxilia no aprendizado de classificação de novos registros
- Registros importantes encontrados, mas que está
fora do padrão esperado
ASSOCIAÇÃO
- Muitas vezes são descartados
-Compara os atributos minerados
- Quando visto como problemas e não soluções
-Pode identificar possíveis problemas futuros
- Pode servir para detecção de fraudes e outras ações de
segurança
AGRUPAMENTO DE DADOS (CLUSTERING)
-Organiza os dados minerados em grupos
@CARREGAR0AC0NCURSEIRA
@RANIFPASSOS
APRENDIZAGEM SUPERVISIONADA aprendizagem faz com que robôs ,por exemplo, consigam
- Precisa de humano para oferecer exemplos trafegar por ambientes nunca explorados anteriormente.
- Comparar as classes apresentadas para minerar decisão em tempo real, tarefas que necessitam de
existentes
@CARREGAR0AC0NCURSEIRA