Escolar Documentos
Profissional Documentos
Cultura Documentos
Conceitos e Tcnicas
DM, DW e OLAP
1.
2.
3.
4.
Processamento analtico:
Anlise multi-dimensional doas dados contidos no
data warehouse;
Suporta operaes OLAP bsicas (slice-dice,
drilling, pivoting);
Mining result
Layer4
User Interface
OLAM
Engine
OLAP
Engine
Layer3
OLAP/OLAM
MDDB
MDDB
Meta Data
Filtering&Integration
Database API
Filtering
Layer1
Data cleaning
Databases
Data
Data integration Warehouse
Data
Repository
Pr-processamento de
dados
Medida multidimensional da
qualidade dos dados
Uma viso multidimensional bem aceita:
Correo;
Completude;
Consistncia;
Atualidade (timeliness);
Credibilidade;
Valor adicionado;
Interpretabilidade;
Acessibilidade.
Categorias abrangentes:
Intrnseca, contextual, representacional e
acessibilidade.
Integrao de dados:
Integrao de mltiplos DB, data cubos, e arquivos;
Reduo de dados:
Obteno de uma representao reduzida em
volume mas que produz resultados de anlise
idnticos ou similares.
Ignorar a tupla;
Preencher o valor manualmente;
Usar uma constante global;
Usar o valor mdio do atributo na base;
Usar o valor mdio do atributo na classe;
Usar o valor mais provvel.
Discretizao;
Agrupamento;
Interao humana;
Regresso.
Suavizao (smooting);
Agregao;
Generalizao;
Normalizao (entre 0 e 1);
Construo de atributos.
Formas de pr-processamento
de dados
Sumrio
A preparao do dados um ponto crucial
tanto para data warehousing quanto para data
mining;
A preparao de dados inclui:
Limpeza e Integrao de dados;
Reduo de dados e seleo de caractersticas;
Discretizao: intervalos iguais, freqncias iguais,
agrupamento.