Escolar Documentos
Profissional Documentos
Cultura Documentos
Conceitos e Técnicas
DM, DW e OLAP
Data Warehousing e OLAP para
Data Mining
Layer2
MDDB
MDDB
Meta Data
1. Ignorar a tupla;
2. Preencher o valor manualmente;
3. Usar uma constante global;
4. Usar o valor médio do atributo na base;
5. Usar o valor médio do atributo na classe;
6. Usar o valor mais provável.
Principais tarefas no pré-
processamento dos dados
• Limpeza dos dados: Atenuação de
dados ruidosos
1. Discretização;
2. Agrupamento;
3. Interação humana;
4. Regressão.
Principais tarefas no pré-
processamento dos dados
• Limpeza dos dados: Inconsistências
1. Eliminar dados;
2. Corrigir manualmente;
3. Ignorar.
Principais tarefas no pré-
processamento dos dados
• Integração de dados:
– Integração de esquemas de BD: problema
da identificação de entidades;
– Redundâncias;
– Detecção e resolução de valores
conflitantes nos dados.
Principais tarefas no pré-
processamento dos dados
• Transformações nos dados:
– Suavização (smooting);
– Agregação;
– Generalização;
– Normalização (entre 0 e 1);
– Construção de atributos.
Principais tarefas no pré-
processamento dos dados
• Redução de dados:
– Agregação de data cubes;
– Redução de dimensionalidade;
– Compressão de dados;
– Redução de instâncias;
– Geração de hierarquias de conceitos.
Formas de pré-processamento
de dados
Sumário
• A preparação do dados é um ponto crucial
tanto para data warehousing quanto para data
mining;