Você está na página 1de 13

Data Mining

Douglas Betoni
Evelin Karpavicius
Gustavo Ziger
Raliel Ferreira
Roteiro
• O que é Data Mining;
• História e avanços recentes;
• Importância;
• Quem usa;
• Como funciona;
• Modelagem Descritiva;
• Modelagem Preditiva;
• Modelagem Prescritiva;
• Ramificações;
O que é Data Mining

• Análise de dados acumulados ao longo do


tempo por ferramentas e/ou sistemas;
• Subconjunto do universo Big Data;
• Caracterizam-se de acordo com a tarefa a ser
resolvida;
• Pressupõe a existência de um conjunto de
dados relacional;
O que é Data Mining

• Descoberta de Associações;
• Classificação;
• Regressão;
• Agrupamento(Clusterização);
• Processo usado para encontrar padrões e
anomalias em grandes conjuntos de dados e
prever resultados;
História e avanços recentes

• A origem do termo mineração data de 1990;


• Sua base compreende:
I. Estatística;
II. Inteligência Artificial;
III. Machine Learning;
• Sempre em evolução para acompanhar o
potencial da Big Data;
Importância

A mineração de dados pode permitir:

• Separar ruídos caóticos e repetitivos em


sequencias de dados;
• Entender a relevância de certos dados para
então avaliação;
• Acelerar o ritmo de tomadas de decisão
estratégica;
Quem usa

• Comunicação;
• Educação;
• Seguros;
• Manufatura;
• Bancos;
• Varejo;
Como funciona

Compreende uma variedade de métodos ou


técnicas usadas em diferentes capacidades
analíticas:
Modelagem Descritiva
Clustering
Agrupa registros semelhantes.

Identifica valores discrepantes


Detecção de anomalias
multidimensionais.

Regras de associação Detecta relações entre os registros.

Análises do componente principal


Detecta relações entre as variáveis.

Agrupa pessoas com interesses comuns ou


objetivos semelhantes (ex., pessoas que
Grupos de afinidade
compram X podem comprar Y e,
possivelmente, Z).
Modelagem Preditiva

Uma medida da força da relação entre


Regressão uma variável dependente e uma série de
variáveis independentes.
Programas de computadores que
Redes neurais detectam padrões, fazem previsões e
aprendem disso.
Diagramas na forma de árvores em que
Árvores de decisão cada galho representa uma ocorrência
provável.
Modelos de aprendizagem supervisionada
Máquinas de vetores de suporte com seus algoritmos de aprendizagem
associados.
Modelagem Prescritiva

Desenvolve regras do tipo se/então


Análises preditivas e suas regras
a partir de padrões e prevê
resultados.
Simula, em tempo real, o mix de
Otimização de marketing
mídia mais vantajoso para alcançar
o maior ROI possível.
Ramificações

O Data Mining é um campo que


compreende diversas ramificações
importantes. Cada tipo de tecnologia possui
suas próprias vantagens e desvantagens.
Ramificações

• Redes Neurais;
• Indução de Regras;
• Árvores de Decisão;
• Análise de Séries Temporais;
• Visualização;

Você também pode gostar