Você está na página 1de 4

Introdução a mineração de dados

DEF: (Mineração de dados): Extração não - trivial de informação implícita previamente


desconhecida e potencialmente útil a partir de dados.

O que não é mineração: Encontrar o máximo/mínimo de um conjunto de valores, ocorrências


mais frequentes, etc....

O que é mineração: Determinado conjunto de clientes características de campos semelhantes

1.1. Mineração e origem


Alguns problemas motivaram a criação do nome chamado MD como uma disciplina formal.
Escalabilidade: O aumento no volume de dados exige algoritmos escaláveis, novas
estruturas de dados e métodos de busca.
Dados heterogêneos: Métodos de análise tradicionais geralmente lidam com dados de
um mesmo tipo, salvos em formatos tabeladores. Recentemente surgiram dados
heterogêneos como páginas na web, jornada de cliques, etc.
Alta dimensionalidade: não é incomum encontrar dados com centenas ou milhares de
atributos, diferentemente de algumas dezenas como décadas atrás.

A mineração de dados exige então como um amalgama de disciplinas para suprir estas
demandas
(Venn)
Estatística IA Aprendizado de maquina Banco de dados

MD

1.2 Tarefas da MD
As aplicações da MD são separadas em tarefas, e estas tarefas em duas categorias:

TAREFAS

PREDITIVAS DESCRITIVAS

CLASSIFICAÇÃO REGRESSÃO AGRUPAMENTO ASSOCIAÇÃO

As tarefas preditivas buscam prever um atributo do BD com base em outros.


Geralmente o valor a ser estimado é chamado de valor alvo “target”, ou variável dependente.
Os atributos usados para realizar as previsões são chamados de variável independente.

Já as tarefas descritivas tem o objetivo de encontrar padrões, correlações, tendências,


agrupamentos, nos dados. Nessas tarefas não existe um valor “correto” em que estamos
interessados em descobrir.

1.2.1 – Classificação

Dado
1.2.2 – Regressão

A tarefa de regressão só se diferencia da classificação pois a variável target é


numérica. Ex.:

N quartos N banheiros Sacada RS/m^2


3 2 N 5,7
4 3 S 7,8
Identificar o preço/m^2 em função de N de quartos, banheiros, etc...

1.2.3 – Análise de Associação (Market Basket Analysis)

A análise de associação é usada para descobrir padrões que descrevam fortes


associações nos dados. Geralmente o conhecimento é extraído na forma de regras com a
seguinte estrutura: A -> B

Em que A é chamado antecedente e B conseguinte. A informação é lida da seguinte forma:


Muitas vezes em que A aconteceu, B também aconteceu. Considere o banco de dados de
transações de um mercado:

Transação Itens comprados


1 pão, manteiga, leite, carne
2 café, açúcar, ovos
3 pão, chá
4 leite, carne

Nesse caso, poderíamos ter uma regra da seguinte forma:

Leite; Pão -> Chá

1.2.4 – Agrupamento

A tarefa de agrupamento busca criar subconjuntos nos dados que possuem


algum tipo de semelhança

Pensando em um banco de dados com 2 atributos (X, Y)

Seja o seguinte banco de dados de peças e maquinas em que estas peças


passam:

M1 M2 M3 M4 M5
P1 X X
P2 X X
P3 X X X
P4 X X
Considere o banco de dados a seguir:

Delta T Início Fim Máquina Funcionário Dia Defeito


30 08:00 08:30 “A” “Dwight” “seg” SIM
60 09:00 10:00 “A” “Michael” “ter” SIM
30 10:00 10:30 “B” “Angelo” “qua” NÃO
... ... ... ... ... ... ...

PROGRAMAÇÃO EM PYTHON

Íliada em grego

Amigo que fala grego Amigo escreve livro inteiro traduzido

Falar palavra a palavra pra você Você lê o livro

Interpretada Compilada

Pyhton no cmd

Quit para voltar pra prompt

C:\Users\User>python "C:\Users\User\OneDrive - ufpr.br\Área de Trabalho\Python\


python.py"

C:\Users\User>pip –version

C:\Users\User>pip list

C:\Users\User>pip install notebook

Python –m notebook

A g: se der ruim

Mudar diretório

 Pega o caminho da pasta


 Bota no cmd

Júpiter

Você também pode gostar