Você está na página 1de 10

4.

1 - Análise de Dados
• Objetivos:

• Conceito de correlação.

• Formatação dos dados para análise


de correlação.

• Interpretar coeficientes numa matriz


de correlação.

2 - Preparação de Dados
• A correlação é uma ferramenta estatística.

• Utilizada para medir o grau de relacionamento entre um conjunto de


atributos de um dado conjunto de dados,

• utilizando os coeficientes de correlação.

Todos os coeficientes estão entre o intervalo [-1, 1]

2 – Análise de correlação
Um exemplo da matriz de correlação no RapidMiner

• Um coeficiente de correlação entre:

•0 a -1 indica uma correlação negativa.


•0 a 1 indica uma correlação positiva.

2 - Análise de Dados
Sempre que ambos os valores dos atributos evoluem no
mesmo sentido a correlação é positiva.

Sempre que ambos os valores dos atributos evoluem em


sentidos opostos a correlação é negativa.

2 – Análise de dados
Os coeficientes de correlação dizem-nos não só se existe
uma relação entre os atributos mas também o grau de
relacionamento.

2 – Análise de Dados
Um exemplo da informação mútua na matriz do RapidMiner.

• Podemos analisar a evolução dos valores no mesmo sentido, ou diretamente


correlacionados.

• Quanto maior o valor mais forte é o relacionamento.

3 – Análise de Dados
• Alguns itens importantes a reter:

• Estas regras são gerais e não exatas.

• Necessitam de ser validadas com outras regras.

• Um coeficiente de correlação de 0,2 pode indicar uma interação entre os atributos, ainda
que não seja estatísticamente significativa.

A correlação não é uma prova. Assumir o contrário pode ser perigoso e por vezes falso.

Os coeficientes não são percentagens.

2 - Análise de Dados
PROBLEMA DE CORRELAÇÃO

Sarah é gestora comercial de uma empresa de combustíveis com forte


fornecimento de combustiveis para aquecimento. A volatilidade dos
preços neste mercado deixou a Sara preocupada com a procura. Assim
foi tentar entender o comportamento e outros fatores que possam
infkuenciar a procura do combustivel de aquecimento no mercado
doméstico.
Quais os fatores que estão relacionados com a utlização do
combustivel de aquecimento. Como é que podemos utilizar este
conhecimento para gerir o armazenamento de forma a responder à
procura, antecipando a compra.

2 – Análise de Dados no RapidMiner


No RapidMiner importe o conjunto de dados do
capítulo 4

2 – Análise de Dados no RapidMiner

Você também pode gostar