Escolar Documentos
Profissional Documentos
Cultura Documentos
adanlucio@gmail.com
https://sites.google.com/site/adanluciop/
Vitória - ES
Bibliografia Básica e Complementar
Objetivos da Aula
Apresentar os o Conceito de
Correlação e Regressão .
Estudos Estatísticos
Mineração: Etapa central do Análise do
processo de Descoberta de Resultado
Conhecimento
Mineração
Pré-preocessamento
Transformação
Limpeza
Seleção
Banco de
Dados 4
Diagrama de Dispersão
X: 25 28 31 34 37 Y: 17 23 30 39 46
6
Diagrama de Dispersão
7
Diagrama de Dispersão
8
Diagrama de Dispersão
O gráfico assim obtido é chamado diagrama de dispersão. O diagrama de dispersão permite visualizar
a relação entre duas variáveis. Se X e Y crescem no mesmo sentido, existe uma correlação positiva
entre as variáveis. Se X e Y variam em sentidos contrários, existe correlação negativa entre as
variáveis.
9
Diagrama de Dispersão
10
Diagrama de Dispersão
11
Diagrama de Dispersão
Através do diagrama de dispersão é
possível observar que, em geral,
valores de idade mais altos são
associados com valores de pressão
intra-ocular mais altos (as
variáveis parecem relacionadas).
12
Diagrama de Dispersão
13
Correlação
A correlação será
tanto maior
quanto menor
for a dispersão
dos pontos.
14
Correlação
15
Correlação
Correlação
Pode acontecer, no entanto, de a variação
de Y não estar relacionada com a variação
de X. Nesses casos, o diagrama de
dispersão mostra que X cresce e Y varia
ao acaso. Dizemos, então, que a
correlação entre as variáveis é nula ou, o
que é o mesmo, que não existe correlação
entre as variáveis.
17
Correlação
18
Correlação
19
Correlação
20
Correlação
21
Correlação
22
Correlação
23
Correlação
24
Correlação
Existe Correlação
entre X e Y !
25
Correlação
26
Correlação
correlação não implica causa. Uma correlação positiva entre duas variáveis mostra que essas
variáveis crescem no mesmo sentido, mas não indica que aumentos sucessivos em uma das
variáveis causam aumentos sucessivos na outra variável
27
Gráfico de Linhas
Por exemplo, altura de criança varia em função da idade. Então altura é a variável
dependente e idade é a variável explanatória.
28
Gráfico de Linhas
29
Gráfico de Linhas
1940 41.236.315
1950 51.944.397
1960 70.191.370
1970 93.139.037
1980 119.002.706
1991 145.815.796
2000 169.799.170
30
Reta de Regressão
Y=a+bX
• Estes parâmetros determinam as características da função que
relaciona ‘Y’ com ‘X’.
31
Reta de Regressão
32
Reta de Regressão
33
Reta de Regressão
E o coeficiente linear é obtido por meio da fórmula, considerando Xbarra e Ybarra como unidades de X e Y:
34
Reta de Regressão
35
Reta de Regressão