Escolar Documentos
Profissional Documentos
Cultura Documentos
Objetivo
Estudar a relação entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças
Tempo de prática de esportes e ritmo cardíaco
Tempo de estudo e nota na prova
Taxa de desemprego e taxa de criminalidade
Expectativa de vida e taxa de analfabetismo
Investigaremos a presença ou ausência de
relação linear sob dois pontos de vista:
4,5
3,5
0 5 10
Tempo
Coeficiente de correlação linear
É uma medida que avalia o quanto a “nuvem de pontos”
no diagrama de dispersão aproxima-se de uma reta.
O coeficiente de correlação linear de Pearson é dado por:
sendo que,
X e Y são as médias amostrais de X e Y, respectivamente,
S X e S Y são os desvios padrão de X e Y, respectivamente.
Fórmula alternativa:
No exemplo:
- - - -
Tempo (X) Nota (Y) (X - X) (Y - Y) (X - X) (Y - Y)
3,0 4,5 -2,1 -1,1 2,31
7,0 6,5 1,9 0,9 1,71
2,0 3,7 -3,1 -1,9 5,89
1,5 4,0 -3,6 -1,6 5,76
12,0 9,3 6,9 3,7 25,53
25,5 28,0 0 0 41,2
- -
X 5,1 Y 5,6
2
(-2,1) ... (6,9) 2 78,2
S2
x 19,55 S x 4,42
4 4
2
(-1,1) ... (3,7) 2 21,9
S2
y 5,47 S y 2,34
4 4
Então,
41,2
r 0,9959
4 . 4,42 . 2,34
Propriedade: -1 r 1
Casos particulares:
O intervalo de r vai de –1 a 1.
–1 0 1
Se r está Se r está Se r está
próximo a –1, próximo de 0, próximo de 1,
há uma forte não há há uma forte
correlação correlação correlação
9
negativa. linear. positiva.
r = 1, correlação linear positiva e perfeita
40
30
Y
20
10
10 20 30 40 50
X
r 1 r -1
Linearidade da associação
Linearidade da associação
Correlação positiva
Y: taxa de criminalidade
X: taxa de analfabetismo
Diagrama de dispersão
Correlação entre X e Y:
Exemplo 3: expectativa de vida e
analfabetismo
Y: expectativa de vida
X: taxa de analfabetismo
Diagrama de dispersão
Correlação entre X e Y:
Reta ajustada:
O que são a e b?
a: intercepto
b: inclinação
Interpretação de b:
Para cada aumento de uma unidade em X, temos
um aumento médio de b unidades em Y.
Reta ajustada
(método de mínimos quadrados)
^
Y : valor predito para a taxa de criminalidade
X : taxa de analfabetismo
Interpretação de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a taxa de criminalidade (Y)
aumenta, em média, 4,257 unidades.
Graficamente, temos
^
Y : valor predito para a expectativ a de vida
X : taxa de analfabeti smo
Interpretação de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a expectativa de vida (Y)
diminui, em média, 1,296 anos.
Graficamente, temos
Exemplo 4: consumo de cerveja e
temperatura
400
Consum o
350
300
10 20 30 40
Temperatura
Qual a interpretação de b?
Aumentando-se um grau
de temperatura (X), o
consumo de cerveja (Y)
aumenta, em média, 4,74
litros por mil habitantes.
Y
Y
Y
?
X X X X
X
Yi Yi 1 yi yi 0
X i X i 1 xi xi 0
Coeficiente de Correlação
Interpretações errôneas dos coeficientes de correlação
Y
A
Y
Y
X X B
X
Exercício
• Suponha que um automóvel, para analisar o seu
consumo de combustível, efetuou 7 viagens, tendo-se
registrado a distância percorrida (km) e o consumo (l),
obtendo-se, então, os 7 pares de valores seguintes:
Exercício
• a) Escreva a equação da reta de regressão estimada
que relaciona distância em relação ao consumo.
Y= 14,0277778X - 1,96428571
Exercício
• b) Com 16 litros de combustível qual das duas
distâncias lhe parece mais provável de ser percorrida:
190 km ou 205 km?
R: y= 14,0277778X - 1,96428571
Y= 14,0277778 x (16) - 1,96428571
Y= 226,4087302
Resíduos Padronizados
Resíduos Padronizados
1.0 1.0 1.0
0.5 0.5 0.5
0.0 0.0 0.0
-0.5 -0.5 -0.5
-1.0 -1.0 -1.0
-1.5 -1.5 -1.5
-2.0 -2.0 -2.0
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
X X X
1.0 1.0
0.5 0.5
0.0 0.0
-0.5 -0.5
-1.0 -1.0
-1.5 -1.5
-2.0 -2.0
0 2 4 6 8 10 0 2 4 6 8 10
X tempo
X
Análise de Regressão no EXCEL
X Y 10
1 1.1 Y
Yˆ = 0,9983X
0,9983 X +0,1306
0,1306
8 2
2 1.9 R R
2 = 0,9496
0,9496
3 2.5 6
Y
4 4.3
4
5 6.1
RESUMO DOS RESULTADOS
6 6.3 2
Estatística de regressão
7 7.8 R múltiplo 0.9745
0
R-Quadrado 0.9496
8 7.0 R-quadrado ajustado 0.9424 0 2 4 6 8 10
Erro padrão 0.6735
X
9 9.1 Observações 9
s
ANOVA
gl SQ MQ F F de significação
Regressão 1 59.8002 59.8002 131.8267 8.54714E-06
Resíduo 7 3.1754 0.4536 valor-P
Total 8 62.9756
s2
Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores
Interseção 0.1306 0.4893 0.2668 0.7973 -1.0265 1.2876
X 0.9983 0.0870 11.4816 0.0000 0.7927 1.2039