Escolar Documentos
Profissional Documentos
Cultura Documentos
Sexta Edição
Cap. 13 – Correlação e
Regressão
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Correlação
• X e Y variáveis quantitativas
X Y
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Correlação
• X e Y estão positivamente correlacionadas
quando elas caminham num mesmo
sentido;
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Correlação
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1
Município DistCap EspVida MortInf Alfab Renda
Araruna (PR) 365 67,99 23,19 86,23 188,29
Nova Redenção (BA) 278 61,19 56,56 63,00 74,79
Monção (MA) 150 59,58 63,32 63,64 66,96
Porto Rico do Maranhão (MA) 78 58,96 66,05 79,33 65,34
Campo Erê (SC) 468 68,10 31,71 83,38 173,38
Lagoa do Piauí (PI) 40 63,65 47,08 65,81 60,00
São José das Palmeiras (PR) 486 71,01 16,62 77,54 150,67
Paraíba do Sul (RJ) 83 71,36 15,69 89,28 264,55
Malhada dos Bois (SE) 65 64,46 44,18 69,95 80,69
Jandaíra (BA) 175 62,45 51,57 59,72 58,68
Vespasiano (MG) 14 68,68 32,81 90,43 196,51
Ipaba (MG) 167 67,42 37,04 81,82 125,75
65
63
61
59
100 150 200 250 300 350 400 x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Î Diagramas de dispersão:
80
70
60
50 150 250
Renda per capita (R$)
55
45
35
25
15
60 65 70
Esperança de vida ao nascer
80
70
60
15 25 35 45 55 65
Taxa de mortalidade infantil
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1Î Diagramas de dispersão:
80
70
60
0 100 200 300 400 500
Distância à capital (km)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de Correlação
• Não deve depender da unidade de medida das variáveis
• Padronização (x, y) Î (x’, y’) para cada par de valores:
x − X y − Y
x′ = y′ =
Sx Sy
Média dos valores de X Média
Médiados
dosvalores
valoresde
deYX
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Efeito da padronização
14
y
12
10
8
6
4
(x, y )
2
0
0 2 4 6 8 x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Padronização
y'
2
0
-2 -1 0 1 2 x'
-1
(0, 0)
-2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Padronização - Exemplo 13.1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Idéia de construção do Coef. de Correlação de
Pearson
x − X y − Y
x′ = y′ =
Sx Sy
x’·y’
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
y’
Quadrante com Quadrante com
x’·y’ negativos x’·y’ positivos
x’
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
y’
Quadrante com
x’·y’ positivos
x’
Quadrante com
x’·y’ positivos
∑ x '⋅y' > 0
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
y’
Quadrante com
x’·y’ negativos
x’
Quadrante com
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
Quadrante com y’ Quadrante com
x’·y’ negativos
x’·y’ positivos
x’
∑ x '⋅y' ≈ 0
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Idéia de construção do Coef. de Correlação de Pearson
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplo 13.1
∑ (x ′ ⋅ y ′) 6,87
r= = = 0,981
n −1 7
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valores possíveis de r e interpretação da correlação
Sentido Força
+1 Forte
Positiva Moderada
Fraca
Valor Ausência
0
de r
Fraca
Moderada
Negativa
Forte
-1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Matriz de correlações. Dados da Tab. 13.1
DISTCAP
1 0,337 -0,400 0,087 0,205
ESPVIDA
0,337 1 -0,983 0,718 0,865
MORTINF
-0,400 -0,983 1 -0,684 -0,860
Interpretar.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Fórmula direta de calcular r
n ⋅ ∑ ( X ⋅ Y ) − (∑ X ) ⋅ (∑ Y )
r=
n ⋅ ∑ X 2 − (∑ X ) n ⋅ ∑ Y 2 − (∑ Y )
2 2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regressão linear simples
X Y
Variável independente ou Variável dependente ou
Variável explicativa Variável resposta
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regressão linear simples
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Exemplos de regressão:
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regressão
Amostra de observações
de (X, Y)
Conhecer o relacionamento
entre X e Y
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Regressão - Modelo
y = α + β.x + e Regressão
Linear
Simples
Parâmetros
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Pressupostos do modelo de regressão
y = α + β.x + e
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros α e β
• Construção da equação de regressão com base nos dados:
180
Altura do filho ( Y )
176
yˆ = a + bx
172
168
164
160
160 164 168 172 176 180
Altura média dos pais ( X )
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros α e β
• Construção da equação de regressão com base nos dados:
yˆ = a + bx
n ⋅ ∑(X ⋅ Y ) − (∑ X ) ⋅ (∑Y )
b=
n ⋅ ∑ X 2 − (∑ X ) (estimativa do beta)
2
∑Y − b ⋅ ∑ X
a= (estimativa do alfa)
n
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parâmetros α e β
Dados Cálculos
• Construção da equação de X Y X2 X ·Y
164 166 26.896 27.224
regressão com base nos dados.
166 166 27.556 27.556
Exemplo 13.5: 169 171 28.561 28.899
169 166 28.561 28.054
n ⋅ ∑(X ⋅ Y ) − (∑ X ) ⋅ (∑Y ) 171 171 29.241 29.241
b=
n ⋅ ∑ X 2 − (∑ X ) 173 171 29.929 29.583
2
176
174
172 yˆ = 22 + 0,872 x
170
168
166
164
160 165 170 175 180
Altura média dos pais (X)
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valores preditos e resíduos
yˆ = 22 + 0,872 x
x y Predito Resíduo
164 166 165,01 0,992
eˆ = y − yˆ
166 166 166,75 -0,752
169 171 169,37 1,632
169 166 169,37 -3,368
171 171 171,11 -0,112
173 171 172,86 -1,856
173 178 172,86 5,144
176 173 175,47 -2,472
178 178 177,22 0,784
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Valores preditos e resíduos
y
176
164
164 168 172 176
x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e não-explicada
y
Variação explicada
pelo modelo de regressão
176
172
Soma de quadrados devida ao
erro aleatório:
168
yˆ = 22 + ( 0 ,872 )x
SQE = ∑ (y − ˆ
y ) 2
164
164 168 172 176 x
172
Soma de quadrado total:
168
SQT = ∑ (y − y ) 2
y = 171 ,11
164
164 168 172 176 x
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e não-explicada
Soma de quadrado total: SQT = ∑ (y − y ) 2
0 ≤ R2 ≤ 1
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e não-explicada. Exemplo 13.5
Média
x y y y −y (y −y)
2
Y = altura do filho
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e não-explicada. Exemplo 13.5
Preditos
x y ŷ y − yˆ (y − ŷ )2
164 166 165,01 0,992 0,98
166 166 166,75 -0,752 0,56
169 171 169,37 1,632 2,66
169 166 169,37 -3,368 11,36
171 171 171,11 -0,112 0,01
173 171 172,86 -1,856 3,46
173 178 172,86 5,144 26,42
176 173 175,47 -2,472 6,1
178 178 177,22 0,784 0,61
0 52
SQE = ∑ (y − ˆ
y ) 2
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.
Variação explicada e não-explicada. Exemplo 13.5
SQR 125
R2 = = = 0,706 ou 70,6%
SQT 177
Interpretar.
PEDRO A. BARBETTA – Estatística Aplicada às Ciências Sociais 6ed. Editora da UFSC, 2006.