Escolar Documentos
Profissional Documentos
Cultura Documentos
Correlao e Regresso
9-1 Aspectos Gerais 9-2 Correlao 9-3 Regresso 9-4 Intervalos de Variao e Predio 9-5 Regresso Mltipla
9-1
Aspectos Gerais
Dados Emparelhados
9-2
Correlao
Definio
Correlao existe entre duas variveis quando uma delas est, de alguma forma, relacionada com a outra.
Suposies
1. A amostra de dados emparelhados (x,y) uma amostra aleatria. 2. Os pares de dados (x,y) tem uma distribuio normal bivariada.
Definio
Diagrama de Disperso um grfico de dados amostrais emparelhados (x,y) com o eixo x horizontal e o eixo y vertical. Cada par individual (x,y) plotado como um ponto.
6
Diagrama de Disperso
x
(a) Positiva (b) Positiva Forte
Figura 9-1
Diagramas de Disperso
8
x
(d) Negativa (e) Negativa Forte
x
(f) Negativa Perfeita
Figura 9-1
Diagramas de Disperso
9
(g) No h Correlao
Figura 9-1
Diagramas de Disperso
10
Notao
- 2 = (x2) n( x )2 Sxx = (x x) - 2 = (y2) n( y )2 Syy = (y y) - Sxy = (x x)(y y) = (xy) n ( x )( y )
11
Definio
r=
Frmula 9-1
xy r
indica que devemos multiplicar cada valor de x pelo valor correspondente de y e somar ento todos estes produtos. representa o coeficiente de correlao linear para uma amostra. representa o coeficiente de correlao linear para uma populao
13
14
= .05
,950 ,878 ,811 ,754 ,707 ,666 ,632 ,602 ,576 ,553 ,532 ,514 ,497 ,482 ,468 ,456 ,444 ,396 ,361 ,335 ,312 ,294 ,279 ,254 ,236 ,220 ,207 ,196
= .01
,999 ,959 ,917 ,875 ,834 ,798 ,765 ,735 ,708 ,684 ,661 ,641 ,623 ,606 ,590 ,575 ,561 ,505 ,463 ,430 ,402 ,378 ,361 ,330 ,305 ,286 ,269 ,256 15
250 200
Distncia (ps)
150 100 50
Tempo (segundos)
Diagrama de disperso da distncia acima do solo e do tempo para um objeto lanado para cima
18
Estatstica de Teste:
t=
r
1-r2 n-2
Valores Crticos:
Figura 9-4
21
-1
r = - 0,811
Figura 9-5
22
FIGURA 9-3
MTODO 1
MTODO 2
A estatstica de teste
t=
Se o valor absoluto da estatstica de teste excede os valores crticos, rejeitar H0: = 0 Caso contrrio, no rejeitar H0
Se H0 rejeitada, concluir que h Correlao linear significativa. Se H0 no rejeitada, ento no h evidncia suficiente para concluir pela existncia de uma correlao linear.
23
n=8
= 0,05
H 1 : 0
H0: = 0
24
= 0,05
H0: H1
=0 : 0
n
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 60 70 80 90 100
= ,05
,950 ,878 ,811 ,754 ,707 ,666 ,632 ,602 ,576 ,553 ,532 ,514 ,497 ,482 ,468 ,456 ,444 ,396 ,361 ,335 ,312 ,294 ,279 ,254 ,236 ,220 ,207 ,196
= ,01
,999 ,959 ,917 ,875 ,834 ,798 ,765 ,735 ,708 ,684 ,661 ,641 ,623 ,606 ,590 ,575 ,561 ,505 ,463 ,430 ,402 ,378 ,361 ,330 ,305 ,286 ,269 ,256
25
-1
r = - 0,707
r = 0,707
Dados amostrais: r = 0,842
26
r=
(x -x) (y -y)
(n -1) sx sy
y
24 20
II Quadrante
(x, y)
x=3
x - x = 7- 3 = 4
I Quadrante
(7, 23)
y - y = 23 - 11 = 12
16 12 8 4 0 0
(x, y)
IV Quadrante
y = 11
III Quadrante
FIGURA 9-6
x
2 3 4 5 6 7
27
^ y = b0 + b1x
descreve a relao entre as duas variveis
Reta de Regresso
29
A Equao de Regresso
x a varivel independente
(varivel preditora)
^y a varivel dependente
(varivel resposta)
^ y = b0 +b1x y = mx +b
b0 = y - intercepto b1 = inclinao
30
0 1
y = 0 + 1 x
b0 b1
^ y = b0 + b1 x
31
Suposies
1. Estamos investigando apenas relaes lineares. 2. Para um dado valor de x, y uma varivel aleatria com distribuio normal (em forma de sino). Todas essas distribuies de y tem a mesma varincia. E ainda, para um dado valor de x, a mdia da distribuio dos valores de y est sobre a reta de regresso. (Os resultados no so afetados seriamente se os desvios da normalidade e da igualdade da varincia no so grandes.)
32
Frmula para b0 e b1
Frmula 9-2
b0 = b1 =
--b x y 1
(Sxy) (Sxx)
(intercepto y)
Frmula 9-3
(coeficiente angular
34
Predies
Ao predizer um valor de y com base em determinado valor de x ...
1. Se no h uma correlao linear significativa, o melhor valor predito de y y.
2. Se h uma correlao linear significativa, obtm-se o melhor valor predito de y substituindo-se o valor de x na equao de regresso.
35
FIGURA 9-7
Calcular r e testar a hiptese que = 0 H correlao linear significativa ? No Dado um valor arbitrrio de uma varivel, o melhor valor Predito da outra varivel sua mdia amostral. Utilizar a equao de regresso para fazer predies. Levar o valor Dado na equao de regresso.
Sim
36
Qual a melhor predio do tamanho de uma residncia que descarta 0,227 kg de plstico?
Dados do Projeto Lixo: Anlise de plstico descartado
x Plstico (kg) 0,122 0,640 0,993 1,284 0,993 0,821 0,386 1,383 y Tamanho da residncia
b0 = 0,549 b1 = 3,263
y = 0,549 + 3,263 (0,227) y = 1,29
Uma residncia que que descarta 0,227 kg de plstico tem aproximadamente uma pessoa.
38
Definies
Variao Marginal
a quantia que uma varivel varia quando a outra varivel sofre uma variao de exatamente 1 unidade
Outlier
um ponto que est muito afastado dos demais pontos.
Pontos de Influncia
pontos que afetam fortemente o grfico da reta de regresso.
39
40
^ = 5 + 4x y
Resduo = 7 Resduo = 11
Resduo = -5
2 3 4
Resduo = -13
5
FIGURA 9-8
41
9-4
Definies
Desvio Explicado
^ a distncia vertical y - y, que a distncia entre o valor predito y e a reta horizontal que passa pela mdia amostral y. ^ a distncia vertical y - y, que a distncia vertical entre o ponto (x, y) e a reta de regresso. (A distncia y - ^ y tambm chamada resduo, definido na Seo 9-3.)
Desvio no-explicado
43
(5, 19)
(5, 9) ^ y = 3 + 2x
y=9
x
1 2 3 4 5 6 7 8 9
44
(desvio total)
(y - y) =
(y - y)
(y - y)
(variao total)
(y - y) =
(y^-
y)
+ (y - y)
^ 2
Frmula 9-5
45
Definio
Coeficiente de determinao
o valor da variao de y que explicado pela reta de regresso
46
Intervalos de Predio
Definio
Erro-padro da estimativa
uma medida das diferenas (ou distncias) entre os valores amostrais y observados e os ^ valores preditos y obtidos atravs da reta de regresso.
47
Erro-padro da Estimativa
(y
^ 2 - y)
n-2
ou
y - b0 y - b1 xy
2
n-2
Frmula 9-6
48
9-5
Regresso Mltipla
Definio
^=b +b x +b x +...+b x y 0 1 1 2 2 k k
50
Notao
(Forma geral da equao de regresso mltipla estimada)
y = b0 + b1 x1+ b2 x2+ b3 x3 +. . .+ bk xk
51
Notao
0 = intercepto y, ou valor de y quando todas as
variveis preditoras so 0.
R Ajustado Definies
Coeficiente de determinao mltipla
uma medida do grau de ajustamento da equao de regresso mltipla aos dados amostrais
53
R Ajustado
2
(n - 1)
[n - (k + 1)]
(1 - R )