Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Anlise de correlao: dedica-se a inferncias estatsticas das
medidas de associao linear que se seguem:
2
REGRESSO LINEAR SIMPLES
Y = 0 + 1 X + E
sendo,
Exemplo:
3
Se fixarmos a profundidade da gua em xi , a temperatura vai variar
devido a outras influncias aleatrias. Assim, para cada xi fixo estamos
a lidar com uma varivel aleatria Yi de mdia Yi ( Yi depende de xi,
pois a temperatura mdia da gua profundidade xi , deve de ser
diferente da temperatura mdia profundidade xj xi ).
Yi = 0 + 1x i + E i i=1,...,n .
y i = 0 + 1x i + i i=1,...,n .
Yi
Realizao da v.a. Ei
y = Y / x =1000 = b 0 + b1 1000
y i = b 0 + b1x i + d i
onde
d i = y i y i = y i (b 0 + b1x i )
6
essencialmente a escolher a recta que se aproxima o mais possvel de
todos os pontos dos dados simultaneamente.
dos resduos i =1 i =1
n
SSE
= 0
n
i 0 1 i = x i yi n x y
b 2 ( y b b x ) 0
b1 = i =1
= "
SSE
0 i 1 n
=0
n
2 ( y i b 0 b1x i ) x i = 0 x i
2
nx 2
b1 i =1 i =1
b 0 = y b1x
7
REGRESSO LINEAR MLTIPLA
Y = 0 + 1X1 + " + k X k + E
sendo,
Exemplo:
8
Consideremos as seguintes variveis:
# # # % #
9
Temos ento n variveis aleatrias,
Y1 = 0 + 1x11 + " + k x k1 + E1
Y2 = 0 + 1x12 + " + k x k 2 + E 2
Yn = 0 + 1x1n + " + k x kn + E n
Em notao matricial,
Y1 1 x11 x 21 " x k1 0 E1
Y 1 x x 22 " x k 2 1 E 2
=
2 12 +
# # # # % # # #
NYn 1 x1n x 2 n " x kn k E n
N N
Y X E
Y=X+E
10
Admite-se que E1, E2,..., En so variveis aleatrias independentes
de mdia zero e varincia 2.
2.
(y1, x11, x21,...,xk1), (y2, x12, x22,...,xk2) ,..., (yn, x1n, x2n,...,xkn).
Yi
Realizao da v.a. Ei
11
Temos ento o seguinte sistema de equaes,
y1 = 0 + 1x11 + " + k x k1 + 1
y = + x + " + x +
2 0 1 12 k k2 2
#
y n = 0 + 1x1n + " + k x kn + n
y1 1 x11 x 21 " x k1 0 1
y 1 x x 22 " x k 2 1 2
2 = 12 +
# # # # % # # #
Ny n 1 x1n x 2 n " x kn k n
N N
y X
Isto ,
y=X+
12
A partir dos dados disponveis (observados) estimamos 0 , 1,...,
k e substitumos estes parmetros tericos pelas suas estimativas b0,
b1, ...,bk para obter a equao de regresso estimada:
y = Y / x1 = 4, x 2 = 3 = b 0 + b1 4 + b 2 3 .
d i = y i y i = y i (b 0 + b1x1i + b 2 x 2i + ... + b k x ki )
Soma dos n n
= SSE = d i = ( y i b 0 b1x1i b 2 x 2i ... b k x ki )
2 2
quadrados dos i =1 i =1
resduos
13
Para determinar b0, b1,..., bk de modo a minimizar SSE resolve-se o
sistema de equaes:
SSE SSE SSE
=0 = 0 " =0
b 0 b1 b k
b0 0
b
Obtm-se o vector b = 1 = X t X
#
( )
1 t
X y estimativa para = 1 .
#
b k k
0
O estimador obviamente, = 1 = X t X
#
( )
1
XtY.
k
i =1
14
COEFICIENTE DE CORRELAO E DE DETERMINAO
( y i y) = ( y i y i ) + ( y i y)
i =1 i =1 i =1
Isto :
15
SSR SST SSE SSE
r2 = = =1
SST SST SST
Note que:
0r21;
Neste sentido este coeficiente pode ser utilizado como uma medida
da qualidade do ajustamento, ou como medida da confiana depositada
na equao de regresso como instrumento de previso:
16
coeficiente de correlao simples (se est envolvida apenas
uma varivel independente)
coeficiente de correlao mltiplo (se esto envolvidas pelo
menos 2 variveis independentes)
r = r2
-1r1;
17
r=0 indica a inexistncia de qualquer relao ou tendncia linear
entre X e Y podendo no entanto existir uma relao no linear
entre elas. Isto , possvel que as duas variveis estejam
fortemente associadas (movimentos numa varivel esto
associados a movimentos na outra) sem que o relacionamento
seja linear.
i =1
0r1;
18
PROPRIEDADES DOS ESTIMADORES DOS MNIMOS
QUADRADOS E TESTES DE HIPTESES
0
(
= 1 = X t X
#
)
1
XtY .
k
( )
E i = i i=1,...,k;
( )
Var i = 2 c ii
Ento,
SSE
S 2 = S2 c ii = c ii .
i n k 1
20
Testes sobre os coeficientes de regresso
H 0 : i = 0
.
H1 : i 0
Sabemos que
i ~ N(i, 2 cii ),
ento
i i
~ N(0,1) .
c ii
SSE
S=
n k 1
vindo,
i i i i
= ~ t n k 1 .
S S c ii
i
i 0 i 0
= ~ t n k 1 .
S S c ii
i
21
Se H0 for rejeitada ento temos evidncia de que i0, isto a
varivel explicativa Xi til na predio do valor da varivel
dependente.
H 0 : i = i 0
.
H1 : i i 0
i i 0 i i 0
= ~ t n k 1 .
S S c ii
i
H 0 : i = i 0 H 0 : i = i 0
.
H1 : i > i 0 H1 : i < i 0
22
Teste F para testar a significncia da regresso
A hiptese nula :
ou equivalentemente,
Matematicamente:
H 0 : 1 = 2 = ... = k = 0
.
H1 : pelo menos um i 0
SSR k SSR k
F= = ~ Fnk k 1 .
SSE (n k 1) S2
Note que,
n k 1 R2
= .
k 1 R 2
23
Rejeitamos H0 para valores grandes da estatstica do teste F. parte
n k 1
da constante a estatstica F a razo entre a variao explicada
k
e a no explicada em Y. natural que digamos que a regresso
significativa s quando a proporo da variao explicada grande. Isto
ocorre s quando a razo F grande. Por esta razo devemos sempre
rejeitar H0 para valores de F muito grandes.
H 0 : 1 = 0
H1 : 1 0
1 0
~ t n 2 .
S Sob H0
1
24
Os resultados descritos podem ser convenientemente resumidos na
tabela da ANOVA seguinte:
n
Devido aos n-k-1 SSE SSR k
SSE= (y i y i )2 = S2 F=
resduos i =1
n k 1 S2
Total n n-1
SST= (y i y )2
i =1
25