Escolar Documentos
Profissional Documentos
Cultura Documentos
HOFFMAN Analise de Regressão - Uma Introdução A Econometria
HOFFMAN Analise de Regressão - Uma Introdução A Econometria
2015
http://www.producao.usp.br/handle/BDPI/48616
Downloaded from: Biblioteca Digital da Produo Intelectual - BDPI, Universidade de So Paulo
ANLISE DE REGRESSO
Uma Introduo Econometria
Rodolfo Hoffmann
maro de 2015
SUMRIO
PREFCIO
sugestes e correes nesta 4a edio. E a tarefa de digitar todo o texto novamente foi
realizada com muita competncia e cuidado por Joselene Rodrigues da Silva.
Cabe, finalmente, registrar as boas condies de trabalho fornecidas pelas
instituies onde trabalhei e trabalho, a ESALQ-USP e o IE-UNICAMP, e agradecer o
apoio recebido da FAPESP e do CNPq.
Para esta nova edio em meio digital de 2015 contei com a indispensvel
colaborao de Helena Aparecida Cardoso.
Sugestes, correes ou dvidas podem ser enviadas para o e-mail do autor:
hoffmannr@usp.br.
(i = 1, K , n)
1.2. Dizemos que as duas variveis esto relacionadas de acordo com um modelo
estatstico.
5
P ( X = k ) = p k (1 p ) 5 k
k
Esta a funo de probabilidade da distribuio binomial para n = 5, onde n o
nmero de ensaios.
Se a varivel aleatria contnua, a probabilidade de obtermos exatamente um
determinado valor k zero, isto :
P( X = k ) = 0
Um desenvolvimento mais detalhado da maioria dos temas abordados nesta reviso pode ser encontrado
em HOFFMANN (1980).
f (X ) =
1
2 2
( X ) 2
exp
2 2
= E ( X ) = X i P( X i )
e, se a varivel aleatria contnua, a esperana de X
+
= E ( X ) = xf ( X )dX
2 = V ( X ) = E[ X E ( X )] 2 = E ( X ) 2
A varincia uma medida de disperso da distribuio.
Demonstremos, a seguir, que, se K uma constante, V ( KX ) = K 2V ( X ) .
Temos
V ( KX ) = E[ KX E ( KX )] 2 =
= E[ KX KE ( X )] 2 =
= E{K 2 [ X E ( X )] 2 } =
= K 2 E[ X E ( X )] 2 =
= K 2V ( X ),
c.q.d.
V ( X + Y ) = E{[( X E ( X )] + [Y E (Y )]}2 =
= E[( X X ) 2 + (Y Y ) 2 + 2( X X )(Y Y )] =
= V ( X ) + V (Y ) + 2 cov( X , Y )
fcil verificar que
V ( X Y ) = V ( X ) + V (Y ) 2 cov( X , Y )
Se X e Y so duas variveis aleatrias independentes temos
cov( X , Y ) = E ( X X )(Y Y ) =
= E ( X X ) E (Y Y ) = 0
1
4
1
4
1
4
X = E ( X ) = X i P( X i ) = 0 + 2 + 4 + 6
i =1
1
=3
4
X2 = V ( X ) = E ( X 3) 2 =
1
1
1
1
= (3) 2 + (1) 2 + 12 + 3 2 = 5
4
4
4
4
Consideremos, agora, que temos dois tetraedros, um azul e outro branco. Sejam
X e Y as variveis aleatrias que representam os valores obtidos nos tetraedros azul e
branco, respectivamente.
Temos
X = Y = 3
X2 = Y2 = 5
Uma vez que X e Y so, obviamente, variveis independentes, devemos verificar
que cov( X , Y ) = 0 .
Na tabela 1.1 so dados os valores do produto ( X X )(Y Y ) a serem
utilizados no clculo da cov( X , Y ) .
TABELA 1.1. Valores de ( X X )(Y Y ) = ( X 3)(Y 3)
Y
0
2
4
6
9
3
3
9
3
1
1
3
3
1
1
3
9
3
3
9
1
1
1
+ 3 +K+ 9 = 0
16
16
16
Seja Z = X + Y
Ento V ( Z ) = V ( X ) + V (Y ) + 2 cov( X , Y ) = 5 + 5 = 10
Verifiquemos este resultado calculando V (Z ) diretamente da definio. Na
tabela 1.2 so apresentados os valores de Z = X + Y .
TABELA 1.2. Soma dos valores obtidos lanando dois tetraedros
Y
0
2
4
6
0
2
4
6
2
4
6
8
4
6
8
10
6
8
10
12
Temos que
E ( Z ) = E ( X + Y ) = E ( X ) + E (Y ) = 3 + 3 = 6
Esse valor tambm pode ser obtido calculando a mdia dos valores obtidos na
tabela 1.2, como segue:
E(Z ) = 0
1
1
1
1
+ 2 + 4 + K + 12 = 6
16
16
16
16
Finalmente, obtemos
V ( Z ) = E[ Z E ( Z )] 2 =
= (0 6) 2
1
1
1
+ (2 6) 2 + K + (12 6) 2 = 10 ,
16
16
16
P ( X i , Y j ) P ( X i ) P (Y j )
TABELA 1.3.
P (Y )
1
1
0,10
0,25
0,30
0
0,10
0,25
0,50
0,50
P( X )
0,35
0,30
0,35
1,00
1.4
mostra
os
valores
de
de
W,
bem
como
do
produto
[ X E ( X )] [W E (W )] .
[ X E ( X )] [W E (W )]
12
10
Temos que
E( X ) = 3 ,
E (W ) = 9 e
cov( X , W ) = [ X E ( X )] [W E (W )] =
1
1
1
1
= (9) + (1) + (1) + (9) = 5
4
4
4
4
Como exerccio, o leitor pode verificar que V (W X ) = 20 .
Pode-se demonstrar que, se K uma constante e se X, Y e Z so variveis
aleatrias, a covarincia apresenta as seguintes propriedades:
a) cov( X + Y , Z ) = cov( X , Z ) + cov(Y , Z )
b) cov( KX , Y ) = cov( X , KY ) = K cov( X , Y )
c) cov( K , X ) = cov( X , K ) = 0
Segue-se que, se 1 , 1 , 1 , 2 , 2 e 2 so constantes,
cov( 1 + 1 X + 1Y , 2 + 2 X + 2 Y ) =
= 1 2V ( X ) + ( 1 2 + 1 2 ) cov( X , Y ) + 1 2V (Y )
Como caso particular temos:
cov( X , + X ) = V ( X )
Este ltimo resultado pode ser utilizado para obter a covarincia entre as
variveis X e W da tabela 1.4. Como a soma de todos os valores marcados no tetraedro
sempre igual a 12, temos que W = 12 X . Ento
cov( X , W ) = cov( X ,12 X ) = V ( X ) = 5 ,
confirmando o resultado obtido anteriormente.
10
X i X1 + X 2
=
n
2
s2 =
( X i X ) 2
= (X1 X )2 + (X 2 X )2
n 1
X2 = V ( X ) = E[ X E ( X )] 2
Temos
X + X 2 +K+ X n 1
V (X ) = V 1
= 2 V (X1 + X 2 +K+ X n )
n
n
Uma vez que as observaes de uma amostra aleatria de uma populao infinita
so independentes, segue-se que
V (X ) =
1
2
2
=
n
n
n2
s2
O estimador da varincia mdia s =
n
2
X
Obviamente, cada uma das dezesseis amostras tem probabilidade 1/16 de ser
selecionada.
11
s2
s X2
0
1
2
3
1
2
3
4
2
3
4
5
3
4
5
6
0
2
8
18
2
0
2
8
8
2
0
2
18
8
2
0
0
1
4
9
1
0
1
4
4
1
0
1
9
4
1
0
( X ) 2
9
4
1
0
4
1
0
1
1
0
1
4
0
1
4
9
Verificamos que
E( X ) = 0
1
1
1
1
1 48
+ 1 + 2 + K + 5 + 6 =
=,
16
16
16
16
16 16
n
1
[ E ( X 1 ) + E ( X 2 ) + K + E ( X n )] =
=
n
n
E(s 2 ) = 0
1
1
1
1
1 80
+ 2 8 +K+ 2 0 =
=5 = 2,
16
16 16
16 16 16
12
V ( X ) = X2 =
2
n
5
2
1
+
16
1
1 40 5
+K+ 9 =
=
16
16 16 2
1
1
1
1
1 40 5
+ 1 + 4 + K + 1 + 0 =
= ,
16
16
16
16
16 16 2
= E( X ) =
1 m
Xi
m i =1
1 m
( X i ) 2
m 1 i =1
V ( X ) = X2 =
S2
n
1
m
Dada uma amostra (sem reposio) de n elementos, uma estimativa notendenciosa de dada por
13
X
X =
i =1
(X
s2 =
i =1
X )2
n 1
s X2 =
s2
n
1
n m
0+2+4+6
=3
4
( X i ) 2 (0 3) 2 + (1 3) 2 + (4 3) 2 + (6 3) 2 20
=
=
S =
m 1
3
3
2
4
Consideremos as = 6 diferentes amostras de 2 elementos (n = 2) que
2
podemos tirar dessa populao. Essas amostras esto discriminadas na tabela 1.6, com
os correspondentes valores de X , s 2 , s X2 e ( X ) 2 .
TABELA 1.6. Valores de X i , X , s 2 , s X2 e ( X ) 2 para as 6 possveis
amostras de 2 elementos (sem reposio).
Valores de X i
s2
s X2
0e2
0e4
0e6
2e4
2e6
4e6
1
2
3
3
4
5
2
8
18
2
8
2
1/2
2
9/2
1/2
2
1/2
( X ) 2
4
1
0
0
1
4
14
V ( X ) = X2 =
S2
n
n 20 2 5
1 =
1 =
m 6 4 3
X2 = E ( X ) 2 =
4 + 1 + 0 + 0 + 1 + 4 10 5
=
=
6
6 3
Verificamos que:
E( X ) =
1
18
(1 + 2 + K + 5) =
= 3,
6
6
ou seja, E ( X ) =
E(s 2 ) =
1
40 20
( 2 + 8 + K + 2) =
=
,
6
6
3
ou seja, E ( s 2 ) = S 2
E ( s X2 ) =
11
1 1 20 5
=
+ 2 +K+ =
62
2 6 2 3
ou seja, E ( s X2 ) = X2
m = i X i , com i = 1
i =1
15
Temos que
E ( m) = i E ( X i ) = i =
Isso mostra que qualquer mdia ponderada dos valores observados em uma
amostra aleatria um estimados no tendencioso de . Portanto, existem infinitos
estimadores no-tendenciosos de .
Dados dois estimadores no-tendenciosos de , a1 e a 2 , por definio a
eficincia relativa de a 2 , em comparao com a1 , igual a
V ( a1 )
V (a 2 )
Assim, por exemplo, dada uma amostra aleatria com 2 elementos, X 1 e X 2 , de
uma populao infinita, consideremos 2 estimadores no-tendenciosos da mdia da
populao:
a) a mdia aritmtica X =
X1 + X 2 1
1
= X1 + X 2 e
2
2
2
b) a mdia ponderada m =
1
3
X1 + X 2
4
4
Temos
V (X ) =
2
2
e
V ( m) =
1 2 9 2 5 2
+ =
16
16
8
A eficincia de m em relao a X
1 2
4
2
= = 0,8 ou 80%
5 2 5
16
m = X 1 + (1 ) X 2 ,
o mais eficiente a mdia aritmtica, ou seja, o caso em que =
1
.
2
Temos
V (m) = 2 2 + (1 ) 2 2 = (1 = 2 + 2 2 ) 2
Igualando a zero a derivada em relao a e simplificando, obtemos
2 + 4 = 0
Donde
1
2
1
.
2
Generalizando esse resultado, demonstraremos que, dada uma varivel aleatria
m = i X i
i =1
Temos que
E ( m) = i
17
= i2 ( i 1)
Igualando a zero as derivadas parciais em relao a i e , obtemos o sistema
de equaes
2 i = 0 ,
i = 1, 2, ..., n
(1.1)
i = 1
(1.2)
De (1.1), obtemos
i =
(1.3)
1
n
i =
1
n
, c.q.d.
18
Pode parecer bvio que o estimador da mdia de uma varivel seja a mdia dos
valores observados em uma amostra. Mas em situaes um pouco mais complicadas
ser necessrio recorrer a um mtodo geral de determinao de estimadores, como o
mtodo dos mnimos quadrados ou o mtodo da mxima verossimilhana (que ser
descrito na prxima seo).
O mtodo dos mnimos quadrados consiste em adotar os estimadores que
minimizam a soma dos quadrados dos desvios entre valores estimados e valores
observados na amostra.
Mostraremos que a mdia aritmtica dos valores da amostra um estimador de
n
(X
i =1
a) 2 .
X i na = 0
Donde
a=
Xi
= X , c.q.d.
n
19
Freqncia:
1
X3.
3
20
p =
X
n
21
Probabilidade (p) de
obter sucesso em uma
tentativa
0
Probabilidade de obter
apenas um sucesso em 4
tentativas = 4p(1 p)3
0
1/4
27/64
1/2
1/4 = 16/64
3/4
3/64
Nmero de
faces azuis
n
P ( X ) = p X (1 p ) n X ,
X
onde X o nmero de sucessos obtidos em n tentativas.
Como o logaritmo uma funo monotnica crescente, o valor de p que
maximiza P(X) tambm maximiza
n
Z = ln P ( X ) = ln + X ln p + (n X ) ln (1 p )
X
Igualando a zero a derivada em relao a p, obtemos
X n X
=0
p 1 p
cuja soluo p =
X
, que o estimador j obtido na seo anterior pelo mtodo de
n
mnimos quadrados.
Como
22
d 2Z
X
n X
= 2
< 0,
2
dp
p
(1 p ) 2
a condio de segunda ordem para mximo satisfeita.
Como mais um exemplo, consideremos a determinao dos estimadores de
mxima verossimilhana da mdia ( ) e da varincia ( 2 ) de uma varivel aleatria
(X), com distribuio normal, com base em uma amostra aleatria de n elementos.
Neste caso, a densidade de probabilidade de obter um valor X i na amostra
f (X i ) =
2 2
( X i ) 2
exp
2 2
=
i =1
1
2 2
= (2 )
2
n
2
( X ) 2
exp i 2 =
2
( X i ) 2
exp
2 2
( X i ) 2
n
n
2
ln L = ln 2 ln
2
2
2 2
Igualando a zero as derivadas parciais em relao a e 2 obtemos o sistema de
equaes
23
2 ( X i )
=0
2 2
2
n + ( X i ) = 0
2 4
2 2
(1.4)
(1.5)
De (1.4) obtemos
Xi
=X
n
(1.6)
(X i X )
=
n
(X i X )
s =
n 1
funo
de
densidade
f (a n ) ,
com
mdia
E (a n )
varincia
(1.7)
(1.8)
24
(1.9)
(1.10)
{ n [a
E (a n )]
(1.11)
25
V ( X ) = E( X ) 2 =
2
n
Ento
E[ n ( X )] 2 = 2
e a varincia assinttica de X
lim E[ n ( X )] =
2
2
n
2
2n
lim P (| a n |> ) = 0 ,
(1.12)
indicando-se
p
an
ou
plim a n = ,
que se l: o limite em probabilidade de a n igual a .
26
do
(1.13)
< a n < + deve tender para um quando n tende para infinito. Em outras
palavras, dados e , positivos e arbitrariamente pequenos, deve existir n o tal que para
todo n > n o temos
P ( < a n < + ) > 1
Em termos da figura 1.3, medida que n cresce, a distribuio de a n deve se
concentrar em torno de , de maneira que quase toda a distribuio fique compreendida
entre os limites e + .
27
lim E (a n ) 2 = 0
n
(1.14)
P (Y = 0) = P ( Z < )
e
P (Y = ) = P ( Z )
Segue-se que
E (Y ) = 0 P (Y = 0) + P (Y = ) = P( Z )
(1.15)
Ento,
E (Y ) E ( Z )
28
P(Z ) E ( Z )
ou
P( Z )
E (Z )
(1.16)
P[( X ) 2 k 2 ]
E( X ) 2 2
= 2
k2
k
(1.17)
2
k2
P[(a n ) 2 2 ]
E (a n ) 2
Ento
E (a n ) 2
lim E (a n ) 2 = 0
Segue-se que
29
lim P[(a n ) 2 2 ] = 0
ou
lim P (| a n |) > ] = 0
isto ,
plim a n =
Demonstremos, tambm, que
E ( a n ) 2 = V (a n ) + [ E ( a n ) ] 2
(1.18)
Temos
E (a n ) 2 = E{[a n E (a n )] + [ E (a n ) ]} 2 =
= E{[a n E (a n )] 2 + [ E (a n ) ] 2 + 2[a n E (a n )] [ E (a n ) ]} =
= V (a n ) + [ E (a n ) ] 2 ,
c.q.d.
lim E (a n ) 2 = 0
Para que isso acontea, por sua vez, suficiente, de acordo com (1.18), que
lim V (a n ) = 0
30
e
E (a n ) =
ou
lim[ E (a n )] =
Conclumos ento que um estimador no-tendencioso ou assintoticamente notendencioso consistente se o limite da sua varincia, quando o tamanho da amostra
tende para infinito, igual a zero.
Vejamos um exemplo. Sabemos que X um estimador no-tendencioso de e
que V ( X ) =
2
n
Como
lim V ( X ) = 0 ,
plim b =
F (a, b)
uma
funo
contnua,
temos
31
plim F (a, b) = F ( , ) .
Temos,
por
exemplo,
E (a 2 ) , E (ab) ou E (a / b) .
Para introduzir a idia de convergncia em distribuio, vamos considerar,
novamente, a distribuio da mdia ( X ) de uma amostra aleatria com n observaes,
com E ( X ) = e V ( X ) = 2 , mas sem que se conhea a forma da distribuio de X. J
vimos que V ( X ) tende a zero quando n cresce. Dizemos que, no limite, a distribuio
de X degenera, concentrando-se em um ponto. Ento conveniente analisar o que
ocorre com a distribuio de
nX
n X N ( n , 2 )
Dizemos, ento, que a distribuio assinttica de X uma distribuio normal
com mdia e varincia 2 n .
32
L( X 1 , X 2 , K , X n ; ) = f ( X i )
i =1
V (a)
1
d ln L
E
2
d ln L
E
(1.19)
L( X 1 , X 2 , K , X n ; ) = (2 )
i =1
= (2 )
n
2
1
2
exp ( X i ) 2 =
2
exp ( X i ) 2
2
Ento
n
1
ln L = ln 2 ( X i ) 2
2
2
Segue-se que
d ln L
= ( X i )
d
e
33
d 2 ln L
= n
d 2
De acordo com (1.19), obtemos
V ( m)
1
n
termos quantitativos, ,
34
P(X)
X
para p = 1/4
para p = 1/2
9/16
1/4
6/16
2/4
1/16
1/4
H o : p = 1/ 4 e H A : p = 1/ 2
Para a soluo deste problema, devemos proceder a um teste de hipteses. Ento,
antes de conhecer o valor assumido por X, devemos estabelecer a regra de deciso a ser
adotada, isto , devemos estabelecer para que valores de X devemos rejeitar H o . Para
este problema podemos estabelecer qualquer uma das quatro regras de deciso que
constam na tabela 1.10. Nesta tabela tambm so dados os valores de e , relativos a
cada regra de deciso, e a relao , isto , a razo entre o incremento em e o
incremento em , quando se passa de uma regra de deciso para a seguinte.
35
Rejeitar H o se X = 2
1/16 = 0,0625
3/4 = 0,75
Rejeitar H o se X 1
7/16 = 0,4375
1/4 = 0,25
Regra de deciso
Nunca rejeitar H o
Sempre rejeitar H o
4/3
4/9
Situao real
H o verdadeira
(probab. = )
H o falsa
(probab. = 1 )
no rejeitar H o
rejeitar H o
U 11
U 12
p11 = (1 )
p12 =
U 21
U 22
p 21 = (1 )
p 22 = (1 )(1 )
L = E (U ) = (1 )U 11 + U 12 + (1 ) U 21 + (1 )(1 )U 22
(1.20)
U 11 + (1 )U 22 L
(U 11 U 12 )
(1 )(U 22 U 21 )
(1 )(U 22 (U 21 )
(1.21)
C I
(1 )C II
(1.22)
37
a) se 4 <
b) se
CI
< , o ponto timo A, isto , nunca devemos rejeitar H o .
C II
CI
= 4 , indiferente utilizar a regra de deciso correspondente ao ponto
C II
A ou ao ponto B.
c) se
4 CI
<
< 4 , o ponto timo B, isto , devemos rejeitar H o se X = 2,
3 C II
CI 4
= , indiferente utilizar a regra de deciso correspondente ao ponto
C II 3
B ou ao ponto C.
e) se
4 CI 4
<
< , o ponto timo C, isto , devemos rejeitar H o se X 1,
9 C II 3
CI 4
= , indiferente utilizar a regra de deciso correspondente ao ponto
C II 9
C ou ao ponto D, e
g) se 0 <
CI 4
< , o ponto timo D, isto , devemos rejeitar H o sempre,
C II 9
= C I (1 )C II
Segue-se que
d
d
(1.23)
dL
= 0 implica
d
C I
d
=
d
(1 )C II
(1.24)
38
d 2L
<0
d 2
De (1.23) obtemos
d 2L
d 2
C
(
1
)
,
II
d 2
d 2
d 2
> 0 , isto
d 2
CI
(o
C II
custo de cometer erro tipo I em comparao com o custo de cometer erro tipo II).
Em problemas prticos geralmente impossvel determinar o nvel de
significncia timo da maneira indicada, porque no se tem nem a probabilidade ( ) de
CI
. Alm disso, a hiptese
C II
39
Exerccios
1.1. Seja X o resultado obtido no lanamento de um dado (hexaedro regular) nochumbado. Seja Y a soma dos resultados obtidos em 100 lanamentos desse dado.
Determine E(X), V(X), E(Y) e V(Y).
40
4
8
so independentes?
1
0,3
0
Xi
2
0
0,4
3
0,3
0
conjunta de X e Y.
a) Essas
variveis
independentes?
so
(Justifique
sua
resposta).
2
0,2
0,1
0
Xi
4
0,1
0,2
0,1
6
0
0,1
0,2
cov
(X,
Y)
H A : trata-se da urna B
O estatstico decide, tambm; que a regra de deciso ser rejeitar H 0 (em favor
de H A ) se a bola retirada da urna apresentar nmero menor do que 3.
Determine: (a) o nvel de significncia do teste; (b) a probabilidade () de
cometer erro tipo II; (c) o poder do teste.
41
H A : trata-se da urna B
O estatstico adota a seguinte regra de deciso: rejeitar H 0 (em favor de H A ) se
a bola retirada da urna apresentar nmero menor do que 5. Determine:
a) o nvel de significncia do teste
b) a probabilidade () de cometer erro tipo II
c) o poder do teste.
Refaa o problema considerando, agora, que a regra de deciso rejeitar H 0 se
o nmero marcado na bola retirada for menor ou igual a 3.
1.6. Temos dois tetraedros regulares de material homogneo. Um deles tem uma face
azul e trs faces brancas. O outro tem trs faces azuis e uma branca. Uma pessoa
pega, ao acaso, um desses tetraedros e o lana n vezes. Seja X o nmero de vezes
em que o resultado foi face azul. Com base no valor de X devemos testar a
hiptese
H 0 : foi utilizado o tetraedro com uma face azul
contra a hiptese alternativa
42
17,5
1750
= 2,9167 , E(Y) = 350 e V (Y ) =
= 291,67
6
6
1.2. E(X) = 2, E(Y) = 5,6 , V(X) = 0,6 , V(Y) = 3,84, cov (X, Y) = 0. As variveis X e
Y no so independentes.
1.3. a) No
b) E(X) = 4 e E(Y) = 5
X1
37/64
1/64
X2
10/64
10/64
X3
X > 3 (nunca)
1/64
37/64
X 0 (sempre)
b) = =
53
= 0,1035
512
43
II)
III)
IV)
ou
E[Yi E (Yi | X i )] 2 = 2
Dizemos, ento, que o erro homocedstico ou que temos homocedasticia (do
erro ou da varivel dependente).
V)
44
VI)
45
E (u i u j ) = E (u i ) E (u j ) = 0
Entretanto, a pressuposio V geralmente no obedecida quando trabalhamos
com sries cronolgicas de dados. Dizemos, ento, que h autocorrelao nos resduos.
Temos autocorrelao positiva se
46
Yi = a + bX i
onde Yi , a e b so, respectivamente estimativas de E (Yi ) = + X i , e .
Para cada par de valores X i , Yi podemos estabelecer o desvio
ei = Yi Yi = Yi (a + bX i )
O mtodo dos mnimos quadrados consiste em adotar como estimativas dos
parmetros os valores que minimizam a soma dos quadrados dos desvios
n
i =1
i =1
Z = ei2 = [Yi (a + bX i )] 2
47
(2.1)
Z
= 2 [Yi (a + bX i )] ( X i ) = 0
b
(2.2)
na + b X i = Yi
2
a X i + b X i = X i Yi
(2.3)
(2.4)
b=
n XY ( X )( Y )
n X 2 ( X ) 2
X
i =1
Y
X
b
n
n
ou
a = Y bX
48
fcil verificar que a frmula para o clculo de b pode ser escrita de diversos
modos, quais sejam:
n XY ( X )( Y )
b=
=
n X 2 ( X ) 2
( X )( Y )
n
=
(
X )2
2
X
n
XY
( X X )(Y Y ) ( X X )Y
=
=
( X X ) 2
( X X ) 2
X (Y Y ) xy xY Xy
=
=
=
( X X ) 2 x 2 x 2 x 2
onde
X =
X
Y
,Y =
, x = X X e y = Y Y
n
n
Assinalemos duas relaes bastante teis que podem ser obtidas a partir das
equaes (2.1) e (2.2). Lembrando que
(2.5)
X i ei = 0
(2.6)
Yi e i = (a + bX i )e i = a e i + b X i e i
De acordo com (2.5) e (2.6), conclumos que
Yi e i = 0
(2.7)
49
(2.8)
isto , a mdia dos valores observados de Y igual mdia dos valores estimados de Y.
Yi = A + bx i + ei
Como x i = 0 , as equaes normais ficam
nA
= Yi
2
b xi = xi Yi
Donde
Y
A =
=Y
n
50
e
b=
xY
x2
Yi = Y + bx i
ou
y i = bx i
(2.9)
onde
y i = Yi Y
Temos
y i ei = (Yi Y )ei = Yi e i Y ei
Lembrando (2.5) e (2.7) conclumos que
y i e i = 0
(2.10)
0
1
1
2
3
3
2
3
5
4
3
4
5
5
6
4
7
6
7
9
51
X 2 = 126
x2 = X 2
( X ) 2
= 126 90 = 36
n
Y = 50 , Y = 5
XY = 186
xy = XY
( X )( Y )
= 186 150 = 36
n
xy 36
=
=1
x 2 36
a = Y bX = 5 3 = 2
Figura 2.2.
Y = 5 + x
52
ou
Y = 2 + X
xiY
x i2
tendencioso de .
Temos que
b=
xi Y
x
2
i
x1
x
2
i
Y1 +
x2
x
2
i
Y2 + K +
xn
x i2
Yn
xi
x i2
so, tambm, valores fixos. Ento, b uma combinao linear dos valores de Yi .
Como
Yi = + X i + u i ,
obtemos
b=
1
x i ( + X i + u i ) =
x i2
=
1
xi + xi X i + xi u i
x i2
Como x i = 0 e x i2 = x i X i ,
b=+
xi u i
x i2
(2.11)
53
xiY
x i2
a = Y bX =
1 Xx i
Yi
xi Y
X
=
n x2
n
x i2
i
Yi
Essa ltima expresso mostra que a uma funo linear dos valores de Yi .
Como
Yi = + X i + u i ,
obtemos
1 Xx i
a =
2
n xi
=
X x i
x i2
( + X i + u i ) =
1 Xx i
Xi
X xi X i
n x2
n
x i2
i
u i
e, como x i = 0 e x i2 = x i X i ,
1 Xx i
a = +
2
n xi
u i
(2.12)
54
(2.13)
De (2.11), obtemos
b =
xi ui
x i2
E ( x i u i ) 2
( x i2 ) 2
Mas
E ( x i u i ) 2 = E ( x1 u 1 + x 2 u 2 + K + x n u n ) 2 =
= E ( x12 u12 + x22u 22 + K + xn2u n2 + 2 x1 x2u1u 2 +
+ K + 2 x1 x n u1 u n + K) =
= x12 2 + x 22 2 + K + x n2 2 =
= 2 x i2
(2.14)
V (b) =
2 x i2
( x i2 ) 2
2
x i2
(2.15)
55
1 Xx i
a =
2
n xi
u i
Ento
1 Xx i
V (a ) = E (a ) = E
2
n x i
2
u i
1 Xx i
V (a ) =
2
n xi
2
=
1
X 2 x i2
2 Xx i
= 2 +
( x i2 ) 2 n x i2
n
1 X 2
= +
2
n xi
2
=
(2.16)
Notando que
( X i ) 2
x =X
= X i2 nX 2
n
2
i
2
i
X i2 2
n xi2
(2.17)
Yi ( + X i + u i )
=
= + X + u
n
n
56
onde u = ( u i ) n
Como E (u ) = 0 , podemos escrever
E (Y ) = + X
Ento, fcil verificar que
Y E (Y ) = u ,
(2.18)
donde obtemos
ui
V (Y ) = E[Y E (Y )] = E (u ) = E
n
2
e, finalmente,
n 2 2
V (Y ) = 2 =
n
n
(2.19)
xi u i
cov(Y , b) = E u
2
xi
E ( u i xi u i )
=
=
n xi2
E (u1 + u 2 + K + u n )( x1u1 + x 2 u 2 + K + x n u n )
=
n xi2
cov(Y , b) =
2 xi
n xi2
=0
(2.20)
57
X 2
xi2
(2.21)
B = ci Yi =
= ci ( + X i + u i ) =
= c i + c i X i + ci u i
(2.22)
E ( B ) = ci + ci X i
Para termos E ( B) = , necessariamente
ci = 0
(2.23)
ci X i = 1
(2.24)
58
F
= 2ci X i = 0
ci
(2.25)
para i = 1, 2, ..., n
Somando essas n igualdades obtemos
2 c i n X i = 0
Pela condio (2.23) segue-se que
+ X = 0
Adicionando essa igualdade a cada uma das relaes em (2.25) obtemos
2c i ( X i X ) = 0
59
2ci = xi
ci =
xi , para i = 1, 2, ..., n
(2.26)
xi X i =
xi2
xi2
ou
1
xi2
ci =
xi
, i = 1, 2, ..., n
xi2
B = ci Yi =
xi Yi
,
xi2
60
Yi Y = Yi Yi + Yi Y
ou
yi = ei + y i
Elevando ao quadrado e somando, obtemos
y i2 = ei2 + y i2 + 2 y i ei
Lembrando (2.10), conclumos que
y i2 = ei2 + y i2
(2.27)
Essa relao mostra que a variao dos valores de Y em torno da sua mdia
( y i2 ) pode ser dividida em duas partes: uma ( y i2 ) que explicada pela regresso
e outra ( ei2 ) devida ao fato de que nem todos os pontos esto sobre a reta de
regresso, que a parte no explicada pela regresso. O coeficiente de determinao,
definido por
S.Q.Regr. y i2
r =
=
,
S.Q.Total y i2
2
61
2
y i2
( xy ) 2
2 x
=
b
=
y i2
y 2 ( x 2 )( y 2 )
(2.28)
e que
S.Q.Regr. = y 2 = b 2 x 2 = b xy =
( xy ) 2
x2
( Y ) 2
= 294 250 = 44
n
S.Q.Regr. = b xy = 36
S.Q.Res. = S.Q.Total S.Q.Regr. = 44 36 = 8
Esta a maneira usual de obter os valores das vrias somas de quadrados. Para
que o aluno compreenda melhor o que est sendo feito, vamos calcular a S.Q.Regr. e a
S.Q.Res. diretamente da sua definio; para isso precisamos obter, inicialmente, os
valores de Yi e ei = Yi Yi , apresentados na tabela 2.2.
As relaes (2.5), (2.6), (2.7) e (2.10), deduzidas anteriormente, que so
ei = 0 , X i ei = 0 , Yi ei = 0 e y i ei = 0 , so facilmente verificadas neste
exemplo.
Como a soma dos desvios nula, a mdia aritmtica de Yi Y = 5 . Obtidos os
valores y i = Yi Y , calculamos
S.Q.Regr. = y i2 = 36 ,
que o mesmo valor obtido anteriormente, pela expresso
S.Q.Regr. = b xy
62
Yi
Yi = 2 + X
0
1
1
2
3
3
4
5
5
6
3
2
3
5
4
4
7
6
7
9
2
3
3
4
5
5
6
7
7
8
y i
3
2
2
1
0
0
+1
+2
+2
+3
ei = Yi Yi
+1
1
0
+1
1
1
+1
1
0
+1
r2 =
9
= 0,818 ou 81,8%
11
(2.29)
63
Sabemos que
( xi y i ) 2
S.Q.Regr. = b xi y i =
xi2
Aplicando esperana temos
E ( xi y i ) 2
E (S.Q.Regr.) =
xi2
(2.30)
Ento
( xi y i ) 2 = 2 ( xi2 ) 2 + ( xi u i ) 2 + 2 xi2 xi u i
Aplicando esperana, vem
E ( xi y i ) 2 = 2 ( xi2 ) 2 + 2 xi2
(2.31)
(2.32)
(2.33)
Mas
(u i u ) 2 = (u i2 + u 2 2u i u ) =
64
( u i )
ui
= u + n
=
2
n
n
2
2
i
( u i ) 2
= u
n
2
i
Ento
E[(u i u ) 2 ] = n 2
n 2
= (n 1) 2
n
(2.34)
(2.35)
Q.M.Regr. = SQ.Regr.
e
Q.M.Res. =
SQ.Res.
n2
65
E (Q.M.Regr.) = 2 xi2 + 2
e
E (Q.M.Res.) = 2
De posse destes resultados, podemos conduzir a anlise de varincia da
regresso linear simples, conforme o esquema seguinte:
Anlise da Varincia
Causas de
Variao
Graus de
Liberdade
Somas de
Quadrados
Quadrados Mdios
Regresso
b xi y i
b xi y i
Resduo
n2
yi2 b xi y i
( y i2 b xi y i ) /(n 2)
Total
n1
y i2
F=
Q.M.Regr.
Q.M.Res.
H0 : = 0,
66
G.L.
S.Q.
Q.M.
Regresso
Resduo
Total
1
8
9
36
8
44
36
1
36
Nos textos em ingls essa probabilidade denominada p-value, o que tem sido traduzido por valorp.
67
S.Q.Regr. S.Q.Res.
=
S.Q.Total S.Q.Total
1
(S.Q.Res.)
n 1
2
n
2
1 r =
=
(1 r 2 )
1
n2
(S.Q.Total)
n 1
(2.36)
ou
r 2 = r2
1
(1 r 2 )
n2
(2.37)
Excluindo o caso em que r 2 = 1 , temos r 2 < r 2 . Note que r 2 pode ser negativo.
Um outro indicador da qualidade do ajustamento obtido o coeficiente de
variao, definido por
CV =
s
,
Y
(2.38)
68
2
xi2
e que
1 X 2
V (a) = +
2
n xi
(2.39)
1 X2
V (a) = s 2 (a) = +
2
n xi
2
s
(2.40)
b
s (b)
t (a ) =
a
s(a)
69
x
b = i 2
xi
u i ,
1 X2
V (a) = +
2
n xi
2 1
9
s = +
= 0,35
10 36
1
6
s (a) = 0,35
Para testar a hiptese H 0 : = 0 , contra a hiptese alternativa H A : 0 , ao
nvel de significncia de 5%, calculamos
70
t (b) =
1 0
=6
1/ 6
t (a) =
23
0,35
= 1,690
A regio de rejeio para este teste t < 1,860. Como o valor calculado no
pertence a esse intervalo, ele no significativo, ou seja, no rejeitamos, ao nvel de
significncia de 5%, a hiptese H 0 : = 3 .
Tambm podem ser obtidos intervalos de confiana para os parmetros. Sendo
71
1 1,860
1
1
< < 1 + 1,860
6
6
Yi = Y + bxi
Ento
xi2
2 xi2 2 1
V (Yi ) =
+
=
+
n
xi2 n xi2
(2.41)
Donde
1
x2
V (Yi ) = s 2 (Yi ) = + i 2
n xi
2
s
Yh = a + bX h = Y + bx h
e
1
x2
V (Yh ) = s 2 (Yh ) = + h 2
n xi
2
s
72
Extraindo a raiz quadrada desse valor obtemos a estimativa dos desvio padro de
Yh Yh = (a ) + (b ) X h u h
Dizemos que Yh uma previso no-tendenciosa do valor de Yh porque a
esperana do erro de previso igual a zero. Verifica-se, tambm, que E (Yh ) = E (Yh ) .
Note, entretanto, que E (Yh ) = + X h Yh .
Para avaliar a preciso Yh como previso do valor da nova observao,
determinamos o intervalo de previso, como mostraremos a seguir. Note, inicialmente,
que tanto Yh como Yh so variveis aleatrias e que, de acordo com a pressuposio V,
suas distribuies so independentes. Uma vez que, para determinado valor ( X h ) da
varivel independente, os valores de Y variam em torno de sua verdadeira mdia, isto ,
em torno de E (Yh ) , com varincia 2 , a varincia que nos interessa
2 + V (Yh ) = 1 +
x2
1
+ h2
n xi
(2.42)
Yh t 0 1 + +
2
n xi
2
s
1/ 2
1
x h2
< Yh < Yh + t 0 1 + +
2
n x i
2
s
1/ 2
73
Yh = 5 + x h
(2.43)
1 x h2
Yh 2,306
+
10 36
(2.44)
Yh 2,306 1 + +
10 36
(2.45)
74
Yh
0
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
10
11
Intervalo de confiana
para E (Yh )
0,64
1,94
3,18
4,27
5,18
5,94
6,64
7,30
7,94
8,58
3,36
4,06
4,82
5,73
6,82
8,06
9,36
10,70
12,06
13,42
Intervalo de previso
para Yh
0,68
0,46
1,55
2,58
3,55
4,46
5,32
6,13
6,91
7,66
4,68
5,54
6,45
7,42
8,45
9,54
10,68
11,87
13,09
14,34
A anlise da expresso
1
x h2
Yh t 0 +
2
n xi
1/ 2
s,
que nos d os limites do intervalo de confiana para E (Yh ) , permite afirmar que a
preciso da estimativa de Y tanto maior quanto:
a) menor for s, isto , quanto menor for a disperso dos valores observados de Y
em torno da reta de regresso.
b) maior for n
c) maior for xi2 , isto , quanto maior for a disperso dos valores de X em torno
da respectiva mdia.
Podemos ento concluir que:
a) O nmero de observaes (n) deve ser o maior possvel.
b) Se possvel, devemos escolher valores de X que conduzem a um elevado
75
76
Xi
V) Yi = + X i + X i2
VI) Yi = + X i
Onde , , e so parmetros a serem estimados.
A determinao da forma matemtica da funo pode ser feita de duas formas
diferentes, muitas vezes complementares:
a) utilizando o conhecimento que temos a priori sobre o fenmeno.
77
78
Yi = +
Xi
+ ui
Vi =
1
Xi
79
(2.46)
exp
[Y1 ( + X 1 )] 2
2
2
2
1
f (Y1 ) =
1
2
n
2
1
exp
2
2
= (2 2 )
i =1
= (2 2 )
exp
[Yi ( + X i )] 2 =
2
2
[Y
i =1
( + X i )] 2
(2.47)
80
2 =
ei2
n
81
Exerccios
2.1.
Y
0
0
2
3
4
4
5
6
8
8
2.3.
2.4.
82
Yi = 728
X i2 = 1456
Yi 2 = 39424
X i Yi = 7504
a) Determine as estimativas dos parmetros da regresso de Y em relao a X e
os respectivos desvios padres.
b) Calcule o coeficiente de determinao da regresso.
c) Teste a hiptese H 0 : = 0 contra a hiptese alternativa H A : > 0 , ao
nvel de significncia de 0,5%.
2.5.
Y
3,0
7,5
7,0
11,5
11,0
83
X
0
2
4
6
8
Y
2
3
14
15
26
Yi = 0,4 + X i
A estimativa do desvio padro da estimativa do coeficiente de regresso 0,1.
Calcule o coeficiente de determinao e teste a hiptese de que o coeficiente angular da
equao igual a zero, ao nvel de significncia de 1%.
2.8.
84
2.9.
Z i = c + dX i
Que relao existe entre b e d? E entre a e c? Sendo b e d as estimativas dos
parmetros e , respectivamente, demonstre que o valor de t relativo hiptese
da nulidade H 0 : = 0 igual ao valor de t relativo hiptese da nulidade
H 0 : = 1 , ou seja, que
b
d 1
=
s (b) s (d )
2.10. Dados os pares de valores X e Y abaixo, qual o modelo que voc usaria e como
faria para obter uma relao que lhe permitisse estimar Y a partir de valores de
X?
X
10
12
14
16
18
Y
2,0
8,2
31,0
130,0
510,0
2.11. A partir de uma amostra de 27 pares de valores foi obtida a equao de regresso
de Y em relao a X
Y = 25,0 + 2,00 X
Sabendo que s = 1,50 ( s 2 = Q.M.Res. ), que a estimativa do desvio padro de X
s ( X ) = 3,00 e que X = 7,50 ,
a) determine o intervalo de confiana do coeficiente de regresso ao nvel
de confiana de 95%.
b) Teste, ao nvel de significncia de 1%, a hiptese de que o coeficiente de
regresso da populao 1,70.
85
105
130
141
159
160
172
2042
2301
2421
2518
2606
2718
Y = 20 X ,
com r 2 = 0,64 . Sabe-se que a estimativa no-tendenciosa da varincia de X
64. Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 0 , contra a
hiptese alternativa H A : > 0 .
2.16. Numa anlise de regresso ( Yi = + X i + u i ) foram obtidos, a partir de uma
amostra de 6 pares de valores X e Y, os seguintes resultados:
r2 =
16
; s(X) = 3; s(Y) = 5; X = 3 e Y = 10
25
86
Yi = +
Xi
+ ui ,
Y
9,0
8,5
8,5
6,5
5,0
Yi 2 = 212
X i = 10
X i2 = 2,1
X i Yi = 21
87
Y
2,5
1
2
0
0,5
3,5
3
4
2
1,5
Pode-se
(1 000 unidades)
1
2
3
4
5
6
7
8
9
10
(Cr$ 1 000,00)
7
11
15
14
18
21
23
30
32
34
verificar
que
XY = 1375 .
a) Estime a funo de custo total.
b) Teste, ao nvel de significncia de 1%, a hiptese de que o custo marginal
nulo.
c) Determine o intervalo de 95% de confiana para o valor dos custos fixos.
d) Calcule o coeficiente de determinao da regresso.
e) Se o produtor vende em regime de competio perfeita ao preo de Cr$ 3,50
por unidade, quantas unidades deve produzir para que sua renda lquida seja
de Cr$ 2.000,00?
f) Determine a estimativa de Y para X = 10 e o respectivo intervalo de
confiana, ao nvel de confiana de 95%.
Y
6
8
9
13
89
X 2 = 168,
X = 32,
Y 2 = 1340
X
1
1
3
3
5
5
7
7
Y
15
19
16
14
9
13
6
4
XY = 304 .
a) Determine a equao de regresso de Y contra X de acordo com o mtodo de
mnimos quadrados.
b) Obtenha uma estimativa no-tendendiosa da varincia do erro do modelo.
c) Verifique se a influncia de X sobre Y estatisticamente significativa ao
nvel de 1%.
d) Determine o intervalo de 90% de confiana para a variao esperada de Y
quando X diminui 3 unidades (X = 3) .
90
Conjunto B
Y
X
1
5,5
2
6,5
3
9,0
4
10,5
5
13,5
6
15,0
Para cada um desses conjuntos,
Conjunto C
Y
X
1
10,5
1
0,5
2
9,5
2
1,5
3
10,0
3
4,0
4
9,5
4
5,5
5
10,5
5
8,5
6
10,0
6
10,0
obtenha as estimativas de mnimos quadrados
Y = 30 + 5 X ,
com um coeficiente de determinao r 2 =
2
3
91
1
1
100
100
10.000
10.000
1
10
1.000
1.000
100
1.000
2
X i2
93
Yi 2
( X i Yi ) 2
= Yi 2 b X i Yi
2
Xi
Y
5
7
11
5
9
2.33. Dados um conjunto de pares de valores X ij , Yij (i = 1, ..., m; j = 1, ..., n), ajustase um conjunto de m retas paralelas
Yij = a i + bX ij
Mostre que as estimativas dos parmetros, de acordo com o mtodo dos mnimos
quadrados, so dadas por
b=
( X ij X i )(Yij Yi )
i
( X ij X i ) 2
i
e
a i = Yi bX i
onde X i =
1 n
1 n
X
e
Y
=
Yij
ij i n
n j =1
j =1
94
Yi
2
4
3
5
8
6
Xi
4
4
5
5
5
5
Yi
9
13
11
10
16
9
X = X 2 , respectivamente)
1 x x
cov(Y1 , Y2 ) = + 1 22
n xi
2.36. Seja X a quantidade de adubo colocada no solo, em doses por hectare, e seja Y a
produtividade obtida, em toneladas por hectare. Admite-se que essas variveis
esto relacionadas de acordo com a funo
95
Yi = + X i + u i ,
onde e so parmetros e os ui so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .
Um experimento com 5 parcelas forneceu os seguintes resultados:
Xi
0
1
4
9
16
Yi
2,7
4,4
5,3
5,4
7,2
, e depois eleve
ao quadrado).
g) Determine o intervalo de previso para a produo de uma nova parcela com
X = 1, considerando um nvel de confiana de 95%.
2.37. Considere o modelo Yi = X i + u i
E (u i u j ) = 0 para i j.
Sabe-se que o estimador de mnimos quadrados para b =
tendencioso, com V (b) =
2
X i2
X i Yi
, no X i2
96
X1 =
1 h
Xi
h i =1
X2 =
1 9
Xi
h i =10 h
X1
X2
1
2
3
4
1
1,5
2
2,5
9
8,5
8
7,5
1 h
Yi
h i =1
Y2 =
1 9
Yi
h i =10 h
u1 =
Y2 Y1
X 2 X1
u 2 u1
,
X 2 X1
1 h
ui
h i =1
u2 =
1 9
ui
h i =10 h
97
para h = 1, 2, 3, 4.
Respostas
2.1. a)
Y = 4 + 1,9 X
b)
F = 320,89, rejeita-se H 0 : = 0
c)
r2 = 0,976
d)
2.4. a)
4
= 0,571
7
b)
r2 =
c)
t = 4, significativo
2.5. a)
Y = 2 + 2 X
b)
c)
t = 8, significativo
d)
t = 6,63, significativo
e)
2.6. a)
Y = 3X
12
= 0,923
13
b)
r2 =
c)
F = 36, significativo
d)
t = 6, no-significativo
e)
t = 2,45, significativo
f)
15,42 a 44,58
2.7. r 2 =
2
; F = 100, significativo
3
2.8. Uma vez que E(b) = , basta mostrar que lim V (b) = 0 , o que acontece desde que
n
98
b)
2.14. a)
b)
2 0,202
t = 3,059, significativo
1 025 250
124,3
2.15. t = 4, no-significativo
2.16. a)
b)
0,06 a 2,72
t = 2,954, significativo
60
2.17. Y = 4,5 +
X
2.18. a)
b)
c)
2.19. a)
r 2 = 0,833 ou 83,3%
Y = 3 0,5X
1
; F = 4, no-significativo
3
b)
r2 =
c)
t = 2, no-significativo
d)
t = 3,27, no-significativo
e)
2,84 a 3,68
f)
X = 4; Y = 1; 0,41 a 2,41
2.20. a)
Y = 4 + 3X
b)
c)
d)
r 2 = 0,974
e)
f)
34 2,14
99
2.21. a)
Y = 6 + 1,5X
27
= 0,519
52
b)
r2 =
c)
d)
Y = 9
3,62 < E( Y | X = 2) < 14,38
2.22. a)
Y = 20 2X
14
= 4,667
3
b)
s2 =
c)
d)
2.23.
Conjunto
Estatstica
a
b
3
2
10
10
0
10
2
2
5
Y
S.Q.Res.
S.Q.Regr.
r2
CV
2.25. a)
b)
1
70
98,6%
5%
1
0
0
1
70
98,6%
5%
10%
1
=V
X
Z = log Y e V = log X
t = 2,40, no-significativo
2.30. Yi = X i i
100
Adotando como origem do tempo (X = 0) o ano em que foi efetuada a terceira das
observaes consideradas, obtemos
Y = 16 2 X
A taxa de crescimento 100% ao ano
F = 7,5
Z = ln Y e V =
2.31. Anamorfoses:
1
X
2.32. g)
Y = 2 X ; t = 7,303, significativo.
2.34. a)
Y = 2 + 2 X
b)
c)
d)
e)
= 4 ; V () = (X ) 2 V (b) =
2
9
5
V () = e t = 2,01, significativo ( t 0 = 1,81 )
9
2.36. a)
a = 3, b = 1
b)
r 2 = 0,931
c)
d)
e)
f)
0,50 <
< 1,50
n 2
( X ) 2
101
2.38. V (b) =
2
60
X 2 X1
V (b*h )
Eficincia relativa
2 /32
0,533
2 /49
0,817
2 /54
0,900
2 /50
0,833
102
3. CORRELAO
Vimos que numa anlise de regresso linear simples, se determina, atravs de
estimativas dos parmetros, como uma varivel X exerce, ou parece exercer, efeito
sobre uma outra varivel Y.
Na anlise de correlao, que veremos aqui, se procura determinar o grau de
relacionamento entre duas variveis, ou seja, se procura medir a covariabilidade entre
elas.
Na anlise de regresso necessrio distinguir a varivel dependente e a varivel
explanatria; na anlise de correlao, tal distino no necessria.
Xi X
=
s( X )
zi =
Yi Y
=
s (Y )
xi
xi2
n 1
(3.1)
e
yi
y i2
n 1
(3.2)
103
104
vi z i
n 1
xi y i
xi2 y i2
(3.3)
105
Yi
Xi
Yi
4
4
6
6
7
6
6
8
8
8
7
8
Obtemos
X =
36
42
= 6; Y =
=7
6
6
x 2 = X i2
( X i ) 2
36 2
= 232
= 16
n
6
( Yi ) 2
42 2
= 298
=4
n
6
y 2 = Yi 2
xi y i = X i Yi
X i Yi
36 42
= 256
=4
n
6
r=
4
16 4
= 0,5
b=
xy
=
x2
xy
x2 y2
y2
,
x2
b=r
y2
s (Y )
=r
2
s( X )
x
(3.4)
onde
s( X ) =
xi2
e s (Y ) =
n 1
y i2
n 1
106
bY X =
(3.5)
xy 4
=
= 0,25 ,
x 2 16
e
b X Y =
xy 4
= =1
y2 4
bY X b X Y = 0,25 = r 2
107
20
Total
25
30
35
40
45
50
55
60
65
70
75
33 189
56
18 682 585
1 140 511
11
75
2
10
52 1024 1238
8
106
179
101
24
5
1
424
2
19
40
42
28
9
3
143
5
14
20
19
14
5
1
78
2
6
10
13
12
9
3
1
56
1
3
5
8
10
9
7
3
1
47
1
2
5
6
7
6
5
1
1
34
1
1
2
4
4
5
4
4
1
26
1
1
2
3
3
3
3
3
1
20
1
1
1
1
2
2
1
9
288
1418
896
268
112
64
42
26
17
11
1
8
1
3
2 3153
X i 27,5
, i = 1, 2, ..., 13
5
(3.6)
e
Zj =
Y j 27,5
5
, j = 1, 2, ..., 12
(3.7)
108
V =
Z =
Vi Fi
922
=
= 0,2924
n
3153
Z jG j
n
742
= 0,2353
3153
vi2 Fi = Vi 2 Fi
( Vi Fi ) 2
922 2
= 9708
= 9438,39
n
3153
z Gj = Z Gj
2
j
2
j
( Z j G j ) 2
n
vi z j f ij = Vi Z j f ij
r=
vi z j f ij
( vi2 Fi )( z 2j G j )
742 2
= 7090
= 6915,38
3153
( Vi Fi )( Z j G j )
= 6256
922(742)
= 6472,98
3153
= 0,8012
109
Y
X
cov( X , Y )
cov( X , Y )
=
=
XY
V ( X )V (Y )
as
variveis
tm
distribuio
normal,
demonstra-se
que
H A : 0 , utilizamos o teste
r 2 ( n 2)
F=
, com 1 e n 2 graus de liberdade.
1 r2
Pode-se verificar que o valor de F, obtido por essa frmula, igual ao valor de F
da anlise de varincia da regresso, obtido dividindo o quadrado mdio de regresso
pelo quadrado mdio residual. Portanto, testar a hiptese H 0 : = 0 equivale a testar a
hiptese H 0 : = 0 .
A funo de densidade de uma distribuio normal bidimensional corresponde a
uma superfcie cujas sees, tanto na direo do eixo dos X como na direo do eixo dos
Y, so curvas normais. As sees horizontais dessa superfcie so elipses de
isoprobabilidade, duas das quais esto traadas na figura 3.6.
110
111
EXERCCIOS
3.1. Calcule o coeficiente de correlao para a seguinte amostra de 10 pares de valores
X i , Yi .
Xi
Yi
Xi
Yi
5
5
6
6
7
1
3
1
5
3
7
8
8
9
9
7
5
9
7
9
112
3.3. Dados:
X
2
4
5
6
8
11
18
12
10
8
7
5
113
3.5. Com base no grfico dado a seguir, determine geometricamente (sem usar as
frmulas comuns de anlise de regresso):
a) A reta de regresso de Y em relao a X.
b) A reta de regresso de X em relao a Y.
c) O coeficiente de correlao (r).
d) O valor estimado de Y para X = 60.
e) O valor estimado de X para Y = 30.
3.6. Os dados a seguir foram apresentados em defesa da tese de que dietas com alto
teor de protena reduzem a fertilidade. a) Estabelea, sem calcular, o sinal do
coeficiente de correlao entre as duas variveis. b) Discuta se dados desse tipo
so apropriados para estabelecer relaes de causa-e-efeito entre essas variveis.
114
Pais
Formosa
Malaia
ndia
Japo
Iugoslvia
Grcia
Itlia
Bulgria
Alemanha
Irlanda
Dinamarca
Austrlia
EUA
Sucia
Taxa de
Natalidade
45,6
39,7
33,0
27,0
25,9
23,5
23,4
22,2
20,0
19,1
18,3
18,0
17,9
15,0
Teor de protena
na dieta
4,7
7,5
8,7
9,7
11,2
15,2
15,2
16,8
37,3
46,7
56,1
59,9
61,4
62,6
3.7. Com base em uma amostra de 200 pares de valores para as variveis X e Y
obtivemos um coeficiente de correlao igual a 0,02. Podemos afirmar que no
existe relao entre essas variveis? Explique.
3.8. Com base nos valores de renda per capita ( X 1 ) e da porcentagem de analfabetos
( X 2 ) para 20 pases latino-americanos em 1950, obtivemos o coeficiente de
correlao r = 0,6.
a) Esse resultado estatisticamente significativo ao nvel de 1%?
b) Interprete o resultado do ponto de vista estatstico e econmico-social.
3.9. So dados n pares de valores X i , Yi cujo coeficiente de correlao r. Sendo
Z i = a + bYi e Vi = k + hX i , demonstre que o coeficiente de correlao entre Vi e
Z i igual a r, se bh > 0, e igual a r, se bh < 0 (a, b, k e h so constantes).
3.10. So dados os valores de Z i (i = 1, ..., n). Definimos X i =
a
b
e Yi =
.
Zi
Zi
115
Y = 10 0,28 X
Determine o coeficiente de correlao entre X e Y sabendo que
x2
y2
2
s (X ) =
= 25 e s (Y ) =
=4
n 1
n 1
2
0
2
4
6
2
2
4
8
116
zi =
yi
, com yi = Yi Y e s (Y ) =
s (Y )
xi2
, e
n 1
y i2
n 1
RESPOSTAS
3.1. a) r = 0,8; F = 14,22, significativo
b) Y = 6,2 + 1,6 X e X = 5 + 0,4Y
c) Para X = 4, temos Y = 0,2 e para X = 9, temos Y = 8,2
Para Y = 3, temos X = 6,2 e para Y = 9, temos X = 8,6
3.2. = 30 o 58
3.3. a) r = 0,92
b) Y = 18,04 1,34 X
c) no se rejeita H 0 : = 1
3.4. a) Y = 2 + 0,5 X
b) X = 1 + Y
117
c) r = 0,7071
d) Y = 2,5
e) X = 0
3.5. a) Y = 10 + 0,25 X
b) X = 20 + Y
c) r = 0,5
d) Y = 25
e) X = 50
3.6. a) A correlao negativa.
b) Tais dados no permitem estabelecer relao de causa-e-efeito. Outras
variveis, como renda per capita, deveriam ser consideradas na anlise. Os
dados podem ser teis para sugerir pesquisas mdico-biolgicas sobre
possveis relaes causais entre consumo de protena e fertilidade.
3.7. Correlao linear igual a zero no implica ausncia de relao entre as variveis.
3.8. a) F = 10,12 ou t = 3,18, significativos.
Renda per capita e proporo de analfabetos se mostram negativamente
correlacionados. Esse resultado estatstico no prova a existncia de uma
relao de causa-e-efeito. No caso, sabemos que existe causao nos dois
sentidos. Analfabetismo implica baixo nvel tecnolgico, baixa produtividade
e baixa renda per capita. Pobreza, por outro lado, significa falta de recursos,
dificultando a analfabetizao.
3.11. Y = 12 + 0,8X
3.12. F = 4,76, significativo
3.13. b= 4/3
3.14. r = 0,7
3.15. Y = 12 X
3.16. a) Y = 1 + X
b) r 2 = 5 / 6
3.17. a) r = c
118
b) S.Q.Total = z i2 = n 1
S.Q.Regr. = r 2 (n 1)
119
j = 1, ..., n
ou
k
Y j = + i X ij + u j
(4.1)
i =1
(4.2)
onde
Y1
Y
y = 2
M
Y
n
1
= 2
M
k
1
1
X=
M
X 11
X 12
M
X 1n
X 21
X 22
M
X 2n
K
K
K
X k1
X k2
M
X kn
u1
u
u = 2
M
u n
i = 1,..., k);
II)
III)
IV)
120
V)
VI)
E (uu ) = I 2
(4.3)
a
b
1
b = b2
M
bk
e1
e
e = 2
M
e n
121
Temos
y = Xb + e = y + e
(4.4)
e
e = y Xb = y y
onde
Y1
Y
y = 2
M
Yn
A soma dos quadrados dos desvios dada por
Z = ee = (y b X)(y Xb) = y y y Xb b Xy + b X Xb
(4.5)
XXb = Xy
(4.6)
122
b = ( XX) 1 Xy
(4.7)
A primeira etapa dos clculos para obteno das estimativas dos parmetros a
construo das matrizes
n
X
1j
XX = X 2 j
M
X kj
X1j
X 12j
X1j X 2 j
M
X 1 j X kj
X2j
X1j X 2 j
X 22 j
M
X 2 j X kj
K
X kj
K X 1 j X kj
K X 2 j X kj
2
X kj
Y j
X Y
1j j
Xy = X 2 j Y j
X kj Y j
(4.8)
ej = 0
e
X ij e j = 0 para i = 1, ..., k
Note-se que a nulidade da soma dos desvios ( e j = 0) decorre do fato de o
modelo ter um termo constante (), fazendo com que a primeira coluna de X seja um
vetor com todos os elementos iguais a 1.
123
(4.9)
b = ( XX) 1 X( X + u)
ou
b = + ( XX) 1 Xu
(4.10)
E (a ) 2
E (a )(b1 1 ) K E (a )(bk k )
E (a )(b1 1 )
E (b1 1 ) 2
K E (b1 1 )(bk k )
=
M
M
M
E (bk k ) 2
E (a )(bk k ) E (b1 1 )(bk k ) K
(4.11)
124
c1
c2 K ck ]
Determinemos a varincia de cb .
Sabemos que
E (b) =
Ento
E (cb) = c
Desde que cb uma matriz com um nico elemento, temos
V (cb) = E (cb c) 2 =
= E[c(b )]2 =
= E[c(b )(b )c]
Considerando (4.11) obtemos
V (cb) = c( XX) 1 c 2
(4.12)
Y j = + 1 X 1 j + 2 X 2 j + K + k X kj + u j , j = 1, ..., n
ou
y = X + u ,
a estimativa do valor de Y, dados os valores X 1h , X 2 h ,K, X kh das variveis
explanatrias,
Yh = a + b1 X 1h + b2 X 2 h + K + bk X kh
ou
Yh = xh b ,
(4.13)
125
onde
x h = [1
X 1h
X kh ]
X 2h
V (Yh ) = xh ( XX) 1 x h 2
(4.14)
(4.15)
S.Q.Total = y = Y
2
j
2
j
( Y j ) 2
n
= y y
( Y j ) 2
n
(4.16)
( Y j ) 2
( Y j ) 2
= ( Xb)Xb
= bXXb
=
=
( Y j ) 2
( Yj ) 2
n
126
S.Q.Regr. = bXy
( Y j ) 2
n
(4.17)
E(S.Q.Res.) = (n p) 2 .
Para isso definimos, inicialmente, as matrizes
H = X( XX) 1 X
e
M = I X( XX) 1 X = I H
As matrizes H e M so simtricas e idempotentes, isto ,
H = H
'
M = M
'
HH = H
MM = M
(4.18)
HX = X ou X H = X
e
MX = 0 ou X M = 0
'
(4.19)
= My = M ( X + u)
Considerando (4.19), segue-se que
e = Mu
(4.20)
S.Q.Res. = ee = u Mu
(4.21)
127
E(S.Q.Res.) = E (ee) = 2 tr (M )
Mas
tr(M) = tr [I X( XX) 1 X] = n (k + 1) = n p
Ento
E(S.Q.Res.) = (n p ) 2 ,
(4.22)
c.q.d.
Nos exerccios 4.25 e 4.26 indicada a maneira como podemos obter as
expresses para E(S.Q.Total.) e E(S.Q.Regr.).
Esses resultados nos levam construo do seguinte esquema de anlise de
varincia:
Anlise de Varincia
C.V.
G.L.
Regresso
k=p1
Resduo
np
Total
n1
S.Q.
b Xy
( Y j ) 2
n
y y b Xy
y y
( Y j ) 2
n
128
(4.23)
1 = 2 = K = k = 0 , o cociente
F=
Q.M.Regr.
Q.M.Res.
H 0 : 1 = 2 = K = k = 0
Obtidas as estimativas dos desvios padres das estimativas dos parmetros,
dadas pelas razes quadradas dos elementos da diagonal principal da matriz ( XX) 1 s 2 ,
podemos utilizar o valor
t=
bi i
,
s (bi )
(4.24)
associado a n p graus de liberdade, para testar hipteses a respeito dos valores dos
parmetros.
Podemos, ainda, construir intervalos de confiana para os parmetros. Escolhido
o nvel de confiana, e sendo t 0 o correspondente valor crtico de t, o intervalo de
confiana para i
(4.25)
R2 =
S.Q.Regr.
S.Q.Total
129
S.Q.Res.
S.Q.Total
p 1
(1 R 2 )
n p
= g y = g( X + u) = gX + gu
(4.26)
(4.27)
130
(4.28)
De (4.26), obtemos
E () = g u
Donde
V () = E[ E ()]2 =
= E (g uu g )
Como E (uu ) = I 2 , podemos escrever
V () = g g 2
(4.29)
V () V (cb) = [g g g X( XX) 1 Xg ] 2 =
= g [I X( XX) 1 X]g 2 =
= g Mg 2
Vimos, em (4.21), que ee = u Mu . Ora, ee 0 porque uma soma de
quadrados. Portanto M uma matriz semidefinida positiva e g Mg 0 . Conclumos
ento que
V () V (cb) ,
(4.30)
c = [0 K 0 1 0 K 0] ,
isto , o i-simo elemento do vetor c igual a um, e todos os outros so iguais a zero.
Ento a desigualdade (4.30) fica
V () V (bi )
onde = g y qualquer estimador linear no-tendencioso de i .
131
xij = X ij X i , i = 1, 2, ..., k
onde
Xi =
1 n
X ij
n j =1
ou em notao matricial,
y = X + u
0
n
0
x12j
XX = 0 x1 j x 2 j
M
M
0 x1 j x kj
0
x1 j x 2 j
x 22 j
M
x 2 j x kj
K
0
K x1 j x kj
K x 2 j x kj
M
K x kj2
Yj
x Y
1j j
Xy = x 2 j Y j
M
x kj Y j
132
Y j
=Y
j =1
j =1
i =1
j =1
S.Q.Res. = Y j2 Y Y j bi xij Y j
Como
Y Y Yj = Y
2
j
2
j
( Y j ) 2
n
= S.Q.Total,
conclumos que
k
i =1
j =1
S.Q.Regr. = bi xij Y j
(4.31)
(4.32)
y j = Yj Y
Se somarmos, membro a membro, as relaes (4.1), para j = 1, 2, ..., n, e
dividirmos por n, obtemos
k
Y = + i X i + u
i =1
(4.33)
onde
u=
1
u j
n
y j = i xij + u j u
i =1
133
ou
y = X + u u
(4.34)
onde
y1
y
y = 2
M
yn
x11
x
X = 12
M
x1n
x 21 K x k 1
x 22 K x k 2
M
M
x 2 n K x kn
1
= 2
M
k
1
u j
n
fcil verificar que, neste caso, a matriz X X igual do modelo onde apenas
as variveis independentes so centradas excluindo a primeira linha e a primeira coluna,
e a matriz X y igual do mesmo modelo, excluindo apenas o primeiro elemento. Os
termos y y e b X y de (4.15) correspondem, respectivamente, soma de quadrados
total e soma de quadrados de regresso, de maneira que o coeficiente de determinao
R2 =
b Xy
y y
b = ( XX) 1 Xy
obtemos
b = ( XX) 1 X( X + u u ) =
= + ( XX) 1 Xu ( XX) 1 Xu
(4.35)
xij u = u xij = 0
j
134
E (b) =
e
V (b) = ( XX) 1 2
4.8.
Yj
X1j
X2j
16,5
1,0
14,0
3,5
6,0
4,0
10,0
7,5
3,5
9,0
Obtemos:
Y j = 50
X 1 j = 25
X 2 j = 20
Y = 10
X1 = 5
X2 = 4
y 2j = 116,5
x12j = 41,5
x 22 j = 10
x1 j Y j = 54
x 2 j Y j = 30
x1 j x 2 j = 20
n
0
XX = 0
x12j
0 x1 j x 2 j
5 0
0
x1 j x 2 j = 0 41,5 20
x 22 j 0 20 10
0
135
Y j 50
Xy = x1 j Y j = 54
x 2 j Y j 30
1
50 10
0
0
5
2
4
b = ( XX) 1 Xy = 0
54 = 4
3
3
0 4 83
3 30 30 11
A equao estimada , ento,
Y j = 10 + 4 x1 j 11x 2 j
Como
x1 j = X 1 j 5
e
x2 j = X 2 j 4
obtemos
Y j = 34 + 4 X 1 j 11X 2 j
De acordo com (4.31), temos
S.Q.Regr. = b1 x1 j Y j + b2 x 2 j Y j =
= 4 (54) 11 (30) = 114
Ento
S.Q.Res. = y 2j 114 = 116,5 114 = 2,5
Poderamos, tambm, ter obtido o valor da soma de quadrados residual de
(4.15):
S.Q.Res. = y y b X y =
= 616,5 614 = 2,5
136
G.L.
S.Q.
Q.M.
Regresso
114,0
57
Resduo
2,5
1,25
Total
116,5
F
45,6
114
= 0,9785
116,5
isto , 97,85% da soma de quadrados total explicada pela regresso linear ajustada.
Conforme a definio apresentada no final da seo 4.5, podemos verificar que o
coeficiente de determinao corrigido para graus de liberdade R 2 = 0,9571 .
Como s 2 = 1,25 temos, de acordo com (4.23), as seguintes estimativas das
varincias e covarincias das estimativas dos parmetros:
1,25
V (b0 ) = s 2 (b0 ) = s 2 (Y ) =
= 0,25
5
2
5
V (b1 ) = s 2 (b1 ) = 1,25 = = 0,8333
3
6
83
83
V (b2 ) = s 2 (b2 ) =
1,25 =
= 3,4583
30
24
cv(Y , b1 ) = cv(Y , b2 ) = 0
4
5
cv(b1 , b2 ) = 1,25 =
3
3
Temos que
a = Y b1 X 1 b2 X 2
Ento
137
t=
34 50
9,75
= 5,124
t=
40
0,8333
= 4,382
t=
11 0
3,4583
= 5,915 , significativo
138
t=
bi
, i = 1, 2, ..., k
s (bi )
ou
y = X + u
Yh = a + b1 X 1h + b2 X 2 h + K + bk X kh = xh b
onde
x h = [1
X 1h
X 2h
X kh ]
Devemos ressaltar que o vetor x h pode ou no ser uma das linhas da matriz X.
De acordo com (4.14), temos
139
V (Yh ) = xh ( XX) 1 x h s 2
(4.36)
(4.37)
Consideremos, mais uma vez, o exemplo numrico da tabela 4.1. Tendo em vista
o modelo5
Y j = 0 + 1 x1 j + 2 x 2 j + u j
( XX) 1
1
5
2
3
4
3
83
30
4
3
10
b = 4
11
Consideremos X 1h = 7 e X 2 h = 1 . Uma vez que estamos fazendo os clculos
tendo em vista o modelo com as variveis explanatrias centradas, e lembrando que
X 1 = 5 e X 2 = 4 , obtemos x1h = 2 e x 2 h = 3 e fazemos
x h = [1
3]
Ento,
V (Yh ) = V ( y h ) +
n
140
Yh = xh b = 51
Lembrando que s 2 = Q.M.Res. = 1,25 , obtemos, de acordo com (4.36),
V (Yh ) = xh ( XX) 1 x h s 2 =
1
0
0
5
1
2
4
1,25 = 54,708
= [1 2 3] 0
3
3 2
4 83
0
3 30 3
X 2 h , ..., X kh .
O estimador de Yh = xh + u h Yh = xh b . O erro de previso
Yh Yh = xh (b ) u h
(4.38)
141
V (Yh Yh ) = V [xh (b )] + 2
De acordo com (4.14), segue-se que
V (Yh Yh ) = 2 + xh ( XX) 1 x h 2 =
= [1 + x h ( X X) 1 x h ] 2
Sendo t 0 o valor crtico de t com n p graus de liberdade e ao nvel de
confiana adotado, o intervalo de previso para a nova observao
H 0 : c = 0
142
onde
c = [0 2 1]
Para testar essa hiptese calculamos, de acordo com (4.12),
V (cb) = c( X X) 1 cs 2 = 0,125
A seguir, obtemos
t=
cb 0
3
=
= 8,485
0,125
V (cb)
(4.39)
x12j
XX =
x1 j x 2 j
x1 j x 2 j
x1 j y j
, Xy =
2
x 2 j
x 2 j y j
( XX) 1 =
x x
2
1j
2
2j
1
( x1 j x 2 j ) 2
x 22 j
x1 j x 2 j
x1 j x 2 j
x12j
De b = ( XX) 1 Xy , obtemos
b1 =
x 22 j x1 j y j x1 j x 2 j x 2 j y j
x12j x 22 j ( x1 j x 2 j ) 2
(4.40)
e
b2 =
x12j x 2 j y j x1 j x 2 j x1 j y j
x12j x 22 j ( x1 j x 2 j ) 2
(4.41)
143
X1.
Sabemos que para uma regresso linear simples de y j em relao a x j temos
xj yj
desvio = y j y j = y j bx j = y j
x2
j
x j
Segue-se que
x 2 j x1 j
v j = x1 j
x2
2j
x2 j
(4.42)
x2 j y j
zj = yj
x2
2j
x2 j
(4.43)
vjz j
(4.44)
v 2j
Mas
x 2 j x1 j
v j z j = x1 j
x2
2j
x2 j
x2 j y j
y j
x2
2j
x2 j
144
v j z j = x1 j y j
x1 j x 2 j x 2 j y j
(4.45)
x 22 j
Analogamente, obtemos
v = x
2
j
2
1j
( x1 j x 2 j ) 2
(4.46)
x 22 j
x 22 j x1 j y j x1 j x 2 j x 2 j y j
(4.47)
x12j x 22 j ( x1 j x 2 j ) 2
yj
6,5
4
4
0
6,5
2
1
0
1
2
0
0,5
1
0,5
0
0,5
1
4
3
0,5
145
vjz j
v
2
j
6
= 4,
1,5
146
vjzj
rY 12 =
v z
2
j
(4.48)
2
j
2
j
( x 2 j y j ) 2
x 22 j
(4.49)
x1 j y j
rY 12 =
x1 j x 2 j x 2 j y j
x 22 j
2 ( x1 j x 2 j ) 2
( x 2 j y j ) 2
2
x1 j
y j
x 22 j
x 22 j
rY 1 r12 rY 2
rY 12 =
(4.50)
(4.51)
Analogamente, temos
rY 2 r12 rY 1
rY 21 =
(4.52)
rY 1 =
rY 2 =
r12 =
x1 j y j
x12j y 2j
x2 j y j
x y
2
2j
54
2
j
x1 j x 2 j
x12j x 22 j
41,5 116,5
30
10 116,5
20
41,5 10
= 0,776617
= 0,878938
= 0,981761
147
rY 12 = 0,952
Esse coeficiente de correlao parcial tambm pode ser obtido calculando-se o
coeficiente de correlao simples entre os valores de v j e z j , da tabela 4.3.
vjzj
rY 12 =
v 2j z 2j
6
1,5 26,5
= 0,952
rY 12
x1 j x2 j x2 j y j
x1 j y j
x22 j
=
2 ( x1 j x2 j ) 2
x1 j
x22 j
( x1 j x2 j ) 2
x12j
x22 j
( x2 j y j ) 2
y 2j
x22 j
( x1 j x2 j ) 2
x22 j
( x2 j y j ) 2
= b1
(S.Q.Res. x1 j | x2 j )
(S.Q.Res y j | x2 j )
x22 j
ou
b1 = rY 12
(S.Q.Res. y j | x 2 j )
(S.Q.Res x1 j | x 2 j )
(4.53)
Analogamente,
b2 = rY 21
(S.Q.Res. y j | x1 j )
(S.Q.Res x 2 j | x1 j )
(4.54)
148
r12 = 0,981761
X1
X2
b1 = 4
b2 = 11
Y
= R 2 y 2j rY22 y 2j
(4.55)
149
(Contribuio de x1 j )
(S.Q.Res. de y j | x 2 j )
R 2 y 2j rY22 y 2j
y 2j rY22 y 2j
R 2 rY22
=
1 rY22
(4.56)
R2 =
(4.57)
que pode ser obtida (aps vrias passagens algbricas que podem ser desenvolvidas,
como exerccio) substituindo (4.40) e (4.41) em
R2 =
b1 x1 y1 + b2 x 2 j y j
y 2j
(rY 1 r12 rY 2 ) 2
(1 r122 )(1 rY22 )
(Contribuio de x1 j )
(S.Q.Res. de y j | x 2 j )
R 2 rY22
1 rY22
(4.58)
Analogamente,
150
rY221 =
(Contribuio de x 2 j )
(S.Q.Res. de y j | x1 j )
R 2 rY21
1 rY21
(4.59)
(S.Q.Regr.de y j | x 2 j ) =
( x 2 j y j ) 2
x 22 j
(30) 2
=
= 90
10
e
(S.Q.Res.de y j | x 2 j ) = 116,5 90 = 26,5
Anteriormente j havamos obtido (ver tabela 4.2)
(S.Q.Regr.de y j | x1 j e x 2 j ) = 114
Ento
(Contribuio de x1 j ) = 114 90 = 24
De acordo com (4.58) temos
rY212 =
24
= 0,905660
26,5
rY 12 = 0,952
que j obtivemos anteriormente de (4.51).
Podemos verificar a significncia estatstica da contribuio de x1 j por meio
de um teste F, como mostrado na tabela 4.4.
TABELA 4.4. Anlise de Varincia
C.V.
Q.M.
24
24
19,2
114
57
45,6
2,5
1,25
116,5
G.L.
S.Q.
Regr. de y j | x 2 j
90
Contribuio de x1 j
Regr. de y j | x1 j e x 2 j
Resduo
Total
151
rY212 3...k =
(Contribuio de x1 j )
(S.Q.Res. de y j | x 2 j , x3 j ,..., x kj )
onde
(Contribuio de x1 j ) =
= (S.Q.Regr. de y j | x1 j , x 2 j , x3 j ,..., x kj ) (S.Q.Regr. de y j | x 2 j , x3 j ,..., x kj )
A significncia estatstica da contribuio de x1 j pode ser testada por meio de
uma decomposio da soma de quadrados de regresso, como est indicado no esquema
a seguir.
Ver a seo 5.3 (p. 132-135) de Johnston (1972), para uma outra maneira de obter os coeficientes de
correlao parcial.
152
G.L.
k1
Regr. de y j | x 2 j , x3 j ,..., x kj
Contribuio de x1 j
Regr. de y j | x1 j , x 2 j , x3 j ,..., x kj
Resduo
k=p1
np
n1
Total
t h = bh / s (bh ) , temos
t h2 =
(Contribuio de x hj )
s2
(Contribuio de x hj ) = t h2 s 2
rYh2 i h =
(Contribuio de x hj )
(n p) s 2 + (Contribuio de x hj )
Segue-se que
2
Yhi h
t h2 s 2
=
(n p ) s 2 + t h2 s 2
ou
rYh2 i h =
t h2
t h2 + n p
153
X1j
X2j
1,5
6,5
10,0
11,0
11,5
16,5
0
1
1
2
2
3
0
2
4
2
4
6
yj
x1 j
x2 j
8,0
3,0
0,5
1,5
2,0
7,0
1,5
0,5
0,5
0,5
0,5
1,5
3
1
1
1
1
3
x1 j x 2 j 5,5 9
,
=
x 22 j 9 22
x1 j y j 25,5
Xy =
=
,
x
y
49
2
j
j
( XX) 1
11
20
=
9
40
9
0,55
0,225
40
11 0,225 0,1375
80
3
b = ( XX) 1 Xy =
1
e
A equao estimada
y j = 3 x1 j + x 2 j
ou
154
Y j = 2 + 3 X 1 j + X 2 j
A tabela 4.6 mostra a anlise de varincia da regresso, verificando-se que
R 2 = 0,977 .
TABELA 4.6. Anlise da Varincia
C.V.
G.L.
S.Q.
Q.M.
Regresso
Resduo
2
3
125,5
3
62,75
1
62,75
Total
128,5
Como s 2 = 1 , temos
V (b1 ) = 0,55 e V (b2 ) = 0,1375
Seguindo o procedimento apresentado na seo a 4.8, verifica-se que
37
V (a ) =
60
Adotando um nvel de significncia de 1%, o valor crtico de F, com 2 e 3 graus
de liberdade, 30,82. Portanto, o resultado significativo, isto , rejeita-se, a esse nvel
de significncia, a hiptese H 0 : 1 = 2 = 0 .
Para testar a hiptese H 0 : 1 = 0 , contra H A : 1 0 , calculamos
t=
3
0,55
= 4,045
t=
1
0,1375
= 2,697 , no significativo
155
2 5,841
37
37
< < 2 + 5,841
60
60
ou
2,59 < < 6,59
O intervalo de confiana para 1
156
1
=F
ms 2
(4.60)
y j = i xij + u j u
i =1
(4.61)
157
H 0 : C = 0
Em (4.60), fazendo C = I k e C = 0 , obtemos
F=
b XXb
ks 2
C = [1
0] , cuja caracterstica m = 1.
Cb = b1
e
C( XX) 1 C = w11 ,
b1 ( w11 ) 1 b1
b12
=
s2
w11 s 2
| t |= F =
| b1 |
s (b1 )
158
(4.62)
0] ,
cuja caracterstica m = 1.
Ento,
Cb = b1 , C = 1 e C( XX) 1 C = w11
Substituindo esses resultados em (4.62), obtemos
(b1 1 )( w11 ) 1 (b1 1 ) < F0 s 2
( 1 b1 ) 2 < F0 w11 s 2
F0 = t 0 e
159
0 1 0
C=
0 0 1
cuja caracterstica m = 2. Ento
C = 1
2
1 b1 = q1
e 2 b2 = q 2
b
Cb = 1
b2
Fazendo
(4.63)
segue-se que
q
Cb C = 1
q2
(4.64)
0 1 0 n
=
0
0 0 1 0
0
w11
w12
0 0 0
w11
w12 1 0 =
w
w22 0 1 12
w12
w22
Donde
x12j
[C( XX) C] =
x1 j x 2 j
1
x1 j x 2 j
x 22 j
(4.65)
[q1
x12j
q2 ]
x1 j x 2 j
x1 j x 2 j q1
2
< 2 F0 s
2
x 2 j q 2
(4.66)
x12j = 5,5
x 22 j = 22
x1 j x 2 j = 9
s2 = 1
160
5,5 9 q1
q2 ]
< 2 30,82
9 22 q 2
[q1
ou
0 0 1
a hiptese H 0 : 1 = 4 e 2 = 2 pode ser indicada como segue:
4
H 0 : C =
2
Como
b 3
Cb = 1 = ,
b2 1
temos que
3 4
1
Cb C =
=
1 2
1
(4.67)
5,5 9 1
1
[1 1]
= 22,75
2
9 22 1
161
X 1 j = x1 j
X 2 j = x2 j
X 3 j = x3 j
8,5
1,0
4,0
4,0
5,0
3,0
6,0
6,0
7,0
5,0
5,0
5,0
3,0
0,5
162
x12j = 16
Y = 4,5
x 22 j = 12
y 2j = 61
x32 j = 10
x1 j Y j = 8
x1 j x 2 j = 8
x 2 j Y j = 24
x1 j x3 j = 8
x3 j Y j = 18
x 2 j x 3 j = 8
Y j = 0 + 1 x1 j + 2 x 2 j + 3 x3 j + u j ,
j = 1, 2, ..., 14
construmos as matrizes
0
0
0
14
63
0 16 8
8
8
XX =
e Xy =
0 8 12 8
24
8 8 10
0
18
A seguir, obtemos
1
14
1
( XX) =
7
64
1
32
1
32
3
16
1
16
1
8
0
1
16
1
4
b0
4,5
b
1
1
1
b=
= ( XX) Xy =
b2
2
1
b3
A equao estimada
Y j = 4,5 + x1 j + 2 x 2 j x3 j
ou, uma vez neste exemplo xij = X ij (i = 1, 2, 3),
163
Y j = 4,5 + X 1 j + 2 X 2 j X 3 j
Temos
S.Q.Regr. = bi xij Y j =
i
G.L.
S.Q.
Q.M.
3
10
13
58
3
61
19,33
0,30
F
64,44
R2 =
58
= 0,951
61
s (b2 ) =
9
= 0,237
160
164
b2 0
=
s (b2 )
2
9
160
= 8,433
0
0 63
c0 14
c = 0 16 8 8 =
1
c 2 0 8 12 24
1
14
=0
0
3
32
1
16
63 4,5
1
8 = 0,75
16
24 2,5
1
165
segue-se que
(Contribuio de x3 j ) = 58 54 = 4
Ento, o coeficiente de determinao parcial entre Y j e X 3 j
rY2312 =
(contribuio de x3 j )
(S.Q.Res. de Y j | x1 j , x 2 j )
4
7
4
= 0,756
7
rY 312 =
H 0 : 1 + 2 + 3 = 1
contra a hiptese alternativa
H A : 1 + 2 + 3 1,
ao nvel de significncia de 5%.
Fazendo
c = [0 1 1 1] ,
a hiptese da nulidade fica
H 0 : c = 1
De acordo com (4.12) temos
V (cb) = c( XX) 1 cs 2 =
= [0
1
14
1]
7
64
1
32
1
32
3
16
1
16
1
8
0 0
1 1
16
141
0,30 =
640
1
8 1
1
1
4
166
A seguir, obtemos
t=
cb c
2 1
=
= 2,130
141
V (cb)
640
3 .
Fazemos
0 0 1 0
C=
,
0 0 0 1
cuja caracterstica m = 2.
Temos que
2
C = 2 , Cb =
3
1
e
3
16
1
C( X X) C =
1
8
1
18
1
4
2 2
1
3
3
16
1
8
1
8
1
4
2 2
1 < F0 2 0,30
3
2 2 8 4 2 2
< 4,10 2 0,30
+ 1 4
6 3 + 1
3
167
Sabemos que essa regio de confiana delimitada por uma elipse com centro no
ponto 2 = 2 e 3 = 1 .
A regio de confiana para 1 , 2 e 3 um elipside num espao com 3
dimenses. A visualizao desse elipside exigiria a determinao e o traado de elipses
que resultam da interseco da superfcie do elipside com planos perpendiculares a um
dos trs eixos coordenados, para vrios valores do parmetro correspondente. Portanto,
fcil ver que a quantidade de clculos exigida para a determinao das regies de
confiana dos parmetros de uma regresso cresce muito rapidamente com o nmero de
parmetros envolvidos e que a visualizao dessas regies de confiana se torna difcil
para mais de dois parmetros.
(4.68)
(4.69)
g = (V V ) 1 V X + (V V ) 1 V u
e
E (g) = P ,
(4.70)
P = (V V ) 1 V X
(4.71)
onde
y j = 1 x1 j + 2 x 2 j + 3 x3 j + u j u
e o pesquisador, erroneamente, obtm a equao estimada
y j = g1 x1 j + g 2 x 2 j
Neste caso
x12j
V V =
x1 j x 2 j
x1 j x 2 j
x 22 j
x12j
VX=
x1 j x 2 j
x1 j x 2 j
x 22 j
x1 j x3 j
x 2 j x3 j
1 0 1
P = (V V ) 1 V X =
0 1 2
(4.72)
1 0 1 1 1 + 1 3
=
E (g ) =
2
0 1 2 2 + 2 3
3
ou seja,
E ( g1 ) = 1 + 1 3
e
169
E ( g 2 ) = 2 + 2 3
Verificamos que as estimativas dos coeficientes obtidos ( g1 e g 2 ) com o
modelo erroneamente especificado so tendenciosas. O vis de g i como estimativa de
x12j
V V = x1 j x 2 j
x1 j x3 j
x1 j x 2 j
x
x 2 j x3 j
2
2j
x1 j x3 j
x 2 j x3 j
x32 j
x12j
V X = x1 j x 2 j
x1 j x3 j
x1 j x 2 j
x 22 j
x 2 j x3 j
1 0
P = (V V ) V X = 0 1
0 0
1
1 0
1
1
E (g) = 0 1 = 2 ,
0 0 2 0
ou seja,
E ( g1 ) = 1 ,
E(g 2 ) = 2
e
E( g3 ) = 0
170
y j = i xij + u j u
i
7
Como ocorre frequentemente, isso pode parecer bvio depois de assinalado. Mas em dois artigos
publicados na Revista Brasileira de Economia h erro de especificao semelhante, incluindo o ndice de
Gini e o PIB per capita de cada Unidade da Federao em modelos destinados a captar o efeito de
transferncias do governo federal sobre a pobreza: Marinho e Araujo (2010) e Marinho et al. (2011).
171
ou
z j = i vij + j +
(4.73)
onde
zj =
yj
y 2j
, vij =
i = i
uj
j =
xij
xij2
xij2
y 2j
, i = 1, 2, ..., k
(4.74)
(4.75)
e =
2
j
y 2j
1
r
V V = 12
M
r
1k
r12
1
M
r2 k
r1k
rY 1
r
r2 k
e V z = Y 2
M
M
1
r
Yk
...
...
vij y j = rYi
i
y 2j
xij2
172
Y j = + 1 X j + 2 X 2j + u j
pode ser encarada como uma regresso linear mltipla com duas variveis
explanatrias, fazendo X j = X 1 j e X 2j = X 2 j .
De maneira anloga, qualquer regresso polinomial pode ser ajustada como uma
regresso linear mltipla.
Em pesquisas econmicas, freqentemente utilizado o modelo
que um modelo de regresso linear mltipla nos logaritmos das variveis. Neste caso,
desde que u j = log j obedea s pressuposies vistas na seo 4.1, as estimativas de
mnimos quadrados tm as propriedades estatsticas desejveis.
4.17.
xij x hj = 0 para i h
i
y j = i xij + u j + u
i
173
( XX)
1
x2
1j
0
=
1
x kj2
0
1
x 22 j
0
e
x1 j y j
2
x1 j
x2 j y j
1
b = ( XX) Xy = x 22 j
x kj y j
2
x kj
Portanto, as estimativas dos parmetros da regresso mltipla coincidem com as
estimativas dos coeficientes das regresses lineares simples de Y j contra cada uma das
variveis explanatrias e a soma de quadrados de regresso, dada por
S.Q.Regr. = bi xij y j ,
i
, neste caso, igual soma das somas de quadrados de regresso das regresses lineares
simples de Y j contra cada uma das variveis explanatrias. O coeficiente de
determinao mltipla , portanto, igual soma dos coeficientes de determinao das
regresses lineares simples mencionadas.
Como vimos, a ortogonalidade entre as colunas da matriz X facilita bastante a
anlise.
Vejamos, agora, o que ocorre quando h multicolinearidade perfeita, isto ,
quando existem, na matriz X, colunas linearmente dependentes.
Consideremos, inicialmente, o caso de uma regresso linear mltipla com duas
variveis independentes perfeitamente correlacionadas entre si
Y j = 1 x1 j + 2 x 2 j + u j u
com
r =
2
12
( xij x 2 j ) 2
x12j x 22 j
=1
174
| XX |= x12j x 22 j ( x1 j x 2 j ) 2 = 0 ,
isto , o determinante da matriz X X igual a zero. No possvel, ento, inverter a
matriz X X e, consequentemente, impossvel obter as estimativas de 1 e 2 .
Geometricamente, o que ocorre que os pontos ( x1 j , x 2 j , y j ) esto todos sobre
um plano , perpendicular ao plano definido pelos eixos de x1 j e de x 2 j . O mtodo dos
mnimos quadrados permite determinar apenas uma reta no plano ; qualquer que seja o
plano que contenha essa reta, a soma dos quadrados dos desvios assume o mesmo valor;
portanto, existe indeterminao.
importante compreender que no caso de uma regresso com mais de duas
variveis explanatrias pode existir multicolinearidade perfeita, mesmo que nenhum dos
coeficientes de determinao simples seja igual a um (ver exerccio 4.12).
Freqentemente, a matriz X apresenta multicolinearidade elevada, embora no
perfeita. As principais conseqncias desse fato so as seguintes:
1) As varincias e covarincias das estimativas dos parmetros sero muito elevadas,
isto , as estimativas obtidas podem ter erros muito grandes e esses erros podem
estar altamente correlacionados entre si. A baixa preciso das estimativas torna
difcil, ou at mesmo impossvel, distinguir as influncias das diversas variveis
explanatrias;
2) Um pesquisador pode ser levado a eliminar variveis da anlise porque os
coeficientes no se mostraram estatisticamente diferentes de zero; essas variveis
podem, na realidade, ser importantes e a amostra disponvel que no permite
detectar sua influncia;
3) As estimativas dos coeficientes variam muito de amostra para amostra. A adio de
algumas observaes amostra pode alterar muito o valor da estimativa obtida.
Para mostrar como a multicolinearidade afeta a preciso das estimativas
consideremos, novamente, uma regresso mltipla com apenas duas variveis
explanatrias:
y j = i xij + u j + u
i
Fazendo
175
zj =
yj
y
2
j
x12j
1 = 1
uj
y
2
j
2
1j
e =
x2 j
, v2 j =
x 22 j
, 2 = 2
y 2j
j =
x1 j
, v1 j =
y 2j
u
y 2j
2
2j
obtemos
z j = 1v1 j + 2 v 2 j + j +
(4.76)
v1 j v 2 j
v1 j v 2 j
2
,
2
v 2 j
1
r
12
1
1 r 2
1
12
r12
1
r12
1 r 2
12
r12
1 r122
2
,
1
1 r122
Conclumos que
V (c1 ) = V (c 2 ) =
2
1 r122
(4.77)
e
cov(c1 , c 2 ) =
r12 2
1 r122
(4.78)
176
c 2 2 r12
1 r 2
12
r12
1 r122 v
1j j
v
1 2j j
1 r122
(4.79)
(4.80)
(4.81)
c1 1 =
v1 j j r122 v1 j j r12 d j j
1 r
2
12
= v1 j j
r12 d j j
1 r122
(4.82)
c2 2 =
r12 v1 j j + r12 v1 j j + d j j
1 r
2
12
d j j
1 r122
(4.83)
177
c 2 subestima 2 , e vice-versa.
Pode-se demonstrar que no h razo para que a multicolinearidade afete
seriamente a estimativa da varincia residual.8 Portanto, as estimativas das varincias
das estimativas dos parmetros so indicadores adequados da existncia de
multicolinearidade. O efeito de uma varivel explanatria pode ser suficientemente
forte, de tal maneira que o respectivo coeficiente se mostre estatisticamente diferente de
zero apesar da multicolinearidade; uma multicolinearidade bastante alta impedir,
entretanto, que se detecte a influncia de variveis importantes.
(4.84)
178
(4.85)
F=
S R SU
( g R gU )s 2
(4.86)
Y j = + 1 X 1 j + 2 X 2 j + u j
Vamos admitir que queremos testar a hiptese H 0 : 1 = 0 . Ento o modelo restrito
Yj = + 2 X j + u j
179
(4.87)
Na seo 4.11 (tabela 4.4) vimos que a soma de quadrados de regresso de uma
regresso de Y contra X 2 igual a 90, podendo-se verificar, ento, que a soma de
quadrados residual do modelo restrito
S R = 26,5 , com g R = 3
(4.88)
(4.89)
com base nos dados da tabela 4.5 (seo 4.12). O modelo irrestrito
Y j = + 1 X 1 j + 2 X 2 j + u j
(4.90)
Na seo 4.12 vimos que a soma de quadrados residual para esse modelo
SU = 3, com g U = 3
(4.91)
Yj = + 4X1j + 2X 2 j + u j
ou
Yj 4X1j 2X 2 j = + u j
(4.92)
Note-se que o modelo sempre deve ser escrito de maneira que no segundo
membro fiquem apenas o erro e os termos com parmetros a serem estimados.
Fazendo
W j = Yj 4X1j 2X 2 j ,
(4.93)
Wj = + u j
(4.94)
180
S R = 48,5, com g R = 5
(4.95)
48,5 3
45,5
F = 53 =
= 22,75
3
2
3
(4.96)
X 1 11
x = X 2 = 2
X 3 10
(4.97)
pode ser representado, graficamente, por uma seta que vai da origem do sistema de
eixos ao ponto (11, 2, 10), num espao tridimensional, como mostra a figura 4.2.
181
X1
X
x = 2
M
X n
Y1
Y
y = 2
M
Yn
x y = y x = x y = y x = X i Yi
i =1
| x |= x x
Para vetores com duas ou trs dimenses pode-se verificar, atravs do teorema
de Pitgoras, que esta definio de comprimento de um vetor corresponde ao
comprimento da seta que o representa. O comprimento do vetor dado em (4.97)
| x |= 112 + 2 2 + 10 2 = 15
Por definio, dois vetores so ortogonais se seu produto escalar igual a zero,
isto , x ortogonal a y se, e somente se, x y = 0 . Assim, por exemplo, os vetores
182
2
x= e
1
1
y=
2
so ortogonais entre si, pois x y = 0 . Esses vetores esto representados na figura 4.3,
que mostra que as setas representativas de dois vetores ortogonais so perpendiculares
entre si.
| x |= (x) (x) = 2 x x =| | | x | ,
isto , o comprimento de x igual ao comprimento de x multiplicado pelo valor
absoluto de .
Para exemplificar, lembremos o vetor x dado em (4.97). Pode-se verificar que os
vetores 2x e 2x so colineares com x e tm comprimento igual a 30, isto , o dobro do
comprimento de x.
Vamos supor agora que, com base em uma amostra com apenas 3 observaes,
foram obtidos os pares de valores ( X i , Yi ) apresentados na tabela 4.9. As mdias das
duas variveis nessa amostra so iguais a zero, isto , xi = X i e y i = Yi (com i = 1, 2,
3).
183
Yi = y i
0
2
2
2
2
4
0
2
x = 2 e y = 2
2
4
(4.98)
| x |= 8 = 2 2 e o comprimento do vetor y | y = 24 = 2 6 .
Na figura 4.4, seja o plano dos vetores x e y. O plano um subespao
bidimensional do espao tridimensional. Qualquer que seja o nmero de observaes da
amostra, isto , qualquer que seja a dimenso (n) de x e y, desde que esses vetores no
184
sejam colineares, eles definem um plano (um subespao bidimensional) no espao ndimensional. Na figura 4.5 os vetores x e y esto representados nesse subespao
bidimensional.
OA = y * = x
(4.99)
Temos
y * + AB = y
ou
AB = y y *
Uma vez que x e AB = y y * so vetores ortogonais entre si, temos
x (y y * ) = 0
Ento
x y = x y*
(4.100)
xy
xx
(4.101)
185
cos =
| y* |
=
|y|
y* y*
yy
xx
(4.102)
yy
cos =
(x x)(y y )
(4.103)
xi y i
xi2 y i2
= r,
(4.104)
12
3
=
2
8 24
Donde
= 30 o
Vamos agora considerar a anlise de regresso de Y contra X de acordo com o
modelo
Yi = X i + u i
ou
y = x + u ,
onde
Y1
X1
Y2
X
y = e x = 2
M
M
Yn
X n
186
uma reta dada pela perpendicular baixada do ponto sobre a reta. Uma vez que, na
figura 4.5, OA = x , por construo, a projeo vertical de y sobre a reta-suporte do
vetor x, conclumos que, para minimizar o comprimento de e = y bx , devemos fazer
bx = OA = x . Portanto, o estimador de mnimos quadrados de
b=
xy
= (x x) 1 x y
xx
AB = e = y OA = y y
No tringulo retngulo OAB da figura 4.5, o teorema de Pitgoras estabelece que
187
OB = OA + AB
ou
y y = y y + e e
ou
S.Q.total = (S.Q.Regr.) + (S.Q.Res.),
que uma relao j demonstrada anteriormente, mas de outra maneira.
Uma vez que x e e so vetores ortogonais entre si, temos
x e = x e = 0
Esta relao um caso particular de (4.8).
fcil verificar que se x e y fossem colineares, teramos = 0, r = cos = 1,
y = y = bx , e = 0 e S.Q.Res. = ee = 0 .
Vamos considerar, a seguir, o modelo de regresso linear mltipla
y = X + u
(4.105)
onde
Y1
Y
y = 2 ,
Yn
X 11
X
X = 12
X 1n
= 1 e
2
X 21
X 22
,
X 2n
u1
u
u = 2
u n
X 11
X 21
X
X
12
22
x1 =
e x2 =
,
X 1n
X 2n
temos
y = 1 x1 + 2 x 2 + u
(4.106)
188
189
y = OA = OA1 + OA 2 ,
OA1 = b1 x1
e
OA 2 = b2 x 2
O valor absoluto de b1 o cociente da diviso do comprimento de OA1 pelo
comprimento de x1 e o valor absoluto de b2 o cociente da diviso do comprimento de
OA 2 pelo comprimento de x 2 . No caso da figura 4.6 verifica-se que b1 > 1 e 0 < b2 < 1 .
O vetor dos desvios da regresso
AB = e = y y
Como o segmento de reta AB , por construo, perpendicular ao plano , tal
segmento perpendicular ou ortogonal a toda reta desse plano. Em particular, AB
perpendicular a OA . Portanto OAB um tringulo retngulo e, conseqentemente
2
OB = OA + AB
ou
y y = y y + e e
ou, ainda,
S.Q.Total = (S.Q.Regr.) + (S.Q.Res.)
Como e = AB ortogonal a x1 e x 2 , temos que
x1 e = x1 e = 0
e
x 2 e = x2 e = 0
De acordo com essas relaes, podemos escrever
X e = 0 ,
(4.107)
e = y Xb ,
(4.108)
onde
b
b = 1
b2
190
OA = 2x1 + 0x 2 ,
OA = 0x1 +
2
x2
3
ou
OA = x1 + x 2
Isso mostra que os valores de b1 e b2 em y = b1 x1 + b2 x 2 so indeterminados.
Esse o problema da multicolinearidade perfeita, j examinado, sob outro enfoque, na
seo 4.17.
Vrios outros problemas de anlise de regresso podem ser examinados com o
auxlio da interpretao geomtrica apresentada nesta seo.10 Como ilustrao final,
vamos considerar o exerccio 2.9, onde se pede para comparar a anlise de regresso
10
Uma exposio didtica do assunto pode ser encontrada em Wonnacott e Wonnacott (1976), parte II.
191
Yi = a + bX i
e
Z i = c + dX i
Vamos demonstrar que c = a e d = b + 1.
Sejam y e y os vetores com os valores de Yi e Yi , respectivamente; seja x1 o
vetor com os valores de X i ; sejam z e z os vetores com os valores de Z i e Z i ,
respectivamente, e seja x 0 um vetor cujos elementos so todos iguais a 1. Temos
z = y + x1
y = ax 0 + bx1
e
z = cx 0 + dx1
Na figura 4.8 esto representados os vetores x 0 , x1 e y . O plano gerado por
x 0 e x1 denominado plano . Indicando a extremidade de y por B e a projeo
vertical de B sobre por A, temos que
OA = y
e
2
AB = (S.Q.Res. y | x 0 e x1 )
(4.109)
OA 0 = ax 0 e OA1 = bx1 ,
de tal maneira que
OA == y = ax 0 + bx1
Uma vez que neste caso a e b so positivos, segue-se que
a=
OA 0
| x0 |
(4.110)
192
b=
OA1
| x1 |
(4.111)
e
2
CD = (S.Q.Res. z | x 0 e x1 )
(4.112)
(4.113)
e
OC = z = OA 0 + OC 1 ,
com
OA 0 = cx 0
e
OC 1 = dx1
193
OA0
| x0 |
(4.114)
d=
OC1
| x1 |
(4.115)
OA1
+1
| x1 |
Exerccios
4.1. Mostre que as frmulas para regresso linear simples, deduzidas no Captulo 2, so
casos particulares das expresses gerais:
a) b = ( X X) 1 X y
b) ( X X) 1 2 , que a matriz de varincias e covarincias das estimativas dos
parmetros.
c) S.Q.Res. = y y b X y
d) V (Yh ) = x h ( XX) 1 x h 2
194
X1
X2
10
12
10
X1
X2
X3
195
X1
X2
E (Y | X 1 = 1 e X 2 = 2 ).
g) Idem, para X 1 = 2 e X 2 = 4 (uma extrapolao).
4.5. So dados os seguintes valores, obtidos de uma amostra aleatria com 10
observaes:
X1
X2
X3
1
1
1
1
1
1
0
0
0
1
1
0
1
1
0
1
0
0
0
1
0
0
0
0
0
0
1
0
1
0
5
7
3
7
9
5
3
8
7
6
196
resultado
do
problema
anterior,
mostre
que,
se
rY 1 = rY 2 = r12 = r 1 , obtemos
197
R2 =
2r 2
1+ r
X1j
X2j
3
0
6
9
0
0
1
3
0
3
1
0
X1
X2
4
5
4
11
0
1
2
3
3
1
2
0
198
finalidade
de
ajustar
modelo
X1
X2
X3
X4
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
3
1
1
1
1
1
1
3
199
Y
0,9
6,4
8,4
10,4
8,9
200
HA : < 0.
e) Determine o valor da contribuio do termo quadrtico para a soma de
quadrados de regresso. Verifique se o respectivo testes F significativo ao
nvel de 5% (note que o valor de F obtido igual ao quadrado do valor de t
calculado no item anterior).
4.16. Com base em uma amostra com 34 observaes foi estimada a equao de
regresso de Y contra X 1 , X 2 e X 3 , considerando o modelo
Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j
x1 y = 8
x12 = 8
x 2 y = 8
x 22 = 4
y 2 = 42
x1 x 2 = 0
Y =6
201
e) Teste a hiptese H 0 : = 10 e 1 2 2 = 0 .
Adote, nos testes, o nvel de significncia de 5%.
4.19. Um ensaio de adubao forneceu os seguintes resultados:
X = dose de adubo por hectare
0
1
2
3
(i = 1, ..., n)
8 12
10
Xy =
8
yy = 10
202
0
1
1
2
2
3
X2j
Yj
0
1
2
1
2
3
0,5
3,5
7,0
7,0
7,5
11,5
entre Y j e X 2 j (rY22.1 ) e
203
Mdias
Estimativas dos
desvios padres
Y = 4,5
sy = 3 5
X1 = 1
X2 = 1
s1 = 6
s2 = 6
Coeficiente de
correlao
rY 1 =
rY 2 =
5
30
4
30
r12 = 0,5
A =I
1
,
n
204
205
h j = x j ( XX) 1 x j
b) Utilizando (4.20), deduza que E (e) = 0 e que a matriz de varincias e
covarincias do vetor de desvios
V (e) = E (ee) = M 2
c) Demonstre que a varincia do desvio da j-sima observao
V (e j ) = (1 h j ) 2
e que a respectiva estimativa
V (e j ) = (1 h j ) s 2
d) Para o exemplo numrico apresentado na seo 4.8, verifique que h1 = 0,6 e
2
x
2
2t
+ v 2 b322 ,
206
y 2j = 3640
rY 1 = 0,90
X1 = 0
x12j = 182
rY 2 = 0,20
X 2 = 14
x 22 j = 2002
207
X1
X2
0
0
0
0
1
1
1
1
1
1
0
0
0
0
1
3
5
3
H 0 , isto , com
1 = 2 = , o modelo fica
Y j = ( X 1 j + X 2 j ) + u j . Calcule o valor de
S 2 S1
S1 /(n 2)
208
Yj
X1 j
X2j
10
20
17
12
11
6
12
10
8
9
28
40
32
36
34
Verifica-se que
Y j = 70 ,
Y = 14 ,
X 2 j = 170 ,
x 22 j = 80
X 1 j = 45 ,
X 2 = 34 ,
e
X1 = 9 ,
x12j = 20 ,
x1 j x 2 j = 32
Y j = + X 1 j + u j , onde os
uj
so erros
209
Y j = + 1 X 1 j + 2 X 2 j + 3 X 12j + 4 X 22 j + u j
4.34. Um pesquisador admite que a varivel Y linearmente dependente das variveis
Q j = Pj1 W j 2 j
e que u j = log j so erros aleatrios independentes com mdia zero e varincia
constante. Dispomos das seguintes observaes:
Pj
Wj
Qj
1
1
10
10
10
100
100
100
1000
1000
1
10
1
10
100
100
10
1000
1000
100
10
100
10
100
100
100
10
100
10
10
210
Q
Q
Z j = W1j 1 W2j2 j
(1)
(1),
aplicando
logaritmos
fazendo
log Z j = Y j ,
log W1 j = X 1 j ,
Y j = + 1 X 1 j + 2 X 2 j + u j
(1)
211
W2 j
Z
= W1j1
W
W1 j
1j
(2)
O modelo (2) pode ser obtido de (1) dividindo os dois membros da equao por
W1 j . Verifica-se que = , 1 = 1 + 2 1 e 2 = 2 .
(Y j X 1 j ) = + 1 X 1 j + 2 ( X 2 j X 1 j ) + u j
(2)
t1 =
b1 + b2 1
V (b + b )
1
d1
V (d 1 )
212
X1
X2
6
10
13
15
24
16
10
6
2
24
50
64
0
0 14
0
168
656
Xy =
1040
28
y y = 2196
24 32 0
16
XX = 32 96 0 , Xy = 32 e y y = 180
0 0 14
28
a) Qual o valor da mdia de X 2 na amostra?
b) Determine as estimativas de mnimos quadrados de 1 , 2 e 3 .
c) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 1 = 2 = 3 = 0 .
213
X1
X2
X3
13
3
8
13
8
3
8
8
32
4
18
34
18
2
18
18
5
45
23
5
27
45
23
27
116
8
63
118
61
6
69
55
Respostas
4.2. a) Y = 3 X 1 + X 2
b) F = 14
c) (Contribuio de X 1 ) = 72; F = 18
(Contribuio de X 2 ) = 40; F = 10
214
4.3. a) Y = 6 + X 1 X 2 + 2 X 3
b) F = 5/3
c) (Contribuio de X 1 ) = 6; F = 5/3
(Contribuio de X 2 ) = 4; F = 10/9
(Contribuio de X 3 ) = 8; F = 20/9
4.4. a) Y = 2 X 1 + X 2
b) F = 2,5
c) (Contribuio de X 1 ) = 40/13; F = 20/13
(Contribuio de X 2 ) = 5; F = 2,5
10
= 0,659 ;
23
d) rY 1.2 =
rY 2.1 =
5
= 0,745
3
e) 6,67 < < 6,67 ; 4,94 < 1 < 8,94 ; 1,72 < 2 < 3,72
f) 4 3,33
g) 8 10,18
4.5. a) Y = 6 + X 1 X 2 + 2 X 3 , s 2 = 3
b) F = 2
c) t = 10,792, significativo ( t 0 = 3,707)
d) t = 1,633, no-significativo ( t 0 = 1,943)
e) rY21.23 =
55
55
4
; rY22.13 =
e rY23.12 =
202
262
13
f) 7 3,73
4.6. t = 3,65, significativo
6,5 1,095
4.10. a) Y = 3,5 + 2 X 1 X 2
b) F = 7
c) R 2 =
14
= 0,9333
15
rY21.2 =
6
= 0,8571
7
d) t = 3,67, no-significativo
e) 5,5 10,47
215
4.11. a) Y = 5,5 + 2 X 1 3 X 2
b) F = 56,5, no-significativo ( F0 = 200 )
c) R 2 =
113
= 0,9912
114
d) rY21.2 =
36
= 0,8780
41
e) t = 9,39, no-significativo
f) F = 274,50, significativo
g) A regio de confiana delimitada pela elipse 5q12 8q1q 2 + 5q 22 = 400
onde q1 = 1 2 e q 2 = 2 + 3
h) t = 10,607, significativo
i) 3 9,47 ou 6,47 < E (Y | X 1 = X 2 = 2,5) < 12,47
4.15. a) Y = 9 + 2 X X 2 , s 2 = 0,35
b) F = 77,14, significativo
c) R 2 = 0,9872
d) t = 6,325, significativo
e) (Contribuio de X 2 ) = 14
F = 40, significativo
4.16. F = 10, significativo ( F0 = 7,56)
4.18. a) a = 6, b1 = 1 e b2 = 2
b)
0
1 / 3 0
( XX) s = 0 3 / 8 0
0
0 3 / 4
1
216
80
= 0,708 ;F = 7,27, no-significativo ( F0 = 34,12)
113
f) Y = 6
217
4.33. a) 1,75
b) 0,625
7
25
5
, b1 =
e b2 =
3
12
24
d) t = 3,796, significativo ( t 0 = 2,353)
c) a =
X2 .
g) No, porque no h repeties.
h) Sim. Entretanto, como temos apenas 5 observaes e o modelo tem 5
parmetros, no possvel fazer qualquer anlise estatstica (no h graus de
liberdade para o resduo).
4.34. R 2 = 1 e rY22 = 0,64 .
4.35. a) Y = log Q , X 1 = log P e X 2 = log W .
b) c = 10 10 , b1 = 0,5 e b2 = 0,5 .
c) R 2 = 0,6 ; F = 5,25, significativo ( F0 = 4,74).
d) t = 3, significativo ( t 0 = 1,895).
e) t = 2,10, no-significativo ( t 0 = 2,365).
f) Y = 0,01 ou um crescimento de 1% em Q.
perfeita.
Verifica-se
que
para
as
observaes
2 X 1 + X 2 = 36 .
4.38. a) X 2 = 6
b) b = [ 2 1 2]
40
c) F =
= 6,67 , significativo ( F0 = 6,55)
6
d) t = 3,06, no-significativo ( t 0 = 3,169)
e) F=
32
= 5,33 , significativo ( F0 = 4,10)
6
218
219
a mdia). Para uma escala ordinal podemos determinar tanto a moda como a mediana,
mas no a mdia da varivel.
Com uma varivel binria ocorre algo interessante. Como ela tem apenas dois
valores distintos, h um nico intervalo e no podemos dizer que ela contrarie a
condio para ser considerada intervalar. Isso permite que uma varivel binria seja
usada como varivel explanatria em anlise de regresso.
Cabe ressaltar que o modelo usual de regresso no permite que a varivel
dependente (Y) seja binria. bvio que uma varivel que inclui um erro com
distribuio normal no pode ser binria. H mtodos especiais (como os modelos de
lgite e prbite) para analisar variveis dependentes binrias.
Varivel binria
Z1
Z2
Z3
Z4
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
(5.1)
220
Varivel binria
Z1
Z2
Z3
Z4
0
1
1
1
1
0
0
1
1
1
0
0
0
1
1
0
0
0
0
1
Yt = + i Z it + u t
i =2
(5.2)
221
com
ou o modelo
12
Yt = i Z it + u t
(5.3)
i =1
Yt = + i Z it + u t
(5.4)
i =1
Perodo
Xj
Yj
1
2
3
4
8
7
7
6
II
1
2
3
4
6
5
3
2
(5.5)
222
1
1
1
X=
1
1
1
1
2
3
4
1
2
3
1
1
1
1
0
0
0
0
Obtemos
44
8
Xy = 28 , XX = 4
100
20
4
4
10
20
10
60
( XX) 1
7
8
1
=
4
1
4
1
2
0
1
4
10
a
6,5
1
b = c = ( XX) Xy = 3
b
1
A equao de regresso estimada
223
Y j = 6,5 + 3Z j X j
Na figura 5.1 est o par de retas paralelas correspondente a essa equao,
juntamente com os pontos da amostra.
Para fazer a anlise de varincia da regresso, apresentada na tabela 5.4,
calculamos
S.Q.Res. = y y b X y = 272 (6,5 44 + 3 28 1 100) = 2
e
S.Q.Total = y y
( Y j ) 2
n
= 272 242 = 30
G.L.
2
5
7
S.Q.
Q.M.
28
2
30
14
0,4
F
35
224
1
V (c) = 0,4 = 0,2
2
e
t=
c 30
=
= 6,708
s (c )
0,2
Y j = + Z j + x j + u j ,
com Z j = 1 no perodo I e Z j = 1 no perodo II.
44
Xy = 12
10
( XX) 1
8
XX = 0
0
1
8
= 0
0
1
8
0
0
8
0
0
0 ,
10
10
5,5
b = ( XX) Xy = 1,5
1
1
A equao estimada
Y j = 5,5 + 1,5Z j x j
ou
Y j = 8 + 1,5Z j X j
225
Y j = 6,5 X j
O resultado, como era de se esperar, o mesmo que obtivemos quando
utilizamos o modelo (5.5).
Y j = + X j + h Z hj ( X j h ) + u j
h =1
(5.6)
Z hj = 0 para X j h
e
Z hj = 1 para X j > h
Pode-se verificar que h a mudana na inclinao do h-simo segmento da
poligonal, em relao inclinao do segmento anterior.
Para uma poligonal com 3 segmentos o modelo fica
Y j = + X j + 1 Z 1 j ( X j 1 ) + 2 Z 2 j ( X j 2 ) + u j
(5.7)
A figura 5.2 mostra como poderia ser a forma da poligonal que mostra como
226
E (Y )
Z1 = 0
Z1 = 1
Z1 = 1
Z2 = 0
Z2 = 0
Z2 = 1
(5.8)
(5.9)
(5.10)
interessante verificar que tanto (5.8) como (5.9) produzem a mesma ordenada
para X j = 1 (que a ordenada do 1o vrtice). Analogamente, (5.9) e (5.10) produzem a
mesma ordenada para X j = 2 .
Para obter a poligonal da figura acima devemos ter > 0 , > 0 , 1 < 0 ,
Y j = + X j + Z j ( X j ) + u j ,
(5.11)
227
Y j = + X j + Z j X j + u j
(5.12)
ou, fazendo W j = Z j X j ,
Y j = + X j + W j + u j
TABELA 5.5. Amostra de 6 observaes consecutivas da varivel Y j .
Tempo ( X j )
Zj
Yj
2
1
0
1
2
3
0
0
0
1
1
1
5,5
5,0
1,0
3,5
4,5
4,5
E (Y j ) = + X j ,
e para as 3 ltimas observaes, onde Z j = 1, a equao da tendncia passa a ser
E (Y j ) = + ( + ) X j
Confirma-se, portanto, que representa a mudana na tendncia.
Para o exemplo apresentado, obtemos:
228
1
1
1
X=
1
1
1
6
XX = 3
3
19
14
2
1
0
1
2
3
0
0
0
1
2
24
Xy = 10 ,
26
6
70
1
42
14 , ( XX) 1 =
114
72
14
42
48
66
72
66
105
e
a
2
b = b = ( XX) 1 Xy = 2
c
3
A equao ajustada
Y j = 2 2 X j + 3Z j X j
A poligonal correspondente est traada na figura 5.3. Note que a declividade no
primeiro perodo 2 e no segundo perodo (2 + 3) = 1.
A seguir calculamos
229
G.L.
2
3
5
S.Q.
Q.M.
10
3
13
5
1
F
5
105 35
V (c) =
=
114 38
e
t=
c0
=
s (c )
3
35
38
= 3,126
(5.13)
230
Y = a + bX + cZ + dZX
(5.14)
(5.15)
FE =
S R SU
2
SU
n1 + n2 4
(5.16)
231
S R ( S1 + S 2 )
2
FE =
S1 + S 2
n1 + n2 4
(5.17)
(5.18)
(5.19)
A tabela 5.7 mostra os valores das variveis que sero utilizadas para estimar a
equao.
232
Yj
xj
Zj
Z jxj
1,0
4,0
6,0
7,0
9,5
11,0
11,5
13,0
13,5
4
3
2
1
0
1
2
3
4
0
0
0
0
1
1
1
1
1
0
0
0
0
0
1
2
3
4
0
XX =
5
10
60
10
10
30
10
10
76,5
92
30
, Xy =
58,5
10
127
30
( XX) 1
1,5
0,5
=
1,5
0,5
0,5
1,5
0,2
0,5
0,5
2,1
0,2
0,3
0,5
0,2
0,3
0,3
Ento
a
9,5
b
2
b = = ( XX) 1 Xy =
c
0,2
d
1
e
Y j = 9,5 + 2 x j + 0,2 Z j Z j x j
(5.20)
233
G.L.
S.Q.
Q.M.
3
5
8
145,2
1,3
146,5
48,4
0,26
F
186,15
234
Estimativa
Desvio
Padro
Teste t
Probabilidade
caudal
9,5
0,6245
15,21
< 0,01%
0,2280
8,77
0,03%
0,2
0,7389
0,27
79,75%
0,2793
3,58
1,59%
(5.21)
com S.Q.Res. = 1.
Considerando os 5 ltimos pares de valores para as variveis Y j e X j obtemos
Y j = 4,7 + X j
(5.22)
(5.23)
235
Th = Yhi
(5.24)
O total geral
G = Th = Yhi
h
(5.25)
(5.26)
236
Z 1 + Z 2 + ... + Z H = 1
(5.27)
X X = 0
( X X) 1
1
n
1
=0
0
n2
0
0
1
n2
0
1
n3
n3
T1
X y = T2
T3
T1
n
1
T
1
b = ( X X) X y = 2
n
2
T3
n
3
Segue-se que
S.Q.Res. = y y b X y = Yhi2
h
Th2
=
nh
G 2 Th2 G 2
= Yhi2
n h nh
n
h i
(5.28)
G
S.Q.Total = Yhi
h i
n
G2
= Yhi2
h i
n
(5.29)
Th2 G 2
S.Q.Trat. =
(5.30)
237
(5.31)
Th2
, com n H graus de liberdade
nh
(5.32)
(5.33)
S R SU
Hp
F=
SU
nH
(5.34)
238
nh
Yhi
Th
2
3
5
4
2
2
14, 11, 12 e 13
18 e 17
22 e 21
50
35
43
Y = 7 + 3 X
(5.35)
exemplo numrico no possvel fazer o teste de falta de ajustamento para esse novo
modelo, pois o nmero de parmetros (p = 3) igual ao nmero de tratamentos (H = 3).
A soma de quadrados residual da equao de segundo grau ser, necessariamente, igual
a SU . Mas, se o nmero de tratamentos fosse maior, poderamos fazer o teste de falta
de ajustamento para a equao de regresso de segundo grau e verificar se esse novo
modelo seria aceitvel ou se seria necessrio experimentar outras formas funcionais.
Cabe assinalar que o teste de falta de ajustamento s pode ser feito quando h,
na amostra, mais de um valor de Y para determinadas combinaes de valores das
variveis explanatrias (que definem os tratamentos), isto , devemos ter n > H. Isso
comum em dados experimentais, mas no comum em dados de amostras de
levantamentos scio-econmicos.
Exerccios
5.1.
Na anlise da oferta de certo produto, admite-se que a funo tem, conforme o
perodo do ano, 2 posies distintas, mas com a mesma declividade. Foram observados os
valores
Perodo
X = preo
Y = quantidade
2,0
1,5
2,5
3,0
5,5
6,5
II
5.2.
Uma varivel Y assume, em 5 anos consecutivos, os seguintes valores: 2,5; 3,0; 0; 3,0 e
2,5.
240
Ajuste a esses dados uma poligonal com vrtice num ponto de abcissa igual abcissa da
3a observao.
a) Qual a estimativa da declividade no 1o perodo (da 1a 3a observao)?
b) Qual a estimativa da declividade no 2o perodo (da 3a 5a observao)?
c) Teste, ao nvel de significncia de 10%, a hiptese de que essas duas declividades so
iguais.
5.3.
Ensaio
X = dose de nutriente
Y = produo
1,5
6,0
5,5
5,5
7,0
9,5
II
Valores de Y
1e2
5e5
5e6
4
5
7e9
6e8
241
Admite-se que h uma tendncia linear do 1o ao 4o ano e uma outra tendncia linear do 4o para o
5o ano.
a) Usando um modelo de regresso mltipla apropriado, ajuste aos dados uma linha
poligonal com vrtice no 4o ano. Qual o significado das estimativas dos parmetros
obtidas?
b) Faa a anlise de varincia da regresso testando falta de ajustamento.
c) Teste a hiptese de que a declividade da linha no 2o perodo (4o ao 5o ano) igual
declividade da linha no 1o perodo (1o ao 4o ano), considerando um nvel de
significncia de 5%.
5.5.
1 e 2 as mdias dessas
t=
Y1 Y2
1
1
+ s 2
n1 n2
onde
s2 =
n1
n2
i =1
i =1
(Y1i Y1 ) 2 + (Y2i Y2 ) 2
n1 + n 2 2
Demonstre que este teste igual ao teste t relativo hiptese H 0 : = 0 , sendo o coeficiente
de regresso do modelo
Yki = + Z ki + u ki ,
onde:
a)
Z ki uma varivel binria que assume valor 1 para as observaes de uma das
amostras e valor +1 no caso da outra amostra;
Y2 , e
c) o ndice i varia de 1 a n1 se k = 1 e de 1 a n 2 se k = 2
5.6.
Mostre que o teste t descrito no exerccio anterior , tambm, igual ao teste t relativo
hiptese H 0 : = , sendo e os coeficientes de regresso do modelo
Yki = Z ki + Vki + u ki ,
242
Yki = 1 Z 1k + 2 Z 2 k + 1 Z 1k X ki + 2 Z 2 k X ki + u ki ,
k = 1, 2 e i = 1, 2, ..., n1 ou n 2
com
Z 11 = 1, Z 12 = 0, Z 21 = 0 e Z 22 = 1
Demonstre que o valor de t para testar a hiptese H 0 : 1 = 2
t=
b1 b2
1
1
x2 + x2
1i
2i
Q1 + Q2
n +n 4
2
1
onde, para k = 1, 2,
bk =
x ki y ki
i
x ki2
i
x ki = X ki X k ,
y ki = Yki Yk
e Q1 e Q2 so as somas de quadrados de resduo para as regresses lineares simples de Yki
contra X ki , para os grupos de observaes I e II, respectivamente, isto ,
5.8.
Dados:
Valores de Y no
X
Tratamento 1
Tratamento 2
Tratamento 3
Totais
26
18
14
Admitimos que para cada tratamento existe uma relao linear entre X e Y, com o mesmo
coeficiente angular, isto , admitimos que a relao funcional entre Y e X pode ser representada
por um feixe de 3 retas paralelas. Sejam h (h = 1, 2, 3) os coeficientes lineares das retas e seja
o coeficiente angular comum. Admitimos, tambm, que Yi = E (Yi ) + u i , com i = 1, 2, ..., 12,
243
1
( 2 + 3 )
2
f) Teste a hiptese H 0 : 2 = 3 e 1 =
2 + 3
2
+ 2.
Yi = h Z hi + X i + ui ,
h =1
Yi = h Z hi + xi + u i
h =1
onde h = h + X e xi = X i X
Os clculos ficam bastante facilitados utilizando este ltimo modelo, pois a
correspondente matriz X X ser uma matriz diagonal.
5.9.
Faa o teste para falta de ajustamento para a regresso linear simples do exerccio 2.1.
5.10. Faa o teste para falta de ajustamento para a reta estimada no exerccio 2.19.
5.11. dada uma amostra com 12 pares de valores das variveis X e Y:
X
1; 1; 2; 2
3; 4; 4; 5
3; 3; 4; 4
Temos
Y = 36 , X = 24 ,
x 2 = 32 ,
y 2 = 18
Y 2 = 126
e xy = 16
244
X1
X2
1
1
1
1
2
2
2
2
1
1
2
2
1
1
2
2
3,5
4,5
5,5
4,5
4,5
3,5
5,0
6,0
de
valores
Ano
1o
quadrimestrais da varivel Y.
Admite-se que essa varivel
2o
3o
Y = 147 , Y 2 = 2535 e
y 2 = 134 .
Quadrimestre
1o
2o
3o
1o
2o
3o
1o
2o
3o
Y
15
22
15
11
18
16
10
20
20
245
Ano
1o
2o
3o
4o
5o
6o
7o
8o
9o
Y
39
54
63
66
96
108
111
120
135
X = ln W
coeficiente
de
determinao
da
0,1
0,6
1,5
2,9
3,0
2,7
246
Regio
12
14
20
17
distinguir
as
duas
regies.
Xi
1
1
3
3
5
5
7
7
Yi
41
37
80
78
107
103
98
96
247
Y = 7 + 34 X 3 X 2 ,
com S.Q.Res. = 60. Faa um teste de falta de ajustamento para essa equao,
isto , verifique se podemos admitir que o efeito de X sobre Y obedece a uma
equao de segundo grau, adotando um nvel de significncia de 5%.
e) Qual a soma de quadrados dos desvios de uma equao de terceiro grau
ajustada a esses dados? possvel fazer um teste de falta de ajustamento
para a equao de terceiro grau? Justifique a resposta.
5.19. dada uma srie temporal de 8 valores
trimestrais da varivel Y, cobrindo um
perodo de dois anos. Admite-se que Y
tenha variaes cclicas estacionais, alm
de
erros
uj
independentes
com
E (u j ) = 0 e varincia constante.
Ano
1
1
1
1
2
2
2
2
Trimestre
1
2
3
4
1
2
3
4
Y
29
18
13
22
27
22
11
18
Y = + 1 X 1 + 2 X 2 + Z + 1 ZX 1 + 2 ZX 2 + u
248
Ano ( X 1 )
1
2
3
4
5
6
7
8
9
10
11
12
13
( X2 )
12
4
8
8
8
4
12
8
14
2
2
14
8
Y
70
50
54
66
62
66
94
114
134
76
78
140
124
A equao estimada
Y = 26 + 4 X 1 + 3 X 2 + 24 Z + 2 ZX 1 + 2 ZX 2 ,
com S.Q.Res. = 384, R 2 = 0,9670 e
R 2 = 0,9434 .
Ajustando uma regresso mltipla de Y contra X 1 e X 2 , com as 13 observaes,
obtemos
Y = 9,6923 + 6 X 1 + 4,3846 X 2 ,
com S.Q.Res. = 1069,54, R 2 = 0,9080 e R 2 = 0,8896 .
a) Qual a equao estimada fazendo uma regresso de Y contra X 1 e X 2 , para
as 7 primeiras observaes?
b) Qual a equao estimada fazendo uma regresso de Y contra X 1 e X 2 , para
as 6 ltimas observaes?
c) Teste, ao nvel de significncia de 5% a hiptese de que ocorreu a suposta
mudana estrutural (o que corresponde, no modelo inicial, a testar a hiptese
de que = 1 = 2 = 0 ).
5.21. A tabela a seguir mostra a escolaridade (X) e o rendimento (Y) de 4 pessoas
ocupadas na agricultura e 4 pessoas ocupadas nos setores urbanos (indstria ou
servios). Define-se uma varivel binria Z que igual a zero para pessoas
ocupadas na agricultura e igual a 1 nos demais casos.
249
0
0
0
0
1
1
1
1
1
3
5
7
3
5
7
9
35
57
73
83
73
91
115
145
Para o modelo
Y j = + X j + Z j + Z j X j + u j
obteve-se
8 40 4 24
40 248 24 164
XX =
4 24 4 24
24 164 24 164
( XX) 1
672
3936
Xy =
424
2784
0,2
1,05 0,2 1,05
0,2
0,05
0,2 0,05
=
1,05
0,2
3,1 0,5
0,1
0,2 0,05 0,5
Y = 30 + 8 X + 4Z + 4ZX , S.Q.Res. = 72
s 2 = 18 .
250
Respostas
5.1. a) Yi = 1,5 + X + 1,5Z
b) 3 unidades
c) t = 3,674, no-significativo ( t 0 = 5,841)
5.2. a) 1 unidade por ano
b) +1 unidade por ano
c) t = 1,265, no-significativo ( t 0 = 2,920)
5.3. a) Adotando o modelo Yi = + xi2 + xi + Z i , com xi = X i X , Z 1 = 1 para
o ensaio I e Z 1 = 1 para o ensaio II, obtemos
Yi = 6,5 xi2 + 2 xi + 1,5Z i
ou
Yi = 3,5 + 1,5Z i + 4 X i X i2
b) 3 unidades
c) t = 3, significativo ( t 0 = 2,920)
d) t = 1,886, no-significativo ( t 0 = 2,920)
5.4. a) Sendo X o ano e Z uma varivel binria que assume valor zero at o 4o ano e
valor 1 no 5o ano, definimos V1 = (1 Z )( X 4) e V2 = Z ( X 4) . Ento V1
cresce de 3 para 0 nos primeiros anos e V2 cresce de 0 para 1 do 4o para o 5o
ano. Obtemos
Y = 8 + 2V1 V2
As declividades no 1o e no 2o perodos so 2 e 1, respectivamente.
b) O valor de F para falta de ajustamento igual a 1,5, no-significativo ao nvel
de 5%.
c) As declividades so estatisticamente diferentes (t = 2,510, significativo, pois
t 0 = 2,365).
5.8. a) b = 1, a1 = 5 , a 2 = 3 e a 3 = 2 .
b) So estimativas lineares no-tedenciosas de varincia mnima, e consistentes.
So, tambm, estimativas de mxima verossimilhana.
c) t = 3,873, significativo ( t 0 =3,355)
d) t = 7,906, significativo ( t 0 =2,896)
e) t = 4,082, significativo ( t 0 = 3,355)
251
252
560
= 31,11 , significativo ( F0 = 18,0)
18
f) H 0 : + 5 = 0 , com t =
24
10,8
253
6. HETEROCEDASTICIA
Veremos, neste captulo, como obter as estimativas dos parmetros de uma
regresso linear quando a varincia do erro no constante, isto , quando h
heterocedasticia.
(6.1)
com
E (u 2j ) = 2j = X 2j 2
Admitiremos que so vlidas as demais pressuposies relativas ao modelo de
regresso linear simples, vistas no captulo 2.
O modelo (6.1) pode ser transformado em um modelo de regresso linear simples
com homocedasticia. Para isso, basta dividir cada termo por X j , obtendo
Yj
Xj
u
1
+ + j
Xj
Xj
ou
Z j = + V j + j ,
(6.2)
onde
Zj =
Yj
Xj
, Vj =
u
1
e j = j
Xj
Xj
E (u 2j )
X
2
j
=2,
ou seja, a varincia do erro no modelo (6.2) constante. O clculo das estimativas dos
parmetros, a determinao de intervalos de confiana e os testes de hipteses relativos ao
254
modelo (6.2) podem, portanto, ser feitos da maneira usual, utilizando as frmulas de
mnimos quadrados ordinrios.
Os mesmos resultados podem ser obtidos atravs do raciocnio exposto a seguir.
Sabemos que, no caso de um modelo homocedstico, as estimativas dos parmetros so os
valores que minimizam
(Y j a bX j ) 2
No caso de um modelo heterocedstico, com E (u 2j ) = 2j , os quadrados dos desvios
devem ser ponderados, sendo que o fator de ponderao deve ser inversamente
proporcional varincia, isto , devemos dar peso maior s observaes de menor
varincia. As estimativas dos parmetros so, ento, os valores que minimizam
2
j
(Y j a bX j ) 2
Yj
1
1
2 (Y j a bX j ) 2 =
ba
X
X j
Xj
j
(6.3)
com E (u) = 0 e
v1
0
E (uu) = V 2 =
M
v2
M
0
0
2
vn
Note que V uma matriz diagonal. Vamos admitir que sejam conhecidos os valores
de v j , que mostram como varia o valor da varincia do erro. O fato de serem nulos os
elementos fora da diagonal principal da matriz V significa que vlida a pressuposio de
255
ausncia de covarincia entre os erros das vrias observaes, isto , que E (u j u h ) = 0 para
j h.
Definimos a matriz diagonal
0
=
M
M
0
onde
j =
1
, j = 1, ..., n
vj
(6.4)
V = 1 1
(6.5)
(6.6)
No modelo (6.6) o vetor dos erros = u e uma vez que E (u) = 0 , temos
E ( ) = 0 .
Notando que = e lembrando que E (uu) = V 2 , obtemos
E () = E ( uu ) = V 2
De acordo com (6.5), segue-se que
E ( ) = 1 1 2 = I 2
ou seja, o modelo (6.6) homocedstico. Podemos, ento, aplicar a esse modelo as
frmulas de mnimos quadrados ordinrios, deduzidas no captulo 4. bvio que devemos
tomar o cuidado de substituir, naquelas frmulas, as matrizes y e X pelas matrizes y e
(6.7)
(6.8)
256
(6.9)
(6.10)
(6.11)
E (b* ) = ,
isto , o estimador de mnimos quadrados ordinrios no-tendencioso. Entretanto, b* no
um estimador eficiente, j que o estimador de varincia mnima o dado por (6.7).
Determinemos a matriz de varincias e covarincias de b* . De (6.11) obtemos
b* = ( XX) 1 Xu
Ento
E[(b * )(b * )] = E[( X X) 1 X uu X( X X) 1 ]
Como E (uu ) = V 2 , segue-se que
E[(b * )(b * )] = ( X X) 1 X VX( X X) 1 2
(6.12)
257
(6.13)
com
E (u j ) = 0 , E (u 2j ) = v j 2 e E (u j u h ) = 0 para h j.
De acordo com (6.7), obtemos
b=
v j 1 X j Y j
v j 1 X 2j
(6.14)
X jY j
b* =
X 2j
(6.15)
V (b) =
2
v j 1 X 2j
(6.16)
V (b* ) =
2 v j X 2j
( X 2j ) 2
(6.17)
( X 2j ) 2
n X 4j
258
Y j = + X j + u j , podem ser
1
(y y b * Xy ) =
n p
1
(y [I X( XX) 1 X]y ,
n p
(6.18)
1
(y V 1 y b XV 1 y )
n p
1
y [V 1 V 1 X( XV 1 X) 1 XV 1 ]y
n p
(6.19)
(6.20)
1
u [V 1 V 1 X( XV 1 X) 1 XV 1 ]u
n p
(6.21)
s*2 =
e
s2 =
De (6.20), notando que se trata de uma matriz com um nico elemento, temos
s*2 =
=
1
tr{u [I X( XX) 1 X]u} =
n p
1
tr{uu [I X( XX) 1 X]}
n p
E ( s*2 ) =
=
2
n p
2
n p
(6.22)
E(s 2 ) =
=
=
2
n p
2
n p
2
n p
tr{V[V 1 V 1 X( XV 1 X) 1 XV 1 ]} =
{tr(I n ) tr[ XV 1 X( XV 1 X) 1 ]} =
[tr(I n ) tr(I p )] = 2
(6.23)
Esse resultado j era esperado, pois (6.19) o quadrado mdio do resduo relativo
ao modelo (6.6), cujo vetor de erros ( ) tal que E ( ) = I 2 , que , de acordo com o
que vimos na seo 4.5, a condio necessria para demonstrar que o quadrado mdio do
resduo um estimador no-tendencioso da varincia residual.
Por simplicidade, consideremos, novamente, o modelo (6.13). O pesquisador que,
inadvertidamente, no considerasse a existncia de heterocedasticia, calcularia b* , dado
por (6.15), e, de acordo com (4.23), obteria
s*2
V* (b* ) =
X 2j
(6.24)
n 1
X 2j
2
*
v j X 2j
vj
(n 1) X 2j
X 2j
(6.25)
s 2 v j X 2j
( X 2j ) 2
(6.26)
1
2
1 1 2 ( v j X j Y j )
v
Y
j j
n 1
v j 1 X 2j
2 v j X 2j
( X 2j ) 2
(6.27)
260
Comparando (6.27) com (6.17), verificamos que (6.26) um estimador notendencioso da varincia de b* .
De (6.17) e (6.25) obtemos a tendenciosidade ou vis de (6.24) como estimador de
V (b* ) , que
E[V* (b* )] V (b* ) =
v j X 2j v j X 2j
2 1
=
vj
=
2
2
2
X j n 1
n 2
(n 1) X 2j
X j
X j
v j v j X 2j
2
n
X
j
(6.28)
Nesta expresso temos, entre parnteses, a diferena entre a mdia aritmtica e a mdia
ponderada dos v j , com X 2j como fatores de ponderao. Se, por exemplo, os maiores
valores dos v j estiverem associados aos maiores valores absolutos dos X j , a mdia
ponderada maior do que a mdia aritmtica e, portanto, V* (b* ) um estimador
negativamente viesado de V (b* ) . bvio que, neste caso, no so vlidos os intervalos de
confiana ou testes de hipteses feitos com base nos estimadores tendenciosos das
varincias obtidos de ( XX) 1 s*2 .
Entretanto, se no houver associao entre v j e X 2j , as duas mdias dos v j (sem
ponderao e com ponderao por X 2j ) em (6.28) tendem a ser iguais. Neste caso o
pesquisador que usa as frmulas de mnimos quadrados ordinrios, embora no esteja
usando o estimador mais eficiente, no ser sistematicamente induzido a concluses
erradas ao efetuar teste de hipteses.
261
onde g h = n h 1 e Yh =
(Yhj Yh ) 2
j
gh
(6.29)
1
Yhj
nh
Sejam
g h s h2
U = ( g h ) ln
g h ln s h2
gh
(6.30)
G = 1+
1
1
1
3( H 1) g h g h
(6.31)
11
262
X ij
(j = 1, ..., n).
b) Eliminamos m observaes centrais e ajustamos, pelo mtodo de mnimos
quadrados ordinrios, uma equao de regresso para as primeiras (n m) / 2 observaes
e uma outra equao de regresso para as ltimas (n m) / 2 observaes. Simulaes
realizadas por Goldfeld e Quandt, considerando o caso em que v j = X ij2 , indicam que o
poder do teste maior quando m igual a cerca de 1/4 de n.
c) Sendo S1 e S 2 as somas de quadrados de resduos das regresses com os
valores relativamente pequenos e relativamente grandes de X ij , respectivamente,
calculamos T1 = S 2 / S1 , se a hiptese alternativa que os v j crescem com X ij e
12
263
Yj
X ij
X2j
uj
1
+ 1 + 2
+
X ij
X1j X1j
| e j |= 0 + 1 X ij + j ,
onde igual a 1, 1, 1/2 ou 1/2.
Sejam c0 e c1 as estimativas de mnimos quadrados ordinrios de 0 e 1 .
A seguir testamos as hipteses H 0 : 0 = 0 e H 0 : 1 = 0 . Trs possibilidades so
consideradas pelo autor:
a) No se rejeita H 0 : 0 = 0 , c0 > 0 e rejeita-se H 0 : 1 = 0 .
264
h =1
2j = 0 + h Z hj ,
com sendo uma funo qualquer para a qual so definidas as duas primeiras derivadas.
A hiptese de nulidade, que estabelece a homocedasticia dos erros, corresponde a
H 0 : 1 = 2 = ... = K = 0
O procedimento para efetuar esse teste pode ser dividido em 3 etapas.
a) Estimamos o modelo y = X + u por mnimos quadrados ordinrios e obtemos o
vetor dos desvios e = y Xb , com elementos e j ( j = 1,..., n ) . Determinamos a estimativa
de mxima verossimilhana da varincia do erro, dada por
2 = (ee ) / n
e calculamos os valores de
gj =
e 2j
para j = 1,..., n
265
266
E (Y j ) , isto ,
(6.32)
V (b * ) = n( XX) 1 Q( XX) 1 ,
(6.33)
ou
com
Q=
1
XVX 2
n
(6.34)
Q=
1 n
x j xj v j 2
n j =1
Q=
1 n
x j xj 2j
n j =1
ou
(6.35)
267
com 2j = v j 2 = E (u 2j )
Sejam e j os desvios da regresso de y contra X, estimada por mnimos quadrados
ordinrios. Se, em (6.35), substituirmos 2j por e 2j , obtemos
Qe =
1 n
x j x j e 2j
n j =1
(6.36)
V (b * ) = ( XX) 1 x j xj e 2j ( XX) 1
(6.37)
j =1
Exerccios
6.1. Considere o modelo
Y j = + X j + u j ,
com E (u j ) = 0 , E (u 2j ) = X 2j 2 e E (u j u h ) = 0 para h j.
268
Xj
1
2
5
5
10
Yj
13
10
20
15
50
0 ,5
3
0
+3
0
6,5
2,5
0,5
0 ,25
0
0 2 ,
0 ,5
0
2
4
6
8
4
8
3
6
1
269
0,5
0 2 ,
0,5
270
Wj
Yj
0,5
16
0,25
25
Xi
Yi
1
2
3
4
5
2
6
6
12
10
6.9. Temos uma amostra de 100 famlias de mesmo tamanho. Essas famlias foram
classificadas em quatro estratos de renda familiar, como mostra a tabela a seguir:
Nmero de famlias ( f i ) , renda familiar mdia (Wi ) e valor mdio do logaritmo
neperiano do consumo (ln C i ) de determinado produto em quatro estratos de renda
familiar
271
Estrato
fi
Wi
1
40
1
2
30
2
3
20
5
4
10
10
Na ltima coluna dessa tabela est o valor do logaritmo neperiano do
ln C i
0,9
2,3
2,6
2,3
consumo de
Wi
+ ui ,
onde u i um erro aleatrio com valor esperado igual a zero, varincia inversamente
proporcional ao nmero de famlias do estrato e ausncia de covarincia entre erros
de diferentes observaes.
a) Qual a renda mdia das 100 famlias?
b) Obtenha estimativas apropriadas de e , levando em considerao o nmero de
famlias de cada estrato.
c) Qual a estimativa da elasticidade-renda do consumo desse produto quando
W = 2? E quando W = 5?
d) Teste, ao nvel de significncia de 5%, a hiptese de que igual a zero.
6.10. Admite-se que Y uma funo de X com as seguintes caractersticas:
a) E(Y) = 0 quando X = 0;
b) E(Y) cresce linearmente com X para 0 X 5 ;
c) Quando X = 5 h uma reduo da declividade, havendo um vrtice na relao
poligonal entre E(Y) e X;
d) Para 5 < X < 10 a relao entre E(Y) e X volta a ser linear, embora com
declividade menor do que no primeiro intervalo;
e) A varincia do erro u = Y E (Y ) 2 quando 0 X 5 e 2 2 quando
272
3
4
6
7
8
10
10
19
17
17
estimativas
lineares
no-tendenciosas
de
Respostas
6.1. a) a = 10 e b = 2
b) t = 0,777, no-significativo (t 0 = 1,638)
6.2. Y = 3 X
t= 4,243, no-significativo ( t 0 = 6,314)
6.3. Y = 6 0,5 X
t = 1,245, no-significativo ( t 0 = 2,353)
6.4.
b=
Yi
Y
=
Xi X
6.5.
a=
1
X iYi n Yi
Xi
1
Xi
n2
Xi
273
b=
X i Yi n X i Yi
1
Xi
n2
Xi
Yi
Xi
2
a=
, V (a) =
1
1
Xi
Xi
6.6.
6.7. a) b = 3
b) t = 14,61, significativo ( t 0 = 9,925)
6.8.
b=
1 Yi
= 2,4
n Xi
6.9. a) 3
b) a = 3 e b = 2
c) 1 e 0,4
d) t = 4,209, no-significativo ( t 0 = 4,303).
6.10. a) E (Y ) = X + ( X 5) Z , com Z = 0 para X 5 e Z = 1 para X > 5. Estimativas
dos parmetros: b= 3 e c = 2
b) s 2 = 3,33
c) t = 1,601, no-significativo (Regio de rejeio: t 1,638).
274
(7.1)
(7.2)
(7.3)
E ( ) = 0
e
E ( ) = E ( uu ) =
= V 2 =
= ( ) 1 2 =
= 1 ( ) 1 2 = I 2
275
b = ( X X) 1 X y = ( XV 1 X) 1 XV 1y ,
(7.4)
(7.5)
A estimativa no-tendenciosa de 2
s2 =
y V 1 y b XV 1 y
n p
(7.6)
Entretanto, no caso de os erros serem correlacionados, isto , de V ser nodiagonal, as expresses relativas predio (estimao de novos valores) so afetadas de
maneira mais complicada, j que possvel, ento, que o erro da nova observao esteja
correlacionado com os erros das observaes da amostra.
Admitamos que seja calculado, incorretamente, o estimador de mnimos quadrados
ordinrios
b * = ( X X) 1 X y
(7.7)
276
De (7.7) obtemos
b * = ( XX) 1 Xu
Segue-se que
E[(b * )(b * )] = E[(XX) 1 Xuu X( XX) 1 ] =
= ( XX) 1 XVX( XX) 1 2
(7.8)
y y b * Xy
n p
(7.9)
E (y y b * Xy ) = E (u Mu ) = E[ tr (u Mu )] =
= E[ tr (Muu )] = 2 tr (MV ) =
= 2 {tr(V ) tr[ X( XX) 1 XV ]} =
= 2 {tr(V ) tr[ XVX( XX) 1 ]}
(7.10)
Uma vez que, com V I , teremos, normalmente, tr(V ) tr[ XVX( XX) 1 ] n p,
a expresso (7.9) dar uma estimativa tendenciosa da varincia 2 .
Note que o mtodo de mnimos quadrados ponderados, estudado no captulo
anterior, um caso particular de mnimos quadrados generalizados, em que a matriz V
diagonal. Alis, o modelo estudado no captulo 4 tambm pode ser encarado como o caso
particular em que V = I.
A matriz simtrica V tem n(n + 1)/2 elementos possivelmente distintos que
precisamos conhecer, para poder aplicar as frmulas (7.4) e (7.6). Em aplicaes prticas
do mtodo de mnimos quadrados generalizados, comumente h restries que tornam
vivel a determinao da matriz V. Na prxima seo vamos examinar uma aplicao de
277
y = X + u ou Yt = i X it + u t , (t = 1, ..., n)
(7.11)
u t = u t 1 + t
(7.12)
i =0
com
E ( t ) = 0 ,
E ( t2 ) = 2 ,
E ( t t h ) = 0 se h 0
Para que o modelo (7.11) tenha um termo constante devemos ter X 0t = 1 para
t = 1, ..., n.
Aqui utilizamos a letra t para indicar o ndice associado s diferentes observaes
porque o problema da autocorrelao dos resduos surge, geralmente, quando estamos
trabalhando com sries cronolgicas de dados; ento cada observao corresponde a um
certo perodo de tempo (ano, ms ou semana, geralmente).
A relao (7.12) mostra que estamos admitindo que o erro da observao relativa a
um perodo est correlacionado com o erro da observao anterior. Se > 0 dizemos que
os erros esto positivamente autocorrelacionados e se < 0 dizemos que h autocorrelao
negativa.
Se = 0 teremos, obviamente, o modelo de regresso linear mltipla estudado no
captulo 4, isto , podemos aplicar mnimos quadrados ordinrios.
Consideremos, inicialmente, o caso particular em que = 1. Ento
u t = u t 1 + t
ou
u t u t 1 = t
(7.13)
278
Yt Yt 1 = i ( X it X i ,t 1 + u t u t 1
(t = 2, ..., n)
i =0
Yt Yt 1 = i ( X it X i ,t 1 ) + t
i =0
(t = 2, ..., n)
(7.14)
Yt + Yt 1 = i ( X it + X i ,t 1 ) + t
i =0
u t = u t 1 + t =
= ( u t 2 + t 1 ) + t =
= 2 u t 2 + t 1 + t =
= 3 u t 3 + 2 t 2 + t 1 + t =
=L=
= t + t 1 + 2 t 2 + 3 t 3 + K =
= r t r
t =0
Ento
E (u t ) = 0 ,
(7.15)
E (u t2 ) = (1 + 2 + 4 + 6 + K) 2 =
2
=
= u2
2
1
(7.16)
279
e, com h 0,
E (u t u t h ) =
= E[( t + t 1 + 2 t 2 + K)( t h + t h 1 + 2 t h 2 + K)] =
= h 2 + h + 2 2 + h+ 4 2 + K =
2
=
= h u2
2
1
h
(7.17)
1 2
V=
1 2
M
n 1
1
M
n 3
n 2
n 1
n2
n 3
K
K
K
M
1
(7.18)
Verifica-se que
0
=
M
1+ 2
1+ 2
1+ 2
e que V 1 = com
1 2
0
=
M
(7.19)
280
( 1 )Y = ( 1 )X + ( 1 )u
k
i =0
i1
(7.20)
Yt Yt 1 = i ( X it X i ,t 1 ) + u t u t 1
i =0
Yt Yt 1 = i ( X it X i ,t 1 ) + t
i =0
(7.21)
i =0
i =0
Yt = Yt 1 + i X it i X i ,t 1 + t
(t = 2, ..., n)
281
b* =
1
e o estimador de mnimos quadrados ordinrios para
X t2
X t Yt
X t2
V* (b* ) = ( XX) 1 u2 =
u2
n
t =1
(7.22)
2
t
n
n
2
1
n 2
X
+
2
X
X
+
2
X t X t 2 + K + 2 n 1 X n X 1
t
t
t 1
2
2
t =2
t =3
1 n 2 t =1
Xt
t =1
n
n
X
X
X t X t 2
t
t
X
X
1 + 2 t = 2 n
= n
+ 2 2 t =3 n
+ K + 2 n 1 n n 1
X t2
X t2
X t2
X t2
t =1
t =1
t =1
t =1
2
u
(7.23)
282
A comparao de (7.22) e (7.23) mostra que, neste caso, a expresso ( XX) 1 2 leva a
uma subestimativa da varincia de b* (o estimador de mnimos quadrados ordinrios).
De acordo com (7.10) temos
E (y y b * X y ) = 2 {tr(V ) tr[ X VX( X X) 1 ]} =
n
X t X t 1
X
X
n 1
t =2
n 1
=
=
n
1
+
2
+
K
+
2
n
n
1 2
2
2
Xt
X t
t =1
t =1
X t X t 1
= u2 n 1 + 2 t =2 n
+ K
X t2
t
=
1
(7.24)
y y b * X y
n 1
(7.25)
estimar
s*2 = (y y b * X y ) / (n 1) ,
varincia
o
b*
de
pesquisador
estaria,
atravs
de
portanto,
( X X) 1 s*2 ,
cometendo
com
erro
de
d=
(et et 1 ) 2
t =2
t =1
(7.26)
2
t
283
d=
et2
et21
t =1
t =1
et et 1
+ t =n2
2 t =2n
et2
et2
et2
t =2
n
t =1
284
Exerccios
7.1. Admite-se que as variveis X t e Yt esto relacionadas de acordo com o modelo
Yt = + X t + u t ,
Yt
5
7
11
17
10
14
30
46
a) Estime .
b) Teste, ao nvel de significncia de 5%, a hiptese de que = 0.
285
Yt
2
19
7
50
12
75
7
40
Admite-se que Y e X esto relacionados de acordo com o modelo
Yt = + X t + u t ,
onde u t = 0,8u t 1 + t , E ( t ) = 0 , E ( t2 ) = 2 e E ( t t + h ) = 0 para h 0.
a) Determine as estimativas lineares no-tendenciosas de varincia mnima de e .
b) Obtenha a estimativa no-tendenciosa de 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 .
7.3. A tabela ao lado mostra os 6 valores consecutivos
de X t e Yt observados ao longo de 6 anos.
Admite-se que essas variveis esto relacionadas
de acordo com o modelo
Yt = + X t + u t ,
com u t = u t 1 + t , sendo t um rudo branco.
Xt
4
2
7
4
4
6
Yt
12
4
28
20
16
20
Semestre
1o
2o
2
1o
2o
Admite-se que essa varivel
1
Yt
23
8
31
10
tem variaes cclicas estacionais e que ela no tem
286
Yt = + X t + u t ,
onde ut = ut 2 + t ,
0 < < 1 , E ( t ) = 0 , E ( t2 ) = 2 e
E ( t t h ) = 0 para h 0.
Note que o erro de uma observao est correlacionado com o erro da observao
defasada de dois perodos. Isso pode ocorrer se os dados so semestrais e o valor de u t em
um semestre afetado pelo valor do erro no mesmo semestre do ano anterior.
Sendo u um vetor coluna cujos elementos so os u t (t = 1, ..., n), determine:
a) E(u)
b) E (uu ) , em funo de e 2
7.6. Admite-se que as variveis Y, X 1 e X 2 esto relacionadas de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j
(j = 1, ..., n)
u1
u = u 2
M
u
n
V=
M
1
M
K
K
287
1
u j , ou, em notao matricial,
n
onde u =
y = X + u u
onde
y1
y
y = 2 ,
M
y
n
= 1 ,
2
x11
x
X = 12
M
x
1n
x 21
x 22
M
x2 n
u
u
u=
M
u
V 1
com d =
d
f
=f
M
f
1
1
f
d
f
M
f
f
f
d
M
f
K
K
K
K
1 1 + (n 1)
f
f
f
M
d
f =
1 1 + (n 1)
X1j
X2j
4
0
3
5
1
1
4
2
2
11
3
0
Admite-se que essas variveis esteja relacionadas de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j (j = 1, ..., 4),
1
0,5
V=
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
288
0,4
1,6
0,4
0,4
1,6
0,4
=
0,4
0,4
0,4
0,4
1,6
0,4
0,4
0,4
0,4
1,6
Respostas
7.1. a) b = 3
b) t= 6,481, significativo ( t 0 = 4,303 )
7.2. a) a = 3 e b = 6
b) s2 = 25
c) t = 9,650, no-significativo ( t 0 = 4,303 )
7.3. a) b = 4
b) t = 6,481, significativo ( t 0 = 3,747)
1
7.4. a) X = 1
1
1
0
1 e b = 27 ou
0
19
1
1
X = 0
1
0
0
1 e b = 27
0
8
1
2
,
1 2
E (u t u t h ) = 0 se h um nmero mpar e
E (u t u t h ) =
2 0,5h
se h um nmero par positivo.
1 2
Ento
289
1
0
2
E (uu ) =
0
1 2 2
0
0
1
0
0
1
0
0
M
0
1
0
0
1
0
M
0
1
M
K
K
K
K
K
K
7.7. b1 = 2 e b2 = 3
V (b1 ) = 5 / 9 , V (b2 ) = 5 / 9 e cv(b1 , b2 ) = 4 / 9
Observao: neste exerccio temos um caso de equicorelao, isto , E (u i u j ) = ,
com i j, para todo i. Aplica-se, ento, o teorema de McElroy (1967) (Ver Theil,
1971, p. 241-243). De acordo com esse teorema, em caso de equicorrelao, e desde
que o modelo tenha um termo constante, as estimativas dos parmetros obtidas pelo
mtodo de mnimos quadrados generalizados so iguais s estimativas obtidas
aplicando mnimos quadrados ordinrios. Com exceo da varincia da estimativa do
termo constante, sero, tambm, iguais, as estimativas das varincias e covarincias
das estimativas dos parmetros, obtidas pelos dois mtodos. Compare os resultados
obtidos aplicando mnimos quadrados generalizados com os obtidos aplicando
mnimos quadrados ordinrios (Ver resultados do exerccio 4.11).
290
8.
Y j = + i X ij + u j (j = 1, ..., n)
i =1
(8.1)
E[( X ij i )u j ] = 0
(i = 1, ..., k),
onde i = E ( X ij )
Nessas condies, aplicando as frmulas de mnimos quadrados ordinrios,
obtemos estimativas no-tendenciosas dos parmetros e, se os u j tm distribuio
normal, os intervalos de confiana, determinados da maneira indicada, e o procedimento
para os testes de hiptese continuam vlidos.
291
a12
,
a 22
plim a11
plim A =
plim
a 21
plim a12
plim a 22
matrizes. Assim,
plim ( AB) = (plim A )(plim B)
e
(plim A 1 ) = (plim A) 1
Consideremos o modelo (8.1), acrescentando a pressuposio de que
lim XX = Q ,
n n
(8.2)
X 0
X
X = 0 e XX = mX0 X 0
M
X 0
Segue-se que
1
1
X X =
X0 X 0 . Conclumos ento que
n
n0
1
1
lim XX =
X0 X0 = Q
n n
n0
isto , a pressuposio (8.2) vlida neste caso.
Passemos demonstrao de que os estimadores de mnimos quadrados
ordinrios so consistentes. De acordo com (4.10), temos
292
1
1
b = + ( XX) Xu = + XX
X u
n
n
1
plim b = + Q 1 plim Xu
n
(8.3)
E X u = 0
n
(8.4)
1
Xu
n
2
1
1
V Xu = 2 E ( Xuu X) = 2 XX
n
n
n
Ento, lembrando (8.2), obtemos
2
1
lim V Xu = lim
n
n
n n
lim XX = 0
n n
(8.5)
1
Xu converge em mdia quadrtica para uma
n
plim Xu = 0
n
(8.6)
plim b = ,
(8.7)
293
plim XX = Q ,
n
plim b = + Q 1 plim Xu
n
(8.8)
plim Xu = 0
n
(8.9)
y = X + u , com
E (u) = 0
E (uu ) = I 2 .
plim X X = Q
n
Se
houver
pelo
menos
uma
varivel
explanatria
assintoticamente
plim X u 0
n
294
expresso (8.3), que se houver um nico elemento no-nulo no vetor plim Xu , isso
n
Y j = X j + u j ,
(8.10)
pressupondo que E (u j ) = 0 , E (u 2j ) = 2 , E (u j u h ) = 0 se h j,
1
lim X 2j = Q e plim X j u j 0 .
n n
b=
X jY j
X 2j
plim b = Q 1 plim X j u j
n
plim Z j X j 0
n
(8.11)
plim Z j u j = 0
n
(8.12)
295
Z jY j
Z jX j
1
Z jY j
n
=+
1
ZjX j
n
Ento
1
plim Z j Y j
n
plim = +
1
plim Z j X j
n
(8.14)
a) plim Z u = 0
n
(8.15)
b) a matriz
296
plim Z X =
n
(8.16)
plim Z Z =
n
(8.17)
existe e no singular.
c) existe a matriz
(8.18)
Note que, se todas as variveis explanatrias forem assintoticamente nocorrelacionadas com o erro, a prpria matriz X pode ser usada como matriz de variveis
instrumentais e ento o estimador (8.18) coincide com o estimador de mnimos
quadrados.
A seguir demonstraremos que, obedecidas as condies (8.15) e (8.16), o
estimador (8.18) consistente. De (8.14) e (8.18) obtemos
= + (Z X) 1 Z u
Ento
plim = + plim Z X
n
plim Z u
n
(Z X) 1 (Z Z)( X Z) 1 s 2
13
(8.19)
297
onde
s 2 = (y X )(y X ) /( n p )
Note que (8.19) se transforma em ( XX) 1 s 2 se Z = X.
j = + j + j ,
(8.20)
(8.21)
Yj = j + wj ,
(8.22)
plim v 2j v2 e plim w 2j = w2 .
n
(8.23)
298
plim 2j = 2 + w2
n
De (8.23), fazendo
u j = j v j
(8.24)
Y j = + X j + u j
(8.25)
obtemos
plim v j j = 0 ,
n
(8.26)
plim v j j = 0 ,
n
(8.27)
plim j j = 0 ,
n
(8.28)
X j u j = j j + v j j v j j v 2j
n
n
n
n
n
Considerando (8.26), (8.27) e (8.28), segue-se que
1
plim X j u j = plim v 2j
n
299
plim X j u j = v2
n
(8.29)
b=
x jY j
x 2j
(8.30)
b=+
x jY j
x 2j
Ento
plim x j Y j
n
plim b = +
1
plim x 2j
n
(8.31)
plim x j Y j = v2
n
(8.32)
plim x 2j = 2 + v2 ,
n
(8.33)
e que
onde 2 = plim ( ) 2
n
300
plim b =
v2
2 + v2
ou
plim b =
v2
1+ 2
(8.34)
na seo 8.3.
De acordo com o que vimos na seo 8.4, o mtodo da varivel insrumental nos
fornece um estimador consistente de , no modelo (8.25). Para isso precisamos dispor
de uma varivel instrumental Z j . Podemos, ento, constituir a matriz
1
1
Z=
M
Z1
Z 2
M
Zn
301
1
1
X=
M
X1
X 2
M
Xn
a) plim Z u = 0
n
b) a matriz
1
plim Z X = ,
n
plim z j x j 0
n
zj yj
zjxj
e = Y X
Y2 Y1
X 2 X1
(8.35)
302
Y3 Y1
X 3 X1
1
x jY j
n
b=
1
x 2j
n
(8.36)
Com Y j = + X j + u j , obtemos
1
1
1
x j Y j = x 2j + x j u j
n
n
n
303
plim x j Y j = 2
n
plim x 2 = 2 + v2
n
1
x jY j
n
1
x 2j v2
n
(8.37)
304
Donde
1
= log1,2
2
2
v
Exerccios
8.1. Admite-se que h uma relao linear entre os verdadeiros
11
25
15
33
19
37
11
21
xi = X i X , tende a
14
18
12
18
16
10
grupos.
5
20
c) Determine as estimativas dos parmetros admitindo que a varincia do erro de
medida em X igual a 0,5.
d) Admitindo que haja erro de medida em X, quais so as propriedades
estatsticas das estimativas do coeficiente regresso obtidas em (a), (b) e (c)?
Se o estimador no for consistente, diga se ele tende a subestimar ou
superestimar o valor verdadeiro.
305
306
lim X 2j = Q .
n n
Y j2
X jY j
2
Q
Respostas
8.1. a) = 2
b) O estimador de mnimos quadrados ordinrios (b) inconsistente, com
tendenciosidade assinttica negativa (tende a subestimar ).
8.2. a) Y = 9,273 + 1,636 X
b) ou c) Y = 8 + 2 X
8.3. a) 5/3
b) negativo
c) 2
d) 2
Observao: O fato dos itens (c) e (d) terem a mesma resposta uma coincidncia,
devida ao carter artificial dos dados desse exerccio. Em geral os vrios mtodos
de estimao daro resultados diferentes.
307
9.
EQUAES SIMULTNEAS
9.1. Introduo
C t = + Yt + u t
Yt = C t + Z t
(9.1)
(9.2)
E{[ Z t E ( Z t )]u t } = 0
ou
E (Z t ut ) = 0
(9.3)
308
1
ut
1
(9.4)
1
1
Zt +
ut
1
1
(9.5)
Zt +
e
Yt =
1
Zt
1
e que
Yt E (Yt ) =
1
ut
1
Ento
cov (Yt , u t ) = E{[Yt E (Yt )]u t } =
u2
= E t
1
2
=
1
309
Como 0 < < 1 , temos que cov (Yt , u t ) > 0 , isto , na relao (9.1) o resduo e a
varivel explanatria esto positivamente correlacionados.
O estimador de mnimos quadrados ordinrios de em (9.1)
b=
yt Ct
yt2
(9.6)
De acordo com o que foi visto na seo 8.3, a existncia de covarincia entre Yt
e u t faz com que o estimador de mnimos quadrados seja inconsistente. Aplicando a
relao (8.3) a esse caso, verificamos que b tende a superestimar o valor de .
Determinemos o limite em probabilidade de b. Substituindo (9.1) em (9.6),
obtemos
b=+
yt ut
y t2
Ento
plim y t u t
n
plim b = +
1
plim y t2
n
(9.7)
1
1
zt +
(u t u )
1
1
(9.8)
plim z t u t = 0
n
1
plim y t u t =
n
1
2
(9.9)
310
e
Q
2
1
2
plim y t =
+
2
(1 ) 2
n
(1 )
(9.10)
onde Q = plim z t2
n
(1 ) 2
Q + 2
(9.11)
zt = Z t Z
Ct
ct = C t C
Yt
yt = Yt Y
16
14
18
20
24
28
4
6
2
0
4
8
119
126
132
125
131
147
11
4
2
5
1
17
135
140
150
145
155
175
15
10
0
5
5
25
311
ct y t
660
=
= 0,66
2
1000
yt
que, como espervamos, superestima o valor de .
zt ct
zt yt
(9.12)
= C Y
(9.13)
=
e
C t = A + BZ t + t
com
A=
B=
(9.14)
(9.15)
t =
1
ut
1
312
z t ct
B =
z t2
(9.16)
A = C B Z
(9.17)
B
1+ B
(9.18)
= (1 ) A
(9.19)
z t ct
z t2
z t ct
=
z t ct z t2 + z t ct
1+
z t2
Como Yt = C t + Z t , temos z t y t = z t ct + z t2 . Ento o estimador de fica
z t ct
zt yt
313
= C C (1 )
Z =
1
= C (C + Z ) =
= C Y ,
ou seja,
= C Y ,
que o estimador anteriormente obtido pelo mtodo da varivel instrumental.
O aluno deve verificar que, se em lugar de utilizarmos a equao (9.4),
utilizarmos a equao (9.5) da foram reduzida, os estimadores de e obtidos atravs
do mtodo de mnimos quadrados indiretos sero os mesmos, isto , sero iguais a
z t ct
zt yt
= C Y
Apliquemos o mtodo de mnimos quadrados indiretos ao exemplo numrico
apresentado.
Para a equao de regresso, derivada de (9.4),
C t = A + BZ t + t ,
obtemos
z t ct 204
B =
=
= 1,5 e A = C B Z = 130 1,5 20 = 100
136
z t2
De acordo com (9.18) temos
B
1 + B
= 0,6
= (1 ) A = 0,4 100 = 40
Como exerccio o aluno deve repetir os clculos considerando a equao (9.5),
em lugar da equao (9.4), verificando que as estimativas de e obtidas sero as
mesmas.
314
2 =
zt yt
z t2
1 = Y 2 Z
Podemos ento calcular os valores de
Yt = t + 2 Z t
(9.20)
C t = + (Yt + et ) + u t
ou
C t = + Yt + (u t + et )
(9.21)
ct y t
y t2
Como y t = 2 z t e 2 =
zt yt
z t2
ct y t 2 z t ct
z t ct
z t ct
= 2
=
=
2
2
2
y t
2 z t
2 z t z t y t
Obtemos, pois, o mesmo estimador consistente j obtido pelo mtodo de
mnimos quadrados indiretos e pelo uso de Z t como varivel instrumental:
zt ct
zt yt
2 =
z t y t 340
=
= 2,5
136
z t2
316
Yt
16
14
18
20
24
28
140
135
145
150
160
170
y t
10
15
5
0
10
20
Temos Yt = Yt = 900 ,
Yt
= Y = 150
n
e
y t2 = 850
No segundo estgio fazemos a regresso de C t contra Yt , obtendo
ct y t 510
=
= 0,6
850
y t2
317
h =1
k =1
(9.22)
E = [1
L ]
Admite-se que
E ( j j ) = I 2j
e que
E ( j h ) = I jh ,
isto , o erro de uma equao em determinado perodo no-correlacionado com os
erros referentes a outros perodos, mas pode ser correlacionado com os erros das outras
equaes no mesmo perodo.
318
(9.23)
Essa notao mais geral no cmoda para a anlise dos mtodos de estimao
que vamos considerar a seguir.
Em princpio cada uma das equaes estruturais pode ser colocada na forma
y j = Z j j + j
(9.24)
onde:
a) y j um vetor-coluna com os n valores da varivel endgena que aparece no
primeiro membro da j-sima equao estrutural;
b) Z j a matriz n N j , onde N j o nmero de variveis no segundo
membro da j-sima equao, incluindo variveis endgenas e exgenas (Se a
equao tem um termo constante, vamos considerar que existe uma varivel
exgena fictcia cujas valores so todos iguais a 1, associada a esse termo);
c) j um vetor com os N j parmetros a serem estimados e
d) j um vetor-coluna com os n valores do erro da j-sima equao.
O estimador de mnimos quadrados ordinrios para j
(Z j Z j ) 1 Z j y j
Entretanto, se Z j inclui variveis conjuntamente determinadas (variveis
endgenas correntes), esse estimador no consistente.
319
uma matriz no-singular, podemos, para uma amostra suficientemente grande, desprezar
Xu obtendo Xy = XX .
Segue-se que = ( X X) 1 X y um estimador consistente de .
W y = W X ,
que poder ser resolvido para , se existir ( W X) 1 . Obter-se-, dessa maneira, o
estimador consistente = ( WX) 1 W y .
Vamos aplicar o mtodo das variveis instrumentais para estimar os parmetros
de (9.24).
A matriz X, com todas as K variveis predeterminadas do sistema, uma matriz
de variveis instrumentais apropriada se pudermos admitir que14
plim X j = 0
n
(9.25)
Xy j = XZ j j + X j
(9.26)
Xy j = XZ j
(9.27)
j = ( XZ j ) 1 Xy j
(9.28)
14
Se X incluir variveis endgenas defasadas, s podemos admitir a validade de (9.25) se os erros no
forem autocorrelacionados. Uma exposio didtica do problema de ajuste de equaes simultneas
quando h variveis endgenas defasadas e autocorrelao nos erros pode ser encontrada em Kelejian e
Oates (1978, p. 321-325).
320
9.9. Identificao
A relao (9.27) representa um sistema de K equaes com N j incgnitas (as
estimativas dos N j parmetros, cada um correspondendo a uma das N j variveis que
aparecem no segundo membro da j-sima equao do sistema de equaes simultneas).
Para que exista uma soluo, isto , para que a equao (9.24) seja identificvel,
necessrio que o nmero de equaes em (9.27) seja pelo menos igual ao nmero de
incgnitas, ou seja, devemos ter
K Nj
(9.29)
ou
K K j Lj
(9.30)
321
qt = 0 + 1 pt + u t (demanda)
qt = 0 + 1 pt + t (oferta)
onde q t e p t so, respectivamente, a quantidade transacionada e o preo do produto no
t-simo perodo. Aqui, o fato de utilizarmos letras minsculas no significa que as
322
Figura 9.1.
Figura 9.1
Consideremos, agora, que a oferta depende, tambm, do preo ( x1t ) de uma
matria-prima, e que este preo uma varivel exgena que no afeta a demanda
qt = 0 + 1 pt + u t (demanda)
qt = 0 + 1 pt + 2 x1t + t (oferta)
(9.31)
N1 = 2 = K .
Para ilustrar graficamente o problema, consideremos um sistema de dois eixos
cartesianos ortogonais, onde so lidos os valores de p t e q t . A funo de oferta estar
em diferentes posies, dependendo do valor de
correspondentes aos pares de valores ( p t , q t ), que esto ao redor dos vrios pontos de
equilbrio, se distribuiro ao longo da funo de demanda, como mostra a figura 9.2.
Tais pontos podero, portanto, ser utilizados para obter uma estimativa da funo de
demanda, isto , essa funo , neste caso, identificvel.
323
Figura 9.2
Consideremos, agora, um outro tipo de anlise para mostrar que no sistema
(9.31) a demanda identificvel, mas a oferta no o . Multiplicando a equao de
demanda por uma constante e somando equao de oferta, obtemos
(1 + )qt = 0 + 0 + ( 1 + 1 ) pt + 2 x1t + t + u t
ou
qt =
0 + 0 1 + 1
+ u t
+
pt + 2 x1t + t
1+
1+
1+
1+
(9.32)
y1t = 1 y 2t + 2 y 3t + 3 x1t
y1t =
y1t = 1 y 2t
+ 1t
+ 2 y 3t + 3 x1t + 4 x 2t + 5 x3t + 2t
+ 3 x1t + 4 x 2t + 5 x3t + 3t
(9.33)
324
admitindo que se sabe, de acordo com a teoria que serviu de base para a construo do
modelo, que
4 5
=
=
4 5
(9.34)
3
3t
1
y 2t + 2 y 3t + 3
x1t + 2t
1
1
1
1
B ]
(9.35)
A 0 = [ 0
B 0 ]
(9.36)
325
A0 = 4
4
5
5
primeira vista essa matriz tem caracterstica 2, sendo atendida a condio suficiente
para identificao da 1a equao. Mas, dada a relao (9.34), conclumos que essa
matriz A 0 tem caracterstica igual a 1 e que a 1a equao do sistema (9.33) no
identificvel.
O leitor pode verificar que para todos os demais exemplos apresentados, quando
a condio de ordem indica que uma equao identificvel, isso confirmado pelo
exame da condio necessria e suficiente.
Vejamos, finalmente, um exemplo em que o exame da condio necessria e
suficiente altera radicalmente o que sugerido pela condio de ordem (Phillips e
Wickens, 1978, p. 283):
(9.37)
A = [
1
B ] = 21
31
12
13
11
23
1
0
0
32
12
0
0
12
0
E ( X j j X) = X X 2j
O estimador de j deve ser obtido, ento, aplicando o mtodo de mnimos
quadrados generalizados. Obtemos
327
j = [Z j X( XX) 1 XZ j ]1 Z j X( XX) 1 Xy j
(9.38)
[Z j X( XX) 1 XZ j ] 1 2j
(9.39)
[Z j X( XX) 1 XZ j ] 1 s 2j
(9.40)
com
s 2j =
(y j Z j j )(y j Z j j )
nNj
(9.41)
( XZ j ) 1 XX( XZ j ) 1 s 2j
(9.42)
328
y j = Z j j + j ,
(9.43)
(9.44)
(9.45)
Y1t = X 1t + Y2t + u t
Y2t = Y1t + X 2t
onde X 1t uma varivel fictcia ( X 1t = 1 ), X 2t o valor do investimento, Y1t a
despesa de consumo e Y2t a renda.
Os dados numricos so reproduzidos na tabela 9.3.
X 2t
Y1t
Y2t
16
119
135
14
126
140
18
132
150
20
125
145
24
131
155
28
147
175
y 1 = Z 11 + u ,
onde u o vetor dos erros.
Temos
119
1
126
1
132
1
y 1 = e Z1 =
125
1
131
1
1
147
135
140
150
145
155
175
330
1
X=
1
1
16
14
18
20
24
28
Obtemos
6
XZ1 =
120
900
18340
780
1 9170
Xy 1 =
e ( XZ 1 ) 1 =
1020 60
15804
450
3
Neste exemplo temos identificao exata, com matriz XZ1 quadrada e nosingular.
De acordo com (9.28) obtemos
40
1 = ( XZ1 ) 1 Xy 1 =
0,6
ou seja, = 40 e = 0,6 .
Temos o seguinte vetor de desvios
2
2
2
y 1 Z1 1 =
2
2
2
Ento, de acordo com (9.41),
s12 =
24
=6
4
331
120
2536
pode-se verificar que a matriz das estimativas das varincias e covarincias assintticas
fica
1 67925
2550 450
450 2
s1
3
ou
1 67925
425 450
Segue-se
que
V ( ) = 159,82 ,
450
3
V ( ) = 0,00706
cov( , ) = 1,0588 ,
t=
0,6
0,00706
0,6
= 7,14
0,0840
332
y1t = 1 y 2t + 1 x1t + 1t
y1t = 2 y 2t + 2 x 2t + 2t
onde y1t e y 2t so variveis endgenas, x1t e x 2t so variveis exgenas, e 1t e 2t
so erros aleatrios com mdia zero e varincia constante, sendo que o erro de um
perodo independente dos erros em outros perodos.
O sistema tem K = 2 variveis predeterminadas ( x1t e x 2t ) e duas variveis
endgenas ( y1t e y 2t ).
Os valores observados em uma amostra hipottica esto na tabela 9.4.
TABELA 9.4. Amostra de 8 valores para as variveis x1t , x 2t , y1t e y 2t
x1t
x 2t
y1t
y 2t
3
3
1
1
1
1
3
3
1
1
1
1
1
1
1
1
1
2
1
0
0
2
1
1
2
0
2
0
0
0
2
2
x1t y1t = 10
x1t y 2t = 20
x 22t = 8
x 2t y1t = 6
x 2 t y 2 t = 4
x1t x 2t = 0
y1t y 2t = 0
333
1 = 1 , 2 = 1 , 1 = 1,5 e 2 = 0,5 .
9.14. Terceiro exemplo
Consideremos o seguinte sistema, constitudo pelas equaes de demanda e de
oferta de um produto agrcola
(oferta)
Y1t = 0 + 1Y2t + 2 X 1t + 2t
onde Y1t a quantidade transacionada, Y2t o preo, X 1t o tempo (em anos ou meses),
Y1t
Y2t
7
9
10
10
11
11
16
18
0
0
1
3
6
8
5
5
X 1t
3
3
1
1
1
1
3
3
X 2t
X 3t
1
1
1
1
2
2
2
2
2
2
2
2
1
1
3
3
334
Obtemos
Y1t = 92
Y2t = 28
X 1t = 0
X 2t = 12
X 3t = 16
Y1 = 11,5
Y2 = 3,5
X1 = 0
X 2 = 1,5
X3 = 2
Y1t2 = 1152
Y22t = 160
X 12t = 40
X 22t = 20
X 32t = 36
y12t = 94
y 22t = 62
x12t = 40
x 22t = 2
x32t = 4
X 1t Y1t = 56
X 2t Y1t = 148
X 3t Y1t = 196
x1t y1t = 56
x 2t y1t = 10
x3t y1t = 12
X 1t Y2t = 40
X 2t Y2t = 52
X 3t Y2t = 52
x1t y 2t = 40
x 2t y 2t = 10
x 3 t y 2 t = 4
X 1t X 2t = 8
X 2 t X 3t = 4
X 2t X 3t = 24
x1t x 2t = 8
x 2t x3t = 4
x 2t x3t = 0
335
X = [x1
x2
x3 ]
Z1 = [y 2
x1
b)
Z 2 = [y 2
c)
1
1 = 2 e 2 = 1 ,
2
3
2
x 2t y1t = 1 x 2t y 2t + 2 x1t x 2t + 3 x 2t
56 = 401 + 40 2 + 8 3
10 = 10 1 + 8 2 + 2 3
12 = 4 + 4
1
2
Resolvendo, obtemos 1 = 1 , 2 = 2 e 3 = 2 .
evidente que o mesmo resultado seria obtido se utilizssemos a relao (9.28).
A equao de demanda estimada
y1t = y 2t + 2 x1t + 2 x 2t
ou
336
Y1t = 12 Y2t + 2 X 1t + 2 X 2t
Verifica-se que 0 = 12 .
Vejamos, a seguir, como as estimativas dos parmetros da equao de demanda
poderiam ser obtidas pelo mtodo de mnimos quadrados em dois estgios.
No primeiro estgio, obtemos a regresso de y 2t (a varivel endgena que
aparece no segundo membro da equao) contra x1t , x 2t e x3t , que so as variveis
predeterminadas do sistema. Seja o vetor das estimativas dos parmetros dessa
regresso.
Temos
x12t
XX = x1t x 2t
x1t x3t
( XX)
x1t x 2t
x
x 2t x3t
2
2t
1
1
= 4
4
1
18
4
x1t x3t 40
x 2t x3t = 8
x32t 4
8
2
0
4
0 ,
4
1
x1t y 2t 40
4 e Xy 2 = x 2t y 2t = 10
x3t y 2t 4
2
A seguir obtemos
1
= ( XX) 1 Xy = 1
2
2
Ento y 2t = x1t + x 2t 2 x3t
3,5
3,5
1,5
1,5
y 2 = X =
3,5
3,5
1,5
1,5
ou
x1
x 2 ] , temos
337
) 1 Z
y
1 = (Z 1 Z
1
1 1
Obtemos
y 22t
Z 1 Z 1 = x1t y 2t
x 2t y 2t
) 1
(Z 1 Z
1
x 2t y 2t 58
x1t x 2t = 40
x 22t 10
x1t y 2t
x12t
x1t x 2t
1
1
= 0
8
5
0
1
4
40
40
8
10
8 ,
2
5
y1t y 2t 42
4 e Z 1 y 1 = x1t y1t = 56
x 2t y1t 10
45
Ento
1 1
1 = 2 = 2
3 2
A matriz de varincias e covarincias assintticas dessas estimativas
1
1
) = 0
(Z 1 Z
1
8
5
1
2
1
0
1
4
5
4 12
45
(y 1 Z1 1 )(y 1 Z 1 1 )
n N1
Temos n = 8, N 1 = 4 e
1
1
1
1
y 1 Z 1 1 =
1
1
1
1
Ento
s12 =
8
=2
4
338
1
4
4
Passemos
equao
de
5
4
45
0
1
4
1
oferta.
Como,
para
essa
equao,
temos
x 3 ] , temos
y
2 = (Z 2 Z 2 ) 1 Z
2 1
Obtemos
y
Z 2 Z 2 = 2t
x3 y 2t
2
x3 y 2t 58
=
x32t 4
4
,
4
2
y1t y 2t 42
e Z 2 y 1 =
=
29
x3t y1t 12
1 2
(Z 2 Z 2 ) 1 =
108 2
Ento
1
2 = 1 =
2 4
A equao de oferta estimada
y1t = y 2t + 4 x3t
Ento
Y1t = Y2t + 4 X 3t
339
Verifica-se que 0 = 0
A matriz de varincias e covarincias assintticas de 1 e 2
1 2
Z
1 2
(Z
2 2) 2 =
108 2
2 2
2
29
s 22 =
(y 1 Z 2 2 )(y 1 Z 2 2 )
n N2
Temos n = 8, N 2 = 3 e
1
1
1
1
y1 Z 2 2 =
1
1
1
1
Ento s 22 = 8 / 5 e a matriz das estimativas das varincias e covarincias
assintticas de 1 e 2
4
135
4
135
4
135
58
135
340
Yt = + X t + Yt 1 + u t ,
onde os u t no so autocorrelacionados. Ento Yt 1 est correlacionado com u t h
(h = 1, 2, ...), mas no est correlacionado com u t ou u t + h (h = 1, 2, ...).
Pode-se demonstrar que, neste caso, o estimador de mnimos quadrados
ordinrios consistente, embora seja tendencioso.
(II-b) Os valores de X correspondentes t-sima observao so correlacionados
com u t .
341
Exerccios
9.1.
C t = + Yt + u t
Yt = C t + Z t
As variveis endgenas so a renda nacional ( Yt ) e a despesa com consumo
( C t ). Os erros u t so variveis aleatrias independentes com mdia zero e
varincia constante. O valor dos investimentos ( Z t ) uma varivel exgena (no
correlacionada com u t ).
dada uma amostra de 4 valores de C t , Yt e Z t :
Ct
Yt
Zt
14
12
20
38
15
15
25
45
1
3
5
7
Y1
Y2
10
21
28
17
22
14
4
16
2
5
8
5
342
Y2t = + Y1t + u t
Y1t = + X t + t
As variveis endgenas so Y1 , Y2 . Pressupe-se que os erros u t e t tm mdia
zero e varincia constante, no apresentam autocorrelao e no so
correlacionados com X t . Admite-se, entretanto, que u t pode ter correlao com
t .
a) Analise a identificao de cada equao.
b) Quando a equao for identificvel, obtenha estimativas (apropriadas) dos
seus parmetros.
c) Teste, ao nvel de significncia de 5%, a hiptese de que = 0 , contra a
hiptese alternativa de que > 0 .
9.3. Seja o sistema de equaes
Yt = + X t + u t
X t = + Z t + t
onde u t e t so variveis aleatrias com mdia zero e varincia constante.
Admite-se que u t e t apresentam correlao assinttica negativa, isto ,
Xt
Zt
10
19
16
22
33
45
48
61
70
76
5
8
6
7
10
12
13
15
20
24
2
4
3
5
8
11
12
15
14
16
343
X t = 120
Z t = 90
Y = 40
X = 12
Z =9
Yt 2 = 21016
X t2 = 1788
Z t2 = 1060
y t2 = 5016
xt2 = 348
z t2 = 250
X t Yt = 6085
X t Z t = 1352
Z t Yt = 4700
xt yt = 1285
xt z t = 272
z t y t = 1100
344
X 1t
X 2t
Y1t
Y2t
1
1
3
3
5
5
7
7
1
1
3
3
3
3
1
1
2
1
4
3
3
5
2
4
1
3
1
3
3
3
5
5
Y1t
26
22
6
18
Y2t
120
96
35
81
345
(1)
Y1t = Y2t + Z t
(2)
Y1t
Y2t
10
12
10
11
12
60
68
64
76
72
50
56
54
65
60
Y1
Y2
4
2
5
1
3
16
4
20
6
9
87
3
102
24
39
Y2t = + Y1t + ut
Y1t = + X t + t
t .
a)
b)
346
X 2t
Y1t
Y2t
11
9
9
7
5
5
3
1
1
7
4
1
7
7
22
21
45
26
17
41
38
37
37
85
51
29
77
69
Y1t = 7 + X 1t + 4 X 2t
Y1t = 0 + 1Y2t + 2 X 1t + 1t
Y1t = 0 + 1Y2t + 2 X 2t + 3 X 3t + 2t
(demanda)
(oferta)
347
X 1t
X 2t
X 3t
Y1t
Y2t
5
6
7
7
8
9
130
110
120
120
110
130
30
20
26
26
30
24
18,5
20,0
19,5
18,5
19,5
24,0
7,5
8,0
7,5
8,5
12,5
10,0
y 1 = y 2 + v
y 2 + X + u
onde
y11
y 21
v1
u1
y
y
v
u
12
22
2
y1 =
, y2 =
, v=
, u = 2,
M
M
M
M
y1n
y 2n
v n
u n
X 01
X
X = 02
M
X 0n
X 11
X 12
M
X 1n
K
K
K
X k1
0
X k2
e = 1
M
M
X kn
k
Admite-se que:
a) E (vt ) = E (u t ) = E (vt vt + h ) = E (u t u t + h ) = 0 para h 0.
1
348
c) E (u t2 ) = plim u t2 = u2
n
d) E (u t vt ) = plim u t vt = uv2
n
e) plim Xu = plim Xv = 0
n
f) plim XX = Q
n
1
1
Xv + u v
n
n
c=+
1
2
1
XX + Xu + u u
n
n
n
e que
plim c = +
uv2
Q + u2
y 2 Ny 1
, onde N = X( XX) 1 X
y 2 Ny 2
Mostre que
1
1
1
1
1
Xv + u X XX Xv
n
n
n
n
= +
1
1
1
1
1
1
XX + 2 Xu + u X XX Xu
n
n
n
n
n
e que plim = , se Q 0 .
Respostas
9.1. a) b = 5 / 6 = 0,833 e a = 1 / 6 = 0,167
b) = 0,8 e = 1
349
1,64
0,80
0,24
0,80
0,80
0,40
0,24
0,40
0,24
c) 2 = 0,5 ; 2 = 0,5 ; 2 = 1
s12 = 1,6
Matriz das estimativas das varincias e covarincias assintticas de 2 , 2 e 2 :
0,64
3,56
0,64
0,72
9.5.
c = 11 e d = 4
9.6. a) b = 0,9
c) = 0,75 e = 6
9.7.
0,16
0,08
0,72
0,08
0,24
s) s ( ) = 0,1768
9.8.
s ( ) = 0,433
350
9.9.
b) = 5 e = 2
c) t = 24,495, significativo ( t 0 = 4,032 )
a) H superidentificao se 2 0 e 3 0 .
b) exatamente identificvel se 2 0 .
c) Equao de demanda
estimada
Y1 = 15 Y2 + 2 X 1
1 160 152
152
248
d) Equao de oferta259
estimada:
Y1 = Y2 + 0,2 X 2 0,5 X 3
= 1varincias
660 assintticas
1500
6800 e covarincias
Matriz das estimativass 2das
de 1 , 2 e 3 :
2
1
660
e) 0,45, 0,7 e 0,4567600 1500
243
245
245
1325
351
352
Y(t)
t1
t2
353
E (a t2 ) = a2
k = cov(at , at + k ) = 0
para k 0
Sejam X t os valores obtidos em lanamentos consecutivos de um dado nochumbado. Ento a srie de valores de Yt = X t 3,5 um exemplo de rudo branco.
354
Yt = + t + h Z h +a t ,
h =2
Yt = Dt + S t + a t
Se os componentes forem multiplicativos o modelo fica
Yt = Dt S t at
Neste caso usam-se os logaritmos para obter um modelo aditivo.
Uma exposio da tcnica usada para separar o componente estacional pode ser
encontrada no captulo 20 do livro Estatstica para Economistas (Hoffmann, 2006).
355
Jenkins, intitulado Time Series Analysis: Forecasting and Control, cuja 1a edio foi
publicada em 1970. H uma 3a edio, com Reinsel como novo co-autor, publicada em
1994.
O modelo de um processo auto-regressivo de primeira ordem, indicado por
AR (1) ,
Yt = + Yt 1 + a t ,
(10.1)
(1 1 B 2 B 2 ... p B p )Yt = + at
(10.2)
ou, sinteticamente,
( B)Yt = + a t
Por definio, o modelo de um processo de mdias mveis de primeira ordem,
indicado por MA(1) (devido expresso em ingls moving average),
Yt = + a t a t 1
(10.3)
Yt = + (1 1 B 2 B 2 ... q B q )at
(10.4)
ou
Yt = + ( B )a t
O nome mdias mveis est consagrado, embora no seja estritamente correto,
uma vez que no se trata de uma mdia mvel dos a t (pois os coeficientes 1, 1 ,
(10.5)
Yt 1 = + Yt 2 + a t 1
Substituindo essa expresso em (10.1), obtemos
Yt = + + 2Yt 2 + a t + a t 1
Mas Yt 2 pode ser substitudo por + Yt 3 + at 2 , obtendo-se
Yt = + + 2 + 3Yt 3 + a t + a t 1 + 2 at 2
Aps sucessivas substituies desse tipo, obtemos
(10.6)
m)
Yt =
+ a t + a t 1 + 2 a t 2 + ...
(10.7)
E (Yt ) =
(10.8)
e
V (Yt ) = (1 + 2 + 4 + ...) a2
ou
V (Yt ) =
1
a2
2
1
(10.9)
357
cov(Yt , Yt k ) =
k
a2 = k
2
1
(10.10)
As expresses (10.8), (10.9) e (10.10) mostram que um AR (1) com < 1 tem
mdia constante, varincia finita e constante e que a covarincia entre Yt e Yt k depende
da defasagem k mas no depende de t. Conclui-se que um AR (1) com
<1
(fracamente) estacionrio.
As expresses (10.1) ou (10.6) mostram que um AR (1) com > 1 explosivo.
Tanto os valores absolutos de Yt como sua varincia crescem ilimitadamente. O
processo no estacionrio.
Yt = Yt 1 + + a t
(10.11)
Yt = Yt 1 + a t
(10.12)
Y1 = Y0 + + a1
Y2 = Y0 + 2 + a1 + a 2
e, generalizando,
t
Yt = Y0 + t + a j
j =1
(10.13)
358
Yt = Yt 1 + + a t
(10.14)
t
Yt = Y0 + t + u t
(10.15)
Yt = + t + a t
(10.16)
1
1
1
W=
1
M
1
2
3
4
M
(10.17)
Yt = Yt Yt 1 = + at
(10.18)
b=Z =
1 n
Zt
n 1 t =2
(10.19)
359
t =2
t =2
Z t = (Yt Yt 1 ) = Yn Y1
Ento
b=
Yn Y1
n 1
(10.20)
Essa equao mostra que a estimativa de depende apenas dos valores inicial e
final de Yt . Isso ocorre porque todas as variaes de Yt em perodos intermedirios
foram sendo acumuladas, sem nenhuma perda, e esto contidas no valor final Yn .
Se a srie de valores de Yt for analisada fazendo uma regresso de Yt contra t
usando as frmulas de mnimos quadrados ordinrios, ser obtida uma estimativa notendenciosa mas ineficiente de . O problema principal que sero utilizadas frmulas
erradas para estimar as varincias, fazendo com que os testes de hiptese no sejam
vlidos. Ao testar H 0 : = 0 , h uma grande probabilidade de obter um valor de t ou F
significativo mesmo que a hiptese seja verdadeira.
O modelo (10.15), obtido de (10.14), um processo estacionrio nas diferenas
(difference stationary process DSP), pois as diferenas Z t = Yt constituem uma
srie estacionria, como mostra (10.18).
O modelo (10.16) gera um processo estacionrio depois de eliminada a
tendncia (determinstica) + t ( um trend stationary process TSP).
Um exemplo numrico simples permite ressaltar as diferenas entre os
procedimentos estatsticos apropriados no caso dos modelos (10.15) e (10.16). Vamos
considerar uma srie com apenas 4 valores consecutivos de Y t , dados na tabela a seguir:
TABELA 10.1. Srie de 4 valores de Yt .
t=X
Yt
1
2
3
4
10
11
17
19
360
b=
xY 16,5
=
= 3,3
5
x2
(10.21)
s2 =
58,75 54,45
= 2,15
2
(10.22)
3,3
2,15
5
= 5,032 (10.23)
9
=3
3
(10.24)
z 2 14
=
=7
2
2
(10.25)
(10.26)
3
7
3
= 1,964
(10.27)
361
1
1
X=
1
1
1
1
2
W=
1
3
4
1
1
2
2
1
2
3
1
2
3
Verifica-se que
W 1
2
1
=
0
1
X W 1 X =
1
1
2
0
1
1
0
2
1
0
0
1
1
1 4
( X W 1 X) 1 =
4
3 1
1
1
10
7
XW 1 y = b = ( XW 1 X) 1 XW 1 y =
19
3
s2 =
1
1
(y W 1 y b X W 1 y ) = (141 127) = 7
n2
2
(10.28)
362
+ a t + a t 1 + 2 a t 2 + K
(10.29)
(10.30)
(10.31)
Cabe ressaltar que a relao (10.31) no permite concluir que a relao (10.30)
correta, pois B um operador, e no uma grandeza algbrica. Pode-se verificar,
entretanto, que, a relao (10.30) vlida sempre que < 1 .
Sabemos que um MA(1) pode ser escrito como
Yt = + (1 B )at
(10.32)
+ at
(10.33)
363
B=
364
(10.34)
k =
cov(Yt , Yt k )
V (Yt )V (Yt k )
(10.35)
k =
k
0
(10.36)
k = k ,
(10.37)
mostrando que neste caso o valor absoluto da autocorrelao cai exponencialmente com
a defasagem .
Para um processo MA(1)
365
Yt = + at at 1
verifica-se que 0 = (1 + 2 ) a2 , 1 = a2 e k = 0 para k > 1. Ento
1 =
e k = 0 para k > 1
1+ 2
(10.38)
ck
,
c0
(10.39)
1 n
(Yt Y )(Yt k Y )
n t = k +1
(10.40)
rk =
com
ck =
366
Yt = + ( 1)Yt 1 + at
Fazendo 1 = , obtemos
Yt = + Yt 1 + at
(10.41)
Yt = Yt 1 + at
(10.42)
Yt = + t + Yt 1 + at
(10.43)
Os valores crticos (com sinal negativo, para lembrar que se trata de teste
unilateral esquerda) so apresentados na tabela 10.2
TABELA 10.2. Valores crticos do teste de Dickey-Fuller
Modelo
Nvel de significncia
10%
5%
1%
Yt = Yt 1 + at
1,62
1,94
2,56
Yt = + Yt 1 + at
2,57
2,86
3,43
Yt = + t + Yt 1 + at
3,13
3,41
3,96
367
(10.44)
Yt = + 1Yt 1 + 2Yt 2 + a t
(10.45)
ou
Yt = + (1 + 2 1)Yt 1 + 2 Yt 1 + at
ou
Yt = + Yt 1 + 2 Yt 1 + at
(10.46)
368
(10.47)
t = Y2t Y1t
(10.48)
Se o erro
for elevado, indicando que o valor de Y2t est relativamente elevado, Y2t tende a
diminuir e Y1t tende a aumentar. Considerando que esses efeitos se manifestam no
prximo perodo, temos
(10.49)
(10.50)
(10.51)
369
(10.52)
t 1 igual a zero. O resultado deve ser comparado com os valores crticos apresentados
na tabela 10.3. Note-se que esses valores crticos so diferentes daqueles que esto nas
duas ltimas linhas da tabela 10.2, pois neste caso a varivel utilizada para fazer o teste
j o resduo de uma regresso.
370
TABELA 10.3. Valores crticos para o teste da estacionariedade do erro de uma equao
de co-integrao de duas variveis, incluindo termo constante.
Equao incluindo
Constante
Constante e tendncia
Nvel de significncia
10%
5%
1%
3,04
3,50
3,34
3,78
3,90
4,32
O fato de a varivel utilizada na equao estimada para obter o valor do teste ser
o resduo da possvel equao de co-integrao faz com que, para a realizao do teste,
seja indiferente (assintoticamente) que o termo constante tenha sido includo na
primeira ou na segunda equao, o mesmo valendo para a incluso de uma tendncia.
Para exemplificar, vamos considerar os valores fictcios de Y1t
e Y2t
Y1t
Y2t
Y1t
Y2t
1
2
3
4
5
6
7
8
9
10
11
12
0,77
0,79
0,81
0,84
0,89
0,95
0,98
0,95
1,04
0,96
0,99
0,87
0,62
0,71
0,68
0,61
0,71
0,73
0,72
0,92
0,78
0,80
0,64
0,83
13
14
15
16
17
18
19
20
21
22
23
24
0,86
0,98
1,02
1,11
1,07
1,13
1,22
1,30
1,34
1,45
1,47
1,40
0,87
0,77
0,81
0,84
0,91
0,87
1,01
1,09
1,21
1,10
1,14
1,16
ao nvel de 1%, rejeitando-se a hiptese de raiz unitria na srie das diferenas. Concluise que Y1t uma srie I(1).
Para a srie Y2t obtemos = 0,91 , = 1,10 e = 3,11 , todos nosignificativos a 10%. J para a srie dos Y2t obtemos = 6,62 , = 6,96 e
= 6,90 , todos significativos a 1%. Conclumos que a srie Y2t tambm I(1).
Admitindo que haja co-integrao entre as duas variveis, estimamos, pelo
mtodo de mnimos quadrados ordinrios, a seguinte equao (testes t entre parnteses,
abaixo do coeficiente):
( 9 ,36 )
( 3, 78 )
( 4 , 33 )
Cabe ressaltar que a natureza artificial dos dados desse exemplo fez com que os
diversos testes conduzissem claramente construo de um modelo de correo de
erros. Na prtica, os resultados geralmente no so to evidentes e a construo de um
modelo apropriado vai depender bastante do discernimento do pesquisador, combinando
o conhecimento de tcnicas estatsticas, de teoria econmica e das qualidades e
limitaes dos dados utilizados.
372
Exerccios
10.1. Admite-se que a varivel Yt um passeio aleatrio com deslocamento:
Yt = Yt 1 + + t ,
sendo uma constante e t um rudo branco. fornecida uma srie de 9 valores
consecutivos de Yt : 6, 5, 10, 18, 22, 22, 31, 36 e 46.
a) Teste, ao nvel de significncia de 5%, a hiptese de que = 0.
b) Teste, ao nvel de significncia de 5%, a hiptese de que = 3.
10.2. dada uma srie de 5 valores consecutivos de Yt : 17, 20, 32, 38 e 41.
Admite-se que esses valores foram gerados pelo modelo
Yt = Yt 1 + + t ,
sendo t um rudo branco com varincia 2 .
a) Estime .
b) Estime 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese de que = 0 , contra a
hiptese alternativa de que > 0 .
10.3. Admite-se que a varivel Yt um passeio aleatrio com deslocamento:
Yt = Yt 1 + + t ,
(1)
Yt = + t + u t
Se 2 a varincia de t e u o vetor-coluna dos valores de u t , tem-se
E (uu ) = V 2 .
dada uma srie de 9 valores consecutivos de Yt (para t = 1, 2, ..., 9): 12, 12, 18,
27, 32, 33, 43, 49 e 60.
a) Quais os valores dos elementos v 22 e v 48 da matriz V?
b) Determine a estimativa linear no-tendenciosa de varincia mnima de .
c) Teste, ao nvel de significncia de 1% a hiptese de que = 0.
d) Teste, ao nvel de significncia de 5% a hiptese de que = 5.
373
10.4. Sendo a t um rudo branco, verifique, para cada um dos modelos a seguir, se ele
gera um processo estacionrio ou no, justificando sumariamente sua resposta:
a) Yt = 18 2,3Yt 1 + a t
b) Yt = 144 + a t + 2a t 1
c) Yt = 0,9Yt 1 + at
d) Yt = 7 + Yt 1 + at
e) Yt = 11 + 1,8Yt 1 0,8Yt 2 + a1
Mostre, inicialmente, que essa equao pode ser escrita como
(1 0,8 B)(1 B)Yt = 11 + at
10.5. So dadas as sries de 24 valores consecutivos das variveis Y1t e Y2t :
Y1t
Y2t
Y1t
Y2t
44
99
13
47
95
56
90
14
26
96
60
103
15
41
81
64
105
16
38
105
53
108
17
51
103
71
108
18
57
119
60
100
19
51
131
59
98
20
60
116
37
107
21
73
115
10
54
99
22
61
124
11
49
106
23
61
136
12
48
104
24
71
132
374
Respostas
10.1 a) b = 5, s 2 (b) = 2 , t = 3,536, significativo ( t 0 = 2,365 )
b) t = 1,414, no-significativo ( t 0 = 2,365 )
10.2. a) b = 6
b) s 2 = 18
c) t = 2,828, significativo (regio de rejeio: t 2,353)
10.3. a) v 22 = 2 e v 48 = 4
b) b = 6
c) t = 4,243, significativo ( t 0 = 3,499 )
d) t = 0,707, no-significativo ( t 0 = 1,895 )
10.4. a) No-estacionrio: AR(1) com | |>1.
b) Estacionrio: MA(1).
c) Estacionrio: AR(1) com | |<1.
d) No-estacionrio: passeio aleatrio com deslocamento ou AR(1) com =1.
e) No-estacionrio: tem raiz unitria.
10.5.a) = 0,03 , = 2,53 e = 2,48 , no-significativos.
375
APNDICE
TABELA I. Distribuio de t de Student. Valor crtico t 0 tal que
Nmero de
Graus de
Liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
0,10
0,05
0,02
0,01
0,005
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,296
1,289
1,282
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,671
1,658
1,645
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,000
1,980
1,960
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,390
2,358
2,326
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,660
2,617
2,576
127,32
14,089
7,453
5,598
4,773
4,317
4,029
3,832
3,690
3,581
3,497
3,428
3,372
3,326
3,286
3,252
3,222
3,197
3,174
3,153
3,135
3,119
3,104
3,090
3,078
3,067
3,056
3,047
3,038
3,030
2,971
2,915
2,860
2,807
Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Theil (1971), p. 717, e Hoel (1968), p. 295.
376
P ( k2 > 02 ) =
0,995
0,975
0,050
0,025
0,010
0,005
3927.108
0,010025
0,07172
0,2070
0,4117
9821.107
0,05064
0,2158
0,4844
0,8312
3,841
5,991
7,815
9,488
11,07
5,024
7,378
9,348
11,14
12,83
6,635
9,210
11,34
13,28
15,09
7,879
10,60
12,84
14,86
16,75
6
7
8
9
10
0,6757
0,9893
1,344
1,735
2,156
1,237
1,690
2,180
2,700
3,247
12,59
14,07
15,51
16,92
18,31
14,45
16,01
17,53
19,02
20,48
16,81
18,48
20,09
21,67
23,21
18,55
20,28
21,96
23,59
25,19
11
12
13
14
15
2,603
3,074
3,565
4,075
4,601
3,816
4,404
5,009
5,629
6,262
19,68
21,03
22,36
23,68
25,00
21,92
23,34
24,74
26,12
27,49
24,72
26,22
27,69
29,14
30,58
26,76
28,30
29,82
31,32
32,80
16
17
18
19
20
5,142
5,697
6,265
6,844
7,434
6,908
7,564
8,231
8,907
9,591
26,30
27,59
28,87
30,14
31,41
28,85
30,19
31,53
32,85
34,17
32,00
33,41
34,81
36,19
37,57
34,27
35,72
37,16
38,58
40,00
21
22
23
24
25
8,034
8,643
9,260
9,886
10,52
10,28
10,98
11,69
12,40
13,12
32,67
33,92
35,17
36,42
37,65
35,48
36,78
38,08
39,36
40,65
38,93
40,29
41,64
42,98
44,31
41,40
42,80
44,18
45,56
46,93
26
27
28
29
30
40
50
60
70
80
90
100
11,16
11,81
12,46
13,12
13,79
20,71
27,99
35,53
43,28
51,17
59,20
67,33
13,84
14,57
15,31
16,05
16,79
24,43
32,36
40,48
48,76
57,15
65,65
74,22
38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,9
113,1
124,3
41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,6
118,1
129,6
45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,4
112,3
124,1
135,8
48,29
49,64
50,99
52,34
53,67
66,77
79,49
91,95
104,2
116,3
128,3
140,2
377
denominador
1
4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2
98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3
34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
4
21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
5
16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
9,89
9,72
9,55
9,47
9,38
9,29
9,20
9,11
9,02
6
7
8
9
10
13,75
12,25
11,26
10,56
10,04
10,92
9,55
8,65
8,02
7,56
9,78
8,45
7,59
6,99
6,55
9,15
7,85
7,01
6,42
5,99
8,75
7,46
6,63
6,06
5,64
8,47
7,19
6,37
5,80
5,39
8,26
6,99
6,18
5,61
5,20
8,10
6,84
6,03
5,47
5,06
7,98
6,72
5,91
5,35
4,94
7,87
6,62
5,81
5,26
4,85
7,72
6,47
5,67
5,11
4,71
7,56
6,31
5,52
4,96
4,56
7,40
6,16
5,36
4,81
4,41
7,31
6,07
5,28
4,73
4,33
7,23
5,99
5,20
4,65
4,25
7,14
5,91
5,12
4,57
4,17
7,06
5,82
5,03
4,48
4,08
6,97
5,74
4,95
4,40
4,00
6,88
5,65
4,86
4,31
3,91
11
12
13
14
15
9,65
9,33
9,07
8,86
8,68
7,21
6,93
6,70
6,51
6,36
6,22
5,95
5,74
5,56
5,42
5,67
5,41
5,21
5,04
4,89
5,32
5,06
4,86
4,69
4,56
5,07
4,82
4,62
4,46
4,32
4,89
4,64
4,44
4,28
4,14
4,74
4,50
4,30
4,14
4,00
4,63
4,39
4,19
4,03
3,89
4,54
4,30
4,10
3,94
3,80
4,40
4,16
3,96
3,80
3,67
4,25
4,01
3,82
3,66
3,52
4,10
3,86
3,66
3,51
3,37
4,02
3,78
3,59
3,43
3,29
3,94
3,70
3,51
3,35
3,21
3,86
3,62
3,43
3,27
3,13
3,78
3,54
3,34
3,18
3,05
3,69
3,45
3,25
3,09
2,96
3,60
3,36
3,17
3,00
2,87
16
17
18
19
20
8,53
8,40
8,29
8,18
8,10
6,23
6,11
6,01
5,93
5,85
5,29
5,18
5,09
5,01
4,94
4,77
4,67
4,58
4,50
4,43
4,44
4,34
4,25
4,17
4,10
4,20
4,10
4,01
3,94
3,87
4,03
3,93
3,84
3,77
3,70
3,89
3,79
3,71
3,63
3,56
3,78
3,68
3,60
3,52
3,46
3,69
3,59
3,51
3,43
3,37
3,55
3,46
3,37
3,30
3,23
3,41
3,31
3,23
3,15
3,09
3,26
3,16
3,08
3,00
2,94
3,18
3,08
3,00
2,92
2,86
3,10
3,00
2,92
2,84
2,78
3,02
2,92
2,84
2,76
2,69
2,93
2,83
2,75
2,67
2,61
2,84
2,75
2,66
2,58
2,52
4,75
2,65
2,57
2,49
2,42
21
22
23
24
25
8,02
7,95
7,88
7,82
7,77
5,78
5,72
5,66
5,61
5,57
4,87
4,82
4,76
4,72
4,68
4,37
4,31
4,26
4,22
4,18
4,04
3,99
3,94
3,90
3,85
3,81
3,76
3,71
3,67
3,63
3,64
3,59
3,54
3,50
3,46
3,51
3,45
3,41
3,36
3,32
3,40
3,35
3,30
3,26
3,22
3,31
3,26
3,21
3,17
3,13
3,17
3,12
3,07
3,03
2,99
3,03
2,98
2,93
2,89
2,85
2,88
2,83
2,78
2,74
2,70
2,80
2,75
2,70
2,66
2,62
2,72
2,67
2,62
2,58
2,54
2,64
2,58
2,54
2,49
2,45
2,55
2,50
2,45
2,40
2,36
2,46
2,40
2,35
2,31
2,27
2,36
2,31
2,26
2,21
2,17
7,56
5,39
4,51
4,02
3,70
3,47
3,30
3,17
3,07
2,98
2,84
7,31
5,18
4,31
3,83
3,51
3,29
3,12
2,99
2,89
2,80
2,66
7,08
4,98
4,13
3,65
3,34
3,12
2,95
2,82
2,72
2,63
2,50
6,85
4,79
3,95
3,48
3,17
2,96
2,79
2,66
2,56
2,47
2,34
6,63
4,61
3,78
3,32
3,02
2,80
2,64
2,51
2,41
2,32
2,18
Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Christ (1966, p. 671) e Pimentel Gomes (1966, p. 408-409).
2,70
2,52
2,35
2,19
2,04
2,55
2,37
2,20
2,03
1,88
2,47
2,29
2,12
1,95
1,79
2,39
2,20
2,03
1,86
1,70
2,30
2,11
1,94
1,76
1,59
2,21
2,02
1,84
1,66
1,47
2,11
1,92
1,73
1,53
1,32
2,01
1,80
1,60
1,38
1,00
30
40
60
120
378
denominador
1
161
200
216
225
230
234
237
239
241
242
244
246
248
249
250
251
252
253
254
2
18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3
10,13
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
8,74
8,70
8,66
8,64
8,62
8,59
8,57
8,55
8,53
4
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,91
5,86
5,80
5,77
5,75
5,72
5,69
5,66
5,63
5
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
4,68
4.62
4,56
4,53
4,50
4,46
4,43
4,40
4,36
6
7
8
9
10
5,99
5,59
5,32
5,12
4,96
5,14
4,74
4,46
4,26
4,10
4,76
4,35
4,07
3,86
3,71
4,53
4,12
3,84
3,63
3,48
4,39
3,97
3,69
3,48
3,33
4,28
3,87
3,58
3,37
3,22
4,21
3,79
3,50
3,29
3,14
4,15
3,73
3,44
3,23
3,07
4,10
3,68
3,39
3,18
3,02
4,06
3,64
3,35
3,14
2,98
4,00
3,57
3,28
3,07
2,91
3,94
3,51
3,22
3,01
2,85
3,87
3,44
3,15
2,94
2,77
3,84
3,41
3,12
2,90
2,74
3,81
3,38
3,08
2,86
2,70
3,77
3,34
3,04
2,83
2,66
3,74
3,30
3,01
2,79
2,62
3,70
3,27
2,97
2,75
2,58
3,67
3,23
2,93
2,71
2,54
11
12
13
14
15
4,84
4,75
4,67
4,60
4,54
3,98
3,89
3,81
3,74
3,68
3,59
3,49
3,41
3,34
3,29
3,36
3,26
3,18
3,11
3,06
3,20
3,11
3,03
2,96
2,90
3,09
3,00
2,92
2,85
2,79
3,01
2,91
2,83
2,76
2,71
2,95
2,85
2,77
2,70
2,64
2,90
2,80
2,71
2,65
2,59
2,85
2,75
2,67
2,60
2,54
2,79
2,69
2,60
2,53
2,48
2,72
2,62
2,53
2,46
2,40
2,65
2,54
2,46
2,39
2,33
2,61
2,51
2,42
2,35
2,29
2,57
2,47
2,38
2,31
2,25
2,53
2,43
2,34
2,27
2,20
2,49
2,38
2,30
2,22
2,16
2,45
2,34
2,25
2,18
2,11
2,40
2,30
2,21
2,13
2,07
16
17
18
19
20
4,49
4,45
4,41
4,38
4,35
3,63
3,59
3,55
3,52
3,49
3,24
3,20
3,16
3,13
3,10
3,01
2,96
2,93
2,90
2,87
2,85
2,81
2,77
2,74
2,71
2,74
2,70
2,66
2,63
2,60
2,66
2,61
2,58
2,54
2,51
2,59
2,55
2,51
2,48
2,45
2,54
2,49
2,46
2,42
2,39
2,49
2,45
2,41
2,38
2,35
2,42
2,38
2,34
2,31
2,28
2,35
2,31
2,27
2,23
2,20
2,28
2,23
2,19
2,16
2,12
2,24
2,19
2,15
2,11
2,08
2,19
2,15
2,11
2,07
2,04
2,15
2,10
2,06
2,03
1,99
2,11
2,06
2,02
1,98
1,95
2,06
2,01
1,97
1,93
1,90
2,01
1,96
1,92
1,88
1,84
21
22
23
24
25
4,32
4,30
4,28
4,26
4,24
3,47
3,44
3,42
2,40
3,39
3,07
3,05
3,03
3,01
2,99
2,84
2,82
2,80
2,78
2,76
2,68
2,66
2,64
2,62
2,60
2,57
2,55
2,53
2,51
2,49
2,49
2,46
2,44
2,42
2,40
2,42
2,40
2,37
2,36
2,34
2,37
2,34
2,32
2,30
2,28
2,32
2,30
2,27
2,25
2,24
2,25
2,23
2,20
2,18
2,16
2,18
2,15
2,13
2,11
2,09
2,10
2,07
2,05
2,03
2,01
2,05
2,03
2,01
1,98
1,96
2,01
1,98
1,96
1,94
1,92
1,96
1,94
1,91
1,89
1,87
1,92
1,89
1,86
1,84
1,82
1,87
1,84
1,81
1,79
1,77
1,81
1,78
1,76
1,73
1,71
4,17
3,32
2,92
2,69
2,53
2,42
2,33
2,27
2,21
2,16
2,09
4,08
3,23
2,84
2,61
2,45
2,34
2,25
2,18
2,12
2,08
2,00
4,00
3,15
2,76
2,53
2,37
2,25
2,17
2,10
2,04
1,99
1,92
3,92
3,07
2,68
2,45
2,29
2,17
2,09
2,02
1,96
1,91
1,83
3,84
3,00
2,60
2,37
2,21
2,10
2,01
1,94
1,88
1,83
1,75
Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Christ (1966, p. 670) e Pimentel Gomes (1966, p. 406-407).
2,01
1,92
1,84
1,75
1,67
1,93
1,84
1,75
1,66
1,57
1,89
1,79
1,70
1,61
1,52
1,84
1,74
1,65
1,55
1,46
1,79
1,69
1,59
1,50
1,39
1,74
1,64
1,53
1,43
1,32
1,68
1,58
1,47
1,35
1,22
1,62
1,51
1,39
1,25
1,00
30
40
60
120
379
10
12
15
20
24
30
40
60
120
1
2
3
4
39,9
8,53
5,54
4,54
49,5
9,00
5,46
4,32
53,6
9,16
5,39
4,19
55,8
9,24
5,34
4,11
57,2
9,29
5,31
4,05
58,2
9,33
5,28
4,01
58,9
9,35
5,27
3,98
59,4
9,37
5,25
3,95
59,9
9,38
5,24
3,94
60,2
9,39
5,23
3,92
60,7
9,41
5,22
3,90
61,2
9,42
5,20
3,87
61,7
9,44
5,18
3,84
62,0
9,45
5,18
3,83
62,3
9,46
5,17
3,82
62,5
9,47
5,16
3,80
62,8
9,47
5,15
3,79
63,1
9,48
5,14
3,78
63,3
9,49
5,13
3,76
5
6
7
8
9
4,06
3,78
3,59
3,46
3,36
3,78
3,46
3,26
3,11
3,01
3,62
3,29
3,07
2,92
2,81
3,52
3,18
2,96
2,81
2,69
3,45
3,11
2,88
2,73
2,61
3,40
3,05
2,83
2,67
2,55
3,37
3,01
2,78
2,62
2,51
3,34
2,98
2,75
2,59
2,47
3,32
2,96
2,72
2,56
2,44
3,30
2,94
2,70
2,54
2,42
3,27
2,90
2,67
2,50
2,38
3,24
2,87
2,63
2,46
2,34
3,21
2,84
2,59
2,42
2,30
3,19
2,82
2,58
2,40
2,28
3,17
2,80
2,56
2,38
2,25
3,16
2,78
2,54
2,36
2,23
3,14
2,76
2,51
2,34
2,21
3,12
2,74
2,49
2,32
2,18
3,10
2,72
2,47
2,29
2,16
10
11
12
13
14
3,29
3,23
3,18
3,14
3,10
2,92
2,86
2,81
2,76
2,73
2,73
2,66
2,61
2,56
2,52
2,61
2,54
2,48
2,43
2,39
2,52
2,45
2,39
2,35
2,31
2,46
2,39
2,33
2,28
2,24
2,41
2,34
2,28
2,23
2,19
2,38
2,30
2,24
2,20
2,15
2,35
2,27
2,21
2,16
2,12
2,32
2,25
2,19
2,14
2,10
2,28
2,21
2,15
2,10
2,05
2,24
2,17
2,10
2,05
2,01
2,20
2,12
2,06
2,01
1,96
2,18
2,10
2,04
1,98
1,94
2,16
2,08
2,01
1,96
1,91
2,13
2,05
1,99
1,93
1,89
2,11
2,03
1,96
1,90
1,86
2,08
2,00
1,93
1,88
1,83
2,06
1,97
1,90
1,85
1,80
15
16
17
18
19
3,07
3,05
3,03
3,01
2,99
2,70
2,67
2,64
2,62
2,61
2,49
2,46
2,44
2,42
2,40
2,36
2,33
2,31
2,29
2,27
2,27
2,24
2,22
2,20
2,18
2,21
2,18
2,15
2,13
2,11
2,16
2,13
2,10
2,08
2,06
2,12
2,09
2,06
2,04
2,02
2,09
2,06
2,03
2,00
1,98
2,06
2,03
2,00
1,98
1,96
2,02
1,99
1,96
1,93
1,91
1,97
1,94
1,91
1,89
1,86
1,92
1,89
1,86
1,84
1,81
1,90
1,87
1,84
1,81
1,79
1,87
1,84
1,81
1,78
1,76
1,85
1,81
1,78
1,75
1,73
1,82
1,78
1,75
1,72
1,70
1,79
1,75
1,72
1,69
1,67
1,76
1,72
1,69
1,66
1,63
20
21
22
23
24
2,97
2,96
2,95
2,94
2,93
2,59
2,57
2,56
2,55
2,54
2,38
2,36
2,35
2,34
2,33
2,25
2,23
2,22
2,21
2,19
2,16
2,14
2,13
2,11
2,10
2,09
2,08
2,06
2,05
2,04
2,04
2,02
2,01
1,99
1,98
2,00
1,98
1,97
1,95
1,94
1,96
1,95
1,93
1,92
1,91
1,94
1,92
1,90
1,89
1,88
1,89
1,88
1,86
1,84
1,83
1,84
1,83
1,81
1,80
1,78
1,79
1,78
1,76
1,74
1,73
1,77
1,75
1,73
1,72
1,70
1,74
1,72
1,70
1,69
1,67
1,71
1,69
1,67
1,66
1,64
1,68
1,66
1,64
1,62
1,61
1,64
1,62
1,60
1,59
1,57
1,61
1,59
1,57
1,55
1,53
25
26
27
28
29
2,92
2,91
2,90
2,89
2,89
2,53
2,52
2,51
2,50
2,50
2,32
2,31
2,30
2,29
2,28
2,18
2,17
2,17
2,16
2,15
2,09
2,08
2,07
2,06
2,06
2,02
2,01
2,00
2,00
1,99
1,97
1,96
1,95
1,94
1,93
1,93
1,92
1,91
1,90
1,89
1,89
1,88
1,87
1,87
1,86
1,87
1,86
1,85
1,84
1,83
1,82
1,81
1,80
1,79
1,78
1,77
1,76
1,75
1,74
1,73
1,72
1,71
1,70
1,69
1,68
1,69
1,68
1,67
1,66
1,65
1,66
1,65
1,64
1,63
1,62
1,63
1,61
1,60
1,59
1,58
1,59
1,58
1,57
1,56
1,55
1,56
1,54
1,53
1,52
1,51
1,52
1,50
1,49
1,48
1,47
30
40
60
120
2,88
2,84
2,79
2,75
2,71
2,49
2,44
2,39
2,35
2,30
2,28
2,23
2,18
2,13
2,08
2,14
2,09
2,04
1,99
1,94
2,05
2,00
1,95
1,90
1,85
1,98
1,93
1,87
1,82
1,77
1,93
1,87
1,82
1,77
1,72
1,88
1,83
1,77
1,72
1,67
1,85
1,79
1,74
1,68
1,63
1,82
1,76
1,71
1,65
1,60
1,77
1,71
1,66
1,60
1,55
1,72
1,66
1,60
1,55
1,49
1,67
1,61
1,54
1,48
1,42
1,64
1,57
1,51
1,45
1,38
1,61
1,54
1,48
1,41
1,34
1,57
1,51
1,44
1,37
1,30
1,54
1,47
1,40
1,32
1,24
1,50
1,42
1,35
1,26
1,17
1,46
1,38
1,29
1,19
1,00
Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Scheff (1959), p. 424-425.
380
ANLISE DE REGRESSO
Tabela VI. Valores crticos do teste de Durbin-Watson para o nvel de significncia de 5%.
No de
observaes
(n)
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100
k =1
k=5
dL
dU
dL
dU
dL
dU
dL
dU
dL
dU
1,08
1,10
1,13
1,16
1,18
1,20
1,22
1,24
1,26
1,27
1,29
1,30
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,43
1,44
1,48
1,50
1,53
1,55
1,57
1,58
1,60
1,61
1,62
1,63
1,64
1,65
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,45
1,46
1,47
1,48
1,48
1,49
1,50
1,50
1,51
1,51
1,52
1,52
1,53
1,54
1,54
1,54
1,57
1,59
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,69
0,95
0,98
1,02
1,05
1,08
1,10
1,13
1,15
1,17
1,19
1,21
1,22
1,24
1,26
1,27
1,28
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,43
1,46
1,49
1,51
1,54
1,55
1,57
1,59
1,60
1,61
1,62
1,63
1,54
1,54
1,54
1,53
1,53
1,54
1,54
1,54
1,54
1,55
1,55
1,55
1,56
1,56
1,56
1,57
1,57
1,57
1,58
1,58
1,58
1,59
1,59
1,59
1,60
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,70
1,71
1,72
0,82
0,86
0,90
0,93
0,97
1,00
1,03
1,05
1,08
1,10
1,12
1,14
1,16
1,18
1,20
1,21
1,23
1,24
1,26
1,27
1,28
1,29
1,31
1,32
1,33
1,34
1,38
1,42
1,45
1,48
1,50
1,52
1,54
1,56
1,57
1,59
1,60
1,61
1,75
1,73
1,71
1,69
1,68
1,68
1,67
1,66
1,66
1,66
1,66
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,66
1,66
1,66
1,66
1,67
1,67
1,68
1,69
1,70
1,70
1,71
1,72
1,72
1,73
1,73
1,74
0,69
0,74
0,78
0,82
0,86
0,90
0,93
0,96
0,99
1,01
1,04
1,06
1,08
1,10
1,12
1,14
1,16
1,18
1,19
1,21
1,22
1,24
1,25
1,26
1,27
1,29
1,34
1,38
1,41
1,44
1,47
1,49
1,51
1,53
1,55
1,57
1,58
1,59
1,97
1,93
1,90
1,87
1,85
1,83
1,81
1,80
1,79
1,78
1,77
1,76
1,76
1,75
1,74
1,74
1,74
1,73
1,73
1,73
1,73
1,73
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,73
1,73
1,74
1,74
1,74
1,75
1,75
1,75
1,76
0,56
0,62
0,67
0,71
0,75
0,79
0,83
0,86
0,90
0,93
0,95
0,98
1,01
1,03
1,05
1,07
1,09
1,11
1,13
1,15
1,16
1,18
1,19
1,21
1,22
1,23
1,29
1,34
1,38
1,41
1,44
1,46
1,49
1,51
1,52
1,54
1,56
1,57
2,21
2,15
2,10
2,06
2,02
1,99
1,96
1,94
1,92
1,90
1,89
1,88
1,86
1,85
1,84
1,83
1,83
1,82
1,81
1,81
1,80
1,80
1,80
1,79
1,79
1,79
1,78
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,78
1,78
1,78
381
ANLISE DE REGRESSO
k =1
k=5
dL
dU
dL
dU
dL
dU
dL
dU
dL
dU
0,81
0,84
0,87
0,90
0,93
0,95
0,97
1,00
1,02
1,04
1,05
1,07
1,09
1,10
1,12
1,13
1,15
1,16
1,17
1,18
1,19
1,21
1,22
1,23
1,24
1,25
1,29
1,32
1,36
1,38
1,41
1,43
1,45
1,47
1,48
1,50
1,51
1,52
1,07
1,09
1,10
1,12
1,13
1,15
1,16
1,17
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,32
1,33
1,34
1,34
1,38
1,40
1,43
1,45
1,47
1,49
1,50
1,52
1,53
1,54
1,55
1,56
0,70
0,74
0,77
0,80
0,83
0,86
0,89
0,91
0,94
0,96
0,98
1,00
1,02
1,04
1,05
1,07
1,08
1,10
1,11
1,13
1,14
1,15
1,16
1,18
1,19
1,20
1,24
1,28
1,32
1,35
1,38
1,40
1,42
1,44
1,46
1,47
1,49
1,50
1,25
1,25
1,25
1,26
1,26
1,27
1,27
1,28
1,29
1,30
1,30
1,31
1,32
1,32
1,33
1,34
1,34
1,35
1,36
1,36
1,37
1,38
1,38
1,39
1,39
1,40
1,42
1,45
1,47
1,48
1,50
1,52
1,53
1,54
1,55
1,56
1,57
1,58
0,59
0,63
0,67
0,71
0,74
0,77
0,80
0,83
0,86
0,88
0,90
0,93
0,95
0,97
0,99
1,01
1,02
1,04
1,05
1,07
1,08
1,10
1,11
1,12
1,14
1,15
1,20
1,24
1,28
1,32
1,35
1,37
1,39
1,42
1,43
1,45
1,47
1,48
1,46
1,44
1,43
1,42
1,41
1,41
1,41
1,40
1,40
1,41
1,41
1,41
1,41
1,41
1,42
1,42
1,42
1,43
1,43
1,43
1,44
1,44
1,45
1,45
1,45
1,46
1,48
1,49
1,51
1,52
1,53
1,55
1,56
1,57
1,58
1,59
1,60
1,60
0,49
0,53
0,57
0,61
0,65
0,68
0,72
0,75
0,77
0,80
0,83
0,85
0,88
0,90
0,92
0,94
0,96
0,98
1,00
1,01
1,03
1,04
1,06
1,07
1,09
1,10
1,16
1,20
1,25
1,28
1,31
1,34
1,37
1,39
1,41
1,43
1,45
1,46
1,70
1,66
1,63
1,60
1,58
1,57
1,55
1,54
1,53
1,53
1,52
1,52
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,52
1,52
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,60
1,61
1,62
1,63
0,39
0,44
0,48
0,52
0,56
0,60
0,63
0,66
0,70
0,72
0,75
0,78
0,81
0,83
0,85
0,88
0,90
0,92
0,94
0,95
0,97
0,99
1,00
1,02
1,03
1,05
1,11
1,16
1,21
1,25
1,28
1,31
1,34
1,36
1,39
1,41
1,42
1,44
1,96
1,90
1,85
1,80
1,77
1,74
1,71
1,69
1,67
1,66
1,65
1,64
1,63
1,62
1,61
1,61
1,60
1,60
1,59
1,59
1,59
1,59
1,59
1,58
1,58
1,58
1,58
1,59
1,59
1,60
1,61
1,61
1,62
1,62
1,63
1,64
1,64
1,65
382
ANLISE DE REGRESSO
BIBLIOGRAFIA
AIGNER, D.J. (1971). Basic econometrics. New Jersey, Prentice-Hall.
ANGRIST, J.D.; PISCHKE, J.S. (2009). Mostly harmless econometrics: an empiricists
companion. Princeton University Press.
BARTLETT, M.S. (1949). Fitting a Straight Line when Both Variables are subject to
Error. Biometrics, 5: 207-242.
BOX, G.E.P.; JENKINS, G. M. e REINSEL, G.C. (1994) Time series analysis Forecasting and Control. 3a ed. New York, Prentice-Hall.
CARTER, H.O. e HARTLEY, H.O. (1958). A Variance Formula for Marginal Productivity
Estimates Using the Cobb-Douglas Function. Econometrica, 26: 306-313.
CASTRO, J. de (1961). Geopoltica da Fome: ensaio sobre os problemas de alimentao e
de populao do mundo.6 ed. So Paulo, Editora Brasiliense.
COCHRAN, W.G. (1965). Tcnicas de Amostragem. Rio de Janeiro, Fundo de Cultura.
CHRIST, C.F. (1966). Econometric Models and Methods. New York, John Wiley.
CROXTON, F.E. e COWDEN, D.J. (1955).
Prentice-Hall.
DAVIDSON, R e MACKINNON, J. (1993). Estimation and Inference in Econometrics.
New York, Oxford University Press.
DRAPER, N. e SMITH, H. (1966). Applied Regression Analysis. New York, John Wiley.
ENDERS, W. (1995). Applied Econometric Time Series. New York, John Wiley.
ENGLE, R.F. e GRANGER, W.J. (1987). Co-integration and Error Correction:
representation, estimation and testing. Econometrica, 55(2): 251-276.
GLEJSER, H. (1969). A New Test for Heteroscedasticity. J. Am. Statist. Assoc., 64: 316323.
GOLDFELD, S.M. e QUANDT, R.E. (1965). Some Tests for Homoscedasticity. J. Am.
Statist. Assoc., 60: 539-547.
383
ANLISE DE REGRESSO
384
ANLISE DE REGRESSO
Regresso e Covarincia.
385
ANLISE DE REGRESSO
386
ANLISE DE REGRESSO
NDICE ANALTICO
A
ADF, 368
Anamorfose, 77-79, 173
AR (p), 356
ARIMA (p, d, q), 365
ARMA (p, q), 357
Auto-regressivo, 356
Autocorrelao, 46, 278
B
Bartlett, 303, 383
Basmann, 328
Binria (ver Varivel binria)
Box, 355, 383
Breusch-Pagan/Godfrey, 265
C
Chebyshev, 28
Christ, 378, 379, 383
Cochran, 13, 383
Coeficiente de correlao
parcial, 146-153
simples, 103-104, 186
Coeficiente de determinao, 61, 68, 105, 129-130
Coeficiente de determinao parcial, 150-153
Coeficiente de variao, 68-69
Consistente (ver Estimador consistente)
Co-integrao, 368-371
Convergncia em mdia quadrtica, 28
387
ANLISE DE REGRESSO
Convergncia em probabilidade, 26
Covarincia
Definio, 6
Propriedades, 10
Cramr-Rao, 32-34
D
Davidson, 268, 367, 371, 383
Desigualdade de Chebyshev, 28
Draper, 232, 285, 383
DSP, 360
Dummy variable (ver Varivel binria)
Durbin-Watson, 284-286, 381, 382
Dickey-Fuller, 367-368
E
Econometria, 1
Eficincia relativa, 16
Engle, 370, 383
Equaes estruturais, 309, 318-319
Erro tipo I, 34
Erro tipo II, 34
Especificao, 77-79, 168-171
Esperana matemtica
Definio, 5
Propriedades, 5
Estimador
assintoticamente eficiente, 25-26
assintoticamente no-tendencioso, 25
consistente, 27, 31, 291-294
de mxima verossimilhana, 21-24, 32-34, 80
de mnimos quadrados, 19-21
388
ANLISE DE REGRESSO
F
Falta de ajustamento, 236-239
Forma reduzida (de um sistema de equaes simultneas), 309, 319
G
Gauss-Markov, 60, 121
Glejser, 264-265
Goldfeld, 263-266
Granger, 370, 383
H
Heterocedasticia, 46, 254
Hiptese (ver teste de hipteses)
Hoel, 262, 285, 376, 384
Hoffmann, 4, 285, 355, 384
Homocedasticia, 44
Homocedsticos, 44, 120
I
Identificao, 321-327
Intervalo de confiana, 71, 73, 75-76, 129, 140-141
Intervalo de previso, 73-76, 141-142
389
ANLISE DE REGRESSO
J
Jenkins, 356, 383
Johnston, 281, 285, 297, 304, 381, 382, 384
K
Kendall, 108, 386
L
Limite em probabilidade, 26
Limite inferior de Cramr-Rao, 32-34
M
Mackinnon, 268, 367, 371, 383
MA (q), 356
Matriz de varincias e covarincias, 124
Mdias mveis, 356
Mtodo
das variveis instrumentais (ver Varivel instrumental)
de mxima verossimilhana, 19, 21-24
dos mnimos quadrados, 19-21, 47, 121-123
dos mnimos quadrados em dois estgios, 315-317, 328-329
dos mnimos quadrados generalizados, 275-278
dos mnimos quadrados indiretos, 312-313
dos mnimos quadrados ordinrios, 256, 257-261, 282-283
dos mnimos quadrados ponderados, 46, 256-258
Modelo de correo de erros, 368-370
Modelo
Estatstico, 2-3
Matemtico, 1-2
390
ANLISE DE REGRESSO
N
Nvel de significncia, 34-40
O
Ortogonalidade, 173, 182-183
P
Passeio aleatrio, 358
Perez, 304, 385
Pimentel Gomes, 378, 385
Poder do teste, 34
Poligonal, 226-229
Probabilidade caudal do teste, 67-71, 137, 138, 284
Processo estacionrio, 353-354
Processo estocstico, 352-353
Q
Quandt, 263-266
R
Raiz unitria, 364
Regresso linear mltipla, 120-121
Regresso linear simples, 44-47
Rudo branco, 354
391
ANLISE DE REGRESSO
S
Scheff, 380, 385
Smith, 232, 285, 383
T
Teorema de Gauss-Markov (ver Gauss-Markov)
Teste de Breusch-Pagan/Godfrey, 265
Teste de Chow, 232
Teste de Dickey-Fuller, 367-368
Teste de Durbin-Watson, 284-286
Teste de Glejser, 264
Teste de Goldfeld e Quandt, 263-266
Teste de hipteses (conceitos bsicos), 34-40
Teste de hipteses no modelo linear, 157, 178-181
Teste de White, 266
Teste para falta de ajustamento (Ver Falta de ajustamento)
Teste para homocedasticia, 261-267
Theil, 33, 34, 263, 267, 281, 328, 376, 377, 385
Trajetria (de um processo estocstico), 352-353
TSP, 360
V
Varincia
Definio, 5-6
Propriedades, 6-7
Varincia assinttica, 25
Variveis conjuntamente determinadas, 317
Varivel
aleatria, 4-5
binria, 219-240
392
ANLISE DE REGRESSO
W
Wald, 303, 385
White, 266-268, 385
Wonnacott, 191, 385
Y
Yule, 108, 386
393