Você está na página 1de 405

Universidade de So Paulo

Biblioteca Digital da Produo Intelectual - BDPI


Departamento de Economia, Administrao e Sociologia ESALQ/LES

Livros e Captulos de Livros - ESALQ/LES

2016

Anlise de regresso : uma introduo


econometria

http://www.producao.usp.br/handle/BDPI/48616
Downloaded from: Biblioteca Digital da Produo Intelectual - BDPI, Universidade de So Paulo

RODOLFO HOFFMANN

ANLISE DE REGRESSO
Uma Introduo Econometria

Portal de Livros Abertos


da USP
2016

RODOLFO HOFFMANN

ANLISE DE REGRESSO
Uma Introduo
Econometria
Esta uma verso ligeiramente modificada do livro de mesmo ttulo
(quarta edio) publicado pela Editora HUCITEC em 2006, com edio esgotada
em 2014.

Piracicaba
Edio do Autor
2016

Dados Internacionais de Catalogao na Publicao

DIVISO DE BIBLIOTECA DIBD/ESALQ/USP


Hoffmann, Rodolfo
Anlise de regresso: uma introduo econometria [recurso eletrnico] /
Rodolfo Hoffmann. - - Piracicaba: ESALQ/USP, 2015.
393 p. : il.
ISBN: 978-85-921057-0-9

1. Anlise de regresso 2. Econometria I.Ttulo


CDD 330.18
H711a

Autorizo a reproduo parcial ou total desta obra, para fins acadmicos,


desde que citada a fonte.

SUMRIO

1. INTRODUO E CONCEITOS ESTATSTICOS BSICOS ..................................................... 1


1.1. Econometria e anlise de regresso ........................................................................... 1
1.2. Modelo matemtico e modelo estatstico .................................................................. 1
1.3. Varivel aleatria ....................................................................................................... 4
1.4. Esperana matemtica ............................................................................................... 5
1.5. Varincia e covarincia ............................................................................................. 5
1.6. Estimador no-tendencioso ...................................................................................... 10
1.7. Estimador de varincia mnima ............................................................................... 15
1.8. Estimadores de mnimos quadrados ........................................................................ 19
1.9. Estimadores de mxima verossimilhana ................................................................ 21
1.10. Propriedades assintticas dos estimadores ............................................................ 24
1.11. O limite inferior de Cramr-Rao e as propriedades assintticas dos
estimadores de mxima verossimilhana .............................................................. 32
1.12. Teste de hipteses .................................................................................................. 34
Exerccios ....................................................................................................................... 40
2. REGRESSO LINEAR SIMPLES ...................................................................................... 44
2.1.

modelo estatstico de uma regresso linear simples ............................................. 44

2.2. Estimativa dos parmetros ...................................................................................... 47


2.3. O modelo simplificado e um exemplo numrico .................................................. 50
2.4. Demonstrao de que os estimadores de mnimos quadrados so
estimadores lineares no-tendenciosos .................................................................. 53
2.5. Varincias e covarincias das estimativas dos parmetros .................................... 55
2.6. Demonstrao de que b um estimador linear no-tendencioso de
varincia mnima ................................................................................................... 58
2.7. Decomposio da soma de quadrados total ........................................................... 61
2.8. Esperanas das somas de quadrados ...................................................................... 63
2.9. Anlise de varincia da regresso .......................................................................... 65
2.10. O coeficiente de determinao corrigido para graus de liberdade e o
coeficiente de variao .......................................................................................... 68

2.11. Estimativas das varincias das estimativas dos parmetros, teste de


hipteses a respeito dos parmetros e respectivos intervalos de
confiana ................................................................................................................ 69
2.12. Varincia de Yi e intervalo de previso ................................................................. 72
2.13. O problema da especificao e as funes que se tornam lineares por
anamorfose ............................................................................................................. 77
2.14. Estimativa de mxima verossimilhana ................................................................ 80
2.15. Anlise de regresso quando X uma varivel aleatria ....................................... 81
Exerccios ....................................................................................................................... 82
3. CORRELAO ............................................................................................................ 103
3.1. O coeficiente de correlao simples para uma amostra ....................................... 103
3.2. Aplicao da anlise de regresso a uma populao com distribuio
normal bidimensional .......................................................................................... 110
Exerccios ..................................................................................................................... 112
4. REGRESSO LINEAR MLTIPLA .................................................................................. 120
4.1. O modelo estatstico de uma regresso linear mltipla .......................................... 120
4.2. Estimativas dos parmetros de acordo com o mtodo dos mnimos
quadrados ............................................................................................................. 121
4.3. Varincias e covarincias das estimativas dos parmetros ..................................... 124
4.4. Varincia de uma combinao linear das estimativas dos parmetros ................... 125
4.5. Anlise de varincia da regresso linear mltipla .................................................. 126
4.6. Demonstrao de que b um estimador linear no-tendencioso de varincia
mnima ................................................................................................................. 130
4.7. O uso das variveis centradas ................................................................................. 132
4.8. Exemplo de uma regresso linear mltipla com duas variveis
explanatrias ........................................................................................................ 135
4.9. Previso e teste de hipteses a respeito do valor de combinaes lineares dos
parmetros ............................................................................................................ 139
4.10. Interpretao dos coeficientes de regresso de uma regresso linear
mltipla com duas variveis explanatrias .......................................................... 143
4.11. Os coeficientes de correlao parcial ................................................................... 146
4.12. Intervalos de confiana e regies de confiana para os parmetros..................... 154
4.13. Exemplo de regresso linear mltipla com trs variveis explanatrias ............. 162

4.14. Problemas de especificao.................................................................................. 168


4.15. Transformao das variveis para obter a matriz de correlaes simples .......... 171
4.16. Regresses que se tornam lineares por anamorfose ............................................ 173
4.17. Ortogonalidade e multicolinearidade na matriz X .............................................. 173
4.18. Teste de hipteses no modelo linear ................................................................... 178
4.19. Interpretao geomtrica da anlise de regresso linear de acordo com o
mtodo de mnimos quadrados ........................................................................... 181
Exerccios ..................................................................................................................... 194
5. USO DE VARIVEIS BINRIAS .................................................................................. 219
5.1. Nveis de medida ................................................................................................. 219
5.2. Uso de variveis binrias para distinguir as categorias de uma varivel
nominal................................................................................................................. 220
5.3. Uso de variveis binrias para ajustar poligonais ............................................... 226
5.4. Mudana estrutural .............................................................................................. 230
5.5. Anlise de varincia de dados com vrios tratamentos e o teste para "falta
de ajustamento" ................................................................................................... 236
Exerccios ..................................................................................................................... 240
6. HETEROCEDASTICIA .................................................................................................. 254
6.1. O caso de uma regresso linear simples em que o desvio padro do erro
proporcional a X .................................................................................................. 254
6.2. O mtodo dos mnimos quadrados ponderados .................................................. 255
6.3. Conseqncias do uso de estimadores de mnimos quadrados ordinrios
quando existe heterocedasticia ............................................................................ 257
6.4. Testes para a homocedasticia e obteno de estimativas dos parmetros
quando a matriz V desconhecida ...................................................................... 261
6.5. O estimador de White para varincia quando h heterocedasticia ...................... 267
Exerccios ..................................................................................................................... 268
7. MNIMOS QUADRADOS GENERALIZADOS E AUTOCORRELAO NOS RESDUOS ........ 275
7.1. Mnimos quadrados generalizados ...................................................................... 275
7.2. Autocorrelao nos resduos ............................................................................... 278
7.3. O teste de Durbin-Watson ................................................................................... 283
Exerccios ..................................................................................................................... 285

8. VARIVEIS INSTRUMENTAIS E ERROS NAS VARIVEIS EXPLANATRIAS ................... 291


8.1. Introduo ........................................................................................................... 291
8.2. A consistncia dos estimadores de mnimos quadrados ordinrios .................... 291
8.3. A inconsistncia dos estimadores de mnimos quadrados quando os erros
esto assintoticamente correlacionados com uma ou mais das variveis
explanatrias ....................................................................................................... 294
8.4. O uso de variveis instrumentais para obter estimativas consistentes ................ 295
8.5. Regresso linear simples com as duas variveis sujeitas a erros de medida ....... 298
8.6. O mtodo da varivel instrumental ..................................................................... 301
8.7. Outro mtodo ...................................................................................................... 303
Exerccios ...................................................................................................................... 305
9. EQUAES SIMULTNEAS ......................................................................................... 308
9.1. Introduo ........................................................................................................... 308
9.2. Um exemplo numrico ........................................................................................ 311
9.3. O estimador de varivel instrumental ................................................................. 312
9.4. Mnimos quadrados indiretos .............................................................................. 312
9.5. Mnimos quadrados em dois estgios ................................................................. 315
9.6. Variveis conjuntamente determinadas e variveis predeterminadas ................. 317
9.7. Notao geral ...................................................................................................... 318
9.8. Variveis instrumentais ....................................................................................... 319
9.9. Identificao ........................................................................................................ 321
9.10. Estimao dos parmetros em caso de superidentificao .................................. 327
9.11. Outras maneiras de obter o estimador de mnimos quadrados em dois
estgios ................................................................................................................ 328
9.12. Um exemplo numrico ........................................................................................ 329
9.13. Um segundo exemplo numrico ......................................................................... 333
9.14. Terceiro exemplo ................................................................................................ 334
9.15. Uma viso global ................................................................................................. 340
Exerccios ..................................................................................................................... 342
10. SRIES TEMPORAIS .................................................................................................. 352
10.1. Processos estocsticos ......................................................................................... 352
10.2. Rudo branco ....................................................................................................... 354
10.3. Modelos de regresso .......................................................................................... 355

10.4. Modelos de decomposio ................................................................................... 355


10.5. Modelos ARMA .................................................................................................. 355
10.6. Anlise do AR(1) ................................................................................................. 357
10.7. O passeio aleatrio com deslocamento ................................................................ 358
10.8. Transformando modelos AR em modelos MA e vice-versa ............................... 362
10.9. Raiz unitria e modelos ARIMA ......................................................................... 364
10.10.Funo de autocorrelao ................................................................................... 365
10.11. Os testes de Dickey-Fuller ................................................................................. 367
10.12. Modelo de correo de erro e co-integrao ..................................................... 368
Exerccios ..................................................................................................................... 373
APNDICE ....................................................................................................................... 376
BIBLIOGRAFIA ............................................................................................................... 383
NDICE ANALTICO.......................................................................................................... 387

PREFCIO

Este livro reflete o esforo do autor em preparar material didtico para


disciplinas de econometria e anlise de regresso ministradas na ESALQ-USP e, a partir
de 1997, no Instituto de Economia da UNICAMP.
O interesse na aprendizagem desses mtodos estatsticos se deve, em grande
parte, ao uso que deles se faz em pesquisas econmicas. Mas a anlise de regresso
tambm largamente aplicada em outras reas, como biologia, fsica ou engenharia.
No exagero afirmar que muitas vezes a conduo e a avaliao de uma pesquisa
dependem do conhecimento do pesquisador sobre econometria e anlise de regresso,
inclusive no que tange a suas potencialidades e a suas limitaes.
Um aspecto didaticamente importante, neste livro, a apresentao de exerccios
numricos que no exigem, para serem resolvidos, nem mesmo uma mquina de
calcular. Dessa maneira o aluno pode, sem dispender muito tempo em clculo, testar sua
aprendizagem e usar os conhecimentos recm-adquiridos. Alis, a idia de minimizar
clculos no nova. Basta lembrarmos de que, quando aprendemos a resolver equaes
do 2o grau, trabalhamos com exerccios do tipo
2x 2 7x + 3 = 0

e no do tipo
0,072150 x 2 + 1,481099 x 470,1902 = 0
No h dvida, entretanto, que tcnicas mais avanadas e recentes exigem o uso
do computador. O prprio desenvolvimento dos mtodos estatsticos nas ltimas
dcadas est muito associado ao uso do computador como poderoso instrumento de
fazer clculos.
Nesta quarta edio foi acrescentado um captulo sobre sries temporais.
Tambm foram incorporados novos exerccios e novas sees em captulos anteriores,
sempre procurando melhorar a apresentao dos temas, deixando para um outro volume
a anlise de regresso no-linear e modelos de lgite e prbite.
Seria difcil listar todos os colegas e alunos que, com suas crticas e sugestes
muito contriburam para que verses anteriores deste livro fossem sucessivamente
melhoradas. A Profa. Sonia Vieira foi co-autora das edies anteriores. A Profa. Angela
A. Kageyama fez cuidadosa reviso da 1a edio. A Profa. Rosngela Ballini fez vrias

sugestes e correes nesta 4a edio. E a tarefa de digitar todo o texto novamente foi
realizada com muita competncia e cuidado por Joselene Rodrigues da Silva.
Cabe, finalmente, registrar as boas condies de trabalho fornecidas pelas
instituies onde trabalhei e trabalho, a ESALQ-USP e o IE-UNICAMP, e agradecer o
apoio recebido da FAPESP e do CNPq.
Para esta nova edio em meio digital de 2015 contei com a indispensvel
colaborao de Helena Aparecida Cardoso.
Sugestes, correes ou dvidas podem ser enviadas para o e-mail do autor:
hoffmannr@usp.br.

1. INTRODUO E CONCEITOS ESTATSTICOS BSICOS


1.1. Econometria e anlise de regresso
A econometria consiste na aplicao de mtodos matemticos e estatsticos a
problemas de economia. O econometrista combina conhecimentos de trs ramos
cientficos: Economia, Matemtica e Estatstica.
A anlise de regresso o mtodo mais importante da econometria.
Sempre interessante conhecer os efeitos que algumas variveis exercem, ou
que parecem exercer, sobre outras. Mesmo que no exista relao causal entre as
variveis podemos relaciona-las por meio de uma expresso matemtica, que pode ser
til para se estimar o valor de uma das variveis quando conhecemos os valores das
outras (estas de mais fcil obteno ou antecessoras da primeira no tempo), sob
determinadas condies.
Genericamente, tais relaes funcionais podem ser representadas por
Y = f ( X 1 , X 2 ,K, X k )
onde Y representa a varivel dependente e os X h (h = 1, 2, ..., k) representam as
variveis explanatrias.
So exemplos de relaes funcionais entre variveis:
a) crescimento da populao ou do PNB de um pas (Y) em funo dos anos (X);
b) variao da produo (Y) obtida numa cultura conforme a quantidade de nitrognio

( X 1 ) , fsforo ( X 2 ) e potssio ( X 3 ) utilizada na adubao;


c) variao do preo (Y) de um produto no mercado em funo da quantidade oferecida
(X).
1.2. Modelo matemtico e modelo estatstico
Consideremos duas variveis, X e Y, relacionadas por uma funo matemtica
Y = f ( X ) . Dado um conjunto de valores X i (i = 1, 2, ..., n) e os correspondentes

valores de Yi = f ( X i ) , se colocarmos os pontos ( X i , Yi ) em um grfico verificaremos


que eles pertencem curva que representa o modelo matemtico que relaciona as duas
variveis, como mostra a figura 1.1.

Figura 1.1. Modelo matemtico: Yi = f ( X i )


comum, entretanto, que a varivel dependente seja afetada por outros fatores,
alm dos considerados no modelo adotado. Admitamos que a varivel dependente sofra
a influncia de k + m variveis, isto ,
Y = f ( X 1 , X 2 , K , X k , X k +1 , K , X k + m )
e que por vrios motivos (no disponibilidade dos valores, impossibilidade de
mensurao, para simplificar a anlise etc.) no consideramos a influncia das variveis
X k +1 , K , X k + m . Ao analisarmos Y como funo das k primeiras variveis permanece,
ento, um resduo ou erro.
Admitindo que esse erro seja aditivo, o modelo estatstico fica
Yi = f ( X 1i , X 2i , K , X ki ) + u i

(i = 1, K , n)

Se apenas uma das variveis independentes considerada, temos


Yi = f ( X i ) + u i
Neste caso, o conjunto de pares de valores ( X i , Y i ) corresponde a um conjunto
de pontos, dispersos em torno da curva representativa da funo, como mostra a figura

1.2. Dizemos que as duas variveis esto relacionadas de acordo com um modelo
estatstico.

Figura 1.2. Modelo estatstico: Yi = f ( X i ) + u i

Outra justificativa para a existncia do erro (u i ) em um modelo estatstico


dada pelos erros de mensurao da varivel dependente. Se os verdadeiros valores (Vi )
da varivel dependente so uma funo matemtica das variveis explanatrias, isto ,
Vi = f ( X 1i , X 2i , K , X ki )
e se os valores observados (Yi ) da varivel dependente apresentam erros de mensurao
(u i ) , isto ,
Yi = Vi + u i ,
a relao entre Yi e os X ki (h = 1, 2, ..., k) fica
Yi = f ( X 1i , X 2i , K , X ki ) + u i

Em casos reais geralmente existem tanto erros de mensurao como efeitos de


outras variveis. Nestes casos, o erro residual do modelo ser a soma desses dois tipos
de erro.
Desde que existam erros de mensurao, lgico admitir que os valores das
variveis explanatrias tambm so afetados; os problemas que isso acarreta sero
discutidos mais adiante; numa primeira etapa admitiremos apenas um erro residual
devido existncia de fatores no includos no modelo e/ou erros de mensurao apenas
na varivel dependente.
Nas prximas sees deste captulo faremos uma reviso de alguns conceitos
bsicos de estatstica.1

1.3. Varivel aleatria

Dizemos que uma varivel discreta X aleatria, se a cada um de seus valores se


associa uma probabilidade P ( X ) . O conjunto dos valores da varivel e das respectivas
probabilidades a distribuio de X.
Vejamos um exemplo. Se uma moeda lanada 5 vezes, o nmero de vezes que
se obtm cara uma varivel aleatria discreta, que pode assumir valores inteiros de 0
a 5, inclusive. Essa varivel tem distribuio binomial. Demonstra-se que, se p a
probabilidade de obter cara em um nico lanamento da moeda, a probabilidade de
ocorrerem X = k caras, em 5 lanamentos da moeda,
5
P( X = k ) = p k (1 p ) 5 k
k
Esta a funo de probabilidade da distribuio binomial para n = 5, onde n o
nmero de ensaios.
Se a varivel aleatria contnua, a probabilidade de obtermos exatamente um
determinado valor k zero, isto :
P( X = k ) = 0

Um desenvolvimento mais detalhado da maioria dos temas abordados nesta reviso pode ser encontrado
em HOFFMANN (1980).

Entretanto, desde que seja definida a funo de densidade f ( X ) , podemos obter


a probabilidade de a varivel aleatria assumir valores no intervalo (a, b), isto ,
b

P(a < X < b) = f ( X )dX


a

O valor de f ( X ) tambm denominado densidade de probabilidade.


Se a varivel contnua tem distribuio normal com mdia e varincia 2 , a
funo de densidade

f (X ) =

1
2 2

( X ) 2
exp

2 2

1.4. Esperana matemtica

Por definio, se a varivel aleatria discreta, a esperana de X

= E ( X ) = X i P( X i )
e, se a varivel aleatria contnua, a esperana de X
+

= E ( X ) = xf ( X )dX

Pode-se demonstrar, dadas as variveis aleatrias X e Y e a constante K, que a


esperana apresenta as seguintes propriedades:
a) E ( K ) = K
b) E ( X + K ) = E ( X ) + K
c) E ( KX ) = KE ( X )
d) E ( X + Y ) = E ( X ) + E (Y )
e, se X e Y so independentes,
e) E ( XY ) = E ( X ) E (Y )

1.5. Varincia e covarincia


Por definio, a varincia de uma varivel aleatria X, de populao infinita,

2 = V ( X ) = E[ X E ( X )] 2 = E ( X ) 2
A varincia uma medida de disperso da distribuio.
Demonstremos, a seguir, que, se K uma constante, V ( KX ) = K 2V ( X ) .
Temos
V ( KX ) = E[ KX E ( KX )] 2 =
= E[ KX KE ( X )] 2 =
= E{K 2 [ X E ( X )] 2 } =
= K 2 E[ X E ( X )] 2 =
= K 2V ( X ),

c.q.d.

Dadas duas variveis aleatrias, X e Y, a covarincia entre X e Y , por definio:


cov( X , Y ) = E[ X E ( X )] [Y E (Y )] =
= E ( X X )(Y Y )
Demonstremos, a seguir, que
V ( X + Y ) = V ( X ) + V (Y ) + 2 cov( X , Y )

Temos
V ( X + Y ) = E[( X + Y ) E ( X + Y )] 2
Ento

V ( X + Y ) = E{[( X E ( X )] + [Y E (Y )]}2 =
= E[( X X ) 2 + (Y Y ) 2 + 2( X X )(Y Y )] =
= V ( X ) + V (Y ) + 2 cov( X , Y )
fcil verificar que
V ( X Y ) = V ( X ) + V (Y ) 2 cov( X , Y )

Se X e Y so duas variveis aleatrias independentes temos


cov( X , Y ) = E ( X X )(Y Y ) =
= E ( X X ) E (Y Y ) = 0

Segue-se que, no caso de variveis independentes,


V ( X Y ) = V ( X ) + V (Y )

Para exemplificar, consideremos que um tetraedro regular, feito de material


homogneo, em cujas faces esto marcados os nmeros 0, 2, 4 e 6, lanado. Seja X a
varivel aleatria que representa o valor marcado na face que ficar em contato com a
mesa. Os sucessivos lanamentos desse tetraedro geram uma populao infinita, em que
a cada um dos 4 diferentes valores est associada a probabilidade 1/4.
Ento
1
4

1
4

1
4

X = E ( X ) = X i P( X i ) = 0 + 2 + 4 + 6
i =1

1
=3
4

X2 = V ( X ) = E ( X 3) 2 =
1
1
1
1
= (3) 2 + (1) 2 + 12 + 3 2 = 5
4
4
4
4
Consideremos, agora, que temos dois tetraedros, um azul e outro branco. Sejam
X e Y as variveis aleatrias que representam os valores obtidos nos tetraedros azul e
branco, respectivamente.
Temos

X = Y = 3
X2 = Y2 = 5
Uma vez que X e Y so, obviamente, variveis independentes, devemos verificar
que cov( X , Y ) = 0 .
Na tabela 1.1 so dados os valores do produto ( X X )(Y Y ) a serem
utilizados no clculo da cov( X , Y ) .
TABELA 1.1. Valores de ( X X )(Y Y ) = ( X 3)(Y 3)

Y
0

0
2

9
3

3
1

3
1

9
3

4
6

3
9

1
3

1
3

3
9

Verificamos ento que

cov( X , Y ) = E ( X X )(Y Y ) =
= 9

1
1
1
+ 3 +K+ 9 = 0
16
16
16

Seja Z = X + Y
Ento V ( Z ) = V ( X ) + V (Y ) + 2 cov( X , Y ) = 5 + 5 = 10
Verifiquemos este resultado calculando V (Z ) diretamente da definio. Na
tabela 1.2 so apresentados os valores de Z = X + Y .
TABELA 1.2. Soma dos valores obtidos lanando dois tetraedros

Y
0
2
4
6

0
2
4
6

2
4
6
8

4
6
8
10

6
8
10
12

Temos que
E ( Z ) = E ( X + Y ) = E ( X ) + E (Y ) = 3 + 3 = 6

Esse valor tambm pode ser obtido calculando a mdia dos valores obtidos na
tabela 1.2, como segue:
E(Z ) = 0

1
1
1
1
+ 2 + 4 + K + 12 = 6
16
16
16
16

Finalmente, obtemos

V ( Z ) = E[ Z E ( Z )] 2 =
= (0 6) 2

1
1
1
+ ( 2 6) 2 + K + (12 6) 2 = 10 ,
16
16
16

confirmando o resultado obtido anteriormente.

Devemos ressaltar que, embora cov( X , Y ) = 0 sempre que X e Y so variveis


aleatrias independentes, o inverso no verdadeiro, isto , se cov( X , Y ) = 0 , no
podemos concluir que X e Y so independentes. Na tabela 1.3 apresentamos uma
distribuio conjunta em que cov( X , Y ) = 0 e as variveis no so independentes, pois
P ( X i , Y j ) P ( X i ) P (Y j )

TABELA 1.3.

Valores de P ( X i , Y j ) para a distribuio conjunta de duas


variveis dependentes com cov( X , Y ) = 0
X

P(Y )

1
1

0,10
0,25

0,30
0

0,10
0,25

0,50
0,50

P( X )

0,35

0,30

0,35

1,00

Entretanto, possvel demonstrar que, se as variveis tm distribuio normal, o


fato de a covarincia ser igual a zero condio suficiente para podermos afirmar que
so variveis independentes.
Vejamos, a seguir, um exemplo de duas variveis com covarincia no nula. No
lanamento do tetraedro descrito anteriormente, seja X o valor marcado na face que fica
em contato com a mesa e seja W a soma dos valores marcados nas outras 3 faces. A
tabela 1.4 mostra os valores de X e de W, bem como do produto [ X E ( X )] [W E (W )]
.

TABELA 1.4. Valores necessrios para o clculo da cov( X , W )


X

[ X E ( X )] [W E (W )]

12

10

Temos que
E( X ) = 3 ,
E (W ) = 9 e

cov( X , W ) = [ X E ( X )] [W E (W )] =
1
1
1
1
= (9) + (1) + (1) + (9) = 5
4
4
4
4
Como exerccio, o leitor pode verificar que V (W X ) = 20 .
Pode-se demonstrar que, se K uma constante e se X, Y e Z so variveis
aleatrias, a covarincia apresenta as seguintes propriedades:
a) cov( X + Y , Z ) = cov( X , Z ) + cov(Y , Z )
b) cov( KX , Y ) = cov( X , KY ) = K cov( X , Y )
c) cov( K , X ) = cov( X , K ) = 0
Segue-se que, se 1 , 1 , 1 , 2 , 2 e 2 so constantes,

cov( 1 + 1 X + 1Y , 2 + 2 X + 2 Y ) =
= 1 2V ( X ) + ( 1 2 + 1 2 ) cov( X , Y ) + 1 2V (Y )
Como caso particular temos:
cov( X , + X ) = V ( X )

Este ltimo resultado pode ser utilizado para obter a covarincia entre as
variveis X e W da tabela 1.4. Como a soma de todos os valores marcados no tetraedro
sempre igual a 12, temos que W = 12 X . Ento
cov( X , W ) = cov( X ,12 X ) = V ( X ) = 5 ,

confirmando o resultado obtido anteriormente.

1.6. Estimador no tendencioso


Por definio, a um estimador no-tendencioso (no-viesado ou imparcial) do
parmetro da populao se
E (a ) =

10

importante lembrar que o estimador a uma varivel, isto , ele representa


uma dada frmula de clculo que fornecer valores que sero diferentes, conforme a
amostra selecionada.
Para exemplificar, consideremos, novamente, a populao infinita gerada pelo
lanamento do tetraedro regular em cujas faces esto marcados os valores 0, 2, 4 e 6.
J vimos que = E ( X ) = 3 e 2 = V ( X ) = 5
Lanando o tetraedro duas vezes, podemos obter amostras com n = 2 elementos
dessa populao. Na tabela 1.5 apresentamos as dezesseis amostras de tamanho n = 2,
que podem ser obtidas, e as respectivas estimativas dos parmetros e 2 . Os
estimadores so

X =

X i X1 + X 2
=
n
2

e
s2 =

( X i X ) 2
= (X1 X )2 + (X 2 X )2
n 1

Calculamos, tambm, as estimativas da varincia da mdia da amostra. Esta


varincia definida por

X2 = V ( X ) = E[ X E ( X )] 2
Temos

X + X 2 +K+ X n 1
V (X ) = V 1
= 2 V (X1 + X 2 +K+ X n )
n

n
Uma vez que as observaes de uma amostra aleatria de uma populao infinita
so independentes, segue-se que
V (X ) =

1
2
2

n
=
n
n2

O estimador da varincia mdia s

2
X

s2
=
n

Obviamente, cada uma das dezesseis amostras tem probabilidade 1/16 de ser
selecionada.

11

TABELA 1.5. Valores de X , s 2 , s X2 e ( X ) 2 para as 16 amostras que


podem ser obtidas lanando duas vezes o tetraedro.
Amostra
0e0
0e2
0e4
0e6
2e0
2e2
2e4
2e6
4e0
4e2
4e4
4e6
6e0
6e2
6e4
6e6

s2

s X2

0
1
2
3
1
2
3
4
2
3
4
5
3
4
5
6

0
2
8
18
2
0
2
8
8
2
0
2
18
8
2
0

0
1
4
9
1
0
1
4
4
1
0
1
9
4
1
0

(X )2
9
4
1
0
4
1
0
1
1
0
1
4
0
1
4
9

Verificamos que
E( X ) = 0

1
1
1
1
1 48
+ 1 + 2 + K + 5 + 6 =
=,
16
16
16
16
16 16

Ou seja, X um estimador no-tendencioso (no viesado, no-viciado ou imparcial) de

. Isto pode ser facilmente demonstrado:


X + X 2 +K+ X n
E ( X ) = E 1
=
n

n
1
[ E ( X 1 ) + E ( X 2 ) + K + E ( X n )] =
=
n
n

Verificamos, tambm, que


E(s 2 ) = 0

1
1
1
1
1 80
+ 2 8 +K+ 2 0 =
=5 = 2,
16
16 16
16 16 16

ou seja, s 2 um estimador no-tendencioso de 2 .


A varincia da mdia da amostra pode ser obtida atravs da expresso

12

V ( X ) = X2 =

2
n

5
2

ou diretamente, a partir da definio, utilizando os valores da ltima coluna da tabela


1.5, como segue:
V ( X ) = E[ X E ( X )] 2 = E ( X ) 2 = 9
+ 4

1
+
16

1
1 40 5
+K+ 9 =
=
16
16 16 2

Considerando os valores de s X2 apresentados na tabela 1.5, verificamos que


E ( s X2 ) = 0

1
1
1
1
1 40 5
+ 1 + 4 + K + 1 + 0 =
= ,
16
16
16
16
16 16 2

ou seja, s X2 um estimador no-tendencioso de X2 .


Devemos ressaltar que o exemplo apresentado refere-se a uma populao
infinita. As mesmas frmulas sero vlidas se, de uma populao finita, tirarmos
amostras com reposio dos elementos.
Consideremos, agora, o caso de uma populao finita (com m elementos) da
qual se tiram amostras (de n elementos) sem reposio.
A mdia da populao

= E( X ) =

1 m
Xi
m i =1

A varincia de X definida por (ver Cochran, 1965, p. 42)


V (X ) = S 2 =

1 m
( X i ) 2

m 1 i =1

Demonstra-se que (ver Cochran, 1965, p. 44)

V ( X ) = X2 =

S2 n
1
n m

Dada uma amostra (sem reposio) de n elementos, uma estimativa notendenciosa de dada por

13

X
X =

i =1

As estimativas no-tendenciosas de S 2 e X2 so dadas, respectivamente, por


n

(X
s2 =

i =1

X )2

n 1

s X2 =

s2 n
1
n m

Vejamos um exemplo numrico simples, embora artificial. Seja uma populao


de apenas 4 elementos (m = 4), onde X i assume os valores 0, 2, 4 e 6. Temos que

0+2+4+6
=3
4

( X i ) 2 (0 3) 2 + (1 3) 2 + ( 4 3) 2 + (6 3) 2 20
S =
=
=
m 1
3
3
2

4
Consideremos as = 6 diferentes amostras de 2 elementos (n = 2) que
2
podemos tirar dessa populao. Essas amostras esto discriminadas na tabela 1.6, com
os correspondentes valores de X , s 2 , s X2 e ( X ) 2 .
TABELA 1.6. Valores de X i , X , s 2 , s X2 e ( X ) 2 para as 6 possveis
amostras de 2 elementos (sem reposio).
Valores de X i

s2

s X2

0e2
0e4
0e6
2e4
2e6
4e6

1
2
3
3
4
5

2
8
18
2
8
2

1/2
2
9/2
1/2
2
1/2

( X )2
4
1
0
0
1
4

Para amostras com n = 2 elementos, temos

14

V (X ) =

S 2 n 20 2 5
=
1 =
1 =
n m 6 4 3

2
X

O mesmo resultado pode ser obtido a partir da definio de varincia, utilizando


os valores da ltima coluna da tabela 1.6. Como as 6 diferentes amostras so igualmente
provveis, temos

X2 = E ( X ) 2 =

4 + 1 + 0 + 0 + 1 + 4 10 5
=
=
6
6 3

Verificamos que:
E( X ) =

1
18
(1 + 2 + K + 5) =
= 3,
6
6

ou seja, E ( X ) =

E(s 2 ) =

1
40 20
,
( 2 + 8 + K + 2) =
=
6
6
3
ou seja, E ( s 2 ) = S 2

E ( s X2 ) =

11
1 1 20 5
=
+ 2 +K+ =
62
2 6 2 3
ou seja, E ( s X2 ) = X2

1.7. Estimador de varincia mnima


A no-tendenciosidade ou ausncia de vis uma qualidade desejvel para os
estimadores. Entretanto, essa qualidade insuficiente como critrio para selecionar um
estimador. Assim, por exemplo, no caso da mdia de uma populao, podemos verificar
que qualquer mdia ponderada dos valores de uma amostra um estimador no
tendencioso de .
Consideremos a mdia ponderada
n

m = i X i , com i = 1
i =1

15

Temos que
E ( m) = i E ( X i ) = i =
Isso mostra que qualquer mdia ponderada dos valores observados em uma
amostra aleatria um estimados no tendencioso de . Portanto, existem infinitos
estimadores no-tendenciosos de .
Dados dois estimadores no-tendenciosos de , a1 e a 2 , por definio a
eficincia relativa de a 2 , em comparao com a1 , igual a

V ( a1 )
V (a 2 )
Assim, por exemplo, dada uma amostra aleatria com 2 elementos, X 1 e X 2 , de
uma populao infinita, consideremos 2 estimadores no-tendenciosos da mdia da
populao:
a) a mdia aritmtica X =

X1 + X 2 1
1
= X1 + X 2 e
2
2
2

b) a mdia ponderada m =

1
3
X1 + X 2
4
4

Temos
V (X ) =

2
2

e
V (m) =

1 2 9 2 5 2
+ =
16
16
8

A eficincia de m em relao a X

1 2

4
2
= = 0,8 ou 80%
5 2 5

16

fcil provar que, dada uma amostra com 2 observaes ( X 1 e X 2 ) , dentre os


estimadores da classe

m = X 1 + (1 ) X 2 ,
o mais eficiente a mdia aritmtica, ou seja, o caso em que =

1
.
2

Temos

V ( m) = 2 2 + (1 ) 2 2 = (1 = 2 + 2 2 ) 2
Igualando a zero a derivada em relao a e simplificando, obtemos

2 + 4 = 0
Donde

1
2

A derivada segunda positiva, confirmando que a varincia mnima quando

1
.
2
Generalizando esse resultado, demonstraremos que, dada uma varivel aleatria

X de populao infinita com mdia e varincia 2 , a mdia aritmtica de uma


amostra aleatria de n observaes , dentre os estimadores lineares no-tendenciosos, o
estimador de varincia mnima.
Dizemos que um estimador linear quando ele uma combinao linear dos
valores da amostra. Como exemplo, consideremos o seguinte estimador linear de :
n

m = i X i
i =1

Temos que

E (m) = i

17

Para que m seja estimador no-tendencioso de , devemos ter


i = 1
Temos, tambm, que
V ( m) = 2 i2

Para minimizar V (m ) devemos minimizar i2 , considerando a restrio


i = 1 . Utilizando o mtodo do multiplicador de Lagrange, definimos a funo

= i2 ( i 1)
Igualando a zero as derivadas parciais em relao a i e , obtemos o sistema
de equaes
2 i = 0 ,

i = 1, 2, ..., n

(1.1)

i = 1

(1.2)

De (1.1), obtemos

i =

(1.3)

Substituindo (1.3) em (1.2), obtemos


n
=1
2
Donde

1
n

Comparando esse resultado com (1.3) conclumos que

i =

1
n

, c.q.d.

18

No h necessidade de verificar a condio de 2a ordem para mnimo por se


tratar de uma soma de quadrados.

1.8. Estimadores de mnimos quadrados

Pode parecer bvio que o estimador da mdia de uma varivel seja a mdia dos
valores observados em uma amostra. Mas em situaes um pouco mais complicadas
ser necessrio recorrer a um mtodo geral de determinao de estimadores, como o
mtodo dos mnimos quadrados ou o mtodo da mxima verossimilhana (que ser
descrito na prxima seo).
O mtodo dos mnimos quadrados consiste em adotar os estimadores que
minimizam a soma dos quadrados dos desvios entre valores estimados e valores
observados na amostra.
Mostraremos que a mdia aritmtica dos valores da amostra um estimador de
n

mnimos quadrados. Para tanto, determinemos o valor de a que minimiza

(X
i =1

a) 2 .

Derivando em relao a a e igualando a zero, obtemos:


2 ( X i a )( 1) = 0

X i na = 0
Donde

a=

Xi
= X , c.q.d.
n

interessante notar que o mtodo de mnimos quadrados conduz mdia


aritmtica, mas que existem outros critrios associados s demais medidas de tendncia
central. Assim, para minimizar o valor absoluto do maior desvio, devemos adotar o
ponto central entre os extremos (o ponto mdio entre o menor e o maior valor); para
maximizar o nmero de desvios iguais a zero devemos adotar a moda da amostra; e para
minimizar a soma dos valores absolutos dos desvios devemos adotar a mediana. Para
verificar essa ltima afirmativa, consideremos a distribuio de freqncias apresentada
na tabela 1.7.

19

TABELA 1.7. Distribuio de freqncias com 13 distribuies


X

Freqncia:

fcil verificar que a moda 1, a mediana 2, a mdia aritmtica 3 e o ponto


central entre os extremos 4.
A soma dos valores absolutos dos desvios em relao mediana 27 (7 para os
valores abaixo da mediana e 20 para os valores acima da mediana). Para mostrar que a
mediana o ponto que minimiza a soma dos valores absolutos dos desvios,
consideremos um ponto abaixo da mediana diferindo desta de menos de 1 unidade, isto
, o ponto de abcissa 2 , com 0 < < 1 . Para os 6 pontos abaixo da mediana, os
desvios ficam aumentados de ; para os 6 pontos localizados acima da mediana, os
desvios ficam aumentados de e para o ponto cuja abcissa igual mediana surge um
desvio igual a em valor absoluto. A soma dos valores absolutos dos desvios em
relao ao ponto de abcissa 2 , portanto,

7 6 + 20 + 6 + = 27 + > 27
Raciocnio semelhante mostra que a soma dos valores absolutos dos desvios em
relao a um ponto acima da mediana tambm maior do que 27. Conclumos, ento,
que essa soma mnima quando referida mediana.
Vejamos um exemplo onde o uso da mdia aritmtica, como medida de
tendncia central, parece ser mais razovel do que o uso da mediana, o que implica em
afirmar que o critrio de mnimos quadrados parece ser mais razovel do que a
minimizao da soma dos desvios absolutos. Consideremos uma amostra com 3
observaes, onde X 1 = X 2 = 0 e X 3 0 . A mediana igual a zero, qualquer que seja
o valor de X 3 , isto , o valor da mediana independe de X 3 . Entretanto, a mdia
aritmtica igual a

1
X3.
3

Para uma outra ilustrao da aplicao do mtodo de mnimos quadrados,


consideremos a determinao do estimador do parmetro p de uma distribuio
binomial, sabendo que numa amostra de n observaes foram constatados X casos
favorveis e n X casos contrrios. Como os valores esperados so de np casos

20

favorveis e n(1 p ) casos contrrios, queremos, de acordo com o mtodo de mnimos


quadrados, o valor de p que minimize
( X np ) 2 + [(n X ) n(1 p )] 2
Deixamos para o leitor verificar que a soluo
p =

X
n

1.9. Estimadores de mxima verossimilhana


De acordo com o mtodo da mxima verossimilhana adotamos, como
estimativas dos parmetros, os valores que maximizam a probabilidade (no caso da
varivel aleatria ser discreta) ou a densidade de probabilidade (no caso de varivel
contnua) de ser obtida a amostra observada. Para obter estimadores de mxima
verossimilhana necessrio conhecer ou pressupor qual a distribuio da varivel em
estudo.
Para exemplificar, consideremos que cada uma das faces de um tetraedro regular
so pintadas de branco ou de azul, e que, ao lanar o tetraedro, o resultado
considerado sucesso se a face que ficar em contato com a mesa for azul. Vamos supor
que o tetraedro foi lanado 4 vezes, sem que soubssemos se o nmero de faces azuis do
tetraedro era 0, 1, 2, 3 ou 4. Somos ento informados de que, nas 4 tentativas, foi obtido
sucesso apenas uma vez. Qual a estimativa de mxima verossimilhana para o nmero
de faces azuis no tetraedro utilizado?
Na tabela 1.8 apresentamos a probabilidade de obter apenas um sucesso em 4
tentativas, para cada um dos casos possveis.

21

TABELA 1.8. A funo de verossimilhana.

Probabilidade (p) de
obter sucesso em uma
tentativa
0

Probabilidade de obter
apenas um sucesso em 4
tentativas = 4p(1 p)3
0

1/4

27/64

1/2

1/4 = 16/64

3/4

3/64

Nmero de
faces azuis

A simples observao da tabela 1.8 mostra que o valor de p que maximiza a


probabilidade de obter um sucesso em 4 tentativas p = 1 / 4 . Ento, essa a estimativa
de mxima verossimilhana para a probabilidade de obter sucesso em um lanamento,
ou seja, o tetraedro utilizado deve ter apenas uma face azul.
Se p varia continuamente, a estimativa de mxima verossimilhana pode ser
obtida atravs das condies necessrias e suficientes do clculo diferencial. Desejamos
o valor de p que maximize
n
P( X ) = p X (1 p ) n X ,
X
onde X o nmero de sucessos obtidos em n tentativas.
Como o logaritmo uma funo monotnica crescente, o valor de p que
maximiza P(X) tambm maximiza
n
Z = ln P( X ) = ln + X ln p + (n X ) ln (1 p )
X
Igualando a zero a derivada em relao a p, obtemos
X n X

=0
p 1 p
cuja soluo p =

X
, que o estimador j obtido na seo anterior pelo mtodo de
n

mnimos quadrados.
Como

22

d 2Z
X
n X
= 2
< 0,
2
dp
p
(1 p ) 2
a condio de segunda ordem para mximo satisfeita.
Como mais um exemplo, consideremos a determinao dos estimadores de
mxima verossimilhana da mdia ( ) e da varincia ( 2 ) de uma varivel aleatria
(X), com distribuio normal, com base em uma amostra aleatria de n elementos.
Neste caso, a densidade de probabilidade de obter um valor X i na amostra
1

f (X i ) =

2 2

(X i )2
exp

2 2

Como as observaes so independentes, a densidade de probabilidade de obter


os valores X 1 , X 2 , K , X n da amostra
L( X 1 , X 2 , K , X n ; , 2 ) = f ( X 1 ) f ( X 2 ) K f ( X n ) =
n

=
i =1

1
2 2

= (2 )
2

n
2

( X ) 2
exp i 2 =
2

( X i ) 2
exp

2 2

Essa a funo de verossimilhana da amostra. usual representa-la por L


porque a palavra inglesa para verossimilhana likelihood.
Os estimadores de mxima verossimilhana de e 2 so os valores que
maximizam o valor de L ( , 2 | X 1 , X 2 , K , X n ) . Como o logaritmo uma funo
monotnica crescente, os valores de e 2 que maximizam L tambm maximizam

( X i ) 2
n
n
ln L = ln 2 ln 2
2
2
2 2
Igualando a zero as derivadas parciais em relao a e 2 obtemos o sistema de
equaes

23

2 ( X i )
=0

2 2

2
n + ( X i ) = 0
2 4
2 2

(1.4)
(1.5)

De (1.4) obtemos

Xi
=X
n

(1.6)

J vimos que X um estimador de mnimos quadrados, no-tendencioso e de


varincia mnima. Sabemos agora que, se X tem distribuio normal, X , tambm, um
estimador de mxima verossimilhana.
De (1.5) e (1.6) obtemos

(X i X )
n

2 =

interessante notar que o estimador de mxima verossimilhana da varincia


tendencioso, uma vez que o estimador no-tendencioso

(X i X )
s =
n 1

1.10. Propriedades assintticas dos estimadores


Seja a n o estimador de um parmetro , obtido com base em uma amostra com
n observaes. Em geral a n uma varivel aleatria cuja distribuio caracterizada
pela

funo

de

densidade

f (a n ) ,

com

mdia

E (a n )

varincia

V ( a n ) = E[a n E ( a n )] 2 . Variando o tamanho da amostra, temos vrias seqncias:

a) a seqncia dos estimadores:


{a n } = a1 , a 2 , K , a n , K

(1.7)

b) a seqncia das mdias:


{E (a n )} = E (a1 ), E (a 2 ), K , E (a n ), K

(1.8)
24

c) a seqncia das varincias:


{V (a n )} = V (a1 ), V (a 2 ), K , V (a n ), K

(1.9)

d) a seqncia das funes de densidade:


{ f (an )} = f (a1 ), f (a2 ), K , f (an ), K

(1.10)

A teoria assinttica dos estimadores se destina a estabelecer o comportamento


dessas seqncias quando n tende para infinito.
Denominamos esperana assinttica de a n ao valor do lim E (a n ) . Se
n

lim E ( a n ) = , dizemos que a n um estimador assintoticamente no-tendencioso.

Poderamos pensar em definir a varincia assinttica de a n como lim V (a n ) .


n

Entretanto, esse limite freqentemente igual a zero, porque a distribuio de a n se


concentra em um nico ponto. Para exemplificar, consideremos a mdia ( X ) de uma
amostra aleatria com n observaes da varivel X, de mdia e varincia 2 . De
V ( X ) = 2 / n segue-se que
lim V ( X ) = 0

Pode-se demonstrar que, quando n cresce, a distribuio da mediana (m) da


amostra se concentra em torno de e o limite de sua varincia tambm zero, isto ,
lim V ( m) = 0

Para verificar qual de dois estimadores assintoticamente mais eficiente,


poderamos pensar em comparar os limites das varincias desses estimadores, quando n
tende para infinito. Entretanto, se esses limites so iguais a zero a eficincia relativa no
definida.
O problema resolvido definindo varincia assinttica como

n 1 lim E n [a n E (a n )]
n

(1.11)

Para o estimador X temos

25

V ( X ) = E( X ) 2 =

2
n

Ento
E[ n ( X )] 2 = 2

e a varincia assinttica de X

lim E[ n ( X )] =
2

2
n

Pode-se demonstrar que, se X tem distribuio normal, a varincia assinttica da


mediana (m) da amostra
n 1 lim E[ n (m )] 2 =
n

2
2n

Como ( / 2) > 1 , conclumos que a mdia ( X ) um estimador de


assintoticamente mais eficiente do que a mediana (m).
Ao analisar a seqncia (1.7) importante ter em mente que, fixado o valor de n,
a n uma varivel aleatria. Por isso no tem sentido falar no limite de a n quando n
tende a infinito. necessrio, ento, introduzir o conceito de convergncia em
probabilidade.
Dizemos que uma seqncia de variveis aleatrias {a n } = a1 , a 2 , K , a n , K
converge em probabilidade para uma constante se, para qualquer > 0 ,
arbitrariamente pequeno,
lim P (| a n |> ) = 0 ,

(1.12)

indicando-se
p

an

ou
plim a n = ,
que se l: o limite em probabilidade de a n igual a .
26

Dada uma amostra de n observaes, a n um estimador consistente

do

parmetro da populao se plim a n = .


Antes de prosseguir vamos analisar melhor esse conceito. A expresso (1.12)
pode ser escrita
lim P( < a n < + ) = 1

(1.13)

Na figura 1.3 representamos a distribuio de a n para n = 10 e n = 100 e


assinalamos, por meio de traos verticais, os limites e + . De acordo com
(1.13), para que a n seja um estimador consistente de , a probabilidade de termos

< a n < + deve tender para um quando n tende para infinito. Em outras
palavras, dados e , positivos e arbitrariamente pequenos, deve existir n o tal que para
todo n > n o temos
P( < a n < + ) > 1
Em termos da figura 1.3, medida que n cresce, a distribuio de a n deve se
concentrar em torno de , de maneira que quase toda a distribuio fique compreendida
entre os limites e + .

Figura 1.3. O conceito de estimador consistente

27

Prosseguindo no estudo das propriedades assintticas dos estimadores, vejamos


o conceito de convergncia em mdia quadrtica. Dizemos que uma srie de variveis
aleatrias {a n } = a1 , a 2 , K , a n , K converge em mdia quadrtica para uma constante
se

lim E (a n ) 2 = 0
n

(1.14)

Demonstraremos adiante que a convergncia em mdia quadrtica condio


suficiente para que tenhamos convergncia em probabilidade. Para isso vamos deduzir,
preliminarmente, a desigualdade de Chebyshev.
Consideremos uma varivel aleatria Z 0 , com mdia finita, e um nmero real

> 0 . Definimos a varivel aleatria Y da seguinte maneira:


Y = 0 , se Z <
e

Y = , se Z
Ento,
P (Y = 0) = P ( Z < )

e
P (Y = ) = P ( Z )

Segue-se que
E (Y ) = 0 P (Y = 0) + P (Y = ) = P ( Z )

(1.15)

Da definio de Y, segue-se que


Y Z

Ento,
E (Y ) E ( Z )

Considerando (1.15) temos:


28

P( Z ) E ( Z )
ou

P( Z )

E (Z )

(1.16)

Consideremos agora a varivel aleatria X, com mdia e varincia 2 .


Aplicando a relao (1.16) varivel aleatria ( X ) 2 0 e ao nmero k 2 , obtemos
P[( X ) 2 k 2 ]

E( X ) 2 2
= 2
k2
k

(1.17)

Donde, com k > 0,


P (| X | k )

2
k2

que a desigualdade de Chebyshev.


Demonstremos agora que a convergncia em mdia quadrtica condio
suficiente para que tenhamos convergncia em probabilidade. Aplicando a relao
(1.16) varivel ( a n ) 2 e ao nmero 2 , obtemos

P[(a n ) 2 2 ]

E (a n ) 2

Ento

lim P[(a n ) ] lim


2

E (a n ) 2

Se a n converge em mdia quadrtica para , temos

lim E (a n ) 2 = 0

Segue-se que

29

lim P[(a n ) 2 2 ] = 0
n

Lembrando que para uma varivel aleatria contnua a probabilidade de se


observar um determinado valor nula, podemos escrever

lim P[(a n ) 2 > 2 ] = 0

ou
lim P (| a n |) > ] = 0

isto ,
plim a n =
Demonstremos, tambm, que
E (a n ) 2 = V (a n ) + [ E (a n ) ] 2

(1.18)

Temos
E (a n ) 2 = E{[ a n E (a n )] + [ E (a n ) ]}2 =
= E{[a n E (a n )] 2 + [ E (a n ) ] 2 + 2[a n E (a n )] [ E (a n ) ]} =
= V (a n ) + [ E (a n ) ] 2 ,

c.q.d.

Vamos resumir as definies e resultados obtidos at esse ponto.


Para que o estimador a n , baseado numa amostra de n observaes, seja um
estimador consistente de , isto , para que
plim a n = ,
suficiente que

lim E (a n ) 2 = 0

Para que isso acontea, por sua vez, suficiente, de acordo com (1.18), que
lim V ( a n ) = 0

30

e
E (a n ) =
ou
lim[ E ( a n )] =

Conclumos ento que um estimador no-tendencioso ou assintoticamente notendencioso consistente se o limite da sua varincia, quando o tamanho da amostra
tende para infinito, igual a zero.
Vejamos um exemplo. Sabemos que X um estimador no-tendencioso de e
que V ( X ) =

2
n

Como

lim V ( X ) = 0 ,

conclumos que plim X = , isto , X um estimador consistente de .


Vimos que os estimadores devem ser no-tendenciosos e eficientes. desejvel,
tambm, que sejam consistentes e assintoticamente eficientes, isto , que apresentem
varincia assinttica mnima. A no-tendenciosidade e a eficincia so denominadas
propriedades de amostra pequena, porque sua validade no depende do tamanho da
amostra, isto , quando um estimador apresenta tais propriedades, elas so igualmente
vlidas para amostras grandes e para amostras pequenas. Por outro lado, as propriedades
definidas em termos de limites, quando o tamanho (n) da amostra tende para infinito,
so denominadas propriedades de amostra grande ou propriedades assintticas.
A seguir so apresentadas, sem demonstrao, algumas propriedades da
convergncia em probabilidade.
Se plim a = e F (a) uma funo contnua de a, ento plim F ( a ) = F ( ) .
Em particular, temos plim (a 2 ) = (plim a ) 2 e plim (a 1 ) = (plim a ) 1 . O teorema se
estende ao caso de uma funo contnua de duas ou mais variveis, isto , se
plim a = ,

plim b =

F ( a , b)

uma

funo

contnua,

temos

31

plim F ( a, b) = F ( , ) .

Temos,

por

exemplo,

plim ( a + b) = plim a + plim b ,

plim ( ab ) = ( plim a ) ( plim b) e, se plim b 0 , plim ( a / b) = ( plim a ) /( plim b) .

Essas propriedades facilitam a determinao do valor para o qual converge em


probabilidade uma funo de estimadores. Note que, conhecida a esperana matemtica
de vrias variveis, no geralmente to imediata a determinao da esperana
matemtica de expresses envolvendo tais variveis. Dado que E (a ) = e E (b) = ,
sabemos que E ( a + b) = + , mas nada podemos dizer, de imediato, sobre o valor de
E (a 2 ) , E (ab ) ou E ( a / b) .
Para introduzir a idia de convergncia em distribuio, vamos considerar,
novamente, a distribuio da mdia ( X ) de uma amostra aleatria com n observaes,
com E ( X ) = e V ( X ) = 2 , mas sem que se conhea a forma da distribuio de X. J
vimos que V ( X ) tende a zero quando n cresce. Dizemos que, no limite, a distribuio
de X degenera, concentrando-se em um ponto. Ento conveniente analisar o que
ocorre com a distribuio de

n X . O teorema do limite central estabelece que, em

condies bastante gerais, no limite, quando n tende a infinito, a distribuio de

nX

n e varincia 2 . Esse um exemplo de

uma distribuio normal com mdia

convergncia em distribuio, indicando-se


d

n X N ( n, 2 )
Dizemos, ento, que a distribuio assinttica de X uma distribuio normal
com mdia e varincia 2 n .

1.11. O limite inferior de Cramr-Rao e as propriedades assintticas dos


estimadores de mxima verossimilhana
Consideremos uma amostra aleatria de n observaes ( X 1 , X 2 , K , X n ) de uma
varivel cuja distribuio caracterizada por um parmetro cujo valor
desconhecido. Se f ( X ) uma funo de densidade de II, a funo de verossimilhana
dessa amostra

32

L( X 1 , X 2 , K , X n ; ) = f ( X i )
i =1

Seja a um estimador no-tendencioso de . Se a funo de densidade f(X)


obedecer a certas condies de regularidade relativas integrao e diferenciao e se
existe a varincia de a, ento pode-se demonstrar que2

V (a)

1
d ln L

E
2

d ln L
E

(1.19)

O valor do 2o membro dessa desigualdade denominado limite inferior de


Cramr-Rao. A desigualdade (1.19) estabelece que no existe estimador notendencioso cuja varincia seja menor do que o limite inferior de Cramr-Rao.
Para exemplificar, consideremos uma varivel X com distribuio normal de
mdia , desconhecida, e varincia igual a um. Dada uma amostra aleatria com n
observaes ( X 1 , X 2 , K , X n ) , a funo de verossimilhana
n

L( X 1 , X 2 , K , X n ; ) = (2 )
i =1

= (2 )

n
2

1
2

exp ( X i ) 2 =
2

exp ( X i ) 2
2

Ento
n
1
ln L = ln 2 ( X i ) 2
2
2
Segue-se que
d ln L
= ( X i )
d
e

A demonstrao pode ser encontrada em Theil (1971), p. 384-387.

33

d 2 ln L
= n
d 2
De acordo com (1.19), obtemos
V ( m)

1
n

onde m qualquer estimador no-tendencioso de . Sabemos que, com 2 = 1 , a


varincia de X igual a 1/n, isto , a mdia aritmtica dos valores da amostra um
estimador com varincia igual ao limite inferior de Cramr-Rao.
Convm ressaltar que h casos nos quais o limite inferior de Cramr-Rao no
atingido, isto , h casos onde no existe estimador no-tendencioso com varincia igual
ao limite inferior de Cramr-Rao.
Entretanto, existe um teorema que afirma, em condies bastante gerais, que, se

o estimador de mxima verossimilhana de ento apresenta distribuio


assintoticamente normal com mdia e varincia igual ao limite inferior de CramrRao, isto , os estimadores de mxima verossimilhana so consistentes e
assintoticamente eficientes.3

1.12. Teste de hipteses


Dada uma hiptese de nulidade ( H o ) , define-se como erro tipo I o erro que
consiste em rejeitar H o , dado que H o verdadeira. Define-se como erro tipo II o erro
que consiste em no rejeitar H o , dado que H o falsa.
A

hiptese da nulidade,

quando

dada em

termos

quantitativos,

necessariamente, uma igualdade.


Usa-se a letra grega para indicar a probabilidade de cometer erro tipo I, que
o nvel de significncia do teste, e a letra grega para indicar a probabilidade de
cometer erro tipo II.
Podemos definir ainda o poder do teste, que a probabilidade de rejeitar H o ,
dado que H o falsa.

A demonstrao deste teorema pode ser encontrada em Theil (1971), p. 392-395.

34

Evidentemente, o poder do teste igual a 1 .


Para exemplificar, consideremos 2 tetraedros regulares, feitos de material
homogneo, sendo que um deles tem uma face azul e 3 brancas e o outro tem 2 faces
azuis e 2 brancas. Quando esses tetraedros so lanados, o resultado considerado
sucesso se a face em contato com a mesa for azul. Ento, a probabilidade de obter
sucesso em um lanamento , para o primeiro tetraedro, p = 1/4 e, para o segundo
tetraedro, p = 1/2.
O nmero (X) de sucessos, obtidos em n lanamentos de um desses tetraedros
uma varivel aleatria discreta com distribuio binomial. A tabela 1.9 apresenta a
distribuio de X para cada um dos dois tetraedros, no caso de n = 2 lanamentos.
TABELA 1.9. Distribuio do nmero de sucessos obtidos em dois lanamentos, para cada um dos dois tetraedros
P(X)

X
para p = 1/4

para p = 1/2

9/16

1/4

6/16

2/4

1/16

1/4

Consideremos a seguinte situao: suponhamos que um dos tetraedros (no


sabemos qual) foi lanado duas vezes e que fomos informados sobre o nmero (X) de
sucessos (X pode assumir os valores 0, 1 ou 2); com base nessa informao, devemos
decidir qual dos dois tetraedros foi utilizado, ou seja, devemos decidir entre
H o : p = 1/ 4 e H A : p = 1/ 2
Para a soluo deste problema, devemos proceder a um teste de hipteses. Ento,
antes de conhecer o valor assumido por X, devemos estabelecer a regra de deciso a ser
adotada, isto , devemos estabelecer para que valores de X devemos rejeitar H o . Para
este problema podemos estabelecer qualquer uma das quatro regras de deciso que
constam na tabela 1.10. Nesta tabela tambm so dados os valores de e , relativos a
cada regra de deciso, e a relao , isto , a razo entre o incremento em e o
incremento em , quando se passa de uma regra de deciso para a seguinte.

35

TABELA 1.10. Valores de e relativos s possveis regras de deciso e relao

Rejeitar H o se X = 2

1/16 = 0,0625

3/4 = 0,75

Rejeitar H o se X 1

7/16 = 0,4375

1/4 = 0,25

Regra de deciso
Nunca rejeitar H o

Sempre rejeitar H o

4/3
4/9

Indiquemos por = ( ) a relao funcional decrescente que existe entre e .


A figura 1.4 mostra essa relao para o problema descrito. Neste exemplo, a funo

= ( ) descontnua porque o teste de hiptese baseado em uma varivel aleatria


discreta. Se o teste de hiptese for baseado em uma varivel aleatria contnua, a funo

= ( ) tambm ser contnua.


Como escolher a regra de deciso, ou seja, como escolher o nvel de
significncia do teste? Isso implica escolher o ponto timo sobre a funo = ( ) .
Admitamos que a probabilidade a priori de H o ser verdadeira seja (Essa
probabilidade deve ser determinada com base em outras informaes que no as que
esto sendo utilizadas para fazer o teste). Ento, podemos obter, como constam na
tabela 1.11, os valores da receita lquida U (num contexto mais geral, os valores U
seriam os nveis de utilidade) associados a cada uma das 4 situaes possveis (quando a
hiptese alternativa simples), e as respectivas probabilidades.

Figura 1.4. Relao entre e


36

TABELA 1.11. A tabela de resultados


Deciso tomada

Situao real
H o verdadeira
(probab. = )
H o falsa
(probab. = 1 )

no rejeitar H o

rejeitar H o

U 11

U 12

p11 = (1 )

p12 =

U 21

U 22

p 21 = (1 )

p 22 = (1 )(1 )

Se todas essas informaes estivessem disponveis, poderamos escolher o nvel


de significncia que maximiza a receita lquida esperada, dada por

L = E (U ) = (1 )U 11 + U 12 + (1 ) U 21 + (1 )(1 )U 22

(1.20)

Essa relao pode ser escrita

U 11 + (1 )U 22 L
(U 11 U 12 )

(1 )(U 22 U 21 )
(1 )(U 22 (U 21 )

(1.21)

A diferena U 11 U 12 = C I > 0 representa o custo de cometer erro tipo I e a


diferena U 22 U 21 = C II > 0 representa o custo de cometer erro tipo II.
Dados os valores de , U 11 , U 12 , U 21 , U 22 , a relao (1.21) corresponde a um
feixe de retas paralelas num sistema de eixos cartesianos com coordenadas e . O
coeficiente angular sempre igual a

C I
(1 )C II

(1.22)

e o coeficiente linear tanto menor quanto maior for o valor de L = E (U ) . Para


maximizar L = E (U ) devemos determinar o ponto de = ( ) que pertena a uma
reta com declividade dada por (1.22) e coeficiente linear mnimo.
Para exemplificar, consideremos a relao = ( ) representada na figura 1.4 e
admitamos que = 0,5 . Neste caso, temos:

37

a) se 4 <

b) se

CI
< , o ponto timo A, isto , nunca devemos rejeitar H o .
C II

CI
= 4 , indiferente utilizar a regra de deciso correspondente ao ponto
C II

A ou ao ponto B.
c) se

4 CI
<
< 4 , o ponto timo B, isto , devemos rejeitar H o se X = 2,
3 C II

fazendo um teste com nvel de significncia = 0,0625 .


d) se

CI 4
= , indiferente utilizar a regra de deciso correspondente ao ponto
C II 3

B ou ao ponto C.
e) se

4 CI 4
<
< , o ponto timo C, isto , devemos rejeitar H o se X 1,
9 C II 3

fazendo um teste com nvel de significncia = 0,4375 .


f) se

CI 4
= , indiferente utilizar a regra de deciso correspondente ao ponto
C II 9

C ou ao ponto D, e
g) se 0 <

CI 4
< , o ponto timo D, isto , devemos rejeitar H o sempre,
C II 9

qualquer que seja o valor observado de X.


Se a funo = ( ) for contnua, o ponto que maximiza a receita lquida pode
ser determinado igualando a zero a derivada de L em relao a .
De (1.20) obtemos

d
dL
= (U 11 U 12 ) (1 )(U 22 U 21 )
=
d
d
= C I (1 )C II

Segue-se que

d
d

(1.23)

dL
= 0 implica
d

C I
d
=
d
(1 )C II

(1.24)

38

O ponto de = ( ) que satisfaz essa condio corresponde a um mximo de


L = E (U ) se

d 2L
<0
d 2
De (1.23) obtemos

d 2L
d 2

C
(
1
)
,
II
d 2
d 2

mostrando que a condio de segunda ordem para mximo satisfeita se

d 2
> 0 , isto
d 2

, se a funo = ( ) for convexa em relao origem.


Sendo = ( ) uma funo decrescente e convexa em relao origem, o nvel
de significncia timo estabelecido atravs de (1.24) ser tanto menor quanto maior for

(a probabilidade a priori de H o ser verdadeira) e quanto maior for a relao

CI
(o
C II

custo de cometer erro tipo I em comparao com o custo de cometer erro tipo II).
Em problemas prticos geralmente impossvel determinar o nvel de
significncia timo da maneira indicada, porque no se tem nem a probabilidade ( ) de

H o ser verdadeira a priori, nem o valor exato da relao

CI
. Alm disso, a hiptese
C II

alternativa , geralmente, composta; a determinao rigorosa de um nvel de


significncia timo exigiria, neste caso, o conhecimento da distribuio a priori dos
valores possveis para a hiptese alternativa, com os respectivos valores do custo de
cometer erro tipo II.
Por isso, a escolha do nvel de significncia tem muito de arbitrrio.
A finalidade da discusso feita deixar claro o sentido em que deve ser ajustado
o nvel de significncia conforme mudem a probabilidade a priori de H o ser verdadeira
e a relao entre os custos de cometer erro tipo I e erro tipo II.
usual que a hiptese alternativa no se refira a um valor especfico. comum,
por exemplo, testar se um parmetro igual a zero ( H 0 : = 0) contra a hiptese
alternativa de que diferente de zero ( H A : 0) . Neste caso pode-se fixar o nvel de

39

significncia do teste (), mas o poder do teste (1 ) no um valor nico. Pode-se


construir a curva de poder do teste, que mostra como esse varia em funo de valores
alternativos do parmetro. claro que o poder do teste se aproxima do nvel de
significncia quando o valor alternativo do parmetro se aproxima do valor estabelecido
pela hiptese da nulidade, fazendo com que, fixado um baixo nvel de significncia, o
poder do teste seja baixo para tais valores alternativos do parmetro. Note-se como,
nestas condies, no h simetria entre as decises de rejeitar e aceitar a hiptese da
nulidade. Ao rejeitar a hiptese da nulidade estaremos tomando uma deciso de maneira
que a probabilidade de estar cometendo erro (tipo I) conhecida e pequena. Mas se o
resultado do teste no-significativo e aceitamos a hiptese da nulidade, a
probabilidade de cometer erro tipo II desconhecida e tende a ser elevada para valores
do parmetro prximos ao estabelecido pela hiptese da nulidade. A linguagem usada
na interpretao do resultado de um teste de hipteses deve refletir essa assimetria. Se,
ao testar ( H 0 : = 0) contra ( H A : 0) , o resultado do teste significativo,
rejeitamos a hiptese da nulidade. Se o resultado for no-significativo, a concluso
que os dados da amostra utilizada no permitem rejeitar a hiptese da nulidade. Note-se
a natureza provisria da concluso. A afirmativa de que aceita-se H o no reflete
adequadamente a indeterminao da probabilidade de cometer erro tipo II quando a
hiptese alternativa composta (no estabelece um nico valor alternativo para o
parmetro).

Exerccios

1.1. Seja X o resultado obtido no lanamento de um dado (hexaedro regular) nochumbado. Seja Y a soma dos resultados obtidos em 100 lanamentos desse dado.
Determine E(X), V(X), E(Y) e V(Y).

40

1.2. Com base na distribuio conjunta de


X e Y, apresentada na tabela ao lado,

Valores de

para a distribuio

conjunta das variveis

determine a E(X), a E(Y), a V(X), a


V(Y) e a cov (X, Y). As variveis X e Y

4
8

so independentes?

1
0,3
0

2
0
0,4

3
0,3
0

1.3. A tabela ao lado mostra a distribuio


Valores de

conjunta de X e Y.
a) Essas

variveis

independentes?

so

(Justifique

conjunta das variveis

sua

resposta).

4
5
6

b) Determine E(X) e E(Y).

para a distribuio

2
0,2
0,1
0

e
4
0,1
0,2
0,1

.
6
0
0,1
0,2

c) Determine V(X) e V(Y).


d) Determine

cov

(X,

Y)

correlao () entre as duas


variveis.
1.4. Temos duas urnas, aparentemente idnticas, com 63 bolas no interior de cada uma.
Essas bolas so marcadas com nmeros (X) de zero a 5. Na urna A h 2 X bolas
com o nmero X, isto , h uma bola com o no 0, duas bolas com o no 1, 4 bolas
com o no 2, e assim por diante, at 32 bolas com o no 5. Na urna B h 2 5 X bolas
com o nmero X, isto , h 32 bolas com o no 0, 16 bolas com o no 1, 8 bolas com
o no 2, e assim por diante, at uma bola com o no 5. Uma dessas urnas, escolhida
ao acaso, entregue a um estatstico, que deve decidir se a urna A ou se a urna
B, retirando, ao acaso, uma nica bola da urna. Ele especifica a hiptese da
nulidade como
H 0 : trata-se da urna A
e a hiptese alternativa como

H A : trata-se da urna B
O estatstico decide, tambm; que a regra de deciso ser rejeitar H 0 (em favor
de H A ) se a bola retirada da urna apresentar nmero menor do que 3.
Determine: (a) o nvel de significncia do teste; (b) a probabilidade () de
cometer erro tipo II; (c) o poder do teste.

41

Refaa o problema considerando, agora, que a regra de deciso rejeitar H 0 se


o nmero (X) marcado na bola retirada for menor ou igual a 1.
1.5. Temos duas urnas, aparentemente idnticas, com 55 bolas no interior de cada uma.
Na urna A h uma bola com o no 0, duas bolas com o no 1, 3 bolas com o no 2, e
assim por diante, at 10 bolas com o no 9. Na urna B h 1 bola com o no 9, 2 bolas
com o no 8, 3 bolas com o no 7, e assim por diante, at 10 bolas com o no 0. Uma
dessas urnas, escolhida ao acaso, entregue a um estatstico, que deve decidir se
a urna A ou se a urna B examinando uma nica bola retirada da urna, ao acaso.
Ele especifica a hiptese da nulidade como
H 0 : trata-se da urna A
e a hiptese alternativa como

H A : trata-se da urna B
O estatstico adota a seguinte regra de deciso: rejeitar H 0 (em favor de H A ) se
a bola retirada da urna apresentar nmero menor do que 5. Determine:
a) o nvel de significncia do teste
b) a probabilidade () de cometer erro tipo II
c) o poder do teste.
Refaa o problema considerando, agora, que a regra de deciso rejeitar H 0 se
o nmero marcado na bola retirada for menor ou igual a 3.
1.6. Temos dois tetraedros regulares de material homogneo. Um deles tem uma face
azul e trs faces brancas. O outro tem trs faces azuis e uma branca. Uma pessoa
pega, ao acaso, um desses tetraedros e o lana n vezes. Seja X o nmero de vezes
em que o resultado foi face azul. Com base no valor de X devemos testar a
hiptese
H 0 : foi utilizado o tetraedro com uma face azul
contra a hiptese alternativa

H A : foi utilizado o tetraedro com trs faces azuis


Seja o nvel de significncia do teste e seja a probabilidade de cometer erro
tipo II.

42

a) Considerando as diferentes regras de deciso, faa uma tabela e um grfico


mostrando como varia em funo de para n = 3.
b) Qual o nvel de significncia para um teste com n = 5, mantendo = ?
Respostas
1.1. E ( X ) = 3,5 , V ( X ) =

17,5
1750
= 2,9167 , E(Y) = 350 e V (Y ) =
= 291,67
6
6

1.2. E(X) = 2, E(Y) = 5,6 , V(X) = 0,6 , V(Y) = 3,84, cov (X, Y) = 0. As variveis X e
Y no so independentes.
1.3. a) No

b) E(X) = 4 e E(Y) = 5

b) V(X) = 2,4 e V(Y) = 0,6

c) cov (X, Y) = 0,8 e = 0,667.


1.4. Para a regra de deciso Rejeitar H 0 se X < 3 obtemos = 7/63 = 1/9 = 0,111,

= 1/9 = 0,111 e 1 = 8/9 = 0,889


Para a regra de deciso Rejeitar H 0 se X 1 obtemos = 3/63 = 1/21 = 0,0476,

= 15/63 = 5/21 = 0,238 e 1 = 16/21 = 0,762.


1.5. Rejeitar H 0 se nmero < 5: = 3/11, = 3/11 e 1 = 8/11.
Rejeitar H 0 se nmero 3: = 2/11, = 21/55 e 1 = 34/55.
1.6.
a) Regra de deciso:
rejeitar H 0 : p = 1 / 4 se

X1

37/64

1/64

X2

10/64

10/64

X3

1/64

37/64

X 0 (sempre)

X > 3 (nunca)
b) = =

53
= 0,1035
512

43

2. REGRESSO LINEAR SIMPLES


2.1. O modelo estatstico de uma regresso linear simples
Dados n pares de valores de duas variveis, X i , Yi (com i = 1, 2, ..., n), se
admitirmos que Y funo linear de X, podemos estabelecer uma regresso linear
simples, cujo modelo estatstico
Yi = + X i + u i ,
onde e so parmetros, X a varivel explanatria e Y a varivel dependente.
O coeficiente angular da reta () tambm denominado coeficiente de regresso
e o coeficiente linear da reta () tambm conhecido como termo constante da equao
de regresso.
A anlise de regresso tambm pode ser aplicada s relaes no-lineares.
Inicialmente, estudaremos apenas o caso da reta. Veremos adiante o caso das relaes
no-lineares.
Ao estabelecer o modelo de regresso linear simples, pressupomos que:
I)

A relao entre X e Y linear.

II)

Os valores de X so fixos, isto , X no uma varivel aleatria.

III)

A mdia do erro nula, isto , E (u i ) = 0 .

IV)

Para um dado valor de X, a varincia do erro u sempre 2 ,


denominada varincia residual, isto ,
E (u i2 ) = 2

ou
E[Yi E (Yi | X i )] 2 = 2

Dizemos, ento, que o erro homocedstico ou que temos homocedasticia (do


erro ou da varivel dependente).
V)

O erro de uma observao no-correlacionado com o erro em outra


observao, isto , E (u i u j ) = 0 para i j.

44

VI)

Os erros tm distribuio normal.

Combinando as pressuposies III, IV e VI, temos que


ui ~ N (0, 2 )

Devemos, ainda, verificar se o nmero de observaes disponveis maior do


que o nmero de parmetros da equao de regresso. Para ajustar uma regresso linear
simples precisamos ter, no mnimo, 3 observaes. Se s dispomos de 2 observaes (2
pontos), a determinao da reta um problema de geometria analtica; no possvel,
neste caso, fazer nenhuma anlise estatstica.
Veremos adiante que as pressuposies I, II e III so necessrias para que se
possa demonstrar que as estimativas dos parmetros obtidas pelo mtodo dos mnimos
quadrados so no-tendenciosas ou imparciais, isto , que
E (a ) =

e
E (b) =

onde a e b so as estimativas de mnimos quadrados de e , respectivamente.


Veremos tambm que, com base nas cinco primeiras pressuposies, possvel
demonstrar que as estimativas dos parmetros obtidas pelo mtodo dos mnimos
quadrados so estimativas lineares no-tendenciosas de varincia mnima.
interessante assinalar que a pressuposio II no , na verdade, essencial.
Veremos, no fim deste captulo, que em certas condies, se X for uma varivel
aleatria, os resultados obtidos pressupondo que os valores de X so fixos continuam
vlidos. Entretanto, tendo em vista a simplicidade das demonstraes de vrios
teoremas, essa pressuposio ser adotada durante a maioria das sees do captulo.
Devemos observar que, se os pares de valores X i , Yi (com i = 1, 2, ..., n) foram obtidos
experimentalmente e X uma varivel controlada (fixada) pelo pesquisador, a
pressuposio II vlida.
A pressuposio III exclui, por exemplo, a existncia de erros sistemticos de
medida da varivel Y.

45

Quando no razovel supor que os erros so homocedsticos (pressuposio


IV), isto , quando existe heterocedasticia, devemos utilizar o mtodo dos mnimos
quadrados ponderados, que ser examinado no captulo 6.
Na figura 2.1 est representado o modelo estatstico de uma regresso linear
simples, considerando as pressuposies de I a IV. As pressuposies I, II e III
permitem escrever
E (Yi ) = + X i ,
ou seja, as mdias das distribuies de Y | X

esto sobre a reta + X .

pressuposio IV corresponde, na figura 2.1, o fato de as distribuies de Y para


diferentes valores de X apresentarem todas a mesma disperso.

Figura 2.1. Representao do modelo estatstico de uma regresso linear simples.

Se os pares de valores X i , Yi foram obtidos atravs de amostragem aleatria de


uma populao infinita, fica garantida a independncia entre observaes. Se, alm
disso, a esperana do erro igual a zero, temos, com i j,
E (u i u j ) = E (u i ) E (u j ) = 0

Entretanto, a pressuposio V geralmente no obedecida quando trabalhamos


com sries cronolgicas de dados. Dizemos, ento, que h autocorrelao nos resduos.
Temos autocorrelao positiva se

E (u i u i +1 ) > 0

e autocorrelao negativa se

E (u i u i +1 ) < 0 . No captulo 7 veremos os mtodos que podem ser utilizados quando h


autocorrelao nos resduos.

46

A pressuposio VI necessria para que possamos utilizar as distribuies de t


e de F para testar hipteses a respeito dos valores dos parmetros ou construir intervalos
de confiana. Em alguns casos, possvel justificar essa pressuposio com base no
teorema do limite central. Esse teorema, na sua verso mais geral, estabelece que a
soma de um grande nmero de variveis aleatrias independentes tem distribuio
aproximadamente normal, desde que nenhuma delas seja dominante. Vimos que o erro
(u i ) do modelo estatstico de uma regresso linear pode ser devido influncia de
todas as variveis que afetam a varivel dependente e que no foram includas no
modelo. Uma vez que as variveis que no foram consideradas devem ser as menos
importantes, seus efeitos devem ser todos relativamente pequenos. Considerando que o
nmero de fatores que podem afetar certa varivel dependente bastante grande, e
desde que seus efeitos sejam aditivos e independentes, podemos concluir, com base no
teorema do limite central, que o erro residual tem distribuio aproximadamente
normal.

2.2. Estimativa dos parmetros


O primeiro passo, na anlise de regresso, obter as estimativas a e b dos
parmetros e da regresso. Os valores dessas estimativas sero obtidos a partir de
uma amostra de n pares de valores X i , Yi (com i = 1, 2, ..., n), que correspondem a n
pontos num grfico.
Obtemos, ento

Yi = a + bX i
onde Yi , a e b so, respectivamente estimativas de E (Yi ) = + X i , e .
Para cada par de valores X i , Yi podemos estabelecer o desvio

ei = Yi Yi = Yi (a + bX i )
O mtodo dos mnimos quadrados consiste em adotar como estimativas dos
parmetros os valores que minimizam a soma dos quadrados dos desvios
n

i =1

i =1

Z = e i2 = [Yi ( a + bX i )] 2

47

A funo Z ter mnimo quando suas derivadas parciais em relao a a e b forem


nulas:
Z
= 2 [Yi ( a + bX i )] = 0
a

(2.1)

Z
= 2 [Yi ( a + bX i )] ( X i ) = 0
b

(2.2)

Por se tratar de uma soma de quadrados de desvios, o ponto extremo ser


necessariamente um ponto de mnimo da funo. Formalmente, pode-se verificar que as
condies de segunda ordem para mnimo so satisfeitas.
Simplificando as equaes (2.1) e (2.2), chegamos ao sistema de equaes
normais

na + b X i = Yi

2
a X i + b X i = X i Yi

(2.3)
(2.4)

Resolvendo o sistema, obtemos:

a=

( X 2 )( Y ) ( X )( XY )

n( X 2 ) ( X ) 2
b=

n XY ( X )( Y )
n X 2 ( X ) 2

Note que, por simplicidade, omitimos o ndice. Para sermos explcitos


n

deveramos escrever, por exemplo,

X
i =1

, onde escrevemos, simplesmente, X .

Na prtica determinamos b em primeiro lugar e da equao (2.3) obtemos


a=

Y
X
b
n
n

ou
a = Y bX

48

fcil verificar que a frmula para o clculo de b pode ser escrita de diversos
modos, quais sejam:

n XY ( X )( Y )
b=
=
n X 2 ( X ) 2

( X )( Y )
n
=
(

X )2
2
X
n

XY

( X X )(Y Y ) ( X X )Y
=
=
( X X ) 2
( X X ) 2

X (Y Y ) xy xY Xy
=
=
=
( X X ) 2 x 2 x 2 x 2

onde
X =

X
Y
,Y =
, x = X X e y = Y Y
n
n

Assinalemos duas relaes bastante teis que podem ser obtidas a partir das
equaes (2.1) e (2.2). Lembrando que

Yi (a + bX i ) = Yi Yi = ei , tais equaes ficam:


ei = 0

(2.5)

X i ei = 0

(2.6)

Temos, tambm, que

Yi ei = (a + bX i )ei = a ei + b X i ei
De acordo com (2.5) e (2.6), conclumos que

Yi ei = 0

(2.7)

As relaes (2.5), (2.6) e (2.7) mostram, respectivamente, que

49

a) a soma dos desvios igual a zero,


b) a soma dos produtos dos desvios pelos correspondentes valores da varivel
independente igual a zero, e
c) a soma dos produtos dos desvios pelos respectivos valores estimados da
varivel dependente igual a zero.
Estas relaes podem ser utilizadas para verificar se as estimativas dos
parmetros foram corretamente calculadas e para verificar o efeito dos erros de
arredondamento.
Como Yi = Yi + ei , de (2.5) conclumos que
Yi Yi
=
=Y ,
n
n

(2.8)

isto , a mdia dos valores observados de Y igual mdia dos valores estimados de Y.

2.3. O modelo simplificado e um exemplo numrico


Uma simplificao conveniente dos clculos obtida quando usamos a varivel
centrada x i = X i X . Na representao grfica, isso corresponde a tomar a mdia da
varivel X i como origem do eixo das abcissas. Nesse caso, o modelo estatstico fica

Yi = A + x i + u i
Representando por A a estimativa de mnimos quadrados do parmetro A, temos

Yi = A + bxi + ei
Como x i = 0 , as equaes normais ficam

nA
= Yi

2
b xi = xi Yi

Donde
Y
A =
=Y
n

50

e
b=

xY
x2

Ento a reta de regresso estimada

Yi = Y + bx i
ou
y i = bx i

(2.9)

onde

y i = Yi Y
Temos

y i ei = (Yi Y )ei = Yi ei Y ei
Lembrando (2.5) e (2.7) conclumos que
y i e i = 0

(2.10)

Para exemplificar, consideremos a amostra de 10 pares de valores X i , Yi da


tabela 2.1, representados graficamente na figura 2.2.
TABELA 2.1. Valores de X i e Yi (i = 1, ..., 10)
X

0
1
1
2
3

3
2
3
5
4

3
4
5
5
6

4
7
6
7
9

Os nmeros apresentados so artificiais e foram escolhidos de maneira a


simplificar os clculos. O estudante de economia pode imaginar, por exemplo, que Y o
custo total de produo correspondente quantidade produzida X, para empresas de
certa indstria; esse estudante poder verificar que, neste caso, representa o custo
fixo (custo existente mesmo quando X = 0) e representa o custo marginal. Tambm
possvel imaginar que Y a quantidade de algum produto oferecida em certo mercado, e

51

X o respectivo preo, ou ainda, que Y o logaritmo do consumo semanal de carne de


uma famlia e X o logaritmo da renda mensal dessa famlia.
So dados, a seguir, os resultados de alguns clculos intermedirios para a
obteno das estimativas a e b.
X = 30 , X = 3

X 2 = 126
x2 = X 2

( X ) 2
= 126 90 = 36
n

Y = 50 , Y = 5
XY = 186
xy = XY

( X )( Y )
= 186 150 = 36
n

Destes resultados obtemos


b=

xy 36
=
=1
x 2 36

a = Y bX = 5 3 = 2

Figura 2.2.

Representao grfica dos pares de valores da tabela 2.1, a reta

ajustada (Y = a + bX ) e a reta verdadeira [ E (Y ) = + X ] .


A reta de regresso estimada

Y = 5 + x

52

ou
Y = 2 + X

2.4. Demonstrao de que os estimadores de mnimos quadrados so


estimadores lineares no-tendenciosos
b=

Demonstraremos, inicialmente, que

xi Y
x i2

um estimador linear no-

tendencioso de .
Temos que
b=

xi Y
x

2
i

x1
x

2
i

Y1 +

x2
x

2
i

Y2 + K +

xn
x i2

Yn

Uma vez que os valores de X i so fixos, de acordo com a pressuposio II,


xi
x i2

so, tambm, valores fixos. Ento, b uma combinao linear dos valores de Yi .
Como
Yi = + X i + u i ,

obtemos

b=

1
x i ( + X i + u i ) =
x i2
=

1
xi + xi X i + xi u i
x i2

Como x i = 0 e x i2 = x i X i ,

b=+

xi u i
x i2

(2.11)

Lembrando que, de acordo com a pressuposio III, E (u i ) = 0 , obtemos

53

E (b) =

isto , b =

xi Y
x i2

um estimador no-tendenciosos ou imparcial de .

Demonstraremos, agora, que


a = Y bX

um estimador linear no-tendenciosos de .


Temos que
a = Y bX =

1 Xx i
Yi
xi Y
X
=
2
2
n
xi
n xi

Yi

Essa ltima expresso mostra que a uma funo linear dos valores de Yi .
Como
Yi = + X i + u i ,
obtemos
1 Xx i
a =
2
n xi
=

X x i
x

2
i

( + X i + u i ) =

1 Xx i
Xi
X xi X i

+
2
2
n
xi
n xi

u i

e, como x i = 0 e x i2 = x i X i ,
1 Xx i
a = +
2
n xi

u i

(2.12)

Lembrando que E (u i ) = 0 , obtemos


E (a ) =

isto , a = Y bX um estimador no-tendencioso de .

54

2.5. Varincias e covarincias das estimativas dos parmetros


Determinaremos, inicialmente, a expresso da varincia de b.
Como E (b) = , por definio temos
V (b) = E (b ) 2

(2.13)

De (2.11), obtemos
b =

xi ui
x i2

Substituindo esse resultado em (2.13), obtemos


V (b) =

E ( x i u i ) 2
( x i2 ) 2

Mas
E ( x i u i ) 2 = E ( x1 u 1 + x 2 u 2 + K + x n u n ) 2 =
= E ( x12 u12 + x 22 u 22 + K + x n2 u n2 + 2 x1 x2 u1u 2 +

+ K + 2 x1 x n u1u n + K) =
= x12 2 + x 22 2 + K + x n2 2 =
= 2 x i2

(2.14)

uma vez que, de acordo com as pressuposies IV e V, E (u i2 ) = 2 e E (u i u j ) = 0 , para


i j.
Ento

V (b) =

2 x i2
( x i2 ) 2

2
x i2

(2.15)

Determinemos, a seguir, a varincia de a


De (2.12) segue-se que
1 Xx i
a =
2
n xi

u i

55

Ento
1 Xx i
V (a ) = E (a ) 2 = E
2
n x i


u i

Lembrando que E (u i2 ) = 2 e E (u i u j ) = 0 , para i j, podemos obter

1 Xx i
V (a ) =
2
n xi

2
=

1
2 Xx i
X 2 x i2

= 2 +

( x i2 ) 2 n x i2
n
1 X 2
= +
2
n xi

2
=

(2.16)

Notando que
( X i ) 2
x =X
= X i2 nX 2
n
2
i

2
i

tambm podemos obter


V (a) =

X i2 2

n xi2

(2.17)

Antes de deduzir a expresso da covarincia entre a e b, determinemos as


varincias e covarincias das estimativas dos parmetros do modelo simplificado
analisado na seo 2.3. Vimos ali que essas estimativas so

xY
A = Y e b =
x2
Temos que

Y =

Yi ( + X i + u i )
=
= + X + u
n
n

onde u = ( u i ) n
Como E (u ) = 0 , podemos escrever
E (Y ) = + X

56

Ento, fcil verificar que


Y E (Y ) = u ,

(2.18)

donde obtemos

ui
V (Y ) = E[Y E (Y )] = E (u ) = E

n
2

e, finalmente,
V (Y ) =

n 2 2
=
n
n2

(2.19)

Determinemos agora a covarincia entre Y e b


cov(Y , b) = E[Y E (Y )] (b )
Considerando (2.11) e (2.18), obtemos

xi u i E ( u i xi u i )
=
=
cov(Y , b) = E u
2
n xi2
xi

E (u1 + u 2 + K + u n )( x1u1 + x 2 u 2 + K + x n u n )
=
n xi2

E[ x1 (u12 + u1u 2 + K + u1u n ) + x 2 (u 2 u1 + u 22 + K + u 2 u n ) + K]


=
n xi2
Lembrando que E (u i2 ) = 2 e E (u i u j ) = 0 , para i j, segue-se que

cov(Y , b) =

2 xi
n xi2

=0

(2.20)

Determinemos, finalmente, a covarincia entre a e b.


Como a = Y bX , temos, de acordo com as propriedades da covarincia dadas
na seo 1.5, que
cov(a, b) = cov(Y , b) XV (b)
Considerando (2.15) e (2.20), obtemos

57

cov(a, b) =

X 2
xi2

(2.21)

2.6. Demonstrao de que b um estimador linear no-tendencioso de


varincia mnima
Consideremos um estimador linear qualquer de ,
B = ci Yi
Para que esse estimador seja no-tendencioso, isto , para que tenhamos
E (B ) = , as constantes c i devem ter certas propriedades, que sero deduzidas a

seguir.
Temos
B = ci Yi =
= ci ( + X i + u i ) =
= c i + c i X i + ci u i

(2.22)

Lembrando que E (u i ) = 0 , podemos escrever


E ( B ) = ci + ci X i
Para termos E (B ) = , necessariamente
ci = 0

(2.23)

ci X i = 1

(2.24)

Nestas condies e de acordo com (2.22), temos que


B = + ci u i
ou

58

B = ci u i
Ento,
V ( B) = E ( B ) 2 = E ( c i u i ) 2

Lembrando que E (u i2 ) = 2 e E (u i u j ) = 0 para i j, obtemos


V ( B ) = 2 c i2

Nosso problema determinar os valores de ci que minimizem V (B ) , ou seja,


que minimizem ci2 , sujeitos s condies (2.23) e (2.24). Aplicando o mtodo do
multiplicador de Lagrange, definimos a funo
F = c i2 ci ( ci X i 1)

No ponto de mnimo condicionado devemos ter


F
= 2ci X i = 0
ci

(2.25)

para i = 1, 2, ..., n
Somando essas n igualdades obtemos
2 c i n X i = 0
Pela condio (2.23) segue-se que

+ X = 0
Adicionando essa igualdade a cada uma das relaes em (2.25) obtemos
2c i ( X i X ) = 0

2ci = xi
ci =

xi , para i = 1, 2, ..., n

(2.26)

59

Multiplicando cada uma dessas relaes pelo respectivo valor de X i e somando,


obtemos
ci X i =

xi X i =

xi2

Lembrando a condio (2.24), segue-se que


1=

xi2

ou

1
x i2

Substituindo esse resultado em (2.26), obtemos

ci =

xi
, i = 1, 2, ..., n
xi2

Conclumos ento que o estimador linear no-tendencioso de varincia mnima


que procuramos

B = ci Yi =

xi Yi
,
xi2

que o estimador de mnimos quadrados.


Demonstrao anloga pode ser feita em relao estimativa do parmetro .
Conclumos, ento, que os estimadores dos parmetros de uma regresso linear simples,
obtidos pelo mtodo dos mnimos quadrados, so estimadores lineares no-tendenciosos
de varincia mnima. Esse um caso particular do teorema de Gauss-Markov. Note que
esse resultado depende de certas pressuposies a respeito do erro do modelo
(pressuposies III a V).

2.7. Decomposio da soma de quadrados total


Demonstraremos que

60

(Yi Y ) 2 = (Yi Yi ) 2 + (Yi Y ) 2


ou
y i2 = ei2 + y i2 ,

isto , que a soma de quadrados total (S.Q.Total) igual soma de quadrados residual
(S.Q.Res.), tambm chamada soma de quadrados dos desvios, mais a soma de
quadrados da regresso (S.Q.Regr.).
Partimos da identidade

Yi Y = Yi Yi + Yi Y
ou
yi = ei + y i
Elevando ao quadrado e somando, obtemos
y i2 = ei2 + y i2 + 2 y i ei

Lembrando (2.10), conclumos que


y i2 = ei2 + y i2

(2.27)

Essa relao mostra que a variao dos valores de Y em torno da sua mdia
( y i2 ) pode ser dividida em duas partes: uma ( y i2 ) que explicada pela regresso

e outra ( ei2 ) devida ao fato de que nem todos os pontos esto sobre a reta de
regresso, que a parte no explicada pela regresso. O coeficiente de determinao,
definido por
r2 =

S.Q.Regr. y i2
=
,
S.Q.Total y i2

indica a proporo da variao de Y que explicada pela regresso. Note que


0 r 2 1.

61

Se estamos interessados em estimar valores de Y a partir de valores de X, a


regresso ser tanto mais til quanto mais prximo de um estiver o valor de r 2 .
Verificamos, facilmente, que
r2 =

2
y i2
( xy ) 2
2 x
=
b
=
y i2
y 2 ( x 2 )( y 2 )

(2.28)

e que
S.Q.Regr. = y 2 = b 2 x 2 = b xy =

( xy ) 2
x2

Vamos, agora, verificar a decomposio da soma de quadrados total e calcular o


valor do coeficiente de determinao para o exemplo apresentado anteriormente.
Da tabela 2.1 obtemos
S.Q.Total = y 2 = Y 2

( Y ) 2
= 294 250 = 44
n

S.Q.Regr. = b xy = 36
S.Q.Res. = S.Q.Total S.Q.Regr. = 44 36 = 8

Esta a maneira usual de obter os valores das vrias somas de quadrados. Para
que o aluno compreenda melhor o que est sendo feito, vamos calcular a S.Q.Regr. e a
S.Q.Res. diretamente da sua definio; para isso precisamos obter, inicialmente, os
valores de Yi e ei = Yi Yi , apresentados na tabela 2.2.
As relaes (2.5), (2.6), (2.7) e (2.10), deduzidas anteriormente, que so
ei = 0 , X i ei = 0 , Yi ei = 0 e y i ei = 0 , so facilmente verificadas neste
exemplo.
Como a soma dos desvios nula, a mdia aritmtica de Yi Y = 5 . Obtidos os
valores y i = Yi Y , calculamos
S.Q.Regr. = y i2 = 36 ,

que o mesmo valor obtido anteriormente, pela expresso


S.Q.Regr. = b xy

62

TABELA 2.2. Valores de X i , Yi , Yi , y i e ei


Xi

Yi

Yi = 2 + X

0
1
1
2
3
3
4
5
5
6

3
2
3
5
4
4
7
6
7
9

2
3
3
4
5
5
6
7
7
8

y i
3
2
2
1
0
0
+1
+2
+2
+3

ei = Yi Yi
+1
1
0
+1
1
1
+1
1
0
+1

O valor da soma de quadrados residual, obtido anteriormente por diferena, pode


agora ser obtido diretamente:
S.Q.Res. = ei2 = 8

O leitor pode verificar que aplicando qualquer uma das frmulas de (2.28) o
valor do coeficiente de determinao obtido
r2 =

9
= 0,818 ou 81,8%
11

2.8. Esperanas das somas de quadrados


Vejamos, inicialmente, a esperana da soma de quadrados de regresso.
Temos
Yi = + X i + u i
e
Y = + X + u
Subtraindo esta equao da anterior, obtemos
y i = x i + u i u

(2.29)

63

Sabemos que
( xi y i ) 2
S.Q.Regr. = b xi y i =
xi2
Aplicando esperana temos
E ( xi y i ) 2
E (S.Q.Regr.) =
xi2

(2.30)

De (2.29) podemos obter


xi y i = xi2 + xi u i u xi = xi2 + xi u i

Ento
( x i y i ) 2 = 2 ( xi2 ) 2 + ( xi u i ) 2 + 2 x i2 xi u i

Aplicando esperana, vem


E ( x i y i ) 2 = 2 ( xi2 ) 2 + 2 xi2

(2.31)

Substituindo esse resultado em (2.30), obtemos


E (S.Q.Regr. ) = 2 x i2 + 2

(2.32)

Determinemos, a seguir, a esperana da soma de quadrados total.


J vimos que
S.Q.Total = y i2

Considerando (2.29), segue-se que


S.Q.Total = ( xi + u i u ) 2 =
= [ 2 xi2 + (u i u ) 2 + 2 x i (u i u )] =
= 2 xi2 + (u i u ) 2 + 2 xi u i 2 u xi =
= 2 xi2 + (u i u ) 2 + 2 xi u i

Donde
E (S.Q.Total ) = 2 xi2 + E[ (u i u ) 2 ]

(2.33)

Mas
(u i u ) 2 = (u i2 + u 2 2u i u ) =

64

( u i )
ui
= u + n
=
2
n
n
2

2
i

( u i ) 2
= u
n
2
i

Ento
E[(u i u ) 2 ] = n 2

n 2
= (n 1) 2
n

Substituindo esse resultado em (2.33) obtemos


E (S.Q.Total) = 2 xi2 + ( n 1) 2

(2.34)

Resta determinar a esperana da soma de quadrados residual.


Como
S.Q.Res. = S.Q.Total S.Q.Regr.,
temos
E(S.Q.Res.) = E(S.Q.Total) E(S.Q.Regr.)
De acordo com (2.32) e (2.34) segue-se que
E(S.Q.Res.) = (n 2) 2

(2.35)

2.9. Anlise de varincia da regresso


Os valores das esperanas das somas de quadrados, deduzidas no item anterior,
justificam que se associe s somas de quadrados total, de regresso e residual n 1, 1 e

n 2 graus de liberdade, respectivamente.


Por definio, os quadrados mdios so obtidos dividindo as somas de
quadrados pelos respectivos graus de liberdade.
Ento, para o caso de uma regresso linear simples, temos
Q.M.Regr. = SQ.Regr.

e
Q.M.Res. =

SQ.Res.
n2

Lembrando (2.32) e (2.35), obtemos

65

E (Q.M.Regr.) = 2 xi2 + 2

e
E (Q.M.Res.) = 2
De posse destes resultados, podemos conduzir a anlise de varincia da
regresso linear simples, conforme o esquema seguinte:
Anlise da Varincia
Causas de
Variao

Graus de
Liberdade

Somas de
Quadrados

Quadrados Mdios

Regresso

b xi y i

b xi y i

Resduo

n2

y i2 b x i y i

( y i2 b xi y i ) /( n 2)

Total

n1

y i2

Considerando as diferentes amostras aleatrias de tamanho n que poderiam ser


obtidas a partir da populao de pares de valores (X, Y), e sendo verdadeiras as 6
pressuposies dada na seo 2.1, conclumos que:
a) o Q.M.Res. uma estimativa no-tendenciosa da varincia do erro ( 2 )
b) o Q.M.Regr. , em mdia, igual a essa mesma varincia residual ( 2 ) somada
ao produto de xi2 pelo quadrado do parmetro . claro que se = 0, o
Q.M.Regr. , em mdia, igual a 2
No faremos aqui, mas pode-se demonstrar que, se os erros tm distribuio
normal e se = 0, o cociente
F=

Q.M.Regr.
Q.M.Res.

tem distribuio de F com 1 e n 2 graus de liberdade.


Ento, para testar a hiptese
H0 : = 0,

66

ao nvel de significncia adotado, podemos utilizar a estatstica F. Nesse caso, o


procedimento consiste em rejeitar H 0 para todo F maior ou igual ao F crtico, com 1 e
n 2 graus de liberdade, relativo ao nvel de significncia adotado.
Note que, se essa hiptese verdadeira, tanto o Q.M.Regr. como o Q.M.Res.
so, em mdia, iguais a 2 e o valor de F tende a 1. Para 0 teremos
E (Q.M.Regr.) > E (Q.M.Res.) , e o valor de F tende a ser superior a 1.

Para ilustrar a aplicao desses conceitos, voltemos a considerar o exemplo


numrico da tabela 2.1. Para este exemplo, obtemos a seguinte tabela de anlise da
varincia:
Anlise da Varincia
C.V.

G.L.

S.Q.

Q.M.

Regresso
Resduo
Total

1
8
9

36
8
44

36
1

36

Ao nvel de significncia de 5% e para 1 e 8 graus de liberdade, o valor crtico


de F 5,32 (ver tabela de valores crticos de F). O valor de F calculado, sendo superior
ao valor crtico, significativo ao nvel de 5%. Conseqentemente, rejeitamos a
hiptese H 0 : = 0 em favor da hiptese alternativa H A : 0 , a esse nvel de
significncia.
Um bom programa de anlise de regresso para computador, alm de calcular o
valor de F, apresenta, ao lado, a probabilidade de, na distribuio terica, ocorrer um
valor de F maior do que o calculado. Trata-se da probabilidade associada cauda da
distribuio, acima do valor calculado. Parece apropriado denomin-la probabilidade
caudal do teste.4 Conhecendo essa probabilidade caudal, para saber se o resultado do
teste ou no significativo, basta compar-lo com o nvel de significncia adotado. O
resultado significativo sempre que a probabilidade caudal for igual ou menor do que o
nvel de significncia. Torna-se desnecessrio, ento, obter o valor crtico da tabela
apropriada. Para o exemplo numrico apresentado, o computador informa que a
probabilidade caudal associada ao valor 36, na distribuio de F com 1 e 8 graus de
4

Nos textos em ingls essa probabilidade denominada p-value, o que tem sido traduzido por valorp.

67

liberdade, 0,0003. O valor calculado , portanto, significativo ao nvel de 5% (


significativo mesmo que tivesse sido adotado um nvel de significncia de 0,1%).

2.10. O coeficiente de determinao corrigido para graus de liberdade e o


coeficiente de variao
Na seo 2.7 vimos que o coeficiente de determinao uma medida descritiva
da qualidade do ajustamento obtido. Entretanto, o valor do coeficiente de determinao
depende do nmero de observaes da amostra, tendendo a crescer quando n diminui;
no limite, para n 2, teramos sempre r 2 = 1 , pois dois pontos determinam uma reta e
os desvios so, portanto, nulos. Veremos a seguir como, numa tentativa de superar esse
inconveniente, definido o coeficiente de determinao corrigido para graus de
liberdade, indicado por r 2 . Sabemos que
1 r2 = 1

S.Q.Regr. S.Q.Res.
=
S.Q.Total S.Q.Total

Considerando o nmero de graus de liberdade associado S.Q.Res. e


S.Q.Total, o coeficiente de determinao corrigido definido por

1
(S.Q.Res.)
n 1
2
2
n

1 r =
=
(1 r 2 )
1
n2
(S.Q.Total)
n 1

(2.36)

ou
r 2 = r2

1
(1 r 2 )
n2

(2.37)

Excluindo o caso em que r 2 = 1 , temos r 2 < r 2 . Note que r 2 pode ser negativo.
Um outro indicador da qualidade do ajustamento obtido o coeficiente de
variao, definido por
CV =

s
,
Y

(2.38)

onde s = Q.M . Re s. . O coeficiente de variao mede a disperso relativa das


observaes, porque, por definio, o cociente entre a medida da disperso dos pontos

68

em torno da reta (s) e o valor mdio da varivel dependente (Y ) . O resultado tanto


melhor quanto menor for o coeficiente de variao.
Veja o exerccio 2.23 para uma anlise comparativa dos valores do coeficiente
de determinao e do coeficiente de variao, em vrios casos.

2.11. Estimativas das varincias das estimativas dos parmetros, teste de


hipteses a respeito dos parmetros e respectivos intervalos de
confiana
Na seo 2.5 deduzimos que
V (b) =

2
xi2

e que

1 X 2
V (a) = +
2
n xi

As respectivas estimativas so obtidas substituindo 2 por s 2 = Q.M.Res. , ou


seja,
s2
V (b) = s 2 (b) =
xi2

(2.39)

1 X2
V (a) = s 2 (a) = +
2
n xi

2
s

(2.40)

As estimativas dos desvios padres s(a) e s(b) so obtidas extraindo a raiz


quadrada das respectivas estimativas de varincia.
Demonstra-se que, sendo vlidas as seis pressuposies apresentadas na seo
2.1, inclusive a que estabelece a normalidade da distribuio dos erros, ento os
cocientes
t (b) =

b
s (b)

t (a) =

a
s (a)

69

tm distribuio de t com n 2 graus de liberdade.


Vamos indicar algumas das etapas da demonstrao no caso de t(b). De (2.11),
obtemos

x
b = i 2
xi

u i ,

mostrando que b uma combinao linear dos u i . Se os erros tm distribuio


normal com mdia zero, segue-se que b tambm tem distribuio normal com mdia
zero. Indicando o desvio padro de b por b = V (b) , conclui-se que
Z=

tem distribuio normal reduzida.


O nmero de graus de liberdade associados a t(b) deve ser relacionado com o
fato de s(b) ser obtido a partir do quadrado mdio residual, que, conforme
demonstramos, tem n 2 graus de liberdade.
Os valores t(b) e t(a) podem ser utilizados para testar hipteses sobre os valores
dos parmetros, como ilustraremos a seguir com base no exemplo numrico que
estamos desenvolvendo.
Calculemos, inicialmente, as estimativas das varincias de b e de a.
s2
1
V (b) =
=
2
36
xi

1 X2
V (a) = +
2
n xi

2 1
9
s = +
= 0,35
10
36

As estimativas dos desvios padres so


s (b ) =

1
6

s(a) = 0,35
Para testar a hiptese H 0 : = 0 , contra a hiptese alternativa H A : 0 , ao
nvel de significncia de 5%, calculamos

70

t (b ) =

1 0
=6
1/ 6

Para um teste bilateral, o valor crtico de t com 8 graus de liberdade, ao nvel de


significncia de 5%, 2,306 (ver tabela de valores crticos de t). Portanto, o valor
calculado t(b) significativo ao nvel de 5%, ou seja, rejeitamos H 0 em favor de H A , a
esse nvel de significncia.
Note que esse teste perfeitamente equivalente ao teste F feito na anlise de
varincia, uma vez que o valor de F calculado igual ao quadrado do valor de t
calculado e que o valor crtico de F igual ao quadrado do valor crtico de t.
No caso dos testes t, os programas de computador usualmente fornecem a
probabilidade de o valor terico de t ser, em valor absoluto, maior do que o valor
calculado. Trata-se, portanto, de uma probabilidade caudal apropriada para testes
bilaterais. Se o teste de hipteses for unilateral, necessrio dividir por 2 a
probabilidade caudal fornecida pelo computador.
Consideremos, agora, que se deseja testar a hiptese H 0 : = 3 contra a
hiptese alternativa H A : < 3 , ao nvel de significncia de 5%. Para isso calculamos

t (a) =

23
0,35

= 1,690

A regio de rejeio para este teste t < 1,860. Como o valor calculado no
pertence a esse intervalo, ele no significativo, ou seja, no rejeitamos, ao nvel de
significncia de 5%, a hiptese H 0 : = 3 .
Tambm podem ser obtidos intervalos de confiana para os parmetros. Sendo

t 0 o valor crtico de t com n 2 graus de liberdade e ao nvel de confiana estabelecido,


os intervalos de confiana para e para so, respectivamente,

b t 0 s (b ) < < b + t 0 s (b )
e

a t 0 s(a) < < a + t 0 s (a)


Vamos determinar, no exemplo numrico que estamos desenvolvendo, o
intervalo de confiana para ao nvel de confiana de 90%. O valor crtico de t para 8
graus de liberdade 1,860. Ento o intervalo de 90% de confiana

71

1 1,860

1
1
< < 1 + 1,860
6
6

0,69 < < 1,31

2.12. Varincia de Yi e intervalo de previso


Vimos na seo 2.3 que

Yi = Y + bxi
Ento

V (Yi ) = V (Y ) + xi2V (b) + 2 xi cov(Y , b)


Considerando (2.15), (2.19) e (2.20), segue-se que

xi2 2
2 xi2 2 1

V (Yi ) =
+
=
+
n
xi2 n xi2

(2.41)

Donde

1
xi2
2

V (Yi ) = s (Yi ) = +
2
n xi

2
s

Podemos estimar o valor de Y correspondente a um valor de X que no exista na


amostra. Se reservarmos o ndice i para indicar os elementos pertencentes amostra,
devemos introduzir aqui um outro ndice (h) para indicar outros valores de X. O novo
valor, X h , pode coincidir ou no com um dos valores ( X i ) da amostra. Temos

Yh = a + bX h = Y + bxh
e

1
x h2
2

V (Yh ) = s (Yh ) = +
2
n xi

2
s

72

Extraindo a raiz quadrada desse valor obtemos a estimativa dos desvio padro de

Yh . Sendo t 0 o valor crtico de t com n 2 graus de liberdade e ao nvel de confiana


estabelecido, o intervalo de confiana para E (Yh ) = + X h

Yh t 0 s(Yh ) < E (Yh ) < Yh + t 0 s(Yh )


Freqentemente, temos interesse em estimar o valor de uma nova observao
(Yh ) , relativa ao valor de X h da varivel independente, isto , queremos prever o valor
da varivel dependente em uma nova observao com X = X h . O estimador de
Yh = + X h + u h Yh = a + bX h . O erro de previso

Yh Yh = (a ) + (b ) X h u h
Dizemos que Yh uma previso no-tendenciosa do valor de Yh porque a
esperana do erro de previso igual a zero. Verifica-se, tambm, que E (Yh ) = E (Yh ) .
Note, entretanto, que E (Yh ) = + X h Yh .
Para avaliar a preciso Yh como previso do valor da nova observao,
determinamos o intervalo de previso, como mostraremos a seguir. Note, inicialmente,
que tanto Yh como Yh so variveis aleatrias e que, de acordo com a pressuposio V,
suas distribuies so independentes. Uma vez que, para determinado valor ( X h ) da
varivel independente, os valores de Y variam em torno de sua verdadeira mdia, isto ,
em torno de E (Yh ) , com varincia 2 , a varincia que nos interessa

2 + V (Yh ) = 1 +

x2
1
+ h2
n xi

(2.42)

O intervalo de previso para a nova observao ( Yh )


1
x2
Yh t 0 1 + + h 2
n xi

2
s

1/ 2

1
x2
< Yh < Yh + t 0 1 + + h 2
n x i

2
s

1/ 2

O conceito de intervalo de previso anlogo ao de intervalo de confiana, com


a diferena de que, enquanto o intervalo de confiana se refere a uma constante (o

73

parmetro , por exemplo), o intervalo de previso se refere a uma varivel aleatria (


Yh , no caso).
Consideremos, para exemplificar a aplicao dessas frmulas, os pares de
valores da tabela 2.1. J vimos que para esses dados Y = 5 e b = 1.
Ento

Yh = 5 + xh

(2.43)

O valor crtico de t, com 8 graus de liberdade, ao nvel de confiana de 95%,


2,306.
Lembrando que, no exemplo numrico que estamos desenvolvendo, n = 10,
xi2 = 36 e s 2 = 1 , verificamos que os limites do intervalo de confiana para E (Yh ) ,

ao nvel de confiana de 95%, so dados por


1 x h2
Yh 2,306
+
10 36

(2.44)

Os limites do intervalo de previso para uma nova observao (Yh ) so dados


por
1 x h2

Yh 2,306 1 + +
10 36

(2.45)

Utilizando as expresses (2.43), (2.44) e (2.45) obtivemos os valores de Yh e os


limites dos intervalos de confiana e de previso que esto na tabela 2.4 e na figura 2.3.
Note que consideramos alguns valores de X fora do intervalo para o qual dispnhamos
de dados, ou seja, estamos fazendo extrapolao.

74

TABELA 2.4 Valores de Yh , limites do intervalo de confiana para E (Yh ) , ao nvel de


confiana de 95%.
Xh

Yh

0
1
2
3
4
5
6
7
8
9

2
3
4
5
6
7
8
9
10
11

Intervalo de confiana
para E (Yh )
0,64
1,94
3,18
4,27
5,18
5,94
6,64
7,30
7,94
8,58

3,36
4,06
4,82
5,73
6,82
8,06
9,36
10,70
12,06
13,42

Intervalo de previso
para Yh
0,68
0,46
1,55
2,58
3,55
4,46
5,32
6,13
6,91
7,66

4,68
5,54
6,45
7,42
8,45
9,54
10,68
11,87
13,09
14,34

A anlise da expresso

1
x h2

Yh t 0 +
2
n

x
i

1/ 2

s,

que nos d os limites do intervalo de confiana para E (Yh ) , permite afirmar que a
preciso da estimativa de Y tanto maior quanto:
a) menor for s, isto , quanto menor for a disperso dos valores observados de Y
em torno da reta de regresso.
b) maior for n
c) maior for xi2 , isto , quanto maior for a disperso dos valores de X em torno
da respectiva mdia.
Podemos ento concluir que:
a) O nmero de observaes (n) deve ser o maior possvel.
b) Se possvel, devemos escolher valores de X que conduzem a um elevado
valor para xi2 .
Devemos notar, ainda, que o intervalo de confiana aumenta medida que X h se
afasta de X .

75

Figura 2.3. A reta de regresso estimada, o intervalo de confiana para E (Yh ) e o


intervalo de previso para Yh .
Ao fazer uma extrapolao necessrio considerar, ainda, um outro problema,
provavelmente mais srio que o crescimento da amplitude do intervalo de confiana (e
tambm do intervalo de previso) medida que X h se afasta de X . Freqentemente o
modelo (linear) ajustado razovel para o intervalo coberto pela amostra, mas
absolutamente inapropriado para uma extrapolao. A figura 2.4 ilustra a questo. As
observaes da amostra pertencem ao intervalo em que a relao entre E (Y ) e X
aproximadamente linear. Entretanto, se utilizarmos a reta estimada para prever valores
direita desse intervalo, os resultados estaro totalmente fora do alvo.

76

Figura 2.4. O perigo da extrapolao

2.13. O problema da especificao e as funes que se tornam lineares


por anamorfose
Quando aplicamos anlise de regresso ao estudo da relao funcional entre duas
variveis, o problema da especificao consiste em determinar a forma matemtica da
funo que ser ajustada. Podemos escolher, por exemplo:
I) Yi = + X i
II) Yi = X i
III) Yi = X i
IV) Yi = +

Xi

V) Yi = + X i + X i2
VI) Yi = + X i
Onde , , e so parmetros a serem estimados.
A determinao da forma matemtica da funo pode ser feita de duas formas
diferentes, muitas vezes complementares:
a) utilizando o conhecimento que temos a priori sobre o fenmeno.

77

b) Empregando o conhecimento adquirido pela inspeo dos dados numricos


disponveis. muito til fazer um grfico com os pontos (Xi, Yi) e,
eventualmente, grficos com os pontos (ln Xi, Yi), (Xi, lnYi) ou (lnXi, lnYi).
Freqentemente, ajustamos mais de um modelo e escolhemos, com base nos
resultados estatsticos obtidos (coeficientes de determinao, quadrados mdios
residuais etc.), o modelo que melhor se ajusta aos dados.
Admitindo um erro aditivo o modelo I fica
Yi = + X i + u i ,
que o modelo estatstico estudado at aqui.
Mostraremos agora que os modelos II, III e IV so exemplos de modelos nolineares que se transformam em funes lineares por anamorfose, isto , por substituio
dos valores de uma ou mais variveis por funes destas variveis.
No caso do modelo II (funo exponencial), admitindo um erro multiplicativo i
, obtemos o modelo estatstico
Yi = X i i

Aplicando logaritmos, obtemos


log Yi = log + X i log + log i
Fazendo
log Yi = Z i ,
log = A ,
log = B

e
log i = u i
temos
Z i = A + BX i + u i
que o modelo estatstico de uma regresso linear simples de Z i = log Yi em relao a
X i . Caso o erro u i = log i obedea s pressuposies dadas na seo 2.1, podemos
aplicar amostra de pares de valores X i e Z i os mtodos de anlise de regresso j
estudados. Obtidas as estimativas dos parmetros A e B fcil determinar as
correspondentes estimativas de e de .
78

No caso do modelo III (funo potncia), conhecido entre economistas como


funo de Cobb-Douglas, o correspondente modelo estatstico
Yi = X i i

Aplicando logaritmos, obtemos


log Yi = log + log X i + log i
ou
Z i = A + Vi + u i
onde
Z i = log Yi ,
A = log ,

Vi = log X i
e
u i = log i
Verificamos que a funo potncia corresponde a um modelo de regresso linear
simples nos logaritmos das duas variveis.
Admitindo um erro aditivo o modelo IV (hiprbole) d origem ao seguinte
modelo estatstico
Yi = +

Xi

+ ui

Basta fazer a anamorfose


Vi =

1
Xi

para obter o modelo de uma regresso linear simples,


Yi = + Vi + u i
Os mtodos de ajustamento dos modelos V e VI sero visto adiante. O modelo V
ajustado como uma regresso mltipla com duas variveis explanatrias e o modelo
VI ser estudado no captulo sobre regresso no-linear.

79

2.14. Estimativa de mxima verossimilhana


Para determinar as estimativas de mxima verossimilhana dos parmetros e
da regresso
Yi = + X i + u i

(2.46)

admitiremos que os erros (u i ) so variveis aleatrias independentes com mdia zero,


varincia 2 e distribuio normal, ou seja,
u i N (0, 2 )

Ento, o valor da densidade de probabilidade para certo valor Y1


1

exp
[Y1 ( + X 1 )] 2
2
2

2
1

f (Y1 ) =

Consideremos uma amostra de n pares de valores X i , Yi . Se os valores de X so


fixos e as observaes so independentes, a densidade de probabilidade de o modelo
(2.46) ter gerado tais valores de Yi dada por
L( X 1 ,K , X n ; , , 2 ) =
n

1
2

n
2

1
exp
2
2

= (2 2 )
i =1

= (2 )
2

exp
[Yi ( + X i )]2 =
2
2

[Y
i =1

( + X i )] 2

(2.47)

Os estimadores de mxima verossimilhana de , e 2 so os valores que


maximizam L ( , , 2 | X 1 , K , X n ) , que a funo de verossimilhana. Uma vez que

e s aparecem no expoente negativo de (2.47), conclumos que o mximo dessa


funo corresponde ao mnimo de
[Yi ( + X i )] 2

Portanto, as estimativas de mxima verossimilhana dos parmetros e


coincidem com as estimativas de mnimos quadrados, desde que a distribuio dos erros
seja normal.

80

O leitor pode verificar que a estimativa de mxima verossimilhana de 2

2 =

ei2
n

2.15. Anlise de regresso quando X uma varivel aleatria


Consideremos o modelo
Yi = + X i + u i
onde X uma varivel aleatria cuja distribuio no depende de , ou 2 .
Vamos manter as pressuposies I, III, IV, V e VI, dadas na seo 2.1, e
pressupor ainda que os erros u i so independentes dos valores de X. Ento X i e u i so
no-correlacionados, isto ,
E[( X i X )u i ] = 0 .
Considerando as distribuies condicionais dos Yi (ou dos u i ), dados X i , podese verificar que todos os resultados obtidos so vlidos, desde que interpretados como
condicionados aos valores de X observados.
Entretanto, tais resultados condicionais podem ser insatisfatrios para o
problema em estudo. o caso, por exemplo, de um intervalo de confiana para , vlido
apenas para o conjunto dos valores de X observados.
Devemos salientar, no entanto, que mesmo sendo X uma varivel aleatria, se
forem verdadeiras as pressuposies enunciadas (e crucial que as distribuies de X i
e u i sejam independentes), possvel demonstrar que os estimadores de mnimos
quadrados so no-tendenciosos e coincidem com os estimadores de mxima
verossimilhana. Tambm se demonstra que os procedimentos para a realizao de
testes de hipteses e para a determinao de intervalos de confiana, apresentados na
seo 2.11, continuam vlidos. interessante notar que a interpretao do intervalo de
95% de confiana para , por exemplo, passa a ser a seguinte: para um grande nmero
de amostras, onde tanto os valores de Yi como os valores de X i variam de uma amostra
para outra, em aproximadamente 95% dos casos os intervalos de confiana, obtidos da
maneira indicada na seo 2.11, conteriam o valor verdadeiro ().

81

Exerccios

2.1.

dada uma amostra de 10 pares de valores


X
2
2
1
1
0
0
1
1
2
2

Y
0
0
2
3
4
4
5
6
8
8

Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo


Yi = + X i + u i , onde os u i so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .
a) Determine as estimativas dos parmetros da regresso linear.
b) Teste H 0 : = 0 ao nvel de significncia de 5%.
c) Calcule o coeficiente de determinao.
d) Determine a estimativa de Y para X = 3 e o respectivo intervalo de confiana
ao nvel de confiana de 95%.
2.2.

Seja b o coeficiente de regresso de Y em relao a X. Seja d o coeficiente de


regresso de Z em relao a X. Sabendo que Z = m + nY , determine a relao
existente entre as estimativa de mnimos quadrados de b e d.

2.3.

Demonstre que numa regresso linear simples o valor de F da anlise de


varincia da regresso igual ao quadrado do valor de t(b), relativo hiptese da
nulidade = 0 (onde o coeficiente de regresso).

2.4.

Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo


Yi = + X i + u i , onde os u i so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .

82

So dados os seguintes valores, obtidos de uma amostra aleatria de 14


observaes:
X i = 140

Yi = 728

X i2 = 1456

Yi 2 = 39424

X i Yi = 7504
a) Determine as estimativas dos parmetros da regresso de Y em relao a X e
os respectivos desvios padres.
b) Calcule o coeficiente de determinao da regresso.
c) Teste a hiptese H 0 : = 0 contra a hiptese alternativa H A : > 0 , ao
nvel de significncia de 0,5%.
2.5.

dada uma amostra de 5 pares de valores:


X
1
2
3
4
5

Y
3,0
7,5
7,0
11,5
11,0

Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo


Yi = + X i + u i , onde os u i so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .
a) Determine as estimativas dos parmetros da regresso linear.
b) Calcule o coeficiente de determinao e faa a anlise de varincia da
regresso, considerando o nvel de significncia de 5%.
c) Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 2 contra a
hiptese alternativa H A : 2 .
d) Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 13 contra a
hiptese alternativa H A : < 13 .
e) Determine a estimativa de Y para X = 5 e o respectivo intervalo de confiana
ao nvel de confiana de 95%.
2.6.

So dados os 5 pares de valores:

83

X
0
2
4
6
8

Y
2
3
14
15
26

Obtemos X = 20, Y = 60, X 2 = 120, Y 2 = 1110 e XY = 360


Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo
Yi = + X i + u i e que so vlidas as pressuposies usuais a respeito dos erros
ui .
a) Determine as estimativas dos parmetros da regresso linear.
b) Calcule o coeficiente de determinao.
c) Verifique se o coeficiente de determinao estatisticamente diferente de
zero ao nvel de significncia de 1%.
d) Teste a hiptese H 0 : = 6 contra a hiptese alternativa H A : > 6 , ao
nvel de significncia de 1%.
e) Teste a hiptese H 0 : = 6 contra a hiptese alternativa H A : 6 , ao
nvel de significncia de 10%.
f) Determine o intervalo de previso para uma nova observao de Y com X =
10, ao nvel de confiana de 95%.
2.7.

Com base em 52 pares de valores das variveis X e Y foi obtida a equao de


regresso

Yi = 0,4 + X i
A estimativa do desvio padro da estimativa do coeficiente de regresso 0,1.
Calcule o coeficiente de determinao e teste a hiptese de que o coeficiente angular da
equao igual a zero, ao nvel de significncia de 1%.
2.8.

Mostre que b um estimador consistente de .

84

2.9.

A partir de n pares de valores X i , Yi obtemos, pelo mtodo de mnimos


quadrados, a equao de regresso Yi = a + bX i . Sendo Z i = Yi + X i , temos n
pares de valores Z i , X i , a partir dos quais obtemos a equao de regresso:

Z i = c + dX i
Que relao existe entre b e d? E entre a e c? Sendo b e d as estimativas dos
parmetros e , respectivamente, demonstre que o valor de t relativo hiptese
da nulidade H 0 : = 0 igual ao valor de t relativo hiptese da nulidade
H 0 : = 1 , ou seja, que
b
d 1
=
s (b) s (d )
2.10. Dados os pares de valores X e Y abaixo, qual o modelo que voc usaria e como
faria para obter uma relao que lhe permitisse estimar Y a partir de valores de
X?
X
10
12
14
16
18

Y
2,0
8,2
31,0
130,0
510,0

2.11. A partir de uma amostra de 27 pares de valores foi obtida a equao de regresso
de Y em relao a X
Y = 25,0 + 2,00 X

Sabendo que s = 1,50 ( s 2 = Q.M.Res. ), que a estimativa do desvio padro de X


s ( X ) = 3,00 e que X = 7,50 ,

a) determine o intervalo de confiana do coeficiente de regresso ao nvel


de confiana de 95%.
b) Teste, ao nvel de significncia de 1%, a hiptese de que o coeficiente de
regresso da populao 1,70.

85

2.12. Para aumentar a preciso da estimativa do coeficiente de regresso, que devemos


fazer com relao escolha dos valores X que sero utilizados na anlise de
regresso?
2.13. Discuta, rapidamente, os problemas relacionados com a extrapolao,
especialmente no campo socioeconmico.
2.14. Suponha que uma fbrica dispe dos seguintes dados:
Quantidade Produzida
Custo (R$)

105

130

141

159

160

172

2042

2301

2421

2518

2606

2718

Por meio de uma anlise de regresso, estabelea:


a) O valor mais provvel dos custos fixos e o respectivo intervalo de confiana,
ao nvel de confiana de 95%.
b) A quantidade para a qual o lucro nulo, admitindo um preo de venda de
R$ 18,00 por unidade.
2.15. Com base em 11 pares de valores das variveis X e Y foi obtida a equao de
regresso

Y = 20 X ,
com r 2 = 0,64 . Sabe-se que a estimativa no-tendenciosa da varincia de X
64. Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 0 , contra a
hiptese alternativa H A : > 0 .
2.16. Numa anlise de regresso ( Yi = + X i + u i ) foram obtidos, a partir de uma
amostra de 6 pares de valores X e Y, os seguintes resultados:
r2 =

16
; s(X) = 3; s(Y) = 5; X = 3 e Y = 10
25

a) Determine o intervalo de 95% de confiana para , sabendo que Y uma


funo crescente de X.
b) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 contra a
hiptese alternativa H A : > 0 .
2.17. Admitindo que as variveis X e Y esto relacionadas conforme o modelo

86

Yi = +

Xi

+ ui ,

onde u i representa erros aleatrios independentes com mdia zero e varincia


constante, determine as estimativas dos parmetros e , com base nos
seguintes dados:
X
12
15
20
30
60

Y
9,0
8,5
8,5
6,5
5,0

2.18. Sejam as variveis X e Y, relacionadas de acordo com o modelo


Yi = + X i + u i
onde u i so erros aleatrios. Dados os resultados abaixo, obtidos de uma amostra
aleatria com 50 observaes,
Yi = 100

Yi 2 = 212

X i = 10

X i2 = 2,1

X i Yi = 21

a) Calcule as estimativas dos parmetros e e as estimativas das respectivas


varincias. Que pressuposies devem ser feitas para que estas estimativas
sejam imparciais e de varincia mnima?
b) Teste as seguintes hipteses ao nvel de significncia de 5%:
I)

H 0 : = 2 contra a hiptese alternativa H A : 2

II) H 0 : = 12 contra a hiptese alternativa H A : < 12


Que pressuposio adicional deve ser feita para testar essas hipteses?
c) Calcule o valor do coeficiente de determinao da regresso e interprete o
resultado.

87

2.19. So dados os seguintes valores, obtidos de uma amostra aleatria com 10


observaes:
X
0
1
2
3
4

Y
2,5
1
2
0
0,5

3,5
3
4
2
1,5

Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo


Yi = + X i + u i , onde u i so variveis aleatrias homocedsticas, normalmente
distribudas e com mdia zero. Pode-se verificar que x 2 = 20 , Y 2 = 55 ,
y 2 = 15 , xY = 10 e Y = 2 .
a) Determine a reta de regresso de Y em relao a X, de acordo com o mtodo
dos mnimos quadrados.
b) Calcule o coeficiente de determinao e verifique se estatisticamente
diferente de zero, atravs do teste F, considerando um nvel de significncia
de 5%.
c) Teste a hiptese H 0 : = 0 contra a hiptese alternativa H A : > 0 , ao
nvel de significncia de 5%.
d) Teste a hiptese H 0 : = 1 contra a hiptese alternativa H A : 1 , ao nvel
de significncia de 1%.
e) Determine o intervalo de previso para uma nova observao de Y com
X = 2 + 10 , ao nvel de confiana de 95%.
f) Considere que a equao de regresso obtida a demanda de um produto em
certo mercado, sendo X o preo e Y a quantidade procurada. Se o produto em
questo vendido por um monopolista e seu custo mdio de produo
constante e igual a Cr$ 2,00, que preo o monopolista deve estabelecer para
maximizar sua renda lquida? Estime a quantidade que ser vendida a esse
preo e determine o intervalo de confiana correspondente, ao nvel de
confiana de 95%.
2.20. Seja X a quantidade de certo produto, em milhares de unidades, e Y o respectivo
custo total de produo em milhares de cruzeiros. Admite-se que o custo
marginal seja constante. dada a seguinte amostra de 10 pares de valores
88

(extrados de H.W. GUTHRIE. Statistical Methods in Economics. Richard D.


Irwin, 1966, p. 108-109):

Pode-se

(1 000 unidades)
1
2
3
4
5
6
7
8
9
10

(Cr$ 1 000,00)
7
11
15
14
18
21
23
30
32
34

verificar

que

X = 55, Y = 205, X 2 = 385, Y 2 = 4965

XY = 1375 .
a) Estime a funo de custo total.
b) Teste, ao nvel de significncia de 1%, a hiptese de que o custo marginal
nulo.
c) Determine o intervalo de 95% de confiana para o valor dos custos fixos.
d) Calcule o coeficiente de determinao da regresso.
e) Se o produtor vende em regime de competio perfeita ao preo de Cr$ 3,50
por unidade, quantas unidades deve produzir para que sua renda lquida seja
de Cr$ 2.000,00?
f) Determine a estimativa de Y para X = 10 e o respectivo intervalo de
confiana, ao nvel de confiana de 95%.

2.21. dada uma amostra de 4 pares de valores:


X
2
1
1
4

Y
6
8
9
13

89

Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo


Yi = + X i + u i , onde os u i so erros independentes, de mdia zero, varincia
constante e distribuio normal.
a) Determine as estimativas dos parmetros da regresso linear.
b) Calcule o coeficiente de determinao da regresso.
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 5 contra a
hiptese alternativa H A : 5 .
d) Determine a estimativa de Y para X = 2 e o intervalo de confiana para
E (Y | X = 2) , ao nvel de confiana de 95%.

2.22. A tabela ao lado mostra os valores de X e Y em


uma amostra com 8 observaes. Admite-se
que essas variveis esto relacionadas de
acordo com o modelo usual de regresso linear
simples. Pode-se verificar que
Y = 96,

X 2 = 168,

X = 32,

Y 2 = 1340

X
1
1
3
3
5
5
7
7

Y
15
19
16
14
9
13
6
4

XY = 304 .
a) Determine a equao de regresso de Y contra X de acordo com o mtodo de
mnimos quadrados.
b) Obtenha uma estimativa no-tendendiosa da varincia do erro do modelo.
c) Verifique se a influncia de X sobre Y estatisticamente significativa ao
nvel de 1%.
d) Determine o intervalo de 90% de confiana para a variao esperada de Y
quando X diminui 3 unidades ( X = 3) .

90

2.23. So dados 3 conjuntos de 6 pares de valores ( X i , Yi , i = 1, ..., 6)


Conjunto A
Y
X

Conjunto B
Y
X

1
5,5
2
6,5
3
9,0
4
10,5
5
13,5
6
15,0
Para cada um desses conjuntos,

Conjunto C
Y
X

1
10,5
1
0,5
2
9,5
2
1,5
3
10,0
3
4,0
4
9,5
4
5,5
5
10,5
5
8,5
6
10,0
6
10,0
obtenha as estimativas de mnimos quadrados

dos parmetros da regresso linear de Y contra X. Calcule os valores do


coeficiente de determinao e do coeficiente de variao e analise
comparativamente os resultados. Para melhor visualizao, faa, para cada
conjunto, um grfico mostrando os pontos observados e a reta de regresso
ajustada.
2.24. Dada uma amostra de n pares de valores X i , Yi (i = 1, ..., n), mostre que a
estimativa dos coeficiente angular da reta, obtida atravs do mtodo dos
mnimos quadrados (b), uma mdia ponderada das declividades das retas que
passam pelos pontos ( X i , Yi ) e pelo ponto central da amostra ( X , Y ) .
2.25. A partir de uma amostra de 7 pares de valores, foi obtida a equao de regresso

Y = 30 + 5 X ,
com um coeficiente de determinao r 2 =

2
3

A estimativa do desvio padro de X s(X) = 2.


a) Determine o intervalo de confiana do coeficiente de regresso, ao nvel de
confiana de 95%.
b) Teste, ao nvel de significncia de 5%, a hiptese de que o coeficiente de
regresso da populao 8,5, considerando a hiptese alternativa de que o
coeficiente de regresso da populao menor do que 8,5.
2.26. Seja Y o custo de carregamento mecnico por tonelada de cana-de-acar. Seja X
o nmero de toneladas carregadas, por carregadeira e por ano. Suponha que um
pesquisador levantou os custos de carregamento mecnico da cana-de-acar em
diversas propriedades, obtendo uma amostra de pares de valores X i , Yi .

91

Admitindo que os custos totais de carregamento mecnico por ano sejam


constitudos por uma parte fixa (que no varia com X) e por uma parte varivel
(de tal maneira que o custo varivel por tonelada seja constante), que modelo
matemtico deve ser usado para estudar, por meio da anlise de regresso, a
variao do custo de carregamento por tonelada de cana-de-acar em funo do
nmero de toneladas carregadas? Que anamorfose dever ser feita?
2.27. Analisando a srie de valores do Produto Nacional Bruto (PNB) de determinado
pas, durante um perodo de 10 anos, verificou-se que so aproximadamente
constantes os incrementos anuais relativos do PNB. Qual a equao (modelo
matemtico) que deve ser usada na anlise de regresso desses dados? Que
transformao de variveis (anamorfose) deve ser feita para determinar as
estimativas dos parmetros atravs do mtodo dos mnimos quadrados? Sabendo
que, utilizando logaritmos decimais, a estimativa do coeficiente de regresso
0,0193 e a estimativa do respectivo desvio padro 0,0010, teste, ao nvel de
significncia de 5%, a hiptese de que a taxa de crescimento 4% ao ano (sabese que log 104 = 2,0170).
2.28. Admitindo que as variveis X e Y esto relacionadas conforme o modelo
Yi = X i i , onde i so erros multiplicativos, determine as estimativas dos

parmetros e com base nos seguintes dados:


X
1
1
100
100
10.000
10.000

Y
1
10
1.000
1.000
100
1.000

2.29. Suponha que um pesquisador est determinando a funo de demanda do


produto A em determinado mercado, com base em uma srie de 8 pares de
valores X i , Yi , onde Yi o preo pelo qual foi vendida a quantidade X i do
produto em determinado intervalo de tempo. Admitindo que a elasticidade-preo
da demanda do produto constante, qual a equao (modelo matemtico) que
o pesquisador deve usar? Que transformao de varivel (anamorfose) dever ser
feita para determinar as estimativas dos parmetros atravs do mtodo dos
92

mnimos quadrados? Sabendo que a estimativa do coeficiente de regresso


obtida 1,24, com um desvio padro estimado em 0,10, teste, ao nvel de
significncia de 5%, a hiptese de que a elasticidade-preo igual a 1.
2.30. Seja Y uma grandeza econmica qualquer e seja X o tempo, em anos. Se
admitirmos que a taxa geomtrica de crescimento de Y constante, que modelo
de regresso deve ser adotado? Sabendo que, em cinco anos consecutivos, Y
assumiu os valores 4, 4, 32, 64 e 32, qual a estimativa da taxa de crescimento
de acordo com o mtodo dos mnimos quadrados? Faa a anlise de varincia da
regresso.
2.31. Em estudos da variao do consumo de certos produtos em funo da renda da

famlia tem sido usada a funo Y = exp , onde Y o dispndio com o


X

produto considerado e X a renda da famlia.


Mostre as anamorfoses que devem ser feitas para que as frmulas de regresso
linear simples sejam usadas para ajustar essa funo, utilizando dados obtidos de
uma amostra aleatria.
2.32. a) Deduza, de acordo com o mtodo dos mnimos quadrados, a frmula para
estimar o parmetro do modelo
Yi = X i + u i com i = 1, ..., n,
onde
E (u i ) = 0 ,
E (u i2 ) = 2

e
E (u i u j ) = 0 para i j

b) Prove que o estimador obtido (b) no-tendencioso


c) Prove que a varincia da estimativa obtida V (b) =

2
X i2

d) Prove que o estimador obtido um estimador linear no-tendencioso de


varincia mnima
e) Mostre que a soma de quadrados residual dada por

93

Yi 2

( X i Yi ) 2
= Yi 2 b X i Yi
2
Xi

f) Demonstre que a esperana da soma de quadrados residual igual a


(n 1) 2
g) Admitindo que Y a receita de uma empresa comercial em certo intervalo de
tempo e que X a quantidade vendida (em unidades fsicas), ajuste aos pares
de valores, dados a seguir, uma reta que passe pela origem dos eixos. Teste,
ao nvel de significncia de 5%, a hiptese H 0 : = 0 .
X
2
3
4
4
5

Y
5
7
11
5
9

2.33. Dados um conjunto de pares de valores X ij , Yij (i = 1, ..., m; j = 1, ..., n), ajustase um conjunto de m retas paralelas
Yij = a i + bX ij
Mostre que as estimativas dos parmetros, de acordo com o mtodo dos mnimos
quadrados, so dadas por
b=

( X ij X i )(Yij Yi )
i

( X ij X i ) 2
i

e
ai = Yi bX i

onde X i =

1 n
1 n
X
Y
=
Yij
e
ij i n
n j =1
j =1

(Extrado de DRAPER e SMITH, 1996, p. 38).

94

2.34. dada uma amostra de 12 pares de valores


Xi
1
1
1
1
2
2

Yi
2
4
3
5
8
6

Xi
4
4
5
5
5
5

Yi
9
13
11
10
16
9

Obtemos Yi = 96 , Yi 2 = 962 , y i2 = 194


Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo
Yi = + X i + u i , onde os ui so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .
a) Determine as estimativas dos parmetros da regresso linear.
b) Calcule o coeficiente de determinao da regresso e faa a anlise de
varincia, interpretando o teste F realizado. Considere um nvel de
significncia de 1%.
c) Teste, ao nvel de significncia de 1%, a hiptese de que = 0 contra a
hiptese de que > 0.
d) Determine a estimativa de Y para X = 6 e o intervalo de confiana para
E (Y | X = 6) , ao nvel de significncia de 99%.

e) Determine o valor da estimativa da variao em E(Y), isto , estime

= E ( Y ) , quando o valor de X aumenta de 2 unidades ( X = 2) . Qual a


varincia de ? Teste, ao nvel de significncia de 5%, a hiptese de que

= 2,5 contra a hiptese alternativa de que > 2,5 .


2.35. Mostre que a covarincia entre duas estimativas de Y ( Y1 e Y2 , para X = X 1 e

X = X 2 , respectivamente)
1 x x
cov(Y1 , Y2 ) = + 1 22
n xi

2.36. Seja X a quantidade de adubo colocada no solo, em doses por hectare, e seja Y a
produtividade obtida, em toneladas por hectare. Admite-se que essas variveis
esto relacionadas de acordo com a funo
95

Yi = + X i + u i ,
onde e so parmetros e os ui so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .
Um experimento com 5 parcelas forneceu os seguintes resultados:

Xi
0
1
4
9
16

Yi
2,7
4,4
5,3
5,4
7,2

a) Determine as estimativas de mnimos quadrados (a e b) de e .


b) Calcule o coeficiente de determinao da regresso.
c) Determine o intervalo de 95% de confiana para .
d) Determine o intervalo de 95% de confiana para .
e) Determine a dose econmica de adubo admitindo que o preo da tonelada do
produto seja igual ao dobro do preo da dose de adubo (j considerados os
custos de colocao do adubo, juros e/ou subsdios, etc.).
f) Determine o intervalo de 95% de confiana para o verdadeiro valor () da
dose econmica, para as condies do item anterior (Sugesto: determine
inicialmente, os limites do intervalo de confiana para

, e depois eleve

ao quadrado).
g) Determine o intervalo de previso para a produo de uma nova parcela com
X = 1, considerando um nvel de confiana de 95%.
2.37. Considere o modelo Yi = X i + u i

com Xi fixos, E(ui) = 0, E (u i2 ) = 2 e

E (u i u j ) = 0 para i j.

Sabe-se que o estimador de mnimos quadrados para b =


tendencioso, com V (b) =

2
X i2

X i Yi
, no X i2

(ver exerccio 2.32).

Um estimador alternativo para = Y / X , que a inclinao da reta unindo


a origem do sistema de eixos ao ponto X , Y .
96

a) Prove que um estimador linear no-tendencioso.


b) Deduza a expresso que d V( ) em funo de 2 e dos valores de X.
c) Prove (sem utilizar o teorema de Gaus-Markov) que V( ) V(b). Em que
condies tem-se V( ) = V(b)?
2.38. Considere o modelo de regresso linear simples Yi = + X i + u i , onde ui so
erros aleatrios independentes com mdia zero e varincia 2 , e os Xi so fixos,
com X i = i para i = 1, 2, ..., 9.
Sejam X 1 e X 2 as mdias de X para as h primeiras e as h ltimas observaes,
isto ,
X1 =

1 h
Xi
h i =1

X2 =

1 9
Xi
h i =10 h

Verifique os valores de X 1 e X 2 apresentados na tabela abaixo


h

X1

X2

1
2
3

1
1,5
2

9
8,5
8

2,5

7,5

Sejam Y1 e Y2 as mdias dos correspondentes valores de Y, isto ,


Y1 =

1 h
Yi
h i =1

Y2 =

1 9
Yi
h i =10 h

Define-se o seguinte estimador de :


b*h =
a) Prove que b*h = +
onde

u1 =

Y2 Y1
X 2 X1

u 2 u1
,
X 2 X1

1 h
ui
h i =1

u2 =

1 9
ui
h i =10 h

b) Mostre que b*h um estimador no-tendencioso de .


c) Demonstre que V (b*h ) =

2 2
h( X 2 X 1 ) 2

97

d) Faa uma tabela mostrando os valores de V (b*h )

para h = 1, 2, 3, 4.

Apresente, na mesma tabela, para cada valor de h, a eficincia relativa de b*h


em comparao com o estimador de mnimos quadrados.

Respostas
2.1. a)

Y = 4 + 1,9 X

b)

F = 320,89, rejeita-se H 0 : = 0

c)

r2 = 0,976

d)

Y = 9,7 . Os limites do intervalo de confiana so 8,89 e 10,51.

2.4. a)

Y = 12 + 4 X ; s(b) = 1; s(a) = 10,2

4
= 0,571
7

b)

r2 =

c)

t = 4, significativo

2.5. a)

Y = 2 + 2 X

b)

r 2 = 0,842 ; F = 16, significativo

c)

t = 8, significativo

d)

t = 6,63, significativo

e)

Y = 12; 8,10 a 15,90

2.6. a)

Y = 3X

12
= 0,923
13

b)

r2 =

c)

F = 36, significativo

d)

t = 6, no-significativo

e)

t = 2,45, significativo

f)

15,42 a 44,58

2.7. r 2 =

2
; F = 100, significativo
3

2.8. Uma vez que E(b) = , basta mostrar que lim V (b) = 0 , o que acontece desde que
n

x 2 cresce indefinidamente quando n cresce.


2.9. d = b + 1 e c = a

98

2.10. Notando que os acrscimos relativos ( Y / Y ) de Y so aproximadamente


constantes, conclui-se que o modelo matemtico apropriado Y = X . A mesma
concluso obtida notando que os pontos (X, Y) esto aproximadamente
alinhados, quando marcados em um grfico com o eixo das ordenadas em escala
logartmica, isto , notando que os pontos de coordenadas log Y e X esto
aproximadamente alinhados.
2.11. a)
b)
2.14. a)
b)

2 0,202
t = 3,059, significativo
1 025 250
124,3

2.15. t = 4, no-significativo
2.16. a)
b)

0,06 a 2,72
t = 2,954, significativo

60
2.17. Y = 4,5 +
X
2.18. a)
b)

a = 0, b = 10, V ( a ) = 0,0175 , V (b) = 0,417


I) t = 15,12, significativo
II) t= 3,10, significativo

c)
2.19. a)

r 2 = 0,833 ou 83,3%
Y = 3 0,5X

1
; F = 4, no-significativo
3

b)

r2 =

c)

t = 2, no-significativo

d)

t = 3,27, no-significativo

e)

2,84 a 3,68

f)

X = 4; Y = 1; 0,41 a 2,41

2.20. a)

Y = 4 + 3X

b)

t = 17,23, significativo; rejeita-se H 0 : = 0

c)

1,51 < < 6,49

d)

r 2 = 0,974

e)

X = 12, isto , 12 000 unidades

f)

34 2,14

99

2.21. a)

Y = 6 + 1,5X

27
= 0,519
52

b)

r2 =

c)

t = 3,429, no-significativo ( t 0 = 4,303 )

d)

Y = 9

3,62 < E( Y | X = 2) < 14,38


2.22. a)

Y = 20 2X

14
= 4,667
3

b)

s2 =

c)

F = 34,29, significativo ( F0 = 13,7 )

d)

4,009 < E(Y) < 7,991

2.23.
Conjunto
Estatstica

a
b

3
2

10
0

2
2

Y
S.Q.Res.
S.Q.Regr.

10

10

r2
CV
2.25. a)
b)

1
70
98,6%
5%

1
0
0

1
70
98,6%

5%

10%

0,94 < < 9,06


t = 2,21, significativo

2.26. 2.26. Anamorfose:

1
=V
X

2.27. Anamorfose: Y = log (PNB)


t = 2,30, no-significativo
2.28. Y = 10 X 0,5
2.29. Y = AX B
Anamorfoses:

Z = log Y e V = log X
t = 2,40, no-significativo

2.30. Yi = X i i

100

Adotando como origem do tempo (X = 0) o ano em que foi efetuada a terceira das
observaes consideradas, obtemos

Y = 16 2 X
A taxa de crescimento 100% ao ano
F = 7,5
Z = ln Y e V =

2.31. Anamorfoses:

1
X

2.32. g)

Y = 2 X ; t = 7,303, significativo.

2.34. a)

Y = 2 + 2 X

b)

r 2 = 0,742 ; F = 28,8, significativo ( F0 = 10,04 )

c)

t = 5,37 , significativo ( t 0 = 2,76 )

d)

Y = 14 ; 9,91 < E(Y|X = 6) < 18,09

e)

= 4 ; V () = (X ) 2 V (b) =

2
9

5
V ( ) = e t = 2,01, significativo ( t 0 = 1,81 )
9
2.36. a)

a = 3, b = 1

b)

r 2 = 0,931

c)

1,78 < < 4,22

d)

0,50 < < 1,50

e)

Uma dose por hectare

f)

0,50 <

< 1,50

ou 0,25 < < 2,25


g)

2,20 < Yh < 5,80

2.37. b)

n 2
V ( ) =
( X ) 2

c)

As varincias so iguais apenas quando todos os valores de X forem iguais.

101

2.38. V (b) =

2
60
X 2 X1

V (b*h )

Eficincia relativa

2 /32

0,533

2 /49

0,817

2 /54

0,900

2 /50

0,833

102

3. CORRELAO
Vimos que numa anlise de regresso linear simples, se determina, atravs de
estimativas dos parmetros, como uma varivel X exerce, ou parece exercer, efeito
sobre uma outra varivel Y.
Na anlise de correlao, que veremos aqui, se procura determinar o grau de
relacionamento entre duas variveis, ou seja, se procura medir a covariabilidade entre
elas.
Na anlise de regresso necessrio distinguir a varivel dependente e a varivel
explanatria; na anlise de correlao, tal distino no necessria.

3.1. O coeficiente de correlao simples para uma amostra


Inicialmente, desenvolveremos o conceito do coeficiente de correlao (r) para uma
amostra de n pares de valores X i , Yi (i = 1, 2, ..., n).
Para obter uma medida de correlao sem a influncia da mdia (tendncia
central) e da varincia (disperso), vamos utilizar variveis reduzidas, definidas por
vi =

Xi X
=
s( X )

zi =

Yi Y
=
s (Y )

xi
xi2
n 1

(3.1)

e
yi
y i2
n 1

(3.2)

Como as variveis reduzidas no tm dimenso, esta transformao tambm


elimina qualquer influncia da unidade de medida.
As figuras 3.1, 3.2 e 3.3 apresentam trs diferentes resultados que poderiam ser
obtidos quando colocamos os pontos ( vi , z i ) em um grfico.

103

Figura 3.1. Correlao


Positiva

Figura 3.2. Correlao


negativa

Figura 3.3. Correlao


aproximadamente igual a
zero

Se X e Y esto positivamente correlacionados, isto , se X e Y tendem a variar no


mesmo sentido, ento a maioria dos pontos ( vi , z i ) estar no 1o e no 3o quadrantes,
como ocorre na figura 3.1.Uma vez que, para pontos localizados nesses quadrantes, o
produto vi z i positivo, o valor de vi z i ser, neste caso, positivo e relativamente alto.
Se X e Y esto negativamente correlacionados, isto , se X e Y tendem a variar
em sentidos opostos, ento a maioria dos pontos ( vi , z i ) estar no 2o e no 4o quadrantes,
como ocorre na figura 3.2. Uma vez que, para pontos localizados nesses quadrantes, o
produto vi z i negativo, o valor de vi z i ser, neste caso, negativo e de valor absoluto
relativamente alto.
Se no existe correlao, os pontos ( vi , z i ) estaro distribudos pelos quatro
quadrantes, como ocorre na figura 3.3. Ento vi z i ser igual a zero ou ter valor
absoluto pequeno, pois as parcelas positivas (correspondendo a pontos no 1o e 3o
quadrantes) so anuladas pelas parcelas negativas (correspondendo a pontos no 2o e 4o
quadrantes).

104

Portanto, o valor de vi z i pode ser utilizado como medida de correlao.


Entretanto, em termos absolutos, esse valor tende a crescer com o nmero de
observaes. Ento, o coeficiente de correlao simples definido por

r=

vi z i
n 1

Considerando (3.1) e (3.2), obtemos


r=

xi y i
xi2 y i2

(3.3)

Comparando (3.3) com (2.28), verificamos que o quadrado do coeficiente de


correlao igual ao coeficiente de determinao da regresso linear simples.
J vimos que
0 r2 1

Ento,
1 r 1

importante assinalar que um coeficiente de correlao igual a zero no implica


em ausncia de relao entre as duas variveis. Isso mostrado na figura 3.4, onde,
apesar de o coeficiente de correlao ser nulo, evidente que existe uma relao
parablica entre X e Y. Portanto, um coeficiente de correlao nulo somente implica
ausncia de relao linear entre as duas variveis.

Figura 3.4. Relao parablica entre X e Y, onde r = 0

105

Para exemplificar, consideremos os 6 pares de valores dados na tabela 3.1 e


representados na figura 3.5. Pode-se imaginar que cada par de valores so as notas
tiradas por um aluno em duas disciplinas.
Tabela 3.1 Amostra de 6 pares de valores X i , Yi
Xi

Yi

Xi

Yi

4
4
6

6
7
6

6
8
8

8
7
8

Obtemos
X =

36
42
= 6; Y =
=7
6
6

x 2 = X i2

( X i ) 2
36 2
= 232
= 16
n
6
( Yi ) 2
42 2
= 298
=4
n
6

y 2 = Yi 2

xi y i = X i Yi

X i Yi
36 42
= 256
=4
n
6

r=

4
16 4

= 0,5

Vejamos a relao que existe entre o coeficiente de correlao e o coeficiente de


regresso.
Como

b=

xy
=
x2

xy
x2 y2

y2
,
x2

verificamos, considerando (3.3), que

b=r

s (Y )
y2
=r
2
s( X )
x

(3.4)

onde
s( X ) =

xi2
e s (Y ) =
n 1

y i2
n 1

Mostraremos agora que o quadrado do coeficiente de correlao igual ao


produto das estimativas dos coeficientes de regresso de Y em relao a X e de X em

106

relao a Y. Representando essas estimativas por bY X e bX Y respectivamente, podemos


escrever

xy
xy
e b X Y =
2
x
y2

bY X =
Segue-se, imediatamente, que

r 2 = bY X b X Y

(3.5)

Para a amostra apresentada na tabela 3.1, temos:

bY X =

xy 4
=
= 0,25 ,
x 2 16
e

b X Y =

xy 4
= =1
y2 4

bY X b X Y = 0,25 = r 2

Tambm podemos obter as retas de regresso de Y em relao a X e de X em


relao a Y, que so, respectivamente,
Y = 5,5 + 0,25 X

e
X = 1 + Y

Figura 3.5. Retas de regresso de Y em relao a X e de X em relao a Y,


para os dados da tabela 3.1.

107

Para ilustrar melhor o conceito de correlao, consideremos um outro exemplo.


A tabela 3.2, transcrita de Yule e Kendall (1940), apresenta as freqncias (em
centenas) de casamentos na Inglaterra e na Irlanda, em 1933, conforme as idades do
marido (X) e da mulher (Y).
TABELA 3.2. Nmero de casamentos em funo da idade do marido e da mulher, na
Inglaterra e na Irlanda, em 1933.
Idade
da
mulher
15
20
25
30
35
40
45
50
55
60
65
70
Total

Idade do marido em anos (limite inferior do intervalo)


15

20

Total

25

30

35

40

45

50

55

60

65

70

75

33 189
56
18 682 585
1 140 511

11
75

2
10

52 1024 1238

8
106
179
101
24
5
1

424

2
19
40
42
28
9
3

143

5
14
20
19
14
5
1

78

2
6
10
13
12
9
3
1

56

1
3
5
8
10
9
7
3
1

47

1
2
5
6
7
6
5
1
1

34

1
1
2
4
4
5
4
4
1

26

1
1
2
3
3
3
3
3
1
20

1
1
1
1
2
2
1
9

288
1418
896
268
112

64

42

26

17

11
1
8
1
3
2 3153

Fonte:Yule e Kendall (1940), p. 198.

Podemos, para facilitar os clculos, utilizar as seguintes variveis auxiliares:

Vi =

X i 27,5
, i = 1, 2, ..., 13
5

(3.6)

e
Zj =

Y j 27,5
5

, j = 1, 2, ..., 12

(3.7)

Devemos ressaltar que o coeficiente de correlao entre V e Z igual ao


coeficiente de correlao entre X e Y (ver exerccio 3.9).
Note que essas variveis auxiliares assumem valor zero no ponto mdio da
classe de 25 a 30 anos e so medidas em unidades de 5 anos.
Representando por f ij as freqncias em cada cela, por Fi as freqncias totais
para cada classe de idade do marido e por Gi as freqncias totais para cada classe de
idade da mulher, temos:
108

V =

Z =

Vi Fi
922
=
= 0,2924
n
3153
Z jG j
n

742
= 0,2353
3153

vi2 Fi = Vi 2 Fi

( Vi Fi ) 2
922 2
= 9708
= 9438,39
n
3153

z Gj = Z Gj
2
j

2
j

( Z j G j ) 2
n

vi z j f ij = Vi Z j f ij

r=

vi z j f ij
( vi2 Fi )( z 2j G j )

= 7090

742 2
= 6915,38
3153

( Vi Fi )( Z j G j )
n

= 6256

922(742)
= 6472,98
3153

= 0,8012

As retas de regresso de Z em relao a V e de V em relao a Z so,


respectivamente,
Z = 0,2353 + 0,6858(V 0,2924)

e
V = 0,2924 + 0,9360( Z + 0,2353)

Considerando (3.6) e (3.7) obtemos, aps simplificaes, as equaes de


regresso de Y em relao a X e de X em relao a Y:
Y = 6,5 + 0,686 X

e
X = 4,3 + 0,936Y

interessante assinalar, na tabela 3.2, as celas modais das distribuies


condicionais de Y | X ; elas mostram, grosseiramente, a posio da reta de regresso de
Y em relao a X. Da mesma maneira, as celas modais das distribuies de X | Y
mostram, aproximadamente, a posio da reta de regresso de X em relao a Y.

109

3.2. Aplicao da anlise de regresso a uma populao com distribuio


normal bidimensional
O coeficiente de correlao de uma populao definido por
X X Y Y
= E

Y
X

cov( X , Y )
cov( X , Y )
=
=
XY
V ( X )V (Y )

Devemos lembrar, aqui, que:


a) Se X e Y so independentes, temos cov( X , Y ) = 0 e, portanto, = 0.
b) Dados cov( X , Y ) = 0 e = 0, no possvel concluir, em geral, que as
variveis so independentes. Isto mostrado no exemplo apresentado na
tabela 1.3 (seo 1.5) e no caso ilustrado na figura 3.4.
c) Se

as

variveis

tm

distribuio

normal,

demonstra-se

que

cov( X , Y ) = = 0 condio suficiente para que as variveis sejam

independentes.
Para fazer inferncia estatstica a respeito de , partindo do coeficiente de
correlao (r) da amostra, pressupomos que as variveis X e Y apresentam uma
distribuio normal bidimensional. Ento estamos excluindo casos como o representado
na figura 3.4.
Para testar a hiptese da nulidade H 0 : = 0 contra a hiptese alternativa

H A : 0 , utilizamos o teste
r 2 ( n 2)
F=
, com 1 e n 2 graus de liberdade.
1 r2
Pode-se verificar que o valor de F, obtido por essa frmula, igual ao valor de F
da anlise de varincia da regresso, obtido dividindo o quadrado mdio de regresso
pelo quadrado mdio residual. Portanto, testar a hiptese H 0 : = 0 equivale a testar a
hiptese H 0 : = 0 .
A funo de densidade de uma distribuio normal bidimensional corresponde a
uma superfcie cujas sees, tanto na direo do eixo dos X como na direo do eixo dos
Y, so curvas normais. As sees horizontais dessa superfcie so elipses de
isoprobabilidade, duas das quais esto traadas na figura 3.6.

110

Vamos mostrar agora que os pontos C, E, F e G da figura 3.6, onde retas


paralelas ao eixo dos Y tangenciam elipses de isoprobabilidade, so os pontos mdios
das distribuies condicionais de Y. Consideremos, particularmente, o plano
perpendicular ao eixo dos X passando por A; esse plano seciona infinitas elipses de
isoprobabilidade, mas todas elas de nvel inferior ao da elipse de isoprobabilidade que
tangencia o plano em C, que , portanto, a moda da curva normal definida pela
interseco do plano em questo com a superfcie de densidade da populao
bidimensional. Como a moda de uma distribuio normal coincide com a mdia,
conclumos que o ponto C corresponde mdia da distribuio de Y, dado X = OA .
Para os pontos E, F e G vale, evidentemente, o mesmo raciocnio. Considerando, ainda,
que, se pode demonstrar que as distribuies condicionais de Y tm varincia constante,
conclumos que a reta GC a verdadeira reta de regresso de Y em relao a X, ou seja,
a reta E (Y | X ) = + X .
Pode-se mostrar, analogamente, que a reta PL a verdadeira reta de regresso de
X em relao a Y.
A reta E (Y | X ) = + X (ou uma estimativa obtida de uma amostra) poderia
ser usada para, dado um valor de X, prever o correspondente valor de Y.
Consideremos, por exemplo, que X e Y so, respectivamente, as notas de
Matemtica e Estatstica obtidas por alunos dessas duas disciplinas. Se um aluno obteve
nota OA em Matemtica, prev-se que obtenha nota AC em Estatstica. interessante
notar que AC uma mdia ponderada de AD e AB = Y , com os pesos dependendo
do valor de . Para entender isso, consideremos, inicialmente, os casos extremos de

= 1 e = 0. medida que aumenta, as elipses de isoprobabilidade se alongam na


direo do seu eixo principal e o ngulo entre as retas de regresso GC e PL diminui, de
maneira que no limite, quando = 1, as retas de regresso GC e PL coincidem com o
eixo principal e a melhor estimativa de Y para X = OA seria AD . Por outro lado,
quando = 0, isto , quando no existe correlao, a melhor estimativa de Y ser Y ,
qualquer que seja o valor de X. Num caso intermedirio em que 0 < < 1 , a melhor
estimativa de Y para X = OA estar entre os valores AB = Y e AD , sendo prxima de
AB quando for pequeno e se aproximando de AD medida que se aproxima de 1.

111

Figura 3.6. As elipses de isoprobabilidade de uma distribuio normal bidimensional e


as retas de regresso de Y em relao a X e de X em relao a Y.

EXERCCIOS
3.1. Calcule o coeficiente de correlao para a seguinte amostra de 10 pares de valores
X i , Yi .
Xi

Yi

Xi

Yi

5
5
6
6
7

1
3
1
5
3

7
8
8
9
9

7
5
9
7
9

a) Teste, ao nvel de significncia de 1%, a hiptese de nulidade H 0 : = 0


contra a hiptese alternativa 0.
b) Determine as retas de regresso de Y em relao a X e de X em relao a Y.
Verifique que bY X b X Y = r 2 .
c) Admitindo que X e Y tenham distribuio normal bidimensional, qual a
estimativa de Y para X = 4? E para X = 9? Qual a estimativa de X para Y = 3?
E para Y = 9?

112

3.2. Sendo o ngulo entre as retas de regresso de Y em relao a X e de X em


relao a Y, prove que
1 r2
1 r2
s ( X ) s (Y )
tg =
=
2
bY X + b X Y
r
s ( X ) + s 2 (Y )
Com base nesta relao determine o ngulo formado pelas duas retas de regresso
no caso da amostra de 6 pares de valores da tabela 3.1.

3.3. Dados:
X

2
4
5
6
8
11

18
12
10
8
7
5

X = 36 ; X 2 = 266 ; Y = 60 ; Y 2 = 706 ; XY = 293


a) Determine o coeficiente de correlao entre X e Y.
b) Determine as estimativas dos parmetros da equao de regresso linear de Y
em relao a X.
c) Admitindo que as variveis X e Y esto relacionadas de acordo com o modelo
Yi = + X i + u i , onde ui so erros com mdia zero, varincia constante e
distribuio normal, teste a hiptese da nulidade H 0 : = 1 , contra a hiptese
alternativa H A : > 1 , considerando um nvel de significncia de 5%.
3.4. Com base no grfico dado a seguir, determine geometricamente (sem usar as
frmulas comuns de anlise de regresso):
a) A reta de regresso de Y em relao a X.
b) A reta de regresso de X em relao a Y.
c) O coeficiente de correlao (r).
d) O valor estimado de Y para X = 1.
e) O valor estimado de X para Y = 1.

113

3.5. Com base no grfico dado a seguir, determine geometricamente (sem usar as
frmulas comuns de anlise de regresso):
a) A reta de regresso de Y em relao a X.
b) A reta de regresso de X em relao a Y.
c) O coeficiente de correlao (r).
d) O valor estimado de Y para X = 60.
e) O valor estimado de X para Y = 30.

3.6. Os dados a seguir foram apresentados em defesa da tese de que dietas com alto
teor de protena reduzem a fertilidade. a) Estabelea, sem calcular, o sinal do
coeficiente de correlao entre as duas variveis. b) Discuta se dados desse tipo
so apropriados para estabelecer relaes de causa-e-efeito entre essas variveis.

114

Pais
Formosa
Malaia
ndia
Japo
Iugoslvia
Grcia
Itlia
Bulgria
Alemanha
Irlanda
Dinamarca
Austrlia
EUA
Sucia

Taxa de
Natalidade
45,6
39,7
33,0
27,0
25,9
23,5
23,4
22,2
20,0
19,1
18,3
18,0
17,9
15,0

Teor de protena
na dieta
4,7
7,5
8,7
9,7
11,2
15,2
15,2
16,8
37,3
46,7
56,1
59,9
61,4
62,6

3.7. Com base em uma amostra de 200 pares de valores para as variveis X e Y
obtivemos um coeficiente de correlao igual a 0,02. Podemos afirmar que no
existe relao entre essas variveis? Explique.
3.8. Com base nos valores de renda per capita ( X 1 ) e da porcentagem de analfabetos (

X 2 ) para 20 pases latino-americanos em 1950, obtivemos o coeficiente de


correlao r = 0,6.
a) Esse resultado estatisticamente significativo ao nvel de 1%?
b) Interprete o resultado do ponto de vista estatstico e econmico-social.
3.9. So dados n pares de valores X i , Yi cujo coeficiente de correlao r. Sendo
Z i = a + bYi e Vi = k + hX i , demonstre que o coeficiente de correlao entre Vi e
Z i igual a r, se bh > 0, e igual a r, se bh < 0 (a, b, k e h so constantes).
3.10. So dados os valores de Z i (i = 1, ..., n). Definimos X i =

a
b
e Yi =
.
Zi
Zi

Demonstre que, se a e b so constantes positivas, o coeficiente de correlao entre


X i e Yi igual a 1.

115

3.11. O coeficiente de correlao entre as variveis X e Y r = 0,60. Sabendo que


s(X) = 1,50, s(Y) = 2,00, X = 10 e Y = 20 , determine a equao de regresso de Y
em relao a X.
3.12. Com base em uma amostra de 27 pares de valores foi obtido o coeficiente de
correlao r = 0,40. Teste, ao nvel de significncia de 5%, a hiptese de que o
coeficiente de correlao das variveis zero.
3.13. O coeficiente de correlao obtido de uma amostra de n pares de valores X i , Yi
r = 4/5. Sabendo que s(X) = 3 e s(Y) = 5, determine o coeficiente de regresso de Y
em relao a X.
3.14. A partir de uma amostra aleatria com n observaes, foi obtida a equao de
regresso
Y = 10 0,28 X

Determine o coeficiente de correlao entre X e Y sabendo que


x2
y2
2
s (X ) =
= 25 e s (Y ) =
=4
n 1
n 1
2

3.15. Para duas variveis negativamente correlacionadas, foram obtidos: X = 0 ,


Y = 12 , s(X) = 8, s(Y) = 10 e r 2 = 0,64 . Determine a equao de regresso de Y
em relao a X.
3.16. Dados
X

0
2
4
6

2
2
4
8

a) Determine as estimativas dos parmetros do modelo Yi = + X i + u i .


b) Calcule o coeficiente de determinao da regresso ( rYX2 ).
c) Calcule os 4 valores de Yi e determine o valor do quadrado do coeficiente de
correlao ( rY2Y ) entre Yi e Yi . Verifique que esse valor igual ao valor do
coeficiente de determinao, calculado no item (b).

116

d) Demonstre que o coeficiente de determinao de uma regresso ( rYX2 ) sempre


igual ao quadrado do coeficiente de correlao entre os valores observados e
os valores estimados da varivel dependente ( rY2Y ).
3.17. Seja r o coeficiente de correlao entre as variveis X i e Yi em uma amostra com
n observaes. Definimos as variveis reduzidas
x
wi = i , com xi = X i X e s ( X ) =
s( X )

zi =

yi
, com y i = Yi Y e s (Y ) =
s(Y )

xi2
, e
n 1

y i2
n 1

Seja c a estimativa do coeficiente de regresso de z i contra wi , de acordo com o


mtodo de mnimos quadrados.
a) Deduza a relao entre r e c.
b) Deduza expresses que dem a S.Q.Total e a S.Q.Regresso da regresso de
z i contra wi em funo de r e n.

RESPOSTAS
3.1. a) r = 0,8; F = 14,22, significativo
b) Y = 6,2 + 1,6 X e X = 5 + 0,4Y
c) Para X = 4, temos Y = 0,2 e para X = 9, temos Y = 8,2
Para Y = 3, temos X = 6,2 e para Y = 9, temos X = 8,6
3.2. = 30 o 58
3.3. a) r = 0,92
b) Y = 18,04 1,34 X
c) no se rejeita H 0 : = 1
3.4. a) Y = 2 + 0,5 X
b) X = 1 + Y

117

c) r = 0,7071
d) Y = 2,5
e) X = 0
3.5. a) Y = 10 + 0,25 X
b) X = 20 + Y
c) r = 0,5
d) Y = 25
e) X = 50
3.6. a) A correlao negativa.
b) Tais dados no permitem estabelecer relao de causa-e-efeito. Outras
variveis, como renda per capita, deveriam ser consideradas na anlise. Os
dados podem ser teis para sugerir pesquisas mdico-biolgicas sobre
possveis relaes causais entre consumo de protena e fertilidade.
3.7. Correlao linear igual a zero no implica ausncia de relao entre as variveis.
3.8. a) F = 10,12 ou t = 3,18, significativos.
Renda per capita e proporo de analfabetos se mostram negativamente
correlacionados. Esse resultado estatstico no prova a existncia de uma
relao de causa-e-efeito. No caso, sabemos que existe causao nos dois
sentidos. Analfabetismo implica baixo nvel tecnolgico, baixa produtividade
e baixa renda per capita. Pobreza, por outro lado, significa falta de recursos,
dificultando a analfabetizao.
3.11. Y = 12 + 0,8X
3.12. F = 4,76, significativo
3.13. b= 4/3
3.14. r = 0,7
3.15. Y = 12 X
3.16. a) Y = 1 + X
b) r 2 = 5 / 6
3.17. a) r = c

118

b) S.Q.Total = z i2 = n 1
S.Q.Regr. = r 2 (n 1)

119

4. REGRESSO LINEAR MLTIPLA


4.1. O modelo estatstico de uma regresso linear mltipla
Temos uma regresso linear mltipla quando admitimos que o valor da varivel
dependente funo linear de duas ou mais variveis explanatrias. O modelo
estatstico de uma regresso linear mltipla com k variveis explanatrias :
Y j = + 1 X 1 j + 2 X 2 j + ... + k X kj + u j ,

j = 1, ..., n

ou
k

Y j = + i X ij + u j

(4.1)

i =1

Utilizando notao matricial o modelo fica


y = X + u

(4.2)

onde

Y1
Y
y = 2
M

Yn

1
= 2

M
k

1
1
X=
M

X 11
X 12
M
X 1n

X 21
X 22
M
X 2n

K
K
K

X k1
X k2
M

X kn

u1
u
u = 2
M

u
n

Mantemos, com algumas modificaes, as pressuposies apresentadas na seo


2.1:
I)

a varivel dependente ( Y j ) funo linear das variveis explanatrias ( X ij ,


i = 1,..., k);

II)

os valores das variveis explanatrias so fixos;

III)

E (u j ) = 0 , ou seja, E (u) = 0 , onde 0 representa um vetor de zeros;

IV)

os erros so homocedsticos, isto , E (u 2j ) = 2 ;

120

V)
VI)

os erros so no-correlacionados entre si, isto , E (u j u h ) = 0 para j h;


os erros tm distribuio normal.
Combinando as pressuposies IV e V temos
E (uu ) = I 2

(4.3)

Seja p = k + 1 o nmero de parmetros a serem estimados ( , 1 , K , k ). Se


dispomos de apenas p observaes, a determinao dos parmetros se reduz a um
problema matemtico de resoluo de um sistema de p equaes com p incgnitas, no
sendo possvel fazer qualquer anlise estatstica. Devemos, portanto, ter n > p. Alm
disso, veremos que para obter as estimativas de mnimos quadrados dos parmetros a
matriz X X deve ser no-singular, isto , sua caracterstica deve ser igual a p. Isso
significa que a caracterstica de X deve ser igual a p. Nas dedues que se seguem
admitiremos que essas condies so observadas, isto , admitiremos que X tem
caracterstica p = k + 1 < n.
Da mesma maneira que na regresso linear simples, as pressuposies I, II e III
so necessrias para demonstrar que os estimadores de mnimos quadrados so notendenciosos e as cinco primeiras pressuposies permitem demonstrar que tais
estimadores so estimadores lineares no-tendenciosos de varincia mnima (teorema de
Gauss-Markov). A pressuposio VI necessria para realizar testes de hiptese e para
construir intervalos de confiana para os parmetros.

4.2. Estimativas dos parmetros de acordo com o mtodo dos mnimos


quadrados
Sejam b e e os vetores das estimativas dos parmetros e dos desvios,
respectivamente, isto ,

a
b
1
b = b2

M
bk

e1
e
e = 2
M

e n

121

Temos
y = Xb + e = y + e

(4.4)

e
e = y Xb = y y

onde
Y1

Y
y = 2
M

Yn
A soma dos quadrados dos desvios dada por
Z = e e = ( y b X )( y Xb ) = y y y Xb b X y + b X Xb

As matrizes y Xb e b X y so iguais, pois uma a transposta da outra e cada


uma tem apenas um elemento. Ento
Z = y y 2b X y + b X Xb

(4.5)

A funo Z apresenta ponto de mnimo para os valores de b que tornem sua


diferencial identicamente nula, isto :
dZ = 2( db ) X y + ( db ) X Xb + b X X( db ) 0

Como ( db ) X Xb = b X X( db ) , por serem matrizes com apenas um elemento e


uma ser a transposta da outra, segue-se que
2( db ) X y + 2( db ) X Xb 0

ou
( db )( X Xb X y ) 0

Portanto, a diferencial de Z ser identicamente nula para


X Xb = X y

(4.6)

que o sistema de equaes normais.


Se X X no singular, existe a matriz inversa ( X X )1. Pr-multiplicando os
dois membros de (4.6) por ( X X )1, obtemos

122

b = ( XX) 1 Xy

(4.7)

A primeira etapa dos clculos para obteno das estimativas dos parmetros a
construo das matrizes

n
X
1j

XX = X 2 j

M
X kj

X1j

X2j

X
X1j X 2 j

X1j X 2 j
X 22 j

X 1 j X kj

X 2 j X kj

2
1j

X kj
K X 1 j X kj
K X 2 j X kj

X kj2
K

Yj
X Y
1j j

Xy = X 2 j Y j

X kj Y j

Veremos, adiante, que essas matrizes so necessrias em vrias outras fases da


anlise de regresso linear mltipla.
Do sistema de equaes normais podemos obter outros resultados de interesse.
De (4.6) segue-se que
X y X Xb = 0

onde 0 representa um vetor cujos elementos so todos iguais a zero.


Ento
X ( y Xb ) = 0

ou

Xe = 0

(4.8)

Essa relao matricial significa que


ej = 0

e
X ij e j = 0 para i = 1, ..., k

Note-se que a nulidade da soma dos desvios ( e j = 0) decorre do fato de o


modelo ter um termo constante (), fazendo com que a primeira coluna de X seja um
vetor com todos os elementos iguais a 1.

123

Sendo nula a soma dos desvios, conclumos que


Y j = Y j

(4.9)

Mostraremos, a seguir, que b = ( XX) 1 Xy um estimador no-tendencioso de


. Substituindo (4.2) em (4.7) obtemos

b = ( XX) 1 X( X + u)
ou
b = + ( XX) 1 Xu

(4.10)

Lembrando as pressuposies II e III, verificamos que


E (b) = , c.q.d.

4.3. Varincias e covarincias das estimativas dos parmetros


A matriz
E[(b )(b ) ]

por definio, a matriz das varincias e covarincias das estimativas dos parmetros,
pois
E[(b )(b ) ] =

E (a ) 2
E (a )(b1 1 ) K E (a )(bk k )

E (a )(b1 1 )
E (b1 1 ) 2
K E (b1 1 )(bk k )

M
M
M

E (bk k ) 2
E (a )(bk k ) E (b1 1 )(bk k ) K

Considerando (4.10) e notando que a matriz X X simtrica e, portanto, igual


sua transposta, obtemos
E[(b )(b )] = E[(XX) 1 Xuu X( XX) 1 ]
De acordo com (4.3) e com a pressuposio II, segue-se que
E[(b )(b )] = ( XX) 1 XI 2 X( XX) 1
ou
E[(b )(b )] = ( XX) 1 2

(4.11)

124

4.4. Varincia de uma combinao linear das estimativas dos parmetros


Seja c um vetor-linha com p = k + 1 constantes:
c = [c0

c1

c2 K ck ]

Determinemos a varincia de cb .
Sabemos que
E (b) =

Ento
E (cb ) = c

Desde que cb uma matriz com um nico elemento, temos


V (cb) = E (cb c) 2 =
= E[c(b )]2 =
= E[c(b )(b )c]

Considerando (4.11) obtemos


V (cb) = c( XX) 1 c 2

(4.12)

Uma aplicao importante desse resultado a determinao da varincia da


estimativa ( Yh ) de um valor da varivel dependente.
Considerando o modelo de regresso linear mltipla
Y j = + 1 X 1 j + 2 X 2 j + K + k X kj + u j , j = 1, ..., n

ou
y = X + u ,

a estimativa do valor de Y, dados os valores X 1h , X 2 h ,K, X kh das variveis


explanatrias,

Yh = a + b1 X 1h + b2 X 2 h + K + bk X kh
ou

Yh = xh b ,

(4.13)

125

onde
x h = [1

X 1h

X kh ]

X 2h

O vetor x h pode ou no ser uma das linhas da matriz X.


Em (4.13) notamos que Yh uma combinao linear das estimativas dos
parmetros. Ento, de acordo com (4.12), obtemos

V (Yh ) = xh ( XX) 1 x h 2

(4.14)

4.5. Anlise de varincia da regresso linear mltipla


De (4.5) e (4.6) segue-se que a soma de quadrados dos desvios, ou soma de
quadrados residual, dada por
e e = y y 2b X y + b X y

ou
S.Q.Res. = e e = y y b X y

(4.15)

Sabemos que a soma de quadrados total dada por

S.Q.Total = y = Y
2
j

2
j

( Y j ) 2
n

= y y

( Y j ) 2
n

(4.16)

A soma de quadrados de regresso dada por


S.Q.Regr. = (Y j Y ) 2 = y 2j =
= Y j2
= y y

( Y j ) 2
n

( Y j ) 2

= ( Xb)Xb

= bXXb

=
=

( Y j ) 2
n

( Yj ) 2
n

Considerando (4.6) e (4.9) segue-se que


126

S.Q.Regr. = bXy

( Y j ) 2
n

(4.17)

De (4.15), (4.16) e (4.17), conclumos que


S.Q.Res. = (S.Q.Total) (S.Q.Regr.)
Sendo p = k + 1 o nmero de parmetros da regresso, podemos demonstrar que

E(S.Q.Res.) = (n p) 2 .
Para isso definimos, inicialmente, as matrizes

H = X( XX) 1 X
e

M = I X( XX) 1 X = I H
As matrizes H e M so simtricas e idempotentes, isto ,

H = H

'

M = M

'

HH = H
MM = M

(4.18)

Verifica-se, tambm que

HX = X ou X H = X
e

MX = 0 ou XM = 0

'

(4.19)

onde 0 uma matriz de zeros.


Temos que

e = y y = y Xb = y X( XX) 1 Xy =
= [I X( XX) 1 X]y =
= My = M ( X + u)

Considerando (4.19), segue-se que

e = Mu

(4.20)

S.Q.Res. = ee = uMu

(4.21)

De (4.18) e (4.20) segue-se que

127

Como ee uma matriz com apenas um elemento temos que


e e = tr (u Mu )

Lembrando o teorema de lgebra de matrizes que estabelece que o trao de um


produto de matrizes no afetado por uma mudana na ordem dos fatores, desde que o
novo produto tambm seja definido, obtemos
e e = tr (uu M )

Considerando (4.3) e a pressuposio II, segue-se que


E(S.Q.Res.) = E (ee) = 2 tr (M )
Mas
tr(M) = tr [I X( XX) 1 X] = n (k + 1) = n p
Ento
E(S.Q.Res.) = (n p ) 2 ,

(4.22)

c.q.d.
Nos exerccios 4.25 e 4.26 indicada a maneira como podemos obter as
expresses para E(S.Q.Total.) e E(S.Q.Regr.).
Esses resultados nos levam construo do seguinte esquema de anlise de
varincia:
Anlise de Varincia
C.V.
Regresso
Resduo
Total

G.L.
k=p1
np
n1

S.Q.

b Xy

( Y j ) 2
n

y y b X y

y y

( Y j ) 2
n

O quadrado mdio residual, dado pelo cociente S.Q.Res./(n p), , portanto,


uma estimativa no-tendenciosa da varincia do erro ( 2 ). Substituindo 2 por

128

s 2 = Q.M.Res. na expresso (4.11) obtemos a matriz das estimativas das varincias e

covarincias das estimativas dos parmetros:


V (b) = ( X X) 1 s 2

(4.23)

possvel demonstrar que, se os erros u j tm distribuio normal e se 1 =

2 = K = k = 0 , o cociente
F=

Q.M.Regr.
Q.M.Res.

tem distribuio de F com k e n p graus de liberdade. Ento, o valor F assim obtido


utilizado para testar a hiptese
H 0 : 1 = 2 = K = k = 0
Obtidas as estimativas dos desvios padres das estimativas dos parmetros,
dadas pelas razes quadradas dos elementos da diagonal principal da matriz ( XX) 1 s 2 ,
podemos utilizar o valor

t=

bi i
,
s(bi )

(4.24)

associado a n p graus de liberdade, para testar hipteses a respeito dos valores dos
parmetros.
Podemos, ainda, construir intervalos de confiana para os parmetros. Escolhido
o nvel de confiana, e sendo t 0 o correspondente valor crtico de t, o intervalo de
confiana para i
bi t 0 s (bi ) < i < bi + t 0 s (bi )

(4.25)

Devemos ressaltar que tanto o teste t como o intervalo de confiana s so


vlidos se os erros u j tiverem distribuio normal.
O coeficiente de determinao mltipla definido por
R2 =

S.Q.Regr.
S.Q.Total

129

e mostra a proporo da soma de quadrados total que explicada pela regresso


mltipla.
Temos que
1 R2 =

S.Q.Res.
S.Q.Total

O coeficiente de determinao corrigido para graus de liberdade definido por


1
(S.Q.Res.)
n p
n 1
2
1 R =
=
(1 R 2 )
1
n p
(S.Q.Total)
n 1
ou
R 2 = R2

p 1
(1 R 2 )
n p

4.6. Demonstrao de que b um estimador linear no-tendencioso de


varincia mnima
Para demonstrar que os estimadores de mnimos quadrados so estimadores
lineares no-tendenciosos de varincia mnima, vamos considerar, inicialmente, a
combinao linear c dos parmetros. Um estimador de = c cb = c( XX) 1 Xy .
Na seo 4.4 vimos que cb um estimador no-tendencioso de c e que, de acordo
com (4.12), sua varincia
V (cb) = c( XX) 1 c 2
Consideremos um estimador linear qualquer = g y de = c . Note que cb
um caso particular de , com g = c ( X X) 1 X
Temos

= g y = g ( X + u ) = g X + g u

(4.26)

Ento, para que seja um estimador no-tendencioso de c , isto , para que


tenhamos E( ) = c , devemos ter
g X = c

(4.27)

130

De acordo com (4.12) e (4.27), obtemos


V (c b) = g X( X X) 1 X g 2

(4.28)

De (4.26), obtemos
E () = g u

Donde
V ( ) = E[ E ()] 2 =
= E (g uu g )

Como E (uu ) = I 2 , podemos escrever


V ( ) = g g 2

(4.29)

De (4.28) e (4.29) segue-se que


V ( ) V (c b ) = [g g g X( X X) 1 X g ] 2 =

= g [I X( XX) 1 X]g 2 =
= g Mg 2
Vimos, em (4.21), que ee = uMu . Ora, ee 0 porque uma soma de
quadrados. Portanto M uma matriz semidefinida positiva e g Mg 0 . Conclumos
ento que
V ( ) V (c b ) ,

(4.30)

onde = g y qualquer estimador linear no-tendencioso de c .


Consideremos o caso particular em que

c = [0 K 0 1 0 K 0] ,
isto , o i-simo elemento do vetor c igual a um, e todos os outros so iguais a zero.
Ento a desigualdade (4.30) fica

V () V (bi )
onde = g y qualquer estimador linear no-tendencioso de i .

131

Esse resultado mostra que, dentre os estimadores lineares no-tendenciosos, bi


o que tem menor varincia, isto , os estimadores de mnimos quadrados so
estimadores lineares no-tendenciosos de varincia mnima.

4.7. O uso das variveis centradas


Para simplificar os clculos, muitas vezes trabalhamos com as variveis
centradas

xij = X ij X i , i = 1, 2, ..., k
onde

Xi =

1 n
X ij
n j =1

Neste caso o modelo estatstico fica


Y j = 0 + 1 x1 j + K + k x kj + u j , j = 1, 2, ..., n

ou em notao matricial,
y = X + u

com as devidas mudanas nas definies das matrizes X e .


As matrizes X X e X y ficam

0
n
0
x12j

XX = 0 x1 j x 2 j

M
M
0 x1 j x kj

0
x1 j x 2 j
x 22 j
M
x 2 j x kj

K x1 j x kj
K x 2 j x kj

M
K x kj2
K

Yj
x Y
1j j
Xy = x 2 j Y j

M
x kj Y j

132

Decompondo a matriz X X apropriadamente, o elemento igual a n pode ser


invertido separadamente. Ento a estimativa de 0
b0 =

Y j

=Y

Verifica-se que a expresso (4.15) pode ser escrita como segue:


n

j =1

j =1

i =1

j =1

S.Q.Res. = Y j2 Y Y j bi xij Y j
Como

Y Y Yj = Y
2
j

2
j

( Y j ) 2
n

= S.Q.Total,

conclumos que
k

i =1

j =1

S.Q.Regr. = bi xij Y j

(4.31)

Determinadas as estimativas dos parmetros do modelo simplificado, se


quisermos escrever a equao estimada com as variveis na forma original, basta
calcular a estimativa de , dada por
a = Y bi X i

(4.32)

s vezes, os clculos so feitos com todas as variveis centradas, inclusive a


varivel dependente, ou seja, utilizamos

y j = Yj Y
Se somarmos, membro a membro, as relaes (4.1), para j = 1, 2, ..., n, e
dividirmos por n, obtemos
k

Y = + i X i + u
i =1

(4.33)

onde
u=

1
u j
n

Subtraindo (4.33) das relaes (4.1) obtemos


k

y j = i xij + u j u
i =1

133

ou
y = X + u u

(4.34)

onde

y1
y
y = 2
M

yn

x11
x
X = 12
M

x1n

x 21 K x k 1
x 22 K x k 2
M
M

x 2 n K x kn

1

= 2
M

k

e u um vetor-coluna com n elementos iguais a


u=

1
u j
n

fcil verificar que, neste caso, a matriz X X igual do modelo onde apenas
as variveis independentes so centradas excluindo a primeira linha e a primeira coluna,
e a matriz X y igual do mesmo modelo, excluindo apenas o primeiro elemento. Os
termos y y e b X y de (4.15) correspondem, respectivamente, soma de quadrados
total e soma de quadrados de regresso, de maneira que o coeficiente de determinao

R2 =

b Xy
y y

As propriedades dos estimadores no so afetadas pelo uso de variveis


centradas. Assim, substituindo (4.34) na expresso

b = ( XX) 1 Xy
obtemos

b = ( XX) 1 X( X + u u ) =
= + ( XX) 1 Xu ( XX) 1 Xu

(4.35)

primeira vista, o resultado obtido em (4.35) diferente da expresso (4.10),


obtida quando as variveis no so centradas. Entretanto, os elementos do vetor Xu ,
com variveis centradas, so

x ij u = u x ij = 0
j

Ento, a expresso (4.35) fica

b = + ( XX) 1 Xu ,
que a relao (4.10).
Assim, da mesma maneira que no modelo sem centrar as variveis, temos:

134

E (b ) =

e
V (b) = ( XX) 1 2
4.8.

Exemplo de uma regresso linear mltipla com duas variveis


explanatrias

Na tabela 4.1 apresentamos os valores de uma amostra de 5 observaes das


variveis Y j , X 1 j e X 2 j .
TABELA 4.1. Valores de trs variveis em uma amostra de 5 observaes.
Yj

X1j

X2j

16,5

1,0

14,0

3,5

6,0

4,0

10,0

7,5

3,5

9,0

Obtemos:
Y j = 50

X 1 j = 25

X 2 j = 20

Y = 10

X1 = 5

X2 = 4

y 2j = 116,5

x12j = 41,5

x 22 j = 10

x1 j Y j = 54

x 2 j Y j = 30

x1 j x 2 j = 20

Tendo em vista o modelo


Y j = 0 + 1 x1 j + 2 x 2 j + u j ,

construmos as matrizes
n
0

x12j
X X = 0
0 x1 j x 2 j

5 0
0

x1 j x 2 j = 0 41,5 20
x 22 j 0 20 10
0

135

Y j 50

X y = x1 j Y j = 54
x 2 j Y j 30

A seguir, determinamos as estimativas dos parmetros

1
50 10
0
0
5

2
4
b = ( XX) 1 Xy = 0
54 = 4
3
3

0 4 83

3 30 30 11
A equao estimada , ento,

Y j = 10 + 4 x1 j 11x 2 j
Como
x1 j = X 1 j 5

e
x2 j = X 2 j 4

obtemos

Y j = 34 + 4 X 1 j 11X 2 j
De acordo com (4.31), temos
S.Q.Regr. = b1 x1 j Y j + b2 x 2 j Y j =
= 4 ( 54) 11 ( 30) = 114

Ento
S.Q.Res. = y 2j 114 = 116,5 114 = 2,5
Poderamos, tambm, ter obtido o valor da soma de quadrados residual de
(4.15):
S.Q.Res. = y y b X y =
= 616,5 614 = 2,5

136

Com esses resultados podemos construir a tabela de anlise da varincia.


TABELA 4.2. Anlise da Varincia
C.V.

G.L.

S.Q.

Q.M.

Regresso

114,0

57

Resduo

2,5

1,25

Total

116,5

F
45,6

Para 2 e 2 graus de liberdade e ao nvel de significncia de 5%, o valor crtico de


F 19,00. Portanto, o resultado significativo, isto , rejeita-se, a esse nvel de
significncia, a hiptese H 0 : 1 = 2 = 0 , Um bom programa para computador informa
que a probabilidade caudal associada a F = 45,6, com 2 e 2 graus de liberdade, 0,0215,
permitindo concluir que o resultado significativo ao nvel de 5%, sem necessidade de
obter o valor crtico de F.
O coeficiente de determinao mltipla
R2 =

114
= 0,9785
116,5

isto , 97,85% da soma de quadrados total explicada pela regresso linear ajustada.
Conforme a definio apresentada no final da seo 4.5, podemos verificar que o
coeficiente de determinao corrigido para graus de liberdade R 2 = 0,9571 .
Como s 2 = 1,25 temos, de acordo com (4.23), as seguintes estimativas das
varincias e covarincias das estimativas dos parmetros:
1,25
V (b0 ) = s 2 (b0 ) = s 2 (Y ) =
= 0,25
5
2
5
V (b1 ) = s 2 (b1 ) = 1,25 = = 0,8333
3
6
83
83
V (b2 ) = s 2 (b2 ) =
1,25 =
= 3,4583
30
24
cv(Y , b1 ) = cv(Y , b2 ) = 0
4
5
cv(b1 , b2 ) = 1,25 =
3
3
Temos que
a = Y b1 X 1 b2 X 2
Ento

137

V (a ) = V (Y ) + X 12V (b1 ) + X 22V (b2 ) 2 X 1 cov(Y , b1 )


2 X 2 cov(Y , b2 ) + 2 X 1 X 2 cov(b1 , b2 )
e
5
83
5
V ( a ) = 0,25 + 5 2 + 4 2
+ 2 5 4 = 9,75
6
24
3
Se tivssemos utilizado o modelo com as variveis no centradas, a estimativa
da varincia de a seria dada pelo primeiro elemento da diagonal principal de ( XX) 1 s 2 .
Podemos, agora, testar hipteses a respeito dos valores dos parmetros.
Adotando o nvel de significncia de 5%, consideremos as seguintes hipteses:
a) H 0 : = 50 contra H A : < 50
Temos

t=

34 50
9,75

= 5,124

O resultado significativo, pois a regio de rejeio para esse teste unilateral


t 2,920 . Portanto, ao nvel de significncia de 5%, rejeitamos a hiptese

H 0 : = 50 , em favor da hiptese H A : < 50 .


b) H 0 : 1 = 0 contra H A : 1 0
Calculamos

t=

40
0,8333

= 4,382

Como o valor crtico de t para 2 graus de liberdade e ao nvel de significncia de


5% 4,303, o resultado obtido significativo, isto , rejeitamos, a esse nvel, a hiptese
de que 1 = 0 . Um bom programa de computador fornece a probabilidade caudal
associada ao t calculado (t = 4,382), isto , a probabilidade de, na distribuio de t com
2 graus de liberdade, essa varivel assumir valor absoluto maior do que 4,382. Essa
probabilidade 0,0483, permitindo concluir que o resultado significativo ao nvel de
5%, sem necessidade de obter o valor crtico de t.
c) H 0 : 2 = 0 contra H A : 2 0
Obtemos

t=

11 0
3,4583

= 5,915 , significativo

138

Neste exemplo rejeitamos, ao nvel de significncia de 5%, a hiptese


H 0 : 1 = 2 = 0 e tambm rejeitamos, ao mesmo nvel de significncia, tanto a
hiptese H 0 : 1 = 0 como a hiptese H 0 : 2 = 0 . Quando o teste F da anlise de
varincia de uma regresso linear mltipla significativo (rejeitando-se a hiptese de
que 1 = 2 = K = k = 0 ), comum que pelo menos um dos valores de

t=

bi
, i = 1, 2, ..., k
s(bi )

seja significativo, considerando-se um teste bilateral com o mesmo nvel de


significncia. Mas nem sempre isso acontece, podendo ocorrer que, apesar de o teste F
da anlise de varincia da regresso ser significativo, nenhum dos testes t para as
hipteses H 0 : i = 0 , (para i = 1, 2, ..., k) seja significativo, como mostra o exemplo
apresentado na seo 4.12, na qual esse assunto ser melhor analisado.

4.9. Previso e teste de hipteses a respeito do valor de combinaes


lineares dos parmetros
Consideremos o modelo de regresso linear mltipla
Y j = + 1 X 1 j + 2 X 2 j + K + k X kj + u j , j = 1, ..., n

ou
y = X + u

Na seo 4.4 vimos que, dados os valores X 1h , X 2 h , K , X kh das variveis


explanatrias, a estimativa de
E (Yh ) = + 1 X 1h + 2 X 2 h + K + k X kh = xh

Yh = a + b1 X 1h + b2 X 2 h + K + bk X kh = xh b
onde
x h = [1

X 1h

X 2h

X kh ]

Devemos ressaltar que o vetor x h pode ou no ser uma das linhas da matriz X.
De acordo com (4.14), temos
139

V (Yh ) = xh ( XX) 1 x h s 2

(4.36)

Obtida a estimativa da varincia de Yh , dada por (4.36), podemos construir o


intervalo de confiana para E (Yh ) = xh . Sendo t 0 o valor crtico de t com n p graus
de liberdade e ao nvel de confiana adotado, o intervalo de confiana

xh b t 0 x h ( XX) 1 x h s 2 < E (Yh ) < xh b + t 0 xh ( XX) 1 x h s 2

(4.37)

Consideremos, mais uma vez, o exemplo numrico da tabela 4.1. Tendo em vista
o modelo5
Y j = 0 + 1 x1 j + 2 x 2 j + u j

obtivemos, anteriormente, as matrizes

( X X) 1

1
5

2
3

4

3

83

30

4
3

10
b = 4
11
Consideremos X 1h = 7 e X 2 h = 1 . Uma vez que estamos fazendo os clculos
tendo em vista o modelo com as variveis explanatrias centradas, e lembrando que

X 1 = 5 e X 2 = 4 , obtemos x1h = 2 e x 2 h = 3 e fazemos


x h = [1

3]

Ento,

Se considerarmos o modelo em que todas as variveis, incluindo a dependente, so centradas,


obteremos, atravs de (4.14), a varincia y h = Yh Y . Como as covarincias entre Y e bi (i = 1, 2, ..., k)
so nulas, a varincia de Y dada por
h

V (Yh ) = V ( y h ) +
n

140

Yh = xh b = 51
Lembrando que s 2 = Q.M.Res. = 1,25 , obtemos, de acordo com (4.36),

V (Yh ) = xh ( XX) 1 x h s 2 =
1

0
0
5
1

2
4
1,25 = 54,708
= [1 2 3] 0

3
3 2

4 83
0

3 30 3

Para um nvel de confiana de 95%, o valor crtico de t com 2 graus de liberdade


4,303. Ento, o intervalo de confiana para E (Yh ) = + 7 1 + 2

51 4,303 54,708 < E (Yh ) < 51 + 4,303 54,708


ou
19,17 < E (Yh ) < 82,83
Consideremos, agora, que desejamos prever o valor da varivel dependente ( Yh )
para uma nova observao e que as variveis independentes assumem os valores X 1h ,

X 2 h , ..., X kh .
O estimador de Yh = xh + u h Yh = xh b . O erro de previso

Yh Yh = xh (b ) u h

(4.38)

Dizemos que Yh uma previso no-tendenciosa do valor de Yh porque a


esperana do erro de previso igual a zero.
Para avaliar a preciso de Yh como previso do valor da nova observao,
determinamos o intervalo de previso, como mostraremos a seguir. Para isso devemos
considerar a varincia do erro de previso, dado por (4.38). Uma vez que, de acordo
com a pressuposio V, o erro ( u h ) da nova observao independente dos erros ( u j , j
= 1, ..., n) das observaes da amostra utilizada para obter a estimativa (b) de , de
(4.38) obtemos

141

V (Yh Yh ) = V [xh (b )] + 2
De acordo com (4.14), segue-se que

V (Yh Yh ) = 2 + xh ( XX) 1 x h 2 =
= [1 + x h ( X X) 1 x h ] 2

Sendo t 0 o valor crtico de t com n p graus de liberdade e ao nvel de


confiana adotado, o intervalo de previso para a nova observao

xh b t 0 [1 + xh ( XX) 1 x h ]s 2 < Yh < xh b + t 0 [1 + xh ( XX) 1 x h ]s 2


No exemplo numrico que estamos analisando, a estimativa da varincia do erro
de previso para X 1h = 7 e X 2 h = 1
1,25 + 54,708 = 55,958
e o intervalo de previso, ao nvel de confiana de 95%, para uma nova observao com
esses valores de X 1h e X 2 h

51 4,303 55,958 < Yh < 51 + 4,303 55,958


ou
18,81 < Yh < 83,19
Note a grande amplitude do intervalo de previso, apesar do elevado coeficiente
de determinao ( R 2 = 0,9785 ) da equao ajustada.
A previso do valor da varivel dependente para uma nova observao pode ser
feita para valores de x h fora da regio onde esto os valores das variveis explanatrias
da amostra, isto , pode ser feita uma extrapolao. Da mesma maneira que no caso da
regresso linear simples (ver seo 2.12), a validade da equao estimada, fora do
intervalo das observaes, deve ser cuidadosamente examinada.
A expresso (4.14), que d a varincia de Yh , um caso particular de (4.12).
Uma outra aplicao de (4.12) o teste de hipteses a respeito de combinaes lineares
dos parmetros. Admitamos que se queira testar, no exemplo que estamos
desenvolvendo, a hiptese H 0 : 2 1 + 2 = 0 contra a hiptese H A : 2 1 + 2 < 0 ,
considerando um nvel de significncia de 5%. A hiptese da nulidade pode ser escrita
H 0 : c = 0

142

onde

c = [0 2 1]
Para testar essa hiptese calculamos, de acordo com (4.12),
V (c b) = c ( X X) 1 cs 2 = 0,125

A seguir, obtemos

t=

3
cb 0
=
= 8,485
0,125
V (cb)

O resultado significativo, isto , rejeitamos H 0 : 2 = 2 1 ao nvel de


significncia de 5%, pois a regio de rejeio para esse teste unilateral t 2,920 .

4.10.Interpretao dos coeficientes de regresso de uma regresso linear


mltipla com duas variveis explanatrias
Consideremos o modelo de uma regresso linear com duas variveis
explanatrias, com todas as variveis centradas:
y j = 1 x1 j + 2 x 2 j + u j u

(4.39)

Neste caso, temos


x 2
X X = 1 j
x1 j x 2 j

x1 j y j
x1 j x 2 j
, Xy =

2
x 2 j
x 2 j y j

e
( X X)

x x
2
1j

2
2j

1
( x1 j x 2 j ) 2

x 22 j

x1 j x 2 j

x1 j x 2 j

x12j

De b = ( XX) 1 Xy , obtemos
b1 =

x 22 j x1 j y j x1 j x 2 j x 2 j y j
x12j x 22 j ( x1 j x 2 j ) 2

(4.40)

e
b2 =

x12j x 2 j y j x1 j x 2 j x1 j y j
x12j x 22 j ( x1 j x 2 j ) 2

(4.41)

143

Vamos indicar os desvios da regresso de x1 j em relao a x 2 j por v j e os


desvios da regresso de y j em relao a x 2 j por z j . Seja a estimativa do coeficiente
de regresso de z j em relao a v j . Demonstraremos que b1 = , isto , que a
estimativa do coeficiente de regresso de x1 j numa regresso linear com duas variveis
explanatrias mede como y j varia em funo de x1 j , aps eliminar dessas variveis a
influncia linear de x 2 j . Analogamente, b2 uma estimativa de como y j varia em
funo de x 2 j , descontando-se, previamente, as variaes de y j e x 2 j que possam ser
devidas influncia linear de x1 j .
Em outras palavras, b1 estima o efeito linear de X 1 , sobre Y depois que essas
variveis so depuradas da influncia linear de X 2 . Analogamente, b2 estima o efeito
linear de X 2 sobre Y depois que essas variveis so depuradas da influncia linear de

X1 .
Sabemos que para uma regresso linear simples de y j em relao a x j temos
xj yj
desvio = y j y j = y j bx j = y j
x2
j

x j

Segue-se que
x 2 j x1 j
v j = x1 j
x2
2j

x2 j

(4.42)

x2 j y j
zj = yj
x2
2j

x2 j

(4.43)

Como x1 j , x 2 j e y j tm mdia igual a zero, v j e z j tambm tm mdia igual a


zero. Ento, a estimativa do coeficiente de regresso de z j em relao a v j

vjz j

(4.44)

v 2j

Mas

x 2 j x1 j
v j z j = x1 j
x2

2j

x2 j

x2 j y j
y j
x2

2j

x2 j

144

Desenvolvendo e simplificando, obtemos

v j z j = x1 j y j

x1 j x 2 j x 2 j y j

(4.45)

x 22 j

Analogamente, obtemos
v = x
2
j

2
1j

( x1 j x 2 j ) 2

(4.46)

x 22 j

Substituindo (4.45) e (4.46) em (4.44) e multiplicando numerador e


denominador por x22 j , obtemos

x 22 j x1 j y j x1 j x 2 j x 2 j y j

(4.47)

x12j x 22 j ( x1 j x 2 j ) 2

Comparando (4.47) com (4.40), verificamos que


b1 = , c.q.d.

Para melhor esclarecer o assunto vamos desenvolver essas etapas no exemplo


numrico da tabela 4.1.
Vamos calcular, inicialmente, os desvios ( v j ) da regresso de x1 j em relao a
x 2 j , dados por
v j = x1 j 2 x 2 j

e os desvios ( z j ) da regresso de y j em relao a x 2 j , dados por


z j = y j + 3x 2 j

Tais valores constam na tabela 4.3.


TABELA 4.3. Valores de y j , x1 j , x 2 j , v j (desvios da regresso de x1 j

yj

contra x 2 j ) e z j (desvios da regresso de y j contra x 2 j ) obtidos com


base nos dados da tabela 4.1.
x1 j
x2 j
vj
zj

6,5
4

4
1,5

2
1

0
0,5

0,5
1

4
0
6,5

1
2,5
4

0
1
2

1
0,5
0

4
3
0,5

A estimativa do coeficiente de regresso de z j em relao a v j

145

vjzj
v

2
j

6
= 4,
1,5

que o valor que j havamos obtido para b1 .


A anlise que fizemos para uma regresso com duas variveis explanatrias
pode ser generalizada para o caso de uma regresso linear mltipla com k variveis
explanatrias. Pode-se demonstrar que a estimativa ( b1 ) do coeficiente de uma varivel
X ij de uma regresso linear mltipla, normalmente obtida atravs de (4.7), poderia ser

obtida percorrendo-se as seguintes etapas:


a) clculo dos resduos ( v j ) da regresso de X ij contra todas as outras
variveis explanatrias;
b) clculo dos resduos ( z j ) da regresso de Y j em relao a essas mesmas
variveis, isto , as variveis explanatrias exclusive X ij ;
c) determinao da estimativa do coeficiente de regresso de z j em relao a
v j , que igual a bi .

Resumindo, podemos afirmar que, ao ajustarmos uma regresso linear mltipla


atravs do mtodo dos mnimos quadrados, a estimativa do coeficiente de uma varivel
X i mede o efeito linear de X i sobre Y depois de terem sido descontadas de ambas
essas variveis as influncias lineares de todas as outras variveis explanatrias
consideradas no modelo.

4.11. Os coeficientes de correlao parcial


Consideremos o caso de uma regresso linear mltipla com duas variveis
explanatrias, cujo modelo estatstico, utilizando todas as variveis centradas, (4.39).
Lembrando que indicamos por v j os desvios da regresso linear de x1 j contra
x 2 j e por z j os desvios da regresso de y j contra x 2 j , o coeficiente de correlao

parcial entre y j e x1 j ( rY 12 ) , por definio, o coeficiente de correlao entre z j e v j ,


isto ,

146

vjzj

rY 12 =

(4.48)

v 2j z 2j

Deduziremos agora a expresso que relaciona o coeficiente de correlao parcial

rY 12 com os coeficientes de correlao simples entre y j e x1 j , entre y j e x 2 j e entre


x1 j e x 2 j , indicados por rY 1 , rY 2 e r12 , respectivamente.

Considerando (4.42) e (4.43) temos, por analogia com (4.46), que


z = y
2
j

2
j

( x 2 j y j ) 2
x 22 j

(4.49)

Substituindo (4.45), (4.46) e (4.49) em (4.48), obtemos

x1 j y j
rY 12 =

x1 j x 2 j x 2 j y j
x 22 j

2 ( x1 j x 2 j ) 2
( x 2 j y j ) 2
2
x1 j
y j

x 22 j
x 22 j

Dividindo o numerador e o denominador por

x12j y 2j , verifica-se que

rY 1 r12 rY 2

rY 12 =

(4.50)

(1 r122 )(1 rY22 )

(4.51)

Analogamente, temos

rY 2 r12 rY 1

rY 21 =

(1 r122 )(1 rY21 )

(4.52)

Consideremos o exemplo numrico da tabela 4.1. Vamos calcular, inicialmente,


os valores dos coeficientes de correlao simples:

rY 1 =

rY 2 =

r12 =

x1 j y j
x y
2
1j

x2 j y j
x 22 j y 2j
x1 j x 2 j
x x
2
1j

54

2
j

2
2j

41,5 116,5

30
10 116,5
20
41,5 10

= 0,776617

= 0,878938

= 0,981761

147

Essas correlaes simples so apresentadas com grande nmero de decimais


para evitar erros de arredondamento nos prximos clculos. Substituindo esses valores
em (4.51), obtemos

rY 12 = 0,952
Esse coeficiente de correlao parcial tambm pode ser obtido calculando-se o
coeficiente de correlao simples entre os valores de v j e z j , da tabela 4.3.

vjzj

rY 12 =

v 2j z 2j

6
1,5 26,5

= 0,952

importante verificar a relao existente entre um coeficiente de correlao


parcial e o correspondente coeficiente de regresso. De (4.50), obtemos

rY 12

x1 j x2 j x2 j y j
x1 j y j

x22 j

=
2 ( x1 j x2 j ) 2
x1 j

x22 j

( x1 j x2 j ) 2
x12j

x22 j

( x2 j y j ) 2
y 2j
x22 j

Multiplicando o numerador e denominador da primeira frao por x22 j e


lembrando (4.40), segue-se que
x12j
rY 12 = b1
y
2
j

( x1 j x2 j ) 2
x22 j
( x2 j y j ) 2

= b1

(S.Q.Res. x1 j | x2 j )
(S.Q.Res y j | x2 j )

x22 j

ou

b1 = rY 12

(S.Q.Res. y j | x 2 j )
(S.Q.Res x1 j | x 2 j )

(4.53)

Analogamente,

b2 = rY 21

(S.Q.Res. y j | x1 j )
(S.Q.Res x 2 j | x1 j )

(4.54)

As relaes (4.53) e (4.54) devem ser comparadas com a relao (3.4).

148

Essas relaes mostram que um coeficiente de correlao parcial sempre tem


sinal igual ao do respectivo coeficiente de regresso na regresso mltipla. Mas o
correspondente coeficiente de correlao simples pode ter sinal oposto, como ocorre
com rY 1 e rY 12 no exemplo analisado. Vimos que rY 1 = 0,776617 e rY 12 = 0,952. O
esquema a seguir procura mostra como isso possvel

Y
O efeito direto de X 1 sobre Y positivo, como mostra o valor de b1 ou o valor
de rY 12 . Mas X 1 tem forte correlao positiva com X 2 que, por sua vez, tem forte
efeito negativo sobre Y. A correlao simples entre X 1 e Y mistura os efeitos direto e
indireto (via X 2 ) de X 1 sobre Y. Neste exemplo o efeito indireto negativo e supera o
efeito direto positivo, fazendo com que a correlao simples ( rY 1 ) seja negativa.
Veremos, a seguir, uma outra maneira de interpretar os coeficientes de
correlao parcial.
Vamos considerar ainda o caso de uma regresso mltipla com duas variveis
explanatrias, ou seja, a regresso de y j em relao a x1 j e x 2 j . De acordo com (4.31),
a soma de quadrados de regresso dada por
(S.Q.Regr.de y j | x1 j e x 2 j ) = b1 x1 j y j + b2 x 2 j y j
ou, lembrando a definio do coeficiente de determinao mltipla ( R 2 ),
(S.Q.Regr. de y j | x1 j e x 2 j ) = R 2 y 2j
A contribuio de x1 j para essa soma de quadrados a diferena entre esse
valor e a soma de quadrados de regresso da regresso linear simples de y j contra x 2 j ,
isto ,
(Contribuio de x1 j ) = (S.Q.Regr. de y j | x1 j e x 2 j ) (S.Q.Regr. de y j | x 2 j ) =

= R 2 y 2j rY22 y 2j

(4.55)

149

Para medir a importncia da contribuio de x1 j , comparamos seu valor com a


soma de quadrados residual da regresso linear simples de y j contra x 2 j , por meio do
cociente

(Contribuio de x1 j )
(S.Q.Res. de y j | x 2 j )

R 2 y 2j rY22 y 2j
y 2j rY22 y 2j

R 2 rY22
1 rY22

(4.56)

Esse cociente, chamado coeficiente de determinao parcial entre y j e x1 j , ,


no mximo, igual a um. Isso ocorre quando a introduo da varivel x1 j explicar (em
termos de soma de quadrados) tudo o que x 2 j deixou de explicar. Est claro que, neste
caso, o coeficiente de determinao mltipla tambm ser igual a um.
Para obter a expresso do cociente em funo apenas dos coeficientes de
correlao simples, utilizaremos a relao

R2 =

rY21 2r12 rY 1 rY 2 + rY22


1 r122

(4.57)

que pode ser obtida (aps vrias passagens algbricas que podem ser desenvolvidas,
como exerccio) substituindo (4.40) e (4.41) em

R2 =

b1 x1 y1 + b2 x 2 j y j
y 2j

Substituindo (4.57) em (4.56), simplificando e fatorando, obtemos


(rY 1 r12 rY 2 ) 2
=
(1 r122 )(1 rY22 )
Comparando esse resultado com (4.51), conclumos que o coeficiente de
determinao parcial entre y j e x1 j igual ao quadrado do coeficiente de correlao
parcial entre as mesmas variveis. Ento (4.56) fica
rY212 =

(Contribuio de x1 j )
(S.Q.Res. de y j | x 2 j )

R 2 rY22
1 rY22

(4.58)

Analogamente,

150

rY221 =

(Contribuio de x 2 j )
(S.Q.Res. de y j | x1 j )

R 2 rY21
1 rY21

(4.59)

Para o exemplo numrico da tabela 4.1, temos

(S.Q.Regr.d e y j | x 2 j ) =

( x 2 j y j ) 2
x 22 j

(30) 2
=
= 90
10

e
(S.Q.Res.de y j | x 2 j ) = 116,5 90 = 26,5

Anteriormente j havamos obtido (ver tabela 4.2)


(S.Q.Regr.d e y j | x1 j e x 2 j ) = 114

Ento
(Contribuio de x1 j ) = 114 90 = 24
De acordo com (4.58) temos

rY212 =

24
= 0,905660
26,5

Extraindo a raiz quadrada e adotando, de acordo com (4.53), o sinal de b1 , temos

rY 12 = 0,952
que j obtivemos anteriormente de (4.51).
Podemos verificar a significncia estatstica da contribuio de x1 j por meio
de um teste F, como mostrado na tabela 4.4.
TABELA 4.4. Anlise de Varincia
C.V.

Q.M.

24

24

19,2

114

57

45,6

2,5

1,25

116,5

G.L.

S.Q.

Regr. de y j | x 2 j

90

Contribuio de x1 j

Regr. de y j | x1 j e x 2 j
Resduo
Total

151

Dividindo o quadrado mdio referente contribuio de x1 j (que igual


respectiva soma de quadrados, pois esta tem 1 grau de liberdade) pelo quadrado mdio
residual da regresso mltipla obtivemos F = 19,2.
Ao nvel de significncia de 5%, o valor crtico de F, para 1 e 2 graus de
liberdade, 18,51. Portanto, o resultado obtido significativo.
importante observar que esse teste F equivalente ao teste t, feito
anteriormente na seo 4.8, para testar a hiptese H 0 : 1 = 0 contra H A : 1 0 . Note
que o valor de F obtido (19,2) igual ao quadrado do valor de t calculado para testar
essa hiptese (4,382).
At aqui analisamos o conceito de correlao parcial para o caso de uma
regresso linear com duas variveis explanatrias. O conceito pode, entretanto, ser
generalizado para o caso de uma regresso linear mltipla com k variveis
explanatrias. Apenas para facilidade de notao, consideremos o coeficiente de
correlao parcial entre y j e x1 j ( rY 123...k ). Sendo v j os desvios da regresso mltipla
de x1 j contra x 2 j , x 3 j ,..., x kj e z i os desvios da regresso mltipla de yi contra
x 2 j , x 3 j ,..., x kj , o coeficiente de correlao parcial entre y j e x1 j , por definio, o

coeficiente de correlao simples entre v j e z j . Pode-se demonstrar que o mesmo


resultado obtido de6
rY212 3...k =

(Contribuio de x1 j )
(S.Q.Res. de y j | x 2 j , x3 j ,..., x kj )

onde
(Contribuio de x1 j ) =
= (S.Q.Regr. de y j | x1 j , x 2 j , x3 j ,..., x kj ) (S.Q.Regr. de y j | x 2 j , x3 j ,..., x kj )
A significncia estatstica da contribuio de x1 j pode ser testada por meio de
uma decomposio da soma de quadrados de regresso, como est indicado no esquema
a seguir.

Ver a seo 5.3 (p. 132-135) de Johnston (1972), para uma outra maneira de obter os coeficientes de
correlao parcial.

152

Esquema da Anlise de Varincia


C.V.

G.L.
k1

Regr. de y j | x 2 j , x3 j ,..., x kj

Contribuio de x1 j
Regr. de y j | x1 j , x 2 j , x3 j ,..., x kj
Resduo

k=p1

Total

np
n1

Pode-se demonstrar que o teste F para a contribuio de x hj sempre


equivalente ao teste t da hiptese H 0 : h = 0 contra H A : h 0 , isto , se
t h = bh / s (bh ) , temos
t h2 =

(Contribuio de x hj )
s2

(Contribuio de x hj ) = t h2 s 2

A soma de quadrados residual da regresso completa (n p ) s 2 . Ento a soma


de quadrados residual da regresso sem x hj (n p ) s 2 + (Contribuio de x hj ) e o
coeficiente de determinao parcial entre y j e xhj

rYh2 i h =

(Contribuio de x hj )
(n p ) s 2 + (Contribuio de x hj )

Segue-se que
rYh2 i h =

t h2 s 2
(n p ) s 2 + t h2 s 2

ou
rYh2 i h =

t h2
t h2 + n p

Essa expresso permite obter com facilidade um coeficiente de determinao


parcial a partir do valor de t referente hiptese de nulidade do coeficiente
correspondente na regresso mltipla.

153

4.12. Intervalos de confiana e regies de confiana para os parmetros


Consideremos, novamente, o modelo de regresso linear com duas variveis
explanatrias:
Y j = + 1 X 1 j + 2 X 2 j + u j

Nesta seo vamos utilizar um novo exemplo numrico, baseado na amostra de 6


observaes apresentada na tabela 4.5. Pode-se verificar que Y = 9,5 , X 1 = 1,5 e
X 2 = 3 . A mesma tabela mostra os valores das variveis centradas y j , x1 j e x 2 j .
TABELA 4.5. Valores de trs variveis em uma amostra com 6 observaes.
Yj

X1j

X2j

1,5
6,5
10,0
11,0
11,5
16,5

0
1
1
2
2
3

0
2
4
2
4
6

yj

x1 j

x2 j

8,0
3,0
0,5
1,5
2,0
7,0

1,5
0,5
0,5
0,5
0,5
1,5

3
1
1
1
1
3

Tendo em vista o modelo com todas as variveis centradas, obtemos


x12j
X X =
x1 j x 2 j

x1 j x 2 j 5,5 9
,
=
x 22 j 9 22

x1 j y j 25,5
Xy =
=
,

x
y
49
2
j
j

( X X) 1

11
20
=

9
40

9
0,55
0,225
40

11 0,225 0,1375

80

3
b = ( XX) 1 Xy =
1

e
A equao estimada

y j = 3 x1 j + x 2 j

ou

154

Y j = 2 + 3 X 1 j + X 2 j
A tabela 4.6 mostra a anlise de varincia da regresso, verificando-se que
R 2 = 0,977 .
TABELA 4.6. Anlise da Varincia
C.V.

G.L.

S.Q.

Q.M.

Regresso
Resduo

2
3

125,5
3

62,75
1

62,75

Total

128,5

Como s 2 = 1 , temos
V (b1 ) = 0,55 e V (b2 ) = 0,1375

Seguindo o procedimento apresentado na seo a 4.8, verifica-se que


37
V ( a ) =
60
Adotando um nvel de significncia de 1%, o valor crtico de F, com 2 e 3 graus
de liberdade, 30,82. Portanto, o resultado significativo, isto , rejeita-se, a esse nvel
de significncia, a hiptese H 0 : 1 = 2 = 0 .
Para testar a hiptese H 0 : 1 = 0 , contra H A : 1 0 , calculamos

t=

3
0,55

= 4,045

Como o valor crtico de t para 3 graus de liberdade, ao nvel de significncia de


1%, 5,841, o resultado obtido no significativo, isto , no rejeitamos a hiptese
H 0 : 1 = 0 .
Para testar a hiptese H 0 : 2 = 0 contra a H A : 2 0 , calculamos

t=

1
0,1375

= 2,697 , no significativo

interessante notar que neste exemplo, embora se rejeite, ao nvel de


significncia de 1%, a hiptese H 0 : 1 = 2 = 0 , no se rejeita, ao mesmo nvel de
significncia, nem a hiptese H 0 : 1 = 0 , nem a hiptese H 0 : 2 = 0 . Veremos,
adiante, porque isso pode ocorrer.
Na seo 4.5 vimos que o intervalo de confiana para o parmetro i de uma
regresso linear mltipla

155

bi t 0 s (bi ) < i < bi + t 0 s (bi )


Vamos determinar os intervalos de confiana, ao nvel de confiana de 99%,
para os parmetros , 1 e 2 , com base nos dados da tabela 4.5. O valor crtico de t ,
neste caso, 5,841.
Temos

a = 2 , b1 = 3 e b2 = 1 .
O intervalo de confiana para

2 5,841

37
37
< < 2 + 5,841
60
60

ou
2,59 < < 6,59
O intervalo de confiana para 1

3 5,841 0,55 < 1 < 3 + 5,841 0,55


ou

1,33 < 1 < 7,33


O intervalo de confiana para 2

1 5,841 0,1375 < 2 < 1 + 5,841 0,1375


ou

1,17 < 2 < 3,17


Esses intervalos de confiana devem ser interpretados com cuidado.
Consideremos, por simplicidade, apenas os parmetros 1 e 2 . Na figura 4.1
assinalamos os intervalos de confiana e traamos a elipse que delimita a regio de
confiana, ao nvel de confiana de 99%, para esses parmetros. Note que, apesar de
tanto o intervalo de confiana para 1 como o intervalo de confiana para 2 inclurem
o valor zero, o ponto ( 1 = 0, 2 = 0) no pertence regio de confiana para 1 e 2 .
por isso que, embora os valores de t obtidos no nos levem a rejeitar, ao nvel de
significncia de 1%, as hipteses H 0 : 1 = 0 ou H 0 : 2 = 0 , o teste F permite rejeitar,
a esse mesmo nvel de significncia, a hiptese H 0 : 1 = 2 = 0 .

156

Figura 4.1. A regio de confiana para os parmetros 1 e 2 .


O conjunto de pontos do retngulo ABCD corresponde aos valores de 1 e 2
que pertencem aos respectivos intervalos de confiana. Poder-se-ia pensar que esse
retngulo seria a regio de confiana para 1 e 2 . Entretanto, embora esse retngulo e
a regio de confiana correta (elptica) tenham uma rea em comum, fcil verificar
que existem pontos do retngulo que no pertencem regio de confiana (como o
caso de 1 = 2 = 0) e pontos da regio de confiana que no pertencem ao retngulo.
Vejamos, agora, como foi obtida a elipse da figura 4.1.
Para o modelo de regresso linear mltipla, com todas as pressuposies
apresentadas na seo 4.1, pode-se demonstrar que
(Cb C)[C( XX) 1 C]1 (Cb C)

1
=F
ms 2

(4.60)

onde m a caracterstica da matriz de constantes C e F est associado a m e n p graus


de liberdade.
A relao (4.60) muito geral. Mostraremos, inicialmente, que o teste F relativo
hiptese H 0 : 1 = 2 = K = k = 0 um de seus casos particulares.
Consideremos o modelo de regresso linear mltipla com todas as variveis
centradas:
k

y j = i x ij + u j u
i =1

(4.61)

Fazendo C = I k , onde I k uma matriz identidade com caracterstica m = k, a


hiptese da nulidade fica

157

H 0 : C = 0
Em (4.60), fazendo C = I k e C = 0 , obtemos
F=

b XXb
ks 2

Lembrando que b = ( X X) 1 X y , obtemos


b X y
b X y
Q.M.Regr.
F=
= k2 =
,
2
Q.M.Res.
ks
s

que , como sabemos, o valor de F usualmente calculado para verificar a significncia


estatstica da regresso ajustada.
Um outro caso particular de (4.60) o teste F para a contribuio de uma
varivel que, como vimos na seo 4.11, equivale ao teste t relativo hiptese
H 0 : i = 0 . Consideremos o modelo (4.61) e admitamos, para facilitar a indicao, que

se deseja verificar se a contribuio da varivel x1 j significativa, ou seja, vamos testar


a hiptese H 0 : 1 = 0 .
Fazemos

C = [1

0] , cuja caracterstica m = 1.

Ento, a hiptese da nulidade pode ser escrita como segue:


H 0 : C = 0

Temos, tambm, que

Cb = b1
e
C( X X) 1 C = w11 ,

onde w11 o primeiro elemento da diagonal principal de ( XX) 1 .


Substituindo esses resultados em (4.60) e considerando que C = 0 , obtemos
F=

b1 ( w11 ) 1 b1
b12
=
s2
w11 s 2

Como w11 s 2 = s 2 (b1 ) segue-se que

| t |= F =

| b1 |
s(b1 )

158

Uma vez que o quadrado de um teste t sempre igual a um teste F com


numerador associado a um grau de liberdade, pode-se verificar que a relao (4.60)
engloba, como caso particular, qualquer t relativo a uma hiptese sobre o valor de um
parmetro ou sobre o valor de uma combinao linear de parmetros, incluindo-se, neste
ltimo caso, um teste a respeito de E (Yh ) .
Se, escolhido um nvel de confiana, substituirmos F, em (4.60), pelo seu valor
crtico F0 , essa relao nos fornecer os limites de um intervalo ou de uma regio de
confiana (dependendo de como definida a matriz C). Os pontos pertencentes ao
intervalo ou regio de confiana obedecem desigualdade
(Cb C )[C( XX) 1 C] 1 (Cb C) < F0 ms 2

(4.62)

Consideremos, por exemplo, que se deseja obter o intervalo de confiana para

1 . Tendo em vista o modelo (4.61), fazemos


C = [1

0] ,

cuja caracterstica m = 1.

Ento,

Cb = b1 , C = 1 e C( XX) 1 C = w11
Substituindo esses resultados em (4.62), obtemos
(b1 1 )( w11 ) 1 (b1 1 ) < F0 s 2
( 1 b1 ) 2 < F0 w11 s 2

F0 w11 s 2 < 1 b1 < F0 w11 s 2


b1 F0 w11 s 2 < 1 < b1 + F0 w11 s 2
Finalmente, como

F0 = t 0 e

w11 s 2 = s (b1 ) , temos

b1 t 0 s (b1 ) < 1 < b1 + t 0 s (b1 )


Verificamos, assim, que o intervalo de confiana para 1 pode ser considerado
como um caso particular de (4.62).
Determinemos, agora, a regio de confiana para os parmetros 1 e 2 de uma
regresso linear mltipla com 2 variveis explanatrias. Tendo em vista o modelo
Y j = 0 + 1 x1 j + 2 x 2 j + u j

fazemos

159

0 1 0
C=

0 0 1
cuja caracterstica m = 2. Ento

C = 1
2

1 b1 = q1

e 2 b2 = q 2

b
Cb = 1
b2

Fazendo
(4.63)

segue-se que
q
Cb C = 1
q 2

(4.64)

Temos, tambm, que


C( X X) 1 C =

0 1 0 n
=
0
0 0 1 0

0
w11
w12

0 0 0
w
w12 1 0 = 11

w
w22 0 1 12

w12
w22

Donde
x12j
[C( X X) C] =
x1 j x 2 j
1

x1 j x 2 j

x 22 j

(4.65)

Substituindo (4.64) e (4.65) em (4.62) e lembrando que m = 2, obtemos

[q1

x12j
q2 ]
x1 j x 2 j

x1 j x 2 j q1
2
< 2 F0 s
2
x 2 j q 2

(4.66)

No caso do exemplo numrico apresentado no incio desta seo, temos

x12j = 5,5

x22 j = 22

x1 j x 2 j = 9

s2 = 1

Para o nvel de confiana de 99%, o valor crtico de F com 2 e 3 graus de


liberdade 30,82.
Substituindo esses resultados em (4.66), obtemos

160

5,5 9 q1
q2 ]
< 2 30,82
9 22 q 2

[q1
ou

5,5q12 + 18q1 q 2 + 22q 22 61,64 < 0


Essa desigualdade satisfeita pelos pontos delimitados pela elipse
5,5q12 + 18q1 q 2 + 22q 22 61,64 = 0 ,
que a elipse traada na figura 4.1.
Para mais uma aplicao da relao (4.60), consideremos que, no exemplo
numrico que estamos desenvolvendo, desejamos testar, ao nvel de significncia de
5%, a hiptese
H 0 : 1 = 4 e 2 = 2
Ressaltemos que esta uma nica hiptese envolvendo, concomitantemente, os
valores de dois parmetros e que o teste dessa hiptese no equivale a fazer dois testes
consecutivos, um para a hiptese H 0 : 1 = 4 e outro para a hiptese H 0 : 2 = 2 .
Fazendo
0 1 0
C=

0 0 1
a hiptese H 0 : 1 = 4 e 2 = 2 pode ser indicada como segue:
4
H 0 : C =
2
Como

b 3
Cb = 1 = ,
b2 1
temos que
3 4
1
Cb C =
=

(4.67)

Substituindo (4.65) e (4.67) em (4.60) e lembrando que m = 2 e s 2 = 1 , obtemos


F=

5,5 9 1
1
[1 1]
= 22,75
2
9 22 1

161

Como o valor crtico de F com 2 e 3 graus de liberdade e ao nvel de


significncia de 5% 9,55, o resultado significativo, isto , rejeita-se a hiptese
H 0 : 1 = 4 e 2 = 2 .
Se tivssemos adotado o nvel de significncia de 1%, no rejeitaramos
H 0 : 1 = 4 e 2 = 2 , pois, neste caso, o valor crtico de F 30,82. Isso pode ser
verificado na figura 4.1, notando que o ponto ( 1 = 4 , 2 = 2 ) pertence regio de
99% de confiana para 1 e 2 .
4.13. Exemplo de uma regresso linear mltipla com trs variveis
explanatrias
Nesta seo, desenvolveremos um exemplo de regresso linear mltipla com trs
variveis explanatrias, como ilustrao do que j foi vista neste captulo.
Na tabela 4.7 so apresentados 14 valores das variveis Y j , X 1 j , X 2 j e X 3 j .
Note que as trs variveis explanatrias j so centradas.
TABELA 4.7. Amostra de 14 observaes para 4 variveis.
Yj

X 1 j = x1 j

X 2 j = x2 j

X 3 j = x3 j

8,5

1,0

4,0

4,0

5,0

3,0

6,0

6,0

7,0

5,0

5,0

5,0

3,0

0,5

162

Os valores bsicos a serem calculados so:


Y j = 63

x12j = 16

Y = 4,5

x 22 j = 12

y 2j = 61

x32 j = 10

x1 j Y j = 8 x1 j x 2 j = 8

x 2 j Y j = 24

x1 j x3 j = 8

x 2 j x 3 j = 8

x 3 j Y j = 18

Tendo em vista o modelo


Y j = 0 + 1 x1 j + 2 x 2 j + 3 x 3 j + u j ,

j = 1, 2, ..., 14

construmos as matrizes
0
0
0
14
63
0 16 8

8
8

XX =
e Xy =
0 8 12 8
24

8 8 10
0
18
A seguir, obtemos

1
14

1
( XX) =

7
64

1
32

1
32

3
16

1
16

1
8

0
1

16

1
4

b0
4,5
b
1
1
1

b=
= ( XX) Xy =
b2
2


1
b3
A equao estimada
Y j = 4,5 + x1 j + 2 x 2 j x3 j
ou, uma vez neste exemplo xij = X ij (i = 1, 2, 3),

163

Y j = 4,5 + X 1 j + 2 X 2 j X 3 j
Temos
S.Q.Regr. = bi xij Y j =
i

= 1 ( 8) + 2 24 + ( 1) ( 18) = 58

A anlise da varincia dada na tabela 4.8.


TABELA 4.8. Anlise de Varincia
C.V.
Regresso
Resduo
Total

G.L.

S.Q.

Q.M.

3
10
13

58
3
61

19,33
0,30

F
64,44

Ao nvel de significncia de 1% e com 3 e 10 graus de liberdade, o valor crtico


de F 6,55. O resultado obtido , portanto, significativo, isto , rejeita-se, a esse nvel
de significncia, a hiptese H 0 : 1 = 2 = 3 = 0 .
O coeficiente de determinao mltipla
R2 =

58
= 0,951
61

Sabemos que as estimativas das varincias e covarincias das estimativas dos


parmetros so dadas por ( XX) 1 s 2 .
Assim, por exemplo, a estimativa da varincia de b2
9
V (b2 ) =
160
Ento

s(b2 ) =

9
= 0,237
160

O intervalo de confiana para 2 , ao nvel de confiana de 95%,


2 2,228 0,237 < 2 < 2 + 2,228 0,237
ou
1,47 < 2 < 2,53

164

Para testar, ao nvel de significncia de 1%, a hiptese H 0 : 2 = 0 , contra a


hiptese alternativa H A : 2 0 , calculamos
t=

b2 0
=
s (b2 )

2
9
160

= 8,433

Como o valor crtico de t para 10 graus de liberdade 3,169, o resultado obtido


significativo, isto , rejeita-se, ao nvel de significncia de 1%, a hiptese de que

2 = 0 , em favor da hiptese de que 2 0 .


Passemos, agora, determinao do coeficiente de correlao parcial entre Y j e
X 3 j , dados X 1 j e X 2 j . Para isso obteremos, inicialmente, as estimativas dos

coeficientes da regresso de Y j em relao a x1 j e x 2 j . Sendo c0 , c1 e c2 as


estimativas dos coeficientes dessa regresso e z j os desvios, temos
Y j = c 0 + c1 x1 j + c 2 x 2 j + z j

De acordo com (4.7), obtemos


1

0
0 63
c0 14
c = 0 16 8 8 =
1

c 2 0 8 12 24

1
14

=0

0
3
32
1
16

63 4,5
1
8 = 0,75

16
24 2,5
1

A soma de quadrados de regresso dessa regresso


(S.Q.Regr. de Y j | x1 j , x2 j ) = 0,75 (8) + 2,5 24 = 54
Ento
(S.Q.Res. de Y j | x1 j , x2 j ) = 61 54 = 7
Como
(S.Q.Regr. de Y j | x1 j , x 2 j , x3 j ) = 58,

165

segue-se que
(Contribuio de x 3 j ) = 58 54 = 4
Ento, o coeficiente de determinao parcial entre Y j e X 3 j
rY2312 =

(contribuio de x3 j )
(S.Q.Res. de Y j | x1 j , x 2 j )

4
7

Lembrando que b3 negativo, conclumos que o coeficiente de correlao


parcial entre Y j e X 3 j

4
= 0,756
7

rY 312 =

Os demais coeficientes de correlao parcial podem ser obtidos de maneira


anloga.
Faamos, agora, o teste da hiptese

H 0 : 1 + 2 + 3 = 1
contra a hiptese alternativa

H A : 1 + 2 + 3 1 ,
ao nvel de significncia de 5%.
Fazendo

c = [0 1 1 1] ,
a hiptese da nulidade fica

H 0 : c = 1
De acordo com (4.12) temos
V (c b ) = c ( X X) 1 cs 2 =

= [0

1
14

1]

7
64

1
32

1
32

3
16

1
16

1
8

0 0


1 1

16
141
0,30 =

640
1
1
8

1
1
4

A seguir, obtemos

166

t=

cb c
2 1
=
= 2,130
141
V (cb)
640

Como, ao nvel de significncia de 5% e para 10 graus de liberdade, o valor


crtico de t 2,228, o resultado obtido no significativo.
Determinemos, agora, a regio de 95% de confiana para os parmetros 2 e 3
.
Fazemos
0 0 1 0
C=
,
0 0 0 1
cuja caracterstica m = 2.
Temos que
2

C = 2 , Cb =
3
1

e
3
16
1
C( XX) C =

1
8

1
18

1
4

Substituindo esses resultados em (4.62) obtemos

2 2
1
3

3
16

1
8

1
8

1
4

2 2
1 < F0 2 0,30
3

Como o valor crtico de F com 2 e 10 graus de liberdade, para um nvel de


confiana de 95%, 4,10, segue-se que os pontos pertencentes regio de confiana
obedecem desigualdade

2 2 8 4 2 2
< 4,10 2 0,30
+ 1 4
6 3 + 1
3

167

Sabemos que essa regio de confiana delimitada por uma elipse com centro no
ponto 2 = 2 e 3 = 1 .
A regio de confiana para 1 , 2 e 3 um elipside num espao com 3
dimenses. A visualizao desse elipside exigiria a determinao e o traado de elipses
que resultam da interseco da superfcie do elipside com planos perpendiculares a um
dos trs eixos coordenados, para vrios valores do parmetro correspondente. Portanto,
fcil ver que a quantidade de clculos exigida para a determinao das regies de
confiana dos parmetros de uma regresso cresce muito rapidamente com o nmero de
parmetros envolvidos e que a visualizao dessas regies de confiana se torna difcil
para mais de dois parmetros.

4.14. Problemas de especificao


Vimos, no Captulo 2, que no caso de uma regresso linear simples, o problema
de especificao da relao entre as duas variveis consiste em escolher o tipo de
funo, isto , o modelo matemtico.
Surge outro problema de especificao quando mais de uma varivel
explanatria pode estar afetando a varivel dependente. Ento, alm de escolher o tipo
de funo, necessrio determinar quais as variveis explanatrias que devem ser
consideradas no modelo.
Vamos analisar o que ocorre com as estimativas dos coeficientes quando se
cometem erros de especificao da matriz X.
Admitamos que a relao verdadeira seja
y = X + u

(4.68)

e que o pesquisador, erroneamente, utilize, em lugar de X, uma matriz V. bvio que,


geralmente, as matrizes X e V tm algumas colunas em comum.
De acordo com o mtodo de mnimos quadrados, o pesquisador em questo
obter
g = (V V ) 1 V y

(4.69)

enquanto que as estimativas corretas seriam


b = ( XX) 1 Xy
Substituindo (4.68) em (4.69) obtemos
168

g = (V V ) 1 V X + (V V ) 1 V u
e
E (g) = P ,

(4.70)

P = (V V ) 1 V X

(4.71)

onde

Para mais facilmente explicar o problema, consideremos um caso em que o


modelo correto
y j = 1 x1 j + 2 x 2 j + 3 x3 j + u j u

e o pesquisador, erroneamente, obtm a equao estimada


y j = g 1 x1 j + g 2 x 2 j

Neste caso
x12j

VV=
x1 j x 2 j

x1 j x 2 j

x 22 j

e
x 2
V X = 1 j
x1 j x 2 j

x1 j x 2 j
x

2
2j

x1 j x3 j

x 2 j x3 j

Substituindo esses resultados em (4.17), obtemos


1 0 1
P = (V V ) 1 V X =

0 1 2

(4.72)

onde 1 e 2 so estimativas dos coeficientes de regresso de x 3 j contra x1 j e x 2 j .


De (4.70) e (4.72), segue-se que


1 0 1 1 1 + 1 3
=
E (g ) =

2
0 1 2 2 + 2 3
3
ou seja,

E ( g1 ) = 1 + 1 3
e

169

E ( g 2 ) = 2 + 2 3
Verificamos que as estimativas dos coeficientes obtidos ( g 1 e g 2 ) com o
modelo erroneamente especificado so tendenciosas. O vis de g i como estimativa de

i depende do valor do parmetro da varivel excluda ( 3 , no caso acima) e do valor


da estimativa do coeficiente relativo a x ij na regresso da varivel excluda contra as
variveis includas.
Consideremos, agora, o caso em que o modelo correto seria
y j = 1 x1 j + 2 x 2 j + u j u

e o pesquisador, erroneamente, ajusta a regresso


y j = g1 x1 j + g 2 x 2 j + g 3 x 3 j

Neste caso
x12j

V V = x1 j x 2 j
x1 j x3 j

x1 j x 2 j
x 22 j
x 2 j x3 j

x1 j x3 j

x 2 j x3 j
x32 j

e
x12j

V X = x1 j x 2 j
x1 j x3 j

x1 j x 2 j

x 22 j
x 2 j x3 j

Ento, de acordo com (4.71),

1 0
P = (V V ) 1 V X = 0 1
0 0
Substituindo esse resultado em (4.70), obtemos

1 0
1
1

E ( g ) = 0 1 = 2 ,

0 0 2 0
ou seja,

E ( g1 ) = 1 ,
E(g 2 ) = 2
e
E(g3 ) = 0

170

interessante notar que quando inclumos uma varivel desnecessria, as


estimativas dos coeficientes permanecem no-tendenciosas, diferentemente do que
ocorre quando deixamos de incluir uma das variveis explanatrias importantes. Isso
mostra que prefervel incluir uma varivel desnecessria que no incluir uma varivel
relevante. Entretanto, a incluso de variveis desnecessrias tambm prejudicial, pois
em geral faz com que aumente a varincia dos estimadores.
H, tambm, o perigo de um controle inapropriado mascarar o efeito que se
deseja captar. Considere um pesquisador que deseja avaliar o efeito das transferncias
de renda do Programa Bolsa Famlia sobre a pobreza, utilizando dados por Unidade de
Federao. A varivel dependente a reduo da pobreza e a varivel explanatria
fundamental o montante de transferncias per capita em certo perodo. Devem ser
controladas caractersticas especficas de cada Unidade da Federao que condicionam
o efeito das transferncias sobre a pobreza, mas um absurdo incluir, nesses controles,
mudanas na renda mdia e no ndice de Gini da distribuio da renda em cada Unidade
da Federao. Aumentando a renda dos pobres, as transferncias contribuem para
reduzir a desigualdade e aumentar um pouco a renda mdia da populao. Usando uma
medida de desigualdade e a renda mdia como controles o pesquisador torna
praticamente impossvel captar o efeito das transferncias sobre a pobreza7. O exerccio
4.39 apresenta dados numricos artificiais que ilustram a questo.
O problema dos maus controles discutido em Angrist e Pischke (2009, p. 6468). Eles assinalam que nem sempre mais controle melhor, que variveis medidas
antes que a varivel explanatria de interesse tenha sido determinada so geralmente
bons controles e que necessrio verificar se alguma varivel de controle , ela prpria,
determinada pela varivel explanatria de interesse.

4.15. Transformao das variveis para obter a matriz de correlaes


simples
Consideremos o modelo

y j = i xij + u j u
i

Como ocorre frequentemente, isso pode parecer bvio depois de assinalado. Mas em dois artigos
publicados na Revista Brasileira de Economia h erro de especificao semelhante, incluindo o ndice de
Gini e o PIB per capita de cada Unidade da Federao em modelos destinados a captar o efeito de
transferncias do governo federal sobre a pobreza: Marinho e Araujo (2010) e Marinho et al. (2011).

171

ou

z j = i vij + j +

(4.73)

onde

zj =

yj
y 2j

, vij =

i = i
uj

j =

xij
xij2
xij2
y 2j

, i = 1, 2, ..., k

(4.74)

(4.75)

e =

2
j

y 2j

Indicando por V a matriz das variveis explanatrias e por z o vetor dos


valores da varivel dependentes, temos

1
r
V V = 12
M

r1k

r12
1
M
r2 k

pois vij2 = 1 , vij v hj = rih com i h, e


i

r1k
rY 1
r
r2 k
e V z = Y 2

M
M


1
rYk

...
...

vij y j = rYi
i

As estimativas de mnimos quadrados dos i so dadas por


c = (V V ) 1 V z
Geralmente, os programas de computador para ajuste de regresses mltiplas
fazem, no incio, as transformaes (4.74). Note que os elementos das matrizes V V e

V z , que passam a ser utilizadas em lugar de X X e X y , variam apenas de 1 a +1.


Isso contribui para diminuir os efeitos dos erros de arredondamento. Obtidas as
estimativas de i , as estimativas dos parmetros i so, de acordo com (4.75), dadas
por
bi = ci

y 2j
xij2

172

4.16. Regresses que se tornam lineares por anamorfose


Vrios modelos estatsticos podem ser facilmente transformados em modelos de
regresso linear mltipla.
Assim, a regresso quadrtica

Y j = + 1 X j + 2 X 2j + u j
pode ser encarada como uma regresso linear mltipla com duas variveis
explanatrias, fazendo X j = X 1 j e X 2j = X 2 j .
De maneira anloga, qualquer regresso polinomial pode ser ajustada como uma
regresso linear mltipla.
Em pesquisas econmicas, freqentemente utilizado o modelo

Y j = X 1j1 X 1j2 ... X kj k j


Aplicando logaritmos, obtemos

log Y j = log + i log X ij + log j ,


i

que um modelo de regresso linear mltipla nos logaritmos das variveis. Neste caso,
desde que u j = log j obedea s pressuposies vistas na seo 4.1, as estimativas de
mnimos quadrados tm as propriedades estatsticas desejveis.

4.17.

Ortogonalidade e multicolinearidade na matriz X

Vejamos o que ocorre quando todas as colunas da matriz X so ortogonais entre


si, isto ,

xij x hj = 0 para i h
i

A matriz X X , ento, uma matriz diagonal.


Tendo em vista o modelo

y j = i xij + u j + u
i

temos, neste caso, que

173

( X X)

1
x2
1j
0
=

1
x kj2

0
1
x 22 j
0

x1 j y j

2
x1 j
x2 j y j
1
b = ( XX) Xy = x 22 j

x kj y j

2
x kj
Portanto, as estimativas dos parmetros da regresso mltipla coincidem com as
estimativas dos coeficientes das regresses lineares simples de Y j contra cada uma das
variveis explanatrias e a soma de quadrados de regresso, dada por
S.Q.Regr. = bi xij y j ,
i

, neste caso, igual soma das somas de quadrados de regresso das regresses lineares
simples de Y j contra cada uma das variveis explanatrias. O coeficiente de
determinao mltipla , portanto, igual soma dos coeficientes de determinao das
regresses lineares simples mencionadas.
Como vimos, a ortogonalidade entre as colunas da matriz X facilita bastante a
anlise.
Vejamos, agora, o que ocorre quando h multicolinearidade perfeita, isto ,
quando existem, na matriz X, colunas linearmente dependentes.
Consideremos, inicialmente, o caso de uma regresso linear mltipla com duas
variveis independentes perfeitamente correlacionadas entre si
Y j = 1 x1 j + 2 x 2 j + u j u

com
r =
2
12

( xij x 2 j ) 2
x12j x 22 j

=1

Neste caso, temos

174

| XX |= x12j x22 j ( x1 j x 2 j ) 2 = 0 ,
isto , o determinante da matriz X X igual a zero. No possvel, ento, inverter a
matriz X X e, consequentemente, impossvel obter as estimativas de 1 e 2 .
Geometricamente, o que ocorre que os pontos ( x1 j , x 2 j , y j ) esto todos sobre
um plano , perpendicular ao plano definido pelos eixos de x1 j e de x 2 j . O mtodo dos
mnimos quadrados permite determinar apenas uma reta no plano ; qualquer que seja o
plano que contenha essa reta, a soma dos quadrados dos desvios assume o mesmo valor;
portanto, existe indeterminao.
importante compreender que no caso de uma regresso com mais de duas
variveis explanatrias pode existir multicolinearidade perfeita, mesmo que nenhum dos
coeficientes de determinao simples seja igual a um (ver exerccio 4.12).
Freqentemente, a matriz X apresenta multicolinearidade elevada, embora no
perfeita. As principais conseqncias desse fato so as seguintes:
1) As varincias e covarincias das estimativas dos parmetros sero muito elevadas,
isto , as estimativas obtidas podem ter erros muito grandes e esses erros podem
estar altamente correlacionados entre si. A baixa preciso das estimativas torna
difcil, ou at mesmo impossvel, distinguir as influncias das diversas variveis
explanatrias;
2) Um pesquisador pode ser levado a eliminar variveis da anlise porque os
coeficientes no se mostraram estatisticamente diferentes de zero; essas variveis
podem, na realidade, ser importantes e a amostra disponvel que no permite
detectar sua influncia;
3) As estimativas dos coeficientes variam muito de amostra para amostra. A adio de
algumas observaes amostra pode alterar muito o valor da estimativa obtida.
Para mostrar como a multicolinearidade afeta a preciso das estimativas
consideremos, novamente, uma regresso mltipla com apenas duas variveis
explanatrias:

y j = i xij + u j + u
i

Fazendo

175

zj =

yj
y 2j

x12j

1 = 1

uj
y

2
j

x12j

e =

x2 j

, v2 j =
x 22 j

, 2 = 2

y 2j

j =

x1 j

, v1 j =

y 2j

u
y 2j

x 22 j

obtemos
z j = 1v1 j + 2 v 2 j + j +

(4.76)

A matriz de varincias e covarincias das estimativas ( c1 e c2 ) dos parmetros


de (4.76)
v12j

v1 j v 2 j

v1 j v 2 j
2
,
2
v 2 j

ou, de acordo com o que foi visto na seo 4.15,

1
r
12

1
1 r 2
1
12
r12

1
r12
1 r 2
12

r12
1 r122
2
,
1
1 r122

Conclumos que
V (c1 ) = V (c 2 ) =

2
1 r122

(4.77)

e
cov(c1 , c 2 ) =

r12 2
1 r122

(4.78)

176

As expresses (4.77) e (4.78) mostram que as varincias e o valor absoluto da


covarincia das estimativas dos parmetros crescem rapidamente quando r122 se
aproxima de um, isto , quando aumenta o grau de multicolinearidade.
Se r12 for positivo, verifica-se, pela expresso (4.78), que a covarincia das
estimativas dos parmetros negativa.
interessante examinar o valor do erro de estimativa para uma determinada
amostra. De acordo com (4.10) temos que
1
1 r 2
12
c1 1
c =
=

c 2 2 r12
1 r 2
12

r12
1 r122 v

1j j
v
1 2j j
1 r122

(4.79)

Indicando por d j os desvios da regresso linear simples de v 2 j contra v1 j temos


v 2 j = r12 v1 j + d j , j = 1, ..., n

(4.80)

De acordo com (2.6),


v1 j d j = 0

Multiplicando cada uma das igualdades em (4.80) por j e somando, obtemos


v 2 j j = r12 v1 j j + d j j

(4.81)

De (4.79) e (4.81) obtemos

c1 1 =

v1 j j r122 v1 j j r12 d j j
1 r122

= v1 j j

r12 d j j
1 r122

(4.82)

c2 2 =

r12 v1 j j + r12 v1 j j + d j j
1 r

2
12

d j j
1 r122

(4.83)

177

essas expresses mostram que, se r12 positivo e se aproxima de um, os erros de


estimao dos parmetros so grandes e de sinais opostos; se c1 superestima 1 , ento

c2 subestima 2 , e vice-versa.
Pode-se demonstrar que no h razo para que a multicolinearidade afete
seriamente a estimativa da varincia residual.8 Portanto, as estimativas das varincias
das estimativas dos parmetros so indicadores adequados da existncia de
multicolinearidade. O efeito de uma varivel explanatria pode ser suficientemente
forte, de tal maneira que o respectivo coeficiente se mostre estatisticamente diferente de
zero apesar da multicolinearidade; uma multicolinearidade bastante alta impedir,
entretanto, que se detecte a influncia de variveis importantes.

4.18. Teste de hipteses no modelo linear


Nesta seo vamos apresentar uma maneira geral de encarar os testes de
hipteses no modelo de regresso linear.
Uma hiptese sobre os parmetros de um modelo de regresso corresponde,
sempre, a uma restrio. O modelo que incorpora a restrio, denominado modelo
restrito, ser menos flexvel do que o modelo original.
Dada uma amostra de dados, seja SU a soma de quadrados residual obtida
ajustando o modelo original, irrestrito (o ndice do smbolo se deve palavra inglesa
para irrestrito: unrestricted), e seja S R a soma de quadrados residual obtida ajustando o
modelo restrito. Como o modelo restrito menos flexvel, a respectiva soma de
quadrados residual tende a ser maior, isto ,
S R SU

(4.84)

Se S R for igual ou pouco maior do que SU , indicando que o modelo restrito se


ajusta aos dados quase to bem como o modelo irrestrito, no h razo para rejeitar a
hiptese. Por outro lado, se S R for substancialmente maior que SU , indicando que o
ajustamento do modelo restrito (que incorpora a hiptese) claramente pior, deveremos
rejeitar a hiptese formulada, pois ela entra em choque com os dados.

Ver Johnston (1972), p. 163.

178

Para saber se a diferena S R SU ou no substancial, o respectivo quadrado


mdio comparado com o quadrado mdio residual do modelo irrestrito, calculando-se
S R SU
g gU
F= R
,
SU
gU

(4.85)

onde g U e g R so os graus de liberdade associados a SU e S R , respectivamente.


claro que a explicao apresentada para obter a expresso (4.85) informal, procurando
apenas mostrar a lgica mais geral da sua fundamentao. Formalmente, necessrio
mostrar que S U / 2 tem distribuio de Qui-quadrado com g U graus de liberdade, e
que, se a hiptese da nulidade for verdadeira, ( S R SU ) / 2 tem distribuio de Quiquadrado com g R g U graus de liberdade, independente da distribuio de S U / 2 .
Pode-se, ento, concluir que a varivel obtida em (4.85) tem distribuio de F com
g R g U e g U graus de liberdade.
Note-se que o denominador de (4.85) o quadrado mdio do resduo do modelo
original (irrestrito), que tem sido indicado por s 2 . Ento a expresso fica

F=

S R SU
( g R gU ) s 2

(4.86)

Se uma hiptese sobre os parmetros de uma regresso linear formulada como


H 0 : C = , onde C e so matrizes com elementos numricos dados, a expresso
(4.85) equivalente expresso (4.60), podendo-se deduzir (4.60) de (4.85).
Vejamos alguns exemplos de aplicao de (4.85). O procedimento sempre
envolve trs etapas: (a) obter a soma de quadrados residual do modelo irrestrito ( SU ) e
os respectivos graus de liberdade ( g U ); (b) construir o modelo restrito e obter a
correspondente soma de quadrados residual ( S R ) e seus graus de liberdade ( g R ); (c)
aplicar (4.85) e interpretar o resultado.
Consideremos os dados da tabela 4.1 e o modelo

Y j = + 1 X 1 j + 2 X 2 j + u j
Vamos admitir que queremos testar a hiptese H 0 : 1 = 0 . Ento o modelo restrito

Yj = + 2 X j + u j

179

Na seo 4.8 j obtivemos a soma de quadrados residual para o modelo original


(irrestrito), que
SU = 2,5 , com g U = 2

(4.87)

Na seo 4.11 (tabela 4.4) vimos que a soma de quadrados de regresso de uma
regresso de Y contra X 2 igual a 90, podendo-se verificar, ento, que a soma de
quadrados residual do modelo restrito

S R = 26,5 , com g R = 3

(4.88)

Substituindo os resultados (4.87) e (4.88) em (4.85), obtemos


26,5 2,5
24
F = 32 =
= 19,2
2,5
1,25
2
Como no podia deixar de ser, esse o valor de F para contribuio de X 1 na tabela
4.4, que o quadrado do valor de t referente hiptese H 0 : 1 = 0 obtido na seo 4.8
(t = 4,382).
Como segundo exemplo, vamos usar (4.85) para testar a hiptese
H 0 : 1 = 4 e 2 = 2

(4.89)

com base nos dados da tabela 4.5 (seo 4.12). O modelo irrestrito

Y j = + 1 X 1 j + 2 X 2 j + u j

(4.90)

Na seo 4.12 vimos que a soma de quadrados residual para esse modelo
SU = 3, com g U = 3

(4.91)

O modelo restrito fica

Yj = + 4X1j + 2X 2 j + u j
ou

Yj 4X1j 2X 2 j = + u j

(4.92)

Note-se que o modelo sempre deve ser escrito de maneira que no segundo
membro fiquem apenas o erro e os termos com parmetros a serem estimados.
Fazendo
W j = Yj 4X1j 2X 2 j ,

(4.93)

o modelo (4.92) fica

180

Wj = + u j

(4.94)

Usando (4.93), podemos calcular os 6 valores de W j para a amostra apresentada


na tabela 4.5. A estimativa de no modelo (4.94) , simplesmente W , que igual a
2,5. Os desvios dessa regresso so w j = W j W , pois como no h coeficientes de
regresso, a soma de quadrados residual a prpria soma de quadrados total (

w 2j = 48,5 , com 6 1 = 5 graus de liberdade). Portanto, para o modelo restrito (4.92)


temos

S R = 48,5, com g R = 5

(4.95)

Substituindo os resultados (4.89) e (4.95) na expresso (4.85), obtemos

48,5 3
45,5
F = 53 =
= 22,75
3
2
3

(4.96)

Adotando um nvel de significncia de 5% , o valor crtico de F para 2 e 3 graus


de liberdade 9,55. O resultado significativo, levando a rejeitar a hiptese (4.89).
Note-se que, como no podia deixar de ser, o resultado obtido em (4.96) idntico ao
obtido no final da seo 4.12, usando a expresso (4.60).

4.19. Interpretao geomtrica da anlise de regresso linear de acordo


com o mtodo de mnimos quadrados
Do estudo da lgebra vetorial sabemos que o vetor

X 1 11
x = X 2 = 2
X 3 10

(4.97)

pode ser representado, graficamente, por uma seta que vai da origem do sistema de
eixos ao ponto (11, 2, 10), num espao tridimensional, como mostra a figura 4.2.

181

Figura 4.2. Representao grfica de um vetor no espao tridimensional.


Genericamente, dizemos que

X1
X
x = 2
M

X n

Y1
Y
y = 2
M

Yn

so vetores no espao n-dimensional.


O produto escalar ou produto interno de dois vetores de mesma dimenso, x e y,
que indicamos x y , , por definio, igual a X i Yi . Temos
n

x y = y x = x y = y x = X i Yi
i =1

Verifica-se facilmente que o produto escalar de vetores distributivo em relao


soma, isto , se x, y e v so trs vetores de mesma dimenso,
x (y + v) = x y + x v

O mdulo ou comprimento do vetor x dado por


| x |= x x

Para vetores com duas ou trs dimenses pode-se verificar, atravs do teorema
de Pitgoras, que esta definio de comprimento de um vetor corresponde ao
comprimento da seta que o representa. O comprimento do vetor dado em (4.97)
| x |= 112 + 2 2 + 10 2 = 15
Por definio, dois vetores so ortogonais se seu produto escalar igual a zero,
isto , x ortogonal a y se, e somente se, x y = 0 . Assim, por exemplo, os vetores
182

2
x= e
1

1
y=
2

so ortogonais entre si, pois x y = 0 . Esses vetores esto representados na figura 4.3,
que mostra que as setas representativas de dois vetores ortogonais so perpendiculares
entre si.

Figura 4.3. Dois vetores ortogonais


Seja um escalar. Ento, se x um vetor com elementos X 1 , X 2 ,..., X n , os
elementos do vetor x so X 1 , X 2 ,..., X n . Os vetores x e x tm a mesma direo,
isto , so vetores colineares (as setas esto sobre a mesma reta-suporte). Se > 0, a
orientao ou sentido dos vetores x e x o mesmo e, se < 0, esses vetores tm
sentidos opostos.
Temos
| x |= (x) (x) = 2 x x =| | | x | ,

isto , o comprimento de x igual ao comprimento de x multiplicado pelo valor


absoluto de .
Para exemplificar, lembremos o vetor x dado em (4.97). Pode-se verificar que os
vetores 2x e 2x so colineares com x e tm comprimento igual a 30, isto , o dobro do
comprimento de x.
Vamos supor agora que, com base em uma amostra com apenas 3 observaes,
foram obtidos os pares de valores ( X i , Yi ) apresentados na tabela 4.9. As mdias das
duas variveis nessa amostra so iguais a zero, isto , xi = X i e y i = Yi (com i = 1, 2,
3).

183

TABELA 4.9. Valores de X i e Yi para uma amostra com 3 observaes.


X i = xi

Yi = y i

0
2
2

2
2
4

Seja x o vetor cujos elementos so os valores da varivel centrada xi e seja y o


vetor cujos elementos so os valores da varivel centrada yi , isto ,

0
2

x = 2 e y = 2
2
4

(4.98)

A figura 4.4 mostra a representao desses vetores no espao tridimensional.

Figura 4.4. O plano () dos vetores x e y.


importante notar a diferena entre esse tipo de representao grfica e aquele
das figuras 2.2 e 3.1. Nas figuras 2.2 e 3.1 cada eixo corresponde a uma varivel, ao
passo que na figura 4.4 cada eixo corresponde a uma observao. L utilizamos o
espao das variveis e aqui estamos considerando o espao das observaes.
Temos x x = 8

e y y = 24 . Portanto o comprimento do vetor x

| x |= 8 = 2 2 e o comprimento do vetor y | y = 24 = 2 6 .

Na figura 4.4, seja o plano dos vetores x e y. O plano um subespao


bidimensional do espao tridimensional. Qualquer que seja o nmero de observaes da
amostra, isto , qualquer que seja a dimenso (n) de x e y, desde que esses vetores no
184

sejam colineares, eles definem um plano (um subespao bidimensional) no espao ndimensional. Na figura 4.5 os vetores x e y esto representados nesse subespao
bidimensional.

Figura 4.5. A projeo vertical de y sobre a reta-suporte de x e o ngulo entre x e y.


Na figura 4.5 o ngulo entre os vetores x e y foi denominado . Foi obtida a
projeo vertical OA = y * do vetor y sobre a reta-suporte do vetor x. Como y * e x so
colineares, existe um escalar tal que

OA = y * = x

(4.99)

Temos

y * + AB = y
ou

AB = y y *
Uma vez que x e AB = y y * so vetores ortogonais entre si, temos
x (y y * ) = 0
Ento
x y = x y*

(4.100)

Substituindo (4.99) em (4.100), obtemos


x y = (x x)

ou

xy
xx

(4.101)

Na figura 4.5, como OAB um tringulo retngulo com hipotenusa igual a | y | ,


temos
185

cos =

| y* |
=
|y|

y* y*
yy

Lembrando (4.99), segue-se que


cos =

xx

(4.102)

yy

Substituindo (4.101) em (4.102) obtemos


xy

cos =

(x x)(y y )

(4.103)

Se os elementos de x e de y so, respectivamente xi e yi (com i = 1, 2, ..., n),


isto , so os valores das variveis centradas obtidos de uma amostra com n
observaes, verifica-se que
cos =

xi y i
xi2 y i2

= r,

(4.104)

onde r o coeficiente de correlao entre X e Y na amostra.


Para a amostra dada na tabela 4.9, que corresponde aos vetores x e y definidos
em (4.98) e representados nas figuras 4.4 e 4.5, temos
cos = r =

12
3
=
2
8 24

Donde

= 30 o
Vamos agora considerar a anlise de regresso de Y contra X de acordo com o
modelo
Yi = X i + u i
ou
y = x + u ,

onde

Y1
X1
Y2
X
y = e x = 2
M
M


Yn
X n

186

Para dar um exemplo numrico, vamos considerar os valores de X i e Yi dados


na tabela 4.9. Ento x e y so os vetores tridimensionais definidos em (4.98) e
representados nas figuras 4.4 e 4.5. Devemos ressaltar que o raciocnio apresentado a
seguir no depende da dimenso dos vetores x e y, pois estaremos considerando apenas
o plano (subespao bidimensional) definido por esses vetores (admitindo que x e y no
sejam colineares).
Se b a estimativa de , o vetor dos desvios
e = y bx

De acordo com o mtodo de mnimos quadrados, devemos determinar o valor de


b que minimiza a soma dos quadrados dos desvios, dada por ee ou e e . Mas e e e,
tambm, o quadrado do comprimento do vetor e = y bx . Devemos, portanto,
determinar o valor de b que minimiza o comprimento do vetor e = y bx .
Uma vez que b um escalar, bx um vetor colinear com x, como os vetores
OA e OC na figura 4.5. Se fizermos bx = OA , teremos e = AB e, se fizermos bx =
OC , teremos e = CB . Por outro lado, sabemos que a menor distncia de um ponto a
uma reta dada pela perpendicular baixada do ponto sobre a reta. Uma vez que, na
figura 4.5, OA = x , por construo, a projeo vertical de y sobre a reta-suporte do
vetor x, conclumos que, para minimizar o comprimento de e = y bx , devemos fazer

bx = OA = x . Portanto, o estimador de mnimos quadrados de


b=
Lembrando (4.101), obtemos
b=

xy
= ( x x) 1 x y
xx

Esta relao um caso particular de (4.7).


Para os valores de X i e Yi da tabela 4.9, obtemos x x = 8 , x y = 12 e
b = 12 / 8 = 1,5 .

Como OA = bx o vetor com os valores estimados de Yi , passaremos a indiclo por y , de acordo com a notao utilizada em sees anteriores.
O vetor dos desvios da regresso

AB = e = y OA = y y
No tringulo retngulo OAB da figura 4.5, o teorema de Pitgoras estabelece que

187

OB = OA + AB

ou
y y = y y + e e

Tambm podemos escrever


y y = y y + e e

ou
S.Q.total = (S.Q.Regr.) + (S.Q.Res.),
que uma relao j demonstrada anteriormente, mas de outra maneira.
Uma vez que x e e so vetores ortogonais entre si, temos

x e = xe = 0
Esta relao um caso particular de (4.8).
fcil verificar que se x e y fossem colineares, teramos = 0, r = cos = 1,
y = y = bx , e = 0 e S.Q.Res. = ee = 0 .

Vamos considerar, a seguir, o modelo de regresso linear mltipla


y = X + u

(4.105)

onde

Y1
Y
y = 2 ,


Yn

X 11
X
X = 12

X 1n


= 1 e
2

X 21
X 22
,

X 2n

u1
u
u = 2


u n

Se indicarmos por x1 e x 2 os vetores constitudos pela primeira e pela segunda


coluna da matriz X, respectivamente, isto , se fizermos

X 11
X 21
X
X
x1 = 12 e x 2 = 22 ,

X 1n
X 2n
temos

y = 1 x1 + 2 x 2 + u

(4.106)

188

Vamos admitir que os vetores y, x1 e x 2 tm dimenso igual ou superior a 3,


no so colineares nem esto todos em um mesmo plano, isto , vamos admitir que y,

x1 e x 2 so linearmente independentes.9 Observada esta condio, qualquer que seja a


dimenso (n 3) dos vetores x1 , x 2 e y, tais vetores geram um espao tridimensional.
A figura 4.6 mostra os 3 vetores nesse espao. Seja o plano (subespao
bidimensional) gerado por x1 e x 2 .

Figura 4.6. Os vetores y, x1 e x 2 .


De acordo com o mtodo de mnimos quadrados, devemos determinar

y = b1 x1 + b2 x 2 de maneira a minimizar e e = ( y y ) ( y y ) , que o quadrado do


comprimento do vetor y y . Devemos, portanto, determinar y = b1 x1 + b2 x 2 de
maneira a minimizar o comprimento do vetor y y . Necessariamente y = b1 x1 + b2 x 2
um vetor no plano , porque uma combinao linear dos vetores x1 e x 2 .
O ponto do plano que est mais prximo do ponto B (a extremidade do vetor
y) a projeo vertical de B sobre , isto , o ponto A na figura 3.6. Portanto y = OA
a combinao linear ( y = b1 x1 + b2 x 2 ) de x1 e x 2 que minimiza o comprimento do
vetor e = y y .
Obtido o vetor y = OA , podemos determinar os vetores b1 x1 e b2 x 2 . Para isso,
devemos traar por A retas paralelas a x1 e x 2 , construindo o paralelogramo OA1 AA2 .
Temos
9

Dado um conjunto de vetores, dizemos que eles so linearmente independentes se nenhum deles pode
ser expresso como uma combinao linear dos demais. Dados dois vetores linearmente independentes
(no colineares), x 1 e x 2 , uma combinao linear 1 x 1 + 2 x 2 sempre um vetor no plano definido por
x 1 e x 2 e, reciprocamente, todo vetor (ponto) neste plano uma combinao linear de x 1 e x 2 ;
dizemos, ento, que os vetores x 1 e x 2 geram o plano (subespao bidimensional). Analogamente, 3
vetores linearmente independentes geram um subespao tridimensional.

189

y = OA = OA1 + OA2 ,
OA1 = b1x1
e

OA 2 = b2 x 2
O valor absoluto de b1 o cociente da diviso do comprimento de OA1 pelo
comprimento de x1 e o valor absoluto de b2 o cociente da diviso do comprimento de
OA 2 pelo comprimento de x 2 . No caso da figura 4.6 verifica-se que b1 > 1 e 0 < b2 < 1
.

O vetor dos desvios da regresso

AB = e = y y
Como o segmento de reta AB , por construo, perpendicular ao plano , tal
segmento perpendicular ou ortogonal a toda reta desse plano. Em particular, AB
perpendicular a OA . Portanto OAB um tringulo retngulo e, conseqentemente
2

OB = OA + AB

ou
y y = y y + e e

ou, ainda,
S.Q.Total = (S.Q.Regr.) + (S.Q.Res.)
Como e = AB ortogonal a x1 e x 2 , temos que

x1 e = x1 e = 0
e

x 2 e = x2 e = 0
De acordo com essas relaes, podemos escrever

Xe = 0 ,

(4.107)

e = y Xb ,

(4.108)

que a relao (4.8).


Temos

onde

b
b = 1
b2
190

Substituindo (4.108) em (4.107), obtemos


X (y Xb) = 0

ou
X Xb = X y ,

que o sistema de equaes normais.


interessante examinar o que ocorre quando os vetores x1 e x 2 so colineares.
Nesse caso esses vetores geram apenas um subespao unidimencional, que a reta que
os contm, e no um plano. Seja y = OA a projeo vertical de y sobre essa reta, como
mostra a figura 4.7.

Figura 4.7. Vetores x1 e x 2 colineares.


Existem infinitas combinaes lineares de x1

e x 2 que produzem o vetor

y = OA . No caso da figura 4.7, admitindo que | x1 |= 1 , | x 2 |= 3 e | OA |= 2 , temos, por


exemplo,

OA = 2x1 + 0x 2 ,
OA = 0x 1 +

2
x2
3

ou

OA = x1 + x 2
Isso mostra que os valores de b1 e b2 em y = b1 x1 + b2 x 2 so indeterminados.
Esse o problema da multicolinearidade perfeita, j examinado, sob outro enfoque, na
seo 4.17.
Vrios outros problemas de anlise de regresso podem ser examinados com o
auxlio da interpretao geomtrica apresentada nesta seo.10 Como ilustrao final,
vamos considerar o exerccio 2.9, onde se pede para comparar a anlise de regresso

10

Uma exposio didtica do assunto pode ser encontrada em Wonnacott e Wonnacott (1976), parte II.

191

linear simples de Yi contra X i com a anlise de regresso linear simples de Z i contra


X i , com Z i = Yi + X i . As equaes estimadas de acordo com o mtodo de mnimos
quadrados so indicadas respectivamente por

Yi = a + bX i
e

Z i = c + dX i
Vamos demonstrar que c = a e d = b + 1.
Sejam y e y os vetores com os valores de Yi e Yi , respectivamente; seja x1 o
vetor com os valores de X i ; sejam z e z os vetores com os valores de Z i e Z i ,
respectivamente, e seja x 0 um vetor cujos elementos so todos iguais a 1. Temos

z = y + x1
y = ax 0 + bx 1
e
z = cx 0 + dx1
Na figura 4.8 esto representados os vetores x 0 , x1 e y . O plano gerado por
x 0 e x 1 denominado plano . Indicando a extremidade de y por B e a projeo
vertical de B sobre por A, temos que

OA = y
e
2

AB = (S.Q.Res. y | x 0 e x1 )

(4.109)

Traando pelo ponto A retas paralelas a x 0 e a x1 , obtemos


OA 0 = ax 0 e OA1 = bx1 ,
de tal maneira que
OA == y = ax 0 + bx1
Uma vez que neste caso a e b so positivos, segue-se que
a=

OA0
| x0 |

(4.110)

e
192

b=

OA1
| x1 |

(4.111)

Figura 4.8. Regresso linear simples de Y contra X e de Z = Y + X contra X.


Para obter o vetor z = x1 + y construmos o paralelogramo OBDQ. Ento BD
um segmento de reta paralelo ao plano com comprimento igual a | x1 | e OD = z .
Sendo C a projeo vertical de D sobre , temos
OC = z
e
2

CD = (S.Q.Res. z | x 0 e x1 )

(4.112)

Como BD paralelo a x1 e ao plano e AC a projeo de BD sobre ,


temos que AC = BD = | x1 | , com AC paralelo a x1 e, portanto, colinear com o
segmento de reta A0 A .
Alm disso, temos CD = AB . Lembrando (4.109) e (4.112), conclumos que
(S.Q.Res. z | x 0 e x1 ) = (S.Q.Res. y | x 0 e x1 ).
Traamos C1C paralelo a x 0 . Ento
A1C1 = AC =| x 1 |

(4.113)

e
OC = z = OA 0 + OC 1 ,
com
OA 0 = cx 0
e

OC 1 = dx1
193

Uma vez que neste caso c e d so positivos, segue-se que


c=

OA0
| x0 |

(4.114)

d=

OC1
| x1 |

(4.115)

Comparando (4.114) com (4.110) conclumos que


c=a
Examinando a figura 4.8 e lembrando (4.113), temos que
OC1 = OA1 + A1C1 = OA1 + | x1 |

Substituindo esse resultado em (4.115) obtemos


d=

OA1
+1
| x1 |

Lembrando (4.111) conclumos que


d = b + 1, c.q.d.

Exerccios
4.1. Mostre que as frmulas para regresso linear simples, deduzidas no Captulo 2, so
casos particulares das expresses gerais:
a) b = ( X X) 1 X y
b) ( XX) 1 2 , que a matriz de varincias e covarincias das estimativas dos
parmetros.
c) S.Q.Res. = y y b X y
d) V (Yh ) = x h ( XX) 1 x h 2

4.2. So dados os valores de X 1 , X 2 e Y da tabela a seguir:

194

X1

X2

10

12

10

Admite-se que as variveis esto relacionadas de acordo com o modelo


Y j = + 1 X 1 j + 2 X 2 j + u j , onde os u j so variveis aleatrias independentes,

homocedsticas, com mdia zero e distribuio normal.


a) Determine as estimativas dos parmetros da regresso linear mltipla de Y em
relao a X 1 e X 2 .
b) Faa a anlise de varincia da regresso.
c) Determine a contribuio de cada varivel para a soma de quadrados de
regresso. Verifique que o respectivo teste F igual ao quadrado do teste t
correspondente hiptese de que seja nulo o valor do coeficiente de regresso
da varivel em questo.
4.3. Idem, para
Y

X1

X2

X3

195

4.4. Idem para


Y

X1

X2

Alm disso, determine:


d) o valor dos coeficientes de correlao parcial rY 1.2 e rY 2.1 .
e) o intervalo de 95% de confiana para cada um dos trs parmetros do modelo
linear
Y j = + 1 X 1 j + 2 X 2 j + u j ,

admitindo que os u j so variveis independentes com distribuio normal de


mdia zero e varincia 2 .
f) a estimativa de Y para X 1 = 1 e X 2 = 2 , e o intervalo de 95% de confiana para

E (Y | X 1 = 1 e X 2 = 2 ).
g) Idem, para X 1 = 2 e X 2 = 4 (uma extrapolao).
4.5. So dados os seguintes valores, obtidos de uma amostra aleatria com 10
observaes:

X1

X2

X3

1
1
1
1
1
1
0
0
0
1

1
0
1
1
0
1
0
0
0
1

0
0
0
0
0
0
1
0
1
0

5
7
3
7
9
5
3
8
7
6

196

Admite-se que as variveis esto relacionadas de acordo com o modelo


Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j ,

onde os u j so erros independentes com distribuio normal de mdia zero e


varincia 2 .
a) Determine as estimativas dos parmetros.
b) Faa a anlise de varincia da regresso.
c) Teste a hiptese H 0 : = 0 contra H A : 0 , ao nvel de significncia de
1%.
d) Teste a hiptese H 0 : 3 = 0 contra H A : 3 > 0 , ao nvel de significncia de
5%.
e) Determine os valores dos coeficientes de determinao parcial rY21.23 , rY22.13 e
rY23.12 .

f) Determine a estimativa de Y j para X 1 = 0 , X 2 = 1 e X 3 = 1 , e o respectivo


intervalo de 95% de confiana.
4.6. No caso do exemplo apresentado na seo 4.13, teste, atravs do valor de t, a
hiptese H 0 : 3 = 0 contra a hiptese H A : 3 0 , considerando um nvel de
significncia de 5%. Obtenha, tambm, o valor do teste F para a contribuio de
X 3 , verificando que este valor igual ao quadrado do valor de t obtido
anteriormente. Determine, para o mesmo exemplo, a estimativa de Y j para
X 1 = X 2 = X 3 = 1 e o respectivo intervalo de 95% de confiana.
4.7. Considerando o modelo de regresso mltipla
Y j = + 1 X 1 j + 2 X 2 j + u j u ,

com todas as variveis centradas, demonstre que


rY21 2r12 rY 1 rY 2 + rY22
R =
,
1 r122
2

onde R 2 o coeficiente de determinao mltipla.


4.8. Considerando

resultado

do

problema

anterior,

mostre

que,

se

rY 1 = rY 2 = r12 = r 1 , obtemos

197

R2 =

2r 2
1+ r

Discuta o caso em que rY 1 = rY 2 = r12 = r = 1 .


4.9. Considerando o modelo do problema 4.7 mostre que, se rY 1.2 = 1 , temos rY22.1 = 1 e
R 2 = 1.
4.10. So dados os valores de Y j , X 1 j e X 2 j da tabela a seguir:
Yj

X1j

X2j

3
0
6
9

0
0
1
3

0
3
1
0

Considerando o modelo Y j = + 1 X 1 j + 2 X 2 j + u j , onde os u j so erros


independentes com distribuio normal de mdia zero e varincia 2 ,
a) Determine a equao de regresso de Y em relao a X 1 e X 2 .
b) Calcule o valor do teste F para a regresso (para testar a hiptese
H 0 : 1 = 2 = 0 ).
c) Calcule os valores de R 2 e rY21.2 .
d) Teste a hiptese H 0 : 1 = 2 contra a hiptese H A : 1 > 2 , considerando o
nvel de significncia de 5%.
e) Determine a estimativa de Y para X 1 = X 2 = 2 e o respectivo intervalo de
90% de confiana.
f) Calcule os valores de Y para as observaes da amostra e, a seguir, o
quadrado do coeficiente de correlao entre Y e Y (note que esse valor igual
a R 2 ).
4.11. So dados os valores de X 1 , X 2 e Y da tabela a seguir:
Y

X1

X2

4
5
4
11

0
1
2
3

3
1
2
0
198

Admite-se que as variveis esto relacionadas de acordo com o modelo


Y j = + 1 X 1 j + 2 X 2 j + u j (j = 1, ..., 4), onde os u j so erros independentes,

homocedsticas, com mdia zero e distribuio normal.


a) Determine a equao de regresso de Y em relao a X 1 e X 2 .
b) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 = 0 .
c) Calcule o valor do coeficiente de determinao mltipla.
d) Calcule o valor de rY21.2 .
e) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 2 = 4 .
f) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 e 2 = 4 .
g) Delimite a regio de 95% de confiana para 1 e 2 .
h) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 , contra a
hiptese H A : 1 > 2 .
i) Calcule a estimativa de Y para X 1 = X 2 = 2,5 e determine o respectivo
intervalo de 90% de confiana.
j) Calcule os valores de Y para as observaes da amostra e, a seguir, o
quadrado do coeficiente de correlao entre Y e Y (note que esse valor igual
a R 2 ).
4.12. Com

finalidade

de

ajustar

modelo

Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + 4 X 4 j + u j foi obtida uma amostra de 8

observaes. Os valores das variveis explanatrias constam da tabela a seguir:

X1

X2

X3

X4

1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1

3
1
1
1
1
1
1
3

199

Verifique que, embora o valor dos coeficientes de correlao entre pares de


variveis independentes seja sempre inferior a 0,58, existe multicolinearidade
perfeita.
4.13. As variveis explanatrias X 1 e X 2 assumem os valores 3, 1, +1 e +3. Temos
16 observaes de Y = f ( X 1 , X 2 ) correspondendo a todas as combinaes
possveis para X 1 e X 2 . Decidiu-se ajustar, a esses dados, uma regresso mltipla
com um termo constante e todos os possveis termos do 1o, 2o, 3o e 4o graus em X 1
e X 2 . No foi possvel obter as estimativas dos parmetros b = ( XX) 1 Xy . Por
qu? Decidiu-se, ento, ignorar a varivel X 2 e se tornou a ajustar, aos mesmos
dados, um polinmio do quarto grau em X 1 . Novamente no foi possvel obter as
estimativas dos parmetros. Por qu? (Extrado de DRAPER e SMITH, 1966, p.
160).
4.14. Sejam 3 regresses onde o nmero de observaes e os valores das variveis
independentes so os mesmos; numa das regresses a varivel dependente Y1 j , na
outra Y2 j , e na terceira Y3 j = Y1 j + Y2 j . Sendo b 1 , b 2 e b 3 os vetores das
estimativas dos parmetros da primeira, da segunda e da terceira regresso,
respectivamente, prove que b 3 = b 1 + b 2 .
4.15. So dados os pares de valores X, Y da tabela a seguir:
X
2
1
0
1
2

Y
0,9
6,4
8,4
10,4
8,9

Admite-se que as variveis esto relacionadas de acordo com o modelo


Yi = + X i + X i2 + u i , onde os u i so os erros independentes com distribuio

normal de mdia zero e varincia 2 .


a) Determine as estimativas dos parmetros.
b) Faa a anlise de varincia da regresso, testando, ao nvel de significncia de
5%, a hiptese H 0 : = = 0 .
c) Calcule o valor do coeficiente de determinao da regresso ajustada.

200

d) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 contra

H A : < 0.
e) Determine o valor da contribuio do termo quadrtico para a soma de
quadrados de regresso. Verifique se o respectivo testes F significativo ao
nvel de 5% (note que o valor de F obtido igual ao quadrado do valor de t
calculado no item anterior).
4.16. Com base em uma amostra com 34 observaes foi estimada a equao de
regresso de Y contra X 1 , X 2 e X 3 , considerando o modelo
Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j

O coeficiente de determinao parcial de Y e X 1 , dados X 2 e X 3 , igual a 0,25.


Teste, ao nvel de significncia de 1%, a hiptese de que 1 = 0 .
4.17. Demonstre que o coeficiente de determinao mltipla de uma regresso linear
mltipla qualquer (definido como o cociente da diviso da S.Q.Regr. pela
S.Q.Total) igual ao quadrado do coeficiente de correlao entre Y j e Y j (Para
facilitar a demonstrao considere que a regresso tenha sido ajustada com todas
as variveis centradas).
4.18. Admite-se que as variveis X 1 , X 2 e Y esto relacionadas conforme o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j

onde u j so erros independentes com E (u j ) = 0 e E (u 2j ) = 2


Para uma amostra de 9 observaes, obtivemos:
X1 = X 2 = 0

x1 y = 8

x12 = 8

x2 y = 8

x 22 = 4

y 2 = 42

x1 x2 = 0

Y =6

a) Calcule as estimativas de mnimos quadrados para , 1 e 2 (a, b1 e b2 ,


respectivamente).
b) Ache a estimativa da matriz de varincias e covarincias de a, b1 e b2 .
c) Determine o intervalo de previso, ao nvel de confiana de 95%, para uma
nova observao de Y com X 1 = X 2 = 1 .
d) Teste a hiptese H 0 : 2 = 1 contra a hiptese alternativa H A : 2 < 1 .

201

e) Teste a hiptese H 0 : = 10 e 1 2 2 = 0 .
Adote, nos testes, o nvel de significncia de 5%.
4.19. Um ensaio de adubao forneceu os seguintes resultados:
X = dose de adubo por hectare
0
1
2
3

Y = produo por hectare


6; 8
16; 18
18; 20
12; 14

Pode-se verificar que Yi = 112 , Y = 14 e (Yi Y ) 2 = 176


a) Admitindo que a funo de produo seja uma parbola do 2o grau, determine
as estimativas dos parmetros dessa funo de acordo com o mtodo de
mnimos quadrados.
b) Faa a anlise de varincia da regresso e calcule o coeficiente de
determinao.
c) Sabendo que a relao entre o preo da dose de adubo e o preo do produto
igual a 2, determine a quantidade economicamente tima de adubo a ser
aplicada.
d) Verifique se o coeficiente do termo quadrtico estatisticamente diferente de
zero. Pressupe-se que a lei dos rendimentos marginais decrescentes seja
vlida.
e) Teste a hiptese de que a produo mxima obtida aplicando-se 2 doses de
adubo por hectare.
Considere, nos testes estatsticos, um nvel de significncia de 1%.
4.20. Foi estabelecido o seguinte modelo de funo de produo:
Yi = 0 + 1 X 1i + 2 X 2i + ui

(i = 1, ..., n)

onde o ndice i indica a empresa agropecuria, Yi o logaritmo do valor da


produo, X 1i o logaritmo da mo-de-obra utilizada e X 2i o logaritmo do
capital utilizado.
A amostra tem 23 observaes e so conhecidas as seguintes matrizes (relativas
ao modelo com todas as variveis centradas, inclusive a dependente)
12 8
XX =

8 12

10
Xy =
8

yy = 10

202

a) Determine as estimativas dos coeficientes de regresso e dos respectivos


desvios padres
b) Calcule o valor de R 2 .
c) Teste se os rendimentos escala so constantes, isto , teste a hiptese
H 0 : 1 + 2 = 1 , considerando um nvel de significncia de 5%.
4.21. So dados os valores das variveis X 1 j , X 2 j e Y j para uma amostra com 6
observaes:
X1 j

0
1
1
2
2
3

X2j

Yj

0
1
2
1
2
3

0,5
3,5
7,0
7,0
7,5
11,5

a) Determine a equao de regresso linear de Y em relao a X1 e X 2 .


b) Calcule o valor do coeficiente de determinao da regresso.
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 + 4 contra a
hiptese alternativa H A : 1 < 2 + 4 .
d) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 1 = 3 e 2 = 5 .
e) Calcule o coeficiente de determinao parcial

entre Y j e X 2 j (rY22.1 ) e

verifique se estatisticamente diferente de zero, considerando um nvel de


significncia de 1%.
f) Calcule a estimativa de Y para X 1 = 0,5 e X 2 = 2,5 e determine o respectivo
intervalo de 90% de confiana.
g) O problema da multicolinearidade mais srio no exerccio anterior ou neste?
Justifique.
4.22. Numa anlise da demanda de certo produto, baseada em dados anuais para um
perodo de 17 anos, foram obtidos os seguintes valores, referentes s variveis Y
(logaritmo da quantidade consumida per capita), X1 (logaritmo da renda per
capita) e X 2 (logaritmo do preo do produto).

203

Mdias

Estimativas dos
desvios padres

Y = 4,5

sy = 3 5

X1 = 1
X2 = 1

s1 = 6
s2 = 6

Coeficiente de
correlao
rY 1 =
rY 2 =

5
30
4
30

r12 = 0,5

a) Calcule as estimativas dos coeficientes de regresso relativos a X1 e a X 2 na


regresso linear de Y em relao a X1 e X 2 .
b) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 2 = 0 contra a
hiptese alternativa H 0 : 2 < 0 .
4.23. Admite-se que as variveis Y, X e T esto relacionadas de acordo com o modelo
Y j = + X j + T j + u j ,

onde T o tempo, medido em anos, e u j so erros aleatrios com mdia zero e


varincia constante. Sejam a, b e c as estimativas de mnimos quadrados de , e

, obtidas a partir de uma amostra com n observaes anuais de X e Y. Mostre que


o valor de b, obtido atravs das frmulas usuais de regresso mltipla, igual
estimativa do coeficiente de regresso de Y em relao a v, sendo v os desvios da
regresso linear simples de X em relao a T.
4.24. Numa anlise da demanda de certo produto, baseada numa srie temporal de
dados, foram estimados

os parmetros da regresso de Y (logaritmo da

quantidade consumida per capita) em relao a X (logaritmo do preo do produto)


e T (tempo, em anos).
Explique o significado econmico da incluso do tempo como varivel
explanatria.
4.25. Considere a matriz
A=I

1
,
n

204

onde I uma matriz unitria de ordem n e um vetor-coluna com n elementos,


todos iguais a 1.
a) Mostre que A uma matriz quadrada, simtrica e idempotente.
b) Demonstre que tr(A) = n 1.
4.26. Considere a matriz A, definida no exerccio anterior, e o modelo de regresso
linear mltipla apresentado no incio do captulo 4, isto ,
y = X + u ,

onde y um vetor-coluna com as n observaes da varivel dependente, X uma


matriz n p de valores fixos, um vetor-coluna com p parmetros (incluindo

, o termo constante da equao de regresso) e u o vetor-coluna dos erros, com


E (u) = 0 e E (uu) = I 2 .

Demonstre que:
a) S.Q.Total = yAy
b) S.Q.Total = u Au + X AX + 2 X Au
c) S.Q.Total = tr ( Auu) + X AX + 2 X Au
d) E(S.Q.Total) = (n 1) 2 + X AX
Finalmente, considerando (4.22) e lembrando que
S.Q.Regr. = (S.Q.Total) (S.Q.Res.),
Deduza que
E(S.Q.Regr.) = X AX + (p 1) 2
Verifique, ainda, que (2.32) um caso particular desse resultado e que o valor de
X AX no depende de .

4.27. Considere, novamente, o modelo de regresso linear mltipla do exerccio anterior


e lembre as propriedades das matrizes H e M definidas na seo 4.5.
a) Se x j a j-sima coluna de X , verifique que o j-simo elemento da diagonal
de H

205

h j = xj ( XX) 1 x j
b) Utilizando (4.20), deduza que E (e) = 0 e que a matriz de varincias e
covarincias do vetor de desvios
V (e) = E (ee) = M 2
c) Demonstre que a varincia do desvio da j-sima observao

V (e j ) = (1 h j ) 2
e que a respectiva estimativa
V (e j ) = (1 h j ) s 2
d) Para o exemplo numrico apresentado na seo 4.8, verifique que h1 = 0,6 e
V (e1 ) = 0,5 . Muitas vezes se considera que o quadrado mdio do resduo ( s 2

), que a estimativa no-tendenciosa da varincia do erro, , tambm, a


estimativa da varincia dos desvios. Note como neste caso (com n pequeno) a
estimativa correta muito diferente.
4.28. Considere o modelo
Yt = 1 + 2 x2t + 3 x3t + ut (t = 1, ..., n)
com
E (ut ) = 0 para todo t
E (ut2 ) = 2 para todo t

E (u t u s ) = 0 se t s
e x 2 t = x 3t = 0
t

Seja b3 uma estimativa no-tendenciosa de 3 , obtida de dados independentes.


Sabendo que a varincia dessa estimativa V (b3 ) = v 2 , demonstre que a varincia
da estimativa do coeficiente de regresso de ( Yt b3 x3t ) contra x2t , de acordo com
o mtodo de mnimos quadrados,

2
x

2
2t

+ v 2 b322 ,

206

onde b32 a estimativa do coeficiente angular da regresso linear simples de x3t


em relao a x 2t .
4.29. Foi proposto o seguinte modelo para analisar o crescimento de uma espcie
vegetal (baseado em AIGNER, 1971, p. 107-108):
Y j = + 1 X 1 j + 2 X 2 j + u j ,

onde Y a altura da planta, em cm, X 1 o tempo decorrido, em semanas,


X 2 = X 12 e os u j so erros aleatrios independentes com distribuio normal de
mdia zero e varincia 2 .
A partir de uma amostra com n = 13 observaes semanais, com a varivel X 1
assumindo os valores 6, 5, 4, 3, 2, 1, 0, 1, 2, 3, 4, 5 e 6, foram obtidos
os seguintes resultados:
Y = 32

y 2j = 3640

rY 1 = 0,90

X1 = 0

x12j = 182

rY 2 = 0,20

X 2 = 14

x22 j = 2002

a) Calcule as estimativas de , 1 e 2 de acordo com o mtodo de mnimos


quadrados.
b) Calcule R 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 = 0 .
d) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 2 = 0 .
4.30. Considerando o exemplo numrico do captulo 2, teste, ao nvel de significncia
de 5%, a hiptese de que = 5 e = 0.
4.31. Considere o modelo Y j = 1 X 1 j + 2 X 2 j + u j , onde os u j so erros aleatrios
independentes com distribuio normal de mdia zero e varincia 2 .

207

a) Utilizando os dados da tabela a seguir, teste, ao nvel de significncia de 5%, a


hiptese H 0 : 1 = 2 .

X1

X2

0
0
0
0
1
1

1
1
1
1
0
0

0
0
1
3
5
3

b) Verifique que sob

H 0 , isto , com

1 = 2 = , o modelo fica

Y j = ( X 1 j + X 2 j ) + u j . Seja S1 , com n 2 graus de liberdade, a soma de

quadrados residual para o modelo Y j = 1 X 1 j + 2 X 2 j + u j e seja S 2 , com

n 1

graus de liberdade, a soma de quadrados residual para o modelo

Y j = ( X 1 j + X 2 j ) + u j . Calcule o valor de

S 2 S1
S1 /(n 2)

e compare com o valor de F relativo ao teste de hiptese da parte (a).


4.32. Com base em uma amostra aleatria com n observaes foi estimada, pelo mtodo
de mnimos quadrados, a equao de regresso linear mltipla de Y contra X 1 e

X 2 , ..., X k e foram obtidas, atravs da equao ajustada, as estimativas de Y para


as n observaes da amostra, isto , foram calculados os valores de Y j para j = 1,
2, ..., n.
A seguir o mtodo de mnimos quadrados novamente utilizado para estimar os
parmetros da equao de regresso linear simples de Y j contra Y j , isto , para
obter as estimativas (c e d) dos parmetros e do modelo
Y j = + Y j + j
Deduza quais so os valores de c e d. Faa um grfico ilustrando suas concluses.
4.33. So dados os valores de Y (renda), X 1 (escolaridade) e X 2 (idade) observados em
uma amostra aleatria de 5 indivduos:

208

Yj

X1 j

X2j

10
20
17
12
11

6
12
10
8
9

28
40
32
36
34

Fonte: S.R. SEARLE. Linear Models. Wiley, 1971.

Verifica-se que
Y j = 70 ,

Y = 14 ,
X 2 = 34 ,

X 2 j = 170 ,

x22 j = 80

X 1 j = 45 ,

X1 = 9 ,

x12j = 20 ,

x1 j x 2 j = 32

a) Qual a estimativa de mnimos quadrados do coeficiente angular da regresso


linear simples de Y contra X 1 ?
b) Qual a estimativa de mnimos quadrados do coeficiente angular da regresso
linear simples de Y contra X 2 ?
c) Determine as estimativas de mnimos quadrados (a, b1 e b2 ) dos parmetros
da equao de regresso linear mltipla de Y em relao a X 1 e X 2 .
d) Considerando o modelo

Y j = + X 1 j + u j , onde os

uj

so erros

independentes entre si com distribuio normal de mdia zero, varincia 2 e


independente de X 1 j , teste a hiptese H 0 : = 0 contra a hiptese H A : > 0
, adotando um nvel de significncia de 5%.
e) Considerando o modelo Y j = + 1 X 1 j + 2 X 2 j + u j , onde os u j so erros
independentes entre si com distribuio normal de mdia zero, varincia 2 e
independente de X 1 j , teste a hiptese H 0 : 1 = 0 contra a hiptese

H A : 1 > 0 , adotando um nvel de significncia de 5%.


f) Tanto no item (d) como no item (e) o teste se refere influncia de X 1 sobre
Y. Os resultados dos testes so diferentes? Por qu?
g) possvel, com base na amostra dada, fazer o teste para falta de
ajustamento relativa ao modelo do item (d)? Explique.

209

h) possvel, com base na amostra dada, estimar os parmetros do modelo a


seguir? Justifique a resposta.

Y j = + 1 X 1 j + 2 X 2 j + 3 X 12j + 4 X 22 j + u j
4.34. Um pesquisador admite que a varivel Y linearmente dependente das variveis

X 1 e X 2 . Obtm, ento, uma amostra aleatria com n observaes de Y, X 1 e


X 2 . Os coeficientes de correlao simples so rY 1 = 0 , rY 2 = 0,8 e r12 = 0,6 . O
pesquisador, que est procurando explicar as variaes de Y, observando que o
coeficiente de correlao simples entre Y e X 1 igual a zero ( rY 1 = 0 ), prope que

X 1 deixe de ser considerada como varivel explanatria. verdade que, como


sugere esta proposta, o coeficiente de determinao da regresso linear mltipla
de Y em funo de X 1 e X 2 igual ao coeficiente de determinao da regresso
linear de Y contra apenas X 2 ? Calcule esses coeficientes de determinao.
4.35. Seja Q a quantidade demandada de certo produto, em determinado mercado, por
unidade de tempo, seja P o respectivo preo e seja W a renda per capita dos
consumidores. Admita que essas variveis esto relacionadas de acordo com o
modelo

Q j = Pj1W j 2 j
e que u j = log j so erros aleatrios independentes com mdia zero e varincia
constante. Dispomos das seguintes observaes:

Pj

Wj

Qj

1
1
10
10
10
100
100
100
1000
1000

1
10
1
10
100
100
10
1000
1000
100

10
100
10
100
100
100
10
100
10
10

a) Que anamorfose devem ser feitas para obtermos um modelo de regresso


linear mltipla?
210

b) Obtenha as estimativas de , 1 e 2 (utilize logaritmos decimais).


c) Faa a anlise de varincia da regresso e calcule o valor do coeficiente de
determinao mltipla. Teste, ao nvel de significncia de 5%, a hiptese
H 0 : 1 = 2 = 0 .
d) Teste, ao nvel de significncia de 5%, a hiptese de que o coeficiente de
elasticidade-preo da demanda do produto igual a 1, contra a hiptese
alternativa de que o coeficiente de elasticidade-preo da demanda , em valor
absoluto, menor do que 1.
e) Teste, ao nvel de significncia de 5%, a hiptese de que o coeficiente de
elasticidade-renda da demanda do produto igual a 0,85, contra a hiptese
alternativa de que esse coeficiente diferente de 0,85.
f) Calcule a estimativa da variao percentual na quantidade, demandada quando
o preo aumenta de 1% e a renda per capita cresce 3%. Obtenha, tambm, a
estimativa do desvio padro dessa estimativa.
Sugesto: (1o) Mostre que as estimativas de 1 e 2 no so alteradas se
mudarmos a base dos logaritmos utilizados; portanto, essas estimativas seriam
as mesmas se fossem utilizados logaritmos neperianos; (2o) Lembre que, com
logaritmos neperianos temos

Q
Q

= (log Q) , desde que as variaes

consideradas sejam pequenas.


4.36. Considere o modelo estatstico de uma funo de produo tipo Cobb-Douglas

Z j = W1j 1W2j2 j

(1)

onde Z a produo de determinada cultura, W1 a rea cultivada, em hectares, e

W2 representa o montante de despesas com mo-de-obra e demais insumos


(sementes, fertilizantes, defensivos, etc.). Admita que se dispe dos valores de Z,

W1 e W2 para uma amostra de n empresas agrcolas.


De (1), aplicando logaritmos e fazendo log Z j = Y j , log W1 j = X 1 j , log W2 j = X 2 j
, log = e log j = u j , obtemos o modelo de regresso linear mltipla
Y j = + 1 X 1 j + 2 X 2 j + u j

(1)

211

Sejam a, b1 e b2 as estimativas de mnimos quadrados de , 1 e 2 ,


respectivamente.
Vamos admitir, agora, que o pesquisador prefere analisar como a produtividade da
cultura varia em funo do montante de despesas com mo-de-obra e insumos por
hectare, isto , como Z /W1 varia em funo de W2 /W1 . A rea cultivada ( W1 )
mantida como varivel independente no modelo para verificar se a escala de
produo afeta a produtividade.
Ento o modelo fica
2

W2 j
Z
= W1j1
W
W1 j
1j

(2)

O modelo (2) pode ser obtido de (1) dividindo os dois membros da equao por
W1 j . Verifica-se que = , 1 = 1 + 2 1 e 2 = 2 .

De (2), aplicando logaritmos e fazendo log = , obtemos o modelo de regresso


linear mltipla
(Y j X 1 j ) = + 1 X 1 j + 2 ( X 2 j X 1 j ) + u j

(2)

Sejam c, d1 e d 2 as estimativas de mnimos quadrados de , 1 e 2 ,


respectivamente
a) Demonstre que d 2 = b2 , d1 = b1 + b2 1 e c = a.
b) Prove que o quadrado mdio do resduo relativo regresso (1) igual ao
quadrado mdio do resduo relativo regresso (2).
c) No modelo (1), para testar a hiptese de que a funo de produo
linearmente homognea (rendimentos constantes escala), ou seja, para testar
H 0 : 1 + 2 = 1 , devemos calcular

t1 =

b1 + b2 1
V (b + b )
1

No modelo (2), para testar H 0 : 1 = 0 devemos calcular


t2 =

d1
V (d1 )

Mostre que essas hipteses so equivalentes e demonstre que t1 = t 2 .


212

4.37. Admite-se que as variveis X 1 , X 2 e Y esto relacionadas de acordo com o


modelo
Y j = + 1 X 1 j + 2 X 2 j + u j ,

onde os u j so erros aleatrios, com as pressuposies usuais. dada a seguinte


amostra:

X1

X2

6
10
13
15

24
16
10
6

2
24
50
64

possvel estimar os parmetros do modelo com base nesta amostra? O nmero


de observaes insuficiente? Explique.
4.38. Admite-se que Y uma funo linear de X 1 , X 2 e X 3 , de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j ,

em que o erro u j tem as propriedades usuais. A partir de uma amostra com 14


observaes, foram obtidas as seguintes matrizes, considerando todas as variveis
na sua forma original:
14 56 84 0
56 248 368 0
,
XX =
84 368 600 0

0
0 14
0

168
656

Xy =
1040

28

y y = 2196

Com todas as variveis centradas, as matrizes so

24 32 0
16

XX = 32 96 0 , Xy = 32 e y y = 180
0 0 14
28
a) Qual o valor da mdia de X 2 na amostra?
b) Determine as estimativas de mnimos quadrados de 1 , 2 e 3 .
c) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 1 = 2 = 3 = 0 .
213

d) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 3 = 0 .


e) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 = 0 .

4.39. A Tabela a seguir mostra os valores de X 1 , X 2 , X 3 e Y em uma amostra com 8


observaes:

X1

X2

X3

13
3
8
13
8
3
8
8

32
4
18
34
18
2
18
18

5
45
23
5
27
45
23
27

116
8
63
118
61
6
69
55

Fazendo uma regresso mltipla de Y contra X 1 , X 2 e X 3 , verifica-se que os


respectivos coeficientes de regresso so 0, 1 e 2. Usando X 2 e X 3 como controles,
no se constata nenhum efeito de X 1 sobre Y.
Verifique, tambm, que a regresso simples de Y contra X 1 fornece um
coeficiente de regresso igual a 11 e que o teste t da respectiva hiptese de nulidade
igual a 26,42, fortemente significativo.
Esses dados foram construdos com X 2 e X 3 como funes de X 1 (com erros
independentes) e Y como funo de X 2 e X 3 . No h efeito direto de X 1 sobre Y, mas
h efeitos importantes associados a X 2 e X 3 .

Respostas
4.2. a) Y = 3 X 1 + X 2
b) F = 14
c) (Contribuio de X 1 ) = 72; F = 18
(Contribuio de X 2 ) = 40; F = 10

214

4.3. a) Y = 6 + X 1 X 2 + 2 X 3
b) F = 5/3
c) (Contribuio de X 1 ) = 6; F = 5/3
(Contribuio de X 2 ) = 4; F = 10/9
(Contribuio de X 3 ) = 8; F = 20/9
4.4. a) Y = 2 X 1 + X 2
b) F = 2,5
c) (Contribuio de X 1 ) = 40/13; F = 20/13
(Contribuio de X 2 ) = 5; F = 2,5

10
= 0,659 ;
23

d) rY 1.2 =

rY 2.1 =

5
= 0,745
3

e) 6,67 < < 6,67 ; 4,94 < 1 < 8,94 ; 1,72 < 2 < 3,72
f) 4 3,33
g) 8 10,18
4.5. a) Y = 6 + X 1 X 2 + 2X 3 , s 2 = 3
b) F = 2
c) t = 10,792, significativo ( t 0 = 3,707)
d) t = 1,633, no-significativo ( t 0 = 1,943)
e) rY21.23 =

55
55
4
; rY22.13 =
e rY23.12 =
202
262
13

f) 7 3,73
4.6. t = 3,65, significativo
6,5 1,095
4.10. a) Y = 3,5 + 2 X 1 X 2
b) F = 7
c) R 2 =

14
= 0,9333
15

rY21.2 =

6
= 0,8571
7

d) t = 3,67, no-significativo
e) 5,5 10,47

215

4.11. a) Y = 5,5 + 2 X 1 3 X 2
b) F = 56,5, no-significativo ( F0 = 200 )
c) R 2 =

113
= 0,9912
114

d) rY21.2 =

36
= 0,8780
41

e) t = 9,39, no-significativo
f) F = 274,50, significativo
g) A regio de confiana delimitada pela elipse 5q12 8q1q 2 + 5q 22 = 400
onde q1 = 1 2 e q 2 = 2 + 3
h) t = 10,607, significativo
i) 3 9,47 ou 6,47 < E (Y | X 1 = X 2 = 2,5) < 12,47
4.15. a) Y = 9 + 2 X X 2 , s 2 = 0,35
b) F = 77,14, significativo
c) R 2 = 0,9872
d) t = 6,325, significativo
e) (Contribuio de X 2 ) = 14
F = 40, significativo
4.16. F = 10, significativo ( F0 = 7,56)
4.18. a) a = 6, b1 = 1 e b2 = 2

b)

0
1 / 3 0

( XX) s = 0 3 / 8 0
0
0 3 / 4
1

c) 2,17 < Yh < 8,17


d) t = 0,943, no-significativo (A regio de rejeio t 1,943)
e) F = 25,33, significativo ( F0 = 5,14)
4.19. a) Y = 7 + 14 X 4 X 2
b) F = 52,5; R 2 = 0,9545
c) 1,5 doses
d) t = 8,944, significativo (A regio de rejeio t 3,365)
e) F = 11,11, no-significativo ( F0 = 16,26)

216

4.20. a) b1 = 0,7 , b2 = 0,2 , s(b1 ) = s(b2 ) = 0,1025


b) R 2 = 0,86
c) t = 1,195, no-significativo ( t 0 = 2,086)
4.21. a) Y = 2 X 1 + 2 X 2
b) R 2 = 0,964 .
c) t = 2,828, significativo (A regio de rejeio t 2,353)
d) F = 41, significativo ( F0 = 30,82)
e) rY221 =

80
= 0,708 ;F = 7,27, no-significativo ( F0 = 34,12)
113

f) Y = 6

2,54 < E (Y | X 1 = 0,5; X 2 = 2,5) < 9,46


g) No exerccio anterior temos r12 = 0,67 e neste temos r12 = 0,82 .
Portanto, a multicolinearidade mais forte no exerccio 4.21.
4.22. a) b1 = 2 e b2 = 1
b) s 2 = 24 / 7 ; t = 4,583, significativo (a regio de rejeio t 2,624).
4.24. O tempo, em anos, , neste caso, uma varivel proxy (varivel representativa) para
vrias variveis scio-econmicas, como a renda per capita e as mudanas nos
hbitos de consumo (estas, por sua vez, associadas crescente urbanizao etc.).
4.29. a) b1 = 4,025 , b2 = 0,2697 e a = 35,776.
b) R 2 = 0,85 .
c) F = 28,33, significativo ( F0 = 4,10)
d) t = 1,633, no-significativo, ( t 0 =2,228)
4.30. F = 18, significativo ( F0 = 4,46)
4.31. a) b1 = 4 e b2 = 1 ; s 2 = 2
F = 6, no-significativo ( F0 = 7,71)
b) = F = 6 . Na realidade, o clculo de , como foi indicado neste item do
exerccio, uma maneira de obter o valor de F para testar a hiptese
H 0 : 1 = 2 .
4.32. d= 1 e c = 0

217

4.33. a) 1,75
b) 0,625
7
25
5
, b1 =
e b2 =
3
12
24
d) t = 3,796, significativo ( t 0 = 2,353)

c) a =

e) t = 2,331, no-significativo ( t 0 = 2,920)


f) A incluso de X 2 afeta o valor da estimativa do coeficiente de regresso, o
valor da estimativa ( s 2 ) da varincia residual e o valor do coeficiente, obtido
da matriz ( XX) 1 , da varincia da estimativa do parmetro. Este ltimo
efeito, bastante importante neste exemplo, se deve correlao entre X 1 e X 2
.
g) No, porque no h repeties.
h) Sim. Entretanto, como temos apenas 5 observaes e o modelo tem 5
parmetros, no possvel fazer qualquer anlise estatstica (no h graus de
liberdade para o resduo).
4.34. R 2 = 1 e rY22 = 0,64 .
4.35. a) Y = log Q , X 1 = log P e X 2 = log W .
b) c = 10 10 , b1 = 0,5 e b2 = 0,5 .
c) R 2 = 0,6 ; F = 5,25, significativo ( F0 = 4,74).
d) t = 3, significativo ( t 0 = 1,895).
e) t = 2,10, no-significativo ( t 0 = 2,365).
f) Y = 0,01 ou um crescimento de 1% em Q.
s ( Y ) = 0,00398 ou, aproximadamente, 0,4% de Q.

4.37. Os parmetros no podem ser estimados com base nessa amostra pois h
multicolinearidade perfeita. Verifica-se que para as 4 observaes 2 X 1 + X 2 = 36
.
4.38. a) X 2 = 6
b) b = [ 2 1 2]
40
c) F =
= 6,67 , significativo ( F0 = 6,55)
6
d) t = 3,06, no-significativo ( t 0 = 3,169)
e) F=

32
= 5,33 , significativo ( F0 = 4,10)
6

218

5. USO DE VARIVEIS BINRIAS


Neste captulo vamos examinar a utilizao de variveis binrias como variveis
explanatrias em anlise de regresso. Uma varivel binria (tambm denominada
varivel dummy) aquela que s tem dois valores distintos, geralmente zero e um.
Preliminarmente, vamos lembrar os diversos nveis de medida de uma varivel.

5.1. Nveis de medida


Podemos distinguir os seguintes nveis de medida ou escalas:
a) Escala nominal, quando temos apenas uma classificao em categorias.
Exemplos: sexo ou religio das pessoas. Neste caso, se forem usados
nmeros para indicar as diferentes categorias, eles so apenas etiquetas ou
nomes.
b) Escala ordinal, quando vlida apenas a ordem dos nmeros. Exemplo: uma
escala de status social.
c) Escala intervalar. Neste caso vale a ordem e tambm podemos comparar,
numricamente, intervalos (diferenas) entre valores. Mas a razo entre
valores no tem sentido porque a origem arbitrria. Exemplos: temperatura
medida em graus centgrados ou graus Fahrenheit e ano (data). Tem sentido
dizer que o perodo 1982-1990 (incluindo extremos) trs vezes mais longo
do que o perodo 1979-1981, mas no tem sentido dizer que no ano de 2002
estvamos no dobro de 1001.
d) Escala razo ou cardinal, quando so vlidas todas as operaes com os
valores. Exemplos: comprimento, peso, idade, valor monetrio.
Note-se que h um enriquecimento progressivo do significado dos nmeros
quando passamos de uma escala para a seguinte, na ordem em que foram apresentadas.
Pode-se argumentar que a escolaridade de uma pessoa uma varivel apenas
ordinal. Mas comum, em trabalhos economtricos, consider-la como cardinal.
Note-se que o clculo de uma simples mdia entre dois valores implica a
comparao de dois intervalos e exige, portanto, que a medida tenha escala intervalar ou
cardinal. Para uma escala nominal podemos determinar a moda (mas no a mediana ou

219

a mdia). Para uma escala ordinal podemos determinar tanto a moda como a mediana,
mas no a mdia da varivel.
Com uma varivel binria ocorre algo interessante. Como ela tem apenas dois
valores distintos, h um nico intervalo e no podemos dizer que ela contrarie a
condio para ser considerada intervalar. Isso permite que uma varivel binria seja
usada como varivel explanatria em anlise de regresso.
Cabe ressaltar que o modelo usual de regresso no permite que a varivel
dependente (Y) seja binria. bvio que uma varivel que inclui um erro com
distribuio normal no pode ser binria. H mtodos especiais (como os modelos de
lgite e prbite) para analisar variveis dependentes binrias.

5.2. Uso de variveis binrias para distinguir as categorias de uma


varivel nominal
Vamos admitir que uma varivel nominal tenha k categorias. Podemos usar k
1 variveis binrias para distinguir as k categorias.
A tabela 5.1 mostra uma maneira de distinguir as 5 regies do Brasil usando 4
variveis binrias, adotando o Nordeste como base.
TABELA 5.1. Uso de 4 variveis binrias para distinguir 5 regies.
Regio
Nordeste
Norte
Sudeste
Sul
Centro-Oeste

Varivel binria

Z1

Z2

Z3

Z4

0
1
0
0
0

0
0
1
0
0

0
0
0
1
0

0
0
0
0
1

Consideremos o modelo de regresso


Y j = + X j + 1 Z 1 j + 2 Z 2 j + 3 Z 3 j + 4 Z 4 j + u j

(5.1)

O parmetro 3 , por exemplo, o valor esperado da mudana em Y j , quando


passamos do Nordeste para o Sul, para dado valor de X j .

220

Para dado valor de X j , a diferena entre o valor esperado de Y j no CentroOeste e no Sudeste 4 2 .


Cabe assinalar que h vrias outras maneiras corretas de distinguir as 5 regies
por meio de variveis binrias. Uma alternativa, mantendo o Nordeste como base,
apresentada na tabela 5.2.
TABELA 5.2. Outra maneira de definir 4 variveis binrias para
distinguir 5 regies.
Regio
Nordeste
Norte
Sudeste
Sul
Centro-Oeste

Varivel binria

Z1

Z2

Z3

Z4

0
1
1
1
1

0
0
1
1
1

0
0
0
1
1

0
0
0
0
1

Seja i o coeficiente de Z ij (i = 1, 2, 3, 4) no modelo com essa nova definio


das variveis. Neste caso o valor esperado da mudana em Y j quando passamos do
Nordeste para o Sul, dado X j , 1 + 2 + 3 . Pode-se provar que o uso de alternativas
corretas na definio das variveis binrias leva a resultados equivalentes. Assim, a
estimativa de 1 + 2 + 3 ser igual estimativa de 3 no modelo (5.1).
Se o modelo de regresso tiver um termo constante, no podemos utilizar k
variveis binrias para distinguir k categorias pois isso causaria um problema de
multicolinearidade perfeita. Consideremos o esquema em que a varivel Z i (com i = 1,
..., k) igual a 1 para a i-sima categoria e igual a zero para as demais categorias.
Neste caso a primeira coluna da matriz X, cujos elementos so todos iguais a 1, seria
igual soma das colunas referentes s k variveis binrias e, consequentemente, a
matriz X X seria singular. Mas podemos usar uma binria para cada categoria se o
termo constante for eliminado do modelo de regresso. Por exemplo, para captar as
variaes estacionais em uma srie de preos mensais de um produto agrcola podemos
utilizar o modelo
12

Yt = + i Z it + u t
i =2

(5.2)

221

com

Z it = 1 para o i-simo ms do ano e


Z it = 0 para os demais meses,

ou o modelo
12

Yt = i Z it + u t

(5.3)

i =1

Mas teramos multicolinearidade perfeita se tentssemos usar o modelo


12

Yt = + i Z it + u t

(5.4)

i =1

Vejamos um exemplo numrico de uso de uma varivel binria para distinguir


dois perodos utilizando a amostra de 8 observaes das variveis X j e Y j apresentada
na tabela 5.3.
TABELA 5.3. Amostra de 8 pares de valores das variveis X j e
Yj .

Perodo

Xj

Yj

1
2
3
4

8
7
7
6

II

1
2
3
4

6
5
3
2

Admitamos que as quatro primeiras observaes se referem a um perodo com


caractersticas distintas do perodo ao qual se referem as quatro ltimas observaes.
Assim, por exemplo, se X j o preo de um produto e Y j a quantidade demandada, os
dois perodos em questo poderiam ser inverno e vero, ou um perodo de guerra e um
de paz, ou ainda, antes e depois de uma importante campanha publicitria.
Para avaliar as mudanas de um perodo para outro, consideramos uma varivel
binria ( Z j ) que assume o valor um ( Z j = 1) quando a observao est no perodo I e
o valor zero ( Z j = 0) quando a observao est no perodo II.
O modelo estatstico
Y j = + Z j + X j + u j

(5.5)
222

Ento, no perodo I a relao fica


Y j = ( + ) + X j + u j

e no perodo II a relao fica


Y j = + X j + u j

Portanto, estamos admitindo que o coeficiente de regresso () o mesmo nos


dois perodos, s mudando o nvel em que a reta se localiza. O modelo (5.5)
corresponde, graficamente, a um par de retas paralelas.
A matriz X relativa ao modelo (5.5)
1
1

1
X=
1

1
1

1
2
3

4
1

2
3

1
1
1
1
0
0
0
0

Obtemos

44
8

Xy = 28 , XX = 4
100
20

4
4
10

20
10
60

( X X) 1

7
8

1
=
4

1
4

1
2
0

1

4

10

Segue-se que o vetor das estimativas dos parmetros

a
6,5

1
b = c = ( XX) Xy = 3
b
1
A equao de regresso estimada

223

Y j = 6,5 + 3Z j X j
Na figura 5.1 est o par de retas paralelas correspondente a essa equao,
juntamente com os pontos da amostra.
Para fazer a anlise de varincia da regresso, apresentada na tabela 5.4,
calculamos
S.Q.Res. = y y b X y = 272 (6,5 44 + 3 28 1 100) = 2
e
S.Q.Total = y y

( Y j ) 2
n

= 272 242 = 30

TABELA 5.4. Anlise de Varincia


C.V.

G.L.

S.Q.

Q.M.
14
0,4

Regresso
Resduo

2
5

28
2

Total

30

F
35

Figura 5.1. Retas paralelas ajustadas aos dados da tabela 5.3.


Vamos testar, ao nvel de significncia de 1%, a hiptese H 0 : = 0 contra a
hiptese alternativa H A : > 0 .
Temos

224

1
V (c ) = 0,4 = 0,2
2
e

t=

c 30
=
= 6,708
s (c )
0,2

A regio de rejeio, para um teste unilateral com 5 graus de liberdade e ao nvel


de significncia de 1%, t 3,365 . O resultado obtido , portanto, significativo, isto ,
rejeita-se, ao nvel de significncia de 1%, a hiptese de que o termo constante da
relao linear entre Y j e X j seja o mesmo nos dois perodos.
Os clculos para ajustar um par de retas paralelas aos dados apresentados, com
nmero igual de observaes em cada perodo, ficam mais simples se considerarmos o
modelo com a varivel independente centrada:
Y j = + Z j + x j + u j ,

com Z j = 1 no perodo I e Z j = 1 no perodo II.


Neste caso, obtemos

44
Xy = 12
10

( X X) 1

8
XX = 0
0
1
8

= 0

0
1
8
0

0
8
0

0
0 ,
10

10

5,5
b = ( XX) Xy = 1,5
1
1

A equao estimada

Y j = 5,5 + 1,5Z j x j
ou

Y j = 8 + 1,5Z j X j
225

No perodo I, com Z j = 1 , temos


Y j = 9,5 X j ,
e no perodo II, com Z j = 1 , temos
Y j = 6,5 X j
O resultado, como era de se esperar, o mesmo que obtivemos quando
utilizamos o modelo (5.5).

5.3. Uso de variveis binrias para ajustar poligonais


Neste caso as variveis binrias so usadas para captar a mudana na inclinao
entre segmentos consecutivos da poligonal.
O modelo geral para uma poligonal com k vrtices (k +1 segmentos)
k

Y j = + X j + h Z hj ( X j h ) + u j
h =1

(5.6)

onde h a abcissa do h-simo vrtice (que pressupomos conhecida) e Z hj uma


varivel binria tal que
Z hj = 0 para X j h

e
Z hj = 1 para X j > h

Pode-se verificar que h a mudana na inclinao do h-simo segmento da


poligonal, em relao inclinao do segmento anterior.
Para uma poligonal com 3 segmentos o modelo fica
Y j = + X j + 1 Z 1 j ( X j 1 ) + 2 Z 2 j ( X j 2 ) + u j

(5.7)
A figura 5.2 mostra como poderia ser a forma da poligonal que mostra como
E (Y j ) varia em funo de X j com 1 < 0 e 2 < 0 .

226

Z1 = 0

Z1 = 1

Z1 = 1

Z2 = 0

Z2 = 0

Z2 = 1

Figura 5.2. Uma poligonal com 3 segmentos.


Para o 1o intervalo ( X j 1 ) a reta
E (Y j ) = + X j

(5.8)

No 2o intervalo ( 1 < X j 2 ) a reta


E (Y j ) = 1 1 + ( + 1 ) X j

(5.9)

No 3o intervalo ( X j > 2 ) a reta


E (Y j ) = 1 1 2 2 + ( + 1 + 2 ) X j

(5.10)

interessante verificar que tanto (5.8) como (5.9) produzem a mesma ordenada
para X j = 1 (que a ordenada do 1o vrtice). Analogamente, (5.9) e (5.10) produzem a
mesma ordenada para X j = 2 .
Para obter a poligonal da figura acima devemos ter > 0 , > 0 , 1 < 0 ,

2 < 0, +1 > 0 e +1 + 2 < 0.


Vamos considerar um exemplo numrico para o qual o modelo tem apenas dois
segmentos. Nesse caso o modelo fica
Y j = + X j + Z j ( X j ) + u j ,

(5.11)

com Z j = 0 para X j e Z j = 1 para X j > .

227

Consideremos, por simplicidade, que estamos analisando a tendncia de uma


varivel ( Y j ) qualquer, ou seja, consideremos que a varivel explanatria ( X j ) o
tempo, medido em anos, por exemplo.
Na tabela 5.5 so apresentados os valores de 6 observaes consecutivas da
varivel Y j . Vamos admitir que a inclinao da linha de tendncia se modifique na 3a
observao. Desejamos, portanto, ajustar uma poligonal com um vrtice cuja abcissa
igual abcissa da 3a observao.
Para facilitar os clculos, vamos considerar que no instante correspondente 3a
observao temos X j = 0. Dessa maneira temos = 0 e o modelo estatstico do
problema em questo fica
Y j = + X j + Z j X j + u j

(5.12)

ou, fazendo W j = Z j X j ,
Y j = + X j + W j + u j

TABELA 5.5. Amostra de 6 observaes consecutivas da varivel Y j .


Tempo ( X j )

Zj

Yj

2
1
0
1
2
3

0
0
0
1
1
1

5,5
5,0
1,0
3,5
4,5
4,5

Para as 3 primeiras observaes, onde Z j = 0, a relao


E (Y j ) = + X j ,

e para as 3 ltimas observaes, onde Z j = 1, a equao da tendncia passa a ser


E (Y j ) = + ( + ) X j

Confirma-se, portanto, que representa a mudana na tendncia.


Para o exemplo apresentado, obtemos:

228

1
1

1
X=
1
1

XX = 3

3
19
14

2
1
0
1
2
3

0
0
0

1
2

24

Xy = 10 ,

26

6
70

1
42
14 , ( XX) 1 =
114

72
14

42
48
66

72

66

105

a
2


b = b = ( XX) 1 Xy = 2


c
3
A equao ajustada
Y j = 2 2 X j + 3Z j X j
A poligonal correspondente est traada na figura 5.3. Note que a declividade no
primeiro perodo 2 e no segundo perodo (2 + 3) = 1.

Figura 5.3. Poligonal ajustada aos dados da tabela 5.5.

A seguir calculamos
229

S.Q.Res. = y y b X y = 109 ( 2 24 2 10 + 3 26) = 3


e fazemos a anlise de varincia da regresso, apresentada na tabela 5.6.
TABELA 5.6. Anlise de Varincia
C.V.
Regresso
Resduo
Total

G.L.
2
3
5

S.Q.

Q.M.

10
3
13

5
1

F
5

Para verificar se a mudana de tendncia aps a terceira observao


estatisticamente significativa, fazemos o teste da hiptese H 0 : = 0 . Para isso
calculamos
105 35
V (c ) =
=
114 38
e

t=

c0
=
s (c )

3
35
38

= 3,126

O valor crtico de t para um teste bilateral, ao nvel de significncia de 5% e com


3 graus de liberdade, 3,182. O resultado obtido no , portanto, significativo.

5.4. Mudana estrutural


Vamos admitir que estamos analisando a relao entre duas variveis ( X j e Y j )
e temos duas situaes (dois perodos, duas regies ou duas categorias). Seja n1 o
nmero de observaes disponveis para a situao I e seja n 2 o nmero de observaes
disponveis para a situao II. Podemos usar uma varivel binria para distinguir as
duas situaes, fazendo Z j = 0 para as observaes da situao I e Z j = 1 para as
observaes da situao II. Admitindo que tanto o nvel como a inclinao da relao
entre X j e Y j sejam diferentes nas duas situaes, um modelo apropriado
Y j = + X j + Z j + Z j X j + u j

(5.13)

230

A equao estimada com base nas n1 + n 2 observaes

Y = a + bX + cZ + dZX

(5.14)

A respectiva soma de quadrados residual


S.Q.Res. = SU , com n1 + n 2 4 graus de liberdade
Na situao I, com Z j = 0 , a relao entre X e Y
E (Y j ) = + X j

Na situao II, com Z j = 1 , a relao fica


E (Y j ) = + + ( + ) X j

Para verificar se existe diferena estrutural entre as duas situaes testamos a


hiptese
H0 : = = 0

(5.15)

Seja FE o valor de F calculado para testar essa hiptese.


O modelo restrito para a hiptese (5.15) Y j = + X j + u j . Seja S R a soma
de quadrados residual obtida ajustando esse modelo restrito s n1 + n 2 observaes.
Ento S R est associado a n1 + n 2 2 graus de liberdade. De acordo com (4.85),
sabemos que o valor de FE pode ser obtido de

FE =

S R SU
2
SU
n1 + n2 4

(5.16)

Se admitimos que a relao entre X j e Y j distinta nas duas situaes


analisadas, lgico ajustar regresses separadamente para cada situao.
Para as n1 observaes da situao I obtemos
Y = a1 + b1 X

e S.Q.Res. = S1 , com n1 2 graus de liberdade

e para as n 2 observaes da situao II obtemos


Y = a 2 + b2 X

e S.Q.Res. = S 2 , com n 2 2 graus de liberdade.


231

Pode-se provar que a1 = a , b1 = b , a 2 = a + c e b2 = b + d , isto , que as duas


retas estimadas separadamente so idnticas ao conjunto de duas retas estimado por
meio do modelo (5.13). Consequentemente
S1 + S 2 = S U
Ento o teste F para mudana estrutural pode ser obtido de

S R ( S1 + S 2 )
2
FE =
S1 + S 2
n1 + n2 4

(5.17)

Esse o teste de Chow para mudana estrutural.


Genericamente, para um modelo com p parmetros em cada uma das duas
situaes, temos
S R ( S1 + S 2 )
p
FE =
S1 + S 2
n1 + n 2 2 p

(5.18)

Para ilustrar o tema, consideremos um exerccio apresentado em Draper e Smith


(1966), no qual dispomos de 9 valores de uma varivel Y j , observados em 9 meses
consecutivos. Vamos admitir que h uma tendncia para as quatro primeiras
observaes, e que h outra tendncia para as 5 ltimas observaes, com mudana
tanto no termo constante como no coeficiente angular. Para captar essas mudanas
definimos uma varivel binria Z j cujo valor zero para as quatro primeiras
observaes e 1 para as 5 ltimas observaes. Sendo X j o nmero de ordem dos 9
meses, para simplificar um pouco as contas, vamos utilizar a varivel centrada
x j = X j 5 . O modelo fica
Y j = + x j + Z j + Z j x j + u j

(5.19)

A tabela 5.7 mostra os valores das variveis que sero utilizadas para estimar a
equao.

232

TABELA 5.7. Valores da varivel Y j e das variveis explanatrias


utilizados para ajustar um par de retas.
Tempo em
meses ( X j )
1
2
3
4
5
6
7
8
9

Yj

xj

Zj

Z jxj

1,0
4,0
6,0
7,0
9,5
11,0
11,5
13,0
13,5

4
3
2
1
0
1
2
3
4

0
0
0
0
1
1
1
1
1

0
0
0
0
0
1
2
3
4

Tendo em vista o modelo (5.19), obtemos


9

0
XX =
5

10

60

10

10

30

10

10
76,5

92
30
, Xy =

58,5
10

127
30

( XX) 1

1,5

0,5
=
1,5

0,5

0,5

1,5

0,2

0,5

0,5

2,1

0,2

0,3

0,5

0,2

0,3

0,3

Ento
a
9,5

b
2

b = = ( XX) 1 X y =
c
0,2

d
1
e
Y j = 9,5 + 2 x j + 0,2 Z j Z j x j

(5.20)
233

No primeiro perodo, com Z j = 0, a reta estimada


Y j = 9,5 + 2 x j ou Y j = 0,5 + 2 X j
No segundo perodo, com Z j = 1, a reta estimada
Y j = 9,7 + x j ou Y j = 4,7 + X j
A figura 5.4 mostra os pontos da amostra e o par de retas ajustado.

Figura 5.4. Retas ajustadas aos dados da tabela 5.7.


Para fazer a anlise de varincia da regresso, apresentada na tabela 5.8,
devemos calcular
S.Q.Res. = y y b X y = 796,75 795,45 = 1,3
TABELA 5.8. Anlise de Varincia
C.V.
Regresso
Resduo
Total

G.L.

S.Q.

Q.M.

3
5
8

145,2
1,3
146,5

48,4
0,26

F
186,15

A tabela 5.9 apresenta, alm das estimativas dos quatro parmetros, as


estimativas dos respectivos desvios padres, o teste t e a correspondente probabilidade
caudal (probabilidade associada a valores absolutos de t maiores do que o calculado).

234

TABELA 5.9.Estimativas dos parmetros do modelo (5.19) e dos respectivos


desvios padres, o teste t e a correspondente probabilidade caudal.
Parmetro

Estimativa

Desvio
Padro

Teste t

Probabilidade
caudal

9,5

0,6245

15,21

< 0,01%

0,2280

8,77

0,03%

0,2

0,7389

0,27

79,75%

0,2793

3,58

1,59%

A estimativa de no estatisticamente diferente de zero, mas, adotando um


nvel de significncia de 5%, rejeitam-se as hipteses de nulidade de , ou .
importante observar que o mesmo par de retas ajustado com base no modelo
(5.19) obtido fazendo-se duas regresses lineares simples.
Considerando os 4 primeiros pares de valores para as variveis Y j e X j
obtemos
Y j = 0,5 + 2 X j

(5.21)

com S.Q.Res. = 1.
Considerando os 5 ltimos pares de valores para as variveis Y j e X j obtemos
Y j = 4,7 + X j

(5.22)

com S.Q.Res. = 0,3.


Note que a soma de quadrados de resduos dessas duas regresses lineares
simples igual soma de quadrados de resduos da regresso mltipla ajustada
anteriormente.
O ajustamento dessas duas regresses lineares simples exige menos clculo do
que o ajustamento de um modelo como (5.19). Entretanto, um modelo como (5.19) tem
a vantagem de tornar relativamente mais fcil testar, posteriormente, hiptese
envolvendo os valores dos parmetros das duas retas.
Para fazer o teste de mudana estrutural da maneira indicada por Chow, alm de
obter as somas de quadrados de resduos das equaes (5.21) e (5.22), necessrio obter
a soma de quadrados residual de uma regresso linear simples de Y j contra X j para as
9 observaes. A equao estimada
Y j = 0,8333 + 1,533 X j ,

(5.23)

235

com S.Q.Res. = S R = 5,4333 , associada a 7 graus de liberdade. De acordo com (5.17),


obtemos
5,4333 (1 + 0,3)
2,0667
2
FE =
=
= 7,95
1 + 0,3
0,26
5
Ao nvel de significncia de 5%, com 2 e 5 graus de liberdade, o valor crtico de

F 5,79. Portanto, rejeita-se a hiptese de que no houve mudana estrutural a partir do


5o ano, isto , rejeita a hiptese H 0 : = = 0 . Cabe assinalar que o teste dessa
hiptese tambm pode ser feito usando (4.60), obtendo-se exatamente o mesmo
resultado.
Tendo concludo que h mudana estrutural, o ajustamento do modelo (5.19)
permite que se especifique melhor a natureza da mudana. Nesse exemplo numrico,
tendo em vista a tabela 5.9, verifica-se que a mudana ocorre, basicamente, no
coeficiente angular da relao linear entre Y j e X j .

5.5. Anlise de varincia de dados com vrios tratamentos e o teste para


falta de ajustamento
Consideremos um total de n observaes de uma varivel, submetida a H
diferentes tratamentos (h = 1, ..., H). Seja Yhi o valor da i-sima observao referente ao

h-simo tratamento. A varivel em questo pode ser o preo de um produto em


diferentes regies, a renda de indivduos classificados conforme o nvel de escolaridade,
a produo de milho nas parcelas de um experimento de competio de variedades, etc.
Seja n h o nmero de observaes relativas ao h-simo tratamento, cujo total

Th = Yhi

(5.24)

O total geral

G = Th = Yhi
h

(5.25)

Para distinguir os H tratamentos vamos utilizar H variveis binrias Z h (com

h = 1, ..., H), fazendo Z h = 1 para as observaes do h-simo tratamento e Z h = 0 para


as observaes dos demais tratamentos. O modelo de regresso

Yhi = 1 Z 1 + 2 Z 2 + ... + H Z h + u hi

(5.26)

236

As linhas da matriz X desse modelo tm todas um nico elemento igual a 1, e os


demais elementos iguais a zero. Assim, em todas as linhas temos

Z1 + Z 2 + ... + Z H = 1

(5.27)

Verifica-se que a matriz X X uma matriz diagonal com o nmero de


observaes de cada tratamento na diagonal e que o vetor-coluna X y formado pelos
totais dos tratamentos. No caso de H = 3 tratamentos, temos

n1

X X = 0

( XX) 1

1
n
1

=0

0
n2
0

0
1
n2
0

1
n3

n3

T1

X y = T2

T3
T1
n
1

T
1
b = ( XX) X y = 2
n
2

T3
n
3

Segue-se que
S.Q.Res. = y y b Xy = Yhi2
h

Th2
=
nh

G 2 Th2 G 2

= Yhi2

n h nh
n
h i

(5.28)

Na primeira expresso entre parnteses podemos reconhecer a soma de


quadrados total:

G
S.Q.Total = Yhi
h i
n

G2
= Yhi2
h i
n

(5.29)

com n 1 graus de liberdade.


A ltima expresso entre parnteses em (5.28) a soma de quadrados de
tratamentos:
Th2 G 2
S.Q.Trat. =

, com n H graus de liberdade


h n
n
h

(5.30)

237

A soma de quadrados de tratamentos representa a parte da variao dos Yhi


devida s diferenas entre tratamentos, ou diferenas entre mdias de Yhi nos vrios
tratamentos ou categorias consideradas.
Note-se que, dados os valores de Yhi , as expresses (5.28), (5.29) e (5.30)
permitem calcular S.Q.Trat., S.Q.Total e S.Q.Res. sem que seja necessrio estimar os
parmetros do modelo (5.26).
Vamos admitir, agora, que os diferentes tratamentos se distinguem apenas pelo
valor de uma varivel X, e seja X h o valor correspondente ao h-simo tratamento.
Pressupondo que o efeito de X h sobre Yhi seja linear, os parmetros h do modelo
(5.26) podem ser substitudos por + X h . Com essa restrio, o modelo fica
Yhi = ( + X h )( Z 1 + Z 2 + ... + Z H ) + u hi
Lembrando (5.27), conclui-se que o modelo restrito
Yhi = + X h + u hi ,

(5.31)

que o modelo de uma regresso linear simples de Yhi contra X h .


Em geral, se os tratamentos so caracterizados pelo valor de k variveis
explanatrias e pressupomos que seu efeito sobre Y linear, obtermos um modelo de
regresso linear mltipla com p = k + 1 parmetros. Se p < H , esse modelo ser um
modelo restrito em comparao com o modelo (5.26).
A soma de quadrados residual do modelo irrestrito
SU = Yhi2
h

Th2
, com n H graus de liberdade
nh

(5.32)

e a soma de quadrados residual do modelo restrito


S R = (S.Q.Res. Yhi | X 1h ,..., X kh ) , com n p graus de liberdade

(5.33)

De acordo com (4.85), calculamos

S R SU
Hp
F=
SU
nH

(5.34)

238

Neste contexto, a diferena S R SU denominada soma de quadrados de falta


de ajustamento e o correspondente teste F denominado teste para falta de
ajustamento, pois um valor elevado de S R SU indica que o modelo onde se impe a
linearidade do efeito das variveis explanatrias no se ajusta bem aos dados.
S razovel utilizar o modelo de regresso linear de Yhi contra as k variveis
explanatrias se esse teste for no-significativo. Um valor de F significativo indica que
devemos rejeitar a hiptese de linearidade do efeito das variveis explanatrias sobre
Yhi . Neste caso deveremos nos limitar ao modelo (5.26) ou experimentar outras formas
para a relao funcional entre Yhi e as variveis explanatrias.
Para exemplificar, consideremos os dados da tabela 5.8, com 8 observaes e 3
tratamentos (3 valores distintos de uma nica varivel explanatria).
TABELA 5.8. Amostra de 8 valores de Y, com 3 valores distintos de X.
Xh

nh

Yhi

Th

2
3
5

4
2
2

14, 11, 12 e 13
18 e 17
22 e 21

50
35
43

De acordo com (5.32), obtemos


SU = 2168 2162 = 6

, com 5 graus de liberdade

Ajustando a regresso linear simples de Y contra X, obtemos

Y = 7 + 3 X

(5.35)

e S R = 12 , com 6 graus de liberdade.


Substituindo esses valores em (5.34) verifica-se que o valor de F para falta de
ajustamento 5. Adotando um nvel de significncia de 5%, o valor crtico, para 1 e 5
graus de liberdade, F0 = 6,61 . Ento o resultado no-significativo, no se rejeita a
linearidade da relao entre X e Y e vlido usar a equao estimada (5.35).
Se fosse adotado um nvel de significncia de 10%, o valor crtico passaria a ser
F0 = 4,06 e o valor obtido (F = 5) seria significativo. Neste caso no seria razovel
utilizar a equao (5.35) e deveramos experimentar uma outra relao funcional entre Y
e X. Uma alternativa seria considerar o modelo Y j = + 1 X j + 2 X 2j + u j . Para esse
239

exemplo numrico no possvel fazer o teste de falta de ajustamento para esse novo
modelo, pois o nmero de parmetros (p = 3) igual ao nmero de tratamentos (H = 3).
A soma de quadrados residual da equao de segundo grau ser, necessariamente, igual
a SU . Mas, se o nmero de tratamentos fosse maior, poderamos fazer o teste de falta
de ajustamento para a equao de regresso de segundo grau e verificar se esse novo
modelo seria aceitvel ou se seria necessrio experimentar outras formas funcionais.
Cabe assinalar que o teste de falta de ajustamento s pode ser feito quando h,
na amostra, mais de um valor de Y para determinadas combinaes de valores das
variveis explanatrias (que definem os tratamentos), isto , devemos ter n > H. Isso
comum em dados experimentais, mas no comum em dados de amostras de
levantamentos scio-econmicos.

Exerccios
5.1.
Na anlise da oferta de certo produto, admite-se que a funo tem, conforme o
perodo do ano, 2 posies distintas, mas com a mesma declividade. Foram observados os
valores

Perodo

X = preo

Y = quantidade

2,0

1,5

2,5

3,0

5,5

6,5

II

Um pesquisador ajustou o modelo


Yi = + X i + Z i + u i ,
com Z tomando valor 1 no perodo 1 e valor +1 no perodo II.
a) Estime os parmetros.
b) Qual o deslocamento da oferta de um perodo para outro?
c) Verifique se o deslocamento estatisticamente significativo ao nvel de
significncia de 1%.

5.2.

Uma varivel Y assume, em 5 anos consecutivos, os seguintes valores: 2,5; 3,0; 0; 3,0 e
2,5.

240

Ajuste a esses dados uma poligonal com vrtice num ponto de abcissa igual abcissa da
3a observao.
a) Qual a estimativa da declividade no 1o perodo (da 1a 3a observao)?
b) Qual a estimativa da declividade no 2o perodo (da 3a 5a observao)?
c) Teste, ao nvel de significncia de 10%, a hiptese de que essas duas declividades so
iguais.
5.3.

Dois ensaios de adubao forneceram os seguintes resultados:

Ensaio

X = dose de nutriente

Y = produo

1,5

6,0

5,5

5,5

7,0

9,5

II

Os trs primeiros pares de valores referem-se ao ensaio I e os trs ltimos pares ao


ensaio II. Admite-se que a funo de produo uma parbola. Admite-se,
tambm, que as funes de produo para os dois ensaios apresentam, para uma
abcissa qualquer, a mesma declividade, embora a funo correspondente ao ensaio
II esteja em nvel mais elevado.
a) Adote um modelo e estime os seus parmetros.
b) Qual a estimativa da diferena de nvel entre as duas funes?
c) Verifique se essa diferena estatisticamente diferente de zero, ao nvel de
significncia de 10%.
d) Teste a hiptese de que o coeficiente de regresso associado ao termo
quadrtico igual a 3, considerando um nvel de significncia de 10%.
5.4.

Dispomos de medidas da varivel Y durante 5 anos consecutivos, com duas medidas


(repeties) para cada ano.
Ano

Valores de Y

1e2

5e5

5e6

4
5

7e9
6e8

241

Admite-se que h uma tendncia linear do 1o ao 4o ano e uma outra tendncia linear do 4o para o
5o ano.
a) Usando um modelo de regresso mltipla apropriado, ajuste aos dados uma linha
poligonal com vrtice no 4o ano. Qual o significado das estimativas dos parmetros
obtidas?
b) Faa a anlise de varincia da regresso testando falta de ajustamento.
c) Teste a hiptese de que a declividade da linha no 2o perodo (4o ao 5o ano) igual
declividade da linha no 1o perodo (1o ao 4o ano), considerando um nvel de
significncia de 5%.
5.5.

Consideremos duas amostras aleatrias, uma da varivel Y1 , com n1 observaes, e outra


da varivel Y2 , com n 2 observaes. Indiquemos por

1 e 2 as mdias dessas

variveis, cujas estimativas so as mdias das amostras Y1 e Y2 , respectivamente.


Admitindo que as duas variveis tm distribuies normais com varincias iguais, a
hiptese H 0 : 1 = 2 pode ser testada, como sabemos, por meio do teste t,

t=

Y1 Y2
1
1
+ s 2
n1 n2

onde

s2 =

n1

n2

i =1

i =1

(Y1i Y1 ) 2 + (Y2i Y2 ) 2
n1 + n 2 2

Demonstre que este teste igual ao teste t relativo hiptese H 0 : = 0 , sendo o coeficiente
de regresso do modelo

Yki = + Z ki + u ki ,
onde:
a)

Z ki uma varivel binria que assume valor 1 para as observaes de uma das
amostras e valor +1 no caso da outra amostra;

b) o ndice k = 1, 2 indica que se trata de uma observao da varivel Y1 ou da varivel

Y2 , e
c) o ndice i varia de 1 a n1 se k = 1 e de 1 a n 2 se k = 2
5.6.

Mostre que o teste t descrito no exerccio anterior , tambm, igual ao teste t relativo
hiptese H 0 : = , sendo e os coeficientes de regresso do modelo

Yki = Z ki + Vki + u ki ,
242

onde Z ki = 1 e Vki = 0 no caso das observaes da amostra de Y1 , e Z ki = 0 e Vki = 1


quando se trata das observaes da amostra de Y2 .
5.7.

Para ajustar um par de retas a um conjunto de n1 + n 2 observaes ( n1 observaes no


grupo I e n 2 observaes no grupo II), podemos utilizar o modelo

Yki = 1 Z 1k + 2 Z 2 k + 1 Z 1k X ki + 2 Z 2 k X ki + u ki ,
k = 1, 2 e i = 1, 2, ..., n1 ou n 2
com

Z11 = 1, Z12 = 0, Z 21 = 0 e Z 22 = 1
Demonstre que o valor de t para testar a hiptese H 0 : 1 = 2
t=

b1 b2
1
1

+
2
x
x 22i
1i

Q1 + Q2

n +n 4
2
1

onde, para k = 1, 2,

bk =

x ki y ki
i

x ki2
i

x ki = X ki X k ,
y ki = Yki Yk
e Q1 e Q2 so as somas de quadrados de resduo para as regresses lineares simples de Yki
contra X ki , para os grupos de observaes I e II, respectivamente, isto ,

Qk = yki2 bk xki yki


i

5.8.

Dados:
Valores de Y no

X
Tratamento 1

Tratamento 2

Tratamento 3

Totais

26

18

14

Admitimos que para cada tratamento existe uma relao linear entre X e Y, com o mesmo
coeficiente angular, isto , admitimos que a relao funcional entre Y e X pode ser representada
por um feixe de 3 retas paralelas. Sejam h (h = 1, 2, 3) os coeficientes lineares das retas e seja
o coeficiente angular comum. Admitimos, tambm, que Yi = E (Yi ) + u i , com i = 1, 2, ..., 12,

243

onde u i so variveis aleatrias independentes, com mdia zero, varincia 2 e distribuio


normal.
a) Determine as estimativas de h (h = 1, 2, 3) e de de acordo com o mtodo de
mnimos quadrados.
b) Quais as propriedades dessas estimativas?
c) Teste a hiptese H 0 : = 0 .
d) Teste a hiptese H 0 : 1 = 0 contra H A : 1 > 0 .
e) Teste a hiptese H 0 : 1 =

1
( 2 + 3 )
2

f) Teste a hiptese H 0 : 2 = 3 e 1 =

2 + 3
2

+ 2.

Considere um nvel de significncia de 1%.


Sugesto: Adote, inicialmente, o modelo
3

Yi = h Z hi + X i + ui ,
h =1

onde Z hi = 1 para toda observao do tratamento h e Z hi = 0 para as observaes


dos outros dois tratamentos (com h = 1, 2, 3).
Dessa maneira h o intercepto da reta relativa ao h-simo tratamento.
A seguir mostre que o modelo inicialmente adotado equivalente a
3

Yi = h Z hi + xi + u i
h =1

onde h = h + X e xi = X i X
Os clculos ficam bastante facilitados utilizando este ltimo modelo, pois a
correspondente matriz X X ser uma matriz diagonal.
5.9.

Faa o teste para falta de ajustamento para a regresso linear simples do exerccio 2.1.

5.10. Faa o teste para falta de ajustamento para a reta estimada no exerccio 2.19.
5.11. dada uma amostra com 12 pares de valores das variveis X e Y:
X

0
2

1; 1; 2; 2
3; 4; 4; 5

3; 3; 4; 4

Temos
,
,

,
e

244

Admite-se que as variveis estejam relacionadas de acordo com o modelo Y j = + X j + u j ,


onde os u j so erros independentes, com E (u j ) = 0 , varincia constante e distribuio
normal.
a) Determine a reta de regresso de Y em relao a X, de acordo com o mtodo dos
mnimos quadrados.
b) Calcule o coeficiente de determinao e faa a anlise de varincia da regresso,
adotando um nvel de significncia de 1%.
c) Verifique se h razes para rejeitar o modelo linear inicialmente proposto,
considerando um nvel de significncia de 1%.
5.12. Verifique se h razes para rejeitar o modelo linear proposto no exerccio 2.34.
5.13. Com base nos 8 pontos cujas coordenadas so dadas na tabela a seguir, ajuste um plano
que passe pela origem dos eixos, considerando Y como varivel dependente. Faa o teste
para falta de ajustamento.

Verifique se o coeficiente de X 2 estatisticamente

diferente de zero, considerando um nvel de significncia de 5%

X1

X2

1
1
1
1
2
2
2
2

1
1
2
2
1
1
2
2

3,5
4,5
5,5
4,5
4,5
3,5
5,0
6,0

5.14. A tabela ao lado mostra uma


srie

de

valores

Ano
1o

quadrimestrais da varivel Y.
Admite-se que essa varivel

2o

apresenta variaes cclicas


estacionais. Verifica-se que

3o

Y = 147 , Y 2 = 2535 e

Quadrimestre
1o
2o
3o
1o
2o
3o
1o
2o
3o

Y
15
22
15
11
18
16
10
20
20

y 2 = 134 .
a) Estabelea um modelo de regresso para captar as variaes estacionais de Y,
utilizando variveis binrias. Construa a matriz X.
b) Estime os parmetros do modelo.

245

c) Teste, ao nvel de significncia de 5%, a hiptese de que no h variaes estacionais


[caso em que se tem E (Y ) = ].
d) Determine o intervalo de previso para o valor de Y no 2o quadrimestre do 4o ano, ao
nvel de confiana de 95%.
5.15. dada uma srie de 9 valores anuais da varivel Y.
Admite-se que Y varia linearmente em funo do
tempo (em anos), mas acredita-se que ocorreu uma
mudana estrutural entre a 4a e a 5a observao, de
maneira que haveria uma tendncia linear durante os 4
primeiros anos da srie e uma tendncia linear distinta
durante os 5 ltimos anos.

Ano
1o
2o
3o
4o
5o
6o
7o
8o
9o

Y
39
54
63
66
96
108
111
120
135

Verifica-se que Y = 792 , Y 2 = 78588 e y 2 = 8892 :


a) Estime as taxas aritmticas de crescimento anual de Y nos dois perodos.
b) Verifique se a mudana estrutural estatisticamente significativa. Sugere-se fazer o
teste com base nas regresses simples, como indicado por Chow.
c)

H diferena estatisticamente significativa entre as taxas aritmticas de

crescimento de Y nos dois perodos? Adote um nvel de significncia de 5% em todos


os testes de hipteses deste exerccio.
5.16. Vamos admitir que temos os resultados de uma pesquisa de oramentos familiares, sendo
W a renda per capita e Q o consumo per capita de determinado alimento. Os respectivos
logaritmos neperianos so
Y = ln Q

X = ln W

Admite-se que a elasticidade-renda do consumo maior para os relativamente pobres do que


para os relativamente ricos. Considera-se relativamente pobres as pessoas com X 4. Para
analisar como Y varia em funo de X ser adotado, ento, um modelo que corresponde a uma
poligonal com dois segmentos e vrtice no ponto de abcissa (X) igual a 4.
Dispomos de uma amostra com 6 pares de valores de X e Y:
a) Estabelea o modelo apropriado e estime seus
parmetros.
b) Calcule
regresso.

coeficiente

de

determinao

da

0,1

0,6

1,5

2,9

3,0

2,7
246

c) Teste, ao nvel de significncia de 1%, a hiptese de que a elasticidade-renda do


consumo desse alimento para os relativamente pobres igual a zero, contra a hiptese
alternativa de que essa elasticidade positiva.
d) Faa um teste bilateral, ao nvel de significncia de 1%, para a hiptese de que a
elasticidade-renda para os relativamente ricos igual a 1.

5.17. Temos uma amostra com 6 valores da


varivel econmica Y em duas regies (3

Regio

observaes em cada regio), como

mostra a tabela ao lado:

12

14

20

17

a) Estabelea um modelo de regresso


com uma ou duas variveis binrias
para

distinguir

as

duas

regies.

Ressalte-se que o modelo vai captar


apenas a diferena no valor de E (Y )
nas duas regies, incluindo um erro
aleatrio com as propriedades usuais.
b) Com base na amostra, estime os dois parmetros do modelo e mostre como
essas estimativas esto associadas com a estimativa de E (Y ) em cada regio.
c) Estime a varincia do erro do modelo.
d) Teste, ao nvel de significncia de 5%, a hiptese de que a E (Y ) a mesma
nas duas regies.
5.18. Dispomos dos 8 pares de valores das variveis X i e Yi da tabela a seguir.
a) Ajuste a equao de regresso linear simples de Y
contra X e determine a respectiva soma de quadrados
dos resduos.
b) Estabelea um modelo cujas variveis explanatrias so
variveis binrias que permitem distinguir os 4
diferentes valores de X observados. Estime os
parmetros do modelo, determine o valor da soma de
quadrados dos resduos e teste, ao nvel de significncia

Xi
1
1
3
3
5
5
7
7

Yi
41
37
80
78
107
103
98
96

de 5%, a hiptese de que o valor esperado de Y o


mesmo para os 4 valores distintos de X.

247

c) Considerando a regresso linear simples ajustada no item (a) como um modelo


restrito em comparao com o modelo do item (b), faa um teste de falta de
ajustamento, isto , verifique, ao nvel de significncia de 1%, se deve ser
rejeitada a hiptese de que o efeito de X sobre Y linear.
d) Ajustando uma equao de segundo grau aos dados, foi obtida a equao

Y = 7 + 34 X 3 X 2 ,
com S.Q.Res. = 60. Faa um teste de falta de ajustamento para essa equao,
isto , verifique se podemos admitir que o efeito de X sobre Y obedece a uma
equao de segundo grau, adotando um nvel de significncia de 5%.
e) Qual a soma de quadrados dos desvios de uma equao de terceiro grau
ajustada a esses dados? possvel fazer um teste de falta de ajustamento
para a equao de terceiro grau? Justifique a resposta.
5.19. dada uma srie temporal de 8 valores
trimestrais da varivel Y, cobrindo um
perodo de dois anos. Admite-se que Y
tenha variaes cclicas estacionais, alm
de

erros

uj

independentes

com

E (u j ) = 0 e varincia constante.

Ano
1
1
1
1
2
2
2
2

Trimestre
1
2
3
4
1
2
3
4

Y
29
18
13
22
27
22
11
18

a) Estabelea um modelo onde as variaes estacionais de Y so captadas por


meio de variveis binrias e estime a equao.
b) Teste, ao nvel de significncia de 5%, a hiptese de que o valor esperado de Y
o mesmo no terceiro e no quarto trimestres.
c) Teste, ao nvel de significncia de 1%, a hiptese de que no h variaes
estacionais.
5.20. So dados os valores de X 2 e Y para uma srie de 13 anos, como mostra a tabela
a seguir. Admitindo que haja uma mudana estrutural entre a 7a e a 8a
observao (posio assinada na tabela pela linha tracejada), consideramos o
modelo

Y = + 1 X 1 + 2 X 2 + Z + 1 ZX 1 + 2 ZX 2 + u

248

Ano ( X 1 )
1
2
3
4
5
6
7
8
9
10
11
12
13

( X2 )
12
4
8
8
8
4
12
8
14
2
2
14
8

Y
70
50
54
66
62
66
94
114
134
76
78
140
124

A equao estimada
Y = 26 + 4 X 1 + 3 X 2 + 24 Z + 2 ZX 1 + 2 ZX 2 ,

com S.Q.Res. = 384, R 2 = 0,9670 e


R 2 = 0,9434 .
Ajustando uma regresso mltipla de Y contra X 1 e X 2 , com as 13 observaes,
obtemos
Y = 9,6923 + 6 X 1 + 4,3846 X 2 ,

com S.Q.Res. = 1069,54, R 2 = 0,9080 e R 2 = 0,8896 .


a) Qual a equao estimada fazendo uma regresso de Y contra X 1 e X 2 , para
as 7 primeiras observaes?
b) Qual a equao estimada fazendo uma regresso de Y contra X 1 e X 2 , para
as 6 ltimas observaes?
c) Teste, ao nvel de significncia de 5% a hiptese de que ocorreu a suposta
mudana estrutural (o que corresponde, no modelo inicial, a testar a hiptese
de que = 1 = 2 = 0 ).
5.21. A tabela a seguir mostra a escolaridade (X) e o rendimento (Y) de 4 pessoas
ocupadas na agricultura e 4 pessoas ocupadas nos setores urbanos (indstria ou
servios). Define-se uma varivel binria Z que igual a zero para pessoas
ocupadas na agricultura e igual a 1 nos demais casos.

249

0
0
0
0
1
1
1
1

1
3
5
7
3
5
7
9

35
57
73
83
73
91
115
145

Para o modelo
Y j = + X j + Z j + Z j X j + u j

obteve-se
8 40 4 24
40 248 24 164

XX =
4 24 4 24

24 164 24 164

( XX) 1

672
3936

Xy =
424

2784

0,2
1,05 0,2 1,05
0,2
0,05
0,2 0,05

=
1,05
0,2
3,1 0,5

0,1
0,2 0,05 0,5

Y = 30 + 8 X + 4Z + 4ZX , S.Q.Res. = 72

s 2 = 18 .

a) Determine a equao de regresso de Y contra X e a respectiva S.Q.Res. para as


4 pessoas do setor agrcola.
b) Idem, para as 4 pessoas do setor urbano.
c) Teste H 0 : = 0 ao nvel de significncia de 1%.
d) Teste H 0 : = 0 ao nvel de significncia de 1%.
e) Ao nvel de significncia de 1%, h diferena estrutural entre setor agrcola e
setor urbano no que se refere relao linear entre escolaridade e
rendimento?
f) Teste, ao nvel de significncia de 1%, a hiptese de que para o nvel de
escolaridade mdio ( X = 5) no h diferena no rendimento esperado para
pessoas ocupadas no setor agrcola e no setor urbano.
250

Respostas
5.1. a) Yi = 1,5 + X + 1,5Z
b) 3 unidades
c) t = 3,674, no-significativo ( t 0 = 5,841)
5.2. a) 1 unidade por ano
b) +1 unidade por ano
c) t = 1,265, no-significativo ( t 0 = 2,920)
5.3. a) Adotando o modelo Yi = + xi2 + x i + Z i , com xi = X i X , Z1 = 1 para
o ensaio I e Z1 = 1 para o ensaio II, obtemos
Yi = 6,5 xi2 + 2 xi + 1,5Z i
ou

Yi = 3,5 + 1,5Z i + 4 X i X i2
b) 3 unidades
c) t = 3, significativo ( t 0 = 2,920)
d) t = 1,886, no-significativo ( t 0 = 2,920)
5.4. a) Sendo X o ano e Z uma varivel binria que assume valor zero at o 4o ano e
valor 1 no 5o ano, definimos V1 = (1 Z )( X 4) e V2 = Z ( X 4) . Ento V1
cresce de 3 para 0 nos primeiros anos e V2 cresce de 0 para 1 do 4o para o 5o
ano. Obtemos
Y = 8 + 2V1 V2

As declividades no 1o e no 2o perodos so 2 e 1, respectivamente.


b) O valor de F para falta de ajustamento igual a 1,5, no-significativo ao nvel
de 5%.
c) As declividades so estatisticamente diferentes (t = 2,510, significativo, pois
t 0 = 2,365).
5.8. a) b = 1, a1 = 5 , a 2 = 3 e a3 = 2 .
b) So estimativas lineares no-tedenciosas de varincia mnima, e consistentes.
So, tambm, estimativas de mxima verossimilhana.
c) t = 3,873, significativo ( t 0 =3,355)
d) t = 7,906, significativo ( t 0 =2,896)
e) t = 4,082, significativo ( t 0 = 3,355)
251

f) F = 1,33, no-significativo ( F0 = 8,65)


5.9. F= 1,33, no-significativo ao nvel de 10% ( F0 = 3,62)
5.10. F = 5/7, no-significativo.
5.11. a) Y = 2 + 0,5 X
b) r 2 = 4 / 9 = 0,444 ; F = 8, no-significativo ( F0 =10,04)
c) F = 13,5, significativo ( F0 = 10,56).
5.12. F = 0,55, no-significativo.
5.13. Y = X 1 + 2 X 2
O valor de F para falta de ajustamento 2,5, no-significativo ao nvel de 10% (
F0 = 4,32).
Para testar H 0 : 2 = 0 obtemos t = 4,50, significativo ao nvel de 5% ( t 0 =
2,447).
5.14. a) Y = 1 Z 1 + 2 Z 2 + 3 Z 3 + u , com Z i =1 no i-simo quadrimestre e Z i =0 nos
demais quadrimestres.
b) Y = 12Z1 + 20Z 2 + 17 Z 3
c) F= 8,167, significativo ( F0 = 5,14)
d) 13,08 < Y11 < 26,92
5.15. a) b1 = b2 = 9 .
b) F = 6,25, significativo ( F0 = 5,79)
c) As estimativas so iguais: t = 0, obviamente no-significativo.
5.16. a) Y = + X + Z ( X 4) + u , com Z = 0 para X 4 e Z = 1 para X > 4.
a = 1, b = 0,9 e c = 0,8.
b) R 2 = 0,9695

c) t = 5,953, significativo ( t 0 = 4,541)

d) t = 5,953, significativo ( t 0 = 5,841).


5.17. a) Yi = + Z i + u i , com Z i = 1 para a regio A e Z i = 1 para a regio B.
b) Y = 13 + 4Z
252

As estimativas de E (Y ) nas regies A e B so, respectivamente, 13 4 = 9 e


13 + 4 = 17.
c) s 2 = 8 , com 4 graus de liberdade.
d) t = 3,464 , significativo (t 0 = 2,776) .
5.18. a)
b)

Y = 40 + 10 X , com S.Q.Res. = 1212


Y = 39 + 40Z 2 + 66Z3 + 58Z 4
ou Y = 39Z + 79Z + 105Z + 97Z , com S.Q.Res. = 20
1

F= 346,13 , significativo ( F0 = 6,59)


596
c) F =
= 119,2 , significativo ( F0 = 18,0)
5
40
d) F =
= 8 , significativo ( F0 = 7,71)
5
e) S.Q.Res. = 20 (a mesma do item b). No h grau de liberdade para o teste de
falta de ajustamento.
5.19. a) Y = 1Z1 + 2 Z 2 + 3 Z 3 + 4 Z 4 + u , com Z i = 1 para o i-simo trimestre e
Z i = 0 para os demais trimestres (i = 1, 2, 3 ou 4).
Y = 28Z + 20Z + 12Z + 20Z .
1

b) t = 3,578, significativo ( t 0 = 2,776).


c) F = 17,07, significativo ( F0 = 16,69)
5.20. a) Y = 26 + 4 X 1 + 3 X 2 .
b) Y = 50 + 2 X + 5 X
1

c) F = 4,166, no-significativo ( F0 = 4,35)


5.21. a) Y = 30 + 8 X , S.Q.Res. = 36
b) Y = 34 + 12 X , S.Q.Res. = 36
c) t = 0,535, no-significativo (t 0 = 4,604)
d) t = 2,981, no-significativo (t 0 = 4,604)
e) F =

560
= 31,11 , significativo ( F0 = 18,0)
18

f) H 0 : + 5 = 0 , com t =

24
10,8

= 7,303 , significativo (t 0 = 4,604)

253

6. HETEROCEDASTICIA
Veremos, neste captulo, como obter as estimativas dos parmetros de uma
regresso linear quando a varincia do erro no constante, isto , quando h
heterocedasticia.

6.1. O caso de uma regresso linear simples em que o desvio padro do


erro proporcional a X
Consideremos, inicialmente, o caso de uma regresso linear simples em que a
varincia do erro proporcional ao valor de X 2 . O modelo dessa regresso
Y j = + X j + u j

(6.1)

com

E (u 2j ) = 2j = X 2j 2
Admitiremos que so vlidas as demais pressuposies relativas ao modelo de
regresso linear simples, vistas no captulo 2.
O modelo (6.1) pode ser transformado em um modelo de regresso linear simples
com homocedasticia. Para isso, basta dividir cada termo por X j , obtendo

Yj
Xj

u
1
++ j
Xj
Xj

ou
Z j = + V j + j ,

(6.2)

onde

Zj =

Yj
Xj

, Vj =

uj
1
e j =
Xj
Xj

Convm ressaltar que


E ( ) =
2
j

E (u 2j )
X

2
j

=2,

ou seja, a varincia do erro no modelo (6.2) constante. O clculo das estimativas dos
parmetros, a determinao de intervalos de confiana e os testes de hipteses relativos ao

254

modelo (6.2) podem, portanto, ser feitos da maneira usual, utilizando as frmulas de
mnimos quadrados ordinrios.
Os mesmos resultados podem ser obtidos atravs do raciocnio exposto a seguir.
Sabemos que, no caso de um modelo homocedstico, as estimativas dos parmetros so os
valores que minimizam

(Y j a bX j ) 2
No caso de um modelo heterocedstico, com E (u 2j ) = 2j , os quadrados dos desvios
devem ser ponderados, sendo que o fator de ponderao deve ser inversamente
proporcional varincia, isto , devemos dar peso maior s observaes de menor
varincia. As estimativas dos parmetros so, ento, os valores que minimizam

2
j

(Y j a bX j ) 2

No caso em que 2j = X 2j 2 isso implica minimizar

Yj
1
1
ba
2 (Y j a bX j ) 2 =
X
X j
Xj
j

Verificamos, portanto, que o resultado o mesmo que o obtido aplicando o mtodo


dos mnimos quadrados ordinrios (no ponderados) ao modelo (6.2).

6.2. O mtodo dos mnimos quadrados ponderados


Consideremos o modelo
y = X + u

(6.3)

com E (u) = 0 e
v1

0
E (uu) = V 2 =
M

v2

M
0

0
2

vn

Note que V uma matriz diagonal. Vamos admitir que sejam conhecidos os valores
de v j , que mostram como varia o valor da varincia do erro. O fato de serem nulos os
elementos fora da diagonal principal da matriz V significa que vlida a pressuposio de

255

ausncia de covarincia entre os erros das vrias observaes, isto , que E (u j u h ) = 0 para
j h.
Definimos a matriz diagonal
1

0
=
M

M
0

onde

j =

1
, j = 1, ..., n
vj

Dessa maneira, temos que


= V 1

(6.4)

V = 1 1

(6.5)

Pr-multiplicando cada um dos termos de (6.3) por , obtemos o modelo


y = X + u

(6.6)

No modelo (6.6) o vetor dos erros = u e uma vez que E (u) = 0 , temos
E ( ) = 0 .

Notando que = e lembrando que E (uu) = V 2 , obtemos


E () = E ( uu ) = V 2
De acordo com (6.5), segue-se que
E ( ) = 1 1 2 = I 2
ou seja, o modelo (6.6) homocedstico. Podemos, ento, aplicar a esse modelo as
frmulas de mnimos quadrados ordinrios, deduzidas no captulo 4. bvio que devemos
tomar o cuidado de substituir, naquelas frmulas, as matrizes y e X pelas matrizes y e
X , respectivamente. Considerando (6.4) obtemos:

b = ( XX) 1 Xy = ( XV 1X) 1 XV 1y

(6.7)

S.Q.Res. = yy bXy = yV 1y bXV 1y

(6.8)

256

E[(b )(b )] = ( XX) 1 2 = ( XV 1 X) 1 2

(6.9)

Desde que E ( ) = 0 e E () = I 2 , isto , desde que os erros j so variveis


aleatrias independentes com mdia zero e varincia constante, as estimativas dos
parmetros obtidas atravs de (6.7) so estimativas lineares no-tendenciosas de varincia
mnima, de acordo com o que foi visto no captulo 4.

6.3. Consequncias do uso de estimadores de mnimos quadrados


ordinrios quando existe heterocedasticia
Vejamos, inicialmente, a perda de eficincia decorrente do uso das frmulas de
mnimos quadrados ordinrios quando h heterocedasticia.
Admitamos que o modelo correto seja (6.3) e que o pesquisador, erroneamente,
admite que E (uu) = I 2 , calculando
b* = ( XX) 1 Xy

(6.10)

Substituindo (6.3) em (6.10), obtemos


b* = ( XX) 1 X( X + u)
ou
b* = + ( XX)1 Xu

(6.11)

Aplicando esperana em (6.11) obtemos

E (b* ) = ,
isto , o estimador de mnimos quadrados ordinrios no-tendencioso. Entretanto, b* no
um estimador eficiente, j que o estimador de varincia mnima o dado por (6.7).
Determinemos a matriz de varincias e covarincias de b* . De (6.11) obtemos
b* = ( XX) 1 Xu
Ento
E[(b * )(b * )] = E[( XX) 1 Xuu X( XX) 1 ]
Como E (uu ) = V 2 , segue-se que
E[(b * )(b * )] = ( XX) 1 XVX( XX) 1 2

(6.12)
257

Por simplicidade, consideremos o modelo


Y j = X j + u j , j = 1, ..., n

(6.13)

com
E (u j ) = 0 , E (u 2j ) = v j 2 e E (u j u h ) = 0 para h j.

De acordo com (6.7), obtemos


b=

v j 1 X j Y j
v j 1 X 2j

(6.14)

O estimador de mnimos quadrados ordinrios

b* =

X jY j
X 2j

(6.15)

De acordo com (6.9) e (6.12) temos, respectivamente,

V (b) =

2
v j 1 X 2j

(6.16)

e
V (b* ) =

2 v j X 2j
( X 2j ) 2

(6.17)

A eficincia relativa de b* , em comparao com b,


( X 2j ) 2
V (b)
=
=
V (b* ) v j 1 X 2j v j X 2j
Para exemplificar, admitamos que a varincia de Y, dado X, seja direta ou
inversamente proporcional ao quadrado do valor de X, isto , v j = X 2j ou v j = X j 2 . Em
ambos os casos temos

( X 2j ) 2
n X 4j

Se X j = j 1 , com j = 1, ..., 11, temos = 0,532 , isto , a eficincia relativa do


estimador de mnimos quadrados ordinrios, em comparao com o estimador de mnimos
quadrados ponderados, de apenas 53,2%.

258

Outros exemplos, considerando o modelo

Y j = + X j + u j , podem ser

encontrados em Johnston (1971, p. 225-229).


claro que o pesquisador que estivesse, inadvertidamente, utilizando as expresses
de mnimos quadrados ordinrios consideraria ( XX) 1 2 , e no (6.12), como a matriz de
varincias e covarincias de b * , e, para estimar 2 , utilizaria
s*2 =
=

1
(y y b * Xy ) =
n p
1
(y [I X( XX) 1 X]y ,
n p

(6.18)

em lugar do estimador correto que, de acordo com (6.8),


s2 =

1
(y V 1 y b XV 1 y )
n p

Lembrando (6.7), obtemos


s2 =

1
y [V 1 V 1 X( XV 1 X) 1 XV 1 ]y
n p

(6.19)

Substituindo (6.3) em (6.18) e (6.19), obtemos


1
u [I X( X X) 1 X]u
n p

(6.20)

1
u [V 1 V 1 X( XV 1 X) 1 XV 1 ]u
n p

(6.21)

s*2 =
e
s2 =

De (6.20), notando que se trata de uma matriz com um nico elemento, temos
s*2 =
=

1
tr{u [I X( XX) 1 X]u} =
n p
1
tr{uu [I X( XX) 1 X]}
n p

Como E (uu ) = V 2 segue-se que

E ( s*2 ) =
=

2
n p

2
n p

tr{V[I X( XX) 1 X]} =


{tr(V ) tr[ XVX( XX) 1 ]}

(6.22)

Analogamente, de (6.21) obtemos


259

E(s 2 ) =
=
=

2
n p

2
n p

2
n p

tr{V[V 1 V 1 X( XV 1 X) 1 XV 1 ]} =
{tr(I n ) tr[ XV 1 X( X V 1 X) 1 ]} =
[tr(I n ) tr(I p )] = 2

(6.23)

Esse resultado j era esperado, pois (6.19) o quadrado mdio do resduo relativo
ao modelo (6.6), cujo vetor de erros ( ) tal que E ( ) = I 2 , que , de acordo com o
que vimos na seo 4.5, a condio necessria para demonstrar que o quadrado mdio do
resduo um estimador no-tendencioso da varincia residual.
Por simplicidade, consideremos, novamente, o modelo (6.13). O pesquisador que,
inadvertidamente, no considerasse a existncia de heterocedasticia, calcularia b* , dado
por (6.15), e, de acordo com (4.23), obteria

s2
V* (b* ) = * 2
Xj

(6.24)

onde, de acordo com (6.18),


( X j Y j ) 2
1
2
s =
Y j

n 1
X 2j
2
*

Considerando (6.22), temos que


E[V* (b* )] =

v j X 2j
vj

(n 1) X 2j
X 2j

(6.25)

De acordo com (6.17), o estimador correto da varincia de b*


V (b* ) =

s 2 v j X 2j
( X 2j ) 2

(6.26)

onde, de acordo com (6.19),


1
2
1 1 2 ( v j X j Y j )
s =
v j Y j

n 1
v j 1 X 2j

Considerando (6.23), temos que


E[V (b* )] =

2 v j X 2j
( X 2j ) 2

(6.27)

260

Comparando (6.27) com (6.17), verificamos que (6.26) um estimador notendencioso da varincia de b* .
De (6.17) e (6.25) obtemos a tendenciosidade ou vis de (6.24) como estimador de

V (b* ) , que
E[V* (b* )] V (b* ) =

v j X 2j v j X 2j
2 1

=
vj

=
2
2
2
X j n 1

n 2
(n 1) X 2j

X j

X j

v j v j X 2j

2
n

X
j

(6.28)

Nesta expresso temos, entre parnteses, a diferena entre a mdia aritmtica e a mdia
ponderada dos v j , com X 2j como fatores de ponderao. Se, por exemplo, os maiores
valores dos v j estiverem associados aos maiores valores absolutos dos X j , a mdia
ponderada maior do que a mdia aritmtica e, portanto, V* (b* ) um estimador
negativamente viesado de V (b* ) . bvio que, neste caso, no so vlidos os intervalos de
confiana ou testes de hipteses feitos com base nos estimadores tendenciosos das
varincias obtidos de ( XX) 1 s*2 .
Entretanto, se no houver associao entre v j e X 2j , as duas mdias dos v j (sem
ponderao e com ponderao por X 2j ) em (6.28) tendem a ser iguais. Neste caso o
pesquisador que usa as frmulas de mnimos quadrados ordinrios, embora no esteja
usando o estimador mais eficiente, no ser sistematicamente induzido a concluses
erradas ao efetuar teste de hipteses.

6.4. Testes para a homocedasticia e obteno de estimativas dos


parmetros quando a matriz V desconhecida
At aqui admitimos que a matriz V, de E (uu ) = V 2 , conhecida.
Entretanto, em problemas prticos, freqentemente desconhecemos se os erros so
homocedsticos ou heterocedsticos. Vejamos ento como podemos, com base nos dados
da amostra, verificar se a varincia dos erros ou no homognea.

261

Vamos admitir, inicialmente, que, na amostra disponvel, temos repeties de


conjuntos de valores das variveis explanatrias, ou seja, dispomos de n h > 1 valores de Y
para os valores X 1h , X 2 h ,..., X kh das variveis explanatrias. Se H o nmero de diferentes
conjuntos de valores de X i existentes (ou nmero de vetores diferentes entre as linhas da
matriz X), os n = n h valores da varivel dependente podem ser indicados por Yhj (j = 1,
..., n h ; h = 1, ..., H).
As estimativas das varincias dentro de cada grupo so dadas por
s =
2
h

onde g h = n h 1 e Yh =

(Yhj Yh ) 2
j

gh

(6.29)

1
Yhj
nh

Sejam
g h s h2
U = ( g h ) ln
g h ln s h2
gh

(6.30)

G = 1+

1
1
1

3( H 1) g h g h

(6.31)

Pode-se demonstrar que, se a varincia de Y homognea, a varivel U / G tem,


aproximadamente, distribuio de qui-quadrado com H 1 graus de liberdade. Ento, o
valor de U / G pode ser utilizado para testar a hiptese H 0 : 12 = 22 = K = H2 , isto , a
hiptese de que a varincia de Y constante.11
Se o teste for no-significativo, justificvel pressupor que h homocedasticia.
Neste caso, razovel aplicar o mtodo de mnimos quadrados ordinrios. Ressaltemos,
entretanto, que um resultado no-significativo no implica, necessariamente, que haja
homocedasticia. O teste de hiptese pode apenas mostrar se razovel manter ou no a
pressuposio de homocedasticia, nunca provando sua veracidade. Em outras palavras, o
fato de o teste para homocedasticia no ser significativo no tira o carter de pressuposio
da afirmao de que os erros so homocedsticos.

11

Ver Hoel (1962, p. 225-227).

262

Se o teste resultar significativo, devemos usar o mtodo de mnimos quadrados


ponderados. Para isso, como a matriz V desconhecida, ela substituda por uma matriz

, cujos elementos diferentes de zero so v = s 2 , obtidos de (6.29). Quando


diagonal V
hj
h
em lugar de V, temos b = ( X V
1 X) 1 X V
1 y , que no um estimador
utilizamos V
linear no-tendencioso de varincia mnima. Pode-se demonstrar, entretanto, que, em
certas condies,12 esse um estimador consistente e assintoticamente eficiente de .
Consideremos, agora, o caso em que o nmero de valores de Y para um mesmo
conjunto de valores de X i insuficiente para aplicar o procedimento anteriormente
descrito. Ento, para testar a homocedasticia dos erros, pode-se usar o mtodo proposto por
Goldfeld e Quandt (1965), que descrevemos a seguir.
Dado o modelo y = X + u , com E (u) = 0 e E (uu ) = V 2 , onde V uma matriz
diagonal cujos elementos diferentes de zero so v j (j = 1, ..., n), a hiptese da nulidade
H 0 : v j = , onde uma constante, e a hiptese alternativa que v j uma funo

monotonicamente crescente (ou decrescente) de X ij (uma das variveis independentes do


modelo) ou de alguma outra varivel cujos valores, para cada uma das observaes da
amostra, so conhecidos.
So as seguintes as etapas do teste:
a) Ordenamos as observaes de acordo com valores crescentes de

X ij

(j = 1, ..., n).
b) Eliminamos m observaes centrais e ajustamos, pelo mtodo de mnimos
quadrados ordinrios, uma equao de regresso para as primeiras ( n m) / 2 observaes
e uma outra equao de regresso para as ltimas ( n m) / 2 observaes. Simulaes
realizadas por Goldfeld e Quandt, considerando o caso em que v j = X ij2 , indicam que o
poder do teste maior quando m igual a cerca de 1/4 de n.
c) Sendo S1 e S 2 as somas de quadrados de resduos das regresses com os
valores relativamente pequenos e relativamente grandes de X ij , respectivamente,
calculamos T1 = S 2 / S1 , se a hiptese alternativa que os v j crescem com X ij e

12

Ver Theil (1971), p. 399.

263

calculamos T2 = S1 / S 2 se a hiptese alternativa que os v j decrescem com X ij . Se H 0


verdadeira, T1 (ou T2 ) tem distribuio de F ( n m 2 p ) / 2 e ( n m 2 p ) / 2 graus de
liberdade, onde p o nmero de parmetros da equao de regresso. Se for verdadeira a
hiptese alternativa de que o valor de v j uma funo monotonicamente crescente (ou
decrescente) de X ij , o valor de T1 (ou T2 ) tende, obviamente, a ser elevado (maior do que
1).
O teste descrito pode ser utilizado para verificar se determinada hiptese a respeito
da forma da heterocedasticia razovel.
Consideremos, por exemplo, que no modelo
Y j = + 1 X 1 j + 2 X 2 j + u j

desejamos verificar se razovel pressupor que E (u 2j ) = X 12j 2 .


Dada essa pressuposio, o modelo
Yj
X ij

X2j
uj
1
+ 1 + 2
+
X ij
X1j X1j

homocedstico, pois E (u j / X 1 j ) 2 = 2 . Portanto, para verificar se a pressuposio de


que E (u 2j ) = X 12j 2 razovel, aplicamos o teste de Goldfeld e Quandt considerando a
regresso de Y j / X 1 j contra 1 / X 1 j e X 2 j / X 1 j .
Um outro teste para verificar a existncia de heterocedasticia foi proposto por
Glejser (1969). Sejam e j os desvios da equao de regresso estimada pelo mtodo de
mnimos quadrados ordinrios. Admitindo que a varincia do erro do modelo uma funo
monotnica do valor da varivel X ij , ajustamos alguns modelos simples de regresso do
mdulo de e j em funo de X ij . Glejser sugere que sejam considerados os modelos

| e j |= 0 + 1 X ij + j ,
onde igual a 1, 1, 1/2 ou 1/2.
Sejam c0 e c1 as estimativas de mnimos quadrados ordinrios de 0 e 1 .
A seguir testamos as hipteses H 0 : 0 = 0 e H 0 : 1 = 0 . Trs possibilidades so
consideradas pelo autor:
a) No se rejeita H 0 : 0 = 0 , c0 > 0 e rejeita-se H 0 : 1 = 0 .

264

razovel, ento, pressupor que o desvio padro de u j proporcional a X ij ,


aplicando-se ento o mtodo de mnimos quadrados ponderados com v j = X ij2 .
b) O valor de c0 + c1 X ij positivo no intervalo relevante de X ij e rejeita-se
H 0 : 0 = 0 e H 0 : 1 = 0 . Neste caso devemos aplicar o mtodo de mnimos quadrados
ponderados substituindo os v j por v j = (c0 + c1 X ij ) 2 .
c) Em qualquer outro caso, admite-se que os erros so homocedsticos e utiliza-se o
mtodo de mnimos quadrados ordinrios.
Tanto o teste de Glejser como o teste de Goldfeld e Quandt exigem que a hiptese
alternativa especifique que a varincia do erro seja uma funo monotnica de uma nica
varivel (que pode ser ou no uma das variveis explanatrias do modelo de regresso que
desejamos estimar). O teste de Breusch-Pagan/Godfrey mais geral, admitindo que a
varincia do erro ( 2j ) seja uma funo de uma combinao linear de K variveis Z 1 j , Z 2 j
, ..., Z Kj , ou seja:

h =1

2j = 0 + h Z hj ,
com sendo uma funo qualquer para a qual so definidas as duas primeiras derivadas.
A hiptese de nulidade, que estabelece a homocedasticia dos erros, corresponde a
H 0 : 1 = 2 = ... = K = 0
O procedimento para efetuar esse teste pode ser dividido em 3 etapas.
a) Estimamos o modelo y = X + u por mnimos quadrados ordinrios e obtemos o
vetor dos desvios e = y Xb , com elementos e j ( j = 1,..., n ) . Determinamos a estimativa
de mxima verossimilhana da varincia do erro, dada por

2 = (ee ) / n
e calculamos os valores de

gj =

e 2j

para j = 1,..., n

b) Fazemos a regresso de g j contra Z 1 j , Z 2 j , ..., Z Kj , incluindo um termo


constante, e calculamos a respectiva soma de quadrados de regresso, que passamos a
indicar por Q.
265

c) Se os erros u j do modelo original tiverem distribuio normal e varincia


constante, Q 2 tem, assintoticamente, distribuio de qui-quadrado com K graus de
liberdade. A hiptese de nulidade (homocedasticia) ser rejeitada se o valor de Q 2 for
igual ou maior do que o valor crtico de K2 , ao nvel de significncia escolhido.
Os testes de Goldfeld e Quandt, de Glejser e de Breusch-Pagan/Godfrey exigem
que tenhamos alguma idia sobre a natureza da heterocedasticia (sua associao com uma
ou mais variveis conhecidas). Isso no necessrio no teste de White (1980), cujo
procedimento descrito a seguir. Sejam e j (com j = 1, ..., n) os desvios da regresso de Y j
contra X 1 j , X 2 j , ..., X kj , estimada pelo mtodo de mnimos quadrados ordinrios.
Incluindo o termo constante, essa regresso inicial tem p = k + 1 coeficientes. Calculamos
os valores de e 2j e fazemos uma regresso auxiliar dessa varivel contra as mesmas
variveis explanatrias ( X 1 j , X 2 j , ..., X kj ), seus quadrados ( X 12j , X 22 j , ..., X kj2 ) e todos os
produtos de duas variveis ( X 1 j X 2 j , ..., X 1 j X kj , ...). Pode-se verificar que em geral essa
regresso auxiliar ter p ( p + 1) / 2 coeficientes. Mas o nmero de coeficientes poder ser
menor, pois necessrio eliminar possveis repeties de variveis. Se, por exemplo, uma
das variveis do modelo original for uma varivel binria, seu quadrado no pode ser
includo na regresso auxiliar. Tambm ser necessrio eliminar duplicaes se a regresso
original j incluir o quadrado de uma varivel (se, por exemplo, X 2 j = X 12j ). Seja L o
nmero de coeficientes remanescentes na regresso auxiliar, incluindo a constante, e seja
R 2 o seu coeficiente de determinao mltipla. Sob a hiptese de homocedasticia e
pressupondo que o modelo original foi corretamente especificado, nR 2 tem distribuio de
qui-quadrado com L 1 graus de liberdade. Um valor de nR 2 significativo (igual ou maior
do que o valor crtico) indica a existncia de heterocedasticia.
Um inconveniente do teste de White que ele no construtivo, no sentido de que
no fornece indicao sobre a natureza da heterocedasticia, para possvel aplicao do
mtodo de mnimos quadrados ponderados.
A generalidade do teste uma vantagem, mas tambm pode fazer com que o teste
de White seja pouco poderoso em comparao com um teste mais especfico. Cabe

266

assinalar, ainda, que um resultado significativo pode ser conseqncia de um erro de


especificao no modelo original.
Antes de encerrar esta seo, vejamos o procedimento a ser seguido se admitirmos
que o desvio padro do erro do modelo proporcional a

E (Y j ) , isto ,

E (u 2j ) = [ E (Y j )]2 2 . Uma vez que o valor de E (Y j ) desconhecido, no possvel aplicar


diretamente as frmulas de mnimos quadrados ponderados. Ento obtemos, inicialmente,
os valores de Y estimados atravs do mtodo de mnimos quadrados ordinrios, que
passamos a indicar por Y* j (j = 1, ..., n). Em seguida aplicamos as frmulas de mnimos
quadrados ponderados, substituindo v j por v j = Y*2j . Esse procedimento sugerido por
Theil (1971), que mostra que os estimadores obtidos so consistentes.

6.5. O estimador de White para varincias quando h heterocedasticia


Nesta sesso veremos como pode ser obtida uma estimativa consistente da matriz
de varincias e covarincias de b * (o estimador de mnimos quadrados ordinrios de )
quando a matriz V desconhecida.
De acordo com (6.12), na presena de heterocedasticia a matriz de varincias e
covarincias das estimativas de mnimos quadrados ordinrios dos parmetros
V (b * ) = ( XX) 1 XVX( XX) 1 2

(6.32)

V (b * ) = n( XX) 1 Q( XX) 1 ,

(6.33)

ou

com
Q=

1
X VX 2
n

(6.34)

Como V uma matriz diagonal, se indicarmos as colunas de X por x j (e as linhas


de X por x j ), temos

Q=

1 n
x j xj v j 2

n j =1

Q=

1 n
x j x j 2j

n j =1

ou
(6.35)

267

com 2j = v j 2 = E (u 2j )
Sejam e j os desvios da regresso de y contra X, estimada por mnimos quadrados
ordinrios. Se, em (6.35), substituirmos 2j por e 2j , obtemos

Qe =

1 n
x j xj e 2j
n j =1

(6.36)

White (1980) demonstrou que plimQ e = plimQ . Ento, substituindo Q por Q e em


(6.33) obtemos o estimador consistente para heterocedasticia (heterocedasticity-consistent
estimator) ou estimador de White para V (b * ) :
n

V (b * ) = ( X X) 1 x j xj e 2j ( XX) 1

(6.37)

j =1

Cabe ressaltar que testes t ou F baseados nessas estimativas de varincias so


estritamente vlidos apenas assintoticamente.
Conforme explica Greene (2000, p. 507), estudos baseados em simulao de dados
mostram que o estimador de White tende a subestimar a varincia correta, sendo
aconselhvel multiplicar o resultado de (6.37) por um fator n /( n p ) ou, tendo em vista
que V (e j ) = (1 h j ) 2 (ver exerccio 4.27), substituir, na expresso (6.37), e 2j por

e 2j /(1 h j ) , sendo h j os elementos da diagonal principal de H = X( XX) 1 X . Essas


correes foram propostas por Davidson e Mackinnon (1993).

Exerccios
6.1. Considere o modelo
Y j = + X j + u j ,

com E (u j ) = 0 , E (u 2j ) = X 2j 2 e E (u j u h ) = 0 para h j.
So dados os valores de X j e Y j observados em uma amostra aleatria com 5
observaes:

268

Xj

1
2
5
5
10

Yj

13
10
20
15
50

a) Obtenha as estimativas lineares no-tendenciosas de varincia mnima de e .


b) Teste, ao nvel de significncia de 10%, a hiptese H 0 : = 1 contra H A : > 1 .
6.2. Estime os parmetros do modelo
Y j = + X j + u j

com base nos seguintes dados

0 ,5

Sabe-se que E (uu ) = 0

3
0
+3
0

6,5
2,5
0,5

0 ,25
0

0 2 ,

0 ,5

onde u representa o vetor dos erros.


Teste, ao nvel de significncia de 10%, a hiptese H 0 : = 0 .
6.3. Estime ao parmetros do modelo
Yi = + X i + u i
com base nos seguintes dados
X

0
2
4
6
8

4
8
3
6
1

269

Sabe-se que E (uu ) = 0

0,5

0 2 ,

0,5

onde u representa o vetor dos erros.


Teste, ao nvel de significncia de 10%, a hiptese H 0 : = 0 .
6.4. Consideremos o modelo
Yi = X i + u i
com, E (u i2 ) = X i 2 , E (u i u j ) = 0 para i j
Deduza, de acordo com o mtodo de mnimos quadrados, a frmula que d a
estimativa linear no-tendenciosa de varincia mnima de .
6.5. Considere a situao descrita no exerccio 2.26, admitindo que a varincia de Y | X
inversamente proporcional a X (Isso porque as empresas maiores, fazendo melhor
controle dos custos, forneceram estimativas do custo mdio mais precisas).
Desenvolva, para esse caso, as frmulas que do as estimativas dos parmetros da
regresso de Y em relao X.
6.6. dada uma amostra com n observaes das variveis X i e Yi . Considere o seguinte
modelo:
Yi = + u i (i = 1, ..., n)
onde u i N (0, 2 X i ) , E (u i u j ) = 0 para i j e os valores de X i so fixos (no
aleatrios). Determine a estimativa linear, no-tendenciosa e de varincia mnima
para , e sua varincia.
6.7. Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo
Y j = X j + u j ,

270

onde os u j so erros aleatrios independentes, com mdia zero e varincia W j 2 .


Note que h heterocedasticia e que o modelo no tem termo constante. dada uma
amostra de 3 valores de X j , W j e Y j :
Xj

Wj

Yj

0,5

16

0,25

25

a) Obtenha a estimativa linear no-tendenciosa de varincia mnima para .


b) Teste, ao nvel de significncia de 1%, a hiptese de que = 0.
6.8. Considere o modelo
Yi = X i + u i (i = 1, ..., n)
onde os valores de X i so fixados (no so aleatrios), E (u i ) = 0 , E (u i u j ) = 0 para
i j e, sendo uma constante, E (u i2 ) = [ E (Yi )] 2 .
Obtenha o estimador de de acordo com o mtodo de mnimos quadrados
ponderados para a seguinte amostra:
Xi

Yi

1
2
3
4
5

2
6
6
12
10

6.9. Temos uma amostra de 100 famlias de mesmo tamanho. Essas famlias foram
classificadas em quatro estratos de renda familiar, como mostra a tabela a seguir:
Nmero de famlias ( f i ) , renda familiar mdia (Wi ) e valor mdio do logaritmo
neperiano do consumo (ln C i ) de determinado produto em quatro estratos de renda
familiar

271

Estrato

fi

Wi

1
40
1
2
30
2
3
20
5
4
10
10
Na ltima coluna dessa tabela est o valor do logaritmo neperiano do

ln Ci
0,9
2,3
2,6
2,3
consumo de

determinado produto, por famlia, para cada estrato.


Admite-se que o consumo desse produto varia com a renda familiar de acordo com o
modelo
ln C i = +

Wi

+ ui ,

onde u i um erro aleatrio com valor esperado igual a zero, varincia inversamente
proporcional ao nmero de famlias do estrato e ausncia de covarincia entre erros
de diferentes observaes.
a) Qual a renda mdia das 100 famlias?
b) Obtenha estimativas apropriadas de e , levando em considerao o nmero de
famlias de cada estrato.
c) Qual a estimativa da elasticidade-renda do consumo desse produto quando
W = 2? E quando W = 5?
d) Teste, ao nvel de significncia de 5%, a hiptese de que igual a zero.
6.10. Admite-se que Y uma funo de X com as seguintes caractersticas:
a) E(Y) = 0 quando X = 0;
b) E(Y) cresce linearmente com X para 0 X 5 ;
c) Quando X = 5 h uma reduo da declividade, havendo um vrtice na relao
poligonal entre E(Y) e X;
d) Para 5 < X < 10 a relao entre E(Y) e X volta a ser linear, embora com
declividade menor do que no primeiro intervalo;
e) A varincia do erro u = Y E (Y ) 2 quando 0 X 5 e 2 2 quando

5 < X < 10 ; admite-se que os erros u i tm mdia zero, no so correlacionados


entre si e tm distribuio normal.

272

3
4
6
7
8

10
10
19
17
17

dada a seguinte amostra de valores de X e Y:


a) Estabelea um modelo de regresso linear para
analisar como Y varia em funo de X e determine
as

estimativas

lineares

no-tendenciosas

de

varincia mnima dos seus dois parmetros.


b) Obtenha a estimativa de 2 .
c) Teste, ao nvel de significncia de 10%, a hiptese de que no h reduo da
declividade (teste unilateral).

Respostas
6.1. a) a = 10 e b = 2
b) t = 0,777, no-significativo (t 0 = 1,638)
6.2. Y = 3 X
t= 4,243, no-significativo ( t 0 = 6,314)
6.3. Y = 6 0,5 X
t = 1,245, no-significativo ( t 0 = 2,353)

6.4.

b=

Yi
Y
=
Xi X

6.5.

a=

1
X iYi n Yi
Xi
1
Xi
n2
Xi
273

b=

X i Yi n X i Yi
1
Xi
n2
Xi

Yi
Xi
2
a=
, V (a) =
1
1

Xi
Xi

6.6.

6.7. a) b = 3
b) t = 14,61, significativo ( t 0 = 9,925)

6.8.

b=

1 Yi

= 2,4
n Xi

6.9. a) 3
b) a = 3 e b = 2
c) 1 e 0,4
d) t = 4,209, no-significativo ( t 0 = 4,303).
6.10. a) E (Y ) = X + ( X 5) Z , com Z = 0 para X 5 e Z = 1 para X > 5. Estimativas
dos parmetros: b= 3 e c = 2
b) s 2 = 3,33
c) t = 1,601, no-significativo (Regio de rejeio: t 1,638).

274

7. MNIMOS QUADRADOS GENERALIZADOS E AUTOCORRELAO NOS


RESDUOS
7.1. Mnimos quadrados generalizados
No captulo anterior estudamos o procedimento a ser usado quando h
heterocedasticia, mas admitimos que as covarincias entre erros de diferentes observaes
eram todas iguais a zero, fazendo com que a matriz de varincias e covarincias do vetor
de erros u fosse uma matriz diagonal. Neste captulo vamos analisar o caso mais geral, em
que se admite que haja covarincias positivas ou negativas entre erros de diferentes
observaes.
Para isso, consideremos o modelo
y = X + u

(7.1)

com E (u) = 0 e E (uu ) = V 2 ,


onde V uma matriz n n, simtrica e definida positiva. Ento V 1 tambm simtrica e
definida positiva e existe uma matriz tal que
= V 1

(7.2)

Pr-multiplicando (7.1) por , obtemos


y = X + u

(7.3)

Para o modelo de regresso (7.3), de y contra X , com = u , temos


E ( ) = 0

e
E ( ) = E ( u u ) =
= V 2 =

= ( ) 1 2 =
= 1 ( ) 1 2 = I 2
Podemos, portanto, aplicar ao modelo (7.3), de regresso de y contra X , as
expresses conhecidas, obtendo

275

b = ( X X) 1 X y = ( XV 1 X) 1 XV 1y ,

(7.4)

que o estimador linear no-tendencioso de varincia mnima de .


A matriz de varincias e covarincias de b
( X X) 1 2 = ( XV 1 X) 1 2

(7.5)

A estimativa no-tendenciosa de 2

s2 =

y V 1 y bXV 1 y
n p

(7.6)

De maneira geral, as expresses relativas ao modelo bsico de regresso mltipla


so facilmente generalizadas, bastando substituir X por X e y por y , e lembrar que
= V 1 .

Entretanto, no caso de os erros serem correlacionados, isto , de V ser nodiagonal, as expresses relativas predio (estimao de novos valores) so afetadas de
maneira mais complicada, j que possvel, ento, que o erro da nova observao esteja
correlacionado com os erros das observaes da amostra.
Admitamos que seja calculado, incorretamente, o estimador de mnimos quadrados
ordinrios
b * = ( XX) 1 Xy
Considerando (7.1), obtemos
b * = ( XX) 1 X( X + u) =
= + ( XX) 1 Xu

(7.7)

Ento E (b * ) = , isto , o estimador de mnimos quadrados ordinrios notendencioso.


Com V I , entretanto, b * = ( XX) 1 Xy um estimador ineficiente, j que o
estimador linear no-tendencioso de varincia mnima dado por (7.4).

276

De (7.7) obtemos
b * = ( XX) 1 Xu
Segue-se que
E[(b * )(b * )] = E[( XX) 1 Xuu X( XX) 1 ] =
= ( XX) 1 XVX( XX) 1 2

(7.8)

Varincias e covarincias obtidas a partir da expresso ( XX) 1 2 estariam,


portanto, erradas se V I .
Quem estivesse, erroneamente, aplicando mnimos quadrados ordinrios utilizaria,
como estimativa da varincia residual, o valor dado por
s*2 =

y y b * X y
n p

(7.9)

Sabemos que y y b* Xy = u Mu , com M = I X( X X) 1 X


Ento

E (y y b* Xy ) = E (uMu) = E[ tr (uMu)] =
= E[ tr (Muu )] = 2 tr (MV ) =
= 2 {tr(V ) tr[ X( X X) 1 X V ]} =
= 2 {tr(V ) tr[ XVX( X X) 1 ]}

(7.10)

Uma vez que, com V I , teremos, normalmente, tr(V ) tr[ X VX( X X) 1 ] n p,


a expresso (7.9) dar uma estimativa tendenciosa da varincia 2 .
Note que o mtodo de mnimos quadrados ponderados, estudado no captulo
anterior, um caso particular de mnimos quadrados generalizados, em que a matriz V
diagonal. Alis, o modelo estudado no captulo 4 tambm pode ser encarado como o caso
particular em que V = I.
A matriz simtrica V tem n(n + 1)/2 elementos possivelmente distintos que
precisamos conhecer, para poder aplicar as frmulas (7.4) e (7.6). Em aplicaes prticas
do mtodo de mnimos quadrados generalizados, comumente h restries que tornam
vivel a determinao da matriz V. Na prxima seo vamos examinar uma aplicao de
277

mnimos quadrados generalizados na qual todos os elementos de V so funo de um nico


parmetro.

7.2. Autocorrelao nos resduos


Para ilustrar o problema da autocorrelao, consideremos o modelo
k

y = X + u ou Yt = i X it + u t , (t = 1, ..., n)

(7.11)

u t = u t 1 + t

(7.12)

i=0

com

Admitimos que 1 1 e que t um rudo branco, isto , uma srie com as


seguintes propriedades:
E ( t ) = 0 ,
E ( t2 ) = 2 ,

E ( t t h ) = 0 se h 0
Para que o modelo (7.11) tenha um termo constante devemos ter X 0t = 1 para
t = 1, ..., n.
Aqui utilizamos a letra t para indicar o ndice associado s diferentes observaes
porque o problema da autocorrelao dos resduos surge, geralmente, quando estamos
trabalhando com sries cronolgicas de dados; ento cada observao corresponde a um
certo perodo de tempo (ano, ms ou semana, geralmente).
A relao (7.12) mostra que estamos admitindo que o erro da observao relativa a
um perodo est correlacionado com o erro da observao anterior. Se > 0 dizemos que
os erros esto positivamente autocorrelacionados e se < 0 dizemos que h autocorrelao
negativa.
Se = 0 teremos, obviamente, o modelo de regresso linear mltipla estudado no
captulo 4, isto , podemos aplicar mnimos quadrados ordinrios.
Consideremos, inicialmente, o caso particular em que = 1. Ento
u t = u t 1 + t
ou
u t u t 1 = t

(7.13)
278

De (7.11) podemos obter


k

Yt Yt 1 = i ( X it X i ,t 1 + u t u t 1

(t = 2, ..., n)

i =0

Considerando (7.13), segue-se que


k

Yt Yt 1 = i ( X it X i ,t 1 ) + t
i =0

(t = 2, ..., n)

(7.14)

Como os erros t tm mdia zero, so no-correlacionados e homocedsticos,


podemos aplicar, para o modelo (7.14), as frmulas de mnimos quadrados ordinrios.
Note que no modelo (7.14) a varivel dependente Yt = Yt Yt 1 , as variveis
explanatrias so X it = X it X i , t 1 (i = 0, ..., k) e o nmero de observaes se reduz a
n 1. Note que, se houver um termo constante no modelo original ( X 0t = 1 para todo t),
ele desaparece na equao (7.14). O modelo (7.14) ter um termo constante somente se
uma das variveis explanatrias do modelo original (7.11) for igual a t.
fcil verificar que, para = 1 , obteramos o modelo
k

Yt + Yt 1 = i ( X it + X i ,t 1 ) + t
i =0

Consideremos, agora, que 1 < < 1 , ou seja, | |< 1 .


Utilizando (7.12) sucessivamente, obtemos
u t = u t 1 + t =
= ( u t 2 + t 1 ) + t =
= 2 u t 2 + t 1 + t =
= 3u t 3 + 2 t 2 + t 1 + t =
=L=
= t + t 1 + 2 t 2 + 3 t 3 + K =

= r t r
t =0

Ento
E (u t ) = 0 ,

(7.15)

E (u t2 ) = (1 + 2 + 4 + 6 + K) 2 =

2
=
= u2
2
1

(7.16)

279

e, com h 0,
E (u t u t h ) =
= E[( t + t 1 + 2 t 2 + K)( t h + t h 1 + 2 t h 2 + K)] =
= h 2 + h + 2 2 + h + 4 2 + K =

2
=
= h u2
2
1
h

(7.17)

De (7.15), (7.16) e (7.17) conclumos que E (u) = 0 e E (uu ) = V 2 , com

K
K
K

1
M

n 2

n 3

1+ 2

1+ 2

1+ 2

1 2

V=
1 2
M
n 1

n 1

n 2
n 3

M
1

(7.18)

Verifica-se que

0
=
M

e que V 1 = com
1 2

0
=
M

Sabemos que o mtodo de mnimos quadrados generalizados corresponde a aplicar


mnimos quadrados ordinrios ao modelo transformado
y = X + u

(7.19)

280

Essa relao matricial representa um sistema de n equaes. A primeira equao,


para t = 1,

( 1 )Y = ( 1 )X + ( 1 )u
k

i =0

i1

(7.20)

e as n 1 equaes restantes, para t = 2, ..., n, so


k

Yt Yt 1 = i ( X it X i ,t 1 ) + u t u t 1
i =0

Uma vez que, de acordo com (7.12), u t = u t 1 + t , temos


k

Yt Yt 1 = i ( X it X i ,t 1 ) + t
i =0

(7.21)

Nos casos em que o valor de desconhecido, o que comumente acontece,


podemos adotar ou o procedimento recomendado por Theil (1971, p. 254) ou o
procedimento recomendado por Johnston (1972, p. 260-265). De acordo com Theil (1971)
ajustamos, inicialmente, uma regresso de Yi contra X it (i = 0, ..., k) pelo mtodo dos
mnimos quadrados ordinrios. A partir dos desvios dessa regresso, indicados por et ,
calculamos a estimativa de :
n
1 n
et et 1
et et 1
t =2
= n 1 t =2 n
=
1
(n 1)(Q.M.Res.)
et2
n p t =1

De posse dessa estimativa, aplicamos o mtodo dos mnimos quadrados


generalizados, usando em lugar de .
Johnston (1972) recomenda o procedimento descrito a seguir.
De (7.21) obtemos
k

i =0

i =0

Yt = Yt 1 + i X it i X i ,t 1 + t

(t = 2, ..., n)

Essa expresso sugere que uma estimativa de seria a estimativa do coeficiente de


regresso de Yt 1 numa regresso de Yt contra Yt 1 , os X it e os X i ,t 1 (i = 1, ..., k), ajustada
pelo mtodo de mnimos quadrados ordinrios.

281

A seguir, a estimativa de , assim obtida, usada para aplicar o mtodo dos


mnimos quadrados generalizados.
Vejamos, a seguir, o que ocorre se, erroneamente, aplicarmos mnimos quadrados
ordinrios ao modelo (7.11).
Uma vez que E (u t ) = 0 , o estimador
b * = ( XX) 1 Xy
no-tendencioso; ele no , entretanto, eficiente.
Para comparar a varincia incorreta, obtida de ( XX) 1 2 , com varincia correta,
dada, de acordo com (7.8), por ( XX) 1 XVX( XX) 1 2 , consideremos o modelo
Yt = X t + u t
com os u t sendo gerados pelo processo auto-regressivo de 1a ordem
u t = u t 1 + t
Neste caso ( X X) 1 =

b* =

1
e o estimador de mnimos quadrados ordinrios para
X t2

X t Yt
X t2

A varincia incorreta ficaria

V* (b* ) = ( XX) 1 u2 =

u2
n

t =1

(7.22)
2
t

Lembrando (7.18), verificamos que a varincia correta de b*


V (b* ) = ( X X) 1 X VX( X X) 1 2 =

n
n
2
1
n 2

X
+
2

X
X
+
2

X t X t 2 + K + 2 n 1 X n X 1

t
t
t 1
2
2
t =2
t =3
1 n 2 t =1

Xt

t =1

n
n

X
X

X t X t 2

t
t 1
X
X

1 + 2 t = 2 n
= n
+ 2 2 t =3 n
+ K + 2 n 1 n n 1
X t2
X t2
X t2
X t2
t =1
t =1
t =1
t =1

2
u

(7.23)

Se positivo e se, como comum, os valores de X t so positivamente


autocorrelacionados, o valor da expresso entre parnteses em (7.23) ser maior do que 1.

282

A comparao de (7.22) e (7.23) mostra que, neste caso, a expresso ( XX) 1 2 leva a
uma subestimativa da varincia de b* (o estimador de mnimos quadrados ordinrios).
De acordo com (7.10) temos
E ( y y b * X y ) = 2 {tr(V ) tr[ X VX( X X) 1 ]} =
n

X t X t 1

X
X

n 1
t =2
n 1

=
=
n

1
+
2

+
K
+
2

n
n
1 2
2
2
Xt
X t

t =1
t =1

X t X t 1

= u2 n 1 + 2 t =2 n
+ K


X t2
t
=
1

(7.24)

O pesquisador que estivesse, erroneamente, aplicando mnimos quadrados


ordinrios estimaria u2 por meio de

s*2 =

y y b * Xy
n 1

(7.25)

Se >0 e se os valores X t so positivamente autocorrelacionados, a expresso


entre parnteses em (7.24) maior do que 1. Neste caso, (7.25) subestima u2 .
Ao estimar a varincia de b* atravs de ( XX) 1 s*2 , com s*2 = (y y b * Xy ) / (n 1)
, o pesquisador estaria, portanto, cometendo erro de subestimao por duas razes:
primeiro, porque ( XX) 1 u2 subestima as varincias verdadeiras e, segundo, porque (7.25)
tende a subestimar u2 .

7.3. O teste de Durbin-Watson


Para verificar a existncia de autocorrelao nos resduos da regresso utilizamos,
freqentemente, o teste de Durbin-Watson, baseado no valor
n

d=

(et et 1 ) 2

t =2

t =1

(7.26)

2
t

283

onde os et so os desvios da regresso ajustada pelo mtodo de mnimos quadrados


ordinrios.
De (7.26) obtemos
n

d=

et2

et21

t =1

t =1

et et 1

+ t =n2
2 t =2n
et2
et2
et2

t =2
n

t =1

Para n bastante grande temos d aproximadamente igual a 1 + 1 2r = 2(1 r), onde


r o coeficiente de correlao entre et e et 1 . Ento, o valor de d varia entre zero (se r = 1)
e quatro (se r = 1). Um valor de d perto de zero indica a existncia de autocorrelao
positiva nos erros e um valor de d prximo de 4 indica que os erros esto negativamente
autocorrelacionados.
A distribuio de d depende do tamanho (n) da amostra, do nmero (p) de
parmetros estimados e tambm da matriz X. Para tornar mais simples a maneira de efetuar
o teste, foram tabelados, para diferentes valores de n e de p, aos nveis de significncia de
1% e 5% (unilaterais), valores crticos d L e d U que permitem tomar uma deciso
independentemente da matriz X.
Para testar H 0 : = 0 contra H A : > 0 , o valor de d comparado com d L e d U .
Se d < d L , o resultado significativo, rejeitando-se H 0 em favor de H A . Se d > d U , o
resultado no-significativo, isto , no se rejeita H 0 . Se d L < d < d U , o resultado
inconclusivo.
Para testar H 0 : = 0 contra H A : < 0 , o valor de comparado com 4 d L e
4 d U . O resultado significativo se d > 4 d L , e no significativo se d > 4 d U .
Se 4 d U < d < 4 d L , o resultado inconclusivo. Obviamente, o resultado ser o mesmo
se compararmos 4 d com d L e d U .
Atualmente j existem programas de computador que fornecem a probabilidade
caudal associada ao valor calculado do teste de Durbin-Watson. Neste caso basta comparar
a probabilidade caudal com o nvel de significncia adotado para decidir se o resultado
ou no significativo, evitando-se o problema do resultado inconclusivo.
A validade do teste depende de os erros terem distribuio normal com mdia zero
e varincia constante e das variveis explanatrias no serem aleatrias. Devemos ressaltar

284

que no se deve aplicar o teste de Durbin-Watson quando h variveis explanatrias


aleatrias, como o caso de modelos onde valores de Y defasados aparecem entre as
variveis explanatrias. Nestes casos, outros testes devem ser usados. (Ver Johnston, 1972,
p. 309-313).
Draper e Smith (1966, p. 95-99) recomendam o uso de um teste no-paramtrico,
baseado no agrupamento dos sinais dos desvios, para analisar os resduos da regresso.
Para uma apresentao do teste do agrupamento dos sinais, ou teste da ordenao casual,
ver, tambm, Hoel (1968, p. 220-223) ou Hoffmann (2006, seo 13.4).
interessante notar que podemos obter um teste significativo, indicando a
existncia de autocorrelao positiva nos resduos, quando existe erro na especificao do
modelo. Consideremos, por exemplo, que as variveis Y e X esto relacionadas de acordo
com o modelo Yt = + X t + X t2 + u t , onde os u t so erros independentes com mdia
zero e varincia constante. Consideremos, ainda, que, dada uma amostra de n pares de
valores dessas variveis, foi ajustada uma regresso linear simples, isto , em lugar da
parbola, ajustamos uma reta. Se antes de estimar a reta de regresso, as observaes
tiverem sido ordenados conforme valores crescentes de X t , fcil perceber que os desvios
tendero a apresentar autocorrelao positiva.

Exerccios
7.1. Admite-se que as variveis X t e Yt esto relacionadas de acordo com o modelo
Yt = + X t + u t ,
onde u t = u t 1 + t , sendo t um rudo branco.
dada uma amostra de 4 pares de valores das variveis:
Xt

Yt

5
7
11
17

10
14
30
46

a) Estime .
b) Teste, ao nvel de significncia de 5%, a hiptese de que = 0.

285

7.2. So dados os 4 pares de valores observados em uma amostra aleatria:


Xt

Yt

2
19
7
50
12
75
7
40
Admite-se que Y e X esto relacionados de acordo com o modelo
Yt = + X t + u t ,
onde u t = 0,8u t 1 + t , E ( t ) = 0 , E ( t2 ) = 2 e E ( t t +h ) = 0 para h 0.
a) Determine as estimativas lineares no-tendenciosas de varincia mnima de e .
b) Obtenha a estimativa no-tendenciosa de 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 .
7.3. A tabela ao lado mostra os 6 valores consecutivos
de X t e Yt observados ao longo de 6 anos.
Admite-se que essas variveis esto relacionadas
de acordo com o modelo
Yt = + X t + u t ,
com u t = u t 1 + t , sendo t um rudo branco.

4
2
7
4
4
6

12
4
28
20
16
20

a) Obtenha a estimativa linear no-tendenciosa de varincia mnima para .


b) Teste, ao nvel de significncia de 1%, a hiptese H 0 : = 0 contra a hiptese
alternativa H A : > 0 .
7.4. So dados os valores de Yt para 4 semestres consecutivos:
Ano

Semestre

1o
2o
2
1o
2o
Admite-se que essa varivel
1

Yt
23
8
31
10
tem variaes cclicas estacionais e que ela no tem

tendncia (crescimento ou decrscimo monotnico no tempo). Admite-se, tambm,

286

que o termo aleatrio ( u t ) apresenta autocorrelao de 1a ordem com = 0,5 , isto


u t = 0,5u t 1 + t , sendo t um rudo branco.
a) considerando o modelo y = X + u , onde y o vetor-coluna com 4 valores de Yt ,
apresente uma matriz X apropriada para captar a variao estacional de Yt e
obtenha a estimativa linear no-tendenciosa de varincia mnima para o vetor .
b) Verifique se a variao estacional estatisticamente significativa, adotando um
nvel de significncia de 5%.
7.5. Dada uma srie temporal de pares de valores X t , Yt , com t = 1, 2, ..., n, considere o
modelo
Yt = + X t + u t ,
onde ut = ut 2 + t ,
0 < < 1 , E ( t ) = 0 , E ( t2 ) = 2 e

E ( t t h ) = 0 para h 0.
Note que o erro de uma observao est correlacionado com o erro da observao
defasada de dois perodos. Isso pode ocorrer se os dados so semestrais e o valor de u t em
um semestre afetado pelo valor do erro no mesmo semestre do ano anterior.
Sendo u um vetor coluna cujos elementos so os u t (t = 1, ..., n), determine:
a) E(u)
b) E (uu ) , em funo de e 2
7.6. Admite-se que as variveis Y, X 1 e X 2 esto relacionadas de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j

(j = 1, ..., n)

com E(u) = 0 e E (uu ) = V 2 , onde


u1

u = u 2
M
u
n

V=
M

1
M

K
K

Os clculos, entretanto, so feitos tendo em vista o modelo com as variveis centradas:


y j = 1 x1 j + 2 x 2 j + u j u ,

287

1
u j , ou, em notao matricial,
n

onde u =

y = X + u u

onde

y1
y
y = 2 ,
M

yn


= 1 ,
2

x11
x
X = 12
M

x1n

x 21
x 22
M

x2n

u
u
u=
M

u

Demonstre que b = ( XV 1 X) 1 XV 1 y um estimador no-tendencioso e que a


correspondente matriz de varincias e covarincias ( XV 1 X) 1 2 .
Verifique, preliminarmente, que

V 1

com d =

d
f
= f

M
f

1
1

f
d
f
M
f

f
f
d
M
f

f
f
f

M
d

K
K
K
K

1 1 + ( n 1)

f =

1 1 + ( n 1)

7.7. So dados os valores de Y, X 1 e X 2 em uma amostra com n = 4 observaes.


Yj

X1j

X2j

5
1
1
4
2
2
11
3
0
Admite-se que essas variveis esteja relacionadas de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j (j = 1, ..., 4),

com E(u) = 0 e E (uu ) = V 2 , onde

1
0,5
V=
0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5

0,5
0,5
0,5

288

Obtenha as estimativas de 1 , de 2 e das respectivas varincias e covarincias, de


acordo com o mtodo de mnimos quadrados generalizados.
Verifique, preliminarmente, que
V 1

0,4
1,6
0,4
0,4

1,6
0,4
=
0,4
0,4

0,4
0,4
1,6
0,4

0,4
0,4
0,4
1,6

Respostas
7.1. a) b = 3
b) t= 6,481, significativo ( t 0 = 4,303 )
7.2. a) a = 3 e b = 6
b) s2 = 25
c) t = 9,650, no-significativo ( t 0 = 4,303 )
7.3. a) b = 4
b) t = 6,481, significativo ( t 0 = 3,747)

1
7.4. a) X = 1
1
1

0
1 e b = 27 ou
0
19
1

1
X = 0
1
0

0
1 e b = 27
0
8
1

b) t = 6,504, significativo ( t 0 = 4,303 )


7.5. a) E (u) = 0

2
b) Temos E (u ) =
,
1 2
2
t

E (u t u t h ) = 0 se h um nmero mpar e

2 0,5 h
E (u t u t h ) =
se h um nmero par positivo.
1 2
Ento

289

1
0

2
E (uu ) =
0
1 2 2
0

0
1
0

0
1
0

0
M

0
1
0

0
1
0
M

0
1
M

K
K

K
K
K
K

7.7. b1 = 2 e b2 = 3
V (b1 ) = 5 / 9 , V (b2 ) = 5 / 9 e cv(b1 , b2 ) = 4 / 9

Observao: neste exerccio temos um caso de equicorelao, isto , E (u i u j ) = ,


com i j, para todo i. Aplica-se, ento, o teorema de McElroy (1967) (Ver Theil,
1971, p. 241-243). De acordo com esse teorema, em caso de equicorrelao, e desde
que o modelo tenha um termo constante, as estimativas dos parmetros obtidas pelo
mtodo de mnimos quadrados generalizados so iguais s estimativas obtidas
aplicando mnimos quadrados ordinrios. Com exceo da varincia da estimativa do
termo constante, sero, tambm, iguais, as estimativas das varincias e covarincias
das estimativas dos parmetros, obtidas pelos dois mtodos. Compare os resultados
obtidos aplicando mnimos quadrados generalizados com os obtidos aplicando
mnimos quadrados ordinrios (Ver resultados do exerccio 4.11).

290

8.

VARIVEIS INSTRUMENTAIS E ERROS NAS VARIVEIS


EXPLANATRIAS
8.1. Introduo

Lembremos, inicialmente, as pressuposies do modelo ordinrio de regresso


linear. Temos
k

Y j = + i X ij + u j (j = 1, ..., n)
i =1

ou, em notao matricial,


y = X + u

(8.1)

e admitimos que E (u) = 0 , E (uu ) = I 2 e X uma matriz com caracterstica


p = k + 1 < n , cujos elementos so valores fixados.

Lembremos tambm que, se as variveis explanatrias ( X ij ) so aleatrias (com


valores variando de amostra para amostra), o mtodo de mnimos quadrados continua
vlido se
a) a distribuio dos X ij no depende de , dos i (i = 1, ..., k) ou de 2 ;
b) os erros ( u j ) so independentes dos valores de X ij , isto ,
E[( X ij i )u j ] = 0

(i = 1, ..., k),

onde i = E ( X ij )
Nessas condies, aplicando as frmulas de mnimos quadrados ordinrios,
obtemos estimativas no-tendenciosas dos parmetros e, se os u j tm distribuio
normal, os intervalos de confiana, determinados da maneira indicada, e o procedimento
para os testes de hiptese continuam vlidos.

8.2. A consistncia dos estimadores de mnimos quadrados ordinrios


Na seo 1.10 foi analisado o conceito de estimador consistente e foram dadas
algumas propriedades da convergncia em probabilidade. Esse conceito e essas
propriedades so facilmente estendidos para o caso de matrizes. Por definio, o limite
em probabilidade de uma matriz, quando n tende a infinito, igual matriz constituda
291

pelos limites em probabilidade de cada um de seus elementos, desde que as dimenses


da matriz no dependam de n. Assim, por exemplo, se
a
A = 11
a 21

a12
,
a 22

plim a11
plim A =
plim
a 21

plim a12
plim a 22

Conhecidos os limites em probabilidade de vrias matrizes, no h dificuldade


em determinar o limite em probabilidade de qualquer

expresso envolvendo tais

matrizes. Assim,
plim ( AB ) = ( plim A )( plim B )

e
( plim A 1 ) = ( plim A) 1
Consideremos o modelo (8.1), acrescentando a pressuposio de que
1

lim XX = Q ,
n n

(8.2)

sendo Q uma matriz no-singular.


Suponhamos, para exemplificar, que dispomos de uma amostra de dados
experimentais, relativos a um ensaio. Suponhamos ainda que amostras maiores so
obtidas repetindo-se, sucessivamente, esse ensaio bsico. Seja X 0 , de dimenses n0 p
, a matriz de valores das variveis independentes para um ensaio. Ento, para m ensaios
temos n = mn 0 ,

X 0
X
X = 0 e XX = mX0 X 0
M

X 0
Segue-se que

1
1
XX =
X0 X 0 . Conclumos ento que
n
n0

1
1
lim XX =
X0 X0 = Q
n n

n0
isto , a pressuposio (8.2) vlida neste caso.
Passemos demonstrao de que os estimadores de mnimos quadrados
ordinrios so consistentes. De acordo com (4.10), temos

292

1
1
b = + ( X X) X u = + X X
X u
n
n
1

Considerando a pressuposio (8.2), obtemos


1

plim b = + Q 1 plim X u
n

(8.3)

Se X uma matriz cujos elementos so fixados, E (u) = 0 e E (uu ) = I 2 ,


temos
1

E Xu = 0
n

e a matriz de varincias e covarincias do vetor

(8.4)

1
X u
n

2
1
1
V Xu = 2 E ( XuuX) = 2 XX
n
n
n
Ento, lembrando (8.2), obtemos

2
1
lim V X u = lim
n
n
n n
De (8.4) e (8.5) conclumos que

lim XX = 0
n n

(8.5)

1
X u converge em mdia quadrtica para uma
n

matriz nula e, consequentemente, que

plim X u = 0
n

(8.6)

plim b = ,

(8.7)

De (8.3) e (8.6) obtemos

isto , b um estimador consistente de


Se as variveis explanatrias forem aleatrias, e admitirmos que

293

plim X X = Q ,
n

fcil ver que a relao (8.3) continua vlida, isto ,


1

plim b = + Q 1 plim X u
n

(8.8)

Ento b um estimador consistente de se


1

plim X u = 0
n

(8.9)

Se pressupomos que X ij (i = 1, ..., k) so variveis aleatrias independentes de


u j , temos cov( X ij , u j ) = 0 e a condio (8.9) obedecida. Alternativamente, podemos

considerar (8.9) como pressuposio do modelo. Essa pressuposio pode ser expressa
dizendo que as variveis X ij so assintoticamente no-correlacionadas com u j .

8.3. A inconsistncia dos estimadores de mnimos quadrados quando os


erros esto assintoticamente correlacionados com uma ou mais das
variveis explanatrias
Consideremos o modelo

y = X + u , com

E (u ) = 0

E (uu ) = I 2 .

Admitamos que as variveis explanatrias so aleatrias e que


1

plim XX = Q
n

Se

houver

pelo

menos

uma

varivel

explanatria

assintoticamente

correlacionada com o erro, temos


1

plim X u 0
n

Ento, de acordo com (8.3), temos plim b , isto , o estimador de mnimos


quadrados inconsistente.

294

importante notar que a covarincia assinttica no-nula entre X hj e u j no


torna inconsistente apenas a estimativa de mnimos quadrados de h . Note-se, na
1

expresso (8.3), que se houver um nico elemento no-nulo no vetor plim X u , isso
n

pode tornar inconsistentes todos os elementos de b, devido pr-multiplicao pela


matriz Q 1 .

8.4. O uso de variveis instrumentais para obter estimativas consistentes


Por simplicidade, consideremos o modelo
Y j = X j + u j ,

(8.10)

pressupondo que E (u j ) = 0 , E (u 2j ) = 2 , E (u j u h ) = 0 se h j,
1

lim X 2j = Q e plim X j u j 0 .
n n

O estimador de mnimos quadrados de

b=

X jY j
X 2j

De acordo com (8.8), temos


1

plim b = Q 1 plim X j u j
n

Se X j e u j apresentam correlao assinttica positiva, b tende a superestimar o


valor de , pois Q > 0 , por tratar-se de uma soma de quadrados. Por outro lado, se X j
e u j apresentam correlao assinttica negativa, b tende a subestimar o valor de .
Admitamos que sejam conhecidos, para as observaes da amostra, os valores de
uma varivel Z j tal que
1

plim Z j X j 0
n

(8.11)

plim Z j u j = 0
n

(8.12)

295

A condio (8.12) significa que Z j

e uj

devem ser assintoticamente no-

correlacionados. Uma varivel ( Z j ) com tais propriedades denominada varivel


instrumental.
A seguir demonstraremos que

Z jY j
ZjX j

denominado estimador de varivel instrumental, consistente.


De (8.10) e (8.13) obtemos

1
Z jY j
n

=+
1
Z jX j
n
Ento

plim Z j Y j
n

plim = +
1

plim Z j X j
n

Considerando (8.11) e (8.12), segue-se que


plim =

isto , um estimador consistente de .


Generalizando, consideremos o modelo
y = X + u ,

(8.14)

pressupondo que E (u) = 0 , E (uu ) = I 2 e plim X u 0 .


n

Sabemos que nestas condies o estimador b = ( X X) 1 X y inconsistente.


Admitamos que, sendo p o nmero de parmetros em , conhecida uma matriz
Z, de dimenses n p, com as seguintes propriedades:
1

a) plim Z u = 0
n

(8.15)

b) a matriz

296

plim Z X =
n

(8.16)

plim Z Z =
n

(8.17)

existe e no singular.
c) existe a matriz

Nestas condies, Z denominada matriz de variveis instrumentais. Se


admitirmos que algumas das variveis explanatrias ( X ij ) so assintoticamente nocorrelacionadas com o erro, tais variveis podem ser utilizadas como variveis
instrumentais, isto , podem constituir colunas da matriz Z. entretanto, ser necessrio
dispor das observaes de uma varivel instrumental adicional para cada varivel
explanatria que admitirmos correlacionada com o erro.
O vetor das estimativas dos parmetros, de acordo com o mtodo das variveis
instrumentais,
= ( Z X) 1 Z y

(8.18)

Note que, se todas as variveis explanatrias forem assintoticamente nocorrelacionadas com o erro, a prpria matriz X pode ser usada como matriz de variveis
instrumentais e ento o estimador (8.18) coincide com o estimador de mnimos
quadrados.
A seguir demonstraremos que, obedecidas as condies (8.15) e (8.16), o
estimador (8.18) consistente. De (8.14) e (8.18) obtemos
= + ( Z X) 1 Z u

Ento
1

plim = + plim Z X plim Z u


n

De acordo com (8.15) e (8.16) segue-se que plim = , c.q.d.


Pode-se demonstrar que a matriz de varincias e covarincias assintticas de
n 1 1 1 2 . As correspondentes estimativas so dadas por,13

( Z X) 1 ( Z Z)( XZ) 1 s 2

(8.19)

onde
13

Ver Johnston (1972, p. 280).

297

s 2 = ( y X ) ( y X ) /( n p )

Note que (8.19) se transforma em ( XX) 1 s 2 se Z = X.

8.5. Regresso linear simples com as duas variveis sujeitas a erros de


medida
Admitamos que as variveis j e j esto relacionadas de acordo com o
modelo

j = + j + j ,

(8.20)

onde os j so erros aleatrios independentes de mdia zero e plim 2j = 2


n

Admitamos tambm que as observaes disponveis incluem erros de medida


nas duas variveis. Por isso no temos os valores de j e j , mas apenas os valores de
X j = j + vj

(8.21)

Yj = j + wj ,

(8.22)

onde v j e w j so erros aleatrios independentes com mdia zero,


1

plim v 2j v2 e plim w 2j = w2 .
n

De (8.20), (8.21) e (8.22), obtemos


Yj wj = + (X j v j ) + j

ou
Y j = + X j + j v j

(8.23)

onde j = j + w j . Se j e w j forem assintoticamente no-correlacionados, temos

298

plim 2j = 2 + w2
n

De (8.23), fazendo
u j = j v j

(8.24)

Y j = + X j + u j

(8.25)

obtemos

Admitimos que as variveis v j e j no so assintoticamente correlacionadas


entre si, nem so assintoticamente correlacionadas com j , isto ,
1

plim v j j = 0 ,
n

(8.26)

plim v j j = 0 ,
n

(8.27)

plim j j = 0 ,
n

(8.28)

De (8.21) e (8.24) obtemos


1
1
1

X j u j = j j + v j j v j j v 2j
n
n
n
n
n
Considerando (8.26), (8.27) e (8.28), segue-se que
1

plim X j u j = plim v 2j
n

Como plim v 2j = v2 , obtemos


n

299

plim X j u j = v2
n

(8.29)

Esse resultado mostra que se > 0 , X j e u j apresentam correlao assinttica


negativa. De acordo com o que foi visto na seo 8.3, sabemos que o estimador de
mnimos quadrados no consistente.
A seguir determinaremos o limite em probabilidade do estimador de mnimos
quadrados,

b=

x jY j
x 2j

(8.30)

Substituindo (8.25) em (8.30), obtemos

b=+

x jY j
x 2j

Ento

plim x j Y j
n

plim b = +
1

plim x 2j
n

(8.31)

Pode-se demonstrar que, de acordo com (8.29),


1

plim x j Y j = v2
n

(8.32)

plim x 2j = 2 + v2 ,
n

(8.33)

e que

onde 2 = plim ( ) 2
n

Substituindo (8.32) e (8.33) em (8.31), obtemos

300

v2
plim b = 2
+ v2
ou

plim b =

2
1 + v2

(8.34)

Portanto, o estimador de mnimos quadrados ordinrios tende a subestimar o


valor absoluto do parmetro quando h erros de medida na varivel explanatria.
Nas prximas sees examinaremos diferentes mtodos para obter uma
estimativa consistente de quando h erros de medida na varivel explanatria.

8.6. O mtodo da varivel instrumental


Note que a inconsistncia do estimador de mnimos quadrados, quando h erros
de medida na varivel explanatria, decorre da existncia de correlao assinttica entre
X j e u j , como mostra (8.29). Portanto, este um caso especial do problema analisado

na seo 8.3.
De acordo com o que vimos na seo 8.4, o mtodo da varivel insrumental nos
fornece um estimador consistente de , no modelo (8.25). Para isso precisamos dispor
de uma varivel instrumental Z j . Podemos, ento, constituir a matriz

1
1
Z=
M

Z1
Z 2
M

Zn

Para o modelo (8.25) temos

301

1
1
X=
M

X1
X 2
M

Xn

De acordo com (8.15) e (8.16), a varivel Z j deve ser tal que:


1

a) plim Z u = 0
n

b) a matriz
1

plim Z X = ,
n

existe e no-singular, o que implica que


1

plim z j x j 0
n

Vimos que, nestas condies, = ( Z X) 1 Z y um estimador consistente. Para


o modelo (8.25) obtemos

zj yj
zjxj

e = Y X

Entretanto, nem sempre dispomos de uma varivel instrumental, obtida dos


dados observados. Vejamos, ento, uma forma especial de obter uma varivel
instrumental. Admitamos, sem perda de generalidade, que as observaes esto
ordenadas de acordo com os valores de X j , em ordem crescente. Se n for par,
estabelecemos Z j = 1 para as primeiras n/2 observaes e Z j = 1 para as n/2 ltimas
observaes. Se n for mpar, estabelecemos Z j = 1 para j = 1, ..., (n 1)/2, Z j = 0
para j = (n + 1)/2 e Z j = 1 para j = (n + 3)/2, ..., n.
fcil verificar que o estimador de de acordo com (8.18) , neste caso,

Y2 Y1
X 2 X1

(8.35)

302

onde X 1 e Y1 so as mdias dos valores de X j e Y j , respectivamente, para as primeiras


n/2 ou (n 1)/2 observaes, e X 2 e Y2 so as mdias dos valores de X j e Y j ,
respectivamente, para as ltimas n/2 ou (n 1)/2 observaes.
O estimador (8.35) foi proposto por Wald (1940). Uma vez que esse estimador
obtido a partir das mdias de X e de Y para dois conjuntos de observaes, o mtodo
denominado mtodo do agrupamento das observaes.
Bartlett (1949) mostrou que a eficincia do estimador aumenta se dividirmos as
observaes, ordenadas de acordo com os valores crescentes de X j , em 3 grupos, com
aproximadamente o mesmo nmero de observaes em cada um, e estabelecermos
Z j = 1 para as observaes do 1o grupo, Z j = 0 para as observaes do 2o grupo e
Z j = 1 para as observaes do 3o grupo. Ento

Y3 Y1
X 3 X1

onde X 1 e Y1 so as mdias dos valores de X j e Y j , respectivamente, para as


observaes do 1o grupo e X 3 e Y3 so as mdias para as observaes do 3o grupo.

8.7. Outro mtodo


Consideremos, novamente, o modelo de regresso linear simples analisado na
seo 8.5.
O estimador de , de acordo com o mtodo de mnimos quadrados ordinrios,

1
x jY j
n
b=
1
x 2j
n

(8.36)

Com Y j = + X j + u j , obtemos
1
1
1
x j Y j = x 2j + x j u j
n
n
n

303

Lembrando (8.32) e (8.33), conclumos que o numerador de (8.36) converge em


probabilidade para
1

plim x j Y j = 2
n

e que o denominador de (8.36) converge em probabilidade para


1

plim x 2 = 2 + v2
n

Segue-se que o estimador

1
x jY j
n
1
x 2j v2
n

(8.37)

converge em probabilidade para .


O mtodo pode ser estendido para o caso de regresses mltiplas, como consta
em Johnston (1972, p. 289-290).
claro que, dada uma amostra de valores de X j e Y j , para que se possa
calcular o valor do estimador consistente (8.37) necessrio conhecer a varincia ( v2 )
do erro de medida da varivel independente.
Esse mtodo foi utilizado por Perez (1973) em um estudo da elasticidade-renda
do consumo de alimentos em Piracicaba, S.P. A varivel independente, nas regresses
ajustadas, era o logaritmo da renda mensal per capita. Perez admitiu que os dados sobre
a renda mensal per capita apresentaram erros de medida e que esse erro era, em 95%
dos casos, menor do que 20% do valor dessa renda. Uma alterao de 20% em um valor
equivale a multiplic-lo ou dividi-lo por 1,2. Como a varivel independente era o
logaritmo da renda, segue-se que seu erro , em 95% dos casos, inferior ao log 1,2, em
mdulo. Lembrando que o intervalo entre 2 e + 2 compreende pouco mais de 95% da
distribuio normal reduzida, temos aproximadamente, que
2 v = log 1,2

304

Donde
1

= log 1,2
2

2
v

Exerccios
8.1. Admite-se que h uma relao linear entre os verdadeiros

valores das variveis X e Y, com coeficiente angular . Sabe-se,

11

25

entretanto, que os valores observados das duas variveis tm

15

33

erros de medida. fornecida uma amostra de 5 pares de valores

19

37

apresentados na tabela ao lado.

11

21

24
a) Obtenha uma estimativa consistente de admitindo que a varincia14do erro
de medida em X igual a 0,8.
b) Neste caso o estimador b = x i Yi / x i2 , com

xi = X i X , tende a

superestimar ? Quais so, neste caso, as propriedades do estimador b?


8.2. Na tabela ao lado esto os valores de Y e X obtidos de uma
amostra com 8 observaes.
a) Determine a equao de regresso de Y contra X de acordo
com o mtodo de mnimos quadrados ordinrios.
b) Admitindo que X inclui um erro de medida, determine as
estimativas dos parmetros da regresso de acordo com o
mtodo de Wald (1940), dividindo as observaes em dois

14

18

12

18

16

10

grupos.

5
20
c) Determine as estimativas dos parmetros admitindo que a varincia do erro de
3
12
medida em X igual a 0,5.
d) Admitindo que haja erro de medida em X, quais so as propriedades
estatsticas das estimativas do coeficiente regresso obtidas em (a), (b) e (c)?
Se o estimador no for consistente, diga se ele tende a subestimar ou
superestimar o valor verdadeiro.

305

8.3. dada a seguinte amostra de valores das variveis X, Y e Z.


X
Y
Z
4

Sabe-se que as variveis X e Y apresentam erros de medida e admite-se que X e Y


esto relacionados de acordo com o modelo
Y j = + X j + u j

Devido aos erros de medida em

X j , o erro u j

assintoticamente

correlacionado com X j .
Admite-se, tambm, que a varivel Z j no assintoticamente correlacionada
com u j .
a) Determine a estimativa de de acordo com o mtodo de mnimos quadrados
ordinrios.
b) Se > 0 , qual o sinal da tendenciosidade assinttica do estimador de
mnimos quadrados ordinrios de ?
c) Determine a estimativa de utilizando Z j como varivel instrumental.
Obtenha, tambm, a estimativa do respectivo desvio padro.
d) Determine a estimativa consistente de admitindo que a varincia do erro
de medida de X v2 = 1 .
8.4. Considere o modelo
Y j = X j + u j ,

306

onde os u j so erros aleatrios indepedentes, identicamente distribudos, com


1

mdia zero e E (u 2j ) = plim u 2j = 2 . Admite-se que os X j so fixos e que


n

lim X 2j = Q .
n n

a) Demonstre que o limite em probabilidade de

Y j2
X jY j

2
Q

Respostas
8.1. a) = 2
b) O estimador de mnimos quadrados ordinrios (b) inconsistente, com
tendenciosidade assinttica negativa (tende a subestimar ).
8.2. a) Y = 9,273 + 1,636 X
b) ou c) Y = 8 + 2 X
8.3. a) 5/3
b) negativo
c) 2
d) 2
Observao: O fato dos itens (c) e (d) terem a mesma resposta uma coincidncia,
devida ao carter artificial dos dados desse exerccio. Em geral os vrios mtodos
de estimao daro resultados diferentes.

307

9.

EQUAES SIMULTNEAS
9.1. Introduo

Para iniciar a anlise dos problemas economtricos relacionados com sistemas


de equaes simultneas, consideremos um modelo muito simples de determinao da
renda nacional, constitudo pelas duas equaes dadas a seguir:

Ct = + Yt + u t

Yt = Ct + Z t

(9.1)
(9.2)

onde C t a despesa de consumo no t-simo perodo (t = 1, 2, ..., n), Yt a renda, Z t a


despesa de investimento e u t o erro aleatrio,
1

com E (u t ) = 0 , E (u t2 ) = plim u t2 = 2 e E (u t u t +h ) = 0 para h 0.


n

Uma vez que representa a propenso marginal a consumir, devemos ter


0 < < 1.

A varivel Z t exgena, ou seja, uma varivel cujos valores so determinados


por um processo independente do descrito pelo sistema de equaes em anlise.
Pressupomos que as variveis exgenas so no-correlacionadas com os erros do
sistema de equaes simultneas.
No caso do exemplo que estamos considerando, pressupomos, pois, que
E{[ Z t E ( Z t )]u t } = 0
ou
E (Z t ut ) = 0

(9.3)

Neste exemplo C t e Yt so variveis endgenas, isto , so variveis


determinadas conjunta e simultaneamente, da maneira indicada pelo sistema de
equaes pela(s) varivel(eis) exgena(s) e o(s) erro(s).

308

Diz-se que um sistema completo quando o nmero de equaes igual ao


nmero de variveis endgenas, de maneira que o sistema pode ser resolvido para essas
variveis. A soluo chamada forma reduzida do sistema. Uma equao na forma
reduzida mostra como uma varivel endgena varia em funo das variveis exgenas e
dos erros aleatrios. As equaes originais so chamadas equaes estruturais.
No caso do exemplo que estamos considerando, a partir das equaes estruturais
(9.1) e (9.2) obtemos as equaes de forma reduzida:
Ct =

1
ut
1

(9.4)

1
1
Zt +
ut
1
1

(9.5)

Zt +

e
Yt =

Vamos verificar, preliminarmente, que na equao (9.1) o erro u t e a varivel


explanatria Yt esto positivamente correlacionados.
De (9.5) segue-se que
E (Yt ) =

1
Zt
1

e que
Yt E (Yt ) =

1
ut
1

Ento
cov (Yt , u t ) = E{[Yt E (Yt )]u t } =

u2 2
= E t =
1 1

309

Como 0 < < 1 , temos que cov (Yt , u t ) > 0 , isto , na relao (9.1) o resduo e a
varivel explanatria esto positivamente correlacionados.
O estimador de mnimos quadrados ordinrios de em (9.1)

b=

yt Ct
yt2

(9.6)

De acordo com o que foi visto na seo 8.3, a existncia de covarincia entre Yt
e u t faz com que o estimador de mnimos quadrados seja inconsistente. Aplicando a
relao (8.3) a esse caso, verificamos que b tende a superestimar o valor de .
Determinemos o limite em probabilidade de b. Substituindo (9.1) em (9.6),
obtemos

b=+

yt ut
y t2

Ento

plim y t u t
n

plim b = +
1

plim y t2
n

(9.7)

1
1
zt +
(u t u )
1
1

(9.8)

De (9.5) segue-se que


yt =

Uma vez que u t e Z t so no-correlacionados, temos


1

plim z t u t = 0
n

Ento, de (9.8), obtemos

310

1

plim y t u t =
n
1
2

(9.9)

e
Q
2
1

plim y t2 =
+
2
(1 ) 2
n
(1 )

(9.10)

onde Q = plim z t2
n

Substituindo (9.9) e (9.10) em (9.7), obtemos


plim b = +

(1 ) 2
Q + 2

(9.11)

De acordo com o esperado, a tendenciosidade assinttica positiva, uma vez que


0 < < 1.

9.2. Um exemplo numrico


Consideremos os valores de Z t , C t e Yt da tabela 9.1. Verifica-se que Z = 20 ,
C = 30 e Y = 150 .

TABELA 9.1. Amostra de 6 valores de Z t , C t e Yt


Zt

zt = Z t Z

Ct

ct = C t C

Yt

y t = Yt Y

16
14
18

4
6
2

119
126
132

11
4
2

135
140
150

15
10
0

20
24
28

0
4
8

125
131
147

5
1
17

145
155
175

5
5
25

Para construir esse exemplo numrico escolhemos, inicialmente, os valores de


Z t apresentados na tabela 9.1. Depois obtivemos 6 valores de u t com mdia zero e de
maneira que a correlao entre Z t e u t fosse igual a zero. Em seguida estabelecemos
que = 40 e = 0,6 e utilizamos as equaes (9.4) e (9.5) para calcular os valores de

311

C t e Yt . Dessa maneira, nesse exemplo artificial, os mtodos consistentes de estimao


iro reproduzir os valores verdadeiros dos parmetros, que so = 40 e = 0,6 .
Da tabela 9.1 obtemos ct yt = 660 e y t2 = 1000 . Ento o estimador de
mnimos quadrados ordinrios para

ct y t
660
=
= 0,66
2
1000
yt
que, como espervamos, superestima o valor de .
9.3. O estimador de varivel instrumental
De acordo com o que foi visto na seo 8.4, o mtodo das variveis
instrumentais pode ser usado para obter estimativas consistentes dos parmetros quando
uma varivel explanatria est correlacionada com o erro do modelo.
De acordo com (8.18), utilizando Z t

como varivel instrumental para Yt , as

estimativas dos parmetros da equao estrutural (9.1) so dadas por


zt ct
zt yt

(9.12)

= C Y

(9.13)

=
e

No caso do exemplo numrico apresentado temos z t ct = 204 e z t y t = 340 .


204
Ento =
= 0,6 e = 130 0,6 150 = 40 .
340

9.4. Mnimos quadrados indiretos


A equao (9.4), da forma reduzida, pode ser escrita como segue:

C t = A + BZ t + t
com

A=
B=

(9.14)
(9.15)

312

t =

1
ut
1

Como cov (u t , Z t ) = 0 , temos cov ( t , Z t ) = 0 . Ento o mtodo de mnimos


quadrados ordinrios fornecer estimadores lineares no-tendenciosos de varincia
mnima e consistentes dos parmetros A e B. Tais estimadores so

z t ct
B =
z t2

(9.16)

A = C B Z

(9.17)

De (9.14) e (9.15) obtemos

B
1+ B

(9.18)

= (1 ) A

(9.19)

Substituindo, em (9.18) e (9.19), A e B pelas suas estimativas consistentes, dadas


por (9.16) e (9.17), obtemos estimativas consistentes de e . Apesar de A e B serem
estimadores no-tendenciosos de A e B, as estimativas de e , obtidas da maneira
descrita, sero tendenciosas porque a no-tendenciosidade s preservada em
transformaes lineares.
De acordo com (9.16) e (9.18) o estimador de

z t ct
z t2
z t ct
=
z t ct z t2 + z t ct
1+
z t2
Como Yt = C t + Z t , temos z t y t = z t ct + z t2 . Ento o estimador de fica

z t ct
zt yt

isto , obtemos, atravs de mnimos quadrados indiretos, o mesmo estimador


anteriormente obtido utilizando Z t como varivel instrumental.
De acordo com (9.17) e (9.19) o estimador de , obtido atravs de mnimos
quadrados indiretos,

313

(1 )(C B Z ) = C C (1 ) B Z =

= C C (1 )
Z =
1
= C (C + Z ) =
= C Y ,

ou seja,

= C Y ,
que o estimador anteriormente obtido pelo mtodo da varivel instrumental.
O aluno deve verificar que, se em lugar de utilizarmos a equao (9.4),
utilizarmos a equao (9.5) da foram reduzida, os estimadores de e obtidos atravs
do mtodo de mnimos quadrados indiretos sero os mesmos, isto , sero iguais a

z t ct
zt yt

= C Y
Apliquemos o mtodo de mnimos quadrados indiretos ao exemplo numrico
apresentado.
Para a equao de regresso, derivada de (9.4),
C t = A + BZ t + t ,
obtemos

z t ct 204
B =
=
= 1,5 e A = C B Z = 130 1,5 20 = 100
136
z t2
De acordo com (9.18) temos

B
1 + B

= 0,6

De acordo com (9.19) temos

= (1 ) A = 0,4 100 = 40
Como exerccio o aluno deve repetir os clculos considerando a equao (9.5),
em lugar da equao (9.4), verificando que as estimativas de e obtidas sero as
mesmas.

314

9.5. Mnimos quadrados em dois estgios


Para estimar os parmetros da equao (9.1) atravs do mtodo de mnimos
quadrados em dois estgios fazemos, inicialmente, a regresso linear simples de Yt (a
varivel endgena que aparece no segundo membro dessa equao) em relao a Z t (a
varivel exgena do sistema). Sejam 1 e 2 as estimativas dos parmetros dessa
regresso. Sabemos que

2 =

zt yt
z t2

1 = Y 2 Z
Podemos ento calcular os valores de

Yt = t + 2 Z t

(9.20)

Em (9.1), substituindo Yt por Yt + et , onde et so os desvios da regresso de Yt


contra Z t , obtemos

Ct = + (Yt + et ) + u t
ou

Ct = + Yt + (u t + et )

(9.21)

De (9.3) e (9.20) obtemos

cov (Yt , u t ) = 2 cov ( Z t , u t ) = 0


Sabemos que Yt no est correlacionado com et (Esta uma propriedade do
mtodo de mnimos quadrados). Conclumos, ento, que, na equao (9.21), Yt no est

315

correlacionado com o erro (u t + et ) . Podemos, portanto, aplicar a essa questo o


mtodo de mnimos quadrados ordinrios, obtendo o seguinte estimador para :

ct y t
y t2
Como y t = 2 z t e 2 =

zt yt
z t2

esse estimador fica

ct y t 2 z t ct
z t ct
z t ct
= 2
=
=
2
2
2
2 z t
2 z t z t y t
y t
Obtemos, pois, o mesmo estimador consistente j obtido pelo mtodo de
mnimos quadrados indiretos e pelo uso de Z t como varivel instrumental:

zt ct
zt yt

Vamos aplicar o mtodo de mnimos quadrados em dois estgios ao exemplo


numrico apresentado.
No primeiro estgio, fazemos a regresso de Yt contra Z t .
Temos

2 =

z t yt 340
=
= 2,5
136
z t2

1 = Y 2,5Z = 150 2,5 20 = 100


Em seguida, calculamos os valores de Yt = 100 + 2,5Z t , que so apresentados na
tabela 9.2.

316

Tabela 9.2. Os valores de Yt obtidos no 1o estgio


Zt

Yt

16
14
18
20
24
28

140
135
145
150
160
170

y t
10
15
5
0
10
20

Temos Yt = Yt = 900 ,
Yt
= Y = 150
n
e
y t2 = 850

No segundo estgio fazemos a regresso de C t contra Yt , obtendo

ct y t 510
=
= 0,6
850
y t2

= C Y = 130 0,6 150 = 40

9.6. Variveis conjuntamente determinadas e variveis predeterminadas


J vimos a distino entre variveis endgenas e variveis exgenas. Se, no
sistema de equaes simultneas, alm das variveis correntes (referentes ao perodo t),
h variveis defasadas (referentes ao perodo t h, com h > 0), podemos distinguir os
seguintes tipos de variveis:
a) variveis endgenas correntes
b) variveis exgenas correntes
c) variveis endgenas defasadas
d) variveis exgenas defasadas
As variveis endgenas correntes so denominadas variveis conjuntamente
determinadas. As outras so chamadas variveis predeterminadas.

317

No caso mais geral, ento, a forma reduzida descreve o comportamento das


variveis conjuntamente determinadas em termos das variveis predeterminadas e dos
erros.

9.7. Notao geral


Consideremos um sistema de equaes simultneas completo, com L equaes e
L variveis endgenas (ou L variveis conjuntamente determinadas, j que no
consideraremos, no que se segue, a possibilidade de existirem variveis endgenas
defasadas).
A j-sima equao estrutural poderia ser representada da seguinte maneira:
L

h =1

k =1

hj Yht + kj X kt = jt (j = 1, ..., L e t = 1, ..., n),

onde Yht a t-sima observao da h-sima varivel endgena e X kt a t-sima


observao da k-sima varivel predeterminada (k = 1, ..., K, sendo K o nmero de
variveis predeterminadas do sistema de equaes em anlise).
O modelo especificar, normalmente, que parte dos coeficientes hj (h = 1, ..., L)
e kj (k = 1, ..., K) so iguais a zero, indicando as variveis excludas das j-sima
equao.
Em notao matricial temos
Y + XB = E

(9.22)

onde Y tem dimenses n L, tem dimenses L L, X tem dimenses n K, B tem


dimenses K L e E tem dimenses n L.
Cada coluna da matriz E constituda de valores dos erros para uma das
equaes do sistema:

E = [1

L ]

Admite-se que

E ( j j ) = I 2j
e que

E ( j h ) = I jh ,
isto , o erro de uma equao em determinado perodo no-correlacionado com os
erros referentes a outros perodos, mas pode ser correlacionado com os erros das outras
equaes no mesmo perodo.
318

De (9.22), que representa as equaes estruturais, obtemos a forma reduzida


Y = XB 1 + E 1

(9.23)

Essa notao mais geral no cmoda para a anlise dos mtodos de estimao
que vamos considerar a seguir.
Em princpio cada uma das equaes estruturais pode ser colocada na forma
y j = Z j j + j

(9.24)

onde:
a) y j um vetor-coluna com os n valores da varivel endgena que aparece no
primeiro membro da j-sima equao estrutural;
b) Z j a matriz n N j , onde N j o nmero de variveis no segundo
membro da j-sima equao, incluindo variveis endgenas e exgenas (Se a
equao tem um termo constante, vamos considerar que existe uma varivel
exgena fictcia cujas valores so todos iguais a 1, associada a esse termo);
c) j um vetor com os N j parmetros a serem estimados e
d) j um vetor-coluna com os n valores do erro da j-sima equao.
O estimador de mnimos quadrados ordinrios para j

(Zj Z j ) 1 Zj y j
Entretanto, se Z j inclui variveis conjuntamente determinadas (variveis
endgenas correntes), esse estimador no consistente.

9.8. Variveis instrumentais


Para relembrar a idia do uso de variveis instrumentais na obteno de
estimativas consistentes dos parmetros, consideremos o modelo bsico de regresso
linear mltipla, com uma nica equao,
y = X + u

Premultiplicando por X obtemos


X y = X X + X u

319

O valor de Xu desconhecido, mas se plim X u = 0 e plim X X


n

uma matriz no-singular, podemos, para uma amostra suficientemente grande, desprezar

Xu obtendo Xy = X X .
Segue-se que = ( X X) 1 X y um estimador consistente de .
1

Se plim X u 0 , mas dispusermos de uma matriz de variveis instrumentais


n

W, com n linhas, sendo que plim W u = 0 e plim W X uma matriz non

singular, obteramos, analogamente, o sistema de equaes


W y = W X ,

que poder ser resolvido para , se existir ( W X) 1 . Obter-se-, dessa maneira, o


estimador consistente = ( WX ) 1 W y .
Vamos aplicar o mtodo das variveis instrumentais para estimar os parmetros
de (9.24).
A matriz X, com todas as K variveis predeterminadas do sistema, uma matriz
de variveis instrumentais apropriada se pudermos admitir que14
1

plim X j = 0
n

(9.25)

De (9.24), considerando X como matriz de variveis instrumentais, obtemos


X y j = X Z j j + X j

(9.26)

Xy j = XZ j

(9.27)

Se N j = K , a matriz XZ j uma matriz quadrada de dimenses K K.


Se, alm disso, XZ j for no-singular, existe ( XZ j ) 1 e de (9.27) obtemos

j = ( X Z j ) 1 Xy j

(9.28)

14

Se X incluir variveis endgenas defasadas, s podemos admitir a validade de (9.25) se os erros no


forem autocorrelacionados. Uma exposio didtica do problema de ajuste de equaes simultneas
quando h variveis endgenas defasadas e autocorrelao nos erros pode ser encontrada em Kelejian e
Oates (1978, p. 321-325).

320

9.9. Identificao
A relao (9.27) representa um sistema de K equaes com N j incgnitas (as
estimativas dos N j parmetros, cada um correspondendo a uma das N j variveis que
aparecem no segundo membro da j-sima equao do sistema de equaes simultneas).
Para que exista uma soluo, isto , para que a equao (9.24) seja identificvel,
necessrio que o nmero de equaes em (9.27) seja pelo menos igual ao nmero de
incgnitas, ou seja, devemos ter
K Nj

(9.29)

Portanto, se as equaes do modelo esto na forma (9.24), para que a j-sima


equao estrutural seja identificvel, a condio necessria, mas no suficiente, que o
nmero (K) de variveis predeterminadas do sistema de equaes simultneas em
estudo seja pelo menos igual ao nmero ( N j ) de variveis que aparecem no segundo
membro da j-sima equao.
Se representarmos por K j e L j , respectivamente, o nmero de variveis
predeterminadas e o nmero de variveis endgenas que aparecem no segundo membro
da j-sima equao, temos
N j = K j + Lj

Ento, a condio K N j fica


K K j + Lj

ou
K K j Lj

(9.30)

Portanto, para que a j-sima equao seja identificvel, necessrio que o


nmero de variveis predeterminadas do sistema que no aparecem nessa equao seja
igual ou maior do que o nmero de variveis endgenas correntes no segundo membro
da equao.
Se K < N j (o que implica K K j < L j ) o sistema (9.27) no tem soluo.
Dizemos, ento, que a j-sima equao estrutural no identificvel, isto , h
subidentificao.

321

Se o sistema de equaes (9.27) for possvel e determinado, isto , se existir


apenas uma soluo para esse sistema, dizemos que a j-sima equao estrutural
exatamente identificvel. Isso ocorre, por exemplo, se N j = K e XZ j for uma matriz
no-singular. Nesse caso, a soluo do sistema dada por (9.28).
Se o nmero de equaes independentes em (9.27) for maior do que o nmero de
incgnitas ( N j ), temos superidentificao.
Note que tanto no caso de identificao exata como no caso de
superidentificao dizemos que a equao identificvel.
Antes de mostrar como podemos obter estimativas dos parmetros em caso de
superidentificao, vamos examinar o conceito de identificao sob outros ngulos.
Para ilustrar o problema de subidentificao, consideremos o sistema (no
identificvel) constitudo pelas equaes de oferta e demanda de um produto:

qt = 0 + 1 pt + u t (demanda)

qt = 0 + 1 pt + t (oferta)
onde qt e p t so, respectivamente, a quantidade transacionada e o preo do produto no
t-simo perodo. Aqui, o fato de utilizarmos letras minsculas no significa que as
variveis sejam centradas.
Neste caso, para qualquer uma das 2 equaes, temos N j =2 (considerando uma
varivel fictcia x 0 = 1 , associada aos parmetros 0 e 0 ). Como K = 1 (s h uma
varivel predeterminada que x 0 = 1 ), temos um caso de subidentificao. Nenhuma
das duas equaes identificvel j que para ambas K < N j . A relao (9.27), isto ,
Xy j = XZ j ,
consiste, tanto no caso da demanda (j = 1) como no caso da oferta (j = 2), de uma nica
equao com 2 incgnitas ( 0 e 1 no caso da demanda e 0 e 1 no caso da oferta).
Podemos mostrar, graficamente, o fato de, nestas condies, as equaes de demanda e
oferta no serem identificveis. Na figura 9.1 representamos a funo de demanda e a
funo de oferta. Os pontos correspondentes aos pares de valores ( p j , q j ) estaro em
redor do ponto de interseco das 2 funes (o ponto de equilbrio). Tais pontos no nos
permitem estimar nenhuma das duas funes.

322

Figura 9.1.

Figura 9.1
Figura 9.1

Consideremos, agora, que a oferta depende, tambm, do preo ( x1t ) de uma


matria-prima, e que este preo uma varivel exgena que no afeta a demanda

qt = 0 + 1 pt + u t (demanda)

qt = 0 + 1 pt + 2 x1t + t (oferta)

(9.31)

Esse sistema tem K = 2 variveis exgenas (a varivel fictcia x0 = 1 e x1 ).


Para a equao de oferta temos N 2 = 3 > K . Portanto, essa equao no
identificvel.
A equao de demanda, entretanto, exatamente identificvel, j que

N1 = 2 = K .
Para ilustrar graficamente o problema, consideremos um sistema de dois eixos
cartesianos ortogonais, onde so lidos os valores de p t e qt . A funo de oferta estar
em diferentes posies, dependendo do valor de

x1t . Com isso, os pontos

correspondentes aos pares de valores ( p t , qt ), que esto ao redor dos vrios pontos de
equilbrio, se distribuiro ao longo da funo de demanda, como mostra a figura 9.2.
Tais pontos podero, portanto, ser utilizados para obter uma estimativa da funo de
demanda, isto , essa funo , neste caso, identificvel.

323

Figura 9.2
Consideremos, agora, um outro tipo de anlise para mostrar que no sistema
(9.31) a demanda identificvel, mas a oferta no o . Multiplicando a equao de
demanda por uma constante e somando equao de oferta, obtemos
(1 + )qt = 0 + 0 + ( 1 + 1 ) pt + 2 x1t + t + u t
ou

qt =

0 + 0 1 + 1
+ u t

+
pt + 2 x1t + t
1+
1+
1+
1+

(9.32)

Essa equao tem exatamente as mesmas variveis que a equao de oferta. No


podemos, portanto, distinguir as duas equaes sem conhecer os valores dos
parmetros. Com 0 , a equao (9.32) , na realidade, uma mistura das equaes de
oferta e de demanda. Isso mostra que a equao de oferta, nesse modelo, no
identificvel. Por outro lado, a equao de demanda em (9.31) se distingue de (9.32)
pelo fato de no apresentar um termo em x1t . Conclumos, ento, que a equao de
demanda identificvel.
A condio K N j (ou K K j L j ) denominada condio de ordem para
identificao e , apenas, uma condio necessria.
Para mostrar que a condio K N j no suficiente, consideremos o sistema

y1t = 1 y 2t + 2 y 3t + 3 x1t
y1t =
y1t = 1 y 2t

+ 1t

+ 2 y3t + 3 x1t + 4 x 2t + 5 x3t + 2t


+ 3 x1t + 4 x 2t + 5 x3t + 3t

(9.33)

324

admitindo que se sabe, de acordo com a teoria que serviu de base para a construo do
modelo, que

4 5
=
=
4 5

(9.34)

Nesse sistema y1t , y 2t e y 3t so variveis endgenas e x1t , x 2t e x3t so


variveis exgenas. Temos, portanto, K = 3 variveis (exgenas) predeterminadas no
sistema.
Para a primeira equao temos N1 = 3 = K , ou seja, satisfeita a condio de
ordem para identificao dessa equao.
Entretanto, subtraindo da segunda equao do sistema a terceira multiplicada
por e considerando (9.34), obtemos
(1 ) y1t = 1 y 2t + 2 y 3t + ( 3 3 ) x1t + 2t 3t
ou

y1t =

3
3t

1
y 2t + 2 y 3t + 3
x1t + 2t
1
1
1
1

Essa equao no se distingue da primeira equao do sistema, uma vez que


ambas tm as mesmas variveis. A primeira equao do sistema no , portanto,
identificvel, apesar de ser obedecida a condio de ordem K N j .
A seguir vamos apresentar, sem demonstrao, a condio necessria e
suficiente para identificao de uma equao de um sistema de equaes simultneas.
Cabe ressaltar que estaremos considerando essencialmente apenas a identificao
baseada em restries de excluso de variveis, isto , baseada no conhecimento prvio
de que os coeficientes de algumas variveis so iguais a zero.
Lembrando a notao usada na expresso (9.22), consideremos a matriz
A = [

B ]

(9.35)

Nessa matriz esto todos os coeficientes do sistema, cada linha correspondendo


a uma das L equaes. Cada uma das L + K colunas da matriz A mostra os coeficientes
de determinada varivel (endgena ou exgena) nas L equaes.
Sem perda de generalidade, vamos determinar a condio de identificao da
primeira equao. Para isso verificamos onde h zeros na 1a linha de A e formamos uma
matriz com os elementos da matriz que ficam abaixo desses zeros, representando essa
nova matriz por
A 0 = [ 0

B 0 ]

(9.36)

325

Essa matriz ter L 1 linhas e um nmero de colunas igual ao nmero de zeros


na 1a linha de A.
A condio necessria e suficiente para identificao da 1a equao do sistema
(por meio de restries de excluso) que a caracterstica da matriz A 0 seja igual a L
1. Como essa matriz tem L 1 linhas, a condio de identificao que essas L 1
linhas sejam linearmente independentes.
Como a condio (9.29) ou (9.30), denominada condio de ordem para
identificao, uma condio necessria, sendo verificado que ela no obedecida para
determinada equao, podemos concluir que a equao no identificvel, sendo
dispensvel examinar a condio necessria e suficiente baseada na caracterstica da
matriz A 0 = [ 0

B 0 ] . Por outro lado, se a condio de ordem para identificao for

satisfeita, isso no garante que a equao seja efetivamente identificvel, devendo-se


verificar se atendida a condio necessria e suficiente.
Para exemplificar, consideremos a 1a equao do sistema (9.33) J vimos que ela
atende condio de ordem para identificao. Obtemos

A0 = 4
4

5
5

primeira vista essa matriz tem caracterstica 2, sendo atendida a condio suficiente
para identificao da 1a equao. Mas, dada a relao (9.34), conclumos que essa
matriz A 0 tem caracterstica igual a 1 e que a 1a equao do sistema (9.33) no
identificvel.
O leitor pode verificar que para todos os demais exemplos apresentados, quando
a condio de ordem indica que uma equao identificvel, isso confirmado pelo
exame da condio necessria e suficiente.
Vejamos, finalmente, um exemplo em que o exame da condio necessria e
suficiente altera radicalmente o que sugerido pela condio de ordem (Phillips e
Wickens, 1978, p. 283):

Y1t = 12Y2t + 13Y3t + 11 X 1t + 12 X 2t + 1t

Y2t = 21Y1t + 23Y3t + 2t

Y3t = 31Y1t + 32Y2t + 3t

(9.37)

O sistema tem K = 2 variveis exgenas ( X 1t e X 2t ). Para a 1a equao temos

N1 = 4 > K , concluindo-se que ela no identificvel. A condio de ordem indica que


326

tanto a 2a como a 3a equao so exatamente identificveis (pois N 2 = N 3 = 2 = K ).


Vejamos a condio necessria e suficiente. Passando todos os termos com parmetros
para o primeiro membro, a matriz com todos os coeficientes fica

A = [

1
B] = 21
31

12

13

11

23
1

0
0

32

12
0
0

Para a 2a equao obtemos



A 0 = 11
0

12
0

com caracterstica igual a 1 (menor do que L 1 = 2), concluindo-se que a 2a equao


no identificvel.
Para a 3a equao a matriz A 0 a mesma, concluindo-se que a 3a equao
tambm no identificvel.

9.10. Estimao dos parmetros em caso de superidentificao


Em caso de superidentificao (K > N j ), o sistema (9.27), isto ,
Xy j = XZ j j ,
tem mais equaes do que incgnitas. A matriz XZ j no quadrada e a soluo (9.28)
no se aplica.
Encaremos a relao (9.26), isto ,
X y j = X Z j j + X j ,

como o modelo de uma regresso linear mltipla de X y j contra XZ j . O vetor de


erros desse modelo de regresso linear mltipla X j , que um vetor-coluna com K
elementos. Desde que a matriz X no contenha variveis aleatrias, temos

E ( X j j X) = XX 2j
O estimador de j deve ser obtido, ento, aplicando o mtodo de mnimos
quadrados generalizados. Obtemos

327

j = [Z j X( XX) 1 XZ j ]1 Z j X( XX) 1 Xy j

(9.38)

com matriz de varincias e covarincias assintticas

[Z j X( XX) 1 XZ j ] 1 2j

(9.39)

Se XZ j for uma matriz quadrada (K = N j ) e no-singular, de (9.38) obtemos


j = ( XZ j ) 1 XX(Z j X) 1 Z j X( XX) 1 Xy j = ( XZ j ) 1 Xy j
Isso mostra que (9.28) pode ser encarado, simplesmente, como um caso
particular de (9.38).
Note que o estimador (9.38) no apresenta todas as propriedades desejveis de
um estimador de mnimos quadrados generalizados, porque Z j (em XZ j ) inclui,
normalmente, variveis conjuntamente determinadas.
Entretanto, pode-se demonstrar que (9.38) um estimador consistente e que

[Z j X( XX) 1 XZ j ] 1 s 2j

(9.40)

com
s 2j =

(y j Z j j )(y j Z j j )
nNj

(9.41)

fornece estimativas de varincias e convarincias das estimativas dos parmetros


assintoticamente vlidas (Validade aproximada para amostras suficientemente grandes).
O estimador (9.38) um estimador de mnimos quadrados em dois estgios (ou
estimador de Theil-Basmann).
Se a matriz ( XZ j ) for quadrada e no-singular, a expresso (9.40) pode ser
escrita

( XZ j ) 1 XX( XZ j ) 1 s 2j

(9.42)

9.11. Outras maneiras de obter o estimador de mnimos quadrados em


dois estgios
As estimativas dos parmetros de (9.24), isto , de

328

y j = Z j j + j ,

tambm podem ser obtidas atravs de um processo em dois estgios.


No primeiro estgio fazemos a regresso de cada uma das variveis em Z j
contra a matriz de variveis predeterminadas X, obtendo
= X( XX) 1 XZ
Z
j
j

(9.43)

No segundo estgio temos duas variantes:


a) Usar Z j como matriz de variveis instrumentais em y j = Z j j + j , obtendo
Z j y j = Z j Z j *j
e
Z ) 1 Z
y
*j = (Z
j
j
j j

(9.44)

b) Substituir Z j por Z j em (9.24) e aplicar mnimos quadrados ordinrios,


obtendo
Z
) 1 Z y
j = (Z
j
j
j j

(9.45)

Agora, substituindo (9.43) em (9.44) e (9.45), e lembrando (9.38), verifica-se


que
j = *j = j ,
isto , qualquer um dos trs caminhos leva ao estimador de mnimos quadrados em dois
estgios.
Lembrando (9.43), verifica-se facilmente que a matriz de varincias e
covarincias assintticas das estimativas dos parmetros, dada por (9.39), pode ser
escrita
Z ) 1 2
(Z
j
j
j

9.12. Um exemplo numrico


Para ilustrar a aplicao de algumas das frmulas obtidas consideremos,
novamente, o exemplo apresentado nas sees 9.1 e 9.2. Mudando a notao, para
adapt-la notao geral utilizada, o sistema de equaes (9.1) e (9.2) pode ser reescrito
da seguinte maneira:
329

Y1t = X 1t + Y2t + u t

Y2t = Y1t + X 2t
onde X 1t uma varivel fictcia ( X 1t = 1 ), X 2t o valor do investimento, Y1t a
despesa de consumo e Y2t a renda.
Os dados numricos so reproduzidos na tabela 9.3.

TABELA 9.3. Valores de X 1t , X 2t , Y1t e Y2t


X 1t

X 2t

Y1t

Y2t

16

119

135

14

126

140

18

132

150

20

125

145

24

131

155

28

147

175

O sistema tem K = 2 variveis predeterminadas ( X 1t e X 2t ) e duas variveis


endgenas ( Y1t e Y2t ).
Sendo y 1 um vetor-coluna com os valores de Y1t , Z1 a matriz com as variveis (
X 1t e Y2t ) que aparecem no segundo membro da primeira equao e 1 o vetor-coluna
com os parmetros dessa equao, isto ,

1 = ,

a primeira equao fica

y 1 = Z 1 1 + u ,
onde u o vetor dos erros.
Temos
119
1
126
1

132
1
y 1 = e Z1 =
125
1
131
1

147
1

135
140
150

145
155

175

330

A matriz X com as variveis predeterminadas


1
1

1
X=
1
1

16
14
18

20
24

28

Obtemos
6
XZ1 =
120

900
18340

780
1 9170
Xy 1 =
e ( XZ1 ) 1 =

1020 60
15804

450
3

Neste exemplo temos identificao exata, com matriz XZ1 quadrada e nosingular.
De acordo com (9.28) obtemos
40
1 = ( XZ 1 ) 1 Xy 1 =
0,6
ou seja, = 40 e = 0,6 .
Temos o seguinte vetor de desvios
2
2

2
y 1 Z1 1 =
2
2

2
Ento, de acordo com (9.41),
s12 =

24
=6
4

331

De acordo com (9.42), a matriz das estimativas das varincias e covarincias


assintticas das estimativas dos parmetros ( XZ j ) 1 XX(Z j X) 1 s 2j .
6
Como XX =
120

120
2536

pode-se verificar que a matriz das estimativas das varincias e covarincias assintticas
fica
1 67925
2550 450

450 2
s1
3

ou
1 67925
425 450
Segue-se

que

V ( ) = 159,82 ,

450
3

V ( ) = 0,00706

cov( , ) = 1,0588 ,

lembrando que se trata das varincias e covarincias assintticas.


Os testes t e F no so estritamente vlidos quando h uma ou mais variveis
endgenas no segundo membro da equao estimada. Mas, por falta de alternativa
melhor, e tendo em vista que eles so assintoticamente vlidos, utilizamos valores de t e
F para testar hipteses. No exemplo analisado, para testar H 0 : = 0 , calculamos

t=

0,6
0,00706

0,6
= 7,14
0,0840

Resultados de computador indicam que, na distribuio de t com 4 graus de


liberdade, a probabilidade de o valor absoluto de t ser maior do que 7,24 0,002,
mostrando que o teste significativo ao nvel de 1%.
Verificamos, no caso desse exemplo numrico, que os trs mtodos de estimao
analisados (uso de variveis instrumentais, mnimos quadrados indiretos e mnimos
quadrados em dois estgios) levam ao mesmo resultado.
O uso de variveis instrumentais sempre equivalente ao mtodo de mnimos
quadrados indiretos. Estes dois mtodos, entretanto, s so aplicveis nos casos de
identificao exata, conduzindo, ento, a resultados idnticos aos do mtodo de
mnimos quadrados em dois estgios. Este ltimo mtodo aplicvel, tambm, em
casos de superidentificao.

332

Assinale-se que os mtodos de estimao analisados podem ser aplicados a uma


equao se essa equao for exatamente identificvel, mesmo que outras equaes do
sistema sejam superidentificadas ou no identificveis.

9.13. Um segundo exemplo numrico


Consideremos o sistema

y1t = 1 y 2t + 1 x1t + 1t

y1t = 2 y 2t + 2 x 2t + 2t
onde y1t e y 2 t so variveis endgenas, x1t e x 2t so variveis exgenas, e 1t e 2t
so erros aleatrios com mdia zero e varincia constante, sendo que o erro de um
perodo independente dos erros em outros perodos.
O sistema tem K = 2 variveis predeterminadas ( x1t e x 2t ) e duas variveis
endgenas ( y1t e y 2 t ).
Os valores observados em uma amostra hipottica esto na tabela 9.4.
TABELA 9.4. Amostra de 8 valores para as variveis x1t , x 2t , y1t e y 2 t
x1t

x 2t

y1t

y 2t

3
3
1
1
1
1
3
3

1
1
1
1
1
1
1
1

1
2
1
0
0
2
1
1

2
0
2
0
0
0
2
2

Note que todas as variveis esto centradas.


Temos
x12t = 40

x1t y1t = 10

x1t y 2t = 20

x 22t = 8

x 2t y1t = 6

x 2 t y 2 t = 4

x1t x 2t = 0

y1t y 2t = 0

333

Neste exemplo, as duas equaes so exatamente identificveis ( N j = K = 2 ).


Podemos, ento, obter as estimativas dos parmetros por qualquer um dos trs
mtodos analisados (uso de variveis instrumentais, mnimos quadrados indiretos e
mnimos quadrados em dois estgios).
Deixamos para o aluno verificar, como exerccio, que qualquer um dos trs
mtodos levar s seguintes estimativas:

1 = 1 , 2 = 1 , 1 = 1,5 e 2 = 0,5 .
9.14. Terceiro exemplo
Consideremos o seguinte sistema, constitudo pelas equaes de demanda e de
oferta de um produto agrcola

Y1t = 0 + 1Y2t + 2 X 1t + 3 X 2t + 1t (demanda)

(oferta)
Y1t = 0 + 1Y2t + 2 X 1t + 2t
onde Y1t a quantidade transacionada, Y2t o preo, X 1t o tempo (em anos ou meses),
X 2t a renda per capita e X 3t a pluviosidade.
As variveis Y1t e Y2t so endgenas e as variveis X 1t , X 2t e X 3t so
exgenas e independentes dos erros 1t e 2t .
Na tabela 9.5 so dados os valores observados em uma amostra. Trata-se de
dados artificiais criados tendo em vista fazer com que os clculos sejam relativamente
simples, no se pretendendo que os valores apresentados sejam nem mesmo
aproximaes de valores reais das variveis.
TABELA 9.5. Amostra de 8 valores para as variveis Y1t , Y2t , X 1t , X 2t e X 3t
Y1t

Y2t

7
9
10
10
11
11
16
18

0
0
1
3
6
8
5
5

X 1t
3
3
1
1
1
1
3
3

X 2t

X 3t

1
1
1
1
2
2
2
2

2
2
2
2
1
1
3
3
334

Obtemos
Y1t = 92

Y2t = 28

X 1t = 0

X 2t = 12

X 3t = 16

Y1 = 11,5

Y2 = 3,5

X1 = 0

X 2 = 1,5

X3 = 2

Y1t2 = 1152

Y22t = 160

X 12t = 40

X 22t = 20

X 32t = 36

y12t = 94

y 22t = 62

x12t = 40

x 22t = 2

x 32t = 4

X 1t Y1t = 56

X 2t Y1t = 148

X 3t Y1t = 196

x1t y1t = 56

x 2t y1t = 10

x3t y1t = 12

X 1t Y2t = 40

X 2t Y2t = 52

X 3t Y2t = 52

x1t y 2t = 40

x 2t y 2t = 10

x 3 t y 2 t = 4

X 1t X 2t = 8

X 2 t X 3t = 4

X 2t X 3t = 24

x1t x 2t = 8

x 2t x3t = 4

x 2t x3t = 0

Considerando que existe uma varivel fictcia X 0 = 1 , associada aos parmetros

0 e 0 , o sistema tem K = 4 variveis predeterminadas.


No caso da equao de demanda temos, incluindo a varivel X 0 = 1 , N1 = 4
variveis no segundo membro da equao. A equao de demanda exatamente
identificvel e as estimativas dos parmetros podem ser obtidas atravs de qualquer um
dos trs mtodos analisados (variveis instrumentais, mnimos quadrados em dois
estgios ou mnimos quadrados indiretos).
No caso da equao de oferta temos, incluindo a varivel X 0 = 1 , N 2 = 3
variveis no segundo membro da equao. Como N 2 < K = 4 , temos um caso de
superidentificao. Os parmetros dessa equao sero estimados pelo mtodo de
mnimos quadrados em dois estgios.
Seja y 1 o vetor-coluna com os n = 8 valores de y1t . Analogamente, sejam y 2 ,

x1 , x 2 e x 3 os vetores-coluna com os valores das variveis centradas y 2 t , x1t , x 2t e x3t


, respectivamente.
Se trabalharmos com todas as variveis centradas ficam, provisoriamente,
eliminados os termos constantes das equaes do sistema.
A matriz de variveis predeterminadas , neste caso

335

X = [x1

x2

x3 ]

Alm de y 1 e X, utilizaremos adiante as matrizes:


a)

Z1 = [y 2

x1

x 2 ] , que a matriz com as variveis que aparecem no segundo


membro da primeira equao (a demanda). Uma vez que
todas as variveis so centradas, deixa de existir a varivel
X0.

b)

Z 2 = [y 2

x 3 ] , que a matriz com as variveis que aparecem no segundo


membro da segunda equao (a oferta).

c)

1

1 = 2 e 2 = 1 ,

2
3

que so os vetores com as estimativas dos parmetros da


equao de demanda

e da equao de oferta

Aplicando o mtodo das variveis instrumentais para estimar os parmetros da


primeira equao (a demanda) obtemos, de acordo com (9.27), o sistema de equaes
Xy 1 = X Z 1 1

ou

x1t y1t = 1 x1t y 2t + 2 x12t + 3 x1t x 2t

2
x 2t y1t = 1 x 2t y 2t + 2 x1t x 2t + 3 x 2t

x3t y1t = 1 x3t y 2t + 2 x1t x3t + 3 x 2t x3t


Considerando os valores numricos dados, o sistema fica

56 = 40 1 + 40 2 + 8 3

10 = 10 1 + 8 2 + 2 3
12 = 4 + 4
1
2

Resolvendo, obtemos 1 = 1 , 2 = 2 e 3 = 2 .
evidente que o mesmo resultado seria obtido se utilizssemos a relao (9.28).
A equao de demanda estimada

y1t = y 2t + 2 x1t + 2 x 2t
ou

Y1t 11,5 = (Y2t 3,5) + 2( X 1t 0) + 2( X 2t 1,5)


Ento

336

Y1t = 12 Y2t + 2 X 1t + 2 X 2t
Verifica-se que 0 = 12 .
Vejamos, a seguir, como as estimativas dos parmetros da equao de demanda
poderiam ser obtidas pelo mtodo de mnimos quadrados em dois estgios.
No primeiro estgio, obtemos a regresso de y 2 t (a varivel endgena que
aparece no segundo membro da equao) contra x1t , x 2t e x3t , que so as variveis
predeterminadas do sistema. Seja o vetor das estimativas dos parmetros dessa
regresso.
Temos
x12t

X X = x1t x 2t
x1t x3t

x1t x 2 t
x 22t
x 2 t x 3t

x1t x3t 40

x 2 t x3t = 8
x32t 4

8
2
0

4
0
4

( XX)

1
1
= 4
4
1

18
4

1
x1t y 2t 40

4 e Xy 2 = x 2t y 2t = 10
x3t y 2t 4
2

A seguir obtemos

1
= ( XX) Xy 2 = 1
2
1

Ento y 2t = x1t + x 2t 2 x3t

3,5
3,5

1,5

1
,
5

y 2 = X =
3,5

3,5
1,5

1,5

ou

No segundo estgio fazemos a regresso de y1t contra y 2 t , x1t e x 2t , obtendo 1


.
Sendo Z 1 = [y 2

x1

x 2 ] , temos

337

1 = ( Z 1 Z 1 ) 1 Z 1 y 1

Obtemos
y 22t

Z 1 Z 1 = x1t y 2 t
x 2t y 2t

(Z 1 Z 1 )

x 2 t y 2t 58

x1t x 2 t = 40
x 22t 10

x1t y 2t
x12t
x1t x 2t

1
1
= 0
8
5

0
1
4

40
40
8

10
8 ,
2

5
y1t y 2t 42

y = x y = 56
4 e Z
1 1
1t 1t
x 2t y1t 10
45

Ento

1 1
1 = 2 = 2
3 2
A matriz de varincias e covarincias assintticas dessas estimativas

1
1
(Z 1 Z 1 ) = 0
8
5
1

2
1

0
1
4

5
4 12
45

De acordo com (9.41) o estimador de 12


s12 =

(y 1 Z 1 1 )(y 1 Z1 1 )
n N1

Temos n = 8, N1 = 4 e

1
1

1

1

y 1 Z 11 =
1

1
1

1
Ento
s12 =

8
=2
4

e a matriz das estimativas das varincias e covarincias assintticas de 1 , 2 e 3

338

1
4

4
Passemos

equao

de

5

4

45

0
1
4
1

oferta.

Como,

para

essa

equao,

temos

superidentificao, dos trs mtodos de estimao apresentados, s o mtodo de


mnimos quadrados em dois estgios aplicvel.
Ento, de acordo com esse mtodo, fazemos, no primeiro estgio, uma regresso
de y 2 t (a varivel endgena que aparece no segundo membro da equao de oferta)
contra x1t , x 2t e x3t , que so as variveis predeterminadas do sistema. Neste exemplo,
este estgio coincide com o primeiro estgio da aplicao do mesmo mtodo equao
de demanda.
No segundo estgio fazemos a regresso de y1t contra y 2 t e x3t , obtendo 2 .

= [y
Sendo Z
2
2

x 3 ] , temos
Z ) 1 Z y
2 = ( Z
2 2
2 1

Obtemos

y 22t

Z2Z2 =
x3 y 2t

x3 y 2t 58
=
x32t 4

4
,
4

2
y = y1t y 2t = 42
e Z
2 1

29
x3t y1t 12

1 2
(Z 2 Z 2 ) 1 =
108 2
Ento

1
2 = 1 =

2 4
A equao de oferta estimada

y1t = y 2t + 4 x3t
Ento

Y1t 11,5 = Y2t 3,5 + 4( X 3t 2)


e

Y1t = Y2t + 4 X 3t
339

Verifica-se que 0 = 0
A matriz de varincias e covarincias assintticas de 1 e 2
1 2
Z
1 2
(Z
2 2) 2 =
108 2

2 2
2
29

De acordo com (9.41) o estimador de 22


s 22 =

(y 1 Z 2 2 )(y 1 Z 2 2 )
n N2

Temos n = 8, N 2 = 3 e

1
1

1

1

y1 Z 2 2 =
1

1
1

1
Ento s 22 = 8 / 5 e a matriz das estimativas das varincias e covarincias
assintticas de 1 e 2

4
135

4
135

4
135

58
135

9.15. Uma viso global


Para o modelo bsico y = X + u , com, entre outras pressuposies,
E (u ) = 0

E (uu ) = I 2
E ( X u ) = 0 ,

obtemos b = ( X X) 1 X y , que um estimador linear, no-tendencioso, de varincia


mnima e consistente.

340

Entretanto, freqentemente uma ou mais dessas pressuposies no so


obedecidas. Consideremos 2 casos gerais:
(I) O vetor de erros u tem matriz de varincias e covarincias
E (uu ) = V 2 , com V I
Ento o melhor estimador de o de mnimos quadrados generalizados, dado
por
= ( X V 1 X) 1 X V 1 y ,

com matriz de varincias e covarincias


( XV 1 X) 1 2
O estimador de mnimos quadrados ordinrios , neste caso, no-tendencioso,
mas ineficiente. A expresso usual ( XX) 1 s 2 dar estimativas incorretas, tendendo
freqentemente a subestimar as varincias e covarincias verdadeiras.
Heterocedasticia e autocorrelao nos resduos so casos particulares desse
problema.
(II) elementos de X so aleatrios e correlacionados com elementos de u.
O estimador de mnimos quadrados ordinrios, neste caso, tendencioso.
interessante distinguir dois subcasos:
(II-a) Os valores de X correspondentes t-sima observao ( t-sima linha de
X) so correlacionados com algum valor do erro (u h , h t ) , mas no com o erro da
mesma observao (u t ) .
Exemplo disso um modelo com variveis defasadas
Yt = + X t + Yt 1 + u t ,
onde os u t no so autocorrelacionados. Ento Yt 1 est correlacionado com u t h (h = 1,
2, ...), mas no est correlacionado com u t ou u t + h (h = 1, 2, ...).
Pode-se demonstrar que, neste caso, o estimador de mnimos quadrados
ordinrios consistente, embora seja tendencioso.
(II-b) Os valores de X correspondentes t-sima observao so correlacionados
com u t .
341

Nessa situao o estimador de mnimos quadrados ordinrios inconsistente.


Isto ocorre, por exemplo, quando variveis importantes no so includas no
modelo, quando h erros de observao nas variveis independentes e no caso de
sistemas de equaes simultneas.

Exerccios
9.1.

Considere um modelo muito simples de determinao da renda nacional, constitudo por


apenas duas equaes simultneas:

Ct = + Yt + u t

Yt = Ct + Z t
As variveis endgenas so a renda nacional ( Yt ) e a despesa com consumo (
C t ). Os erros u t so variveis aleatrias independentes com mdia zero e
varincia constante. O valor dos investimentos ( Z t ) uma varivel exgena (no
correlacionada com u t ).
dada uma amostra de 4 valores de C t , Yt e Z t :
Ct

Yt

Zt

14
12
20
38

15
15
25
45

1
3
5
7

Verifica-se que C t = 84 , Yt = 100 e Z t = 16 .


a) Obtenha as estimativas de e por mnimos quadrados ordinrios, ajustando
a regresso linear simples de C t contra Yt , como sugere a equao (1),
isoladamente.
b) Considerando o sistema de equaes simultneas, obtenha estimativas
consistentes de e . Como denominado o mtodo que voc usou?
c) O que voc pode dizer dos estimadores usados no item (a)?
9.2. Na tabela ao lado esto os valores de Y1 , Y2 e X em
uma amostra com 4 observaes. Admite-se que
essas variveis esto relacionadas de acordo com o
sistema

X
10
21
28
17

22
14
4
16

2
5
8
5
342

Y2t = + Y1t + u t

Y1t = + X t + t
As variveis endgenas so Y1 , Y2 . Pressupe-se que os erros u t e t tm mdia
zero e varincia constante, no apresentam autocorrelao e no so
correlacionados com X t . Admite-se, entretanto, que u t pode ter correlao com

t .
a) Analise a identificao de cada equao.
b) Quando a equao for identificvel, obtenha estimativas (apropriadas) dos
seus parmetros.
c) Teste, ao nvel de significncia de 5%, a hiptese de que = 0 , contra a
hiptese alternativa de que > 0 .
9.3. Seja o sistema de equaes

Yt = + X t + u t

X t = + Z t + t
onde u t e t so variveis aleatrias com mdia zero e varincia constante.
Admite-se que u t e t apresentam correlao assinttica negativa, isto ,
1

plim u t t < 0 . Admite-se, tambm que u t e t no so assintoticamente


n

correlacionados com Z t e que o erro de uma observao ( u t ou t )


independente dos erros das demais observaes ( u t + h e t + h ).
dada a seguinte amostra de valores de Yt , X t e Z t (extrada de KONG CHU,
Principles of Econometrics, International Textbook, 1968, p. 110):
Yt

Xt

Zt

10
19
16
22
33
45
48
61
70
76

5
8
6
7
10
12
13
15
20
24

2
4
3
5
8
11
12
15
14
16

343

Pode-se verificar que


Yt = 400

X t = 120

Z t = 90

Y = 40

X = 12

Z =9

Yt 2 = 21016

X t2 = 1788

Z t2 = 1060

y t2 = 5016

x t2 = 348

z t2 = 250

X t Yt = 6085

X t Z t = 1352

Z t Yt = 4700

xt y t = 1285

xt z t = 272

z t y t = 1100

a) Mostre que o estimador de mnimos quadrados ordinrios, b = xy / x 2 ,


tende a subestimar , isto , mostre que plim b < .
b) Obtenha estimativas dos parmetros , , e e d as qualidades dos
estimadores utilizados.
9.4.

Considere o seguinte sistema, constitudo pelas equaes de demanda e de oferta de um


produto, em certo mercado:

Y1t = 1 + 1Y2t + 1 X 1t + 1t (demanda)

Y1t = 2 + 2Y2t + 2 X 2t + 2t (oferta)


As variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do
produto, respectivamente, no perodo t. As variveis exgenas X 1t e X 2t so a
renda per capita e o preo de um subproduto, respectivamente.
Admite-se que 1t ou 2t so erros aleatrios com mdia zero e varincia
constante, e que o erro de um perodo ( 1t ou 2t ) independente dos erros em
outros perodos.
dada a seguinte amostra de valores X 1t , X 2t , Y1t e Y2t :

344

X 1t

X 2t

Y1t

Y2t

1
1
3
3
5
5
7
7

1
1
3
3
3
3
1
1

2
1
4
3
3
5
2
4

1
3
1
3
3
3
5
5

a) satisfeita a condio necessria para que as duas equaes sejam


identificveis?
b) Obtenha estimativas consistentes dos parmetros da equao de demanda e
determine a matriz das estimativas das respectivas varincias e covarincias
assintticas.
c) Idem, para a equao de oferta.
d) Para a equao de demanda, faa os clculos sem centrar e centrando as
variveis e verifique que os resultados so idnticos.
Note que se todas as variveis forem centradas, esse exerccio se confunde com o
segundo exemplo dado no texto (seo 9.13).

9.5. Considere o seguinte sistema de equaes simultneas:


Y1t = + X t + u1t
Y2t = + Y1t + u 2 t
onde X t uma varivel exgena, Y1t e Y2t so variveis endgenas e os erros u1t
e u 2t so rudos brancos, podendo haver correlao entre u1t e u 2t .
Obtenha estimativas consistentes de e com base na seguinte amostra:
Xt
10
10
2
10

Y1t
26
22
6
18

Y2t
120
96
35
81

345

9.6. Considere o seguinte modelo (extremamente simples) de determinao da renda


nacional (Y1t ) e do consumo (Y2t ) , com duas equaes:
Y2t = + Y1t + ut

(1)

Y1t = Y2t + Z t

(2)

Admite-se que o investimento ( Z t ) uma varivel exgena, no correlacionada


com o erro ut .
So dados os valores de Z t , Y1t e Y2t em uma amostra com 5 observaes:
Zt

Y1t

Y2t

10
12
10
11
12

60
68
64
76
72

50
56
54
65
60

a) Estime ajustando a equao (1) por mnimos quadrados ordinrios.


b) Quais so, neste caso, as propriedades desse estimador?
c) Obtenha estimativas consistentes de e de .
d) Determine a estimativa do desvio padro do estimador de utilizado no item
anterior.
9.7. Na tabela ao lado esto os valores de X, Y1 , Y2 em

uma amostra com 5 observaes. Admite-se que estas

4
2
5
1
3

variveis esto relacionadas de acordo com o sistema

Y2t = + Y1t + ut

Y1t = + X t + t

16
4
20
6
9

87
3
102
24
39

As variveis endgenas so Y1 e Y2 . Pressupe-se que os erros ut e t tem mdia


zero e varincia constante, no apresentam autocorrelao e no so
correlacionados com X t . Admite-se, entretanto, que ut pode ter correlao com

t .
a)

Analise a identificao de cada equao.

b)

Quando a equao for identificvel, obtenha estimativas consistentes dos seus


parmetros.
c) Se possvel, obtenha uma estimativa do desvio padro da estimativa de .

346

9.8. Considere o seguinte sistema de equaes simultneas, no qual Y1 e Y2 so


variveis endgenas e X1 e X 2 so variveis exgenas:
Y2t = + Y1t + u2t
Y1t = 0 + 1 X 1t + 2 X 2t + u1t
dada a seguinte amostra de valores das 4 variveis:
X 1t

X 2t

Y1t

Y2t

11
9
9
7
5
5
3

1
1
7
4
1
7
7

22
21
45
26
17
41
38

37
37
85
51
29
77
69

Sabe-se que a estimativa da segunda equao

Y1t = 7 + X 1t + 4 X 2t

a) Analise a identificao da primeira equao.


b) Obtenha estimativas consistentes de e
c) Teste, ao nvel de significncia de 1%, a hiptese de que = 0.

9.9. Considere o seguinte sistema, constitudo pelas equaes de demanda e de oferta de


um produto, em certo mercado:

Y1t = 0 + 1Y2t + 2 X 1t + 1t

Y1t = 0 + 1Y2t + 2 X 2t + 3 X 3t + 2t

(demanda)
(oferta)

As variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do


produto, respectivamente, no perodo t.
As variveis exgenas X 1t , X 2t e X 3t so, respectivamente, a renda per capita, o
montante de subsdios recebidos pelos produtores e o preo da matria-prima.
Admite-se que 1t e 2t so erros aleatrios com mdia zero e varincia
constante, e que os erros de um perodo, embora correlacionados entre si, so nocorrelacionados com os erros relativos a outros perodos.
dada a seguinte amostra de valores X 1t , X 2t , X 3t , Y1t e Y2t :

347

X 1t

X 2t

X 3t

Y1t

Y2t

5
6
7
7
8
9

130
110
120
120
110
130

30
20
26
26
30
24

18,5
20,0
19,5
18,5
19,5
24,0

7,5
8,0
7,5
8,5
12,5
10,0

a) A equao de demanda identificvel?


b) A equao de oferta identificvel?
c) Obtenha estimativas consistentes dos parmetros 1 e 2 da equao de
demanda e determine a matriz das estimativas das respectivas varincias e
covarincias assintticas.
d) Idem, para os parmetros 1 , 2 e 3 da equao de oferta.
e) Determine as estimativas da elasticidade-preo da demanda, da elasticidaderenda da demanda e da elasticidade-preo da oferta para os valores mdios de
Y1t , Y2t e X 1t .
9.10. Considere o modelo

y 1 = y 2 + v

y 2 + X + u
onde

y11
y 21
v1
u1
y
y
v
u
y 1 = 12 , y 2 = 22 , v = 2 , u = 2 ,
M
M
M
M




y1n
y 2n
v n
u n
X 01
X
X = 02
M

X 0n

X 11

X 12
M

X 1n

X k1
0


X k2
1
e =
M
M


X kn
k

Admite-se que:
a) E (vt ) = E (u t ) = E (vt vt + h ) = E (u t u t + h ) = 0 para h 0.
1

b) E (vt2 ) = plim vt2 = v2


n

348

c) E (u t2 ) = plim u t2 = u2
n

d) E (u t v t ) = plim u t vt = uv2
n

e) plim X u = plim X v = 0
n

f) plim X X = Q
n

Seja c = (y 1 y 2 ) /(y 2 y 2 ) o estimador de mnimos quadrados ordinrios de .


Mostre que

1
1
Xv + u v
n
n
c=+
1
2
1
XX + Xu + u u
n
n
n
e que
plim c = +

uv2
Q + u2

Note que o estimador de mnimos quadrados ordinrios consistente se uv2 = 0 ;


neste caso, o modelo dado constituiria um sistema recursivo (Ver Johnston, 1972,
p. 377-380 ou Wonnacott e Wonnacott, 1876, p. 180-182).
Verifique que o estimador de mnimos quadrados em dois estgio de

y 2 Ny1
, onde N = X( XX) 1 X
y 2 Ny 2

Mostre que
1

1
1
1
1

Xv + u X XX Xv
n
n
n
n

= +
1
1

1
1
1
1

XX + 2 Xu + u X XX Xu
n

n
n
n
n

e que plim = , se Q 0 .

Respostas
9.1. a) b = 5 / 6 = 0,833 e a = 1 / 6 = 0,167
b) = 0,8 e = 1

349

c) So estimadores inconsistentes, com b tendendo a superestimar .


9.2. a) A 1a equao exatamente identificvel. A segunda equao no tem varivel
endgena no segundo membro e, consequentemente, identificvel e pode ser
estimada por mnimos quadrados ordinrios.
b) Y2 = 33 Y1 e Y1 = 4 + 3 X
c) t = 6,364, significativo (a regio de rejeio t 2,920 ).
9.3. b) = 8,529 e = 4,044 so estimativas consistentes.

= 2,208

e = 1,088 so estimativas consistentes, no-tendenciosas e de

varincia mnima.
9.4. a) Sim.
b) 1 = 3,5 ; 1 = 1,5 ; 1 = 1
s12 = 1,6
Matriz das estimativas das varincias e covarincias assintticas de 1 , 1 e 1 :

1,64
0,80

0,24

0,80
0,80
0,40

0,24
0,40
0,24

c) 2 = 0,5 ; 2 = 0,5 ; 2 = 1
s12 = 1,6
Matriz das estimativas das varincias e covarincias assintticas de 2 , 2 e 2 :

0,64

3,56
0,64

0,72
9.5.

c = 11 e d = 4

9.6. a) b = 0,9

b) Estimador inconsistente, tendendo a superestimar .

c) = 0,75 e = 6
9.7.

0,16
0,08

0,72
0,08
0,24

s) s ( ) = 0,1768

a) A primeira equao exatamente identificvel. A segunda equao obviamente


identificvel, pois no h varivel endgena no segundo membro.
b) = 1 , = 4 , = 15 e = 6
c)

9.8.

s ( ) = 0,433

a) Ocorre superidentificao na 1a equao. A 2asequao obviamente identificvel, pois


no h varivel endgena no 2o membro.

350

b) = 5 e = 2
c) t = 24,495, significativo ( t 0 = 4,032 )
9.9.

a) H superidentificao se 2 0 e 3 0 .
b) exatamente identificvel se 2 0 .
c) Equao de demanda estimada

Y1 = 15 Y2 + 2 X 1
s12 = 4
Matriz das estimativas das varincias e covarincias assintticas de 1 e 2 :

1 160
259 152

152
248

d) Equao de oferta estimada:

Y1 = Y2 + 0,2 X 2 0,5 X 3
s 22 = 1
Matriz das estimativas das varincias e covarincias assintticas de 1 , 2 e 3 :

6800
1
660
67600
1500

660
243
245

1500
245
1325

e) 0,45, 0,7 e 0,45

351

10. SRIES TEMPORAIS


10.1. Processos estocsticos
Uma srie temporal um conjunto de valores de uma varivel ordenados no
tempo. Exemplos: a srie de temperaturas mximas dirias em determinado posto
meteorolgico, a srie dos preos mdios mensais de milho em determinado mercado e
a srie de valores anuais do PIB brasileiro.
Para uma conceituao mais formal, necessrio considerar o processo
estocstico subjacente. Dado um conjunto T, um processo estocstico uma famlia
Y = {Y (t ), t T } , tal que, para cada t T , Y (t ) uma varivel aleatria. O conjunto T

, normalmente, o conjunto dos nmeros inteiros {0, 1, 2, ...} ou o conjunto dos


nmeros reais. A figura abaixo ilustra esta interpretao de um processo estocstico
(Moretin e Toloi, p. 17):

Figura 10.1. Um processo estocstico.

Alternativamente, um processo estocstico pode ser interpretado como uma


famlia de trajetrias ou realizaes do processo, como ilustra a figura a seguir:

352

Y(t)

t
Figura 10.2. Conjunto de trajetrias

Imaginando um conjunto infinito de trajetrias, um corte no instante t


permitiria obter a distribuio de Y(t) naquele instante.
Uma srie temporal uma trajetria ou realizao de um processo estocstico.
Aqui sero analisadas apenas sries temporais de valores Yt equiespaados no tempo
(sries completas de dados anuais ou mensais, por exemplo).
Um exemplo de processo estocstico um conjunto infinito de sries formadas
pelos resultados de 100 lanamentos consecutivos de um dado.
Note-se que o critrio de ordenao dos Y (t ) , na definio de um processo
estocstico, no precisa ser o tempo. Mas certo que na grande maioria das aplicaes t
representa o tempo.
Um processo estocstico caracterizado pelas distribuies conjuntas de Y (t1 ) ,

Y (t 2 ) , ..., Y (t n ) para qualquer conjunto finito de valores de t ( t1 , t 2 ,..., t n ) pertencentes a


T. Na prtica, a anlise usualmente fica limitada a trs tipos de parmetros:
a) as mdias (t ) = E[Y (t )]
b) as varincias t2 = V [Y (t )] = E[Y (t ) (t )] 2
c) as covarincias (t1 , t 2 ) = cov[Y (t1 ), Y (t 2 )]
Note que t2 = (t , t )
Um processo estocstico estritamente estacionrio se as distribuies
conjuntas de Y (t1 ) , Y (t 2 ) , ..., Y (t n ) no so afetadas por translaes no tempo, isto ,

353

se a distribuio conjunta de Y (t1 ) , Y (t 2 ) , ..., Y (t n ) idntica distribuio conjunta


de Y (t1 + k ) , Y (t 2 + k ) , ..., Y (t n + k ) .
No caso de um processo estacionrio, a escolha da origem no eixo t no afeta
nenhuma caracterstica do processo.
Na prtica impossvel conhecer todas as distribuies conjuntas de Y (t1 ) ,

Y (t 2 ) , ..., Y (t n ) e ficamos restritos ao conceito de processo fracamente estacionrio


(ou estacionrio de segunda ordem), que aquele que obedece s seguintes condies:
a) a mdia de Y (t ) constante, isto , (t ) = para todo t.
b) a varincia de Y (t ) constante, isto , V [Y (t )] = 2 para todo t.
c) (t1 , t 2 ) uma funo de t 2 t1 , isto , a covarincia entre dois Y (t )
depende apenas da defasagem entre eles.
Essa ltima condio permite que, no caso de um processo estacionrio, a
covarincia entre Y (t ) e Y (t + k ) seja indicada por k . Consequentemente, a varincia
de Y (t ) pode ser indicada por 0 .

10.2. Rudo branco


Por simplicidade, a partir desse ponto passamos a representar os valores da srie
temporal por Yt , em lugar de Y (t ) .
Denomina-se rudo branco uma srie temporal (at ) com mdia igual a zero,
varincia constante e sem covarincia entre valores referentes a dois momentos
distintos, isto ,
E (a t ) = 0
E ( a t2 ) = a2

k = cov(at , at +k ) = 0

para k 0

Sejam X t os valores obtidos em lanamentos consecutivos de um dado nochumbado. Ento a srie de valores de Yt = X t 3,5 um exemplo de rudo branco.

354

10.3. Modelos de regresso


Um possvel modelo para uma srie temporal Yt = (t ) + a t , t = 1, ..., n , onde
at um rudo branco no correlacionado com (t ) , que uma determinada funo do
tempo (a parcela sistemtica ou determinstica de Yt ).
Um exemplo bastante simples o modelo de uma regresso linear simples
Yt = + t + a t
Se Yt uma srie de dados mensais e incluirmos variveis binrias para captar
uma possvel variao estacional, o modelo fica
12

Yt = + t + h Z h +a t ,
h =2

com Z h = 1 no h-simo ms do ano e Z h = 0 nos demais meses do ano.

10.4. Modelos de decomposio


O modelo clssico de decomposio de uma srie temporal baseia-se na
pressuposio de que ela pode ser separada em parcelas. Tipicamente so considerados
3 componentes: a tendncia ( Dt ) , a variao cclica sazonal ( S t ) e a parte aleatria ( at
). Ento
Yt = Dt + S t + a t

Se os componentes forem multiplicativos o modelo fica


Yt = Dt S t at

Neste caso usam-se os logaritmos para obter um modelo aditivo.


Uma exposio da tcnica usada para separar o componente estacional pode ser
encontrada no captulo 20 do livro Estatstica para Economistas (Hoffmann, 2006).

10.5. Modelos ARMA


Em comparao com os modelos de regresso e a tcnica de decomposio das
sries temporais, os modelos ARMA, descritos nesta seo e nas seguintes, tiveram
desenvolvimento relativamente recente. O trabalho pioneiro foi o livro de Box e

355

Jenkins, intitulado Time Series Analysis: Forecasting and Control, cuja 1a edio foi
publicada em 1970. H uma 3a edio, com Reinsel como novo co-autor, publicada em
1994.
O modelo de um processo auto-regressivo de primeira ordem, indicado por
AR (1) ,

Yt = + Yt 1 + a t ,

(10.1)

em que a t um rudo branco e e so parmetros.


O modelo de um AR ( p) (processo auto-regressivo de ordem p)
Yt = + 1Yt 1 + 2Yt 2 + ... + p Yt p + at

ou
Yt 1Yt 1 2Yt 2 ... p Yt p = + at

Usando o operador de defasagem B, tal que B k (Yt ) = Yt k , o modelo pode ser


escrito

(1 1 B 2 B 2 ... p B p )Yt = + at

(10.2)

ou, sinteticamente,

( B)Yt = + a t
Por definio, o modelo de um processo de mdias mveis de primeira ordem,
indicado por MA(1) (devido expresso em ingls moving average),
Yt = + a t a t 1

(10.3)

O modelo de um MA ( q ) (processo de mdias mveis de ordem q) fica


Yt = + at 1 a t 1 2 a t 2 ... q a t q

ou

Yt = + (1 1 B 2 B 2 ... q B q )at

(10.4)

ou
Yt = + ( B)a t
O nome mdias mveis est consagrado, embora no seja estritamente correto,
uma vez que no se trata de uma mdia mvel dos at (pois os coeficientes 1, 1 , 2
, K , q no precisam ser positivos nem ter soma igual a 1).
356

Combinando (10.2) e (10.4) obtemos o modelo de um ARMA ( p, q ) :

(1 1 B ... p B p )Yt = + (1 1 B ... q B q )at

(10.5)

10.6. Anlise do AR(1)


De acordo com (10.1) temos que
Yt 1 = + Yt 2 + at 1
Substituindo essa expresso em (10.1), obtemos
Yt = + + 2 Yt 2 + a t + a t 1

Mas Yt 2 pode ser substitudo por + Yt 3 + at 2 , obtendo-se


Yt = + + 2 + 3Yt 3 + a t + at 1 + 2 a t 2

Aps sucessivas substituies desse tipo, obtemos


Yt = + + 2 + ... + m + m +1Yt m 1 + a t + at 1 + 2 a t 2 + ... + m a t m

(10.6)

com m arbitrariamente grande.


Se < 1 , podemos desprezar o termo em Yt m1 e obtemos (no limite, para

m)
Yt =

+ a t + at 1 + 2 at 2 + ...

(10.7)

Como a t um rudo branco, obtemos


E (Yt ) =

(10.8)

e
V (Yt ) = (1 + 2 + 4 + ...) a2

ou
V (Yt ) =

1
a2
1 2

(10.9)

Pode-se verificar que

357

cov(Yt , Yt k ) =

k
a2 = k
2
1

(10.10)

As expresses (10.8), (10.9) e (10.10) mostram que um AR (1) com < 1 tem
mdia constante, varincia finita e constante e que a covarincia entre Yt e Yt k depende
da defasagem k mas no depende de t. Conclui-se que um AR (1) com

<1

(fracamente) estacionrio.
As expresses (10.1) ou (10.6) mostram que um AR (1) com > 1 explosivo.
Tanto os valores absolutos de Yt como sua varincia crescem ilimitadamente. O
processo no estacionrio.

10.7. O passeio aleatrio com deslocamento


No caso particular em que = 1 o modelo AR (1) fica
Yt = Yt 1 + + at

(10.11)

Esse processo denominado passeio aleatrio com deslocamento. Em cada


perodo o valor da varivel acrescido de e de um elemento aleatrio at .
O passeio aleatrio o caso particular em que = 0 :
Yt = Yt 1 + a t

(10.12)

Para um passeio aleatrio com deslocamento, partindo de um valor inicial Y0 e


aplicando sucessivamente a relao (10.11), obtemos
Y1 = Y0 + + a1
Y2 = Y0 + 2 + a1 + a 2
e, generalizando,
t

Yt = Y0 + t + a j
j =1

(10.13)

O mesmo resultado pode ser obtido de (10.6) fazendo = 1 e m = t 1 .

358

A expresso (10.13) mostra que E (Yt ) cresce linearmente com t e que a


varincia da parcela aleatria tambm cresce sempre com t, mostrando que um AR (1)
com = 1 no estacionrio.
Se substituirmos por , o modelo do passeio aleatrio com deslocamento fica
Yt = Yt 1 + + a t

(10.14)
t

Se, alm disso, definirmos u t = a j , a expresso (10.13) fica


j =1

Yt = Y0 + t + u t

(10.15)

Esse modelo enganadoramente semelhante ao modelo


Yt = + t + a t

(10.16)

apresentado na seo 3. A diferena est na matriz de varincias e covarincias dos


erros. Para o modelo (10.16) essa matriz I a2 , ao passo que no caso do modelo
(10.15), admitindo que os valores observados sejam Y1 , Y2 ,..., Yn , essa matriz W a2
com
1
1

1
W=
1
M

1
2
2
2

1
2
3
3

1
2
3
4

K
K
K
K
K

1
2
3

4
M

(10.17)

Observa-se que no modelo (10.15) h heterocedasticia e covarincia entre os


erros. Se formos estimar o parmetro em (10.15) por meio de uma anlise de
regresso, necessrio utilizar mnimos quadrados generalizados. Mas h uma maneira
muito mais fcil de estimar . De (10.14) segue-se que

Yt = Yt Yt 1 = + a t

(10.18)

Dada a srie de n valores de Yt , podemos calcular Z t = Yt e a estimativa de ,


simplesmente,
b=Z =

1 n
Zt
n 1 t =2

(10.19)

359

Pode-se verificar que


n

t =2

t =2

Z t = (Yt Yt 1 ) = Yn Y1

Ento

b=

Yn Y1
n 1

(10.20)

Essa equao mostra que a estimativa de depende apenas dos valores inicial e
final de Yt . Isso ocorre porque todas as variaes de Yt em perodos intermedirios
foram sendo acumuladas, sem nenhuma perda, e esto contidas no valor final Yn .
Se a srie de valores de Yt for analisada fazendo uma regresso de Yt contra t
usando as frmulas de mnimos quadrados ordinrios, ser obtida uma estimativa notendenciosa mas ineficiente de . O problema principal que sero utilizadas frmulas
erradas para estimar as varincias, fazendo com que os testes de hiptese no sejam
vlidos. Ao testar H 0 : = 0 , h uma grande probabilidade de obter um valor de t ou F
significativo mesmo que a hiptese seja verdadeira.
O modelo (10.15), obtido de (10.14), um processo estacionrio nas diferenas
(difference stationary process DSP), pois as diferenas Z t = Yt constituem uma
srie estacionria, como mostra (10.18).
O modelo (10.16) gera um processo estacionrio depois de eliminada a
tendncia (determinstica) + t ( um trend stationary process TSP).
Um exemplo numrico simples permite ressaltar as diferenas entre os
procedimentos estatsticos apropriados no caso dos modelos (10.15) e (10.16). Vamos
considerar uma srie com apenas 4 valores consecutivos de Y t , dados na tabela a seguir:
TABELA 10.1. Srie de 4 valores de Yt .
t=X

Yt

1
2
3
4

10
11
17
19

Admitindo que (10.16) seja o modelo que gerou os dados, a estimativa de

360

b=

xY 16,5
=
= 3,3
5
x2

(10.21)

O quadrado mdio do resduo


s2 =

58,75 54,45
= 2,15
2

(10.22)

Para testar a hiptese H 0 : = 0 calculamos

t=

3,3
2,15
5

= 5,032 (10.23)

Ao nvel de significncia de 5%, o valor crtico de t 4,303. O resultado


significativo. A esse nvel de significncia, rejeita-se H 0 : = 0 .
Vamos admitir, agora, que a srie de 4 valores de Yt foi gerada pelo modelo
(10.14). Um procedimento apropriado para obter a estimativa de calcular os valores
de Z t = Yt (que so 1, 6 e 2) e, de acordo com (10.19), obter sua mdia:

b=Z =

9
=3
3

(10.24)

Pode-se verificar que o mesmo resultado obtido utilizando a expresso (10.20).


A estimativa de a2 dada por

z 2 14
s =
=
=7
2
2
2

(10.25)

Lembrando a frmula para varincia de uma mdia, obtemos


7
V (b) =
3

(10.26)

Para testar H 0 : = 0 , calculamos

t=

3
7
3

= 1,964

(10.27)

O resultado no significativo. No se rejeita H 0 : = 0 .


interessante verificar que o mesmo resultado obtido ajustando uma regresso
linear simples de Yt contra t, mas tomando o cuidado de utilizar as frmulas de
mnimos quadrados generalizados, respeitando a estrutura da matriz de varincias e
covarincias dos erros u t do modelo (10.15) [Ver (10.17)]. Temos

361

1
1
X=
1

1
1

1
2
W=
1
3

4
1

1
2
2

1
2
3

1
2
3

Verifica-se que

W 1

2
1
=
0

1
XW 1 X =
1

1
2

0
1

1
0

2
1

0
0
1

1
1 4
( X W 1 X) 1 =

4
3 1

1
1

10
7
XW 1y = b = ( XW 1 X) 1 XW 1 y =
19
3
s2 =

1
1
( y W 1 y b X W 1 y ) = (141 127) = 7
n2
2

A estimativa de igual a 3, reproduzindo o resultado obtido em (10.24), e a


estimativa da respectiva varincia 7/3, reproduzindo o resultado obtido em (10.26).
bvio que para testar H 0 : = 0 seria obtido o mesmo valor j calculado em (10.27).
claro que a estimao de por mnimos quadrados generalizados uma
complicao desnecessria. O mtodo anterior, baseado nas diferenas Yt , muito
mais simples. A finalidade da exposio foi deixar claro que quando se estima o
parmetro no modelo (10.15) fazendo uma regresso por mnimos quadrados
ordinrios o erro consiste em utilizar um procedimento inapropriado estrutura dos
erros u t , no havendo nenhuma incompatibilidade entre a anlise de sries temporais e
o mtodo de mnimos quadrados ou outros procedimentos clssicos da econometria.

10.8. Transformando modelos AR em modelos MA e vice-versa


O modelo de um processo auto-regressivo de primeira ordem pode ser escrito
como
(1 B)Yt = + a t

(10.28)

362

Se esse processo for estacionrio, isto , se < 1 , de acordo com a expresso


(10.7) ele pode ser escrito como
Yt =

+ a t + at 1 + 2 at 2 + K

(10.29)

Pode-se verificar que isso o modelo de um MA de ordem infinita, com


coeficientes que so todos potncias de .
A passagem de (10.28) para (10.29) foi feita anteriormente por meio de
sucessivas substituies e manipulaes algbricas. Ela pode ser feita mais rapidamente
considerando que podemos dividir os dois membros de (10.28) por 1 B e que
1
= 1 + B + 2 B 2 + 3 B 3 + K
1 B

(10.30)

Note-se que essa expresso anloga frmula do limite da soma de uma


progresso geomtrica com razo menor do que 1:
a
= a + aq + aq 2 + aq 3 + K
1 q

(10.31)

Cabe ressaltar que a relao (10.31) no permite concluir que a relao (10.30)
correta, pois B um operador, e no uma grandeza algbrica. Pode-se verificar,
entretanto, que, a relao (10.30) vlida sempre que < 1 .
Sabemos que um MA(1) pode ser escrito como
Yt = + (1 B ) at

(10.32)

Se < 1 , podemos dividir todos os termos por 1 B , obtendo


(1 + B + 2 B 2 + K)Yt =

+ at

(10.33)

Esse resultado mostra que um MA(1) um AR de ordem infinita cujos


coeficientes so todos potncias de .
Um MA(1) com < 1 denominado invertvel. H uma clara simetria formal
entre a condio para estacionariedade de um AR(1) e a condio de invertibilidade de
um MA(1).

363

10.9. Raiz unitria e modelos ARIMA


Consideremos, novamente, o modelo de um AR(1):
(1 B)Yt = + a t
Vamos considerar a expresso que multiplica Yt como um polinmio em B e
definir a equao caracterstica
1 B = 0

A raiz dessa equao


B=

Sabemos que o AR(1) estacionrio apenas quando < 1 . Em outras palavras,


um AR(1) estacionrio se, e somente se, a raiz da respectiva equao caracterstica ,
em mdulo, maior do que 1.
Para um AR(2) a equao caracterstica
1 1 B 2 B 2 = 0
Neste caso as razes podem ser nmeros complexos e pode-se provar que a
condio de estacionariedade que as duas razes estejam fora do crculo unitrio (na
representao geomtrica dos nmeros complexos h vi em que h e v so,
respectivamente, a abscissa e a ordenada do ponto em um sistema de eixos cartesianos
ortogonais).
Genericamente, a condio de estacionariedade de um AR(p) que todas as
razes da equao caracterstica ( B ) = 0 estejam fora do crculo unitrio.
Analogamente, um MA(q) invertvel se, e somente se, todas as razes da
equao caracterstica ( B ) = 0 estiverem fora do crculo unitrio.
Um caso especial de grande interesse a existncia de uma raiz unitria. O
AR(1) com raiz unitria o passeio aleatrio com deslocamento analisado na seo
anterior. Vimos que esse modelo exige procedimentos estatsticos especficos,
passando-se a utilizar as diferenas Yt = Yt Yt 1 . Sempre que uma srie Yt for no-

364

estacionria mas as diferenas Z t = Yt formarem uma srie estacionria, dizemos que


a srie Yt integrada de primeira ordem ou I(1). Se a srie Z t = Yt tambm for noestacionria e a srie Z t = 2Yt for estacionria, dizemos que a srie Yt integrada de
segunda ordem ou I(2), e assim por diante. Uma srie estacionria I(0).
Se aps d diferenas obtemos uma srie que um ARMA(p, q), a srie original
um ARIMA (p, d, q).
O modelo de um ARIMA (1, 1, 1), por exemplo,
(1 B)Yt = + (1 B)a t
ou
(1 B)(1 B)Yt = + (1 B)a t

(10.34)

10.10. Funo de autocorrelao


Dada uma srie temporal Yt , sua autocorrelao com defasagem k

k =

cov(Yt , Yt k )
V (Yt )V (Yt k )

(10.35)

Para uma srie estacionria a covarincia entre Yt e Yt k no depende de t e ser


indicada por k , e a varincia, que constante, ser indicada por 0 . Ento a
autocorrelao com defasagem k fica

k =

k
0

(10.36)

A funo de autocorrelao da srie mostra como k varia com a defasagem k.


Para um processo AR(1) estacionrio, substituindo (10.9) e (10.10) em (10.36),
obtemos

k = k ,

(10.37)

mostrando que neste caso o valor absoluto da autocorrelao cai exponencialmente com
a defasagem .
Para um processo MA(1)

365

Yt = + at a t 1
verifica-se que 0 = (1 + 2 ) a2 , 1 = a2 e k = 0 para k > 1. Ento

1 =

e k = 0 para k > 1
1+ 2

(10.38)

Generalizando, pode-se demonstrar que para um MA(q) apenas as q primeiras


autocorrelaes so diferentes de zero.
Na anlise de uma srie temporal observada, usual calcular as estimativas das
autocorrelaes. Indicando a estimativa de k por ck e a estimativa de k por rk ,
temos

ck
,
c0

(10.39)

1 n
(Yt Y )(Yt k Y )
n t = k +1

(10.40)

rk =

com
ck =

onde Y a mdia dos valores de Yt na amostra.


As autocorrelaes estimadas podem ser utilizadas para identificar o processo
que deu origem srie observada. Se, por exemplo, apenas r1 for claramente diferente
de zero, o processo deve ser um MA(1).
Se os valores de rk diminuem muito lentamente com k, isso indica que deve
haver uma raiz unitria. Entretanto, quanto mais curta a srie disponvel, mais
rapidamente diminuem os valores de rk , mesmo que a srie tenha uma raiz unitria. Na
prtica, pode ser impossvel distinguir um passeio aleatrio de um AR(1) cujo
parmetro menor, mas prximo de 1.

366

10.11. Os testes de Dickey-Fuller


O AR(1) definido por (10.1) pode ser escrito como

Yt = + ( 1)Yt 1 + at
Fazendo 1 = , obtemos

Yt = + Yt 1 + at

(10.41)

Ento a hiptese de que = 1 corresponde hiptese de que = 0 , e < 1


corresponde a < 0 . O teste de Dickey-Fuller consiste em fazer uma regresso de Yt
contra Yt 1 e calcular, da maneira usual, o valor de t referente hiptese H 0 : = 0 .
Mas, dadas as caractersticas especiais da varivel Yt quando = 1 , os valores crticos
para esse teste no so os da distribuio de t de Student. Para distinguir esse teste do t
usual, comum indic-lo com a letra grega .
H trs verses do teste de Dickey-Fuller:
a) Teste , quando se considera que a relao entre Yt e Yt 1 no tem termo
constante:

Yt = Yt 1 + at

(10.42)

b) Teste , quando se considera a relao (10.41).


c) Teste , quando includa uma tendncia linear no tempo:

Yt = + t + Yt 1 + at

(10.43)

Os valores crticos (com sinal negativo, para lembrar que se trata de teste
unilateral esquerda) so apresentados na tabela 10.2
TABELA 10.2. Valores crticos do teste de Dickey-Fuller
Modelo

Nvel de significncia
10%

5%

1%

Yt = Yt 1 + at

1,62

1,94

2,56

Yt = + Yt 1 + at

2,57

2,86

3,43

Yt = + t + Yt 1 + a t

3,13

3,41

3,96

Fonte: Davidson e Mackinnon (1993).

367

Vamos admitir que o modelo subjacente seja um AR(2):


(1 1 B 2 B 2 )Yt = + a t

(10.44)

Yt = + 1Yt 1 + 2Yt 2 + a t

(10.45)

ou

Se existir uma raiz unitria teremos 1 1 2 = 0 .


A equao (10.45) pode ser escrita como

Yt = + (1 + 2 1)Yt 1 + 2 Yt 1 + at
ou

Yt = + Yt 1 + 2 Yt 1 + at

(10.46)

Quando a equao ajustada inclui termos com valores defasados de Yt no


segundo membro, o teste da hiptese de que = 0 denominado teste de DickeyFuller aumentado (Augmented Dickey-Fuller test, ou ADF). Os valores crticos so os
mesmos j apresentados na tabela 10.2).

10.12. Modelo de correo de erro e co-integrao


Vamos considerar que temos duas variveis econmicas, Y1t e Y2t , estreitamente
associadas entre si, sendo que ambas so I(1), isto , so integradas de primeira ordem.
interessante imaginar que Y1t e Y2t sejam os logaritmos dos preos de dois produtos
substitutos prximos no consumo, como o preo, no varejo, da lata de leo de milho e
da lata de leo de arroz. Outra alternativa imaginar que se trata dos logaritmos dos
preos de um mesmo produto em dois mercados prximos, como, por exemplo, o preo
do feijo em Curitiba e em So Paulo. Nestes casos, embora tanto Y1t como Y2t sejam
sries no-estacionrias, a diferena entre elas est limitada pela relao econmica
entre ambas. Se uma delas subir ela puxa a outra. A imagem fsica seria de um
elstico ou uma mola ligando as duas variveis.

368

Generalizando um pouco, vamos considerar duas variveis I(1) relacionadas pela


equao
Y2t = + Y1t + t

(10.47)

t = Y2t Y1t

(10.48)

Se o erro

for elevado, indicando que o valor de Y2t est relativamente elevado, Y2t tende a
diminuir e Y1t tende a aumentar. Considerando que esses efeitos se manifestam no
prximo perodo, temos

Y2t = 2 (Y2 ,t 1 Y1,t 1 ) + u 2t

(10.49)

Y1t = 1 (Y2 ,t 1 Y1,t 1 ) + u1t

(10.50)

com 2 < 0 e 1 > 0 .


As equaes (10.47), (10.49) e (10.50) constituem um exemplo simples de
modelo de correo de erro envolvendo duas variveis.
Como admitimos que Y1t e Y2t so variveis I(1), Y1t e Y2t so variveis
estacionrias. Se admitirmos, ainda, que u 2t e u1t so rudos brancos, podemos afirmar
que 2 t em (10.49) e 1 t em (10.50) so estacionrios, pois uma combinao linear
de variveis estacionrias sempre estacionria. Finalmente, se 1 0 ou 2 0
podemos concluir que t estacionrio, ou seja, uma varivel I(0).
Verifica-se, portanto, que o modelo de correo de erros descrito implica a
existncia de uma combinao linear entre variveis I(1) [a equao (10.48)] que I(0).
Dizemos, ento, que Y1t e Y2t so variveis co-integradas e que (10.48) [ou (10.47)] a
relao de co-integrao.
Cabe ressaltar que a incluso ou no do termo constante no afeta em nada a
anlise da estacionariedade das sries.
Podemos admitir que os valores de Y2t e Y1t tambm sejam afetados pelos
valores prvios dessas diferenas. Ento as equaes (10.49) e (10.50) seriam
substitudas por

Y2t = 2 (Y2,t 1 Y1,t 1 ) + 21 Y1,t 1 + 22 Y2 ,t 1 + u 2t

(10.51)

369

Y1t = 1 (Y2,t 1 Y1,t 1 ) + 11 Y1,t 1 + 12 Y2 ,t 1 + u1t

(10.52)

Como as diferenas defasadas tambm so estacionrias, sua incluso nas


equaes no altera a concluso anterior sobre a estacionariedade de t .
O exemplo analisado ilustra um caso particular de co-integrao. O conceito
mais geral e sua relao com os modelos de correo de erro foi rigorosamente
apresentado em artigo clssico de Engle e Granger (1987). Consideremos um processo
envolvendo k variveis ( Y1t , Y2t , K , Ykt ) e seja y t o vetor-coluna com os valores dessas
variveis no tempo t. Essas k variveis so integradas de ordem d, c se todas as k
variveis so I(d) e existe um vetor-coluna , com 0 , tal que y t I(d c), com c
> 0. Em outras palavras, a ordem de integrao da combinao linear y t menor do
que a ordem de integrao (d) das variveis em y t . O vetor denominado vetor de
co-integrao. No caso do modelo de correo de erro analisado anteriormente temos
d= 1 e c = 1.
Quando duas variveis so co-integradas, a relao de co-integrao pode ser
estimada pelo mtodo de mnimos quadrados ordinrios. Para testar se as variveis so
co-integradas devemos, inicialmente, verificar sua ordem de integrao. Vamos admitir
que testes de Dickey-Fuller tenham mostrado que as variveis Y1t e Y2t so I(1). Ento
elas so co-integradas se existe uma relao de co-integrao cujo erro ( t )
estacionrio. Como no dispomos dos valores desse erro, o teste feito com base nos
resduos da regresso de Y2t contra Y1t , que passamos a indicar por t . Da mesma
maneira que no teste de Dickey-Fuller, fazemos a regresso de t contra t 1 e
calculamos, da maneira usual, o valor de t referente hiptese de que o parmetro de

t 1 igual a zero. O resultado deve ser comparado com os valores crticos apresentados
na tabela 10.3. Note-se que esses valores crticos so diferentes daqueles que esto nas
duas ltimas linhas da tabela 10.2, pois neste caso a varivel utilizada para fazer o teste
j o resduo de uma regresso.

370

TABELA 10.3. Valores crticos para o teste da estacionariedade do erro de uma equao
de co-integrao de duas variveis, incluindo termo constante.
Equao incluindo
Constante
Constante e tendncia

Nvel de significncia
10%

5%

1%

3,04
3,50

3,34
3,78

3,90
4,32

Fonte: Davidson e Mackinnon (1993).

O fato de a varivel utilizada na equao estimada para obter o valor do teste ser
o resduo da possvel equao de co-integrao faz com que, para a realizao do teste,
seja indiferente (assintoticamente) que o termo constante tenha sido includo na
primeira ou na segunda equao, o mesmo valendo para a incluso de uma tendncia.
Para exemplificar, vamos considerar os valores fictcios de Y1t

e Y2t

apresentados na tabela 10.4.


TABELA 10.4. Sries de 24 valores consecutivos de Y1t e Y2t .
t

Y1t

Y2t

Y1t

Y2t

1
2
3
4
5
6
7
8
9
10
11
12

0,77
0,79
0,81
0,84
0,89
0,95
0,98
0,95
1,04
0,96
0,99
0,87

0,62
0,71
0,68
0,61
0,71
0,73
0,72
0,92
0,78
0,80
0,64
0,83

13
14
15
16
17
18
19
20
21
22
23
24

0,86
0,98
1,02
1,11
1,07
1,13
1,22
1,30
1,34
1,45
1,47
1,40

0,87
0,77
0,81
0,84
0,91
0,87
1,01
1,09
1,21
1,10
1,14
1,16

Para a srie Y1t os testes , e de Dickey-Fuller so 2,00, 0,32 e 1,64,


respectivamente. Trata-se de resultados claramente no-significativos (ver tabela 10.2),
no se podendo rejeitar a hiptese de que a srie dos Y1t tem raiz unitria. Repetindo os
testes para a srie dos Y1t obtemos = 3,88 , = 4,52 e = 4,42 , significativos
371

ao nvel de 1%, rejeitando-se a hiptese de raiz unitria na srie das diferenas. Concluise que Y1t uma srie I(1).
Para a srie Y2t obtemos = 0,91 , = 1,10 e = 3,11 , todos nosignificativos a 10%. J para a srie dos Y2t obtemos = 6,62 , = 6,96 e

= 6,90 , todos significativos a 1%. Conclumos que a srie Y2t tambm I(1).
Admitindo que haja co-integrao entre as duas variveis, estimamos, pelo
mtodo de mnimos quadrados ordinrios, a seguinte equao (testes t entre parnteses,
abaixo do coeficiente):
Y2t = 0,06289 0,75508 Y1t
( 0 , 73 )

( 9 , 36 )

Para a srie de 24 desvios ( t ) dessa regresso obtemos = 5,66 , significativo


ao nvel de 1% (ver tabela 10.3), o que permite concluir que esses desvios so
estacionrios. Tendo em vista que j havamos verificado que as sries Y1t e Y2t so
I(1), conclumos que Y1t e Y2t so co-integradas.
Considerando a verso mais simples do modelo de correo de erro descrito no
incio dessa seo (mas incluindo um termo constante nas equaes), estimamos as
seguintes equaes:

Y1t = 0,028+ 0,486 t


( 2 , 76 )

( 3, 78 )

Y2t = 0,022 0,822 t


(1, 46 )

( 4 , 33 )

Cabe ressaltar que a natureza artificial dos dados desse exemplo fez com que os
diversos testes conduzissem claramente construo de um modelo de correo de
erros. Na prtica, os resultados geralmente no so to evidentes e a construo de um
modelo apropriado vai depender bastante do discernimento do pesquisador, combinando
o conhecimento de tcnicas estatsticas, de teoria econmica e das qualidades e
limitaes dos dados utilizados.
372

Exerccios
10.1. Admite-se que a varivel Yt um passeio aleatrio com deslocamento:
Yt = Yt 1 + + t ,
sendo uma constante e t um rudo branco. fornecida uma srie de 9 valores
consecutivos de Yt : 6, 5, 10, 18, 22, 22, 31, 36 e 46.
a) Teste, ao nvel de significncia de 5%, a hiptese de que = 0.
b) Teste, ao nvel de significncia de 5%, a hiptese de que = 3.
10.2. dada uma srie de 5 valores consecutivos de Yt : 17, 20, 32, 38 e 41.
Admite-se que esses valores foram gerados pelo modelo
Yt = Yt 1 + + t ,
sendo t um rudo branco com varincia 2 .
a) Estime .
b) Estime 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese de que = 0 , contra a
hiptese alternativa de que > 0 .
10.3. Admite-se que a varivel Yt um passeio aleatrio com deslocamento:
Yt = Yt 1 + + t ,

(1)

onde uma constante e t um rudo branco.


O modelo (1) permite deduzir que Yt varia no tempo de acordo com a equao
Yt = + t + u t
Se 2 a varincia de t e u o vetor-coluna dos valores de u t , tem-se
E (uu ) = V 2 .
dada uma srie de 9 valores consecutivos de Yt (para t = 1, 2, ..., 9): 12, 12, 18,
27, 32, 33, 43, 49 e 60.
a) Quais os valores dos elementos v 22 e v 48 da matriz V?
b) Determine a estimativa linear no-tendenciosa de varincia mnima de .
c) Teste, ao nvel de significncia de 1% a hiptese de que = 0.
d) Teste, ao nvel de significncia de 5% a hiptese de que = 5.
373

10.4. Sendo at um rudo branco, verifique, para cada um dos modelos a seguir, se ele
gera um processo estacionrio ou no, justificando sumariamente sua resposta:
a) Yt = 18 2,3Yt 1 + a t
b) Yt = 144 + a t + 2at 1
c) Yt = 0,9Yt 1 + at
d) Yt = 7 + Yt 1 + a t
e) Yt = 11 + 1,8Yt 1 0,8Yt 2 + a1
Mostre, inicialmente, que essa equao pode ser escrita como
(1 0,8 B)(1 B)Yt = 11 + at
10.5. So dadas as sries de 24 valores consecutivos das variveis Y1t e Y2t :

Y1t

Y2t

Y1t

Y2t

44

99

13

47

95

56

90

14

26

96

60

103

15

41

81

64

105

16

38

105

53

108

17

51

103

71

108

18

57

119

60

100

19

51

131

59

98

20

60

116

37

107

21

73

115

10

54

99

22

61

124

11

49

106

23

61

136

12

48

104

24

71

132

a) Usando um programa para computador apropriado, faa os testes de Dickey-Fuller


para verificar se a srie Y1t tm uma raiz unitria.
b) Idem, para a srie Y1t .
c) Idem, para as sries Y2t e Y2t .
d) O que se pode concluir sobre a ordem de integrao das sries Y1t e Y2t ?
e) Estime a equao Y2t = + t + Y1t + t e verifique se esta uma relao de cointegrao.

374

Respostas
10.1 a) b = 5, s 2 (b) = 2 , t = 3,536, significativo ( t 0 = 2,365 )
b) t = 1,414, no-significativo ( t 0 = 2,365 )
10.2. a) b = 6
b) s 2 = 18
c) t = 2,828, significativo (regio de rejeio: t 2,353)
10.3. a) v 22 = 2 e v 48 = 4
b) b = 6
c) t = 4,243, significativo ( t 0 = 3,499 )
d) t = 0,707, no-significativo ( t 0 = 1,895 )
10.4. a) No-estacionrio: AR(1) com | |>1.
b) Estacionrio: MA(1).
c) Estacionrio: AR(1) com | |<1.
d) No-estacionrio: passeio aleatrio com deslocamento ou AR(1) com =1.
e) No-estacionrio: tem raiz unitria.
10.5.a) = 0,03 , = 2,53 e = 2,48 , no-significativos.
b) = 7,32 , = 7,20 e = 7,08 , todos significativos a 1%.
c) Para Y2t : = 0,51 , = 1,44 e = 2,38 , no-significativos
Para Y2t : = 6,10 , = 6,24 e = 6,12 , significativos a 1%
d) Tanto Y1t como Y2t so I(1).
e) Y2t = 69,09 + 1,128t + 0,4517Y1t , com R 2 = 0,562 .
Para a srie dos desvios dessa regresso obtm-se = 5,05 . Como o valor
crtico ao nvel de 1%, na tabela 10.3, 4,32, conclui-se que Y1t e Y2t so
sries co-integradas.

375

APNDICE
TABELA I. Distribuio de t de Student. Valor crtico t 0 tal que

P(t > t 0 ) = P(t < t 0 ) = / 2

Nmero de
Graus de
Liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

Nvel de significncia para o teste bilateral ()


0,20

0,10

0,05

0,02

0,01

0,005

3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,296
1,289
1,282

6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,671
1,658
1,645

12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,000
1,980
1,960

31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,390
2,358
2,326

63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,660
2,617
2,576

127,32
14,089
7,453
5,598
4,773
4,317
4,029
3,832
3,690
3,581
3,497
3,428
3,372
3,326
3,286
3,252
3,222
3,197
3,174
3,153
3,135
3,119
3,104
3,090
3,078
3,067
3,056
3,047
3,038
3,030
2,971
2,915
2,860
2,807

Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Theil (1971), p. 717, e Hoel (1968), p. 295.

376

TABELA II. Distribuio de qui-quadrado. Valor crtico 02 tal que


Nmero de
Graus de
Liberdade
(k)
1
2
3
4
5

P ( k2 > 02 ) =

0,995

0,975

0,050

0,025

0,010

0,005

3927.108
0,010025
0,07172
0,2070
0,4117

9821.107
0,05064
0,2158
0,4844
0,8312

3,841
5,991
7,815
9,488
11,07

5,024
7,378
9,348
11,14
12,83

6,635
9,210
11,34
13,28
15,09

7,879
10,60
12,84
14,86
16,75

6
7
8
9
10

0,6757
0,9893
1,344
1,735
2,156

1,237
1,690
2,180
2,700
3,247

12,59
14,07
15,51
16,92
18,31

14,45
16,01
17,53
19,02
20,48

16,81
18,48
20,09
21,67
23,21

18,55
20,28
21,96
23,59
25,19

11
12
13
14
15

2,603
3,074
3,565
4,075
4,601

3,816
4,404
5,009
5,629
6,262

19,68
21,03
22,36
23,68
25,00

21,92
23,34
24,74
26,12
27,49

24,72
26,22
27,69
29,14
30,58

26,76
28,30
29,82
31,32
32,80

16
17
18
19
20

5,142
5,697
6,265
6,844
7,434

6,908
7,564
8,231
8,907
9,591

26,30
27,59
28,87
30,14
31,41

28,85
30,19
31,53
32,85
34,17

32,00
33,41
34,81
36,19
37,57

34,27
35,72
37,16
38,58
40,00

21
22
23
24
25

8,034
8,643
9,260
9,886
10,52

10,28
10,98
11,69
12,40
13,12

32,67
33,92
35,17
36,42
37,65

35,48
36,78
38,08
39,36
40,65

38,93
40,29
41,64
42,98
44,31

41,40
42,80
44,18
45,56
46,93

26
27
28
29
30
40
50
60
70
80
90
100

11,16
11,81
12,46
13,12
13,79
20,71
27,99
35,53
43,28
51,17
59,20
67,33

13,84
14,57
15,31
16,05
16,79
24,43
32,36
40,48
48,76
57,15
65,65
74,22

38,89
40,11
41,34
42,56
43,77
55,76
67,50
79,08
90,53
101,9
113,1
124,3

41,92
43,19
44,46
45,72
46,98
59,34
71,42
83,30
95,02
106,6
118,1
129,6

45,64
46,96
48,28
49,59
50,89
63,69
76,15
88,38
100,4
112,3
124,1
135,8

48,29
49,64
50,99
52,34
53,67
66,77
79,49
91,95
104,2
116,3
128,3
140,2

Fonte: Theil (1971), p. 718-719.

377

TABELA III Distribuio de F. Valor crtico F0 tal que P( F > F0 ) = 0,01 .


No de graus de
Nmero de graus de liberdade do numerador
liberdade do
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120

denominador
1
4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2
98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3
34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
4
21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
5
16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
9,89
9,72
9,55
9,47
9,38
9,29
9,20
9,11
9,02
6
7
8
9
10

13,75
12,25
11,26
10,56
10,04

10,92
9,55
8,65
8,02
7,56

9,78
8,45
7,59
6,99
6,55

9,15
7,85
7,01
6,42
5,99

8,75
7,46
6,63
6,06
5,64

8,47
7,19
6,37
5,80
5,39

8,26
6,99
6,18
5,61
5,20

8,10
6,84
6,03
5,47
5,06

7,98
6,72
5,91
5,35
4,94

7,87
6,62
5,81
5,26
4,85

7,72
6,47
5,67
5,11
4,71

7,56
6,31
5,52
4,96
4,56

7,40
6,16
5,36
4,81
4,41

7,31
6,07
5,28
4,73
4,33

7,23
5,99
5,20
4,65
4,25

7,14
5,91
5,12
4,57
4,17

7,06
5,82
5,03
4,48
4,08

6,97
5,74
4,95
4,40
4,00

6,88
5,65
4,86
4,31
3,91

11
12
13
14
15

9,65
9,33
9,07
8,86
8,68

7,21
6,93
6,70
6,51
6,36

6,22
5,95
5,74
5,56
5,42

5,67
5,41
5,21
5,04
4,89

5,32
5,06
4,86
4,69
4,56

5,07
4,82
4,62
4,46
4,32

4,89
4,64
4,44
4,28
4,14

4,74
4,50
4,30
4,14
4,00

4,63
4,39
4,19
4,03
3,89

4,54
4,30
4,10
3,94
3,80

4,40
4,16
3,96
3,80
3,67

4,25
4,01
3,82
3,66
3,52

4,10
3,86
3,66
3,51
3,37

4,02
3,78
3,59
3,43
3,29

3,94
3,70
3,51
3,35
3,21

3,86
3,62
3,43
3,27
3,13

3,78
3,54
3,34
3,18
3,05

3,69
3,45
3,25
3,09
2,96

3,60
3,36
3,17
3,00
2,87

16
17
18
19
20

8,53
8,40
8,29
8,18
8,10

6,23
6,11
6,01
5,93
5,85

5,29
5,18
5,09
5,01
4,94

4,77
4,67
4,58
4,50
4,43

4,44
4,34
4,25
4,17
4,10

4,20
4,10
4,01
3,94
3,87

4,03
3,93
3,84
3,77
3,70

3,89
3,79
3,71
3,63
3,56

3,78
3,68
3,60
3,52
3,46

3,69
3,59
3,51
3,43
3,37

3,55
3,46
3,37
3,30
3,23

3,41
3,31
3,23
3,15
3,09

3,26
3,16
3,08
3,00
2,94

3,18
3,08
3,00
2,92
2,86

3,10
3,00
2,92
2,84
2,78

3,02
2,92
2,84
2,76
2,69

2,93
2,83
2,75
2,67
2,61

2,84
2,75
2,66
2,58
2,52

4,75
2,65
2,57
2,49
2,42

21
22
23
24
25

8,02
7,95
7,88
7,82
7,77

5,78
5,72
5,66
5,61
5,57

4,87
4,82
4,76
4,72
4,68

4,37
4,31
4,26
4,22
4,18

4,04
3,99
3,94
3,90
3,85

3,81
3,76
3,71
3,67
3,63

3,64
3,59
3,54
3,50
3,46

3,51
3,45
3,41
3,36
3,32

3,40
3,35
3,30
3,26
3,22

3,31
3,26
3,21
3,17
3,13

3,17
3,12
3,07
3,03
2,99

3,03
2,98
2,93
2,89
2,85

2,88
2,83
2,78
2,74
2,70

2,80
2,75
2,70
2,66
2,62

2,72
2,67
2,62
2,58
2,54

2,64
2,58
2,54
2,49
2,45

2,55
2,50
2,45
2,40
2,36

2,46
2,40
2,35
2,31
2,27

2,36
2,31
2,26
2,21
2,17

7,56
5,39
4,51
4,02
3,70
3,47
3,30
3,17
3,07
2,98
2,84
7,31
5,18
4,31
3,83
3,51
3,29
3,12
2,99
2,89
2,80
2,66
7,08
4,98
4,13
3,65
3,34
3,12
2,95
2,82
2,72
2,63
2,50
6,85
4,79
3,95
3,48
3,17
2,96
2,79
2,66
2,56
2,47
2,34
6,63
4,61
3,78
3,32
3,02
2,80
2,64
2,51
2,41
2,32
2,18

Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Christ (1966, p. 671) e Pimentel Gomes (1966, p. 408-409).

2,70
2,52
2,35
2,19
2,04

2,55
2,37
2,20
2,03
1,88

2,47
2,29
2,12
1,95
1,79

2,39
2,20
2,03
1,86
1,70

2,30
2,11
1,94
1,76
1,59

2,21
2,02
1,84
1,66
1,47

2,11
1,92
1,73
1,53
1,32

2,01
1,80
1,60
1,38
1,00

30
40
60
120

378

TABELA IV Distribuio de F. Valor crtico F0 tal que P( F > F0 ) = 0,05 .


No de graus de
Nmero de graus de liberdade do numerador
liberdade do
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120

denominador
1
161
200
216
225
230
234
237
239
241
242
244
246
248
249
250
251
252
253
254
2
18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3
10,13
9,55
9,28
9,12
9,01
8,94
8,89
8,85
8,81
8,79
8,74
8,70
8,66
8,64
8,62
8,59
8,57
8,55
8,53
4
7,71
6,94
6,59
6,39
6,26
6,16
6,09
6,04
6,00
5,96
5,91
5,86
5,80
5,77
5,75
5,72
5,69
5,66
5,63
5
6,61
5,79
5,41
5,19
5,05
4,95
4,88
4,82
4,77
4,74
4,68
4.62
4,56
4,53
4,50
4,46
4,43
4,40
4,36
6
7
8
9
10

5,99
5,59
5,32
5,12
4,96

5,14
4,74
4,46
4,26
4,10

4,76
4,35
4,07
3,86
3,71

4,53
4,12
3,84
3,63
3,48

4,39
3,97
3,69
3,48
3,33

4,28
3,87
3,58
3,37
3,22

4,21
3,79
3,50
3,29
3,14

4,15
3,73
3,44
3,23
3,07

4,10
3,68
3,39
3,18
3,02

4,06
3,64
3,35
3,14
2,98

4,00
3,57
3,28
3,07
2,91

3,94
3,51
3,22
3,01
2,85

3,87
3,44
3,15
2,94
2,77

3,84
3,41
3,12
2,90
2,74

3,81
3,38
3,08
2,86
2,70

3,77
3,34
3,04
2,83
2,66

3,74
3,30
3,01
2,79
2,62

3,70
3,27
2,97
2,75
2,58

3,67
3,23
2,93
2,71
2,54

11
12
13
14
15

4,84
4,75
4,67
4,60
4,54

3,98
3,89
3,81
3,74
3,68

3,59
3,49
3,41
3,34
3,29

3,36
3,26
3,18
3,11
3,06

3,20
3,11
3,03
2,96
2,90

3,09
3,00
2,92
2,85
2,79

3,01
2,91
2,83
2,76
2,71

2,95
2,85
2,77
2,70
2,64

2,90
2,80
2,71
2,65
2,59

2,85
2,75
2,67
2,60
2,54

2,79
2,69
2,60
2,53
2,48

2,72
2,62
2,53
2,46
2,40

2,65
2,54
2,46
2,39
2,33

2,61
2,51
2,42
2,35
2,29

2,57
2,47
2,38
2,31
2,25

2,53
2,43
2,34
2,27
2,20

2,49
2,38
2,30
2,22
2,16

2,45
2,34
2,25
2,18
2,11

2,40
2,30
2,21
2,13
2,07

16
17
18
19
20

4,49
4,45
4,41
4,38
4,35

3,63
3,59
3,55
3,52
3,49

3,24
3,20
3,16
3,13
3,10

3,01
2,96
2,93
2,90
2,87

2,85
2,81
2,77
2,74
2,71

2,74
2,70
2,66
2,63
2,60

2,66
2,61
2,58
2,54
2,51

2,59
2,55
2,51
2,48
2,45

2,54
2,49
2,46
2,42
2,39

2,49
2,45
2,41
2,38
2,35

2,42
2,38
2,34
2,31
2,28

2,35
2,31
2,27
2,23
2,20

2,28
2,23
2,19
2,16
2,12

2,24
2,19
2,15
2,11
2,08

2,19
2,15
2,11
2,07
2,04

2,15
2,10
2,06
2,03
1,99

2,11
2,06
2,02
1,98
1,95

2,06
2,01
1,97
1,93
1,90

2,01
1,96
1,92
1,88
1,84

21
22
23
24
25

4,32
4,30
4,28
4,26
4,24

3,47
3,44
3,42
2,40
3,39

3,07
3,05
3,03
3,01
2,99

2,84
2,82
2,80
2,78
2,76

2,68
2,66
2,64
2,62
2,60

2,57
2,55
2,53
2,51
2,49

2,49
2,46
2,44
2,42
2,40

2,42
2,40
2,37
2,36
2,34

2,37
2,34
2,32
2,30
2,28

2,32
2,30
2,27
2,25
2,24

2,25
2,23
2,20
2,18
2,16

2,18
2,15
2,13
2,11
2,09

2,10
2,07
2,05
2,03
2,01

2,05
2,03
2,01
1,98
1,96

2,01
1,98
1,96
1,94
1,92

1,96
1,94
1,91
1,89
1,87

1,92
1,89
1,86
1,84
1,82

1,87
1,84
1,81
1,79
1,77

1,81
1,78
1,76
1,73
1,71

4,17
3,32
2,92
2,69
2,53
2,42
2,33
2,27
2,21
2,16
2,09
4,08
3,23
2,84
2,61
2,45
2,34
2,25
2,18
2,12
2,08
2,00
4,00
3,15
2,76
2,53
2,37
2,25
2,17
2,10
2,04
1,99
1,92
3,92
3,07
2,68
2,45
2,29
2,17
2,09
2,02
1,96
1,91
1,83
3,84
3,00
2,60
2,37
2,21
2,10
2,01
1,94
1,88
1,83
1,75

Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Christ (1966, p. 670) e Pimentel Gomes (1966, p. 406-407).

2,01
1,92
1,84
1,75
1,67

1,93
1,84
1,75
1,66
1,57

1,89
1,79
1,70
1,61
1,52

1,84
1,74
1,65
1,55
1,46

1,79
1,69
1,59
1,50
1,39

1,74
1,64
1,53
1,43
1,32

1,68
1,58
1,47
1,35
1,22

1,62
1,51
1,39
1,25
1,00

30
40
60
120

379

Tabela V. Distribuio de F. Valor crtico F0 tal que P( F > F0 ) = 0,10 .


No de graus de
liberdade do
denominador

Nmero de graus de liberdade do numerador


1

10

12

15

20

24

30

40

60

120

1
2
3
4

39,9
8,53
5,54
4,54

49,5
9,00
5,46
4,32

53,6
9,16
5,39
4,19

55,8
9,24
5,34
4,11

57,2
9,29
5,31
4,05

58,2
9,33
5,28
4,01

58,9
9,35
5,27
3,98

59,4
9,37
5,25
3,95

59,9
9,38
5,24
3,94

60,2
9,39
5,23
3,92

60,7
9,41
5,22
3,90

61,2
9,42
5,20
3,87

61,7
9,44
5,18
3,84

62,0
9,45
5,18
3,83

62,3
9,46
5,17
3,82

62,5
9,47
5,16
3,80

62,8
9,47
5,15
3,79

63,1
9,48
5,14
3,78

63,3
9,49
5,13
3,76

5
6
7
8
9

4,06
3,78
3,59
3,46
3,36

3,78
3,46
3,26
3,11
3,01

3,62
3,29
3,07
2,92
2,81

3,52
3,18
2,96
2,81
2,69

3,45
3,11
2,88
2,73
2,61

3,40
3,05
2,83
2,67
2,55

3,37
3,01
2,78
2,62
2,51

3,34
2,98
2,75
2,59
2,47

3,32
2,96
2,72
2,56
2,44

3,30
2,94
2,70
2,54
2,42

3,27
2,90
2,67
2,50
2,38

3,24
2,87
2,63
2,46
2,34

3,21
2,84
2,59
2,42
2,30

3,19
2,82
2,58
2,40
2,28

3,17
2,80
2,56
2,38
2,25

3,16
2,78
2,54
2,36
2,23

3,14
2,76
2,51
2,34
2,21

3,12
2,74
2,49
2,32
2,18

3,10
2,72
2,47
2,29
2,16

10
11
12
13
14

3,29
3,23
3,18
3,14
3,10

2,92
2,86
2,81
2,76
2,73

2,73
2,66
2,61
2,56
2,52

2,61
2,54
2,48
2,43
2,39

2,52
2,45
2,39
2,35
2,31

2,46
2,39
2,33
2,28
2,24

2,41
2,34
2,28
2,23
2,19

2,38
2,30
2,24
2,20
2,15

2,35
2,27
2,21
2,16
2,12

2,32
2,25
2,19
2,14
2,10

2,28
2,21
2,15
2,10
2,05

2,24
2,17
2,10
2,05
2,01

2,20
2,12
2,06
2,01
1,96

2,18
2,10
2,04
1,98
1,94

2,16
2,08
2,01
1,96
1,91

2,13
2,05
1,99
1,93
1,89

2,11
2,03
1,96
1,90
1,86

2,08
2,00
1,93
1,88
1,83

2,06
1,97
1,90
1,85
1,80

15
16
17
18
19

3,07
3,05
3,03
3,01
2,99

2,70
2,67
2,64
2,62
2,61

2,49
2,46
2,44
2,42
2,40

2,36
2,33
2,31
2,29
2,27

2,27
2,24
2,22
2,20
2,18

2,21
2,18
2,15
2,13
2,11

2,16
2,13
2,10
2,08
2,06

2,12
2,09
2,06
2,04
2,02

2,09
2,06
2,03
2,00
1,98

2,06
2,03
2,00
1,98
1,96

2,02
1,99
1,96
1,93
1,91

1,97
1,94
1,91
1,89
1,86

1,92
1,89
1,86
1,84
1,81

1,90
1,87
1,84
1,81
1,79

1,87
1,84
1,81
1,78
1,76

1,85
1,81
1,78
1,75
1,73

1,82
1,78
1,75
1,72
1,70

1,79
1,75
1,72
1,69
1,67

1,76
1,72
1,69
1,66
1,63

20
21
22
23
24

2,97
2,96
2,95
2,94
2,93

2,59
2,57
2,56
2,55
2,54

2,38
2,36
2,35
2,34
2,33

2,25
2,23
2,22
2,21
2,19

2,16
2,14
2,13
2,11
2,10

2,09
2,08
2,06
2,05
2,04

2,04
2,02
2,01
1,99
1,98

2,00
1,98
1,97
1,95
1,94

1,96
1,95
1,93
1,92
1,91

1,94
1,92
1,90
1,89
1,88

1,89
1,88
1,86
1,84
1,83

1,84
1,83
1,81
1,80
1,78

1,79
1,78
1,76
1,74
1,73

1,77
1,75
1,73
1,72
1,70

1,74
1,72
1,70
1,69
1,67

1,71
1,69
1,67
1,66
1,64

1,68
1,66
1,64
1,62
1,61

1,64
1,62
1,60
1,59
1,57

1,61
1,59
1,57
1,55
1,53

25
26
27
28
29

2,92
2,91
2,90
2,89
2,89

2,53
2,52
2,51
2,50
2,50

2,32
2,31
2,30
2,29
2,28

2,18
2,17
2,17
2,16
2,15

2,09
2,08
2,07
2,06
2,06

2,02
2,01
2,00
2,00
1,99

1,97
1,96
1,95
1,94
1,93

1,93
1,92
1,91
1,90
1,89

1,89
1,88
1,87
1,87
1,86

1,87
1,86
1,85
1,84
1,83

1,82
1,81
1,80
1,79
1,78

1,77
1,76
1,75
1,74
1,73

1,72
1,71
1,70
1,69
1,68

1,69
1,68
1,67
1,66
1,65

1,66
1,65
1,64
1,63
1,62

1,63
1,61
1,60
1,59
1,58

1,59
1,58
1,57
1,56
1,55

1,56
1,54
1,53
1,52
1,51

1,52
1,50
1,49
1,48
1,47

30
40
60
120

2,88
2,84
2,79
2,75
2,71

2,49
2,44
2,39
2,35
2,30

2,28
2,23
2,18
2,13
2,08

2,14
2,09
2,04
1,99
1,94

2,05
2,00
1,95
1,90
1,85

1,98
1,93
1,87
1,82
1,77

1,93
1,87
1,82
1,77
1,72

1,88
1,83
1,77
1,72
1,67

1,85
1,79
1,74
1,68
1,63

1,82
1,76
1,71
1,65
1,60

1,77
1,71
1,66
1,60
1,55

1,72
1,66
1,60
1,55
1,49

1,67
1,61
1,54
1,48
1,42

1,64
1,57
1,51
1,45
1,38

1,61
1,54
1,48
1,41
1,34

1,57
1,51
1,44
1,37
1,30

1,54
1,47
1,40
1,32
1,24

1,50
1,42
1,35
1,26
1,17

1,46
1,38
1,29
1,19
1,00

Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Scheff (1959), p. 424-425.

380

ANLISE DE REGRESSO

Uma Introduo Econometria

Tabela VI. Valores crticos do teste de Durbin-Watson para o nvel de significncia de 5%.
No de
observaes
(n)
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100

Nmero de variveis explanatrias


k=2
k=3
k=4

k =1

k=5

dL

dU

dL

dU

dL

dU

dL

dU

dL

dU

1,08
1,10
1,13
1,16
1,18
1,20
1,22
1,24
1,26
1,27
1,29
1,30
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,43
1,44
1,48
1,50
1,53
1,55
1,57
1,58
1,60
1,61
1,62
1,63
1,64
1,65

1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,45
1,46
1,47
1,48
1,48
1,49
1,50
1,50
1,51
1,51
1,52
1,52
1,53
1,54
1,54
1,54
1,57
1,59
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,69

0,95
0,98
1,02
1,05
1,08
1,10
1,13
1,15
1,17
1,19
1,21
1,22
1,24
1,26
1,27
1,28
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,43
1,46
1,49
1,51
1,54
1,55
1,57
1,59
1,60
1,61
1,62
1,63

1,54
1,54
1,54
1,53
1,53
1,54
1,54
1,54
1,54
1,55
1,55
1,55
1,56
1,56
1,56
1,57
1,57
1,57
1,58
1,58
1,58
1,59
1,59
1,59
1,60
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,70
1,71
1,72

0,82
0,86
0,90
0,93
0,97
1,00
1,03
1,05
1,08
1,10
1,12
1,14
1,16
1,18
1,20
1,21
1,23
1,24
1,26
1,27
1,28
1,29
1,31
1,32
1,33
1,34
1,38
1,42
1,45
1,48
1,50
1,52
1,54
1,56
1,57
1,59
1,60
1,61

1,75
1,73
1,71
1,69
1,68
1,68
1,67
1,66
1,66
1,66
1,66
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,66
1,66
1,66
1,66
1,67
1,67
1,68
1,69
1,70
1,70
1,71
1,72
1,72
1,73
1,73
1,74

0,69
0,74
0,78
0,82
0,86
0,90
0,93
0,96
0,99
1,01
1,04
1,06
1,08
1,10
1,12
1,14
1,16
1,18
1,19
1,21
1,22
1,24
1,25
1,26
1,27
1,29
1,34
1,38
1,41
1,44
1,47
1,49
1,51
1,53
1,55
1,57
1,58
1,59

1,97
1,93
1,90
1,87
1,85
1,83
1,81
1,80
1,79
1,78
1,77
1,76
1,76
1,75
1,74
1,74
1,74
1,73
1,73
1,73
1,73
1,73
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,73
1,73
1,74
1,74
1,74
1,75
1,75
1,75
1,76

0,56
0,62
0,67
0,71
0,75
0,79
0,83
0,86
0,90
0,93
0,95
0,98
1,01
1,03
1,05
1,07
1,09
1,11
1,13
1,15
1,16
1,18
1,19
1,21
1,22
1,23
1,29
1,34
1,38
1,41
1,44
1,46
1,49
1,51
1,52
1,54
1,56
1,57

2,21
2,15
2,10
2,06
2,02
1,99
1,96
1,94
1,92
1,90
1,89
1,88
1,86
1,85
1,84
1,83
1,83
1,82
1,81
1,81
1,80
1,80
1,80
1,79
1,79
1,79
1,78
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,78
1,78
1,78

Fonte: Johnston (1972), p. 430.

381

ANLISE DE REGRESSO

Uma Introduo Econometria

Tabela VII. Valores crticos do teste de Durbin-Watson para o nvel de significncia de


1%.
No de
observaes
(n)
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100

Nmero de variveis explanatrias


k=2
k=3
k=4

k =1

k=5

dL

dU

dL

dU

dL

dU

dL

dU

dL

dU

0,81
0,84
0,87
0,90
0,93
0,95
0,97
1,00
1,02
1,04
1,05
1,07
1,09
1,10
1,12
1,13
1,15
1,16
1,17
1,18
1,19
1,21
1,22
1,23
1,24
1,25
1,29
1,32
1,36
1,38
1,41
1,43
1,45
1,47
1,48
1,50
1,51
1,52

1,07
1,09
1,10
1,12
1,13
1,15
1,16
1,17
1,19
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
1,31
1,32
1,32
1,33
1,34
1,34
1,38
1,40
1,43
1,45
1,47
1,49
1,50
1,52
1,53
1,54
1,55
1,56

0,70
0,74
0,77
0,80
0,83
0,86
0,89
0,91
0,94
0,96
0,98
1,00
1,02
1,04
1,05
1,07
1,08
1,10
1,11
1,13
1,14
1,15
1,16
1,18
1,19
1,20
1,24
1,28
1,32
1,35
1,38
1,40
1,42
1,44
1,46
1,47
1,49
1,50

1,25
1,25
1,25
1,26
1,26
1,27
1,27
1,28
1,29
1,30
1,30
1,31
1,32
1,32
1,33
1,34
1,34
1,35
1,36
1,36
1,37
1,38
1,38
1,39
1,39
1,40
1,42
1,45
1,47
1,48
1,50
1,52
1,53
1,54
1,55
1,56
1,57
1,58

0,59
0,63
0,67
0,71
0,74
0,77
0,80
0,83
0,86
0,88
0,90
0,93
0,95
0,97
0,99
1,01
1,02
1,04
1,05
1,07
1,08
1,10
1,11
1,12
1,14
1,15
1,20
1,24
1,28
1,32
1,35
1,37
1,39
1,42
1,43
1,45
1,47
1,48

1,46
1,44
1,43
1,42
1,41
1,41
1,41
1,40
1,40
1,41
1,41
1,41
1,41
1,41
1,42
1,42
1,42
1,43
1,43
1,43
1,44
1,44
1,45
1,45
1,45
1,46
1,48
1,49
1,51
1,52
1,53
1,55
1,56
1,57
1,58
1,59
1,60
1,60

0,49
0,53
0,57
0,61
0,65
0,68
0,72
0,75
0,77
0,80
0,83
0,85
0,88
0,90
0,92
0,94
0,96
0,98
1,00
1,01
1,03
1,04
1,06
1,07
1,09
1,10
1,16
1,20
1,25
1,28
1,31
1,34
1,37
1,39
1,41
1,43
1,45
1,46

1,70
1,66
1,63
1,60
1,58
1,57
1,55
1,54
1,53
1,53
1,52
1,52
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,51
1,52
1,52
1,52
1,53
1,54
1,55
1,56
1,57
1,58
1,59
1,60
1,60
1,61
1,62
1,63

0,39
0,44
0,48
0,52
0,56
0,60
0,63
0,66
0,70
0,72
0,75
0,78
0,81
0,83
0,85
0,88
0,90
0,92
0,94
0,95
0,97
0,99
1,00
1,02
1,03
1,05
1,11
1,16
1,21
1,25
1,28
1,31
1,34
1,36
1,39
1,41
1,42
1,44

1,96
1,90
1,85
1,80
1,77
1,74
1,71
1,69
1,67
1,66
1,65
1,64
1,63
1,62
1,61
1,61
1,60
1,60
1,59
1,59
1,59
1,59
1,59
1,58
1,58
1,58
1,58
1,59
1,59
1,60
1,61
1,61
1,62
1,62
1,63
1,64
1,64
1,65

Fonte: Johnston (1972), p. 431.

382

ANLISE DE REGRESSO

Uma Introduo Econometria

BIBLIOGRAFIA
AIGNER, D.J. (1971). Basic econometrics. New Jersey, Prentice-Hall.
ANGRIST, J.D.; PISCHKE, J.S. (2009). Mostly harmless econometrics: an empiricists
companion. Princeton University Press.
BARTLETT, M.S. (1949). Fitting a Straight Line when Both Variables are subject to
Error. Biometrics, 5: 207-242.
BOX, G.E.P.; JENKINS, G. M. e REINSEL, G.C. (1994) Time series analysis Forecasting and Control. 3a ed. New York, Prentice-Hall.
CARTER, H.O. e HARTLEY, H.O. (1958). A Variance Formula for Marginal Productivity
Estimates Using the Cobb-Douglas Function. Econometrica, 26: 306-313.
CASTRO, J. de (1961). Geopoltica da Fome: ensaio sobre os problemas de alimentao e
de populao do mundo.6 ed. So Paulo, Editora Brasiliense.
COCHRAN, W.G. (1965). Tcnicas de Amostragem. Rio de Janeiro, Fundo de Cultura.
CHRIST, C.F. (1966). Econometric Models and Methods. New York, John Wiley.
CROXTON, F.E. e COWDEN, D.J. (1955).

Apllied General Statistics. New York,

Prentice-Hall.
DAVIDSON, R e MACKINNON, J. (1993). Estimation and Inference in Econometrics.
New York, Oxford University Press.
DRAPER, N. e SMITH, H. (1966). Applied Regression Analysis. New York, John Wiley.
ENDERS, W. (1995). Applied Econometric Time Series. New York, John Wiley.
ENGLE, R.F. e GRANGER, W.J. (1987). Co-integration and Error Correction:
representation, estimation and testing. Econometrica, 55(2): 251-276.
GLEJSER, H. (1969). A New Test for Heteroscedasticity. J. Am. Statist. Assoc., 64: 316323.
GOLDFELD, S.M. e QUANDT, R.E. (1965). Some Tests for Homoscedasticity. J. Am.
Statist. Assoc., 60: 539-547.

383

ANLISE DE REGRESSO

Uma Introduo Econometria

GREENE, W.H. (2000). Econometric Analysis. 4a ed. Prentice-Hall.


HADLEY, G. (1967). Introduction to Probability and Statistical Decision Theory, San
Francisco, Holden-Day.
HEADY, E.O. e DILLON, J.L. (1961). Agricultural Production Functions. Ames, Iowa
State University Press.
HILL, R.C.; GRIFFITHS, W.E. e JUDGE, G.G. (2003). Econometria. 2a ed. So Paulo,
Editora Saraiva.
HOEL, P.G. (1962). Introduction to Mathematical Statistics, 3aed. New York, John Wiley.
HOEL, P.G. (1968). Estatstica Elementar, 2a ed. Rio de Janeiro, Fundo de Cultura.
HOFFMANN, R. (2006) Estatstica para economistas. 4a ed. rev. e ampl.. So Paulo,
Pioneira Thomson Learning.
HOOD, W.C. e KOOPMANS, T.C., ed. (1953). Studies in Econometric Method. New
Haven, Yale University Press.
HUANG, D.S. (1970). Regression and Econometric Methods. New York, John Wiley.
JOHNSTON, J. (1971). Mtodos Economtricos. So Paulo, Atlas.
JOHNSTON, J. (1972). Econometric Methods, 2a ed. New York, McGraw-Hill.
JOHNSTON, J. e DINARDO, J. (1997). Econometric Methods. 4a ed. McGraw-Hill.
KELEJIAN, H.H. e OATES, W.E. (1978). Introduo Econometria: Princpios e
aplicaes. Rio de Janeiro, Campus.
KMENTA, J. (1971). Elements of Econometrics. New York, McMillan.
LANGE, O. (1967). Introduo Econometria, 2a ed. Rio de Janeiro, Fundo de Cultura.
LTKEPOHL, H. (1991). Introduction to Multiple Time Series Analysis. Berlin, SpringerVerlag.
MADDALA, G.S. (1988). Introduction to Econometrics. New York, MacMillan.
MALINVAUD, E. (1970). Statistical Methods of Econometrics, 2a ed. Amsterdam, NorthHolland.

384

ANLISE DE REGRESSO

Uma Introduo Econometria

MARINHO, E.; ARAJO, J. (2010). Pobreza e o sistema de seguridade social rural no


Brasil. Revista Brasileira de Economia 64(2): 161-174.
MARINHO, E.; LINHARES, F.; CAMPELO, G. (2011). Os programas de transferncia de
renda do governo impactam a pobreza no Brasil? Revista Brasileira de Economia
65(3): 267-288.
MORETTIN, P.A. E TOLOI, C.M.C. (1985). Previso de Sries Temporais. So Paulo,
Atual Editora.
NERLOVE, M. (1958). The Dynamics of Supply: Estimation of Farmers Response to
Price. Balrimore, John Hopkins.
PEREZ, M.C.R.C. (1973). Contribuio ao Estudo da Elasticidade-renda do Consumo de
Alimentos. Piracicaba, ESALQ-USP (Dissertao de Mestrado).
PHILLIPS, P.C.B. e WICKENS, M.R. (1978). Exercises in Econometrics, volume two.
Oxford, Philip Allan Publishers.
PIMENTEL GOMES, F. (1966). Curso de Estatstica Experimental. 3a ed. Piracicaba,
ESALQ-USP.
PIMENTEL GOMES, F. e NOGUEIRA, I.R. (1964).

Regresso e Covarincia.

Piracicaba, ESALQ-USP (mimeografado).


SCHEFF, H. (1959). The Analysis of Variance. New York, John Wiley.
SILVA LEME, R.A. da (1965). Curso de Estatstica. 2a ed. Rio de Janeiro, Livro Tcnico.
THEIL, H. (1971). Principles of Econometrics. New York, John Wiley.
WALD, A. (1940). The Fitting of Straight Lines in both Variables are Subject to Error.
Ann. Math. Statist., 11:284-300.
WALLIS, K.F. (1967). Lagged Dependent Variables and Serially Correlated Errors: A
Reappraisal of three-Pass Least Squares. Rev. Economics and Statistics, 49:555-567.
WHITE, H. (1980). A Heteroskedasticity-consistent Covariance Matrix Estimator and a
Direct Test for Heteroskedasticity. Econometrica 48(4): 817-838,

385

ANLISE DE REGRESSO

Uma Introduo Econometria

WONNACOTT, R.J. e WONNACOTT, T.H. (1970). Econometrics. New York, John


Wiley.
WONNACOTT, R.J. e WONNACOTT, T.H. (1976). Econometria. Rio de Janeiro, Livros
Tcnicos e Cientficos.
YAMANE, T. (1967). Statistics, an Introductory Analysis. 2a ed. New York, Harper and
Row.
YULE, G.U. e KENDALL, M.G. (1940). An introduction to the Theory of Statistics. 12a
ed. London, Griffin.

386

ANLISE DE REGRESSO

Uma Introduo Econometria

NDICE ANALTICO

A
ADF, 368
Anamorfose, 77-79, 173
AR (p), 356
ARIMA (p, d, q), 365
ARMA (p, q), 357
Auto-regressivo, 356
Autocorrelao, 46, 278

B
Bartlett, 303, 383
Basmann, 328
Binria (ver Varivel binria)
Box, 355, 383
Breusch-Pagan/Godfrey, 265

C
Chebyshev, 28
Christ, 378, 379, 383
Cochran, 13, 383
Coeficiente de correlao
parcial, 146-153
simples, 103-104, 186
Coeficiente de determinao, 61, 68, 105, 129-130
Coeficiente de determinao parcial, 150-153
Coeficiente de variao, 68-69
Consistente (ver Estimador consistente)
Co-integrao, 368-371
Convergncia em mdia quadrtica, 28

387

ANLISE DE REGRESSO

Uma Introduo Econometria

Convergncia em probabilidade, 26
Covarincia
Definio, 6
Propriedades, 10
Cramr-Rao, 32-34

D
Davidson, 268, 367, 371, 383
Desigualdade de Chebyshev, 28
Draper, 232, 285, 383
DSP, 360
Dummy variable (ver Varivel binria)
Durbin-Watson, 284-286, 381, 382
Dickey-Fuller, 367-368

E
Econometria, 1
Eficincia relativa, 16
Engle, 370, 383
Equaes estruturais, 309, 318-319
Erro tipo I, 34
Erro tipo II, 34
Especificao, 77-79, 168-171
Esperana matemtica
Definio, 5
Propriedades, 5
Estimador
assintoticamente eficiente, 25-26
assintoticamente no-tendencioso, 25
consistente, 27, 31, 291-294
de mxima verossimilhana, 21-24, 32-34, 80
de mnimos quadrados, 19-21
388

ANLISE DE REGRESSO

Uma Introduo Econometria

de varincia mnima, 15-18


de Theil-Basmann, 328
de White, 265-269
eficiente, 16, 34
imparcial, 10
no-tendencioso, 10-12
no-viesado, 10
Extrapolao, 76-77, 142

F
Falta de ajustamento, 236-239
Forma reduzida (de um sistema de equaes simultneas), 309, 319

G
Gauss-Markov, 60, 121
Glejser, 264-265
Goldfeld, 263-266
Granger, 370, 383

H
Heterocedasticia, 46, 254
Hiptese (ver teste de hipteses)
Hoel, 262, 285, 376, 384
Hoffmann, 4, 285, 355, 384
Homocedasticia, 44
Homocedsticos, 44, 120

I
Identificao, 321-327
Intervalo de confiana, 71, 73, 75-76, 129, 140-141
Intervalo de previso, 73-76, 141-142
389

ANLISE DE REGRESSO

Uma Introduo Econometria

J
Jenkins, 356, 383
Johnston, 281, 285, 297, 304, 381, 382, 384

K
Kendall, 108, 386

L
Limite em probabilidade, 26
Limite inferior de Cramr-Rao, 32-34

M
Mackinnon, 268, 367, 371, 383
MA (q), 356
Matriz de varincias e covarincias, 124
Mdias mveis, 356
Mtodo
das variveis instrumentais (ver Varivel instrumental)
de mxima verossimilhana, 19, 21-24
dos mnimos quadrados, 19-21, 47, 121-123
dos mnimos quadrados em dois estgios, 315-317, 328-329
dos mnimos quadrados generalizados, 275-278
dos mnimos quadrados indiretos, 312-313
dos mnimos quadrados ordinrios, 256, 257-261, 282-283
dos mnimos quadrados ponderados, 46, 256-258
Modelo de correo de erros, 368-370
Modelo
Estatstico, 2-3
Matemtico, 1-2
390

ANLISE DE REGRESSO

Uma Introduo Econometria

de uma regresso linear simples, 44-47


de uma regresso linear mltipla, 120-121
restrito, 178
Mudana estrutural, 230-232
Multicolinearidade, 174-178, 191

N
Nvel de significncia, 34-40

O
Ortogonalidade, 173, 182-183

P
Passeio aleatrio, 358
Perez, 304, 385
Pimentel Gomes, 378, 385
Poder do teste, 34
Poligonal, 226-229
Probabilidade caudal do teste, 67-71, 137, 138, 284
Processo estacionrio, 353-354
Processo estocstico, 352-353

Q
Quandt, 263-266

R
Raiz unitria, 364
Regresso linear mltipla, 120-121
Regresso linear simples, 44-47
Rudo branco, 354
391

ANLISE DE REGRESSO

Uma Introduo Econometria

S
Scheff, 380, 385
Smith, 232, 285, 383

T
Teorema de Gauss-Markov (ver Gauss-Markov)
Teste de Breusch-Pagan/Godfrey, 265
Teste de Chow, 232
Teste de Dickey-Fuller, 367-368
Teste de Durbin-Watson, 284-286
Teste de Glejser, 264
Teste de Goldfeld e Quandt, 263-266
Teste de hipteses (conceitos bsicos), 34-40
Teste de hipteses no modelo linear, 157, 178-181
Teste de White, 266
Teste para falta de ajustamento (Ver Falta de ajustamento)
Teste para homocedasticia, 261-267
Theil, 33, 34, 263, 267, 281, 328, 376, 377, 385
Trajetria (de um processo estocstico), 352-353
TSP, 360

V
Varincia
Definio, 5-6
Propriedades, 6-7
Varincia assinttica, 25
Variveis conjuntamente determinadas, 317
Varivel
aleatria, 4-5
binria, 219-240

392

ANLISE DE REGRESSO

Uma Introduo Econometria

defasada, 285, 317


endgena, 308
exgena, 308
instrumental, 295-297, 301-302, 312, 319-320
predeterminada, 317

W
Wald, 303, 385
White, 266-268, 385
Wonnacott, 191, 385

Y
Yule, 108, 386

393