Analise de Regressão - Livro PDF

RODOLFO HOFFMANN
ANLISE DE REGRESSO
Uma Introduo Econometria
Portal de Livros Abertos

da USP
2016
RODOLFO HOFFMANN
ANLISE DE REGRESSO
Uma Introduo
Econometria
Esta uma nova verso do livro de mesmo ttulo (quarta edio)

publicado pela Editora HUCITEC em 2006, com edio esgotada em 2014.
Piracicaba
Edio do Autor
2016
DOI: 10.11606/9788592105709
Dados Internacionais de Catalogao na Publicao
DIVISO DE BIBLIOTECA DIBD/ESALQ/USP
Hoffmann, Rodolfo
Anlise de regresso: uma introduo econometria [recurso eletrnico] / Rodolfo
Hoffmann. - - 5. ed. Piracicaba: O Autor, 2016.
393 p. : il.
ISBN: 978-85-921057-0-9
1. Anlise de regresso 2. Econometria I.Ttulo
CDD 330.18
H711a
DOI: 10.11606/9788592105709
Autorizo a reproduo parcial ou total desta obra, para fins acadmicos,

desde que citada a fonte
SUMRIO
1. INTRODUO E CONCEITOS ESTATSTICOS BSICOS ..................................................... 1

1.1. Econometria e anlise de regresso ........................................................................... 1
1.2. Modelo matemtico e modelo estatstico .................................................................. 1
1.3. Varivel aleatria ....................................................................................................... 4
1.4. Esperana matemtica ............................................................................................... 5
1.5. Varincia e covarincia ............................................................................................. 5
1.6. Estimador no-tendencioso ...................................................................................... 10
1.7. Estimador de varincia mnima ............................................................................... 15
1.8. Estimadores de mnimos quadrados ........................................................................ 19
1.9. Estimadores de mxima verossimilhana ................................................................ 21
1.10. Propriedades assintticas dos estimadores ............................................................ 24
1.11. O limite inferior de Cramr-Rao e as propriedades assintticas dos
estimadores de mxima verossimilhana .............................................................. 32
1.12. Teste de hipteses .................................................................................................. 34
Exerccios ....................................................................................................................... 40
2. REGRESSO LINEAR SIMPLES ...................................................................................... 44

2.1. modelo estatstico de uma regresso linear simples ............................................. 44
2.2. Estimativa dos parmetros ...................................................................................... 47
2.3. O modelo simplificado e um exemplo numrico .................................................. 50
2.4. Demonstrao de que os estimadores de mnimos quadrados so
estimadores lineares no-tendenciosos .................................................................. 53
2.5. Varincias e covarincias das estimativas dos parmetros .................................... 55
2.6. Demonstrao de que b um estimador linear no-tendencioso de
varincia mnima ................................................................................................... 58
2.7. Decomposio da soma de quadrados total ........................................................... 61
2.8. Esperanas das somas de quadrados ...................................................................... 63
2.9. Anlise de varincia da regresso .......................................................................... 65
2.10. O coeficiente de determinao corrigido para graus de liberdade e o
coeficiente de variao .......................................................................................... 68
2.11. Estimativas das varincias das estimativas dos parmetros, teste de
hipteses a respeito dos parmetros e respectivos intervalos de
confiana ................................................................................................................ 69
2.12. Varincia de Yi e intervalo de previso ................................................................. 72

2.13. O problema da especificao e as funes que se tornam lineares por
anamorfose ............................................................................................................. 77
2.14. Estimativa de mxima verossimilhana ................................................................ 80
2.15. Anlise de regresso quando X uma varivel aleatria ....................................... 81
Exerccios ....................................................................................................................... 82
3. CORRELAO ............................................................................................................ 103

3.1. O coeficiente de correlao simples para uma amostra ....................................... 103
3.2. Aplicao da anlise de regresso a uma populao com distribuio
normal bidimensional .......................................................................................... 110
Exerccios ..................................................................................................................... 112
4. REGRESSO LINEAR MLTIPLA .................................................................................. 120
4.1. O modelo estatstico de uma regresso linear mltipla .......................................... 120
4.2. Estimativas dos parmetros de acordo com o mtodo dos mnimos
quadrados ............................................................................................................. 121
4.3. Varincias e covarincias das estimativas dos parmetros ..................................... 124
4.4. Varincia de uma combinao linear das estimativas dos parmetros ................... 125
4.5. Anlise de varincia da regresso linear mltipla .................................................. 126
4.6. Demonstrao de que b um estimador linear no-tendencioso de varincia
mnima ................................................................................................................. 130
4.7. O uso das variveis centradas ................................................................................. 132
4.8. Exemplo de uma regresso linear mltipla com duas variveis
explanatrias ........................................................................................................ 135
4.9. Previso e teste de hipteses a respeito do valor de combinaes lineares dos
parmetros ............................................................................................................ 139
4.10. Interpretao dos coeficientes de regresso de uma regresso linear
mltipla com duas variveis explanatrias .......................................................... 143
4.11. Os coeficientes de correlao parcial ................................................................... 146
4.12. Intervalos de confiana e regies de confiana para os parmetros..................... 154
4.13. Exemplo de regresso linear mltipla com trs variveis explanatrias ............. 162
4.14. Problemas de especificao.................................................................................. 168
4.15. Transformao das variveis para obter a matriz de correlaes simples .......... 171
4.16. Regresses que se tornam lineares por anamorfose ............................................ 173
4.17. Ortogonalidade e multicolinearidade na matriz X .............................................. 173
4.18. Teste de hipteses no modelo linear ................................................................... 178
4.19. Interpretao geomtrica da anlise de regresso linear de acordo com o
mtodo de mnimos quadrados ........................................................................... 181
Exerccios ..................................................................................................................... 194
5. USO DE VARIVEIS BINRIAS .................................................................................. 219

5.1. Nveis de medida ................................................................................................. 219
5.2. Uso de variveis binrias para distinguir as categorias de uma varivel
nominal................................................................................................................. 220
5.3. Uso de variveis binrias para ajustar poligonais ............................................... 226
5.4. Mudana estrutural .............................................................................................. 230
5.5. Anlise de varincia de dados com vrios tratamentos e o teste para "falta
de ajustamento" ................................................................................................... 236
Exerccios ..................................................................................................................... 240
6. HETEROCEDASTICIA .................................................................................................. 254
6.1. O caso de uma regresso linear simples em que o desvio padro do erro
proporcional a X .................................................................................................. 254
6.2. O mtodo dos mnimos quadrados ponderados .................................................. 255
6.3. Conseqncias do uso de estimadores de mnimos quadrados ordinrios
quando existe heterocedasticia ............................................................................ 257
6.4. Testes para a homocedasticia e obteno de estimativas dos parmetros
quando a matriz V desconhecida ...................................................................... 261
6.5. O estimador de White para varincia quando h heterocedasticia ...................... 267
Exerccios ..................................................................................................................... 268
7. MNIMOS QUADRADOS GENERALIZADOS E AUTOCORRELAO NOS RESDUOS ........ 275

7.1. Mnimos quadrados generalizados ...................................................................... 275
7.2. Autocorrelao nos resduos ............................................................................... 278
7.3. O teste de Durbin-Watson ................................................................................... 283
Exerccios ..................................................................................................................... 285
8. VARIVEIS INSTRUMENTAIS E ERROS NAS VARIVEIS EXPLANATRIAS ................... 291
8.1. Introduo ........................................................................................................... 291
8.2. A consistncia dos estimadores de mnimos quadrados ordinrios .................... 291
8.3. A inconsistncia dos estimadores de mnimos quadrados quando os erros
esto assintoticamente correlacionados com uma ou mais das variveis
explanatrias ....................................................................................................... 294
8.4. O uso de variveis instrumentais para obter estimativas consistentes ................ 295
8.5. Regresso linear simples com as duas variveis sujeitas a erros de medida ....... 298
8.6. O mtodo da varivel instrumental ..................................................................... 301
8.7. Outro mtodo ...................................................................................................... 303
Exerccios ...................................................................................................................... 305
9. EQUAES SIMULTNEAS ......................................................................................... 308
9.1. Introduo ........................................................................................................... 308
9.2. Um exemplo numrico ........................................................................................ 311
9.3. O estimador de varivel instrumental ................................................................. 312
9.4. Mnimos quadrados indiretos .............................................................................. 312
9.5. Mnimos quadrados em dois estgios ................................................................. 315
9.6. Variveis conjuntamente determinadas e variveis predeterminadas ................. 317
9.7. Notao geral ...................................................................................................... 318
9.8. Variveis instrumentais ....................................................................................... 319
9.9. Identificao ........................................................................................................ 321
9.10. Estimao dos parmetros em caso de superidentificao .................................. 327
9.11. Outras maneiras de obter o estimador de mnimos quadrados em dois
estgios ................................................................................................................ 328
9.12. Um exemplo numrico ........................................................................................ 329
9.13. Um segundo exemplo numrico ......................................................................... 333
9.14. Terceiro exemplo ................................................................................................ 334
9.15. Uma viso global ................................................................................................. 340
Exerccios ..................................................................................................................... 342
10. SRIES TEMPORAIS .................................................................................................. 352

10.1. Processos estocsticos ......................................................................................... 352
10.2. Rudo branco ....................................................................................................... 354
10.3. Modelos de regresso .......................................................................................... 355
10.4. Modelos de decomposio ................................................................................... 355
10.5. Modelos ARMA .................................................................................................. 355
10.6. Anlise do AR(1) ................................................................................................. 357
10.7. O passeio aleatrio com deslocamento ................................................................ 358
10.8. Transformando modelos AR em modelos MA e vice-versa ............................... 362
10.9. Raiz unitria e modelos ARIMA ......................................................................... 364
10.10.Funo de autocorrelao ................................................................................... 365
10.11. Os testes de Dickey-Fuller ................................................................................. 367
10.12. Modelo de correo de erro e co-integrao ..................................................... 368
Exerccios ..................................................................................................................... 373
APNDICE ....................................................................................................................... 376
BIBLIOGRAFIA ............................................................................................................... 383
NDICE ANALTICO.......................................................................................................... 387
PREFCIO
Este livro reflete o esforo do autor em preparar material didtico para

disciplinas de econometria e anlise de regresso ministradas na ESALQ-USP e, a partir
de 1997, no Instituto de Economia da UNICAMP.
O interesse na aprendizagem desses mtodos estatsticos se deve, em grande
parte, ao uso que deles se faz em pesquisas econmicas. Mas a anlise de regresso
tambm largamente aplicada em outras reas, como biologia, fsica ou engenharia.
No exagero afirmar que muitas vezes a conduo e a avaliao de uma pesquisa
dependem do conhecimento do pesquisador sobre econometria e anlise de regresso,
inclusive no que tange a suas potencialidades e a suas limitaes.
Um aspecto didaticamente importante, neste livro, a apresentao de exerccios
numricos que no exigem, para serem resolvidos, nem mesmo uma mquina de
calcular. Dessa maneira o aluno pode, sem dispender muito tempo em clculo, testar sua
aprendizagem e usar os conhecimentos recm-adquiridos. Alis, a idia de minimizar
clculos no nova. Basta lembrarmos de que, quando aprendemos a resolver equaes
do 2o grau, trabalhamos com exerccios do tipo
2x 2 7x + 3 = 0
e no do tipo
0,072150 x 2 + 1,481099 x 470,1902 = 0
No h dvida, entretanto, que tcnicas mais avanadas e recentes exigem o uso
do computador. O prprio desenvolvimento dos mtodos estatsticos nas ltimas
dcadas est muito associado ao uso do computador como poderoso instrumento de
fazer clculos.
Nesta quarta edio foi acrescentado um captulo sobre sries temporais.
Tambm foram incorporados novos exerccios e novas sees em captulos anteriores,
sempre procurando melhorar a apresentao dos temas, deixando para um outro volume
a anlise de regresso no-linear e modelos de lgite e prbite.
Seria difcil listar todos os colegas e alunos que, com suas crticas e sugestes
muito contriburam para que verses anteriores deste livro fossem sucessivamente
melhoradas. A Profa. Sonia Vieira foi co-autora das edies anteriores. A Profa. Angela
A. Kageyama fez cuidadosa reviso da 1a edio. A Profa. Rosngela Ballini fez vrias
sugestes e correes nesta 4a edio. E a tarefa de digitar todo o texto novamente foi
realizada com muita competncia e cuidado por Joselene Rodrigues da Silva.
Cabe, finalmente, registrar as boas condies de trabalho fornecidas pelas
instituies onde trabalhei e trabalho, a ESALQ-USP e o IE-UNICAMP, e agradecer o
apoio recebido da FAPESP e do CNPq.
Para esta nova edio em meio digital, de 2016, contei com a indispensvel
colaborao de Helena Aparecida Cardoso.
Sugestes, correes ou dvidas podem ser enviadas para o e-mail do autor:
hoffmannr@usp.br.
1. INTRODUO E CONCEITOS ESTATSTICOS BSICOS
1.1. Econometria e anlise de regresso
A econometria consiste na aplicao de mtodos matemticos e estatsticos a

problemas de economia. O econometrista combina conhecimentos de trs ramos
cientficos: Economia, Matemtica e Estatstica.
A anlise de regresso o mtodo mais importante da econometria.
Sempre interessante conhecer os efeitos que algumas variveis exercem, ou
que parecem exercer, sobre outras. Mesmo que no exista relao causal entre as
variveis podemos relaciona-las por meio de uma expresso matemtica, que pode ser
til para se estimar o valor de uma das variveis quando conhecemos os valores das
outras (estas de mais fcil obteno ou antecessoras da primeira no tempo), sob
determinadas condies.
Genericamente, tais relaes funcionais podem ser representadas por
Y = f ( X 1 , X 2 ,K, X k )
onde Y representa a varivel dependente e os X h (h = 1, 2, ..., k) representam as

variveis explanatrias.
So exemplos de relaes funcionais entre variveis:
a) crescimento da populao ou do PNB de um pas (Y) em funo dos anos (X);
b) variao da produo (Y) obtida numa cultura conforme a quantidade de nitrognio
( X 1 ) , fsforo ( X 2 ) e potssio ( X 3 ) utilizada na adubao;
c) variao do preo (Y) de um produto no mercado em funo da quantidade oferecida
(X).
1.2. Modelo matemtico e modelo estatstico
Consideremos duas variveis, X e Y, relacionadas por uma funo matemtica

Y = f ( X ) . Dado um conjunto de valores X i (i = 1, 2, ..., n) e os correspondentes
valores de Yi = f ( X i ) , se colocarmos os pontos ( X i , Yi ) em um grfico verificaremos

que eles pertencem curva que representa o modelo matemtico que relaciona as duas
variveis, como mostra a figura 1.1.
1
Figura 1.1. Modelo matemtico: Yi = f ( X i )
comum, entretanto, que a varivel dependente seja afetada por outros fatores,
alm dos considerados no modelo adotado. Admitamos que a varivel dependente sofra
a influncia de k + m variveis, isto ,
Y = f ( X 1 , X 2 , K , X k , X k +1 , K , X k + m )
e que por vrios motivos (no disponibilidade dos valores, impossibilidade de

mensurao, para simplificar a anlise etc.) no consideramos a influncia das variveis
X k +1 , K , X k + m . Ao analisarmos Y como funo das k primeiras variveis permanece,
ento, um resduo ou erro.
Admitindo que esse erro seja aditivo, o modelo estatstico fica
Yi = f ( X 1i , X 2i , K , X ki ) + u i (i = 1, K , n)
Se apenas uma das variveis independentes considerada, temos
Yi = f ( X i ) + u i
Neste caso, o conjunto de pares de valores ( X i , Y i ) corresponde a um conjunto

de pontos, dispersos em torno da curva representativa da funo, como mostra a figura
2
1.2. Dizemos que as duas variveis esto relacionadas de acordo com um modelo
estatstico.
Figura 1.2. Modelo estatstico: Yi = f ( X i ) + u i
Outra justificativa para a existncia do erro (u i ) em um modelo estatstico
dada pelos erros de mensurao da varivel dependente. Se os verdadeiros valores (Vi )

da varivel dependente so uma funo matemtica das variveis explanatrias, isto ,
Vi = f ( X 1i , X 2i , K , X ki )
e se os valores observados (Yi ) da varivel dependente apresentam erros de mensurao
(u i ) , isto ,
Yi = Vi + u i ,
a relao entre Yi e os X ki (h = 1, 2, ..., k) fica
Yi = f ( X 1i , X 2i , K , X ki ) + u i
3
Em casos reais geralmente existem tanto erros de mensurao como efeitos de
outras variveis. Nestes casos, o erro residual do modelo ser a soma desses dois tipos
de erro.
Desde que existam erros de mensurao, lgico admitir que os valores das
variveis explanatrias tambm so afetados; os problemas que isso acarreta sero
discutidos mais adiante; numa primeira etapa admitiremos apenas um erro residual
devido existncia de fatores no includos no modelo e/ou erros de mensurao apenas
na varivel dependente.
Nas prximas sees deste captulo faremos uma reviso de alguns conceitos
bsicos de estatstica.1
1.3. Varivel aleatria
Dizemos que uma varivel discreta X aleatria, se a cada um de seus valores se

associa uma probabilidade P ( X ) . O conjunto dos valores da varivel e das respectivas
probabilidades a distribuio de X.
Vejamos um exemplo. Se uma moeda lanada 5 vezes, o nmero de vezes que
se obtm cara uma varivel aleatria discreta, que pode assumir valores inteiros de 0
a 5, inclusive. Essa varivel tem distribuio binomial. Demonstra-se que, se p a
probabilidade de obter cara em um nico lanamento da moeda, a probabilidade de
ocorrerem X = k caras, em 5 lanamentos da moeda,
5
P( X = k ) = p k (1 p ) 5 k
k
Esta a funo de probabilidade da distribuio binomial para n = 5, onde n o

nmero de ensaios.
Se a varivel aleatria contnua, a probabilidade de obtermos exatamente um
determinado valor k zero, isto :
P( X = k ) = 0
1
Um desenvolvimento mais detalhado da maioria dos temas abordados nesta reviso pode ser encontrado
em HOFFMANN (1980).
4
Entretanto, desde que seja definida a funo de densidade f ( X ) , podemos obter
a probabilidade de a varivel aleatria assumir valores no intervalo (a, b), isto ,
b
P(a < X < b) = f ( X )dX
a
O valor de f ( X ) tambm denominado densidade de probabilidade.
Se a varivel contnua tem distribuio normal com mdia e varincia 2 , a

funo de densidade
1 ( X ) 2
f (X ) = exp
2 2 2 2
1.4. Esperana matemtica
Por definio, se a varivel aleatria discreta, a esperana de X
= E ( X ) = X i P( X i )
e, se a varivel aleatria contnua, a esperana de X
+
= E ( X ) = xf ( X )dX

Pode-se demonstrar, dadas as variveis aleatrias X e Y e a constante K, que a

esperana apresenta as seguintes propriedades:
a) E ( K ) = K
b) E ( X + K ) = E ( X ) + K
c) E ( KX ) = KE ( X )
d) E ( X + Y ) = E ( X ) + E (Y )
e, se X e Y so independentes,
e) E ( XY ) = E ( X ) E (Y )
1.5. Varincia e covarincia
Por definio, a varincia de uma varivel aleatria X, de populao infinita,
5
2 = V ( X ) = E[ X E ( X )] 2 = E ( X ) 2
A varincia uma medida de disperso da distribuio.

Demonstremos, a seguir, que, se K uma constante, V ( KX ) = K 2V ( X ) .
Temos
V ( KX ) = E[ KX E ( KX )] 2 =
= E[ KX KE ( X )] 2 =
= E{K 2 [ X E ( X )] 2 } =
= K 2 E[ X E ( X )] 2 =
= K 2V ( X ), c.q.d.
Dadas duas variveis aleatrias, X e Y, a covarincia entre X e Y , por definio:
cov( X , Y ) = E[ X E ( X )] [Y E (Y )] =
= E ( X X )(Y Y )
Demonstremos, a seguir, que
V ( X + Y ) = V ( X ) + V (Y ) + 2 cov( X , Y )
Temos
V ( X + Y ) = E[( X + Y ) E ( X + Y )] 2
Ento
V ( X + Y ) = E{[( X E ( X )] + [Y E (Y )]}2 =
= E[( X X ) 2 + (Y Y ) 2 + 2( X X )(Y Y )] =
= V ( X ) + V (Y ) + 2 cov( X , Y )
fcil verificar que
V ( X Y ) = V ( X ) + V (Y ) 2 cov( X , Y )
Se X e Y so duas variveis aleatrias independentes temos
cov( X , Y ) = E ( X X )(Y Y ) =
= E ( X X ) E (Y Y ) = 0
6
Segue-se que, no caso de variveis independentes,
V ( X Y ) = V ( X ) + V (Y )
Para exemplificar, consideremos que um tetraedro regular, feito de material

homogneo, em cujas faces esto marcados os nmeros 0, 2, 4 e 6, lanado. Seja X a
varivel aleatria que representa o valor marcado na face que ficar em contato com a
mesa. Os sucessivos lanamentos desse tetraedro geram uma populao infinita, em que
a cada um dos 4 diferentes valores est associada a probabilidade 1/4.
Ento
4 1 1 1 1
X = E ( X ) = X i P( X i ) = 0 + 2 + 4 + 6 =3
i =1 4 4 4 4
e
X2 = V ( X ) = E ( X 3) 2 =
1 1 1 1
= (3) 2 + (1) 2 + 12 + 3 2 = 5
4 4 4 4
Consideremos, agora, que temos dois tetraedros, um azul e outro branco. Sejam
X e Y as variveis aleatrias que representam os valores obtidos nos tetraedros azul e
branco, respectivamente.
Temos
X = Y = 3
X2 = Y2 = 5
Uma vez que X e Y so, obviamente, variveis independentes, devemos verificar
que cov( X , Y ) = 0 .
Na tabela 1.1 so dados os valores do produto ( X X )(Y Y ) a serem

utilizados no clculo da cov( X , Y ) .
TABELA 1.1. Valores de ( X X )(Y Y ) = ( X 3)(Y 3)
X
Y
0 2 4 6
0 9 3 3 9
2 3 1 1 3
4 3 1 1 3
6 9 3 3 9
7
Verificamos ento que
cov( X , Y ) = E ( X X )(Y Y ) =
1 1 1
= 9 + 3 +K+ 9 = 0
16 16 16
Seja Z = X + Y
Ento V ( Z ) = V ( X ) + V (Y ) + 2 cov( X , Y ) = 5 + 5 = 10
Verifiquemos este resultado calculando V (Z ) diretamente da definio. Na

tabela 1.2 so apresentados os valores de Z = X + Y .
TABELA 1.2. Soma dos valores obtidos lanando dois tetraedros

X
Y
0 2 4 6
0 0 2 4 6
2 2 4 6 8
4 4 6 8 10
6 6 8 10 12
Temos que
E ( Z ) = E ( X + Y ) = E ( X ) + E (Y ) = 3 + 3 = 6
Esse valor tambm pode ser obtido calculando a mdia dos valores obtidos na
tabela 1.2, como segue:
1 1 1 1
E(Z ) = 0 + 2 + 4 + K + 12 = 6
16 16 16 16
Finalmente, obtemos
V ( Z ) = E[ Z E ( Z )] 2 =
1 1 1
= (0 6) 2 + ( 2 6) 2 + K + (12 6) 2 = 10 ,
16 16 16
confirmando o resultado obtido anteriormente.
8
Devemos ressaltar que, embora cov( X , Y ) = 0 sempre que X e Y so variveis
aleatrias independentes, o inverso no verdadeiro, isto , se cov( X , Y ) = 0 , no
podemos concluir que X e Y so independentes. Na tabela 1.3 apresentamos uma
distribuio conjunta em que cov( X , Y ) = 0 e as variveis no so independentes, pois
P ( X i , Y j ) P ( X i ) P (Y j )
TABELA 1.3. Valores de P ( X i , Y j ) para a distribuio conjunta de duas

variveis dependentes com cov( X , Y ) = 0
Y X
P(Y )
1 0 1
1 0,10 0,30 0,10 0,50
1 0,25 0 0,25 0,50
P( X ) 0,35 0,30 0,35 1,00
Entretanto, possvel demonstrar que, se as variveis tm distribuio normal, o

fato de a covarincia ser igual a zero condio suficiente para podermos afirmar que
so variveis independentes.
Vejamos, a seguir, um exemplo de duas variveis com covarincia no nula. No
lanamento do tetraedro descrito anteriormente, seja X o valor marcado na face que fica
em contato com a mesa e seja W a soma dos valores marcados nas outras 3 faces. A
tabela 1.4 mostra os valores de X e de W, bem como do produto [ X E ( X )] [W E (W )]
.
TABELA 1.4. Valores necessrios para o clculo da cov( X , W )

X W [ X E ( X )] [W E (W )]
0 12 9
2 10 1
4 8 1
6 6 9
Temos que
E( X ) = 3 ,
E (W ) = 9 e
9
cov( X , W ) = [ X E ( X )] [W E (W )] =
1 1 1 1
= (9) + (1) + (1) + (9) = 5
4 4 4 4
Como exerccio, o leitor pode verificar que V (W X ) = 20 .

Pode-se demonstrar que, se K uma constante e se X, Y e Z so variveis
aleatrias, a covarincia apresenta as seguintes propriedades:
a) cov( X + Y , Z ) = cov( X , Z ) + cov(Y , Z )
b) cov( KX , Y ) = cov( X , KY ) = K cov( X , Y )
c) cov( K , X ) = cov( X , K ) = 0
Segue-se que, se 1 , 1 , 1 , 2 , 2 e 2 so constantes,
cov( 1 + 1 X + 1Y , 2 + 2 X + 2 Y ) =
= 1 2V ( X ) + ( 1 2 + 1 2 ) cov( X , Y ) + 1 2V (Y )
Como caso particular temos:
cov( X , + X ) = V ( X )
Este ltimo resultado pode ser utilizado para obter a covarincia entre as
variveis X e W da tabela 1.4. Como a soma de todos os valores marcados no tetraedro
sempre igual a 12, temos que W = 12 X . Ento
cov( X , W ) = cov( X ,12 X ) = V ( X ) = 5 ,
confirmando o resultado obtido anteriormente.
1.6. Estimador no tendencioso
Por definio, a um estimador no-tendencioso (no-viesado ou imparcial) do

parmetro da populao se
E (a ) =
10
importante lembrar que o estimador a uma varivel, isto , ele representa
uma dada frmula de clculo que fornecer valores que sero diferentes, conforme a
amostra selecionada.
Para exemplificar, consideremos, novamente, a populao infinita gerada pelo
lanamento do tetraedro regular em cujas faces esto marcados os valores 0, 2, 4 e 6.
J vimos que = E ( X ) = 3 e 2 = V ( X ) = 5
Lanando o tetraedro duas vezes, podemos obter amostras com n = 2 elementos
dessa populao. Na tabela 1.5 apresentamos as dezesseis amostras de tamanho n = 2,
que podem ser obtidas, e as respectivas estimativas dos parmetros e 2 . Os
estimadores so
X i X1 + X 2
X = =
n 2
e
( X i X ) 2
s2 = = (X1 X )2 + (X 2 X )2
n 1
Calculamos, tambm, as estimativas da varincia da mdia da amostra. Esta

varincia definida por
X2 = V ( X ) = E[ X E ( X )] 2
Temos
X + X 2 +K+ X n 1
V (X ) = V 1 = 2 V (X1 + X 2 +K+ X n )
n n
Uma vez que as observaes de uma amostra aleatria de uma populao infinita
so independentes, segue-se que
1 2
V (X ) = n 2
=
n2 n
s2
O estimador da varincia mdia s 2
X
=
n
Obviamente, cada uma das dezesseis amostras tem probabilidade 1/16 de ser
selecionada.
11
TABELA 1.5. Valores de X , s 2 , s X2 e ( X ) 2 para as 16 amostras que
podem ser obtidas lanando duas vezes o tetraedro.
Amostra X s2 s X2 (X )2
0e0 0 0 0 9
0e2 1 2 1 4
0e4 2 8 4 1
0e6 3 18 9 0
2e0 1 2 1 4
2e2 2 0 0 1
2e4 3 2 1 0
2e6 4 8 4 1
4e0 2 8 4 1
4e2 3 2 1 0
4e4 4 0 0 1
4e6 5 2 1 4
6e0 3 18 9 0
6e2 4 8 4 1
6e4 5 2 1 4
6e6 6 0 0 9
Verificamos que
1 1 1 1 1 48
E( X ) = 0 + 1 + 2 + K + 5 + 6 = =,
16 16 16 16 16 16
Ou seja, X um estimador no-tendencioso (no viesado, no-viciado ou imparcial) de

. Isto pode ser facilmente demonstrado:
X + X 2 +K+ X n
E ( X ) = E 1 =
n
1 n
= [ E ( X 1 ) + E ( X 2 ) + K + E ( X n )] = =
n n
Verificamos, tambm, que
1 1 1 1 1 80
E(s 2 ) = 0 + 2 8 +K+ 2 0 = =5 = 2,
16 16 16 16 16 16
ou seja, s 2 um estimador no-tendencioso de 2 .

A varincia da mdia da amostra pode ser obtida atravs da expresso
12
2 5
V ( X ) = X2 = =
n 2
ou diretamente, a partir da definio, utilizando os valores da ltima coluna da tabela

1.5, como segue:
1
V ( X ) = E[ X E ( X )] 2 = E ( X ) 2 = 9 +
16
1 1 40 5
+ 4 +K+ 9 = =
16 16 16 2
Considerando os valores de s X2 apresentados na tabela 1.5, verificamos que
1 1 1 1 1 40 5
E ( s X2 ) = 0 + 1 + 4 + K + 1 + 0 = = ,
16 16 16 16 16 16 2
ou seja, s X2 um estimador no-tendencioso de X2 .
Devemos ressaltar que o exemplo apresentado refere-se a uma populao

infinita. As mesmas frmulas sero vlidas se, de uma populao finita, tirarmos
amostras com reposio dos elementos.
Consideremos, agora, o caso de uma populao finita (com m elementos) da
qual se tiram amostras (de n elementos) sem reposio.
A mdia da populao
1 m
= E( X ) = Xi
m i =1
A varincia de X definida por (ver Cochran, 1965, p. 42)
1 m
V (X ) = S 2 =
m 1 i =1
( X i ) 2
Demonstra-se que (ver Cochran, 1965, p. 44)
S2 n
V ( X ) = X2 = 1
n m
Dada uma amostra (sem reposio) de n elementos, uma estimativa no-

tendenciosa de dada por
13
n
X
i =1
i
X =
n
As estimativas no-tendenciosas de S 2 e X2 so dadas, respectivamente, por
(X i X )2
s2 n
s2 = i =1
e s X2 = 1
n 1 n m
Vejamos um exemplo numrico simples, embora artificial. Seja uma populao

de apenas 4 elementos (m = 4), onde X i assume os valores 0, 2, 4 e 6. Temos que
0+2+4+6
= =3
4
( X i ) 2 (0 3) 2 + (1 3) 2 + ( 4 3) 2 + (6 3) 2 20
S =
2
= =
m 1 3 3
4
Consideremos as = 6 diferentes amostras de 2 elementos (n = 2) que
2
podemos tirar dessa populao. Essas amostras esto discriminadas na tabela 1.6, com
os correspondentes valores de X , s 2 , s X2 e ( X ) 2 .
TABELA 1.6. Valores de X i , X , s 2 , s X2 e ( X ) 2 para as 6 possveis
amostras de 2 elementos (sem reposio).

Valores de X i X s2 s X2 ( X )2
0e2 1 2 1/2 4
0e4 2 8 2 1
0e6 3 18 9/2 0
2e4 3 2 1/2 0
2e6 4 8 2 1
4e6 5 2 1/2 4
Para amostras com n = 2 elementos, temos
14
S 2 n 20 2 5
V (X ) = 2
X
= 1 = 1 =
n m 6 4 3
O mesmo resultado pode ser obtido a partir da definio de varincia, utilizando

os valores da ltima coluna da tabela 1.6. Como as 6 diferentes amostras so igualmente
provveis, temos
4 + 1 + 0 + 0 + 1 + 4 10 5
X2 = E ( X ) 2 = = =
6 6 3
Verificamos que:
1 18
E( X ) = (1 + 2 + K + 5) = = 3,
6 6
ou seja, E ( X ) =
1 40 20
E(s 2 ) = ( 2 + 8 + K + 2) = = ,
6 6 3
ou seja, E ( s 2 ) = S 2
11 1 1 20 5
E ( s X2 ) = + 2 +K+ = =
62 2 6 2 3
ou seja, E ( s X2 ) = X2
1.7. Estimador de varincia mnima
A no-tendenciosidade ou ausncia de vis uma qualidade desejvel para os

estimadores. Entretanto, essa qualidade insuficiente como critrio para selecionar um
estimador. Assim, por exemplo, no caso da mdia de uma populao, podemos verificar
que qualquer mdia ponderada dos valores de uma amostra um estimador no
tendencioso de .
Consideremos a mdia ponderada
n
m = i X i , com i = 1
i =1
15
Temos que
E ( m) = i E ( X i ) = i =
Isso mostra que qualquer mdia ponderada dos valores observados em uma
amostra aleatria um estimados no tendencioso de . Portanto, existem infinitos
estimadores no-tendenciosos de .
Dados dois estimadores no-tendenciosos de , a1 e a 2 , por definio a
eficincia relativa de a 2 , em comparao com a1 , igual a
V ( a1 )
V (a 2 )
Assim, por exemplo, dada uma amostra aleatria com 2 elementos, X 1 e X 2 , de

uma populao infinita, consideremos 2 estimadores no-tendenciosos da mdia da
populao:
X1 + X 2 1 1
a) a mdia aritmtica X = = X1 + X 2 e
2 2 2
1 3
b) a mdia ponderada m = X1 + X 2
4 4
Temos
2
V (X ) =
2
e
1 2 9 2 5 2
V (m) = + =
16 16 8
A eficincia de m em relao a X
1 2

2 4
= = 0,8 ou 80%
5 2 5

8
16
fcil provar que, dada uma amostra com 2 observaes ( X 1 e X 2 ) , dentre os
estimadores da classe
m = X 1 + (1 ) X 2 ,
1
o mais eficiente a mdia aritmtica, ou seja, o caso em que = .
2
Temos
V ( m) = 2 2 + (1 ) 2 2 = (1 = 2 + 2 2 ) 2
Igualando a zero a derivada em relao a e simplificando, obtemos
2 + 4 = 0
Donde
1
=
2
A derivada segunda positiva, confirmando que a varincia mnima quando

1
= .
2
Generalizando esse resultado, demonstraremos que, dada uma varivel aleatria

X de populao infinita com mdia e varincia 2 , a mdia aritmtica de uma
amostra aleatria de n observaes , dentre os estimadores lineares no-tendenciosos, o
estimador de varincia mnima.
Dizemos que um estimador linear quando ele uma combinao linear dos
valores da amostra. Como exemplo, consideremos o seguinte estimador linear de :
n
m = i X i
i =1
Temos que
E (m) = i
17
Para que m seja estimador no-tendencioso de , devemos ter
i = 1
Temos, tambm, que
V ( m) = 2 i2
Para minimizar V (m ) devemos minimizar i2 , considerando a restrio
i = 1 . Utilizando o mtodo do multiplicador de Lagrange, definimos a funo
= i2 ( i 1)
Igualando a zero as derivadas parciais em relao a i e , obtemos o sistema

de equaes
2 i = 0 , i = 1, 2, ..., n (1.1)
i = 1 (1.2)
De (1.1), obtemos

i = (1.3)
2
Substituindo (1.3) em (1.2), obtemos
n
=1
2
Donde
1
=
2 n
Comparando esse resultado com (1.3) conclumos que
1
i = , c.q.d.
n
18
No h necessidade de verificar a condio de 2a ordem para mnimo por se
tratar de uma soma de quadrados.
1.8. Estimadores de mnimos quadrados
Pode parecer bvio que o estimador da mdia de uma varivel seja a mdia dos
valores observados em uma amostra. Mas em situaes um pouco mais complicadas
ser necessrio recorrer a um mtodo geral de determinao de estimadores, como o
mtodo dos mnimos quadrados ou o mtodo da mxima verossimilhana (que ser
descrito na prxima seo).
O mtodo dos mnimos quadrados consiste em adotar os estimadores que
minimizam a soma dos quadrados dos desvios entre valores estimados e valores
observados na amostra.
Mostraremos que a mdia aritmtica dos valores da amostra um estimador de
n
mnimos quadrados. Para tanto, determinemos o valor de a que minimiza (X
i =1
i a) 2 .
Derivando em relao a a e igualando a zero, obtemos:
2 ( X i a )( 1) = 0
X i na = 0
Donde
Xi
a= = X , c.q.d.
n
interessante notar que o mtodo de mnimos quadrados conduz mdia

aritmtica, mas que existem outros critrios associados s demais medidas de tendncia
central. Assim, para minimizar o valor absoluto do maior desvio, devemos adotar o
ponto central entre os extremos (o ponto mdio entre o menor e o maior valor); para
maximizar o nmero de desvios iguais a zero devemos adotar a moda da amostra; e para
minimizar a soma dos valores absolutos dos desvios devemos adotar a mediana. Para
verificar essa ltima afirmativa, consideremos a distribuio de freqncias apresentada
na tabela 1.7.
19
TABELA 1.7. Distribuio de freqncias com 13 distribuies
X : 0 1 2 3 4 5 6 7 8
Freqncia: 1 5 1 1 1 1 2 0 1
fcil verificar que a moda 1, a mediana 2, a mdia aritmtica 3 e o ponto

central entre os extremos 4.
A soma dos valores absolutos dos desvios em relao mediana 27 (7 para os
valores abaixo da mediana e 20 para os valores acima da mediana). Para mostrar que a
mediana o ponto que minimiza a soma dos valores absolutos dos desvios,
consideremos um ponto abaixo da mediana diferindo desta de menos de 1 unidade, isto
, o ponto de abcissa 2 , com 0 < < 1 . Para os 6 pontos abaixo da mediana, os
desvios ficam aumentados de ; para os 6 pontos localizados acima da mediana, os
desvios ficam aumentados de e para o ponto cuja abcissa igual mediana surge um
desvio igual a em valor absoluto. A soma dos valores absolutos dos desvios em
relao ao ponto de abcissa 2 , portanto,
7 6 + 20 + 6 + = 27 + > 27
Raciocnio semelhante mostra que a soma dos valores absolutos dos desvios em
relao a um ponto acima da mediana tambm maior do que 27. Conclumos, ento,
que essa soma mnima quando referida mediana.
Vejamos um exemplo onde o uso da mdia aritmtica, como medida de
tendncia central, parece ser mais razovel do que o uso da mediana, o que implica em
afirmar que o critrio de mnimos quadrados parece ser mais razovel do que a
minimizao da soma dos desvios absolutos. Consideremos uma amostra com 3
observaes, onde X 1 = X 2 = 0 e X 3 0 . A mediana igual a zero, qualquer que seja
o valor de X 3 , isto , o valor da mediana independe de X 3 . Entretanto, a mdia
1
aritmtica igual a X3.
3
Para uma outra ilustrao da aplicao do mtodo de mnimos quadrados,
consideremos a determinao do estimador do parmetro p de uma distribuio
binomial, sabendo que numa amostra de n observaes foram constatados X casos
favorveis e n X casos contrrios. Como os valores esperados so de np casos
20
favorveis e n(1 p ) casos contrrios, queremos, de acordo com o mtodo de mnimos
quadrados, o valor de p que minimize
( X np ) 2 + [(n X ) n(1 p )] 2
Deixamos para o leitor verificar que a soluo
X
p =
n
1.9. Estimadores de mxima verossimilhana
De acordo com o mtodo da mxima verossimilhana adotamos, como

estimativas dos parmetros, os valores que maximizam a probabilidade (no caso da
varivel aleatria ser discreta) ou a densidade de probabilidade (no caso de varivel
contnua) de ser obtida a amostra observada. Para obter estimadores de mxima
verossimilhana necessrio conhecer ou pressupor qual a distribuio da varivel em
estudo.
Para exemplificar, consideremos que cada uma das faces de um tetraedro regular
so pintadas de branco ou de azul, e que, ao lanar o tetraedro, o resultado
considerado sucesso se a face que ficar em contato com a mesa for azul. Vamos supor
que o tetraedro foi lanado 4 vezes, sem que soubssemos se o nmero de faces azuis do
tetraedro era 0, 1, 2, 3 ou 4. Somos ento informados de que, nas 4 tentativas, foi obtido
sucesso apenas uma vez. Qual a estimativa de mxima verossimilhana para o nmero
de faces azuis no tetraedro utilizado?
Na tabela 1.8 apresentamos a probabilidade de obter apenas um sucesso em 4
tentativas, para cada um dos casos possveis.
21
TABELA 1.8. A funo de verossimilhana.
Probabilidade (p) de Probabilidade de obter

Nmero de
obter sucesso em uma apenas um sucesso em 4
faces azuis
tentativa tentativas = 4p(1 p)3
0 0 0
1 1/4 27/64
2 1/2 1/4 = 16/64
3 3/4 3/64
4 1 0
A simples observao da tabela 1.8 mostra que o valor de p que maximiza a

probabilidade de obter um sucesso em 4 tentativas p = 1 / 4 . Ento, essa a estimativa
de mxima verossimilhana para a probabilidade de obter sucesso em um lanamento,
ou seja, o tetraedro utilizado deve ter apenas uma face azul.
Se p varia continuamente, a estimativa de mxima verossimilhana pode ser
obtida atravs das condies necessrias e suficientes do clculo diferencial. Desejamos
o valor de p que maximize
n
P( X ) = p X (1 p ) n X ,
X
onde X o nmero de sucessos obtidos em n tentativas.

Como o logaritmo uma funo monotnica crescente, o valor de p que
maximiza P(X) tambm maximiza
n
Z = ln P( X ) = ln + X ln p + (n X ) ln (1 p )
X
Igualando a zero a derivada em relao a p, obtemos
X n X
=0
p 1 p
X
cuja soluo p = , que o estimador j obtido na seo anterior pelo mtodo de
n
mnimos quadrados.
Como
22
d 2Z X n X
= 2 < 0,
dp 2
p (1 p ) 2
a condio de segunda ordem para mximo satisfeita.

Como mais um exemplo, consideremos a determinao dos estimadores de
mxima verossimilhana da mdia ( ) e da varincia ( 2 ) de uma varivel aleatria
(X), com distribuio normal, com base em uma amostra aleatria de n elementos.
Neste caso, a densidade de probabilidade de obter um valor X i na amostra
1 (X i )2
f (X i ) = exp
2 2 2 2
Como as observaes so independentes, a densidade de probabilidade de obter

os valores X 1 , X 2 , K , X n da amostra
L( X 1 , X 2 , K , X n ; , 2 ) = f ( X 1 ) f ( X 2 ) K f ( X n ) =
n
1 ( X ) 2
= exp i 2 =
i =1 2 2 2
n ( X i ) 2
= (2 ) 2 2
exp
2 2
Essa a funo de verossimilhana da amostra. usual representa-la por L

porque a palavra inglesa para verossimilhana likelihood.
Os estimadores de mxima verossimilhana de e 2 so os valores que
maximizam o valor de L ( , 2 | X 1 , X 2 , K , X n ) . Como o logaritmo uma funo
monotnica crescente, os valores de e 2 que maximizam L tambm maximizam
n n ( X i ) 2
ln L = ln 2 ln 2
2 2 2 2
Igualando a zero as derivadas parciais em relao a e 2 obtemos o sistema de

equaes
23
2 ( X i )
=0 (1.4)
2 2

n + ( X i ) = 0
2
(1.5)
2 2 2 4
De (1.4) obtemos
Xi
= =X (1.6)
n
J vimos que X um estimador de mnimos quadrados, no-tendencioso e de

varincia mnima. Sabemos agora que, se X tem distribuio normal, X , tambm, um
estimador de mxima verossimilhana.
De (1.5) e (1.6) obtemos
(X i X )
2
2 =
n
interessante notar que o estimador de mxima verossimilhana da varincia

tendencioso, uma vez que o estimador no-tendencioso
(X i X )
2
s =
2
n 1
1.10. Propriedades assintticas dos estimadores
Seja a n o estimador de um parmetro , obtido com base em uma amostra com
n observaes. Em geral a n uma varivel aleatria cuja distribuio caracterizada
pela funo de densidade f (a n ) , com mdia E (a n ) e varincia
V ( a n ) = E[a n E ( a n )] 2 . Variando o tamanho da amostra, temos vrias seqncias:
a) a seqncia dos estimadores:
{a n } = a1 , a 2 , K , a n , K (1.7)
b) a seqncia das mdias:
{E (a n )} = E (a1 ), E (a 2 ), K , E (a n ), K (1.8)
24
c) a seqncia das varincias:
{V (a n )} = V (a1 ), V (a 2 ), K , V (a n ), K (1.9)
d) a seqncia das funes de densidade:
{ f (an )} = f (a1 ), f (a2 ), K , f (an ), K (1.10)
A teoria assinttica dos estimadores se destina a estabelecer o comportamento

dessas seqncias quando n tende para infinito.
Denominamos esperana assinttica de a n ao valor do lim E (a n ) . Se
n
lim E ( a n ) = , dizemos que a n um estimador assintoticamente no-tendencioso.

n
Poderamos pensar em definir a varincia assinttica de a n como lim V (a n ) .

n
Entretanto, esse limite freqentemente igual a zero, porque a distribuio de a n se
concentra em um nico ponto. Para exemplificar, consideremos a mdia ( X ) de uma
amostra aleatria com n observaes da varivel X, de mdia e varincia 2 . De

V ( X ) = 2 / n segue-se que
lim V ( X ) = 0
n
Pode-se demonstrar que, quando n cresce, a distribuio da mediana (m) da

amostra se concentra em torno de e o limite de sua varincia tambm zero, isto ,
lim V ( m) = 0
n
Para verificar qual de dois estimadores assintoticamente mais eficiente,

poderamos pensar em comparar os limites das varincias desses estimadores, quando n
tende para infinito. Entretanto, se esses limites so iguais a zero a eficincia relativa no
definida.
O problema resolvido definindo varincia assinttica como
n
{
n 1 lim E n [a n E (a n )] } 2
(1.11)
Para o estimador X temos
25
2
V ( X ) = E( X ) 2 =
n
Ento
E[ n ( X )] 2 = 2
e a varincia assinttica de X
2
n 1
lim E[ n ( X )] = 2
n n
Pode-se demonstrar que, se X tem distribuio normal, a varincia assinttica da
mediana (m) da amostra
2
n 1 lim E[ n (m )] 2 =
n 2n
Como ( / 2) > 1 , conclumos que a mdia ( X ) um estimador de

assintoticamente mais eficiente do que a mediana (m).
Ao analisar a seqncia (1.7) importante ter em mente que, fixado o valor de n,
a n uma varivel aleatria. Por isso no tem sentido falar no limite de a n quando n
tende a infinito. necessrio, ento, introduzir o conceito de convergncia em
probabilidade.
Dizemos que uma seqncia de variveis aleatrias {a n } = a1 , a 2 , K , a n , K
converge em probabilidade para uma constante se, para qualquer > 0 ,

arbitrariamente pequeno,
lim P (| a n |> ) = 0 , (1.12)
n
indicando-se
p
an
ou
plim a n = ,
que se l: o limite em probabilidade de a n igual a .
26
Dada uma amostra de n observaes, a n um estimador consistente do
parmetro da populao se plim a n = .
Antes de prosseguir vamos analisar melhor esse conceito. A expresso (1.12)

pode ser escrita
lim P( < a n < + ) = 1 (1.13)

n
Na figura 1.3 representamos a distribuio de a n para n = 10 e n = 100 e
assinalamos, por meio de traos verticais, os limites e + . De acordo com

(1.13), para que a n seja um estimador consistente de , a probabilidade de termos
< a n < + deve tender para um quando n tende para infinito. Em outras
palavras, dados e , positivos e arbitrariamente pequenos, deve existir n o tal que para
todo n > n o temos
P( < a n < + ) > 1
Em termos da figura 1.3, medida que n cresce, a distribuio de a n deve se
concentrar em torno de , de maneira que quase toda a distribuio fique compreendida

entre os limites e + .
Figura 1.3. O conceito de estimador consistente
27
Prosseguindo no estudo das propriedades assintticas dos estimadores, vejamos
o conceito de convergncia em mdia quadrtica. Dizemos que uma srie de variveis
aleatrias {a n } = a1 , a 2 , K , a n , K converge em mdia quadrtica para uma constante
se
lim E (a n ) 2 = 0 (1.14)
n
Demonstraremos adiante que a convergncia em mdia quadrtica condio

suficiente para que tenhamos convergncia em probabilidade. Para isso vamos deduzir,
preliminarmente, a desigualdade de Chebyshev.
Consideremos uma varivel aleatria Z 0 , com mdia finita, e um nmero real
> 0 . Definimos a varivel aleatria Y da seguinte maneira:
Y = 0 , se Z <
e
Y = , se Z
Ento,
P (Y = 0) = P ( Z < )
P (Y = ) = P ( Z )
Segue-se que
E (Y ) = 0 P (Y = 0) + P (Y = ) = P ( Z ) (1.15)
Da definio de Y, segue-se que
Y Z
Ento,
E (Y ) E ( Z )
Considerando (1.15) temos:
28
P( Z ) E ( Z )
ou
E (Z )
P( Z ) (1.16)

Consideremos agora a varivel aleatria X, com mdia e varincia 2 .

Aplicando a relao (1.16) varivel aleatria ( X ) 2 0 e ao nmero k 2 , obtemos
E( X ) 2 2
P[( X ) 2 k 2 ] = 2 (1.17)
k2 k
Donde, com k > 0,
2
P (| X | k ) ,
k2
que a desigualdade de Chebyshev.
Demonstremos agora que a convergncia em mdia quadrtica condio

suficiente para que tenhamos convergncia em probabilidade. Aplicando a relao
(1.16) varivel ( a n ) 2 e ao nmero 2 , obtemos
E (a n ) 2
P[(a n ) 2 2 ]
2
Ento
E (a n ) 2
lim P[(a n ) ] lim
2 2
n n 2
Se a n converge em mdia quadrtica para , temos
lim E (a n ) 2 = 0
n
Segue-se que
29
lim P[(a n ) 2 2 ] = 0
n
Lembrando que para uma varivel aleatria contnua a probabilidade de se

observar um determinado valor nula, podemos escrever
lim P[(a n ) 2 > 2 ] = 0

n
ou
lim P (| a n |) > ] = 0
n
isto ,
plim a n =
Demonstremos, tambm, que
E (a n ) 2 = V (a n ) + [ E (a n ) ] 2 (1.18)
Temos
E (a n ) 2 = E{[ a n E (a n )] + [ E (a n ) ]}2 =
= E{[a n E (a n )] 2 + [ E (a n ) ] 2 + 2[a n E (a n )] [ E (a n ) ]} =
= V (a n ) + [ E (a n ) ] 2 , c.q.d.
Vamos resumir as definies e resultados obtidos at esse ponto.

Para que o estimador a n , baseado numa amostra de n observaes, seja um
estimador consistente de , isto , para que
plim a n = ,
suficiente que
lim E (a n ) 2 = 0
n
Para que isso acontea, por sua vez, suficiente, de acordo com (1.18), que
lim V ( a n ) = 0
n
30
e
E (a n ) =
ou
lim[ E ( a n )] =
n
Conclumos ento que um estimador no-tendencioso ou assintoticamente no-

tendencioso consistente se o limite da sua varincia, quando o tamanho da amostra
tende para infinito, igual a zero.
Vejamos um exemplo. Sabemos que X um estimador no-tendencioso de e
2
que V ( X ) = .
n
Como
lim V ( X ) = 0 ,
n
conclumos que plim X = , isto , X um estimador consistente de .
Vimos que os estimadores devem ser no-tendenciosos e eficientes. desejvel,

tambm, que sejam consistentes e assintoticamente eficientes, isto , que apresentem
varincia assinttica mnima. A no-tendenciosidade e a eficincia so denominadas
propriedades de amostra pequena, porque sua validade no depende do tamanho da
amostra, isto , quando um estimador apresenta tais propriedades, elas so igualmente
vlidas para amostras grandes e para amostras pequenas. Por outro lado, as propriedades
definidas em termos de limites, quando o tamanho (n) da amostra tende para infinito,
so denominadas propriedades de amostra grande ou propriedades assintticas.
A seguir so apresentadas, sem demonstrao, algumas propriedades da
convergncia em probabilidade.
Se plim a = e F (a) uma funo contnua de a, ento plim F ( a ) = F ( ) .
Em particular, temos plim (a 2 ) = (plim a ) 2 e plim (a 1 ) = (plim a ) 1 . O teorema se

estende ao caso de uma funo contnua de duas ou mais variveis, isto , se
plim a = , plim b = e F ( a , b) uma funo contnua, temos
31
plim F ( a, b) = F ( , ) . Temos, por exemplo, plim ( a + b) = plim a + plim b ,
plim ( ab ) = ( plim a ) ( plim b) e, se plim b 0 , plim ( a / b) = ( plim a ) /( plim b) .
Essas propriedades facilitam a determinao do valor para o qual converge em
probabilidade uma funo de estimadores. Note que, conhecida a esperana matemtica
de vrias variveis, no geralmente to imediata a determinao da esperana
matemtica de expresses envolvendo tais variveis. Dado que E (a ) = e E (b) = ,
sabemos que E ( a + b) = + , mas nada podemos dizer, de imediato, sobre o valor de
E (a 2 ) , E (ab ) ou E ( a / b) .
Para introduzir a idia de convergncia em distribuio, vamos considerar,
novamente, a distribuio da mdia ( X ) de uma amostra aleatria com n observaes,
com E ( X ) = e V ( X ) = 2 , mas sem que se conhea a forma da distribuio de X. J
vimos que V ( X ) tende a zero quando n cresce. Dizemos que, no limite, a distribuio
de X degenera, concentrando-se em um ponto. Ento conveniente analisar o que

ocorre com a distribuio de n X . O teorema do limite central estabelece que, em
condies bastante gerais, no limite, quando n tende a infinito, a distribuio de nX
uma distribuio normal com mdia n e varincia 2 . Esse um exemplo de

convergncia em distribuio, indicando-se
d
n X N ( n, 2 )
Dizemos, ento, que a distribuio assinttica de X uma distribuio normal

com mdia e varincia 2 n .
1.11. O limite inferior de Cramr-Rao e as propriedades assintticas dos

estimadores de mxima verossimilhana
Consideremos uma amostra aleatria de n observaes ( X 1 , X 2 , K , X n ) de uma
varivel cuja distribuio caracterizada por um parmetro cujo valor

desconhecido. Se f ( X ) uma funo de densidade de II, a funo de verossimilhana
dessa amostra
32
n
L( X 1 , X 2 , K , X n ; ) = f ( X i )
i =1
Seja a um estimador no-tendencioso de . Se a funo de densidade f(X)

obedecer a certas condies de regularidade relativas integrao e diferenciao e se
existe a varincia de a, ento pode-se demonstrar que2
1 1
V (a) = (1.19)
d ln L
2
d ln L
2
E 2
E
d d
O valor do 2o membro dessa desigualdade denominado limite inferior de

Cramr-Rao. A desigualdade (1.19) estabelece que no existe estimador no-
tendencioso cuja varincia seja menor do que o limite inferior de Cramr-Rao.
Para exemplificar, consideremos uma varivel X com distribuio normal de
mdia , desconhecida, e varincia igual a um. Dada uma amostra aleatria com n
observaes ( X 1 , X 2 , K , X n ) , a funo de verossimilhana
1
n 1
L( X 1 , X 2 , K , X n ; ) = (2 ) 2
exp ( X i ) 2 =
i =1 2
n
1
= (2 ) 2
exp ( X i ) 2
2
Ento
n 1
ln L = ln 2 ( X i ) 2
2 2
Segue-se que
d ln L
= ( X i )
d
2
A demonstrao pode ser encontrada em Theil (1971), p. 384-387.
33
d 2 ln L
= n
d 2
De acordo com (1.19), obtemos
1
V ( m)
n
onde m qualquer estimador no-tendencioso de . Sabemos que, com 2 = 1 , a

varincia de X igual a 1/n, isto , a mdia aritmtica dos valores da amostra um
estimador com varincia igual ao limite inferior de Cramr-Rao.
Convm ressaltar que h casos nos quais o limite inferior de Cramr-Rao no
atingido, isto , h casos onde no existe estimador no-tendencioso com varincia igual
ao limite inferior de Cramr-Rao.
Entretanto, existe um teorema que afirma, em condies bastante gerais, que, se
o estimador de mxima verossimilhana de ento apresenta distribuio
assintoticamente normal com mdia e varincia igual ao limite inferior de Cramr-
Rao, isto , os estimadores de mxima verossimilhana so consistentes e
assintoticamente eficientes.3
1.12. Teste de hipteses
Dada uma hiptese de nulidade ( H o ) , define-se como erro tipo I o erro que
consiste em rejeitar H o , dado que H o verdadeira. Define-se como erro tipo II o erro
que consiste em no rejeitar H o , dado que H o falsa.
A hiptese da nulidade, quando dada em termos quantitativos, ,

necessariamente, uma igualdade.
Usa-se a letra grega para indicar a probabilidade de cometer erro tipo I, que
o nvel de significncia do teste, e a letra grega para indicar a probabilidade de
cometer erro tipo II.
Podemos definir ainda o poder do teste, que a probabilidade de rejeitar H o ,
dado que H o falsa.
3
A demonstrao deste teorema pode ser encontrada em Theil (1971), p. 392-395.
34
Evidentemente, o poder do teste igual a 1 .
Para exemplificar, consideremos 2 tetraedros regulares, feitos de material
homogneo, sendo que um deles tem uma face azul e 3 brancas e o outro tem 2 faces
azuis e 2 brancas. Quando esses tetraedros so lanados, o resultado considerado
sucesso se a face em contato com a mesa for azul. Ento, a probabilidade de obter
sucesso em um lanamento , para o primeiro tetraedro, p = 1/4 e, para o segundo
tetraedro, p = 1/2.
O nmero (X) de sucessos, obtidos em n lanamentos de um desses tetraedros
uma varivel aleatria discreta com distribuio binomial. A tabela 1.9 apresenta a
distribuio de X para cada um dos dois tetraedros, no caso de n = 2 lanamentos.
TABELA 1.9. Distribuio do nmero de sucessos obtidos em dois lana-

mentos, para cada um dos dois tetraedros
P(X)
X
para p = 1/4 para p = 1/2
0 9/16 1/4
1 6/16 2/4
2 1/16 1/4
Consideremos a seguinte situao: suponhamos que um dos tetraedros (no

sabemos qual) foi lanado duas vezes e que fomos informados sobre o nmero (X) de
sucessos (X pode assumir os valores 0, 1 ou 2); com base nessa informao, devemos
decidir qual dos dois tetraedros foi utilizado, ou seja, devemos decidir entre
H o : p = 1/ 4 e H A : p = 1/ 2
Para a soluo deste problema, devemos proceder a um teste de hipteses. Ento,

antes de conhecer o valor assumido por X, devemos estabelecer a regra de deciso a ser
adotada, isto , devemos estabelecer para que valores de X devemos rejeitar H o . Para
este problema podemos estabelecer qualquer uma das quatro regras de deciso que
constam na tabela 1.10. Nesta tabela tambm so dados os valores de e , relativos a
cada regra de deciso, e a relao , isto , a razo entre o incremento em e o
incremento em , quando se passa de uma regra de deciso para a seguinte.
35
TABELA 1.10. Valores de e relativos s possveis regras de deciso e relao

Regra de deciso
Nunca rejeitar H o 0 1
4
Rejeitar H o se X = 2 1/16 = 0,0625 3/4 = 0,75
4/3
Rejeitar H o se X 1 7/16 = 0,4375 1/4 = 0,25 4/9
Sempre rejeitar H o 1 0
Indiquemos por = ( ) a relao funcional decrescente que existe entre e .

A figura 1.4 mostra essa relao para o problema descrito. Neste exemplo, a funo
= ( ) descontnua porque o teste de hiptese baseado em uma varivel aleatria
discreta. Se o teste de hiptese for baseado em uma varivel aleatria contnua, a funo
= ( ) tambm ser contnua.
Como escolher a regra de deciso, ou seja, como escolher o nvel de
significncia do teste? Isso implica escolher o ponto timo sobre a funo = ( ) .
Admitamos que a probabilidade a priori de H o ser verdadeira seja (Essa

probabilidade deve ser determinada com base em outras informaes que no as que
esto sendo utilizadas para fazer o teste). Ento, podemos obter, como constam na
tabela 1.11, os valores da receita lquida U (num contexto mais geral, os valores U
seriam os nveis de utilidade) associados a cada uma das 4 situaes possveis (quando a
hiptese alternativa simples), e as respectivas probabilidades.
Figura 1.4. Relao entre e
36
TABELA 1.11. A tabela de resultados
Deciso tomada
Situao real
no rejeitar H o rejeitar H o
H o verdadeira U 11 U 12
(probab. = ) p11 = (1 ) p12 =
H o falsa U 21 U 22
(probab. = 1 ) p 21 = (1 ) p 22 = (1 )(1 )
Se todas essas informaes estivessem disponveis, poderamos escolher o nvel

de significncia que maximiza a receita lquida esperada, dada por
L = E (U ) = (1 )U 11 + U 12 + (1 ) U 21 + (1 )(1 )U 22 (1.20)
Essa relao pode ser escrita
U 11 + (1 )U 22 L (U 11 U 12 )
= (1.21)
(1 )(U 22 U 21 ) (1 )(U 22 (U 21 )
A diferena U 11 U 12 = C I > 0 representa o custo de cometer erro tipo I e a
diferena U 22 U 21 = C II > 0 representa o custo de cometer erro tipo II.
Dados os valores de , U 11 , U 12 , U 21 , U 22 , a relao (1.21) corresponde a um

feixe de retas paralelas num sistema de eixos cartesianos com coordenadas e . O
coeficiente angular sempre igual a
C I
(1.22)
(1 )C II
e o coeficiente linear tanto menor quanto maior for o valor de L = E (U ) . Para

maximizar L = E (U ) devemos determinar o ponto de = ( ) que pertena a uma
reta com declividade dada por (1.22) e coeficiente linear mnimo.
Para exemplificar, consideremos a relao = ( ) representada na figura 1.4 e
admitamos que = 0,5 . Neste caso, temos:
37
CI
a) se 4 < < , o ponto timo A, isto , nunca devemos rejeitar H o .
C II
CI
b) se = 4 , indiferente utilizar a regra de deciso correspondente ao ponto
C II
A ou ao ponto B.
4 CI
c) se < < 4 , o ponto timo B, isto , devemos rejeitar H o se X = 2,
3 C II
fazendo um teste com nvel de significncia = 0,0625 .
CI 4
d) se = , indiferente utilizar a regra de deciso correspondente ao ponto
C II 3
B ou ao ponto C.
4 CI 4
e) se < < , o ponto timo C, isto , devemos rejeitar H o se X 1,
9 C II 3
fazendo um teste com nvel de significncia = 0,4375 .
CI 4
f) se = , indiferente utilizar a regra de deciso correspondente ao ponto
C II 9
C ou ao ponto D, e
CI 4
g) se 0 < < , o ponto timo D, isto , devemos rejeitar H o sempre,
C II 9
qualquer que seja o valor observado de X.
Se a funo = ( ) for contnua, o ponto que maximiza a receita lquida pode

ser determinado igualando a zero a derivada de L em relao a .
De (1.20) obtemos
dL d
= (U 11 U 12 ) (1 )(U 22 U 21 ) =
d d
d
= C I (1 )C II (1.23)
d
dL
Segue-se que = 0 implica
d
d C I
= (1.24)
d (1 )C II
38
O ponto de = ( ) que satisfaz essa condio corresponde a um mximo de
L = E (U ) se
d 2L
<0
d 2
De (1.23) obtemos
d 2L d 2
= (1 )C ,
d 2 d 2
II
d 2
mostrando que a condio de segunda ordem para mximo satisfeita se > 0 , isto
d 2
, se a funo = ( ) for convexa em relao origem.
Sendo = ( ) uma funo decrescente e convexa em relao origem, o nvel
de significncia timo estabelecido atravs de (1.24) ser tanto menor quanto maior for
CI
(a probabilidade a priori de H o ser verdadeira) e quanto maior for a relao (o
C II
custo de cometer erro tipo I em comparao com o custo de cometer erro tipo II).
Em problemas prticos geralmente impossvel determinar o nvel de
significncia timo da maneira indicada, porque no se tem nem a probabilidade ( ) de
CI
H o ser verdadeira a priori, nem o valor exato da relao . Alm disso, a hiptese
C II
alternativa , geralmente, composta; a determinao rigorosa de um nvel de
significncia timo exigiria, neste caso, o conhecimento da distribuio a priori dos
valores possveis para a hiptese alternativa, com os respectivos valores do custo de
cometer erro tipo II.
Por isso, a escolha do nvel de significncia tem muito de arbitrrio.
A finalidade da discusso feita deixar claro o sentido em que deve ser ajustado
o nvel de significncia conforme mudem a probabilidade a priori de H o ser verdadeira
e a relao entre os custos de cometer erro tipo I e erro tipo II.
usual que a hiptese alternativa no se refira a um valor especfico. comum,
por exemplo, testar se um parmetro igual a zero ( H 0 : = 0) contra a hiptese
alternativa de que diferente de zero ( H A : 0) . Neste caso pode-se fixar o nvel de
39
significncia do teste (), mas o poder do teste (1 ) no um valor nico. Pode-se
construir a curva de poder do teste, que mostra como esse varia em funo de valores
alternativos do parmetro. claro que o poder do teste se aproxima do nvel de
significncia quando o valor alternativo do parmetro se aproxima do valor estabelecido
pela hiptese da nulidade, fazendo com que, fixado um baixo nvel de significncia, o
poder do teste seja baixo para tais valores alternativos do parmetro. Note-se como,
nestas condies, no h simetria entre as decises de rejeitar e aceitar a hiptese da
nulidade. Ao rejeitar a hiptese da nulidade estaremos tomando uma deciso de maneira
que a probabilidade de estar cometendo erro (tipo I) conhecida e pequena. Mas se o
resultado do teste no-significativo e aceitamos a hiptese da nulidade, a
probabilidade de cometer erro tipo II desconhecida e tende a ser elevada para valores
do parmetro prximos ao estabelecido pela hiptese da nulidade. A linguagem usada
na interpretao do resultado de um teste de hipteses deve refletir essa assimetria. Se,
ao testar ( H 0 : = 0) contra ( H A : 0) , o resultado do teste significativo,
rejeitamos a hiptese da nulidade. Se o resultado for no-significativo, a concluso
que os dados da amostra utilizada no permitem rejeitar a hiptese da nulidade. Note-se
a natureza provisria da concluso. A afirmativa de que aceita-se H o no reflete
adequadamente a indeterminao da probabilidade de cometer erro tipo II quando a
hiptese alternativa composta (no estabelece um nico valor alternativo para o
parmetro).
Exerccios
1.1. Seja X o resultado obtido no lanamento de um dado (hexaedro regular) no-

chumbado. Seja Y a soma dos resultados obtidos em 100 lanamentos desse dado.
Determine E(X), V(X), E(Y) e V(Y).
40
1.2. Com base na distribuio conjunta de Valores de para a distribuio
X e Y, apresentada na tabela ao lado, conjunta das variveis e .
determine a E(X), a E(Y), a V(X), a

1 2 3
V(Y) e a cov (X, Y). As variveis X e Y 4 0,3 0 0,3
so independentes? 8 0 0,4 0
1.3. A tabela ao lado mostra a distribuio

Valores de para a distribuio
conjunta de X e Y.
conjunta das variveis e .
a) Essas variveis so
independentes? (Justifique sua
2 4 6
resposta). 4 0,2 0,1 0
5 0,1 0,2 0,1
b) Determine E(X) e E(Y).
6 0 0,1 0,2
c) Determine V(X) e V(Y).
d) Determine cov (X, Y) e a
correlao () entre as duas
variveis.
1.4. Temos duas urnas, aparentemente idnticas, com 63 bolas no interior de cada uma.
Essas bolas so marcadas com nmeros (X) de zero a 5. Na urna A h 2 X bolas
com o nmero X, isto , h uma bola com o no 0, duas bolas com o no 1, 4 bolas
com o no 2, e assim por diante, at 32 bolas com o no 5. Na urna B h 2 5 X bolas
com o nmero X, isto , h 32 bolas com o no 0, 16 bolas com o no 1, 8 bolas com
o no 2, e assim por diante, at uma bola com o no 5. Uma dessas urnas, escolhida
ao acaso, entregue a um estatstico, que deve decidir se a urna A ou se a urna
B, retirando, ao acaso, uma nica bola da urna. Ele especifica a hiptese da
nulidade como
H 0 : trata-se da urna A
e a hiptese alternativa como
H A : trata-se da urna B
O estatstico decide, tambm; que a regra de deciso ser rejeitar H 0 (em favor
de H A ) se a bola retirada da urna apresentar nmero menor do que 3.

Determine: (a) o nvel de significncia do teste; (b) a probabilidade () de
cometer erro tipo II; (c) o poder do teste.
41
Refaa o problema considerando, agora, que a regra de deciso rejeitar H 0 se
o nmero (X) marcado na bola retirada for menor ou igual a 1.
1.5. Temos duas urnas, aparentemente idnticas, com 55 bolas no interior de cada uma.
Na urna A h uma bola com o no 0, duas bolas com o no 1, 3 bolas com o no 2, e
assim por diante, at 10 bolas com o no 9. Na urna B h 1 bola com o no 9, 2 bolas
com o no 8, 3 bolas com o no 7, e assim por diante, at 10 bolas com o no 0. Uma
dessas urnas, escolhida ao acaso, entregue a um estatstico, que deve decidir se
a urna A ou se a urna B examinando uma nica bola retirada da urna, ao acaso.
Ele especifica a hiptese da nulidade como
H 0 : trata-se da urna A
e a hiptese alternativa como
H A : trata-se da urna B
O estatstico adota a seguinte regra de deciso: rejeitar H 0 (em favor de H A ) se
a bola retirada da urna apresentar nmero menor do que 5. Determine:
a) o nvel de significncia do teste
b) a probabilidade () de cometer erro tipo II
c) o poder do teste.
Refaa o problema considerando, agora, que a regra de deciso rejeitar H 0 se
o nmero marcado na bola retirada for menor ou igual a 3.
1.6. Temos dois tetraedros regulares de material homogneo. Um deles tem uma face
azul e trs faces brancas. O outro tem trs faces azuis e uma branca. Uma pessoa
pega, ao acaso, um desses tetraedros e o lana n vezes. Seja X o nmero de vezes
em que o resultado foi face azul. Com base no valor de X devemos testar a
hiptese
H 0 : foi utilizado o tetraedro com uma face azul
contra a hiptese alternativa
H A : foi utilizado o tetraedro com trs faces azuis
Seja o nvel de significncia do teste e seja a probabilidade de cometer erro

tipo II.
42
a) Considerando as diferentes regras de deciso, faa uma tabela e um grfico
mostrando como varia em funo de para n = 3.
b) Qual o nvel de significncia para um teste com n = 5, mantendo = ?
Respostas
17,5 1750
1.1. E ( X ) = 3,5 , V ( X ) = = 2,9167 , E(Y) = 350 e V (Y ) = = 291,67
6 6
1.2. E(X) = 2, E(Y) = 5,6 , V(X) = 0,6 , V(Y) = 3,84, cov (X, Y) = 0. As variveis X e
Y no so independentes.
1.3. a) No b) E(X) = 4 e E(Y) = 5 b) V(X) = 2,4 e V(Y) = 0,6

c) cov (X, Y) = 0,8 e = 0,667.
1.4. Para a regra de deciso Rejeitar H 0 se X < 3 obtemos = 7/63 = 1/9 = 0,111,
= 1/9 = 0,111 e 1 = 8/9 = 0,889

Para a regra de deciso Rejeitar H 0 se X 1 obtemos = 3/63 = 1/21 = 0,0476,
= 15/63 = 5/21 = 0,238 e 1 = 16/21 = 0,762.
1.5. Rejeitar H 0 se nmero < 5: = 3/11, = 3/11 e 1 = 8/11.
Rejeitar H 0 se nmero 3: = 2/11, = 21/55 e 1 = 34/55.
1.6.
a) Regra de deciso:
rejeitar H 0 : p = 1 / 4 se
X 0 (sempre) 1 0
X1 37/64 1/64
X2 10/64 10/64
X3 1/64 37/64
X > 3 (nunca) 0 1
53
b) = = = 0,1035
512
43
2. REGRESSO LINEAR SIMPLES
2.1. O modelo estatstico de uma regresso linear simples
Dados n pares de valores de duas variveis, X i , Yi (com i = 1, 2, ..., n), se

admitirmos que Y funo linear de X, podemos estabelecer uma regresso linear
simples, cujo modelo estatstico
Yi = + X i + u i ,
onde e so parmetros, X a varivel explanatria e Y a varivel dependente.

O coeficiente angular da reta () tambm denominado coeficiente de regresso
e o coeficiente linear da reta () tambm conhecido como termo constante da equao
de regresso.
A anlise de regresso tambm pode ser aplicada s relaes no-lineares.
Inicialmente, estudaremos apenas o caso da reta. Veremos adiante o caso das relaes
no-lineares.
Ao estabelecer o modelo de regresso linear simples, pressupomos que:
I) A relao entre X e Y linear.
II) Os valores de X so fixos, isto , X no uma varivel aleatria.
III) A mdia do erro nula, isto , E (u i ) = 0 .
IV) Para um dado valor de X, a varincia do erro u sempre 2 ,

denominada varincia residual, isto ,
E (u i2 ) = 2
ou
E[Yi E (Yi | X i )] 2 = 2
Dizemos, ento, que o erro homocedstico ou que temos homocedasticia (do

erro ou da varivel dependente).
V) O erro de uma observao no-correlacionado com o erro em outra

observao, isto , E (u i u j ) = 0 para i j.
44
VI) Os erros tm distribuio normal.
Combinando as pressuposies III, IV e VI, temos que
ui ~ N (0, 2 )
Devemos, ainda, verificar se o nmero de observaes disponveis maior do

que o nmero de parmetros da equao de regresso. Para ajustar uma regresso linear
simples precisamos ter, no mnimo, 3 observaes. Se s dispomos de 2 observaes (2
pontos), a determinao da reta um problema de geometria analtica; no possvel,
neste caso, fazer nenhuma anlise estatstica.
Veremos adiante que as pressuposies I, II e III so necessrias para que se
possa demonstrar que as estimativas dos parmetros obtidas pelo mtodo dos mnimos
quadrados so no-tendenciosas ou imparciais, isto , que
E (a ) =
E (b) =
onde a e b so as estimativas de mnimos quadrados de e , respectivamente.

Veremos tambm que, com base nas cinco primeiras pressuposies, possvel
demonstrar que as estimativas dos parmetros obtidas pelo mtodo dos mnimos
quadrados so estimativas lineares no-tendenciosas de varincia mnima.
interessante assinalar que a pressuposio II no , na verdade, essencial.
Veremos, no fim deste captulo, que em certas condies, se X for uma varivel
aleatria, os resultados obtidos pressupondo que os valores de X so fixos continuam
vlidos. Entretanto, tendo em vista a simplicidade das demonstraes de vrios
teoremas, essa pressuposio ser adotada durante a maioria das sees do captulo.
Devemos observar que, se os pares de valores X i , Yi (com i = 1, 2, ..., n) foram obtidos
experimentalmente e X uma varivel controlada (fixada) pelo pesquisador, a
pressuposio II vlida.
A pressuposio III exclui, por exemplo, a existncia de erros sistemticos de
medida da varivel Y.
45
Quando no razovel supor que os erros so homocedsticos (pressuposio
IV), isto , quando existe heterocedasticia, devemos utilizar o mtodo dos mnimos
quadrados ponderados, que ser examinado no captulo 6.
Na figura 2.1 est representado o modelo estatstico de uma regresso linear
simples, considerando as pressuposies de I a IV. As pressuposies I, II e III
permitem escrever
E (Yi ) = + X i ,
ou seja, as mdias das distribuies de Y | X esto sobre a reta + X .

pressuposio IV corresponde, na figura 2.1, o fato de as distribuies de Y para
diferentes valores de X apresentarem todas a mesma disperso.
Figura 2.1. Representao do modelo estatstico de uma regresso linear simples.
Se os pares de valores X i , Yi foram obtidos atravs de amostragem aleatria de

uma populao infinita, fica garantida a independncia entre observaes. Se, alm
disso, a esperana do erro igual a zero, temos, com i j,
E (u i u j ) = E (u i ) E (u j ) = 0
Entretanto, a pressuposio V geralmente no obedecida quando trabalhamos

com sries cronolgicas de dados. Dizemos, ento, que h autocorrelao nos resduos.
Temos autocorrelao positiva se E (u i u i +1 ) > 0 e autocorrelao negativa se
E (u i u i +1 ) < 0 . No captulo 7 veremos os mtodos que podem ser utilizados quando h

autocorrelao nos resduos.
46
A pressuposio VI necessria para que possamos utilizar as distribuies de t
e de F para testar hipteses a respeito dos valores dos parmetros ou construir intervalos
de confiana. Em alguns casos, possvel justificar essa pressuposio com base no
teorema do limite central. Esse teorema, na sua verso mais geral, estabelece que a
soma de um grande nmero de variveis aleatrias independentes tem distribuio
aproximadamente normal, desde que nenhuma delas seja dominante. Vimos que o erro
(u i ) do modelo estatstico de uma regresso linear pode ser devido influncia de
todas as variveis que afetam a varivel dependente e que no foram includas no
modelo. Uma vez que as variveis que no foram consideradas devem ser as menos
importantes, seus efeitos devem ser todos relativamente pequenos. Considerando que o
nmero de fatores que podem afetar certa varivel dependente bastante grande, e
desde que seus efeitos sejam aditivos e independentes, podemos concluir, com base no
teorema do limite central, que o erro residual tem distribuio aproximadamente
normal.
2.2. Estimativa dos parmetros
O primeiro passo, na anlise de regresso, obter as estimativas a e b dos

parmetros e da regresso. Os valores dessas estimativas sero obtidos a partir de
uma amostra de n pares de valores X i , Yi (com i = 1, 2, ..., n), que correspondem a n
pontos num grfico.
Obtemos, ento
Yi = a + bX i
onde Yi , a e b so, respectivamente estimativas de E (Yi ) = + X i , e .
Para cada par de valores X i , Yi podemos estabelecer o desvio
ei = Yi Yi = Yi (a + bX i )
O mtodo dos mnimos quadrados consiste em adotar como estimativas dos

parmetros os valores que minimizam a soma dos quadrados dos desvios
n n
Z = e i2 = [Yi ( a + bX i )] 2
i =1 i =1
47
A funo Z ter mnimo quando suas derivadas parciais em relao a a e b forem
nulas:
Z
= 2 [Yi ( a + bX i )] = 0 (2.1)
a
Z
= 2 [Yi ( a + bX i )] ( X i ) = 0 (2.2)
b
Por se tratar de uma soma de quadrados de desvios, o ponto extremo ser

necessariamente um ponto de mnimo da funo. Formalmente, pode-se verificar que as
condies de segunda ordem para mnimo so satisfeitas.
Simplificando as equaes (2.1) e (2.2), chegamos ao sistema de equaes
normais
na + b X i = Yi (2.3)

a X i + b X i = X i Yi (2.4)
2
Resolvendo o sistema, obtemos:
( X 2 )( Y ) ( X )( XY )
a=
n( X 2 ) ( X ) 2
n XY ( X )( Y )
b=
n X 2 ( X ) 2
Note que, por simplicidade, omitimos o ndice. Para sermos explcitos

n
deveramos escrever, por exemplo, X
i =1
i , onde escrevemos, simplesmente, X .
Na prtica determinamos b em primeiro lugar e da equao (2.3) obtemos
Y X
a= b
n n
ou
a = Y bX
48
fcil verificar que a frmula para o clculo de b pode ser escrita de diversos
modos, quais sejam:
( X )( Y )
XY
n XY ( X )( Y ) n
b= = =
n X 2 ( X ) 2 ( X )2
X
2
( X X )(Y Y ) ( X X )Y
= = =
( X X ) 2 ( X X ) 2
X (Y Y ) xy xY Xy
= = = =
( X X ) 2 x 2 x 2 x 2
onde
X Y
X = ,Y = , x = X X e y = Y Y
n n
Assinalemos duas relaes bastante teis que podem ser obtidas a partir das
equaes (2.1) e (2.2). Lembrando que
Yi (a + bX i ) = Yi Yi = ei , tais equaes ficam:
ei = 0 (2.5)
X i ei = 0 (2.6)
Temos, tambm, que
Yi ei = (a + bX i )ei = a ei + b X i ei
De acordo com (2.5) e (2.6), conclumos que
Yi ei = 0 (2.7)
As relaes (2.5), (2.6) e (2.7) mostram, respectivamente, que
49
a) a soma dos desvios igual a zero,
b) a soma dos produtos dos desvios pelos correspondentes valores da varivel
independente igual a zero, e
c) a soma dos produtos dos desvios pelos respectivos valores estimados da
varivel dependente igual a zero.
Estas relaes podem ser utilizadas para verificar se as estimativas dos

parmetros foram corretamente calculadas e para verificar o efeito dos erros de
arredondamento.
Como Yi = Yi + ei , de (2.5) conclumos que
Yi Yi
= =Y , (2.8)
n n
isto , a mdia dos valores observados de Y igual mdia dos valores estimados de Y.
2.3. O modelo simplificado e um exemplo numrico
Uma simplificao conveniente dos clculos obtida quando usamos a varivel

centrada x i = X i X . Na representao grfica, isso corresponde a tomar a mdia da
varivel X i como origem do eixo das abcissas. Nesse caso, o modelo estatstico fica
Yi = A + x i + u i
Representando por A a estimativa de mnimos quadrados do parmetro A, temos
Yi = A + bxi + ei
Como x i = 0 , as equaes normais ficam
nA = Yi

b xi = xi Yi
2
Donde
Y
A = =Y
n
50
e
xY
b=
x2
Ento a reta de regresso estimada
Yi = Y + bx i
ou
y i = bx i (2.9)
onde
y i = Yi Y
Temos
y i ei = (Yi Y )ei = Yi ei Y ei
Lembrando (2.5) e (2.7) conclumos que
y i e i = 0 (2.10)
Para exemplificar, consideremos a amostra de 10 pares de valores X i , Yi da

tabela 2.1, representados graficamente na figura 2.2.
TABELA 2.1. Valores de X i e Yi (i = 1, ..., 10)
X Y X Y
0 3 3 4
1 2 4 7
1 3 5 6
2 5 5 7
3 4 6 9
Os nmeros apresentados so artificiais e foram escolhidos de maneira a

simplificar os clculos. O estudante de economia pode imaginar, por exemplo, que Y o
custo total de produo correspondente quantidade produzida X, para empresas de
certa indstria; esse estudante poder verificar que, neste caso, representa o custo
fixo (custo existente mesmo quando X = 0) e representa o custo marginal. Tambm
possvel imaginar que Y a quantidade de algum produto oferecida em certo mercado, e
51
X o respectivo preo, ou ainda, que Y o logaritmo do consumo semanal de carne de
uma famlia e X o logaritmo da renda mensal dessa famlia.
So dados, a seguir, os resultados de alguns clculos intermedirios para a
obteno das estimativas a e b.
X = 30 , X = 3
X 2 = 126
( X ) 2
x2 = X 2 = 126 90 = 36
n
Y = 50 , Y = 5
XY = 186
( X )( Y )
xy = XY = 186 150 = 36
n
Destes resultados obtemos

xy 36
b= = =1
x 2 36
a = Y bX = 5 3 = 2
Figura 2.2. Representao grfica dos pares de valores da tabela 2.1, a reta
ajustada (Y = a + bX ) e a reta verdadeira [ E (Y ) = + X ] .
A reta de regresso estimada
Y = 5 + x
52
ou
Y = 2 + X
2.4. Demonstrao de que os estimadores de mnimos quadrados so

estimadores lineares no-tendenciosos
xi Y
Demonstraremos, inicialmente, que b= um estimador linear no-
x i2
tendencioso de .
Temos que
xi Y x1 x2 xn
b= = Y1 + Y2 + K + Yn
x 2
i x 2
i x 2
i x i2
Uma vez que os valores de X i so fixos, de acordo com a pressuposio II,
xi
so, tambm, valores fixos. Ento, b uma combinao linear dos valores de Yi .
x i2
Como
Yi = + X i + u i ,
obtemos
1
b= x i ( + X i + u i ) =
x i2
=
1
(
xi + xi X i + xi u i )
x i2
Como x i = 0 e x i2 = x i X i ,
xi u i
b=+ (2.11)
x i2
Lembrando que, de acordo com a pressuposio III, E (u i ) = 0 , obtemos
53
E (b) =
xi Y
isto , b = um estimador no-tendenciosos ou imparcial de .
x i2
Demonstraremos, agora, que
a = Y bX
um estimador linear no-tendenciosos de .
Temos que
Yi xi Y 1 Xx i
a = Y bX = X = Yi

n xi 2
n xi
2

Essa ltima expresso mostra que a uma funo linear dos valores de Yi .
Como
Yi = + X i + u i ,
obtemos
1 Xx i
a = ( + X i + u i ) =

n xi
2

X x i Xi X xi X i 1 Xx i
= + + u i

x 2
i
n xi
2
n xi
2

e, como x i = 0 e x i2 = x i X i ,
1 Xx i
a = + u i
(2.12)
n xi
2

Lembrando que E (u i ) = 0 , obtemos
E (a ) =
isto , a = Y bX um estimador no-tendencioso de .
54
2.5. Varincias e covarincias das estimativas dos parmetros
Determinaremos, inicialmente, a expresso da varincia de b.

Como E (b) = , por definio temos
V (b) = E (b ) 2 (2.13)
De (2.11), obtemos
xi ui
b =
x i2
Substituindo esse resultado em (2.13), obtemos

E ( x i u i ) 2
V (b) =
( x i2 ) 2
Mas
E ( x i u i ) 2 = E ( x1 u 1 + x 2 u 2 + K + x n u n ) 2 =
= E ( x12 u12 + x 22 u 22 + K + x n2 u n2 + 2 x1 x2 u1u 2 +
+ K + 2 x1 x n u1u n + K) =
= x12 2 + x 22 2 + K + x n2 2 =
= 2 x i2 (2.14)
uma vez que, de acordo com as pressuposies IV e V, E (u i2 ) = 2 e E (u i u j ) = 0 , para
i j.
Ento
2 x i2 2
V (b) = = (2.15)
( x i2 ) 2 x i2
Determinemos, a seguir, a varincia de a
De (2.12) segue-se que
1 Xx i
a = u i

n xi
2

55
Ento
2
1 Xx i
V (a ) = E (a ) 2 = E u i

n x i
2

Lembrando que E (u i2 ) = 2 e E (u i u j ) = 0 , para i j, podemos obter
2
1 Xx i 2
V (a ) = =

n xi
2

1 X 2 x i2 2 Xx i 2

= 2 + =
( x i2 ) 2 n x i2
n
1 X 2 2
= + (2.16)

n xi
2

Notando que
( X i ) 2
x =X
2
i i
2
= X i2 nX 2
n
tambm podemos obter
X i2 2
V (a) = (2.17)
n xi2
Antes de deduzir a expresso da covarincia entre a e b, determinemos as

varincias e covarincias das estimativas dos parmetros do modelo simplificado
analisado na seo 2.3. Vimos ali que essas estimativas so
xY
A = Y e b =
x2
Temos que
Yi ( + X i + u i )
Y = = = + X + u
n n
onde u = ( u i ) n
Como E (u ) = 0 , podemos escrever
E (Y ) = + X
56
Ento, fcil verificar que
Y E (Y ) = u , (2.18)
donde obtemos
2
ui
V (Y ) = E[Y E (Y )] = E (u ) = E
2 2

n
e, finalmente,
n 2 2
V (Y ) = = (2.19)
n2 n
Determinemos agora a covarincia entre Y e b
cov(Y , b) = E[Y E (Y )] (b )
Considerando (2.11) e (2.18), obtemos
xi u i E ( u i xi u i )
cov(Y , b) = E u 2
= =
xi n xi2
E (u1 + u 2 + K + u n )( x1u1 + x 2 u 2 + K + x n u n )
= =
n xi2
E[ x1 (u12 + u1u 2 + K + u1u n ) + x 2 (u 2 u1 + u 22 + K + u 2 u n ) + K]

=
n xi2
Lembrando que E (u i2 ) = 2 e E (u i u j ) = 0 , para i j, segue-se que
2 xi
cov(Y , b) = =0 (2.20)
n xi2
Determinemos, finalmente, a covarincia entre a e b.

Como a = Y bX , temos, de acordo com as propriedades da covarincia dadas
na seo 1.5, que
cov(a, b) = cov(Y , b) XV (b)
57
X 2
cov(a, b) = (2.21)
xi2

varincia mnima
Consideremos um estimador linear qualquer de ,
B = ci Yi
Para que esse estimador seja no-tendencioso, isto , para que tenhamos
E (B ) = , as constantes c i devem ter certas propriedades, que sero deduzidas a
seguir.
Temos
B = ci Yi =
= ci ( + X i + u i ) =
= c i + c i X i + ci u i (2.22)
Lembrando que E (u i ) = 0 , podemos escrever
E ( B ) = ci + ci X i
Para termos E (B ) = , necessariamente
ci = 0 (2.23)
ci X i = 1 (2.24)
Nestas condies e de acordo com (2.22), temos que
B = + ci u i
ou
58
B = ci u i
Ento,
V ( B) = E ( B ) 2 = E ( c i u i ) 2
Lembrando que E (u i2 ) = 2 e E (u i u j ) = 0 para i j, obtemos
V ( B ) = 2 c i2
Nosso problema determinar os valores de ci que minimizem V (B ) , ou seja,
que minimizem ci2 , sujeitos s condies (2.23) e (2.24). Aplicando o mtodo do

multiplicador de Lagrange, definimos a funo
F = c i2 ci ( ci X i 1)
No ponto de mnimo condicionado devemos ter
F
= 2ci X i = 0 (2.25)
ci
para i = 1, 2, ..., n
Somando essas n igualdades obtemos
2 c i n X i = 0
Pela condio (2.23) segue-se que
+ X = 0
Adicionando essa igualdade a cada uma das relaes em (2.25) obtemos
2c i ( X i X ) = 0
2ci = xi

ci = xi , para i = 1, 2, ..., n (2.26)
2
59
Multiplicando cada uma dessas relaes pelo respectivo valor de X i e somando,
obtemos

ci X i = xi X i = xi2
2 2
Lembrando a condio (2.24), segue-se que

1= xi2
2
ou
1
=
2 x i2
xi
ci = , i = 1, 2, ..., n
xi2
Conclumos ento que o estimador linear no-tendencioso de varincia mnima
que procuramos
xi Yi
B = ci Yi = ,
xi2
que o estimador de mnimos quadrados.

Demonstrao anloga pode ser feita em relao estimativa do parmetro .
Conclumos, ento, que os estimadores dos parmetros de uma regresso linear simples,
obtidos pelo mtodo dos mnimos quadrados, so estimadores lineares no-tendenciosos
de varincia mnima. Esse um caso particular do teorema de Gauss-Markov. Note que
esse resultado depende de certas pressuposies a respeito do erro do modelo
(pressuposies III a V).
2.7. Decomposio da soma de quadrados total
Demonstraremos que
60
(Yi Y ) 2 = (Yi Yi ) 2 + (Yi Y ) 2
ou
y i2 = ei2 + y i2 ,
isto , que a soma de quadrados total (S.Q.Total) igual soma de quadrados residual
(S.Q.Res.), tambm chamada soma de quadrados dos desvios, mais a soma de
quadrados da regresso (S.Q.Regr.).
Partimos da identidade
Yi Y = Yi Yi + Yi Y
ou
yi = ei + y i
Elevando ao quadrado e somando, obtemos
y i2 = ei2 + y i2 + 2 y i ei
Lembrando (2.10), conclumos que
y i2 = ei2 + y i2 (2.27)
Essa relao mostra que a variao dos valores de Y em torno da sua mdia
( y i2 ) pode ser dividida em duas partes: uma ( y i2 ) que explicada pela regresso
e outra ( ei2 ) devida ao fato de que nem todos os pontos esto sobre a reta de
regresso, que a parte no explicada pela regresso. O coeficiente de determinao,
definido por
S.Q.Regr. y i2
r2 = = ,
S.Q.Total y i2
indica a proporo da variao de Y que explicada pela regresso. Note que

0 r 2 1.
61
Se estamos interessados em estimar valores de Y a partir de valores de X, a
regresso ser tanto mais til quanto mais prximo de um estiver o valor de r 2 .
Verificamos, facilmente, que
y i2 2 x
2
( xy ) 2
r2 = = b = (2.28)
y i2 y 2 ( x 2 )( y 2 )
e que
( xy ) 2
S.Q.Regr. = y 2 = b 2 x 2 = b xy =
x2
Vamos, agora, verificar a decomposio da soma de quadrados total e calcular o

valor do coeficiente de determinao para o exemplo apresentado anteriormente.
Da tabela 2.1 obtemos
( Y ) 2
S.Q.Total = y 2 = Y 2 = 294 250 = 44
n
S.Q.Regr. = b xy = 36
S.Q.Res. = S.Q.Total S.Q.Regr. = 44 36 = 8
Esta a maneira usual de obter os valores das vrias somas de quadrados. Para
que o aluno compreenda melhor o que est sendo feito, vamos calcular a S.Q.Regr. e a
S.Q.Res. diretamente da sua definio; para isso precisamos obter, inicialmente, os
valores de Yi e ei = Yi Yi , apresentados na tabela 2.2.

As relaes (2.5), (2.6), (2.7) e (2.10), deduzidas anteriormente, que so
ei = 0 , X i ei = 0 , Yi ei = 0 e y i ei = 0 , so facilmente verificadas neste

exemplo.
Como a soma dos desvios nula, a mdia aritmtica de Yi Y = 5 . Obtidos os
valores y i = Yi Y , calculamos
S.Q.Regr. = y i2 = 36 ,
que o mesmo valor obtido anteriormente, pela expresso
S.Q.Regr. = b xy
62
TABELA 2.2. Valores de X i , Yi , Yi , y i e ei
Xi Yi Yi = 2 + X yi ei = Yi Yi
0 3 2 3 +1
1 2 3 2 1
1 3 3 2 0
2 5 4 1 +1
3 4 5 0 1
3 4 5 0 1
4 7 6 +1 +1
5 6 7 +2 1
5 7 7 +2 0
6 9 8 +3 +1
O valor da soma de quadrados residual, obtido anteriormente por diferena, pode

agora ser obtido diretamente:
S.Q.Res. = ei2 = 8
O leitor pode verificar que aplicando qualquer uma das frmulas de (2.28) o
valor do coeficiente de determinao obtido
9
r2 = = 0,818 ou 81,8%
11
2.8. Esperanas das somas de quadrados
Vejamos, inicialmente, a esperana da soma de quadrados de regresso.

Temos
Yi = + X i + u i
e
Y = + X + u
Subtraindo esta equao da anterior, obtemos
y i = x i + u i u (2.29)
63
Sabemos que
( xi y i ) 2
S.Q.Regr. = b xi y i =
xi2
Aplicando esperana temos
E ( xi y i ) 2
E (S.Q.Regr.) = (2.30)
xi2
De (2.29) podemos obter
xi y i = xi2 + xi u i u xi = xi2 + xi u i
Ento
( x i y i ) 2 = 2 ( xi2 ) 2 + ( xi u i ) 2 + 2 x i2 xi u i
Aplicando esperana, vem
E ( x i y i ) 2 = 2 ( xi2 ) 2 + 2 xi2 (2.31)

E (S.Q.Regr. ) = 2 x i2 + 2 (2.32)
Determinemos, a seguir, a esperana da soma de quadrados total.
J vimos que
S.Q.Total = y i2
Considerando (2.29), segue-se que
S.Q.Total = ( xi + u i u ) 2 =
= [ 2 xi2 + (u i u ) 2 + 2 x i (u i u )] =
= 2 xi2 + (u i u ) 2 + 2 xi u i 2 u xi =
= 2 xi2 + (u i u ) 2 + 2 xi u i
Donde
E (S.Q.Total ) = 2 xi2 + E[ (u i u ) 2 ] (2.33)
Mas
(u i u ) 2 = (u i2 + u 2 2u i u ) =
64
2
ui ( u i ) 2
= u + n
2
i 2 =
n n
( u i ) 2
= u 2
i
n
Ento
n 2
E[(u i u ) 2 ] = n 2 = (n 1) 2
n
Substituindo esse resultado em (2.33) obtemos
E (S.Q.Total) = 2 xi2 + ( n 1) 2 (2.34)

Resta determinar a esperana da soma de quadrados residual.
Como
S.Q.Res. = S.Q.Total S.Q.Regr.,
temos
E(S.Q.Res.) = E(S.Q.Total) E(S.Q.Regr.)
De acordo com (2.32) e (2.34) segue-se que
E(S.Q.Res.) = (n 2) 2 (2.35)
2.9. Anlise de varincia da regresso
Os valores das esperanas das somas de quadrados, deduzidas no item anterior,

justificam que se associe s somas de quadrados total, de regresso e residual n 1, 1 e
n 2 graus de liberdade, respectivamente.
Por definio, os quadrados mdios so obtidos dividindo as somas de
quadrados pelos respectivos graus de liberdade.
Ento, para o caso de uma regresso linear simples, temos
Q.M.Regr. = SQ.Regr.
e
SQ.Res.
Q.M.Res. =
n2
Lembrando (2.32) e (2.35), obtemos
65
E (Q.M.Regr.) = 2 xi2 + 2
E (Q.M.Res.) = 2
De posse destes resultados, podemos conduzir a anlise de varincia da

regresso linear simples, conforme o esquema seguinte:
Anlise da Varincia
Causas de Graus de Somas de Quadrados Mdios
Variao Liberdade Quadrados
Regresso 1 b xi y i b xi y i
Resduo n2 y i2 b x i y i ( y i2 b xi y i ) /( n 2)
Total n1 y i2
Considerando as diferentes amostras aleatrias de tamanho n que poderiam ser

obtidas a partir da populao de pares de valores (X, Y), e sendo verdadeiras as 6
pressuposies dada na seo 2.1, conclumos que:
a) o Q.M.Res. uma estimativa no-tendenciosa da varincia do erro ( 2 )
b) o Q.M.Regr. , em mdia, igual a essa mesma varincia residual ( 2 ) somada
ao produto de xi2 pelo quadrado do parmetro . claro que se = 0, o
Q.M.Regr. , em mdia, igual a 2

No faremos aqui, mas pode-se demonstrar que, se os erros tm distribuio
normal e se = 0, o cociente
Q.M.Regr.
F=
Q.M.Res.
tem distribuio de F com 1 e n 2 graus de liberdade.

Ento, para testar a hiptese
H0 : = 0,
66
ao nvel de significncia adotado, podemos utilizar a estatstica F. Nesse caso, o
procedimento consiste em rejeitar H 0 para todo F maior ou igual ao F crtico, com 1 e
n 2 graus de liberdade, relativo ao nvel de significncia adotado.
Note que, se essa hiptese verdadeira, tanto o Q.M.Regr. como o Q.M.Res.
so, em mdia, iguais a 2 e o valor de F tende a 1. Para 0 teremos
E (Q.M.Regr.) > E (Q.M.Res.) , e o valor de F tende a ser superior a 1.
Para ilustrar a aplicao desses conceitos, voltemos a considerar o exemplo
numrico da tabela 2.1. Para este exemplo, obtemos a seguinte tabela de anlise da
varincia:
Anlise da Varincia
C.V. G.L. S.Q. Q.M. F
Regresso 1 36 36 36
Resduo 8 8 1
Total 9 44
Ao nvel de significncia de 5% e para 1 e 8 graus de liberdade, o valor crtico

de F 5,32 (ver tabela de valores crticos de F). O valor de F calculado, sendo superior
ao valor crtico, significativo ao nvel de 5%. Conseqentemente, rejeitamos a
hiptese H 0 : = 0 em favor da hiptese alternativa H A : 0 , a esse nvel de
significncia.
Um bom programa de anlise de regresso para computador, alm de calcular o
valor de F, apresenta, ao lado, a probabilidade de, na distribuio terica, ocorrer um
valor de F maior do que o calculado. Trata-se da probabilidade associada cauda da
distribuio, acima do valor calculado. Parece apropriado denomin-la probabilidade
caudal do teste.4 Conhecendo essa probabilidade caudal, para saber se o resultado do
teste ou no significativo, basta compar-lo com o nvel de significncia adotado. O
resultado significativo sempre que a probabilidade caudal for igual ou menor do que o
nvel de significncia. Torna-se desnecessrio, ento, obter o valor crtico da tabela
apropriada. Para o exemplo numrico apresentado, o computador informa que a
probabilidade caudal associada ao valor 36, na distribuio de F com 1 e 8 graus de
4
Nos textos em ingls essa probabilidade denominada p-value, o que tem sido traduzido por valor-
p.
67
liberdade, 0,0003. O valor calculado , portanto, significativo ao nvel de 5% (
significativo mesmo que tivesse sido adotado um nvel de significncia de 0,1%).
2.10. O coeficiente de determinao corrigido para graus de liberdade e o

coeficiente de variao
Na seo 2.7 vimos que o coeficiente de determinao uma medida descritiva

da qualidade do ajustamento obtido. Entretanto, o valor do coeficiente de determinao
depende do nmero de observaes da amostra, tendendo a crescer quando n diminui;
no limite, para n 2, teramos sempre r 2 = 1 , pois dois pontos determinam uma reta e
os desvios so, portanto, nulos. Veremos a seguir como, numa tentativa de superar esse
inconveniente, definido o coeficiente de determinao corrigido para graus de
liberdade, indicado por r 2 . Sabemos que
S.Q.Regr. S.Q.Res.
1 r2 = 1 =
S.Q.Total S.Q.Total
Considerando o nmero de graus de liberdade associado S.Q.Res. e

S.Q.Total, o coeficiente de determinao corrigido definido por
1
(S.Q.Res.)
n 2 n 1
1 r =
2
= (1 r 2 ) (2.36)
1 n2
(S.Q.Total)
n 1
ou
1
r 2 = r2 (1 r 2 ) (2.37)
n2
Excluindo o caso em que r 2 = 1 , temos r 2 < r 2 . Note que r 2 pode ser negativo.
Um outro indicador da qualidade do ajustamento obtido o coeficiente de
variao, definido por
s
CV = , (2.38)
Y
onde s = Q.M . Re s. . O coeficiente de variao mede a disperso relativa das

observaes, porque, por definio, o cociente entre a medida da disperso dos pontos
68
em torno da reta (s) e o valor mdio da varivel dependente (Y ) . O resultado tanto
melhor quanto menor for o coeficiente de variao.
Veja o exerccio 2.23 para uma anlise comparativa dos valores do coeficiente
de determinao e do coeficiente de variao, em vrios casos.
2.11. Estimativas das varincias das estimativas dos parmetros, teste de

hipteses a respeito dos parmetros e respectivos intervalos de
confiana
Na seo 2.5 deduzimos que
2
V (b) =
xi2
e que
1 X 2 2
V (a) = +
n xi
2

As respectivas estimativas so obtidas substituindo 2 por s 2 = Q.M.Res. , ou

seja,
s2
V (b) = s 2 (b) = (2.39)
xi2
1 X2 2
V (a) = s 2 (a) = + s (2.40)
n xi
2

As estimativas dos desvios padres s(a) e s(b) so obtidas extraindo a raiz

quadrada das respectivas estimativas de varincia.
Demonstra-se que, sendo vlidas as seis pressuposies apresentadas na seo
2.1, inclusive a que estabelece a normalidade da distribuio dos erros, ento os
cocientes
b a
t (b) = e t (a) =
s (b) s (a)
69
tm distribuio de t com n 2 graus de liberdade.
Vamos indicar algumas das etapas da demonstrao no caso de t(b). De (2.11),
obtemos
x
b = i 2 u i ,
xi
mostrando que b uma combinao linear dos u i . Se os erros tm distribuio
normal com mdia zero, segue-se que b tambm tem distribuio normal com mdia
zero. Indicando o desvio padro de b por b = V (b) , conclui-se que
b
Z= ,
b
tem distribuio normal reduzida.

O nmero de graus de liberdade associados a t(b) deve ser relacionado com o
fato de s(b) ser obtido a partir do quadrado mdio residual, que, conforme
demonstramos, tem n 2 graus de liberdade.
Os valores t(b) e t(a) podem ser utilizados para testar hipteses sobre os valores
dos parmetros, como ilustraremos a seguir com base no exemplo numrico que
estamos desenvolvendo.
Calculemos, inicialmente, as estimativas das varincias de b e de a.
s2 1
V (b) = =
xi2
36
1 X2 2 1 9
V (a) = + s = + = 0,35
n xi
2
10 36
As estimativas dos desvios padres so
1
s (b ) =
6
s(a) = 0,35
Para testar a hiptese H 0 : = 0 , contra a hiptese alternativa H A : 0 , ao
nvel de significncia de 5%, calculamos
70
1 0
t (b ) = =6
1/ 6
Para um teste bilateral, o valor crtico de t com 8 graus de liberdade, ao nvel de

significncia de 5%, 2,306 (ver tabela de valores crticos de t). Portanto, o valor
calculado t(b) significativo ao nvel de 5%, ou seja, rejeitamos H 0 em favor de H A , a
esse nvel de significncia.
Note que esse teste perfeitamente equivalente ao teste F feito na anlise de
varincia, uma vez que o valor de F calculado igual ao quadrado do valor de t
calculado e que o valor crtico de F igual ao quadrado do valor crtico de t.
No caso dos testes t, os programas de computador usualmente fornecem a
probabilidade de o valor terico de t ser, em valor absoluto, maior do que o valor
calculado. Trata-se, portanto, de uma probabilidade caudal apropriada para testes
bilaterais. Se o teste de hipteses for unilateral, necessrio dividir por 2 a
probabilidade caudal fornecida pelo computador.
Consideremos, agora, que se deseja testar a hiptese H 0 : = 3 contra a
hiptese alternativa H A : < 3 , ao nvel de significncia de 5%. Para isso calculamos

23
t (a) = = 1,690
0,35
A regio de rejeio para este teste t < 1,860. Como o valor calculado no
pertence a esse intervalo, ele no significativo, ou seja, no rejeitamos, ao nvel de
significncia de 5%, a hiptese H 0 : = 3 .
Tambm podem ser obtidos intervalos de confiana para os parmetros. Sendo

t 0 o valor crtico de t com n 2 graus de liberdade e ao nvel de confiana estabelecido,
os intervalos de confiana para e para so, respectivamente,

b t 0 s (b ) < < b + t 0 s (b )
e
a t 0 s(a) < < a + t 0 s (a)
Vamos determinar, no exemplo numrico que estamos desenvolvendo, o

intervalo de confiana para ao nvel de confiana de 90%. O valor crtico de t para 8
graus de liberdade 1,860. Ento o intervalo de 90% de confiana
71
1 1
1 1,860 < < 1 + 1,860
6 6
0,69 < < 1,31
2.12. Varincia de Yi e intervalo de previso
Vimos na seo 2.3 que
Yi = Y + bxi
Ento
V (Yi ) = V (Y ) + xi2V (b) + 2 xi cov(Y , b)
Considerando (2.15), (2.19) e (2.20), segue-se que
2 xi2 2 1 xi2 2
V (Yi ) = + = + (2.41)
n xi2 n xi2
Donde
1 xi2 2
V (Yi ) = s (Yi ) = +
2
s
n xi
2

Podemos estimar o valor de Y correspondente a um valor de X que no exista na

amostra. Se reservarmos o ndice i para indicar os elementos pertencentes amostra,
devemos introduzir aqui um outro ndice (h) para indicar outros valores de X. O novo
valor, X h , pode coincidir ou no com um dos valores ( X i ) da amostra. Temos
Yh = a + bX h = Y + bxh
e
1 x h2 2
V (Yh ) = s (Yh ) = +
2
s
n xi
2

72
Extraindo a raiz quadrada desse valor obtemos a estimativa dos desvio padro de
Yh . Sendo t 0 o valor crtico de t com n 2 graus de liberdade e ao nvel de confiana
estabelecido, o intervalo de confiana para E (Yh ) = + X h
Yh t 0 s(Yh ) < E (Yh ) < Yh + t 0 s(Yh )
Freqentemente, temos interesse em estimar o valor de uma nova observao

(Yh ) , relativa ao valor de X h da varivel independente, isto , queremos prever o valor
da varivel dependente em uma nova observao com X = X h . O estimador de
Yh = + X h + u h Yh = a + bX h . O erro de previso
Yh Yh = (a ) + (b ) X h u h
Dizemos que Yh uma previso no-tendenciosa do valor de Yh porque a
esperana do erro de previso igual a zero. Verifica-se, tambm, que E (Yh ) = E (Yh ) .
Note, entretanto, que E (Yh ) = + X h Yh .
Para avaliar a preciso Yh como previso do valor da nova observao,

determinamos o intervalo de previso, como mostraremos a seguir. Note, inicialmente,
que tanto Yh como Yh so variveis aleatrias e que, de acordo com a pressuposio V,
suas distribuies so independentes. Uma vez que, para determinado valor ( X h ) da

varivel independente, os valores de Y variam em torno de sua verdadeira mdia, isto ,
em torno de E (Yh ) , com varincia 2 , a varincia que nos interessa
1 x2 2
2 + V (Yh ) = 1 + + h2 (2.42)
n xi
O intervalo de previso para a nova observao ( Yh )
1/ 2 1/ 2
1 x2 2 1 x2 2
Yh t 0 1 + + h 2 s < Yh < Yh + t 0 1 + + h 2 s

n xi n x i
O conceito de intervalo de previso anlogo ao de intervalo de confiana, com

a diferena de que, enquanto o intervalo de confiana se refere a uma constante (o
73
parmetro , por exemplo), o intervalo de previso se refere a uma varivel aleatria (
Yh , no caso).
Consideremos, para exemplificar a aplicao dessas frmulas, os pares de
valores da tabela 2.1. J vimos que para esses dados Y = 5 e b = 1.
Ento
Yh = 5 + xh (2.43)
O valor crtico de t, com 8 graus de liberdade, ao nvel de confiana de 95%,

2,306.
Lembrando que, no exemplo numrico que estamos desenvolvendo, n = 10,
xi2 = 36 e s 2 = 1 , verificamos que os limites do intervalo de confiana para E (Yh ) ,
ao nvel de confiana de 95%, so dados por
1 x h2
Yh 2,306 + (2.44)
10 36
Os limites do intervalo de previso para uma nova observao (Yh ) so dados
por
1 x h2
Yh 2,306 1 + +
(2.45)
10 36
Utilizando as expresses (2.43), (2.44) e (2.45) obtivemos os valores de Yh e os

limites dos intervalos de confiana e de previso que esto na tabela 2.4 e na figura 2.3.
Note que consideramos alguns valores de X fora do intervalo para o qual dispnhamos
de dados, ou seja, estamos fazendo extrapolao.
74
TABELA 2.4 Valores de Yh , limites do intervalo de confiana para E (Yh ) , ao nvel de
confiana de 95%.
Intervalo de confiana Intervalo de previso
Xh Yh para E (Yh ) para Yh
0 2 0,64 3,36 0,68 4,68
1 3 1,94 4,06 0,46 5,54
2 4 3,18 4,82 1,55 6,45
3 5 4,27 5,73 2,58 7,42
4 6 5,18 6,82 3,55 8,45
5 7 5,94 8,06 4,46 9,54
6 8 6,64 9,36 5,32 10,68
7 9 7,30 10,70 6,13 11,87
8 10 7,94 12,06 6,91 13,09
9 11 8,58 13,42 7,66 14,34
A anlise da expresso
1/ 2
1 x h2
Yh t 0 +

2
s,
n x i
que nos d os limites do intervalo de confiana para E (Yh ) , permite afirmar que a
preciso da estimativa de Y tanto maior quanto:
a) menor for s, isto , quanto menor for a disperso dos valores observados de Y
em torno da reta de regresso.
b) maior for n
c) maior for xi2 , isto , quanto maior for a disperso dos valores de X em torno
da respectiva mdia.
Podemos ento concluir que:
a) O nmero de observaes (n) deve ser o maior possvel.
b) Se possvel, devemos escolher valores de X que conduzem a um elevado
valor para xi2 .
Devemos notar, ainda, que o intervalo de confiana aumenta medida que X h se
afasta de X .
75
Figura 2.3. A reta de regresso estimada, o intervalo de confiana para E (Yh ) e o
intervalo de previso para Yh .
Ao fazer uma extrapolao necessrio considerar, ainda, um outro problema,

provavelmente mais srio que o crescimento da amplitude do intervalo de confiana (e
tambm do intervalo de previso) medida que X h se afasta de X . Freqentemente o
modelo (linear) ajustado razovel para o intervalo coberto pela amostra, mas
absolutamente inapropriado para uma extrapolao. A figura 2.4 ilustra a questo. As
observaes da amostra pertencem ao intervalo em que a relao entre E (Y ) e X
aproximadamente linear. Entretanto, se utilizarmos a reta estimada para prever valores
direita desse intervalo, os resultados estaro totalmente fora do alvo.
76
Figura 2.4. O perigo da extrapolao
2.13. O problema da especificao e as funes que se tornam lineares

por anamorfose
Quando aplicamos anlise de regresso ao estudo da relao funcional entre duas

variveis, o problema da especificao consiste em determinar a forma matemtica da
funo que ser ajustada. Podemos escolher, por exemplo:
I) Yi = + X i
II) Yi = X i
III) Yi = X i

IV) Yi = +
Xi
V) Yi = + X i + X i2
VI) Yi = + X i
Onde , , e so parmetros a serem estimados.

A determinao da forma matemtica da funo pode ser feita de duas formas
diferentes, muitas vezes complementares:
a) utilizando o conhecimento que temos a priori sobre o fenmeno.
77
b) Empregando o conhecimento adquirido pela inspeo dos dados numricos
disponveis. muito til fazer um grfico com os pontos (Xi, Yi) e,
eventualmente, grficos com os pontos (ln Xi, Yi), (Xi, lnYi) ou (lnXi, lnYi).
Freqentemente, ajustamos mais de um modelo e escolhemos, com base nos

resultados estatsticos obtidos (coeficientes de determinao, quadrados mdios
residuais etc.), o modelo que melhor se ajusta aos dados.
Admitindo um erro aditivo o modelo I fica
Yi = + X i + u i ,
que o modelo estatstico estudado at aqui.
Mostraremos agora que os modelos II, III e IV so exemplos de modelos no-
lineares que se transformam em funes lineares por anamorfose, isto , por substituio
dos valores de uma ou mais variveis por funes destas variveis.
No caso do modelo II (funo exponencial), admitindo um erro multiplicativo i
, obtemos o modelo estatstico
Yi = X i i
Aplicando logaritmos, obtemos
log Yi = log + X i log + log i
Fazendo
log Yi = Z i ,
log = A ,
log = B
e
log i = u i
temos
Z i = A + BX i + u i
que o modelo estatstico de uma regresso linear simples de Z i = log Yi em relao a
X i . Caso o erro u i = log i obedea s pressuposies dadas na seo 2.1, podemos
aplicar amostra de pares de valores X i e Z i os mtodos de anlise de regresso j

estudados. Obtidas as estimativas dos parmetros A e B fcil determinar as
correspondentes estimativas de e de .
78
No caso do modelo III (funo potncia), conhecido entre economistas como
funo de Cobb-Douglas, o correspondente modelo estatstico
Yi = X i i

log Yi = log + log X i + log i
ou
Z i = A + Vi + u i
onde
Z i = log Yi ,
A = log ,
Vi = log X i
e
u i = log i
Verificamos que a funo potncia corresponde a um modelo de regresso linear

simples nos logaritmos das duas variveis.
Admitindo um erro aditivo o modelo IV (hiprbole) d origem ao seguinte
modelo estatstico

Yi = + + ui
Xi
Basta fazer a anamorfose
1
Vi =
Xi
para obter o modelo de uma regresso linear simples,
Yi = + Vi + u i
Os mtodos de ajustamento dos modelos V e VI sero visto adiante. O modelo V

ajustado como uma regresso mltipla com duas variveis explanatrias e o modelo
VI ser estudado no captulo sobre regresso no-linear.
79
2.14. Estimativa de mxima verossimilhana
Para determinar as estimativas de mxima verossimilhana dos parmetros e

da regresso
Yi = + X i + u i (2.46)
admitiremos que os erros (u i ) so variveis aleatrias independentes com mdia zero,
varincia 2 e distribuio normal, ou seja,
u i N (0, 2 )
Ento, o valor da densidade de probabilidade para certo valor Y1
1 1
f (Y1 ) = exp [Y1 ( + X 1 )] 2
2 2
2
2

Consideremos uma amostra de n pares de valores X i , Yi . Se os valores de X so

fixos e as observaes so independentes, a densidade de probabilidade de o modelo
(2.46) ter gerado tais valores de Yi dada por
L( X 1 ,K , X n ; , , 2 ) =
1

n
1
= (2 2 )
2
exp [Yi ( + X i )]2 =
2
2
i =1
n
1 n

= (2 ) 2 2
exp
2
2 [Y
i =1
i ( + X i )] 2

(2.47)
Os estimadores de mxima verossimilhana de , e 2 so os valores que

maximizam L ( , , 2 | X 1 , K , X n ) , que a funo de verossimilhana. Uma vez que
e s aparecem no expoente negativo de (2.47), conclumos que o mximo dessa

funo corresponde ao mnimo de
[Yi ( + X i )] 2
Portanto, as estimativas de mxima verossimilhana dos parmetros e

coincidem com as estimativas de mnimos quadrados, desde que a distribuio dos erros
seja normal.
80
O leitor pode verificar que a estimativa de mxima verossimilhana de 2
ei2
2 =
n
2.15. Anlise de regresso quando X uma varivel aleatria
Consideremos o modelo
Yi = + X i + u i
onde X uma varivel aleatria cuja distribuio no depende de , ou 2 .
Vamos manter as pressuposies I, III, IV, V e VI, dadas na seo 2.1, e

pressupor ainda que os erros u i so independentes dos valores de X. Ento X i e u i so
no-correlacionados, isto ,
E[( X i X )u i ] = 0 .
Considerando as distribuies condicionais dos Yi (ou dos u i ), dados X i , pode-

se verificar que todos os resultados obtidos so vlidos, desde que interpretados como
condicionados aos valores de X observados.
Entretanto, tais resultados condicionais podem ser insatisfatrios para o
problema em estudo. o caso, por exemplo, de um intervalo de confiana para , vlido
apenas para o conjunto dos valores de X observados.
Devemos salientar, no entanto, que mesmo sendo X uma varivel aleatria, se
forem verdadeiras as pressuposies enunciadas (e crucial que as distribuies de X i
e u i sejam independentes), possvel demonstrar que os estimadores de mnimos

quadrados so no-tendenciosos e coincidem com os estimadores de mxima
verossimilhana. Tambm se demonstra que os procedimentos para a realizao de
testes de hipteses e para a determinao de intervalos de confiana, apresentados na
seo 2.11, continuam vlidos. interessante notar que a interpretao do intervalo de
95% de confiana para , por exemplo, passa a ser a seguinte: para um grande nmero
de amostras, onde tanto os valores de Yi como os valores de X i variam de uma amostra
para outra, em aproximadamente 95% dos casos os intervalos de confiana, obtidos da
maneira indicada na seo 2.11, conteriam o valor verdadeiro ().
81
Exerccios
2.1. dada uma amostra de 10 pares de valores

X Y
2 0
2 0
1 2
1 3
0 4
0 4
1 5
1 6
2 8
2 8
Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo

Yi = + X i + u i , onde os u i so variveis aleatrias independentes com
distribuio normal de mdia zero e varincia 2 .
a) Determine as estimativas dos parmetros da regresso linear.

b) Teste H 0 : = 0 ao nvel de significncia de 5%.
c) Calcule o coeficiente de determinao.
d) Determine a estimativa de Y para X = 3 e o respectivo intervalo de confiana
ao nvel de confiana de 95%.
2.2. Seja b o coeficiente de regresso de Y em relao a X. Seja d o coeficiente de

regresso de Z em relao a X. Sabendo que Z = m + nY , determine a relao
existente entre as estimativa de mnimos quadrados de b e d.
2.3. Demonstre que numa regresso linear simples o valor de F da anlise de

varincia da regresso igual ao quadrado do valor de t(b), relativo hiptese da
nulidade = 0 (onde o coeficiente de regresso).
2.4. Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo

82
So dados os seguintes valores, obtidos de uma amostra aleatria de 14
observaes:
X i = 140 Yi = 728
X i2 = 1456 Yi 2 = 39424
X i Yi = 7504
a) Determine as estimativas dos parmetros da regresso de Y em relao a X e
os respectivos desvios padres.
b) Calcule o coeficiente de determinao da regresso.
c) Teste a hiptese H 0 : = 0 contra a hiptese alternativa H A : > 0 , ao
nvel de significncia de 0,5%.
2.5. dada uma amostra de 5 pares de valores:

X Y
1 3,0
2 7,5
3 7,0
4 11,5
5 11,0


b) Calcule o coeficiente de determinao e faa a anlise de varincia da
regresso, considerando o nvel de significncia de 5%.
c) Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 2 contra a
hiptese alternativa H A : 2 .
d) Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 13 contra a
hiptese alternativa H A : < 13 .

e) Determine a estimativa de Y para X = 5 e o respectivo intervalo de confiana
2.6. So dados os 5 pares de valores:
83
X Y
0 2
2 3
4 14
6 15
8 26
Obtemos X = 20, Y = 60, X 2 = 120, Y 2 = 1110 e XY = 360

Yi = + X i + u i e que so vlidas as pressuposies usuais a respeito dos erros
ui .

b) Calcule o coeficiente de determinao.
c) Verifique se o coeficiente de determinao estatisticamente diferente de
zero ao nvel de significncia de 1%.
d) Teste a hiptese H 0 : = 6 contra a hiptese alternativa H A : > 6 , ao
nvel de significncia de 1%.
e) Teste a hiptese H 0 : = 6 contra a hiptese alternativa H A : 6 , ao
f) Determine o intervalo de previso para uma nova observao de Y com X =
10, ao nvel de confiana de 95%.
2.7. Com base em 52 pares de valores das variveis X e Y foi obtida a equao de
regresso
Yi = 0,4 + X i
A estimativa do desvio padro da estimativa do coeficiente de regresso 0,1.

Calcule o coeficiente de determinao e teste a hiptese de que o coeficiente angular da
equao igual a zero, ao nvel de significncia de 1%.
2.8. Mostre que b um estimador consistente de .
84
2.9. A partir de n pares de valores X i , Yi obtemos, pelo mtodo de mnimos
quadrados, a equao de regresso Yi = a + bX i . Sendo Z i = Yi + X i , temos n
pares de valores Z i , X i , a partir dos quais obtemos a equao de regresso:
Z i = c + dX i
Que relao existe entre b e d? E entre a e c? Sendo b e d as estimativas dos
parmetros e , respectivamente, demonstre que o valor de t relativo hiptese
da nulidade H 0 : = 0 igual ao valor de t relativo hiptese da nulidade
H 0 : = 1 , ou seja, que
b d 1
=
s (b) s (d )
2.10. Dados os pares de valores X e Y abaixo, qual o modelo que voc usaria e como
faria para obter uma relao que lhe permitisse estimar Y a partir de valores de
X?
X Y
10 2,0
12 8,2
14 31,0
16 130,0
18 510,0
2.11. A partir de uma amostra de 27 pares de valores foi obtida a equao de regresso
de Y em relao a X
Y = 25,0 + 2,00 X
Sabendo que s = 1,50 ( s 2 = Q.M.Res. ), que a estimativa do desvio padro de X
s ( X ) = 3,00 e que X = 7,50 ,

a) determine o intervalo de confiana do coeficiente de regresso ao nvel
de confiana de 95%.
b) Teste, ao nvel de significncia de 1%, a hiptese de que o coeficiente de
regresso da populao 1,70.
85
2.12. Para aumentar a preciso da estimativa do coeficiente de regresso, que devemos
fazer com relao escolha dos valores X que sero utilizados na anlise de
regresso?
2.13. Discuta, rapidamente, os problemas relacionados com a extrapolao,

especialmente no campo socioeconmico.
2.14. Suponha que uma fbrica dispe dos seguintes dados:

Quantidade Produzida 105 130 141 159 160 172
Custo (R$) 2042 2301 2421 2518 2606 2718
Por meio de uma anlise de regresso, estabelea:
a) O valor mais provvel dos custos fixos e o respectivo intervalo de confiana,
b) A quantidade para a qual o lucro nulo, admitindo um preo de venda de
R$ 18,00 por unidade.
2.15. Com base em 11 pares de valores das variveis X e Y foi obtida a equao de
regresso
Y = 20 X ,
com r 2 = 0,64 . Sabe-se que a estimativa no-tendenciosa da varincia de X
64. Teste, ao nvel de significncia de 0,5%, a hiptese H 0 : = 0 , contra a
hiptese alternativa H A : > 0 .
2.16. Numa anlise de regresso ( Yi = + X i + u i ) foram obtidos, a partir de uma

amostra de 6 pares de valores X e Y, os seguintes resultados:
16
r2 = ; s(X) = 3; s(Y) = 5; X = 3 e Y = 10
25
a) Determine o intervalo de 95% de confiana para , sabendo que Y uma

funo crescente de X.
b) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 contra a
2.17. Admitindo que as variveis X e Y esto relacionadas conforme o modelo
86

Yi = + + ui ,
Xi
onde u i representa erros aleatrios independentes com mdia zero e varincia
constante, determine as estimativas dos parmetros e , com base nos

seguintes dados:
X Y
12 9,0
15 8,5
20 8,5
30 6,5
60 5,0
2.18. Sejam as variveis X e Y, relacionadas de acordo com o modelo

Yi = + X i + u i
onde u i so erros aleatrios. Dados os resultados abaixo, obtidos de uma amostra

aleatria com 50 observaes,
Yi = 100 Yi 2 = 212 X i Yi = 21
X i = 10 X i2 = 2,1
a) Calcule as estimativas dos parmetros e e as estimativas das respectivas

varincias. Que pressuposies devem ser feitas para que estas estimativas
sejam imparciais e de varincia mnima?
b) Teste as seguintes hipteses ao nvel de significncia de 5%:
I) H 0 : = 2 contra a hiptese alternativa H A : 2
II) H 0 : = 12 contra a hiptese alternativa H A : < 12

Que pressuposio adicional deve ser feita para testar essas hipteses?
c) Calcule o valor do coeficiente de determinao da regresso e interprete o
resultado.
87
2.19. So dados os seguintes valores, obtidos de uma amostra aleatria com 10
observaes:
X Y
0 2,5 3,5
1 1 3
2 2 4
3 0 2
4 0,5 1,5

Yi = + X i + u i , onde u i so variveis aleatrias homocedsticas, normalmente
distribudas e com mdia zero. Pode-se verificar que x 2 = 20 , Y 2 = 55 ,

y 2 = 15 , xY = 10 e Y = 2 .
a) Determine a reta de regresso de Y em relao a X, de acordo com o mtodo
dos mnimos quadrados.
b) Calcule o coeficiente de determinao e verifique se estatisticamente
diferente de zero, atravs do teste F, considerando um nvel de significncia
de 5%.
c) Teste a hiptese H 0 : = 0 contra a hiptese alternativa H A : > 0 , ao
d) Teste a hiptese H 0 : = 1 contra a hiptese alternativa H A : 1 , ao nvel
de significncia de 1%.
e) Determine o intervalo de previso para uma nova observao de Y com
X = 2 + 10 , ao nvel de confiana de 95%.
f) Considere que a equao de regresso obtida a demanda de um produto em
certo mercado, sendo X o preo e Y a quantidade procurada. Se o produto em
questo vendido por um monopolista e seu custo mdio de produo
constante e igual a Cr$ 2,00, que preo o monopolista deve estabelecer para
maximizar sua renda lquida? Estime a quantidade que ser vendida a esse
preo e determine o intervalo de confiana correspondente, ao nvel de
confiana de 95%.
2.20. Seja X a quantidade de certo produto, em milhares de unidades, e Y o respectivo

custo total de produo em milhares de cruzeiros. Admite-se que o custo
marginal seja constante. dada a seguinte amostra de 10 pares de valores
88
(extrados de H.W. GUTHRIE. Statistical Methods in Economics. Richard D.
Irwin, 1966, p. 108-109):
X Y
(1 000 unidades) (Cr$ 1 000,00)
1 7
2 11
3 15
4 14
5 18
6 21
7 23
8 30
9 32
10 34
Pode-se verificar que X = 55, Y = 205, X 2 = 385, Y 2 = 4965 e

XY = 1375 .
a) Estime a funo de custo total.
b) Teste, ao nvel de significncia de 1%, a hiptese de que o custo marginal
nulo.
c) Determine o intervalo de 95% de confiana para o valor dos custos fixos.
d) Calcule o coeficiente de determinao da regresso.
e) Se o produtor vende em regime de competio perfeita ao preo de Cr$ 3,50
por unidade, quantas unidades deve produzir para que sua renda lquida seja
de Cr$ 2.000,00?
f) Determine a estimativa de Y para X = 10 e o respectivo intervalo de
confiana, ao nvel de confiana de 95%.
2.21. dada uma amostra de 4 pares de valores:

X Y
2 6
1 8
1 9
4 13
89
Yi = + X i + u i , onde os u i so erros independentes, de mdia zero, varincia
constante e distribuio normal.

c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 5 contra a
hiptese alternativa H A : 5 .
d) Determine a estimativa de Y para X = 2 e o intervalo de confiana para
E (Y | X = 2) , ao nvel de confiana de 95%.
2.22. A tabela ao lado mostra os valores de X e Y em X Y

uma amostra com 8 observaes. Admite-se 1 15
1 19
que essas variveis esto relacionadas de 3 16
acordo com o modelo usual de regresso linear 3 14
5 9
simples. Pode-se verificar que X = 32, 5 13
7 6
Y = 96, X 2 = 168, Y 2 = 1340 e
7 4
XY = 304 .
a) Determine a equao de regresso de Y contra X de acordo com o mtodo de

mnimos quadrados.
b) Obtenha uma estimativa no-tendendiosa da varincia do erro do modelo.
c) Verifique se a influncia de X sobre Y estatisticamente significativa ao
nvel de 1%.
d) Determine o intervalo de 90% de confiana para a variao esperada de Y
quando X diminui 3 unidades ( X = 3) .
90
2.23. So dados 3 conjuntos de 6 pares de valores ( X i , Yi , i = 1, ..., 6)
Conjunto A Conjunto B Conjunto C

X Y X Y X Y
1 5,5 1 10,5 1 0,5
2 6,5 2 9,5 2 1,5
3 9,0 3 10,0 3 4,0
4 10,5 4 9,5 4 5,5
5 13,5 5 10,5 5 8,5
6 15,0 6 10,0 6 10,0
Para cada um desses conjuntos, obtenha as estimativas de mnimos quadrados
dos parmetros da regresso linear de Y contra X. Calcule os valores do
coeficiente de determinao e do coeficiente de variao e analise
comparativamente os resultados. Para melhor visualizao, faa, para cada
conjunto, um grfico mostrando os pontos observados e a reta de regresso
ajustada.
2.24. Dada uma amostra de n pares de valores X i , Yi (i = 1, ..., n), mostre que a
estimativa dos coeficiente angular da reta, obtida atravs do mtodo dos
mnimos quadrados (b), uma mdia ponderada das declividades das retas que
passam pelos pontos ( X i , Yi ) e pelo ponto central da amostra ( X , Y ) .
2.25. A partir de uma amostra de 7 pares de valores, foi obtida a equao de regresso
Y = 30 + 5 X ,
2
com um coeficiente de determinao r 2 =
3
A estimativa do desvio padro de X s(X) = 2.
a) Determine o intervalo de confiana do coeficiente de regresso, ao nvel de
confiana de 95%.
b) Teste, ao nvel de significncia de 5%, a hiptese de que o coeficiente de
regresso da populao 8,5, considerando a hiptese alternativa de que o
coeficiente de regresso da populao menor do que 8,5.
2.26. Seja Y o custo de carregamento mecnico por tonelada de cana-de-acar. Seja X

o nmero de toneladas carregadas, por carregadeira e por ano. Suponha que um
pesquisador levantou os custos de carregamento mecnico da cana-de-acar em
diversas propriedades, obtendo uma amostra de pares de valores X i , Yi .
91
Admitindo que os custos totais de carregamento mecnico por ano sejam
constitudos por uma parte fixa (que no varia com X) e por uma parte varivel
(de tal maneira que o custo varivel por tonelada seja constante), que modelo
matemtico deve ser usado para estudar, por meio da anlise de regresso, a
variao do custo de carregamento por tonelada de cana-de-acar em funo do
nmero de toneladas carregadas? Que anamorfose dever ser feita?
2.27. Analisando a srie de valores do Produto Nacional Bruto (PNB) de determinado

pas, durante um perodo de 10 anos, verificou-se que so aproximadamente
constantes os incrementos anuais relativos do PNB. Qual a equao (modelo
matemtico) que deve ser usada na anlise de regresso desses dados? Que
transformao de variveis (anamorfose) deve ser feita para determinar as
estimativas dos parmetros atravs do mtodo dos mnimos quadrados? Sabendo
que, utilizando logaritmos decimais, a estimativa do coeficiente de regresso
0,0193 e a estimativa do respectivo desvio padro 0,0010, teste, ao nvel de
significncia de 5%, a hiptese de que a taxa de crescimento 4% ao ano (sabe-
se que log 104 = 2,0170).
2.28. Admitindo que as variveis X e Y esto relacionadas conforme o modelo

Yi = X i i , onde i so erros multiplicativos, determine as estimativas dos
parmetros e com base nos seguintes dados:

X Y
1 1
1 10
100 1.000
100 1.000
10.000 100
10.000 1.000
2.29. Suponha que um pesquisador est determinando a funo de demanda do

produto A em determinado mercado, com base em uma srie de 8 pares de
valores X i , Yi , onde Yi o preo pelo qual foi vendida a quantidade X i do
produto em determinado intervalo de tempo. Admitindo que a elasticidade-preo
da demanda do produto constante, qual a equao (modelo matemtico) que
o pesquisador deve usar? Que transformao de varivel (anamorfose) dever ser
feita para determinar as estimativas dos parmetros atravs do mtodo dos
92
mnimos quadrados? Sabendo que a estimativa do coeficiente de regresso
obtida 1,24, com um desvio padro estimado em 0,10, teste, ao nvel de
significncia de 5%, a hiptese de que a elasticidade-preo igual a 1.
2.30. Seja Y uma grandeza econmica qualquer e seja X o tempo, em anos. Se

admitirmos que a taxa geomtrica de crescimento de Y constante, que modelo
de regresso deve ser adotado? Sabendo que, em cinco anos consecutivos, Y
assumiu os valores 4, 4, 32, 64 e 32, qual a estimativa da taxa de crescimento
de acordo com o mtodo dos mnimos quadrados? Faa a anlise de varincia da
regresso.
2.31. Em estudos da variao do consumo de certos produtos em funo da renda da

famlia tem sido usada a funo Y = exp , onde Y o dispndio com o
X
produto considerado e X a renda da famlia.
Mostre as anamorfoses que devem ser feitas para que as frmulas de regresso
linear simples sejam usadas para ajustar essa funo, utilizando dados obtidos de
uma amostra aleatria.
2.32. a) Deduza, de acordo com o mtodo dos mnimos quadrados, a frmula para
estimar o parmetro do modelo
Yi = X i + u i com i = 1, ..., n,
onde
E (u i ) = 0 ,
E (u i2 ) = 2
e
E (u i u j ) = 0 para i j
b) Prove que o estimador obtido (b) no-tendencioso

2
c) Prove que a varincia da estimativa obtida V (b) =
X i2
d) Prove que o estimador obtido um estimador linear no-tendencioso de
varincia mnima
e) Mostre que a soma de quadrados residual dada por
93
( X i Yi ) 2
Yi 2 = Yi 2 b X i Yi
Xi 2
f) Demonstre que a esperana da soma de quadrados residual igual a

(n 1) 2
g) Admitindo que Y a receita de uma empresa comercial em certo intervalo de
tempo e que X a quantidade vendida (em unidades fsicas), ajuste aos pares
de valores, dados a seguir, uma reta que passe pela origem dos eixos. Teste,
ao nvel de significncia de 5%, a hiptese H 0 : = 0 .
X Y
2 5
3 7
4 11
4 5
5 9
2.33. Dados um conjunto de pares de valores X ij , Yij (i = 1, ..., m; j = 1, ..., n), ajusta-
se um conjunto de m retas paralelas

Yij = a i + bX ij
Mostre que as estimativas dos parmetros, de acordo com o mtodo dos mnimos
quadrados, so dadas por
( X ij X i )(Yij Yi )
b=
i j
( X ij X i ) 2
i j
e
ai = Yi bX i
1 n 1 n
onde X i = ij i n
n j =1
X e Y =
j =1
Yij
(Extrado de DRAPER e SMITH, 1996, p. 38).
94
2.34. dada uma amostra de 12 pares de valores
Xi Yi Xi Yi
1 2 4 9
1 4 4 13
1 3 5 11
1 5 5 10
2 8 5 16
2 6 5 9
Obtemos Yi = 96 , Yi 2 = 962 , y i2 = 194

Yi = + X i + u i , onde os ui so variveis aleatrias independentes com

b) Calcule o coeficiente de determinao da regresso e faa a anlise de
varincia, interpretando o teste F realizado. Considere um nvel de
significncia de 1%.
c) Teste, ao nvel de significncia de 1%, a hiptese de que = 0 contra a
hiptese de que > 0.
d) Determine a estimativa de Y para X = 6 e o intervalo de confiana para
E (Y | X = 6) , ao nvel de significncia de 99%.
e) Determine o valor da estimativa da variao em E(Y), isto , estime
= E ( Y ) , quando o valor de X aumenta de 2 unidades ( X = 2) . Qual a
varincia de ? Teste, ao nvel de significncia de 5%, a hiptese de que

= 2,5 contra a hiptese alternativa de que > 2,5 .
2.35. Mostre que a covarincia entre duas estimativas de Y ( Y1 e Y2 , para X = X 1 e
X = X 2 , respectivamente)
1 x x 2
cov(Y1 , Y2 ) = + 1 22
n xi
2.36. Seja X a quantidade de adubo colocada no solo, em doses por hectare, e seja Y a
produtividade obtida, em toneladas por hectare. Admite-se que essas variveis
esto relacionadas de acordo com a funo
95
Yi = + X i + u i ,
onde e so parmetros e os ui so variveis aleatrias independentes com

Um experimento com 5 parcelas forneceu os seguintes resultados:
Xi Yi
0 2,7
1 4,4
4 5,3
9 5,4
16 7,2
a) Determine as estimativas de mnimos quadrados (a e b) de e .

c) Determine o intervalo de 95% de confiana para .
d) Determine o intervalo de 95% de confiana para .
e) Determine a dose econmica de adubo admitindo que o preo da tonelada do
produto seja igual ao dobro do preo da dose de adubo (j considerados os
custos de colocao do adubo, juros e/ou subsdios, etc.).
f) Determine o intervalo de 95% de confiana para o verdadeiro valor () da
dose econmica, para as condies do item anterior (Sugesto: determine
inicialmente, os limites do intervalo de confiana para , e depois eleve

ao quadrado).
g) Determine o intervalo de previso para a produo de uma nova parcela com
X = 1, considerando um nvel de confiana de 95%.
2.37. Considere o modelo Yi = X i + u i com Xi fixos, E(ui) = 0, E (u i2 ) = 2 e
E (u i u j ) = 0 para i j.
X i Yi
Sabe-se que o estimador de mnimos quadrados para b = , no-
X i2
2
tendencioso, com V (b) = (ver exerccio 2.32).
X i2
Um estimador alternativo para = Y / X , que a inclinao da reta unindo
a origem do sistema de eixos ao ponto X , Y .
96
a) Prove que um estimador linear no-tendencioso.
b) Deduza a expresso que d V( ) em funo de 2 e dos valores de X.
c) Prove (sem utilizar o teorema de Gaus-Markov) que V( ) V(b). Em que
condies tem-se V( ) = V(b)?
2.38. Considere o modelo de regresso linear simples Yi = + X i + u i , onde ui so
erros aleatrios independentes com mdia zero e varincia 2 , e os Xi so fixos,

com X i = i para i = 1, 2, ..., 9.
Sejam X 1 e X 2 as mdias de X para as h primeiras e as h ltimas observaes,

isto ,
1 h 1 9
X1 = Xi
h i =1
e X2 = Xi
h i =10 h
Verifique os valores de X 1 e X 2 apresentados na tabela abaixo
h X1 X2
1 1 9
2 1,5 8,5
3 2 8
4 2,5 7,5
Sejam Y1 e Y2 as mdias dos correspondentes valores de Y, isto ,
1 h 1 9
Y1 = Yi
h i =1
e Y2 = Yi
h i =10 h
Define-se o seguinte estimador de :
Y2 Y1
b*h =
X 2 X1
u 2 u1
a) Prove que b*h = + ,
X 2 X1
1 h 1 9
onde u1 = ui
h i =1
e u2 = ui
h i =10 h
b) Mostre que b*h um estimador no-tendencioso de .
2 2
c) Demonstre que V (b*h ) =
h( X 2 X 1 ) 2
97
d) Faa uma tabela mostrando os valores de V (b*h ) para h = 1, 2, 3, 4.
Apresente, na mesma tabela, para cada valor de h, a eficincia relativa de b*h

em comparao com o estimador de mnimos quadrados.
Respostas
2.1. a) Y = 4 + 1,9 X
b) F = 320,89, rejeita-se H 0 : = 0
c) r2 = 0,976
d) Y = 9,7 . Os limites do intervalo de confiana so 8,89 e 10,51.
2.4. a) Y = 12 + 4 X ; s(b) = 1; s(a) = 10,2

4
b) r2 = = 0,571
7
c) t = 4, significativo
2.5. a) Y = 2 + 2 X
b) r 2 = 0,842 ; F = 16, significativo
c) t = 8, significativo
d) t = 6,63, significativo
e) Y = 12; 8,10 a 15,90
2.6. a) Y = 3X
12
b) r2 = = 0,923
13
c) F = 36, significativo
d) t = 6, no-significativo
e) t = 2,45, significativo
f) 15,42 a 44,58
2
2.7. r 2 = ; F = 100, significativo
3
2.8. Uma vez que E(b) = , basta mostrar que lim V (b) = 0 , o que acontece desde que
n
x 2 cresce indefinidamente quando n cresce.

2.9. d = b + 1 e c = a
98
2.10. Notando que os acrscimos relativos ( Y / Y ) de Y so aproximadamente
constantes, conclui-se que o modelo matemtico apropriado Y = X . A mesma

concluso obtida notando que os pontos (X, Y) esto aproximadamente
alinhados, quando marcados em um grfico com o eixo das ordenadas em escala
logartmica, isto , notando que os pontos de coordenadas log Y e X esto
aproximadamente alinhados.
2.11. a) 2 0,202
b) t = 3,059, significativo
2.14. a) 1 025 250
b) 124,3
2.15. t = 4, no-significativo
2.16. a) 0,06 a 2,72
60
2.17. Y = 4,5 +
X
2.18. a) a = 0, b = 10, V ( a ) = 0,0175 , V (b) = 0,417
b) I) t = 15,12, significativo
II) t= 3,10, significativo
c) r 2 = 0,833 ou 83,3%
2.19. a) Y = 3 0,5X
1
b) r2 = ; F = 4, no-significativo
3
c) t = 2, no-significativo
d) t = 3,27, no-significativo
e) 2,84 a 3,68
f) X = 4; Y = 1; 0,41 a 2,41
2.20. a) Y = 4 + 3X
b) t = 17,23, significativo; rejeita-se H 0 : = 0
c) 1,51 < < 6,49
d) r 2 = 0,974
e) X = 12, isto , 12 000 unidades
f) 34 2,14
99
2.21. a) Y = 6 + 1,5X
27
b) r2 = = 0,519
52
c) t = 3,429, no-significativo ( t 0 = 4,303 )
d) Y = 9
3,62 < E( Y | X = 2) < 14,38
2.22. a) Y = 20 2X
14
b) s2 = = 4,667
3
c) F = 34,29, significativo ( F0 = 13,7 )
d) 4,009 < E(Y) < 7,991

2.23.
Conjunto
Estatstica A B C
a 3 10 2
b 2 0 2
Y 10 10 5
S.Q.Res. 1 1 1
S.Q.Regr. 70 0 70
r2 98,6% 0 98,6%
CV 5% 5% 10%
2.25. a) 0,94 < < 9,06

1
2.26. 2.26. Anamorfose: =V
X
2.27. Anamorfose: Y = log (PNB)
t = 2,30, no-significativo
2.28. Y = 10 X 0,5
2.29. Y = AX B
Anamorfoses: Z = log Y e V = log X
t = 2,40, no-significativo
2.30. Yi = X i i
100
Adotando como origem do tempo (X = 0) o ano em que foi efetuada a terceira das
observaes consideradas, obtemos
Y = 16 2 X
A taxa de crescimento 100% ao ano
F = 7,5
1
2.31. Anamorfoses: Z = ln Y e V =
X
2.32. g) Y = 2 X ; t = 7,303, significativo.
2.34. a) Y = 2 + 2 X
b) r 2 = 0,742 ; F = 28,8, significativo ( F0 = 10,04 )
c) t = 5,37 , significativo ( t 0 = 2,76 )
d) Y = 14 ; 9,91 < E(Y|X = 6) < 18,09

2
e) = 4 ; V () = (X ) 2 V (b) = ;
9
5
V ( ) = e t = 2,01, significativo ( t 0 = 1,81 )
9
2.36. a) a = 3, b = 1
b) r 2 = 0,931
c) 1,78 < < 4,22
d) 0,50 < < 1,50
e) Uma dose por hectare
f) 0,50 < < 1,50

ou 0,25 < < 2,25
g) 2,20 < Yh < 5,80
n 2
2.37. b) V ( ) =
( X ) 2
c) As varincias so iguais apenas quando todos os valores de X forem iguais.
101
2
2.38. V (b) =
60
h X 2 X1 V (b*h ) Eficincia relativa
1 8 2 /32 0,533
2 7 2 /49 0,817
3 6 2 /54 0,900
4 5 2 /50 0,833
102
3. CORRELAO
Vimos que numa anlise de regresso linear simples, se determina, atravs de

estimativas dos parmetros, como uma varivel X exerce, ou parece exercer, efeito
sobre uma outra varivel Y.
Na anlise de correlao, que veremos aqui, se procura determinar o grau de

relacionamento entre duas variveis, ou seja, se procura medir a covariabilidade entre
elas.
Na anlise de regresso necessrio distinguir a varivel dependente e a varivel
explanatria; na anlise de correlao, tal distino no necessria.
3.1. O coeficiente de correlao simples para uma amostra
Inicialmente, desenvolveremos o conceito do coeficiente de correlao (r) para uma

amostra de n pares de valores X i , Yi (i = 1, 2, ..., n).
Para obter uma medida de correlao sem a influncia da mdia (tendncia

central) e da varincia (disperso), vamos utilizar variveis reduzidas, definidas por
Xi X xi
vi = = (3.1)
s( X ) xi2
n 1
e
Yi Y yi
zi = = (3.2)
s (Y ) y i2
n 1
Como as variveis reduzidas no tm dimenso, esta transformao tambm

elimina qualquer influncia da unidade de medida.
As figuras 3.1, 3.2 e 3.3 apresentam trs diferentes resultados que poderiam ser
obtidos quando colocamos os pontos ( vi , z i ) em um grfico.
103
Figura 3.1. Correlao Figura 3.2. Correlao
Positiva negativa
Figura 3.3. Correlao

aproximadamente igual a
zero
Se X e Y esto positivamente correlacionados, isto , se X e Y tendem a variar no

mesmo sentido, ento a maioria dos pontos ( vi , z i ) estar no 1o e no 3o quadrantes,
como ocorre na figura 3.1.Uma vez que, para pontos localizados nesses quadrantes, o
produto vi z i positivo, o valor de vi z i ser, neste caso, positivo e relativamente alto.
Se X e Y esto negativamente correlacionados, isto , se X e Y tendem a variar
em sentidos opostos, ento a maioria dos pontos ( vi , z i ) estar no 2o e no 4o quadrantes,
como ocorre na figura 3.2. Uma vez que, para pontos localizados nesses quadrantes, o
produto vi z i negativo, o valor de vi z i ser, neste caso, negativo e de valor absoluto
relativamente alto.
Se no existe correlao, os pontos ( vi , z i ) estaro distribudos pelos quatro
quadrantes, como ocorre na figura 3.3. Ento vi z i ser igual a zero ou ter valor
absoluto pequeno, pois as parcelas positivas (correspondendo a pontos no 1o e 3o
quadrantes) so anuladas pelas parcelas negativas (correspondendo a pontos no 2o e 4o
quadrantes).
104
Portanto, o valor de vi z i pode ser utilizado como medida de correlao.
Entretanto, em termos absolutos, esse valor tende a crescer com o nmero de
observaes. Ento, o coeficiente de correlao simples definido por
vi z i
r=
n 1
xi y i
r= (3.3)
xi2 y i2
Comparando (3.3) com (2.28), verificamos que o quadrado do coeficiente de

correlao igual ao coeficiente de determinao da regresso linear simples.
J vimos que
0 r2 1
Ento,
1 r 1
importante assinalar que um coeficiente de correlao igual a zero no implica
em ausncia de relao entre as duas variveis. Isso mostrado na figura 3.4, onde,
apesar de o coeficiente de correlao ser nulo, evidente que existe uma relao
parablica entre X e Y. Portanto, um coeficiente de correlao nulo somente implica
ausncia de relao linear entre as duas variveis.
Figura 3.4. Relao parablica entre X e Y, onde r = 0
105
Para exemplificar, consideremos os 6 pares de valores dados na tabela 3.1 e
representados na figura 3.5. Pode-se imaginar que cada par de valores so as notas
tiradas por um aluno em duas disciplinas.
Tabela 3.1 Amostra de 6 pares de valores X i , Yi
Xi Yi Xi Yi
4 6 6 8
4 7 8 7
6 6 8 8
Obtemos
36 42
X = = 6; Y = =7
6 6
( X i ) 2 36 2
x 2 = X i2 = 232 = 16
n 6
( Yi ) 2 42 2
y 2 = Yi 2 = 298 =4
n 6
X i Yi 36 42
xi y i = X i Yi = 256 =4
n 6
4
r= = 0,5
16 4
Vejamos a relao que existe entre o coeficiente de correlao e o coeficiente de
regresso.
Como
xy xy y2
b= = ,
x2 x2 y2 x2
verificamos, considerando (3.3), que
y2 s (Y )
b=r =r (3.4)
x 2
s( X )
onde
xi2 y i2
s( X ) = e s (Y ) =
n 1 n 1
Mostraremos agora que o quadrado do coeficiente de correlao igual ao

produto das estimativas dos coeficientes de regresso de Y em relao a X e de X em
106
relao a Y. Representando essas estimativas por bY X e bX Y respectivamente, podemos
escrever
xy xy
bY X = e b X Y =
x 2
y2
Segue-se, imediatamente, que
r 2 = bY X b X Y (3.5)
Para a amostra apresentada na tabela 3.1, temos:
xy 4 xy 4
bY X = = = 0,25 , b X Y = = =1
x 2 16 y2 4
e bY X b X Y = 0,25 = r 2
Tambm podemos obter as retas de regresso de Y em relao a X e de X em

relao a Y, que so, respectivamente,
Y = 5,5 + 0,25 X
e
X = 1 + Y
Figura 3.5. Retas de regresso de Y em relao a X e de X em relao a Y,

para os dados da tabela 3.1.
107
Para ilustrar melhor o conceito de correlao, consideremos um outro exemplo.
A tabela 3.2, transcrita de Yule e Kendall (1940), apresenta as freqncias (em
centenas) de casamentos na Inglaterra e na Irlanda, em 1933, conforme as idades do
marido (X) e da mulher (Y).
TABELA 3.2. Nmero de casamentos em funo da idade do marido e da mulher, na

Inglaterra e na Irlanda, em 1933.
Idade Idade do marido em anos (limite inferior do intervalo)
da Total
mulher 15 20 25 30 35 40 45 50 55 60 65 70 75
15 33 189 56 8 2 288
20 18 682 585 106 19 5 2 1 1418
25 1 140 511 179 40 14 6 3 1 1 896
30 11 75 101 42 20 10 5 2 1 1 268
35 2 10 24 28 19 13 8 5 2 1 112
40 1 5 9 14 12 10 6 4 2 1 64
45 1 3 5 9 9 7 4 3 1 42
50 1 3 7 6 5 3 1 26
55 1 3 5 4 3 1 17
60 1 1 4 3 2 11
65 1 1 3 2 1 8
70 1 1 1 3
Total 52 1024 1238 424 143 78 56 47 34 26 20 9 2 3153
Fonte:Yule e Kendall (1940), p. 198.
Podemos, para facilitar os clculos, utilizar as seguintes variveis auxiliares:
X i 27,5
Vi = , i = 1, 2, ..., 13 (3.6)
5
e
Y j 27,5
Zj = , j = 1, 2, ..., 12 (3.7)
5
Devemos ressaltar que o coeficiente de correlao entre V e Z igual ao

coeficiente de correlao entre X e Y (ver exerccio 3.9).
Note que essas variveis auxiliares assumem valor zero no ponto mdio da
classe de 25 a 30 anos e so medidas em unidades de 5 anos.
Representando por f ij as freqncias em cada cela, por Fi as freqncias totais
para cada classe de idade do marido e por Gi as freqncias totais para cada classe de
idade da mulher, temos:
108
Vi Fi 922
V = = = 0,2924
n 3153
Z jG j 742
Z = = = 0,2353
n 3153
( Vi Fi ) 2 922 2
vi2 Fi = Vi 2 Fi = 9708 = 9438,39
n 3153
( Z j G j ) 2 742 2
z Gj = Z Gj
2
j
2
j = 7090 = 6915,38
n 3153
( Vi Fi )( Z j G j ) 922(742)
vi z j f ij = Vi Z j f ij = 6256 = 6472,98
n 3153
vi z j f ij
r= = 0,8012
( vi2 Fi )( z 2j G j )
As retas de regresso de Z em relao a V e de V em relao a Z so,

respectivamente,
Z = 0,2353 + 0,6858(V 0,2924)
e
V = 0,2924 + 0,9360( Z + 0,2353)
Considerando (3.6) e (3.7) obtemos, aps simplificaes, as equaes de

regresso de Y em relao a X e de X em relao a Y:
Y = 6,5 + 0,686 X
e
X = 4,3 + 0,936Y
interessante assinalar, na tabela 3.2, as celas modais das distribuies
condicionais de Y | X ; elas mostram, grosseiramente, a posio da reta de regresso de
Y em relao a X. Da mesma maneira, as celas modais das distribuies de X | Y
mostram, aproximadamente, a posio da reta de regresso de X em relao a Y.
109
3.2. Aplicao da anlise de regresso a uma populao com distribuio
normal bidimensional
O coeficiente de correlao de uma populao definido por
X X Y Y cov( X , Y ) cov( X , Y )
= E = =
X Y XY V ( X )V (Y )
Devemos lembrar, aqui, que:

a) Se X e Y so independentes, temos cov( X , Y ) = 0 e, portanto, = 0.
b) Dados cov( X , Y ) = 0 e = 0, no possvel concluir, em geral, que as

variveis so independentes. Isto mostrado no exemplo apresentado na
tabela 1.3 (seo 1.5) e no caso ilustrado na figura 3.4.
c) Se as variveis tm distribuio normal, demonstra-se que
cov( X , Y ) = = 0 condio suficiente para que as variveis sejam
independentes.
Para fazer inferncia estatstica a respeito de , partindo do coeficiente de

correlao (r) da amostra, pressupomos que as variveis X e Y apresentam uma
distribuio normal bidimensional. Ento estamos excluindo casos como o representado
na figura 3.4.
Para testar a hiptese da nulidade H 0 : = 0 contra a hiptese alternativa
H A : 0 , utilizamos o teste
r 2 ( n 2)
F= , com 1 e n 2 graus de liberdade.
1 r2
Pode-se verificar que o valor de F, obtido por essa frmula, igual ao valor de F
da anlise de varincia da regresso, obtido dividindo o quadrado mdio de regresso
pelo quadrado mdio residual. Portanto, testar a hiptese H 0 : = 0 equivale a testar a
hiptese H 0 : = 0 .
A funo de densidade de uma distribuio normal bidimensional corresponde a
uma superfcie cujas sees, tanto na direo do eixo dos X como na direo do eixo dos
Y, so curvas normais. As sees horizontais dessa superfcie so elipses de
isoprobabilidade, duas das quais esto traadas na figura 3.6.
110
Vamos mostrar agora que os pontos C, E, F e G da figura 3.6, onde retas
paralelas ao eixo dos Y tangenciam elipses de isoprobabilidade, so os pontos mdios
das distribuies condicionais de Y. Consideremos, particularmente, o plano
perpendicular ao eixo dos X passando por A; esse plano seciona infinitas elipses de
isoprobabilidade, mas todas elas de nvel inferior ao da elipse de isoprobabilidade que
tangencia o plano em C, que , portanto, a moda da curva normal definida pela
interseco do plano em questo com a superfcie de densidade da populao
bidimensional. Como a moda de uma distribuio normal coincide com a mdia,
conclumos que o ponto C corresponde mdia da distribuio de Y, dado X = OA .

Para os pontos E, F e G vale, evidentemente, o mesmo raciocnio. Considerando, ainda,
que, se pode demonstrar que as distribuies condicionais de Y tm varincia constante,
conclumos que a reta GC a verdadeira reta de regresso de Y em relao a X, ou seja,
a reta E (Y | X ) = + X .
Pode-se mostrar, analogamente, que a reta PL a verdadeira reta de regresso de
X em relao a Y.
A reta E (Y | X ) = + X (ou uma estimativa obtida de uma amostra) poderia
ser usada para, dado um valor de X, prever o correspondente valor de Y.
Consideremos, por exemplo, que X e Y so, respectivamente, as notas de
Matemtica e Estatstica obtidas por alunos dessas duas disciplinas. Se um aluno obteve
nota OA em Matemtica, prev-se que obtenha nota AC em Estatstica. interessante
notar que AC uma mdia ponderada de AD e AB = Y , com os pesos dependendo

do valor de . Para entender isso, consideremos, inicialmente, os casos extremos de
= 1 e = 0. medida que aumenta, as elipses de isoprobabilidade se alongam na
direo do seu eixo principal e o ngulo entre as retas de regresso GC e PL diminui, de
maneira que no limite, quando = 1, as retas de regresso GC e PL coincidem com o
eixo principal e a melhor estimativa de Y para X = OA seria AD . Por outro lado,

quando = 0, isto , quando no existe correlao, a melhor estimativa de Y ser Y ,
qualquer que seja o valor de X. Num caso intermedirio em que 0 < < 1 , a melhor
estimativa de Y para X = OA estar entre os valores AB = Y e AD , sendo prxima de
AB quando for pequeno e se aproximando de AD medida que se aproxima de 1.
111
Figura 3.6. As elipses de isoprobabilidade de uma distribuio normal bidimensional e
as retas de regresso de Y em relao a X e de X em relao a Y.
EXERCCIOS
3.1. Calcule o coeficiente de correlao para a seguinte amostra de 10 pares de valores

X i , Yi .
Xi Yi Xi Yi
5 1 7 7
5 3 8 5
6 1 8 9
6 5 9 7
7 3 9 9
a) Teste, ao nvel de significncia de 1%, a hiptese de nulidade H 0 : = 0
contra a hiptese alternativa 0.
b) Determine as retas de regresso de Y em relao a X e de X em relao a Y.

Verifique que bY X b X Y = r 2 .
c) Admitindo que X e Y tenham distribuio normal bidimensional, qual a
estimativa de Y para X = 4? E para X = 9? Qual a estimativa de X para Y = 3?
E para Y = 9?
112
3.2. Sendo o ngulo entre as retas de regresso de Y em relao a X e de X em
relao a Y, prove que
1 r2 1 r2 s ( X ) s (Y )
tg = = 2
bY X + b X Y r s ( X ) + s 2 (Y )
Com base nesta relao determine o ngulo formado pelas duas retas de regresso
no caso da amostra de 6 pares de valores da tabela 3.1.
3.3. Dados:
X Y
2 18
4 12
5 10
6 8
8 7
11 5
X = 36 ; X 2 = 266 ; Y = 60 ; Y 2 = 706 ; XY = 293
a) Determine o coeficiente de correlao entre X e Y.

b) Determine as estimativas dos parmetros da equao de regresso linear de Y
em relao a X.
c) Admitindo que as variveis X e Y esto relacionadas de acordo com o modelo
Yi = + X i + u i , onde ui so erros com mdia zero, varincia constante e
distribuio normal, teste a hiptese da nulidade H 0 : = 1 , contra a hiptese
alternativa H A : > 1 , considerando um nvel de significncia de 5%.
3.4. Com base no grfico dado a seguir, determine geometricamente (sem usar as
frmulas comuns de anlise de regresso):
a) A reta de regresso de Y em relao a X.
b) A reta de regresso de X em relao a Y.
c) O coeficiente de correlao (r).
d) O valor estimado de Y para X = 1.
e) O valor estimado de X para Y = 1.
113
3.5. Com base no grfico dado a seguir, determine geometricamente (sem usar as
frmulas comuns de anlise de regresso):
a) A reta de regresso de Y em relao a X.
b) A reta de regresso de X em relao a Y.
c) O coeficiente de correlao (r).
d) O valor estimado de Y para X = 60.
e) O valor estimado de X para Y = 30.
3.6. Os dados a seguir foram apresentados em defesa da tese de que dietas com alto
teor de protena reduzem a fertilidade. a) Estabelea, sem calcular, o sinal do
coeficiente de correlao entre as duas variveis. b) Discuta se dados desse tipo
so apropriados para estabelecer relaes de causa-e-efeito entre essas variveis.
114
Taxa de Teor de protena
Pais
Natalidade na dieta
Formosa 45,6 4,7
Malaia 39,7 7,5
ndia 33,0 8,7
Japo 27,0 9,7
Iugoslvia 25,9 11,2
Grcia 23,5 15,2
Itlia 23,4 15,2
Bulgria 22,2 16,8
Alemanha 20,0 37,3
Irlanda 19,1 46,7
Dinamarca 18,3 56,1
Austrlia 18,0 59,9
EUA 17,9 61,4
Sucia 15,0 62,6
3.7. Com base em uma amostra de 200 pares de valores para as variveis X e Y
obtivemos um coeficiente de correlao igual a 0,02. Podemos afirmar que no
existe relao entre essas variveis? Explique.
3.8. Com base nos valores de renda per capita ( X 1 ) e da porcentagem de analfabetos (
X 2 ) para 20 pases latino-americanos em 1950, obtivemos o coeficiente de

correlao r = 0,6.
a) Esse resultado estatisticamente significativo ao nvel de 1%?
b) Interprete o resultado do ponto de vista estatstico e econmico-social.
3.9. So dados n pares de valores X i , Yi cujo coeficiente de correlao r. Sendo
Z i = a + bYi e Vi = k + hX i , demonstre que o coeficiente de correlao entre Vi e
Z i igual a r, se bh > 0, e igual a r, se bh < 0 (a, b, k e h so constantes).
a b
3.10. So dados os valores de Z i (i = 1, ..., n). Definimos X i = e Yi = .
Zi Zi
Demonstre que, se a e b so constantes positivas, o coeficiente de correlao entre
X i e Yi igual a 1.
115
3.11. O coeficiente de correlao entre as variveis X e Y r = 0,60. Sabendo que
s(X) = 1,50, s(Y) = 2,00, X = 10 e Y = 20 , determine a equao de regresso de Y
em relao a X.
3.12. Com base em uma amostra de 27 pares de valores foi obtido o coeficiente de
correlao r = 0,40. Teste, ao nvel de significncia de 5%, a hiptese de que o
coeficiente de correlao das variveis zero.
3.13. O coeficiente de correlao obtido de uma amostra de n pares de valores X i , Yi

r = 4/5. Sabendo que s(X) = 3 e s(Y) = 5, determine o coeficiente de regresso de Y
em relao a X.
3.14. A partir de uma amostra aleatria com n observaes, foi obtida a equao de
regresso
Y = 10 0,28 X
Determine o coeficiente de correlao entre X e Y sabendo que
x2 y2
s (X ) =
2
= 25 e s (Y ) =
2
=4
n 1 n 1
3.15. Para duas variveis negativamente correlacionadas, foram obtidos: X = 0 ,
Y = 12 , s(X) = 8, s(Y) = 10 e r 2 = 0,64 . Determine a equao de regresso de Y
em relao a X.
3.16. Dados
X Y
0 2
2 2
4 4
6 8
a) Determine as estimativas dos parmetros do modelo Yi = + X i + u i .
b) Calcule o coeficiente de determinao da regresso ( rYX2 ).
c) Calcule os 4 valores de Yi e determine o valor do quadrado do coeficiente de
correlao ( rY2Y ) entre Yi e Yi . Verifique que esse valor igual ao valor do
coeficiente de determinao, calculado no item (b).
116
d) Demonstre que o coeficiente de determinao de uma regresso ( rYX2 ) sempre
igual ao quadrado do coeficiente de correlao entre os valores observados e
os valores estimados da varivel dependente ( rY2Y ).
3.17. Seja r o coeficiente de correlao entre as variveis X i e Yi em uma amostra com

n observaes. Definimos as variveis reduzidas
x xi2
wi = i , com xi = X i X e s ( X ) = , e
s( X ) n 1
yi y i2
zi = , com y i = Yi Y e s (Y ) =
s(Y ) n 1
Seja c a estimativa do coeficiente de regresso de z i contra wi , de acordo com o
mtodo de mnimos quadrados.

a) Deduza a relao entre r e c.
b) Deduza expresses que dem a S.Q.Total e a S.Q.Regresso da regresso de
z i contra wi em funo de r e n.
RESPOSTAS
3.1. a) r = 0,8; F = 14,22, significativo

b) Y = 6,2 + 1,6 X e X = 5 + 0,4Y
c) Para X = 4, temos Y = 0,2 e para X = 9, temos Y = 8,2
Para Y = 3, temos X = 6,2 e para Y = 9, temos X = 8,6
3.2. = 30 o 58
3.3. a) r = 0,92
b) Y = 18,04 1,34 X
c) no se rejeita H 0 : = 1
3.4. a) Y = 2 + 0,5 X
b) X = 1 + Y
117
c) r = 0,7071
d) Y = 2,5
e) X = 0
3.5. a) Y = 10 + 0,25 X
b) X = 20 + Y
c) r = 0,5
d) Y = 25
e) X = 50
3.6. a) A correlao negativa.

b) Tais dados no permitem estabelecer relao de causa-e-efeito. Outras
variveis, como renda per capita, deveriam ser consideradas na anlise. Os
dados podem ser teis para sugerir pesquisas mdico-biolgicas sobre
possveis relaes causais entre consumo de protena e fertilidade.
3.7. Correlao linear igual a zero no implica ausncia de relao entre as variveis.
3.8. a) F = 10,12 ou t = 3,18, significativos.

Renda per capita e proporo de analfabetos se mostram negativamente
correlacionados. Esse resultado estatstico no prova a existncia de uma
relao de causa-e-efeito. No caso, sabemos que existe causao nos dois
sentidos. Analfabetismo implica baixo nvel tecnolgico, baixa produtividade
e baixa renda per capita. Pobreza, por outro lado, significa falta de recursos,
dificultando a analfabetizao.
3.11. Y = 12 + 0,8X
3.12. F = 4,76, significativo
3.13. b= 4/3
3.14. r = 0,7
3.15. Y = 12 X
3.16. a) Y = 1 + X
b) r 2 = 5 / 6
3.17. a) r = c
118
b) S.Q.Total = z i2 = n 1
S.Q.Regr. = r 2 (n 1)
119
4. REGRESSO LINEAR MLTIPLA
4.1. O modelo estatstico de uma regresso linear mltipla
Temos uma regresso linear mltipla quando admitimos que o valor da varivel
dependente funo linear de duas ou mais variveis explanatrias. O modelo
estatstico de uma regresso linear mltipla com k variveis explanatrias :
Y j = + 1 X 1 j + 2 X 2 j + ... + k X kj + u j , j = 1, ..., n
ou
k
Y j = + i X ij + u j (4.1)
i =1
Utilizando notao matricial o modelo fica
y = X + u (4.2)
onde
Y1 1 X 11 X 21 K X k1
Y 1 X 12 X 22 K X k2
y = 2 X=
M M M M M

Yn 1 X 1n X 2n K X kn

1 u1
u
= 2 u = 2
M
M
u
n
k
Mantemos, com algumas modificaes, as pressuposies apresentadas na seo

2.1:
I) a varivel dependente ( Y j ) funo linear das variveis explanatrias ( X ij ,
i = 1,..., k);
II) os valores das variveis explanatrias so fixos;
III) E (u j ) = 0 , ou seja, E (u) = 0 , onde 0 representa um vetor de zeros;
IV) os erros so homocedsticos, isto , E (u 2j ) = 2 ;
120
V) os erros so no-correlacionados entre si, isto , E (u j u h ) = 0 para j h;
VI) os erros tm distribuio normal.
Combinando as pressuposies IV e V temos
E (uu ) = I 2 (4.3)
Seja p = k + 1 o nmero de parmetros a serem estimados ( , 1 , K , k ). Se

dispomos de apenas p observaes, a determinao dos parmetros se reduz a um
problema matemtico de resoluo de um sistema de p equaes com p incgnitas, no
sendo possvel fazer qualquer anlise estatstica. Devemos, portanto, ter n > p. Alm
disso, veremos que para obter as estimativas de mnimos quadrados dos parmetros a
matriz X X deve ser no-singular, isto , sua caracterstica deve ser igual a p. Isso
significa que a caracterstica de X deve ser igual a p. Nas dedues que se seguem
admitiremos que essas condies so observadas, isto , admitiremos que X tem
caracterstica p = k + 1 < n.
Da mesma maneira que na regresso linear simples, as pressuposies I, II e III

so necessrias para demonstrar que os estimadores de mnimos quadrados so no-
tendenciosos e as cinco primeiras pressuposies permitem demonstrar que tais
estimadores so estimadores lineares no-tendenciosos de varincia mnima (teorema de
Gauss-Markov). A pressuposio VI necessria para realizar testes de hiptese e para
construir intervalos de confiana para os parmetros.
4.2. Estimativas dos parmetros de acordo com o mtodo dos mnimos

quadrados
Sejam b e e os vetores das estimativas dos parmetros e dos desvios,

respectivamente, isto ,
a
b e1
1 e
b = b2 e e = 2
M
M
bk e n
121
Temos
y = Xb + e = y + e (4.4)
e = y Xb = y y
onde
Y1

Y
y = 2
M

Yn
A soma dos quadrados dos desvios dada por
Z = e e = ( y b X )( y Xb ) = y y y Xb b X y + b X Xb
As matrizes y Xb e b X y so iguais, pois uma a transposta da outra e cada

uma tem apenas um elemento. Ento
Z = y y 2b X y + b X Xb (4.5)
A funo Z apresenta ponto de mnimo para os valores de b que tornem sua

diferencial identicamente nula, isto :
dZ = 2( db ) X y + ( db ) X Xb + b X X( db ) 0
Como ( db ) X Xb = b X X( db ) , por serem matrizes com apenas um elemento e

uma ser a transposta da outra, segue-se que
2( db ) X y + 2( db ) X Xb 0
ou
( db )( X Xb X y ) 0
Portanto, a diferencial de Z ser identicamente nula para
X Xb = X y (4.6)
que o sistema de equaes normais.
Se X X no singular, existe a matriz inversa ( X X )1. Pr-multiplicando os

dois membros de (4.6) por ( X X )1, obtemos
122
b = ( XX) 1 Xy (4.7)
A primeira etapa dos clculos para obteno das estimativas dos parmetros a
construo das matrizes
n X1j X2j K X kj
X X 2
X1j X 2 j K X 1 j X kj
1j 1j
XX = X 2 j X1j X 2 j X 22 j K X 2 j X kj

M M M M
X kj X 1 j X kj X 2 j X kj X kj2

Yj
X Y
1j j
Xy = X 2 j Y j

M
X kj Y j

Veremos, adiante, que essas matrizes so necessrias em vrias outras fases da

anlise de regresso linear mltipla.
Do sistema de equaes normais podemos obter outros resultados de interesse.
X y X Xb = 0
onde 0 representa um vetor cujos elementos so todos iguais a zero.
Ento
X ( y Xb ) = 0
ou
Xe = 0 (4.8)
Essa relao matricial significa que
ej = 0
e
X ij e j = 0 para i = 1, ..., k
Note-se que a nulidade da soma dos desvios ( e j = 0) decorre do fato de o
modelo ter um termo constante (), fazendo com que a primeira coluna de X seja um
vetor com todos os elementos iguais a 1.
123
Sendo nula a soma dos desvios, conclumos que
Y j = Y j (4.9)
Mostraremos, a seguir, que b = ( XX) 1 Xy um estimador no-tendencioso de

. Substituindo (4.2) em (4.7) obtemos
b = ( XX) 1 X( X + u)
ou
b = + ( XX) 1 Xu (4.10)
Lembrando as pressuposies II e III, verificamos que
E (b) = , c.q.d.
4.3. Varincias e covarincias das estimativas dos parmetros
A matriz
E[(b )(b ) ]
por definio, a matriz das varincias e covarincias das estimativas dos parmetros,
pois
E[(b )(b ) ] =
E (a ) 2 E (a )(b1 1 ) K E (a )(bk k )

E (a )(b1 1 ) E (b1 1 ) 2 K E (b1 1 )(bk k )
=
M M M

E (a )(bk k ) E (b1 1 )(bk k ) K E (bk k ) 2
Considerando (4.10) e notando que a matriz X X simtrica e, portanto, igual

sua transposta, obtemos
E[(b )(b )] = E[(XX) 1 Xuu X( XX) 1 ]
De acordo com (4.3) e com a pressuposio II, segue-se que
E[(b )(b )] = ( XX) 1 XI 2 X( XX) 1
ou
E[(b )(b )] = ( XX) 1 2 (4.11)
124
4.4. Varincia de uma combinao linear das estimativas dos parmetros
Seja c um vetor-linha com p = k + 1 constantes:
c = [c0 c1 c2 K ck ]
Determinemos a varincia de cb .
Sabemos que
E (b) =
Ento
E (cb ) = c
Desde que cb uma matriz com um nico elemento, temos
V (cb) = E (cb c) 2 =
= E[c(b )]2 =
= E[c(b )(b )c]
Considerando (4.11) obtemos
V (cb) = c( XX) 1 c 2 (4.12)
Uma aplicao importante desse resultado a determinao da varincia da
estimativa ( Yh ) de um valor da varivel dependente.

Considerando o modelo de regresso linear mltipla
Y j = + 1 X 1 j + 2 X 2 j + K + k X kj + u j , j = 1, ..., n
ou
y = X + u ,
a estimativa do valor de Y, dados os valores X 1h , X 2 h ,K, X kh das variveis

explanatrias,
Yh = a + b1 X 1h + b2 X 2 h + K + bk X kh
ou
Yh = xh b , (4.13)
125
onde
x h = [1 X 1h X 2h K X kh ]
O vetor x h pode ou no ser uma das linhas da matriz X.
Em (4.13) notamos que Yh uma combinao linear das estimativas dos

parmetros. Ento, de acordo com (4.12), obtemos
V (Yh ) = xh ( XX) 1 x h 2 (4.14)
4.5. Anlise de varincia da regresso linear mltipla
De (4.5) e (4.6) segue-se que a soma de quadrados dos desvios, ou soma de

quadrados residual, dada por
e e = y y 2b X y + b X y
ou
S.Q.Res. = e e = y y b X y (4.15)
Sabemos que a soma de quadrados total dada por
( Y j ) 2 ( Y j ) 2
S.Q.Total = y = Y
2
j j
2
= y y (4.16)
n n
A soma de quadrados de regresso dada por
S.Q.Regr. = (Y j Y ) 2 = y 2j =
( Y j ) 2
= Y j2 =
n
( Y j ) 2
= y y =
n
( Y j ) 2
= ( Xb)Xb =
n
( Yj ) 2
= bXXb
n
Considerando (4.6) e (4.9) segue-se que
126
( Y j ) 2
S.Q.Regr. = bXy (4.17)
n
De (4.15), (4.16) e (4.17), conclumos que
S.Q.Res. = (S.Q.Total) (S.Q.Regr.)
Sendo p = k + 1 o nmero de parmetros da regresso, podemos demonstrar que

E(S.Q.Res.) = (n p) 2 .
Para isso definimos, inicialmente, as matrizes
H = X( XX) 1 X
M = I X( XX) 1 X = I H
As matrizes H e M so simtricas e idempotentes, isto ,
H = H
'
M = M
'
HH = H
e MM = M (4.18)
Verifica-se, tambm que
HX = X ou X H = X
e
MX = 0 ou XM = 0 (4.19)
'
onde 0 uma matriz de zeros.
Temos que
e = y y = y Xb = y X( XX) 1 Xy =
= [I X( XX) 1 X]y =
= My = M ( X + u)
e = Mu (4.20)
De (4.18) e (4.20) segue-se que
S.Q.Res. = ee = uMu (4.21)
127
Como ee uma matriz com apenas um elemento temos que
e e = tr (u Mu )
Lembrando o teorema de lgebra de matrizes que estabelece que o trao de um

produto de matrizes no afetado por uma mudana na ordem dos fatores, desde que o
novo produto tambm seja definido, obtemos
e e = tr (uu M )
Considerando (4.3) e a pressuposio II, segue-se que
E(S.Q.Res.) = E (ee) = 2 tr (M )
Mas
tr(M) = tr [I X( XX) 1 X] = n (k + 1) = n p
Ento
E(S.Q.Res.) = (n p ) 2 , (4.22)
c.q.d.
Nos exerccios 4.25 e 4.26 indicada a maneira como podemos obter as

expresses para E(S.Q.Total.) e E(S.Q.Regr.).
Esses resultados nos levam construo do seguinte esquema de anlise de
varincia:
Anlise de Varincia
C.V. G.L. S.Q.
( Y j ) 2
Regresso k=p1 b Xy
n
Resduo np y y b X y
( Y j ) 2
Total n1 y y
n
O quadrado mdio residual, dado pelo cociente S.Q.Res./(n p), , portanto,

uma estimativa no-tendenciosa da varincia do erro ( 2 ). Substituindo 2 por
128
s 2 = Q.M.Res. na expresso (4.11) obtemos a matriz das estimativas das varincias e
covarincias das estimativas dos parmetros:
V (b) = ( X X) 1 s 2 (4.23)
possvel demonstrar que, se os erros u j tm distribuio normal e se 1 =
2 = K = k = 0 , o cociente
Q.M.Regr.
F=
Q.M.Res.
tem distribuio de F com k e n p graus de liberdade. Ento, o valor F assim obtido

utilizado para testar a hiptese
H 0 : 1 = 2 = K = k = 0
Obtidas as estimativas dos desvios padres das estimativas dos parmetros,

dadas pelas razes quadradas dos elementos da diagonal principal da matriz ( XX) 1 s 2 ,
podemos utilizar o valor
bi i
t= , (4.24)
s(bi )
associado a n p graus de liberdade, para testar hipteses a respeito dos valores dos
parmetros.
Podemos, ainda, construir intervalos de confiana para os parmetros. Escolhido

o nvel de confiana, e sendo t 0 o correspondente valor crtico de t, o intervalo de
confiana para i
bi t 0 s (bi ) < i < bi + t 0 s (bi ) (4.25)
Devemos ressaltar que tanto o teste t como o intervalo de confiana s so

vlidos se os erros u j tiverem distribuio normal.
O coeficiente de determinao mltipla definido por
S.Q.Regr.
R2 =
S.Q.Total
129
e mostra a proporo da soma de quadrados total que explicada pela regresso
mltipla.
Temos que
S.Q.Res.
1 R2 =
S.Q.Total
O coeficiente de determinao corrigido para graus de liberdade definido por
1
(S.Q.Res.)
n p n 1
1 R =
2
= (1 R 2 )
1 n p
(S.Q.Total)
n 1
ou
p 1
R 2 = R2 (1 R 2 )
n p
varincia mnima
Para demonstrar que os estimadores de mnimos quadrados so estimadores

lineares no-tendenciosos de varincia mnima, vamos considerar, inicialmente, a
combinao linear c dos parmetros. Um estimador de = c cb = c( XX) 1 Xy .
Na seo 4.4 vimos que cb um estimador no-tendencioso de c e que, de acordo
com (4.12), sua varincia
V (cb) = c( XX) 1 c 2
Consideremos um estimador linear qualquer = g y de = c . Note que cb
um caso particular de , com g = c ( X X) 1 X
Temos
= g y = g ( X + u ) = g X + g u (4.26)
Ento, para que seja um estimador no-tendencioso de c , isto , para que
tenhamos E( ) = c , devemos ter
g X = c (4.27)
130
De acordo com (4.12) e (4.27), obtemos
V (c b) = g X( X X) 1 X g 2 (4.28)
De (4.26), obtemos
E () = g u
Donde
V ( ) = E[ E ()] 2 =
= E (g uu g )
Como E (uu ) = I 2 , podemos escrever
V ( ) = g g 2 (4.29)
De (4.28) e (4.29) segue-se que
V ( ) V (c b ) = [g g g X( X X) 1 X g ] 2 =
= g [I X( XX) 1 X]g 2 =
= g Mg 2
Vimos, em (4.21), que ee = uMu . Ora, ee 0 porque uma soma de
quadrados. Portanto M uma matriz semidefinida positiva e g Mg 0 . Conclumos
ento que
V ( ) V (c b ) , (4.30)
onde = g y qualquer estimador linear no-tendencioso de c .

Consideremos o caso particular em que
c = [0 K 0 1 0 K 0] ,
isto , o i-simo elemento do vetor c igual a um, e todos os outros so iguais a zero.
Ento a desigualdade (4.30) fica
V () V (bi )
onde = g y qualquer estimador linear no-tendencioso de i .
131
Esse resultado mostra que, dentre os estimadores lineares no-tendenciosos, bi
o que tem menor varincia, isto , os estimadores de mnimos quadrados so
estimadores lineares no-tendenciosos de varincia mnima.
4.7. O uso das variveis centradas
Para simplificar os clculos, muitas vezes trabalhamos com as variveis

centradas
xij = X ij X i , i = 1, 2, ..., k
onde
1 n
Xi = X ij
n j =1
Neste caso o modelo estatstico fica
Y j = 0 + 1 x1 j + K + k x kj + u j , j = 1, 2, ..., n
ou em notao matricial,
y = X + u
com as devidas mudanas nas definies das matrizes X e .
As matrizes X X e X y ficam
n 0 0 K 0
0 x12j x1 j x 2 j K x1 j x kj

XX = 0 x1 j x 2 j x 22 j K x 2 j x kj

M M M M
0 x1 j x kj x 2 j x kj K x kj2

e
Yj
x Y
1j j
Xy = x 2 j Y j

M
x kj Y j

132
Decompondo a matriz X X apropriadamente, o elemento igual a n pode ser
invertido separadamente. Ento a estimativa de 0
Y j
b0 = =Y
n
Verifica-se que a expresso (4.15) pode ser escrita como segue:
n n k n
S.Q.Res. = Y j2 Y Y j bi xij Y j
j =1 j =1 i =1 j =1
Como
( Y j ) 2
Y Y Yj = Y
j
2
j
2
= S.Q.Total,
n
conclumos que
k n
S.Q.Regr. = bi xij Y j (4.31)
i =1 j =1
Determinadas as estimativas dos parmetros do modelo simplificado, se

quisermos escrever a equao estimada com as variveis na forma original, basta
calcular a estimativa de , dada por
a = Y bi X i (4.32)
s vezes, os clculos so feitos com todas as variveis centradas, inclusive a
varivel dependente, ou seja, utilizamos
y j = Yj Y
Se somarmos, membro a membro, as relaes (4.1), para j = 1, 2, ..., n, e

dividirmos por n, obtemos
k
Y = + i X i + u (4.33)
i =1
onde
1
u= u j
n
Subtraindo (4.33) das relaes (4.1) obtemos
k
y j = i xij + u j u
i =1
133
ou
y = X + u u (4.34)
onde
y1 x11 x 21 K x k 1
1
y x x 22 K x k 2
y = 2 X = 12 = 2
M M M M M

k
yn x1n x 2 n K x kn
e u um vetor-coluna com n elementos iguais a

1
u= u j
n
fcil verificar que, neste caso, a matriz X X igual do modelo onde apenas
as variveis independentes so centradas excluindo a primeira linha e a primeira coluna,
e a matriz X y igual do mesmo modelo, excluindo apenas o primeiro elemento. Os
termos y y e b X y de (4.15) correspondem, respectivamente, soma de quadrados
total e soma de quadrados de regresso, de maneira que o coeficiente de determinao
b Xy
R2 =
y y
As propriedades dos estimadores no so afetadas pelo uso de variveis

centradas. Assim, substituindo (4.34) na expresso
b = ( XX) 1 Xy
obtemos
b = ( XX) 1 X( X + u u ) =
= + ( XX) 1 Xu ( XX) 1 Xu (4.35)

primeira vista, o resultado obtido em (4.35) diferente da expresso (4.10),
obtida quando as variveis no so centradas. Entretanto, os elementos do vetor Xu ,
com variveis centradas, so
x ij u = u x ij = 0
j j
Ento, a expresso (4.35) fica

b = + ( XX) 1 Xu ,
que a relao (4.10).
Assim, da mesma maneira que no modelo sem centrar as variveis, temos:
134
E (b ) =
e
V (b) = ( XX) 1 2
4.8. Exemplo de uma regresso linear mltipla com duas variveis

explanatrias
Na tabela 4.1 apresentamos os valores de uma amostra de 5 observaes das

variveis Y j , X 1 j e X 2 j .
TABELA 4.1. Valores de trs variveis em uma amostra de 5 observaes.
Yj X1j X2j
16,5 1,0 2
14,0 3,5 3
6,0 4,0 4
10,0 7,5 5
3,5 9,0 6
Obtemos:
Y j = 50 X 1 j = 25 X 2 j = 20
Y = 10 X1 = 5 X2 = 4
y 2j = 116,5 x12j = 41,5 x 22 j = 10
x1 j Y j = 54 x 2 j Y j = 30 x1 j x 2 j = 20
Tendo em vista o modelo
Y j = 0 + 1 x1 j + 2 x 2 j + u j ,
construmos as matrizes
n 0 0 5 0 0

X X = 0 x12j x1 j x 2 j = 0 41,5 20
0 x1 j x 2 j x 22 j 0 20 10

135
Y j 50

X y = x1 j Y j = 54
x 2 j Y j 30

A seguir, determinamos as estimativas dos parmetros
1 50 10
5 0 0
2 4
b = ( XX) 1 Xy = 0 54 = 4
3 3
0 4 83
3 30 30 11

A equao estimada , ento,
Y j = 10 + 4 x1 j 11x 2 j
Como
x1 j = X 1 j 5
x2 j = X 2 j 4
obtemos
Y j = 34 + 4 X 1 j 11X 2 j
De acordo com (4.31), temos
S.Q.Regr. = b1 x1 j Y j + b2 x 2 j Y j =
= 4 ( 54) 11 ( 30) = 114
Ento
S.Q.Res. = y 2j 114 = 116,5 114 = 2,5
Poderamos, tambm, ter obtido o valor da soma de quadrados residual de

(4.15):
S.Q.Res. = y y b X y =
= 616,5 614 = 2,5
136
Com esses resultados podemos construir a tabela de anlise da varincia.
TABELA 4.2. Anlise da Varincia

Regresso 2 114,0 57 45,6
Resduo 2 2,5 1,25
Total 4 116,5
Para 2 e 2 graus de liberdade e ao nvel de significncia de 5%, o valor crtico de

F 19,00. Portanto, o resultado significativo, isto , rejeita-se, a esse nvel de
significncia, a hiptese H 0 : 1 = 2 = 0 , Um bom programa para computador informa
que a probabilidade caudal associada a F = 45,6, com 2 e 2 graus de liberdade, 0,0215,
permitindo concluir que o resultado significativo ao nvel de 5%, sem necessidade de
obter o valor crtico de F.
O coeficiente de determinao mltipla
114
R2 = = 0,9785
116,5
isto , 97,85% da soma de quadrados total explicada pela regresso linear ajustada.
Conforme a definio apresentada no final da seo 4.5, podemos verificar que o
coeficiente de determinao corrigido para graus de liberdade R 2 = 0,9571 .
Como s 2 = 1,25 temos, de acordo com (4.23), as seguintes estimativas das

varincias e covarincias das estimativas dos parmetros:
1,25
V (b0 ) = s 2 (b0 ) = s 2 (Y ) = = 0,25
5
2 5
V (b1 ) = s 2 (b1 ) = 1,25 = = 0,8333
3 6
83 83
V (b2 ) = s 2 (b2 ) = 1,25 = = 3,4583
30 24
cv(Y , b1 ) = cv(Y , b2 ) = 0
4 5
cv(b1 , b2 ) = 1,25 =
3 3
Temos que
a = Y b1 X 1 b2 X 2
Ento
137
V (a ) = V (Y ) + X 12V (b1 ) + X 22V (b2 ) 2 X 1 cov(Y , b1 )
2 X 2 cov(Y , b2 ) + 2 X 1 X 2 cov(b1 , b2 )
e
5 83 5
V ( a ) = 0,25 + 5 2 + 4 2 + 2 5 4 = 9,75
6 24 3
Se tivssemos utilizado o modelo com as variveis no centradas, a estimativa
da varincia de a seria dada pelo primeiro elemento da diagonal principal de ( XX) 1 s 2 .
Podemos, agora, testar hipteses a respeito dos valores dos parmetros.
Adotando o nvel de significncia de 5%, consideremos as seguintes hipteses:
a) H 0 : = 50 contra H A : < 50
Temos
34 50
t= = 5,124
9,75
O resultado significativo, pois a regio de rejeio para esse teste unilateral
t 2,920 . Portanto, ao nvel de significncia de 5%, rejeitamos a hiptese
H 0 : = 50 , em favor da hiptese H A : < 50 .
b) H 0 : 1 = 0 contra H A : 1 0
Calculamos
40
t= = 4,382
0,8333
Como o valor crtico de t para 2 graus de liberdade e ao nvel de significncia de
5% 4,303, o resultado obtido significativo, isto , rejeitamos, a esse nvel, a hiptese
de que 1 = 0 . Um bom programa de computador fornece a probabilidade caudal
associada ao t calculado (t = 4,382), isto , a probabilidade de, na distribuio de t com
2 graus de liberdade, essa varivel assumir valor absoluto maior do que 4,382. Essa
probabilidade 0,0483, permitindo concluir que o resultado significativo ao nvel de
5%, sem necessidade de obter o valor crtico de t.
c) H 0 : 2 = 0 contra H A : 2 0
Obtemos
11 0
t= = 5,915 , significativo
3,4583
138
Neste exemplo rejeitamos, ao nvel de significncia de 5%, a hiptese
H 0 : 1 = 2 = 0 e tambm rejeitamos, ao mesmo nvel de significncia, tanto a
hiptese H 0 : 1 = 0 como a hiptese H 0 : 2 = 0 . Quando o teste F da anlise de

varincia de uma regresso linear mltipla significativo (rejeitando-se a hiptese de
que 1 = 2 = K = k = 0 ), comum que pelo menos um dos valores de
bi
t= , i = 1, 2, ..., k
s(bi )
seja significativo, considerando-se um teste bilateral com o mesmo nvel de
significncia. Mas nem sempre isso acontece, podendo ocorrer que, apesar de o teste F
da anlise de varincia da regresso ser significativo, nenhum dos testes t para as
hipteses H 0 : i = 0 , (para i = 1, 2, ..., k) seja significativo, como mostra o exemplo
apresentado na seo 4.12, na qual esse assunto ser melhor analisado.
4.9. Previso e teste de hipteses a respeito do valor de combinaes

lineares dos parmetros
Consideremos o modelo de regresso linear mltipla
Y j = + 1 X 1 j + 2 X 2 j + K + k X kj + u j , j = 1, ..., n
ou
y = X + u
Na seo 4.4 vimos que, dados os valores X 1h , X 2 h , K , X kh das variveis

explanatrias, a estimativa de
E (Yh ) = + 1 X 1h + 2 X 2 h + K + k X kh = xh
Yh = a + b1 X 1h + b2 X 2 h + K + bk X kh = xh b
onde
x h = [1 X 1h X 2h K X kh ]
Devemos ressaltar que o vetor x h pode ou no ser uma das linhas da matriz X.
139
V (Yh ) = xh ( XX) 1 x h s 2 (4.36)
Obtida a estimativa da varincia de Yh , dada por (4.36), podemos construir o
intervalo de confiana para E (Yh ) = xh . Sendo t 0 o valor crtico de t com n p graus

de liberdade e ao nvel de confiana adotado, o intervalo de confiana
xh b t 0 x h ( XX) 1 x h s 2 < E (Yh ) < xh b + t 0 xh ( XX) 1 x h s 2 (4.37)
Consideremos, mais uma vez, o exemplo numrico da tabela 4.1. Tendo em vista
o modelo5
Y j = 0 + 1 x1 j + 2 x 2 j + u j
obtivemos, anteriormente, as matrizes
1
0 0
5

2 4
( X X) 1 = 0
3 3

4 83
0
3 30
10
b = 4
11
Consideremos X 1h = 7 e X 2 h = 1 . Uma vez que estamos fazendo os clculos

tendo em vista o modelo com as variveis explanatrias centradas, e lembrando que
X 1 = 5 e X 2 = 4 , obtemos x1h = 2 e x 2 h = 3 e fazemos
x h = [1 2 3]
Ento,
5
Se considerarmos o modelo em que todas as variveis, incluindo a dependente, so centradas,
obteremos, atravs de (4.14), a varincia y h = Yh Y . Como as covarincias entre Y e bi (i = 1, 2, ..., k)
so nulas, a varincia de Yh dada por
2
V (Yh ) = V ( y h ) +
n
140
Yh = xh b = 51
Lembrando que s 2 = Q.M.Res. = 1,25 , obtemos, de acordo com (4.36),
V (Yh ) = xh ( XX) 1 x h s 2 =
1
5 0 0
1

4
= [1 2 3] 0
2
1,25 = 54,708
3 3 2

4 83
0
3 30 3
Para um nvel de confiana de 95%, o valor crtico de t com 2 graus de liberdade

4,303. Ento, o intervalo de confiana para E (Yh ) = + 7 1 + 2
51 4,303 54,708 < E (Yh ) < 51 + 4,303 54,708

ou
19,17 < E (Yh ) < 82,83
Consideremos, agora, que desejamos prever o valor da varivel dependente ( Yh )
para uma nova observao e que as variveis independentes assumem os valores X 1h ,
X 2 h , ..., X kh .
O estimador de Yh = xh + u h Yh = xh b . O erro de previso
Yh Yh = xh (b ) u h (4.38)
Dizemos que Yh uma previso no-tendenciosa do valor de Yh porque a

esperana do erro de previso igual a zero.
Para avaliar a preciso de Yh como previso do valor da nova observao,

determinamos o intervalo de previso, como mostraremos a seguir. Para isso devemos
considerar a varincia do erro de previso, dado por (4.38). Uma vez que, de acordo
com a pressuposio V, o erro ( u h ) da nova observao independente dos erros ( u j , j
= 1, ..., n) das observaes da amostra utilizada para obter a estimativa (b) de , de

(4.38) obtemos
141
V (Yh Yh ) = V [xh (b )] + 2
De acordo com (4.14), segue-se que
V (Yh Yh ) = 2 + xh ( XX) 1 x h 2 =
= [1 + x h ( X X) 1 x h ] 2
Sendo t 0 o valor crtico de t com n p graus de liberdade e ao nvel de

confiana adotado, o intervalo de previso para a nova observao
xh b t 0 [1 + xh ( XX) 1 x h ]s 2 < Yh < xh b + t 0 [1 + xh ( XX) 1 x h ]s 2
No exemplo numrico que estamos analisando, a estimativa da varincia do erro

de previso para X 1h = 7 e X 2 h = 1
1,25 + 54,708 = 55,958
e o intervalo de previso, ao nvel de confiana de 95%, para uma nova observao com
esses valores de X 1h e X 2 h
51 4,303 55,958 < Yh < 51 + 4,303 55,958

ou
18,81 < Yh < 83,19
Note a grande amplitude do intervalo de previso, apesar do elevado coeficiente
de determinao ( R 2 = 0,9785 ) da equao ajustada.
A previso do valor da varivel dependente para uma nova observao pode ser
feita para valores de x h fora da regio onde esto os valores das variveis explanatrias
da amostra, isto , pode ser feita uma extrapolao. Da mesma maneira que no caso da
regresso linear simples (ver seo 2.12), a validade da equao estimada, fora do
intervalo das observaes, deve ser cuidadosamente examinada.
A expresso (4.14), que d a varincia de Yh , um caso particular de (4.12).

Uma outra aplicao de (4.12) o teste de hipteses a respeito de combinaes lineares
dos parmetros. Admitamos que se queira testar, no exemplo que estamos
desenvolvendo, a hiptese H 0 : 2 1 + 2 = 0 contra a hiptese H A : 2 1 + 2 < 0 ,
considerando um nvel de significncia de 5%. A hiptese da nulidade pode ser escrita
H 0 : c = 0
142
onde
c = [0 2 1]
Para testar essa hiptese calculamos, de acordo com (4.12),
V (c b) = c ( X X) 1 cs 2 = 0,125
A seguir, obtemos
cb 0 3
t= = = 8,485
V (cb) 0,125
O resultado significativo, isto , rejeitamos H 0 : 2 = 2 1 ao nvel de
significncia de 5%, pois a regio de rejeio para esse teste unilateral t 2,920 .
4.10.Interpretao dos coeficientes de regresso de uma regresso linear

mltipla com duas variveis explanatrias
Consideremos o modelo de uma regresso linear com duas variveis

explanatrias, com todas as variveis centradas:
y j = 1 x1 j + 2 x 2 j + u j u (4.39)
Neste caso, temos
x 2 x1 j x 2 j x1 j y j
X X = 1 j , Xy =
x1 j x 2 j x 2 j x 2 j y j
2
1 x 22 j x1 j x 2 j
( X X) 1
=
x x ( x1 j x 2 j ) 2 x1 j x 2 j x12j
2 2
1j 2j
De b = ( XX) 1 Xy , obtemos
x 22 j x1 j y j x1 j x 2 j x 2 j y j
b1 = (4.40)
x12j x 22 j ( x1 j x 2 j ) 2
x12j x 2 j y j x1 j x 2 j x1 j y j
b2 = (4.41)
x12j x 22 j ( x1 j x 2 j ) 2
143
Vamos indicar os desvios da regresso de x1 j em relao a x 2 j por v j e os
desvios da regresso de y j em relao a x 2 j por z j . Seja a estimativa do coeficiente
de regresso de z j em relao a v j . Demonstraremos que b1 = , isto , que a
estimativa do coeficiente de regresso de x1 j numa regresso linear com duas variveis
explanatrias mede como y j varia em funo de x1 j , aps eliminar dessas variveis a
influncia linear de x 2 j . Analogamente, b2 uma estimativa de como y j varia em
funo de x 2 j , descontando-se, previamente, as variaes de y j e x 2 j que possam ser
devidas influncia linear de x1 j .
Em outras palavras, b1 estima o efeito linear de X 1 , sobre Y depois que essas
variveis so depuradas da influncia linear de X 2 . Analogamente, b2 estima o efeito
linear de X 2 sobre Y depois que essas variveis so depuradas da influncia linear de
X1 .
Sabemos que para uma regresso linear simples de y j em relao a x j temos
xj yj
desvio = y j y j = y j bx j = y j x j
x2
j
Segue-se que
x 2 j x1 j
v j = x1 j x2 j (4.42)
x2
2j
e
x2 j y j
zj = yj x2 j (4.43)
x2
2j
Como x1 j , x 2 j e y j tm mdia igual a zero, v j e z j tambm tm mdia igual a
zero. Ento, a estimativa do coeficiente de regresso de z j em relao a v j
vjz j
= (4.44)
v 2j
Mas
x 2 j x1 j x2 j y j
v j z j = x1 j x2 j y j x2 j
x2 x2
2j 2j
144
Desenvolvendo e simplificando, obtemos
x1 j x 2 j x 2 j y j
v j z j = x1 j y j (4.45)
x 22 j
Analogamente, obtemos
( x1 j x 2 j ) 2
v = x
2
j
2
1j (4.46)
x 22 j
Substituindo (4.45) e (4.46) em (4.44) e multiplicando numerador e

denominador por x22 j , obtemos
x 22 j x1 j y j x1 j x 2 j x 2 j y j
= (4.47)
x12j x 22 j ( x1 j x 2 j ) 2
Comparando (4.47) com (4.40), verificamos que

b1 = , c.q.d.
Para melhor esclarecer o assunto vamos desenvolver essas etapas no exemplo
numrico da tabela 4.1.
Vamos calcular, inicialmente, os desvios ( v j ) da regresso de x1 j em relao a
x 2 j , dados por
v j = x1 j 2 x 2 j
e os desvios ( z j ) da regresso de y j em relao a x 2 j , dados por
z j = y j + 3x 2 j
Tais valores constam na tabela 4.3.
TABELA 4.3. Valores de y j , x1 j , x 2 j , v j (desvios da regresso de x1 j

contra x 2 j ) e z j (desvios da regresso de y j contra x 2 j ) obtidos com
base nos dados da tabela 4.1.
yj x1 j x2 j vj zj
6,5 4 2 0 0,5
4 1,5 1 0,5 1
4 1 0 1 4
0 2,5 1 0,5 3
6,5 4 2 0 0,5
A estimativa do coeficiente de regresso de z j em relao a v j
145
vjzj 6
= = = 4,
v 2
j 1,5
que o valor que j havamos obtido para b1 .
A anlise que fizemos para uma regresso com duas variveis explanatrias
pode ser generalizada para o caso de uma regresso linear mltipla com k variveis
explanatrias. Pode-se demonstrar que a estimativa ( b1 ) do coeficiente de uma varivel
X ij de uma regresso linear mltipla, normalmente obtida atravs de (4.7), poderia ser
obtida percorrendo-se as seguintes etapas:

a) clculo dos resduos ( v j ) da regresso de X ij contra todas as outras
variveis explanatrias;
b) clculo dos resduos ( z j ) da regresso de Y j em relao a essas mesmas
variveis, isto , as variveis explanatrias exclusive X ij ;
c) determinao da estimativa do coeficiente de regresso de z j em relao a
v j , que igual a bi .
Resumindo, podemos afirmar que, ao ajustarmos uma regresso linear mltipla

atravs do mtodo dos mnimos quadrados, a estimativa do coeficiente de uma varivel
X i mede o efeito linear de X i sobre Y depois de terem sido descontadas de ambas
essas variveis as influncias lineares de todas as outras variveis explanatrias
consideradas no modelo.
4.11. Os coeficientes de correlao parcial
Consideremos o caso de uma regresso linear mltipla com duas variveis

explanatrias, cujo modelo estatstico, utilizando todas as variveis centradas, (4.39).
Lembrando que indicamos por v j os desvios da regresso linear de x1 j contra
x 2 j e por z j os desvios da regresso de y j contra x 2 j , o coeficiente de correlao
parcial entre y j e x1 j ( rY 12 ) , por definio, o coeficiente de correlao entre z j e v j ,
isto ,
146
vjzj
rY 12 = (4.48)
v 2j z 2j
Deduziremos agora a expresso que relaciona o coeficiente de correlao parcial

rY 12 com os coeficientes de correlao simples entre y j e x1 j , entre y j e x 2 j e entre
x1 j e x 2 j , indicados por rY 1 , rY 2 e r12 , respectivamente.
Considerando (4.42) e (4.43) temos, por analogia com (4.46), que
( x 2 j y j ) 2
z = y 2
j
2
j (4.49)
x 22 j
Substituindo (4.45), (4.46) e (4.49) em (4.48), obtemos
x1 j x 2 j x 2 j y j
x1 j y j
x 22 j
rY 12 = (4.50)
2 ( x1 j x 2 j ) 2 ( x 2 j y j ) 2
x1 j y j
2

x 22 j x 22 j
Dividindo o numerador e o denominador por x12j y 2j , verifica-se que
rY 1 r12 rY 2
rY 12 = (4.51)
(1 r122 )(1 rY22 )
Analogamente, temos
rY 2 r12 rY 1
rY 21 = (4.52)
(1 r122 )(1 rY21 )
Consideremos o exemplo numrico da tabela 4.1. Vamos calcular, inicialmente,

os valores dos coeficientes de correlao simples:
x1 j y j 54
rY 1 = = = 0,776617
x y
2
1j
2
j
41,5 116,5
x2 j y j 30
rY 2 = = = 0,878938
x 22 j y 2j 10 116,5
x1 j x 2 j 20
r12 = = = 0,981761
x x 2
1j
2
2j
41,5 10
147
Essas correlaes simples so apresentadas com grande nmero de decimais
para evitar erros de arredondamento nos prximos clculos. Substituindo esses valores
em (4.51), obtemos
rY 12 = 0,952
Esse coeficiente de correlao parcial tambm pode ser obtido calculando-se o

coeficiente de correlao simples entre os valores de v j e z j , da tabela 4.3.
vjzj 6
rY 12 = = = 0,952
v 2j z 2j 1,5 26,5
importante verificar a relao existente entre um coeficiente de correlao

parcial e o correspondente coeficiente de regresso. De (4.50), obtemos
x1 j x2 j x2 j y j ( x1 j x2 j ) 2
x1 j y j x12j
x22 j x22 j
rY 12 =
2 ( x1 j x2 j ) 2 ( x2 j y j ) 2
x1 j y 2j
x22 j x22 j
Multiplicando o numerador e denominador da primeira frao por x22 j e
lembrando (4.40), segue-se que
( x1 j x2 j ) 2
x12j
x22 j (S.Q.Res. x1 j | x2 j )
rY 12 = b1 = b1
( x2 j y j ) 2 (S.Q.Res y j | x2 j )
y 2
j
x22 j
ou
(S.Q.Res. y j | x 2 j )
b1 = rY 12 (4.53)
(S.Q.Res x1 j | x 2 j )
Analogamente,
(S.Q.Res. y j | x1 j )
b2 = rY 21 (4.54)
(S.Q.Res x 2 j | x1 j )
As relaes (4.53) e (4.54) devem ser comparadas com a relao (3.4).
148
Essas relaes mostram que um coeficiente de correlao parcial sempre tem
sinal igual ao do respectivo coeficiente de regresso na regresso mltipla. Mas o
correspondente coeficiente de correlao simples pode ter sinal oposto, como ocorre
com rY 1 e rY 12 no exemplo analisado. Vimos que rY 1 = 0,776617 e rY 12 = 0,952. O
esquema a seguir procura mostra como isso possvel
Y
O efeito direto de X 1 sobre Y positivo, como mostra o valor de b1 ou o valor
de rY 12 . Mas X 1 tem forte correlao positiva com X 2 que, por sua vez, tem forte
efeito negativo sobre Y. A correlao simples entre X 1 e Y mistura os efeitos direto e
indireto (via X 2 ) de X 1 sobre Y. Neste exemplo o efeito indireto negativo e supera o
efeito direto positivo, fazendo com que a correlao simples ( rY 1 ) seja negativa.
Veremos, a seguir, uma outra maneira de interpretar os coeficientes de

correlao parcial.
Vamos considerar ainda o caso de uma regresso mltipla com duas variveis
explanatrias, ou seja, a regresso de y j em relao a x1 j e x 2 j . De acordo com (4.31),
a soma de quadrados de regresso dada por
(S.Q.Regr.de y j | x1 j e x 2 j ) = b1 x1 j y j + b2 x 2 j y j
ou, lembrando a definio do coeficiente de determinao mltipla ( R 2 ),
(S.Q.Regr. de y j | x1 j e x 2 j ) = R 2 y 2j
A contribuio de x1 j para essa soma de quadrados a diferena entre esse
valor e a soma de quadrados de regresso da regresso linear simples de y j contra x 2 j ,
isto ,
(Contribuio de x1 j ) = (S.Q.Regr. de y j | x1 j e x 2 j ) (S.Q.Regr. de y j | x 2 j ) =
= R 2 y 2j rY22 y 2j (4.55)
149
Para medir a importncia da contribuio de x1 j , comparamos seu valor com a
soma de quadrados residual da regresso linear simples de y j contra x 2 j , por meio do
cociente
(Contribuio de x1 j ) R 2 y 2j rY22 y 2j R 2 rY22

= = = (4.56)
(S.Q.Res. de y j | x 2 j ) y 2j rY22 y 2j 1 rY22
Esse cociente, chamado coeficiente de determinao parcial entre y j e x1 j , ,
no mximo, igual a um. Isso ocorre quando a introduo da varivel x1 j explicar (em
termos de soma de quadrados) tudo o que x 2 j deixou de explicar. Est claro que, neste
caso, o coeficiente de determinao mltipla tambm ser igual a um.
Para obter a expresso do cociente em funo apenas dos coeficientes de

correlao simples, utilizaremos a relao
rY21 2r12 rY 1 rY 2 + rY22

R2 = (4.57)
1 r122
que pode ser obtida (aps vrias passagens algbricas que podem ser desenvolvidas,
como exerccio) substituindo (4.40) e (4.41) em
b1 x1 y1 + b2 x 2 j y j
R2 =
y 2j
Substituindo (4.57) em (4.56), simplificando e fatorando, obtemos
(rY 1 r12 rY 2 ) 2
=
(1 r122 )(1 rY22 )
Comparando esse resultado com (4.51), conclumos que o coeficiente de

determinao parcial entre y j e x1 j igual ao quadrado do coeficiente de correlao
parcial entre as mesmas variveis. Ento (4.56) fica
(Contribuio de x1 j ) R 2 rY22
rY212 = = (4.58)
(S.Q.Res. de y j | x 2 j ) 1 rY22
Analogamente,
150
(Contribuio de x 2 j ) R 2 rY21
rY221 = = (4.59)
(S.Q.Res. de y j | x1 j ) 1 rY21
Para o exemplo numrico da tabela 4.1, temos
( x 2 j y j ) 2 (30) 2
(S.Q.Regr.d e y j | x 2 j ) = = = 90
x 22 j 10
(S.Q.Res.de y j | x 2 j ) = 116,5 90 = 26,5
Anteriormente j havamos obtido (ver tabela 4.2)
(S.Q.Regr.d e y j | x1 j e x 2 j ) = 114
Ento
(Contribuio de x1 j ) = 114 90 = 24
De acordo com (4.58) temos
24
rY212 = = 0,905660
26,5
Extraindo a raiz quadrada e adotando, de acordo com (4.53), o sinal de b1 , temos
rY 12 = 0,952
que j obtivemos anteriormente de (4.51).
Podemos verificar a significncia estatstica da contribuio de x1 j por meio
de um teste F, como mostrado na tabela 4.4.
TABELA 4.4. Anlise de Varincia

Regr. de y j | x 2 j 1 90
Contribuio de x1 j 1 24 24 19,2
Regr. de y j | x1 j e x 2 j 2 114 57 45,6

Resduo 2 2,5 1,25
Total 4 116,5
151
Dividindo o quadrado mdio referente contribuio de x1 j (que igual
respectiva soma de quadrados, pois esta tem 1 grau de liberdade) pelo quadrado mdio
residual da regresso mltipla obtivemos F = 19,2.
Ao nvel de significncia de 5%, o valor crtico de F, para 1 e 2 graus de
liberdade, 18,51. Portanto, o resultado obtido significativo.
importante observar que esse teste F equivalente ao teste t, feito
anteriormente na seo 4.8, para testar a hiptese H 0 : 1 = 0 contra H A : 1 0 . Note
que o valor de F obtido (19,2) igual ao quadrado do valor de t calculado para testar
essa hiptese (4,382).
At aqui analisamos o conceito de correlao parcial para o caso de uma
regresso linear com duas variveis explanatrias. O conceito pode, entretanto, ser
generalizado para o caso de uma regresso linear mltipla com k variveis
explanatrias. Apenas para facilidade de notao, consideremos o coeficiente de
correlao parcial entre y j e x1 j ( rY 123...k ). Sendo v j os desvios da regresso mltipla
de x1 j contra x 2 j , x 3 j ,..., x kj e z i os desvios da regresso mltipla de yi contra
x 2 j , x 3 j ,..., x kj , o coeficiente de correlao parcial entre y j e x1 j , por definio, o
coeficiente de correlao simples entre v j e z j . Pode-se demonstrar que o mesmo
resultado obtido de6

(Contribuio de x1 j )
rY212 3...k =
(S.Q.Res. de y j | x 2 j , x3 j ,..., x kj )
onde
(Contribuio de x1 j ) =
= (S.Q.Regr. de y j | x1 j , x 2 j , x3 j ,..., x kj ) (S.Q.Regr. de y j | x 2 j , x3 j ,..., x kj )
A significncia estatstica da contribuio de x1 j pode ser testada por meio de
uma decomposio da soma de quadrados de regresso, como est indicado no esquema

a seguir.
6
Ver a seo 5.3 (p. 132-135) de Johnston (1972), para uma outra maneira de obter os coeficientes de
correlao parcial.
152
Esquema da Anlise de Varincia
C.V. G.L.
Regr. de y j | x 2 j , x3 j ,..., x kj k1
Contribuio de x1 j 1
Regr. de y j | x1 j , x 2 j , x3 j ,..., x kj k=p1

Resduo np
Total n1
Pode-se demonstrar que o teste F para a contribuio de x hj sempre
equivalente ao teste t da hiptese H 0 : h = 0 contra H A : h 0 , isto , se
t h = bh / s (bh ) , temos
(Contribuio de x hj )
t h2 =
s2
e (Contribuio de x hj ) = t h2 s 2
A soma de quadrados residual da regresso completa (n p ) s 2 . Ento a soma
de quadrados residual da regresso sem x hj (n p ) s 2 + (Contribuio de x hj ) e o
coeficiente de determinao parcial entre y j e xhj
(Contribuio de x hj )
rYh2 i h =
(n p ) s 2 + (Contribuio de x hj )
Segue-se que
t h2 s 2
rYh2 i h =
(n p ) s 2 + t h2 s 2
ou
t h2
rYh2 i h =
t h2 + n p
Essa expresso permite obter com facilidade um coeficiente de determinao
parcial a partir do valor de t referente hiptese de nulidade do coeficiente
correspondente na regresso mltipla.
153
4.12. Intervalos de confiana e regies de confiana para os parmetros
Consideremos, novamente, o modelo de regresso linear com duas variveis

explanatrias:
Y j = + 1 X 1 j + 2 X 2 j + u j
Nesta seo vamos utilizar um novo exemplo numrico, baseado na amostra de 6

observaes apresentada na tabela 4.5. Pode-se verificar que Y = 9,5 , X 1 = 1,5 e
X 2 = 3 . A mesma tabela mostra os valores das variveis centradas y j , x1 j e x 2 j .
TABELA 4.5. Valores de trs variveis em uma amostra com 6 observaes.
Yj X1j X2j yj x1 j x2 j
1,5 0 0 8,0 1,5 3
6,5 1 2 3,0 0,5 1
10,0 1 4 0,5 0,5 1
11,0 2 2 1,5 0,5 1
11,5 2 4 2,0 0,5 1
16,5 3 6 7,0 1,5 3
Tendo em vista o modelo com todas as variveis centradas, obtemos
x12j x1 j x 2 j 5,5 9
X X = = ,
x1 j x 2 j x 22 j 9 22
x1 j y j 25,5
Xy = = ,
x 2 j y j 49
11 9
0,225
20 40
0,55
( X X) 1 = =

9 11 0,225 0,1375

40 80
3
e b = ( XX) 1 Xy =
1
A equao estimada
y j = 3 x1 j + x 2 j
ou
154
Y j = 2 + 3 X 1 j + X 2 j
A tabela 4.6 mostra a anlise de varincia da regresso, verificando-se que

R 2 = 0,977 .
TABELA 4.6. Anlise da Varincia
Regresso 2 125,5 62,75 62,75
Resduo 3 3 1
Total 5 128,5
Como s 2 = 1 , temos
V (b1 ) = 0,55 e V (b2 ) = 0,1375
Seguindo o procedimento apresentado na seo a 4.8, verifica-se que
37
V ( a ) =
60
Adotando um nvel de significncia de 1%, o valor crtico de F, com 2 e 3 graus
de liberdade, 30,82. Portanto, o resultado significativo, isto , rejeita-se, a esse nvel
de significncia, a hiptese H 0 : 1 = 2 = 0 .
Para testar a hiptese H 0 : 1 = 0 , contra H A : 1 0 , calculamos
3
t= = 4,045
0,55
Como o valor crtico de t para 3 graus de liberdade, ao nvel de significncia de
1%, 5,841, o resultado obtido no significativo, isto , no rejeitamos a hiptese
H 0 : 1 = 0 .
Para testar a hiptese H 0 : 2 = 0 contra a H A : 2 0 , calculamos
1
t= = 2,697 , no significativo
0,1375
interessante notar que neste exemplo, embora se rejeite, ao nvel de
significncia de 1%, a hiptese H 0 : 1 = 2 = 0 , no se rejeita, ao mesmo nvel de
significncia, nem a hiptese H 0 : 1 = 0 , nem a hiptese H 0 : 2 = 0 . Veremos,

adiante, porque isso pode ocorrer.
Na seo 4.5 vimos que o intervalo de confiana para o parmetro i de uma
regresso linear mltipla
155
bi t 0 s (bi ) < i < bi + t 0 s (bi )
Vamos determinar os intervalos de confiana, ao nvel de confiana de 99%,
para os parmetros , 1 e 2 , com base nos dados da tabela 4.5. O valor crtico de t ,
neste caso, 5,841.
Temos
a = 2 , b1 = 3 e b2 = 1 .
O intervalo de confiana para
37 37
2 5,841 < < 2 + 5,841
60 60
ou
2,59 < < 6,59
O intervalo de confiana para 1
3 5,841 0,55 < 1 < 3 + 5,841 0,55

ou
1,33 < 1 < 7,33
O intervalo de confiana para 2
1 5,841 0,1375 < 2 < 1 + 5,841 0,1375

ou
1,17 < 2 < 3,17
Esses intervalos de confiana devem ser interpretados com cuidado.
Consideremos, por simplicidade, apenas os parmetros 1 e 2 . Na figura 4.1
assinalamos os intervalos de confiana e traamos a elipse que delimita a regio de
confiana, ao nvel de confiana de 99%, para esses parmetros. Note que, apesar de
tanto o intervalo de confiana para 1 como o intervalo de confiana para 2 inclurem
o valor zero, o ponto ( 1 = 0, 2 = 0) no pertence regio de confiana para 1 e 2 .

por isso que, embora os valores de t obtidos no nos levem a rejeitar, ao nvel de
significncia de 1%, as hipteses H 0 : 1 = 0 ou H 0 : 2 = 0 , o teste F permite rejeitar,
a esse mesmo nvel de significncia, a hiptese H 0 : 1 = 2 = 0 .
156
Figura 4.1. A regio de confiana para os parmetros 1 e 2 .
O conjunto de pontos do retngulo ABCD corresponde aos valores de 1 e 2

que pertencem aos respectivos intervalos de confiana. Poder-se-ia pensar que esse
retngulo seria a regio de confiana para 1 e 2 . Entretanto, embora esse retngulo e
a regio de confiana correta (elptica) tenham uma rea em comum, fcil verificar
que existem pontos do retngulo que no pertencem regio de confiana (como o
caso de 1 = 2 = 0) e pontos da regio de confiana que no pertencem ao retngulo.
Vejamos, agora, como foi obtida a elipse da figura 4.1.
Para o modelo de regresso linear mltipla, com todas as pressuposies
apresentadas na seo 4.1, pode-se demonstrar que
1
(Cb C)[C( XX) 1 C]1 (Cb C) =F (4.60)
ms 2
onde m a caracterstica da matriz de constantes C e F est associado a m e n p graus

de liberdade.
A relao (4.60) muito geral. Mostraremos, inicialmente, que o teste F relativo

hiptese H 0 : 1 = 2 = K = k = 0 um de seus casos particulares.
Consideremos o modelo de regresso linear mltipla com todas as variveis

centradas:
k
y j = i x ij + u j u (4.61)
i =1
Fazendo C = I k , onde I k uma matriz identidade com caracterstica m = k, a
hiptese da nulidade fica
157
H 0 : C = 0
Em (4.60), fazendo C = I k e C = 0 , obtemos
b XXb
F=
ks 2
Lembrando que b = ( X X) 1 X y , obtemos
b X y
b X y Q.M.Regr.
F= 2
= k2 = ,
ks s Q.M.Res.
que , como sabemos, o valor de F usualmente calculado para verificar a significncia

estatstica da regresso ajustada.
Um outro caso particular de (4.60) o teste F para a contribuio de uma
varivel que, como vimos na seo 4.11, equivale ao teste t relativo hiptese
H 0 : i = 0 . Consideremos o modelo (4.61) e admitamos, para facilitar a indicao, que
se deseja verificar se a contribuio da varivel x1 j significativa, ou seja, vamos testar
a hiptese H 0 : 1 = 0 .
Fazemos
C = [1 0 0 K 0] , cuja caracterstica m = 1.
Ento, a hiptese da nulidade pode ser escrita como segue:
H 0 : C = 0
Temos, tambm, que

Cb = b1
e
C( X X) 1 C = w11 ,
onde w11 o primeiro elemento da diagonal principal de ( XX) 1 .

Substituindo esses resultados em (4.60) e considerando que C = 0 , obtemos
b1 ( w11 ) 1 b1 b12
F= =
s2 w11 s 2
Como w11 s 2 = s 2 (b1 ) segue-se que
| b1 |
| t |= F =
s(b1 )
158
Uma vez que o quadrado de um teste t sempre igual a um teste F com
numerador associado a um grau de liberdade, pode-se verificar que a relao (4.60)
engloba, como caso particular, qualquer t relativo a uma hiptese sobre o valor de um
parmetro ou sobre o valor de uma combinao linear de parmetros, incluindo-se, neste
ltimo caso, um teste a respeito de E (Yh ) .
Se, escolhido um nvel de confiana, substituirmos F, em (4.60), pelo seu valor
crtico F0 , essa relao nos fornecer os limites de um intervalo ou de uma regio de
confiana (dependendo de como definida a matriz C). Os pontos pertencentes ao
intervalo ou regio de confiana obedecem desigualdade
(Cb C )[C( XX) 1 C] 1 (Cb C) < F0 ms 2 (4.62)

Consideremos, por exemplo, que se deseja obter o intervalo de confiana para
1 . Tendo em vista o modelo (4.61), fazemos
C = [1 0 0 K 0] , cuja caracterstica m = 1.
Ento,
Cb = b1 , C = 1 e C( XX) 1 C = w11
Substituindo esses resultados em (4.62), obtemos
(b1 1 )( w11 ) 1 (b1 1 ) < F0 s 2
( 1 b1 ) 2 < F0 w11 s 2
F0 w11 s 2 < 1 b1 < F0 w11 s 2
b1 F0 w11 s 2 < 1 < b1 + F0 w11 s 2
Finalmente, como F0 = t 0 e w11 s 2 = s (b1 ) , temos
b1 t 0 s (b1 ) < 1 < b1 + t 0 s (b1 )
Verificamos, assim, que o intervalo de confiana para 1 pode ser considerado

como um caso particular de (4.62).
Determinemos, agora, a regio de confiana para os parmetros 1 e 2 de uma
regresso linear mltipla com 2 variveis explanatrias. Tendo em vista o modelo
Y j = 0 + 1 x1 j + 2 x 2 j + u j
fazemos
159
0 1 0
C=
0 0 1
cuja caracterstica m = 2. Ento
b
Cb = 1
C = 1 e
2 b2
Fazendo
1 b1 = q1 e 2 b2 = q 2 (4.63)
segue-se que
q
Cb C = 1 (4.64)
q 2
Temos, tambm, que
C( X X) 1 C =
1
0 0 0 0
0 1 0 n w w12
= 0 w11 w12 1 0 = 11
0 0 1 0 w w22
w12 w22 0 1 12

Donde
x12j x1 j x 2 j
[C( X X) C] =
1 1
(4.65)
x1 j x 2 j x 22 j
Substituindo (4.64) e (4.65) em (4.62) e lembrando que m = 2, obtemos
x12j x1 j x 2 j q1
[q1 q2 ] < 2 F0 s
2
(4.66)
x1 j x 2 j x 2 j q 2
2
No caso do exemplo numrico apresentado no incio desta seo, temos
x12j = 5,5 x22 j = 22
x1 j x 2 j = 9 s2 = 1
Para o nvel de confiana de 99%, o valor crtico de F com 2 e 3 graus de

liberdade 30,82.
160
5,5 9 q1
[q1 q2 ] < 2 30,82
9 22 q 2
ou
5,5q12 + 18q1 q 2 + 22q 22 61,64 < 0
Essa desigualdade satisfeita pelos pontos delimitados pela elipse

5,5q12 + 18q1 q 2 + 22q 22 61,64 = 0 ,
que a elipse traada na figura 4.1.
Para mais uma aplicao da relao (4.60), consideremos que, no exemplo

numrico que estamos desenvolvendo, desejamos testar, ao nvel de significncia de
5%, a hiptese
H 0 : 1 = 4 e 2 = 2
Ressaltemos que esta uma nica hiptese envolvendo, concomitantemente, os
valores de dois parmetros e que o teste dessa hiptese no equivale a fazer dois testes
consecutivos, um para a hiptese H 0 : 1 = 4 e outro para a hiptese H 0 : 2 = 2 .
Fazendo
0 1 0
C=
0 0 1
a hiptese H 0 : 1 = 4 e 2 = 2 pode ser indicada como segue:
4
H 0 : C =
2
Como
b 3
Cb = 1 = ,
b2 1
temos que
3 4 1
Cb C = = (4.67)
1 2 1
Substituindo (4.65) e (4.67) em (4.60) e lembrando que m = 2 e s 2 = 1 , obtemos
[1 1]
1 5,5 9 1
F= = 22,75
2 9 22 1
161
Como o valor crtico de F com 2 e 3 graus de liberdade e ao nvel de
significncia de 5% 9,55, o resultado significativo, isto , rejeita-se a hiptese
H 0 : 1 = 4 e 2 = 2 .
Se tivssemos adotado o nvel de significncia de 1%, no rejeitaramos
H 0 : 1 = 4 e 2 = 2 , pois, neste caso, o valor crtico de F 30,82. Isso pode ser
verificado na figura 4.1, notando que o ponto ( 1 = 4 , 2 = 2 ) pertence regio de
99% de confiana para 1 e 2 .
4.13. Exemplo de uma regresso linear mltipla com trs variveis

explanatrias
Nesta seo, desenvolveremos um exemplo de regresso linear mltipla com trs

variveis explanatrias, como ilustrao do que j foi vista neste captulo.
Na tabela 4.7 so apresentados 14 valores das variveis Y j , X 1 j , X 2 j e X 3 j .
Note que as trs variveis explanatrias j so centradas.
TABELA 4.7. Amostra de 14 observaes para 4 variveis.
Yj X 1 j = x1 j X 2 j = x2 j X 3 j = x3 j
8,5 2 2 2
1,0 1 1 0
4,0 1 0 0
4,0 1 0 0
5,0 1 1 0
3,0 1 1 0
6,0 1 0 0
6,0 1 0 0
7,0 1 1 0
5,0 0 0 1
5,0 0 0 0
5,0 0 0 0
3,0 0 0 1
0,5 2 2 2
162
Os valores bsicos a serem calculados so:
Y j = 63 x12j = 16 Y = 4,5
x 22 j = 12 y 2j = 61 x32 j = 10
x1 j Y j = 8 x1 j x 2 j = 8 x 2 j Y j = 24
x1 j x3 j = 8 x 3 j Y j = 18 x 2 j x 3 j = 8

Y j = 0 + 1 x1 j + 2 x 2 j + 3 x 3 j + u j , j = 1, 2, ..., 14
construmos as matrizes
14 0 0 0 63
0 16 8
8 8
XX = e Xy =
0 8 12 8 24

0 8 8 10 18
A seguir, obtemos
1
14 0 0 0
7 1 1
0
64 32 16
( XX) =
1
1 3 1
0
32 16 8

0 1 1 1

16 8 4
e
b0 4,5
b 1
b= 1
= ( XX) Xy =
1
b2 2

b3 1
A equao estimada
Y j = 4,5 + x1 j + 2 x 2 j x3 j
ou, uma vez neste exemplo xij = X ij (i = 1, 2, 3),
163
Y j = 4,5 + X 1 j + 2 X 2 j X 3 j
Temos
S.Q.Regr. = bi xij Y j =
i j
= 1 ( 8) + 2 24 + ( 1) ( 18) = 58
A anlise da varincia dada na tabela 4.8.

Regresso 3 58 19,33 64,44
Resduo 10 3 0,30
Total 13 61
Ao nvel de significncia de 1% e com 3 e 10 graus de liberdade, o valor crtico

de F 6,55. O resultado obtido , portanto, significativo, isto , rejeita-se, a esse nvel
de significncia, a hiptese H 0 : 1 = 2 = 3 = 0 .
O coeficiente de determinao mltipla
58
R2 = = 0,951
61
Sabemos que as estimativas das varincias e covarincias das estimativas dos
parmetros so dadas por ( XX) 1 s 2 .
Assim, por exemplo, a estimativa da varincia de b2

9
V (b2 ) =
160
Ento
9
s(b2 ) = = 0,237
160
O intervalo de confiana para 2 , ao nvel de confiana de 95%,
2 2,228 0,237 < 2 < 2 + 2,228 0,237

ou
1,47 < 2 < 2,53
164
Para testar, ao nvel de significncia de 1%, a hiptese H 0 : 2 = 0 , contra a
hiptese alternativa H A : 2 0 , calculamos
b2 0 2
t= = = 8,433
s (b2 ) 9
160
Como o valor crtico de t para 10 graus de liberdade 3,169, o resultado obtido

significativo, isto , rejeita-se, ao nvel de significncia de 1%, a hiptese de que
2 = 0 , em favor da hiptese de que 2 0 .
Passemos, agora, determinao do coeficiente de correlao parcial entre Y j e
X 3 j , dados X 1 j e X 2 j . Para isso obteremos, inicialmente, as estimativas dos
coeficientes da regresso de Y j em relao a x1 j e x 2 j . Sendo c0 , c1 e c2 as
estimativas dos coeficientes dessa regresso e z j os desvios, temos
Y j = c 0 + c1 x1 j + c 2 x 2 j + z j

1
c0 14 0 0 63
c = 0 16 8 8 =
1
c 2 0 8 12 24
1
14 0 0

63 4,5
1
8 = 0,75
3
=0
32 16
24 2,5
1 1
0
16 8
A soma de quadrados de regresso dessa regresso

(S.Q.Regr. de Y j | x1 j , x2 j ) = 0,75 (8) + 2,5 24 = 54
Ento
(S.Q.Res. de Y j | x1 j , x2 j ) = 61 54 = 7
Como
(S.Q.Regr. de Y j | x1 j , x 2 j , x3 j ) = 58,
165
segue-se que
(Contribuio de x 3 j ) = 58 54 = 4
Ento, o coeficiente de determinao parcial entre Y j e X 3 j
(contribuio de x3 j ) 4
rY2312 = =
(S.Q.Res. de Y j | x1 j , x 2 j ) 7
Lembrando que b3 negativo, conclumos que o coeficiente de correlao
parcial entre Y j e X 3 j
4
rY 312 = = 0,756
7
Os demais coeficientes de correlao parcial podem ser obtidos de maneira
anloga.
Faamos, agora, o teste da hiptese
H 0 : 1 + 2 + 3 = 1
contra a hiptese alternativa
H A : 1 + 2 + 3 1 ,
ao nvel de significncia de 5%.
Fazendo
c = [0 1 1 1] ,
a hiptese da nulidade fica
H 0 : c = 1
V (c b ) = c ( X X) 1 cs 2 =
1
14 0 0 0 0

0 7 1 1 1

64 32 16
= [0 1]
141
1 1 0,30 =

1 3 1 640
0 1
32 16 8

1 1 1
0 1
16 8 4
A seguir, obtemos
166
cb c 2 1
t= = = 2,130
V (cb) 141
640
Como, ao nvel de significncia de 5% e para 10 graus de liberdade, o valor

crtico de t 2,228, o resultado obtido no significativo.
Determinemos, agora, a regio de 95% de confiana para os parmetros 2 e 3
.
Fazemos
0 0 1 0
C= ,
0 0 0 1
cuja caracterstica m = 2.
Temos que
2
C = 2 , Cb =
3 1
e
3 1
16 18
C( XX) C =
1

1 1
8 4
Substituindo esses resultados em (4.62) obtemos
1
3 1
16 8
2 2 2 2
1 1 < F0 2 0,30
3 3
1 1
8 4
Como o valor crtico de F com 2 e 10 graus de liberdade, para um nvel de

confiana de 95%, 4,10, segue-se que os pontos pertencentes regio de confiana
obedecem desigualdade

2 2 8 4 2 2
+ 1 4 < 4,10 2 0,30
3 6 3 + 1
167
Sabemos que essa regio de confiana delimitada por uma elipse com centro no
ponto 2 = 2 e 3 = 1 .
A regio de confiana para 1 , 2 e 3 um elipside num espao com 3

dimenses. A visualizao desse elipside exigiria a determinao e o traado de elipses
que resultam da interseco da superfcie do elipside com planos perpendiculares a um
dos trs eixos coordenados, para vrios valores do parmetro correspondente. Portanto,
fcil ver que a quantidade de clculos exigida para a determinao das regies de
confiana dos parmetros de uma regresso cresce muito rapidamente com o nmero de
parmetros envolvidos e que a visualizao dessas regies de confiana se torna difcil
para mais de dois parmetros.
4.14. Problemas de especificao
Vimos, no Captulo 2, que no caso de uma regresso linear simples, o problema

de especificao da relao entre as duas variveis consiste em escolher o tipo de
funo, isto , o modelo matemtico.
Surge outro problema de especificao quando mais de uma varivel

explanatria pode estar afetando a varivel dependente. Ento, alm de escolher o tipo
de funo, necessrio determinar quais as variveis explanatrias que devem ser
consideradas no modelo.
Vamos analisar o que ocorre com as estimativas dos coeficientes quando se
cometem erros de especificao da matriz X.
Admitamos que a relao verdadeira seja
y = X + u (4.68)
e que o pesquisador, erroneamente, utilize, em lugar de X, uma matriz V. bvio que,

geralmente, as matrizes X e V tm algumas colunas em comum.
De acordo com o mtodo de mnimos quadrados, o pesquisador em questo
obter
g = (V V ) 1 V y (4.69)
enquanto que as estimativas corretas seriam
b = ( XX) 1 Xy
Substituindo (4.68) em (4.69) obtemos
168
g = (V V ) 1 V X + (V V ) 1 V u
e
E (g) = P , (4.70)
onde
P = (V V ) 1 V X (4.71)
Para mais facilmente explicar o problema, consideremos um caso em que o

modelo correto
y j = 1 x1 j + 2 x 2 j + 3 x3 j + u j u
e o pesquisador, erroneamente, obtm a equao estimada
y j = g 1 x1 j + g 2 x 2 j
Neste caso
x12j x1 j x 2 j

VV=
x1 j x 2 j x 22 j
x 2 x1 j x 2 j x1 j x3 j
V X = 1 j
x1 j x 2 j x x 2 j x3 j
2
2j
1 0 1
P = (V V ) 1 V X =

(4.72)
0 1 2
onde 1 e 2 so estimativas dos coeficientes de regresso de x 3 j contra x1 j e x 2 j .
De (4.70) e (4.72), segue-se que

1 0 1 1 1 + 1 3
E (g ) = =
2
0 1 2 2 + 2 3
3
ou seja,
E ( g1 ) = 1 + 1 3
e
169
E ( g 2 ) = 2 + 2 3
Verificamos que as estimativas dos coeficientes obtidos ( g 1 e g 2 ) com o

modelo erroneamente especificado so tendenciosas. O vis de g i como estimativa de
i depende do valor do parmetro da varivel excluda ( 3 , no caso acima) e do valor

da estimativa do coeficiente relativo a x ij na regresso da varivel excluda contra as
variveis includas.
Consideremos, agora, o caso em que o modelo correto seria
y j = 1 x1 j + 2 x 2 j + u j u
e o pesquisador, erroneamente, ajusta a regresso

y j = g1 x1 j + g 2 x 2 j + g 3 x 3 j
Neste caso
x12j x1 j x 2 j x1 j x3 j

V V = x1 j x 2 j x 22 j x 2 j x3 j
x1 j x3 j x 2 j x3 j x32 j

e
x12j x1 j x 2 j

V X = x1 j x 2 j x 22 j
x1 j x3 j x 2 j x3 j

Ento, de acordo com (4.71),
1 0
P = (V V ) 1 V X = 0 1
0 0

1 0 1
1
E ( g ) = 0 1 = 2 ,

0 0 2 0
ou seja,
E ( g1 ) = 1 ,
E(g 2 ) = 2
e
E(g3 ) = 0
170
interessante notar que quando inclumos uma varivel desnecessria, as
estimativas dos coeficientes permanecem no-tendenciosas, diferentemente do que
ocorre quando deixamos de incluir uma das variveis explanatrias importantes. Isso
mostra que prefervel incluir uma varivel desnecessria que no incluir uma varivel
relevante. Entretanto, a incluso de variveis desnecessrias tambm prejudicial, pois
em geral faz com que aumente a varincia dos estimadores.
H, tambm, o perigo de um controle inapropriado mascarar o efeito que se
deseja captar. Considere um pesquisador que deseja avaliar o efeito das transferncias
de renda do Programa Bolsa Famlia sobre a pobreza, utilizando dados por Unidade de
Federao. A varivel dependente a reduo da pobreza e a varivel explanatria
fundamental o montante de transferncias per capita em certo perodo. Devem ser
controladas caractersticas especficas de cada Unidade da Federao que condicionam
o efeito das transferncias sobre a pobreza, mas um absurdo incluir, nesses controles,
mudanas na renda mdia e no ndice de Gini da distribuio da renda em cada Unidade
da Federao. Aumentando a renda dos pobres, as transferncias contribuem para
reduzir a desigualdade e aumentar um pouco a renda mdia da populao. Usando uma
medida de desigualdade e a renda mdia como controles o pesquisador torna
praticamente impossvel captar o efeito das transferncias sobre a pobreza7. O exerccio
4.39 apresenta dados numricos artificiais que ilustram a questo.
O problema dos maus controles discutido em Angrist e Pischke (2009, p. 64-
68). Eles assinalam que nem sempre mais controle melhor, que variveis medidas
antes que a varivel explanatria de interesse tenha sido determinada so geralmente
bons controles e que necessrio verificar se alguma varivel de controle , ela prpria,
determinada pela varivel explanatria de interesse.
4.15. Transformao das variveis para obter a matriz de correlaes

simples
y j = i xij + u j u
i
7
Como ocorre frequentemente, isso pode parecer bvio depois de assinalado. Mas em dois artigos
publicados na Revista Brasileira de Economia h erro de especificao semelhante, incluindo o ndice de
Gini e o PIB per capita de cada Unidade da Federao em modelos destinados a captar o efeito de
transferncias do governo federal sobre a pobreza: Marinho e Araujo (2010) e Marinho et al. (2011).
171
ou
z j = i vij + j + (4.73)
i
onde
yj xij
zj = , vij = , i = 1, 2, ..., k (4.74)
y 2j xij2
xij2
i = i , (4.75)
y 2j
uj u
j = e =
y 2
j y 2j
Indicando por V a matriz das variveis explanatrias e por z o vetor dos

valores da varivel dependentes, temos
1 r12 ... r1k rY 1

r 1 ... r2 k r
V V = 12 e V z = Y 2
M M M M

r1k r2 k K 1 rYk
pois vij2 = 1 , vij v hj = rih com i h, e vij y j = rYi

i i i
As estimativas de mnimos quadrados dos i so dadas por
c = (V V ) 1 V z
Geralmente, os programas de computador para ajuste de regresses mltiplas
fazem, no incio, as transformaes (4.74). Note que os elementos das matrizes V V e
V z , que passam a ser utilizadas em lugar de X X e X y , variam apenas de 1 a +1.
Isso contribui para diminuir os efeitos dos erros de arredondamento. Obtidas as
estimativas de i , as estimativas dos parmetros i so, de acordo com (4.75), dadas
por
y 2j
bi = ci
xij2
172
4.16. Regresses que se tornam lineares por anamorfose
Vrios modelos estatsticos podem ser facilmente transformados em modelos de

regresso linear mltipla.
Assim, a regresso quadrtica
Y j = + 1 X j + 2 X 2j + u j
pode ser encarada como uma regresso linear mltipla com duas variveis
explanatrias, fazendo X j = X 1 j e X 2j = X 2 j .
De maneira anloga, qualquer regresso polinomial pode ser ajustada como uma
regresso linear mltipla.
Em pesquisas econmicas, freqentemente utilizado o modelo
Y j = X 1j1 X 1j2 ... X kj k j

log Y j = log + i log X ij + log j ,
i
que um modelo de regresso linear mltipla nos logaritmos das variveis. Neste caso,
desde que u j = log j obedea s pressuposies vistas na seo 4.1, as estimativas de
mnimos quadrados tm as propriedades estatsticas desejveis.
4.17. Ortogonalidade e multicolinearidade na matriz X
Vejamos o que ocorre quando todas as colunas da matriz X so ortogonais entre

si, isto ,
xij x hj = 0 para i h
i
A matriz X X , ento, uma matriz diagonal.

y j = i xij + u j + u
i
temos, neste caso, que
173
1
x2 0 0
1j
0 1
0
( X X) 1
= x 22 j

0 0
1
x kj2

e
x1 j y j

x1 j
2
x2 j y j
b = ( XX) Xy = x 22 j
1

x kj y j

x kj
2
Portanto, as estimativas dos parmetros da regresso mltipla coincidem com as

estimativas dos coeficientes das regresses lineares simples de Y j contra cada uma das
variveis explanatrias e a soma de quadrados de regresso, dada por

S.Q.Regr. = bi xij y j ,
i j
, neste caso, igual soma das somas de quadrados de regresso das regresses lineares
simples de Y j contra cada uma das variveis explanatrias. O coeficiente de
determinao mltipla , portanto, igual soma dos coeficientes de determinao das

regresses lineares simples mencionadas.
Como vimos, a ortogonalidade entre as colunas da matriz X facilita bastante a
anlise.
Vejamos, agora, o que ocorre quando h multicolinearidade perfeita, isto ,
quando existem, na matriz X, colunas linearmente dependentes.
Consideremos, inicialmente, o caso de uma regresso linear mltipla com duas
variveis independentes perfeitamente correlacionadas entre si
Y j = 1 x1 j + 2 x 2 j + u j u
com
( xij x 2 j ) 2
r =
2
12 =1
x12j x 22 j
Neste caso, temos
174
| XX |= x12j x22 j ( x1 j x 2 j ) 2 = 0 ,
isto , o determinante da matriz X X igual a zero. No possvel, ento, inverter a

matriz X X e, consequentemente, impossvel obter as estimativas de 1 e 2 .
Geometricamente, o que ocorre que os pontos ( x1 j , x 2 j , y j ) esto todos sobre
um plano , perpendicular ao plano definido pelos eixos de x1 j e de x 2 j . O mtodo dos
mnimos quadrados permite determinar apenas uma reta no plano ; qualquer que seja o
plano que contenha essa reta, a soma dos quadrados dos desvios assume o mesmo valor;
portanto, existe indeterminao.
importante compreender que no caso de uma regresso com mais de duas
variveis explanatrias pode existir multicolinearidade perfeita, mesmo que nenhum dos
coeficientes de determinao simples seja igual a um (ver exerccio 4.12).
Freqentemente, a matriz X apresenta multicolinearidade elevada, embora no
perfeita. As principais conseqncias desse fato so as seguintes:
1) As varincias e covarincias das estimativas dos parmetros sero muito elevadas,
isto , as estimativas obtidas podem ter erros muito grandes e esses erros podem
estar altamente correlacionados entre si. A baixa preciso das estimativas torna
difcil, ou at mesmo impossvel, distinguir as influncias das diversas variveis
explanatrias;
2) Um pesquisador pode ser levado a eliminar variveis da anlise porque os
coeficientes no se mostraram estatisticamente diferentes de zero; essas variveis
podem, na realidade, ser importantes e a amostra disponvel que no permite
detectar sua influncia;
3) As estimativas dos coeficientes variam muito de amostra para amostra. A adio de
algumas observaes amostra pode alterar muito o valor da estimativa obtida.
Para mostrar como a multicolinearidade afeta a preciso das estimativas

consideremos, novamente, uma regresso mltipla com apenas duas variveis
explanatrias:
y j = i xij + u j + u
i
Fazendo
175
yj x1 j x2 j
zj = , v1 j = , v2 j = ,
y 2j x12j x 22 j
x12j x 22 j
1 = 1 , 2 = 2 ,
y 2j y 2j
uj u
j = e = ,
y 2
j y 2j
obtemos
z j = 1v1 j + 2 v 2 j + j + (4.76)
A matriz de varincias e covarincias das estimativas ( c1 e c2 ) dos parmetros

de (4.76)
1
v12j v1 j v 2 j
,
2

v1 j v 2 j v 2 j
2
ou, de acordo com o que foi visto na seo 4.15,
1 r12
1 1 r 2 1 r122
1 r12 12 2
r 2
= ,
12 1
r12 1
1 r 2 1 r122
12
Conclumos que
2
V (c1 ) = V (c 2 ) = (4.77)
1 r122
r12 2
cov(c1 , c 2 ) = (4.78)
1 r122
176
As expresses (4.77) e (4.78) mostram que as varincias e o valor absoluto da
covarincia das estimativas dos parmetros crescem rapidamente quando r122 se
aproxima de um, isto , quando aumenta o grau de multicolinearidade.
Se r12 for positivo, verifica-se, pela expresso (4.78), que a covarincia das
estimativas dos parmetros negativa.
interessante examinar o valor do erro de estimativa para uma determinada

amostra. De acordo com (4.10) temos que
1 r12
1 r 2 1 r122 v
c1 1 12
c = =
1j j
v (4.79)
c 2 2 r12 1 2j j
1 r 2 1 r122
12
Indicando por d j os desvios da regresso linear simples de v 2 j contra v1 j temos
v 2 j = r12 v1 j + d j , j = 1, ..., n (4.80)
De acordo com (2.6),
v1 j d j = 0
Multiplicando cada uma das igualdades em (4.80) por j e somando, obtemos
v 2 j j = r12 v1 j j + d j j (4.81)
De (4.79) e (4.81) obtemos
v1 j j r122 v1 j j r12 d j j r12 d j j

c1 1 = = v1 j j (4.82)
1 r122 1 r122
r12 v1 j j + r12 v1 j j + d j j d j j
c2 2 = = (4.83)
1 r 2
12 1 r122
177
essas expresses mostram que, se r12 positivo e se aproxima de um, os erros de
estimao dos parmetros so grandes e de sinais opostos; se c1 superestima 1 , ento
c2 subestima 2 , e vice-versa.
Pode-se demonstrar que no h razo para que a multicolinearidade afete

seriamente a estimativa da varincia residual.8 Portanto, as estimativas das varincias
das estimativas dos parmetros so indicadores adequados da existncia de
multicolinearidade. O efeito de uma varivel explanatria pode ser suficientemente
forte, de tal maneira que o respectivo coeficiente se mostre estatisticamente diferente de
zero apesar da multicolinearidade; uma multicolinearidade bastante alta impedir,
entretanto, que se detecte a influncia de variveis importantes.
4.18. Teste de hipteses no modelo linear
Nesta seo vamos apresentar uma maneira geral de encarar os testes de

hipteses no modelo de regresso linear.
Uma hiptese sobre os parmetros de um modelo de regresso corresponde,
sempre, a uma restrio. O modelo que incorpora a restrio, denominado modelo
restrito, ser menos flexvel do que o modelo original.
Dada uma amostra de dados, seja SU a soma de quadrados residual obtida
ajustando o modelo original, irrestrito (o ndice do smbolo se deve palavra inglesa
para irrestrito: unrestricted), e seja S R a soma de quadrados residual obtida ajustando o
modelo restrito. Como o modelo restrito menos flexvel, a respectiva soma de
quadrados residual tende a ser maior, isto ,
S R SU (4.84)
Se S R for igual ou pouco maior do que SU , indicando que o modelo restrito se

ajusta aos dados quase to bem como o modelo irrestrito, no h razo para rejeitar a
hiptese. Por outro lado, se S R for substancialmente maior que SU , indicando que o
ajustamento do modelo restrito (que incorpora a hiptese) claramente pior, deveremos
rejeitar a hiptese formulada, pois ela entra em choque com os dados.
8
Ver Johnston (1972), p. 163.
178
Para saber se a diferena S R SU ou no substancial, o respectivo quadrado
mdio comparado com o quadrado mdio residual do modelo irrestrito, calculando-se
S R SU
g gU
F= R , (4.85)
SU
gU
onde g U e g R so os graus de liberdade associados a SU e S R , respectivamente.

claro que a explicao apresentada para obter a expresso (4.85) informal, procurando
apenas mostrar a lgica mais geral da sua fundamentao. Formalmente, necessrio
mostrar que S U / 2 tem distribuio de Qui-quadrado com g U graus de liberdade, e
que, se a hiptese da nulidade for verdadeira, ( S R SU ) / 2 tem distribuio de Qui-
quadrado com g R g U graus de liberdade, independente da distribuio de S U / 2 .

Pode-se, ento, concluir que a varivel obtida em (4.85) tem distribuio de F com
g R g U e g U graus de liberdade.
Note-se que o denominador de (4.85) o quadrado mdio do resduo do modelo
original (irrestrito), que tem sido indicado por s 2 . Ento a expresso fica
S R SU
F= (4.86)
( g R gU ) s 2
Se uma hiptese sobre os parmetros de uma regresso linear formulada como
H 0 : C = , onde C e so matrizes com elementos numricos dados, a expresso
(4.85) equivalente expresso (4.60), podendo-se deduzir (4.60) de (4.85).

Vejamos alguns exemplos de aplicao de (4.85). O procedimento sempre
envolve trs etapas: (a) obter a soma de quadrados residual do modelo irrestrito ( SU ) e
os respectivos graus de liberdade ( g U ); (b) construir o modelo restrito e obter a
correspondente soma de quadrados residual ( S R ) e seus graus de liberdade ( g R ); (c)

aplicar (4.85) e interpretar o resultado.
Consideremos os dados da tabela 4.1 e o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j
Vamos admitir que queremos testar a hiptese H 0 : 1 = 0 . Ento o modelo restrito
Yj = + 2 X j + u j
179
Na seo 4.8 j obtivemos a soma de quadrados residual para o modelo original
(irrestrito), que
SU = 2,5 , com g U = 2 (4.87)
Na seo 4.11 (tabela 4.4) vimos que a soma de quadrados de regresso de uma
regresso de Y contra X 2 igual a 90, podendo-se verificar, ento, que a soma de
quadrados residual do modelo restrito
S R = 26,5 , com g R = 3 (4.88)
Substituindo os resultados (4.87) e (4.88) em (4.85), obtemos
26,5 2,5
F = 32 =
24
= 19,2
2,5 1,25
2
Como no podia deixar de ser, esse o valor de F para contribuio de X 1 na tabela
4.4, que o quadrado do valor de t referente hiptese H 0 : 1 = 0 obtido na seo 4.8
(t = 4,382).
Como segundo exemplo, vamos usar (4.85) para testar a hiptese
H 0 : 1 = 4 e 2 = 2 (4.89)
com base nos dados da tabela 4.5 (seo 4.12). O modelo irrestrito
Y j = + 1 X 1 j + 2 X 2 j + u j (4.90)
Na seo 4.12 vimos que a soma de quadrados residual para esse modelo
SU = 3, com g U = 3 (4.91)
O modelo restrito fica
Yj = + 4X1j + 2X 2 j + u j
ou
Yj 4X1j 2X 2 j = + u j (4.92)
Note-se que o modelo sempre deve ser escrito de maneira que no segundo
membro fiquem apenas o erro e os termos com parmetros a serem estimados.
Fazendo
W j = Yj 4X1j 2X 2 j , (4.93)
o modelo (4.92) fica
180
Wj = + u j (4.94)
Usando (4.93), podemos calcular os 6 valores de W j para a amostra apresentada
na tabela 4.5. A estimativa de no modelo (4.94) , simplesmente W , que igual a

2,5. Os desvios dessa regresso so w j = W j W , pois como no h coeficientes de
regresso, a soma de quadrados residual a prpria soma de quadrados total (

w 2j = 48,5 , com 6 1 = 5 graus de liberdade). Portanto, para o modelo restrito (4.92)
temos
S R = 48,5, com g R = 5 (4.95)
Substituindo os resultados (4.89) e (4.95) na expresso (4.85), obtemos

48,5 3
F = 53 =
45,5
= 22,75 (4.96)
3 2
3
Adotando um nvel de significncia de 5% , o valor crtico de F para 2 e 3 graus

de liberdade 9,55. O resultado significativo, levando a rejeitar a hiptese (4.89).
Note-se que, como no podia deixar de ser, o resultado obtido em (4.96) idntico ao
obtido no final da seo 4.12, usando a expresso (4.60).
4.19. Interpretao geomtrica da anlise de regresso linear de acordo

com o mtodo de mnimos quadrados
Do estudo da lgebra vetorial sabemos que o vetor
X 1 11
x = X 2 = 2 (4.97)
X 3 10
pode ser representado, graficamente, por uma seta que vai da origem do sistema de
eixos ao ponto (11, 2, 10), num espao tridimensional, como mostra a figura 4.2.
181
Figura 4.2. Representao grfica de um vetor no espao tridimensional.
Genericamente, dizemos que
X1 Y1
X Y
x = 2 e y = 2
M M

X n Yn
so vetores no espao n-dimensional.
O produto escalar ou produto interno de dois vetores de mesma dimenso, x e y,

que indicamos x y , , por definio, igual a X i Yi . Temos
n
x y = y x = x y = y x = X i Yi
i =1
Verifica-se facilmente que o produto escalar de vetores distributivo em relao

soma, isto , se x, y e v so trs vetores de mesma dimenso,
x (y + v) = x y + x v
O mdulo ou comprimento do vetor x dado por
| x |= x x
Para vetores com duas ou trs dimenses pode-se verificar, atravs do teorema
de Pitgoras, que esta definio de comprimento de um vetor corresponde ao
comprimento da seta que o representa. O comprimento do vetor dado em (4.97)
| x |= 112 + 2 2 + 10 2 = 15
Por definio, dois vetores so ortogonais se seu produto escalar igual a zero,
isto , x ortogonal a y se, e somente se, x y = 0 . Assim, por exemplo, os vetores
182
2 1
x= e y=
1 2
so ortogonais entre si, pois x y = 0 . Esses vetores esto representados na figura 4.3,
que mostra que as setas representativas de dois vetores ortogonais so perpendiculares
entre si.
Figura 4.3. Dois vetores ortogonais
Seja um escalar. Ento, se x um vetor com elementos X 1 , X 2 ,..., X n , os
elementos do vetor x so X 1 , X 2 ,..., X n . Os vetores x e x tm a mesma direo,
isto , so vetores colineares (as setas esto sobre a mesma reta-suporte). Se > 0, a
orientao ou sentido dos vetores x e x o mesmo e, se < 0, esses vetores tm
sentidos opostos.
Temos
| x |= (x) (x) = 2 x x =| | | x | ,
isto , o comprimento de x igual ao comprimento de x multiplicado pelo valor

absoluto de .
Para exemplificar, lembremos o vetor x dado em (4.97). Pode-se verificar que os
vetores 2x e 2x so colineares com x e tm comprimento igual a 30, isto , o dobro do
comprimento de x.
Vamos supor agora que, com base em uma amostra com apenas 3 observaes,
foram obtidos os pares de valores ( X i , Yi ) apresentados na tabela 4.9. As mdias das
duas variveis nessa amostra so iguais a zero, isto , xi = X i e y i = Yi (com i = 1, 2,

3).
183
TABELA 4.9. Valores de X i e Yi para uma amostra com 3 observaes.
X i = xi Yi = y i
0 2
2 2
2 4
Seja x o vetor cujos elementos so os valores da varivel centrada xi e seja y o
vetor cujos elementos so os valores da varivel centrada yi , isto ,
0 2
x = 2 e y = 2
(4.98)
2 4
A figura 4.4 mostra a representao desses vetores no espao tridimensional.
Figura 4.4. O plano () dos vetores x e y.
importante notar a diferena entre esse tipo de representao grfica e aquele

das figuras 2.2 e 3.1. Nas figuras 2.2 e 3.1 cada eixo corresponde a uma varivel, ao
passo que na figura 4.4 cada eixo corresponde a uma observao. L utilizamos o
espao das variveis e aqui estamos considerando o espao das observaes.
Temos x x = 8 e y y = 24 . Portanto o comprimento do vetor x
| x |= 8 = 2 2 e o comprimento do vetor y | y = 24 = 2 6 .
Na figura 4.4, seja o plano dos vetores x e y. O plano um subespao
bidimensional do espao tridimensional. Qualquer que seja o nmero de observaes da
amostra, isto , qualquer que seja a dimenso (n) de x e y, desde que esses vetores no
184
sejam colineares, eles definem um plano (um subespao bidimensional) no espao n-
dimensional. Na figura 4.5 os vetores x e y esto representados nesse subespao
bidimensional.
Figura 4.5. A projeo vertical de y sobre a reta-suporte de x e o ngulo entre x e y.
Na figura 4.5 o ngulo entre os vetores x e y foi denominado . Foi obtida a
projeo vertical OA = y * do vetor y sobre a reta-suporte do vetor x. Como y * e x so

colineares, existe um escalar tal que
OA = y * = x (4.99)
Temos
y * + AB = y
ou
AB = y y *
Uma vez que x e AB = y y * so vetores ortogonais entre si, temos
x (y y * ) = 0
Ento
x y = x y* (4.100)
x y = (x x)
ou
xy
= (4.101)
xx
Na figura 4.5, como OAB um tringulo retngulo com hipotenusa igual a | y | ,

temos
185
| y* | y* y*
cos = =
|y| yy
Lembrando (4.99), segue-se que
xx
cos = (4.102)
yy
Substituindo (4.101) em (4.102) obtemos

xy
cos = (4.103)
(x x)(y y )
Se os elementos de x e de y so, respectivamente xi e yi (com i = 1, 2, ..., n),

isto , so os valores das variveis centradas obtidos de uma amostra com n
observaes, verifica-se que
xi y i
cos = = r, (4.104)
xi2 y i2
onde r o coeficiente de correlao entre X e Y na amostra.

Para a amostra dada na tabela 4.9, que corresponde aos vetores x e y definidos
em (4.98) e representados nas figuras 4.4 e 4.5, temos
12 3
cos = r = =
8 24 2
Donde
= 30 o
Vamos agora considerar a anlise de regresso de Y contra X de acordo com o
modelo
Yi = X i + u i
ou
y = x + u ,
onde
Y1 X1
Y2 X
y = e x = 2
M M

Yn X n
186
Para dar um exemplo numrico, vamos considerar os valores de X i e Yi dados
na tabela 4.9. Ento x e y so os vetores tridimensionais definidos em (4.98) e
representados nas figuras 4.4 e 4.5. Devemos ressaltar que o raciocnio apresentado a
seguir no depende da dimenso dos vetores x e y, pois estaremos considerando apenas
o plano (subespao bidimensional) definido por esses vetores (admitindo que x e y no
sejam colineares).
Se b a estimativa de , o vetor dos desvios
e = y bx
De acordo com o mtodo de mnimos quadrados, devemos determinar o valor de
b que minimiza a soma dos quadrados dos desvios, dada por ee ou e e . Mas e e e,
tambm, o quadrado do comprimento do vetor e = y bx . Devemos, portanto,
determinar o valor de b que minimiza o comprimento do vetor e = y bx .
Uma vez que b um escalar, bx um vetor colinear com x, como os vetores
OA e OC na figura 4.5. Se fizermos bx = OA , teremos e = AB e, se fizermos bx =
OC , teremos e = CB . Por outro lado, sabemos que a menor distncia de um ponto a

uma reta dada pela perpendicular baixada do ponto sobre a reta. Uma vez que, na
figura 4.5, OA = x , por construo, a projeo vertical de y sobre a reta-suporte do

vetor x, conclumos que, para minimizar o comprimento de e = y bx , devemos fazer
bx = OA = x . Portanto, o estimador de mnimos quadrados de

b=
Lembrando (4.101), obtemos
xy
b= = ( x x) 1 x y
xx
Esta relao um caso particular de (4.7).
Para os valores de X i e Yi da tabela 4.9, obtemos x x = 8 , x y = 12 e
b = 12 / 8 = 1,5 .
Como OA = bx o vetor com os valores estimados de Yi , passaremos a indic-
lo por y , de acordo com a notao utilizada em sees anteriores.

O vetor dos desvios da regresso
AB = e = y OA = y y
No tringulo retngulo OAB da figura 4.5, o teorema de Pitgoras estabelece que
187
2 2 2
OB = OA + AB
ou
y y = y y + e e
Tambm podemos escrever
y y = y y + e e
ou
S.Q.total = (S.Q.Regr.) + (S.Q.Res.),
que uma relao j demonstrada anteriormente, mas de outra maneira.

Uma vez que x e e so vetores ortogonais entre si, temos
x e = xe = 0
Esta relao um caso particular de (4.8).
fcil verificar que se x e y fossem colineares, teramos = 0, r = cos = 1,
y = y = bx , e = 0 e S.Q.Res. = ee = 0 .
Vamos considerar, a seguir, o modelo de regresso linear mltipla
y = X + u (4.105)
onde
Y1 X 11 X 21
Y X X 22
y = 2 , X = 12 ,

Yn X 1n X 2n
u1
u

= 1 e u = 2
2

u n
Se indicarmos por x1 e x 2 os vetores constitudos pela primeira e pela segunda
coluna da matriz X, respectivamente, isto , se fizermos
X 11 X 21
X X
x1 = 12 e x 2 = 22 ,

X 1n X 2n
temos
y = 1 x1 + 2 x 2 + u (4.106)
188
Vamos admitir que os vetores y, x1 e x 2 tm dimenso igual ou superior a 3,
no so colineares nem esto todos em um mesmo plano, isto , vamos admitir que y,
x1 e x 2 so linearmente independentes.9 Observada esta condio, qualquer que seja a
dimenso (n 3) dos vetores x1 , x 2 e y, tais vetores geram um espao tridimensional.
A figura 4.6 mostra os 3 vetores nesse espao. Seja o plano (subespao

bidimensional) gerado por x1 e x 2 .
Figura 4.6. Os vetores y, x1 e x 2 .
De acordo com o mtodo de mnimos quadrados, devemos determinar

y = b1 x1 + b2 x 2 de maneira a minimizar e e = ( y y ) ( y y ) , que o quadrado do
comprimento do vetor y y . Devemos, portanto, determinar y = b1 x1 + b2 x 2 de
maneira a minimizar o comprimento do vetor y y . Necessariamente y = b1 x1 + b2 x 2
um vetor no plano , porque uma combinao linear dos vetores x1 e x 2 .
O ponto do plano que est mais prximo do ponto B (a extremidade do vetor

y) a projeo vertical de B sobre , isto , o ponto A na figura 3.6. Portanto y = OA
a combinao linear ( y = b1 x1 + b2 x 2 ) de x1 e x 2 que minimiza o comprimento do

vetor e = y y .
Obtido o vetor y = OA , podemos determinar os vetores b1 x1 e b2 x 2 . Para isso,
devemos traar por A retas paralelas a x1 e x 2 , construindo o paralelogramo OA1 AA2 .

Temos
9
Dado um conjunto de vetores, dizemos que eles so linearmente independentes se nenhum deles pode
ser expresso como uma combinao linear dos demais. Dados dois vetores linearmente independentes
(no colineares), x 1 e x 2 , uma combinao linear 1 x 1 + 2 x 2 sempre um vetor no plano definido por
x 1 e x 2 e, reciprocamente, todo vetor (ponto) neste plano uma combinao linear de x 1 e x 2 ;
dizemos, ento, que os vetores x 1 e x 2 geram o plano (subespao bidimensional). Analogamente, 3
vetores linearmente independentes geram um subespao tridimensional.
189
y = OA = OA1 + OA2 ,
OA1 = b1x1
e
OA 2 = b2 x 2
O valor absoluto de b1 o cociente da diviso do comprimento de OA1 pelo
comprimento de x1 e o valor absoluto de b2 o cociente da diviso do comprimento de
OA 2 pelo comprimento de x 2 . No caso da figura 4.6 verifica-se que b1 > 1 e 0 < b2 < 1
. O vetor dos desvios da regresso
AB = e = y y
Como o segmento de reta AB , por construo, perpendicular ao plano , tal

segmento perpendicular ou ortogonal a toda reta desse plano. Em particular, AB
perpendicular a OA . Portanto OAB um tringulo retngulo e, conseqentemente

2 2 2
OB = OA + AB
ou
y y = y y + e e
ou, ainda,
S.Q.Total = (S.Q.Regr.) + (S.Q.Res.)
Como e = AB ortogonal a x1 e x 2 , temos que
x1 e = x1 e = 0
e
x 2 e = x2 e = 0
De acordo com essas relaes, podemos escrever
Xe = 0 , (4.107)
que a relao (4.8).

Temos
e = y Xb , (4.108)
onde
b
b = 1
b2
190
X (y Xb) = 0
ou
X Xb = X y ,
que o sistema de equaes normais.
interessante examinar o que ocorre quando os vetores x1 e x 2 so colineares.
Nesse caso esses vetores geram apenas um subespao unidimencional, que a reta que
os contm, e no um plano. Seja y = OA a projeo vertical de y sobre essa reta, como

mostra a figura 4.7.
Figura 4.7. Vetores x1 e x 2 colineares.
Existem infinitas combinaes lineares de x1 e x 2 que produzem o vetor
y = OA . No caso da figura 4.7, admitindo que | x1 |= 1 , | x 2 |= 3 e | OA |= 2 , temos, por

exemplo,
OA = 2x1 + 0x 2 ,
2
OA = 0x 1 + x2
3
ou
OA = x1 + x 2
Isso mostra que os valores de b1 e b2 em y = b1 x1 + b2 x 2 so indeterminados.

Esse o problema da multicolinearidade perfeita, j examinado, sob outro enfoque, na
seo 4.17.
Vrios outros problemas de anlise de regresso podem ser examinados com o
auxlio da interpretao geomtrica apresentada nesta seo.10 Como ilustrao final,
vamos considerar o exerccio 2.9, onde se pede para comparar a anlise de regresso
10
Uma exposio didtica do assunto pode ser encontrada em Wonnacott e Wonnacott (1976), parte II.
191
linear simples de Yi contra X i com a anlise de regresso linear simples de Z i contra
X i , com Z i = Yi + X i . As equaes estimadas de acordo com o mtodo de mnimos

quadrados so indicadas respectivamente por
Yi = a + bX i
e
Z i = c + dX i
Vamos demonstrar que c = a e d = b + 1.
Sejam y e y os vetores com os valores de Yi e Yi , respectivamente; seja x1 o
vetor com os valores de X i ; sejam z e z os vetores com os valores de Z i e Z i ,
respectivamente, e seja x 0 um vetor cujos elementos so todos iguais a 1. Temos
z = y + x1
y = ax 0 + bx 1
e
z = cx 0 + dx1
Na figura 4.8 esto representados os vetores x 0 , x1 e y . O plano gerado por
x 0 e x 1 denominado plano . Indicando a extremidade de y por B e a projeo
vertical de B sobre por A, temos que
OA = y
e
2
AB = (S.Q.Res. y | x 0 e x1 ) (4.109)
Traando pelo ponto A retas paralelas a x 0 e a x1 , obtemos
OA 0 = ax 0 e OA1 = bx1 ,
de tal maneira que
OA == y = ax 0 + bx1
Uma vez que neste caso a e b so positivos, segue-se que

OA0
a= (4.110)
| x0 |
e
192
OA1
b= (4.111)
| x1 |
Figura 4.8. Regresso linear simples de Y contra X e de Z = Y + X contra X.
Para obter o vetor z = x1 + y construmos o paralelogramo OBDQ. Ento BD
um segmento de reta paralelo ao plano com comprimento igual a | x1 | e OD = z .
Sendo C a projeo vertical de D sobre , temos
OC = z
e
2
CD = (S.Q.Res. z | x 0 e x1 ) (4.112)
Como BD paralelo a x1 e ao plano e AC a projeo de BD sobre ,
temos que AC = BD = | x1 | , com AC paralelo a x1 e, portanto, colinear com o
segmento de reta A0 A .
Alm disso, temos CD = AB . Lembrando (4.109) e (4.112), conclumos que
(S.Q.Res. z | x 0 e x1 ) = (S.Q.Res. y | x 0 e x1 ).
Traamos C1C paralelo a x 0 . Ento
A1C1 = AC =| x 1 | (4.113)
e
OC = z = OA 0 + OC 1 ,
com
OA 0 = cx 0
e
OC 1 = dx1
193
Uma vez que neste caso c e d so positivos, segue-se que
OA0
c= (4.114)
| x0 |
e
OC1
d= (4.115)
| x1 |
Comparando (4.114) com (4.110) conclumos que

c=a
Examinando a figura 4.8 e lembrando (4.113), temos que
OC1 = OA1 + A1C1 = OA1 + | x1 |
Substituindo esse resultado em (4.115) obtemos
OA1
d= +1
| x1 |
Lembrando (4.111) conclumos que
d = b + 1, c.q.d.
Exerccios
4.1. Mostre que as frmulas para regresso linear simples, deduzidas no Captulo 2, so
casos particulares das expresses gerais:
a) b = ( X X) 1 X y
b) ( XX) 1 2 , que a matriz de varincias e covarincias das estimativas dos

parmetros.
c) S.Q.Res. = y y b X y
d) V (Yh ) = x h ( XX) 1 x h 2
4.2. So dados os valores de X 1 , X 2 e Y da tabela a seguir:
194
X1 X2 Y
0 0 1
0 2 3
0 4 5
0 6 5
2 0 4
2 2 10
2 4 12
2 6 10
Admite-se que as variveis esto relacionadas de acordo com o modelo

Y j = + 1 X 1 j + 2 X 2 j + u j , onde os u j so variveis aleatrias independentes,
homocedsticas, com mdia zero e distribuio normal.

a) Determine as estimativas dos parmetros da regresso linear mltipla de Y em
relao a X 1 e X 2 .
b) Faa a anlise de varincia da regresso.
c) Determine a contribuio de cada varivel para a soma de quadrados de
regresso. Verifique que o respectivo teste F igual ao quadrado do teste t
correspondente hiptese de que seja nulo o valor do coeficiente de regresso
da varivel em questo.
4.3. Idem, para
X1 X2 X3 Y
1 1 0 5
1 0 0 7
1 1 0 3
1 1 0 7
1 0 0 9
1 1 0 5
0 0 1 3
0 0 0 8
0 0 1 7
195
4.4. Idem para
X1 X2 Y
0 1 1
1 0 1
1 1 4
1 2 5
1 3 4
Alm disso, determine:

d) o valor dos coeficientes de correlao parcial rY 1.2 e rY 2.1 .
e) o intervalo de 95% de confiana para cada um dos trs parmetros do modelo
linear
Y j = + 1 X 1 j + 2 X 2 j + u j ,
admitindo que os u j so variveis independentes com distribuio normal de
mdia zero e varincia 2 .

f) a estimativa de Y para X 1 = 1 e X 2 = 2 , e o intervalo de 95% de confiana para
E (Y | X 1 = 1 e X 2 = 2 ).
g) Idem, para X 1 = 2 e X 2 = 4 (uma extrapolao).
4.5. So dados os seguintes valores, obtidos de uma amostra aleatria com 10

observaes:
X1 X2 X3 Y
1 1 0 5
1 0 0 7
1 1 0 3
1 1 0 7
1 0 0 9
1 1 0 5
0 0 1 3
0 0 0 8
0 0 1 7
1 1 0 6
196
Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j ,
onde os u j so erros independentes com distribuio normal de mdia zero e
varincia 2 .
a) Determine as estimativas dos parmetros.
b) Faa a anlise de varincia da regresso.
c) Teste a hiptese H 0 : = 0 contra H A : 0 , ao nvel de significncia de
1%.
d) Teste a hiptese H 0 : 3 = 0 contra H A : 3 > 0 , ao nvel de significncia de
5%.
e) Determine os valores dos coeficientes de determinao parcial rY21.23 , rY22.13 e
rY23.12 .
f) Determine a estimativa de Y j para X 1 = 0 , X 2 = 1 e X 3 = 1 , e o respectivo
intervalo de 95% de confiana.
4.6. No caso do exemplo apresentado na seo 4.13, teste, atravs do valor de t, a

hiptese H 0 : 3 = 0 contra a hiptese H A : 3 0 , considerando um nvel de
significncia de 5%. Obtenha, tambm, o valor do teste F para a contribuio de
X 3 , verificando que este valor igual ao quadrado do valor de t obtido
anteriormente. Determine, para o mesmo exemplo, a estimativa de Y j para
X 1 = X 2 = X 3 = 1 e o respectivo intervalo de 95% de confiana.
4.7. Considerando o modelo de regresso mltipla
Y j = + 1 X 1 j + 2 X 2 j + u j u ,
com todas as variveis centradas, demonstre que
rY21 2r12 rY 1 rY 2 + rY22

R =
2
,
1 r122
onde R 2 o coeficiente de determinao mltipla.
4.8. Considerando o resultado do problema anterior, mostre que, se

rY 1 = rY 2 = r12 = r 1 , obtemos
197
2r 2
R2 =
1+ r
Discuta o caso em que rY 1 = rY 2 = r12 = r = 1 .
4.9. Considerando o modelo do problema 4.7 mostre que, se rY 1.2 = 1 , temos rY22.1 = 1 e
R 2 = 1.
4.10. So dados os valores de Y j , X 1 j e X 2 j da tabela a seguir:
Yj X1j X2j
3 0 0
0 0 3
6 1 1
9 3 0
Considerando o modelo Y j = + 1 X 1 j + 2 X 2 j + u j , onde os u j so erros
independentes com distribuio normal de mdia zero e varincia 2 ,

a) Determine a equao de regresso de Y em relao a X 1 e X 2 .
b) Calcule o valor do teste F para a regresso (para testar a hiptese
H 0 : 1 = 2 = 0 ).
c) Calcule os valores de R 2 e rY21.2 .
d) Teste a hiptese H 0 : 1 = 2 contra a hiptese H A : 1 > 2 , considerando o

e) Determine a estimativa de Y para X 1 = X 2 = 2 e o respectivo intervalo de
90% de confiana.
f) Calcule os valores de Y para as observaes da amostra e, a seguir, o
quadrado do coeficiente de correlao entre Y e Y (note que esse valor igual
a R 2 ).
4.11. So dados os valores de X 1 , X 2 e Y da tabela a seguir:
Y X1 X2
4 0 3
5 1 1
4 2 2
11 3 0
198
Y j = + 1 X 1 j + 2 X 2 j + u j (j = 1, ..., 4), onde os u j so erros independentes,
homocedsticas, com mdia zero e distribuio normal.

a) Determine a equao de regresso de Y em relao a X 1 e X 2 .
b) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 = 0 .
c) Calcule o valor do coeficiente de determinao mltipla.
d) Calcule o valor de rY21.2 .
e) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 2 = 4 .
f) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 e 2 = 4 .
g) Delimite a regio de 95% de confiana para 1 e 2 .

h) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 , contra a
hiptese H A : 1 > 2 .
i) Calcule a estimativa de Y para X 1 = X 2 = 2,5 e determine o respectivo

j) Calcule os valores de Y para as observaes da amostra e, a seguir, o
quadrado do coeficiente de correlao entre Y e Y (note que esse valor igual
a R 2 ).
4.12. Com a finalidade de ajustar o modelo

Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + 4 X 4 j + u j foi obtida uma amostra de 8
observaes. Os valores das variveis explanatrias constam da tabela a seguir:
X1 X2 X3 X4
1 1 1 3
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 3
199
Verifique que, embora o valor dos coeficientes de correlao entre pares de
variveis independentes seja sempre inferior a 0,58, existe multicolinearidade
perfeita.
4.13. As variveis explanatrias X 1 e X 2 assumem os valores 3, 1, +1 e +3. Temos
16 observaes de Y = f ( X 1 , X 2 ) correspondendo a todas as combinaes
possveis para X 1 e X 2 . Decidiu-se ajustar, a esses dados, uma regresso mltipla
com um termo constante e todos os possveis termos do 1o, 2o, 3o e 4o graus em X 1
e X 2 . No foi possvel obter as estimativas dos parmetros b = ( XX) 1 Xy . Por
qu? Decidiu-se, ento, ignorar a varivel X 2 e se tornou a ajustar, aos mesmos
dados, um polinmio do quarto grau em X 1 . Novamente no foi possvel obter as

estimativas dos parmetros. Por qu? (Extrado de DRAPER e SMITH, 1966, p.
160).
4.14. Sejam 3 regresses onde o nmero de observaes e os valores das variveis

independentes so os mesmos; numa das regresses a varivel dependente Y1 j , na
outra Y2 j , e na terceira Y3 j = Y1 j + Y2 j . Sendo b 1 , b 2 e b 3 os vetores das
estimativas dos parmetros da primeira, da segunda e da terceira regresso,

respectivamente, prove que b 3 = b 1 + b 2 .
4.15. So dados os pares de valores X, Y da tabela a seguir:

X Y
2 0,9
1 6,4
0 8,4
1 10,4
2 8,9
Yi = + X i + X i2 + u i , onde os u i so os erros independentes com distribuio
normal de mdia zero e varincia 2 .

a) Determine as estimativas dos parmetros.
b) Faa a anlise de varincia da regresso, testando, ao nvel de significncia de
5%, a hiptese H 0 : = = 0 .
c) Calcule o valor do coeficiente de determinao da regresso ajustada.
200
d) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 contra
H A : < 0.
e) Determine o valor da contribuio do termo quadrtico para a soma de
quadrados de regresso. Verifique se o respectivo testes F significativo ao
nvel de 5% (note que o valor de F obtido igual ao quadrado do valor de t
calculado no item anterior).
4.16. Com base em uma amostra com 34 observaes foi estimada a equao de
regresso de Y contra X 1 , X 2 e X 3 , considerando o modelo
Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j
O coeficiente de determinao parcial de Y e X 1 , dados X 2 e X 3 , igual a 0,25.
Teste, ao nvel de significncia de 1%, a hiptese de que 1 = 0 .
4.17. Demonstre que o coeficiente de determinao mltipla de uma regresso linear

mltipla qualquer (definido como o cociente da diviso da S.Q.Regr. pela
S.Q.Total) igual ao quadrado do coeficiente de correlao entre Y j e Y j (Para
facilitar a demonstrao considere que a regresso tenha sido ajustada com todas
as variveis centradas).
4.18. Admite-se que as variveis X 1 , X 2 e Y esto relacionadas conforme o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j
onde u j so erros independentes com E (u j ) = 0 e E (u 2j ) = 2
Para uma amostra de 9 observaes, obtivemos:

X1 = X 2 = 0 x1 y = 8 x12 = 8 x2 y = 8
x 22 = 4 y 2 = 42 x1 x2 = 0 Y =6
a) Calcule as estimativas de mnimos quadrados para , 1 e 2 (a, b1 e b2 ,

respectivamente).
b) Ache a estimativa da matriz de varincias e covarincias de a, b1 e b2 .
c) Determine o intervalo de previso, ao nvel de confiana de 95%, para uma
nova observao de Y com X 1 = X 2 = 1 .
d) Teste a hiptese H 0 : 2 = 1 contra a hiptese alternativa H A : 2 < 1 .
201
e) Teste a hiptese H 0 : = 10 e 1 2 2 = 0 .
Adote, nos testes, o nvel de significncia de 5%.
4.19. Um ensaio de adubao forneceu os seguintes resultados:

X = dose de adubo por hectare Y = produo por hectare
0 6; 8
1 16; 18
2 18; 20
3 12; 14
Pode-se verificar que Yi = 112 , Y = 14 e (Yi Y ) 2 = 176
a) Admitindo que a funo de produo seja uma parbola do 2o grau, determine
as estimativas dos parmetros dessa funo de acordo com o mtodo de
mnimos quadrados.
b) Faa a anlise de varincia da regresso e calcule o coeficiente de
determinao.
c) Sabendo que a relao entre o preo da dose de adubo e o preo do produto
igual a 2, determine a quantidade economicamente tima de adubo a ser
aplicada.
d) Verifique se o coeficiente do termo quadrtico estatisticamente diferente de
zero. Pressupe-se que a lei dos rendimentos marginais decrescentes seja
vlida.
e) Teste a hiptese de que a produo mxima obtida aplicando-se 2 doses de
adubo por hectare.
Considere, nos testes estatsticos, um nvel de significncia de 1%.
4.20. Foi estabelecido o seguinte modelo de funo de produo:
Yi = 0 + 1 X 1i + 2 X 2i + ui (i = 1, ..., n)
onde o ndice i indica a empresa agropecuria, Yi o logaritmo do valor da
produo, X 1i o logaritmo da mo-de-obra utilizada e X 2i o logaritmo do

capital utilizado.
A amostra tem 23 observaes e so conhecidas as seguintes matrizes (relativas

ao modelo com todas as variveis centradas, inclusive a dependente)
12 8 10
XX = Xy = yy = 10
8 12 8
202
a) Determine as estimativas dos coeficientes de regresso e dos respectivos
desvios padres
b) Calcule o valor de R 2 .
c) Teste se os rendimentos escala so constantes, isto , teste a hiptese

H 0 : 1 + 2 = 1 , considerando um nvel de significncia de 5%.
4.21. So dados os valores das variveis X 1 j , X 2 j e Y j para uma amostra com 6
observaes:
X1 j X2j Yj
0 0 0,5
1 1 3,5
1 2 7,0
2 1 7,0
2 2 7,5
3 3 11,5
a) Determine a equao de regresso linear de Y em relao a X1 e X 2 .
b) Calcule o valor do coeficiente de determinao da regresso.
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 + 4 contra a
hiptese alternativa H A : 1 < 2 + 4 .
d) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 1 = 3 e 2 = 5 .
e) Calcule o coeficiente de determinao parcial entre Y j e X 2 j (rY22.1 ) e
verifique se estatisticamente diferente de zero, considerando um nvel de

significncia de 1%.
f) Calcule a estimativa de Y para X 1 = 0,5 e X 2 = 2,5 e determine o respectivo
g) O problema da multicolinearidade mais srio no exerccio anterior ou neste?
Justifique.
4.22. Numa anlise da demanda de certo produto, baseada em dados anuais para um
perodo de 17 anos, foram obtidos os seguintes valores, referentes s variveis Y
(logaritmo da quantidade consumida per capita), X1 (logaritmo da renda per
capita) e X 2 (logaritmo do preo do produto).
203
Estimativas dos Coeficiente de
Mdias
desvios padres correlao
5
Y = 4,5 sy = 3 5 rY 1 =
30
4
X1 = 1 s1 = 6 rY 2 =
30
X2 = 1 s2 = 6 r12 = 0,5
a) Calcule as estimativas dos coeficientes de regresso relativos a X1 e a X 2 na
regresso linear de Y em relao a X1 e X 2 .

b) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 2 = 0 contra a
hiptese alternativa H 0 : 2 < 0 .
4.23. Admite-se que as variveis Y, X e T esto relacionadas de acordo com o modelo
Y j = + X j + T j + u j ,
onde T o tempo, medido em anos, e u j so erros aleatrios com mdia zero e
varincia constante. Sejam a, b e c as estimativas de mnimos quadrados de , e

, obtidas a partir de uma amostra com n observaes anuais de X e Y. Mostre que
o valor de b, obtido atravs das frmulas usuais de regresso mltipla, igual
estimativa do coeficiente de regresso de Y em relao a v, sendo v os desvios da
regresso linear simples de X em relao a T.
4.24. Numa anlise da demanda de certo produto, baseada numa srie temporal de
dados, foram estimados os parmetros da regresso de Y (logaritmo da
quantidade consumida per capita) em relao a X (logaritmo do preo do produto)
e T (tempo, em anos).
Explique o significado econmico da incluso do tempo como varivel
explanatria.
4.25. Considere a matriz
1
A=I ,
n
204
onde I uma matriz unitria de ordem n e um vetor-coluna com n elementos,
todos iguais a 1.
a) Mostre que A uma matriz quadrada, simtrica e idempotente.
b) Demonstre que tr(A) = n 1.
4.26. Considere a matriz A, definida no exerccio anterior, e o modelo de regresso

linear mltipla apresentado no incio do captulo 4, isto ,
y = X + u ,
onde y um vetor-coluna com as n observaes da varivel dependente, X uma

matriz n p de valores fixos, um vetor-coluna com p parmetros (incluindo
, o termo constante da equao de regresso) e u o vetor-coluna dos erros, com

E (u) = 0 e E (uu) = I 2 .
Demonstre que:
a) S.Q.Total = yAy
b) S.Q.Total = u Au + X AX + 2 X Au
c) S.Q.Total = tr ( Auu) + X AX + 2 X Au
d) E(S.Q.Total) = (n 1) 2 + X AX
Finalmente, considerando (4.22) e lembrando que
S.Q.Regr. = (S.Q.Total) (S.Q.Res.),
Deduza que
E(S.Q.Regr.) = X AX + (p 1) 2
Verifique, ainda, que (2.32) um caso particular desse resultado e que o valor de
X AX no depende de .
4.27. Considere, novamente, o modelo de regresso linear mltipla do exerccio anterior

e lembre as propriedades das matrizes H e M definidas na seo 4.5.
a) Se x j a j-sima coluna de X , verifique que o j-simo elemento da diagonal
de H
205
h j = xj ( XX) 1 x j
b) Utilizando (4.20), deduza que E (e) = 0 e que a matriz de varincias e

covarincias do vetor de desvios
V (e) = E (ee) = M 2
c) Demonstre que a varincia do desvio da j-sima observao
V (e j ) = (1 h j ) 2
e que a respectiva estimativa
V (e j ) = (1 h j ) s 2
d) Para o exemplo numrico apresentado na seo 4.8, verifique que h1 = 0,6 e
V (e1 ) = 0,5 . Muitas vezes se considera que o quadrado mdio do resduo ( s 2

), que a estimativa no-tendenciosa da varincia do erro, , tambm, a
estimativa da varincia dos desvios. Note como neste caso (com n pequeno) a
estimativa correta muito diferente.
4.28. Considere o modelo
Yt = 1 + 2 x2t + 3 x3t + ut (t = 1, ..., n)
com
E (ut ) = 0 para todo t
E (ut2 ) = 2 para todo t
E (u t u s ) = 0 se t s
e x 2 t = x 3t = 0
t t
Seja b3 uma estimativa no-tendenciosa de 3 , obtida de dados independentes.
Sabendo que a varincia dessa estimativa V (b3 ) = v 2 , demonstre que a varincia
da estimativa do coeficiente de regresso de ( Yt b3 x3t ) contra x2t , de acordo com

o mtodo de mnimos quadrados,
2
+ v 2 b322 ,
x 2
2t
206
onde b32 a estimativa do coeficiente angular da regresso linear simples de x3t
em relao a x 2t .
4.29. Foi proposto o seguinte modelo para analisar o crescimento de uma espcie
vegetal (baseado em AIGNER, 1971, p. 107-108):
Y j = + 1 X 1 j + 2 X 2 j + u j ,
onde Y a altura da planta, em cm, X 1 o tempo decorrido, em semanas,
X 2 = X 12 e os u j so erros aleatrios independentes com distribuio normal de
mdia zero e varincia 2 .
A partir de uma amostra com n = 13 observaes semanais, com a varivel X 1

assumindo os valores 6, 5, 4, 3, 2, 1, 0, 1, 2, 3, 4, 5 e 6, foram obtidos
os seguintes resultados:
Y = 32 y 2j = 3640 rY 1 = 0,90
X1 = 0 x12j = 182 rY 2 = 0,20
X 2 = 14 x22 j = 2002
a) Calcule as estimativas de , 1 e 2 de acordo com o mtodo de mnimos

quadrados.
b) Calcule R 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 = 0 .
d) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 2 = 0 .
4.30. Considerando o exemplo numrico do captulo 2, teste, ao nvel de significncia

de 5%, a hiptese de que = 5 e = 0.
4.31. Considere o modelo Y j = 1 X 1 j + 2 X 2 j + u j , onde os u j so erros aleatrios
independentes com distribuio normal de mdia zero e varincia 2 .
207
a) Utilizando os dados da tabela a seguir, teste, ao nvel de significncia de 5%, a
hiptese H 0 : 1 = 2 .
X1 X2 Y
0 1 0
0 1 0
0 1 1
0 1 3
1 0 5
1 0 3
b) Verifique que sob H 0 , isto , com 1 = 2 = , o modelo fica

Y j = ( X 1 j + X 2 j ) + u j . Seja S1 , com n 2 graus de liberdade, a soma de
quadrados residual para o modelo Y j = 1 X 1 j + 2 X 2 j + u j e seja S 2 , com
n 1 graus de liberdade, a soma de quadrados residual para o modelo

Y j = ( X 1 j + X 2 j ) + u j . Calcule o valor de
S 2 S1
=
S1 /(n 2)
e compare com o valor de F relativo ao teste de hiptese da parte (a).
4.32. Com base em uma amostra aleatria com n observaes foi estimada, pelo mtodo
de mnimos quadrados, a equao de regresso linear mltipla de Y contra X 1 e
X 2 , ..., X k e foram obtidas, atravs da equao ajustada, as estimativas de Y para
as n observaes da amostra, isto , foram calculados os valores de Y j para j = 1,
2, ..., n.
A seguir o mtodo de mnimos quadrados novamente utilizado para estimar os

parmetros da equao de regresso linear simples de Y j contra Y j , isto , para
obter as estimativas (c e d) dos parmetros e do modelo
Y j = + Y j + j
Deduza quais so os valores de c e d. Faa um grfico ilustrando suas concluses.
4.33. So dados os valores de Y (renda), X 1 (escolaridade) e X 2 (idade) observados em

uma amostra aleatria de 5 indivduos:
208
Yj X1 j X2j
10 6 28
20 12 40
17 10 32
12 8 36
11 9 34
Fonte: S.R. SEARLE. Linear Models. Wiley, 1971.
Verifica-se que
Y j = 70 , Y = 14 , X 1 j = 45 , X1 = 9 ,
X 2 j = 170 , X 2 = 34 , x12j = 20 ,
x22 j = 80 e x1 j x 2 j = 32
a) Qual a estimativa de mnimos quadrados do coeficiente angular da regresso

linear simples de Y contra X 1 ?
b) Qual a estimativa de mnimos quadrados do coeficiente angular da regresso
linear simples de Y contra X 2 ?
c) Determine as estimativas de mnimos quadrados (a, b1 e b2 ) dos parmetros
da equao de regresso linear mltipla de Y em relao a X 1 e X 2 .
d) Considerando o modelo Y j = + X 1 j + u j , onde os uj so erros
independentes entre si com distribuio normal de mdia zero, varincia 2 e

independente de X 1 j , teste a hiptese H 0 : = 0 contra a hiptese H A : > 0
, adotando um nvel de significncia de 5%.

e) Considerando o modelo Y j = + 1 X 1 j + 2 X 2 j + u j , onde os u j so erros
independentes entre si com distribuio normal de mdia zero, varincia 2 e

independente de X 1 j , teste a hiptese H 0 : 1 = 0 contra a hiptese
H A : 1 > 0 , adotando um nvel de significncia de 5%.

f) Tanto no item (d) como no item (e) o teste se refere influncia de X 1 sobre
Y. Os resultados dos testes so diferentes? Por qu?
g) possvel, com base na amostra dada, fazer o teste para falta de
ajustamento relativa ao modelo do item (d)? Explique.
209
h) possvel, com base na amostra dada, estimar os parmetros do modelo a
seguir? Justifique a resposta.
Y j = + 1 X 1 j + 2 X 2 j + 3 X 12j + 4 X 22 j + u j
4.34. Um pesquisador admite que a varivel Y linearmente dependente das variveis

X 1 e X 2 . Obtm, ento, uma amostra aleatria com n observaes de Y, X 1 e
X 2 . Os coeficientes de correlao simples so rY 1 = 0 , rY 2 = 0,8 e r12 = 0,6 . O
pesquisador, que est procurando explicar as variaes de Y, observando que o
coeficiente de correlao simples entre Y e X 1 igual a zero ( rY 1 = 0 ), prope que
X 1 deixe de ser considerada como varivel explanatria. verdade que, como

sugere esta proposta, o coeficiente de determinao da regresso linear mltipla
de Y em funo de X 1 e X 2 igual ao coeficiente de determinao da regresso
linear de Y contra apenas X 2 ? Calcule esses coeficientes de determinao.
4.35. Seja Q a quantidade demandada de certo produto, em determinado mercado, por

unidade de tempo, seja P o respectivo preo e seja W a renda per capita dos
consumidores. Admita que essas variveis esto relacionadas de acordo com o
modelo
Q j = Pj1W j 2 j
e que u j = log j so erros aleatrios independentes com mdia zero e varincia
constante. Dispomos das seguintes observaes:
Pj Wj Qj
1 1 10
1 10 100
10 1 10
10 10 100
10 100 100
100 100 100
100 10 10
100 1000 100
1000 1000 10
1000 100 10
a) Que anamorfose devem ser feitas para obtermos um modelo de regresso

linear mltipla?
210
b) Obtenha as estimativas de , 1 e 2 (utilize logaritmos decimais).
c) Faa a anlise de varincia da regresso e calcule o valor do coeficiente de
determinao mltipla. Teste, ao nvel de significncia de 5%, a hiptese
H 0 : 1 = 2 = 0 .
d) Teste, ao nvel de significncia de 5%, a hiptese de que o coeficiente de
elasticidade-preo da demanda do produto igual a 1, contra a hiptese
alternativa de que o coeficiente de elasticidade-preo da demanda , em valor
absoluto, menor do que 1.
e) Teste, ao nvel de significncia de 5%, a hiptese de que o coeficiente de
elasticidade-renda da demanda do produto igual a 0,85, contra a hiptese
alternativa de que esse coeficiente diferente de 0,85.
f) Calcule a estimativa da variao percentual na quantidade, demandada quando
o preo aumenta de 1% e a renda per capita cresce 3%. Obtenha, tambm, a
estimativa do desvio padro dessa estimativa.
Sugesto: (1o) Mostre que as estimativas de 1 e 2 no so alteradas se
mudarmos a base dos logaritmos utilizados; portanto, essas estimativas seriam
as mesmas se fossem utilizados logaritmos neperianos; (2o) Lembre que, com
Q
logaritmos neperianos temos = (log Q) , desde que as variaes
Q
consideradas sejam pequenas.
4.36. Considere o modelo estatstico de uma funo de produo tipo Cobb-Douglas
Z j = W1j 1W2j2 j (1)
onde Z a produo de determinada cultura, W1 a rea cultivada, em hectares, e
W2 representa o montante de despesas com mo-de-obra e demais insumos

(sementes, fertilizantes, defensivos, etc.). Admita que se dispe dos valores de Z,
W1 e W2 para uma amostra de n empresas agrcolas.
De (1), aplicando logaritmos e fazendo log Z j = Y j , log W1 j = X 1 j , log W2 j = X 2 j
, log = e log j = u j , obtemos o modelo de regresso linear mltipla
Y j = + 1 X 1 j + 2 X 2 j + u j (1)
211
Sejam a, b1 e b2 as estimativas de mnimos quadrados de , 1 e 2 ,
respectivamente.
Vamos admitir, agora, que o pesquisador prefere analisar como a produtividade da

cultura varia em funo do montante de despesas com mo-de-obra e insumos por
hectare, isto , como Z /W1 varia em funo de W2 /W1 . A rea cultivada ( W1 )
mantida como varivel independente no modelo para verificar se a escala de
produo afeta a produtividade.
Ento o modelo fica

2
Z W2 j
= W1j1 j (2)
W1 j W
1j
O modelo (2) pode ser obtido de (1) dividindo os dois membros da equao por
W1 j . Verifica-se que = , 1 = 1 + 2 1 e 2 = 2 .
De (2), aplicando logaritmos e fazendo log = , obtemos o modelo de regresso

linear mltipla
(Y j X 1 j ) = + 1 X 1 j + 2 ( X 2 j X 1 j ) + u j (2)
Sejam c, d1 e d 2 as estimativas de mnimos quadrados de , 1 e 2 ,

respectivamente
a) Demonstre que d 2 = b2 , d1 = b1 + b2 1 e c = a.
b) Prove que o quadrado mdio do resduo relativo regresso (1) igual ao
quadrado mdio do resduo relativo regresso (2).
c) No modelo (1), para testar a hiptese de que a funo de produo
linearmente homognea (rendimentos constantes escala), ou seja, para testar
H 0 : 1 + 2 = 1 , devemos calcular
b1 + b2 1
t1 =
V (b + b )
1 2
No modelo (2), para testar H 0 : 1 = 0 devemos calcular
d1
t2 =
V (d1 )
Mostre que essas hipteses so equivalentes e demonstre que t1 = t 2 .
212
4.37. Admite-se que as variveis X 1 , X 2 e Y esto relacionadas de acordo com o
modelo
Y j = + 1 X 1 j + 2 X 2 j + u j ,
onde os u j so erros aleatrios, com as pressuposies usuais. dada a seguinte
amostra:
X1 X2 Y
6 24 2
10 16 24
13 10 50
15 6 64
possvel estimar os parmetros do modelo com base nesta amostra? O nmero

de observaes insuficiente? Explique.
4.38. Admite-se que Y uma funo linear de X 1 , X 2 e X 3 , de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + 3 X 3 j + u j ,
em que o erro u j tem as propriedades usuais. A partir de uma amostra com 14
observaes, foram obtidas as seguintes matrizes, considerando todas as variveis

na sua forma original:
14 56 84 0 168
56 248 368 0 656
XX = , Xy = e y y = 2196
84 368 600 0 1040

0 0 0 14 28
Com todas as variveis centradas, as matrizes so
24 32 0 16
XX = 32 96 0 , Xy = 32 e y y = 180

0 0 14 28
a) Qual o valor da mdia de X 2 na amostra?
b) Determine as estimativas de mnimos quadrados de 1 , 2 e 3 .
c) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 1 = 2 = 3 = 0 .
213
d) Teste, ao nvel de significncia de 1%, a hiptese H 0 : 3 = 0 .
e) Teste, ao nvel de significncia de 5%, a hiptese H 0 : 1 = 2 = 0 .
4.39. A Tabela a seguir mostra os valores de X 1 , X 2 , X 3 e Y em uma amostra com 8

observaes:
X1 X2 X3 Y
13 32 5 116
3 4 45 8
8 18 23 63
13 34 5 118
8 18 27 61
3 2 45 6
8 18 23 69
8 18 27 55
Fazendo uma regresso mltipla de Y contra X 1 , X 2 e X 3 , verifica-se que os
respectivos coeficientes de regresso so 0, 1 e 2. Usando X 2 e X 3 como controles,
no se constata nenhum efeito de X 1 sobre Y.
Verifique, tambm, que a regresso simples de Y contra X 1 fornece um

coeficiente de regresso igual a 11 e que o teste t da respectiva hiptese de nulidade
igual a 26,42, fortemente significativo.
Esses dados foram construdos com X 2 e X 3 como funes de X 1 (com erros
independentes) e Y como funo de X 2 e X 3 . No h efeito direto de X 1 sobre Y, mas
h efeitos importantes associados a X 2 e X 3 .
Respostas
4.2. a) Y = 3 X 1 + X 2
b) F = 14
c) (Contribuio de X 1 ) = 72; F = 18
(Contribuio de X 2 ) = 40; F = 10
214
4.3. a) Y = 6 + X 1 X 2 + 2 X 3
b) F = 5/3
c) (Contribuio de X 1 ) = 6; F = 5/3
(Contribuio de X 2 ) = 4; F = 10/9
(Contribuio de X 3 ) = 8; F = 20/9
4.4. a) Y = 2 X 1 + X 2
b) F = 2,5
c) (Contribuio de X 1 ) = 40/13; F = 20/13
(Contribuio de X 2 ) = 5; F = 2,5
10 5
d) rY 1.2 = = 0,659 ; rY 2.1 = = 0,745
23 3
e) 6,67 < < 6,67 ; 4,94 < 1 < 8,94 ; 1,72 < 2 < 3,72
f) 4 3,33
g) 8 10,18
4.5. a) Y = 6 + X 1 X 2 + 2X 3 , s 2 = 3
b) F = 2
c) t = 10,792, significativo ( t 0 = 3,707)
d) t = 1,633, no-significativo ( t 0 = 1,943)
55 55 4
e) rY21.23 = ; rY22.13 = e rY23.12 =
202 262 13
f) 7 3,73
4.6. t = 3,65, significativo
6,5 1,095
4.10. a) Y = 3,5 + 2 X 1 X 2
b) F = 7
14 6
c) R 2 = = 0,9333 ; rY21.2 = = 0,8571
15 7
d) t = 3,67, no-significativo
e) 5,5 10,47
215
4.11. a) Y = 5,5 + 2 X 1 3 X 2
b) F = 56,5, no-significativo ( F0 = 200 )
113
c) R 2 = = 0,9912
114
36
d) rY21.2 = = 0,8780
41
e) t = 9,39, no-significativo
f) F = 274,50, significativo
g) A regio de confiana delimitada pela elipse 5q12 8q1q 2 + 5q 22 = 400
onde q1 = 1 2 e q 2 = 2 + 3
h) t = 10,607, significativo
i) 3 9,47 ou 6,47 < E (Y | X 1 = X 2 = 2,5) < 12,47
4.15. a) Y = 9 + 2 X X 2 , s 2 = 0,35
b) F = 77,14, significativo
c) R 2 = 0,9872
d) t = 6,325, significativo
e) (Contribuio de X 2 ) = 14
F = 40, significativo
4.16. F = 10, significativo ( F0 = 7,56)
4.18. a) a = 6, b1 = 1 e b2 = 2
1 / 3 0 0
b) ( XX) s = 0 3 / 8 0
1 2
0 0 3 / 4
c) 2,17 < Yh < 8,17
d) t = 0,943, no-significativo (A regio de rejeio t 1,943)

e) F = 25,33, significativo ( F0 = 5,14)
4.19. a) Y = 7 + 14 X 4 X 2
b) F = 52,5; R 2 = 0,9545
c) 1,5 doses
d) t = 8,944, significativo (A regio de rejeio t 3,365)
e) F = 11,11, no-significativo ( F0 = 16,26)
216
4.20. a) b1 = 0,7 , b2 = 0,2 , s(b1 ) = s(b2 ) = 0,1025
b) R 2 = 0,86
c) t = 1,195, no-significativo ( t 0 = 2,086)
4.21. a) Y = 2 X 1 + 2 X 2
b) R 2 = 0,964 .
c) t = 2,828, significativo (A regio de rejeio t 2,353)
d) F = 41, significativo ( F0 = 30,82)
80
e) rY221 = = 0,708 ;F = 7,27, no-significativo ( F0 = 34,12)
113
f) Y = 6
2,54 < E (Y | X 1 = 0,5; X 2 = 2,5) < 9,46
g) No exerccio anterior temos r12 = 0,67 e neste temos r12 = 0,82 .
Portanto, a multicolinearidade mais forte no exerccio 4.21.
4.22. a) b1 = 2 e b2 = 1
b) s 2 = 24 / 7 ; t = 4,583, significativo (a regio de rejeio t 2,624).
4.24. O tempo, em anos, , neste caso, uma varivel proxy (varivel representativa) para
vrias variveis scio-econmicas, como a renda per capita e as mudanas nos
hbitos de consumo (estas, por sua vez, associadas crescente urbanizao etc.).
4.29. a) b1 = 4,025 , b2 = 0,2697 e a = 35,776.
b) R 2 = 0,85 .
c) F = 28,33, significativo ( F0 = 4,10)
d) t = 1,633, no-significativo, ( t 0 =2,228)
4.30. F = 18, significativo ( F0 = 4,46)
4.31. a) b1 = 4 e b2 = 1 ; s 2 = 2
F = 6, no-significativo ( F0 = 7,71)
b) = F = 6 . Na realidade, o clculo de , como foi indicado neste item do

exerccio, uma maneira de obter o valor de F para testar a hiptese
H 0 : 1 = 2 .
4.32. d= 1 e c = 0
217
4.33. a) 1,75
b) 0,625
7 25 5
c) a = , b1 = e b2 =
3 12 24
d) t = 3,796, significativo ( t 0 = 2,353)
e) t = 2,331, no-significativo ( t 0 = 2,920)
f) A incluso de X 2 afeta o valor da estimativa do coeficiente de regresso, o
valor da estimativa ( s 2 ) da varincia residual e o valor do coeficiente, obtido

da matriz ( XX) 1 , da varincia da estimativa do parmetro. Este ltimo
efeito, bastante importante neste exemplo, se deve correlao entre X 1 e X 2

.
g) No, porque no h repeties.
h) Sim. Entretanto, como temos apenas 5 observaes e o modelo tem 5
parmetros, no possvel fazer qualquer anlise estatstica (no h graus de
liberdade para o resduo).
4.34. R 2 = 1 e rY22 = 0,64 .
4.35. a) Y = log Q , X 1 = log P e X 2 = log W .
b) c = 10 10 , b1 = 0,5 e b2 = 0,5 .
c) R 2 = 0,6 ; F = 5,25, significativo ( F0 = 4,74).
d) t = 3, significativo ( t 0 = 1,895).
e) t = 2,10, no-significativo ( t 0 = 2,365).
f) Y = 0,01 ou um crescimento de 1% em Q.
s ( Y ) = 0,00398 ou, aproximadamente, 0,4% de Q.
4.37. Os parmetros no podem ser estimados com base nessa amostra pois h
multicolinearidade perfeita. Verifica-se que para as 4 observaes 2 X 1 + X 2 = 36
.
4.38. a) X 2 = 6 b) b = [ 2 1 2]
40
c) F = = 6,67 , significativo ( F0 = 6,55)
6
32
e) F= = 5,33 , significativo ( F0 = 4,10)
6
218
5. USO DE VARIVEIS BINRIAS
Neste captulo vamos examinar a utilizao de variveis binrias como variveis

explanatrias em anlise de regresso. Uma varivel binria (tambm denominada
varivel dummy) aquela que s tem dois valores distintos, geralmente zero e um.
Preliminarmente, vamos lembrar os diversos nveis de medida de uma varivel.
5.1. Nveis de medida
Podemos distinguir os seguintes nveis de medida ou escalas:

a) Escala nominal, quando temos apenas uma classificao em categorias.
Exemplos: sexo ou religio das pessoas. Neste caso, se forem usados
nmeros para indicar as diferentes categorias, eles so apenas etiquetas ou
nomes.
b) Escala ordinal, quando vlida apenas a ordem dos nmeros. Exemplo: uma
escala de status social.
c) Escala intervalar. Neste caso vale a ordem e tambm podemos comparar,
numricamente, intervalos (diferenas) entre valores. Mas a razo entre
valores no tem sentido porque a origem arbitrria. Exemplos: temperatura
medida em graus centgrados ou graus Fahrenheit e ano (data). Tem sentido
dizer que o perodo 1982-1990 (incluindo extremos) trs vezes mais longo
do que o perodo 1979-1981, mas no tem sentido dizer que no ano de 2002
estvamos no dobro de 1001.
d) Escala razo ou cardinal, quando so vlidas todas as operaes com os
valores. Exemplos: comprimento, peso, idade, valor monetrio.
Note-se que h um enriquecimento progressivo do significado dos nmeros

quando passamos de uma escala para a seguinte, na ordem em que foram apresentadas.
Pode-se argumentar que a escolaridade de uma pessoa uma varivel apenas
ordinal. Mas comum, em trabalhos economtricos, consider-la como cardinal.
Note-se que o clculo de uma simples mdia entre dois valores implica a
comparao de dois intervalos e exige, portanto, que a medida tenha escala intervalar ou
cardinal. Para uma escala nominal podemos determinar a moda (mas no a mediana ou
219
a mdia). Para uma escala ordinal podemos determinar tanto a moda como a mediana,
mas no a mdia da varivel.
Com uma varivel binria ocorre algo interessante. Como ela tem apenas dois
valores distintos, h um nico intervalo e no podemos dizer que ela contrarie a
condio para ser considerada intervalar. Isso permite que uma varivel binria seja
usada como varivel explanatria em anlise de regresso.
Cabe ressaltar que o modelo usual de regresso no permite que a varivel
dependente (Y) seja binria. bvio que uma varivel que inclui um erro com
distribuio normal no pode ser binria. H mtodos especiais (como os modelos de
lgite e prbite) para analisar variveis dependentes binrias.
5.2. Uso de variveis binrias para distinguir as categorias de uma

varivel nominal
Vamos admitir que uma varivel nominal tenha k categorias. Podemos usar k
1 variveis binrias para distinguir as k categorias.
A tabela 5.1 mostra uma maneira de distinguir as 5 regies do Brasil usando 4
variveis binrias, adotando o Nordeste como base.
TABELA 5.1. Uso de 4 variveis binrias para distinguir 5 regies.

Varivel binria
Regio
Z1 Z2 Z3 Z4
Nordeste 0 0 0 0
Norte 1 0 0 0
Sudeste 0 1 0 0
Sul 0 0 1 0
Centro-Oeste 0 0 0 1
Consideremos o modelo de regresso
Y j = + X j + 1 Z 1 j + 2 Z 2 j + 3 Z 3 j + 4 Z 4 j + u j (5.1)
O parmetro 3 , por exemplo, o valor esperado da mudana em Y j , quando
passamos do Nordeste para o Sul, para dado valor de X j .
220
Para dado valor de X j , a diferena entre o valor esperado de Y j no Centro-
Oeste e no Sudeste 4 2 .
Cabe assinalar que h vrias outras maneiras corretas de distinguir as 5 regies
por meio de variveis binrias. Uma alternativa, mantendo o Nordeste como base,
apresentada na tabela 5.2.
TABELA 5.2. Outra maneira de definir 4 variveis binrias para

distinguir 5 regies.
Varivel binria
Regio
Z1 Z2 Z3 Z4
Nordeste 0 0 0 0
Norte 1 0 0 0
Sudeste 1 1 0 0
Sul 1 1 1 0
Centro-Oeste 1 1 1 1
Seja i o coeficiente de Z ij (i = 1, 2, 3, 4) no modelo com essa nova definio
das variveis. Neste caso o valor esperado da mudana em Y j quando passamos do
Nordeste para o Sul, dado X j , 1 + 2 + 3 . Pode-se provar que o uso de alternativas
corretas na definio das variveis binrias leva a resultados equivalentes. Assim, a

estimativa de 1 + 2 + 3 ser igual estimativa de 3 no modelo (5.1).
Se o modelo de regresso tiver um termo constante, no podemos utilizar k
variveis binrias para distinguir k categorias pois isso causaria um problema de
multicolinearidade perfeita. Consideremos o esquema em que a varivel Z i (com i = 1,
..., k) igual a 1 para a i-sima categoria e igual a zero para as demais categorias.
Neste caso a primeira coluna da matriz X, cujos elementos so todos iguais a 1, seria
igual soma das colunas referentes s k variveis binrias e, consequentemente, a
matriz X X seria singular. Mas podemos usar uma binria para cada categoria se o
termo constante for eliminado do modelo de regresso. Por exemplo, para captar as
variaes estacionais em uma srie de preos mensais de um produto agrcola podemos
utilizar o modelo
12
Yt = + i Z it + u t (5.2)
i =2
221
com Z it = 1 para o i-simo ms do ano e
Z it = 0 para os demais meses,

ou o modelo
12
Yt = i Z it + u t (5.3)
i =1
Mas teramos multicolinearidade perfeita se tentssemos usar o modelo

12
Yt = + i Z it + u t (5.4)
i =1
Vejamos um exemplo numrico de uso de uma varivel binria para distinguir

dois perodos utilizando a amostra de 8 observaes das variveis X j e Y j apresentada
na tabela 5.3.
TABELA 5.3. Amostra de 8 pares de valores das variveis X j e

Yj .
Perodo Xj Yj
1 8
2 7
I
3 7
4 6
1 6
2 5
II
3 3
4 2
Admitamos que as quatro primeiras observaes se referem a um perodo com

caractersticas distintas do perodo ao qual se referem as quatro ltimas observaes.
Assim, por exemplo, se X j o preo de um produto e Y j a quantidade demandada, os
dois perodos em questo poderiam ser inverno e vero, ou um perodo de guerra e um

de paz, ou ainda, antes e depois de uma importante campanha publicitria.
Para avaliar as mudanas de um perodo para outro, consideramos uma varivel
binria ( Z j ) que assume o valor um ( Z j = 1) quando a observao est no perodo I e
o valor zero ( Z j = 0) quando a observao est no perodo II.
O modelo estatstico
Y j = + Z j + X j + u j (5.5)
222
Ento, no perodo I a relao fica
Y j = ( + ) + X j + u j
e no perodo II a relao fica

Y j = + X j + u j
Portanto, estamos admitindo que o coeficiente de regresso () o mesmo nos

dois perodos, s mudando o nvel em que a reta se localiza. O modelo (5.5)
corresponde, graficamente, a um par de retas paralelas.
A matriz X relativa ao modelo (5.5)
1 1 1
1 1 2

1 1 3

1 1 4
X=
1 0 1

1 0 2
1 0 3

1 0 4
Obtemos
44 8 4 20
Xy = 28 , XX = 4
4 10
100 20 10 60
e
7 1 1
8
4 4

1 1
( X X) 1 = 0
4 2

1 1
0
4 10
Segue-se que o vetor das estimativas dos parmetros
a 6,5
b = c = ( XX) Xy = 3
1
b 1
A equao de regresso estimada
223
Y j = 6,5 + 3Z j X j
Na figura 5.1 est o par de retas paralelas correspondente a essa equao,

juntamente com os pontos da amostra.
Para fazer a anlise de varincia da regresso, apresentada na tabela 5.4,
calculamos
S.Q.Res. = y y b X y = 272 (6,5 44 + 3 28 1 100) = 2

e
( Y j ) 2
S.Q.Total = y y = 272 242 = 30
n

Regresso 2 28 14 35
Resduo 5 2 0,4
Total 7 30
Figura 5.1. Retas paralelas ajustadas aos dados da tabela 5.3.

Vamos testar, ao nvel de significncia de 1%, a hiptese H 0 : = 0 contra a

Temos
224
1
V (c ) = 0,4 = 0,2
2
e
c 30
t= = = 6,708
s (c ) 0,2
A regio de rejeio, para um teste unilateral com 5 graus de liberdade e ao nvel

de significncia de 1%, t 3,365 . O resultado obtido , portanto, significativo, isto ,
rejeita-se, ao nvel de significncia de 1%, a hiptese de que o termo constante da
relao linear entre Y j e X j seja o mesmo nos dois perodos.
Os clculos para ajustar um par de retas paralelas aos dados apresentados, com
nmero igual de observaes em cada perodo, ficam mais simples se considerarmos o
modelo com a varivel independente centrada:
Y j = + Z j + x j + u j ,
com Z j = 1 no perodo I e Z j = 1 no perodo II.
Neste caso, obtemos

44 8 0 0
Xy = 12 , XX = 0 8 0 ,
10 0 0 10
1
8 0 0

1
( X X) 1 = 0 0
8

1
0 0
10
e
5,5
b = ( XX) Xy = 1,5
1
A equao estimada
Y j = 5,5 + 1,5Z j x j
ou
Y j = 8 + 1,5Z j X j
225
No perodo I, com Z j = 1 , temos
Y j = 9,5 X j ,
e no perodo II, com Z j = 1 , temos
Y j = 6,5 X j
O resultado, como era de se esperar, o mesmo que obtivemos quando

utilizamos o modelo (5.5).
5.3. Uso de variveis binrias para ajustar poligonais
Neste caso as variveis binrias so usadas para captar a mudana na inclinao

entre segmentos consecutivos da poligonal.
O modelo geral para uma poligonal com k vrtices (k +1 segmentos)
k
Y j = + X j + h Z hj ( X j h ) + u j (5.6)
h =1
onde h a abcissa do h-simo vrtice (que pressupomos conhecida) e Z hj uma
varivel binria tal que

Z hj = 0 para X j h
e
Z hj = 1 para X j > h
Pode-se verificar que h a mudana na inclinao do h-simo segmento da

poligonal, em relao inclinao do segmento anterior.
Para uma poligonal com 3 segmentos o modelo fica
Y j = + X j + 1 Z 1 j ( X j 1 ) + 2 Z 2 j ( X j 2 ) + u j
(5.7)
A figura 5.2 mostra como poderia ser a forma da poligonal que mostra como
E (Y j ) varia em funo de X j com 1 < 0 e 2 < 0 .
226
X
Z1 = 0 Z1 = 1 Z1 = 1
Z2 = 0 Z2 = 0 Z2 = 1
Figura 5.2. Uma poligonal com 3 segmentos.
Para o 1o intervalo ( X j 1 ) a reta
E (Y j ) = + X j (5.8)
No 2o intervalo ( 1 < X j 2 ) a reta
E (Y j ) = 1 1 + ( + 1 ) X j (5.9)
No 3o intervalo ( X j > 2 ) a reta
E (Y j ) = 1 1 2 2 + ( + 1 + 2 ) X j (5.10)
interessante verificar que tanto (5.8) como (5.9) produzem a mesma ordenada
para X j = 1 (que a ordenada do 1o vrtice). Analogamente, (5.9) e (5.10) produzem a
mesma ordenada para X j = 2 .
Para obter a poligonal da figura acima devemos ter > 0 , > 0 , 1 < 0 ,
2 < 0, +1 > 0 e +1 + 2 < 0.

Vamos considerar um exemplo numrico para o qual o modelo tem apenas dois
segmentos. Nesse caso o modelo fica
Y j = + X j + Z j ( X j ) + u j , (5.11)
com Z j = 0 para X j e Z j = 1 para X j > .
227
Consideremos, por simplicidade, que estamos analisando a tendncia de uma
varivel ( Y j ) qualquer, ou seja, consideremos que a varivel explanatria ( X j ) o
tempo, medido em anos, por exemplo.

Na tabela 5.5 so apresentados os valores de 6 observaes consecutivas da
varivel Y j . Vamos admitir que a inclinao da linha de tendncia se modifique na 3a
observao. Desejamos, portanto, ajustar uma poligonal com um vrtice cuja abcissa
igual abcissa da 3a observao.
Para facilitar os clculos, vamos considerar que no instante correspondente 3a
observao temos X j = 0. Dessa maneira temos = 0 e o modelo estatstico do
problema em questo fica

Y j = + X j + Z j X j + u j (5.12)
ou, fazendo W j = Z j X j ,
Y j = + X j + W j + u j
TABELA 5.5. Amostra de 6 observaes consecutivas da varivel Y j .
Tempo ( X j ) Zj Yj
2 0 5,5
1 0 5,0
0 0 1,0
1 1 3,5
2 1 4,5
3 1 4,5
Para as 3 primeiras observaes, onde Z j = 0, a relao
E (Y j ) = + X j ,
e para as 3 ltimas observaes, onde Z j = 1, a equao da tendncia passa a ser
E (Y j ) = + ( + ) X j
Confirma-se, portanto, que representa a mudana na tendncia.

Para o exemplo apresentado, obtemos:
228
1 2 0
1 1 0
24
1 0 0
X= , Xy = 10 ,
1 1 1
1 2 2 26

1 3 3
6 3 6 70 42 72
1
XX = 3 19 14 , ( XX) 1 = 42 48 66
114
6 14 14 72 66 105
e
a 2

b = b = ( XX) 1 Xy = 2

c 3
A equao ajustada
Y j = 2 2 X j + 3Z j X j
A poligonal correspondente est traada na figura 5.3. Note que a declividade no

primeiro perodo 2 e no segundo perodo (2 + 3) = 1.
Figura 5.3. Poligonal ajustada aos dados da tabela 5.5.
A seguir calculamos
229
S.Q.Res. = y y b X y = 109 ( 2 24 2 10 + 3 26) = 3
e fazemos a anlise de varincia da regresso, apresentada na tabela 5.6.

Regresso 2 10 5 5
Resduo 3 3 1
Total 5 13
Para verificar se a mudana de tendncia aps a terceira observao

estatisticamente significativa, fazemos o teste da hiptese H 0 : = 0 . Para isso
calculamos
105 35
V (c ) = =
114 38
e
c0 3
t= = = 3,126
s (c ) 35
38
O valor crtico de t para um teste bilateral, ao nvel de significncia de 5% e com

3 graus de liberdade, 3,182. O resultado obtido no , portanto, significativo.
5.4. Mudana estrutural
Vamos admitir que estamos analisando a relao entre duas variveis ( X j e Y j )
e temos duas situaes (dois perodos, duas regies ou duas categorias). Seja n1 o
nmero de observaes disponveis para a situao I e seja n 2 o nmero de observaes

disponveis para a situao II. Podemos usar uma varivel binria para distinguir as
duas situaes, fazendo Z j = 0 para as observaes da situao I e Z j = 1 para as
observaes da situao II. Admitindo que tanto o nvel como a inclinao da relao
entre X j e Y j sejam diferentes nas duas situaes, um modelo apropriado
Y j = + X j + Z j + Z j X j + u j (5.13)
230
A equao estimada com base nas n1 + n 2 observaes
Y = a + bX + cZ + dZX (5.14)
A respectiva soma de quadrados residual
S.Q.Res. = SU , com n1 + n 2 4 graus de liberdade
Na situao I, com Z j = 0 , a relao entre X e Y
E (Y j ) = + X j
Na situao II, com Z j = 1 , a relao fica
E (Y j ) = + + ( + ) X j
Para verificar se existe diferena estrutural entre as duas situaes testamos a

hiptese
H0 : = = 0 (5.15)
Seja FE o valor de F calculado para testar essa hiptese.
O modelo restrito para a hiptese (5.15) Y j = + X j + u j . Seja S R a soma
de quadrados residual obtida ajustando esse modelo restrito s n1 + n 2 observaes.
Ento S R est associado a n1 + n 2 2 graus de liberdade. De acordo com (4.85),
sabemos que o valor de FE pode ser obtido de
S R SU
FE = 2 (5.16)
SU
n1 + n2 4
Se admitimos que a relao entre X j e Y j distinta nas duas situaes
analisadas, lgico ajustar regresses separadamente para cada situao.
Para as n1 observaes da situao I obtemos
Y = a1 + b1 X e S.Q.Res. = S1 , com n1 2 graus de liberdade
e para as n 2 observaes da situao II obtemos
Y = a 2 + b2 X e S.Q.Res. = S 2 , com n 2 2 graus de liberdade.
231
Pode-se provar que a1 = a , b1 = b , a 2 = a + c e b2 = b + d , isto , que as duas
retas estimadas separadamente so idnticas ao conjunto de duas retas estimado por
meio do modelo (5.13). Consequentemente
S1 + S 2 = S U
Ento o teste F para mudana estrutural pode ser obtido de
S R ( S1 + S 2 )
FE = 2 (5.17)
S1 + S 2
n1 + n2 4
Esse o teste de Chow para mudana estrutural.

Genericamente, para um modelo com p parmetros em cada uma das duas
situaes, temos
S R ( S1 + S 2 )
p
FE = (5.18)
S1 + S 2
n1 + n 2 2 p
Para ilustrar o tema, consideremos um exerccio apresentado em Draper e Smith
(1966), no qual dispomos de 9 valores de uma varivel Y j , observados em 9 meses
consecutivos. Vamos admitir que h uma tendncia para as quatro primeiras

observaes, e que h outra tendncia para as 5 ltimas observaes, com mudana
tanto no termo constante como no coeficiente angular. Para captar essas mudanas
definimos uma varivel binria Z j cujo valor zero para as quatro primeiras
observaes e 1 para as 5 ltimas observaes. Sendo X j o nmero de ordem dos 9
meses, para simplificar um pouco as contas, vamos utilizar a varivel centrada

x j = X j 5 . O modelo fica
Y j = + x j + Z j + Z j x j + u j (5.19)
A tabela 5.7 mostra os valores das variveis que sero utilizadas para estimar a
equao.
232
TABELA 5.7. Valores da varivel Y j e das variveis explanatrias
utilizados para ajustar um par de retas.
Tempo em
meses ( X j ) Yj xj Zj Z jxj
1 1,0 4 0 0
2 4,0 3 0 0
3 6,0 2 0 0
4 7,0 1 0 0
5 9,5 0 1 0
6 11,0 1 1 1
7 11,5 2 1 2
8 13,0 3 1 3
9 13,5 4 1 4
Tendo em vista o modelo (5.19), obtemos
9 0 5 10 76,5

0 60 10 30 92
XX = , Xy =
5 10 5 10 58,5

10 30 10 30 127
1,5 0,5 1,5 0,5

0,5 0,2 0,5 0,2
( XX) 1 =
1,5 0,5 2,1 0,3

0,5 0,2 0,3 0,3
Ento
a 9,5

b 2
b = = ( XX) 1 X y =
c 0,2

d 1
Y j = 9,5 + 2 x j + 0,2 Z j Z j x j (5.20)
233
No primeiro perodo, com Z j = 0, a reta estimada
Y j = 9,5 + 2 x j ou Y j = 0,5 + 2 X j
No segundo perodo, com Z j = 1, a reta estimada
Y j = 9,7 + x j ou Y j = 4,7 + X j
A figura 5.4 mostra os pontos da amostra e o par de retas ajustado.
Figura 5.4. Retas ajustadas aos dados da tabela 5.7.
Para fazer a anlise de varincia da regresso, apresentada na tabela 5.8,

devemos calcular
S.Q.Res. = y y b X y = 796,75 795,45 = 1,3

Regresso 3 145,2 48,4 186,15
Resduo 5 1,3 0,26
Total 8 146,5
A tabela 5.9 apresenta, alm das estimativas dos quatro parmetros, as

estimativas dos respectivos desvios padres, o teste t e a correspondente probabilidade
caudal (probabilidade associada a valores absolutos de t maiores do que o calculado).
234
TABELA 5.9.Estimativas dos parmetros do modelo (5.19) e dos respectivos
desvios padres, o teste t e a correspondente probabilidade caudal.
Desvio Probabilidade
Parmetro Estimativa Teste t
Padro caudal
9,5 0,6245 15,21 < 0,01%
2 0,2280 8,77 0,03%
0,2 0,7389 0,27 79,75%
1 0,2793 3,58 1,59%
A estimativa de no estatisticamente diferente de zero, mas, adotando um

nvel de significncia de 5%, rejeitam-se as hipteses de nulidade de , ou .
importante observar que o mesmo par de retas ajustado com base no modelo
(5.19) obtido fazendo-se duas regresses lineares simples.
Considerando os 4 primeiros pares de valores para as variveis Y j e X j
obtemos
Y j = 0,5 + 2 X j (5.21)
com S.Q.Res. = 1.
Considerando os 5 ltimos pares de valores para as variveis Y j e X j obtemos
Y j = 4,7 + X j (5.22)
com S.Q.Res. = 0,3.

Note que a soma de quadrados de resduos dessas duas regresses lineares
simples igual soma de quadrados de resduos da regresso mltipla ajustada
anteriormente.
O ajustamento dessas duas regresses lineares simples exige menos clculo do
que o ajustamento de um modelo como (5.19). Entretanto, um modelo como (5.19) tem
a vantagem de tornar relativamente mais fcil testar, posteriormente, hiptese
envolvendo os valores dos parmetros das duas retas.
Para fazer o teste de mudana estrutural da maneira indicada por Chow, alm de
obter as somas de quadrados de resduos das equaes (5.21) e (5.22), necessrio obter
a soma de quadrados residual de uma regresso linear simples de Y j contra X j para as
9 observaes. A equao estimada

Y j = 0,8333 + 1,533 X j , (5.23)
235
com S.Q.Res. = S R = 5,4333 , associada a 7 graus de liberdade. De acordo com (5.17),
obtemos
5,4333 (1 + 0,3)
2 2,0667
FE = = = 7,95
1 + 0,3 0,26
5
Ao nvel de significncia de 5%, com 2 e 5 graus de liberdade, o valor crtico de
F 5,79. Portanto, rejeita-se a hiptese de que no houve mudana estrutural a partir do
5o ano, isto , rejeita a hiptese H 0 : = = 0 . Cabe assinalar que o teste dessa
hiptese tambm pode ser feito usando (4.60), obtendo-se exatamente o mesmo
resultado.
Tendo concludo que h mudana estrutural, o ajustamento do modelo (5.19)
permite que se especifique melhor a natureza da mudana. Nesse exemplo numrico,
tendo em vista a tabela 5.9, verifica-se que a mudana ocorre, basicamente, no
coeficiente angular da relao linear entre Y j e X j .
5.5. Anlise de varincia de dados com vrios tratamentos e o teste para

falta de ajustamento
Consideremos um total de n observaes de uma varivel, submetida a H

diferentes tratamentos (h = 1, ..., H). Seja Yhi o valor da i-sima observao referente ao
h-simo tratamento. A varivel em questo pode ser o preo de um produto em
diferentes regies, a renda de indivduos classificados conforme o nvel de escolaridade,
a produo de milho nas parcelas de um experimento de competio de variedades, etc.
Seja n h o nmero de observaes relativas ao h-simo tratamento, cujo total
Th = Yhi (5.24)
i
O total geral
G = Th = Yhi (5.25)
h h i
Para distinguir os H tratamentos vamos utilizar H variveis binrias Z h (com
h = 1, ..., H), fazendo Z h = 1 para as observaes do h-simo tratamento e Z h = 0 para

as observaes dos demais tratamentos. O modelo de regresso
Yhi = 1 Z 1 + 2 Z 2 + ... + H Z h + u hi (5.26)
236
As linhas da matriz X desse modelo tm todas um nico elemento igual a 1, e os
demais elementos iguais a zero. Assim, em todas as linhas temos
Z1 + Z 2 + ... + Z H = 1 (5.27)
Verifica-se que a matriz X X uma matriz diagonal com o nmero de

observaes de cada tratamento na diagonal e que o vetor-coluna X y formado pelos
totais dos tratamentos. No caso de H = 3 tratamentos, temos
n1 0 0 T1

X X = 0 n2 0 , X y = T2

0 0 n3 T3
1 T1
n 0 0 n
1 1

T
0
1
( XX) 1 =0 e b = ( XX) X y = 2
1
n2 n
2

0 0
1 T3
n3 n
3
Segue-se que
Th2
S.Q.Res. = y y b Xy = Yhi2 =
h i h nh
G 2 Th2 G 2
= Yhi2 (5.28)
h i n h nh n
Na primeira expresso entre parnteses podemos reconhecer a soma de
quadrados total:
2
G G2
S.Q.Total = Yhi = Yhi2 (5.29)
h i
n h i n
com n 1 graus de liberdade.

A ltima expresso entre parnteses em (5.28) a soma de quadrados de
tratamentos:
Th2 G 2
S.Q.Trat. = , com n H graus de liberdade (5.30)
h n n
h
237
A soma de quadrados de tratamentos representa a parte da variao dos Yhi
devida s diferenas entre tratamentos, ou diferenas entre mdias de Yhi nos vrios
tratamentos ou categorias consideradas.
Note-se que, dados os valores de Yhi , as expresses (5.28), (5.29) e (5.30)
permitem calcular S.Q.Trat., S.Q.Total e S.Q.Res. sem que seja necessrio estimar os
parmetros do modelo (5.26).
Vamos admitir, agora, que os diferentes tratamentos se distinguem apenas pelo

valor de uma varivel X, e seja X h o valor correspondente ao h-simo tratamento.
Pressupondo que o efeito de X h sobre Yhi seja linear, os parmetros h do modelo
(5.26) podem ser substitudos por + X h . Com essa restrio, o modelo fica
Yhi = ( + X h )( Z 1 + Z 2 + ... + Z H ) + u hi
Lembrando (5.27), conclui-se que o modelo restrito
Yhi = + X h + u hi , (5.31)
que o modelo de uma regresso linear simples de Yhi contra X h .
Em geral, se os tratamentos so caracterizados pelo valor de k variveis

explanatrias e pressupomos que seu efeito sobre Y linear, obtermos um modelo de
regresso linear mltipla com p = k + 1 parmetros. Se p < H , esse modelo ser um
modelo restrito em comparao com o modelo (5.26).
A soma de quadrados residual do modelo irrestrito

Th2
SU = Yhi2 , com n H graus de liberdade (5.32)
h i h nh
e a soma de quadrados residual do modelo restrito
S R = (S.Q.Res. Yhi | X 1h ,..., X kh ) , com n p graus de liberdade (5.33)
De acordo com (4.85), calculamos

S R SU
Hp
F= (5.34)
SU
nH
238
Neste contexto, a diferena S R SU denominada soma de quadrados de falta
de ajustamento e o correspondente teste F denominado teste para falta de
ajustamento, pois um valor elevado de S R SU indica que o modelo onde se impe a
linearidade do efeito das variveis explanatrias no se ajusta bem aos dados.
S razovel utilizar o modelo de regresso linear de Yhi contra as k variveis
explanatrias se esse teste for no-significativo. Um valor de F significativo indica que
devemos rejeitar a hiptese de linearidade do efeito das variveis explanatrias sobre
Yhi . Neste caso deveremos nos limitar ao modelo (5.26) ou experimentar outras formas
para a relao funcional entre Yhi e as variveis explanatrias.

Para exemplificar, consideremos os dados da tabela 5.8, com 8 observaes e 3
tratamentos (3 valores distintos de uma nica varivel explanatria).
TABELA 5.8. Amostra de 8 valores de Y, com 3 valores distintos de X.
Xh nh Yhi Th
2 4 14, 11, 12 e 13 50
3 2 18 e 17 35
5 2 22 e 21 43
SU = 2168 2162 = 6 , com 5 graus de liberdade
Ajustando a regresso linear simples de Y contra X, obtemos
Y = 7 + 3 X (5.35)
e S R = 12 , com 6 graus de liberdade.
Substituindo esses valores em (5.34) verifica-se que o valor de F para falta de

ajustamento 5. Adotando um nvel de significncia de 5%, o valor crtico, para 1 e 5
graus de liberdade, F0 = 6,61 . Ento o resultado no-significativo, no se rejeita a
linearidade da relao entre X e Y e vlido usar a equao estimada (5.35).
Se fosse adotado um nvel de significncia de 10%, o valor crtico passaria a ser
F0 = 4,06 e o valor obtido (F = 5) seria significativo. Neste caso no seria razovel
utilizar a equao (5.35) e deveramos experimentar uma outra relao funcional entre Y
e X. Uma alternativa seria considerar o modelo Y j = + 1 X j + 2 X 2j + u j . Para esse
239
exemplo numrico no possvel fazer o teste de falta de ajustamento para esse novo
modelo, pois o nmero de parmetros (p = 3) igual ao nmero de tratamentos (H = 3).
A soma de quadrados residual da equao de segundo grau ser, necessariamente, igual
a SU . Mas, se o nmero de tratamentos fosse maior, poderamos fazer o teste de falta
de ajustamento para a equao de regresso de segundo grau e verificar se esse novo
modelo seria aceitvel ou se seria necessrio experimentar outras formas funcionais.
Cabe assinalar que o teste de falta de ajustamento s pode ser feito quando h,
na amostra, mais de um valor de Y para determinadas combinaes de valores das
variveis explanatrias (que definem os tratamentos), isto , devemos ter n > H. Isso
comum em dados experimentais, mas no comum em dados de amostras de
levantamentos scio-econmicos.
Exerccios
5.1. Na anlise da oferta de certo produto, admite-se que a funo tem, conforme o
perodo do ano, 2 posies distintas, mas com a mesma declividade. Foram observados os
valores
Perodo X = preo Y = quantidade
1 2,0
I 2 1,5
3 2,5
1 3,0
II 2 5,5
3 6,5
Um pesquisador ajustou o modelo

Yi = + X i + Z i + u i ,
com Z tomando valor 1 no perodo 1 e valor +1 no perodo II.
a) Estime os parmetros.
b) Qual o deslocamento da oferta de um perodo para outro?
c) Verifique se o deslocamento estatisticamente significativo ao nvel de
significncia de 1%.
5.2. Uma varivel Y assume, em 5 anos consecutivos, os seguintes valores: 2,5; 3,0; 0; 3,0 e
2,5.
240
Ajuste a esses dados uma poligonal com vrtice num ponto de abcissa igual abcissa da
3a observao.
a) Qual a estimativa da declividade no 1o perodo (da 1a 3a observao)?
b) Qual a estimativa da declividade no 2o perodo (da 3a 5a observao)?
c) Teste, ao nvel de significncia de 10%, a hiptese de que essas duas declividades so
iguais.
5.3. Dois ensaios de adubao forneceram os seguintes resultados:
Ensaio X = dose de nutriente Y = produo

0 1,5
I 1 6,0
2 5,5
0 5,5
II 1 7,0
2 9,5
Os trs primeiros pares de valores referem-se ao ensaio I e os trs ltimos pares ao

ensaio II. Admite-se que a funo de produo uma parbola. Admite-se,
tambm, que as funes de produo para os dois ensaios apresentam, para uma
abcissa qualquer, a mesma declividade, embora a funo correspondente ao ensaio
II esteja em nvel mais elevado.
a) Adote um modelo e estime os seus parmetros.
b) Qual a estimativa da diferena de nvel entre as duas funes?
c) Verifique se essa diferena estatisticamente diferente de zero, ao nvel de
significncia de 10%.
d) Teste a hiptese de que o coeficiente de regresso associado ao termo
quadrtico igual a 3, considerando um nvel de significncia de 10%.
5.4. Dispomos de medidas da varivel Y durante 5 anos consecutivos, com duas medidas
(repeties) para cada ano.
Ano Valores de Y
1 1e2
2 5e5
3 5e6
4 7e9
5 6e8
241
Admite-se que h uma tendncia linear do 1o ao 4o ano e uma outra tendncia linear do 4o para o
5o ano.
a) Usando um modelo de regresso mltipla apropriado, ajuste aos dados uma linha
poligonal com vrtice no 4o ano. Qual o significado das estimativas dos parmetros
obtidas?
b) Faa a anlise de varincia da regresso testando falta de ajustamento.
c) Teste a hiptese de que a declividade da linha no 2o perodo (4o ao 5o ano) igual
declividade da linha no 1o perodo (1o ao 4o ano), considerando um nvel de
significncia de 5%.
5.5. Consideremos duas amostras aleatrias, uma da varivel Y1 , com n1 observaes, e outra
da varivel Y2 , com n 2 observaes. Indiquemos por 1 e 2 as mdias dessas

variveis, cujas estimativas so as mdias das amostras Y1 e Y2 , respectivamente.
Admitindo que as duas variveis tm distribuies normais com varincias iguais, a
hiptese H 0 : 1 = 2 pode ser testada, como sabemos, por meio do teste t,
Y1 Y2
t= ,
1 1
+ s 2
n1 n2
onde
n1 n2
(Y1i Y1 ) 2 + (Y2i Y2 ) 2
s2 = i =1 i =1
n1 + n 2 2
Demonstre que este teste igual ao teste t relativo hiptese H 0 : = 0 , sendo o coeficiente
de regresso do modelo
Yki = + Z ki + u ki ,
onde:
a) Z ki uma varivel binria que assume valor 1 para as observaes de uma das
amostras e valor +1 no caso da outra amostra;
b) o ndice k = 1, 2 indica que se trata de uma observao da varivel Y1 ou da varivel
Y2 , e
c) o ndice i varia de 1 a n1 se k = 1 e de 1 a n 2 se k = 2
5.6. Mostre que o teste t descrito no exerccio anterior , tambm, igual ao teste t relativo
hiptese H 0 : = , sendo e os coeficientes de regresso do modelo
Yki = Z ki + Vki + u ki ,
242
onde Z ki = 1 e Vki = 0 no caso das observaes da amostra de Y1 , e Z ki = 0 e Vki = 1
quando se trata das observaes da amostra de Y2 .
5.7. Para ajustar um par de retas a um conjunto de n1 + n 2 observaes ( n1 observaes no
grupo I e n 2 observaes no grupo II), podemos utilizar o modelo
Yki = 1 Z 1k + 2 Z 2 k + 1 Z 1k X ki + 2 Z 2 k X ki + u ki ,
k = 1, 2 e i = 1, 2, ..., n1 ou n 2
com
Z11 = 1, Z12 = 0, Z 21 = 0 e Z 22 = 1
Demonstre que o valor de t para testar a hiptese H 0 : 1 = 2
b1 b2
t=
1 1 Q1 + Q2

x +
n +n 4

2
1i x 22i 1 2
onde, para k = 1, 2,
x ki y ki
bk = i
,
x ki2
i
x ki = X ki X k ,
y ki = Yki Yk
e Q1 e Q2 so as somas de quadrados de resduo para as regresses lineares simples de Yki
contra X ki , para os grupos de observaes I e II, respectivamente, isto ,
Qk = yki2 bk xki yki

i i
5.8. Dados:
Valores de Y no
X
Tratamento 1 Tratamento 2 Tratamento 3
0 4 3 3
1 7 4 2
2 6 6 4
3 9 5 5
Totais 26 18 14
Admitimos que para cada tratamento existe uma relao linear entre X e Y, com o mesmo
coeficiente angular, isto , admitimos que a relao funcional entre Y e X pode ser representada
por um feixe de 3 retas paralelas. Sejam h (h = 1, 2, 3) os coeficientes lineares das retas e seja
o coeficiente angular comum. Admitimos, tambm, que Yi = E (Yi ) + u i , com i = 1, 2, ..., 12,
243
onde u i so variveis aleatrias independentes, com mdia zero, varincia 2 e distribuio
normal.
a) Determine as estimativas de h (h = 1, 2, 3) e de de acordo com o mtodo de
mnimos quadrados.
b) Quais as propriedades dessas estimativas?
c) Teste a hiptese H 0 : = 0 .
d) Teste a hiptese H 0 : 1 = 0 contra H A : 1 > 0 .
1
e) Teste a hiptese H 0 : 1 = ( 2 + 3 )
2
2 + 3
f) Teste a hiptese H 0 : 2 = 3 e 1 = + 2.
2
Considere um nvel de significncia de 1%.
Sugesto: Adote, inicialmente, o modelo
3
Yi = h Z hi + X i + ui ,
h =1
onde Z hi = 1 para toda observao do tratamento h e Z hi = 0 para as observaes
dos outros dois tratamentos (com h = 1, 2, 3).

Dessa maneira h o intercepto da reta relativa ao h-simo tratamento.
A seguir mostre que o modelo inicialmente adotado equivalente a

3
Yi = h Z hi + xi + u i
h =1
onde h = h + X e xi = X i X
Os clculos ficam bastante facilitados utilizando este ltimo modelo, pois a

correspondente matriz X X ser uma matriz diagonal.
5.9. Faa o teste para falta de ajustamento para a regresso linear simples do exerccio 2.1.
5.10. Faa o teste para falta de ajustamento para a reta estimada no exerccio 2.19.
5.11. dada uma amostra com 12 pares de valores das variveis X e Y:

X Y Temos
0 1; 1; 2; 2
, ,
2 3; 4; 4; 5
4 3; 3; 4; 4 , e
244
Admite-se que as variveis estejam relacionadas de acordo com o modelo Y j = + X j + u j ,
onde os u j so erros independentes, com E (u j ) = 0 , varincia constante e distribuio
normal.
a) Determine a reta de regresso de Y em relao a X, de acordo com o mtodo dos
mnimos quadrados.
b) Calcule o coeficiente de determinao e faa a anlise de varincia da regresso,
adotando um nvel de significncia de 1%.
c) Verifique se h razes para rejeitar o modelo linear inicialmente proposto,
considerando um nvel de significncia de 1%.
5.12. Verifique se h razes para rejeitar o modelo linear proposto no exerccio 2.34.
5.13. Com base nos 8 pontos cujas coordenadas so dadas na tabela a seguir, ajuste um plano
que passe pela origem dos eixos, considerando Y como varivel dependente. Faa o teste
para falta de ajustamento. Verifique se o coeficiente de X 2 estatisticamente
diferente de zero, considerando um nvel de significncia de 5%
X1 X2 Y
1 1 3,5
1 1 4,5
1 2 5,5
1 2 4,5
2 1 4,5
2 1 3,5
2 2 5,0
2 2 6,0
5.14. A tabela ao lado mostra uma Ano Quadrimestre Y

srie de 9 valores 1o 1o 15
2o 22
quadrimestrais da varivel Y. 3o 15
Admite-se que essa varivel 2o 1o 11
apresenta variaes cclicas
2o 18
3o 16
estacionais. Verifica-se que 3o 1o 10
Y = 147 , Y 2 = 2535 e 2o 20
3o 20
y 2 = 134 .
a) Estabelea um modelo de regresso para captar as variaes estacionais de Y,

utilizando variveis binrias. Construa a matriz X.
b) Estime os parmetros do modelo.
245
c) Teste, ao nvel de significncia de 5%, a hiptese de que no h variaes estacionais
[caso em que se tem E (Y ) = ].
d) Determine o intervalo de previso para o valor de Y no 2o quadrimestre do 4o ano, ao
nvel de confiana de 95%.
Ano Y
5.15. dada uma srie de 9 valores anuais da varivel Y.
Admite-se que Y varia linearmente em funo do 1o 39
2o 54
tempo (em anos), mas acredita-se que ocorreu uma
3o 63
mudana estrutural entre a 4a e a 5a observao, de
4o 66
maneira que haveria uma tendncia linear durante os 4 5o 96
primeiros anos da srie e uma tendncia linear distinta 6o 108
durante os 5 ltimos anos. 7o 111
8o 120
9o 135
Verifica-se que Y = 792 , Y 2 = 78588 e y 2 = 8892 :

a) Estime as taxas aritmticas de crescimento anual de Y nos dois perodos.
b) Verifique se a mudana estrutural estatisticamente significativa. Sugere-se fazer o
teste com base nas regresses simples, como indicado por Chow.
c) H diferena estatisticamente significativa entre as taxas aritmticas de
crescimento de Y nos dois perodos? Adote um nvel de significncia de 5% em todos
os testes de hipteses deste exerccio.
5.16. Vamos admitir que temos os resultados de uma pesquisa de oramentos familiares, sendo
W a renda per capita e Q o consumo per capita de determinado alimento. Os respectivos
logaritmos neperianos so
Y = ln Q e X = ln W
Admite-se que a elasticidade-renda do consumo maior para os relativamente pobres do que
para os relativamente ricos. Considera-se relativamente pobres as pessoas com X 4. Para
analisar como Y varia em funo de X ser adotado, ento, um modelo que corresponde a uma
poligonal com dois segmentos e vrtice no ponto de abcissa (X) igual a 4.
Dispomos de uma amostra com 6 pares de valores de X e Y: X Y

a) Estabelea o modelo apropriado e estime seus 1 0,1
parmetros. 2 0,6
b) Calcule o coeficiente de determinao da 3 1,5
regresso. 5 2,9
6 3,0
7 2,7
246
c) Teste, ao nvel de significncia de 1%, a hiptese de que a elasticidade-renda do
consumo desse alimento para os relativamente pobres igual a zero, contra a hiptese
alternativa de que essa elasticidade positiva.
d) Faa um teste bilateral, ao nvel de significncia de 1%, para a hiptese de que a
elasticidade-renda para os relativamente ricos igual a 1.
5.17. Temos uma amostra com 6 valores da

varivel econmica Y em duas regies (3 Regio Y
observaes em cada regio), como A 8
mostra a tabela ao lado: A 12

A 7
a) Estabelea um modelo de regresso
B 14
com uma ou duas variveis binrias
B 20
para distinguir as duas regies.
B 17
Ressalte-se que o modelo vai captar
apenas a diferena no valor de E (Y )
nas duas regies, incluindo um erro
aleatrio com as propriedades usuais.
b) Com base na amostra, estime os dois parmetros do modelo e mostre como
essas estimativas esto associadas com a estimativa de E (Y ) em cada regio.
c) Estime a varincia do erro do modelo.
d) Teste, ao nvel de significncia de 5%, a hiptese de que a E (Y ) a mesma
nas duas regies.
5.18. Dispomos dos 8 pares de valores das variveis X i e Yi da tabela a seguir.

a) Ajuste a equao de regresso linear simples de Y
Xi Yi
contra X e determine a respectiva soma de quadrados 1 41
dos resduos. 1 37
b) Estabelea um modelo cujas variveis explanatrias so 3 80
3 78
variveis binrias que permitem distinguir os 4
5 107
diferentes valores de X observados. Estime os 5 103
parmetros do modelo, determine o valor da soma de 7 98
7 96
quadrados dos resduos e teste, ao nvel de significncia
de 5%, a hiptese de que o valor esperado de Y o
mesmo para os 4 valores distintos de X.
247
c) Considerando a regresso linear simples ajustada no item (a) como um modelo
restrito em comparao com o modelo do item (b), faa um teste de falta de
ajustamento, isto , verifique, ao nvel de significncia de 1%, se deve ser
rejeitada a hiptese de que o efeito de X sobre Y linear.
d) Ajustando uma equao de segundo grau aos dados, foi obtida a equao
Y = 7 + 34 X 3 X 2 ,
com S.Q.Res. = 60. Faa um teste de falta de ajustamento para essa equao,
isto , verifique se podemos admitir que o efeito de X sobre Y obedece a uma
equao de segundo grau, adotando um nvel de significncia de 5%.
e) Qual a soma de quadrados dos desvios de uma equao de terceiro grau
ajustada a esses dados? possvel fazer um teste de falta de ajustamento
para a equao de terceiro grau? Justifique a resposta.
5.19. dada uma srie temporal de 8 valores Ano Trimestre Y

trimestrais da varivel Y, cobrindo um 1 1 29
1 2 18
perodo de dois anos. Admite-se que Y 1 3 13
tenha variaes cclicas estacionais, alm 1 4 22
2 1 27
de erros uj independentes com 2 2 22
2 3 11
E (u j ) = 0 e varincia constante. 2 4 18
a) Estabelea um modelo onde as variaes estacionais de Y so captadas por

meio de variveis binrias e estime a equao.
b) Teste, ao nvel de significncia de 5%, a hiptese de que o valor esperado de Y
o mesmo no terceiro e no quarto trimestres.
c) Teste, ao nvel de significncia de 1%, a hiptese de que no h variaes
estacionais.
5.20. So dados os valores de X 2 e Y para uma srie de 13 anos, como mostra a tabela
a seguir. Admitindo que haja uma mudana estrutural entre a 7a e a 8a
observao (posio assinada na tabela pela linha tracejada), consideramos o
modelo
Y = + 1 X 1 + 2 X 2 + Z + 1 ZX 1 + 2 ZX 2 + u
248
Ano ( X 1 ) ( X2 ) Y
1 12 70
2 4 50
3 8 54
4 8 66
5 8 62
6 4 66
7 12 94
8 8 114
9 14 134
10 2 76
11 2 78
12 14 140
13 8 124
A equao estimada
Y = 26 + 4 X 1 + 3 X 2 + 24 Z + 2 ZX 1 + 2 ZX 2 ,
com S.Q.Res. = 384, R 2 = 0,9670 e
R 2 = 0,9434 .
Ajustando uma regresso mltipla de Y contra X 1 e X 2 , com as 13 observaes,

obtemos
Y = 9,6923 + 6 X 1 + 4,3846 X 2 ,
com S.Q.Res. = 1069,54, R 2 = 0,9080 e R 2 = 0,8896 .
a) Qual a equao estimada fazendo uma regresso de Y contra X 1 e X 2 , para

as 7 primeiras observaes?
b) Qual a equao estimada fazendo uma regresso de Y contra X 1 e X 2 , para
as 6 ltimas observaes?
c) Teste, ao nvel de significncia de 5% a hiptese de que ocorreu a suposta
mudana estrutural (o que corresponde, no modelo inicial, a testar a hiptese
de que = 1 = 2 = 0 ).
5.21. A tabela a seguir mostra a escolaridade (X) e o rendimento (Y) de 4 pessoas

ocupadas na agricultura e 4 pessoas ocupadas nos setores urbanos (indstria ou
servios). Define-se uma varivel binria Z que igual a zero para pessoas
ocupadas na agricultura e igual a 1 nos demais casos.
249
Z X Y
0 1 35
0 3 57
0 5 73
0 7 83
1 3 73
1 5 91
1 7 115
1 9 145
Para o modelo
Y j = + X j + Z j + Z j X j + u j
obteve-se
8 40 4 24 672
40 248 24 164 3936
XX = Xy =
4 24 4 24 424

24 164 24 164 2784
1,05 0,2 1,05 0,2

0,2 0,05 0,2 0,05
( XX) 1 =
1,05 0,2 3,1 0,5

0,2 0,05 0,5 0,1
Y = 30 + 8 X + 4Z + 4ZX , S.Q.Res. = 72 e s 2 = 18 .
a) Determine a equao de regresso de Y contra X e a respectiva S.Q.Res. para as

4 pessoas do setor agrcola.
b) Idem, para as 4 pessoas do setor urbano.
c) Teste H 0 : = 0 ao nvel de significncia de 1%.
d) Teste H 0 : = 0 ao nvel de significncia de 1%.

e) Ao nvel de significncia de 1%, h diferena estrutural entre setor agrcola e
setor urbano no que se refere relao linear entre escolaridade e
rendimento?
f) Teste, ao nvel de significncia de 1%, a hiptese de que para o nvel de
escolaridade mdio ( X = 5) no h diferena no rendimento esperado para
pessoas ocupadas no setor agrcola e no setor urbano.
250
Respostas
5.1. a) Yi = 1,5 + X + 1,5Z
b) 3 unidades
5.2. a) 1 unidade por ano

b) +1 unidade por ano
5.3. a) Adotando o modelo Yi = + xi2 + x i + Z i , com xi = X i X , Z1 = 1 para

o ensaio I e Z1 = 1 para o ensaio II, obtemos
Yi = 6,5 xi2 + 2 xi + 1,5Z i
ou
Yi = 3,5 + 1,5Z i + 4 X i X i2
b) 3 unidades
c) t = 3, significativo ( t 0 = 2,920)
5.4. a) Sendo X o ano e Z uma varivel binria que assume valor zero at o 4o ano e
valor 1 no 5o ano, definimos V1 = (1 Z )( X 4) e V2 = Z ( X 4) . Ento V1
cresce de 3 para 0 nos primeiros anos e V2 cresce de 0 para 1 do 4o para o 5o
ano. Obtemos
Y = 8 + 2V1 V2
As declividades no 1o e no 2o perodos so 2 e 1, respectivamente.

b) O valor de F para falta de ajustamento igual a 1,5, no-significativo ao nvel
de 5%.
c) As declividades so estatisticamente diferentes (t = 2,510, significativo, pois
t 0 = 2,365).
5.8. a) b = 1, a1 = 5 , a 2 = 3 e a3 = 2 .
b) So estimativas lineares no-tedenciosas de varincia mnima, e consistentes.
So, tambm, estimativas de mxima verossimilhana.
c) t = 3,873, significativo ( t 0 =3,355)
d) t = 7,906, significativo ( t 0 =2,896)
e) t = 4,082, significativo ( t 0 = 3,355)
251
f) F = 1,33, no-significativo ( F0 = 8,65)
5.9. F= 1,33, no-significativo ao nvel de 10% ( F0 = 3,62)
5.10. F = 5/7, no-significativo.
5.11. a) Y = 2 + 0,5 X
b) r 2 = 4 / 9 = 0,444 ; F = 8, no-significativo ( F0 =10,04)
c) F = 13,5, significativo ( F0 = 10,56).
5.12. F = 0,55, no-significativo.
5.13. Y = X 1 + 2 X 2
O valor de F para falta de ajustamento 2,5, no-significativo ao nvel de 10% (

F0 = 4,32).
Para testar H 0 : 2 = 0 obtemos t = 4,50, significativo ao nvel de 5% ( t 0 =

2,447).
5.14. a) Y = 1 Z 1 + 2 Z 2 + 3 Z 3 + u , com Z i =1 no i-simo quadrimestre e Z i =0 nos

demais quadrimestres.
b) Y = 12Z1 + 20Z 2 + 17 Z 3
c) F= 8,167, significativo ( F0 = 5,14)
d) 13,08 < Y11 < 26,92
5.15. a) b1 = b2 = 9 .
b) F = 6,25, significativo ( F0 = 5,79)
c) As estimativas so iguais: t = 0, obviamente no-significativo.
5.16. a) Y = + X + Z ( X 4) + u , com Z = 0 para X 4 e Z = 1 para X > 4.
a = 1, b = 0,9 e c = 0,8.
b) R 2 = 0,9695 c) t = 5,953, significativo ( t 0 = 4,541)
d) t = 5,953, significativo ( t 0 = 5,841).
5.17. a) Yi = + Z i + u i , com Z i = 1 para a regio A e Z i = 1 para a regio B.

b) Y = 13 + 4Z
252
As estimativas de E (Y ) nas regies A e B so, respectivamente, 13 4 = 9 e
13 + 4 = 17.
c) s 2 = 8 , com 4 graus de liberdade.
d) t = 3,464 , significativo (t 0 = 2,776) .
5.18. a) Y = 40 + 10 X , com S.Q.Res. = 1212

b) Y = 39 + 40Z 2 + 66Z3 + 58Z 4
ou Y = 39Z + 79Z + 105Z + 97Z , com S.Q.Res. = 20
1 2 3 4
F= 346,13 , significativo ( F0 = 6,59)

596
c) F = = 119,2 , significativo ( F0 = 18,0)
5
40
d) F = = 8 , significativo ( F0 = 7,71)
5
e) S.Q.Res. = 20 (a mesma do item b). No h grau de liberdade para o teste de

falta de ajustamento.
5.19. a) Y = 1Z1 + 2 Z 2 + 3 Z 3 + 4 Z 4 + u , com Z i = 1 para o i-simo trimestre e

Z i = 0 para os demais trimestres (i = 1, 2, 3 ou 4).
Y = 28Z + 20Z + 12Z + 20Z .
1 2 3 4
b) t = 3,578, significativo ( t 0 = 2,776).

c) F = 17,07, significativo ( F0 = 16,69)
5.20. a) Y = 26 + 4 X 1 + 3 X 2 .
b) Y = 50 + 2 X + 5 X
1 2
c) F = 4,166, no-significativo ( F0 = 4,35)
5.21. a) Y = 30 + 8 X , S.Q.Res. = 36
b) Y = 34 + 12 X , S.Q.Res. = 36
c) t = 0,535, no-significativo (t 0 = 4,604)
d) t = 2,981, no-significativo (t 0 = 4,604)
560
e) F = = 31,11 , significativo ( F0 = 18,0)
18
24
f) H 0 : + 5 = 0 , com t = = 7,303 , significativo (t 0 = 4,604)
10,8
253
6. HETEROCEDASTICIA
Veremos, neste captulo, como obter as estimativas dos parmetros de uma
regresso linear quando a varincia do erro no constante, isto , quando h
heterocedasticia.
6.1. O caso de uma regresso linear simples em que o desvio padro do

erro proporcional a X
Consideremos, inicialmente, o caso de uma regresso linear simples em que a
varincia do erro proporcional ao valor de X 2 . O modelo dessa regresso
Y j = + X j + u j (6.1)
com
E (u 2j ) = 2j = X 2j 2
Admitiremos que so vlidas as demais pressuposies relativas ao modelo de

regresso linear simples, vistas no captulo 2.
O modelo (6.1) pode ser transformado em um modelo de regresso linear simples
com homocedasticia. Para isso, basta dividir cada termo por X j , obtendo
Yj 1 u
= ++ j
Xj Xj Xj
ou
Z j = + V j + j , (6.2)
onde
Yj 1 uj
Zj = , Vj = e j =
Xj Xj Xj
Convm ressaltar que

E (u 2j )
E ( ) =
2
j 2
=2,
X j
ou seja, a varincia do erro no modelo (6.2) constante. O clculo das estimativas dos
parmetros, a determinao de intervalos de confiana e os testes de hipteses relativos ao
254
modelo (6.2) podem, portanto, ser feitos da maneira usual, utilizando as frmulas de
mnimos quadrados ordinrios.
Os mesmos resultados podem ser obtidos atravs do raciocnio exposto a seguir.
Sabemos que, no caso de um modelo homocedstico, as estimativas dos parmetros so os
valores que minimizam
(Y j a bX j ) 2
No caso de um modelo heterocedstico, com E (u 2j ) = 2j , os quadrados dos desvios
devem ser ponderados, sendo que o fator de ponderao deve ser inversamente
proporcional varincia, isto , devemos dar peso maior s observaes de menor
varincia. As estimativas dos parmetros so, ento, os valores que minimizam
1
(Y j a bX j ) 2
2
j
No caso em que 2j = X 2j 2 isso implica minimizar

2
1 Yj 1
2 (Y j a bX j ) 2 = ba
Xj X X j
j
Verificamos, portanto, que o resultado o mesmo que o obtido aplicando o mtodo
dos mnimos quadrados ordinrios (no ponderados) ao modelo (6.2).
6.2. O mtodo dos mnimos quadrados ponderados

y = X + u (6.3)
com E (u) = 0 e
v1 0 K 0

0 v2 K 0
E (uu) = V 2 =
2
M M M

0 0 K vn
Note que V uma matriz diagonal. Vamos admitir que sejam conhecidos os valores
de v j , que mostram como varia o valor da varincia do erro. O fato de serem nulos os
elementos fora da diagonal principal da matriz V significa que vlida a pressuposio de
255
ausncia de covarincia entre os erros das vrias observaes, isto , que E (u j u h ) = 0 para
j h.
Definimos a matriz diagonal
1 0 K 0

0 2 K 0
=
M M M

0 0 K n
onde
1
j = , j = 1, ..., n
vj
Dessa maneira, temos que
= V 1 (6.4)
e
V = 1 1 (6.5)
Pr-multiplicando cada um dos termos de (6.3) por , obtemos o modelo
y = X + u (6.6)
No modelo (6.6) o vetor dos erros = u e uma vez que E (u) = 0 , temos
E ( ) = 0 .
Notando que = e lembrando que E (uu) = V 2 , obtemos
E () = E ( uu ) = V 2
De acordo com (6.5), segue-se que
E ( ) = 1 1 2 = I 2
ou seja, o modelo (6.6) homocedstico. Podemos, ento, aplicar a esse modelo as

frmulas de mnimos quadrados ordinrios, deduzidas no captulo 4. bvio que devemos
tomar o cuidado de substituir, naquelas frmulas, as matrizes y e X pelas matrizes y e
X , respectivamente. Considerando (6.4) obtemos:
b = ( XX) 1 Xy = ( XV 1X) 1 XV 1y (6.7)
S.Q.Res. = yy bXy = yV 1y bXV 1y (6.8)
256
E[(b )(b )] = ( XX) 1 2 = ( XV 1 X) 1 2 (6.9)
Desde que E ( ) = 0 e E () = I 2 , isto , desde que os erros j so variveis
aleatrias independentes com mdia zero e varincia constante, as estimativas dos

parmetros obtidas atravs de (6.7) so estimativas lineares no-tendenciosas de varincia
mnima, de acordo com o que foi visto no captulo 4.
6.3. Consequncias do uso de estimadores de mnimos quadrados

ordinrios quando existe heterocedasticia
Vejamos, inicialmente, a perda de eficincia decorrente do uso das frmulas de
mnimos quadrados ordinrios quando h heterocedasticia.
Admitamos que o modelo correto seja (6.3) e que o pesquisador, erroneamente,
admite que E (uu) = I 2 , calculando
b* = ( XX) 1 Xy (6.10)
b* = ( XX) 1 X( X + u)
ou
b* = + ( XX)1 Xu (6.11)
Aplicando esperana em (6.11) obtemos
E (b* ) = ,
isto , o estimador de mnimos quadrados ordinrios no-tendencioso. Entretanto, b* no

um estimador eficiente, j que o estimador de varincia mnima o dado por (6.7).
Determinemos a matriz de varincias e covarincias de b* . De (6.11) obtemos
b* = ( XX) 1 Xu
Ento
E[(b * )(b * )] = E[( XX) 1 Xuu X( XX) 1 ]
Como E (uu ) = V 2 , segue-se que
E[(b * )(b * )] = ( XX) 1 XVX( XX) 1 2 (6.12)
257
Por simplicidade, consideremos o modelo
Y j = X j + u j , j = 1, ..., n (6.13)
com
E (u j ) = 0 , E (u 2j ) = v j 2 e E (u j u h ) = 0 para h j.

v j 1 X j Y j
b= (6.14)
v j 1 X 2j
O estimador de mnimos quadrados ordinrios

X jY j
b* = (6.15)
X 2j
De acordo com (6.9) e (6.12) temos, respectivamente,

2
V (b) = (6.16)
v j 1 X 2j
e
2 v j X 2j
V (b* ) = (6.17)
( X 2j ) 2
A eficincia relativa de b* , em comparao com b,
V (b) ( X 2j ) 2
= =
V (b* ) v j 1 X 2j v j X 2j
Para exemplificar, admitamos que a varincia de Y, dado X, seja direta ou

inversamente proporcional ao quadrado do valor de X, isto , v j = X 2j ou v j = X j 2 . Em
ambos os casos temos

( X 2j ) 2
=
n X 4j
Se X j = j 1 , com j = 1, ..., 11, temos = 0,532 , isto , a eficincia relativa do
estimador de mnimos quadrados ordinrios, em comparao com o estimador de mnimos

quadrados ponderados, de apenas 53,2%.
258
Outros exemplos, considerando o modelo Y j = + X j + u j , podem ser
encontrados em Johnston (1971, p. 225-229).

claro que o pesquisador que estivesse, inadvertidamente, utilizando as expresses
de mnimos quadrados ordinrios consideraria ( XX) 1 2 , e no (6.12), como a matriz de
varincias e covarincias de b * , e, para estimar 2 , utilizaria

1
s*2 = (y y b * Xy ) =
n p
1
= (y [I X( XX) 1 X]y , (6.18)
n p
em lugar do estimador correto que, de acordo com (6.8),
1
s2 = (y V 1 y b XV 1 y )
n p
Lembrando (6.7), obtemos
1
s2 = y [V 1 V 1 X( XV 1 X) 1 XV 1 ]y (6.19)
n p
Substituindo (6.3) em (6.18) e (6.19), obtemos
1
s*2 = u [I X( X X) 1 X]u (6.20)
n p
e
1
s2 = u [V 1 V 1 X( XV 1 X) 1 XV 1 ]u (6.21)
n p
De (6.20), notando que se trata de uma matriz com um nico elemento, temos
1
s*2 = tr{u [I X( XX) 1 X]u} =
n p
1
= tr{uu [I X( XX) 1 X]}
n p
Como E (uu ) = V 2 segue-se que
2
E ( s*2 ) = tr{V[I X( XX) 1 X]} =
n p
2
= {tr(V ) tr[ XVX( XX) 1 ]} (6.22)
n p
Analogamente, de (6.21) obtemos
259
2
E(s 2 ) = tr{V[V 1 V 1 X( XV 1 X) 1 XV 1 ]} =
n p
2
= {tr(I n ) tr[ XV 1 X( X V 1 X) 1 ]} =
n p
2
= [tr(I n ) tr(I p )] = 2 (6.23)
n p
Esse resultado j era esperado, pois (6.19) o quadrado mdio do resduo relativo
ao modelo (6.6), cujo vetor de erros ( ) tal que E ( ) = I 2 , que , de acordo com o
que vimos na seo 4.5, a condio necessria para demonstrar que o quadrado mdio do
resduo um estimador no-tendencioso da varincia residual.
Por simplicidade, consideremos, novamente, o modelo (6.13). O pesquisador que,
inadvertidamente, no considerasse a existncia de heterocedasticia, calcularia b* , dado
por (6.15), e, de acordo com (4.23), obteria
s2
V* (b* ) = * 2 (6.24)
Xj
onde, de acordo com (6.18),
1 ( X j Y j ) 2
s =
2
Y j
2

n 1
*
X 2j
Considerando (6.22), temos que
2 v j X 2j
E[V* (b* )] = vj (6.25)
(n 1) X 2j X 2j
De acordo com (6.17), o estimador correto da varincia de b*
s 2 v j X 2j
V (b* ) = , (6.26)
( X 2j ) 2
onde, de acordo com (6.19),

1
1 1 2 ( v j X j Y j )
2
s =
2
v j Y j
n 1 v j 1 X 2j
Considerando (6.23), temos que

2 v j X 2j
E[V (b* )] = (6.27)
( X 2j ) 2
260
Comparando (6.27) com (6.17), verificamos que (6.26) um estimador no-
tendencioso da varincia de b* .
De (6.17) e (6.25) obtemos a tendenciosidade ou vis de (6.24) como estimador de
V (b* ) , que
E[V* (b* )] V (b* ) =
2 1 v j X 2j v j X 2j

= vj =
X j n 1
2 2
X j 2
X j
n 2 v j v j X 2j
= (6.28)
(n 1) X 2j n X 2
j
Nesta expresso temos, entre parnteses, a diferena entre a mdia aritmtica e a mdia
ponderada dos v j , com X 2j como fatores de ponderao. Se, por exemplo, os maiores
valores dos v j estiverem associados aos maiores valores absolutos dos X j , a mdia
ponderada maior do que a mdia aritmtica e, portanto, V* (b* ) um estimador
negativamente viesado de V (b* ) . bvio que, neste caso, no so vlidos os intervalos de

confiana ou testes de hipteses feitos com base nos estimadores tendenciosos das
varincias obtidos de ( XX) 1 s*2 .
Entretanto, se no houver associao entre v j e X 2j , as duas mdias dos v j (sem
ponderao e com ponderao por X 2j ) em (6.28) tendem a ser iguais. Neste caso o
pesquisador que usa as frmulas de mnimos quadrados ordinrios, embora no esteja

usando o estimador mais eficiente, no ser sistematicamente induzido a concluses
erradas ao efetuar teste de hipteses.
6.4. Testes para a homocedasticia e obteno de estimativas dos

parmetros quando a matriz V desconhecida
At aqui admitimos que a matriz V, de E (uu ) = V 2 , conhecida.
Entretanto, em problemas prticos, freqentemente desconhecemos se os erros so
homocedsticos ou heterocedsticos. Vejamos ento como podemos, com base nos dados
da amostra, verificar se a varincia dos erros ou no homognea.
261
Vamos admitir, inicialmente, que, na amostra disponvel, temos repeties de
conjuntos de valores das variveis explanatrias, ou seja, dispomos de n h > 1 valores de Y
para os valores X 1h , X 2 h ,..., X kh das variveis explanatrias. Se H o nmero de diferentes
conjuntos de valores de X i existentes (ou nmero de vetores diferentes entre as linhas da
matriz X), os n = n h valores da varivel dependente podem ser indicados por Yhj (j = 1,
..., n h ; h = 1, ..., H).

As estimativas das varincias dentro de cada grupo so dadas por
(Yhj Yh ) 2
s =
2 j
h , (6.29)
gh
1
onde g h = n h 1 e Yh = Yhj
nh
Sejam
g h s h2
U = ( g h ) ln g h ln s h2 (6.30)
gh
e
1 1 1
G = 1+ (6.31)
3( H 1) g h g h
Pode-se demonstrar que, se a varincia de Y homognea, a varivel U / G tem,
aproximadamente, distribuio de qui-quadrado com H 1 graus de liberdade. Ento, o
valor de U / G pode ser utilizado para testar a hiptese H 0 : 12 = 22 = K = H2 , isto , a
hiptese de que a varincia de Y constante.11

Se o teste for no-significativo, justificvel pressupor que h homocedasticia.
Neste caso, razovel aplicar o mtodo de mnimos quadrados ordinrios. Ressaltemos,
entretanto, que um resultado no-significativo no implica, necessariamente, que haja
homocedasticia. O teste de hiptese pode apenas mostrar se razovel manter ou no a
pressuposio de homocedasticia, nunca provando sua veracidade. Em outras palavras, o
fato de o teste para homocedasticia no ser significativo no tira o carter de pressuposio
da afirmao de que os erros so homocedsticos.
11
Ver Hoel (1962, p. 225-227).
262
Se o teste resultar significativo, devemos usar o mtodo de mnimos quadrados
ponderados. Para isso, como a matriz V desconhecida, ela substituda por uma matriz
diagonal V , cujos elementos diferentes de zero so vhj = s h2 , obtidos de (6.29). Quando
utilizamos V em lugar de V, temos b = ( X V

1 X) 1 X V
1 y , que no um estimador
linear no-tendencioso de varincia mnima. Pode-se demonstrar, entretanto, que, em

certas condies,12 esse um estimador consistente e assintoticamente eficiente de .
Consideremos, agora, o caso em que o nmero de valores de Y para um mesmo
conjunto de valores de X i insuficiente para aplicar o procedimento anteriormente
descrito. Ento, para testar a homocedasticia dos erros, pode-se usar o mtodo proposto por
Goldfeld e Quandt (1965), que descrevemos a seguir.
Dado o modelo y = X + u , com E (u) = 0 e E (uu ) = V 2 , onde V uma matriz
diagonal cujos elementos diferentes de zero so v j (j = 1, ..., n), a hiptese da nulidade
H 0 : v j = , onde uma constante, e a hiptese alternativa que v j uma funo
monotonicamente crescente (ou decrescente) de X ij (uma das variveis independentes do
modelo) ou de alguma outra varivel cujos valores, para cada uma das observaes da
amostra, so conhecidos.
So as seguintes as etapas do teste:
a) Ordenamos as observaes de acordo com valores crescentes de X ij
(j = 1, ..., n).
b) Eliminamos m observaes centrais e ajustamos, pelo mtodo de mnimos
quadrados ordinrios, uma equao de regresso para as primeiras ( n m) / 2 observaes
e uma outra equao de regresso para as ltimas ( n m) / 2 observaes. Simulaes
realizadas por Goldfeld e Quandt, considerando o caso em que v j = X ij2 , indicam que o
poder do teste maior quando m igual a cerca de 1/4 de n.

c) Sendo S1 e S 2 as somas de quadrados de resduos das regresses com os
valores relativamente pequenos e relativamente grandes de X ij , respectivamente,
calculamos T1 = S 2 / S1 , se a hiptese alternativa que os v j crescem com X ij e
12
Ver Theil (1971), p. 399.
263
calculamos T2 = S1 / S 2 se a hiptese alternativa que os v j decrescem com X ij . Se H 0
verdadeira, T1 (ou T2 ) tem distribuio de F ( n m 2 p ) / 2 e ( n m 2 p ) / 2 graus de

liberdade, onde p o nmero de parmetros da equao de regresso. Se for verdadeira a
hiptese alternativa de que o valor de v j uma funo monotonicamente crescente (ou
decrescente) de X ij , o valor de T1 (ou T2 ) tende, obviamente, a ser elevado (maior do que
1).
O teste descrito pode ser utilizado para verificar se determinada hiptese a respeito
da forma da heterocedasticia razovel.
Consideremos, por exemplo, que no modelo
Y j = + 1 X 1 j + 2 X 2 j + u j
desejamos verificar se razovel pressupor que E (u 2j ) = X 12j 2 .
Dada essa pressuposio, o modelo

Yj 1 X2j uj
= + 1 + 2 +
X ij X ij X1j X1j
homocedstico, pois E (u j / X 1 j ) 2 = 2 . Portanto, para verificar se a pressuposio de
que E (u 2j ) = X 12j 2 razovel, aplicamos o teste de Goldfeld e Quandt considerando a
regresso de Y j / X 1 j contra 1 / X 1 j e X 2 j / X 1 j .
Um outro teste para verificar a existncia de heterocedasticia foi proposto por

Glejser (1969). Sejam e j os desvios da equao de regresso estimada pelo mtodo de
mnimos quadrados ordinrios. Admitindo que a varincia do erro do modelo uma funo
monotnica do valor da varivel X ij , ajustamos alguns modelos simples de regresso do
mdulo de e j em funo de X ij . Glejser sugere que sejam considerados os modelos
| e j |= 0 + 1 X ij + j ,
onde igual a 1, 1, 1/2 ou 1/2.

Sejam c0 e c1 as estimativas de mnimos quadrados ordinrios de 0 e 1 .
A seguir testamos as hipteses H 0 : 0 = 0 e H 0 : 1 = 0 . Trs possibilidades so
consideradas pelo autor:

a) No se rejeita H 0 : 0 = 0 , c0 > 0 e rejeita-se H 0 : 1 = 0 .
264
razovel, ento, pressupor que o desvio padro de u j proporcional a X ij ,
aplicando-se ento o mtodo de mnimos quadrados ponderados com v j = X ij2 .
b) O valor de c0 + c1 X ij positivo no intervalo relevante de X ij e rejeita-se
H 0 : 0 = 0 e H 0 : 1 = 0 . Neste caso devemos aplicar o mtodo de mnimos quadrados
ponderados substituindo os v j por v j = (c0 + c1 X ij ) 2 .
c) Em qualquer outro caso, admite-se que os erros so homocedsticos e utiliza-se o

mtodo de mnimos quadrados ordinrios.
Tanto o teste de Glejser como o teste de Goldfeld e Quandt exigem que a hiptese
alternativa especifique que a varincia do erro seja uma funo monotnica de uma nica
varivel (que pode ser ou no uma das variveis explanatrias do modelo de regresso que
desejamos estimar). O teste de Breusch-Pagan/Godfrey mais geral, admitindo que a
varincia do erro ( 2j ) seja uma funo de uma combinao linear de K variveis Z 1 j , Z 2 j
, ..., Z Kj , ou seja:
K

2j = 0 + h Z hj ,
h =1
com sendo uma funo qualquer para a qual so definidas as duas primeiras derivadas.
A hiptese de nulidade, que estabelece a homocedasticia dos erros, corresponde a
H 0 : 1 = 2 = ... = K = 0
O procedimento para efetuar esse teste pode ser dividido em 3 etapas.
a) Estimamos o modelo y = X + u por mnimos quadrados ordinrios e obtemos o
vetor dos desvios e = y Xb , com elementos e j ( j = 1,..., n ) . Determinamos a estimativa
de mxima verossimilhana da varincia do erro, dada por

2 = (ee ) / n
e calculamos os valores de
e 2j
gj = para j = 1,..., n
2
b) Fazemos a regresso de g j contra Z 1 j , Z 2 j , ..., Z Kj , incluindo um termo
constante, e calculamos a respectiva soma de quadrados de regresso, que passamos a

indicar por Q.
265
c) Se os erros u j do modelo original tiverem distribuio normal e varincia
constante, Q 2 tem, assintoticamente, distribuio de qui-quadrado com K graus de
liberdade. A hiptese de nulidade (homocedasticia) ser rejeitada se o valor de Q 2 for
igual ou maior do que o valor crtico de K2 , ao nvel de significncia escolhido.

Os testes de Goldfeld e Quandt, de Glejser e de Breusch-Pagan/Godfrey exigem
que tenhamos alguma idia sobre a natureza da heterocedasticia (sua associao com uma
ou mais variveis conhecidas). Isso no necessrio no teste de White (1980), cujo
procedimento descrito a seguir. Sejam e j (com j = 1, ..., n) os desvios da regresso de Y j
contra X 1 j , X 2 j , ..., X kj , estimada pelo mtodo de mnimos quadrados ordinrios.
Incluindo o termo constante, essa regresso inicial tem p = k + 1 coeficientes. Calculamos
os valores de e 2j e fazemos uma regresso auxiliar dessa varivel contra as mesmas
variveis explanatrias ( X 1 j , X 2 j , ..., X kj ), seus quadrados ( X 12j , X 22 j , ..., X kj2 ) e todos os
produtos de duas variveis ( X 1 j X 2 j , ..., X 1 j X kj , ...). Pode-se verificar que em geral essa
regresso auxiliar ter p ( p + 1) / 2 coeficientes. Mas o nmero de coeficientes poder ser

menor, pois necessrio eliminar possveis repeties de variveis. Se, por exemplo, uma
das variveis do modelo original for uma varivel binria, seu quadrado no pode ser
includo na regresso auxiliar. Tambm ser necessrio eliminar duplicaes se a regresso
original j incluir o quadrado de uma varivel (se, por exemplo, X 2 j = X 12j ). Seja L o
nmero de coeficientes remanescentes na regresso auxiliar, incluindo a constante, e seja

R 2 o seu coeficiente de determinao mltipla. Sob a hiptese de homocedasticia e
pressupondo que o modelo original foi corretamente especificado, nR 2 tem distribuio de
qui-quadrado com L 1 graus de liberdade. Um valor de nR 2 significativo (igual ou maior
do que o valor crtico) indica a existncia de heterocedasticia.
Um inconveniente do teste de White que ele no construtivo, no sentido de que
no fornece indicao sobre a natureza da heterocedasticia, para possvel aplicao do
mtodo de mnimos quadrados ponderados.
A generalidade do teste uma vantagem, mas tambm pode fazer com que o teste
de White seja pouco poderoso em comparao com um teste mais especfico. Cabe
266
assinalar, ainda, que um resultado significativo pode ser conseqncia de um erro de
especificao no modelo original.
Antes de encerrar esta seo, vejamos o procedimento a ser seguido se admitirmos
que o desvio padro do erro do modelo proporcional a E (Y j ) , isto ,
E (u 2j ) = [ E (Y j )]2 2 . Uma vez que o valor de E (Y j ) desconhecido, no possvel aplicar
diretamente as frmulas de mnimos quadrados ponderados. Ento obtemos, inicialmente,

os valores de Y estimados atravs do mtodo de mnimos quadrados ordinrios, que
passamos a indicar por Y* j (j = 1, ..., n). Em seguida aplicamos as frmulas de mnimos
quadrados ponderados, substituindo v j por v j = Y*2j . Esse procedimento sugerido por
Theil (1971), que mostra que os estimadores obtidos so consistentes.
6.5. O estimador de White para varincias quando h heterocedasticia

Nesta sesso veremos como pode ser obtida uma estimativa consistente da matriz
de varincias e covarincias de b * (o estimador de mnimos quadrados ordinrios de )
quando a matriz V desconhecida.
De acordo com (6.12), na presena de heterocedasticia a matriz de varincias e
covarincias das estimativas de mnimos quadrados ordinrios dos parmetros
V (b * ) = ( XX) 1 XVX( XX) 1 2 (6.32)
ou
V (b * ) = n( XX) 1 Q( XX) 1 , (6.33)
com
1
Q= X VX 2 (6.34)
n
Como V uma matriz diagonal, se indicarmos as colunas de X por x j (e as linhas
de X por x j ), temos
1 n
Q=
n j =1
x j xj v j 2
ou
1 n
Q=
n j =1
x j x j 2j (6.35)
267
com 2j = v j 2 = E (u 2j )
Sejam e j os desvios da regresso de y contra X, estimada por mnimos quadrados
ordinrios. Se, em (6.35), substituirmos 2j por e 2j , obtemos
1 n
Qe = x j xj e 2j
n j =1
(6.36)
White (1980) demonstrou que plimQ e = plimQ . Ento, substituindo Q por Q e em

(6.33) obtemos o estimador consistente para heterocedasticia (heterocedasticity-consistent
estimator) ou estimador de White para V (b * ) :
n
V (b * ) = ( X X) 1 x j xj e 2j ( XX) 1 (6.37)
j =1
Cabe ressaltar que testes t ou F baseados nessas estimativas de varincias so

estritamente vlidos apenas assintoticamente.
Conforme explica Greene (2000, p. 507), estudos baseados em simulao de dados
mostram que o estimador de White tende a subestimar a varincia correta, sendo
aconselhvel multiplicar o resultado de (6.37) por um fator n /( n p ) ou, tendo em vista
que V (e j ) = (1 h j ) 2 (ver exerccio 4.27), substituir, na expresso (6.37), e 2j por
e 2j /(1 h j ) , sendo h j os elementos da diagonal principal de H = X( XX) 1 X . Essas
correes foram propostas por Davidson e Mackinnon (1993).
Exerccios
Y j = + X j + u j ,
com E (u j ) = 0 , E (u 2j ) = X 2j 2 e E (u j u h ) = 0 para h j.
So dados os valores de X j e Y j observados em uma amostra aleatria com 5
observaes:
268
Xj Yj
1 13
2 10
5 20
5 15
10 50
a) Obtenha as estimativas lineares no-tendenciosas de varincia mnima de e .

b) Teste, ao nvel de significncia de 10%, a hiptese H 0 : = 1 contra H A : > 1 .
6.2. Estime os parmetros do modelo
Y j = + X j + u j
com base nos seguintes dados

X Y
3 6,5
0 2,5
+3 0,5
0 ,5 0 0

Sabe-se que E (uu ) = 0 0 ,25 0 2 ,

0 0 0 ,5
onde u representa o vetor dos erros.

Teste, ao nvel de significncia de 10%, a hiptese H 0 : = 0 .
6.3. Estime ao parmetros do modelo
Yi = + X i + u i
com base nos seguintes dados
X Y
0 4
2 8
4 3
6 6
8 1
269
1 0 0 0 0

0 1 0 0 0

Sabe-se que E (uu ) = 0 0 0,5 0 0 2 ,

0 0 0 1 0

0 0 0 0 0,5
onde u representa o vetor dos erros.

Teste, ao nvel de significncia de 10%, a hiptese H 0 : = 0 .
6.4. Consideremos o modelo
Yi = X i + u i
com, E (u i2 ) = X i 2 , E (u i u j ) = 0 para i j
Deduza, de acordo com o mtodo de mnimos quadrados, a frmula que d a

estimativa linear no-tendenciosa de varincia mnima de .
6.5. Considere a situao descrita no exerccio 2.26, admitindo que a varincia de Y | X

inversamente proporcional a X (Isso porque as empresas maiores, fazendo melhor
controle dos custos, forneceram estimativas do custo mdio mais precisas).
Desenvolva, para esse caso, as frmulas que do as estimativas dos parmetros da
regresso de Y em relao X.
6.6. dada uma amostra com n observaes das variveis X i e Yi . Considere o seguinte
modelo:
Yi = + u i (i = 1, ..., n)
onde u i N (0, 2 X i ) , E (u i u j ) = 0 para i j e os valores de X i so fixos (no
aleatrios). Determine a estimativa linear, no-tendenciosa e de varincia mnima

para , e sua varincia.
6.7. Admite-se que as variveis X e Y esto relacionadas de acordo com o modelo

Y j = X j + u j ,
270
onde os u j so erros aleatrios independentes, com mdia zero e varincia W j 2 .
Note que h heterocedasticia e que o modelo no tem termo constante. dada uma
amostra de 3 valores de X j , W j e Y j :
Xj Wj Yj
2 1 2
6 0,5 16
8 0,25 25
a) Obtenha a estimativa linear no-tendenciosa de varincia mnima para .

b) Teste, ao nvel de significncia de 1%, a hiptese de que = 0.
Yi = X i + u i (i = 1, ..., n)
onde os valores de X i so fixados (no so aleatrios), E (u i ) = 0 , E (u i u j ) = 0 para
i j e, sendo uma constante, E (u i2 ) = [ E (Yi )] 2 .
Obtenha o estimador de de acordo com o mtodo de mnimos quadrados

ponderados para a seguinte amostra:
Xi Yi
1 2
2 6
3 6
4 12
5 10
6.9. Temos uma amostra de 100 famlias de mesmo tamanho. Essas famlias foram
classificadas em quatro estratos de renda familiar, como mostra a tabela a seguir:
Nmero de famlias ( f i ) , renda familiar mdia (Wi ) e valor mdio do logaritmo
neperiano do consumo (ln C i ) de determinado produto em quatro estratos de renda

familiar
271
Estrato fi Wi ln Ci
1 40 1 0,9
2 30 2 2,3
3 20 5 2,6
4 10 10 2,3
Na ltima coluna dessa tabela est o valor do logaritmo neperiano do consumo de
determinado produto, por famlia, para cada estrato.
Admite-se que o consumo desse produto varia com a renda familiar de acordo com o
modelo

ln C i = + + ui ,
Wi
onde u i um erro aleatrio com valor esperado igual a zero, varincia inversamente
proporcional ao nmero de famlias do estrato e ausncia de covarincia entre erros
de diferentes observaes.
a) Qual a renda mdia das 100 famlias?
b) Obtenha estimativas apropriadas de e , levando em considerao o nmero de
famlias de cada estrato.
c) Qual a estimativa da elasticidade-renda do consumo desse produto quando
W = 2? E quando W = 5?
d) Teste, ao nvel de significncia de 5%, a hiptese de que igual a zero.
6.10. Admite-se que Y uma funo de X com as seguintes caractersticas:

a) E(Y) = 0 quando X = 0;
b) E(Y) cresce linearmente com X para 0 X 5 ;
c) Quando X = 5 h uma reduo da declividade, havendo um vrtice na relao
poligonal entre E(Y) e X;
d) Para 5 < X < 10 a relao entre E(Y) e X volta a ser linear, embora com
declividade menor do que no primeiro intervalo;
e) A varincia do erro u = Y E (Y ) 2 quando 0 X 5 e 2 2 quando
5 < X < 10 ; admite-se que os erros u i tm mdia zero, no so correlacionados

entre si e tm distribuio normal.
272
X Y
3 10
4 10
6 19
7 17
8 17
dada a seguinte amostra de valores de X e Y:
a) Estabelea um modelo de regresso linear para

analisar como Y varia em funo de X e determine
as estimativas lineares no-tendenciosas de
varincia mnima dos seus dois parmetros.
b) Obtenha a estimativa de 2 .
c) Teste, ao nvel de significncia de 10%, a hiptese de que no h reduo da
declividade (teste unilateral).
Respostas
6.1. a) a = 10 e b = 2
b) t = 0,777, no-significativo (t 0 = 1,638)
6.2. Y = 3 X
t= 4,243, no-significativo ( t 0 = 6,314)
6.3. Y = 6 0,5 X
t = 1,245, no-significativo ( t 0 = 2,353)
Yi Y
6.4. b= =
Xi X
1
X iYi n Yi
Xi
6.5. a=
1
Xi n2
Xi
273
X i Yi n X i Yi
b=
1
Xi n2
Xi
Yi

Xi 2
6.6. a= , V (a) =
1 1

Xi Xi
6.7. a) b = 3
b) t = 14,61, significativo ( t 0 = 9,925)
1 Yi
6.8. b= = 2,4
n Xi
6.9. a) 3
b) a = 3 e b = 2
c) 1 e 0,4
d) t = 4,209, no-significativo ( t 0 = 4,303).
6.10. a) E (Y ) = X + ( X 5) Z , com Z = 0 para X 5 e Z = 1 para X > 5. Estimativas

dos parmetros: b= 3 e c = 2
b) s 2 = 3,33
c) t = 1,601, no-significativo (Regio de rejeio: t 1,638).
274
7. MNIMOS QUADRADOS GENERALIZADOS E AUTOCORRELAO NOS
RESDUOS
7.1. Mnimos quadrados generalizados

No captulo anterior estudamos o procedimento a ser usado quando h
heterocedasticia, mas admitimos que as covarincias entre erros de diferentes observaes
eram todas iguais a zero, fazendo com que a matriz de varincias e covarincias do vetor
de erros u fosse uma matriz diagonal. Neste captulo vamos analisar o caso mais geral, em
que se admite que haja covarincias positivas ou negativas entre erros de diferentes
observaes.
Para isso, consideremos o modelo
y = X + u (7.1)
com E (u) = 0 e E (uu ) = V 2 ,
onde V uma matriz n n, simtrica e definida positiva. Ento V 1 tambm simtrica e

definida positiva e existe uma matriz tal que
= V 1 (7.2)
Pr-multiplicando (7.1) por , obtemos
y = X + u (7.3)
Para o modelo de regresso (7.3), de y contra X , com = u , temos
E ( ) = 0
E ( ) = E ( u u ) =
= V 2 =
= ( ) 1 2 =
= 1 ( ) 1 2 = I 2
Podemos, portanto, aplicar ao modelo (7.3), de regresso de y contra X , as

expresses conhecidas, obtendo
275
b = ( X X) 1 X y = ( XV 1 X) 1 XV 1y , (7.4)
que o estimador linear no-tendencioso de varincia mnima de .
A matriz de varincias e covarincias de b
( X X) 1 2 = ( XV 1 X) 1 2 (7.5)
A estimativa no-tendenciosa de 2
y V 1 y bXV 1 y
s2 = (7.6)
n p
De maneira geral, as expresses relativas ao modelo bsico de regresso mltipla

so facilmente generalizadas, bastando substituir X por X e y por y , e lembrar que
= V 1 .
Entretanto, no caso de os erros serem correlacionados, isto , de V ser no-

diagonal, as expresses relativas predio (estimao de novos valores) so afetadas de
maneira mais complicada, j que possvel, ento, que o erro da nova observao esteja
correlacionado com os erros das observaes da amostra.
Admitamos que seja calculado, incorretamente, o estimador de mnimos quadrados

ordinrios
b * = ( XX) 1 Xy
Considerando (7.1), obtemos
b * = ( XX) 1 X( X + u) =
= + ( XX) 1 Xu (7.7)
Ento E (b * ) = , isto , o estimador de mnimos quadrados ordinrios no-

tendencioso.
Com V I , entretanto, b * = ( XX) 1 Xy um estimador ineficiente, j que o

estimador linear no-tendencioso de varincia mnima dado por (7.4).
276
De (7.7) obtemos
b * = ( XX) 1 Xu
Segue-se que
E[(b * )(b * )] = E[( XX) 1 Xuu X( XX) 1 ] =
= ( XX) 1 XVX( XX) 1 2 (7.8)
Varincias e covarincias obtidas a partir da expresso ( XX) 1 2 estariam,

portanto, erradas se V I .
Quem estivesse, erroneamente, aplicando mnimos quadrados ordinrios utilizaria,

como estimativa da varincia residual, o valor dado por
y y b * X y
s*2 = (7.9)
n p
Sabemos que y y b* Xy = u Mu , com M = I X( X X) 1 X
Ento
E (y y b* Xy ) = E (uMu) = E[ tr (uMu)] =
= E[ tr (Muu )] = 2 tr (MV ) =
= 2 {tr(V ) tr[ X( X X) 1 X V ]} =
= 2 {tr(V ) tr[ XVX( X X) 1 ]} (7.10)
Uma vez que, com V I , teremos, normalmente, tr(V ) tr[ X VX( X X) 1 ] n p,
a expresso (7.9) dar uma estimativa tendenciosa da varincia 2 .
Note que o mtodo de mnimos quadrados ponderados, estudado no captulo

anterior, um caso particular de mnimos quadrados generalizados, em que a matriz V
diagonal. Alis, o modelo estudado no captulo 4 tambm pode ser encarado como o caso
particular em que V = I.
A matriz simtrica V tem n(n + 1)/2 elementos possivelmente distintos que

precisamos conhecer, para poder aplicar as frmulas (7.4) e (7.6). Em aplicaes prticas
do mtodo de mnimos quadrados generalizados, comumente h restries que tornam
vivel a determinao da matriz V. Na prxima seo vamos examinar uma aplicao de
277
mnimos quadrados generalizados na qual todos os elementos de V so funo de um nico
parmetro.
7.2. Autocorrelao nos resduos

Para ilustrar o problema da autocorrelao, consideremos o modelo
k
y = X + u ou Yt = i X it + u t , (t = 1, ..., n) (7.11)
i=0
com
u t = u t 1 + t (7.12)
Admitimos que 1 1 e que t um rudo branco, isto , uma srie com as

seguintes propriedades:
E ( t ) = 0 ,
E ( t2 ) = 2 ,
E ( t t h ) = 0 se h 0
Para que o modelo (7.11) tenha um termo constante devemos ter X 0t = 1 para
t = 1, ..., n.
Aqui utilizamos a letra t para indicar o ndice associado s diferentes observaes
porque o problema da autocorrelao dos resduos surge, geralmente, quando estamos
trabalhando com sries cronolgicas de dados; ento cada observao corresponde a um
certo perodo de tempo (ano, ms ou semana, geralmente).
A relao (7.12) mostra que estamos admitindo que o erro da observao relativa a
um perodo est correlacionado com o erro da observao anterior. Se > 0 dizemos que
os erros esto positivamente autocorrelacionados e se < 0 dizemos que h autocorrelao
negativa.
Se = 0 teremos, obviamente, o modelo de regresso linear mltipla estudado no
captulo 4, isto , podemos aplicar mnimos quadrados ordinrios.
Consideremos, inicialmente, o caso particular em que = 1. Ento
u t = u t 1 + t
ou
u t u t 1 = t (7.13)
278
De (7.11) podemos obter
k
Yt Yt 1 = i ( X it X i ,t 1 + u t u t 1 (t = 2, ..., n)
i =0

k
Yt Yt 1 = i ( X it X i ,t 1 ) + t (t = 2, ..., n) (7.14)
i =0
Como os erros t tm mdia zero, so no-correlacionados e homocedsticos,

podemos aplicar, para o modelo (7.14), as frmulas de mnimos quadrados ordinrios.
Note que no modelo (7.14) a varivel dependente Yt = Yt Yt 1 , as variveis
explanatrias so X it = X it X i , t 1 (i = 0, ..., k) e o nmero de observaes se reduz a
n 1. Note que, se houver um termo constante no modelo original ( X 0t = 1 para todo t),
ele desaparece na equao (7.14). O modelo (7.14) ter um termo constante somente se
uma das variveis explanatrias do modelo original (7.11) for igual a t.
fcil verificar que, para = 1 , obteramos o modelo
k
Yt + Yt 1 = i ( X it + X i ,t 1 ) + t
i =0
Consideremos, agora, que 1 < < 1 , ou seja, | |< 1 .

Utilizando (7.12) sucessivamente, obtemos
u t = u t 1 + t =
= ( u t 2 + t 1 ) + t =
= 2 u t 2 + t 1 + t =
= 3u t 3 + 2 t 2 + t 1 + t =
=L=
= t + t 1 + 2 t 2 + 3 t 3 + K =

= r t r
t =0
Ento
E (u t ) = 0 , (7.15)
E (u t2 ) = (1 + 2 + 4 + 6 + K) 2 =
2
= = u2 (7.16)
1 2
279
e, com h 0,
E (u t u t h ) =
= E[( t + t 1 + 2 t 2 + K)( t h + t h 1 + 2 t h 2 + K)] =
= h 2 + h + 2 2 + h + 4 2 + K =
2
= h
= h u2 (7.17)
1 2
De (7.15), (7.16) e (7.17) conclumos que E (u) = 0 e E (uu ) = V 2 , com
1 2 K n 1

1 K n 2
1 2
V= 1 K n 3 (7.18)
1 2
M M M M
n 1 n 2 n 3 K 1

Verifica-se que
1 0 K 0 0

1+ 2 K 0 0

1
0 1+ 2 K 0 0
V =
M M M M M

0 0 0 K 1+ 2

0 0 0 K 1
e que V 1 = com
1 2 0 0 K 0 0

1 0 K 0 0

0 1 K 0 0
=
M M M M M

0 0 0 K 1 0

0 0 0 K 1
Sabemos que o mtodo de mnimos quadrados generalizados corresponde a aplicar
mnimos quadrados ordinrios ao modelo transformado
y = X + u (7.19)
280
Essa relao matricial representa um sistema de n equaes. A primeira equao,
para t = 1,
( 1 )Y = ( 1 )X + ( 1 )u
2
1
i =0
k
i
2
i1
2
1 (7.20)
e as n 1 equaes restantes, para t = 2, ..., n, so

k
Yt Yt 1 = i ( X it X i ,t 1 ) + u t u t 1
i =0
Uma vez que, de acordo com (7.12), u t = u t 1 + t , temos
k
Yt Yt 1 = i ( X it X i ,t 1 ) + t (7.21)
i =0
Nos casos em que o valor de desconhecido, o que comumente acontece,

podemos adotar ou o procedimento recomendado por Theil (1971, p. 254) ou o
procedimento recomendado por Johnston (1972, p. 260-265). De acordo com Theil (1971)
ajustamos, inicialmente, uma regresso de Yi contra X it (i = 0, ..., k) pelo mtodo dos
mnimos quadrados ordinrios. A partir dos desvios dessa regresso, indicados por et ,
calculamos a estimativa de :
1 n n
et et 1 et et 1
= n 1 t =2 n = t =2
1 (n 1)(Q.M.Res.)
et2
n p t =1
De posse dessa estimativa, aplicamos o mtodo dos mnimos quadrados

generalizados, usando em lugar de .
Johnston (1972) recomenda o procedimento descrito a seguir.
De (7.21) obtemos
k k
Yt = Yt 1 + i X it i X i ,t 1 + t (t = 2, ..., n)
i =0 i =0
Essa expresso sugere que uma estimativa de seria a estimativa do coeficiente de

regresso de Yt 1 numa regresso de Yt contra Yt 1 , os X it e os X i ,t 1 (i = 1, ..., k), ajustada
pelo mtodo de mnimos quadrados ordinrios.
281
A seguir, a estimativa de , assim obtida, usada para aplicar o mtodo dos
mnimos quadrados generalizados.
Vejamos, a seguir, o que ocorre se, erroneamente, aplicarmos mnimos quadrados
ordinrios ao modelo (7.11).
Uma vez que E (u t ) = 0 , o estimador
b * = ( XX) 1 Xy
no-tendencioso; ele no , entretanto, eficiente.
Para comparar a varincia incorreta, obtida de ( XX) 1 2 , com varincia correta,
dada, de acordo com (7.8), por ( XX) 1 XVX( XX) 1 2 , consideremos o modelo
Yt = X t + u t
com os u t sendo gerados pelo processo auto-regressivo de 1a ordem
u t = u t 1 + t
1
Neste caso ( X X) 1 = e o estimador de mnimos quadrados ordinrios para
X t2
X t Yt
b* =
X t2
A varincia incorreta ficaria
u2
V* (b* ) = ( XX) 1 u2 = n
(7.22)
X t
2
t =1
Lembrando (7.18), verificamos que a varincia correta de b*
V (b* ) = ( X X) 1 X VX( X X) 1 2 =
2 1 n 2 n n

= X + 2 X X t 1 + 2 2
X t X t 2 + K + 2 n 1 X n X 1
1 n 2 t =1
t t

2 2
t =2 t =3
Xt
t =1
n n

2 X t X t 1 X t X t 2 X X
= n u
1 + 2 t = 2 n + 2 2 t =3 n + K + 2 n 1 n n 1 (7.23)
X t2 X t2 X t2 X t2
t =1 t =1 t =1 t =1
Se positivo e se, como comum, os valores de X t so positivamente
autocorrelacionados, o valor da expresso entre parnteses em (7.23) ser maior do que 1.
282
A comparao de (7.22) e (7.23) mostra que, neste caso, a expresso ( XX) 1 2 leva a
uma subestimativa da varincia de b* (o estimador de mnimos quadrados ordinrios).

E ( y y b * X y ) = 2 {tr(V ) tr[ X VX( X X) 1 ]} =
n

2 X t X t 1 X X
= n 1 + 2 t =2
+ K + 2 n 1 n 1
=
1 2 n
Xt
n
2
X t
2
t =1 t =1
n

X t X t 1
= u2 n 1 + 2 t =2 n + K (7.24)
X t2
t =1
O pesquisador que estivesse, erroneamente, aplicando mnimos quadrados
ordinrios estimaria u2 por meio de
y y b * Xy
s*2 = (7.25)
n 1
Se >0 e se os valores X t so positivamente autocorrelacionados, a expresso
entre parnteses em (7.24) maior do que 1. Neste caso, (7.25) subestima u2 .
Ao estimar a varincia de b* atravs de ( XX) 1 s*2 , com s*2 = (y y b * Xy ) / (n 1)

, o pesquisador estaria, portanto, cometendo erro de subestimao por duas razes:
primeiro, porque ( XX) 1 u2 subestima as varincias verdadeiras e, segundo, porque (7.25)
tende a subestimar u2 .
7.3. O teste de Durbin-Watson

Para verificar a existncia de autocorrelao nos resduos da regresso utilizamos,
freqentemente, o teste de Durbin-Watson, baseado no valor
n
(et et 1 ) 2
d= t =2
n
(7.26)
e 2
t
t =1
283
onde os et so os desvios da regresso ajustada pelo mtodo de mnimos quadrados
ordinrios.
De (7.26) obtemos
n n n
et2 et21 et et 1
d= t =2
n
+ t =n2 2 t =2n
et2 et2 et2
t =1 t =1 t =1
Para n bastante grande temos d aproximadamente igual a 1 + 1 2r = 2(1 r), onde

r o coeficiente de correlao entre et e et 1 . Ento, o valor de d varia entre zero (se r = 1)
e quatro (se r = 1). Um valor de d perto de zero indica a existncia de autocorrelao
positiva nos erros e um valor de d prximo de 4 indica que os erros esto negativamente
autocorrelacionados.
A distribuio de d depende do tamanho (n) da amostra, do nmero (p) de
parmetros estimados e tambm da matriz X. Para tornar mais simples a maneira de efetuar
o teste, foram tabelados, para diferentes valores de n e de p, aos nveis de significncia de
1% e 5% (unilaterais), valores crticos d L e d U que permitem tomar uma deciso
independentemente da matriz X.
Para testar H 0 : = 0 contra H A : > 0 , o valor de d comparado com d L e d U .
Se d < d L , o resultado significativo, rejeitando-se H 0 em favor de H A . Se d > d U , o
resultado no-significativo, isto , no se rejeita H 0 . Se d L < d < d U , o resultado

inconclusivo.
Para testar H 0 : = 0 contra H A : < 0 , o valor de comparado com 4 d L e
4 d U . O resultado significativo se d > 4 d L , e no significativo se d > 4 d U .
Se 4 d U < d < 4 d L , o resultado inconclusivo. Obviamente, o resultado ser o mesmo
se compararmos 4 d com d L e d U .
Atualmente j existem programas de computador que fornecem a probabilidade
caudal associada ao valor calculado do teste de Durbin-Watson. Neste caso basta comparar
a probabilidade caudal com o nvel de significncia adotado para decidir se o resultado
ou no significativo, evitando-se o problema do resultado inconclusivo.
A validade do teste depende de os erros terem distribuio normal com mdia zero
e varincia constante e das variveis explanatrias no serem aleatrias. Devemos ressaltar
284
que no se deve aplicar o teste de Durbin-Watson quando h variveis explanatrias
aleatrias, como o caso de modelos onde valores de Y defasados aparecem entre as
variveis explanatrias. Nestes casos, outros testes devem ser usados. (Ver Johnston, 1972,
p. 309-313).
Draper e Smith (1966, p. 95-99) recomendam o uso de um teste no-paramtrico,
baseado no agrupamento dos sinais dos desvios, para analisar os resduos da regresso.
Para uma apresentao do teste do agrupamento dos sinais, ou teste da ordenao casual,
ver, tambm, Hoel (1968, p. 220-223) ou Hoffmann (2006, seo 13.4).
interessante notar que podemos obter um teste significativo, indicando a
existncia de autocorrelao positiva nos resduos, quando existe erro na especificao do
modelo. Consideremos, por exemplo, que as variveis Y e X esto relacionadas de acordo
com o modelo Yt = + X t + X t2 + u t , onde os u t so erros independentes com mdia
zero e varincia constante. Consideremos, ainda, que, dada uma amostra de n pares de
valores dessas variveis, foi ajustada uma regresso linear simples, isto , em lugar da
parbola, ajustamos uma reta. Se antes de estimar a reta de regresso, as observaes
tiverem sido ordenados conforme valores crescentes de X t , fcil perceber que os desvios
tendero a apresentar autocorrelao positiva.
Exerccios
7.1. Admite-se que as variveis X t e Yt esto relacionadas de acordo com o modelo
Yt = + X t + u t ,
onde u t = u t 1 + t , sendo t um rudo branco.

dada uma amostra de 4 pares de valores das variveis:
Xt Yt
5 10
7 14
11 30
17 46
a) Estime .
285
7.2. So dados os 4 pares de valores observados em uma amostra aleatria:
Xt Yt
2 19
7 50
12 75
7 40
Admite-se que Y e X esto relacionados de acordo com o modelo
Yt = + X t + u t ,
onde u t = 0,8u t 1 + t , E ( t ) = 0 , E ( t2 ) = 2 e E ( t t +h ) = 0 para h 0.
a) Determine as estimativas lineares no-tendenciosas de varincia mnima de e .

b) Obtenha a estimativa no-tendenciosa de 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese H 0 : = 0 .

7.3. A tabela ao lado mostra os 6 valores consecutivos
de X t e Yt observados ao longo de 6 anos.
4 12
Admite-se que essas variveis esto relacionadas 2 4
de acordo com o modelo 7 28
4 20
Yt = + X t + u t ,
4 16
com u t = u t 1 + t , sendo t um rudo branco. 6 20
a) Obtenha a estimativa linear no-tendenciosa de varincia mnima para .

b) Teste, ao nvel de significncia de 1%, a hiptese H 0 : = 0 contra a hiptese
alternativa H A : > 0 .
7.4. So dados os valores de Yt para 4 semestres consecutivos:
Ano Semestre Yt
1 1o 23
2o 8
2 1o 31
2o 10
Admite-se que essa varivel tem variaes cclicas estacionais e que ela no tem
tendncia (crescimento ou decrscimo monotnico no tempo). Admite-se, tambm,
286
que o termo aleatrio ( u t ) apresenta autocorrelao de 1a ordem com = 0,5 , isto
u t = 0,5u t 1 + t , sendo t um rudo branco.
a) considerando o modelo y = X + u , onde y o vetor-coluna com 4 valores de Yt ,
apresente uma matriz X apropriada para captar a variao estacional de Yt e
obtenha a estimativa linear no-tendenciosa de varincia mnima para o vetor .

b) Verifique se a variao estacional estatisticamente significativa, adotando um
7.5. Dada uma srie temporal de pares de valores X t , Yt , com t = 1, 2, ..., n, considere o
modelo
Yt = + X t + u t ,
onde ut = ut 2 + t ,
0 < < 1 , E ( t ) = 0 , E ( t2 ) = 2 e
E ( t t h ) = 0 para h 0.
Note que o erro de uma observao est correlacionado com o erro da observao
defasada de dois perodos. Isso pode ocorrer se os dados so semestrais e o valor de u t em
um semestre afetado pelo valor do erro no mesmo semestre do ano anterior.
Sendo u um vetor coluna cujos elementos so os u t (t = 1, ..., n), determine:
a) E(u)
b) E (uu ) , em funo de e 2
7.6. Admite-se que as variveis Y, X 1 e X 2 esto relacionadas de acordo com o modelo

Y j = + 1 X 1 j + 2 X 2 j + u j (j = 1, ..., n)
com E(u) = 0 e E (uu ) = V 2 , onde
u1 1 K
1 K
u = u 2 V=
M
e
M M M M
u
n K 1
Os clculos, entretanto, so feitos tendo em vista o modelo com as variveis centradas:
y j = 1 x1 j + 2 x 2 j + u j u ,
287
1
onde u = u j , ou, em notao matricial,
n
y = X + u u
onde
y1 x11 x 21 u
y x x 22 u
= 1 , y = 2 , X = 12 u=
M
e
2
M

M

M

yn x1n x2n u
Demonstre que b = ( XV 1 X) 1 XV 1 y um estimador no-tendencioso e que a
correspondente matriz de varincias e covarincias ( XV 1 X) 1 2 .

Verifique, preliminarmente, que
d f f K f
f d f K f
V 1 = f f d K f

M M M M
f f f K d
1 1
com d = 1 1 + ( n 1) e f =
1 1 1 + ( n 1)
7.7. So dados os valores de Y, X 1 e X 2 em uma amostra com n = 4 observaes.
Yj X1j X2j
4 0 3
5 1 1
4 2 2
11 3 0
Admite-se que essas variveis esteja relacionadas de acordo com o modelo
Y j = + 1 X 1 j + 2 X 2 j + u j (j = 1, ..., 4),
com E(u) = 0 e E (uu ) = V 2 , onde
1 0,5 0,5 0,5

0,5 1 0,5 0,5
V=
0,5 0,5 1 0,5

0,5 0,5 0,5 1
288
Obtenha as estimativas de 1 , de 2 e das respectivas varincias e covarincias, de
acordo com o mtodo de mnimos quadrados generalizados.
Verifique, preliminarmente, que
1,6 0,4 0,4 0,4
0,4 1,6 0,4 0,4
V 1 =
0,4 0,4 1,6 0,4
0,4 0,4 0,4 1,6

Respostas
7.1. a) b = 3
b) t= 6,481, significativo ( t 0 = 4,303 )
7.2. a) a = 3 e b = 6
b) s2 = 25
c) t = 9,650, no-significativo ( t 0 = 4,303 )

7.3. a) b = 4
b) t = 6,481, significativo ( t 0 = 3,747)
1 0 1 0
7.4. a) X = 1 1 e b = 27 ou X = 0 1 e b = 27
1 0 19 1 0 8
1 1 0 1
b) t = 6,504, significativo ( t 0 = 4,303 )
7.5. a) E (u) = 0
2
b) Temos E (u ) =2
,
1 2
t
E (u t u t h ) = 0 se h um nmero mpar e
2 0,5 h
E (u t u t h ) = se h um nmero par positivo.
1 2
Ento
289
1 0 0 2 0 K
0 1 0 0 2
K

2 0 1 0 0 K
E (uu ) = 0 0 1 0 K
1 2 2 0 0 1 0 K
0 2
0 0 1 K

M M M M M M L
7.7. b1 = 2 e b2 = 3
V (b1 ) = 5 / 9 , V (b2 ) = 5 / 9 e cv(b1 , b2 ) = 4 / 9

Observao: neste exerccio temos um caso de equicorelao, isto , E (u i u j ) = ,
com i j, para todo i. Aplica-se, ento, o teorema de McElroy (1967) (Ver Theil,
1971, p. 241-243). De acordo com esse teorema, em caso de equicorrelao, e desde
que o modelo tenha um termo constante, as estimativas dos parmetros obtidas pelo
mtodo de mnimos quadrados generalizados so iguais s estimativas obtidas
aplicando mnimos quadrados ordinrios. Com exceo da varincia da estimativa do
termo constante, sero, tambm, iguais, as estimativas das varincias e covarincias
das estimativas dos parmetros, obtidas pelos dois mtodos. Compare os resultados
obtidos aplicando mnimos quadrados generalizados com os obtidos aplicando
mnimos quadrados ordinrios (Ver resultados do exerccio 4.11).
290
8. VARIVEIS INSTRUMENTAIS E ERROS NAS VARIVEIS
EXPLANATRIAS
8.1. Introduo
Lembremos, inicialmente, as pressuposies do modelo ordinrio de regresso

linear. Temos
k
Y j = + i X ij + u j (j = 1, ..., n)
i =1
ou, em notao matricial,

y = X + u (8.1)
e admitimos que E (u) = 0 , E (uu ) = I 2 e X uma matriz com caracterstica

p = k + 1 < n , cujos elementos so valores fixados.
Lembremos tambm que, se as variveis explanatrias ( X ij ) so aleatrias (com
valores variando de amostra para amostra), o mtodo de mnimos quadrados continua

vlido se
a) a distribuio dos X ij no depende de , dos i (i = 1, ..., k) ou de 2 ;
b) os erros ( u j ) so independentes dos valores de X ij , isto ,
E[( X ij i )u j ] = 0 (i = 1, ..., k),
onde i = E ( X ij )
Nessas condies, aplicando as frmulas de mnimos quadrados ordinrios,

obtemos estimativas no-tendenciosas dos parmetros e, se os u j tm distribuio
normal, os intervalos de confiana, determinados da maneira indicada, e o procedimento

para os testes de hiptese continuam vlidos.
8.2. A consistncia dos estimadores de mnimos quadrados ordinrios
Na seo 1.10 foi analisado o conceito de estimador consistente e foram dadas

algumas propriedades da convergncia em probabilidade. Esse conceito e essas
propriedades so facilmente estendidos para o caso de matrizes. Por definio, o limite
em probabilidade de uma matriz, quando n tende a infinito, igual matriz constituda
291
pelos limites em probabilidade de cada um de seus elementos, desde que as dimenses
da matriz no dependam de n. Assim, por exemplo, se
a a12
plim A =
plim a11 plim a12
A = 11 ,
a 21 a 22 plim a 21 plim a 22
Conhecidos os limites em probabilidade de vrias matrizes, no h dificuldade

em determinar o limite em probabilidade de qualquer expresso envolvendo tais
matrizes. Assim,
plim ( AB ) = ( plim A )( plim B )
e
( plim A 1 ) = ( plim A) 1
Consideremos o modelo (8.1), acrescentando a pressuposio de que
1
lim XX = Q , (8.2)

n n

sendo Q uma matriz no-singular.
Suponhamos, para exemplificar, que dispomos de uma amostra de dados
experimentais, relativos a um ensaio. Suponhamos ainda que amostras maiores so
obtidas repetindo-se, sucessivamente, esse ensaio bsico. Seja X 0 , de dimenses n0 p
, a matriz de valores das variveis independentes para um ensaio. Ento, para m ensaios
temos n = mn 0 ,
X 0
X
X = 0 e XX = mX0 X 0
M

X 0
1 1
Segue-se que XX = X0 X 0 . Conclumos ento que
n n0
1 1
lim XX = X0 X0 = Q

n n
n0
isto , a pressuposio (8.2) vlida neste caso.
Passemos demonstrao de que os estimadores de mnimos quadrados

ordinrios so consistentes. De acordo com (4.10), temos
292
1
1 1
b = + ( X X) X u = + X X
1
X u
n n
Considerando a pressuposio (8.2), obtemos
1
plim b = + Q 1 plim X u (8.3)
n
Se X uma matriz cujos elementos so fixados, E (u) = 0 e E (uu ) = I 2 ,

temos
1
E Xu = 0 (8.4)
n
1
e a matriz de varincias e covarincias do vetor X u
n
1 1 2
V Xu = 2 E ( XuuX) = 2 XX
n n n
Ento, lembrando (8.2), obtemos
1 2 1
lim V X u = lim lim XX = 0 (8.5)
n
n n n n n

1
De (8.4) e (8.5) conclumos que X u converge em mdia quadrtica para uma
n
matriz nula e, consequentemente, que
1
plim X u = 0 (8.6)
n
plim b = , (8.7)
isto , b um estimador consistente de
Se as variveis explanatrias forem aleatrias, e admitirmos que
293
1
plim X X = Q ,
n
fcil ver que a relao (8.3) continua vlida, isto ,
1
plim b = + Q 1 plim X u (8.8)
n
Ento b um estimador consistente de se
1
plim X u = 0 (8.9)
n
Se pressupomos que X ij (i = 1, ..., k) so variveis aleatrias independentes de
u j , temos cov( X ij , u j ) = 0 e a condio (8.9) obedecida. Alternativamente, podemos
considerar (8.9) como pressuposio do modelo. Essa pressuposio pode ser expressa
dizendo que as variveis X ij so assintoticamente no-correlacionadas com u j .
8.3. A inconsistncia dos estimadores de mnimos quadrados quando os

erros esto assintoticamente correlacionados com uma ou mais das
variveis explanatrias
Consideremos o modelo y = X + u , com E (u ) = 0 e E (uu ) = I 2 .

Admitamos que as variveis explanatrias so aleatrias e que
1
plim XX = Q
n
Se houver pelo menos uma varivel explanatria assintoticamente

correlacionada com o erro, temos
1
plim X u 0
n
Ento, de acordo com (8.3), temos plim b , isto , o estimador de mnimos

quadrados inconsistente.
294
importante notar que a covarincia assinttica no-nula entre X hj e u j no
torna inconsistente apenas a estimativa de mnimos quadrados de h . Note-se, na
1
expresso (8.3), que se houver um nico elemento no-nulo no vetor plim X u , isso
n
pode tornar inconsistentes todos os elementos de b, devido pr-multiplicao pela
matriz Q 1 .
8.4. O uso de variveis instrumentais para obter estimativas consistentes

Por simplicidade, consideremos o modelo
Y j = X j + u j , (8.10)
pressupondo que E (u j ) = 0 , E (u 2j ) = 2 , E (u j u h ) = 0 se h j,
1 1
lim X 2j = Q e plim X j u j 0 .

n n
n
O estimador de mnimos quadrados de
X jY j
b=
X 2j

1
plim b = Q 1 plim X j u j
n
Se X j e u j apresentam correlao assinttica positiva, b tende a superestimar o
valor de , pois Q > 0 , por tratar-se de uma soma de quadrados. Por outro lado, se X j
e u j apresentam correlao assinttica negativa, b tende a subestimar o valor de .
Admitamos que sejam conhecidos, para as observaes da amostra, os valores de

uma varivel Z j tal que
1
plim Z j X j 0 (8.11)
n
e
1
plim Z j u j = 0 (8.12)
n
295
A condio (8.12) significa que Z j e uj devem ser assintoticamente no-
correlacionados. Uma varivel ( Z j ) com tais propriedades denominada varivel
instrumental.
A seguir demonstraremos que
Z jY j
= ,
ZjX j
denominado estimador de varivel instrumental, consistente.

De (8.10) e (8.13) obtemos
1
Z jY j
=+
n
1
Z jX j
n
Ento
1
plim Z j Y j
plim = + n
1
plim Z j X j
n
Considerando (8.11) e (8.12), segue-se que
plim =
isto , um estimador consistente de .
Generalizando, consideremos o modelo
y = X + u , (8.14)
1
pressupondo que E (u) = 0 , E (uu ) = I 2 e plim X u 0 .
n
Sabemos que nestas condies o estimador b = ( X X) 1 X y inconsistente.
Admitamos que, sendo p o nmero de parmetros em , conhecida uma matriz

Z, de dimenses n p, com as seguintes propriedades:
1
a) plim Z u = 0 (8.15)
n
b) a matriz
296
1
plim Z X = (8.16)
n
existe e no singular.
c) existe a matriz
1
plim Z Z = (8.17)
n
Nestas condies, Z denominada matriz de variveis instrumentais. Se

admitirmos que algumas das variveis explanatrias ( X ij ) so assintoticamente no-
correlacionadas com o erro, tais variveis podem ser utilizadas como variveis
instrumentais, isto , podem constituir colunas da matriz Z. entretanto, ser necessrio
dispor das observaes de uma varivel instrumental adicional para cada varivel
explanatria que admitirmos correlacionada com o erro.
O vetor das estimativas dos parmetros, de acordo com o mtodo das variveis
instrumentais,
= ( Z X) 1 Z y (8.18)
Note que, se todas as variveis explanatrias forem assintoticamente no-

correlacionadas com o erro, a prpria matriz X pode ser usada como matriz de variveis
instrumentais e ento o estimador (8.18) coincide com o estimador de mnimos
quadrados.
A seguir demonstraremos que, obedecidas as condies (8.15) e (8.16), o
estimador (8.18) consistente. De (8.14) e (8.18) obtemos
= + ( Z X) 1 Z u
Ento
1
1 1
plim = + plim Z X plim Z u
n n
De acordo com (8.15) e (8.16) segue-se que plim = , c.q.d.

Pode-se demonstrar que a matriz de varincias e covarincias assintticas de
n 1 1 1 2 . As correspondentes estimativas so dadas por,13

( Z X) 1 ( Z Z)( XZ) 1 s 2 (8.19)
onde
13
Ver Johnston (1972, p. 280).
297
s 2 = ( y X ) ( y X ) /( n p )
Note que (8.19) se transforma em ( XX) 1 s 2 se Z = X.
8.5. Regresso linear simples com as duas variveis sujeitas a erros de

medida
Admitamos que as variveis j e j esto relacionadas de acordo com o
modelo
j = + j + j , (8.20)
1
onde os j so erros aleatrios independentes de mdia zero e plim 2j = 2
n
Admitamos tambm que as observaes disponveis incluem erros de medida

nas duas variveis. Por isso no temos os valores de j e j , mas apenas os valores de
X j = j + vj (8.21)
Yj = j + wj , (8.22)
onde v j e w j so erros aleatrios independentes com mdia zero,
1 1
plim v 2j v2 e plim w 2j = w2 .
n n
De (8.20), (8.21) e (8.22), obtemos
Yj wj = + (X j v j ) + j
ou
Y j = + X j + j v j (8.23)
onde j = j + w j . Se j e w j forem assintoticamente no-correlacionados, temos
298
1
plim 2j = 2 + w2
n
De (8.23), fazendo
u j = j v j (8.24)
obtemos
Y j = + X j + u j (8.25)
Admitimos que as variveis v j e j no so assintoticamente correlacionadas
entre si, nem so assintoticamente correlacionadas com j , isto ,
1
plim v j j = 0 , (8.26)
n
1
plim v j j = 0 , (8.27)
n
1
plim j j = 0 , (8.28)
n
De (8.21) e (8.24) obtemos
1 1 1
X j u j = j j + v j j v j j v 2j
n n n n n
Considerando (8.26), (8.27) e (8.28), segue-se que
1 1
plim X j u j = plim v 2j
n n
1
Como plim v 2j = v2 , obtemos
n
299
1
plim X j u j = v2 (8.29)
n
Esse resultado mostra que se > 0 , X j e u j apresentam correlao assinttica
negativa. De acordo com o que foi visto na seo 8.3, sabemos que o estimador de
mnimos quadrados no consistente.
A seguir determinaremos o limite em probabilidade do estimador de mnimos

quadrados,
x jY j
b= (8.30)
x 2j
x jY j
b=+
x 2j
Ento
1
plim x j Y j
plim b = + n (8.31)
1
plim x 2j
n
Pode-se demonstrar que, de acordo com (8.29),
1
plim x j Y j = v2 (8.32)
n
e que
1
plim x 2j = 2 + v2 , (8.33)
n
1
onde 2 = plim ( ) 2
n
Substituindo (8.32) e (8.33) em (8.31), obtemos
300
v2
plim b = 2
+ v2
ou

plim b = (8.34)
2
1 + v2

Portanto, o estimador de mnimos quadrados ordinrios tende a subestimar o

valor absoluto do parmetro quando h erros de medida na varivel explanatria.
Nas prximas sees examinaremos diferentes mtodos para obter uma

estimativa consistente de quando h erros de medida na varivel explanatria.
8.6. O mtodo da varivel instrumental
Note que a inconsistncia do estimador de mnimos quadrados, quando h erros

de medida na varivel explanatria, decorre da existncia de correlao assinttica entre
X j e u j , como mostra (8.29). Portanto, este um caso especial do problema analisado
na seo 8.3.
De acordo com o que vimos na seo 8.4, o mtodo da varivel insrumental nos
fornece um estimador consistente de , no modelo (8.25). Para isso precisamos dispor
de uma varivel instrumental Z j . Podemos, ento, constituir a matriz
1 Z1
1 Z 2
Z=
M M

1 Zn
Para o modelo (8.25) temos
301
1 X1
1 X 2
X=
M M

1 Xn
De acordo com (8.15) e (8.16), a varivel Z j deve ser tal que:
1
a) plim Z u = 0
n
b) a matriz
1
plim Z X = ,
n
existe e no-singular, o que implica que
1
plim z j x j 0
n
Vimos que, nestas condies, = ( Z X) 1 Z y um estimador consistente. Para

o modelo (8.25) obtemos
zj yj
= e = Y X
zjxj
Entretanto, nem sempre dispomos de uma varivel instrumental, obtida dos

dados observados. Vejamos, ento, uma forma especial de obter uma varivel
instrumental. Admitamos, sem perda de generalidade, que as observaes esto
ordenadas de acordo com os valores de X j , em ordem crescente. Se n for par,
estabelecemos Z j = 1 para as primeiras n/2 observaes e Z j = 1 para as n/2 ltimas
observaes. Se n for mpar, estabelecemos Z j = 1 para j = 1, ..., (n 1)/2, Z j = 0
para j = (n + 1)/2 e Z j = 1 para j = (n + 3)/2, ..., n.
fcil verificar que o estimador de de acordo com (8.18) , neste caso,
Y2 Y1
= (8.35)
X 2 X1
302
onde X 1 e Y1 so as mdias dos valores de X j e Y j , respectivamente, para as primeiras
n/2 ou (n 1)/2 observaes, e X 2 e Y2 so as mdias dos valores de X j e Y j ,
respectivamente, para as ltimas n/2 ou (n 1)/2 observaes.
O estimador (8.35) foi proposto por Wald (1940). Uma vez que esse estimador
obtido a partir das mdias de X e de Y para dois conjuntos de observaes, o mtodo
denominado mtodo do agrupamento das observaes.
Bartlett (1949) mostrou que a eficincia do estimador aumenta se dividirmos as

observaes, ordenadas de acordo com os valores crescentes de X j , em 3 grupos, com
aproximadamente o mesmo nmero de observaes em cada um, e estabelecermos

Z j = 1 para as observaes do 1o grupo, Z j = 0 para as observaes do 2o grupo e
Z j = 1 para as observaes do 3o grupo. Ento
Y3 Y1
=
X 3 X1
onde X 1 e Y1 so as mdias dos valores de X j e Y j , respectivamente, para as
observaes do 1o grupo e X 3 e Y3 so as mdias para as observaes do 3o grupo.
8.7. Outro mtodo
Consideremos, novamente, o modelo de regresso linear simples analisado na

seo 8.5.
O estimador de , de acordo com o mtodo de mnimos quadrados ordinrios,
1
x jY j
b= n (8.36)
1
x 2j
n
Com Y j = + X j + u j , obtemos
1 1 1
x j Y j = x 2j + x j u j
n n n
303
Lembrando (8.32) e (8.33), conclumos que o numerador de (8.36) converge em
probabilidade para
1
plim x j Y j = 2
n
e que o denominador de (8.36) converge em probabilidade para

1
plim x 2 = 2 + v2
n
Segue-se que o estimador
1
x jY j
= n (8.37)
1
x 2j v2
n
converge em probabilidade para .
O mtodo pode ser estendido para o caso de regresses mltiplas, como consta
em Johnston (1972, p. 289-290).
claro que, dada uma amostra de valores de X j e Y j , para que se possa
calcular o valor do estimador consistente (8.37) necessrio conhecer a varincia ( v2 )

do erro de medida da varivel independente.
Esse mtodo foi utilizado por Perez (1973) em um estudo da elasticidade-renda

do consumo de alimentos em Piracicaba, S.P. A varivel independente, nas regresses
ajustadas, era o logaritmo da renda mensal per capita. Perez admitiu que os dados sobre
a renda mensal per capita apresentaram erros de medida e que esse erro era, em 95%
dos casos, menor do que 20% do valor dessa renda. Uma alterao de 20% em um valor
equivale a multiplic-lo ou dividi-lo por 1,2. Como a varivel independente era o
logaritmo da renda, segue-se que seu erro , em 95% dos casos, inferior ao log 1,2, em
mdulo. Lembrando que o intervalo entre 2 e + 2 compreende pouco mais de 95% da
distribuio normal reduzida, temos aproximadamente, que
2 v = log 1,2
304
Donde
2
1
= log 1,2
2
v
2
Exerccios
8.1. Admite-se que h uma relao linear entre os verdadeiros X Y

valores das variveis X e Y, com coeficiente angular . Sabe-se, 11 25
entretanto, que os valores observados das duas variveis tm 15 33
erros de medida. fornecida uma amostra de 5 pares de valores 19 37
apresentados na tabela ao lado. 11 21
a) Obtenha uma estimativa consistente de admitindo que a varincia14do erro
24
de medida em X igual a 0,8.
b) Neste caso o estimador b = x i Yi / x i2 , com xi = X i X , tende a
superestimar ? Quais so, neste caso, as propriedades do estimador b?
8.2. Na tabela ao lado esto os valores de Y e X obtidos de uma

X Y
amostra com 8 observaes.
2 14
a) Determine a equao de regresso de Y contra X de acordo
6 18
com o mtodo de mnimos quadrados ordinrios.
1 12
b) Admitindo que X inclui um erro de medida, determine as
4 18
estimativas dos parmetros da regresso de acordo com o
5 16
mtodo de Wald (1940), dividindo as observaes em dois
2 10
grupos.
5 20
c) Determine as estimativas dos parmetros admitindo que a varincia do erro de
3 12
medida em X igual a 0,5.
d) Admitindo que haja erro de medida em X, quais so as propriedades
estatsticas das estimativas do coeficiente regresso obtidas em (a), (b) e (c)?
Se o estimador no for consistente, diga se ele tende a subestimar ou
superestimar o valor verdadeiro.
305
8.3. dada a seguinte amostra de valores das variveis X, Y e Z.
X Y Z
4 6 1
2 4 5
2 0 1
0 2 3
0 4 1
2 2 3
2 6 1
4 8 5
Sabe-se que as variveis X e Y apresentam erros de medida e admite-se que X e Y

esto relacionados de acordo com o modelo
Y j = + X j + u j
Devido aos erros de medida em X j , o erro u j assintoticamente
correlacionado com X j .
Admite-se, tambm, que a varivel Z j no assintoticamente correlacionada
com u j .
a) Determine a estimativa de de acordo com o mtodo de mnimos quadrados

ordinrios.
b) Se > 0 , qual o sinal da tendenciosidade assinttica do estimador de
mnimos quadrados ordinrios de ?
c) Determine a estimativa de utilizando Z j como varivel instrumental.
Obtenha, tambm, a estimativa do respectivo desvio padro.

d) Determine a estimativa consistente de admitindo que a varincia do erro
de medida de X v2 = 1 .

Y j = X j + u j ,
306
onde os u j so erros aleatrios indepedentes, identicamente distribudos, com
1
mdia zero e E (u 2j ) = plim u 2j = 2 . Admite-se que os X j so fixos e que
n
1
lim X 2j = Q .

n n

a) Demonstre que o limite em probabilidade de
Y j2
=
X jY j

2
+
Q
Respostas
8.1. a) = 2
b) O estimador de mnimos quadrados ordinrios (b) inconsistente, com
tendenciosidade assinttica negativa (tende a subestimar ).
8.2. a) Y = 9,273 + 1,636 X
b) ou c) Y = 8 + 2 X
8.3. a) 5/3
b) negativo
c) 2
d) 2
Observao: O fato dos itens (c) e (d) terem a mesma resposta uma coincidncia,
devida ao carter artificial dos dados desse exerccio. Em geral os vrios mtodos
de estimao daro resultados diferentes.
307
9. EQUAES SIMULTNEAS
9.1. Introduo
Para iniciar a anlise dos problemas economtricos relacionados com sistemas

de equaes simultneas, consideremos um modelo muito simples de determinao da
renda nacional, constitudo pelas duas equaes dadas a seguir:
(9.1)
Ct = + Yt + u t
(9.2)
Yt = Ct + Z t
onde C t a despesa de consumo no t-simo perodo (t = 1, 2, ..., n), Yt a renda, Z t a
despesa de investimento e u t o erro aleatrio,
1
com E (u t ) = 0 , E (u t2 ) = plim u t2 = 2 e E (u t u t +h ) = 0 para h 0.
n
Uma vez que representa a propenso marginal a consumir, devemos ter

0 < < 1.
A varivel Z t exgena, ou seja, uma varivel cujos valores so determinados
por um processo independente do descrito pelo sistema de equaes em anlise.
Pressupomos que as variveis exgenas so no-correlacionadas com os erros do

sistema de equaes simultneas.
No caso do exemplo que estamos considerando, pressupomos, pois, que
E{[ Z t E ( Z t )]u t } = 0
ou
E (Z t ut ) = 0 (9.3)
Neste exemplo C t e Yt so variveis endgenas, isto , so variveis
determinadas conjunta e simultaneamente, da maneira indicada pelo sistema de

equaes pela(s) varivel(eis) exgena(s) e o(s) erro(s).
308
Diz-se que um sistema completo quando o nmero de equaes igual ao
nmero de variveis endgenas, de maneira que o sistema pode ser resolvido para essas
variveis. A soluo chamada forma reduzida do sistema. Uma equao na forma
reduzida mostra como uma varivel endgena varia em funo das variveis exgenas e
dos erros aleatrios. As equaes originais so chamadas equaes estruturais.
No caso do exemplo que estamos considerando, a partir das equaes estruturais

(9.1) e (9.2) obtemos as equaes de forma reduzida:
1
Ct = + Zt + ut (9.4)
1 1 1
1 1
Yt = + Zt + ut (9.5)
1 1 1
Vamos verificar, preliminarmente, que na equao (9.1) o erro u t e a varivel
explanatria Yt esto positivamente correlacionados.
1
E (Yt ) = + Zt
1 1
e que
1
Yt E (Yt ) = ut
1
Ento
cov (Yt , u t ) = E{[Yt E (Yt )]u t } =
u2 2
= E t =
1 1
309
Como 0 < < 1 , temos que cov (Yt , u t ) > 0 , isto , na relao (9.1) o resduo e a
varivel explanatria esto positivamente correlacionados.
O estimador de mnimos quadrados ordinrios de em (9.1)
yt Ct
b= (9.6)
yt2
De acordo com o que foi visto na seo 8.3, a existncia de covarincia entre Yt
e u t faz com que o estimador de mnimos quadrados seja inconsistente. Aplicando a
relao (8.3) a esse caso, verificamos que b tende a superestimar o valor de .
Determinemos o limite em probabilidade de b. Substituindo (9.1) em (9.6),

obtemos
yt ut
b=+
y t2
Ento
1
plim y t u t
plim b = + n (9.7)
1
plim y t2
n
1 1
yt = zt + (u t u ) (9.8)
1 1
Uma vez que u t e Z t so no-correlacionados, temos
1
plim z t u t = 0
n
Ento, de (9.8), obtemos
310
1
2
plim y t u t = (9.9)
n 1
1 Q 2
plim y t2 = + , (9.10)
(1 ) (1 ) 2
2
n
1
onde Q = plim z t2
n
Substituindo (9.9) e (9.10) em (9.7), obtemos
(1 ) 2
plim b = + (9.11)
Q + 2
De acordo com o esperado, a tendenciosidade assinttica positiva, uma vez que

0 < < 1.
9.2. Um exemplo numrico
Consideremos os valores de Z t , C t e Yt da tabela 9.1. Verifica-se que Z = 20 ,
C = 30 e Y = 150 .
TABELA 9.1. Amostra de 6 valores de Z t , C t e Yt
Zt zt = Z t Z Ct ct = C t C Yt y t = Yt Y
16 4 119 11 135 15
14 6 126 4 140 10
18 2 132 2 150 0
20 0 125 5 145 5
24 4 131 1 155 5
28 8 147 17 175 25
Para construir esse exemplo numrico escolhemos, inicialmente, os valores de

Z t apresentados na tabela 9.1. Depois obtivemos 6 valores de u t com mdia zero e de
maneira que a correlao entre Z t e u t fosse igual a zero. Em seguida estabelecemos
que = 40 e = 0,6 e utilizamos as equaes (9.4) e (9.5) para calcular os valores de
311
C t e Yt . Dessa maneira, nesse exemplo artificial, os mtodos consistentes de estimao
iro reproduzir os valores verdadeiros dos parmetros, que so = 40 e = 0,6 .
Da tabela 9.1 obtemos ct yt = 660 e y t2 = 1000 . Ento o estimador de
mnimos quadrados ordinrios para
ct y t 660
= = 0,66
yt 2
1000
que, como espervamos, superestima o valor de .
9.3. O estimador de varivel instrumental
De acordo com o que foi visto na seo 8.4, o mtodo das variveis
instrumentais pode ser usado para obter estimativas consistentes dos parmetros quando
uma varivel explanatria est correlacionada com o erro do modelo.
De acordo com (8.18), utilizando Z t como varivel instrumental para Yt , as
estimativas dos parmetros da equao estrutural (9.1) so dadas por
zt ct
= (9.12)
zt yt
e
= C Y (9.13)
No caso do exemplo numrico apresentado temos z t ct = 204 e z t y t = 340 .
204
Ento = = 0,6 e = 130 0,6 150 = 40 .
340
9.4. Mnimos quadrados indiretos
A equao (9.4), da forma reduzida, pode ser escrita como segue:

C t = A + BZ t + t
com

A= , (9.14)
1

B= (9.15)
1
e
312
1
t = ut
1
Como cov (u t , Z t ) = 0 , temos cov ( t , Z t ) = 0 . Ento o mtodo de mnimos
quadrados ordinrios fornecer estimadores lineares no-tendenciosos de varincia
mnima e consistentes dos parmetros A e B. Tais estimadores so
z t ct
B = (9.16)
z t2
e
A = C B Z (9.17)
De (9.14) e (9.15) obtemos
B
= (9.18)
1+ B
e
= (1 ) A (9.19)
Substituindo, em (9.18) e (9.19), A e B pelas suas estimativas consistentes, dadas
por (9.16) e (9.17), obtemos estimativas consistentes de e . Apesar de A e B serem
estimadores no-tendenciosos de A e B, as estimativas de e , obtidas da maneira
descrita, sero tendenciosas porque a no-tendenciosidade s preservada em
transformaes lineares.
De acordo com (9.16) e (9.18) o estimador de
z t ct
z t2 z t ct
=
z t ct z t2 + z t ct
1+
z t2
Como Yt = C t + Z t , temos z t y t = z t ct + z t2 . Ento o estimador de fica
z t ct
= ,
zt yt
isto , obtemos, atravs de mnimos quadrados indiretos, o mesmo estimador

anteriormente obtido utilizando Z t como varivel instrumental.
De acordo com (9.17) e (9.19) o estimador de , obtido atravs de mnimos

quadrados indiretos,
313
(1 )(C B Z ) = C C (1 ) B Z =

= C C (1 ) Z =
1
= C (C + Z ) =
= C Y ,
ou seja,
= C Y ,
que o estimador anteriormente obtido pelo mtodo da varivel instrumental.
O aluno deve verificar que, se em lugar de utilizarmos a equao (9.4),
utilizarmos a equao (9.5) da foram reduzida, os estimadores de e obtidos atravs
do mtodo de mnimos quadrados indiretos sero os mesmos, isto , sero iguais a
z t ct
=
zt yt
e
= C Y
Apliquemos o mtodo de mnimos quadrados indiretos ao exemplo numrico

apresentado.
Para a equao de regresso, derivada de (9.4),
C t = A + BZ t + t ,
obtemos
z t ct 204
B = = = 1,5 e A = C B Z = 130 1,5 20 = 100
z t2 136
B
= = 0,6
1 + B
= (1 ) A = 0,4 100 = 40
Como exerccio o aluno deve repetir os clculos considerando a equao (9.5),

em lugar da equao (9.4), verificando que as estimativas de e obtidas sero as
mesmas.
314
9.5. Mnimos quadrados em dois estgios
Para estimar os parmetros da equao (9.1) atravs do mtodo de mnimos

quadrados em dois estgios fazemos, inicialmente, a regresso linear simples de Yt (a
varivel endgena que aparece no segundo membro dessa equao) em relao a Z t (a
varivel exgena do sistema). Sejam 1 e 2 as estimativas dos parmetros dessa

regresso. Sabemos que
zt yt
2 =
z t2
1 = Y 2 Z
Podemos ento calcular os valores de
Yt = t + 2 Z t (9.20)
Em (9.1), substituindo Yt por Yt + et , onde et so os desvios da regresso de Yt
contra Z t , obtemos
Ct = + (Yt + et ) + u t
ou
Ct = + Yt + (u t + et ) (9.21)
cov (Yt , u t ) = 2 cov ( Z t , u t ) = 0
Sabemos que Yt no est correlacionado com et (Esta uma propriedade do
mtodo de mnimos quadrados). Conclumos, ento, que, na equao (9.21), Yt no est
315
correlacionado com o erro (u t + et ) . Podemos, portanto, aplicar a essa questo o
mtodo de mnimos quadrados ordinrios, obtendo o seguinte estimador para :
ct y t
y t2
zt yt
Como y t = 2 z t e 2 = ,
z t2
esse estimador fica
ct y t 2 z t ct z t ct z t ct
= 2 = =
y t2
2 z t2
2 z t z t y t
2
Obtemos, pois, o mesmo estimador consistente j obtido pelo mtodo de

mnimos quadrados indiretos e pelo uso de Z t como varivel instrumental:
zt ct
=
zt yt
Vamos aplicar o mtodo de mnimos quadrados em dois estgios ao exemplo

numrico apresentado.
No primeiro estgio, fazemos a regresso de Yt contra Z t .
Temos
z t yt 340
2 = = = 2,5
z t2 136
1 = Y 2,5Z = 150 2,5 20 = 100
Em seguida, calculamos os valores de Yt = 100 + 2,5Z t , que so apresentados na

tabela 9.2.
316
Tabela 9.2. Os valores de Yt obtidos no 1o estgio
Zt Yt yt
16 140 10
14 135 15
18 145 5
20 150 0
24 160 10
28 170 20
Temos Yt = Yt = 900 ,
Yt
= Y = 150
n
e
y t2 = 850
No segundo estgio fazemos a regresso de C t contra Yt , obtendo
ct y t 510
= = = 0,6
y t2 850
e
= C Y = 130 0,6 150 = 40
9.6. Variveis conjuntamente determinadas e variveis predeterminadas
J vimos a distino entre variveis endgenas e variveis exgenas. Se, no

sistema de equaes simultneas, alm das variveis correntes (referentes ao perodo t),
h variveis defasadas (referentes ao perodo t h, com h > 0), podemos distinguir os
seguintes tipos de variveis:
a) variveis endgenas correntes
b) variveis exgenas correntes
c) variveis endgenas defasadas
d) variveis exgenas defasadas
As variveis endgenas correntes so denominadas variveis conjuntamente
determinadas. As outras so chamadas variveis predeterminadas.
317
No caso mais geral, ento, a forma reduzida descreve o comportamento das
variveis conjuntamente determinadas em termos das variveis predeterminadas e dos
erros.
9.7. Notao geral
Consideremos um sistema de equaes simultneas completo, com L equaes e

L variveis endgenas (ou L variveis conjuntamente determinadas, j que no
consideraremos, no que se segue, a possibilidade de existirem variveis endgenas
defasadas).
A j-sima equao estrutural poderia ser representada da seguinte maneira:
L K
hj Yht + kj X kt = jt (j = 1, ..., L e t = 1, ..., n),
h =1 k =1
onde Yht a t-sima observao da h-sima varivel endgena e X kt a t-sima

observao da k-sima varivel predeterminada (k = 1, ..., K, sendo K o nmero de
variveis predeterminadas do sistema de equaes em anlise).
O modelo especificar, normalmente, que parte dos coeficientes hj (h = 1, ..., L)
e kj (k = 1, ..., K) so iguais a zero, indicando as variveis excludas das j-sima
equao.
Em notao matricial temos
Y + XB = E (9.22)
onde Y tem dimenses n L, tem dimenses L L, X tem dimenses n K, B tem

dimenses K L e E tem dimenses n L.
Cada coluna da matriz E constituda de valores dos erros para uma das
equaes do sistema:
E = [1 2 K L ]
Admite-se que
E ( j j ) = I 2j
e que
E ( j h ) = I jh ,
isto , o erro de uma equao em determinado perodo no-correlacionado com os

erros referentes a outros perodos, mas pode ser correlacionado com os erros das outras
equaes no mesmo perodo.
318
De (9.22), que representa as equaes estruturais, obtemos a forma reduzida
Y = XB 1 + E 1 (9.23)
Essa notao mais geral no cmoda para a anlise dos mtodos de estimao
que vamos considerar a seguir.
Em princpio cada uma das equaes estruturais pode ser colocada na forma
y j = Z j j + j (9.24)
onde:
a) y j um vetor-coluna com os n valores da varivel endgena que aparece no
primeiro membro da j-sima equao estrutural;

b) Z j a matriz n N j , onde N j o nmero de variveis no segundo
membro da j-sima equao, incluindo variveis endgenas e exgenas (Se a

equao tem um termo constante, vamos considerar que existe uma varivel
exgena fictcia cujas valores so todos iguais a 1, associada a esse termo);
c) j um vetor com os N j parmetros a serem estimados e
d) j um vetor-coluna com os n valores do erro da j-sima equao.
O estimador de mnimos quadrados ordinrios para j
(Zj Z j ) 1 Zj y j
Entretanto, se Z j inclui variveis conjuntamente determinadas (variveis
endgenas correntes), esse estimador no consistente.
9.8. Variveis instrumentais
Para relembrar a idia do uso de variveis instrumentais na obteno de

estimativas consistentes dos parmetros, consideremos o modelo bsico de regresso
linear mltipla, com uma nica equao,
y = X + u
Premultiplicando por X obtemos
X y = X X + X u
319
1 1
O valor de Xu desconhecido, mas se plim X u = 0 e plim X X
n n
uma matriz no-singular, podemos, para uma amostra suficientemente grande, desprezar
Xu obtendo Xy = X X .
Segue-se que = ( X X) 1 X y um estimador consistente de .
1
Se plim X u 0 , mas dispusermos de uma matriz de variveis instrumentais
n
1 1
W, com n linhas, sendo que plim W u = 0 e plim W X uma matriz no-
n n
singular, obteramos, analogamente, o sistema de equaes
W y = W X ,
que poder ser resolvido para , se existir ( W X) 1 . Obter-se-, dessa maneira, o
estimador consistente = ( WX ) 1 W y .
Vamos aplicar o mtodo das variveis instrumentais para estimar os parmetros
de (9.24).
A matriz X, com todas as K variveis predeterminadas do sistema, uma matriz
de variveis instrumentais apropriada se pudermos admitir que14
1
plim X j = 0 (9.25)
n
De (9.24), considerando X como matriz de variveis instrumentais, obtemos
X y j = X Z j j + X j (9.26)
e
Xy j = XZ j (9.27)
Se N j = K , a matriz XZ j uma matriz quadrada de dimenses K K.
Se, alm disso, XZ j for no-singular, existe ( XZ j ) 1 e de (9.27) obtemos
j = ( X Z j ) 1 Xy j (9.28)
14
Se X incluir variveis endgenas defasadas, s podemos admitir a validade de (9.25) se os erros no
forem autocorrelacionados. Uma exposio didtica do problema de ajuste de equaes simultneas
quando h variveis endgenas defasadas e autocorrelao nos erros pode ser encontrada em Kelejian e
Oates (1978, p. 321-325).
320
9.9. Identificao
A relao (9.27) representa um sistema de K equaes com N j incgnitas (as
estimativas dos N j parmetros, cada um correspondendo a uma das N j variveis que
aparecem no segundo membro da j-sima equao do sistema de equaes simultneas).

Para que exista uma soluo, isto , para que a equao (9.24) seja identificvel,
necessrio que o nmero de equaes em (9.27) seja pelo menos igual ao nmero de
incgnitas, ou seja, devemos ter
K Nj (9.29)
Portanto, se as equaes do modelo esto na forma (9.24), para que a j-sima

equao estrutural seja identificvel, a condio necessria, mas no suficiente, que o
nmero (K) de variveis predeterminadas do sistema de equaes simultneas em
estudo seja pelo menos igual ao nmero ( N j ) de variveis que aparecem no segundo
membro da j-sima equao.

Se representarmos por K j e L j , respectivamente, o nmero de variveis
predeterminadas e o nmero de variveis endgenas que aparecem no segundo membro

da j-sima equao, temos
N j = K j + Lj
Ento, a condio K N j fica
K K j + Lj
ou
K K j Lj (9.30)
Portanto, para que a j-sima equao seja identificvel, necessrio que o

nmero de variveis predeterminadas do sistema que no aparecem nessa equao seja
igual ou maior do que o nmero de variveis endgenas correntes no segundo membro
da equao.
Se K < N j (o que implica K K j < L j ) o sistema (9.27) no tem soluo.
Dizemos, ento, que a j-sima equao estrutural no identificvel, isto , h

subidentificao.
321
Se o sistema de equaes (9.27) for possvel e determinado, isto , se existir
apenas uma soluo para esse sistema, dizemos que a j-sima equao estrutural
exatamente identificvel. Isso ocorre, por exemplo, se N j = K e XZ j for uma matriz
no-singular. Nesse caso, a soluo do sistema dada por (9.28).

Se o nmero de equaes independentes em (9.27) for maior do que o nmero de
incgnitas ( N j ), temos superidentificao.
Note que tanto no caso de identificao exata como no caso de

superidentificao dizemos que a equao identificvel.
Antes de mostrar como podemos obter estimativas dos parmetros em caso de
superidentificao, vamos examinar o conceito de identificao sob outros ngulos.
Para ilustrar o problema de subidentificao, consideremos o sistema (no
identificvel) constitudo pelas equaes de oferta e demanda de um produto:
qt = 0 + 1 pt + u t (demanda)

qt = 0 + 1 pt + t (oferta)
onde qt e p t so, respectivamente, a quantidade transacionada e o preo do produto no

t-simo perodo. Aqui, o fato de utilizarmos letras minsculas no significa que as
variveis sejam centradas.
Neste caso, para qualquer uma das 2 equaes, temos N j =2 (considerando uma
varivel fictcia x 0 = 1 , associada aos parmetros 0 e 0 ). Como K = 1 (s h uma
varivel predeterminada que x 0 = 1 ), temos um caso de subidentificao. Nenhuma
das duas equaes identificvel j que para ambas K < N j . A relao (9.27), isto ,
Xy j = XZ j ,
consiste, tanto no caso da demanda (j = 1) como no caso da oferta (j = 2), de uma nica
equao com 2 incgnitas ( 0 e 1 no caso da demanda e 0 e 1 no caso da oferta).

Podemos mostrar, graficamente, o fato de, nestas condies, as equaes de demanda e
oferta no serem identificveis. Na figura 9.1 representamos a funo de demanda e a
funo de oferta. Os pontos correspondentes aos pares de valores ( p j , q j ) estaro em
redor do ponto de interseco das 2 funes (o ponto de equilbrio). Tais pontos no nos
permitem estimar nenhuma das duas funes.
322
Figura 9.1.
Figura 9.1
Figura 9.1
Consideremos, agora, que a oferta depende, tambm, do preo ( x1t ) de uma

matria-prima, e que este preo uma varivel exgena que no afeta a demanda
qt = 0 + 1 pt + u t (demanda)
(9.31)
qt = 0 + 1 pt + 2 x1t + t (oferta)
Esse sistema tem K = 2 variveis exgenas (a varivel fictcia x0 = 1 e x1 ).
Para a equao de oferta temos N 2 = 3 > K . Portanto, essa equao no

identificvel.
A equao de demanda, entretanto, exatamente identificvel, j que
N1 = 2 = K .
Para ilustrar graficamente o problema, consideremos um sistema de dois eixos
cartesianos ortogonais, onde so lidos os valores de p t e qt . A funo de oferta estar
em diferentes posies, dependendo do valor de x1t . Com isso, os pontos
correspondentes aos pares de valores ( p t , qt ), que esto ao redor dos vrios pontos de
equilbrio, se distribuiro ao longo da funo de demanda, como mostra a figura 9.2.
Tais pontos podero, portanto, ser utilizados para obter uma estimativa da funo de
demanda, isto , essa funo , neste caso, identificvel.
323
Figura 9.2
Consideremos, agora, um outro tipo de anlise para mostrar que no sistema

(9.31) a demanda identificvel, mas a oferta no o . Multiplicando a equao de
demanda por uma constante e somando equao de oferta, obtemos
(1 + )qt = 0 + 0 + ( 1 + 1 ) pt + 2 x1t + t + u t
ou
0 + 0 1 + 1 + u t
qt = + pt + 2 x1t + t (9.32)
1+ 1+ 1+ 1+
Essa equao tem exatamente as mesmas variveis que a equao de oferta. No

podemos, portanto, distinguir as duas equaes sem conhecer os valores dos
parmetros. Com 0 , a equao (9.32) , na realidade, uma mistura das equaes de
oferta e de demanda. Isso mostra que a equao de oferta, nesse modelo, no
identificvel. Por outro lado, a equao de demanda em (9.31) se distingue de (9.32)
pelo fato de no apresentar um termo em x1t . Conclumos, ento, que a equao de
demanda identificvel.
A condio K N j (ou K K j L j ) denominada condio de ordem para
identificao e , apenas, uma condio necessria.

Para mostrar que a condio K N j no suficiente, consideremos o sistema
y1t = 1 y 2t + 2 y 3t + 3 x1t + 1t

y1t = + 2 y3t + 3 x1t + 4 x 2t + 5 x3t + 2t (9.33)
y1t = 1 y 2t + 3 x1t + 4 x 2t + 5 x3t + 3t
324
admitindo que se sabe, de acordo com a teoria que serviu de base para a construo do
modelo, que
4 5
= = (9.34)
4 5
Nesse sistema y1t , y 2t e y 3t so variveis endgenas e x1t , x 2t e x3t so
variveis exgenas. Temos, portanto, K = 3 variveis (exgenas) predeterminadas no
sistema.
Para a primeira equao temos N1 = 3 = K , ou seja, satisfeita a condio de
ordem para identificao dessa equao.
Entretanto, subtraindo da segunda equao do sistema a terceira multiplicada
por e considerando (9.34), obtemos
(1 ) y1t = 1 y 2t + 2 y 3t + ( 3 3 ) x1t + 2t 3t
ou
1 3 3t
y1t = y 2t + 2 y 3t + 3 x1t + 2t
1 1 1 1
Essa equao no se distingue da primeira equao do sistema, uma vez que
ambas tm as mesmas variveis. A primeira equao do sistema no , portanto,
identificvel, apesar de ser obedecida a condio de ordem K N j .
A seguir vamos apresentar, sem demonstrao, a condio necessria e

suficiente para identificao de uma equao de um sistema de equaes simultneas.
Cabe ressaltar que estaremos considerando essencialmente apenas a identificao
baseada em restries de excluso de variveis, isto , baseada no conhecimento prvio
de que os coeficientes de algumas variveis so iguais a zero.
Lembrando a notao usada na expresso (9.22), consideremos a matriz
A = [ B ] (9.35)
Nessa matriz esto todos os coeficientes do sistema, cada linha correspondendo

a uma das L equaes. Cada uma das L + K colunas da matriz A mostra os coeficientes
de determinada varivel (endgena ou exgena) nas L equaes.
Sem perda de generalidade, vamos determinar a condio de identificao da
primeira equao. Para isso verificamos onde h zeros na 1a linha de A e formamos uma
matriz com os elementos da matriz que ficam abaixo desses zeros, representando essa
nova matriz por
A 0 = [ 0 B 0 ] (9.36)
325
Essa matriz ter L 1 linhas e um nmero de colunas igual ao nmero de zeros
na 1a linha de A.
A condio necessria e suficiente para identificao da 1a equao do sistema
(por meio de restries de excluso) que a caracterstica da matriz A 0 seja igual a L
1. Como essa matriz tem L 1 linhas, a condio de identificao que essas L 1
linhas sejam linearmente independentes.
Como a condio (9.29) ou (9.30), denominada condio de ordem para
identificao, uma condio necessria, sendo verificado que ela no obedecida para
determinada equao, podemos concluir que a equao no identificvel, sendo
dispensvel examinar a condio necessria e suficiente baseada na caracterstica da
matriz A 0 = [ 0 B 0 ] . Por outro lado, se a condio de ordem para identificao for
satisfeita, isso no garante que a equao seja efetivamente identificvel, devendo-se
verificar se atendida a condio necessria e suficiente.
Para exemplificar, consideremos a 1a equao do sistema (9.33) J vimos que ela
atende condio de ordem para identificao. Obtemos
5
A0 = 4
4 5
primeira vista essa matriz tem caracterstica 2, sendo atendida a condio suficiente
para identificao da 1a equao. Mas, dada a relao (9.34), conclumos que essa
matriz A 0 tem caracterstica igual a 1 e que a 1a equao do sistema (9.33) no
identificvel.
O leitor pode verificar que para todos os demais exemplos apresentados, quando
a condio de ordem indica que uma equao identificvel, isso confirmado pelo
exame da condio necessria e suficiente.
Vejamos, finalmente, um exemplo em que o exame da condio necessria e
suficiente altera radicalmente o que sugerido pela condio de ordem (Phillips e
Wickens, 1978, p. 283):
Y1t = 12Y2t + 13Y3t + 11 X 1t + 12 X 2t + 1t

Y2t = 21Y1t + 23Y3t + 2t (9.37)
Y3t = 31Y1t + 32Y2t + 3t

O sistema tem K = 2 variveis exgenas ( X 1t e X 2t ). Para a 1a equao temos
N1 = 4 > K , concluindo-se que ela no identificvel. A condio de ordem indica que
326
tanto a 2a como a 3a equao so exatamente identificveis (pois N 2 = N 3 = 2 = K ).
Vejamos a condio necessria e suficiente. Passando todos os termos com parmetros
para o primeiro membro, a matriz com todos os coeficientes fica
1 12 13 11 12
A = [ B] = 21 1 23 0 0
31 32 1 0 0
Para a 2a equao obtemos
12
A 0 = 11
0 0
com caracterstica igual a 1 (menor do que L 1 = 2), concluindo-se que a 2a equao

no identificvel.
Para a 3a equao a matriz A 0 a mesma, concluindo-se que a 3a equao
tambm no identificvel.
9.10. Estimao dos parmetros em caso de superidentificao
Em caso de superidentificao (K > N j ), o sistema (9.27), isto ,
Xy j = XZ j j ,
tem mais equaes do que incgnitas. A matriz XZ j no quadrada e a soluo (9.28)
no se aplica.
Encaremos a relao (9.26), isto ,
X y j = X Z j j + X j ,
como o modelo de uma regresso linear mltipla de X y j contra XZ j . O vetor de
erros desse modelo de regresso linear mltipla X j , que um vetor-coluna com K
elementos. Desde que a matriz X no contenha variveis aleatrias, temos
E ( X j j X) = XX 2j
O estimador de j deve ser obtido, ento, aplicando o mtodo de mnimos
quadrados generalizados. Obtemos
327
j = [Z j X( XX) 1 XZ j ]1 Z j X( XX) 1 Xy j (9.38)
com matriz de varincias e covarincias assintticas
[Z j X( XX) 1 XZ j ] 1 2j (9.39)
Se XZ j for uma matriz quadrada (K = N j ) e no-singular, de (9.38) obtemos
j = ( XZ j ) 1 XX(Z j X) 1 Z j X( XX) 1 Xy j = ( XZ j ) 1 Xy j
Isso mostra que (9.28) pode ser encarado, simplesmente, como um caso
particular de (9.38).
Note que o estimador (9.38) no apresenta todas as propriedades desejveis de

um estimador de mnimos quadrados generalizados, porque Z j (em XZ j ) inclui,
normalmente, variveis conjuntamente determinadas.
Entretanto, pode-se demonstrar que (9.38) um estimador consistente e que
[Z j X( XX) 1 XZ j ] 1 s 2j (9.40)
com
(y j Z j j )(y j Z j j )
s 2j = (9.41)
nNj
fornece estimativas de varincias e convarincias das estimativas dos parmetros

assintoticamente vlidas (Validade aproximada para amostras suficientemente grandes).
O estimador (9.38) um estimador de mnimos quadrados em dois estgios (ou

estimador de Theil-Basmann).
Se a matriz ( XZ j ) for quadrada e no-singular, a expresso (9.40) pode ser
escrita
( XZ j ) 1 XX( XZ j ) 1 s 2j (9.42)
9.11. Outras maneiras de obter o estimador de mnimos quadrados em

dois estgios
As estimativas dos parmetros de (9.24), isto , de
328
y j = Z j j + j ,
tambm podem ser obtidas atravs de um processo em dois estgios.

No primeiro estgio fazemos a regresso de cada uma das variveis em Z j
contra a matriz de variveis predeterminadas X, obtendo
= X( XX) 1 XZ
Z (9.43)
j j
No segundo estgio temos duas variantes:
a) Usar Z j como matriz de variveis instrumentais em y j = Z j j + j , obtendo
Z j y j = Z j Z j *j
e
Z ) 1 Z
*j = (Z y (9.44)
j j j j
b) Substituir Z j por Z j em (9.24) e aplicar mnimos quadrados ordinrios,
obtendo
j = (Z
Z
j
) 1 Z y
j j j (9.45)
Agora, substituindo (9.43) em (9.44) e (9.45), e lembrando (9.38), verifica-se

que
j = *j = j ,
isto , qualquer um dos trs caminhos leva ao estimador de mnimos quadrados em dois
estgios.
Lembrando (9.43), verifica-se facilmente que a matriz de varincias e
covarincias assintticas das estimativas dos parmetros, dada por (9.39), pode ser
escrita
Z ) 1 2
(Z j j j
9.12. Um exemplo numrico
Para ilustrar a aplicao de algumas das frmulas obtidas consideremos,

novamente, o exemplo apresentado nas sees 9.1 e 9.2. Mudando a notao, para
adapt-la notao geral utilizada, o sistema de equaes (9.1) e (9.2) pode ser reescrito
da seguinte maneira:
329
Y1t = X 1t + Y2t + u t

Y2t = Y1t + X 2t
onde X 1t uma varivel fictcia ( X 1t = 1 ), X 2t o valor do investimento, Y1t a
despesa de consumo e Y2t a renda.

Os dados numricos so reproduzidos na tabela 9.3.
TABELA 9.3. Valores de X 1t , X 2t , Y1t e Y2t
X 1t X 2t Y1t Y2t
1 16 119 135
1 14 126 140
1 18 132 150
1 20 125 145
1 24 131 155
1 28 147 175
O sistema tem K = 2 variveis predeterminadas ( X 1t e X 2t ) e duas variveis
endgenas ( Y1t e Y2t ).
Sendo y 1 um vetor-coluna com os valores de Y1t , Z1 a matriz com as variveis (
X 1t e Y2t ) que aparecem no segundo membro da primeira equao e 1 o vetor-coluna

com os parmetros dessa equao, isto ,

1 = ,

a primeira equao fica
y 1 = Z 1 1 + u ,
onde u o vetor dos erros.
Temos
119 1 135
126 1 140

132 1 150
y 1 = e Z1 =
125 1 145
131 1 155

147 1 175
330
A matriz X com as variveis predeterminadas
1 16
1 14

1 18
X=
1 20
1 24

1 28
Obtemos
6 900
XZ1 =
120 18340
780 1 9170 450

Xy 1 = e ( XZ1 ) 1 =
15804 1020 60 3
Neste exemplo temos identificao exata, com matriz XZ1 quadrada e no-
singular.
De acordo com (9.28) obtemos
40
1 = ( XZ 1 ) 1 Xy 1 =
0,6
ou seja, = 40 e = 0,6 .
Temos o seguinte vetor de desvios
2
2

2
y 1 Z1 1 =
2
2

2
Ento, de acordo com (9.41),
24
s12 = =6
4
331
De acordo com (9.42), a matriz das estimativas das varincias e covarincias
assintticas das estimativas dos parmetros ( XZ j ) 1 XX(Z j X) 1 s 2j .
6 120
Como XX =
120 2536
pode-se verificar que a matriz das estimativas das varincias e covarincias assintticas
fica
1 67925 450 2
s1
2550 450 3
ou
1 67925 450
425 450 3
Segue-se que V ( ) = 159,82 , V ( ) = 0,00706 e cov( , ) = 1,0588 ,

lembrando que se trata das varincias e covarincias assintticas.
Os testes t e F no so estritamente vlidos quando h uma ou mais variveis

endgenas no segundo membro da equao estimada. Mas, por falta de alternativa
melhor, e tendo em vista que eles so assintoticamente vlidos, utilizamos valores de t e
F para testar hipteses. No exemplo analisado, para testar H 0 : = 0 , calculamos
0,6 0,6
t= = = 7,14
0,00706 0,0840
Resultados de computador indicam que, na distribuio de t com 4 graus de

liberdade, a probabilidade de o valor absoluto de t ser maior do que 7,24 0,002,
mostrando que o teste significativo ao nvel de 1%.
Verificamos, no caso desse exemplo numrico, que os trs mtodos de estimao

analisados (uso de variveis instrumentais, mnimos quadrados indiretos e mnimos
quadrados em dois estgios) levam ao mesmo resultado.
O uso de variveis instrumentais sempre equivalente ao mtodo de mnimos
quadrados indiretos. Estes dois mtodos, entretanto, s so aplicveis nos casos de
identificao exata, conduzindo, ento, a resultados idnticos aos do mtodo de
mnimos quadrados em dois estgios. Este ltimo mtodo aplicvel, tambm, em
casos de superidentificao.
332
Assinale-se que os mtodos de estimao analisados podem ser aplicados a uma
equao se essa equao for exatamente identificvel, mesmo que outras equaes do
sistema sejam superidentificadas ou no identificveis.
9.13. Um segundo exemplo numrico

Consideremos o sistema
y1t = 1 y 2t + 1 x1t + 1t

y1t = 2 y 2t + 2 x 2t + 2t
onde y1t e y 2 t so variveis endgenas, x1t e x 2t so variveis exgenas, e 1t e 2t

so erros aleatrios com mdia zero e varincia constante, sendo que o erro de um
perodo independente dos erros em outros perodos.
O sistema tem K = 2 variveis predeterminadas ( x1t e x 2t ) e duas variveis
endgenas ( y1t e y 2 t ).
Os valores observados em uma amostra hipottica esto na tabela 9.4.
TABELA 9.4. Amostra de 8 valores para as variveis x1t , x 2t , y1t e y 2 t
x1t x 2t y1t y 2t
3 1 1 2
3 1 2 0
1 1 1 2
1 1 0 0
1 1 0 0
1 1 2 0
3 1 1 2
3 1 1 2
Note que todas as variveis esto centradas.
Temos
x12t = 40 x1t y1t = 10 x1t y 2t = 20
x 22t = 8 x 2t y1t = 6 x 2 t y 2 t = 4
x1t x 2t = 0 y1t y 2t = 0
333
Neste exemplo, as duas equaes so exatamente identificveis ( N j = K = 2 ).
Podemos, ento, obter as estimativas dos parmetros por qualquer um dos trs
mtodos analisados (uso de variveis instrumentais, mnimos quadrados indiretos e
mnimos quadrados em dois estgios).
Deixamos para o aluno verificar, como exerccio, que qualquer um dos trs
mtodos levar s seguintes estimativas:
1 = 1 , 2 = 1 , 1 = 1,5 e 2 = 0,5 .
9.14. Terceiro exemplo
Consideremos o seguinte sistema, constitudo pelas equaes de demanda e de

oferta de um produto agrcola
Y1t = 0 + 1Y2t + 2 X 1t + 3 X 2t + 1t (demanda)

Y1t = 0 + 1Y2t + 2 X 1t + 2t (oferta)
onde Y1t a quantidade transacionada, Y2t o preo, X 1t o tempo (em anos ou meses),
X 2t a renda per capita e X 3t a pluviosidade.
As variveis Y1t e Y2t so endgenas e as variveis X 1t , X 2t e X 3t so
exgenas e independentes dos erros 1t e 2t .

Na tabela 9.5 so dados os valores observados em uma amostra. Trata-se de
dados artificiais criados tendo em vista fazer com que os clculos sejam relativamente
simples, no se pretendendo que os valores apresentados sejam nem mesmo
aproximaes de valores reais das variveis.
TABELA 9.5. Amostra de 8 valores para as variveis Y1t , Y2t , X 1t , X 2t e X 3t
Y1t Y2t X 1t X 2t X 3t
7 0 3 1 2
9 0 3 1 2
10 1 1 1 2
10 3 1 1 2
11 6 1 2 1
11 8 1 2 1
16 5 3 2 3
18 5 3 2 3
334
Obtemos
Y1t = 92 Y2t = 28 X 1t = 0 X 2t = 12 X 3t = 16
Y1 = 11,5 Y2 = 3,5 X1 = 0 X 2 = 1,5 X3 = 2
Y1t2 = 1152 Y22t = 160 X 12t = 40 X 22t = 20 X 32t = 36
y12t = 94 y 22t = 62 x12t = 40 x 22t = 2 x 32t = 4
X 1t Y1t = 56 X 2t Y1t = 148 X 3t Y1t = 196
x1t y1t = 56 x 2t y1t = 10 x3t y1t = 12
X 1t Y2t = 40 X 2t Y2t = 52 X 3t Y2t = 52
x1t y 2t = 40 x 2t y 2t = 10 x 3 t y 2 t = 4
X 1t X 2t = 8 X 2 t X 3t = 4 X 2t X 3t = 24
x1t x 2t = 8 x 2t x3t = 4 x 2t x3t = 0
Considerando que existe uma varivel fictcia X 0 = 1 , associada aos parmetros
0 e 0 , o sistema tem K = 4 variveis predeterminadas.

No caso da equao de demanda temos, incluindo a varivel X 0 = 1 , N1 = 4
variveis no segundo membro da equao. A equao de demanda exatamente
identificvel e as estimativas dos parmetros podem ser obtidas atravs de qualquer um
dos trs mtodos analisados (variveis instrumentais, mnimos quadrados em dois
estgios ou mnimos quadrados indiretos).
No caso da equao de oferta temos, incluindo a varivel X 0 = 1 , N 2 = 3
variveis no segundo membro da equao. Como N 2 < K = 4 , temos um caso de

superidentificao. Os parmetros dessa equao sero estimados pelo mtodo de
mnimos quadrados em dois estgios.
Seja y 1 o vetor-coluna com os n = 8 valores de y1t . Analogamente, sejam y 2 ,
x1 , x 2 e x 3 os vetores-coluna com os valores das variveis centradas y 2 t , x1t , x 2t e x3t

, respectivamente.
Se trabalharmos com todas as variveis centradas ficam, provisoriamente,
eliminados os termos constantes das equaes do sistema.
A matriz de variveis predeterminadas , neste caso
335
X = [x1 x2 x3 ]
Alm de y 1 e X, utilizaremos adiante as matrizes:
a) Z1 = [y 2 x1 x 2 ] , que a matriz com as variveis que aparecem no segundo

membro da primeira equao (a demanda). Uma vez que
todas as variveis so centradas, deixa de existir a varivel
X0.
b) Z 2 = [y 2 x 3 ] , que a matriz com as variveis que aparecem no segundo

membro da segunda equao (a oferta).
1

c) 1 = 2 e 2 = 1 , que so os vetores com as estimativas dos parmetros da
2

3
equao de demanda e da equao de oferta .
Aplicando o mtodo das variveis instrumentais para estimar os parmetros da

primeira equao (a demanda) obtemos, de acordo com (9.27), o sistema de equaes
Xy 1 = X Z 11
ou
x1t y1t = 1 x1t y 2t + 2 x12t + 3 x1t x 2t

x 2t y1t = 1 x 2t y 2t + 2 x1t x 2t + 3 x 2t
2

x3t y1t = 1 x3t y 2t + 2 x1t x3t + 3 x 2t x3t
Considerando os valores numricos dados, o sistema fica

56 = 40 1 + 40 2 + 8 3

10 = 10 1 + 8 2 + 2 3
12 = 4 + 4
1 2
Resolvendo, obtemos 1 = 1 , 2 = 2 e 3 = 2 .
evidente que o mesmo resultado seria obtido se utilizssemos a relao (9.28).
A equao de demanda estimada
y1t = y 2t + 2 x1t + 2 x 2t
ou
Y1t 11,5 = (Y2t 3,5) + 2( X 1t 0) + 2( X 2t 1,5)

Ento
336
Y1t = 12 Y2t + 2 X 1t + 2 X 2t
Verifica-se que 0 = 12 .
Vejamos, a seguir, como as estimativas dos parmetros da equao de demanda
poderiam ser obtidas pelo mtodo de mnimos quadrados em dois estgios.
No primeiro estgio, obtemos a regresso de y 2 t (a varivel endgena que
aparece no segundo membro da equao) contra x1t , x 2t e x3t , que so as variveis
predeterminadas do sistema. Seja o vetor das estimativas dos parmetros dessa

regresso.
Temos
x12t x1t x 2 t x1t x3t 40 8 4

X X = x1t x 2t x 22t x 2 t x3t = 8 2 0
x1t x3t x 2 t x 3t x32t 4 0 4

,
1 4 1 x1t y 2t 40
1
( XX) 1
= 4 18 4 e Xy 2 = x 2t y 2t = 10

4
1 4 2 x3t y 2t 4
A seguir obtemos
1
= ( XX) Xy 2 = 1
1
Ento y 2t = x1t + x 2t 2 x3t
3,5
3,5

1,5

1,5
ou y 2 = X =
3,5

3,5
1,5

1,5
No segundo estgio fazemos a regresso de y1t contra y 2 t , x1t e x 2t , obtendo 1

.
Sendo Z 1 = [y 2 x1 x 2 ] , temos
337
1 = ( Z 1 Z 1 ) 1 Z 1 y 1
Obtemos
y 22t x1t y 2t x 2 t y 2t 58 40 10

Z 1 Z 1 = x1t y 2 t x12t x1t x 2 t = 40 40 8 ,
x 2t y 2t x1t x 2t x 22t 10 8 2

1 0 5 y1t y 2t 42
1 y = x y = 56
(Z 1 Z 1 ) 1
= 0 1 4 e Z 1 1 1t 1t
8
5 4 45 x 2t y1t 10
Ento
1 1
1 = 2 = 2
3 2
A matriz de varincias e covarincias assintticas dessas estimativas

1 0 5
(Z 1 Z 1 ) = 0 4 12
1 1
2
1 1
8
5 4 45
De acordo com (9.41) o estimador de 12
(y 1 Z 1 1 )(y 1 Z1 1 )
s12 =
n N1
Temos n = 8, N1 = 4 e
1
1

1

1
y 1 Z 11 =

1

1
1

1
Ento
8
s12 = =2
4
e a matriz das estimativas das varincias e covarincias assintticas de 1 , 2 e 3
338
1 5
4 0
4

0 1
1
4
5 45
1
4 4
Passemos equao de oferta. Como, para essa equao, temos

superidentificao, dos trs mtodos de estimao apresentados, s o mtodo de
mnimos quadrados em dois estgios aplicvel.
Ento, de acordo com esse mtodo, fazemos, no primeiro estgio, uma regresso
de y 2 t (a varivel endgena que aparece no segundo membro da equao de oferta)
contra x1t , x 2t e x3t , que so as variveis predeterminadas do sistema. Neste exemplo,

este estgio coincide com o primeiro estgio da aplicao do mesmo mtodo equao
de demanda.
No segundo estgio fazemos a regresso de y1t contra y 2 t e x3t , obtendo 2 .
= [y
Sendo Z x 3 ] , temos
2 2
Z ) 1 Z y
2 = ( Z 2 2 2 1
Obtemos
y 22t x3 y 2t 58 4

Z2Z2 =
= ,
x3 y 2t x32t 4 4
1 2 2 y = y1t y 2t = 42

(Z 2 Z 2 ) 1 = e Z
108 2
x3t y1t 12
2 1
29
Ento
1
2 = 1 =
2 4

A equao de oferta estimada

y1t = y 2t + 4 x3t
Ento
Y1t 11,5 = Y2t 3,5 + 4( X 3t 2)

e
Y1t = Y2t + 4 X 3t
339
Verifica-se que 0 = 0
A matriz de varincias e covarincias assintticas de 1 e 2
Z 1 2 2 2
2 2) 2 = 2
(Z 1 2
108 2 29
De acordo com (9.41) o estimador de 22
(y 1 Z 2 2 )(y 1 Z 2 2 )
s 22 =
n N2
Temos n = 8, N 2 = 3 e
1
1

1

1
y1 Z 2 2 =

1

1
1

1
Ento s 22 = 8 / 5 e a matriz das estimativas das varincias e covarincias
assintticas de 1 e 2
4 4
135 135

4 58
135 135
9.15. Uma viso global
Para o modelo bsico y = X + u , com, entre outras pressuposies,

E (u ) = 0
E (uu ) = I 2
E ( X u ) = 0 ,
obtemos b = ( X X) 1 X y , que um estimador linear, no-tendencioso, de varincia

mnima e consistente.
340
Entretanto, freqentemente uma ou mais dessas pressuposies no so
obedecidas. Consideremos 2 casos gerais:
(I) O vetor de erros u tem matriz de varincias e covarincias
E (uu ) = V 2 , com V I
Ento o melhor estimador de o de mnimos quadrados generalizados, dado

por
= ( X V 1 X) 1 X V 1 y ,
com matriz de varincias e covarincias

( XV 1 X) 1 2
O estimador de mnimos quadrados ordinrios , neste caso, no-tendencioso,
mas ineficiente. A expresso usual ( XX) 1 s 2 dar estimativas incorretas, tendendo
freqentemente a subestimar as varincias e covarincias verdadeiras.
Heterocedasticia e autocorrelao nos resduos so casos particulares desse
problema.
(II) elementos de X so aleatrios e correlacionados com elementos de u.
O estimador de mnimos quadrados ordinrios, neste caso, tendencioso.

interessante distinguir dois subcasos:
(II-a) Os valores de X correspondentes t-sima observao ( t-sima linha de

X) so correlacionados com algum valor do erro (u h , h t ) , mas no com o erro da
mesma observao (u t ) .
Exemplo disso um modelo com variveis defasadas
Yt = + X t + Yt 1 + u t ,
onde os u t no so autocorrelacionados. Ento Yt 1 est correlacionado com u t h (h = 1,
2, ...), mas no est correlacionado com u t ou u t + h (h = 1, 2, ...).

Pode-se demonstrar que, neste caso, o estimador de mnimos quadrados
ordinrios consistente, embora seja tendencioso.
(II-b) Os valores de X correspondentes t-sima observao so correlacionados
com u t .
341
Nessa situao o estimador de mnimos quadrados ordinrios inconsistente.
Isto ocorre, por exemplo, quando variveis importantes no so includas no
modelo, quando h erros de observao nas variveis independentes e no caso de
sistemas de equaes simultneas.
Exerccios
9.1. Considere um modelo muito simples de determinao da renda nacional, constitudo por
apenas duas equaes simultneas:
Ct = + Yt + u t

Yt = Ct + Z t
As variveis endgenas so a renda nacional ( Yt ) e a despesa com consumo (
C t ). Os erros u t so variveis aleatrias independentes com mdia zero e
varincia constante. O valor dos investimentos ( Z t ) uma varivel exgena (no
correlacionada com u t ).
dada uma amostra de 4 valores de C t , Yt e Z t :
Ct Yt Zt
14 15 1
12 15 3
20 25 5
38 45 7
Verifica-se que C t = 84 , Yt = 100 e Z t = 16 .
a) Obtenha as estimativas de e por mnimos quadrados ordinrios, ajustando

a regresso linear simples de C t contra Yt , como sugere a equao (1),
isoladamente.
b) Considerando o sistema de equaes simultneas, obtenha estimativas
consistentes de e . Como denominado o mtodo que voc usou?
c) O que voc pode dizer dos estimadores usados no item (a)?
9.2. Na tabela ao lado esto os valores de Y1 , Y2 e X em

X
uma amostra com 4 observaes. Admite-se que
10 22 2
essas variveis esto relacionadas de acordo com o 21 14 5
sistema 28 4 8
17 16 5
342
Y2t = + Y1t + u t

Y1t = + X t + t
As variveis endgenas so Y1 , Y2 . Pressupe-se que os erros u t e t tm mdia
zero e varincia constante, no apresentam autocorrelao e no so
correlacionados com X t . Admite-se, entretanto, que u t pode ter correlao com
t .
a) Analise a identificao de cada equao.
b) Quando a equao for identificvel, obtenha estimativas (apropriadas) dos
seus parmetros.
c) Teste, ao nvel de significncia de 5%, a hiptese de que = 0 , contra a
hiptese alternativa de que > 0 .
9.3. Seja o sistema de equaes

Yt = + X t + u t

X t = + Z t + t
onde u t e t so variveis aleatrias com mdia zero e varincia constante.
Admite-se que u t e t apresentam correlao assinttica negativa, isto ,
1
plim u t t < 0 . Admite-se, tambm que u t e t no so assintoticamente
n
correlacionados com Z t e que o erro de uma observao ( u t ou t )
independente dos erros das demais observaes ( u t + h e t + h ).
dada a seguinte amostra de valores de Yt , X t e Z t (extrada de KONG CHU,

Principles of Econometrics, International Textbook, 1968, p. 110):
Yt Xt Zt
10 5 2
19 8 4
16 6 3
22 7 5
33 10 8
45 12 11
48 13 12
61 15 15
70 20 14
76 24 16
343
Pode-se verificar que
Yt = 400 X t = 120 Z t = 90
Y = 40 X = 12 Z =9
Yt 2 = 21016 X t2 = 1788 Z t2 = 1060
y t2 = 5016 x t2 = 348 z t2 = 250
X t Yt = 6085 X t Z t = 1352 Z t Yt = 4700
xt y t = 1285 xt z t = 272 z t y t = 1100
a) Mostre que o estimador de mnimos quadrados ordinrios, b = xy / x 2 ,

tende a subestimar , isto , mostre que plim b < .
b) Obtenha estimativas dos parmetros , , e e d as qualidades dos
estimadores utilizados.
9.4. Considere o seguinte sistema, constitudo pelas equaes de demanda e de oferta de um

produto, em certo mercado:
Y1t = 1 + 1Y2t + 1 X 1t + 1t (demanda)

Y1t = 2 + 2Y2t + 2 X 2t + 2t (oferta)
As variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do
produto, respectivamente, no perodo t. As variveis exgenas X 1t e X 2t so a

renda per capita e o preo de um subproduto, respectivamente.
Admite-se que 1t ou 2t so erros aleatrios com mdia zero e varincia
constante, e que o erro de um perodo ( 1t ou 2t ) independente dos erros em

outros perodos.
dada a seguinte amostra de valores X 1t , X 2t , Y1t e Y2t :
344
X 1t X 2t Y1t Y2t
1 1 2 1
1 1 1 3
3 3 4 1
3 3 3 3
5 3 3 3
5 3 5 3
7 1 2 5
7 1 4 5
a) satisfeita a condio necessria para que as duas equaes sejam

identificveis?
b) Obtenha estimativas consistentes dos parmetros da equao de demanda e
determine a matriz das estimativas das respectivas varincias e covarincias
assintticas.
c) Idem, para a equao de oferta.
d) Para a equao de demanda, faa os clculos sem centrar e centrando as
variveis e verifique que os resultados so idnticos.
Note que se todas as variveis forem centradas, esse exerccio se confunde com o
segundo exemplo dado no texto (seo 9.13).
9.5. Considere o seguinte sistema de equaes simultneas:

Y1t = + X t + u1t
Y2t = + Y1t + u 2 t
onde X t uma varivel exgena, Y1t e Y2t so variveis endgenas e os erros u1t
e u 2t so rudos brancos, podendo haver correlao entre u1t e u 2t .
Obtenha estimativas consistentes de e com base na seguinte amostra:
Xt Y1t Y2t
10 26 120
10 22 96
2 6 35
10 18 81
345
9.6. Considere o seguinte modelo (extremamente simples) de determinao da renda
nacional (Y1t ) e do consumo (Y2t ) , com duas equaes:
Y2t = + Y1t + ut (1)
Y1t = Y2t + Z t (2)
Admite-se que o investimento ( Z t ) uma varivel exgena, no correlacionada
com o erro ut .
So dados os valores de Z t , Y1t e Y2t em uma amostra com 5 observaes:
Zt Y1t Y2t
10 60 50
12 68 56
10 64 54
11 76 65
12 72 60
a) Estime ajustando a equao (1) por mnimos quadrados ordinrios.

b) Quais so, neste caso, as propriedades desse estimador?
c) Obtenha estimativas consistentes de e de .
d) Determine a estimativa do desvio padro do estimador de utilizado no item
anterior.
9.7. Na tabela ao lado esto os valores de X, Y1 , Y2 em X

uma amostra com 5 observaes. Admite-se que estas 4 16 87
variveis esto relacionadas de acordo com o sistema 2 4 3
5 20 102
Y2t = + Y1t + ut 1 6 24

Y1t = + X t + t
3 9 39
As variveis endgenas so Y1 e Y2 . Pressupe-se que os erros ut e t tem mdia

zero e varincia constante, no apresentam autocorrelao e no so
correlacionados com X t . Admite-se, entretanto, que ut pode ter correlao com
t .
a) Analise a identificao de cada equao.
b) Quando a equao for identificvel, obtenha estimativas consistentes dos seus
parmetros.
c) Se possvel, obtenha uma estimativa do desvio padro da estimativa de .
346
9.8. Considere o seguinte sistema de equaes simultneas, no qual Y1 e Y2 so
variveis endgenas e X1 e X 2 so variveis exgenas:

Y2t = + Y1t + u2t
Y1t = 0 + 1 X 1t + 2 X 2t + u1t
dada a seguinte amostra de valores das 4 variveis:

X 1t X 2t Y1t Y2t
11 1 22 37
9 1 21 37
9 7 45 85
7 4 26 51
5 1 17 29
5 7 41 77
3 7 38 69
Sabe-se que a estimativa da segunda equao Y1t = 7 + X 1t + 4 X 2t
a) Analise a identificao da primeira equao.

b) Obtenha estimativas consistentes de e
c) Teste, ao nvel de significncia de 1%, a hiptese de que = 0.
9.9. Considere o seguinte sistema, constitudo pelas equaes de demanda e de oferta de

um produto, em certo mercado:
Y1t = 0 + 1Y2t + 2 X 1t + 1t (demanda)

Y1t = 0 + 1Y2t + 2 X 2t + 3 X 3t + 2t (oferta)
As variveis endgenas Y1t e Y2t so a quantidade transacionada e o preo do

produto, respectivamente, no perodo t.
As variveis exgenas X 1t , X 2t e X 3t so, respectivamente, a renda per capita, o
montante de subsdios recebidos pelos produtores e o preo da matria-prima.
Admite-se que 1t e 2t so erros aleatrios com mdia zero e varincia
constante, e que os erros de um perodo, embora correlacionados entre si, so no-
correlacionados com os erros relativos a outros perodos.
dada a seguinte amostra de valores X 1t , X 2t , X 3t , Y1t e Y2t :
347
X 1t X 2t X 3t Y1t Y2t
5 130 30 18,5 7,5
6 110 20 20,0 8,0
7 120 26 19,5 7,5
7 120 26 18,5 8,5
8 110 30 19,5 12,5
9 130 24 24,0 10,0
a) A equao de demanda identificvel?

b) A equao de oferta identificvel?
c) Obtenha estimativas consistentes dos parmetros 1 e 2 da equao de
demanda e determine a matriz das estimativas das respectivas varincias e
covarincias assintticas.
d) Idem, para os parmetros 1 , 2 e 3 da equao de oferta.
e) Determine as estimativas da elasticidade-preo da demanda, da elasticidade-
renda da demanda e da elasticidade-preo da oferta para os valores mdios de
Y1t , Y2t e X 1t .
y 1 = y 2 + v

y 2 + X + u
onde
y11 y 21 v1 u1
y y v u
y 1 = 12 , y 2 = 22 , v = 2 , u = 2 ,
M M M M

y1n y 2n v n u n
X 01 X 11 K X k1 0
X X 12 K
X k2
X = 02 e =
1
M M M M

X 0n X 1n K X kn k
Admite-se que:
a) E (vt ) = E (u t ) = E (vt vt + h ) = E (u t u t + h ) = 0 para h 0.
1
b) E (vt2 ) = plim vt2 = v2
n
348
1
c) E (u t2 ) = plim u t2 = u2
n
1
d) E (u t v t ) = plim u t vt = uv2
n
1 1
e) plim X u = plim X v = 0
n n
1
f) plim X X = Q
n
Seja c = (y 1 y 2 ) /(y 2 y 2 ) o estimador de mnimos quadrados ordinrios de .
Mostre que
1 1
Xv + u v
c=+ n n
1 2 1
XX + Xu + u u
n n n
e que
uv2
plim c = +
Q + u2
Note que o estimador de mnimos quadrados ordinrios consistente se uv2 = 0 ;
neste caso, o modelo dado constituiria um sistema recursivo (Ver Johnston, 1972,
p. 377-380 ou Wonnacott e Wonnacott, 1876, p. 180-182).
Verifique que o estimador de mnimos quadrados em dois estgio de
y 2 Ny1
= , onde N = X( XX) 1 X
y 2 Ny 2
Mostre que
1
1 1 1 1
Xv + u X XX Xv
= + n n n n
1
1 1 1 1 1
XX + 2 Xu + u X XX Xu
n n n n n
e que plim = , se Q 0 .
Respostas
9.1. a) b = 5 / 6 = 0,833 e a = 1 / 6 = 0,167
b) = 0,8 e = 1
349
c) So estimadores inconsistentes, com b tendendo a superestimar .
9.2. a) A 1a equao exatamente identificvel. A segunda equao no tem varivel
endgena no segundo membro e, consequentemente, identificvel e pode ser
estimada por mnimos quadrados ordinrios.
b) Y2 = 33 Y1 e Y1 = 4 + 3 X
c) t = 6,364, significativo (a regio de rejeio t 2,920 ).
9.3. b) = 8,529 e = 4,044 so estimativas consistentes.
= 2,208 e = 1,088 so estimativas consistentes, no-tendenciosas e de

varincia mnima.
9.4. a) Sim.
b) 1 = 3,5 ; 1 = 1,5 ; 1 = 1
s12 = 1,6
Matriz das estimativas das varincias e covarincias assintticas de 1 , 1 e 1 :
1,64 0,80 0,24

0,80 0,80 0,40

0,24 0,40 0,24
c) 2 = 0,5 ; 2 = 0,5 ; 2 = 1
s12 = 1,6
3,56 0,64 0,72

0,64 0,16 0,08

0,72 0,08 0,24
9.5. c = 11 e d = 4
9.6. a) b = 0,9 b) Estimador inconsistente, tendendo a superestimar .
c) = 0,75 e = 6 s) s ( ) = 0,1768
9.7. a) A primeira equao exatamente identificvel. A segunda equao obviamente

identificvel, pois no h varivel endgena no segundo membro.
b) = 1 , = 4 , = 15 e = 6
c) s ( ) = 0,433
9.8. a) Ocorre superidentificao na 1a equao. A 2asequao obviamente identificvel, pois

no h varivel endgena no 2o membro.
350
b) = 5 e = 2
c) t = 24,495, significativo ( t 0 = 4,032 )
9.9. a) H superidentificao se 2 0 e 3 0 .
b) exatamente identificvel se 2 0 .
c) Equao de demanda estimada
Y1 = 15 Y2 + 2 X 1
s12 = 4
Matriz das estimativas das varincias e covarincias assintticas de 1 e 2 :
1 160 152
259 152 248
d) Equao de oferta estimada:
Y1 = Y2 + 0,2 X 2 0,5 X 3
s 22 = 1
6800 660 1500

1
660 243 245
67600
1500 245 1325
e) 0,45, 0,7 e 0,45
351
10. SRIES TEMPORAIS
10.1. Processos estocsticos
Uma srie temporal um conjunto de valores de uma varivel ordenados no

tempo. Exemplos: a srie de temperaturas mximas dirias em determinado posto
meteorolgico, a srie dos preos mdios mensais de milho em determinado mercado e
a srie de valores anuais do PIB brasileiro.
Para uma conceituao mais formal, necessrio considerar o processo
estocstico subjacente. Dado um conjunto T, um processo estocstico uma famlia
Y = {Y (t ), t T } , tal que, para cada t T , Y (t ) uma varivel aleatria. O conjunto T
, normalmente, o conjunto dos nmeros inteiros {0, 1, 2, ...} ou o conjunto dos

nmeros reais. A figura abaixo ilustra esta interpretao de um processo estocstico
(Moretin e Toloi, p. 17):
Figura 10.1. Um processo estocstico.
Alternativamente, um processo estocstico pode ser interpretado como uma

famlia de trajetrias ou realizaes do processo, como ilustra a figura a seguir:
352
Y(t)
Figura 10.2. Conjunto de trajetrias
Imaginando um conjunto infinito de trajetrias, um corte no instante t

permitiria obter a distribuio de Y(t) naquele instante.
Uma srie temporal uma trajetria ou realizao de um processo estocstico.
Aqui sero analisadas apenas sries temporais de valores Yt equiespaados no tempo
(sries completas de dados anuais ou mensais, por exemplo).
Um exemplo de processo estocstico um conjunto infinito de sries formadas
pelos resultados de 100 lanamentos consecutivos de um dado.
Note-se que o critrio de ordenao dos Y (t ) , na definio de um processo
estocstico, no precisa ser o tempo. Mas certo que na grande maioria das aplicaes t
representa o tempo.
Um processo estocstico caracterizado pelas distribuies conjuntas de Y (t1 ) ,
Y (t 2 ) , ..., Y (t n ) para qualquer conjunto finito de valores de t ( t1 , t 2 ,..., t n ) pertencentes a

T. Na prtica, a anlise usualmente fica limitada a trs tipos de parmetros:
a) as mdias (t ) = E[Y (t )]
b) as varincias t2 = V [Y (t )] = E[Y (t ) (t )] 2
c) as covarincias (t1 , t 2 ) = cov[Y (t1 ), Y (t 2 )]
Note que t2 = (t , t )
Um processo estocstico estritamente estacionrio se as distribuies
conjuntas de Y (t1 ) , Y (t 2 ) , ..., Y (t n ) no so afetadas por translaes no tempo, isto ,
353
se a distribuio conjunta de Y (t1 ) , Y (t 2 ) , ..., Y (t n ) idntica distribuio conjunta
de Y (t1 + k ) , Y (t 2 + k ) , ..., Y (t n + k ) .
No caso de um processo estacionrio, a escolha da origem no eixo t no afeta
nenhuma caracterstica do processo.
Na prtica impossvel conhecer todas as distribuies conjuntas de Y (t1 ) ,
Y (t 2 ) , ..., Y (t n ) e ficamos restritos ao conceito de processo fracamente estacionrio

(ou estacionrio de segunda ordem), que aquele que obedece s seguintes condies:
a) a mdia de Y (t ) constante, isto , (t ) = para todo t.
b) a varincia de Y (t ) constante, isto , V [Y (t )] = 2 para todo t.
c) (t1 , t 2 ) uma funo de t 2 t1 , isto , a covarincia entre dois Y (t )

depende apenas da defasagem entre eles.
Essa ltima condio permite que, no caso de um processo estacionrio, a

covarincia entre Y (t ) e Y (t + k ) seja indicada por k . Consequentemente, a varincia
de Y (t ) pode ser indicada por 0 .
10.2. Rudo branco
Por simplicidade, a partir desse ponto passamos a representar os valores da srie

temporal por Yt , em lugar de Y (t ) .
Denomina-se rudo branco uma srie temporal (at ) com mdia igual a zero,
varincia constante e sem covarincia entre valores referentes a dois momentos
distintos, isto ,
E (a t ) = 0
E ( a t2 ) = a2
k = cov(at , at +k ) = 0 para k 0
Sejam X t os valores obtidos em lanamentos consecutivos de um dado no-
chumbado. Ento a srie de valores de Yt = X t 3,5 um exemplo de rudo branco.
354
10.3. Modelos de regresso
Um possvel modelo para uma srie temporal Yt = (t ) + a t , t = 1, ..., n , onde
at um rudo branco no correlacionado com (t ) , que uma determinada funo do
tempo (a parcela sistemtica ou determinstica de Yt ).

Um exemplo bastante simples o modelo de uma regresso linear simples
Yt = + t + a t
Se Yt uma srie de dados mensais e incluirmos variveis binrias para captar

uma possvel variao estacional, o modelo fica
12
Yt = + t + h Z h +a t ,
h =2
com Z h = 1 no h-simo ms do ano e Z h = 0 nos demais meses do ano.
10.4. Modelos de decomposio
O modelo clssico de decomposio de uma srie temporal baseia-se na

pressuposio de que ela pode ser separada em parcelas. Tipicamente so considerados
3 componentes: a tendncia ( Dt ) , a variao cclica sazonal ( S t ) e a parte aleatria ( at
). Ento
Yt = Dt + S t + a t
Se os componentes forem multiplicativos o modelo fica
Yt = Dt S t at
Neste caso usam-se os logaritmos para obter um modelo aditivo.
Uma exposio da tcnica usada para separar o componente estacional pode ser
encontrada no captulo 20 do livro Estatstica para Economistas (Hoffmann, 2006).
10.5. Modelos ARMA
Em comparao com os modelos de regresso e a tcnica de decomposio das

sries temporais, os modelos ARMA, descritos nesta seo e nas seguintes, tiveram
desenvolvimento relativamente recente. O trabalho pioneiro foi o livro de Box e
355
Jenkins, intitulado Time Series Analysis: Forecasting and Control, cuja 1a edio foi
publicada em 1970. H uma 3a edio, com Reinsel como novo co-autor, publicada em
1994.
O modelo de um processo auto-regressivo de primeira ordem, indicado por
AR (1) ,
Yt = + Yt 1 + a t , (10.1)
em que a t um rudo branco e e so parmetros.

O modelo de um AR ( p) (processo auto-regressivo de ordem p)
Yt = + 1Yt 1 + 2Yt 2 + ... + p Yt p + at
ou
Yt 1Yt 1 2Yt 2 ... p Yt p = + at
Usando o operador de defasagem B, tal que B k (Yt ) = Yt k , o modelo pode ser

escrito
(1 1 B 2 B 2 ... p B p )Yt = + at (10.2)
ou, sinteticamente,
( B)Yt = + a t
Por definio, o modelo de um processo de mdias mveis de primeira ordem,
indicado por MA(1) (devido expresso em ingls moving average),
Yt = + a t a t 1 (10.3)
O modelo de um MA ( q ) (processo de mdias mveis de ordem q) fica

Yt = + at 1 a t 1 2 a t 2 ... q a t q
ou
Yt = + (1 1 B 2 B 2 ... q B q )at (10.4)
ou
Yt = + ( B)a t
O nome mdias mveis est consagrado, embora no seja estritamente correto,

uma vez que no se trata de uma mdia mvel dos at (pois os coeficientes 1, 1 , 2
, K , q no precisam ser positivos nem ter soma igual a 1).
356
Combinando (10.2) e (10.4) obtemos o modelo de um ARMA ( p, q ) :
(1 1 B ... p B p )Yt = + (1 1 B ... q B q )at (10.5)
10.6. Anlise do AR(1)
De acordo com (10.1) temos que
Yt 1 = + Yt 2 + at 1
Substituindo essa expresso em (10.1), obtemos
Yt = + + 2 Yt 2 + a t + a t 1
Mas Yt 2 pode ser substitudo por + Yt 3 + at 2 , obtendo-se
Yt = + + 2 + 3Yt 3 + a t + at 1 + 2 a t 2
Aps sucessivas substituies desse tipo, obtemos
Yt = + + 2 + ... + m + m +1Yt m 1 + a t + at 1 + 2 a t 2 + ... + m a t m (10.6)
com m arbitrariamente grande.
Se < 1 , podemos desprezar o termo em Yt m1 e obtemos (no limite, para
m)

Yt = + a t + at 1 + 2 at 2 + ... (10.7)
1
Como a t um rudo branco, obtemos

E (Yt ) = (10.8)
1
e
V (Yt ) = (1 + 2 + 4 + ...) a2
ou
1
V (Yt ) = a2 (10.9)
1 2
357
k
cov(Yt , Yt k ) = a2 = k (10.10)
1 2
As expresses (10.8), (10.9) e (10.10) mostram que um AR (1) com < 1 tem
mdia constante, varincia finita e constante e que a covarincia entre Yt e Yt k depende
da defasagem k mas no depende de t. Conclui-se que um AR (1) com <1

(fracamente) estacionrio.
As expresses (10.1) ou (10.6) mostram que um AR (1) com > 1 explosivo.

Tanto os valores absolutos de Yt como sua varincia crescem ilimitadamente. O
processo no estacionrio.
10.7. O passeio aleatrio com deslocamento
No caso particular em que = 1 o modelo AR (1) fica
Yt = Yt 1 + + at (10.11)
Esse processo denominado passeio aleatrio com deslocamento. Em cada

perodo o valor da varivel acrescido de e de um elemento aleatrio at .
O passeio aleatrio o caso particular em que = 0 :
Yt = Yt 1 + a t (10.12)
Para um passeio aleatrio com deslocamento, partindo de um valor inicial Y0 e

aplicando sucessivamente a relao (10.11), obtemos
Y1 = Y0 + + a1
Y2 = Y0 + 2 + a1 + a 2
e, generalizando,
t
Yt = Y0 + t + a j (10.13)
j =1
O mesmo resultado pode ser obtido de (10.6) fazendo = 1 e m = t 1 .
358
A expresso (10.13) mostra que E (Yt ) cresce linearmente com t e que a
varincia da parcela aleatria tambm cresce sempre com t, mostrando que um AR (1)
com = 1 no estacionrio.
Se substituirmos por , o modelo do passeio aleatrio com deslocamento fica
Yt = Yt 1 + + a t (10.14)
t
Se, alm disso, definirmos u t = a j , a expresso (10.13) fica
j =1
Yt = Y0 + t + u t (10.15)
Esse modelo enganadoramente semelhante ao modelo
Yt = + t + a t (10.16)
apresentado na seo 3. A diferena est na matriz de varincias e covarincias dos

erros. Para o modelo (10.16) essa matriz I a2 , ao passo que no caso do modelo
(10.15), admitindo que os valores observados sejam Y1 , Y2 ,..., Yn , essa matriz W a2

com
1 1 1 1 K 1
1 2 2 2 K 2

1 2 3 3 K 3
W= (10.17)
1 2 3 4 K 4
M M M M M

1 2 3 4 K n
Observa-se que no modelo (10.15) h heterocedasticia e covarincia entre os

erros. Se formos estimar o parmetro em (10.15) por meio de uma anlise de
regresso, necessrio utilizar mnimos quadrados generalizados. Mas h uma maneira
muito mais fcil de estimar . De (10.14) segue-se que
Yt = Yt Yt 1 = + a t (10.18)
Dada a srie de n valores de Yt , podemos calcular Z t = Yt e a estimativa de ,

simplesmente,
1 n
b=Z = Zt (10.19)
n 1 t =2
359
n n
Z t = (Yt Yt 1 ) = Yn Y1
t =2 t =2
Ento
Yn Y1
b= (10.20)
n 1
Essa equao mostra que a estimativa de depende apenas dos valores inicial e
final de Yt . Isso ocorre porque todas as variaes de Yt em perodos intermedirios
foram sendo acumuladas, sem nenhuma perda, e esto contidas no valor final Yn .
Se a srie de valores de Yt for analisada fazendo uma regresso de Yt contra t

usando as frmulas de mnimos quadrados ordinrios, ser obtida uma estimativa no-
tendenciosa mas ineficiente de . O problema principal que sero utilizadas frmulas
erradas para estimar as varincias, fazendo com que os testes de hiptese no sejam
vlidos. Ao testar H 0 : = 0 , h uma grande probabilidade de obter um valor de t ou F
significativo mesmo que a hiptese seja verdadeira.
O modelo (10.15), obtido de (10.14), um processo estacionrio nas diferenas
(difference stationary process DSP), pois as diferenas Z t = Yt constituem uma
srie estacionria, como mostra (10.18).
O modelo (10.16) gera um processo estacionrio depois de eliminada a
tendncia (determinstica) + t ( um trend stationary process TSP).
Um exemplo numrico simples permite ressaltar as diferenas entre os
procedimentos estatsticos apropriados no caso dos modelos (10.15) e (10.16). Vamos
considerar uma srie com apenas 4 valores consecutivos de Y t , dados na tabela a seguir:
TABELA 10.1. Srie de 4 valores de Yt .
t=X Yt
1 10
2 11
3 17
4 19
Admitindo que (10.16) seja o modelo que gerou os dados, a estimativa de
360
xY 16,5
b= = = 3,3 (10.21)
x2 5
O quadrado mdio do resduo
58,75 54,45
s2 = = 2,15 (10.22)
2
Para testar a hiptese H 0 : = 0 calculamos
3,3
t= = 5,032 (10.23)
2,15
5
Ao nvel de significncia de 5%, o valor crtico de t 4,303. O resultado
significativo. A esse nvel de significncia, rejeita-se H 0 : = 0 .
Vamos admitir, agora, que a srie de 4 valores de Yt foi gerada pelo modelo
(10.14). Um procedimento apropriado para obter a estimativa de calcular os valores

de Z t = Yt (que so 1, 6 e 2) e, de acordo com (10.19), obter sua mdia:
9
b=Z = =3 (10.24)
3
Pode-se verificar que o mesmo resultado obtido utilizando a expresso (10.20).
A estimativa de a2 dada por
z 2 14
s =
2
= =7 (10.25)
2 2
Lembrando a frmula para varincia de uma mdia, obtemos
7
V (b) = (10.26)
3
Para testar H 0 : = 0 , calculamos
3
t= = 1,964 (10.27)
7
3
O resultado no significativo. No se rejeita H 0 : = 0 .
interessante verificar que o mesmo resultado obtido ajustando uma regresso

linear simples de Yt contra t, mas tomando o cuidado de utilizar as frmulas de
mnimos quadrados generalizados, respeitando a estrutura da matriz de varincias e
covarincias dos erros u t do modelo (10.15) [Ver (10.17)]. Temos
361
1 1 1 1 1 1
1
2 1 2 2 2
X= W=
1 3 1 2 3 3

1 4 1 2 3 4
Verifica-se que
2 1 0 0
1 2 1 0
W 1 =
0 1 2 1

0 0 1 1
1 1 1 4 1
XW 1 X = ( X W 1 X) 1 =
1 4 3 1 1
10 7
XW 1y = b = ( XW 1 X) 1 XW 1 y =
19 3
1 1
s2 = ( y W 1 y b X W 1 y ) = (141 127) = 7
n2 2
A estimativa de igual a 3, reproduzindo o resultado obtido em (10.24), e a
estimativa da respectiva varincia 7/3, reproduzindo o resultado obtido em (10.26).
bvio que para testar H 0 : = 0 seria obtido o mesmo valor j calculado em (10.27).
claro que a estimao de por mnimos quadrados generalizados uma
complicao desnecessria. O mtodo anterior, baseado nas diferenas Yt , muito
mais simples. A finalidade da exposio foi deixar claro que quando se estima o
parmetro no modelo (10.15) fazendo uma regresso por mnimos quadrados
ordinrios o erro consiste em utilizar um procedimento inapropriado estrutura dos
erros u t , no havendo nenhuma incompatibilidade entre a anlise de sries temporais e
o mtodo de mnimos quadrados ou outros procedimentos clssicos da econometria.
10.8. Transformando modelos AR em modelos MA e vice-versa

O modelo de um processo auto-regressivo de primeira ordem pode ser escrito
como
(1 B)Yt = + a t (10.28)
362
Se esse processo for estacionrio, isto , se < 1 , de acordo com a expresso
(10.7) ele pode ser escrito como

Yt = + a t + at 1 + 2 at 2 + K (10.29)
1
Pode-se verificar que isso o modelo de um MA de ordem infinita, com

coeficientes que so todos potncias de .
A passagem de (10.28) para (10.29) foi feita anteriormente por meio de
sucessivas substituies e manipulaes algbricas. Ela pode ser feita mais rapidamente
considerando que podemos dividir os dois membros de (10.28) por 1 B e que
1
= 1 + B + 2 B 2 + 3 B 3 + K (10.30)
1 B
Note-se que essa expresso anloga frmula do limite da soma de uma
progresso geomtrica com razo menor do que 1:
a
= a + aq + aq 2 + aq 3 + K (10.31)
1 q
Cabe ressaltar que a relao (10.31) no permite concluir que a relao (10.30)
correta, pois B um operador, e no uma grandeza algbrica. Pode-se verificar,
entretanto, que, a relao (10.30) vlida sempre que < 1 .
Sabemos que um MA(1) pode ser escrito como

Yt = + (1 B ) at (10.32)
Se < 1 , podemos dividir todos os termos por 1 B , obtendo

(1 + B + 2 B 2 + K)Yt = + at (10.33)
1
Esse resultado mostra que um MA(1) um AR de ordem infinita cujos
coeficientes so todos potncias de .
Um MA(1) com < 1 denominado invertvel. H uma clara simetria formal
entre a condio para estacionariedade de um AR(1) e a condio de invertibilidade de

um MA(1).
363
10.9. Raiz unitria e modelos ARIMA
Consideremos, novamente, o modelo de um AR(1):
(1 B)Yt = + a t
Vamos considerar a expresso que multiplica Yt como um polinmio em B e

definir a equao caracterstica
1 B = 0
A raiz dessa equao
1
B=

Sabemos que o AR(1) estacionrio apenas quando < 1 . Em outras palavras,
um AR(1) estacionrio se, e somente se, a raiz da respectiva equao caracterstica ,

em mdulo, maior do que 1.
Para um AR(2) a equao caracterstica
1 1 B 2 B 2 = 0
Neste caso as razes podem ser nmeros complexos e pode-se provar que a
condio de estacionariedade que as duas razes estejam fora do crculo unitrio (na
representao geomtrica dos nmeros complexos h vi em que h e v so,
respectivamente, a abscissa e a ordenada do ponto em um sistema de eixos cartesianos
ortogonais).
Genericamente, a condio de estacionariedade de um AR(p) que todas as

razes da equao caracterstica ( B ) = 0 estejam fora do crculo unitrio.
Analogamente, um MA(q) invertvel se, e somente se, todas as razes da

equao caracterstica ( B ) = 0 estiverem fora do crculo unitrio.
Um caso especial de grande interesse a existncia de uma raiz unitria. O

AR(1) com raiz unitria o passeio aleatrio com deslocamento analisado na seo
anterior. Vimos que esse modelo exige procedimentos estatsticos especficos,
passando-se a utilizar as diferenas Yt = Yt Yt 1 . Sempre que uma srie Yt for no-
364
estacionria mas as diferenas Z t = Yt formarem uma srie estacionria, dizemos que
a srie Yt integrada de primeira ordem ou I(1). Se a srie Z t = Yt tambm for no-
estacionria e a srie Z t = 2Yt for estacionria, dizemos que a srie Yt integrada de

segunda ordem ou I(2), e assim por diante. Uma srie estacionria I(0).
Se aps d diferenas obtemos uma srie que um ARMA(p, q), a srie original
um ARIMA (p, d, q).
O modelo de um ARIMA (1, 1, 1), por exemplo,
(1 B)Yt = + (1 B)a t
ou
(1 B)(1 B)Yt = + (1 B)a t (10.34)
10.10. Funo de autocorrelao
Dada uma srie temporal Yt , sua autocorrelao com defasagem k
cov(Yt , Yt k )
k = (10.35)
V (Yt )V (Yt k )
Para uma srie estacionria a covarincia entre Yt e Yt k no depende de t e ser
indicada por k , e a varincia, que constante, ser indicada por 0 . Ento a

autocorrelao com defasagem k fica
k
k = (10.36)
0
A funo de autocorrelao da srie mostra como k varia com a defasagem k.
Para um processo AR(1) estacionrio, substituindo (10.9) e (10.10) em (10.36),

obtemos
k = k , (10.37)
mostrando que neste caso o valor absoluto da autocorrelao cai exponencialmente com
a defasagem .
Para um processo MA(1)
365
Yt = + at a t 1
verifica-se que 0 = (1 + 2 ) a2 , 1 = a2 e k = 0 para k > 1. Ento

1 = e k = 0 para k > 1 (10.38)
1+ 2
Generalizando, pode-se demonstrar que para um MA(q) apenas as q primeiras

autocorrelaes so diferentes de zero.
Na anlise de uma srie temporal observada, usual calcular as estimativas das

autocorrelaes. Indicando a estimativa de k por ck e a estimativa de k por rk ,
temos
ck
rk = , (10.39)
c0
com
1 n
ck = (Yt Y )(Yt k Y ) (10.40)
n t = k +1
onde Y a mdia dos valores de Yt na amostra.
As autocorrelaes estimadas podem ser utilizadas para identificar o processo

que deu origem srie observada. Se, por exemplo, apenas r1 for claramente diferente
de zero, o processo deve ser um MA(1).
Se os valores de rk diminuem muito lentamente com k, isso indica que deve

haver uma raiz unitria. Entretanto, quanto mais curta a srie disponvel, mais
rapidamente diminuem os valores de rk , mesmo que a srie tenha uma raiz unitria. Na
prtica, pode ser impossvel distinguir um passeio aleatrio de um AR(1) cujo
parmetro menor, mas prximo de 1.
366
10.11. Os testes de Dickey-Fuller
O AR(1) definido por (10.1) pode ser escrito como
Yt = + ( 1)Yt 1 + at
Fazendo 1 = , obtemos
Yt = + Yt 1 + at (10.41)
Ento a hiptese de que = 1 corresponde hiptese de que = 0 , e < 1
corresponde a < 0 . O teste de Dickey-Fuller consiste em fazer uma regresso de Yt
contra Yt 1 e calcular, da maneira usual, o valor de t referente hiptese H 0 : = 0 .
Mas, dadas as caractersticas especiais da varivel Yt quando = 1 , os valores crticos

para esse teste no so os da distribuio de t de Student. Para distinguir esse teste do t
usual, comum indic-lo com a letra grega .
H trs verses do teste de Dickey-Fuller:
a) Teste , quando se considera que a relao entre Yt e Yt 1 no tem termo
constante:
Yt = Yt 1 + at (10.42)
b) Teste , quando se considera a relao (10.41).
c) Teste , quando includa uma tendncia linear no tempo:
Yt = + t + Yt 1 + at (10.43)
Os valores crticos (com sinal negativo, para lembrar que se trata de teste
unilateral esquerda) so apresentados na tabela 10.2
TABELA 10.2. Valores crticos do teste de Dickey-Fuller
Modelo Nvel de significncia
10% 5% 1%
Yt = Yt 1 + at 1,62 1,94 2,56
Yt = + Yt 1 + at 2,57 2,86 3,43
Yt = + t + Yt 1 + a t 3,13 3,41 3,96

Fonte: Davidson e Mackinnon (1993).
367
Vamos admitir que o modelo subjacente seja um AR(2):
(1 1 B 2 B 2 )Yt = + a t (10.44)
ou
Yt = + 1Yt 1 + 2Yt 2 + a t (10.45)
Se existir uma raiz unitria teremos 1 1 2 = 0 .
A equao (10.45) pode ser escrita como
Yt = + (1 + 2 1)Yt 1 + 2 Yt 1 + at
ou
Yt = + Yt 1 + 2 Yt 1 + at (10.46)
Quando a equao ajustada inclui termos com valores defasados de Yt no
segundo membro, o teste da hiptese de que = 0 denominado teste de Dickey-

Fuller aumentado (Augmented Dickey-Fuller test, ou ADF). Os valores crticos so os
mesmos j apresentados na tabela 10.2).
10.12. Modelo de correo de erro e co-integrao
Vamos considerar que temos duas variveis econmicas, Y1t e Y2t , estreitamente
associadas entre si, sendo que ambas so I(1), isto , so integradas de primeira ordem.
interessante imaginar que Y1t e Y2t sejam os logaritmos dos preos de dois produtos
substitutos prximos no consumo, como o preo, no varejo, da lata de leo de milho e
da lata de leo de arroz. Outra alternativa imaginar que se trata dos logaritmos dos
preos de um mesmo produto em dois mercados prximos, como, por exemplo, o preo
do feijo em Curitiba e em So Paulo. Nestes casos, embora tanto Y1t como Y2t sejam
sries no-estacionrias, a diferena entre elas est limitada pela relao econmica
entre ambas. Se uma delas subir ela puxa a outra. A imagem fsica seria de um
elstico ou uma mola ligando as duas variveis.
368
Generalizando um pouco, vamos considerar duas variveis I(1) relacionadas pela
equao
Y2t = + Y1t + t (10.47)
Se o erro
t = Y2t Y1t (10.48)
for elevado, indicando que o valor de Y2t est relativamente elevado, Y2t tende a
diminuir e Y1t tende a aumentar. Considerando que esses efeitos se manifestam no

prximo perodo, temos
Y2t = 2 (Y2 ,t 1 Y1,t 1 ) + u 2t (10.49)
e
Y1t = 1 (Y2 ,t 1 Y1,t 1 ) + u1t (10.50)
com 2 < 0 e 1 > 0 .

As equaes (10.47), (10.49) e (10.50) constituem um exemplo simples de
modelo de correo de erro envolvendo duas variveis.
Como admitimos que Y1t e Y2t so variveis I(1), Y1t e Y2t so variveis
estacionrias. Se admitirmos, ainda, que u 2t e u1t so rudos brancos, podemos afirmar
que 2 t em (10.49) e 1 t em (10.50) so estacionrios, pois uma combinao linear
de variveis estacionrias sempre estacionria. Finalmente, se 1 0 ou 2 0
podemos concluir que t estacionrio, ou seja, uma varivel I(0).

Verifica-se, portanto, que o modelo de correo de erros descrito implica a
existncia de uma combinao linear entre variveis I(1) [a equao (10.48)] que I(0).
Dizemos, ento, que Y1t e Y2t so variveis co-integradas e que (10.48) [ou (10.47)] a
relao de co-integrao.
Cabe ressaltar que a incluso ou no do termo constante no afeta em nada a
anlise da estacionariedade das sries.
Podemos admitir que os valores de Y2t e Y1t tambm sejam afetados pelos
valores prvios dessas diferenas. Ento as equaes (10.49) e (10.50) seriam
substitudas por
Y2t = 2 (Y2,t 1 Y1,t 1 ) + 21 Y1,t 1 + 22 Y2 ,t 1 + u 2t (10.51)
369
Y1t = 1 (Y2,t 1 Y1,t 1 ) + 11 Y1,t 1 + 12 Y2 ,t 1 + u1t (10.52)
Como as diferenas defasadas tambm so estacionrias, sua incluso nas

equaes no altera a concluso anterior sobre a estacionariedade de t .
O exemplo analisado ilustra um caso particular de co-integrao. O conceito
mais geral e sua relao com os modelos de correo de erro foi rigorosamente
apresentado em artigo clssico de Engle e Granger (1987). Consideremos um processo
envolvendo k variveis ( Y1t , Y2t , K , Ykt ) e seja y t o vetor-coluna com os valores dessas
variveis no tempo t. Essas k variveis so integradas de ordem d, c se todas as k
variveis so I(d) e existe um vetor-coluna , com 0 , tal que y t I(d c), com c
> 0. Em outras palavras, a ordem de integrao da combinao linear y t menor do
que a ordem de integrao (d) das variveis em y t . O vetor denominado vetor de

co-integrao. No caso do modelo de correo de erro analisado anteriormente temos
d= 1 e c = 1.
Quando duas variveis so co-integradas, a relao de co-integrao pode ser
estimada pelo mtodo de mnimos quadrados ordinrios. Para testar se as variveis so
co-integradas devemos, inicialmente, verificar sua ordem de integrao. Vamos admitir
que testes de Dickey-Fuller tenham mostrado que as variveis Y1t e Y2t so I(1). Ento
elas so co-integradas se existe uma relao de co-integrao cujo erro ( t )

estacionrio. Como no dispomos dos valores desse erro, o teste feito com base nos
resduos da regresso de Y2t contra Y1t , que passamos a indicar por t . Da mesma
maneira que no teste de Dickey-Fuller, fazemos a regresso de t contra t 1 e

calculamos, da maneira usual, o valor de t referente hiptese de que o parmetro de
t 1 igual a zero. O resultado deve ser comparado com os valores crticos apresentados
na tabela 10.3. Note-se que esses valores crticos so diferentes daqueles que esto nas
duas ltimas linhas da tabela 10.2, pois neste caso a varivel utilizada para fazer o teste
j o resduo de uma regresso.
370
TABELA 10.3. Valores crticos para o teste da estacionariedade do erro de uma equao
de co-integrao de duas variveis, incluindo termo constante.
Nvel de significncia
Equao incluindo
10% 5% 1%
Constante 3,04 3,34 3,90
Constante e tendncia 3,50 3,78 4,32
Fonte: Davidson e Mackinnon (1993).
O fato de a varivel utilizada na equao estimada para obter o valor do teste ser
o resduo da possvel equao de co-integrao faz com que, para a realizao do teste,
seja indiferente (assintoticamente) que o termo constante tenha sido includo na
primeira ou na segunda equao, o mesmo valendo para a incluso de uma tendncia.
Para exemplificar, vamos considerar os valores fictcios de Y1t e Y2t

apresentados na tabela 10.4.
TABELA 10.4. Sries de 24 valores consecutivos de Y1t e Y2t .
t Y1t Y2t t Y1t Y2t

1 0,77 0,62 13 0,86 0,87
2 0,79 0,71 14 0,98 0,77
3 0,81 0,68 15 1,02 0,81
4 0,84 0,61 16 1,11 0,84
5 0,89 0,71 17 1,07 0,91
6 0,95 0,73 18 1,13 0,87
7 0,98 0,72 19 1,22 1,01
8 0,95 0,92 20 1,30 1,09
9 1,04 0,78 21 1,34 1,21
10 0,96 0,80 22 1,45 1,10
11 0,99 0,64 23 1,47 1,14
12 0,87 0,83 24 1,40 1,16
Para a srie Y1t os testes , e de Dickey-Fuller so 2,00, 0,32 e 1,64,
respectivamente. Trata-se de resultados claramente no-significativos (ver tabela 10.2),

no se podendo rejeitar a hiptese de que a srie dos Y1t tem raiz unitria. Repetindo os
testes para a srie dos Y1t obtemos = 3,88 , = 4,52 e = 4,42 , significativos
371
ao nvel de 1%, rejeitando-se a hiptese de raiz unitria na srie das diferenas. Conclui-
se que Y1t uma srie I(1).
Para a srie Y2t obtemos = 0,91 , = 1,10 e = 3,11 , todos no-
significativos a 10%. J para a srie dos Y2t obtemos = 6,62 , = 6,96 e
= 6,90 , todos significativos a 1%. Conclumos que a srie Y2t tambm I(1).
Admitindo que haja co-integrao entre as duas variveis, estimamos, pelo

mtodo de mnimos quadrados ordinrios, a seguinte equao (testes t entre parnteses,
abaixo do coeficiente):
Y2t = 0,06289 0,75508 Y1t

( 0 , 73 ) ( 9 , 36 )
Para a srie de 24 desvios ( t ) dessa regresso obtemos = 5,66 , significativo

ao nvel de 1% (ver tabela 10.3), o que permite concluir que esses desvios so
estacionrios. Tendo em vista que j havamos verificado que as sries Y1t e Y2t so
I(1), conclumos que Y1t e Y2t so co-integradas.
Considerando a verso mais simples do modelo de correo de erro descrito no

incio dessa seo (mas incluindo um termo constante nas equaes), estimamos as
seguintes equaes:
Y1t = 0,028+ 0,486 t

( 2 , 76 ) ( 3, 78 )
Y2t = 0,022 0,822 t

(1, 46 ) ( 4 , 33 )
Cabe ressaltar que a natureza artificial dos dados desse exemplo fez com que os
diversos testes conduzissem claramente construo de um modelo de correo de
erros. Na prtica, os resultados geralmente no so to evidentes e a construo de um
modelo apropriado vai depender bastante do discernimento do pesquisador, combinando
o conhecimento de tcnicas estatsticas, de teoria econmica e das qualidades e
limitaes dos dados utilizados.
372
Exerccios
10.1. Admite-se que a varivel Yt um passeio aleatrio com deslocamento:
Yt = Yt 1 + + t ,
sendo uma constante e t um rudo branco. fornecida uma srie de 9 valores
consecutivos de Yt : 6, 5, 10, 18, 22, 22, 31, 36 e 46.
a) Teste, ao nvel de significncia de 5%, a hiptese de que = 0.

10.2. dada uma srie de 5 valores consecutivos de Yt : 17, 20, 32, 38 e 41.
Admite-se que esses valores foram gerados pelo modelo
Yt = Yt 1 + + t ,
sendo t um rudo branco com varincia 2 .
a) Estime .
b) Estime 2 .
c) Teste, ao nvel de significncia de 5%, a hiptese de que = 0 , contra a
hiptese alternativa de que > 0 .
10.3. Admite-se que a varivel Yt um passeio aleatrio com deslocamento:
Yt = Yt 1 + + t , (1)
onde uma constante e t um rudo branco.
O modelo (1) permite deduzir que Yt varia no tempo de acordo com a equao
Yt = + t + u t
Se 2 a varincia de t e u o vetor-coluna dos valores de u t , tem-se
E (uu ) = V 2 .
dada uma srie de 9 valores consecutivos de Yt (para t = 1, 2, ..., 9): 12, 12, 18,
27, 32, 33, 43, 49 e 60.
a) Quais os valores dos elementos v 22 e v 48 da matriz V?
b) Determine a estimativa linear no-tendenciosa de varincia mnima de .

c) Teste, ao nvel de significncia de 1% a hiptese de que = 0.
d) Teste, ao nvel de significncia de 5% a hiptese de que = 5.
373
10.4. Sendo at um rudo branco, verifique, para cada um dos modelos a seguir, se ele
gera um processo estacionrio ou no, justificando sumariamente sua resposta:
a) Yt = 18 2,3Yt 1 + a t
b) Yt = 144 + a t + 2at 1
c) Yt = 0,9Yt 1 + at
d) Yt = 7 + Yt 1 + a t
e) Yt = 11 + 1,8Yt 1 0,8Yt 2 + a1
Mostre, inicialmente, que essa equao pode ser escrita como
(1 0,8 B)(1 B)Yt = 11 + at
10.5. So dadas as sries de 24 valores consecutivos das variveis Y1t e Y2t :
t Y1t Y2t t Y1t Y2t

1 44 99 13 47 95
2 56 90 14 26 96
3 60 103 15 41 81
4 64 105 16 38 105
5 53 108 17 51 103
6 71 108 18 57 119
7 60 100 19 51 131
8 59 98 20 60 116
9 37 107 21 73 115
10 54 99 22 61 124
11 49 106 23 61 136
12 48 104 24 71 132
a) Usando um programa para computador apropriado, faa os testes de Dickey-Fuller

para verificar se a srie Y1t tm uma raiz unitria.
b) Idem, para a srie Y1t .
c) Idem, para as sries Y2t e Y2t .
d) O que se pode concluir sobre a ordem de integrao das sries Y1t e Y2t ?
e) Estime a equao Y2t = + t + Y1t + t e verifique se esta uma relao de co-

integrao.
374
Respostas
10.1 a) b = 5, s 2 (b) = 2 , t = 3,536, significativo ( t 0 = 2,365 )
b) t = 1,414, no-significativo ( t 0 = 2,365 )
10.2. a) b = 6
b) s 2 = 18
c) t = 2,828, significativo (regio de rejeio: t 2,353)
10.3. a) v 22 = 2 e v 48 = 4
b) b = 6
c) t = 4,243, significativo ( t 0 = 3,499 )
d) t = 0,707, no-significativo ( t 0 = 1,895 )
10.4. a) No-estacionrio: AR(1) com | |>1.

b) Estacionrio: MA(1).
c) Estacionrio: AR(1) com | |<1.
d) No-estacionrio: passeio aleatrio com deslocamento ou AR(1) com =1.
e) No-estacionrio: tem raiz unitria.
10.5.a) = 0,03 , = 2,53 e = 2,48 , no-significativos.
b) = 7,32 , = 7,20 e = 7,08 , todos significativos a 1%.
c) Para Y2t : = 0,51 , = 1,44 e = 2,38 , no-significativos
Para Y2t : = 6,10 , = 6,24 e = 6,12 , significativos a 1%
d) Tanto Y1t como Y2t so I(1).
e) Y2t = 69,09 + 1,128t + 0,4517Y1t , com R 2 = 0,562 .
Para a srie dos desvios dessa regresso obtm-se = 5,05 . Como o valor
crtico ao nvel de 1%, na tabela 10.3, 4,32, conclui-se que Y1t e Y2t so
sries co-integradas.
375
APNDICE
TABELA I. Distribuio de t de Student. Valor crtico t 0 tal que
P(t > t 0 ) = P(t < t 0 ) = / 2
Nmero de Nvel de significncia para o teste bilateral ()
Graus de
Liberdade 0,20 0,10 0,05 0,02 0,01 0,005
1 3,078 6,314 12,706 31,821 63,657 127,32
2 1,886 2,920 4,303 6,965 9,925 14,089
3 1,638 2,353 3,182 4,541 5,841 7,453
4 1,533 2,132 2,776 3,747 4,604 5,598
5 1,476 2,015 2,571 3,365 4,032 4,773
6 1,440 1,943 2,447 3,143 3,707 4,317
7 1,415 1,895 2,365 2,998 3,499 4,029
8 1,397 1,860 2,306 2,896 3,355 3,832
9 1,383 1,833 2,262 2,821 3,250 3,690
10 1,372 1,812 2,228 2,764 3,169 3,581
11 1,363 1,796 2,201 2,718 3,106 3,497
12 1,356 1,782 2,179 2,681 3,055 3,428
13 1,350 1,771 2,160 2,650 3,012 3,372
14 1,345 1,761 2,145 2,624 2,977 3,326
15 1,341 1,753 2,131 2,602 2,947 3,286
16 1,337 1,746 2,120 2,583 2,921 3,252
17 1,333 1,740 2,110 2,567 2,898 3,222
18 1,330 1,734 2,101 2,552 2,878 3,197
19 1,328 1,729 2,093 2,539 2,861 3,174
20 1,325 1,725 2,086 2,528 2,845 3,153
21 1,323 1,721 2,080 2,518 2,831 3,135
22 1,321 1,717 2,074 2,508 2,819 3,119
23 1,319 1,714 2,069 2,500 2,807 3,104
24 1,318 1,711 2,064 2,492 2,797 3,090
25 1,316 1,708 2,060 2,485 2,787 3,078
26 1,315 1,706 2,056 2,479 2,779 3,067
27 1,314 1,703 2,052 2,473 2,771 3,056
28 1,313 1,701 2,048 2,467 2,763 3,047
29 1,311 1,699 2,045 2,462 2,756 3,038
30 1,310 1,697 2,042 2,457 2,750 3,030
40 1,303 1,684 2,021 2,423 2,704 2,971
60 1,296 1,671 2,000 2,390 2,660 2,915
120 1,289 1,658 1,980 2,358 2,617 2,860
1,282 1,645 1,960 2,326 2,576 2,807
Interpolaes devem ser feitas com base nos recprocos dos graus de liberdade (interpolao harmnica).
Fonte: Theil (1971), p. 717, e Hoel (1968), p. 295.
376
TABELA II. Distribuio de qui-quadrado. Valor crtico 02 tal que
P ( k2 > 02 ) =
Nmero de
Graus de
Liberdade 0,995 0,975 0,050 0,025 0,010 0,005
(k)
1 3927.108 9821.107 3,841 5,024 6,635 7,879
2 0,010025 0,05064 5,991 7,378 9,210 10,60
3 0,07172 0,2158 7,815 9,348 11,34 12,84
4 0,2070 0,4844 9,488 11,14 13,28 14,86
5 0,4117 0,8312 11,07 12,83 15,09 16,75
6 0,6757 1,237 12,59 14,45 16,81 18,55
7 0,9893 1,690 14,07 16,01 18,48 20,28
8 1,344 2,180 15,51 17,53 20,09 21,96
9 1,735 2,700 16,92 19,02 21,67 23,59
10 2,156 3,247 18,31 20,48 23,21 25,19
11 2,603 3,816 19,68 21,92 24,72 26,76
12 3,074 4,404 21,03 23,34 26,22 28,30
13 3,565 5,009 22,36 24,74 27,69 29,82
14 4,075 5,629 23,68 26,12 29,14 31,32
15 4,601 6,262 25,00 27,49 30,58 32,80
16 5,142 6,908 26,30 28,85 32,00 34,27
17 5,697 7,564 27,59 30,19 33,41 35,72
18 6,265 8,231 28,87 31,53 34,81 37,16
19 6,844 8,907 30,14 32,85 36,19 38,58
20 7,434 9,591 31,41 34,17 37,57 40,00
21 8,034 10,28 32,67 35,48 38,93 41,40
22 8,643 10,98 33,92 36,78 40,29 42,80
23 9,260 11,69 35,17 38,08 41,64 44,18
24 9,886 12,40 36,42 39,36 42,98 45,56
25 10,52 13,12 37,65 40,65 44,31 46,93
26 11,16 13,84 38,89 41,92 45,64 48,29

27 11,81 14,57 40,11 43,19 46,96 49,64
28 12,46 15,31 41,34 44,46 48,28 50,99
29 13,12 16,05 42,56 45,72 49,59 52,34
30 13,79 16,79 43,77 46,98 50,89 53,67
40 20,71 24,43 55,76 59,34 63,69 66,77
50 27,99 32,36 67,50 71,42 76,15 79,49
60 35,53 40,48 79,08 83,30 88,38 91,95
70 43,28 48,76 90,53 95,02 100,4 104,2
80 51,17 57,15 101,9 106,6 112,3 116,3
90 59,20 65,65 113,1 118,1 124,1 128,3
100 67,33 74,22 124,3 129,6 135,8 140,2
Fonte: Theil (1971), p. 718-719.
377
TABELA III Distribuio de F. Valor crtico F0 tal que P( F > F0 ) = 0,01 .
No de graus de Nmero de graus de liberdade do numerador
liberdade do
denominador
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 4052 5000 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 4,75
17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00
Fonte: Christ (1966, p. 671) e Pimentel Gomes (1966, p. 408-409).
378
TABELA IV Distribuio de F. Valor crtico F0 tal que P( F > F0 ) = 0,05 .
liberdade do
denominador
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 161 200 216 225 230 234 237 239 241 242 244 246 248 249 250 251 252 253 254
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4.62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 2,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,17 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Fonte: Christ (1966, p. 670) e Pimentel Gomes (1966, p. 406-407).
379
Tabela V. Distribuio de F. Valor crtico F0 tal que P( F > F0 ) = 0,10 .
liberdade do
denominador 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
1 39,9 49,5 53,6 55,8 57,2 58,2 58,9 59,4 59,9 60,2 60,7 61,2 61,7 62,0 62,3 62,5 62,8 63,1 63,3
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,45 9,46 9,47 9,47 9,48 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,18 5,17 5,16 5,15 5,14 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,79 3,78 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,14 3,12 3,10
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,58 2,56 2,54 2,51 2,49 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,34 2,32 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,28 2,25 2,23 2,21 2,18 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,18 2,16 2,13 2,11 2,08 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,21 2,17 2,12 2,10 2,08 2,05 2,03 2,00 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,04 2,01 1,99 1,96 1,93 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,10 2,05 2,01 1,98 1,96 1,93 1,90 1,88 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10 2,05 2,01 1,96 1,94 1,91 1,89 1,86 1,83 1,80
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,90 1,87 1,85 1,82 1,79 1,76
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,99 1,94 1,89 1,87 1,84 1,81 1,78 1,75 1,72
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,96 1,91 1,86 1,84 1,81 1,78 1,75 1,72 1,69
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98 1,93 1,89 1,84 1,81 1,78 1,75 1,72 1,69 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,91 1,86 1,81 1,79 1,76 1,73 1,70 1,67 1,63
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,77 1,74 1,71 1,68 1,64 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92 1,88 1,83 1,78 1,75 1,72 1,69 1,66 1,62 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,86 1,81 1,76 1,73 1,70 1,67 1,64 1,60 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89 1,84 1,80 1,74 1,72 1,69 1,66 1,62 1,59 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,70 1,67 1,64 1,61 1,57 1,53
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,69 1,66 1,63 1,59 1,56 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86 1,81 1,76 1,71 1,68 1,65 1,61 1,58 1,54 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85 1,80 1,75 1,70 1,67 1,64 1,60 1,57 1,53 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,63 1,59 1,56 1,52 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83 1,78 1,73 1,68 1,65 1,62 1,58 1,55 1,51 1,47
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,64 1,61 1,57 1,54 1,50 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,47 1,42 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,51 1,48 1,44 1,40 1,35 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,45 1,41 1,37 1,32 1,26 1,19
2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 1,60 1,55 1,49 1,42 1,38 1,34 1,30 1,24 1,17 1,00
Fonte: Scheff (1959), p. 424-425.
380
ANLISE DE REGRESSO Uma Introduo Econometria
Tabela VI. Valores crticos do teste de Durbin-Watson para o nvel de significncia de 5%.
No de Nmero de variveis explanatrias
obser- k =1 k=2 k=3 k=4 k=5
vaes
(n) dL dU dL dU dL dU dL dU dL dU
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15
17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10
18 1,16 1,39 1,05 1,53 0,93 1,69 0,82 1,87 0,71 2,06
19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02
20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99
21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96
22 1,24 1,43 1,15 1,54 1,05 1,66 0,96 1,80 0,86 1,94
23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92
24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,78 0,93 1,90
25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89
26 1,30 1,46 1,22 1,55 1,14 1,65 1,06 1,76 0,98 1,88
27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,76 1,01 1,86
28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85
29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
31 1,36 1,50 1,30 1,57 1,23 1,65 1,16 1,74 1,09 1,83
32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82
33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81
34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 1,15 1,81
35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80
36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80
37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80
38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79
39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
45 1,48 1,57 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78
50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77
55 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77
60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77
65 1,57 1,63 1,54 1,66 1,50 1,70 1,47 1,73 1,44 1,77
70 1,58 1,64 1,55 1,67 1,52 1,70 1,49 1,74 1,46 1,77
75 1,60 1,65 1,57 1,68 1,54 1,71 1,51 1,74 1,49 1,77
80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77
85 1,62 1,67 1,60 1,70 1,57 1,72 1,55 1,75 1,52 1,77
90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78
95 1,64 1,69 1,62 1,71 1,60 1,73 1,58 1,75 1,56 1,78
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78
Fonte: Johnston (1972), p. 430.
381
Tabela VII. Valores crticos do teste de Durbin-Watson para o nvel de significncia de

1%.
No de Nmero de variveis explanatrias
obser- k =1 k=2 k=3 k=4 k=5
vaes
(n) dL dU dL dU dL dU dL dU dL dU
15 0,81 1,07 0,70 1,25 0,59 1,46 0,49 1,70 0,39 1,96
16 0,84 1,09 0,74 1,25 0,63 1,44 0,53 1,66 0,44 1,90
17 0,87 1,10 0,77 1,25 0,67 1,43 0,57 1,63 0,48 1,85
18 0,90 1,12 0,80 1,26 0,71 1,42 0,61 1,60 0,52 1,80
19 0,93 1,13 0,83 1,26 0,74 1,41 0,65 1,58 0,56 1,77
20 0,95 1,15 0,86 1,27 0,77 1,41 0,68 1,57 0,60 1,74
21 0,97 1,16 0,89 1,27 0,80 1,41 0,72 1,55 0,63 1,71
22 1,00 1,17 0,91 1,28 0,83 1,40 0,75 1,54 0,66 1,69
23 1,02 1,19 0,94 1,29 0,86 1,40 0,77 1,53 0,70 1,67
24 1,04 1,20 0,96 1,30 0,88 1,41 0,80 1,53 0,72 1,66
25 1,05 1,21 0,98 1,30 0,90 1,41 0,83 1,52 0,75 1,65
26 1,07 1,22 1,00 1,31 0,93 1,41 0,85 1,52 0,78 1,64
27 1,09 1,23 1,02 1,32 0,95 1,41 0,88 1,51 0,81 1,63
28 1,10 1,24 1,04 1,32 0,97 1,41 0,90 1,51 0,83 1,62
29 1,12 1,25 1,05 1,33 0,99 1,42 0,92 1,51 0,85 1,61
30 1,13 1,26 1,07 1,34 1,01 1,42 0,94 1,51 0,88 1,61
31 1,15 1,27 1,08 1,34 1,02 1,42 0,96 1,51 0,90 1,60
32 1,16 1,28 1,10 1,35 1,04 1,43 0,98 1,51 0,92 1,60
33 1,17 1,29 1,11 1,36 1,05 1,43 1,00 1,51 0,94 1,59
34 1,18 1,30 1,13 1,36 1,07 1,43 1,01 1,51 0,95 1,59
35 1,19 1,31 1,14 1,37 1,08 1,44 1,03 1,51 0,97 1,59
36 1,21 1,32 1,15 1,38 1,10 1,44 1,04 1,51 0,99 1,59
37 1,22 1,32 1,16 1,38 1,11 1,45 1,06 1,51 1,00 1,59
38 1,23 1,33 1,18 1,39 1,12 1,45 1,07 1,52 1,02 1,58
39 1,24 1,34 1,19 1,39 1,14 1,45 1,09 1,52 1,03 1,58
40 1,25 1,34 1,20 1,40 1,15 1,46 1,10 1,52 1,05 1,58
45 1,29 1,38 1,24 1,42 1,20 1,48 1,16 1,53 1,11 1,58
50 1,32 1,40 1,28 1,45 1,24 1,49 1,20 1,54 1,16 1,59
55 1,36 1,43 1,32 1,47 1,28 1,51 1,25 1,55 1,21 1,59
60 1,38 1,45 1,35 1,48 1,32 1,52 1,28 1,56 1,25 1,60
65 1,41 1,47 1,38 1,50 1,35 1,53 1,31 1,57 1,28 1,61
70 1,43 1,49 1,40 1,52 1,37 1,55 1,34 1,58 1,31 1,61
75 1,45 1,50 1,42 1,53 1,39 1,56 1,37 1,59 1,34 1,62
80 1,47 1,52 1,44 1,54 1,42 1,57 1,39 1,60 1,36 1,62
85 1,48 1,53 1,46 1,55 1,43 1,58 1,41 1,60 1,39 1,63
90 1,50 1,54 1,47 1,56 1,45 1,59 1,43 1,61 1,41 1,64
95 1,51 1,55 1,49 1,57 1,47 1,60 1,45 1,62 1,42 1,64
100 1,52 1,56 1,50 1,58 1,48 1,60 1,46 1,63 1,44 1,65
Fonte: Johnston (1972), p. 431.
382
BIBLIOGRAFIA
AIGNER, D.J. (1971). Basic econometrics. New Jersey, Prentice-Hall.
ANGRIST, J.D.; PISCHKE, J.S. (2009). Mostly harmless econometrics: an empiricists

companion. Princeton University Press.
BARTLETT, M.S. (1949). Fitting a Straight Line when Both Variables are subject to
Error. Biometrics, 5: 207-242.
BOX, G.E.P.; JENKINS, G. M. e REINSEL, G.C. (1994) Time series analysis -

Forecasting and Control. 3a ed. New York, Prentice-Hall.
CARTER, H.O. e HARTLEY, H.O. (1958). A Variance Formula for Marginal Productivity
Estimates Using the Cobb-Douglas Function. Econometrica, 26: 306-313.
CASTRO, J. de (1961). Geopoltica da Fome: ensaio sobre os problemas de alimentao e

de populao do mundo.6 ed. So Paulo, Editora Brasiliense.
COCHRAN, W.G. (1965). Tcnicas de Amostragem. Rio de Janeiro, Fundo de Cultura.
CHRIST, C.F. (1966). Econometric Models and Methods. New York, John Wiley.
CROXTON, F.E. e COWDEN, D.J. (1955). Apllied General Statistics. New York,
Prentice-Hall.
DAVIDSON, R e MACKINNON, J. (1993). Estimation and Inference in Econometrics.

New York, Oxford University Press.
DRAPER, N. e SMITH, H. (1966). Applied Regression Analysis. New York, John Wiley.
ENDERS, W. (1995). Applied Econometric Time Series. New York, John Wiley.
ENGLE, R.F. e GRANGER, W.J. (1987). Co-integration and Error Correction:

representation, estimation and testing. Econometrica, 55(2): 251-276.
GLEJSER, H. (1969). A New Test for Heteroscedasticity. J. Am. Statist. Assoc., 64: 316-
323.
GOLDFELD, S.M. e QUANDT, R.E. (1965). Some Tests for Homoscedasticity. J. Am.
Statist. Assoc., 60: 539-547.
383
GREENE, W.H. (2000). Econometric Analysis. 4a ed. Prentice-Hall.
HADLEY, G. (1967). Introduction to Probability and Statistical Decision Theory, San

Francisco, Holden-Day.
HEADY, E.O. e DILLON, J.L. (1961). Agricultural Production Functions. Ames, Iowa
State University Press.
HILL, R.C.; GRIFFITHS, W.E. e JUDGE, G.G. (2003). Econometria. 2a ed. So Paulo,
Editora Saraiva.
HOEL, P.G. (1962). Introduction to Mathematical Statistics, 3aed. New York, John Wiley.
HOEL, P.G. (1968). Estatstica Elementar, 2a ed. Rio de Janeiro, Fundo de Cultura.
HOFFMANN, R. (2006) Estatstica para economistas. 4a ed. rev. e ampl.. So Paulo,

Pioneira Thomson Learning.
HOOD, W.C. e KOOPMANS, T.C., ed. (1953). Studies in Econometric Method. New
Haven, Yale University Press.
HUANG, D.S. (1970). Regression and Econometric Methods. New York, John Wiley.
JOHNSTON, J. (1971). Mtodos Economtricos. So Paulo, Atlas.
JOHNSTON, J. (1972). Econometric Methods, 2a ed. New York, McGraw-Hill.
JOHNSTON, J. e DINARDO, J. (1997). Econometric Methods. 4a ed. McGraw-Hill.
KELEJIAN, H.H. e OATES, W.E. (1978). Introduo Econometria: Princpios e

aplicaes. Rio de Janeiro, Campus.
KMENTA, J. (1971). Elements of Econometrics. New York, McMillan.
LANGE, O. (1967). Introduo Econometria, 2a ed. Rio de Janeiro, Fundo de Cultura.
LTKEPOHL, H. (1991). Introduction to Multiple Time Series Analysis. Berlin, Springer-

Verlag.
MADDALA, G.S. (1988). Introduction to Econometrics. New York, MacMillan.
MALINVAUD, E. (1970). Statistical Methods of Econometrics, 2a ed. Amsterdam, North-

Holland.
384
MARINHO, E.; ARAJO, J. (2010). Pobreza e o sistema de seguridade social rural no

Brasil. Revista Brasileira de Economia 64(2): 161-174.
MARINHO, E.; LINHARES, F.; CAMPELO, G. (2011). Os programas de transferncia de

renda do governo impactam a pobreza no Brasil? Revista Brasileira de Economia
65(3): 267-288.
MORETTIN, P.A. E TOLOI, C.M.C. (1985). Previso de Sries Temporais. So Paulo,

Atual Editora.
NERLOVE, M. (1958). The Dynamics of Supply: Estimation of Farmers Response to

Price. Balrimore, John Hopkins.
PEREZ, M.C.R.C. (1973). Contribuio ao Estudo da Elasticidade-renda do Consumo de

Alimentos. Piracicaba, ESALQ-USP (Dissertao de Mestrado).
PHILLIPS, P.C.B. e WICKENS, M.R. (1978). Exercises in Econometrics, volume two.

Oxford, Philip Allan Publishers.
PIMENTEL GOMES, F. (1966). Curso de Estatstica Experimental. 3a ed. Piracicaba,

ESALQ-USP.
PIMENTEL GOMES, F. e NOGUEIRA, I.R. (1964). Regresso e Covarincia.

Piracicaba, ESALQ-USP (mimeografado).
SCHEFF, H. (1959). The Analysis of Variance. New York, John Wiley.
SILVA LEME, R.A. da (1965). Curso de Estatstica. 2a ed. Rio de Janeiro, Livro Tcnico.
THEIL, H. (1971). Principles of Econometrics. New York, John Wiley.
WALD, A. (1940). The Fitting of Straight Lines in both Variables are Subject to Error.
Ann. Math. Statist., 11:284-300.
WALLIS, K.F. (1967). Lagged Dependent Variables and Serially Correlated Errors: A
Reappraisal of three-Pass Least Squares. Rev. Economics and Statistics, 49:555-567.
WHITE, H. (1980). A Heteroskedasticity-consistent Covariance Matrix Estimator and a

Direct Test for Heteroskedasticity. Econometrica 48(4): 817-838,
385
WONNACOTT, R.J. e WONNACOTT, T.H. (1970). Econometrics. New York, John

Wiley.
WONNACOTT, R.J. e WONNACOTT, T.H. (1976). Econometria. Rio de Janeiro, Livros

Tcnicos e Cientficos.
YAMANE, T. (1967). Statistics, an Introductory Analysis. 2a ed. New York, Harper and
Row.
YULE, G.U. e KENDALL, M.G. (1940). An introduction to the Theory of Statistics. 12a
ed. London, Griffin.
386
NDICE ANALTICO
A
ADF, 368
Anamorfose, 77-79, 173
AR (p), 356
ARIMA (p, d, q), 365
ARMA (p, q), 357
Auto-regressivo, 356
Autocorrelao, 46, 278
B
Bartlett, 303, 383
Basmann, 328
Binria (ver Varivel binria)
Box, 355, 383
Breusch-Pagan/Godfrey, 265
C
Chebyshev, 28
Christ, 378, 379, 383
Cochran, 13, 383
Coeficiente de correlao
parcial, 146-153
simples, 103-104, 186
Coeficiente de determinao, 61, 68, 105, 129-130
Coeficiente de determinao parcial, 150-153
Coeficiente de variao, 68-69
Consistente (ver Estimador consistente)
Co-integrao, 368-371
Convergncia em mdia quadrtica, 28
387
Convergncia em probabilidade, 26
Covarincia
Definio, 6
Propriedades, 10
Cramr-Rao, 32-34
D
Davidson, 268, 367, 371, 383
Desigualdade de Chebyshev, 28
Draper, 232, 285, 383
DSP, 360
Dummy variable (ver Varivel binria)
Durbin-Watson, 284-286, 381, 382
Dickey-Fuller, 367-368
E
Econometria, 1
Eficincia relativa, 16
Engle, 370, 383
Equaes estruturais, 309, 318-319
Erro tipo I, 34
Erro tipo II, 34
Especificao, 77-79, 168-171
Esperana matemtica
Definio, 5
Propriedades, 5
Estimador
assintoticamente eficiente, 25-26
assintoticamente no-tendencioso, 25
consistente, 27, 31, 291-294
de mxima verossimilhana, 21-24, 32-34, 80
de mnimos quadrados, 19-21
388
de varincia mnima, 15-18

de Theil-Basmann, 328
de White, 265-269
eficiente, 16, 34
imparcial, 10
no-tendencioso, 10-12
no-viesado, 10
Extrapolao, 76-77, 142
F
Falta de ajustamento, 236-239
Forma reduzida (de um sistema de equaes simultneas), 309, 319
G
Gauss-Markov, 60, 121
Glejser, 264-265
Goldfeld, 263-266
Granger, 370, 383
H
Heterocedasticia, 46, 254
Hiptese (ver teste de hipteses)
Hoel, 262, 285, 376, 384
Hoffmann, 4, 285, 355, 384
Homocedasticia, 44
Homocedsticos, 44, 120
I
Identificao, 321-327
Intervalo de confiana, 71, 73, 75-76, 129, 140-141
Intervalo de previso, 73-76, 141-142
389
J
Jenkins, 356, 383
Johnston, 281, 285, 297, 304, 381, 382, 384
K
Kendall, 108, 386
L
Limite em probabilidade, 26
Limite inferior de Cramr-Rao, 32-34
M
Mackinnon, 268, 367, 371, 383
MA (q), 356
Matriz de varincias e covarincias, 124
Mdias mveis, 356
Mtodo
das variveis instrumentais (ver Varivel instrumental)
de mxima verossimilhana, 19, 21-24
dos mnimos quadrados, 19-21, 47, 121-123
dos mnimos quadrados em dois estgios, 315-317, 328-329
dos mnimos quadrados generalizados, 275-278
dos mnimos quadrados indiretos, 312-313
dos mnimos quadrados ordinrios, 256, 257-261, 282-283
dos mnimos quadrados ponderados, 46, 256-258
Modelo de correo de erros, 368-370
Modelo
Estatstico, 2-3
Matemtico, 1-2
390
de uma regresso linear simples, 44-47

de uma regresso linear mltipla, 120-121
restrito, 178
Mudana estrutural, 230-232
Multicolinearidade, 174-178, 191
N
Nvel de significncia, 34-40
O
Ortogonalidade, 173, 182-183
P
Passeio aleatrio, 358
Perez, 304, 385
Pimentel Gomes, 378, 385
Poder do teste, 34
Poligonal, 226-229
Probabilidade caudal do teste, 67-71, 137, 138, 284
Processo estacionrio, 353-354
Processo estocstico, 352-353
Q
Quandt, 263-266
R
Raiz unitria, 364
Regresso linear mltipla, 120-121
Regresso linear simples, 44-47
Rudo branco, 354
391
S
Scheff, 380, 385
Smith, 232, 285, 383
T
Teorema de Gauss-Markov (ver Gauss-Markov)
Teste de Breusch-Pagan/Godfrey, 265
Teste de Chow, 232
Teste de Dickey-Fuller, 367-368
Teste de Durbin-Watson, 284-286
Teste de Glejser, 264
Teste de Goldfeld e Quandt, 263-266
Teste de hipteses (conceitos bsicos), 34-40
Teste de hipteses no modelo linear, 157, 178-181
Teste de White, 266
Teste para falta de ajustamento (Ver Falta de ajustamento)
Teste para homocedasticia, 261-267
Theil, 33, 34, 263, 267, 281, 328, 376, 377, 385
Trajetria (de um processo estocstico), 352-353
TSP, 360
V
Varincia
Definio, 5-6
Propriedades, 6-7
Varincia assinttica, 25
Variveis conjuntamente determinadas, 317
Varivel
aleatria, 4-5
binria, 219-240
392
defasada, 285, 317

endgena, 308
exgena, 308
instrumental, 295-297, 301-302, 312, 319-320
predeterminada, 317
W
Wald, 303, 385
White, 266-268, 385
Wonnacott, 191, 385
Y
Yule, 108, 386
393

Analise de Regressão - Livro PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Analise de Regressão - Livro PDF

Enviado por

Direitos autorais:

Formatos disponíveis

RODOLFO HOFFMANN

Portal de Livros Abertos

Esta uma nova verso do livro de mesmo ttulo (quarta edio)

1. Anlise de regresso 2. Econometria I.Ttulo

Autorizo a reproduo parcial ou total desta obra, para fins acadmicos,

1. INTRODUO E CONCEITOS ESTATSTICOS BSICOS ..................................................... 1

2. REGRESSO LINEAR SIMPLES ...................................................................................... 44

2.12. Varincia de Yi e intervalo de previso ................................................................. 72

3. CORRELAO ............................................................................................................ 103

5. USO DE VARIVEIS BINRIAS .................................................................................. 219

7. MNIMOS QUADRADOS GENERALIZADOS E AUTOCORRELAO NOS RESDUOS ........ 275

10. SRIES TEMPORAIS .................................................................................................. 352

Este livro reflete o esforo do autor em preparar material didtico para

A econometria consiste na aplicao de mtodos matemticos e estatsticos a

onde Y representa a varivel dependente e os X h (h = 1, 2, ..., k) representam as

Consideremos duas variveis, X e Y, relacionadas por uma funo matemtica

valores de Yi = f ( X i ) , se colocarmos os pontos ( X i , Yi ) em um grfico verificaremos

e que por vrios motivos (no disponibilidade dos valores, impossibilidade de

Se apenas uma das variveis independentes considerada, temos

Neste caso, o conjunto de pares de valores ( X i , Y i ) corresponde a um conjunto

Figura 1.2. Modelo estatstico: Yi = f ( X i ) + u i

Outra justificativa para a existncia do erro (u i ) em um modelo estatstico

dada pelos erros de mensurao da varivel dependente. Se os verdadeiros valores (Vi )

e se os valores observados (Yi ) da varivel dependente apresentam erros de mensurao

a relao entre Yi e os X ki (h = 1, 2, ..., k) fica

1.3. Varivel aleatria

Dizemos que uma varivel discreta X aleatria, se a cada um de seus valores se

Esta a funo de probabilidade da distribuio binomial para n = 5, onde n o

O valor de f ( X ) tambm denominado densidade de probabilidade.

Se a varivel contnua tem distribuio normal com mdia e varincia 2 , a

1.4. Esperana matemtica

Por definio, se a varivel aleatria discreta, a esperana de X

e, se a varivel aleatria contnua, a esperana de X

Pode-se demonstrar, dadas as variveis aleatrias X e Y e a constante K, que a

1.5. Varincia e covarincia

Por definio, a varincia de uma varivel aleatria X, de populao infinita,

A varincia uma medida de disperso da distribuio.

Dadas duas variveis aleatrias, X e Y, a covarincia entre X e Y , por definio:

Demonstremos, a seguir, que

fcil verificar que

Se X e Y so duas variveis aleatrias independentes temos

Para exemplificar, consideremos que um tetraedro regular, feito de material

Na tabela 1.1 so dados os valores do produto ( X X )(Y Y ) a serem

TABELA 1.1. Valores de ( X X )(Y Y ) = ( X 3)(Y 3)

Verifiquemos este resultado calculando V (Z ) diretamente da definio. Na

TABELA 1.2. Soma dos valores obtidos lanando dois tetraedros

confirmando o resultado obtido anteriormente.

TABELA 1.3. Valores de P ( X i , Y j ) para a distribuio conjunta de duas

Entretanto, possvel demonstrar que, se as variveis tm distribuio normal, o

TABELA 1.4. Valores necessrios para o clculo da cov( X , W )

Como exerccio, o leitor pode verificar que V (W X ) = 20 .

Segue-se que, se 1 , 1 , 1 , 2 , 2 e 2 so constantes,

Como caso particular temos:

cov( X , W ) = cov( X ,12 X ) = V ( X ) = 5 ,

confirmando o resultado obtido anteriormente.

1.6. Estimador no tendencioso

Por definio, a um estimador no-tendencioso (no-viesado ou imparcial) do

Calculamos, tambm, as estimativas da varincia da mdia da amostra. Esta

podem ser obtidas lanando duas vezes o tetraedro.

Ou seja, X um estimador no-tendencioso (no viesado, no-viciado ou imparcial) de

Verificamos, tambm, que

ou seja, s 2 um estimador no-tendencioso de 2 .

ou diretamente, a partir da definio, utilizando os valores da ltima coluna da tabela