Escolar Documentos
Profissional Documentos
Cultura Documentos
Gorimaiaeconometria PDF
Gorimaiaeconometria PDF
Instituto de Economia
2013
Sumário
1. Correlação e Regressão Linear Simples ................................................................................. 9
Introdução ................................................................................................................................... 9
1.1. Correlação ........................................................................................................................ 9
1.2. Regressão Linear Simples .............................................................................................. 15
1.3. Método de Mínimos Quadrados Ordinários ................................................................... 18
1.3.1. Definição ................................................................................................................. 19
1.3.2. Aplicação do MQO na regressão linear simples ..................................................... 20
1.3.3. Propriedades dos Estimadores de Mínimos Quadrados Ordinários ........................ 22
Exercícios .................................................................................................................................. 23
Respostas................................................................................................................................... 24
2. Inferência com os Estimadores de MQO .............................................................................. 25
Introdução ................................................................................................................................. 25
2.1. Teorema de Gauss-Markov ............................................................................................ 25
2.2. Significância das estimativas ......................................................................................... 29
2.3. Distribuição amostral dos estimadores ....................................................................... 29
2.4. Variância dos estimadores .......................................................................................... 30
2.5. Teste de hipóteses para os coeficientes ...................................................................... 32
2.6. Intervalo de confiança para os coeficientes ................................................................ 35
Exercícios .................................................................................................................................. 37
Respostas................................................................................................................................... 38
3. Intervalos de Confiança e Previsão para os Valores de Y ..................................................... 48
Introdução ................................................................................................................................. 48
3.1. Intervalos para valores individuais e para a média aritmética ....................................... 48
3.2. Intervalo de confiança para o valor previsto de Yi ......................................................... 50
3.3. Intervalo de previsão para valores individuais de Yi ...................................................... 52
3.4. Propriedades das estimativas por intervalo .................................................................... 53
Exercícios .................................................................................................................................. 55
Respostas................................................................................................................................... 55
4. Formas Funcionais ................................................................................................................ 58
Introdução ................................................................................................................................. 58
4.1. Modelo Linear ................................................................................................................ 58
4.2. Modelo Log-Lin ............................................................................................................. 60
4.3. Modelo Lin-Log ............................................................................................................. 62
4.4. Modelo Log-Log ............................................................................................................ 64
Exercícios .................................................................................................................................. 66
Respostas................................................................................................................................... 67
5. Análise de Variância ............................................................................................................. 68
Introdução ................................................................................................................................. 68
5.1. Soma dos Quadrados ...................................................................................................... 68
5.2. Coeficiente de Determinação ......................................................................................... 72
5.3. Análise de Variância (ANOVA) .................................................................................... 74
Exercícios .................................................................................................................................. 76
Respostas................................................................................................................................... 77
6. Introdução à Regressão Linear Múltipla ............................................................................... 82
Introdução ................................................................................................................................. 82
6.1. Estimadores de MQO ..................................................................................................... 82
6.2. Estimadores de MQO a partir de notação matricial ....................................................... 85
6.3. O uso de variáveis centradas .......................................................................................... 89
Exercícios .................................................................................................................................. 94
Respostas................................................................................................................................... 96
7. Análise de Variância para Regressão Linear Múltipla ....................................................... 102
Introdução ............................................................................................................................... 102
7.1. Coeficiente de determinação e estatística F ................................................................. 102
7.2. Coeficiente de determinação ajustado .......................................................................... 106
Exercícios ................................................................................................................................ 108
Respostas................................................................................................................................. 110
8. Inferência em Regressão Linear Múltipla ........................................................................... 113
Introdução ............................................................................................................................... 113
8.1. Matriz de variância e covariância e teste t para βk ....................................................... 113
8.2. Inferência para combinação linear dos parâmetros ...................................................... 117
8.3. Teste de hipóteses para combinação linear dos parâmetros ......................................... 118
8.3. Intervalo de confiança para valor previsto ................................................................... 120
Exercícios ................................................................................................................................ 122
Respostas................................................................................................................................. 124
9. Contribuição Marginal ........................................................................................................ 125
Introdução ............................................................................................................................... 125
9.1. ANOVA para contribuição marginal ........................................................................... 125
9.2. Correlação parcial ........................................................................................................ 130
Exercícios ................................................................................................................................ 132
Respostas................................................................................................................................. 134
10. Multicolinearidade ........................................................................................................... 135
Introdução ............................................................................................................................... 135
10.1. Definição .................................................................................................................. 136
10.2. Fator Inflacionário da Variância ............................................................................... 139
10.3. Identificação da multicolinearidade.......................................................................... 141
10.4. Correção da multicolinearidade ................................................................................ 142
Exercícios ................................................................................................................................ 145
Respostas................................................................................................................................. 148
11. Variáveis Binárias ............................................................................................................ 153
Introdução ............................................................................................................................... 153
11.1. Variáveis binárias para representar 2 categorias ...................................................... 154
11.2. Variáveis binárias para representar múltiplas categorias ......................................... 156
11.3. Interpretação de coeficientes de binárias em equações semi-logaritmicas ............... 159
11.4. Outras aplicações das variáveis binárias .................................................................. 161
11.5. Teste de mudança estrutural ..................................................................................... 165
Exercícios ................................................................................................................................ 169
Respostas................................................................................................................................. 171
12. Heterocedasticidade ......................................................................................................... 172
Introdução ............................................................................................................................... 172
12.1. Definição .................................................................................................................. 172
12.2. Identificação ............................................................................................................. 175
12.2.1. Análise Gráfica .................................................................................................. 175
12.2.2. Teste de Goldfeld-Quandt ................................................................................. 177
12.2.3. Teste de Breusch-Pagan .................................................................................... 180
12.2.4. Teste de White ................................................................................................... 182
12.3. Mínimos Quadrados Ponderados .............................................................................. 184
12.3.1. Função de heterocedasticidade conhecida......................................................... 186
12.3.2. Função de heterocedasticidade desconhecida – Mínimos Quadrados
Generalizados Factíveis ...................................................................................................... 188
12.4. Estimadores Robustos da Variância ......................................................................... 190
Exercícios ................................................................................................................................ 192
Respostas................................................................................................................................. 194
13. Autocorrelação ................................................................................................................. 195
Introdução ............................................................................................................................... 195
13.1. Definição .................................................................................................................. 195
13.2. Identificação ............................................................................................................. 199
13.2.1. Análise Gráfica ..................................................................................................... 199
13.2.2. Teste t para regressores estritamente exógenos .................................................... 201
13.2.3. Teste de Durbin-Watson para um MCRL ............................................................. 203
13.2.4. Teste de Breusch-Godfrey para múltiplas defasagens .......................................... 205
13.3. Mínimos Quadrados Generalizados.......................................................................... 207
13.3.1. Coeficiente de autocorrelação conhecido – Mínimos Quadrados Generalizados
210
13.3.2. Coeficiente de autocorrelação desconhecido – Mínimos Quadrados
Generalizados Factíveis ...................................................................................................... 212
13.4. Estimadores Robustos da Variância ......................................................................... 214
Exercícios ................................................................................................................................ 215
Respostas................................................................................................................................. 217
14. Equações Simultâneas ...................................................................................................... 220
Introdução ............................................................................................................................... 220
14.1. Origem do problema ................................................................................................. 221
14.2. Definição .................................................................................................................. 223
14.3. Mínimos Quadrados Indiretos .................................................................................. 226
14.4. Identificação ............................................................................................................. 228
14.5. Estimação por Variáveis Instrumentais .................................................................... 236
14.6. Mínimos Quadrados em dois Estágios (MQ2E) ....................................................... 238
14.7. Teste de endogeneidade ............................................................................................ 241
Exercícios ................................................................................................................................ 243
Respostas................................................................................................................................. 245
15. Estacionariedade .............................................................................................................. 247
Introdução ............................................................................................................................... 247
15.1. Processos estocásticos .............................................................................................. 248
15.2. Estacionariedade ....................................................................................................... 249
15.2.1. Definição ............................................................................................................... 249
15.2.2. Raiz Unitária ......................................................................................................... 251
15.2.3. Terminologia ......................................................................................................... 255
15.3. Função de autocorrelação ......................................................................................... 258
15.4. Teste de raiz unitária................................................................................................. 260
15.4.1. Teste de Dickey-Fuller .......................................................................................... 261
15.4.2. Teste de Dickey-Fuller aumentado ....................................................................... 263
Exercícios ................................................................................................................................ 265
Respostas................................................................................................................................. 266
16. Cointegração .................................................................................................................... 267
Introdução ............................................................................................................................... 267
16.1. Relação espúria ......................................................................................................... 267
16.2. Modelo de tendência estacionária............................................................................. 269
16.2.1. Coeficiente de determinação para regressando com tendência............................. 270
16.3. Modelo de diferença estacionária ............................................................................. 272
16.4. Cointegração ............................................................................................................. 273
16.4.1. Modelo de correção de erros ................................................................................. 278
Exercícios ................................................................................................................................ 280
Respostas................................................................................................................................. 281
17. Modelos ARIMA ............................................................................................................. 283
Introdução ............................................................................................................................... 283
17.1. Modelo Autorregressivo (AR) .................................................................................. 283
17.2. Modelo de Médias Móveis (MA) ............................................................................. 286
17.3. Modelo Autorregressivo e de Médias Móveis (ARMA) .......................................... 287
17.4. Modelo Autorregressivo Integrado e de Médias Móveis (ARIMA) ........................ 288
Exercícios ................................................................................................................................ 293
Respostas................................................................................................................................. 293
Referências .............................................................................................................................. 294
PARTE I
Introdução
O termo regressão foi originalmente proposto por Francis Galton em seu trabalho
Regression Towards Mediocrity in Hereditary Stature, publicado no Journal of the
Anthropological Institute of Great Britain and Ireland, em 1886. Galton analisou a relação entre
a estatura média dos pais de uma família e a de seus filhos adultos. Como se esperava, observou
que, em geral, pais altos têm filhos altos e pais baixos têm filhos baixos. Também verificou que
os filhos de pais altos não são tão altos quanto seus pais, assim como os filhos de pais baixos não
são tão baixos quanto seus pais. Em outras palavras, a estatura dos filhos tendia a regredir à
estatura média da população, comportamento que Galton denominou regressão à mediocridade1.
A estatística moderna reserva, entretanto, o termo regressão ao estudo da relação de
dependência de uma variável, a variável dependente, em função de uma ou mais variáveis, as
variáveis explanatórias. O objetivo dessas análises é estimar ou prever o valor médio da variável
dependente a partir de variações na variável explanatória, ou independente.
Para melhor compreender os objetivos e aplicações da regressão em estatística, será
inicialmente apresentada a análise de correlação, estreitamente relacionada à análise de
regressão, mas conceitualmente muito diferente. Posteriormente, descrevem-se alguns conceitos
e técnicas iniciais da regressão aplicada às relações lineares entre duas variáveis, a regressão
linear simples.
1.1. Correlação
Uma técnica simples para identificar possíveis padrões de associação entre duas variáveis
quantitativas é o diagrama de dispersão. A Figura 1 apresenta três diagramas com diferentes
padrões de dispersão entre duas variáveis X e Y. No primeiro observa-se uma tendência de
associação linear positiva, ou seja, aumentando o valor de X, o valor de Y também tende a
aumentar. No segundo, a associação assemelha-se a uma parábola, ou seja, Y aumenta com X até
determinado ponto, quando, então, passa a diminuir. No último não há associação aparente entre
as variáveis Y e X, pois os pontos não apresentam qualquer tendência particular.
1
Medíocre no sentido de médio ou mediano, algo que está entre pequeno e grande, segundo definição do dicionário
Michaelis da Língua Portuguesa.
9
Econometria Regressão Linear Simples
(1)
Entre os muitos tipos de associações entre duas variáveis, a mais simples e frequente é a
linear. A associação de dependência linear pode ser positiva, quando os valores de Y e X são
diretamente proporcionais2, ou negativa, quando os valores de Y e X são inversamente
proporcionais.
Uma medida simples para quantificar a relação de dependência linear entre X e Y é a
covariância. Dado N pares de valores de uma população (X1, Y1), ..., (XN, YN), a covariância entre
X e Y será dada por:
N
∑ ( X i − µ X )(Yi − µY ) (2)
i =1
σ XY =
N
Onde µX e µY são, respectivamente, as médias populacionais de X e Y.
Quando se trata de uma amostra de n pares de valores de X e Y, com médias amostrais
equivalentes a X e Y , a estimativa da covariância será dada por:
n r
∑ ( X i − X )(Yi − Y ) (3)
i =1
σˆ XY =
n −1
Valores negativos da covariância sugerem relação de dependência linear negativa;
valores positivos sugerem dependência linear positiva; e valores muito próximos de zero
sugerem ausência de dependência linear.
Observe que a covariância é uma média dos produtos em relação aos valores centrados de
X e Y (desvios em relação às respectivas médias). Para simplificar as representações, esses
valores centrados podem ser representados pelas minúsculas x e y:
xi = ( X i − X ) e y i = (Yi − Y ) (4)
E a covariância, expressa em valores centrados, será dada por:
2
Aumentando X, aumenta o valor de Y.
10
Econometria Alexandre Gori Maia
n
∑ xi y i (5)
i =1
σˆ XY =
n −1
Graficamente, os valores centrados representam uma mudança de eixos no diagrama de
dispersão, que passam a ter origem nas médias de X e Y, mas sem alterar o padrão de associação:
(6)
Observe agora que, no diagrama formado pelos eixos x e y, pontos com padrão de
associação linear positiva tendem a concentrar-se no 1º e 3º quadrantes, onde as coordenadas
apresentam o mesmo sinal e, portanto, o produto xiyi, ou ( X i − X )(Yi − Y ) , será sempre positivo.
Ou seja, a covariância será positiva.
Analogamente, pontos com padrão de associação linear negativa concentrar-se-ão no 2º e
4º quadrantes, onde as coordenadas apresentam sinais diferentes e o produto xiyi, será sempre
negativo (primeiro gráfico da Figura 7). Na ausência de padrões de associação linear (segundo e
terceiro gráficos da Figura 7), produtos com sinais negativos tendem a compensar aqueles com
sinais positivos e a covariância será próxima de zero.
(7)
X 0 3 5 7 7 9 11 13 15 15
Y 240 240 440 300 640 870 700 1800 2400 240
11
Econometria Regressão Linear Simples
Exemplo 2. Uma amostra hipotética apresentou os seguintes dados para o rendimento (X) e um
indicador de felicidade, com escala entre 0 e 10 (Y), de 10 indivíduos:
X 240 300 440 640 700 870 1500 1800 2400 2900
Y 1 3 4 7 7 8 7 7 5 2
O diagrama de dispersão e a covariância entre as duas variáveis serão dados por:
Embora o valor da covariância seja positivo, ele é baixo e, visualmente, observa-se que a
associação entre as variáveis não é linear, mas sim quadrática.
12
Econometria Alexandre Gori Maia
apresenta o maior grau de associação linear. A medida derivada do produto de variáveis com um
maior grau de dispersão tenderia, naturalmente, a apresentar um maior valor de covariância.
Para contornar esse problema e medir o grau de associação linear entre duas variáveis,
utilizamos a correlação linear. A correlação (ρ) é uma medida padronizada (adimensional) de
associação linear entre duas variáveis, obtida ao se ponderar a covariância pelo produto dos
desvios padrão de X e Y (σX e σY, respectivamente):
σ XY
ρ= (8)
σ XσY
Outra maneira de enxergar a correlação é como uma média do produto dos desvios
padronizados de X e Y. Em outras palavras, de (2), (4) e (8) teremos:
N
∑ xi y i N
i =1
∑ xi y i 1 1 N xi y i
(9)
N i =1
ρ= = = ∑
σ XσY σ XσY N N i =1 σ X σ Y
Que pode ainda ser expressa apenas em função dos valores xi, yi e seus respectivos
quadrados:
N
∑i=1 xi yi N
ρ= N =
∑i=1 xi yi
N N N N
(10)
∑i=1 xi2 ∑i=1 yi2 ∑i=1 xi2 ∑i=1 yi2
N N
Para um conjunto de dados da amostra, teremos:
σ̂ XY
r= (11)
S X SY
Ou ainda:
n
r=
1 n xi y i
∑ =
∑i =1 xi yi
(12)
n − 1 i =1 S X S Y n n
∑i =1 xi2 ∑i =1 yi2
Graficamente, significa que, enquanto a covariância mede a aproximação dos desvios em
relação a uma reta, a correlação medirá a aproximação dos desvios padronizados em relação a
uma reta. Mantém-se a proporcionalidade e se elimina as distorções das diferentes escalas de
medida, passando todas a referir-se a unidades de desvios padrão:
13
Econometria Regressão Linear Simples
(13)
(14)
14
Econometria Alexandre Gori Maia
Exemplo 4. A partir dos dados do Exemplo (2), sobre renda (X) e felicidade (Y), teríamos:
S X = 928,4 e S Y = 2,5
σˆ XY 1,2
r= = = 0,001
S X SY (928,4)(2,5)
Ou seja, não há qualquer associação linear entre anos de escolaridade e rendimento, sugerindo,
por exemplo, que o aumento da renda não implicará, necessariamente, em variações
proporcionais na felicidade.
3
O termo linear refere-se aos coeficientes unitários dos parâmetros α e β. Modelos em que os coefecientes não
apresentam expoente unitário são chamados de modelos de regressão não lineares.
15
Econometria Regressão Linear Simples
(16)
(17)
Exemplo 5. Podemos pressupor que rendimento mensal (Y) seja determinado pelos anos de
escolaridade (X) segundo a relação linear:
Yi = α + βX i + ei
Assim, pressupomos que o rendimento de um ocupado seja dado em função (linear) de seus anos
de escolaridade mais um fator não observado ei. Os erros ei representam outras informações não
previstas pelo modelo que também afetam o rendimento, tais como experiência profissional,
aptidão, tipo de ocupação e características socioeconômicas do local de moradia.
16
Econometria Alexandre Gori Maia
E (Y / X i ) = α + βX i ou E (Yi ) = α + βX i (18)
Podemos também demonstrar, sem muita dificuldade, que se a reta de regressão
representa a esperança condicional de Yi, então a esperança condicional dos erros será igual a 0.
Em outras palavras:
ei = Yi − (α + βX i )
E (e | X i ) = E[Yi − (α + βX i )] = E (Yi ) − E (α + βX i ) = E (Yi ) − E (Yi ) = 0 (19)
E (ei | X i ) = E (ei ) = 0
Esse pressuposto é denominado de média condicional zero dos erros, segundo o qual os
erros não estão associados aos valores das variáveis independentes. Para compreendermos seu
significado, vamos supor uma aplicação da análise de regressão onde a variável Xi representa os
anos de escolaridade de um ocupado e Yi seu rendimento. Poderíamos ter um comportamento não
observado nos erros (ei), aptidão, por exemplo, que seja maior para pessoas com elevada
escolaridade e menor para pessoas com baixa escolaridade. Em outras palavras, teríamos E(ei)>0
para valores elevados de Xi e E(ei)<0 para valores baixos de Xi, ou seja E(ei|Xi)≠0. O problema é
que, quando formos analisar um modelo de regressão, não saberemos se os rendimentos mais
elevados se devem a uma maior escolaridade ou uma maior aptidão. A relação de determinação
entre escolaridade e renda poderia, assim, estar viesada.
Compreendido esse pressuposto muito importate da análise de regressão (que será ainda
abordado futuramente), voltemos agora à análise da reta de regressão. A equação (15) permite
uma interpretação muito intuitiva da relação entre Y e X. O intercepto α, por exemplo, representa
o valor esperado de Y quando o valor controlado de X for nulo. O coeficiente angular β, por sua
vez, representa a variação marginal no valor esperado de Y dada uma variação unitária em X. Isso
porque, se desejamos estimar a variação marginal no valor esperado de Y - ∆E(Y) - dada uma
variação infinitesimal em X - ∆X - basta calcularmos a derivada de E(Y/X) em função de X:
E (Y / 0) = α + β (0) = α
e
(20)
∆E (Y | X ) ∂E (Y | X ) ∂ (α + βX )
= = =β
∆X ∂X ∂X
17
Econometria Regressão Linear Simples
Uma diferença importante entre regressão e correlação está na forma com que as
variáveis são tratadas. Na regressão, pressupomos que a variável dependente seja, assim como os
resíduos, de natureza estocástica. Já a variável independente é considerada como um valor fixo,
controlado pelo pesquisador. Seria o caso, por exemplo, de controlarmos o nível de fertilizante
em um solo (variável independente) e verificarmos a produtividade resultante (variável
dependente). Para cada nível de fertilizante teríamos variações aleatórias na produtividade, das
quais poderíamos estimar os valores médios. Não seria adequado, por sua vez, tentarmos
controlar a produtividade para verificarmos as variações no nível de fertilizante. A correlação,
por sua vez, não estabelece qualquer distinção entre as variáveis X e Y.
Quando trabalhamos com dados de uma amostra, a representação da função de regressão
(amostral) será dada por:
Exemplo 6. Seja a relação do rendimento mensal (Y) com função dos anos de escolaridade (X):
Yi = α + βX i + ei
Assim, o rendimento esperado para aqueles trabalhadores não remunerados seria dado por α e,
para cada ano adicional de escolaridade, haveria uma variação marginal de β reais no rendimento
esperado.
4
O termo erro costuma ser reservado à função de regressão da população e resíduo para a função de regressão da
amostra.
18
Econometria Alexandre Gori Maia
operacional e resultados que, satisfeitas algumas condições, são os mais acurados (exatos) e
eficientes (variância mínima) existentes (essas condições serão abordadas posteriormente). O
método utiliza princípios matemáticos para ajustar uma função a uma série de valores
observados em uma amostra, utilizando procedimentos que minimizam a soma dos erros de
previsão ao quadrado, ou seja, a soma quadrática das diferenças entre os valores observados na
amostra e os estimados pela função.
O método de mínimos quadrados é uma das ferramentas mais importantes da estatística
moderna e sua descoberta envolveu uma das disputas mais famosas da história da estatística.
Adrien Marie Legendre foi o primeiro a publicar a técnica, em 1805, em seu livro Nouvelles
Méthodes pour la Determination des Orbites de Comètes, mas Johann Carl Friedrich Gauss
clamou a descoberta da técnica que dizia utilizar desde 1795, também em problemas de
Astronomia e Física, embora publicada apenas em 1809.
1.3.1. Definição
Seja um conjunto de observações (Yi) e uma função matemática f(θ) utilizada para prever
os valores de Yi na população Em outras palavras:
Yi = f (θ ) + ei (23)
Onde ei é o erro de previsão, ou seja, a diferença entre o valor observado Yi e aquele
previsto pela função f(θ):
ei = Yi − f (θ ) (24)
O método de mínimos quadrados estimará o parâmetro θ de tal forma que a soma dos
erros de previsão ei ao quadrado seja mínima. Para isso, o primeiro passo é obter a função que
define a soma dos erros ao quadrado que, assim como f(θ), também dependerá de θ. Essa função
é chamada de Erro Quadrático Total (EQT):
n n
EQT (θ ) = ∑ ei2 = ∑ [Yi − f (θ )]2 (25)
i =1 i =1
19
Econometria Regressão Linear Simples
para cima5, seu valor mínimo será obtido igualando-se a primeira derivada da função em relação
ao parâmetro a zero.
dEQT (θ )
=0 (26)
dθ
que a soma dos erros quadráticos seja a mínima possível, ou seja, minimizando a função de EQT:
n
2
EQT = ∑ eˆi
i =1
n
EQT = ∑ [Yi − Yˆi ] 2 (27)
i =1
n
EQT = ∑ [Yi − (αˆ + βˆX i )] 2
i =1
Para minimizar a função de EQT, deve-se igualar a zero as derivadas parciais em relação
a α e β.
d EQT
= 2∑in=1[Yi − (αˆ + βˆX i )](−1) = 0 (28)
d αˆ
d EQT
= 2∑in=1[Yi − (αˆ + βˆX i )](− X i ) = 0 (29)
ˆ
dβ
Desenvolvendo as expressões (28) e (29) chegaremos aos estimadores de MQO α̂ e β̂ .
5
Verifique que o sinal associado ao termo quadrático θ2 será sempre positivo.
20
Econometria Alexandre Gori Maia
αˆ = Y − βˆ X (30)
n
∑ X i Yi − n X Y
i =1
β̂ = n (31)
2 2
∑ Xi − nX
i =1
i =1 i =1 i =1 i =1 i =1
Conforme a conveniência analítica, pode-se demonstrar que β̂ pode ainda ser dado por:
n n n
∑ xi yi ∑ X i yi ∑ xiYi
βˆ = i =1
n
= i =1
n
= i =1
n
(33)
∑ xi 2
∑ xi 2
∑ xi 2
i =1 i =1 i =1
Exemplo 6. A partir das informações da amostra apresentas no Exemplo (1), podemos estimar os
parâmetros para o ajuste de regressão linear entre o rendimento mensal (Y) e os anos de
escolaridade (X):
Yi = αˆ + βˆX i + eˆi
Onde:
6
Dica: faça o caminho contrário da demostração, partindo da forma simplificada, para facilitar a compreensão.
21
Econometria Regressão Linear Simples
Em outras palavras, o rendimento esperado para quem não possui escolaridade seria de 7,62 reais
e, para cada ano adicional de escolaridade, espera-se um acréscimo de 91,69 reais no rendimento.
(34)
∑ n
i =1[Yi − Yˆi ] = ∑in=1 eˆi = 0
22
Econometria Alexandre Gori Maia
Das equações (22) e (30) podemos demonstrar que, quando o valor controlado de Xi for
equivalente à média de X, o valor esperado de Yi será igual à média de Y.
Yˆi = αˆ + βˆX i
Yˆi = Y − βˆ X + βˆX i
(35)
Yˆi = Y − βˆ X + βˆ X
Yˆi = Y
Exercícios
1. Dados os estimadores de MQO do ajuste Yˆi = αˆ + βˆX i , prove que yˆ i = β̂xi .
2. Observaram-se os gastos per capita com alimentação (Y) e a renda mensal per capita (X) em
uma amostra de 5 famílias:
Y 52 104 122 141 166
X 254 487 615 950 1014
a. Esboce e análise o gráfico de dispersão para as variáveis em questão;
b. Estime e analise a covariância e a correlação entre as variáveis;
c. Estime os parâmetros do modelo de regressão linear simples para prever o gasto com
alimentação (Y) em função da renda (X);
d. Interprete os parâmetros do modelo de regressão;
e. Obtenha os resíduos associados a cada estimativa para os gastos com alimentação;
f. Qual o gasto esperado com alimentação para uma família com renda per capita de
2.000 reais?
23
Econometria Regressão Linear Simples
3. Uma amostra de quatro anos de uma economia fictícia forneceu os seguintes dados:
Y (Consumo, bilhões de US$) 1 1 2 4
4. (ANPEC, 1992) Responda Falso ou Verdadeiro. O custo total, C, de uma indústria e sua
produção, X, têm uma relação linear do tipo Ct = α + βX t + et . Para se ajustar esse modelo por
mínimos quadrados ordinários é preciso assumir certas hipóteses como:
a. A variável independente X seja aleatória.
b. Os erros tenham média zero.
c. Os erros sigam uma distribuição normal.
d. A variável independente X seja independente do temo erro.
Respostas
2) b. σXY=13180; r=0,96; c. αˆ = 30,80 ; βˆ = 0,13 ; e. êi=-11,8; 10,0; 11,4; -13,1; 3,6; f. 290,4
24
Econometria Alexandre Gori Maia
Introdução
Após estimar os coeficientes de um modelo de regressão, deve-se verificar o grau de
confiabilidade dos resultados, ou seja, verificar em que medida as estimativas obtidas na amostra
aproximam-se dos reais parâmetros da população. Para cumprir com esse objetivo, serão
realizados testes de hipóteses e intervalos de confiança para os reais parâmetros do modelo
regressão linear simples a partir das estimativas de MQO.
Para viabilizar essas análises, é fundamental conhecer algumas importantes propriedades
estatísticas dos estimadores de MQO. A contribuição mais importante para essa análise foi dada
em 1821, quando Gauss demontrou que, sob determinadas premissas, as estimativas de MQO
seriam não viesadas e de mínima variância. Posteriormente, em 1912, Markov desenvolveu de
maneira mais usual esse mesmo teorema, que passou a ser conhecido como teorema de Gauss-
Markov.
25
Econometria Propriedades dos Estimadores
(2)
Em segundo lugar, devemos considerar que, para uma dada amostra selecionada, outras
técnicas poderiam ser aplicadas para obter os estimadores dos coeficientes α e β , não apenas o
MQO7, as quais não necessariamente chegariam aos mesmos resultados. Em outras palavras,
para uma dada amostra, poderíamos ter diferentes retas amostrais, dependendo da técnica
utilizada. O que garante que os estimadores de MQO serão melhores que outros estimadores é
uma série de condições estabelecidas pelo Teorema de Gauss-Markov.
Segundo o Teorema de Gauss-Markov, cinco pressupostos básicos devem ser satisfeitos
para que os estimadores de MQO sejam os Melhores Estimadores Lineares Não Viesados
(MELNV) ou, em ingês, Best Linear Unbiased Estimator (BLUE). Ser linear, significa que os
estimadores de α e β serão funções lineares da variável aleatória Y8. Ser não viesado significa
que o valor esperado do estimador de MQO será igual ao parâmetro da população (3) e ser o
melhor estimador significa que sua variabiliadde será a mínima possível (4).
E (αˆ ) = α e E ( βˆ ) = β (3)
7
Entre as técnicas alternativas, destaque para o Método de Máxima Verossimilhança e o Método de Momentos.
8
Pressupondo que os valores de X sejam controlados (não aleatórios), é fácil demonstrar que os estimadores de
MQO são funções lineares de Y.
26
Econometria Alexandre Gori Maia
A relação entre Y e X na população pode ser representada por uma função com
coeficientes (parâmetros) lineares9. A linearidade nas variáveis, por sua vez, não é
necessária, já que estas podem ser algebricamente transformadas em novas
variáveis que apresentem relação linear entre si. Por exemplo, o modelo
Yi = α + βX i2 + ei não é linear no regressor, mas, se criarmos a variável Z i = X i2 ,
9
Expoentes dos coeficientes iguais a 1.
27
Econometria Propriedades dos Estimadores
Enquanto os três primeiros pressupostos são necessários para que os estimadores sejam
não viesados, os dois últimos são necessários para que estes sejam os mais eficientes12.
Em adição a estes cinco pressupostos, é ainda importante que os erros estejam
normalmente distribuídos para viabilizar a aplicação de testes de hipóteses e intervalos de
confiança aos coeficientes do modelo de regressão (a ser visto no próximo tópico). Modelos
10
Lembre-se que a associação entre uma constante (X) e uma variável aleatório (e) será sempre nula.
11
É uma das condições de primeira ordem dos estimadores de MQO.
12
Para os leitores familiarizados com álgebra, as demonstrações dessas propriedades podem ser consultadas nos
Apêndices A e B.
28
Econometria Alexandre Gori Maia
baseados nessas seis pressuposições são chamados de Modelos Clássicos de Regressão Linear
(MCRL). Uma propriedade adicional muito importante dos estimadores de MQO sob a premissas
de um MCRL é que esses serão os mais eficientes (apresentarão variância mínima) entre
quaisquer estimadores não viesados de β, não apenas entre os estimadores lineares como
pressupõe o teorema de Gauss-Markov.
(5)
29
Econometria Propriedades dos Estimadores
os erros ei, por serem considerados uma soma de diferentes fatores não observáveis afetando a
variável Y, também estariam normalmente distribuídos em torno de uma média zero. Entretanto,
essa pressuposição pode não ser verdadeira, sobretudo para amostras pequenas, dependendo da
composição dos fatores não observáveis (caso estes não sejam aditivos, por exemplo) e de suas
respectivas distribuições de probabilidade. Há testes estatísticos apropriados para verificar até
que ponto a distribuição dos resíduos se aproxima de uma normal e se tal pressuposição pode ser
considerada verdadeira.
Dizer que os erros possuem distribuição normal com média zero é o mesmo que afirmar
que os valores de Yi se distribuem normalmente em torno da reta de regressão (5). Ademais, a
normalidade dos erros (e dos valores de Yi em torno da reta) implicaria ainda que os estimadores
de MQO estariam normalmente distribuídos, já que esses são combinações lineares dos valores
de Yi (ver Apêndice A). Pressupondo ainda que os estimadores de MQO sejam não viesados,
como sugere o Teorema de Gauss-Markov, teríamos que os estimadores de um MCRL estariam
normalmente distribuídos em torno dos reais parâmetros α e β .
ei ~ N (0, σ 2 )
αˆ ~ N (α , σ α̂2 ) (6)
βˆ ~ N ( β ,σ β̂2 )
13
Os valores dos parâmetros α e β não são necessários já que o objetivo dos testes de hipóteses e dos intervalos de
confiança é justamente inferir sobre seus reais valores.
30
Econometria Alexandre Gori Maia
A variância dos erros representa a dispersão quadrática média dos erros em torno da reta
de regressão. Como usualmente desconhecemos o real valor de σ2 na população, precisamos de
um estimador para estimá-lo a partir dos resíduos da amostra. Como demonstrado no Apêndice
C, o estimador não viesado de σ2 a partir dos resíduos do MQO será dada por:
2
σˆ 2 =
∑ eˆi (7)
n−2
O denominador n–2 representa o número de graus de liberdade dos resíduos e significa
que, caso se conheça n–2 valores dos resíduos, os outros dois seriam automaticamente
determinados a partir de restrições impostas às propriedades matemáticas dos estimadores de
MQO14. A raiz quadrada da variância da regressão, ou σˆ , é chamada de erro padrão da regressão
e é uma medida da dispersão média dos resíduos.
Como o cálculo do numerador da equação (7), ∑ êi2 , pode ser demasiadamente
(∑ xi y i ) 2
∑ eˆi = ∑ yi −
2 2
= ∑ y i2 − βˆ ∑ xi y i
∑ xi
2
médias destes em função da aleatoriedade da amostra. Serão dadas por (ver demonstrações no
Apêndice B):
14
São duas as restrições impostas aos resíduos: i) Σêi=0; ii) ΣêiXi=0.
31
Econometria Propriedades dos Estimadores
∑ X i2 σˆ 2 = 1 + X 2 σˆ 2 σˆ 2
Sα2ˆ = 2
e S β2ˆ = (11)
n∑ xi2 n ∑ xi
1
∑ xi2
As raízes quadradas dessas variâncias ( Sα̂ e S βˆ ) são chamadas de erros padrão dos
estimadores.
A partir dos estimadores obtidos em (11) podemos derivar algumas importantes
propriedades matemáticas:
i. Quanto maior o erro padrão da regressão, menos precisa será a estimativa dos
parâmetros: em outras palavras, quanto mais dispersos estiverem os valores
observados em torno da reta de regressão, mais dispersas serão as estimativas de
MQO. Algebricamente, pode-se observar essa propriedade a partir do numerador
das equações em (11).
ii. Quanto maior a variabilidade observada para os valores de X, mais precisa será a
estimativa dos parâmetros: a variabilidade dos valores amostrados de X é uma
importante medida da qualidade do ajuste. Baixa dispersão de X indica que a
amostra não representa uma relevante amplitude de valores. Matematicamente, a
dispersão de X será medida pelo denominador ∑ xi2 das equações em (11);
equações em (11).
32
Econometria Alexandre Gori Maia
H 0 : α = 0 H 0 : β = 0
e (12)
H 1 : α ≠ 0 H 1 : β ≠ 0
Embora menos frequentes, podem ainda ser elaborados testes para verificar se os
parâmetros α e β são diferentes, maiores ou menores que quaisquer outras constantes que não o
zero.
Pressupondo a veracidade das hipóteses nulas e conhecendo as propriedades dos
estimadores de MQO (propriedade 6 e 10), teremos as seguintes distribuições de probabilidade
para as estatísticas de teste:
(14)
Exemplo 1. Obeservou-se o consumo mensal de energia (Y, em Kwh) e o total de horas que o ar
condicionado permaneceu ligado (X, em h) em uma amostra de 21 domicílios. Os valores
observados e as estimativas de MQ para o ajuste linear foram:
33
Econometria Propriedades dos Estimadores
KWh AC KWh AC
i i
(Y) (X) (Y) (X)
1 35 1,5 12 77 7,5
2 17 2,0 13 62 7,5
3 57 2,5 14 65 7,5
4 63 4,5 15 66 8,0
5 66 5,0 16 65 8,0
6 33 5,0 17 75 8,0
7 79 6,0 18 94 8,5
8 43 6,0 19 85 12,0
9 33 6,0 20 94 12,5 Yi = 27,85 + 5,34 X i + eˆi
10 78 6,5 21 93 13,5
11 82 7,5
Em outras palavras, espera-se que para cada hora adicional com o ar condicionado ligado o
consumo de energia aumente, em média, 5,34 KWh. O consumo esperado para um domicílio que
não utilize o ar condicionado é de 27,85 KWh.
As estimativas da variância e erro padrão da regressão serão dadas por:
σˆ 2 =
∑ eˆi2 = (−0,86) 2 + (−21,53) 2 + ... + (−0,61) 2 + (−6,96) 2 = 3968,91 = 208,89
n−2 21 − 2 19
σˆ = 208,89 = 14,45
O erro padrão é uma estimativa do erro médio de previsão do modelo, ou seja, de
aproximadamente 14,45 KWh.
O próximo passo é estimar as variâncias dos coeficientes do modelo para verificar se as
estimativas de α e β são significativas, ou seja, se são estatisticamente diferentes de zero. Essas
serão dadas por:
1 X2 2 1 6,9 2
Sα2ˆ = + 2 σˆ = + 2 2
208,89 = 60,94 = 7,812
n ∑ xi 21 (−5,4) + ... + (6,6)
σˆ 2 208,89
S β2ˆ = 2
= = 1,06 = 1,03 2
1
∑ xi 196 ,6
Pode-se então, finalmente, verificar se as estimativas são significativas aplicando-se o teste de
hipóteses para aos coeficientes do modelo:
34
Econometria Alexandre Gori Maia
35
Econometria Propriedades dos Estimadores
(15)
Onde Zγ é o número de desvios padrão, obtido da distribuição Z~N(0,1), que se deve estar
afastado do centro da distribuição para que se tenha γ de probabilidade entre os dois extremos do
intervalo. Entretanto, como os reais valores σ α̂2 e σ β̂2 são desconhecidos, o uso das estimativas
Onde tn–2 é o valor da distribuição t de student com n–2 graus de liberdade para que se
tenha γ de probabilidade entre os dois extremos do intervalo.
Exemplo 2. Para estimar intervalos com confiança de 95% para os parâmetro do modelo da
relação linear entre consumo mensal de energia (Y, em Kwh) e o total de horas que o ar
condicionado permaneceu ligado (X, em h), teríamos:
IC(α , γ) = [ 27,85 − t19 (7,81); 27,85 + t19 (7,81) ]
IC(β , γ) = [ 5,34 − t19 (1,03); 5,34 + t19 (1,03) ]
Para uma confiança de 95%, por exemplo, os intervalos seriam dados por:
36
Econometria Alexandre Gori Maia
O intervalo determinado pelos valores 11,51 a 44,19 KWh é uma estimativa de um intervalo que,
em repetidas amostras de tamanho 21, conteria o real valor do parâmetro α em 95% das
situações. Por sua vez, o intervalo definido pelos valores 3,18 a 7,50 KWh é uma estimativa do
intervalo de 95% de confiança para o parâmetro β .
Exercícios
1. Observaram-se os gastos per capita com alimentação (Y) e a renda mensal per capita (X) em
uma amostra de 5 famílias:
Y 52 104 122 141 166
X 254 487 615 950 1014
a. Estime a variância dos coeficientes do modelo de regressão linear simples para
prever o gasto com alimentação (Y) em função da renda (X).
b. As estimativas dos coeficientes são significativas? Interprete.
c. Defina intervalos com confiança de 95% para os parâmetros do modelo. Interprete
seus resultados.
d. Existe alguma associação entre os resultados dos testes de hipóteses (b) e dos
intervalos de confiança (c)?
2. A partir de uma amostra de n elementos, foi estimada uma regressão linear simples, pelo
método de mínimos quadrados, obtendo-se o resultado: Yˆ = αˆ + βˆ1 X . A seguir, a mesma
regressão foi estimada sabendo-se que a reta de regressão da população passa pela origem
das coordenadas (termo constante = 0), obtendo-se o resultado: Yˆ = βˆ2 X . Pode-se afirmar
que:
a. βˆ1 = βˆ2 .
b. A reta de regressão passa pelas médias amostrais de Y e X, mesmo que o modelo
não tenha intercepto.
c. No primeiro modelo, quanto maior for a variação da variável explicativa, maior
será a precisão com que o coeficiente angular pode ser estimado.
37
Econometria Propriedades dos Estimadores
3. (ANPEC, 1996) Suponha que, num modelo de regressão linear simples, o regressor (variável
independente) seja correlacionado com o termo erro. Sobre o estimador de MQO, podemos
afirmar:
a. É, em geral, viesado.
b. Não é possível de ser obtido.
c. É não viesado, porém não é eficiente.
d. É consistente.
Respostas
1) a. Sα2ˆ = 15,38 2 ; S β2ˆ = 0,02 2 ; b. α: p=0,139; β: p=0,009; c. IC(95%;α)=[-18,16; 79,77];
IC(95%;β)=[0,06; 0,20]
2) a. F; b. F; c. V
3) a. V; b. F; c. F; d. F
38
Econometria Alexandre Gori Maia
n
xi
Para simplificar a demonstração, vamos denominar zi = n
e teremos βˆ = ∑ z i Yi
∑ x j2 i =1
j =1
n ∑(Xi − X ) 0
O primeiro termo, α ∑ z i , será igual a zero, pois α i =1
n
=α n
=0
i =1
∑ xi2 ∑ xi2
i =1 i =1
n
O segundo termo, β ∑ z i X i , sera igual a β, pois
i =1
n n n n n
∑ xi X i ∑(Xi − X )X i ∑ X i2 − ∑ X i X ∑ X i2 − nX 2
i =1 i =1 i =1 i =1 i =1
β n
=β n
=β n n n
=β n
=β
∑ xi2 ∑(Xi − X ) 2
∑ X i2 − 2∑ X i X + ∑ X 2
∑ X i2 − 2 nX + nX 2 2
i =1 i =1 i =1 i =1 i =1 i =1
Assim, teremos:
n
βˆ = β + ∑ z i ei
i =1
n n
E ( βˆ ) = E β + ∑ z i ei = β + E ∑ z i ei
i =1 i =1
39
Econometria Propriedades dos Estimadores
Pressuposto iii: e se a esperança condicional dos erros for zero, teremos finalmente:
n
E ( βˆ ) = β + ∑ z i 0 = β
i =1
αˆ = (α + β X + e ) − βˆX = α + X ( β − βˆ ) + e
Assim, a esperança de α̂ será:
E (αˆ ) = E (α ) + E[ X ( β − βˆ )] + E (e ) = α + E ( X )[ E ( β ) − E ( βˆ )] + E (e )
Pressuposto iii: dada a esperança condicional (e incondicional) zero dos erros, teremos que
E (e ) = 0
Presspostos i a iii: ademais, caso os pressupostos (i) a (iii) sejam satisfeitos, sabemos que
E ( βˆ ) = β . Então o valor esperado de α̂ será:
E (αˆ ) = α + E ( X ) × 0 + 0 = α
40
Econometria Alexandre Gori Maia
Var ( βˆ ) = E[ βˆ − E ( βˆ )]2
n
Pressupostos i a iii: supondo E ( βˆ ) = β e βˆ = β + ∑ z i ei , então:
i =1
n
Var ( βˆ ) = E ( βˆ − β ) 2 = E (∑ z i ei ) 2 = E ( z12 e12 + ... + z n2 en2 + 2 z1 z 2 e1 e2 + ... + 2 z n−1 z n en −1en )
i =1
Pressuposto iv: caso a variância dos erros será constante para qualquer i, ou seja E (ei2 ) = σ 2 e:
n n n −1
Var ( βˆ ) = ∑ z i2σ 2 + 2∑∑ z i z j E (ei e j )
i =1 i =1 j ≠i
Pressuposto v: caso os erros sejam não autocorrelacionados, ou seja, E (ei e j ) = 0 para i≠j,
então:
n
n n ∑ xi2
Var ( βˆ ) = ∑ zi2σ 2 = σ 2 ∑ zi2 = σ 2 i =1
2
i =1 i =1 n
∑ xi2
i =1
E:
ˆ σ2
Var ( β ) = n
∑ xi2
i =1
Para agora demonstrarmos que a variância dos estimador de MQO para β é a menor entre os
estimadores lineares não viesados de β , comecemos pela representação desse primeiro dada por:
41
Econometria Propriedades dos Estimadores
n
βˆ = ∑ z i Yi
i =1
Primeiro, as condições necessária para que β̂ * seja não vieasado, ou seja E ( βˆ * ) = β , são:
n
∑ wi = 0 e
i =1
n
∑ wi X i = 1
i =1
n
Como Var(Yi) = Var(ei)=σ2, então Var ( βˆ * ) = σ 2 ∑ wi2
i =1
Desenvolvendo, teremos:
n
Var ( βˆ * ) = σ 2 ∑ [( wi − z i ) 2 + 2 z i ( wi − z i ) + z i2 ] =
i =1
42
Econometria Alexandre Gori Maia
n n n
Var ( βˆ * ) = σ 2 ∑ ( wi − z i ) 2 + 2σ 2 ∑ ( z i wi − z i2 ) + σ 2 ∑ z i2
i =1 i =1 i =1
n ∑ wi xi ∑ xi2 1 1
∑ ( zi wi − z i2 ) = i =1
n
− i =1
2
= n
− n
=0
n 2
i =1
∑ xi2 ∑ xi ∑ xi2 ∑ xi2
i =1 i =1 i =1
i =1
Assim, a variância βˆ * de resume-se a:
n n n
σ2
Var ( βˆ * ) = σ 2 ∑ ( wi − z i ) 2 + σ 2 ∑ z i2 = σ 2 ∑ ( wi − z i ) 2 + n
i =1 i =1 i =1
∑ xi2
i =1
n
Como o segundo termo da equação ( σ 2 ∑ xi2 ) é constante, a variância de β̂ * será minimizada
i =1
justamente o βˆ , pois:
n n
βˆ * = ∑ wi Yi = ∑ z i Yi = β̂
i =1 i =1
Pressuposto iv e v: caso a variância dos erros seja constante, E (ei2 ) = σ 2 , e os erros sejam não
43
Econometria Propriedades dos Estimadores
σ2 1 n
σ2 nσ 2
Var (αˆ ) = X 2 n
+
n2
∑ E (ei2 ) = X 2 n
+
n2
∑ xi2 i =1
∑ xi2
i =1 i =1
E:
X2 1
Var (αˆ ) = ( n
+ )σ 2
n
∑ xi2
i =1
44
Econometria Alexandre Gori Maia
n n n n
E (∑ eˆi2 ) = E[∑ xi2 ( βˆ − β ) 2 ] − 2 E[∑ xi ( βˆ − β )(ei − e )] + E[∑ [(ei − e ) 2 ]
i =1 i =1 i =1 i =1
45
Econometria Propriedades dos Estimadores
n n 2
ˆ) = 2 σ
O primeiro termo pode ser simplicado por ∑ i x 2
Var ( β ∑ i n =σ2
x
i =1 i =1
∑ xi2
i =1
O segundo termo pode ser desenvolvido a partir de uma das propriedades do Apêndice A,
n
xi
βˆ = β + ∑ z i ei , onde z i = n
:
i =1
∑ z i2
i =1
n n
xe n
x 2e 2 x 2e e
2 E[∑ xi ( βˆ − β )(ei − e )] = 2 E[∑ xi ( β + n i i − β )(ei − e )] = 2 E[∑ ni i − ni i ]
i =1 i =1
∑ xi2 i =1
∑ xi2 ∑ xi2
i =1 i =1 i =1
Como o valor médio dos erros é zero e os valores de Xi são considerados controlados:
n
n n
x 2e 2
∑ xi2 E (ei2 )
2 E[∑ xi ( βˆ − β )(ei − e )] = 2 E[∑ ni i ] = 2 i =1
n
= 2σ 2
i =1 i =1
∑ xi2 ∑ xi2
i =1 i =1
2
n n n n
E[∑ (ei − e ) ] = E (∑
2
ei2 − ne ) = E [ ∑
2
ei2 + n ∑ ei n ]
i =1 i =1 i =1 i =1
Caso os erros sejam não correlacionados (pressuposto v), então E(eiej)=0 e
n n
E (∑ ei ) 2 = E (∑ ei2 ) . Então:
i =1 i =1
n n n n
1 n 2
E[∑ (ei − e ) 2 ] = E[∑ ei2 − n∑ ei2 n 2 ] = E[∑ ei2 − ∑ ei ] = nσ 2 − σ 2 = (n − 1)σ 2 =
i =1 i =1 i =1 i =1 n i =1
Finalmente, voltamos ao desenvolvimento da SQRes, substituindo cada termo pelos seus
respectivos desenvolvimentos:
46
Econometria Alexandre Gori Maia
n
E (∑ eˆi2 ) = σ 2 − 2σ 2 + (n − 1)σ 2 = (n − 2)σ 2
i =1
n−2 n−2
47
Econometria Intervalos de Confiança e Previsão
Introdução
Sabemos que, dependendo da amostra selecionada, teremos estimativas diferentes para os
coeficientes da regressão α e β . Assim como as estimativas variam aleatoriamente, o mesmo
Y ~ N (800, 200 2 )
A partir da fdp de Y poderíamos estimar quaisquer intervalos com probabilidades de
ocorrência de valores individuais de Y em uma amostra. O intervalo definido pelos rendimentos
entre 408 e 1192 reais conteria, por exemplo, 95% dos rendimentos de uma amostra.
Imagine, agora, que dessa população Y seja selecionada uma amostra aleatória de 100
pessoas e calculada sua média aritmética. Pelo Teorema do Limite Central, sabemos que essa
48
Econometria Alexandre Gori Maia
2
média aritmética Y estará normalmente distribuída com média de 800 reais e variância ( σ Y ) de
2002/100.
200 2
Y ~ N (800, )
100
Da mesma forma que fizemos para valores individuais de Y, podemos também estimar
intervalos com probabilidades de ocorrência dos valores de Y . Teríamos, por exemplo, 95% de
probabilidade de o rendimento médio de uma amostra de 100 pessoas estar entre 761 e 839 reais:
IC (γ , µY ) = [Y − Z γ σ Y ; Y + Z γ σ Y ] (1)
Supondo que o valor da média observada na amostra Y seja de 780, a estimativa para
esse intervalo seria:
200 200
IC (95%, µ Y ) = [780 − 1,96( ); 780 + 1,96( )] = [740,9; 819,2]
10 10
A partir da média observada na amostra ( Y =780) poderíamos ainda inferir sobre os
valores individuais de Y, ou seja, sobre os rendimentos individuais. Enquanto o intervalo de
confiança refere-se a uma estimativa para um parâmetro populacional, uma constante, o intervalo
49
Econometria Intervalos de Confiança e Previsão
IP(γ , Y ) = [Y − Z γ σ Y ; Y + Z γ σ Y ] (2)
Perceba que, enquanto a estimativa do intervalo de confiança baseia-se na variabiliade da
( σ Y ).
No nosso exemplo, a estimativa para o intervalo de previsão de 95% para os rendimentos
individuais seria dada por:
IP(95%, Y ) = [780 − 1,96(200); 780 + 1,96(200)] = [388; 1172]
15
Controlando-se os valores de Xi, a única fonte de variabilidade Yˆi será proveniente dos estimadores α̂ e βˆ , já
que Yˆi = αˆ + βˆX i . Como esses apresentam distribuição normal, uma função linear de variáveis normais terá
50
Econometria Alexandre Gori Maia
Sendo que σ Y2ˆ será dado por (ver Apêndice A para demonstração):
i
2
1 x
σ Y2ˆ = + n i σ 2 (6)
i n
∑ x 2j
j =1
Entretanto, como σ2 é desconhecido, teremos sua estimativa não tendenciosa dada por:
1 xi2 σˆ 2
S Y2ˆ = + n (7)
i n
∑ x 2j
j =1
Assim, intervalos de confiança γ para os valores previstos de Y serão dados por:
Exemplo 1. Observaram-se o consumo mensal per capita de vinho (X em litros mensais per
capita) e a taxa de mortalidade cardíaca (Y em mortes para cada grupo de 100 mil habitantes) em
19 países. Os valores observados foram:
País X Y País X Y
Alemanha 2,7 172 Holanda 1,8 167
Austrália 2,5 211 Irlanda 0,7 300
Áustria 3,9 167 Islândia 0,8 211
Bélgica 2,9 131 Itália 7,9 107
Canadá 2,4 191 Noruega 0,8 227
Dinamarca 2,9 220 Nova Zelândia 1,9 266
Espanha 6,5 86 Reino Unido 1,3 285
Estados Unidos 1,2 199 Suécia 1,6 207
Finlândia 0,8 297 Suiça 5,8 115
França 9,1 71
Pressupondo que a relação entre consumo de vinho e mortalidade cardíaca seja linear, estimou-se
o seguinte ajuste:
51
Econometria Intervalos de Confiança e Previsão
σˆ 2 = 37 ,9 2
e
1 (5 − 3) 2
S Y2ˆ = + 2 2
37,9 2 = 11,2 2
19 ( 2,7 − 3) + ...( 5,8 − 3)
i
Assim, o intervalo definido pelos valores 122 e 169 mortes/100 mil habitatantes seria uma
estimativa do intervalo que, em repetidas amostras de tamanho 19, conteria a real mortalidae
média dos países com consumo de vinho equivalente a 5 litros per capita em 95% das situações
Sendo que σ Y2i será dado por (ver demonstração no Apêndice A):
1 x2
σ Y2ˆ = 1 + + n i σ 2 (10)
i n
∑ x 2j
j =1
52
Econometria Alexandre Gori Maia
1 x2
S Y2i = 1 + + n i σˆ 2 (11)
n
∑ x 2j
j =1
Assim, intervalos de previsão de γ para valores individuais de Y serão dados por:
Exemplo 2. No exemplo (1) tínhamos uma estimativa por intervalo para a mortalidade cardíaca
média em países com consumo de vinho equivalente a 5 litros per capita. Suponha que agora
desejamos uma estimativa por intervalo para as mortalidades de cada país, não mais para a
mortalidade média. Em outras palavras, uma estimativa por intervalo de, por exemplo, 95% para
as taxas individuais de mortalidade seria dada por:
IC (95%, Yi ) = [145,7 − 2,11(39,5); 145,7 + 2,11(39,5)] = [62,4; 229,0]
Pois:
1 (5 − 3) 2
S Y2i = 1 + + 2 2
37 ,9 2 = 39,5 2
19 ( 2,7 − 3) + ...( 5,8 − 3)
Assim, os valores 62 e 229 mortes/100 mil habitantes definiriam a estimativa de um intervalo de
95% de probabilidade para as taxas de mortalidade de países com consumo de 5 litros de vinho
per capita.
53
Econometria Intervalos de Confiança e Previsão
Exemplo 3. A Figura abaixo apresenta as faixas de amplitude para os intervalos de confiança dos
valores previsos (faixas mais estreitas) e para os intervalos de previsão dos valores individuais
(faixas mais largas) da mortalidade por grupo de 100 mil habitantes.
54
Econometria Alexandre Gori Maia
Em segundo lugar, como as variâncias de Yˆi e Yi dependem do valor controlado de Xi, observa-
se que as amplitudes dos dois intervalos tendem a aumentar à medida que os valores controlados
de X afastam-se da médias de suas observações (3 litros per capita), o que está associado à
menor precisão para extrapolações distantes do conjunto de valores ovservados.
Exercícios
1. A partir dos gastos per capita com alimentação (Y) e a renda mensal per capita (X) em uma
amostra de 5 famílias, pede-se:
Y 52 104 122 141 166
X 254 487 615 950 1014
a. Estabeleça uma previsão, com 95% de confiança, para a despesa mensal média
das famílias com renda mensal de 1.500 reais e para possíveis valores individuais
dos gastos dessa mesma família. Interprete os resultados.
Respostas
1) a. IC(90%, E[Yi])=[229,8 ± 57,9]; IP(90%, Yi)=[229,8 ± 70,7];
55
Econometria Intervalos de Confiança e Previsão
Yˆ* = αˆ + βˆX *
Var (Yˆ* ) = Var (αˆ + βˆX * ) = Var (αˆ ) + Var ( βˆ ) X *2 + 2Cov (αˆ , βˆX * )
da covariância entre α̂ e βˆ para dar continuidade ao desenvolvimento algébrico. Esta será dada
por:
Cov(αˆ , βˆ ) = E[αˆ − E (αˆ )][ βˆ − E ( βˆ )]
2
1 (X − X )
Var (Yˆ* ) = [ + *n ]σ 2
n
∑ xi2
i =1
Por sua vez, a representação do valor individual Yi, dado o valor de X * , será dada por:
Como os resíduos não são relacionados aos valores previstos de Y, a variância de Yi* será dada
por:
56
Econometria Alexandre Gori Maia
2 2
1 (X − X ) 1 (X − X )
Var (Yi* ) = Var (αˆ + βˆX * ) + Var (eˆi* ) = [ + *n ]σ 2 + σ 2 = [ + *n + 1]σ 2
n n
∑ xi2 ∑ xi2
i =1 i =1
57
Econometria Formas Funcionais
4. Formas Funcionais
Introdução
Sabemos que o MQO limita-se ao ajuste de funções lineares, ou seja, ao ajuste de uma
reta no caso de regressão linear simples. Entretanto, há relações que, embora originalmente
sejam não lineares nas variáveis, podem ser transformadas em relações lineares por anamorfose,
ou seja, através de transformações de suas variáveis originais. Isso significa que, caso a relação
entre Y e X não seja linear, podemos encontrar transformações f(Y) e g(X) tais que as relações
entre estas funções sejam lineares. Seria o caso, por exemplo, de uma relação quadrática entre Y
e X ( Yi = α + βX i2 + ei ), que se transformaria em linear quando analisada em relação a Y e Z=X2
( Yi = α + βZ i + ei ).
58
Econometria Alexandre Gori Maia
Yi = α + β X i + ei (1)
E[Y / 0] = α + β (0) = α
e
(2)
∆Y ∂Y ∂ (α + βX )
= = =β
∆X ∂X ∂X
Exemplo 1. Observou-se, durante 19 dias, a relação entre o total de vendas nos finais de semana
de uma sorveteria (Y, em 1.000 R$) e a temperatura média (X, em oC). Pressupondo que haja
uma relação linear de determinação entre as variáveis, o modelo ajustado foi:
59
Econometria Formas Funcionais
A estimativa do coeficiente angular sugere que, para cada aumento unitário na temperatura
média (∆X=1 oC), haja um incremento médio e constante de 125 reais nas vendas de sorvete
(∆Y=0,125×1.000 R$). O intercepto negativo não possui interpretação econômica, pois indicaria
um venda esperada negativa caso a temperatura média fosse igual a 0 oC. Este ocorre porque os
valores observados na amostra limitam-se basicamente a temperaturas entre 20 e 40º C, ficando
muito difícil prever o que ocorreria com uma temperatura igual a 0o C.
ln(Yi ) = α + β X i + ei (3)
As relações dos coeficientes com as variáveis do modelo linear, que eram dadas
diretamente com Y e X, passam, agora, a ser dadas entre ln(Y) e X:
E[ln(Y ) / 0] = α + β (0) = α
e
(4)
∆ ln(Y ) d ln(Y ) d (α + βX )
= = =β
∆X dX dX
60
Econometria Alexandre Gori Maia
Como a interpretação de variações absolutas no valor esperado de ln(Y) não é algo trivial,
a relação direta entre variações de X e Y pode ser obtida através de algumas propriedades básicas
do cálculo diferencial:
E[ln(Y ) / 0] = α ⇒ E[Y / 0] ≈ eα
e
∆ ln(Y ) ∆Y / Yi
=β ⇒ =β
∆X ∆X (5)
pois
∆ ln(Y ) 1 ∆Y
= ⇒ ∆ ln(Y ) =
∆Y Yi Yi
Isso significa que variações absolutas marginais em ln(Y), ou seja, ∆ln(Y), representam
variações relativas em Y (∆Y/Yi). Assim, o coeficiente angular β representará a variação relativa
em Y dada uma variação unitária em X, pois quando ∆X=1, teremos ∆Y/Yi=β e,
consequentemente, ∆Y=βYi.
Já a representação para o valor esperado de Y quando X é igual a zero (E[Y/0] ≈eα) deve
ser interpretada de forma aproximada. O antilogaritmo trata-se, na verdade, de uma estimativa
viesada para a esperança condicional de Y para qualquer valor condicionado de X, já que o valor
médio de ln(Y) corresponde ao log da média geométrica de Y e não de sua média aritmética.
Exemplo 2. Uma amostra ofereceu informações sobre a renda mensal (Y, em R$) e anos
completos de escolaridade (X) de 94 ocupados do estado de São Paulo em 2007. Acredita-se que
a renda cresça exponencialmente com os anos de escolaridade, ou seja, acréscimos absolutos nos
anos de escolaridade implicariam em variações absolutas maiores no rendimento médio para
aqueles com escolaridade mais elevada: A relação estabelecida seria dada por:
61
Econometria Formas Funcionais
Assim, o coeficiente angular sugere que, para cada ano adicional de escolaridade (∆X=1), haja
um incremento médio relativo constante de 12,1% no rendimento do trabalho (∆Y=0,121Yi).
Espera-se ainda que o rendimento daqueles sem escolaridade (X=0) seja de aproximadamente
406 reais (e6,006)16.
Yi = α + β ln( X i ) + ei (6)
16
Lembre-se que se trata de uma estimativa viesada do valor esperado de Y.
62
Econometria Alexandre Gori Maia
∆Y dY d [α + β ln( X )]
= = =β (7)
∆ ln( X ) d ln( X ) d ln( X )
Cabe agora compreender a relação entre variações em ln(X) e variações em X, o que pode
ser feito através de desenvolvimento análogo ao realizado para os coeficientes do modelo log-lin:
∆Y ∆Y
=β ⇒ =β
∆ ln( X ) ∆X / X i
pois (8)
∆ ln( X ) 1 ∆X
= ⇒ ∆ ln( X ) =
∆X Xi Xi
Isso significa que variações absolutas em ln(X), ou seja, ∆ln(X), representam variações
relativas em X (∆X/Xi). Assim, o coeficiente angular β representará variações absolutas em Y
(∆Y) dada uma variação relativa de 100% em X (∆X/Xi=1=100%). Como o cálculo diferencial
considera apenas variações infinitesimais das variáveis, não seria conveniente considerar 100%
de variação em X como uma variação marginal. Assim, em modelos lin-log, é sempre
recomendado considerar que uma variação de 1% em X causará um impacto de β/100 em Y (ou
seja, dividir os dois lados da relação por 100).
Exemplo 3. Para analisar a relação entre a jornada de trabalho (X, em h) e o rendimento hora do
trabalho (X, em R$/h) observou-se uma amostra de 92 ocupados com rendimentos positivos do
estado de São Paulo no ano de 2007. Pressupõe-se que o aumento da renda tenha um efeito
positivo sobre a jornada de trabalho, já que o custo do lazer tornar-se-ia relativamente mais caro
para rendimentos mais elevados. Entretanto, essa relação não seria linear, já que à medida que a
renda cresça indefinidamente, esperam-se variações cada vez mais tênues sobre a jornada de
63
Econometria Formas Funcionais
Assim, a princípio, o coeficiente angular sugeriria que, para cada variação relativa de 100% no
rendimento do trabalho (∆ln(X)=1), haveria um acréscimo médio de 4,79 horas na jornada
semana de trabalho. Entretanto, como um incremento de 100% no rendimento não pode ser
considerado uma variação marginal, o correto seria afirmar que, para cada variação relativa de
1% no rendimento hora do trabalho, espera-se um incremento absoluto de 0,0490 horas (2,87
minutos) na jornada de trabalho do ocupado.
Yi = φX iβ e ei
ou, com α=ln(φ): (9)
ln(Yi ) = α + β ln( X i ) + ei
64
Econometria Alexandre Gori Maia
Como, de (5) e (8), sabemos que variações absolutas em ln(X) e ln(Y) representam,
respectivamente, variações relativas em X e Y, o coeficiente angular β representará as variações
relativas em Y (∆Y/Yi) dada uma variação relativa de 100% em X (∆X/Xi=1). Entretanto, por
conveniência analítica, a interpretação correta é que, dada uma variação de 1% em X, espera-se
uma variação de (β/100)% em Y.
∆ ln(Y ) ∆Y / Yi
=β ⇒ =β
∆ ln( X ) ∆X / X i (11)
Exemplo 4. Obteve-se uma amostra de 94 municípios brasileiros para analisar a relação entre a
taxa de visitação a um parque nacional (Y, em visitas/1000 habitantes) e o custo de viagem para
uma pessoa se deslocar do município de residência ao parque (X, em R$). Espera-se que haja
uma elasticidade constante entre taxa de visitação e custo de viagem, ou seja, incrementos
percentuais no custo de viagem gerariam reduções percentuais na taxa de visitação.
65
Econometria Formas Funcionais
Exercícios
1. A partir dos gastos per capita com alimentação (Y) e a renda mensal per capita (X) em uma
amostra de 5 famílias, pede-se:
Y 52 104 122 141 166
X 254 487 615 950 1014
a. As estimativas para os coeficientes do modelo: ln(Y)=α + β ln(X) + e. Interprete os
resultados
b. As estimativas são significativas?
c. Qual a despesa esperada para uma família com renda equivalente a 1.000 reais?
2. Uma amostra de 4 anos forneceu os seguintes dados sobre a emissão de CO2 (Y, em ton) e
PIB (X, em bilhões de US$ correntes):
Y 5 7 9 10
X 10 12 14 16
Suponha ainda que a relação entre as variáveis seja dada por ln(Y)=α + β X + e. Pede-se:
a. Estime e interprete os coeficientes do modelo por MQO.
b. Calcule e interprete a significância dos coeficientes estimados.
Utilize a seguinte tabela de conversão dos valores:
66
Econometria Alexandre Gori Maia
Z 5 7 9 10 12 14 16
ln(Z) 1,6 1,9 2,2 2,3 2,5 2,6 2,8
Respostas
1) a. αˆ = −0,279 ; αˆ = 0,779 ; b. α: p=0,688; β: p=0,004; c. Yˆ = 163,9 .
67
Econometria Análise de Variância
3. Análise de Variância
Introdução
Um bom modelo de regressão é aquele capaz de explicar em grande medida o
comportamento da variável dependente Y. Portanto, para avaliar a qualidade de um ajuste, nada
mais natural que medir a parcela do comportamento de Y explicada pela variável explanatória X,
comparando-a com a associada aos resíduos do ajuste.
Passo fundamental para esse tipo de análise foi dado por Ronald Fisher em 1925, com a
publicação do livro intitulado “Statistical Methods for Research Workers”. Para muitos, a obra
mais influente da estatística moderna. Fisher desenvolveu o conceito de Análise de Variância, na
qual o comportamento de um resultado de interesse pode ser dividido entre aquele devido a
fatores controlados e aquele devido a fatores não controlados.
Para entender como o conceito de Análise de Variância pode ser aplicado à RLS, serão
apresentadas algumas medidas simples e intuitivas de análise do comportamento de uma variável
para, ao final, sistematizar os resultados na Análise de Variância.
68
Econometria Alexandre Gori Maia
(1)
A medida estatística da variabilidade total de Y é dada pela Soma Total dos Quadrados
(STQ) e será calculada pela distância quadrática total dos valores de Y em relação à média
aritmética Y . Em outras palavras:
n
STQ = ∑ (Yi − Y )2 (2)
i =1
(3)
Não é difícil demonstrar que a STQ pode ser decomposta em dois fatores principais: um
associado aos desvios dos valores previstos do modelo em relação à média de Y, ou seja, ŷi , e
69
Econometria Análise de Variância
Lembrando, a partir das propriedades dos estimadores de MQO, que os valores previstos
n
de Y não estão associados aos resíduos de MQO ( ∑ yˆ i eˆi = 0 ).
i =1
de Y ( Y ). Em outras palavras, a Soma dos Quadrados da Regressão (SQReg) será dada por:
n n
SQ Re g = ∑ yˆ i2 = ∑ (Yˆi − Y )2 (5)
i =1 i =1
Graficamente, a SQReg representa a soma das distâncias quadráticas dos pontos da reta
em relação à média aritmética.
(6)
A parcela da variabilidade de Y não explicada por X será medida pela Soma dos
Quadrados dos Resíduos (SQRes). Como o próprio nome diz, a SQRes será dada pela soma
quadrática dos resíduos (Yi Ŷi ) ou, em outras palavras:
n n
SQ Re s = ∑ eˆi2 = ∑ (Yi − Yˆi )2 (7)
i =1 i =1
70
Econometria Alexandre Gori Maia
(8)
n n n
SQ Re g = ∑ (Yˆi − Y )2 = βˆ 2 ∑ xi = βˆ ∑ xi y i
2
(10)
i =1 i =1 i =1
n n n n
SQ Re s = ∑ (Yi − Yˆi )2 = ∑ eˆi = ∑ yi2 − βˆ ∑ xi yi
2
(11)
i =1 i =1 i =1 i =1
Exemplo 1. Seja a relação entre consumo mensal de energia (Y, em kWh) e total de horas que o
ar condicionado permaneceu ligado (X, em h). Os valores observados para uma amostra de 21
domicílios foram:
kWh AC kWh AC
i i
(Y) (X) (Y) (X)
1 35 1,5 12 77 7,5
2 17 2,0 13 62 7,5
3 57 2,5 14 65 7,5
4 63 4,5 15 66 8,0
5 66 5,0 16 65 8,0
6 33 5,0 17 75 8,0
7 79 6,0 18 94 8,5
8 43 6,0 19 85 12,0
9 33 6,0 20 94 12,5
10 78 6,5 21 93 13,5 Yi = 27,85 + 5,34 X i + eˆi
11 82 7,5
71
Econometria Análise de Variância
72
Econometria Alexandre Gori Maia
Dessa análise pode-se extrair uma medida simples e muito útil de qualidade do ajuste, o
coeficiente de determinação (R2). O R2 estima a proporção da variabilidade da variável
dependente que é explicada pela variável independente do modelo de regressão. Em outras
palavras:
n n
SQ Re g ∑ yˆ i2 ∑ (Yˆ i − Y )2
R2 = = i =1
n
= i =1
n (12)
STQ
∑yi =1
2
i ∑ (Y
i =1
i −Y ) 2
(14)
73
Econometria Análise de Variância
Outra precaução em relação à análise do R2 refere-se ao fato de valores baixos para esta
estatística não necessariamente significar um ajuste insatisfatório. Algumas variáveis, como, por
exemplo, a riqueza de uma pessoa, são muito difíceis de serem determinadas quantitativamente e
mesmo uma baixa contribuição de um fator explanatório pode nos dar uma importante fonte de
informação.
Exemplo 2. Calculadas as somas dos quadrados para o consumo de energia, o R2 será facilmente
obtido por:
9578,6
R2 = = 0,586
5609,7
Em outras palavras, 58,6% da variabilidade do consumo de energia elétrica é explicada pelo total
de horas que o ar condicionado permanece ligado. Os demais 41,4% seriam determinados por
outros equipamentos ou mesmo por diferenças entre os ar condicionados.
74
Econometria Alexandre Gori Maia
observações com valores fixos para chegarmos às igualdades necessárias às estimativas dos
parâmetros α e β. A SQReg, por sua vez, possui apenas 1 grau de liberdade já que, de acordo
com a equação (10), apenas o estimador de β apresentaria variabilidade em função da amostra
(lembre-se que os valores de Xi são considerados fixos). A estatística F seguirá, portanto, uma
distribuição F com 1 grau de liberdade no numerador e n − 2 graus de liberdade no
denominador.
A razão da SQReg pelos seus respectivos graus de liberdade é chamada de Quadrado
Médio da Regressão e representa uma medida de variabilidade quadrática média explicada pelo
modelo. Por sua vez, a razão da SQRes pelos seus respectivos graus de liberdade é chamada de
Quadrado Médio dos Resíduos, que é igual à variância da regressão (σˆ 2 ) .
Sob a hipótese nula de que o modelo não contribui para explicar o comportamento de Y,
espera-se que a SQReg seja mínima e a SQRes seja máxima, fazendo com que a estatística F
apresente valores baixos. O valor esperado da estatística F na hipótese de contribuição nula do
modelo será igual a 1, como é demonstrado no Apêndice A.
À medida que o modelo contribua significativamente para explicar o comportamento de
Y, a SQReg tende a ser máxima e a SQRes mínima, fazendo com que a estatística F apresente
valores elevados. Assim, quão maior o valor da estatística F, mais evidências teremos para
rejeitar a hipótese nula de que o modelo não contribui para explicar o comportamento de Y. O
valor p será a medida da probabilidade de erro que estaremos sujeitos caso rejeitássemos H0, ou
seja, caso afirmássemos que o modelo contribui para explicar a variabilidade de Y.
(15)
Perceba ainda que, no caso da RLS, testar a hipótese nula de que o modelo não contribui
para explicar a variabilidade de Y é a mesma coisa que testar se o coeficiente associado à
variável X (β) é igual a zero. Isso porque, como só há uma variável independente no modelo,
caso β seja nulo significa que a melhor previsão para Y seria sua média aritmética, fazendo com
que SQT seja igual à SQRes.
Uma síntese dos resultados é dada pela Tabela ANOVA:
75
Econometria Análise de Variância
(15)
A estatítsica F obtida pela razão entre os quadrados médios terá 1 grau de liberdade no
numerador e 19 no denominador. Assim, a probabiliade de erro associada à estimativa obtida
será praticamente nula.
Em outras palavras, pode-se afirmar que o modelo ou, no caso, as horas de ar condicionado
ligado, contribua significativamente para explicar a variabilidade do consumo de energia. A
probabilidade de errro ao fazermos tal afirmação é praticamente nula.
Exercícios
1. A partir dos gastos per capita com alimentação (Y) e a renda mensal per capita (X) em uma
amostra de 5 famílias, pede-se:
76
Econometria Alexandre Gori Maia
Respostas
1) a. SQReg=6843,7; SQRes=552,3; STQ=7396; b. R2=0,925; d. p=0,009.
77
Econometria Análise de Variância
n n
( ∑ xi y i ) 2
SQ Re g = βˆ 2 ∑ xi 2 = βˆ ∑ xi yi = i =1
n
i =1 i =1
∑ xi 2
i =1
y i = Yi − Y = (α + β X i + ei ) − (α + β X + e ) = β ( X i − X ) + ei − e = βxi + ei − e
Continuando o desenvolvimento da SQReg, teremos então:
n n n n n n
[∑ xi ( βˆxi + ei − e )] 2 ( βˆ ∑ xi2 + ∑ xi ei − e ∑ xi ) 2 ( βˆ ∑ xi2 + ∑ xi ei ) 2
i =1 i =1 i =1 i =1 i =1 i =1
SQ Re g = n
= n
= n
∑ xi2 ∑ xi2 ∑ xi2
i =1 i =1 i =1
n n n n
βˆ 2 (∑ xi2 ) 2 + 2βˆ ∑ xi2 ∑ xi ei + (∑ xi ei ) 2
i =1 i =1 i =1 i =1
SQ Re g = n
∑ xi2
i =1
Pressupondo que os erros sejam não correlacionados aos valores de X (Σxiei=0) teremos:
n n n n n
βˆ 2 (∑ xi2 ) 2 + 2βˆ ∑ xi2 ∑ xi ei + (∑ xi ei ) 2 n ∑ xi2 ei2
SQ Re g = i =1 i =1
n
i =1 i =1
= βˆ 2 ∑ xi2 + i =1
n
∑ xi2 i =1
∑ xi2
i =1 i =1
78
Econometria Alexandre Gori Maia
n
σ 2 ∑ xi2 n
E ( SQ Re g ) = β 2 ∑ xi2 + n
i =1
= β 2 ∑ xi2 + σ 2
i =1
∑ xi2 i =1
i =1
Procedimentos análogos devem agora ser realizados para a STQ (a SQRes será obtida a partir da
diferença entre STQ e SQReg):
n n n
STQ = ∑ yi2 = ∑ ( βxi + ei − e ) 2 = ∑ [ β 2 xi2 + 2 xi (ei − e ) + (ei − e ) 2 ]
i =1 i =1 i =1
n n n n n n n
STQ = β 2 ∑ xi2 + 2∑ xi ei − 2e ∑ xi + ∑ (ei − e ) 2 = β 2 ∑ xi2 + 2∑ xi ei + ∑ (ei − e ) 2
i =1 i =1 i =1 i =1 i =1 i =1 i =1
n
O último termo da expressão - ∑ (ei − e ) 2 - pode ainda ser dado por:
i =1
n n n n n n
∑ (ei − e ) 2 = ∑ ei2 − 2e ∑ ei + ∑ e 2 = ∑ ei2 − 2e ∑ ei + ne 2
i =1 i =1 i =1 i =1 i =1 i =1
2
n n n n n n n n
∑ (ei − e ) 2
=∑ ei2 − 2 ∑ ei n ∑ ei + n ∑ ei n = ∑ ei2 − 2 (∑ ei ) 2 n + (∑ ei ) 2 n
i =1 i =1 i =1 i =1 i =1 i =1 i =1 i =1
n n n
∑ (ei − e ) 2 = ∑ ei2 − (∑ ei ) 2 n
i =1 i =1 i =1
Pressupondo que os valores de X sejam não correlacionados aos erros e a variância dos erros
seja constante, teremos:
n n
E ( STQ) = β 2 ∑ xi2 + nσ 2 − nσ 2 n = β 2 ∑ xi2 + (n − 1)σ 2
i =1 i =1
Definidos os valores esperados para SQReg e STQ, calculamos agora para a SQRes:
79
Econometria Análise de Variância
n n
E ( SQ Re s ) = E ( STQ) − E ( SQ Re g ) = [ β 2 ∑ xi2 + (n − 1)σ 2 ] − [ β 2 ∑ xi2 + σ 2 ]
i =1 i =1
E ( SQ Re s) = (n − 2)σ 2
Finalmente, teremos o valor esperado para a estatística F:
n
β 2 ∑ xi2 + σ 2
SQ Re g 1 i =1
E ( F ) = E[ ]=
SQ Re g ( n − 2) σ2
Caso o valor de β seja zero (hipótese nula do teste F para a Análise de Variância), teremos:
σ2
E ( F | β = 0) = =1
σ2
80
Econometria Alexandre Gori Maia
PARTE II
81
Econometria Regressão Linear Múltipla
Introdução
Embora a regressão com apenas uma variável independente seja operacionalmente
simples e muito útil para compreendermos conceitos e cálculos, acaba, na prática, sendo pouco
utilizada, já que mais de um fator explanatório costuma afetar o comportamento de uma variável
dependente. Ademais, como a presença nos erros de fatores relacionados à variável independente
tende a viesar as relações de causa e efeito, o ideal seria também controlá-los como regressores
adicionais em nosso modelo. O modelo de regressão linear com mais de uma variável
independente é chamado de regressão linear múltipla (RLM).
O conceito de regressão múltipla foi introduzido por Karl Pearson em 1908 e vem sendo
constantemente aperfeiçoado. O MQO também pode ser utilizado para obter seus estimadores, os
quais apresentam procedimentos de cálculos e propriedades muito semelhantes àquelas da RLS.
Embora os cálculos possam se tornar complexos, o emprego da álgebra matricial pode facilitar
seu desenvolvimento.
Uma das grandes virtudes da RLM é permitir a análise do efeito isolado de fatores
explanatórios sobre a variável dependente. Em outras palavras, permite, por exemplo, verificar o
impacto da variação do preço sobre as vendas de uma mercadoria, desde que os preços de seus
substitutos não se alterem. Apresentaremos, neste capítulo, os principais conceitos que envolvem
a RLM, assim como o cálculo de seus estimadores pelo método de MQO.
82
Econometria Alexandre Gori Maia
. (1)
Yi = α + β X i + ei Yi = α + β1 X 1i + β 2 X 2i + ei
Em ambas as situações, o MQO pode ser empregado para obter os estimadores que
minimizam o erro quadrático total (EQT), ou seja, a soma dos quadrados dos erros de previsão.
No caso da RLS, o EQT será função das estimativas de α e β , pois:
EQT (αˆ , βˆ1 , βˆ2 ) = ∑ eˆi2 = ∑ [Yi − (αˆ + βˆ1 X 1i + βˆ2 X 2i )]2 (3)
Aplicando-se os conceitos de cálculo diferencial, sabemos que os parâmetros que
minimizam a função de EQT são aqueles em que as respectivas derivadas parciais igualam-se a
zero. No caso da função de EQT para a RLS (2), os estimadores de α e β seriam dados por:
∂EQT
= 0 ⇒ αˆ = Y − βˆX
∂αˆ
(4)
∂EQT
= 0 ⇒ βˆ =
∑ xi yi
∂βˆ ∑ xi2
E, no caso da funçao de EQT para a RLM (3), teríamos os seguintes estimadores de
MQO:
∂EQT
= 0 ⇒ αˆ = Y − βˆ1 X 1 − βˆ2 X 2
∂αˆ
∂EQT (∑ yi x1i )(∑ x22i ) − (∑ yi x2i )(∑ x1i x2i )
= 0 ⇒ βˆ1 = (5)
∂βˆ 1 (∑ x12i )(∑ x22i ) − (∑ x1i x2i ) 2
83
Econometria Regressão Linear Múltipla
Em outras palavras, os estimadores obtidos em (4) são aqueles que minimizam o EQT do
modelo de RLS proposto em (1) e os estimadores obtidos em (5) são aqueles que minimizam o
EQT do modelo de RLM proposto também em (1).
Para interpretar os coeficientes dos modelos de RLS e RLM, podemos desenvolver
alguns simples exercícios matemáticos. No caso do modelo de RLS, α representará o valor
esperado de Y quando X for nulo e β representará a variação marginal esperada em Y dada uma
variação unitária em X. Isso porque:
E[Y / X = 0] = α
∂Y (6)
=β
∂X
A partir de desenvolvimento análogo chegamos às interpretações dos parâmetros do
modelo de RLM (equações 7). Neste caso, destaca-se o fato de as derivadas parciais
representarem as relações entre as variações marginais de duas variáveis mantendo-se as demais
constantes. Assim, α representará o valor esperado de Y quando ambos X1 e X2 forem nulos; β1
será a variação marginal esperada em Y dada uma variação unitária em X1, mantendo-se X2
constante; e β2 será a variação marginal esperada em Y dada uma variação unitária em X2,
mantendo-se X2 constante.
E[Y / X 1 = 0, X 2 = 0] = α
∂Y
= β1
∂X 2 (7)
∂Y
= β2
∂X 2
Como as derivadas parciais (β1 e β2) são constantes, dizemos ainda que a variação
marginal esperada em Y dada, por exemplo, uma variação unitária em X1 será independente do
valor de X2 e vice-versa17. Graficamente, podemos observar que a inclinação do plano em (1) é a
mesma para todos os valores de X1 e X2.
17
Nem sempre a variação marginal em Y será independente dos valores dos regressores. Por exemplo, no modelo
84
Econometria Alexandre Gori Maia
O modelo de RLM com duas variáveis independentes pode ser extrapolado para um
conjunto de k variáveis independentes. Genericamente, um modelo de regressão linear múltipla
com k variáveis independentes e p (p=k+1) parâmetros será dado por:
Yi = α + β1 X 1i + β1 X 2i + ... + β k X ki + ei (8)
Onde:
α é o valor esperado de Y quando todos as variáveis independentes forem nulas;
βk é a variação esperada em Y dado um incremento unitário em Xk, mantendo-se
constantes todas as demais variáveis independentes;
ei é o erro não explicado pelo modelo.
Exemplo 1. Suponha dois modelos para prever o consumo de energia elétrica de domicílios
(Kwh):
Kwhi = α + βACi + ei Kwhi = α + β1 ACi + β 2 SECi + ei
O primeiro caso pressupõe que o consumo de energia seja unicamente determinado pelas horas
de ar condicionado ligado (AC). Nesse caso, α indicaria o consumo de energia esperado para
uma residência em que o ar condicionao permaneça desligado e β indicaria o consumo de
energia adicional esperado para cada hora adicional com ar condicionado ligado.
No segundo, pressupõe-se que o consumo de energia seja conjuntamente determinado por uma
função linear das horas de ar condicionado e secadora (SEC) ligados. Neste caso, α indicaria o
consumo esperado de energia quando ambos ar condicionado e secadora permaneçam
desligados. O coeficiente β1 indicaria o aumento no consumo esperado de energia para cada hora
adicional com ar condicionado ligado, mantendo-se constante o tempo de uso da secadora.
Analogamente, o coeficiente β2 indicaria o efeito isolado de uma hora adicional com a secadora
ligada sobre o consumo esperado de energia.
85
Econometria Regressão Linear Múltipla
Para compreender esse processo, suponha inicialmente um modelo de RLS com sua
equivalente representação matricial:
Yi = α + β X i + ei y = Xβ + e
ou ou
Y1 = α + βX 1 + e1 Y1 1 X 1 e1 Y1 1 X1 e1
(9)
Y2 = α + βX 2 + e2 Y2 1 X 2 e2 Y2 1 X 2 α e2
... = α ... + β ... + ... ⇒ ... = ... +
... ... β ...
Y 1 X e Y 1 X n e
Yn = α + βX n + en n n n n n
A partir da função linear em (9), sabemos que, para obter os estimadores de MQO,
devemos minimizar sua função de EQT (equações 2 e 4). Analogamente, podemos também
derivar a expressão matricial obtida em (9) para obter a notação matricial dos estimadores de
MQO. Neste caso, a função de EQT será expressa por:
EQT = eˆ T eˆ (10)
Onde
eˆ = y − yˆ
yˆ = Xβˆ
(11)
αˆ
β̂ =
ˆ
β
Aplicando cálculo diferencial em funções matriciais chegaremos ao vetor de estimadores
que minimiza a função EQT (o desenvolvimento desta derivada é apresentado no Apêndice A):
∂EQT
= 0 ⇒ βˆ = ( X T X) −1 ( X T y ) (12)
ˆ
∂β
A grande vantagem da expressão matricial para o cálculo dos estimadores de α e β, no
caso, do vetor coluna β̂ , é que este é indiferente ao número de variáveis. Assim, para o caso do
modelo de regressão múltipla com k variáveis independentes e p coeficientes teríamos:
86
Econometria Alexandre Gori Maia
Yi = α + β1 X 1 + β 2 X 2 + ... + β k X k + ei
ou
Y1 = α + β1 X 11 + β 2 X 21 + ... + β k X k1 + e1
(13)
Y2 = α + β1 X 12 + β 2 X 22 + ... + β k X k2 + e2
...
Yn = α + β1 X 1n + β 2 X 2n + ... + β k X kn + en
Com a equivalente representação matricial:
y = Xβ + e
ou
(14)
Sendo que o vetor de estimadores de MQO continua sendo dado por (12).
Importante ainda destacar que as pressuposições do modelo de regressão linear múltipla
para que os estimadores de MQO sejam os MELNV são muito semelhantes às do modelo
simples:
1. A v.a. Yi é uma função linear das variáveis explanatórias (Xij, j=1..k);
2. Os valores de Xj são fixos (controlados) em repetidas amostras;
3. Esperança condicional dos erros igual a zero, ou seja, E(ei)=0;
4. Os erros são homocedásticos, ou seja, E( ei2 )=σ2;
87
Econometria Regressão Linear Múltipla
y = Xβˆ + eˆ
ou
βˆ = ( X T X) −1 ( X T y )
88
Econometria Alexandre Gori Maia
−1
1 5 21 4
1 1 1 1 1 1 1 1
1 10 30 6
βˆ = 5 10 15 0 5 10 15 0
1 15 40 8
21 30 40 50
21 30 40 50
1 0 50 6
−1
4 30 141 24 0,829
ˆ
β = 30 350 1005 200 = 0,203
141 1005 5441 884 0,103
Assim, o ajuste de MQO seria dado por:
Em outras palavras, espera-se, para cada ano adicional de estudo do ocupado, um aumento de
0,203 SM na renda do trabalho, mantendo-se constante a idade da pessoa. E, para cada ano de
idade adicional, espera-se um aumento de 0,103 SM na renda, independente dos anos de
escolaridade.
89
Econometria Regressão Linear Múltipla
Yi = α + βX i + ei
Onde:
αˆ = Y − βˆ X
n n
(16)
∑ ( X i − X )(Yi − Y ) ∑ xi yi
βˆ = i =1
n
= i =1
n
2 2
∑(Xi − X ) ∑ xi
i =1 i =1
y i = Yi − Y e xi = X i − X (18)
Geometricamente, isso significa que substituimos os eixos originais por aqueles
representando os valores médios de Y e X. Assim, o novo modelo passará obrigatoriamente pela
origem sem, entretanto, qualquer mudança na inclinação ou qualidade do ajuste.
(19)
Para demostrar que o novo ajuste terá intercepto nulo e inclinação semelhante à de (16),
basta lembrarmos que a soma dos desvios em relação à média aritmética é igual a zero.
Consequentemente:
y=0 e x=0 (20)
E:
αˆ ′ = y − βˆ x = 0
n n
∑ ( xi − x )( yi − y ) ∑ xi y i (21)
βˆ ′ = i =1
n
= i =1
n
= βˆ
∑ ( xi − x ) 2 ∑ xi2
i =1 i =1
90
Econometria Alexandre Gori Maia
Uma vez estimado o valor de βˆ ′ (ou β̂ ), pode-se chegar a α̂ (da equação 16) através de:
αˆ = Y − βˆ X = Y − βˆ ′X (22)
(24)
Para demostrar que o novo ajuste terá intercepto igual à média de Y e inclinação
semelhante à de (16), devemos desenvolver:
α̂ ′ = Y − βˆ x = Y
n n
∑ ( xi − x )(Yi − Y ) ∑ xi y i (25)
βˆ ′ = i =1
n
= i =1
n
= β̂
∑ ( xi − x ) 2 ∑ xi2
i =1 i =1
αˆ = Y − βˆ X = Y − βˆ ′X (26)
91
Econometria Regressão Linear Múltipla
Duas matrizes utilizadas em muitas fases da análise de regressão linear múltipla (por
exemplo, na equação 12) são:
n
∑ X1 j ∑ X1 j
... ∑ Xk j
∑ X1 ∑ X 12 ∑ X1 X 2 ... ∑ X1 X k
XT X = j J j j j j
e
... ... ... ... ...
∑ X k ∑ X1j X k j ∑ X2j Xkj ... ∑ X k2J
j
(27)
∑Y j
XT y =
∑ X 1 j
Y j
...
∑ X k Yj
j
Entretanto, se considerarmos um ajuste com variáveis independentes centradas, onde:
x k i = X ki − X k (28)
O sistema de equações será dado por:
Y1 1 x11 x 21 ... x k1 α ′ e1
Y2 1 x12 x 22 ... x k2 β1 e2
... = ... ... + (29)
... ... ... ... ...
Y 1 x
n 1n x 2n ... x kn β k en
Como:
∑ j xk j = 0 (30)
Teremos:
n 0 0 ... 0 ∑Y j
T 0 ∑ x12J ∑ x1 j x2 j ... ∑ x1 j xk j T ∑ x1 j Y j
X X=
... ... ... ... ... e X y = ... (31)
0
∑x 1j xk j ∑x 2j xk j ... ∑x 2
kJ
∑ xk Y j
j
Que é mais fácil de ser invertida que a matriz XTX em (27). Assim como no ajuste de
variáveis independentes centradas de RLS, o ajuste de RLM terá a mesma inclinação (β’s) e
qualidade do ajuste. Apenas o intercepto α’ de (29) será diferente do α de (9), já que o primeiro
representará o valor médio de Y (ver equação 26). Entranto, a estimativa do intercepto para o
modelo original pode facilmente ser obtido por:
αˆ = Y − ∑i βˆi X i (32)
92
Econometria Alexandre Gori Maia
X 1 = 7,5 e X 2 = 35,25
E os dados da amostra ficariam:
Y 4 6 8 6
x1 -2,5 2,5 7,5 -7,5
x2 -14,25 -5,25 4,75 14,75
O ajuste seria então com as variáveis centradas x1 e x2:
Yi = α ′ + β1 x1i + β 2 x2i + ei
Que, a partir da notação matricial, teríamos:
y = Xβˆ + eˆ
ou
4 1 - 2,5 - 14,25 αˆ ′ eˆ1
6 1 2,5 - 5,25 ˆ eˆ2
8 = 1 7,5 β1 +
4,75 eˆ3
6 1 - 7,5 14,75 βˆ2 eˆ
4
Devemos então calcular o vetor de estimadores de β:
βˆ = ( X T X ) −1 ( X T y )
Resolvendo as operações matriciais chegaremos a:
−1
4 0 0 24 6
βˆ = 0 125 - 52,5 20 = 0,203
0 - 52,5 470,75 38 0,103
Note que a matriz XTX ficou muito mais fácil de ser invertida. O termo 4 na primeira linha e
primeira coluna pode ser invertido isoladamente e, invertendo a sub-matriz resultante, cujo
determinante é 56088:
93
Econometria Regressão Linear Múltipla
1/4 0 0 24 6
1 -1
βˆ = 0 (470,75) (−52,25) 20 = 0,203
56088 56088
-1 1 38 0,103
0 (−52,25) (125)
56088 56088
Falta apenas obter a constante do modelo com variáveis originais, que, segundo equação (31),
será dado por:
αˆ = 6 − [0,203(7,5) + 0,103(35,25)] = 0,829
Chegando ao ajuste de MQO:
Yi = 0,829 + 0,203 X 1i + 0,103 X 2i + eˆi
Exercícios
1. Observaram-se os gastos mensais com alimentação (Y, em 1000 reais), renda mensal (X1, em
1000 reais) e distância da residência ao supermercado mais próximo (X2, em km) de 4
domicílios:
Y 0,4 0,2 0,3 0,6
X1 1 2 2 3
X2 2 3 3 2
a) Estime e interprete os coeficientes do modelo de regressão linear múltipla para os
gastos mensais com alimentação em função da renda mensal e tamanho da família;
2. Sejam as seguintes informações sobre o consumo de frango (Y), renda disponível (X1) e preço
do frango (X2) em 4 diferentes anos:
Ano 1974 1975 1976 1977
Y (kg per capita) 74 82 84 110
X1 (1.000 R$) 6 8 8 10
X2 (R$ / kg) 0.8 1.2 1.2 1.0
a) Estime e interprete os coeficientes da função demanda relacionando o consumo à renda
e ao preço do frango;
b) Estime e interprete os coeficientes da função demanda relacionando o log do consumo
ao log da renda e ao log do preço do frango;
94
Econometria Alexandre Gori Maia
3. Uma amostra de 4 países forneceu os seguintes dados sobre mortalidade infantil (Y, em
mortes para cada mil nascidos vivos), PIB per capita (X1, em mil dólares) e número de
médicos (X2, em médios por 1000 habitantes):
Y 5 4 7 8
X1 10 12 13 16
X2 3 2 1 0
Suponha agora que a relação entre as variáveis seja dada por:
Yi = α + β1 ln( X 1 ) + β 2 X 2 + ei
a) Estime os coeficientes do modelo por MQ;
b) Interprete as estimativas dos coeficientes angulares;
Caso necessário, trabalhe com os seguintes valores para o logaritmo natural:
Z 1 2 3 4 5 7 8 10 12 13 16
ln(Z) 0 0,7 1,1 1,4 1,6 1,9 2,1 2,3 2,5 2,6 2,8
4. Uma amostra de 4 empresas que produzem o mesmo tipo de produto forneceu os seguintes
dados sobre o total de venda (Y, em milhões de reais), investimento (X1, em milhões de reais)
e horas trabalhadas (X2, em mil horas):
95
Econometria Regressão Linear Múltipla
Yi = β 0 + β1 X 1i + β 2 X 2i + K + β k X ki + ei
Pode-se afirmar que:
a) O método, dos mínimos quadrados ordinários (MQO), usado para estimar os coeficientes
β j , j = 0,1,K , k exige que o erro tenha distribuição normal.
b) Os estimadores de MQO dos coeficientes β j , j = 0,1,K , k são não viciados (ou não
viesados).
c) Os coeficientes β j , j = 0,1, K , k podem ser interpretados como as elasticidades entre os
regressores X j e a variável Y.
Respostas
1) a. βˆ ′ = (0,8; 0,1; −0,25)
5) a. F; b. F; c. F;
6) a. F; b. F; c. F;
96
Econometria Alexandre Gori Maia
Desenvolvendo teremos:
EQT = y T y − y T Xβˆ − βˆ T X T y + βˆ T X T Xβˆ
Como os produtos das matrizes y T Xβˆ e βˆ T X T y resultam em grandezas escalares e uma é
transposta da outra, essas podem ser somadas:
EQT = y T y − 2βˆ T X T y + βˆ T X T Xβˆ
Para encontrarmos o ponto de mínimo de EQT, devemos igualar a zero sua derivada em relação
a β̂ . Primeiro, a representação da derivada do escalar EQT em função do vetor β̂ será dada por:
∂ ( w T Aw )
= 2 Aw
∂w
Em forma de um vetor coluna, ou:
97
Econometria Regressão Linear Múltipla
∂ ( w T Aw )
= 2w T A
∂w
Em forma de um vetor linha.
Então, prosseguindo com a diferenciação da função EQT, teremos:
Para minimizarmos a função de EQT, devemos igualar sua derivada a zero e teremos:
2 X T Xβˆ = 2 X T y
Ou, simplesmente:
βˆ = ( X T X) −1 X T y
98
Econometria Alexandre Gori Maia
βˆ = ( X T X) −1 X T ( Xβ + e) = ( X T X ) −1 ( X T X)β + ( X T X) −1 X T e
E, como ( X T X ) −1 ( X T X) = I :
βˆ = β + ( X T X) −1 X T e
Pressupondo que os valores de Xj sejam fixos (pressuposto ii) e que a esperança condicional dos
erros seja zero (pressuposto iii), o valor esperado de β̂ será:
E (βˆ ) = β + ( X T X) −1 X T E (e)
E (βˆ ) = β
Var (βˆ ) = ( X T X) −1 X T σ 2 IX ( X T X ) −1
99
Econometria Regressão Linear Múltipla
βˆ ∗ = W T y
Onde W é uma matriz de ordem n × k com valores que definem uma combinação linear de y.
Considerando que y = Xβ + e teremos:
βˆ ∗ = W T ( Xβ + e) = W T Xβ + W T e
E (βˆ ∗ ) = E ( W T Xβ + W T e) = W T Xβ + W T E (e)
Pressupondo a esperança dos erros igual a zero (pressuposto iii):
E (βˆ ∗ ) = E ( W T Xβ + W T e) = W T Xβ
Assim, para que β̂ ∗ seja não viesado, ou seja E (βˆ ∗ ) = β , devemos ter:
WT X = I
Assumindo W T X = I :
Var (βˆ ∗ ) = E[( W T e)( W T e) T ] = E ( W T ee T W ) = W T E (ee T ) W = W T Wσ 2
100
Econometria Alexandre Gori Maia
Ou seja, a variância do estimador de MQO será sempre menor ou igual à de outro estimador β̂ ∗
linear não viesado de β.
101
Econometria ANOVA para Regressão Linear Múltipla
Introdução
Após estimar e interpretar os coeficientes de um modelo de RLM pelo MQO, é
necessário iniciar a análise da qualidade do ajuste. Em outras palavras, é preciso verificar em que
medida podemos inferir sobre a relação linear entre as variáveis na população a partir do que
observamos na amostra.
Passos essencias para essa análise são a elaboração da tabela ANOVA e o cálculo do
coeficiente de determinação. Embora com procedimentos muito semelhantes aos da RLS, essa
análise da variabilidade dos resíduos com múltiplas variáveis independentes possui algumas
peculiaridades e requer atenção na interpretação. Em especial, na compreensão dos efeitos
parciais e combinados das variáveis independentes sobre a dependente.
i =1 i =1
18
O desenvolvimento algébrico dessas expressões pode ser acompanhado no Apêndice A.
102
Econometria Alexandre Gori Maia
(4)
Sabemos que os graus de liberdade da STQ são iguais a n–1 pois, das n observações da
amostra, uma apresentará valor fixo em função da restrição imposta pela equação ∑ (Yi − Y ) = 0 .
Os resíduos, por sua vez, apresentarão n–(k+1) graus de liberdade pois k+1 restrições são
impostas às n observações da amostra para obter os parâmetros do modelo (pressupondo um
modelo de RLM com k coeficientes angulares e um intercepto)19. E a regressão apresentará
apenas k graus de liberdades, equivalentes ao número de coeficientes angulares que podem variar
aleatoriamente para obtenção da SQReg.
Da tabela ANOVA derivam-se duas importantes estatísticas da qualidade do ajuste da
regressão linear: o coeficiente de determinação (R2) e a estatística F. O coeficiente de
determinação é uma medida descritiva da proporção da variabilidade da variável dependente que
é explicada pelo conjunto das k variáveis independentes do modelo de regressão, sendo dado por:
19
As restrições impostas à SQRes referem-se à soma zero dos resíduos e à ausência de correlação entre os resíduos e
cada uma das variáveis independentes. Em outras palavras: ∑ eˆi = 0 ; ∑ eˆi X 1
i
= 0 ; ...; ∑ eˆi X k i
=0
103
Econometria ANOVA para Regressão Linear Múltipla
SQ Re g SQ Re s
R2 = = 1− (5)
STQ STQ
A estatística F, por sua vez, permite verificar se a variabilidade explicada pelo ajuste de
regressão é significativa, ou seja, se o valor observado de R2 na amostra pode ser considerado
estatisticamente diferente de zero. A estatística F será dada pela razão entre os quadrados médios
da regressão e dos resíduos:
SQ Re g / k
F= ~ Fk ,n −k −1 (6)
SQ Re s /(n − k − 1)
As propriedades da estatística F para a RLM são semelhantes àquelas da RLS. Sob a
hipótese nula de que o modelo não contribui para explicar o comportamento de Y, espera-se que
a SQReg seja mínima e a SQRes seja máxima, fazendo com que a estatística F apresente valores
baixos. O valor esperado da estatística F na hipótese de contribuição nula do modelo será igual a
1.
À medida que o modelo contribua significativamente para explicar o comportamento de
Y, a SQReg tende a ser máxima e a SQRes mínima, fazendo com que a estatística F apresente
valores elevados. Assim, quão maior o valor da estatística F, mais evidências teremos para
rejeitar a hipótese nula de que o modelo não contribui para explicar o comportamento de Y. O
valor p será a medida da probabilidade de erro que estaremos sujeitos caso rejeitemos H0.
(7)
Um detalhe importante desse teste F para a RLM é que não rejeitar H0 implica afirmar
que nenhuma das k variáveis independentes contribui para explicar a variabilidade de Y. Assim,
se o modelo não contribui para explicar Y, todos os coeficientes angulares serão iguais a zero, já
que nenhuma variável independente seria necessária no modelo. Por outro lado, se o modelo
contribui para explicar Y, pelo menos um coeficiente angular seria diferente de zero. Ou seja,
pelo menos uma variável independente seria necessária no modelo, não necessariamente todas.
104
Econometria Alexandre Gori Maia
Uma representação esquemática de possíveis resultados para o ajuste de RLM com duas
variáveis independentes Y = α + β1 X 1 + β 2 X 2 + e é apresentada na Figura (8). Os três primeiros
exemplos representam situações em que pelos menos uma das variáveis independentes contribui
para explicar a variabilidade de Y e, consequentemente, a hipótese nula deveria ser rejeitada. No
último exemplo, nenhuma das variáveis contribui para explicar a variabilidade de Y e a hipótese
nula não deveria ser rejeitada.
(8)
Exemplo 1. Vamos aproveitar os resultados obtidos no ajuste estabelecido para a relação linear
entre a variável dependente rendimento familiar (Y) e as variáveis independentes anos de estudo
(X1) e idade do responsável pela família (X2), onde:
Yi = 0,829 + 0,203 X 1i + 0,103 X 2i + eˆi
O primeiro passo na análise da qualidade do ajuste é obter as somas dos quadrados:
105
Econometria ANOVA para Regressão Linear Múltipla
4
6
STQ = y y − nY = (4 6 8 6) − 4(6) 2 = 152 − 144 = 8
T 2
8
6
24
SQ Re g = βˆ T X T y − nY 2 = (0,829 0,203 0,103) 200 − 4(6) 2 = 151,998 − 144 = 7,998
884
SQ Re s = STQ − SQ Re g = 8 − 7,998
O coeficiente de determinação será então dado por:
SQReg
R2 = = 0,9998
STQ
Significando que as variáveis independentes anos de estudo e idade da pessoa responsável pela
família explicam, conjuntamente, quase a totalidade (99,98%) da variabilidade observada para a
renda familiar na amostra.
Embora expressiva, essa contribuição não pode ser considerada estatisticamente significativa
sem a realização do teste F da ANOVA. A estatística F para testar a hipótese nula de que todos
os coeficientes angulares são iguais a zero será dada pela razão entre os quadrados médios da
regressão e dos resíduos. Os resultados aparecem sistematizados na tabela ANOVA:
106
Econometria Alexandre Gori Maia
mesmo valor. Assim, modelos com mais variáveis independentes tendem a apresentar valores
mais elevados para o R2. Por exemplo, sejam as medidas de qualidade do ajuste:
(10)
A inclusão de uma variável independente adicional (X3) iria, na pior das hipóteses,
manter o mesmo valor para SQReg e R2 (R2y12, no exemplo) quando esta variável não possuir
qualquer relação linear com Y:
(11)
107
Econometria ANOVA para Regressão Linear Múltipla
1. Se k=1, R2= R 2 ;
2. Se k>1, R2≥ R 2 ;
3. R 2 pode ser negativo.
Exercícios
1. A partir de informações sobre os gastos mensais com alimentação (Y, em 1000 reais), renda
mensal (X1, em 1000 reais) e distância ao supermercado mais próximo (X2, em km) de 4
famílias, pede-se:
Y 0,4 0,2 0,3 0,6
X1 1 2 2 3
X2 2 3 3 2
a) Calcule STQ, SQReg e SQRes;
b) Calcule e interprete R2 e R 2 ;
c) Construa tabela ANOVA e interprete o teste F.
108
Econometria Alexandre Gori Maia
2. Sejam as seguintes informações sobre o consumo de frango (Y), renda disponível (X1) e preço
do frango (X2) em 4 diferentes anos:
Ano 1974 1975 1976 1977
Y (kg per capita) 74 82 84 110
X1 (1.000 R$) 6 8 8 10
X2 (R$ / kg) 0.8 1.2 1.2 1.0
a) Estime e interprete os resultados da tabela ANOVA pressuponto que a relação entre as
variáveis seja dada por Y = α + β1 X 1 + β 2 X 2 + e ;
b) Estime e interprete os resultados da tabela ANOVA pressuponto que a relação entre as
variáveis seja dada por ln(Y ) = α + β1 ln( X 1 ) + β 2 ln( X 2 ) + e ;
c) Qual dos dois modelos você considera mais apropriado para representar a relação entre as
variáveis?
3. Uma amostra de 4 países forneceu os seguintes dados sobre mortalidade infantil (Y, em
mortes para cada mil nascidos vivos), PIB per capita (X1, em mil dólares) e número de
médicos (X2, em médios por 1000 habitantes):
Y 5 4 7 8
X1 10 12 13 16
X2 3 2 1 0
Suponha agora que a relação entre as variáveis seja dada por:
Yi = α + β1 ln( X 1 ) + β 2 X 2 + ei
a) Construa a tabela ANOVA e interprete o nível de significância do teste F;
b) Calcule e interprete o coeficiente de determinação e o coeficiente de determinação ajustado.
Caso seja necessário, trabalhe com os seguintes valores para o logaritmo natural:
Z 1 2 3 4 5 7 8 10 12 13 16
ln(Z) 0 0,7 1,1 1,4 1,6 1,9 2,1 2,3 2,5 2,6 2,8
109
Econometria ANOVA para Regressão Linear Múltipla
4. Uma amostra de 4 empresas que produzem o mesmo tipo de produto forneceu os seguintes
dados sobre o total de venda (Y, em milhões de reais), investimento (X1, em milhões de reais)
e horas trabalhadas (X2, em mil horas):
Y X
1
X
2
ln(Y) ln(X1) ln(X2)
Respostas
1) a. STQ=0,0875; SQReg=0,0825; SQRes=0,005; b. R2=0,9429; R 2 =0,8286; c. F=8,25;
p=0,2391.
110
Econometria Alexandre Gori Maia
111
Econometria ANOVA para Regressão Linear Múltipla
SQ Re s = y T y − 2βˆ T X T y + βˆ T X T y
Teremos, então, a expressão matricial para a SQRes:
SQ Re s = y T y − βˆ T X T y
i =1 i =1 i =1 i =1 i =1
n
Como y T y = ∑ Yi 2 teremos a expressão matricial para a STQ:
i =1
STQ = y T y − nY 2
Então:
SQ Re g = βˆ T X T y − nY 2
112
Econometria Alexandre Gori Maia
Introdução
A partir de algumas propriedades do modelo clássico de regressão linear, podemos
realizar inferências para os coeficientes e esperanças condicionais do modelo de RLM. Para
viabilizar essas análises, o primeiro passo é estimar a variância dos estimadores de MQO que,
sob as premissas do Teorema de Gauss-Markov, serão não viesados e de variância mínima. O
segundo passo é conhecer a distribuição de probabilidade dos estimadores que, sob a premissa de
normalidade dos erros, também estariam normalmente distribuídos. A partir de então, poderemos
realizar testes de hipóteses para os desconhecidos parâmetros da regressão ou estabelecer
intervalos de confiança para valores esperados da variável dependente.
(1)
H 0 : β j = 0
(2)
H1 : β j ≠ 0
Como β j representa o efeito isolado de Xj sobre Y, depois de controlado o efeito das
demais variáveis independentes, rejeitar a hipótese nula significa afirmar que Xj apresenta
113
Econometria Inferência em Regressão Linear Múltipla
relação linear isolada com Y ou, em outras palavras, que Xj contribua isoladamente para explicar
a variabilidade de Y.
Para testar a hipótese nula em (2) precisamos conhecer: i) a estatística de teste
apropriada; ii) a distribuição de probabilidade dessa estatística. Sob as premissas do modelo
clássico de regressão linear, o estimador β̂ j de MQO, que é uma função linear dos erros do
(3)
estimadores βˆ j , que, em notação matricial, será dada por (ver Apêndice B do Capítulo 6):
Var (αˆ )
Cov(αˆ , βˆ1 ) ... Cov(αˆ , βˆk )
Cov( βˆ1 , αˆ ) Var ( βˆ1 ) ... Cov( βˆ1 , βˆk )
Var (βˆ ) = (5)
... ... ... ...
Cov( βˆ , αˆ ) Cov( βˆ , βˆ ) ... Var ( βˆk )
k k 1
20
Sabemos, da demonstração apresentada no Apêndice B do Capítulo 6, que βˆ = β + ( XT X) −1 XT e . Sendo β um
vetor de constantes e X uma matriz de valores fixos, temos que β̂ será uma função linear do vetor de variáveis
aleatórias e.
114
Econometria Alexandre Gori Maia
eˆ T eˆ y T y − βˆ T X T y
σˆ 2 = = (6)
n − (k + 1) n − (k + 1)
Teremos então a matriz de estimadores de σ β̂2 dada por:
βˆ j ~N (0 , σ 2βˆ ) (9)
j
(10)
21
Não confundir com constante do modelo de regressão, embora ambos sejam representados pela letra grega “α”.
115
Econometria Inferência em Regressão Linear Múltipla
Exemplo 1. A partir do ajuste estabelecido para a relação linear entre a variável dependente
rendimento familiar (Y) e as variáveis independentes anos de estudo (X1) e idade do responsável
pela família (X2), vamos proceder com o teste de hipóteses para os coeficientes do modelo. O
modelo ajustado foi:
Yi = 0,829 + 0,203 X 1i + 0,103 X 2i + eˆi
A matriz de estimativas das variâncias e covariâncias dos coeficientes será dada por:
−1
4 30 141
S βˆ = ( X X) σˆ = 30 350 1005 σˆ 2
2 T −1 2
eˆ T eˆ 0,002
σˆ 2 = = = 0,002
n − (k + 1) 4 − (2 + 1)
Teremos então:
E:
Assim, a probabilidade de erro ao afirmarmos que a variável anos de estudo do responsável pela
família tenha relação linear isolada com a renda familiar é de apenas 1,2% e podemos rejeitar H0.
116
Econometria Alexandre Gori Maia
Resultado semelhante ocorre para o teste do coeficiente β2, associado à variável idade do
responsável. Podemos afirmar que a idade tenha relação linear isolada com a renda familiar com
uma chance de erro de apenas 1,2%.
α
β1
c0α + c1 β1 + ... + c k β k = (c0 c1 ... ck ) = c T β (11)
...
β
k
Como veremos posteriormente, a combinação cTβ pode ser utilizada para testar
combinações dos parâmetros ou estabelecer previsões para Y. Por hora, analisemos as
propriedades dessa combinação linear. A primeira diz que uma combinação linear dos
estimadores de MQO será também um estimador não viesado da combinação dos parâmetros.
Em outras palavras:
E (c T βˆ ) = c T E (βˆ ) = c T β (12)
Podemos ainda demonstrar facilmente qual será a variância dessa combinação linear:
117
Econometria Inferência em Regressão Linear Múltipla
H 0 : β1 = β 2
(16)
H 1 : β1 ≠ β 2
Testar a hipótese nula H0 é o mesmo que testar a nulidade da seguinte combinação linear:
(0)α + (1) β1 + (−1) β 2 ... + (0) β k = 0 (17)
Ou, matricialmente:
α
β
(0 1 − 1 0 ... 0) 1 = cT β = 0 (18)
...
β
k
Neste caso, a estatística de teste seria dada por:
αˆ
βˆ
(0 1 − 1 0 ... 0) 1 = cT βˆ (19)
...
βˆ
k
Como uma função linear de variáveis aleatórias normalmente distribuídas é também
apresenta uma distribuição normal, teremos a seguinte distribuição para a estatística de teste:
118
Econometria Alexandre Gori Maia
(21)
H 0 : β1 = β 2
H 1 : β1 > β 2
A hipótese nula pode também ser representada pela combinação linear:
α
(0)α + (1) β1 + (−1) β 2 = 0 ou, matricialmente, (0 1 − 1) β1 = c T β = 0
β
2
A estatística de teste será, por sua vez, dada por:
αˆ 0,829
Tˆ ˆ
c β = (0 1 − 1) β1 = (0 1 − 1) 0,203 = 0,10
βˆ 0,103
2
Com variância estimada por:
S c2T βˆ = c T ( XT X) −1 cσˆ 2
−1
4 30 141 0
S c2T βˆ = (0 1 − 1) 30 350 1005 1 0,002 = 0,0000156
141 1005 5441 − 1
Podemos, então, dar continuidade ao teste de hipóteses. Supondo a veracidade da hipótese nula, a
estatística cT βˆ estará normalmente distribuída em torno de zero. O objetivo é estimar a
119
Econometria Inferência em Regressão Linear Múltipla
probabilidade de erro (valor p) associado à rejeição da hipótese nula. Como se trata de um teste
unicaudal, a região de rejeição estará associada a valores positivos de cT βˆ ( β̂1 > β̂ 2 ):
O valor da estatística observada na amostra (0,10) estaria 25,32 erros padrão afastado do centro
da distribuição e a probabilidade de erro associada a esse valor é de 1,3%. Em outras palavras, se
afirmarmos que o efeito isolado da escolaridade seja superior ao da idade da pessoa responsável,
estaremos sujeitos a um erro de apenas 1,3%. Há, assim, fortes evidências estatísticas para
afirmar que o efeito parcial da escolaridade sobre a renda seja superior ao da idade.
αˆ
βˆ1
(
Yˆi = x T βˆ = 1 X 1i X 2i ... X ki ) ... (23)
βˆ
k
Lembrando que esta previsão é uma estimativa da real esperança condicional na
população dada por:
E (Yi / X 1i ,..., X ki ) = α + β1 X 1i + β 2 X 2i + ... + β k X ki (24)
Ou, matricialmente:
α
β1
(
E (Yi / X 1i ,..., X ki ) = x T β = 1 X 1i X 2i ... X ki )
... (25)
β
k
120
Econometria Alexandre Gori Maia
Para estabelecermos uma estimativa por intervalo para E(Yi) precisamos conhecer a
distribuição da estatística xT βˆ , ou simplesmente Ŷi . Esta, por ser uma combinação linear de
variáveis normais, apresentará também distribuição normal:
x T βˆ ~ N (x T β, σ x2T β̂ ) (26)
E já sabemos que a variância de uma combinação linear será dada por:
σ x2T βˆ = xT ( X T X) −1 xσ 2 (27)
Por trabalharmos, na prática, com valores da amostra, o estimador da variância será:
(29)
Assim, uma estimativa com confiança de γ para E(Yi) seria dada por:
Exemplo 3. Uma família onde o responsável tenha nível superior completo (X1=15) e 30 anos de
idade (X2=30) teria uma renda familiar prevista pelo modelo do exemplo (1) de:
121
Econometria Inferência em Regressão Linear Múltipla
0,829
Tˆ
ˆ
Yi = x β = (1 15 30 ) 0,203 = 6,983
0,103
Onde Ŷi seria uma v.a. com distribuição dada por:
Yˆi ~ N ( E (Yi ), x T ( XT X) −1 xσ 2 )
Com variância estimada por:
−1
4 30 141 1
S x2T βˆ T T −1 2
= x ( X X) xσˆ = (1 15 30) 30 350 1005 15 0,002 = 0,00127
141 1005 5441 30
Uma estimativa por intervalo com 95% de confiança seria, por exemplo, dada por:
Onde o valor da estatística t com 1 grau de liberdade (resíduos) representa o número de erros
padrão a se deslocar à direita e à esquerda do valor previsto para que se tenham 95% de
probabilidade em um intervalo simétrico. Assim, a estimativa para o intervalo com 95% de
confiança para E(Yi) seria dada por:
IC[E(Yi );0,95 ] = [6,983 ± 0,452]
E significaria a estimativa para o intervalo que conteria a real renda esperada de uma família
onde o responsável tenha superior completo e 30 anos de idade em 95% das situações (repetidas
amostras).
Exercícios
1. A partir de informações sobre os gastos mensais com alimentação (Y, em 1000 reais), renda
mensal (X1, em 1000 reais) e distância ao supermercado (X2, em número de integrantes) de 4
famílias, pede-se:
Y 0,4 0,2 0,3 0,6
X1 1 2 2 3
122
Econometria Alexandre Gori Maia
X2 2 3 3 2
a. Obtenha e interprete os valores p associados ao teste de hipóteses para os
coeficientes angulares do modelo.
b. Há evidências significativas para afirmar que o efeito conjunto de um integrante
adicional e um aumento de 1000 reais na renda sobre os gastos mensais com
alimentação seja negativo?
c. Estabeleça e interprete uma estimativa por intervalo com 90% para os gastos
esperados de uma família com renda mensal de 5.000 reais e com 2 integrantes.
2. Sejam as seguintes informações sobre o consumo de frango (Y), renda disponível (X1) e preço
do frango (X2) em 4 diferentes anos:
Ano 1974 1975 1976 1977
Y (kg per capita) 74 82 84 110
X1 (1.000 R$) 6 8 8 10
X2 (R$ / kg) 0.8 1.2 1.2 1.0
a. Há evidências significativas para afirmar que uma redução de 3% no preço do
frango tenha um efeito marginal superior sobre o consumo de frango que o
acréscimo de 1% na renda disponível?
3. Uma amostra de 4 países forneceu os seguintes dados sobre mortalidade infantil (Y, em
mortes para cada mil nascidos vivos), PIB per capita (X1, em mil dólares) e número de
médicos (X2, em médios por 1000 habitantes):
Y 5 4 7 8
X1 10 12 13 16
X2 3 2 1 0
Supondo que a relação entre as variáveis seja dada por:
Yi = α + β1 ln( X 1 ) + β 2 X 2 + ei
a. Estime e interprete um intervalo com 90% de confiança para a mortalidade
infantil de um país com PIB per capita de 10 mil dólares e 1 médico por 1000
habitantes.
Caso necessário, trabalhe com os seguintes valores para o logaritmo natural:
123
Econometria Inferência em Regressão Linear Múltipla
Z 1 2 3 4 5 7 8 10 12 13 16
ln(Z) 0 0,7 1,1 1,4 1,6 1,9 2,1 2,3 2,5 2,6 2,8
Respostas
1) a. β1: t=2; p=0,295; β2: t=-3,54; p=0,175; b. S c2T βˆ = 0,0075 ; t=--1,732; p=0,167; c.
IC[E(Yi);95%]=[0,8±0,999].
4) a. V; b. F.
5) V.
124
Econometria Alexandre Gori Maia
9. Contribuição Marginal
Introdução
A contribuição marginal mede a parcela da variabilidade de Y que é explicada
exclusivamente por uma ou mais variáveis independentes, após considerada a contribuição das
demais variáveis independentes do modelo. Em outras palavras, desejamos saber qual a parcela
da SQReg devida exclusivamente a uma variável Xj, ou a um grupo de q variáveis independentes.
Pode ser útil, por exemplo, para decidirmos se é necessária a inclusão de uma variável
independente (ou de um grupo de variáveis) em um modelo de RLM após a consideração dos
demais fatores explanatórios. Identificada esta contribuição marginal, podemos ainda realizar
inferências para saber se essa parcela da variabilidade explicada pode ser considerada
siginificativa.
Para viabilizar essas análises, veremos primeiramente como desagregar a variabilidade
total explicada pelo modelo entre as parcelas devidas às contribuições parciais (ou marginais) de
cada variável independente e a parcela devida à contribuição conjunta. Posteriormente, veremos
como o teste F pode ser aplicado para verificar a significância destas contribuições marginais.
125
Econometria Contribuição Marginal
seriam 2, já que há duas variáveis independentes no modelo ou, em outras palavras, o valor da
SQReg dependeria da variação aleatória de β̂1 e βˆ 2 .
SQRegir (2)
O modelo (1) será, a partir de agora, denominado modelo irrestrito (ir), pois não são
feitas quaisquer restrições sobre os valores dos coeficientes β1 e β2. Sua SQReg será, agora,
representada por SQRegir.
Suponha agora que coloquemos a restrição de que o coeficiente β2 seja igual a zero.
Teríamos então o modelo restrito (r), ou seja, com restrição em um de seus coeficientes (β2=0):
Yi = α + β1 X 1i + ei (3)
A SQRreg desse ajuste (SQRegr) seria, portanto, uma medida da variabilidade de Y
explicada exclusivamente por X1 (Figura 4). Teria apenas 1 grau de liberdade, já que sua
estimativa dependeria unicamente da variação aleatória de β̂1 :
SQRegr (4)
Podemos estender esse raciocínio para um ajuste de RLM com k variáveis independentes
e verificar, por exemplo, se um subconjunto de q variáveis independentes apresenta contribuição
significativa sobre Y. Nesse caso, o modelo irrestrito de RLM seria dado por:
Y = α + β1 X 1 + β 2 X 2 + ... + β k X k + e (6)
126
Econometria Alexandre Gori Maia
( Rir2 − Rr2 ) / q
F= (10)
(1 − Rir2 ) /( n − k − 1)
A equação (10) é particularmente útil pois em muitos trabalhos não dispomos dos
resultados das somas dos quadrados, apenas dos coeficientes de determinação dos ajustes.
Entretanto, como o R2 refere-se ao percentual da variabilidade da variável dependente explicada
127
Econometria Contribuição Marginal
pelo modelo, a utilização da equação (10) exige sempre supor que as variáveis dependentes do
modelo restrito e irrestrito são as mesmas.
(11)
Para testar a hipótese nula de que não há contribuição marginal (expressão 8), devemos
estimar a probabilidade de erro p associada ao valor estimado de F em (9), que terá distribuição
Fq,n–k–1. O valor p indicará a probabilidade de erro ao rejeitarmos H0, ou seja, a chance de erro ao
afirmarmos que o grupo de q variáveis independente contribui para explicar a variabiliade de Y.
(12)
Exemplo 1. Dada a relação entre renda familiar (Y), anos de estudo (X1) e idade (X2) do
responsável pela família, podemos afirmar que a contribuição marginal da idade seja
significativa?
Para identificar a contribuição marginal da idade, o primeiro passo é verificar a contribuição do
conjunto de variáveis independentes (X1 e X2) no ajuste para o modelo irrestrito:
128
Econometria Alexandre Gori Maia
129
Econometria Contribuição Marginal
Em outras palavras, não haveria evidências para afirmar que a contribuição marginal da idade
sobre a variabilidade da renda familiar seja significativa. A probabilidade de erro ao fazermos tal
afirmação seria muito alta, de aproximadamente 63%.
130
Econometria Alexandre Gori Maia
Para, por exemplo, calcular rY1.2 , primeiro devemos isolar a parcela de Y não associada a
X2. A parcela de Y não associada a X2 estaria contida nos resíduos (êY2) do ajuste:
Posteriormente, devemos isolar a parcela de X1 não associada a X2, que estaria contida
nos resíduos (ê12) do ajuste:
Por sua vez, a correlação parcial entre Y e X1, isolando-se o efeito de X2, seria então dada
pela relação entre os resíduos dos dois ajustes:
Embora trabalhosa, a vantagem dessa estimativa por etapas é que pode ser facilmente
generalizada para o caso com k variáveis independentes. Mas, no caso de duas variáveis
independentes, pode-se demonstrar que o coeficiente de correlação parcial pode ser diretamente
obtido pela expressão:
rY 1 − rY 2 r12 rY 2 − rY 1r12
rY 1.2 = e rY 2.1 = (18)
(1 − r122 )(1 − rY22 ) (1 − r122 )(1 − rY21 )
Analogamente, o coeficiente de determinação parcial seria dado por:
R 2 − rY22
r 2Y 1.2 = (19)
1 − rY22
Uma importante consequência das expressões em (18) é que, nem sempre, a correlação
parcial terá o mesmo sinal da correlação simples. Em outras palavras, duas variáveis podem
estar, por exemplo, positivamente relacionadas, embora a correlação parcial entre essas, após
isolado o efeito de outras variáveis, seja negativa.
131
Econometria Contribuição Marginal
Exemplo 2. Para obtermos diretamente, por exemplo, a correlação parcial entre renda familiar
(Y) e anos de estudo (X1), isolando-se o efeito da idade (X2), devemos calcular:
rY 1 − rY 2 r12
rY 1.2 =
(1 − r122 )(1 − rY22 )
As correlações simples necessárias para o cálculo serão dadas por:
n
rY 1 =
∑i=1 x1i yi =
27
= 0 ,9959
n n (21)(35)
∑i=1 x12 ∑i=1 yi2
i
rY 2 =
∑i=1 x2 i yi =
130
= 0 ,9827
n n (500)(35)
∑i=1 x22 ∑i=1 yi2i
r12 =
∑i=1 x1i x2 i =
100
= 0,9759
n n (21)(500)
∑i=1 x12 ∑i=1 x22
i i
Exercícios
1. A partir de informações sobre os gastos mensais com alimentação (Y, em 1000 reais), renda
mensal (X1, em 1000 reais) e tamanho (X2, distância ao supermercado) de 4 famílias, pede-se:
Y 0,4 0,2 0,3 0,6
X1 1 2 2 3
X2 2 3 3 2
a. Analise a significância da contribuição marginal da distância ao supermercado
sobre os gastos com alimentação.
b. Calcule e interprete a correlação parcial entre gastos com alimentação e renda
mensal.
132
Econometria Alexandre Gori Maia
2. Sejam as seguintes informações sobre o consumo de frango (Y), renda disponível (X1) e preço
do frango (X2) em 4 diferentes anos:
Ano 1974 1975 1976 1977
Y (kg per capita) 74 82 84 110
X1 (1.000 R$) 6 8 8 10
X2 (R$ / kg) 0.8 1.2 1.2 1.0
a. Analise a significância da contribuição marginal do logaritmo da renda sobre o
logaritmo do consumo de frango.
b. Calcule e interprete o coeficiente de determinação parcial entre o logaritmo da
renda e o logaritmo do consumo de frango.
3. Uma amostra de 4 países forneceu os seguintes dados sobre mortalidade infantil (Y, em
mortes para cada mil nascidos vivos), PIB per capita (X1, em mil dólares) e número de
médicos (X2, em médicos por 1000 habitantes):
Y 5 4 7 8
X1 10 12 13 16
X2 3 2 1 0
133
Econometria Contribuição Marginal
Respostas
1) a. SQRegir-SQRegr=0,0825-0,02=0,0625; QMRegcontribuiçao=0,0625; F=12,5; p=0,175; b.
rY1.2= 0,8944.
2) a. SQRegir-SQRegr=0,0855-0,0035=0,0821; QMRegcontribuição=0,0821; F=282,6; p=0,038; b.
r2Y2.1=0,996.
3) a. SQRegir-SQRegr=9-3,769=5,231; QMRegcontribuição=5,231; F=5,231; p=0,262; b.
2
r Y2.1=0,735.
134
Econometria Alexandre Gori Maia
10. Multicolinearidade
Introdução
Como sabemos, um coeficiente angular de um modelo de regressão múltipla estima o
efeito marginal de uma variável independente sobre a variável dependente. Em outras palavras,
estima a variação esperada na variável dependente caso haja uma variação unitária na referida
variável independente, mantendo todas as demais constantes. Imagine agora uma siutuação em
que a variação unitária de um regressor implique necessariamente na variação de outro regressor.
Por exemplo, horas médias trabalhadas por dia e horas médias trabalhadas por semana. Como
poderíamos identificar o efeito marginal isolado de cada variável se não podemos variar uma
mantendo constante a outra?
Uma condição necessária para estimar os coeficientes do modelo de regressão é que não
haja relação linear exata entre quaisquer variáveis explanatórias do modelo. Quando há uma
relação linear exata dizemos que as variáveis explanatórias são perfeitamente colineares, ou que
existe perfeita colinearidade. Seria o caso de tentarmos prever a renda de uma pessoa (Y) com
base na jornada média diária (X1) e na jornada média de uma semana de 5 dias (X2). Como as
variáveis X1 e X2 são perfeitamente colineares (X2=5X1), seria impossível determinar o efeito
isolado X2 sobre Y. Isso porque se mantermos X1 constante, X2 também permanecerá constante e
será impossível medir seu efeito isolado sobre Y.
Na prática, entretanto, a colinearidade exata ocorre raramente, muitas vezes por falhas na
especificação do modelo. Frequentemente nos deparamos com a situação de multicolinearidade,
na qual há uma elevada, mas não exata, relação linear entre duas ou mais variáveis
independentes22. Embora a multicolinearidade não afete as propriedades dos estimadores de
MQO, pode dificultar a identificação do efeito isolado das variáveis independentes, já que seria
muito difícil observar na amostra variações isoladas de uma variável após mantidas constantes as
demais. Por exemplo, se a renda temporária (X1) e a renda permanente (X2) de um indivíduo
apresentam relação de multicolinearidade, será mais difícil observar variações na renda
22
O termo multicolinearidade foi originalmente proposto por Ragnar Frisch em 1934 para designar a relação
colinear exata entre duas ou mais variáveis independentes. Atualmente, refere-se a um conceito mais amplo, de
interrelação entre as varáveis independentes, mas não de maneira exata.
135
Econometria Multicolinearidade
10.1. Definição
Dizemos que há perfeita colinearidade entre as variáveis explanatórias quando uma delas
(Xj) for definida por uma função linear exata das demais:
X ji = λ1 X 1i + λ 2 X 2i + ... + λk X ki (1)
Onde λ1, λ2,... λk são constantes tais que nem todas são zero simultaneamente.
Entretanto, a chance de se observarmos uma amostra em que os regressores se relacionem
dessa maneira é muito pequena. Usualmente ocorrerá quando há falhas na especificação do
modelo. O que ocorre, na prática, é a relação de multicolinearidade, na qual as variáveis
independentes estão interrelacionadas, não de maneira perfeita, mas com a incorporação de um
termo vi aleatório.
X ji = λ1 X 1i + λ 2 X 2i + ... + λk X ki + vi (2)
Exemplo 1. Suponha, por exemplo, a jornada média diária (X1) de um ocupado e sua equivalente
jornada média semanal (X2) considerando uma semana de 5 dias úteis. Há uma evidente
colinearidade exata entre X1 e X2 já que esta última foi obtida pela expressão X2=5X1.
X1 X2 X2*
4 20 22
6 30 38
8 40 44
10 50 50
*
Já a variável X2 representa a jornada efetivamente praticada em uma semana de referência, ou
seja, a jornada diária multiplicada pelo número de dias da semana mais eventuais desvios devido
a ausências ou horas extras de trabalho na semana: X2*=5X1+vi. Os desvios observados foram: 2,
8 4 e 0. Embora não haja uma relação exata entre X1 e X2*, há uma forte relação de
multicolinearidade, já que o coeficiente de correlação linear entre ambas é de 0,965.
136
Econometria Alexandre Gori Maia
(3)
Yi = αˆ + βˆ1 X 1i + βˆ 2 X 2i + eˆi
) )
Yi = αˆ + βˆ1 (λ2 X 2i ) + β 2 X 2i + ei (4)
) )
Yi = αˆ + ( βˆ1λ2 + β 2 ) X 2i + ei
)
Isso significa que, embora seja possível estimar a função dos coeficiente ( βˆ1λ2 + β 2 ) ,
essa estimativa permitiria infinitas soluções para β̂1 e βˆ 2 , já que teríamos apenas uma equação
para duas incógnitas. Em outras palavras, na presença de perfeita colinearidade não haveria uma
solução única para os coeficientes isolados do modelo de regressão, embora seja possível obter
uma resposta única para uma combinação linear dos mesmos. Se tentarmos encontrar as
estimativas de MQO por βˆ = ( X T X) −1 ( X T y ) na presença de perfeita colinearidade, chegaremos
23
Caso uma das variáveis independentes seja uma função linear exata de outra variável independente, uma das
colunas da matriz XTX será uma combinação linear exata de outra coluna. Nesse caso, a matriz XTX será singular
(determinante igual a zero) e não-inversível.
137
Econometria Multicolinearidade
(5)
(6)
É importante lembrar que a ausência de multicolinearidade não faz parte dos pressupostos
do Teorema de Gauss-Markov para que os estimadores de MQO sejam os MELNV. Em outras
palavras, a presença de multicolinearidade não implica que os coeficientes de MQO deixam de
ser não viesados e de mínima variância. A multicolinearidade apenas dificulta a identificação dos
138
Econometria Alexandre Gori Maia
efeitos isolados na amostra e, caso esta não seja suficientemente representativa dos inúmeros
comportamentos das variáveis (represente variações conjuntas e isoladas dos regressores), não
permitirá estimar coeficientes significativos para os efeitos marginais. Assim, o impacto da
multicolinearidade sobre as estimativas dos coeficientes dependerá também de outros fatores,
como o tamanho da amostra e a variabilidade do regressor. Por esse motivo, muitos autores
argumentam que a multicolinearidade trata-se, na verdade, de um problema de
micronumerosidade, ou seja, que a amostra não seria grande o suficiente para representar
significativamente o relacionamento entre as variáveis em questão24.
σ2
Var ( βˆ j ) = n (8)
∑i =1 x 2ji (1 − R 2j )
Onde R 2j é o coeficiente de determinação do ajuste de Xj em função de todas as demais
24
O conceito da micronumerosidade foi sugerido por Arthur Goldberger (1991), argumentando que o problema da
multicolinearidade deve-se, na verdade, à pequena variabilidade dos regressores observados em uma amostra de
tamanho insuficiente. Segundo o autor, amostras de tamanho pequeno e baixa variabilidade dos regressores causam
problemas tão graves quanto o da multicolinearidade.
139
Econometria Multicolinearidade
estimador βˆ j (Figura 10). Consequentemente, mais dificíl será provarmos que o valor estimado
(10)
σ2 1 σ2
Var ( βˆ j ) = n 2
= n
FIV j (11)
∑i =1 x 2ji (1 − R j ) ∑i =1 x 2ji
O termo FIV representa o quanto a variância de β̂ j está sendo inflacionada pela relação
aproximamo-nos de uma relação exata ( R 2j =1), o FIV tenderá a infinito. Para relações
140
Econometria Alexandre Gori Maia
141
Econometria Multicolinearidade
142
Econometria Alexandre Gori Maia
Exemplo. A tabela abaixo contém dados hipotéticos sobre emissões de CO2 (CO2, em milhões
de toneladas), PIB (PIB, em bilhões de US$) e população (Pop, em milhões de habitantes) para 8
países.
CO2 PIB Pop
1,5 13,2 3,2
8,7 197,0 35,5
2,8 128,6 19,1
9,4 286,4 40,4
4,4 72,6 3,1
8,4 167,8 22,3
3,2 114,4 8,4
0,9 58,0 9,0
Pressupõe-se que as emissões cresçam linearmente com o crescimento da economia e também da
população, teremos:
CO 2 = β0 + β1 PIB + β 2 Pop + e
Aplicando-se MQO, teremos o seguinte resultado para a tabela ANOVA:
143
Econometria Multicolinearidade
Fonte gl SQ QM F p
Regressão 2 63.9 31.9 8.80 0.023
Resíduos 5 18.2 3.6
Total 7 82.0
Em outras palavras, o ajuste mostrou-se significativo. A probabilidade de erro ao afirmarmos que
as variáveis PIB e Pop contribuem para expliciar a variabilidade do CO2 é de apenas 0,02%.
Mais ainda, o R2 de 0,779 sugere que 78% da variabilidade do CO2 seja explicada pelas
variáveis PIB e Pop.
Entretanto, se verificarmos as contribuições isoladas dos regressores, veremos que ambas são
insignificantes:
Variável β̂ S β̂ t p
Intercepto 0.472 1.328 0.356 0.737
PIB 0.030 0.025 1.226 0.275
Pop 0.028 0.150 0.183 0.862
A probabilidade de erro ao afirmarmos que o efeito isolado do PIB sobre o CO2 seja diferente de
zero é de 27,5%. Para a variável Pop, a probabilidade de erro é de 86,2%. Esses resultados
sugerem a presença de colinearidade entre PIB e Pop, pois, embora o ajuste seja significativo no
conjunto, não está conseguindo estimar os efeitos isolados de cada variável independente sobre o
CO2.
Como os coeficientes β1 e β2 estimam o efeito isolado das variáveis PIB e Pop sobre o CO2, suas
estimativas estariam sendo insignificantes pois essas variáveis representariam apenas uma
pequena parcela da variabilidade total explicada pelo ajuste. Em outras palavras, o efeito
conjunto do PIB e Pop representaria a maior parcela da variabilidade explicada pelo ajuste.
Para certificar-se da relação de colinearidade entre PIB e Pop, podemos analisar o modelo:
PIB = α 0 + α 1 Pop + e
Aplicando-se MQO, chegaremos a um R2 de 0,889 e uma estatística F igual a 47,9, a qual
corresponde a uma probabilidade de erro inferior a 0,001% ao afirmarmos que haja relação linear
entre PIB e Pop.
Em outras palavras, há fortes indícios para suspeitar que a relação de colinearidade entre PIB e
Pop esteja comprometendo a significância de seus estimadores na regressão para o CO2. As
variâncias desses estimadores estariam sendo inflacionadas pela relação de colinearidade entre os
144
Econometria Alexandre Gori Maia
regressores e a amostra não estaria sendo suficiente para captar os efeitos isolados de suas
respectivas variáveis independentes.
Podemos ainda calcular o FIV para estimarmos em que medida as variâncias estão sendo
inflacionadas pela relação de multicolinearidade. Como temos apenas uma relação linear simples
entre PIB e Pop, o R 2j e, consequentemente, o FIVj serão os mesmos para PIB e Pop. O FIV será
dado por:
1
FIV j = = 8,98
(1 − 0,889)
Em outras palavras, as variâncias dos estimadores β̂1 e β̂ 2 são 9 vezes supeior ao que poderiam
ser na ausência de relação linear entre as variáveis independentes. Esse elevado valor do FIV está
sendo suficiente para tornar as estimativas insiginificantes, dada a baixa representatividade da
amostra. A solução ideal para este problema seria obter uma amostra mais representativa
(maior). Excluir uma das variáveis poderia comprometer a especificação teórica das relações, ou
seja, tornar tendenciosas as estimativas dos coeficientes. Transformações podem ainda ser
sugeridas às variáveis como, por exemplo, estimar as emissões per capita de CO2 como função
do PIB per capita.
Exercícios
1. A tabela abaixo apresenta informações sobre a renda (Renda), anos de idade (Idade), anos de
estudo (Escolaridade) de uma amostra de 6 ocupados. Na ausência de informações apuradas
sobre a experiência profissional dos ocupados, trabalha-se com uma aproximação dada pela
idade da pessoa menos a idade esperada de finalização dos estudos. Supondo que o indivíduo
ingresse na escola com 7 anos, teríamos a variável medindo a experiência profissional
(Experiencia) dada por:
Experiencia = Idade – Escolaridade – 7
Renda Idade Escolaridade Experiencia
1590 25 15 3
1340 24 12 5
1880 32 18 7
1600 31 15 9
1910 36 18 11
2190 40 20 13
145
Econometria Multicolinearidade
Pressupõe agora que a renda seja uma função linear da escolaridade e da experiência
profissional, teríamos o modelo de RLM:
Renda = α + β1 Escolaridade + β2 Experiencia + e
a. Ajuste a regressão por MQO e analise a significância dos coeficientes;
b. A colinearidade entre as variáveis independentes poderia estar influenciando a
significância dos coeficientes?
c. Estime as medidas utilizadas para analisar a magnitude da relação linear entre as
variáveis (R2 e FIV) e interprete seus resultados;
d. Seria possível incluir a variável Idade no modelo de RLM? Por quê?
146
Econometria Alexandre Gori Maia
5. (ANPEC, 1992) Dada a função de produção Pi = β 0 K β1 Lβ2 eui , se houver correlação linear
perfeita entre K e L, necessariamente o modelo não poderá ser estimado.
147
Econometria Multicolinearidade
a. Caso a relação linear simples entre X1 e cada uma das outras k–1variáveis
independentes seja não perfeita, então não haverá multicolinearidade perfeita
entre X1 e as demais variáveis independentes conjuntamente;
b. Caso a variância para um coeficiente estimado seja elevada, significa que há
necessariamente multicolinearidade;
Respostas
1) a. Renda = 128 + 95 Escolaridade + 9 Experiencia + ê; F = 129.47; p = 0.001; S βˆ =9,67;
1
2) a. AUTO = 10650,4 + 87,4 IPC − 137,9 IPCAuto + 8,8RENDA + eˆ ; F=10,78; p=0,001; t1=1,53;
2
p1=0,151; t2=-4,40; p2<0,001; t3=4,70; p3<0,001; c. R123 = 0,994 ; F123=1138,7; p123<0,001;
2 2
R213 = 0,994 ; F213=1128,2; p213<0,001; R312 = 0,984 ; F312=406,1; p312<0,001; d.
FIV123=176,2; FIV213=174,6; FIV312=63,5.
3) b. ln(Y ) = 7,42 − 1,52 ln( X 1 ) + 4,80 ln( X 2 ) + eˆ ; F=5,75; p=0,033; t1=-2,36; p1=0,050;
2
t2=1,068; p2=0,320; R12 = 0,212 ; F12=2,15; p12<0,181; FIV12=1,268.
4) a. V; b. F; c. F; d. F; e. F.
5) V.
6) F.
7) a. F; b. F.
148
Econometria Alexandre Gori Maia
X T
X=
∑x 2
1J ∑x x 1j 2j
= ∑ x12J ∑ x22J − (∑ x1 j x2 j ) 2
∑x x 2j 1j ∑x 2
2J
(∑ x1 j x2 j ) 2 = ∑ x12J ∑ x22J
E, consequentemente, o determinante da matriz XTX será nulo:
XT X = 0
Em outras palavras, a matriz XTX será singula e não inversível, não sendo possível obter os
estimadores de MQO para β1 e β2.
149
Econometria Multicolinearidade
y i = β 2 x 2i + e 2 i
ˆβ = ( X T X) −1 ( XT y ) = ∑ 1J ∑ x1 x2
x2 ∑ x1 j y j
j j
∑ x 2 x1 ∑ x22 ∑ x2 y j
j j j j
E que os estimadores de MQO para os modelos de RLS serão:
βˆ1 =
∑ x1 y jj
e βˆ 2 =
∑ x2 y j j
∑ x12j ∑ x22 j
Entretanto, caso as variáveis X1 e X2 sejam independentes, teremo que ∑ x1 x2
j j
= 0 e,
consequentemente:
−1
∑ x12 0 ∑ x1 j y j ∑ x1 j y j ∑ x12
βˆ = J = J
0 ∑ x2 j
2 ∑ x2 y j ∑ x2 y j ∑ x22
j j j
150
Econometria Alexandre Gori Maia
1 S
2
− 12 (1 − r122 )
S11 (1 − r12 ) S11 S 22
( XT X) −1 =
S 1
− 12 (1 − r122 )
S11 S 22 S 22 (1 − r122 )
Finalmente, teremos:
1 S
2
− 12 (1 − r122 )
S11 (1 − r12 ) S11 S 22
Var(βˆ ) = σ 2
S12 1
− (1 − r122 )
S11 S 22 S 22 (1 − r122 )
Ou seja:
151
Econometria Multicolinearidade
σ2
Var ( β 1) =
S11 (1 − r122 )
σ2
Var ( β 2) =
S 22 (1 − r122 )
− S12σ 2
Cov( β 1, β 2) =
S11 S 22 (1 − r122 )
Assim, quanto maior for a relação linear entre X1 e X2, maior será r122 e, consequentemente,
maiores serão as variâncias de β̂1 e β̂ 2 .Quando o valor de r122 aproximar-se de 1, as variâncias
tenderão a infinito.
A demonstração para o caso de k variáveis independente é semelhante, embora mais trabalhosa.
De maneira geral, teremos:
σ2
Var ( βˆ j ) =
S j (1 − R 2j )
152
Econometria Alexandre Gori Maia
Introdução
As variáveis utilizadas em análises estatísticas podem ser classificadas em quatro grupos
principais, segundo suas escalas de medidas:
25
Os modelos de regressão logística, por exemplo, são indicados para ajustes com variável dependente nominal.
153
Econometria Variáveis Binárias
Exemplo 1. Seja uma amostra de 4 observações com informações sobre o número de filhos de
um casal (Y), anos completos de escolaridade da esposa (X) e se o domicílio onde residem assina
televisão a cabo:
Y X TV?
0 15 Sim
2 8 Sim
4 5 Não
6 4 Não
Podemos definir a variável binária D para representar a posse (1) ou não (0) de televisão:
0 1 15 1 αˆ eˆ1
2 1 8 1 ˆ eˆ2
y = Xβˆ + eˆ ⇒ = β +
1 5 0 eˆ3
1
4
6 1 3 0 βˆ2 eˆ
4
Como em qualquer ajuste de RLM, as estimativas de MQO para esse modelo seriam dadas por:
154
Econometria Alexandre Gori Maia
βˆ = ( X T X ) −1 ( X T y )
−1
1 15 1 0
1 1 1 1 1 1 1 1
1 8 1 2
βˆ = 15 8 5 3 15 8 5 3
1 5 0 4
1 1 0 0 1 1 0 0
1 3 0 6
−1
4 31 12 12 6,36
βˆ = 31 323 23 54 = − 0,34
12 23 2 2 - 1,45
Que nos daria o seguinte ajuste:
Yi = 6,36 − 0,34 X i − 1,45 Di + eˆi
Percebam, pela figura abaixo, que o ajuste estabelecido permite a representação de um plano
para quaisquer valores de D, embora, na prática, esta representação seja válida apenas para os
valores 0 e 1:
155
Econometria Variáveis Binárias
inclinações em relação aos anos de estudo, mas com deslocamentos (interceptos) diferentes para
domicílios com TV e sem TV a cabo.
Categoria DAi
A 1 (2)
B 0
E o modelo de RLM dado por:
Yi = α + β1 X i + β 2 D Ai + ei (3)
Nessa situação o coeficiente β2 indicaria quanto Y seria, em média, maior (ou menor)
para a categoria A (DA=1) que a categoria de referência B (DA=0), independente do valor de X.
Isso porque seria o mesmo que analisarmos dois modelos possíveis para Y:
(4)
156
Econometria Alexandre Gori Maia
157
Econometria Variáveis Binárias
(8)
Exemplo 2. Seja uma amostra com informações sobre a renda (Y), anos de estudo (X) e posição
na ocupação (empregado; autônomo ou empregador) de seis trabalhadores, e duas variáveis
binárias (D1 e D2) para representar três categorias ocupacionais (empregado, autônomo e
empregador):
Yi = α + β1 X i + β 2 D1i + β 3 D2i + ei
Em notação matricial, a função na amostra corresponderia a:
158
Econometria Alexandre Gori Maia
100 1 0 0
0 eˆ1
200 1 4 0 αˆ eˆ2
0
ˆ
400 1 8 0 βˆ1 eˆ3
0
y = Xβ + e ⇒
ˆ = +
400 1 4 0 βˆ2 eˆ4
1
500 1 8 1 0 βˆ3 eˆ5
600 1 0 0 1 eˆ
6
Aplicando MQO chegaríamos às estimativas:
βˆ = ( X T X ) −1 ( X T y )
−1
6 24 2 1 2200 93,3
24 160 12 0 9600 35
βˆ = =
2 12 2 0 900 146,7
1 0 0 1 600 506,7
Que sugeririam o ajuste:
Yi = 93,3 + 35 X i + 146,7 D1i + 506,7 D2i + eˆi
Assim, independente dos anos de escolaridade, o rendimento médio dos autônomos seria 146,7
reais superior ao dos empregados e o dos empregadores 506,7 superior ao dos empregados. A
figura abaixo representa graficamente essa relação:
159
Econometria Variáveis Binárias
ln(Yi ) = α + β Di + ui
(9)
Em outras palavras, o valor esperado de ln(Y) seria β unidades superior para D=1 em
comparação à categoria de referência (D=0), já que para D=0 a E[ln(Y)]=α e para D=1 a
E[ln(Y)]=α+β. Baseado no que aprendemos sobre a interpretação de coeficientes em modelos
logarítmicos, seríamos também levados a afirmar que o valor esperado de Y para D=1
(chamaremos de Y1) seria β×100% superior ao valor para D=0 (chamaremos de Y0), pois:
∆Y
∆ ln(Y ) Y0 Y1 − Y0 (10)
β= = =
∆D 1− 0 Y0
Entretanto, a relação estabelecida em (10) é apenas válidas quando as variações em ln(Y)
e D forem infinitesimais, o que não necessariamente é o caso quando comparamos categorias
nominais, sobretudo quando o valor de β não for suficientemente pequeno. Para obtermos a real
variação relativa em Y quando comparamos as categorias D=1 e D=0, podemos realizar o
Y1 − Y0
caminho inverso do desenvolvimento em (10), ou seja, estimar o valor para . O primeiro
Y0
passo é estimar a relação entre Y e D, que é representada pela função não linear:
Yi = eα + βDi +ui
(11)
160
Econometria Alexandre Gori Maia
Y1 − Y0 eα + β − eα eα e β − eα
= α
= α
= eβ −1 (12)
Y0 e e
Em outras palavras, para obtermos a variação relativa em Y quando mudamos da
categoria D=0 para a categoria D=1, devemos calcular eβ–1. Quando o valor de β for
suficientemente pequeno, ou seja, quando podemos considerar que as variações em ln(Y) são
infinitesimais, as equações (10) e (12) se equivalem e a transformação acaba sendo
desnecessária. Na dúvida, entretanto, é sempre recomendável utilizar a expressão (12) quando
temos coeficientes associados a variáveis binárias em equações semi-logarítimicas.
(13)
161
Econometria Variáveis Binárias
p
Y = α + β X + ∑ γ j ( X − X *j ) D j + e
j =1
(14)
binária que assume 1 quando X > X *j e 0 caso contrário. Assim, o coeficiente γj indicará a
Exemplo 3. Seja uma amostra com informações sobre renda (Y), anos de estudo (X) e sexo de
seis ocupados:
Yi Xi Sexo
100 0 Mulher
250 4 Mulher
300 8 Mulher
200 0 Homem
400 4 Homem
500 8 Homem
Definimos a variável binária D para identificar o sexo da pessoa:
1, Homem
D=
0, Mulher
Para considerar que as mulheres ganham, em média, menos que os homens, independente da
escolaridade, e que os retornos marginais da escolaridade sobre a renda sejam diferentes entre os
sexos, podemos propor o seguinte modelo:
Yi = α + β1 X i + β 2 Di + β 3 Di ⋅ X i + ei
Onde a variável DiXi é simplesmente o produto de Di por Xi. Para compreender seu significado,
vejamos o que acontece com a reta de regressão para homens e para mulheres:
162
Econometria Alexandre Gori Maia
Assim, α seria a renda esperada de uma mulher quando X=0. Para homens, essa renda esperada
seria β2 unidades superior (ou inferior se β2<0). O coeficiente β1, por sua vez, indicaria a
variação marginal na renda da mulher para cada ano adicional de escolaridade. Para homens,
essa variação marginal seria β3 unidades superior (ou inferior se β3<0). O pressuposto desta
análise é que os retornos marginais de escolaridade sejam diferentes para homens e mulheres.
Com os dados da amostra, a representação matricial para o problema seria:
100 1 0 0 0 ê1
250 1 4 0 0 αˆ ê 2
300 1 8 0 0 βˆ1 ê 3
y = Xβˆ + eˆ ⇒ = +
200 1 0 1 0 βˆ 2 ê 4
400 1
4 1 4 βˆ3 ê 5
500 1 8 1 8 ê
6
E as estimativas de MQO:
βˆ = ( X T X ) −1 ( X T y )
−1
6 24 3 12 1750 116,7
24 160 12 80 9000 25
βˆ = 1100 = 100
3 12 3 12
12 80 12 80 5600 12,5
Teríamos, então, o seguinte ajuste:
163
Econometria Variáveis Binárias
Exemplo 4. Sejam os seguintes dados amostrais para a renda (Y) e anos de estudo (X) de seis
ocupados:
Yi Xi
100 0
250 4
300 8
450 10
700 13
800 15
Supõe-se que o retorno marginal da escolaridade sobre a renda seja diferente para aqueles com
até o 1º grau (X≤8) e aqueles com 2º grau ou mais de escolaridade (X>8). Uma maneira de
expressar essa relação seria, primeiramente, definindo a variável binária D para discriminar dois
grupos de escolaridade:
0, se X i ≤ 8
Di =
1, se X i > 8
Posteriormente, estabeleceríamos a relação:
Yi = α + β1 X i + β 2 ( X i − 8) Di + ei
Em outras palavras, β1 seria a variação marginal na renda para cada ano adicional de
escolaridade até o 8º ano de escolaridade. A partir do 2º grau (X>8 e D=1), a variação marginal
na renda seria de β1+β2 para cada ano adicional de escolaridade.
Com os dados da amostra, a representação matricial para o problema seria:
164
Econometria Alexandre Gori Maia
100 1 0 0 eˆ1
250 1 4 0 eˆ2
300 1 8 0 αˆ eˆ
y = Xβˆ + eˆ ⇒ = βˆ1 + 3
450 1 10 2 ˆ eˆ4
β 2 eˆ
700 1 13 5 5
800 1 15 7 eˆ
6
E as estimativas de MQO:
βˆ = ( X T X ) −1 ( X T y )
−1
6 50 14 2600 116,6
ˆβ = 50 574 190 29000 = 25,1
14 190 78 10000 46,2
Teríamos, então, o seguinte ajuste:
Yi = 116,6 + 25,1X i + 46,2( X i − 8) Di + eˆi
Isso significa que, até o 8º ano de escolaridade (D=0), seria esperada uma variação marginal de
25,1 reais na renda para cada ano adicional de escolaridade. Por sua vez, o retorno marginal da
educação na renda seria, em média 46,2 reais superior após o 8º ano de escolaridade. A figura
abaixo permite ainda visualizar graficamente essa relação:
165
Econometria Variáveis Binárias
da variável binária, apresentam a mesma função de regressão. Esse tipo de teste é denominado
teste de mudança estrutural, pois, uma vez provada a relevância da variável binária no modelo,
significa afirmar que há mudanças significativas na estrutura da função de regressão (mudança
do intercepto e/ou inclinação da reta) após a consideração de algum atributo qualitativo de
interesse.
Para visualizarmos a aplicação do teste de mudança estrutural, suponha inicialmente que
tenhamos a seguinte especificação do modelo de regressão:
Yi = β 0 + β1 X i + ei (15)
Vamos agora considerar um modelo com mudança de intercepto e de inclinação da reta
em função de um atributo qualitativo de interesse, discriminado pela variável binária D:
Yi = β 0 + β1 X i + β 2 Di + β 3 Di ⋅ X i + ei (16)
Caso o atributo qualitativo incorpore alguma informação relevante ao modelo original
(15), devemos esperar que haja mudança no intercepto e/ou inclinação da reta. Em outras
palavras, esperamos que haja uma mudança estrutural em virtude da consideração da variável
binária D em (16), situação caracterizada pelas três últimas regressões em (17):
Regressões Regressões Regressões Regressões
Coincidentes Paralelas Concorrentes Dissimilares
(17)
H 0 : β 2 = β 3 = 0
(18)
H 1 : β 2 ≠ 0 e / ou β 3 ≠ 0
A hipótese nula deste teste é o da estabilidade da regressão, ou seja, quando as relações
entre X e Y são as mesmas (constantes) para as duas categorias de análise. A hipótese alternativa
é a da diferença da relação de regressão para as categorias.
Este teste de hipóteses corresponde àquele utilizado para a contribuição marginal das
variáveis associadas aos coeficientes β2 e β3. Assim, podemos aplicar um teste de restrição aos
166
Econometria Alexandre Gori Maia
parâmetros, onde o modelo irrestrito seria definido pela equação (16) e o modelo restrito pela
equação (15). A estatística de teste seria a F, com graus de liberdade do numerador definidos
pelo número de restrições impostas aos parâmetros (no caso, 2) e, no denominador, com os
mesmos graus de liberdade dos resíduos do modelo irrestrito:
( SQReg ir − SQReg r ) / 2 ( SQRes r − SQResir ) / 2
F= ou F = (19)
SQResir /( n − 4) SQResir /( n − 4)
Caso a hipótese nula seja rejeitada pelo teste F, ou seja, caso o valor p associado à
estatística F seja suficientemente pequeno, dizemos que há mudança estrutural na relação entre Y
e X. Para saber se a mudança se deve à variação no intercepto, no coeficiente angular ou nos
dois, podemos verificar os resultados dos testes t isolados para cada coeficiente.
O teste de mudança estrutural com variáveis binárias é uma alternativa àquele conhecido
na literatura como teste de Chow26. Neste teste, são ajustadas duas regressões independentes para
cada categoria de análise e seus resultados comparados através de uma mesma estatística F com
os resultados obtidos para um ajuste com as populações das duas categorias conjuntamente. A
principal vantagem do teste com variáveis binárias é que este também permite identificar em que
coeficiente se dá a mudança estrutural (intercepto ou coeficiente angular). A principal
desvantagem é que a especificação do modelo com variáveis binárias pode ficar demasiadamente
extensa quando estamos analisando as interações com inúmeras variáveis independentes X.
Exemplo 4. Seja a mesma amostra com informações sobre renda (Y), anos de estudo (X) e sexo
de seis ocupados:
Yi Xi Sexo
100 0 Mulher
250 4 Mulher
300 8 Mulher
200 0 Homem
400 4 Homem
500 8 Homem
26
Chow, G. C. Test of equality between subsets of coefficients in two linear regressions models. Econometrica,
1960, p. 591-605.
167
Econometria Variáveis Binárias
1, Homem
D1 =
0, Mulher
O modelo irrestrito, com a consideração da mudança estrutural imposta pela consideração do
sexo da pessoa, seria:
Yi = α + β1 X i + β 2 Di + β 3 Di X i + ei
Aplicando MQO, chegaríamos ao ajuste:
Yi = 116,7 + 25 X i + 100 Di + 12,5 Di X i + ei
Com soma dos quadrados da regressão (SQRegir) igual a 98750 e soma dos quadrados dos
resíduos (SQResir) igual a 3333,3.
Por sua vez, o modelo restrito seria aquele sem a consideração de mudança estrutural entre os
sexos, ou seja, com restrição aos parâmetros β 2 e β3 do modelo. Seria, então, definido por:
Yi = α + β1 X i + ei
E com estimativas de MQO dadas por:
Yi = 166,7 + 31,25 X i + eˆi
Nesse caso, a soma dos quadrados da regressão (SQRegr) seria igual a 62500.
A representação do modelo restrito e irrestrito pode ser observada no gráfico abaixo:
168
Econometria Alexandre Gori Maia
Exercícios
1. Observaram-se informações sobre o preço (X) e a quantidade ofertada (Y) de determinado
produto nos 6 bimestres de um ano (t):
Y 2,0 1,5 2,5 3,0 5,5 6,5
X 1 2 3 1 2 3
t 1 2 3 4 5 6
3. (ANPEC, 2012) Usando uma base de dados que tem informação de 65.535 trabalhadores,
queremos verificar se existe desigualdade salarial entre setores da economia. Consideremos
169
Econometria Variáveis Binárias
que a economia está dividida em 4 setores: indústria, comércio, serviços e construção. Cada
um dos trabalhadores está em um dos quatro setores e eles são mutuamente exclusivos. Seja
Yi o salário mensal do trabalhador i e definimos para cada setor uma variável binária que é
igual a 1 se o trabalhador está em determinado setor e 0 caso contrário. Estimando um
modelo linear de regressão, obtemos o seguinte resultado:
em que educ representa o número de anos de estudos de cada trabalhador, idade é medida
em anos, Homem é uma variável binária que assume valor igual a 1 se i é homem e 0 caso
contrário, DI representa a dummy para indústria, DC para o comércio e DCons para o setor
de construção. Entre parênteses encontra-se o erro padrão.
Baseado nas informações acima, julgue as seguintes afirmativas:
[ Para a resolução desta questão talvez lhe seja útil saber que se Z tem distribuição Normal
Padrão, então Pr(|Z|>1,645)=0,10 e Pr(|Z|>1,96)=0,05.]
a. Com base nos resultados acima, é possível rejeitar ao nível de 5% de significância
a hipótese nula de que o salário do setor da indústria é igual ao salário do setor de
serviços para trabalhadores com o mesmo nível educacional, a mesma idade e do
mesmo sexo. A hipótese alternativa é que os salários nestes setores sejam
diferentes;
b. Com base nos resultados acima, é possível rejeitar ao nível de 5% de significância
a hipótese nula de que o salário no setor da construção é igual ao salário no setor
de comércio, mantendo educação, idade e sexo fixos. A hipótese alternativa é que
os salários nestes setores sejam diferentes;
c. Com base nos resultados acima, é possível rejeitar ao nível de 5% de significância
a hipótese nula de que o salário nos 4 setores da economia são iguais, mantendo
constante educação, idade e sexo;
d. Os resultados do modelo acima permitem testar a hipótese de que o retorno
salarial entre homem e mulher é diferente para cada nível educacional, ao nível de
5% de significância;
170
Econometria Alexandre Gori Maia
e. Com base nos resultados acima, podemos testar a hipótese de que o intercepto do
modelo linear de salário em função da educação, idade e setor para homem é
diferente do intercepto do mesmo modelo linear de salário para mulher;
Respostas
1) a. Yˆ = 0 + X + 3D ; b. β1: t=2; p=0,139; β2: t=0,816; p=0,035; c.
171
Econometria Heterocedasticidade
12. Heterocedasticidade
Introdução
Passaremos agora a verificar as consequências da ausência de algum dos pressupostos do
Teorema de Gauss-Markov sobre os estimadores de mínimos quadrados. Um desses pressupõe
que a variância do erro ( σ 2 ) seja a mesma para todos os valores condicionais de X. Em outras
palavras, pressupõe a homocedasticidade (ou homocedasticia) dos erros, palavra de origem
grega que significa igual (homo) dispersão (skedasis).
Na presença de heterocedasticidade, a variância dos erros será diferente para cada valor
de X e os estimadores de MQO, embora permaneçam não viesados e consistentes, deixam de ser
eficientes, ou seja, deixam de apresentar variância mínima. Neste capítulo, além da definição de
heterocedasticidade, veremos quais suas causas, consequências, como detectá-la e quais as
possíveis medidas corretivas.
12.1. Definição
Dado o modelo de RLM:
Yi = α + β1 X 1i + β 2 X 2i + ... + β k X ki + ei (1)
Um dos pressupostos para que os estimadores de MQO dos parâmetors α e β’s sejam os
MELNV é que a variância dos erros e, condicional aos valores das variáveis explanatórias, seja
constante. Em outras palavras, a homocedasticidade define-se por:
(3)
172
Econometria Alexandre Gori Maia
Por outro lado, na presença de hetocedasticia, a variância dos erros será diferente para
cada valor condicional de Xj. Esse comportamento pode ser representado pela expressão (4) e
figura (5).
(5)
173
Econometria Heterocedasticidade
função de rendimentos pode implicar em maior variabilidade dos erros para valores
intermediários da idade, onde o rendimento seria maior;
• Transformação dos dados: a transformação das variáveis (por exemplo, proporção ao
invés de valores absolutos) ou da forma funcional (modelo log-duplo ao invés de
linear) pode eliminar ou atenuar a heterocedasticidade.
Homocedasticidade Heterocedasticidade
Var (ei ) = σ 2 Var (ei ) = σ i2
n (8)
Var ( βˆ ) =
σ2
Var ( βˆ ) =
∑i=1 xi2σ i2
n
∑i=1 xi2 n
(∑i =1 xi2 ) 2
σˆ 2
estimador de MQO para a variância de β̂ ( S 2ˆ = n
) seria não viesado na presença de
β
∑i=1 xi2
homocedasticidade e viesado na presença de heterocedasticia. Consequentemente, a estatística t
para o coeficiente β e a estatística F para a contribuição conjunta dos coeficientes deixariam de
27
Ver Apêndices A e B do Capítulo 2.
174
Econometria Alexandre Gori Maia
12.2. Identificação
Caso não haja conhecimento a priori da existência de heterocedasticidade em um modelo
de regressão populacional, pode-se analisar o comportamento dos resíduos na regressão amostral
para inferir sobre sua existência e forma de relacionamento com as variáveis independentes.
Veremos quatro técnicas bem populares de identificação: i) análise gráfica; ii) teste de Goldfeld-
Quandt; iii) teste de Breush-Pagan; iv) teste de White.
aproximação para a variância condicional: o quadrado dos resíduos ( eˆi2 ). Assim, visualizando a
dispersão dos resíduos quadráticos eˆi2 em função dos valores de Xi, podemos identificar
175
Econometria Heterocedasticidade
(9)
Exemplo 1. O ajuste linear dos gastos com alimentação (Gasto Aliment, em R$) em função
renda (Renda, em R$) em uma amostra de 40 famílias forneceu o seguinte resultado:
Gasto Aliment i = 40,8 + 0,13 Rendai + eˆi
A dispersão dos valores em torno da reta de regressão já sugere que, à medida que a renda
cresce, a dispersão dos erros também aumenta, indicando a presença de heterocedasticidade.
Essa análise é complementada pelo gráfico abaixo, entre o quadrado dos resíduos e a variável
independente renda. Seria natural supor a existência de heterocedasticidade nesse problema, já
que famílias pobres estão limitadas economicamente a gastos fixos básicos com alimentação
(feijão com arroz), enquanto famílias ricas podem optar por uma alimentação básica (gastos
176
Econometria Alexandre Gori Maia
relativamente baixos) ou gostos extravagantes com alimentação (foie gras e vinho Romanée-
Conti).
A partir do padrão de dispersão observado, podemos ainda sugerir que a variabilidade dos erros
em função da renda siga um formato linear, que poderia ser representado pela expressão:
σ i2 = σ 2 X i
28
Goldfeld e Quandt sugerem que, quando a relação de heterocedasticidade é definida por σi2=σ2Xi2, o poder de
teste será maior quando c for igual a n/4.
177
Econometria Heterocedasticidade
H 0: σ12 = σ 22 σˆ 22
⇒ F = onde F ~ Fgl , gl (11)
H1: σ12 < σ 22 σˆ 12
Colocando no denominador da estatística F a estimativa da subamostra com maior
variância ( σˆ 22 ), garante-se um valor de F superior a 1 e permite-se, assim, um teste
unicaudal para hipótese da igualdade das variâncias. O valor p associado a esse teste
unicaudal indicará a probabilidade de erro ao afirmarmos que há heterocedasticidade
no resíduos ( σ 12 < σ 22 );
Esquematicamente, teremos:
(12)
No caso de um modelo de RLM (k>1), a mesma análise pode-se repetir para cada
variável independente.
178
Econometria Alexandre Gori Maia
Amostra 1 Amostra 2
Gasto Aliment i = 12,6 + 0,18 Rendai + eˆi Gasto Aliment i = 75,1 + 0,09 Rendai + eˆi
Para testar a hipótese nula de igualdade entre as variâncias das regressões, utilizamos a estatística
F. Colocando a maior variância no numerador (amostra 2), podemos realizar um teste unicaudal
com probabilidade de erro associada à área no extremo direito da distribuição F.
H 0: σ12 = σ 22 σˆ 22 2629,9
com estatística de teste: F = 2 = = 4,99
H1: σ12 < σ 22 σˆ1 526,7
179
Econometria Heterocedasticidade
eˆi2 = δ 0 + δ 1 X 1i + δ 2 X 2i + ui (14)
A hipótese nula de homocedasticidade será dada por:
H 0 : δ1 = δ 2 = 0 (15)
Importante destacar que, para testar a hipótese de homocedasticidade dos erros a partir de
(15), consideramos que os erros (ei) não estejam associados às variáveis independentes, ou seja,
que a relação a ser testada seja unicamente entre o quadrado dos erros ( eˆi2 ) e as variáveis
independentes. Assim, para testar a hipótese de homocedastidade (15), podemos utilizar a
estatística F da tabela ANOVA ou a estatística LM, que é o produto do número de observações
da amostra pelo coeficiente de determinação do ajuste auxiliar obtido em (14). As duas
estatísticas dependem do coeficiente de determinação do modelo e, mesmo que os resíduos êi não
estejam normalmente distribuídos, ambas se justificam assintoticamente, ou seja, apresentam as
distribuições de probabilidade esperadas para amostras relativamente grandes. Originalmente, o
teste de Breusch-Pagan baseia-se no resultado da estatística LM, que terá distribuição χ2 com
graus de liberdade dados pelo número de variáveis independentes do modelo (k):
180
Econometria Alexandre Gori Maia
2
n × Raux ~ χ k2 (16)
2
Onde Raux é o coeficiente de determinação do modelo auxiliar (14). Assim, quanto
melhor for a qualidade do ajuste, maior será o valor de LM e mais evidências teremos para
rejeitar a hipótese nula da homocedasticidade. A probabilidade de erro ao rejeitarmos a hipótese
nula será dada pela região crítica representada pelo valor p na Figura (17):
(17)
eˆi2 = δ 0 + δ 1 Rendai + ui
Estimando por MQO teremos:
181
Econometria Heterocedasticidade
apenas uma variável independente no modelo (Renda), a hipótese nula equivale à igualdade a
zero do único coeficiente angular do modelo (δ1). Assim, teremos:
H 0: δ1 = 0 2
com estatística de teste: n × Raux = 40 × 0,301 = 12,0
H
1 1: δ ≠ 0
Também pelo fato de termos apenas uma variável independente no modelo, a distribuição de
probabilidade da estatística LM será uma χ2 com 1 grau de liberdade. A probabilidade de erro
associada ao valor 12,0 em uma distribuição χ2 com 1 grau de liberdade será de 0,05%. Em
outras palavras, há fortíssimas evidências para suspeitarmos que os erros sejam heterocedásticos.
cruzados (XjXp).
Em outras palavras, seja o ajuste de RLM com duas variáveis independentes:
Yi = α + β1 X 1i + β 2 X 2i + ei (18)
Após ajustar a equação (18) por MQO, o teste de White analisará a qualidade de um
ajuste auxiliar para o quadrado dos resíduos:
182
Econometria Alexandre Gori Maia
2
n × Raux ~ χ h2 (21)
Assim, quanto melhor for a qualidade do ajuste, maior será o valor de LM e mais
evidências teremos para rejeitar a hipótese nula da homocedasticidade. A probabilidade de erro
ao rejeitarmos a hipótese nula será dada pela região crítica representada pelo valor p na figura
(22):
(22)
H 0: δ 1 = δ 2 = 0 2
com estatística de teste: n × Raux = 40 × 0,366 = 14,6
H 1: δ 1 ≠ 0 ou δ 2 ≠ 0
183
Econometria Heterocedasticidade
A probabilidade de erro associada ao valor 14,6 em uma distribuição χ2 com 2 graus de liberdade
será de 0,08%. Em outras palavras, há fortíssimas evidências para suspeitarmos que os erros
sejam heterocedásticos.
v1 0 0 0
0 v 0 0 2
Var (e) = E (eeT ) =
2
σ = Vσ 2 (24)
0 0 ... 0
0 0 0 vn
Se conhecermos vi podemos demonstrar que, ao ponderar o modelo pela raiz quadrada de
vi, chegaremos aos MELNV. Em outras palavras, o modelo corrigido seria dado por:
184
Econometria Alexandre Gori Maia
Yi 1 X1 Xk e
=α + β1 i + ... + β 2 i + i (25)
vi vi vi vi vi
Sendo que a variância dos erros desse modelo transformado ( ei vi ) seria a constante
σ2, pois:
1
2
e
E i = E (ei2 ) = σ 2 (26)
vi vi
A equivalente da equação (25) em representação matricial seria:
1 v1 0 0 0
0 1 v2 0 0
Λy = ΛXβ + Λe onde Λ = (27)
0 0 ... 0
0 0 0 1 v 2
Sendo Λ a matrix diagonal com os fatores de ponderação de cada observação.
Analogamente, os erros de (27) seriam homocedásticos, pois:
185
Econometria Heterocedasticidade
A questão que agora fica é como estabelecer a matriz de fatores V e sua equivalente
matriz de ponderações Λ. Veremos a seguir duas situações: i) quando a relação de
heterocedasticidade é conhecida; ii) quando a relação de heterocedasticadade é desconhecida e
devemos trabalhar com estimativas obtidas a partir de comportamentos observados na amostra.
X j1 0 0
0
0 X j2 0 0 2
Var (e) = E (ee ) =
T
σ = Vσ 2 (33)
0 0 ... 0
0 0 0 X jn
1 X j 0 0 0
i
0 1 X j2 0 0
Λ= (34)
0 0 ... 0
0 0 0 1 X jn
186
Econometria Alexandre Gori Maia
Exemplo 5. Partindo do pressuposto que a variância dos erros da relação entre gastos com
alimentos e renda seja proporcioanl ao valor de X (Renda), podemos obter estimativas de mínima
variância aplicando a técnica de MQP. A variância dos erros seria dada por:
X 1 ... 0
2
Var (ei ) = σ X i ou Var (e) = ... ... ... σ 2 = Vσ 2
0 ... X 40
Os estimadores de MQP seriam:
31,9
βˆ = ( X T V −1 X) −1 X T V −1y =
0,14
Graficamente podemos perceber que o ajuste de MQP (em azul) aproxima-se mais do
comportamento observado para as observações de baixa variabilidade (menores rendas) do que
aquele obtido com MQO (tracejado em vermelho):
Podemos ainda testar a significância dos estimadores de MQP. O primeiro passo é obter as
estimativas de suas variâncias:
323,5 − 0,46
S βˆ2 = ( X T V −1 X) −1σˆ 2 =
− 0,46 0,0007
Onde:
187
Econometria Heterocedasticidade
βˆ0 − 0 3,19
t βˆ = = = 1,77 ⇒ p = 0,084
0 S βˆ 323,5
0
βˆ1 − 0 0,14
t βˆ = = = 5,22 ⇒ p = 6 × 10 −6
1 S βˆ 0,0007
1
Considerando uma chance máxima de erro de 10%, podemos afirmar que os dois coeficientes
são significativos, ou seja, que são diferentes de zero.
v ( x) = eδ 0 +δ1X1+...+δ k X k (36)
A opção pela forma exponencial proposta em (36), em detrimento das forma linear
proposta pelo teste de Breusch-Pagan (14), ou mesmo da forma quadrática proposta pelo teste de
White (18), justifica-se, entre outros motivos, pelo fato de essa garantir que os valores estimados
para vi em (36) sejam todos positivos. Como sabemos, a variância não pode assumir valores
negativos, o que não seria garantido caso os mesmos sejam fossem etimados, por exemplo,
segunda a função linear proposta pelo teste de Breusch-Pagan.
Utilizando o quadrado dos erros como aproximação para a variância, podemos propor o
seguinte modelo de relacionamente entre a variabilidade dos erros e as variáveis independentes:
δ 0 +δ1 X1i +...+δ k X ki
ei2 = e ui (37)
Ou, a partir da equivalente função linear:
188
Econometria Alexandre Gori Maia
O fator v̂i pode então ser substituído na matriz de ponderações Λ em (27) para obter os
βˆ = ( XT V ˆ −1y = 22,6
ˆ −1X) −1 XT V
0,16
As estimavas diferem marginalmente das obtidas por MQO e MQP. Devemos, entretanto,
considerar que o MQGF seria apropriado, sobretudo, para amostras relativamente grandes, já que
seus estimadores são viesados para amostras pequenas.
189
Econometria Heterocedasticidade
Var ( βˆ ) =
∑i=1 xi2σ i2 (42)
n
(∑i =1 xi2 ) 2
Precisamos agora de um estimador para essa variância, ou seja, um estimador que seja
robusto à presença de heterocedasticidade. De acordo com White (1980), essa variância pode ser
estimada consistentemente por:
n
S β2ˆ ∗ =
∑ x 2 eˆ 2
i =1 i i
(43)
n
(∑i =1 xi2 ) 2
Onde eˆi2 são os resíduos obtidos pelo ajuste da equação (42) por MQO.
De maneira genérica, podemos considerar um modelo de RLM dado por:
Yi = α + β1 X 1i + β 2 X 2i + ... + β k X ki + ei (44)
O estimador robusto à heterocedasticidade para a variância do coeficiente βj será, neste
caso:
n
S β2ˆ ∗ =
∑ uˆ 2 eˆ 2
i =1 j i i
(45)
n
j
(∑i =1 uˆ 2j ) 2 i
190
Econometria Alexandre Gori Maia
variáveis independentes. A raiz quadrada do estimador S β2ˆ∗ é conhecida como erro padrão
j
robusto à heterocedasticidade e sua autoria atribuída à Halbert White. Seu uso justifica-se
quando trabalhamos com amostras grandes, já que é assintoticamente não viesado, ou seja,
converge, em amostras grandes, para a a real variância na presença de heterocedasticidade (42).
Analogamente, as estatísticas t e F baseadas no estimador de White também se justificam apenas
assintoticamente.
A grande vantagem desse procedimento é que não necessita estabelecer premissas sobre a
forma de heterocedasticidade dos erros (como o MQP), tampouco gera estimadores viesados dos
coeficientes para amostras pequenas (como os MQGF). A desvantagem é que, para amostras
relativamente pequenas, as estatísticas t e F baseadas nas variâncias robustas não apresentarão as
respectivas distribuições de probabilidade t e F.
Exemplo 7. O ajuste de MQO para a relação entre gastos com alimentação e renda forneceu as
seguintes estimativas:
Gasto Aliment i = 40,8 + 0,13 Rendai + eˆi
A estimativa de MQO para a variância do estimador de β seria:
σˆ 2 1.429
S β2ˆ = n
= = 0,00093 = 0,0312
∑ x2
i =1 i
1.532.463
S β2ˆ ∗ =
∑i=1 xi2 eˆi2 = 3.421.453.919 = 0,0015 = 0,0382
n
(∑i =1 xi2 ) 2 (1.532.463) 2
191
Econometria Heterocedasticidade
O valor p associado à esta estimativa seria 0,00178. Em outras palavras, considerando o erro
padrão robusto à heterocedasticidade, haveria apenas 0,2% de chance de erro se afirmássemos
que há relação significativa entre renda e gastos com alimentação.
Exercícios
1. O arquivo DistanciaPercorridaFerias.XLS contém informações sobre a distância percorrida
por famílias em férias (Dist, em km), renda mensal (Renda, em reais) e idade do chefe da
família (Idade). Pressupõe-se que a distância percorrida seja uma função linear da renda e da
idade do chefe da família.
a. Sem qualquer tipo de análise prévia, há motivos para suspeitar de
heterocedasticidade nesse modelo?
b. Obtenha os estimadores de MQO.
c. Verifique a existência de heterocedasticidade a partir da análise gráfica.
d. Teste a existência de heterocedasticidade a partir do teste de Goldfeld-Quandt.
e. Teste a existência de heterocedasticidade a partir do teste de White.
f. Pressupondo que a variância dos resíduos seja proporcional à renda, obtenha os
estimadores de MQP.
g. Analise a significância das estimativas obtidas em (f).
192
Econometria Alexandre Gori Maia
3. Uma amostra de 6 famílias forneceu as seguintes informações sobre gastos com alimentos
(Gasto em mil reais) e renda (Renda, em mil reais):
Gasto 0,4 0,6 2,8 1,2 4,2 2,2
Renda 1 2 3 4 5 6
Supondo que os gastos sejam linearmente determinados pela renda das famílias, pede-se:
a. Obtenha os estimadores de MQO.
b. Teste a existência de heterocedasticidade a partir do teste de Goldfeld-Quandt.
Tendo em vista o limitado tamanho da amostra, não elimine observações centrais
para realização do teste.
c. Teste a existência de heterocedasticidade a partir do teste de Breusch-Pagan.
d. Teste a existência de heterocedasticidade a partir do teste de White.
e. Supondo que a heterocedasticidade seja diretamente proporcional ao valor da
renda, ajuste a regressão por MQP.
f. Analise a significância das estimativas obtidas em (d).
g. Obtenha as estimativas de MQGF.
193
Econometria Heterocedasticidade
Respostas
1) b. Dist = 5,52 + 0,27 Renda + 11,07 Idade + eˆ ;
e. eˆ 2 = −3375 + 163Renda − 2556 Idade − 0,02 Renda 2 + 44,7 Idade 2 − 2, ,45Renda ⋅ Idade + uˆ ;
nR2=7,99; p=0,157; f. Dist = 100,9 + 0,24 Renda + 9,66 Idade + eˆ ; g. βˆ0 : t=-0,798; p=0,461;
Inv = −17,9 + 0,028V + 0,156 K + eˆ ; g. βˆ0 : t=-0,629; p=0,549; βˆ1 : t=-2,150; p=0,069; βˆ2 :
t=-2,492; p=0,041;
3) a. Gasto = 0,08 + 0,52 Renda + ê; b. F=6,267, p=0,242; c. nR2= 6×0,4778=2,866; p=0,090; c.
nR2= 6×0,628=3,768; p=0,152; e. Gasto = -0,16 + 0,59 Renda + ê; f. tβ0=0,23; p=0,83; .
tβ1=2,46; p=0,07; g. Gasto = 0,005 + 0,542 Renda + ê;
4) F.
5) V.
6) V.
194
Econometria Alexandre Gori Maia
13. Autocorrelação
Introdução
Os dados utilizados em análises econométricas podem ser classificados em três grupos
principais: i) dados de corte transversal (cross section): quando indivíduos independentes são
observados em um mesmo ponto do tempo (por exemplo, dados sobre a renda e escolaridade de
um grupo de pessoas em um determinado período); ii) dados de séries temporais (time series):
quando um mesmo indivíduo é observado em perídos consecutivos de tempo (por exemplo,
dados sobre o consumo e renda de um país entre 1981 e 2010); iii) dados em painel (panel data):
quando um grupo de elementos amostrais é observado em períodos consecutivos de tempo (por
exemplo, dados sobre o consumo e renda para cada um dos países da América do Sul entre 1981
e 2010).
Uma característica da análise de dados de séries temporais é que valores de períodos
correntes tendem a estar associados a valores de períodos passados. Seria o caso, por exemplo,
da área plantada em determinado ano que dependeria da área plantada no ano anterior, ou do
consumo em determinado trimestre, que dependeria não somente da renda presente como da
renda nos trimestres anteriores. Para contornar esse problema, modelos com dados de séries
temporais costumam conter valores defasados (de períodos anteriores) das variáveis Y e X entre
os regressores.
Entretanto, quando a relação entre valores presentes e passados reproduz-se nos erros do
modelo, é quebrada uma das premissas do MCRL, a ausência de autocorrelação nos erros. Da
mesma forma que ocorre com a heterocedasticidade, na presença de autocorrelação os
estimadores de MQO deixam de ser eficientes, embora permaneçam não viesados e consistentes.
Adicionalmente, o estimador de MQO para a variância dos coeficentes do modelos passa a ser
tendencioso. Neste capítulo, além da definição de autocorrelação, discutiremos quais suas
consequências, determinantes, técnicas para detectá-la e as principais medidas corretivas.
13.1. Definição
Seja o modelo de RLM para um conjunto de dados de séries temporais:
Yt = α + β1 X 1t + β 2 X 2t + ... + β k X kt + et (1)
195
Econometria Autocorrelação
E (u t ) = 0 E (ut2 ) = σ u2 E (u t u t −s ) = 0 (4)
Graficamente, a autocorrelação nos erros significa que esses apresentarão um padrão
sistemático ao longo do tempo, enquanto que, na ausência de autocorrelação, sua dispersão ao
longo do tempo será indiscernível:
Não Autocorrelacionado Autocorrelacionado
(5)
29
Embora o coeficiente de autocorrelação ρ possa também assumir o valor 1 ou –1, veremos adiante que esse
resultado implicaria em um problema mais sério no modelo de regressão: não estacionariedade dos erros.
196
Econometria Alexandre Gori Maia
São vários os motivos que podem levar à autocorrelação no erros, entre os quais podemos
destacar:
• Inércia: é comum que séries temporais econômicas apresentarem ciclos, ou seja,
períodos de crescimento ou decaimento. Mudanças em uma tendência temporal
costumam ocorrer lentamente. Quando esse comportamento se reflete nos erros de um
modelo de regressão, esses tenderão a estar autocorrelacionadas, ou seja, erros
positivos tenderão a estar próximos em períodos de crescimento, assim como erros
negativos tenderão a estar próximos em períodos de retrocesso. Por exemplo, se a
declaração de otimismo da população em relação à economia está, em um
determinado período, acima do que se esperaria para a respectiva taxa de crescimento
econômico por fatores não observáveis, é natural supor que esse comportamento se
mantenha em períodos subsequentes, mesmo com tendência de convergência ao
padrão histórico de relacionamento ao longo do tempo;
• Falhas de especificação: a autocorrelação pode ser devida à ausência de uma
importante variável no modelo de regressão ou transformação das variáveis
existentes. Os erros expresariam, assim, um padrão sistemático devido à ausência
dessas informações. Por exemplo, omitir o preço de um substituto em uma função de
demanda pode sujeitar os erros a um comportamento sistemático. Analogamente,
ajustar uma função linear a uma relação quadrática também poderia sujeitar os
resíduos a um padrão sistemático.
• Defasagens: as decisões econômicas em um período t dependem, muitas vezes, de
informações defasadas do período t−1. Desconsiderar esse tipo de relação sujeitaria
os erros à correlação serial. Por exemplo, o otimismo da população pode ser
influenciada não apenas pelo crescimento da economia no período presente, mas
também pelo comportamento da econômia nos períodos anteriores. Analogamente, o
consumo pode depender, além da renda presente, do consumo e da renda nos períodos
anteriores;
197
Econometria Autocorrelação
de os estimadores das variâncias dos coeficientes serem viesados. Assim, estatísticas de teste
baseadas na variabilidade dos coeficientes, como as estatísticas t e F, deixariam de ser válidas.
Para melhor compreender esse problema, suponha que estejamos trabalhando com um modelo de
RLS:
Yt = α + βX t + et (6)
Onde sabemos que os estimadores de MQO serão:
n
∑ xt yt
β̂ = t =n1 S β2ˆ =
σˆ 2
(7)
n
∑t =1 xt2 ∑t =1 xt2
Agora comparemos algumas propriedades do modelo na presença e ausência de
autocorrelação (ver demostração no Apêndice A):
σ2 (8)
Cov(et , et +s ) = 0 Cov (et , et + s ) = ρ s
1− ρ 2
σ2 σ2 σ2 n −1 n −t
Var ( βˆ ) = n Var ( βˆ ) = +2 ∑∑ ρ s xt xt + s
∑
n n
x2
t =1 i ∑ x2
t =1 i ∑ x 2 t =1 s =1
t =1 i
estimador de MQO (7) com a real variância de βˆ (8), podemos observar que o primeiro
198
Econometria Alexandre Gori Maia
13.2. Identificação
Caso não haja conhecimento a priori da existência de autocorrelação nos erros, deve-se
analisar o comportamento dos resíduos para inferir sobre sua existência. Veremos quatro formas
principais de análise: i) análise gráfica; ii) teste t para regressores estritamente exógenos; iii)
teste de Durbin-Watson para o MCRL; iv) teste de Breusch-Godfrey para ordens superiores e
regressores não estritamente exógenos.
(a) (b)
(9)
(c) (d)
Exemplo 1. Observou-se, durante 34 trimestres, a relação entre área plantada (Área, em mil
hectares) e preço (Preço, em reais por tonelada) da cana-de-açucar em determinada região. A
199
Econometria Autocorrelação
dispersão dos valores observados e o ajuste de MQO estabelecido, com seus respectivos erros
padrão (em parênteses), são apresentados abaixo:
Quando se observa a distribuição dos resíduos (êt) ao longo do tempo, observa-se um provável
padrão cíclico, o que sugeriria a existência de autocorrelação nos erros do modelo.
Afinal, é natural supor que a área plantada no trimestre t não dependa apenas do preço no ano t,
mas também de informações observadas em períodos anteriores. A área plantada em um
trimestre pode ser influenciada tanto pela área plantada no trimestre anterior, pelo preço pago
pela cana-de-açucar no período anterior, como por outros fatores não previstos pelo ajuste
(política de incentivos do governo, previsões sobre os preços futuros e expectativas sobre o
estabelecimento de usinas na região, por exemplo) que tenham lento amortecimento no tempo.
Ademais, o próprio ajuste da oferta pelo produtor em função de variações no preço da cana
podem ser pouco flexíveis e, consequentemente, também gerar um lento amortecimento no
tempo.
200
Econometria Alexandre Gori Maia
H 0: ρ = 0
(11)
H1: ρ > 0
A hipótese nula corresponde à hipótese da ausência de autocorrelação, já que implicaria a
inexistência de relação entre os erros presentes (et) e passados (et–1). Como a correlação serial é
usualmente positiva, limitamo-nos a realizar um teste unicaudal para o ceficiente de
autocorrelação (ρ).
Um procedimento natural seria substituirmos et pelos resíduos êt de MQO e estimarmos o
coeficiente ρ também por MQO. Teríamos então o estimador ρ̂ e a respectiva estatística t para
testar as hipóteses em (11) dados por:
n
∑ eˆt eˆt −1
ρˆ = t =2 2 e t=
ρˆ
(12)
n S ρˆ
∑t =2 eˆ t −1
n 2
Sendo S ρˆ =
σˆ 2 ∑ uˆ
e σˆ 2 = t =2 t −1 os estimadores de MQO para o erro padrão do
2
n (n − 1) − 1
∑t =2 eˆ t −1
201
Econometria Autocorrelação
Exemplo 2. Para testar a presença de autocorrelação de 1ª ordem no modelo para a área plantada
em função do preço da cana-de-açucar, ajustamos o seguinte modelo por MQO:
eˆt = 0,252eˆt −1 + uˆt
A estatística t associada ao coeficiente de autocorrelação foi estimada por:
ρˆ 0,252
t= = = 1,443
S ρˆ 0,175
Das 34 observações originais, a primeira foi perdida em função da ausência de uma estimativa
para êt–1 quando t=1. Considerando ainda o único coeficiente do modelo, teremos 32 graus de
liberdade para a estatística t e o valor p associado ao teste unicaudal será dado por:
202
Econometria Alexandre Gori Maia
H 0: ρ = 0
(15)
H1: ρ > 0
A estatística de Durbin-Watson (DW) proposta para testar essas hipóteses será dada por:
n
DW =
∑ (eˆ − eˆt −1 ) 2
t =2 t
(16)
n
∑t =1 eˆt 2
Onde êt são os resíduos obtidos no ajuste de MQO. Perceba que, como desconhecemos a
defasagem (t–1) para o primeiro período (t=1), a expressão no numerador considera apenas o
comportamento para n–1 observações. Podemos ainda demonstrar que existe uma estreita relação
entre a estimativa de DW e o coeficiente de autocorrelação dos resíduos. Desenvolvendo a
expressão (11) teremos:
n n n
DW =
∑ eˆ − 2∑t =2 eˆt eˆt −1 + ∑t =2 eˆt −1
t =2 t
2 2
(17)
n
∑t =1 teˆ 2
203
Econometria Autocorrelação
teremos para rejeitar a hipótese nula, sugerindo a existência de correlação serial positiva. Embora
possível, valores de DW próximos de 4 dificilmente ocorrem, pois implicariam correlação serial
negativa, fenômeno pouco comum em séries temporais.
Os valores críticos da tabela de Durbin-Watson apresentam uma importante
peculiaridade. Diferentemente das estatísticas de teste padrão, como t e F que se baseiam em
valores observados na amostra, a estatística DW baseia-se em valores estimados a partir da
amostra (êt). Essa peculiaridade condiciona sua distribuição de probabilidade aos valores
observados para as variáveis independentes (X) na amostra. Para contornar essa limitação,
Durbin e Watson propuseram uma tabela com possíveis valores extremos de DW em função do
número de variáveis independentes (k) e observações da amostra (n).
Assim, dados os valores de n e k, pode-se consultar o valor crítico inferior (dI) e superior
(dS) para DW supondo que sua distribuição esteja, respectivamente, o mais concentrado possível
à esquerda ( DWnI,k ) e à direita ( DWnS,k ), como mostra a Figura 13:
(20)
A novidade nessa análise é a existência de uma zona de indecisão, entre dI e dS, onde não
se pode rejeitar nem aceitar H0, já que cada distribuição extrema proporcionaria uma decisão
diferente:
(21)
Alguns autores sugerem, entretanto, que o limite superior da tabela (ds) seja uma boa
aproximação para o real valor crítico da distribuição na maioria das situações.
Em comparação ao teste t, a vantagem da estatística de Durbin-Watson é o fato de
apresentar uma distribuição específica de probabilidade, não dependendo apenas de
aproximações assintóticas. Entretanto, a validade do teste de Durbin-Watson também depende de
algumas considerações importantes. Primeiro, o teste depende fundamentalmente das premissas
do MCRL, como a homocedasticidade e normalidade dos erros. O teste também limita-se ainda
à detecção de esquemas autorregressivos de 1ª ordem (et=et–1+ut). Ademais, todos os regressores
204
Econometria Alexandre Gori Maia
devem ser não aleatórios, o que não ocorrerá, por exemplo, quando temos um componente
autorregressivo de Y entre as variáveis explanatórias.
DW =
∑ (eˆ − eˆt −1 ) 2
t =2 t
= 1,4745
n
∑t =1 t
eˆ 2
Para conhecermos os pontos críticos da tabela DW, devemos considerar os valores inferior e
superior para uma amostra com 34 observações (n=34) e apenas a variável Preço como regressor
(k=1).
Como o valor de DW obtido para os resíduos (1,4745) está na região de indecisão, o teste é
inconclusivo, ou seja, não há evidências, a 5% de significância, para rejeitar ou não H0. Em
outras palavras, não podemos afirmar se os erros são ou não autocorrelacionados para uma
significância de 5%.
205
Econometria Autocorrelação
H 0: ρ1 = ρ 2 = 0
(23)
H 1: ρ1 ≠ 0 ou ρ 2 ≠ 0
O procedimento usual seria substituirmos et pelos resíduos de MQO êt e estimarmos o
modelo:
eˆt = ρ1eˆt −1 + ρ 2 eˆt −2 + ut (24)
Entretanto, para permitirmos que os erros defasados correlacionem-se com os
regressores, consideramos esses também na equação (24), assim como o intercepto. No caso de
um modelo de RLS, teremos:
eˆt = δ 0 + δ1 X t + ρ1eˆt −1 + ρ 2 eˆt −2 + ut (25)
Os regressores incluídos na equação acima podem conter valores defasados de X ou Y.
Esse procedimento permite que Xt seja correlacionado a et–s e, consequentemente, que o teste seja
válido mesmo na ausência de exogeneidade estrita.
O teste pode ainda ser facilmente generalizado para autocorrelações de múltiplas ordens,
AR(q). Neste caso, teríamos:
et = ρ1et −1 + ... + ρ q et −q + ut (26)
As hipóteses seriam:
H 0: ρ1 = ... = ρ q = 0
(27)
H1: ρ j ≠ 0
Supondo agora um modelo de RLM com k regressores, a equação a ser estimada seria:
eˆt = δ 0 + δ1 X 1t + ... + δ k X kt + ρ1eˆt −1 + ... + ρ q eˆt −q + ut (28)
Para testarmos a hipótese de ausência de autocorrelação de ordem q (27), tanto a
estatística F para a contribuição marginal dos q coeficientes como a estatística LM se justificam
assintoticamente. O teste de BG baseia-se na estatística LM, que será dada por:
206
Econometria Alexandre Gori Maia
LM = (n − q) Reˆ2 (29)
(30)
207
Econometria Autocorrelação
208
Econometria Alexandre Gori Maia
1 ρ ρ2 ... ρ n −1
ρ 1 ρ ... ρ n −2
1 2
... ρ n −3 σ = Vσ
T 2 2
Var (e) = E (ee ) = ρ ρ 1 (36)
1− ρ 2
... ... ... ... ...
ρ n−1 ρ n− 2 ρ n −3 ... 1
Para melhor compreender essa estrutura de variâncias e covariâncias, reveja as
propriedades apresentadas em (8).
Se conhecemos essa estrutura de variâncias e covariâncias, podemos aplicar o mesmo
raciocício do MQP para corrigir a matriz de valores de X e Y e chegarmos a um modelo com
erros de variância constante e não autocorrelacionados. Em outras palavras, os estimadores
MELNV de MQG serão obtidos pelo modelo:
Λy = ΛXβ + Λe (37)
Onde:
Λ T Λ = V −1 (38)
A partir de desenvolvimento algébrico, podemos chegar à matriz V–1:
1 −ρ 0 ...0
− ρ 1 + ρ 2 −ρ ... 0
V −1 = 0 − ρ 1+ ρ 2 ... 0 (40)
... ... ... ... ...
0 0 ... − ρ 1
E à matriz Λ:
1− ρ 2 0 0 0 ...
−ρ 1 0 0 ...
Λ= 0 − ρ 1 ... 0 (39)
... ... ... ... ...
0 0 ... − ρ 1
Perceba que os produtos Λy e ΛX nos darão, para t≥2, as variáveis transformadas
209
Econometria Autocorrelação
unitários constantes associados ao intercepto (α). Agora a matriz ΛX conterá valores variáveis,
observações (t≥2).
Assim como ocorre no caso da heterocedasticidade, a questão que fica é como estabelecer
a matriz de correções das covariâncias V e a resepectiva matriz de transformação Λ. Veremos a
seguir duas situações: i) quando o coeficiente de autocorrelação ρ é conhecido; ii) quando o
coeficiente de autocorrelação ρ é desconhecido e trabalhamos com estimativas obtidas a partir de
comportamentos observados na amostra.
βˆ = ( X T V −1 X) −1 X T V −1 y (40)
E a respectiva estimativa da matriz de variâncias e covariâncias dos coeficientes por:
y T V −1y − βˆ T X T V −1y
σˆ 2 = (42)
n − (k + 1)
210
Econometria Alexandre Gori Maia
1 − 0,5 0 ... 0
− 0,5 1 + 0,5 2 − 0,5 ... 0
V −1 = 0 − 0,5 1 + 0,5 2 ... 0
... ... ... ... ...
0 0 ... − 0,5 1
Os estimadores de MQG serão, portanto:
− 3,34
βˆ = ( XT V −1X) −1 XT V −1y =
5,056
Area = −3,34 + 5,056 Precot + eˆt
Embora não haja diferenças expressivas entre a reta de MQO (linha tracejada) e MQG (linha
contínua), devemos considerar que as estimativas das variâncias de MQO serão viesadas. No
caso do MQG, as variâncias estimadas serão obtidas da matriz:
727,4 − 21,35
S β2ˆ = ( XT V −1X) −1σˆ 2 =
− 21,35 0,823
Onde:
211
Econometria Autocorrelação
1 − ρˆ 0 ... 0
− ρˆ 1 + ρˆ 2 − ρˆ ... 0
ˆ −1
V = 0 − ρˆ 1 + ρˆ 2 ... 0 (44)
... ... ... ... ...
0 0 ... − ρˆ 1
De maneira similar ao MQG, os estimadores de MQGF seriam agora obtidos pela
expressão:
βˆ = ( X T V
ˆ −1 X ) − 1 X T V
ˆ −1y (45)
Com a respectiva estimativa da matriz de variâncias e covariâncias dos coeficientes dada
por:
ˆ −1X) −1σˆ 2
S β2ˆ = ( XT V (46)
Onde:
ˆ −1y − βˆ T XT V
yT V ˆ −1y
σˆ 2 = (47)
n − (k + 1)
A única diferença em relação aos estimadores de MQG (expressões 40, 41 e 42) é a
ˆ −1 . A consequência imediata da substituição de
substituição da matriz V −1 pela sua estimativa V
212
Econometria Alexandre Gori Maia
Exemplo 6. Para obtermos os estimadores de MQGF da relação entre área e preço da cana-de-
açucar, o primeiro passo é estimar, por MQO, a função de autcorrelação de 1ª ordem para os
resíduos:
eˆt = 0,252eˆt −1 + uˆt
A partir da estimativa ρˆ = 0,252 , termos a seguinte estimativa para a matriz de transformação
das covariâncias dos erros:
213
Econometria Autocorrelação
1 − 0,252 0 ... 0
− 0,252 1 + 0,252 2 − 0,252 ... 0
ˆ −1
V = 0 − 0,252 1 + 0,252 2 ... 0
... ... ... ... ...
0 0 ... − 0,252 1
Os estimadores de MQGF serão, portanto:
− 0,007
βˆ = ( XT V −1X) −1 XT V −1y =
4 ,903
Area = −0,007 + 4,903Precot + eˆt
As diferenças entre as retas de MQO (vermelho tracejado) e MQGF (roxo contínuo) são quase
imperceptíveis. Assintoticamente, as estimativas de MQGF seriam mais eficientes que as de
MQO, embora sua exatidão possa ser discutível em razão do número razoavelmente pequeno de
observações na amostra.
214
Econometria Alexandre Gori Maia
σ2 σ2 n −1 n −t
Var ( βˆ ) = n
+2 n ∑∑ ρ s xt xt +s (48)
∑ x2
t =1 t ∑ x 2 t =1 s=1
t =1 t
Um estimador robusto para essa variância poderia ser obtido, por exemplo, substituindo ρ
e σ2 pelos seus respectivos estimadores:
σˆ 2 σˆ 2 n −1 n −t
Var ( βˆ ) = n
+2 n ∑∑ ρˆ s xt xt +s (49)
∑ x2
t =1 t ∑ x 2 t =1 s=1
t =1 t
Exercícios
1. O arquivo FuncaoCobbDouglas.XLS contém informações anuais sobre produto bruto real
(Y), dias trabalhados (L) e insumos de capital real (K) em Taiwan entre 1958 e 1972.
Suponha que a relação entre as variáveis seja dada por:
ln(Yt ) = α + β1 ln(Lt ) + β 2 ln(K t ) + et
a. Sem qualquer tipo de análise prévia, há motivos para suspeitar de autocorrelação
nesse modelo?
b. Obtenha os estimadores de MQO.
c. Verifique a existência de autocorrelação a partir da análise gráfica.
d. Verifique a existência de autocorrelação a partir do teste de Durbin-Watson.
e. Pressupondo que o coeficiente de autocorrelação dos erros seja de 0,4, obtenha os
estimadores de MQG. Analise suas propriedades em comparação às do MQO.
f. Analise a significância das estimativas obtidas em (e).
215
Econometria Autocorrelação
2. O arquivo PrecoCobre.XLS contém informações anuais sobre preço médio do cobre nos
EUA (Preco, em US$/libra) e PIB (em bilhões de dólares). Suponha que a relação entre as
variáveis seja dada por:
ln(Preco) = α + β ln(PIB) + et
a. Sem qualquer tipo de análise prévia, há motivos para suspeitar de autocorrelação
nesse modelo?
b. Obtenha os estimadores de MQO.
c. Verifique a existência de autocorrelação a partir da análise gráfica.
d. Verifique a existência de autocorrelação a partir do teste de Durbin-Watson.
e. Pressupondo que o coeficiente de autocorrelação dos erros seja de 0,2, obtenha os
estimadores de MQG. Analise suas propriedades em comparação às do MQO.
f. Analise a significância das estimativas obtidas em (e).
216
Econometria Alexandre Gori Maia
em que et tem média zero e variância σ 2 . Então, se os erros são autocorrelacionados, ainda
assim os estimadores de Mínimos Quadrados Ordinários de β1 e β2 são lineares e não
tendenciosos.
Respostas
1) b. ln(Yt ) = −3,34 + 1,50 ln(Lt ) + 0,49 ln(K t ) + eˆt ; d. ρˆ = 0,366 ; DW≈1,269;
e. ln(Yt ) = −2,54 + 1,26 ln(Lt ) + 0,54 ln(K t ) + eˆt ; f. α: t=-0,851; p=0,412; β1: t=2,039;
p=0,196;
4) V.
5) V.
217
Econometria Autocorrelação
Sendo ut um ruído branco, ou seja, com média zero, homocedástico e não autocorrelacionado:
E (u t ) = 0 E (ut2 ) = σ u2 E (u t u t − s ) = 0
A partir dessas premissas, vamos, primeiro, calcular a variância dos erros et (σ2):
Como o erro ut deve ser não correlacionado ao regressor (et −1) de seu modelo, teremos:
σ 2 = ρ 2σ 2 + σ u2
Finalmente:
2 σ u2
Var (et ) = σ =
1− ρ 2
E (et et −1 ) = ρE (et2−1 )
E, finalmente:
σ u2
Cov(et , et −1 ) = ρ 2
= ρσ 2
1− ρ
218
Econometria Alexandre Gori Maia
σ u2
Cov(et , et − s ) = ρ s 2
= ρ sσ 2
1− ρ
σ2 σ2 n −1n − t
Var ( βˆ ) =
n 2
+2
n 2 ∑ ∑ ρ s xt xt + s
∑ t =1 xt ∑ t =1 xt t =1s =1
219
Econometria Equações Simultâneas
Introdução
Boa parte das relações econométrica pode ser representada por apenas uma equação de
regressão, onde se supõe que a relação de causa e efeito seja unidirecional, ou seja, os
regressores (variáveis independentes) determinam ou causam efeitos sobre o regressando
(variável dependente). Entretanto, pode haver situações em que um regressor determina e, ao
mesmo tempo, é determinado pelo regressando. Seria o caso, por exemplo, do preço de um
produto, que, ao mesmo tempo, determinaria a quantidade consumida (preços maiores reduzem a
demanda) e seria determinado pela quantidade produzida (aumento da oferta reduz os preços).
Ou da jornada de trabalho, que determinaria a remuneração do trabalho (pessoas que trabalham
mais são mais experientes e tendem a ganhar mais) e seria determinada pela remuneração
(acréscimos controlados na renda tendem a aumentar a disposição a trabalhar horas adicionais).
Como será visto a seguir, esse tipo de relação de reciprocidade, ou simultaneidade, entre
variáveis dependentes e independentes, ocorre em situações de quebra de um dos pressupostos
do Teorema de Gauss-Markov, aquele que diz que os valores de X são controlados em repetidas
amostras. Uma consequência importante da simultaneidade é que os erros passam a apresentar
relação com a variável independente, implicando na tendenciosidade e inconsistência dos
estimadores de MQO.
A simultaneidade entre as variáveis exige a consideração de um sistema de equações, ou
equações simultâneas, onde cada variável endógena (aquela que apresenta relação de
simultaneidade) seja representada por um modelo individual de regressão, e todos os modelos
individuais estejam interconectados através de um sistema de equações. O conceito de equações
simultâneas que veremos nesta seção foi desenvolvido nos anos 40, por econometristas da
Cowles Foundation at the University of Chicago. Além da definição e implicações da
simultaneidade, veremos as duas principais técnicas para estimação de seus coeficientes
(Mínimos Quadrados Indiretos e Mínimos Quadrados em 2 Estágios), as condições impostas
para a identificação de estimadores consistentes e um teste estatístico para verificação da relação
de endogeneidade.
220
Econometria Alexandre Gori Maia
221
Econometria Equações Simultâneas
Q d = α 0 + α1 P + e d (2)
Mas também sabemos que, pela mesma teoria microeconômica, à medida que o preço de
um produto aumenta, o produtor sentir-se-á mais estimulado a produzi-lo, aumentando sua
oferta. A função oferta relacionando o preço da mercadoria (P) à quantidade ofertada (Qo) pode
ser representada por:
Q o = β 0 + β1 P + e o (3)
Q d = α 0 + α 1 P + e d
o o
Q = β 0 + β1 P + e (4)
d o
Q = Q = Q
Embora o sistema de equações em (4) não evidencie a relação de simultaneidade
abertamente, podemos desenvolver conceitualmente a interdepedência entre preço e quantidade.
Como mostra a figura (5), se, por exemplo, a demanda aumentar de Q0 para Q1 em decorrência
de uma variação positiva de ed (outros fatores que não o preço, como mudanças na renda ou no
gosto da população), o preço também aumentará pois os produtores não estarão dispostos a
aumentar a oferta sem variação do preço. Em outras palavras, a função de demanda deslocar–se-
30
Embora a representação gráfica não condiga com a função estatística (Q no eixo das abscissas), essa é a forma
usual de representação da função demanda.
222
Econometria Alexandre Gori Maia
á para cima, pois os consumidores estariam dispostos a pagar um pouco mais pela mesma
quantidade demandada.
Raciocínio análogo é válido para a função oferta. Se, por exemplo, a quantidade ofertada
reduzir de Q0 para Q2 por fatores alheios ao preço (efeito de eo, tais como greve ou fatores
ambientais), o preço também aumentará para ajustar-se à demanda. Haveria, pois, um
deslocamento da função oferta para cima, já que a manutenção de uma oferta superior só seria
possível a um custo superior.
(5)
De maneira geral, podemos dizer que variações de ed irão afetar tanto Q quanto P, assim
como eo também afetará ambas as variáveis. Em outras palavras, P e Q são conjuntamente
dependentes e tanto ed quanto eo possuem relação com P.
14.2. Definição
Um sistema de equações simultâneas representa a relação de mútua determinação entre
variáveis endógenas (aquelas que são conjuntamente determinadas dentro do sistema) e seus
determinantes exógenos (aqueles que são determinados fora do sistema). Em outras palavras, seja
o sistema:
31
Variáveis predeterminadas consideram, além das variáveis exógenas, variáveis endógenas de períodos defasados
(t−1). Supõe-se que essas sejam determinadas no período t.
223
Econometria Equações Simultâneas
(7)
A existência de relação mútua entre Y1 e Y2 faz, por exemplo, com que fatores não
explicados pelo modelo da primeira equação (e1) afetem, simultaneamente, Y1 e Y2, causando
correlação entre os erros e1 e a variável independente Y2. Da mesma forma, haverá relação linear
entre a variável independente Y1 e os erros aleatórios da segunda equação (e2). Com a quebra do
pressuposto da ausência de relação entre erros e variáveis independentes, a regressão por MQO
traria estimadores viesados e inconsitentes.
Exemplo 1. Vamos, inicialmente, considerar apenas a relação estabelecida pela função demanda
isoladamente. Supondo que, além do preço (P), a renda (R) também influencie a quantidade
demandada (Qd), teremos:
Q d = α 0 + α1P + α 21R + e d
Nessa representação isolada pressuporíamos que, dados os valores do preço (P) e da renda (R)
seriam determinados exogenamente e, em adição ao erro aleatório não explicado pelo modelo
(ed), determinariam a demanda (Qd).
Por outro lado, teríamos a função oferta relacionando preço à quantidade ofertada (Qo):
Q o = β 0 + β1P + e o
Nessa representação isolada, o preço (P) seria considerado um fator exógeno que, em conjunto
com o erro aleatório não explicado pelo modelo (eo), determinaria a oferta da mercadoria.
Considerando agora o equilíbrio do mercado, teríamos não somente que Qd=Qo (genericamente
Q), mas também que fatores não explicados pelas equações (ed e eo), como mudanças climáticas
ou nos padrões de consumo, causariam impactos simultâneos em Q e P:
224
Econometria Alexandre Gori Maia
Q d = α 0 + α 1 P + α 2 R + e d
o o
Q = β 0 + β 1 P + e
d o
Q = Q
C = β 0 + β1Y + e
Y =C+I
A função identidade define a renda como soma do consumo mais investimento. Não há erro
aleatório nessa representação pois não se trata de um modelo estatístico, mas sim de uma relação
matemática determinística.
225
Econometria Equações Simultâneas
A partir das relações estabelecidas, fica claro que o consumo dependeria da renda, da mesma
forma que a renda dependeria do consumo. Essa interação entre as funções de consumo e renda
pode ser representada por:
C = β 0 + β1Y + e
Y = C + I
Pela função consumo, variações em C devido a fatores alheios à renda (e) também afetariam a
renda, até se chegar a um novo ponto de equilíbrio da economia entre consumo e renda. C e Y
seriam então consideradas variáveis endógenas, ou seja, determinadas internamente no sistema
de equações. I seria a única variável exógena do sistema.
226
Econometria Alexandre Gori Maia
cada variável endógena seria representada por uma função única e exclusiva das variáveis
exógenas ou predeterminadas, no caso, somente X1:
α 0 + α 1 β 0 α 1 β 2 + α 2 e1 − α1e2
Y1 = + X1 +
1 − α 1 β1 1 − α 1 β1 1 − α 1 β1
(10)
Y = β + β α 0 + α 1 β 0 + β + β α 1 β 2 + α 2 X + e + β e1 − α1e2
2 0 1 2
1 − α1β 0
1
1 − α1β 0
1 2 1
1 − α 1 β1
Para simplicar as representações, podemos criar funções dos coeficientes α’s e β’s e dos
erros e1 e e2:
Y1 = π 1 + π 2 X 1 + u1
(11)
Y2 = π 3 + π 4 X 1 + u 2
Onde:
α 0 + α1 β 0 α1β 2 + α 2
π1 = e π2 =
1 − α 1 β1 1 − α 1 β1
α 0 + α1β 0 α1 β 2 + α 2
π 3 = β 0 + β1 e π 4 = β 2 + β1 (12)
1 − α1β 0 1 − α1β 0
e1 − α 1e2 e1 − α 1e2
u1 = e u 2 = e2 + β1
1 − α 1β1 1 − α 1 β1
O sistema obtido em (11), em que cada variável endógena é representada por uma função
das variáveis exógenas (ou predeterminadas) do sistema, é chamado de sistema de equações da
forma reduzida. Os parâmetros π’s são chamados parâmetros da forma reduzida. Os erros u1 e u2
são chamados de erros da forma reduzida.
Como não há problema de endogeneidade nas equações da forma reduzida, seus
parâmetros (π’s) podem ser obtidos pelo MQO. Para obter os estimadores consistentes dos
parâmetros da forma estrutural (α’s e β ’s) bastaria, posteriormente, desenvolver o sistema de
equações obtido em (12). Em outras palavras, estimar os coeficientes α’s e β ’s como funções dos
coeficientes π’s. Esse procedimento é denominado Mínimos Quadrados Indiretos (MQI).
Antes de resolvermos o sistema de equações é necessário, entretanto, saber se os
coeficientes da forma estrutural poderão ser identificados a partir dos coeficientes da forma
reduzida. Em outras palavras, precisamos saber se à partir dos coeficientes π’s conseguiremos
estimar todos os coeficientes da forma estrutura. Essa análise pode ser feita previamente e é
denominada identificação.
227
Econometria Equações Simultâneas
14.4. Identificação
Em sistemas de equações simultâneas, o conceito de identificação está associado à
possibilidade de obtermos estimativas consistentes para os parâmetros da forma estrutural.
Através de algumas regras básicas, prodemos definir a priori se os parâmetros de uma equação
da forma estrutural poderão ser identificados, ou seja, se poderão ser estimados
consistentemente. Antes de analisarmos essas regras, vamos relembrar algumas propriedades de
um sistema de equações. Sabemos que, para estimarmos k incógnitas em um sistema de
equações, precisamos de pelo menos k equações independentes. Quando o número de equações é
idêntico ao número de incógnitas, podemos chegar a soluções únicas para as incógnitas (por
exemplo, a+b=3 e 2a+b=5). Quando o número de equações é superior ao de incógnitas,
poderemos ter múltiplas soluções para cada incógnita (por exemplo, a=6 e a=5). Quando o
número de equações é inferior ao número de incógnitas (por exemplo, a+b=2), teremos uma
infinidade de soluções e o sistema será indeterminado.
Em sistemas de equações simultâneas, a estimativa dos coeficientes da forma estrutural
(equação 8) a partir do sistema de equações da forma reduzida (equação 12) também exige que o
número de equações seja, no mínimo, igual ao número de incógnitas (coeficientes estruturais).
Em outras palavras, é necessário que o número de coeficientes da forma reduzida seja, no
mínimo, igual ao número de coeficientes da forma estrutural. O problema é que, muitas vezes,
como no caso ilustrado em (12), o número de incógnitas supera o número de equações, ou seja,
não é possível estimar todos os parâmetros da forma estrutural.
Analisaremos a seguir duas regras básicas para sabermos a priori se os coeficientes de
uma equação podem ser identificados: i) condição de ordem, uma condição necessária mas não
suficiente para a estimação; ii) condição de posto, uma condição suficiente para a estimação.
228
Econometria Alexandre Gori Maia
predeterminadas em dada equação. Então, uma condição necessária (mas não suficiente) para a
identificação dos coeficientes de cada equação do sistema é:
• Se K − k = m − 1, a equação é exatamente identificada, ou seja, há uma solução
única para os parâmetros da forma estrutural;
• Se K − k > m − 1, a equação é superidentificada, ou seja, há estimativas
múltiplas para os parâmetros da forma estrutural;
• Se K − k < m − 1, a equação é subidentificada, ou seja, não é possível obter
estimativas para os parâmetros da forma estrutural;
Basicamente, a condição de ordem especifica que, para que os coeficientes de uma dada
equação estrutural possam ser estimados, o número de variáveis predeterminadas do sistema
excluídas na respectiva equação seja igual ou superior ao número de variáveis endógenas
incluídas como independentes na mesma equação. Apenas as equações exatamente identificadas
podem ser resolvidas por MQI. Equações superidentificadas podem ser resolvidas por Mínimos
Quadrados em 2 Estágios, a ser apresentado posteriormente.
Q d = α 0 + α 1 P + e d
o o
Q = β 0 + β1 P + e
d o
Q = Q
Nessa representação, o sistema como um todo apresenta duas variáveis endógenas e nenhuma
variável predeterminada (K=0). A equação para a demanda (Qd) possui 2 variáveis endógenas
(m=2) e não há nenhuma variável predeterminada ausente (K−k=0). É portanto, uma equação
subidentificada (K−k < m−1). A equação para a oferta (Qo) também não pode ser identificada
pois possui 2 variáveis exógenas (m=2) e nenhuma variável predeterminada ausente (K−k=0).
Para melhor compreender a indeterminação dessas equações, podemos realizar o
desenvolvimento algébrico das expressões. Igualando a função demanda à função oferta
chegaremos à forma reduzida de P. Posteriormente, substituindo P na função de demanda (ou
oferta) pela sua equação da forma reduzida, chegaremos à forma reduzida de Q. As duas
equações da forma reduzida seriam então dadas por:
229
Econometria Equações Simultâneas
β 0 − α 0 eo − ed
P = +
α1 − β1 α1 − β1
α 1β 0 − α 0 β1 α1e o − β1e d
Q = +
α1 − β1 α1 − β1
De maneira simplificada, teremos:
P = π 1 + u p β0 − α0 α 1 β 0 − α 0 β1
onde π1 = e π2 =
α 1 − β1 α 1 − β1
Q = P = π 2 + u q
Ou seja, restaram 2 equações para determinar 4 coeficientes estruturais. Nem todos os
coeficientes da forma estrutural poderiam ser estimados. Como há subidentificação nas duas
equações, não será possível estimar nenhum dos coeficientes da forma estrutural.
Outra maneira de enxergarmos essa subidentificação é a partir da representação gráfica. Cada
ponto observado na amostra refere-se ao preço e quantidade obtidos a partir de uma condição de
equilíbrio do mercado. Ou seja, sabemos qual o ponto de equilíbrio, mas não conseguimos
determinar as inclinações das curvas de demanda e oferta.
Exemplo 4. Vamos agora considerar que, além do preço, a renda (R) também determine a
demanda de um produto:
Q d = α 0 + α 1 P + α 2 R + e d
o o
Q = β 0 + β1 P + e
d o
Q = Q
No sistema como um todo, temos agora duas variáveis endógenas (M=2) e uma variável exógena
(K=1). A equação da demanda (Qd) possui duas variáveis endógenas (m=2) e uma variável
exógena (k=1), sendo subidentificada (K−k < m-1). Na equação da oferta (Qo), a ausência da
variável exógena renda (k=0) permite esta seja exatamente identificada (K−k=m–1).
Fazendo-se os devidos desenvolvimentos algébricos, chegaremos às representações:
230
Econometria Alexandre Gori Maia
P = π 1 + π 2 R + u p
Q = π 3 + π 4 R + u q
Onde:
β0 − α0 α2
π1 = e π2 = −
α1 − β1 α 1 − β1
α 1 β 0 − α 0 β1 α 2 β1
π3 = e π4 = −
α 1 − β1 α 1 − β1
Restaram 4 equações para determinar 5 coeficientes estruturais. Embora não seja possível uma
solução única para todos os coeficientes, pode-se chegar, após as devidas transformações, a
soluções únicas para β0 e β1:
β 0 = π 3 − β1π 1 e β1 = π 4 π 2
Em outras palavras, apenas os parâmetros estruturais da função oferta podem ser identificados.
Para melhor compreender a identificação da função oferta, lembre-se que, pela teoria econômica,
um aumento na renda deslocará a curva de demanda para cima. Da mesma forma, uma redução
na renda descolará a curva de demanda para baixo. Com diferentes valores observados para a
renda na amostra, e pressupondo equilíbrio das forças de oferta e demanda no mercado, será
possível estabelecer a relação entre P e Q para a função de oferta:
231
Econometria Equações Simultâneas
Q d = α 0 + α 1 P + α 2 R + e d
o o
Q = β 0 + β1 P + e
d o
Q = Q
Como visto anteriormente, a função da oferta poderá ser exatamente identificada enquanto que a
função da demanda é subidentificada.
A partir de uma amostra observada para 20 períodos, ajustaram-se por MQO as seguintes
equações da forma reduzida:
P = π 1 + π 2 R + u p P = 72,3392 + 0,2838R + uˆ p
⇒
Q = π 3 + π 4 R + u q Q = 77,0146 + 0,2449 R + uˆ q
O próximo passo é resolver, para os coeficientes da única função identificável (função oferta), as
estimativas de MQI a partir das igualdades previamente estabelecidas (Exemplo 4):
Q o = 14,5966 + 0,8629 P + uˆ q
Para a função demanda não é possível obter as estimativas já que esta é subidentificada.
Exemplo 6. Podemos ainda supor (e ter informações suficientes para isso) que, além do preço
corrente (Pt) e da renda (Rt), a riqueza (RQt), sendo o patrimônio uma boa aproximação, seja
outro fator a ser considerado na função demanda. Na função oferta, poderíamos supor que, além
do preço corrente do produto, o preço do período anterior (Pt–1) também influencie a oferta do
produto no período corrente. Teríamos então:
Q td = α 0 + α 1 Pt + α 2 Rt + α 2 RQt + e td
o o
Q t = β 0 + β1 Pt + β 2 Pt −1 + et
d o
Q t = Q t
Nesse sistema há 2 variáveis endógenas (M=2: Qt e Pt) e 3 variáveis predeterminadas (K=3: Rt,
RQt e Pt–1). Embora Pt seja endógeno, Pt-1 é conhecido (predeterminado) no período t. A equação
da demanda seria exatamente identificada (K–k=m–1) e a equação da oferta seria
superidentificada (K−k>m−1).
232
Econometria Alexandre Gori Maia
Pt = π 1 + π 2 Rt + π 3 RQt + π 4 Pt −1 + utp
Qt = π 5 + π 6 Rt + π 7 RQt + π 8 Pt −1 + utq
Ou seja, restaram 8 coeficientes reduzidos para determinar 7 coeficientes estruturais. Com o
devido desenvolvimento algébrico, chegaremos à conclusão de que todos os coeficientes
estruturais apresentam mais de uma possível solução. Esse sistema é superidentificado, ou seja,
não há uma solução algébrica única para quaisquer das equações do sistema.
β0 − α0 α2 α3 β2
π1 = π2 = − π3 = − π4 =
α1 − β1 α1 − β1 α1 − β1 α1 − β1
α β − α 0 β1 α β α β α β
π5 = 1 0 π 6 = − 2 1 π 7 = − 3 1 π8 = 1 2
α1 − β1 α1 − β1 α1 − β1 α1 − β1
Geometricamente, a relação estabelecida significa que, com variações da renda (Rt) e da riqueza
(RQt), seria possível identificar deslocamentos da função demanda e, consequentemente, estimar
a função oferta. Por sua vez, com descolamentos da funçã oferta em função de variações no
preço defasado (Pt–1) seria possível determinar a função demanda.
Embora não haja uma solução algébrica única para o sistema de equações dos coeficientes da
forma reduzida, esses poderão ser estimados pela técnica de Mínimos Quadrados em dois
Estágios.
233
Econometria Equações Simultâneas
Em um sistema com apenas duas equações, a condição de posto resume-se a exigir que,
para que os coeficientes de uma dada equação sejam identificados, pelo menos uma das variáveis
exógenas ausentes em sua especificação apresente coeficiente diferente de zero na outra equação.
Em outras palavras, não basta excluir uma variável exógena de uma equação para que esta possa
ser identificada, é necessário que a variável excluída apresente de fato contribuição parcial na
outra equação.
Embora essa regra seja fácilmente verificada em um sistema com duas equações,
precisamos de um procedimento mais sistemático para verificá-la em um sistema com múltiplas
equações. Vamos ilustrar os passos da análise para um sistema hipotético para três variáveis
endógenas (M=3):
1º Passo
Estruturar as equações de forma que todas as variáveis, endógenas e predeterminadas,
apareçam do lado esquerdo da igualdade:
− α1 + Y1 − δ11 X 1 − δ13 X 3 = e1
− α2 + Y2 − β 23Y3 − δ 21 X 1 − δ 22 X 2 = e2 (14)
− α3 − β 31Y1 + Y3 − δ 31 X 1 − δ 33 X 3 = e3
Em seguida, escrever o sistema em forma tabular:
Equação Intercepto Y1 Y2 Y3 X1 X2 X3
(1) − α1 1 0 0 − δ 11 0 − δ13
(15)
(2) −α2 0 1 − β 23 − δ 21 − δ 22 0
(3) −α3 − β 31 0 1 − δ 31 0 − δ 33
2º Passo
234
Econometria Alexandre Gori Maia
A partir da tabela (15), elaborar uma matriz para a equação que se deseja analisar a
identificação. Nessa matriz, deverão ser desconsideradas: i) a linha correspondente à equação
analisada; e ii) todas as colunas que contenham valores diferentes de zero nessa respectiva linha.
Por exemplo, a matriz correspondente à equação 3 (Y3) será dada por:
0 0
A3 = (16)
1 − δ 22
Observe que essa matriz A3 conterá todos os coeficientes das variáveis incluídas no
sistema mas não inseridas na equação em análise (Y3).
3º Passo
Aplicar a condição de posto à matriz obtida. Ou seja, identificar todas as submatrizes de
ordem (M−1)×(M−1) da matriz obtida e calcular seus determinantes. Se pelo menos um
determinante for diferente de zero, então a equação será identificada (exatamente ou
superidentificada).
Por exemplo, a única submatriz de ordem (M−1)×(M−1) (ordem 2×2) que podemos obter
da matriz A1 é ela mesma (sua ordem é igual a 2×2). Assim, a equação não identificada pois seu
determinante é igual a zero.
0 0
det A 3 = = (0) × (−δ 22 ) − (0) × (1) = 0 (17)
1 − δ 22
Embora a terceira equação não possa ser identificada segundo a condição de posto, a
condição de ordem sugeriu indevidamente sua identificação. Perceba que a variável exógena
excluída da terceira equação (X2) não apresenta consta entre os regressores da variável endógena
Y1. Assim, embora tenhamos excluído um regressor exógeno na terceira equação, este não
apresenta relação diferente de zero com o regressor endógeno dessa mesma equação.
O nome “posto” desta condição de identificação deriva do conceito de posto de uma
matriz. Ou seja, a ordem da maior submatriz quadrada cujo determinante é diferente de zero.
Embora seja uma condição necessária e suficiente, na prática, a condição de posto é raramente
empregada. A condição de ordem é muito mais simples e apenas em casos excepcionais não será
suficiente para a identificação da equação.
235
Econometria Equações Simultâneas
(20)
236
Econometria Alexandre Gori Maia
Uma vez identificado o instrumento Z, uma técnica simples e muito utilizada para obter
os coeficientes da equação (18) é a de Mínimos Quadrados em Dois Estágios (MQ2E). Como o
próprio nome sugere, há dois processos de estimação, ambos aplicando MQO. No primeiro
estágio, identificamos a parcela de Z associada à X ajustando o modelo:
X i = δ 0 + δ 0 Z i + ui (22)
O valor previsto de X pelo ajuste do modelo (22), ou Xˆ i = δˆ0 + δˆ1Z i , conteria a parcela
de Z associada à X (representação inferior de Z na figura 23), eliminando qualquer interferência
da parcela de X associada aos erros e (representação superior de X na figura 23).
(23)
Yi = α + βXˆ i + ei (24)
O estimador de β da equação (24) é denominado de estimador de variáveis instrumentais,
ou estimador de MQ2E. Uma vez eliminada a parcela de X contaminada pela associação com os
erros e (ver representação na Figura 25), este estimador pode ser obtido por MQO.
(25)
O raciocício do método de MQ2E pode ser facilmente extendido quando temos 2 ou mais
fatores exógenos que podem ser utilizados como instrumento para uma variável endógena. Por
exemplo, poderíamos utilizar a escolaridade da mãe (Z1) e do pai (Z2) como instrumentos para a
escolaridade do filho (X). Nesse caso, nossa variável instrumental X̂ seria dada por:
237
Econometria Equações Simultâneas
Podemos ainda pensar no caso de um modelo de regressão múltipla para Y onde, além da
endógena X, tenhamos um ou mais regressores exógenos (W, por exemplo):
Yi = α + βX i + λWi + ei (27)
Onde:
Cov( X , e) ≠ 0 e Cov(W , e) = 0 (28)
Neste caso, todos os estimadores de MQO para a equação (27) seriam viesados e
inconsistentes, não apenas aquele associado à endógena X.
Como a variável exógena W aparece como regressor na equação da forma estrutural (27),
não pode ser utilizado como instrumento para X. Agora nossos instrumentos (Z1 e Z2, por
exemplo), além de não constarem como regressores na equação da forma estrutural, precisam
apresentar correlação parcial significativa com X. Em outras palavras, seja a equação para X
como função das variáveis exógenas:
X i = δ 0 + δ 1Z1i + δ 2 Z 2i + δ 3Wi + ui (29)
Para que X̂ ( Xˆ i = δˆ0 + δˆ1Z1i + δˆ2 Z 2i + δˆ3Wi ) seja um variável instrumental válida de X, é
238
Econometria Alexandre Gori Maia
(31)
Ou, simplificadamente:
Y1i = π 1 + π 2 X i + u1i
(32)
Y2i = π 3 + π 4 X i + u 2i
Como pode ser observado a partir da relação algébrica expressa para a equação de Y1 na
forma reduzida (equação 31), parte do comportamento total de Y1 é devida à influência da
variável exógena X e parte devida à influência conjunta de e1 e e2 (u1). Assim, a variável Y1não
poderia ser utilizada para prever Y2 na forma estrutural, pois carregaria consigo uma parcela
associada aos erros e2.
A proposta do MQ2E é substituir a variável independente Y1 da forma estrutural por uma
variável instrumental, ou seja, uma aproximação para Y1 que elimine a interferência de e2 e acabe
com a relação entre regressor e erros. No caso do MQ2E, essa variável será dada pelo valor
previsto de Y1 na forma reduzida.
Em outras palavras, para estimar os coeficientes da segunda equação por MQ2E, o
primeiro estágio consiste em estimar os coeficientes da forma reduzida por MQO e,
posteriormente, estimar os valores previstos de Y1 e Y2:
Yˆ1i = πˆ1 + πˆ 2 X i
(33)
Yˆ2i = πˆ 3 + πˆ 4 X i
Verifique que o valor previsto de Y1 mantém a relação com X, mas elimina o componente
associado a e1 e e2.
O segundo estágio consiste em substituir os valores originais das variáveis endógenas das
equações estruturais identificáveis (no nosso exemplo, apenas a segunda equação), pelos seus
valores previstos:
239
Econometria Equações Simultâneas
O MQO pode então ser aplicado para estimar β0 e β1, já que Yˆ1 não apresenta relação
com e2. Assim como no MQI, os estimadores de MQ2E são consistentes, embora tendam a ser
viesados para amostras pequenas.
Exemplo 7. Vamos agora supor que as funções de demanda e oferta de alimentos sejam dadas
pelas seguintes equações:
Q td = α 0 + α 1 Pt + α 2 Rt + e td
o o
Q t = β 0 + β1 Pt + β 2 P1t + e
d o
Q t = Q t
Onde Pt é a razão entre o índice de preços dos alimentos e o índice geral de preços, Rt a renda
média dos consumidores e P1t é o índice de preços no ano anterior. Temos 2 equações com 2
variáveis endógenas (M=2: Qt e Pt), e 2 variáveis predeterminadas (K=2: Rt e P1t). Há omissão
de 1 variável predeterminada na equação para a demanda (P1t) e de 1 variável exógena na
equação para a oferta (Rt). Assim, as duas equações são exatamente identificadas (K−k=1).
Ambas as equações podem ser estimadas por MQ2E.
O primeiro passo para obter os estimadores de MQ2E é elaborar as equações da forma reduzida,
representando cada endógena como função das variáveis exógenas do sistema:
Pt = π 1 + π 2 Rt + π 3 P1t + utp
Qt = π 4 + π 5 Rt + π 6 P1t + utq
A partir dos valores observados na amostra, aplicamos MQO para obtermos as estimativas dos
valores previstos das endógenas:
240
Econometria Alexandre Gori Maia
(36)
Ou, simplificadamente:
241
Econometria Equações Simultâneas
Y1i = π 1 + π 2 X i + u1i
(37)
Y2i = π 3 + π 4 X i + u 2i
Aplicando MQO a essas equações, chegaríamos às estimativas dos coeficientes da forma
reduzida:
uma parcela associada à variável exógena X (estimada na forma reduzida por Yˆ1 ) e outra parcela
(39)
A ideia central é que, caso Y1 seja de fato endógeno, os erros da forma reduzida u1 estarão
associados aos erros da forma estrutural e2 (já que essas apresentariam uma parcela de e2 em sua
composição). Caso contrário, o único componente de u1 seria o erro e1 e não observaríamos a
relação entre u1 e e2. Em outras palavras, podemos representar e2 por
Podemos agora utilizar a estatística t associada a δˆ para testar a hipótese nula de que
δ=0. Caso a estimativa seja significativo, haverá indícios de endogeidade para Y1 e,
consequentemente, de simultaneidade entre Y1 e Y2.
242
Econometria Alexandre Gori Maia
Exemplo 8. Suponha a mesma especificação do exemplo 7 para a relação entre demanda e oferta
de alimentos:
Q td = α 0 + α 1 Pt + α 2 Rt + e td
o o
Q t = β 0 + β1 Pt + β 2 P1t + e
d o
Q t = Q t
Com a respectiva relação na forma reduzida para a endógena Pt dada por:
Pt = π 1 + π 2 Rt + π 3 P1t + utp
Caso haja de fato relação de endogeneidade para P, espera-se que os erros da forma reduzida utp
estejam relacionados aos erros da forma estrutural eo e ed. Para analisarmos, por exemplo, a
relação de endogeneidade na função oferta, vamos considerar que:
eto = δutp + vt
Em que vt é a parcela de eo não associada a up. Para testarmos essa relação, analisaremos a
significância da estimativa de δ no ajuste do modelo:
Q to = β 0 + β1 Pt + β 2 P1t + δuˆtp + vt
Aplicando MQO, chegaremos às estimativas:
A estatística t associada ao coeficiente δ é igual −4,30 e o valor p do teste é menor que 0,1%. Em
outras palavras, há evidencias significativas que a variável Pt comporte-se como variável
endógena na equação de oferta.
Exercícios
1. O arquivo ConsumoAlimentos.XLS contém informações anuais sobre o índice de consumo
per capita de alimentos (Q), a razão entre o índice de preço dos alimentos e índice geral de
preços (P), renda pessoal disponível (R), a razão entre os índices de preços dos anos
anteriores (P1) e ano (t=1..20). Suponha agora as seguintes equações para a função demanda
e oferta de alimentos:
243
Econometria Equações Simultâneas
Qid = α 0 + α1 Pi + α 2 Ri + eid
o
Qi = β 0 + β1 Pi + eio
em que
E[u1 ] = E[u 2 ] = 0
E[u1 z ] = E[u 2 z ] = 0
É correto afirmar que:
a. O estimador de mínimos quadrados ordinários de θ1 na equação (1) é consistente.
b. Os estimadores de mínimos quadrados ordinários de β1 e β2 na equação (2) são
não viesados.
c. A equação (1) é exatamente identificada e a equação (2) é sobreidentificada.
d. Se σ 12 =0, tanto a equação (1) quanto a equação (2) são exatamente identificadas.
244
Econometria Alexandre Gori Maia
com
E[ε 1 | z , y ] = E[u 2 | z , y] = 0
Respostas
3) a. V; b. F; c. F; d. V; e. V
4) a. V; b. F; c. V; d. F
245
Econometria Análise de Séries Temporais
PARTE III
246
Econometria Alexandre Gori Maia
15. Estacionariedade
Introdução
Série temporal é um conjunto de valores coletados em períodos regulares ou não de
tempo. Por exemplo, o conjunto de valores anuais da renda de uma população, do lucro de uma
empresa ou do preço de uma mercadoria. Além de essas séries serem utilizadas para elaborar
modelos estruturais de causa (variável independente) e efeito (variável dependente), são também
muito utilizadas para elaborar modelos univariados ou multivariados de previsão. Nos modelos
univariados de previsão, por exemplo, a previsão de um valor futuro de uma variável é dada
unicamente em função dos valores passados da mesma. Em outras palavras, a partir do
comportamento passado da série procuramos inferir seu provável comportamento futuro.
Modelos univariados de previsão são particularmente úteis em análises de séries financeiras,
eliminando, por exemplo, a difícil tarefa de se prever valores futuros das variáveis independentes
(Xt+s) para se estimar o valor futuro de uma variável dependente (Yt+s).
A análise de séries temporais exige, entretanto, cuidados adicionais em relação àqueles
necessários em análises de dados de corte transversal (dados coletados em um único período de
tempo). Em especial, deve-se verificar se o comportamento da série é o mesmo ao longo do
tempo, ou seja, se esta apresenta uma estrutura que possa ser caracterizada e descrita. A análise
da relação entre duas séries que apresentam comportamentos não sistemáticos pode levar a
conclusões totalmente equivocadas. Analogamente, a previsão de uma série que apresenta
importantes mudanças estruturais no tempo a partir de seu comportamento passado seria algo
provavelmente ineficaz.
Quando trabalhamos com modelos de regressão para dados de corte transversal,
pressupomos que nossa amostra contenha valores extraídos aleatoriamente de uma população e,
consequentemente, os valores sejam não correlacionados. Entretanto, em séries temporais os
valores estão usualmente correlacionados no tempo. Nessas circunstâncias, a consistência das
análises dependerá fundamentalmente da velocidade com essa correlação tende a zero para
observações de períodos distintos. Séries temporais com correlação serial elevada exigem
cuidados especiais nas análises.
O objetivo desta seção é justamente apresentar o conceito de estacionariedade, uma
propriedade fundamental para análises estruturais de relação de causa e efeito ou para modelos
247
Econometria Estacionariedade
(1)
248
Econometria Alexandre Gori Maia
15.2. Estacionariedade
15.2.1. Definição
Uma propriedade desejável de uma série temporal é que esta apresente um
comportamento constante no tempo, ou seja, seja estacionária. Por exemplo, caso o
comportamento da série seja não estacionário, ou seja, mude com o tempo, seria muito difícil
estabelecermos um modelo de previsão para seus valores futuros baseado no seu comportamento
passado. Analogamente, seria muito difícil estabelecermos uma relação de determinação para
uma variável dependente em função de variáveis independentes caso essa relação apresente
importantes quebras estruturais com o tempo.
O conceito mais abrangente de estacionariedade, ou estacionariedade estrita, supõe que a
distribuição conjunta para todos os Yt não mude com o tempo, ou seja, a distribuição conjunta de
Y1, Y2, ..., Yk seja, por exemplo, igual à de Y1+s, Y2+s, ..., Yk+s. Entretanto, como na prática é
impossível conhecer todas as distribuições conjuntas de Y1, Y2, ..., Yk, restringimo-nos ao
conceito de estacionariedade fraca. Uma série será fracamente estacionária se:
249
Econometria Estacionariedade
(2)
250
Econometria Alexandre Gori Maia
251
Econometria Estacionariedade
O erro et é também denominado de ruído branco32 e representa uma série com média
igual a zero, variância constante e não autocorrelacionada. Em outras palavras:
Exemplo 3. Suponha que o processo definidor de um índice de inflação seja dado pelo seguinte
modelo autorregressivo de 1a ordem:
Yt = 0,5Yt −1 + et
Considere agora, por exemplo, que no mês 1 a inflação fora igual a 0% (Y1=0) e que, no
mês 2, houve um choque não esperado (alta dos combustíveis, por exemplo) que elevou a
inflação para 2% (Y2=0,02). Segundo a especificação do modelo, esse comportamento seria
expresso por:
Y1 = 0
Y2 = 0,5Y1 + e2 = 0,5 × 0 + 0,02 = 0,02
A idéia central é que, segundo a especificação do processo, com coeficiente associado à
variável defasada Yt1 inferior a 1, esse choque de 0,02 seria amortecido com o tempo e a série
convergiria naturalmente à sua média histórica. Para visualizarmos esse comportamento, basta
supormos que não haja mais choques (negativos ou positivos) e verificarmos que o valor de Yt
convergirá para próximo de 0 (sua média histórica):
32
O termo ruído branco deriva da acústica, utilizado para representar um tipo de ruído produzido pela combinação
simultânea de sons de todas as frequências sonoras. O adjetivo branco é uma analogia à luz branca, já que esta é
obtida pela combinação simultânea de todas as frequências cromáticas.
252
Econometria Alexandre Gori Maia
Exemplo 4. Suponha agora o caso do preço de uma commodity (preço do barril do petróleo, por
exemplo), com processo definido pelo seguinte modelo autorregressivo de 1a ordem:
Yt = Yt −1 + et
Imagine, por exemplo, que até o mês 1 o preço tenha oscilado em torno de 1 unidade
(Y1=1). No mês 2 há um choque, aumentando o preço em 0,5 unidade (de 1 para 1,5 unidade):
Y1 = 1
Y2 = Y1 + e2 = 1 + 0,5 = 1,5
Em séries não estacionárias, eventuais choques serão assimilados eternamente pela
variável. Neste exemplo, dado um choque positivo no mês 2, a tendência é que nos demais anos
este preço seja mantido. Em outras palavras, na ausência de um novo choque que reverta a
tendência da série, esta não voltará naturalmente à sua média histórica:
Y3 = Y2 + e3 = 1,5 + 0 = 1,5
Y4 = Y3 + e4 = 1,5 + 0 = 1,5
Y5 = Y4 + e5 = 1,5 + 0 = 1,5
Graficamente, teríamos:
253
Econometria Estacionariedade
E (Yt ) = E (Y0 + ∑i =1 ei ) = Y0
t
(8)
Var (Yt ) = Var (Y0 + ∑i =1 ei ) = Var (Y0 ) + Var (∑i =1 ei ) = tσ 2
t t
Ou seja, embora a valor médio da série convirja para uma constante, igual ao seu valor
inicial (Y0), sua variância tende a aumentar com tempo. A representação gráfica de uma possível
realização desse processo é dada por:
(9)
254
Econometria Alexandre Gori Maia
Vamos agora analisar os dois primeiros momentos (média e variância) de outro processo
não estacionário, dado pelo modelo autorregressivo com constante α:
Yt = α + Yt −1 + et (10)
Nesse caso, teríamos por desenvolvimento algébrico:
Y1 = α + Y0 + e1
Y2 = Y1 + e2 = [α + α ] + Y0 + [e1 + e2 ] (11)
t t
Yt = Y0 + ∑i =1α + ∑i =1 ei
O valor esperado e a variância de Yt seriam então dados por:
t
E (Yt ) = E (Y0 + α + ∑i =1 ei ) = Y0 + tδ
(12)
t t
Var (Yt ) = Var (Y0 + ∑i =1α + ∑i =1 ei ) = tσ 2
Neste caso, tanto o valor médio da série como sua variância tenderão a crescer com o
tempo. A representação gráfica de uma possível realização desse processo é dada por:
(13)
Uma variância que cresce com o tempo pode trazer sérias implicações para um ajuste de
regressão. Caso esse comportamento se reproduza nos erros do modelo, esses deixariam de
apresentar variância finita e os estimadores de MQO não seriam mais consistentes.
15.2.3. Terminologia
Alguns processos estocásticos apresentam denominações próprias, que caracterizam sua
natureza estacionária e os componentes que fazem parte de sua especificação. Entre as
denominações para processos estacionários, podemos destacar os seguintes casos:
Ruído branco: Yt = et
255
Econometria Estacionariedade
É o caso mais simples de processo estacionário. Possui média zero, variância constante
(σ2) e é não autocorrelacionado serialmente. O erro do modelo clássico de regressão linear é, por
definição, um ruído branco, independente e identicamente distribuído de maneira normal:
et ~ IIDN (0, σ 2 ) . A Figura 13 apresenta uma realização de um ruído branco.
(13)
Tendência determinística: Yt = α + βt + et
Embora a média não seja constante, pode ser prevista com exatidão conhecendo-se o
valor de t. É também chamado de processo estacionário em tendência ou estacionário pós-
remoção de tendência. Em outras palavras, é uma série que apresenta comportamento
estacionário em cima de uma tendência no tempo. A Figura 14 apresenta um exemplo de
realização de tendência determinística definida pelo processo Yt = 0,5 + 0,1t + et .
(14)
Choques são absorvidos com o tempo ( ρ<1) e o processo tende a ser estacionário em
torno de uma tendência determinística (βt). Em relação ao processo anterior (tendência
determinística), apresenta um comportamento mais errático, com magnitude que dependerá da
256
Econometria Alexandre Gori Maia
inércia do componente autorregressivo (ρ). A Figura 15 apresenta uma realização definida pelo
processo Yt = 0,5 + 0,05t + 0,7Yt −1 + et .
(15)
(16)
257
Econometria Estacionariedade
apresenta uma realização de um passeio aleatório com descolamento definido pelo processo
Yt = 0,1 + Yt −1 + et .
(17)
(18)
258
Econometria Alexandre Gori Maia
Cov(Yt , Yt −k ) Cov(Yt , Yt −k ) γ k
ρk = = = (19)
DP (Yt ) DP (Yt −k ) Var (Yt ) γ0
basta obtermos o valor esperado do produto entre a última equação de (21) e Yt−k:
ρ k σ y2
Corr (Yt , Yt −k ) = = ρk (24)
σ yσ y
O que as equações (23) e (24) nos dizem é que, embora os valores de um processo
estacionário (|ρ|<1) estajam autocorrelacionados no tempo, esta correlação tende à zero à medida
que nos afastamos no tempo (k relativamente grande).
259
Econometria Estacionariedade
260
Econometria Alexandre Gori Maia
261
Econometria Estacionariedade
A partir das equações transformadas, testar a hipótese nula de que ρ=1 seria, agora,
equivalente a testar a hipótese de que δ=0. Ou seja, as novas hipóteses seriam:
mais a distribuição t de Student, mesmo em amostras grandes. Para contornar esse problema,
Dickey e Fuller definiriam uma nova distribuição de probabilidade para essa estatística, também
denominada de ι (tau). A distribuição da estatística ι dependerá do tamanho da amostra e
também da especificação utilizada para o processo estocástico. Isso quer dizer que, para cada
especificação que adotemos para o processo estocástico (i, ii ou iii), teremos uma distribuição
distinta de probabilidade.
A tabela 27 apresenta valores críticos de ι a 5% para diferentes tamanhos de amostra (n) e
diferentes especificações do processo estocástico. Como o teste é unicaudal, devemos encontrar
um valor de ι inferior aos valores críticos da tabela para termos evidências para rejeitar H0
(afirmar que a série é estacionária).
Valores críticos de ι a 5% para teste de raiz unitária
Sem Com Constante e
n
Constante Constante Tendência
25 −1,95 −3,00 −3,60
50 −1,95 −2,93 −3,50 (27)
100 −1,95 −2,89 −3,45
250 −1,95 −2,88 −3,43
500 −1,95 −2,87 −3,42
∞ −1,95 −2,86 −3,41
Exemplo 7. Podemos aplicar o teste de Dickey-Fuller para testar a estacionariedade da série para
o preço do petróleo (Y). O ideal seria, à priori, conhecer a especificação do processo gerador da
série (sem constante, com constante ou com constante e tendência). Como este é, na prática,
262
Econometria Alexandre Gori Maia
deconhecido, iremos realizar o teste para os três processos e arriscar, posteriormente, uma
especificação a partir de evidências observadas na amostra. Aplicando MQO, teremos:
i) ∆Yt = 0,004Yt −1 + eˆt
Como perdemos a primeira observação para calcularmos ∆Yt e Yt–1, nossa amostra final contém
84 observações (fevereiro de 2004 a dezembro de 2010). Os valores críticos aproximados com
5% de significância para cada especificação seriam, respectivamente: −1,95; −2,89; −3,45. Por
sua vez, os valores de ι associados a cada coeficiente do termo atuorregressivo foram: 0,430;
−1,633; −1,757. Como nenhum dos valores de ι se encontra na região crítica, qualquer que seja o
processo considerado, não é possível rejeitar H0 em nenhuma das circunstâncias, ou seja, a série
é não estacionária.
p
i) ∆Yt = δYt −1 + ∑ ∆Yt − j + et
j =1
p
ii) ∆Yt = α + δYt −1 + ∑ ∆Yt − j + et
j =1
p
iii) ∆Yt = α + β t + δYt −1 + ∑ ∆Yt − j + et
j =1
263
Econometria Estacionariedade
distirbuição de probabilidade do teste anterior, com valores críticos definidos pela da tabela (27).
Exemplo 8. Para identificar a presença de autocorrelação nos erros dos ajustes realizados no
exemplo 7 para os testes de Dickey-Fuller, estimamos o coeficiente de autocorrelação de 1ª
n
∑ eˆt eˆt −1 . Os valores obtidos foram para cada ajuste:
ordem dos erros por ρ̂ e = t =n2
∑t =1 eˆt 2
i) ∆Yt = 0,004Yt −1 + eˆt ⇒ ρˆ e = 0,486
264
Econometria Alexandre Gori Maia
um nível de significância de 5%. Ou seja, nossa conclusão é que a série seria gerada por um
processo não estacionário, independente da especificação proposta.
Exercícios
1. O arquivo ProducaoAutosAco.XLS contém informações mensais sobre a produção de
automóveis (unidades) e aço (toneladas) no Brasil, entre janeiro de 1990 e agosto de 2008.
Pede-se:
a. Analise a estacionariedade da produção de automóveis e de aço a partir da análise
gráfica e da função de autocorrelação.
b. Analise a estacionariedade das séries a partir do teste de Dickey-Fuller.
ruído branco com média zero e variância σ², a média de yt varia com t.
265
Econometria Estacionariedade
Respostas
1) a. Automóveis: ρ1=0,923; ρ2=0,874; ρ3=0,830; ρ4=0,776; ρ5=0,753; Aço: ρ1=0,886;
ρ2=0,854; ρ3=0,805; ρ4=0,780; ρ5=0,757; b. ∆Autost = 0,0002 Autost −1 + eˆt ( τ = 0,022 );
∆Autost = 11286,9 + 132,6t − 0,209 Autost −1 + eˆt ( τ = −4,879 ); ∆Açot = 0,0003 Açot −1 + eˆt
266
Econometria Alexandre Gori Maia
16. Cointegração
Introdução
Um problema frequente quando relacionamos séries que não apresentam comportamentos
estacionários é o fenômeno da relação espúria. Em outras palavras, a análise estatística sugeriria
falsamente uma associação significativa entre as séries, quando na verdade não haveria nenhuma
relação de causa e efeito entre essas.
Quando trabalhamos com dados de corte transversal, a relação espúria ocorre nas
situações em que a relação entre o regressor Y e o regressando X se deve exclusivamente ao fato
de essas variáveis serem relacionadas a uma terceira variável Z, não considerada na especificação
do modelo. Em outras palavras, a relação desapareceria se incluíssemos a variável Z no modelo.
Em análise de séries temporais, a relação espúria é frequente quando não consideramos a
tendência comum de crescimento (ou decaimento) no tempo para regressor e regressandos.
Ademais, relacionamentos entre séries que são passeios aleatórios usualmente resultam em
estatísticas significativas, mesmos que essas não apresentem deslocamentos em comum.
Nesse módulo, veremos como identificar a relação espúria e três maneiras distintas de
evitar sua ocorrência: i) incluindo o componente tempo na especificação do modelo (modelo de
tendência estacionária); ii) transformando as séries originais (não estacionárias) em séries
estacionárias (modelo de diferenças estacionárias)); iii) trabalhando com séries não estacionárias
que sejam cointegradas.
267
Econometria Cointegração
(2)
33
O desenvolvimento encontra-se no Capítulo 15.
268
Econometria Alexandre Gori Maia
Em outras palavras, et será um passeio aleatório com variância tendendo a explodir com o
tempo: Var (et ) = tσ u2 . Fato que viola as premissas do Teorema de Gauss-Markov para que os
Exemplo 1. Sejam as séries anuais para o número de vacas ordenhadas (Y, em mil cabeças) e o
número de médicos (X, em mil médicos) no Brasil entre 1996 e 2008:
269
Econometria Cointegração
Yt = α + β1 X t + β 2 t + et (5)
Onde Yt e Xt são processos estacionários em tendência. A omissão da variável t do
modelo, como sugere a equação (1), implicaria na relação entre regressor e erros e,
consequentemente, em estimativas viesadas e inconsistentes pelo MQO. Por outro lado, a
consideração da variável t permitiria identificar o efeito de X sobre Y, isolando a tendência de
ambas as séries no tempo.
270
Econometria Alexandre Gori Maia
Como a STQ mede as distâncias quadráticas dos valores de Yt em relação à sua média
constante ( Y ), seu valor tende a crescer substancialmente com o tempo quando Yt apresenta
tendência. O resultado é que a STQ e o R2 acabam superestimados.
Para contornar esse problema, sugere-se que, quando a variável dependente apresenta
alguma tendência, o ideal seja isolarmos o efeito do tempo antes de calcularmos o R2. A proposta
é trabalhar com uma variável dependente com remoção de tendência ( Yt* ). Para calcularmos Yt* ,
o primeiro passo é ajustar a relação entre Yt e t:
Yˆt = αˆ 0 + αˆ1t (7)
Em seguinda, removemos o efeito do tempo em Yt por:
Yt* = Yt − Yˆt = Yt − (αˆ 0 + αˆ1t ) (8)
271
Econometria Cointegração
Ou seja, pressupondo que et seja um ruído branco, a série ∆Yt seria estacionária, variando
aleatoriamente em torno de uma constante αy. Entretanto, como na prática desconhecemos o
processo que define a série Yt, o ideal seria realizarmos um teste de estacionariedade à série ∆Y
para nos certificarmos que a diferenciação de fato eliminou a não estacionariedade.
Quando a série Yt se torna estacionária a partir da primeira diferença, dizemos que ela é
um processo integrado de ordem um, ou I(1)34. Isso significa que ela é gerada a partir de uma
única integração (o oposto de diferenciação) de um processo estacionário, que no caso seria ∆Yt.
Caso a série Yt seja estacionária, dizemos que ela é um I(0). E, caso sejam necessárias d
diferenciações para ela se tornar estacionária, dizemos que ela é um I(d).
Além de poder transformar uma série não estacionária em estacionária, a diferenciação
também remove qualquer tendência linear que a série apresente no tempo. Por exemplo, caso a
série Yt apresente uma tendência definida por:
Yt = γ 0 + γ 1t + et (12)
Então a primeira diferença gerará a série:
∆Yt = Yt − Yt −1 = (γ 0 − γ 0 ) + γ 1[t − (t − 1)] + (et − et −1 ) = γ 1 + ∆et (13)
34
Os processos integrados serão discutidos com maiores detalhes no Capítulo 17.
272
Econometria Alexandre Gori Maia
Exemplo 3. Para eveitar o problema de relação espúria entre número de vacas ordenhadas (Y) e
número de médicos (X), podemos trabalhar as primeiras diferenças de seus logaritmos:
∆ ln(Yt ) = ln(Yt ) − ln(Yt −1 ) ∆ ln( X t ) = ln( X t ) − ln( X t −1 )
Embora o ideal seja realizar um teste de estacionariedade nas séries ∆Y e ∆X, vamos pressupor
que essas sejam de fato estacionárias e ajustar o modelo:
∆ ln(Yt ) = α + β∆ ln( X t ) + et
As estimativas de MQO seriam:
∆ ln(Yt ) = 0,02 − 0,01∆ ln( X t ) + eˆt
A relação entre número de médicos e vacas ordenhadas passa a ser insignificante a 10%, assim
como o R2 do ajuste (0,001). Em outras palavras, eliminando o problema da não
estacionariedade, constatamos que a variação de curto prazo (anual) no número de médicos não
possui qualquer relação com a variação (anual) no número de vacas ordenhadas.
16.4. Cointegração
Mesmo não estacionárias, duas séries podem apresentar relação de causa e efeito caso
essas sejam cointegradas. Duas séries que apresentam a mesma ordem de integração serão
denominadas cointegradas caso apresentem comportamentos semelhantes no tempo, que tendem
a convergir em longo prazo. É como se uma série puxasse a outra, produzindo um efeito elástico
na relação entre essas.
273
Econometria Cointegração
(16)
Por outro lado, caso as séries não estacionárias não sejam cointegradas, os resíduos de
seu ajustes serão não estacionários, como representa da Figura (17).
(17)
274
Econometria Alexandre Gori Maia
trabalhando com valores estimados (êt e êt−1) em substituição aos valores observados (et).
Ademais, sob a veracidade da hipótese nula, essas estimativas seriam obtidas através de um
estimador β̂ inconsistente, já que a relação seria de não cointegração. Consequentemente, os
valores criticos da estatístca de Dickey-Fuller não seriam mais apropriados para o teste.
Para contornar esse problema, Davidson e Mackninnon propuseram novos valores
críticos para o teste de cointegração. Esses valores consideram ainda duas possibilidades de
especificação: i) relações de cointegração com constante (equação 15); ii) relações de
cointegração em tendência (equação 22).
Yt = α + β1 X t + β 2 t + et (22)
Os valores críticos propostos por Davidson e Mackninnon para cada especificação são
apresentados na tabela 23:
275
Econometria Cointegração
Com Com
Signifiância Constante Constante e
Tendência
1% −3,90 −4,32 (23)
5% −3,34 −3,78
10% −3,04 −3,50
Uma vez rejeitada a hipótese nula, ou seja, identificada a estacionariedade dos erros,
podemos afirmar que há relação de cointegração entre as séries.
Exemplo 4. Podemos verificar a cointegração das séries dos logaritmos do número de vacas
ordenhadas e de médicos analisando os resíduos do ajuste:
ln(Yt ) = 6,97 + 0,52 ln( X t ) + eˆt
O primeiro passo é analisar o comportamento gráfico dos resíduos:
O teste da raiz unitária consiste em verificar se há evidências para afirmar que ρ<1, ou seja, que
os resíduos são estacionários. Testar a hipótese nula de que ρ=1 é o mesmo que testar se δ=0,
sendo δ o coeficiente do modelo:
∆eˆt = δeˆt −1 + ut
Aplicando MQO, chegaremos à estimativas:
276
Econometria Alexandre Gori Maia
A estimativa do erro padrão de δˆ foi de 0,248 e da estatística τ foi de −2,067. Como o valor de
τ não é inferior ao valor critico da tabela de Davidson e Makninnon para 10% de significância
em um ajuste sem intercepto (−3,50), não rejeitaríamos a hipótese nula de não estacionariedade
dos resíduos. Ou seja, o teste sugeriria que os resíduos são não estacionários e,
consequentemente, que a relação entre as variáveis não seja de cointegração.
Exemplo 5. Vamos agora analisar a relação entre renda disponível no Brasil (X, em mil reais) e
consumo final das famílias (Y, em mil reais) entre 1961 (t=1) e 2009 (t=63).
Embora as duas séries sejam aparentemente não estacionárias, a relação linear entre essas seria
consistente caso essas sejam cointegradas. O modelo proposto é dado por:
ln(Yt ) = α + β ln( X t ) + et
Aplicando MQO chegaremos a:
ln(Yt ) = −0,07 + 0,98 ln( X t ) + eˆt
A elasticidade renda consumo é significativa a 1% e o R2 do modelo (sem remoção de tendência)
é de 0,998. Como pôde ser observado visualmente, consumo e renda compartilham tendências
estocásticas (aleatórias) semelhantes. Essas séries não divergem muito uma da outra, e
compartilham de um equilíbrio a longo prazo.Os resíduos obtidos no ajuste foram:
277
Econometria Cointegração
Embora a dispersão dos resíduos no tempo sugira um comportamento aleatório, devemos realizar
o teste da raiz unitária para nos certificarmos da presença de estacionariedade nos resíduos.
Aplicando MQO, chegaremos às estimativas:
∆eˆt = −0,625eˆt −1 + uˆt
A estimativa do erro padrão de δˆ foi de 0,120 e da estatística τ foi de -5,211. Como o valor de
τ é inferior ao valor critico da tabela de Davidson e Makninnon para 1% de significância em um
ajuste sem tendência (−3,90), encontramos evidências fortíssimas para rejeitar a hipótese nula de
não estacionariedade dos erros. Ou seja, sujeitos a um erro inferior a 1%, afirmaríamos que a
relação entre o logaritmo da renda e do consumo é de cointegração.
278
Econometria Alexandre Gori Maia
ao equilíbro. Assim, a constante δ determinará a velocidade com que a série retornará ao ponto
de equilíbro após desvios ocorrerem no período anterior.
Como, na prática, não observamos os valores de et, trabalhamos com os resíduos
estimados êt para o modelo de cointegração. Assintoticamente, o uso de estimativas êt obtidas
por MQO ou outra técnica de estimação não afetará os coeficientes do modelo correção de erros.
O modelo de correção de erros permite analisar a relação de curto prazo entre duas séries
cointegradas. Alguns modelos de correção de erros incorporam ainda defasagens do regressor
∆Xt e do regressando ∆Yt, que são particularmente úteis em modelos de previsão de séries
temporais ou quando desejamos analisar o comportamento dinâmico das séries temporais.
Exemplo 6. No exemplo 5, identificamos uma relação de cointegração entre renda disponível (X,
em mil reais) e consumo final das famílias (Y, em mil reais) entre 1961 (t=1) e 2009 (t=63) no
Brasil. O ajuste para a relação de longo prazo foi dado por:
ln(Yt ) = −0,07 + 0,98 ln( X t ) + eˆt
Para estabelecermos a relação de curto prazo entre as séries, podemos considerar o seguinte
modelo de correção de erros:
∆ ln(Yt ) = γ 0 + γ 1∆ ln( X t ) + δet −1 + ut
Como os valores de et não são observados, trabalharemos com as estimativas dadas pelo ajuste
de cointegração:
eˆt −1 = ln(Yt −1 ) − [−0,07 + 0,98 ln( X t −1 )]
Assim, as estimativas para o modelo de correção de erros foram:
∆ ln(Yt ) = 0,01 + 0,88∆ ln( X t ) − 0,07eˆt −1 + uˆt
A estimativa de δ é negativa, como esperado, mas não significativa a 5% (seu erro padrão é igual
a 0,12). O ajuste sugere, portanto, que o consumo se ajusta à renda no mesmo período. Ademais,
enquanto a elasticidade obtida no exemplo 5 (0,98) refere-se à propensão marginal a consumir de
longo prazo, a elasticidade de curto prazo estimada pelo modelo de correção de erros é igual a
0,88 e significativa a 0,1%.
279
Econometria Cointegração
Exercícios
1. O arquivo ProducaoAutosAco.XLS contém informações mensais sobre a produção de
automóveis (unidades) e aço (toneladas) no Brasil, entre janeiro de 1990 e agosto de 2008.
Pede-se:
a. Analise a relação entre a produção de aço (Y) e de automóveis (X). Há motivos
para suspeitar de relação espúria?
b. Analise os resultados de um modelo de tendência estacionária.
c. Analise os resultados de um modelo de diferença estacionária.
d. Analise a realção de cointegração entre as séries.
280
Econometria Alexandre Gori Maia
4. (ANPEC, 2008) A regressão entre duas variáveis não estacionárias é sempre espúria.
5. (ANPEC, 2007) Sejam Yt e Xt duas séries temporais. Considere os resultados dos seguintes
modelos de regressão estimados por mínimos quadrados ordinários (MQO):
Respostas
1) a. Açot = 1524,5 *** + 0,006 *** Autos t + eˆt ;
281
Econometria Cointegração
282
Econometria Alexandre Gori Maia
Introdução
O proeminente trabalho de Box e Jenkins em 1970, intitulado “Time series
analysis:forecasting and control”, revolucionou o estudo sobre previsão de séries temporais. Os
autores propuseram uma nova metodologia para prever os valores futuros de uma série tempo a
partir de seus valores passados. A idéia central dessa proposta, também denominada de
“metodologia de Box e Jenkins”, é “deixar que os dados falem por si mesmos”.
Nesse módulo, veremos as principais formulações propostas por Box e Jenkins. Em
especial, veremos a definição de 4 tipos de modelos: i) autorregressivos; ii) média móvel; iii)
autorregressivo de média móvel; iv) autorregressivo integrado de média móvel. A metodologia
completa de previsão não será, entretanto, abordada nesta apresentação. Esta exige uma literatura
específica e programas estatísticos apropriados para o desenvolvimento das análises.
Yt = α + φYt −1 + et (1)
283
Econometria Modelos ARIMA
B k (Yt ) = Yt −k (3)
Então, o processo AR(2) definido em (2) poderia também ser representado por:
φ ( B)Yt = α + et (5)
µ (1 − φ1 − ... − φ p ) = α (6)
α
µ=
(1 − φ1 − ... − φ p )
284
Econometria Alexandre Gori Maia
Esse resultado nada mais é que uma generalização do conceito de raiz unitária aplicado
ao modelo AR(1). Ou seja, o modelo de previsão AR(p) será estacionário, com média definida e
constante, caso ( φ1 + ... + φ p < 1 ). Caso contrário ( φ1 + ... + φ p = 1 ), a série será não estacionária e
Podemos pressupor que o investimento em estoque seja gerado por um AR(1), ou seja, que o
valor da série para o período t seja dado com no valor de sua primeira defasagem (t–1) mais um
erro aleatório et. Teríamos, então, o seguinte ajuste para o modelo:
Yt = 9,80 + 0,54Yt −1 + et
A comparação entre os valores observados e previsto de Yt pelo AR(1) (linha tracejada em
vermelho) é dada pelo gráfico:
Percebam que, para os períodos contidos na amostra, os valores previstos pelo AR(1) se
aproximam muito daqueles observados. Para previsões futuras, entretanto, a tendência é de que a
previsão convirja para o valor esperado de Yt. Esse valor esperado, por sua vez, será dado por:
E (Yt ) = E (9,80 + 0,54Yt −1 )
µ = 9,80 + 0,54 µ
285
Econometria Modelos ARIMA
9,80
µ= = 21,3
1 − 0,54
Os parâmetros θ’s podem ser positivos ou negativos. A representação pelo sinal negativo
é apenas uma prática frequente, embora não seja universal. Por sua vez, o termo média móvel
está associado à ponderação dos parâmetros θ’s, embora não essa ponderação não se trate
necessariamente de uma média. Não há qualquer restrição que limite os parâmetros θi a valores
positivos ou que a soma de seus valores seja igual a 1.
No caso de um processo MA(q), podemos demonstrar facilmente que o valor esperado da
série será dado pelo parâmetro do modelo µ :
286
Econometria Alexandre Gori Maia
Exemplo 2. Vamos agora considerar a investimento em estoque em um período t seja dado por
uma soma ponderada de uma perturbação aleatória presente e outra passada, ou seja, um MA(1).
O ajuste para o modelo proposto seria dado por:
Yt = 21,64 + et + 0,48et −1
É fácil identificarmos que o valor esperado da série será dado pelo termo constante 21,64. Assim,
o investimento em estoque para o período t seria previsto com base na média constante 21,64
mais uma soma ponderada do resíduo presente e do resíduo passado.
Graficamente, observamos que previsões futuras dos valores de Yt convergirão rapidamente para
a média histórica 21,64:
287
Econometria Modelos ARIMA
µ (1 − φ1 − ... − φ p ) = δ
(13)
δ
µ=
(1 − φ1 − ... − φ p )
Exemplo 3. Vamos agora supor que o investimento em estoque no período corrente seja definido
por uma combinação do investimento no período anterior e uma defasagem da flutuação
aleatória em torno de uma média constante. A estimativa para o modelo ARMA (1,1) proposto
seria dada por:
Yt = 21,72 + 0,63Yt −1 + et − 0,13et −1
Segundo as especificações propostas, o processo convergeria para uma média constante dada
por:
21,72
µ= = 58,7
1 − 0,63
E o comportamento gráfico dos valores observados, previstos e extrapolações futuras seria:
288
Econometria Alexandre Gori Maia
∆Yt = Yt − Yt −1 (13)
Caso a nova série ∆Yt não seja estacionária, aplicam-se novas diferenças até se chegar a
uma série estacionária. Por exemplo, a segunda diferença da série Yt (∆2Yt) será dada por:
289
Econometria Modelos ARIMA
Por sua vez, igualando as equações (16) e (17) teremos que integrando duas vezes a série
2
∆2Yt ( ∑ ∆2 Yt ) chegaremos à série Yt:
2
Yt = ∑ ∆Yt = ∑ ∑ ∆2 Yt = ∑ ∆2 Yt (18)
Genericamente, teríamos que integrar d vezes a série ∆dYt para se chegar à série Yt:
d
Yt = ∑ ∆Yt = ∑ ∑ ∆2 Yt = ∑ ...∑ ∆d Yt = ∑ ∆d Yt (19)
Diz-se que um processo é integrado de ordem d, ou I(d), quando, ele se torna estacionário
após ser diferenciado d vezes. Em outras palavras:
Após diferenciar uma série não estacionária Yt um total de d vezes para torná-la
estacionária e, sendo ∆dYt um processo ARMA (p, q), então dizemos que Yt é um processo
autorregressivo integrado e de médias móveis de ordem (p, d, q), ou simplesmente
ARIMA( p, d , q) . Em outras palavras:
290
Econometria Alexandre Gori Maia
Ou simplesmente:
Exemplo 4. Seja a série Yt reprsentada no gráfico abaixo, com comportamento claramente não
estacionário:
O primeiro passo para o procedimento de previsão seria transformá-la em uma série estacionária.
Aplicando a primeira diferença, obteríamos a série ∆Yt, com comportamento expresso
graficamente por:
Assumindo que a série ∆Yt seja estacionária (os testes usuais de estacionariedade seriam
necessários), podemos prevê-la pelo modelo ARIMA. Como foi necessária uma diferenciação
para transformá-la em um série estacionária, sabemos que o parâmetro d será igual a 1, ou seja, a
série Yt é um I(1).
291
Econometria Modelos ARIMA
Pressupondo agora que o valor de ∆Yt seja uma função de um componete autorregressivo (p=1) e
dois componentes de médias móveis (d=2), teríamos um modelo ARIMA(1,1,2) , expresso por:
∆Yt = φ1 ∆d Yt −1 + δ + et − θ 1et −1 − θ 2 et − 2
Uma vez estimado os valores de ∆Yt, podemos estimar os valores de Yt integrando uma vez a
série ∆Yt:
Yt = ∑ ∆Yt
O primeiro passo seria diferenciarmos a série Yt quantas vezes forem necessárias para
transformá-la em estacionária. Como pode ser observado nos gráficos abaixo, esta tornar-se-á
estacionária à partir da segunda diferença, ou seja, Yt é um I(2):
Após realizadas as previsões de ∆2Yt, podemos estimar os valores de Yt integrando duas vezes a
série ∆2Yt:
Yt = ∑ ∆Yt = ∑∑ ∆2 Yt
292
Econometria Alexandre Gori Maia
Exercícios
1. (ANPEC, 2012) Suponha que ∆Yt pode ser representado pelo seguinte processo:
∆Yt = et − 0,6et −1 , para t=1
ordem se θ=1.
Respostas
1) 10
2) Falso.
3) a. Falso; b. Verdadeiro.
293
Econometria Alexandre Gori Maia
Referências
Box, G.; Jenkins, G. Time series analysis: Forecasting and control, San Francisco: Holden-Day,
1970.
Breusch, T.S. Testing for autocorrelation in dynamic linear models. Australian Economic
Papers, v. 17, 1979, pp. 334–355.
Chow, G. C. Test of equality between subsets of coefficients in two linear regressions models.
Econometrica, 1960, p. 591-605.
Davidson, R.; Mackinnon, J. Estimation and inference in econometrics. New York, Oxford
University Press, 1993.
Dickey, D. A.; Fuller, W. A. Distribution of the estimators for autoregressive time series with a
unit root. Journal of the American Statistical Association, v. 74, 1979, pp. 427–431.
Durbin, J.; Watson, G. S. Testing for Serial Correlation in Least Squares Regression, I.
Biometrika, v. 37, 1950, pp. 409–428.
Durbin, J.; Watson, G. S. Testing for Serial Correlation in Least Squares Regression, II.
Biometrika, v. 38, 1951, pp. 159–179.
Engle, R. F.; Granger, C. W. J. Co-integration and error correction: representation, estimation,
and testing. Econometrica, v. 55, n. 2, 1987, pp. 251-276.
Frisch, R. Statistical confluence analysis by means of complete regression systems. Institute
of Economics, University of Oslo, 1934.
Godfrey, L.G. Testing against general autoregressive and moving average error models when the
Regressors Include Lagged Dependent Variables. Econometrica, v. 46, 1978, pp. 1293–1302.
Goldfeld, S. M.; Quandt, R. E. Some Tests for Homoscedasticity. Journal of the American
Statistical Association, v. 60, n. 310, 1965, pp. 539–547.
Galton, F. Regression towards mediocrity in hereditary stature. Journal of the Anthropological
Institute of Great Britain and Ireland, v. 15, 1886, pp. 246-263.
Goldberger, A. S. A course in econometrics. Cambridge, Mass: Harvard University Press, 1991.
Gujarati, D. Econometria Básica: Rio de Janeiro: Elsevier, 2006.
Hoffmann, R. Análise de regressão: uma introdução à econometria. São Paulo: Hucitec,
2006.
Maddala, G. S. Introduction to econometrics. Englewood Cliffs: Prentice Hall, 1992.
294
Regressão Linear Simples Alexandre Gori Maia
Murray, M. P. A drunk and her dog: an illustration of cointegration and error correction. The
American Statistician, v. 48, n. 1, 1994, pp. 37-39.
Pindyck, R. S.; Rubinfeld, D. L. Econometria: modelos & previsões. Rio de Janeiro: Elsevier,
2004.
Shao, S. P. Estadistica para economistas y administradores de empresas. Mexico: Herrero
Hermanos, 1970.
Theil, H. Principles of econometrics. New York, John Wiley, 1971.
White, H. A heteroskedasticity-consistent covariance matrix estimator and a direct test for
heteroskedasticity. Econometrica, v. 48, n. 4, 1980, pp. 817-838.
Wooldridge, J. M. Introductory Econometrics: a modern approach. Thomson Learning,
2002.
Wooldridge, J. M. On the application of robust regression-based diagnostics to models of
conditional means and conditional variances. Journal of Econometrics, v. 47, 2001, pp. 5-46.
295