Você está na página 1de 157

Regressão Linear Simples

Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Estimador de MQO para RLS;
• Teorema de Gauss-Markov;
• Variância dos Estimadores;
• Teste t para os coeficientes;
• Análise de Varância

Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 1-3; 5.
Mínimos Quadrados - EQT
Supondo que Y seja uma função de : Yi =  + ei
e3
e2 e4 e1 = Y 1 – 
e5 Os erros ei
e1 e2 = Y 2 –  representam os

Y1 Y2 Y3 Y4 Y5
e3 = Y 3 –  erros de
mensuração de Y a
e4 = Y 4 –  partir de .

 e5 = Y 5 – 

1 Passo) Definir Erro Quadrático Total: A função EQT é


uma medida do
EQT  e12  e2 2  e3 2  e4 2  e5 2 erro total que
cometemos ao
EQT  (Y1  θ)2  (Y2  θ)2  (Y3  θ)2  (Y4  θ)2  (Y5  θ)2 utilizar  para
5 estimar Y na
EQT ( θ )   (Yi  θ)2 função Yi=+ei
i 1
EQT - Exemplo
Supondo que Y seja uma função de : Yi =  + ei
5
Seja o conjunto
EQT ( θ )   (Yi  θ)2
de valores de Y i 1

Y1 = 100
EQT()  350.000
300.000
Y2 = 200 300.000 100 250.000

Y3 = 300 150.000 200 200.000


150.000
100.000 300 100.000
Y4 = 400 150.000 400 *
50.000
0
Y5 = 500 300.000 500 0 100 200 300 400 500 600

Para este conjunto de dados, o valor de  que minimizaria a função


EQT (*) seria o 300.
Estimador de Mínimos Quadrados
Para uma amostra de tamanho n teremos:
n n
Yi  ˆ  eˆi EQT   eˆi   (Yi  θˆ)2
2

i 1 i 1

^
2 Passo) Encontrar  que minimiza EQT:

dEQT
0

EQT
dθˆ
n n n
dEQT
  2(Yi  θˆ)( 1)  2 Yi  2 θˆ
dθˆ i 1 i 1 i 1
n
EQT
dEQT n  Yi θˆ
0

 2 Yi  2nθˆ  0 θˆ  i 1
dθˆ i 1 n ^ ^
*
Função de Regressão Populacional
Seja a relação entre Y e X na população:
Yi =  + Xi + ei Modelo de Regressão
Y ou Linear Simples para Y
Yi
E(Y/Xi) =  + Xi na população

ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou explanatória
 é o intercepto ou constante do modelo
Xi X  é o coeficiente angular do modelo

Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo
Interpretação dos Coeficientes
Y Para cada valor controlado de X, teremos
e3 um valor esperado de Y.
e2 O erro representa variáveis omitidas ou
e1 mesmo dificuldades para mensurar aquelas
E(Y1) presentes no modelo.
Pressupõe-se que o efeito do erro seja
mínimo e que este esteja aleatoriamente
distriuído em torno da reta de regressão.
X1 X2 X3
X
Para compreendermos a interpretação
Y dos coeficientes do modelo:
O intercepto  representa o valor esperado de Y
quando o valor controlado de X for nulo:
E(Yi)  Y
X E (Y / 0)     (0)  
O coeficiente angular , por sua vez, representa
E(Y/0)= a variação marginal no valor esperado de Y
dada uma variação unitária em X
E (Y ) dE(Y ) d (  X )
0 Xi
X   
X dX dX
Função de Regressão Amostral
Em uma amostra, a relação entre Y e X será dada por:

Y Função de regressão amostral:


Yi = ^ + ^Xi + ^ei
^ Y previsto pelo ajuste:
ei
^ ^
Y i Y^i = ^ + Xi
Resíduo, valor não previsto pelo ajuste:
^e = Y – Y^
i i i
Xi
X
Função de Erro Quadrático Total (EQT):
EQT  eˆ12  eˆ2 2  ...  eˆn 2
EQT  (Y1  Yˆ1 )2  (Y2  Yˆ2 )2  ...  (Yn  Yˆn )2
n n
EQT   (Yi  Yˆi )2   [Yi  (ˆ  βˆX i )]
2

i 1 i 1
Método de Mínimos Quadrados
Mínimos Quadrados Ordinários:
Y
O método de mínimos quadrados ordinários (MQO)
ê6
ên ajustará a reta que apresentar as menores distâncias
ê4
ê2 ê5 quadráticas entre os valores observados e a reta (êi).
ê3 Em outras palavras, os estimadores de MQO dos
ê1 parâmetros  e  minimizarão o valor da função de
Erro Quadrático Total (EQT), dada por:
n
EQT   [Yi  (αˆ  βˆX i )]2
X i 1

Para encontrar os valores que minimizam a função EQT:


EQT ˆ  Y  βˆ1 X
 2i 1[Yi  (ˆ  ˆX i )](1)  0
n
(1)
ˆ
n

EQT
 X iYi  n X Y
 2i 1[Yi  (ˆ  ˆX i )](  X i )  0
n i 1
(2) β̂ 
βˆ
n
 Xi2  n X
2

i 1
Estimadores de MQO
Estimadores de Mínimos Quadrados Ordinários:
Seja o modelo de Regressão Linear Simples (RLS) para o conjunto de dados
populacionais e sua equivalente representação na amostra:
Yi    X i  ei Yi  ˆ  ˆX i  eˆi (3)
Os estimadores de MQO para os parâmetros  e , ou seja, os estimadores que
minimizam o valor de êi2, serão
n
dadas por:
 X iYi  n X Y
ˆ  Y  βˆ X e βˆ  i 1
n
 Xi2  n X
2

i 1

Para simplificar os cálculos, podemos demonstrar que essas expressões podem


também ser dadas como função dos desvios de X e Y em relação às suas
respectivas médias amostrais: n n n
 xi yi  X i yi  xiYi
ˆ  Y  βˆ X (4) e βˆ  i 1
n
 i 1
n
 i 1
n (5)
 xi 2  xi 2  xi 2
i 1 i 1 i 1

Onde: xi  X i  X e yi  Yi  Y
Estimadores de MQO - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de
estudo (X) do responsável pela família: Y X
Yi    X i  ei (Renda) (Anos
Estudo)
A partir dos dados de uma amostra de 4 oobservações, os 4 1
estimadores de MQO para a função amostral serão: 8 4

Yi  ˆ  ˆX i  eˆi Yi  2,71  1,29 X i  eˆi 10 6

12 7

ˆ  Y  βˆ X  8,5  1,29(4,5)  2,71


n
 xi yi 27
βˆ  i 1
n   1,29
i 2 21
x
i 1
Para cada ano adicional de escolaridade da
pessoa responsável, espera-se um acréscimo de
1,98 SM na renda familiar. O rendimento esperado
para famílias lideradas por pessoas sem
escolaridade seria de 2,71 SMs.
Distribuição Amostral dos Estimadores
Seja uma população com 20 observações:
Y=^+^X+e
^
Y=+X+e Função ajustada
Y Função de Y para amostra 2
Regressão
Populacional

Y=^+^X+e
^
Função ajustada
para amostra 1

X X

Os estimadores de MQO variarão aleatoriamente em função dos valores


observados na amostra.
Teorema de Gauss-Markov
Teorema de Gauss-Markov
Sob a hipótese da veracidade de alguns pressupostos, os estimadores obtidos pelo
método de mínimos quadrados ordinários serão os Melhores Estimadores Lineares
Não Viesados (MELNV, ou BLUE - Best Linear Unbiased Estimator).
Em outras palavras:
E( ˆ )   estimador não viesado
E:
Var( ˆ )  Var( ˆ ' ) estimador mais eficiente que ^’,
qualquer que seja ^’ outro estimador
de 
1 – Relação Linear
Linearidade nos parâmetros Linearidade nos parâmetros
e nas variáveis
Yi  α  βX i2  ei
Y Yi  α  βX i  ei Y

X X
Modelo é linear nas variáveis pois todos Modelo não é linear nas variáveis pois o
os expoentes de Y e X são iguais a 1. expoente de X não é igual a 1.
Modelo é linear nos parâmetros pois Modelo é linear nos parâmetros pois
todos os expoentes dos parâmetros são todos os expoentes dos parâmetros são
iguais a 1. iguais a 1.
2- Valores de X são Fixos
Pressupõe que o valor de X seja controlado em repetidas amostras para
se observar variações aleatórias de Y.

Yi    X i  ei
Y Premissa utilizada em inúmeras
demonstrações, embora seja, muitas
vezes, pouco factível. Nessas
E(Y1)
circunstâncias, cuidados adicionais
deverão ser tomados para que as
E(Y2) estimativas de MQO não sejam viesadas.

X1 X2 X
3 - Esperança Condicional Zero
Os erros apresentam esperança condicional zero, ou seja, esses não
podem estar associados aos regressores.
E (e | X i )  E (ei )  0 E (Y / X i )    X i

Y
A média dos erros associados a cada
Yi valor controlado de X será sempre 0,
ei não importa qual seja o valor de X.
E(Y/Xi)

Xi X
4 - Homocedasticidade
A variabilidade dos erros deve ser constante, qualquer que seja o valor
de :X
Var(ei / X i )   2

Homocedasticidade Heterocedasticidade
Y Y

E(Y2) E(Y2)
Var(e2)=2
E(Y1) E(Y1) Var(e2)=22
Var(e1)=2 Var(e1)=21
X1 X2 Xj X1 X2 Xj
5 – Ausência de Autocorrelação
Não há correlação entre os erros do modelo regressão:

Cov(et , et  s )  E (et et  s )  0

Não Autocorrelacionado Autocorrelacionado


e E (et et s )  0 e E (et et s )  0

t t

A autocorrelação é frequente em análise de séries temporais de dados


espaciais.
Modelo Clássico de Regressão Linear
1) Relação Linear entre X e Y:
Modelo Clássico de Regressão Linear

O ajuste só é válido para relações lineares.


2) Os valores de X são fixos em repetidas amostras, não aleatórios:
Quem varia é o regressando, o regressor é fixo e dado, qualquer que seja a
amostra. Fazemos a pressuposição que dado um valor de X, Y irá variar
segundo uma distribuição de probabilidade com valor esperado dado por E(Y|Xi).

3) Esperança condicional dos erros igual a zero, ou seja, E(e|Xi)=0:


É a mesma coisa afirmar que E(Y|Xi)=+Xi.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=2
Os erros são homocedásticos, ou seja, sua variância é a mesma para qualquer X.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0:
Não há relação entre valores ordenados dos erros segundo tempo ou espaço.
6) Os erros apresentam distribuição normal:
Não é um pressuposto necessário para que os estimadores de MQO sejam
MELNV, mas necessário para que as inferências sejam válidas.
Variância dos Estimadores
Variância dos estimadores de MQO:
Seja o modelo de RLS:
Yi    X i  ei
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, o método de
MQO oferecerá estimadores não viesados para os coeficientes do modelo e para
suas respectivas variâncias. As variâncias dos estimadores e seus respetivos
estimadores serão dados por:

Var(ˆ )  E (ˆ   ) 2 
 X i
2
 2
S 2

 X i
2
ˆ 2



1

X 2 
ˆ 2

n xi2 n xi2  n  xi 
ˆ 2

2 ˆ 2
Var( ˆ )  E ( ˆ   ) 
2
S 2ˆ 
 xi2  xi2
Onde 2=Var(ei) é a variânica dos erros ou variância da regressão e 
^ 2 seu
respectivo estimador, dado por:
 ˆ 2
 i  i  ̂  xi yi
e
ˆ 2  i onde ˆ
e 2
 y 2
n2
Teste t para os Estimadores
Então, para verificar que os estimadores de MQO são significativos:
Teste de hipótese para : ˆ~N (0, ̂2 )
H0: =0
p é a probabilidade de erro
ao afirmar que  é
Sob a hipótese de H0 ser
H1: 0 verdadeiro temos... p/2 p/2
significativo no modelo

0 ̂ valor obtido pela amostra

Teste de hipótese para 1: βˆ~N (0,  2 )


β̂
H0: =0 p é a probabilidade de erro
ao afirmar que  é
Sob a hipótese de H0 ser
H1: 0 verdadeiro temos...
p/2 p/2
significativo no modelo

0 ˆ valor obtido pela amostra


Variância dos Estimadores - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de
estudo (X) do responsável pela família:
Yi    X i  ei Y
(Renda)
X
(Anos
Estudo)
A partir dos dados de uma amostra de 4 oobservações, as
4 1
estimativas de MQO para a função amostral serão:
8 4
Yi  ˆ  ˆX i  eˆi Yi  2,71  1,29 X i  eˆi 10 6

As estimativas das variâncias dos erros e dos estimadores de 12 7


MQO serão:

ˆ 2   ˆ
ei
2

0,2857
 0,1429  0,3780 2
n2 42
1 X 2  2  1 4,52 
S2ˆ   ˆ     0,1429  0,1735  0, 4165 2

 n  xi 
2
 4 21 
ˆ 2 0,1429
S ˆ 
2
  0,0068  0,0825 2

 xi2 21
Teste t- Exemplo
Conhecendo os erros padrões e a fdp dos estimadores, temos que:

Teste de hipótese para 0: t2


Aplicando a estatística de a probabilidade de erro ao
H0: =0 teste tn–2 afirmar que o intercepto é
significativo no modelo é de
H1: 0 ˆ  0 2,71
0,2%
t  0,011 0,011
Sˆ 0,42 0 6,52

Teste de hipótese para 1: t2


Aplicando a estatística a probabilidade de erro ao
H0: =0 de teste tn–2 afirmar que a variável X é
significativa no modelo é de
H1: 0 ˆ  0 1,29 0,002 0,002 0,4%
t 
S ˆ 0,08 0 15,6
Análise de Variância
Quando X explica Y Quando X não explica Y
Y Maior Soma dos Y Menor Soma dos
Quadrados da Quadrados da
Regressão Regressão

Y Y
^
Y
^
Y

X X

n n n
STQ   (Yi  Y ) 2 ˆ  Y)2
SQReg   (Y ˆ )2
SQRes   (Yi  Y
i i
i 1 i 1 i 1
Soma dos Quadrados
Soma Total dos Quadrados (STQ)
Mensura a variabilidade total da variável dependente.
n n
STQ   (Yi  Y )   yi 2
2
i 1 i 1

Soma dos Quadrados da Regressão (SQReg)


Mensura a variabilidade da variável dependente explicada
pelo modelo. n n n
SQ Re g   (Yˆi  Y )2  ˆ12  xi 2  ˆ1  xi yi
i 1 i 1 i 1
Soma dos Quadrados da Regressão (SQReg)
Mensura a variabilidade residual, não explicada pelo
modelo. n n n n
SQ Re s   (Yi  Yˆi )2   eˆi 2   yi 2  ˆ1  xi yi
i 1 i 1 i 1 i 1
Coeficiente de Determinação
Coeficiente de Determinação (R2):
Definição: Estima a proporção da variabilidade da
variável dependente (Y) que é explicada pela(s) variável(eis)
independente(s) do modelo de regressão.
n n n

SQ Re g
 (Yˆi  Y )2  eˆi2  xi2
R2   i 1
n
 1 i 1
n
 ˆ12 i 1
n
STQ
 (Yi  Y )2  yi2  yi2
i 1 i 1 i 1

Escala de R2:

0 A significância das escalas depende muito da 1


independência natureza da variável dependente relação
linear linear exata
Análise de Variância
Problema: O modelo contribui para explicar Y?
H0: 1=0 (o modelo não contribui) SQReg
~ F1, n-2
SQRes/(n - 2)
H1: 10 (o modelo contribui) Sob a hipótese
de H0 ser
verdadeiro
Dados: temos...
p
 = nível de significância
F
SQReg = Soma dos Quadrados da Regressão
SQRes = Soma dos Quadrados dos Resíduos
SQReg
n = número de observações F
SQRes/n - 2

Conclusão:
Rejeito H0 se valor p  .
Análise de Variância
Tabela ANOVA (Analysis Of Variance)
Soma dos Quadrados
Fonte GL F
Quadrados Médios
n SQReg/1
Regressão 1 ˆ  Y)
SQReg   (Y 2 SQReg F
i SQRes/(n - 2)
i 1 1
n SQRes
Resíduos n-2 ˆ )2
SQRes   (Yi - Yi n-2
i 1

n
Total n -1 STQ   (Yi  Y )2
i 1

Rejeito H0 quando valor p – prob (F > F1, n-2) - for menor que
nível de significância esperado ().
Formas Funcionais

Econometria
Alexandre Gori Maia

Ementa:
• Definição: modelos lineares e não lineares;
• Modelo Linear;
• Modelo Log-Linear;
• Modelo Linear-Log;
• Modelo Log-Log.

Bibliografia Básica:
-Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 4.
Modelos Não Lineares
Linearidade nos parâmetros Linearidade nos parâmetros
e nas variáveis
Yi  α  βX i2  ei
Y Yi  α  βX i  ei Y

X X
Modelo é linear nas variáveis pois todos Modelo não é linear nas variáveis pois o
os expoentes de Y e X são iguais a 1. expoente de X não é igual a 1.
Modelo é linear nos parâmetros pois os Modelo é linear nos parâmetros pois os
expoentes de  e  são iguais a 1. expoentes de  e  são iguais a 1.
Modelos Lineares nos Parâmetros
Modelos não lineares nas variáveis podem tornar-se lineares por anamorfose:

Yi  α  βX i2  ei Yi  α  βZ i  ei
Y Y

é a mesma coisa que...

X Z=X2
Relações não lineares nas variáveis podem ser transformadas em relações lineares por
anamorfose, ou seja, por transformações de suas variáveis originais.
A escolha da forma funcional (tipo de transformação das variáveis) depender á da análise
dos valores e, principalmente, do conhecimento prévio das relações por parte do
pesquisador.
Constatada a linearidade nas variáveis, os coeficiente (’s) de modelos lineares por
anamorfose são estimados de maneira análoga pelo método de mínimos quadrados.
Formas Funcionais
As formas funcionais mais utilizadas em análises econômicas sâo:
Y Y

Yi  β0  β1 X i  ei β0 β1  0
1) Modelo linear: β1  0 ou
β0
X X
Y β1  1
Y 0  β1  1
2) Modelo log-log: ln(Yi )  β0  β1ln(X i )  ei  1  β1  0 ou
X X

Y Y
β1  0
3) Modelo log-lin: ln(Yi )  β0  β1 X i  ei β1  0 ou
X X
Y Y β1  0
4) Modelo lin-log: Yi  β0  β1ln(X i )  ei β1  0
ou
X X
Y Y
1 β0
5) Modelo inverso: Yi  β0  β1 X  ei β1  0 ou β1  0
i
β0
X X
Modelo Linear
Forma Funcional: Yi    X i  ei
Pressupõe que Y apresente aumentos (ou reduções) absolutos constantes dadas
variações absolutas em X.

Y E[Y / 0]     (0)  
 é o valor esperado de Y para valores
+Xi+1 nulos de X
Y=
+Xi
X=1 Y dY d (  X )
  
X dX dX

 é a variação marginal absoluta no
valor esperado de Y (Y) dada uma
0 Xi Xi+1 variação unitária em X (X=1).
X
A variação marginal no valor esperado de Y é a mesma para qualquer valor de X.
Modelo Linear
Qual o efeito da temperatura média diária (°C) sobre as vendas de sorvete?
Pressupondo que a relação entre total de
vendas de uma sorveteria (Y, em 1.000
R$) e a temperatura média (X, em oC) seja
linear:
Yi    βX i  ei
De onde obtemos:
Vendasi  1,04  0,12Tempi  ei

A estimativa do coeficiente angular sugere que, para cada aumento unitário na


temperatura média (X=1 oC), haja um incremento médio e constante de 120 reais nas
vendas de sorvete (Y=0,125 1.000 R$).
O intercepto negativo não possui interpretação econômica, mas sugeririam que o valor
esperado das vendas seria negativo caso a temperatura média fosse igual a 0 oC.
Modelo Log-Linear
Forma Funcional: ln(Yi )    X i ei
Pressupõe que Y apresente crescimento (ou decaimento) exponencial em relação a
variações absolutas de X.
Y ln(Y)
e+Xi+1
+Xi+1
+Xi ln(Y)=
Y/Yi= X=1
e+Xi
e X=1 

0 Xi Xi+1 0 Xi Xi+1
X X
Temos que:

E[ln(Y ) / 0]     (0)   E[Y / 0]  e

 ln(Y ) d ln(Y ) d (  X ) Y / Yi  ln( Y ) 1 Y


    pois    ln( Y ) 
X dX dX X Y Yi Yi
Modelo Log-Linear
Qual o impacto da escolaridade sobre a renda do trabalho?
Pressupondo que a renda do trabalho (Y,
em R$ mensais) cresça exponencialmente
com os anos de escolaridade (X):
ln( Yi )    βX i  ei
De onde obtemos:
ln(Yi )  6,006  0,121 X i  eˆi

Espera-se, para cada ano adicional de escolaridade (X=1), um incremento relativo


de 12,1% no rendimento do trabalho (Y=0,121 Yi).
Modelo Linear-Log
Forma Funcional: Yi     ln( X i ) ei
Pressupõe que Y apresente variações absolutas constantes dadas variações relativas
em X.
Y Y

+ln(Xi+1) +ln(Xi+1)
Y= +ln(Xi) Y=
+ln(Xi)
X=Xi ln(X)=1

Xi Xi+1 ln(Xi) ln(Xi+1)


X ln(X)
Temos que:
Como variações absolutas em ln(X), ou
 ln( X ) 1 X seja, ln(X), representam variações
   ln( X ) 
X Xi Xi relativas em X (X/Xi), o coeficiente
angular  representará as variações
Então:
absolutas em Y (Y) dada uma variação
Y [   ln( X )] Y
   relativa de 100% em X (X/Xi=1=100%).
 ln( X )  ln( X ) X / X i
Modelo Linear-Log
Como a renda do trabalho afeta a disposição a trabalhar?
Pressupõe-se que o aumento da renda (X, em
R$/h) tenha um efeito positivo sobre a jornada de
trabalho (h semanais). Entretanto, à medida que a
renda cresça indefinidamente, espera-se
variações cada vez mais tênues sobre a jornada
de trabalho:
Yi    β ln( X i )  ei
De onde obtemos:
Yi  30,799  4,790 ln( X i )  eˆi

Espera-se que, para cada variação relativa de 1% no rendimento hora do trabalho,


haja um incremento absoluto de 0,0479 horas (2,87 minutos) na jornada de trabalho
do ocupado.
Modelo Log-Log
Forma Funcional: ln(Yi )     ln( X i ) ei
Pressupõe que Y apresente variações relativas constantes dadas variações relativas em
X.
Y ln(Y)

e+ln(Xi+1) +ln(Xi+1)
Y=Yi +ln(Xi) ln(Y)=
e+ln(Xi)
X=Xi ln(X)=1

Xi Xi+1 ln(Xi) ln(Xi+1)


X ln(X)
Sabemos que:
O coeficiente  é uma medida constante da
X Y elasticidade de Y em relação a X, ou seja,
 ln( X )  e  ln(Y ) 
Xi Yi considera que as variações relativas em Y dadas
Então: variações relativas em X sejam as mesmas para
 ln( Y ) Y / Yi quaisquer valores de Xi e Yi.
 
 ln( X ) X / X i
Modelo Log-Log
Como o custo de viagem afeta a taxa de visitação a um parque nacional?
Espera-se que haja uma elasticidade constante
entre taxa de visitação (Y, em visitas/100.000
habitantes) e custo de viagem do município de
origem ao parque (X, em R$), ou seja,
incrementos percentuais no custo de viagem
gerariam reduções percentuais na taxa de
visitação:
ln( Yi )    β ln( X i )  ei
De onde obtemos:
ln(Yi )  13,492  2,049 ln( X i )  eˆi

O coeficiente angular sugere um demanda relativamente elástica às variações no


custo de viagem. Para cada aumento de percentual no custo de viagem, espera-se
uma redução 2,05% na taxa de visitação.
Regressão Linear Múltipla
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Estimadores Mínimos de Mínimos Ordinários;
• Teorema de Gauss-Markov

Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 6.
Definição MQO Gauss-Markov

Função de Regressão Populacional


Seja a relação entre Y e X na população:
Yi =  + Xi + ei Modelo de Regressão
Y ou Linear Simples para Y
Yi
E(Y/Xi) =  + Xi na população

ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou regressor
 é o intercepto ou constante do modelo
Xi X  é o coeficiente angular do modelo

Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo 2/11
Definição MQO Gauss-Markov

Função de Regressão Amostral


A relação entre Y e X estimada na amostra será dada por:

Y Função de regressão amostral:


Yi = ^ + ^Xi + ^ei
^ Y previsto pelo ajuste:
ei
^ ^
Y i Y^i = ^ + Xi
Resíduo, valor não previsto pelo ajuste:
^e = Y – Y^
i i i
Xi
X
Função de Erro Quadrático Total (EQT):
EQT  eˆ1  eˆ2  ...  eˆn
2 2 2

EQT  (Y1  Yˆ1 ) 2  (Y2  Yˆ2 ) 2  ...  (Yn  Yˆn ) 2


n
EQT   (Yi  Yˆi ) 2   [Yi  (αˆ  βˆX i )]
n
2

i 1 i 1 3/11
Definição MQO Gauss-Markov

Regressão Múltipla
Regressão Linear Simples: Regressão Linear Múltipla:
Yi    X i  ei Yi    1 X 1i   2 X 2i  ei

X1 X2
Onde: Onde:
EQT (ˆ , ˆ )   eˆi2   [Yi  (ˆ  ˆX i )]2 EQT (ˆ , ˆ1 , ˆ2 )   eˆi2   [Yi  (ˆ  ˆ1 X 1i  ˆ2 X 2i )]2
Minimizando EQT: Minimizando EQT:
EQT
EQT  0  ˆ  Y  ˆ1 X1  ˆ2 X 2
 0  ˆ  Y  ˆX ˆ
ˆ
EQT ˆ ( yi x1i )(  x22i )  ( yi x2i )(  x1i x2i )
EQT  xi yi  0  1 
 0  ˆ  ˆ1 ( x12i )(  x22i )  ( x1i x2i ) 2
ˆ  xi2 EQT ( yi x2i )(  x12i )  ( yi x1i )(  x1i x2i )
 0  ˆ2 
ˆ2 ( x12i )(  x22i )  ( x1i x2i ) 2

4/11
Definição MQO Gauss-Markov

Regressão Múltipla
Regressão Linear Simples: Regressão Linear Múltipla:
Yi    X i  ei Yi    1 X1i   2 X 2i  ei

X1 X2

Temos que: Temos que:


Valor esperado de Y
E[Y / X  0]   Valor esperado de Y quando X é E[Y / X1  0, X 2  0]   quando ambos X1 e X2
nulo. são nulos.
dY Y
 Variação marginal esperada em
 1
Variação marginal esperada em Y para
dX Y para cada variação unitária em X 1 cada variação unitária em X1,
X. mantendo X2 constante.
Y
 2 Variação marginal esperada em Y para
X 2 cada variação unitária em X2,
mantendo X1 constante.
5/11
Definição MQO Gauss-Markov

Regressão Múltipla - Exemplo


Seja a relação para consumo de energia (Kwh), horas de ar condicionado
ligado (AC) e horas de secadora ligada (SEC):
Kwhi    ACi  ei Kwhi    1 ACi   2 SECi  ei

O coeficiente  indicará o consumo esperado de


energia quando ambos ar condicionado e secadora
O coeficiente  indicará o consumo esperado de permanecerem desligados.
energia quando o ar condicionado permanecer
O coeficiente 1 indicará o aumento no consumo de
desligado. energia esperado para cada hora adicional com ar
O coeficiente  indicará o consumo de energia condicionado ligado, mantendo-se constante o tempo
adicional esperado para cada hora adicional com ar de uso da secadora. Analogamente, O coeficiente 2
condicionado ligado. indicará efeito isolado de uma hora adicional com a
secadora ligada sobre o consumo esperado de
energia.
6/11
Definição MQO Gauss-Markov

Regressão Múltipla - Definição


Regressão Múltipla
Em um modelo de regressão múltipla, a variável dependente (Y) será
determinada por mais de uma variável independente (X). Genericamente, um
modelo de regressão linear múltipla com k variáveis independentes e p parâmetros
(p=k+1) pode ser representado por:
Yi    1 X 1i   2 X 2i  ...   k X ki  ei
Onde:
 é o valor esperado de Y quando todos as variáveis independentes forem
nulas;
1 é a variação esperada em Y dado um incremento unitário em X1,
mantendo-se constantes todas as demais variáveis independentes;
...
k é a variação esperada em Y dado um incremento unitário em Xk,
mantendo-se constantes todas as demais variáveis independentes;
ei é o erro não explicado pelo modelo;

7/11
Definição MQO Gauss-Markov

MQO em Notação Matricial - RLS


Dada a equação: A equivalente matricial:
Yi    X i  ei y  Xβ  e
Que representa o sistema: Que representa o sistema:
Y1    X 1  e1  Y1  1   X 1   e1   Y1  1 X1   e1 
             
Y2    X 2  e2  Y2  1   X 2   e2   Y2  1 X 2     e2 
 ...    ...     
 ...     ...    ...    ...  
...    ...
...              
Y  1   X  e   Y  1  e 
Yn    X n  en  n    n  n  n  Xn 
p1
 n
yn1 Xnp en1
Para obter os
Para obter os estimadores de MQO:
estimadores de MQO:
EQT   eˆi2 ˆ 
yˆ  Xβˆ eˆ  y  yˆ EQT  eˆ eˆT
onde β̂   
ˆ
 
e
EQT Então:
 0  ˆ  Y  ˆX
ˆ
EQT
EQT  xi yi  0  βˆ  ( XT X) 1 ( XT y )
 0  ˆ  βˆ
ˆ  xi2
8/11
Definição MQO Gauss-Markov

MQO em Notação Matricial - RLM


Dada a equação: A equivalente matricial:
Yi    1 X 1   2 X 2  ...   k X k  ei y  Xβ  e
Que representa o sistema: Que representa o sistema:

Y1    1 X 11   2 X 21  ...   k X k1  e1  Y1   1 X 11 X 21 ... X k1     e1 
      
Y2    1 X 12   2 X 22  ...   k X k2  e2  Y2   1 X 12 X 22 ... X k2  1   e2 
 ...    ... ... ...

... ...  ...   ... 
...       
Yn    1 X 1n   2 X 2n  ...   k X kn  en Y   1 X
 n  1n X 2n ... X kn   k   en 

yn1 Xnp p1 en1


Para obter os estimadores de MQO: Para obter os estimadores de MQO:
EQT   eˆi
e
yˆ  Xβˆ eˆ  y  yˆ EQT  eˆ T eˆ
EQT Então:
 0  ˆ  ...
ˆ EQT
...  0  βˆ  ( XT X) 1 ( XT y )
EQT βˆ
 0  ˆk  ...
ˆk 9/11
Definição MQO Gauss-Markov

Regressão Múltipla - Exemplo


Seja a relação entre renda familiar em SM (Y), anos de estudo (X1) e idade (X2) do
responsável pela família:

Yi    1 X 1i   2 X 2i  ei y  Xβ  e Y X1 X2
(Renda) (Anos (Idade)
Estudo)
A função de regressão amostral será dada por:
 4  1 1 20  ˆ  eˆ1  4 1 20
      
ˆ  8  1 4 30  ˆ   eˆ2  8 4 30
y  Xβ  e
ˆ 10   1 6 40  1    eˆ 
 ˆ   3 
10 6 40
  
12  1 7 50  2   eˆ 
     4 12 7 50
^
y41 X43 31 ê41
E as estimativas de MQO:
1
 4 18 140   34   1,9 
     
βˆ  (XT X)1(XT y)   18 102 730   180    1 
140 730 5400  1320   0,06 
     
Espera-se, para cada ano adicional de estudo do
responsável pela família, um aumento de 1 SM e,
para cada ano de idade adicional, um aumento de
0,06 SM na renda familiar. 10/11
Definição MQO Gauss-Markov

Teorema de Gauss-Markov
Método de Mínimos Quadrados
Seja o modelo de regressão múltipla representado matricialmente por:
y  Xβ  e
O estimador de MQO para o vetor de coeficientes  que minimizará o erro
quadrático total do modelo será dado por:

βˆ p1  (X T X) 1 (XT y)
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, os estimadores
de MQO serão os MELNV dos coeficientes de um modelo de RLM.
1. A v.a. Yi é uma função linear das variáveis explanatórias (Xij, j=1..k);
2. Os valores de Xj são fixos;
3. Os erros possuem esperança condicional zero, ou seja, E(ei)=0;
4. Os erros são homocedásticos, ou seja, E(ei2)=2; E(ee’)=I2
5. Os erros são não-correlacionados, ou seja, E(eiej)=0, para ij;
E, para que tenhamos um modelo clássico de regressão linear:
6. Os erros estão normalmente distribuídos;
11/11
Análise de Variância
Econometria
Alexandre Gori Maia
Ementa:
• Soma dos Quadrados;
• Coeficiente de Determinação;
• Teste F para Tabela ANOVA;
• Coeficiente de Determinação Ajustado;

Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 7.
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado

Soma dos Quadrados - Conceito


Quando X explica Y Quando X não explica Y
Y Maior Soma dos Y Menor Soma dos
Quadrados da Quadrados da
Regressão Regressão

Y Y
^
Y
^
Y

X X
n n n
STQ   (Yi  Y ) 2
SQReg   (Yˆi  Y ) 2 SQRes   (Yi  Yˆi ) 2
i 1 i 1 i 1

2/11
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado

Soma dos Quadrados - Definição


Soma Total dos Quadrados (STQ): Y
n n
STQ   (Yi  Y ) 2   yi  y T y  nY 2 STQ
2

i 1 i 1
X1 X2
Variabilidade total da variável dependente. Representa as distâncias
quadráticas dos valores de Y em relação à média aritmética.

Soma dos Quadrados da Regressão (SQReg):


n Y
SQReg   (Yˆi  Y )  βˆ X y  nY
2 T T 2
SQReg
i 1
X1 X
Variabilidade da variável dependente explicada pelo conjunto de variáveis 2
independentes. Representa as distâncias quadráticas dos valores
ajustados pelo modelo em relação à média aritmética.
Soma dos Quadrados dos Resíduos (SQRes): Y
n SQRes
SQRes   (Yi  Yˆi ) 2  eˆ T eˆ  y T y  βˆ T XT y
i 1
X1 X2
Variabilidade da variável dependente não explicada pelo conjunto de
variáveis independentes. Representa as distâncias quadráticas entre os
valores observados de Y e seus valores ajustados pelo modelo.
3/11
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado

Análise de Variância
Soma dos Quadrados
Fonte GL Quadrados F
Médios

SQReg F
SQReg/k
Regressão k βˆ T XT y  nY 2 k SQRes/ (n  k  1)

SQRes
Resíduos n  (k  1) y y  βˆ T XT y
T
n  (k  1)

Total n 1 yT y  nY 2

4/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação

Coeficiente de Determinação
Coeficiente de Determinação (R2):
Definição: Estima a proporção da variabilidade da variável dependente
(Y) que é explicada pelo conjunto das k variáveis independentes do
modelo de regressão (X).
Y
SQReg SQRes
R2   1 X1
STQ STQ X2

Escala para R2:

0 1
Independência Relação
linear linear exata
5/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação

Soma dos Quadrados - Exemplo


Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Yi  1,9  1X 1i  0,06 X 2i  eˆi

Y X1 X2
(Renda) (Anos (Idade)
Estudo)
4 1 20

8 4 30

10 6 40

12 7 50 SQReg 34,8
R2    0,994
4 STQ 35
  As variáveis anos de estudo e
8
STQ  y y  nY  4 8 10 12    4(8,5)  324  289  35 idade explicam, conjuntamente,
T 2 2
10
  quase a totatilidade (99,4%) da
12 
  variabilidade observada para a
 34  renda familiar na amostra.
 
SQReg  βˆ T XT y  nY 2  1,9 1 0,06  180   4(8,5)  323,8  289  34,8
2

1320 
 
SQ Re s  STQ  SQ Re g  35  34,8  0,2
6/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

Teste F para ANOVA- Exemplo


Seja o modelo de RLM com duas variáveis: Y    1 X1  2 X 2  e

H 0 : 1   2  0
E as hipóteses: 
H1 : Pelo menos um  j  0

Possíveis resultados do modelo:

Y Y Y
Y

X2 X1
X1 X2
X1 X2 X1 X2

10 20 1=0 20 10 2=0 1=0 2=0


Nenhuma variável
X1 e X2 contribuem Apenas X2 contribui Apenas X1 contribui
contribui para
para explicar Y. H0 para explicar Y. H0 para explicar Y. H0
explicar Y. H0 não
deveria ser rejeitado deveria ser rejeitado deveria ser rejeitado
deveria ser rejeitado

7/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

Teste F para ANOVA


Seja o modelo de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para testarmos a contribuição do conjunto de k variáveis independentes do modelo,
teremos as hipóteses:

H0: 1=...=k =0 (não contribui)


H1: Pelo menos um j 0 (contribui) F ~ Fn,nk 1
A estatística de teste será Considerando
H0 verdadeiro, a
SQReg/k fdp de F será... p
F
SQRes/ (n  k  1) F
Rejeitar H0 significa afirmar que o modelo contribui para explicar Y, ou seja, há
relação significativa entre pelo menos uma variável explicativa e a variável
dependente.

8/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

Teste F para ANOVA - Exemplo


Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Y  1,9  1X  0,06 X  eˆ
i 1i 2i i

SQReg/ 2
~ F2 ,1
SQRes/1

0,076
F  87,0

valor p = 0,076
Há evidências moderadas para
afirmar que o modelo contribui
para explicar a variabilidade da
renda familiar. A probabilidade de
erro ao fazermos tal afirmação é
de aproximadamente 7,6%.
9/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

R2 Ajustado - Definição
Seja o ajuste: Incorporando uma variável independente adicional (X3):
Yi    ˆ1 X 1i  ˆ2 X 2i  eˆi Yi    ˆ1 X 1i  ˆ2 X 2i  ˆ3 X 3i  eˆi
Poderemos ter: Ry2123  Ry212
Ry2123  Ry212
SQReg
Y Ry212  Y Y
STQ X3 X3
SQReg SQReg ou SQReg
X1 X X1 X2 X1 X
2 2

O R2 nunca diminui quando incorporamos variáveis


independentes adicionais no modelo.
_
Coeficiente de _Determinação Ajustado (R2):
O R2 ajustado (R2) pondera o coeficiente de determinação (R2) pelo número de variáveis
explicativas e pelo número de observações da amostra. É particularmente útil quando
desejamos comparar modelos de regressão múltipla que prevêem a mesma variável
dependente, pois penaliza aquele modelo com maior número de variáveis independentes.
Será dado por:
SQRes/ [n  (k  1)] n 1
R 2  1  1  (1  R 2 )
STQ/ (n  1) n  (k  1) 10/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado

R2 Ajustado - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Y  1,9  1X  0,06 X  eˆ
i 1i 2i i

R 2  0,994
4 1
R 2  1  (1  0,994)  0,982
4  (2  1)
Não há mudanças expressivas no coeficiente de determinação ajustado pelo número de
observações e variáveis do modelo é expressivamente inferior ao R2. Reflexo, sobretudo,
do elevadíssimo valor encontrado para o R2.

11/11
Inferência em Regressão Múltipla
Econometria
Alexandre Gori Maia
Ementa:
• Variância dos estimadores;
• Teste t para os coeficientes;
• Combinação linear dos parâmetros;
• Intervalo de Confiança para os valores previstos;

Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: Conceitos e Aplicações. Cap. 8.
Variância dos
Teste t Combinação Linear Intervalo Confiança
coeficients

Variância dos Estimadores


Variância dos estimadores de MQO:
Seja o modelo de RLM:
y  Xβ  e
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, o método de
MQO oferecerá estimadores não viesados para os coeficientes do modelo e para
suas respectivas variâncias. As variâncias dos estimadores e seus respetivos
estimadores serão dados por:
Var(βˆ )  (XT X) 1 2 Sβˆ2  ( XT X) 1ˆ 2

Onde 2 é a variânica dos erros ou variância da regressão e 


^ 2 seu respectivo
estimador, dado por:
eˆ T eˆ y T y  βˆ T XT y
ˆ 
2

n  (k  1) n  (k  1)

2/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Teste t para Coeficientes


Seja o modelo de RLM:
Yi    1 X 1   2 X 2  ...   k X k  ei
Para saber se Xj possui de fato relação isolada com Y, podemos realizar um teste de
hipóteses para o coeficiente j :
Efeito Efeito
Y isolado
H0: j=0 (Variável Xj não tem relação isolada com Y) isolado
de X1 de X2

H1: j0 (Variável Xj não tem relação isolada com Y) X1 X2

Sob as premissas do MCRL, o estimador de MQO para j , além de não viesado e de


variância mínima, apresentará distribuição normal. Assim, caso H0 seja válido, sua
distribuição será dada por:
βˆ j ~N ( 0, σ β2ˆ ) ˆ j  0 t ~ tn-(k1)
t
j

Sj 2 S ˆ
j

p/2 p/2 p/2 p/2


0 ̂ j 0 t 3/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Teste t para Coeficientes


O parâmetro será nulo até que se prove o contrário: S^j2
βˆ j ~N ( 0, σ β2ˆ )
H0: j =0 j

Se H0 é verdadeiro, então...
H1:  j  0
Dados: p/2 p/2
^ 0 ̂ j
j = estimador de MQ
ˆ j  0 t ~ tn-(k1)
S^j = erro padrão do estimador t nk1 são os
S ˆ
valor p = nível de significância
j graus de
liberdade dos
observado
p/2 p/2 resíduos
0 t
Conclusão:
Rejeito H0 se valor p (prob de erro ao rejeitar H0) for baixa. Nestas
circunstâncias, posso afirmar que o estimador é significativo.
4/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Teste t para Coeficientes - Exemplo


Sejam os dados da relação entre renda familiar (Y), anos de estudo (X1) e idade
(X2) do responsável pela família:
Yi  1,9  1X 1i  0,06 X 2i  eˆi
A matriz de estimativas das variâncias e covariâncias dos coeficientes será:
1
 4 18 140   8,95 2,5  0,57   1,79 0,5  0,114 
     
1 2 2    
S βˆ  ( X X)    18 102 730  
2 T
ˆ ˆ  2 ,5 1 0, 2  0, 2  0 ,5 0 , 2 0 ,04 
140 730 5400    0,57  0,2 0,042    0,114  0,04 0,0084  S2^j
     
Realizando testes de hipóteses para os coeficientes angulares:

H0: 1=0 ˆ1 ~ N (0,  2ˆ ) t


1 0
 2,24
1
0,2 t1
H1: 10
Se afirmarmos que anos de estudo tenham p/2 p/2 0,134 0,134
efeito isolado sobre a renda, estaremos 0 0
1 2,24
sujeitos a um erro de 27%

H0: 2=0 ˆ2 ~ N (0,  2ˆ ) t


0,06  0
 0,65
2
0,0084 t1
H1: 20
Se afirmarmos que a idade tenha efeito p/2 p/2 0,315 0,315
isolado sobre a renda, estaremos sujeitos 0 0
0,06 0,65
a um erro de 63%
5/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Combinação Linear de Parâmetros


Combinação linear dos parâmetros:
Dado o modelo de RLM:
y  Xβ  e
Sob as premissas do Teorema de Gauss-Markov, temos que:
E (βˆ )  β e Var(βˆ )  E[(βˆ  β)(βˆ  β)T ]  (XT X) 1 2
Uma combinação linear dos parâmetros, onde cada coeficiente j seja multiplicado por
uma constante cj , seria dado por:
 
 
 
c0  c11  ...  ck  k  c0 c1 ... ck  1   cT β
...
 
 
 k
Não é difícil demonstrar que:
E(cT βˆ )  cT E(βˆ )  cT β
ou seja, uma função linear dos estimadores de MQO é um
estimador não viesado da função linear dos parâmetros
E:
a variância da função linear
Var(cT βˆ )  E[(cT βˆ  cT β)(cT βˆ  cT β)T ]  cT (XT X)1c 2 será uma grandeza escalar.

A combinação linear dos parâmetros pode ser utilizada em teste de hipóteses para
combinações dos parâmetros ou intervalos de confiança para os valores previstos.
6/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Teste t para Combinação Linear


Seja o ajuste de MQ:
Yi  ˆ  ˆ1 X 1i  ˆ2 X 2i  ...  ˆk X ki  eˆi
Suponha as seguintes hipóteses para os parâmetros 1 e 2 do modelo:
Testar a hipótese nula que 1=2 é o mesmo que testar a combinação:
H 0: 1=  2
(0)  (1) 1  (1)  2 ...  (0)  k  0  
 
H 1: 1  2  
ou, matricialmente: 0 1  1 0 ... 0 1   cT β  0
...
 ˆ   
   

  ˆ  k
A estatística de teste será: 0 1  1 0 ... 0 1   cT βˆ
...
 
 ˆ 
 k
Como combinação linear de v.a.s normais é também uma normal, teremos: cT βˆ ~ N (cT β,  2T )
c β̂
1
Onde:  cT βˆ  c (X X) c
2 T T 2

Finalmente, para resolver o teste de hipóteses:

H 0: 1= 2 cT βˆ ~ N (0,  c2T β̂ ) t


cT βˆ  0
c T ( XT X) 1 cˆ 2
tn(k 1)
H 1: 1 2
Rejeito H0 quando o valor p, p/2 p/2 p/2 p/2
probabilidade de erro ao rejeitar H0, for 0 0
suficientemente pequeno. c T βˆ t
7/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Teste t para Combinação Linear - Exemplo


Sejam os dados da relação entre renda familiar (Y), anos de estudo (X1) e idade
(X2) do responsável pela família:
Yi  1,9  1X 1i  0,06 X 2i  eˆi
Há evidências de que o efeito dos anos de estudo seja maior que o da idade?
Testar a hipótese nula que 1=2 é o mesmo que testar a combinação:
H 0 : 1 =  2
(0)  (1)1  (1)2  0
 
 
H 1: 1>  2 ou, matricialmente: 0 1  1 1   cT β  0
 
 2  ˆ   1,9 
   
E a estatística de teste será: cT βˆ  0 1  1 ˆ1   0 1  1 1   0,94
 ˆ   0,06 
 2  
Que estará normalmente distribuída e a estimativa de sua variância será:
 8,95 2,5  0,57  0 
  
1 2  0 1  1 2,5 
Sc2T βˆ  c (X X) cˆ
T T
 1 0, 2  1 0,2  0,2884
  0,57  0,2 0,042   1
  

H 0: 1= 2 cT βˆ ~ N (0,  c2T β̂ ) 0,94  0


t t1
H 1: 1> 2 0,2884

Se afirmarmos que o efeito isolado dos anos p/2 0,165


de escolaridade é superior ao da idade 0 0
0,94 1,75
estaremos sujeitos a um erro de 16,5%
8/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Intervalo de Confiança
Seja o modelo de RLM: E seu ajuste de MQ:
Yi    1 X 1i   2 X 2i  ...   k X ki  ei Yi  ˆ  ˆ1 X 1i  ˆ2 X 2i  ...  ˆk X ki  ei
A esperança condicional de Y também é uma Assim como o valor previsto da amostra é uma
combinação linear dos parâmetros: combinação linear dos estimadores:
E (Yi / X 1i ,..., X ki )    1 X 1i   2 X 2i  ...   k X ki Yˆ  ˆ  ˆ X  ˆ X  ...  ˆ X
i 1 1i 2 2i k ki
ou, matricialmente: ou, matricialmente:
   ˆ 
   
   ˆ1 

E (Yi / X 1i ,..., X ki )  xT β  1 X 1i X 2i 
... X ki  1 
...

Yˆi  xT βˆ  1 X 1i X 2i 
... X ki  
...
   
   ˆ 
 k Tˆ  k
Onde: x β ~ N (x β,  xT β̂ )
T 2

E:  x2T βˆ  xT (XT X)1 x 2


Podemos, por exemplo, realizar intervalos de confiança para previsões:
Para uma confiança igual a :
xT βˆ ~ N (xT β,  x2T β̂ )
IC[E(Yi );  ]  [x T βˆ  t xT ( XT X) 1 xˆ 2 ] tn(k 1)
Intervalo que, em reptidas amostras,  
conterá a real esperança condicional
de Y em  das situações.
x T βˆ  t xT ( XT X) 1 xˆ 2 xT ˆ  t xT ( X T X ) 1 xˆ 2 -t t
9/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança

Intervalo de Confiança para Previsão


Sejam os dados da relação entre renda familiar (Y), anos de estudo (X1) e idade
(X2) do responsável pela família:
Yi  1,9  1X 1i  0,0,6 X 2i  eˆi
Qual seria a estimativa por intervalo para a renda esperada de uma família com
responsável com nível superior completo (X1=15) e 30 anos de idade(X2=30)?
A renda prevista pelo ajuste de MQ seria:
Yˆ  1,9  1(15)  0,06(30)  18,7
i ou seja, 18,7 Salários Mínimos
Ou, matricialmente:  1,9 
 
Yi  x   1 15 30  1   18,7
ˆ T ˆ
onde: Yˆi ~ N ( E (Yi ), xT ( X T X ) 1 x 2 )
 0,06 
 
A estimativa da variância do valor previsto será:
 8,95 2,5  0,57  1 
  
S x2T ˆ  xT ( X T X ) 1 xˆ 2  1 15 30  2,5 1  0,2  15 0,2  26,51
  0,57  0,2 0,042  30 
  
Para uma confiança igual a 95%:
Yˆi ~ N ( E (Yi ),  x2T ̂ )
IC[E(Yi );0,95 ]  [6,983  0,452] t1
Estimativa do intervalo de 95% de 95% 95%
confiança para a real renda
esperada de uma família com tais -46,7 84,1
18,7  12 ,71 26,51 18,7  12 ,71 26,51
características. 10/10
Contribuição Marginal
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• ANOVA para Contribuição Marginal;
• Correlação Parcial;

Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: Conceitos e Aplicações. Cap. 9.
Definição ANOVA Correlação Parcial

Contribuição Marginal
Seja o modelo de RLS: Seja o modelo de RLM:
Y    1 X1  e Y    1 X1  2 X 2  e
Contribuição
Contribuição marginal de
marginal de Variabilidade X2 em Y
Variabilidade X1 em Y total de Y
total de Y

Variabilidade
de Y Variabilidade Variabilidade
Variabilidade explicada por total de X2
total de X1 total de X1
X1
Contribuição
conjunta de X1 e X2
sobre Y
O grau de relacionamento linear entre X1 e Y Qual a parcela da variabilidade de Y
determinará a parcela da variabilidade de Y explicada unicamente por X2?
explicada unicamente por X1. Em outras palavras, qual a contribuição
marginal de X2, depois de considerada a
contribuição de X1? 2/13
Definição ANOVA Correlação Parcial

Contribuição Marginal (q=1)


SQReg devido a X1 e X2 (Irrestrito):
SQReg(Y / X 1 e X 2 ) Y
ou SQRegir
Variabilidade de Y explicada pelo conjunto das variáveis X1 e X2. X1 X2
coeficientes angulares do modelo
Graus de liberdade: 2 Y=+1X1+2X2+e.

SQReg devido exclusivamente a X1 (Restrito):


Y
SQReg(Y / X1 ) ou SQRegr
Variabilidade de Y explicada exclusivamente por X1. X1 X2
coeficiente angular do modelo
Graus de liberdade: 1 Y=+1X1+e.

SQReg devido ao acréscimo de X2:


Y
Contribuição X 2  SQRegir  SQRegr
Variabilidade de Y explicada por X2 após considerada a
variabilidade explicada por X1. X1 X2

Graus de liberdade: 1 novo coeficiente angular incorporado no modelo (2).


3/13
Definição ANOVA Correlação Parcial

Contribuição Marginal (q=2)


SQReg devido a X1, X2 e X3 (Irrestrito):
SQReg(Y / X 1 , X 2 , X 3 ) ou SQRegir Y

Variabilidade de Y explicada pelo conjunto das variáveis


X1, X2 e X3: X1 X2
Graus de liberdade: 3 coeficientes angulares do modelo
Y=+1X1+2X2+3X3+e X3

SQReg devido exclusivamente a X1 (Restrito):


Y
SQReg(Y / X1 ) ou SQRegr
Variabilidade de Y explicada exclusivamente por X1 X1 X2

Graus de liberdade: 1 coeficiente angular do modelo Y=+1X1+e. X3

SQReg devido ao acréscimo de X2 e X3: Y


Contribuição de X 2 e X 3  SQRegir  SQRegr
Variabilidade de Y explicada por X2 e X3 após considerada a X2
variabilidade explicada por X1 X1

Graus de liberdade: 2 novos coeficientes angulares incorporados X3


no modelo (2 e 3). 4/13
Definição ANOVA Correlação Parcial

Teste de Restrição aos Parâmetros


Seja o modelo irrestrito de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para verificarmos se a contribuição de um grupo de q variáveis independentes é
significativa no modelo irrestrito devemos, primeiro, elaborar um modelo com restrição
aos parâmetros. Suponha que, por simplicidade, as q variáveis que desejamos testar são
as últimas das k variáveis do modelo irrestrito (a ordem, obviamente, não faz
importância). Nosso modelo restrito seria:
Y    1 X1   2 X 2  ...   k q X k q  e
Em outras palavras, estaríamos interesados em testar a hipótese nula de que os q
coeficientes do modelo irrestrito são nulos:
H 0 :  k q1  0, ...,  k  0
O teste estatístico para restrição aos parâmetros consiste em verificar se a contribuição
marginal dessas q variáveis é significativa . A estatística F será dada por:
( SQ Re g ir  SQ Re g r ) / q ( SQ Re sr  SQ Re sir ) / q
F ou F 
SQ Re sir /( n  k  1) SQ Re sir /( n  k  1)
Onde SQRegir e SQRegr são, respectivamente, a soma dos quadrados da regressão sem e
com restrição nos parâmetros, SQResir é a soma dos quadrados dos resíduos da regressão
sem restrição. 5/13
Definição ANOVA Correlação Parcial

ANOVA para Contribuição Marginal


Fonte gl Soma dos Quadrados F
Quadrados Médios

Regressão Restrita k -q SQRe g r SQ Re gr /(k  q)

QMRegcontribuiç ão
Contribuição q SQ Re gir  SQ Re g r (SQ Re gir  SQ Re g r ) F  QMResir
q

QMRegir
Regressão Irrestrita k SQ Re g ir SQ Re gir / k F
QMResir

Resíduos n - (k  1) SQ Re sir SQ Re sir /( n  k  1)

Total n-1 STQ

6/13
Definição ANOVA Correlação Parcial

Teste F para Contribuição Marginal


Seja o modelo de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para testarmos a contribuição marginal de um grupo de q variáveis, teremos as
hipóteses:

H0: k–q+1=...=k =0 (não contribui)


H1: Pelo menos um j 0 (contribui) F ~ Fq,n-k 1

A estatística de teste será Considerando


H0 verdadeiro, a
(SQRegir - SQRegr )/q fdp de F será...
F p
SQResir /(n - k  1)
F
Rejeitar H0 significa afirmar que o grupo de q variáveis contribui para explicar Y, ou
seja, há relação significativa entre pelo menos uma destas variáveis explicativa e a
variável dependente.

7/13
Definição ANOVA Correlação Parcial

Contribuição Marginal - Exemplo


Na relação entre renda familiar (Y), anos de estudo (X1) e idade (X2) do
responsável pela família, a contribuição marginal da idade é significativa?
Modelo Irrestrito: Yi  1,9  1X 1  0,06 X 2  eˆi 34,714
Y
0,086
i i

Modelo Restrito: Yi  2,714  1,286 X 1  eˆi


i
X1 X2
Soma dos Quadrados
Fonte gl F
Quadrados Médios
SQ Re g cont / 1
Regressão Restrita
Irrestrita 1
2 34.174
34.800 34.174
17.400 87.000 ~F1,1
SQ Re s/ 1
Contribuição
Regressão Marginal
Resíduos Irrestrita 1
2 0.086
34.800
0.200 0.086
17.400
0.200 0.430
87.000
Regressão
Resíduos
Total Irrestrita 2
1
3 34.800
0.200
35.000 17.400
0.200 87.000
Resíduos
Total 1
3 0.200
35.000 0.200 0,631
Total 3 35.000
F  0,430

Não há evidências para afirmar que a contribuição marginal da idade sobre a


variabilidade da renda familiar seja significativa. A probabilidade de erro ao fazermos
tal afirmação é muito alta, de aproximadamente 63%.
8/13
Definição ANOVA Correlação Parcial

Correlação Parcial - Definição


Seja o modelo de RLM:
Yi    β 1 X 1i  ...  β k X ki  ei
Da mesma forma que análise de variância permite considerar a contribuição
marginal de uma variável explanatória, podemos estender o conceito de correlação
simples para ver em que medida a variável dependente e uma das variáveis
independentes estão relacionadas, depois de isolados os efeitos das demais
variáveis explanatórias do modelo:

rY 1.23...k
O rY1.23...k é a correlação parcial entre Y e X1, mantendo-se constantes os efeitos das
k–1 variáveis independentes restantes. Seu quadrado, r2Y1.23...k é o respectivo
coeficiente de determinação parcial.

9/13
Definição ANOVA Correlação Parcial

Correlação Parcial - Conceito


Seja o modelo de RLM: Y    1 X1  2 X 2  e
Para calcularmos rY1.2, poderíamos seguir os seguintes passos:
Passo 1) Estimar resíduos do ajuste: Y  ˆ0  ˆ1 X 2  eˆ y 2
êy2 contém a parcela de Y não associada a X2.
Passo 2) Estimar resíduos da relação: X 1 ˆ0  ˆ1 X 2  eˆ12
ê12 contém a parcela de X1 não associada a X2.
Passo 3) Estimar correlação entre
os resíduos dos dois modelos:
rY1.2  reˆY 2eˆ12

Y Y r2y1.2
Y

X2 X2
X1 X1 X2
X1

10/13
Definição ANOVA Correlação Parcial

Correlação Parcial - Cálculo


Coeficiente de Correlação Parcial
No caso de duas variáveis independentes:
Y    1 X1  2 X 2  e
Então a correlação parcial poderá ser diretamente obtida por:
rY 1  rY 2 r12 rY 2  rY 1r12
rY1.2  e rY2.1 
(1  r122 )(1  rY22 ) (1  r122 )(1  rY21 )
Analogamente, o coeficiente de determinação parcial será dado por:

R 2  rY22
r 2
Y1.2 
1  rY22

11/13
Definição ANOVA Correlação Parcial

Correlação Parcial - Exemplo


Vamos considerar a relação para a renda (Y) como função dos anos de
estudo (X1) e idade (X2).
Y    1 X1  2 X 2  e Yi  1,9  1X 1i  0,06 X 2i  eˆi
Para calcularmos a correlação parcial entre renda e anos de estudo (rY1.2),
podemos seguir os seguintes passos:
Passo 1) Estimar resíduos do ajuste: Y  2,714  1,286 X 2  eˆ y 2
Passo 2) Estimar resíduos da relação: X 1 2,5  0,2 X 2  eˆ12
Passo 3) Estimar correlação entre rY 1.2  reˆY 2eˆ12  0,913
os resíduos dos dois modelos:

Y Y r2y1.2=0,833
Y

X2 X2
X1 X1 X2
X1
12/13
Definição ANOVA Correlação Parcial

Correlação Parcial - Exemplo


Vamos considerar a relação para a renda (Y) como função dos anos de
estudo (X1) e idade (X2).
Y    1 X1  2 X 2  e Yi  1,9  1X 1i  0,06 X 2i  eˆi
Podemos ainda calcular a correlação parcial entre renda e anos de estudo
(rY1.2) diretamente por:
rY 1  rY 2 r12 (0,9959)  (0,9827)(0,9757)
rY1.2    0,913
(1  r12 )(1  rY 2 )
2 2
[1  (0,9759) ][1  (0,9827) ]
2 2

Onde:
 xy
n
27
rY 1  i 1 1i
  0,9959
i

 x y
n n
2 2 ( 21 )( 35 )
i 1 i
1 i 1 i

 x y
n
130
rY 2  i 1
  0,9827
2i i

 x  y
n n
2 2 ( 500 )( 35 )
i 1 2i i 1 i

 xx
n
100
r12  i 1 1i 2 i
  0,9759
 x x
n n
2 2 ( 21 )( 500 )
i 1 1i i 1 2i 13/13
Multicolinearidade
Econometria
Alexandre Gori Maia

Ementa:
• Definição;
• Fator Inflacionário da Variância;
• Identificação: Estatística Conflitantes e Ajsute entre Regressores;
• Medidas Paliativas;

Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 10.
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Conceito
Seja o modelo definido por: Y    1 X1i  2 X 2i  ei
Variabilidade de Variabilidade Se X1 e X2 são independentes, a
Y explicada por de Y explicada variabilidade de Y explicada pelo modelo
X1 (SQReg1) Variabilidade por X2
de RLM divide-se em duas partes
total de Y (SQReg 2 )
disjuntas: o efeito isolado de X1 (SQReg1)
e o efeito isolado de X2 (SQReg2).
Variabilidade Teríamos ainda os mesmos coeficientes
Variabilidade total de X2 angulares das regressões simples:
total de X1
Y  1  1 X1i  e1i SQ Re g1
Y   2  2 X 2i  e2i SQ Re g 2
Variabilidade No outro extremo, poderíamos ter uma
total de Y
relação linear exata entre X1 e X2 (perfeita
colinearidade), ou seja:
Efeito
conjunto de X1i  2 X 2i
Variabilidade X1 e X2
X Nesta situação, seria impossível estimar
conjunta 1de X1 sobre Y
e X2 os efeitos isolados de X1 e X2 sobre Y.
2/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Conceito
Seja o modelo definido por: Y    1 X1i  2 X 2i  ei
Frequentemente observamos relação entre
Efeito Efeito
Variabilidade
isolado de isolado de as variáveis independentes X1 e X2 e,
total de Y
X1 em Y X2 em Y nesses casos, oefeito sobre Y poderá ser
dividido em 3 partes: i) efeito isolado de
X1; ii) isolado de X2; e iii) efeito conjunto
Variabilidade de X1 e X2.
Variabilidade total de X2
total de X1 O problema é que quando há uma forte
relação linear entre X1 e X2
Efeito conjunto de (multicolinearidade) pode ficar muito
X1 e X2 sobre Y difícil identificar os efeitos isolados de X1
Efeito
Efeito
isolado de
isolado de
e X2 sobre Y. Ou seja, a maior parcela da
X1 em Y Variabilidade
total de Y X2 em Y variabilidade de Y é explicada pelo efeito
conjunto de X1 e X2.
Efeito
Algebricamente, essa relação de
conjunto de multicolinearidade seria dada por:
X2
X1 X1 e X2 X1i  2 X 2i  vi
sobre Y
3/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Definição
Colinearidade Perfeita
Duas variáveis são ditas perfeitamente colineares quando há uma relação linear
exata entre essas. De maneira genérica, podemos representar a linearidade perfeita
por: X j  1 X 1  2 X 2  ...  k X k
i i i i

Multicolinearidade
Há multicolinearidade em um modelo de regressão múltipla quando duas ou mais
variáveis independentes são fortemente relacionadas linearmente entre si. Nesse
caso, teríamos: X j  1 X 1  2 X 2  ...  k X k  vi
i i i i

Conseqüências da Multicolinearidade
A existência de uma colinearidade exata entre duas ou mais variáveis
independentes torna impossível a obtenção dos coeficientes dos parâmetros por
MQO. Por sua vez, na presença de muiltcolinearidade os estimadores de MQO
continuam sendo os MELNV. O problema é que a multicolinearidade torna muitas
vezes as estimativas dos coeficientes dos parâmetros (’s) insignificantes, já que
cada um pressupõe, por definição, a variação em Y dada uma variação unitária em
X, mantendo-se constantes as demais informações. Ou seja, se duas variáveis
independentes são fortemente correlacionadas, tornár-se-á muito difícil haver
variação em uma sem que haja em outra. 4/11
Definição FIV Identificação Medidas Paliativas

Fator Inflacionário da Variância


Sabemos que a variância dos estimadores será:
Var (βˆ )  ( XT X) 1 2
Var(ˆ j )
Alternativamente, podemos chegar às
estimativas das variâncias individuais por:
2 2 1 2
Var( ˆ j )  n 2  n  FIV j
i 1 x ji (1  R j ) i 1 x ji 
2 (1  R 2 ) n
2
j x2
i 1 ji

Onde R2j é o coeficiente de


determinação do ajuste: R 2j
X ji  0  1 X1i  ... k 1 X ki  vi

Fator Inflacionário da Variância - FIV


Representa o quanto a variância de ^j está sendo inflacionada pela relação de
multcolinearidade entre Xj e as demais variáveis independentes. Quando não houver relação
entre as variáveis independentes (R2j =0) o FIVj será igual a 1 e, à medida que aproximamo-
nos de uma relação exata (R2j =1), o FIVj tenderá a infinito.

5/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Identificação
Alguns sinais de multicolinearidade:
Conflito entre estatísticas R2 e F do modelo e testes t para os parâmetros : as
estatísticas R2 e F podem indicar um modelo significativo, enquanto os testes t dos
parâmetros ´s seriam insignificantes.
Y    1 X1i  2 X 2i  ei H 0 : 1   2  0 X H 0 : 1  0 e H 0 :  2  0

Ajuste linear significativo entre as variáveis independentes: uma das variáveis


independentes apresentaria forte relação de linearidade com as demais.
X ji  0  1 X1i  ... k 1 X ki  vi R 2j
Fator Inflacionário da Variância: uma consequência de uma relação linear forte
entre um dos regressores e os demais será um elevado valor para o respectivo FIV.
R 2j FIVj

6/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Exemplo
Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
CO2 1.5 8.7 2.8 9.4 4.4 8.4 3.2 0.9
PIB 13.2 197.0 128.6 286.4 72.6 167.8 114.4 58.0
Pop 3.2 35.5 19.1 40.4 3.1 22.3 8.4 9.0
O ajuste de MQO forneceu os seguintes resultados para o modelo:
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Para a tabela ANOVA:
Fonte gl SQ QM F p CO2
Regressão 2 63.9 31.9 8.80 0.023
Resíduos 5 18.2 3.6
PIB Pop
Total 7 82.0
E para os testes t dos coeficientes:
Embora o ajuste seja significativo no
Variável ^ S^ t p
conjunto (teste F), as contribuições
Intercepto 0.472 1.328 0.356 0.737 marginais de cada variável são
PIB 0.030 0.025 1.226 0.275 insignificantes. Resultados que sugerem
a presença de multicolinearidade.
Pop 0.028 0.150 0.183 0.862 7/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Exemplo
Para nos certificarmos da presença de multicolinearidade, relacionamos os
regressores PIB e Pop:
O ajuste de MQO forneceu os seguintes resultados para a relação entre os regressores:

PIB  0  1 Pop  v PIB  29,2  5,7 Pop  vˆ

Os resultados da tabela ANOVA:


Fonte gl SQ QM F p
Regression 1 46.871,2 46.871,2 47,88 0,0005 PIB Pop
Residual 6 5.873,5 978,9
Total 7 52.744,6
2
RPIB  0,889
Podemos ainda calcular o FIV por:
1 1 Há multicolinearidade nos regressores, o que
FIV    8,98
(1  R j )
2
(1  0,889 ) estaria dificultando a identificação dos impactos
isolados dos regressores. O FIV é 9 vezes
superior ao que seria na ausência de relação
entre os regressores.
8/11
Definição FIV Identificação Medidas Paliativas

Multicolinearidade - Correção
Alguma medidas paliativas na presenção de multicolinearidade:
Aumentar o tamanho da amostra: aumentando o tamanho da amostra estaremos
aumentando a variabilidade de Xj e, conseqüentemente, reduzindo a variância do
estimador de j.
 2

Y    1 X1i  2 X 2i  ei Var ( ˆ j )  n FIV j


i1 x j
2
i

Tranformar as variáveis: a multicolinearidade pode ser eliminada a partir de


funções das variáveis independentes.
Y    1 X1i  2 X 2i  ei Y   0   0 Z i  ui onde Zi  f ( X1i , X 2i )

Omitir regressor que apresentar alta colinearidade com os demais: uma


solução simples, mas perigora, é excluir uma ou mais variáveis que apresentam
multicolinearidade. A exclusão de variáveis essenciais para compreensão do
problema pode, entretanto, gerar viés de especificação.
Y    1 X1i  2 X 2i  ei Y    1 X1i  ei

9/11
Definição FIV Identificação Medidas Paliativas

Correção Multicolinearidade - Exemplo


Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
O ajuste de MQO nos forneceu os seguintes resultados :
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor um novo ajuste:
CO 2 PIB CO 2 PIB
 0  1 v  0,123  0,058  vˆ
Pop Pop Pop Pop
Os resultados da ANOVA seriam: CO2/
Fonte gl SQ QM F p Pop

Regressão 1 0,96 0,96 20,1 0,004


R2  0,77
Resíduos 6 0,29 0,05 PIB/
Total 7 1,25 Pop

O ajuste é significativo. Como se trata de um modelo de RLS, a significância do


teste t será igual à da estatística F.
10/11
Definição FIV Identificação Medidas Paliativas

Correção Multicolinearidade - Exemplo


Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
O ajuste de MQO nos forneceu os seguintes resultados :
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor a exclusão de uma das variáveis:
CO 2  β0  β1 PIB  e CO2  0,401 0,035PIB  eˆ

Os resultados da ANOVA seriam:


CO2
Fonte gl SQ QM F p
Regressão 1 63,77 63,77 20,93 0,004
Resíduos 6 18,28 3,05
PIB
Total 7 82,05

Como pode-se comparar, as estimativas do segundo modelo são apenas ligeiramente


tendenciosas. E a relação entre CO2 e PIB passou a ser significativa. A decisão ideal
deveria, entretanto, basear-se em pressupostos teóricos sobre a forma de
relacionamento das variáveis... 11/11
Variáveis Binárias
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Variáveis binárias para representar 2 ou k categorias nominais;
• Variáveis binárias em equações semi-logarítmicas;
• Coeficientes angulares interativos;
• Regressão poligonal;
• Teste de mudança estrutural;

Bibliografia:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 11.
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural

Variáveis Binárias - Definição


1) Escala Nominal: Valores representam categorias (nomes). Não se pode falar que um seja
maior que o outro. Exemplo: sexo.

2) Escala Ordinal: Valores representam uma hierarquia de posições. Não se pode, entretanto,
falar quão maior é um valor em relação a outro. Exemplo: classe social.
3) Escala Intervalar: Valores representam ordem e é possível mensurar intervalo entre eles.
Não se pode, entretanto, dizer quantas vezes um é maior que outro.
Exemplo: ano.
4) Escala de razão: Valores representam ordem, é possível mensurar intervalo entre eles e
quantificar grandezas em uma escala de razão. Exemplo: renda.

Variável Binária
Uma variável binária (variável dummy) pode representar dois estados possíveis::
0, ausência da característica de interesse (Fracasso)
X 1, presença da característica de interesse (Sucesso)
Podemos, assim, estimar a influência de variáveis explicativas (independentes) nominais ou
ordinais em modelo de regressão, da mesma maneira que fazemos com variáveis
quantitativas de escala intervalar ou de razão.
2/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural

Variáveis Binárias - Exemplo


Seja a relação para o número de filhos e TV a cabo no domicílio:
Podemos inicialmente supor que o no de filhos
esteja associado à escolaridade da mãe.
famílias sem TV

NFilhos = 0 + 1 AnosEst + e
Agora seja a variável binária:
famílias com TV
0 = Não tem TV
Tem TV a cabo?
1 = Tem TV
Por que não considerar dois ajustes?
N FIlhos i) para famílias sem TV a cabo;
ii) para famílias com TV a cabo;
Este problema pode ser simplificado por um
modelo de regressão linear múltipla:

NFilhos = 0 + 1 AnosEst + 2 TV + e
TV Anos Est

3/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural

Variáveis Binárias - Exemplo


Seja a relação entre número de filhos (Y), anos de estudo da mãe (X1) e se tem TV
a cabo no domicílio (X2): Yi    1 X 1i   2 Di  ei
Dados da amostra :
y  Xβˆ  eˆ Espera-se, para mulheres
com TV a cabo no
 0   1 15 1  ˆ  eˆ1 
       domicílio, em média 1,45
 2  1 8 1 ˆ    eˆ2  filhos a menos que
   
 4   1 5 0  1  eˆ  mulheres sem TV,
    ˆ   3 
 6   1 3 0  2   eˆ  independente dos anos
     4 de escolaridade.

ˆ  ( XT X) 1( XT y )
Aplicando MQO: β
1 Como:
 1 15 1    0 
 1 1 1 1    1 1 1 1   Yi  6,36  0,34 X i  1,45 Di  eˆi
1 8 1   15 8 5 3  2 
βˆ  15 8 5 3    4 
 1 5 0  Teremos que:
 1 1 0 0  
  1 1 0 0   Quando D=0 (sem TV)
 1 3 0    6 
1
Yi  6,36  0,34 X i  eˆi
 4 31 12   12   6,36 
      Quando D=1 (com TV)
ˆβ   31 323 23   54     0,34 
12 23 2   2   - 1,45 
Yi  (6,36  1,45)  0,34 X i  eˆi
      4/16
Categorias Equações Semi-
Definição Aplicações Mudança Estrutural
Nominais Logarítmicas

Nominais com Múltiplas Categorias


Para representarmos duas categorias nominais (A e B), precisamos de apenas uma
variável binária D. A referência da análise será dada por D=0. Exemplo:
Yi    1 X i   2 Di  ei Categoria Di
Y A
O coeficiente  indicaria quanto Y seria, em B
2 A 1
média, maior (ou menor) para a categoria A 2
B 0
(D=1) que a categoria de referência B (D=0),
 X
independente do valor de X.
Para A: Yi  (   2 )  1 X i  ei
Para B: Yi    1 X i  ei
Para representarmos k categorias nominais, precisamos de k–1 variáveis binárias D’s.
A referência da análise será dada por uma das categorias. Exemplo, supondo k=3:
Yi    1 X i   2 D1i   3 D2i  ei A
O coeficiente 2 indicaria quanto Y seria, em Categoria D1i D2i Y B
média, maior para a categoria A (D1=1) que a A 1 0
2
C
categoria de referência C (D1=0 e D2=0), B 0 1 3
independente do valor de X. O coeficiente 3 C 0 0
indicaria quanto Y seria, em média, maior para  X
a categoria B (D2=1) que a categoria de
Para A: Yi  (   2 )  1 X i  ei
referência C. Pois teríamos:
Para B: Yi  (  3 )  1 X i  ei
Para C: Yi    1 X i  ei 5/16
Categorias Equações Semi-
Definição Aplicações Mudança Estrutural
Nominais Logarítmicas

Múltiplas Categorias - Exemplo


Sejam os dados amostrais para renda (Y), anos de estudo (X) e posição na
ocupação:
Dadas as binárias:
Yi Xi Posição Ocupação D1i D2i 
1, se Autônomo 1, se Empregador
100 0 Empregado 0 0 D1i   D2i  

0, c.c. 0, c.c.
200 4 Empregado 0 0
Terermos o ajuste:
400 8 Empregado 0 0
400 4 Autônomo 1 0 Yi    1 X i   2 D1i   3 D2i  ei
500 8 Autônomo 1 0 Por MQO:  100  1 0 0 0  eˆ1 
     
600 0 Empregador 0 1  200  1 4 0 0     eˆ2 
ˆ
 
 400  1 0  ˆ1   eˆ3 

Yi  (93,3  506,7)  35 X i y  Xβˆ  eˆ  
8 0
  
  400  1 4 1  ˆ 
0  2  eˆ4 
Yi  (93,3  146,7)  35 X i  500  1     
    8 1 0  ˆ3   eˆ5 
Yi  93,3  35 X i  600  1
E:    0 0 1   eˆ 
 6
βˆ  ( XT X) 1( XT y )
1
 6 24 2 1   2200   93,3 
Independente dos anos de escolaridade, o      
 24 160 12 0   9600   35 
rendimento médio dos autônomos seria 146,7 βˆ   
reais superior ao dos empregados e o dos 2 12 2 0   900   146,7 
     
empregadores 506,7 superior. 1 0 1   600   506,7 
   
 0 6/16
Categorias Equações Semi-
Definição Aplicações Mudança Estrutural
Nominais Logarítmicas

Equação de Rendimentos - Exemplo


Sejam os dados amostrais para 164 mil ocupados no Brasil em 2011:
Considerando inicialmente o modelo:
rendai    1anosesti   2idadei  ei
Discriminando por sexo pela binária:
feminino  1, se mulher; 0 se homen
Discriminando por cor pelas binárias
Discriminando por cor pela binária:
(cor preta como referência):
branca  1, se cor branca; 0 c.c.
parda  1, se cor parda; 0 c.c.
amarela  1, se cor amarela; 0 c.c.
Discriminando por região pelas binárias
(região Sul como referência):
no  1, se região norte; 0 c.c.
ne  1, se região nordeste; 0 c.c.
se  1, se região sudeste; 0 c.c.
co  1, se região centro  oeste; 0 c.c. 7/16
Equações Semi-
Definição Categorias Nominais Aplicações Mudança Estrutural
Logarítmicas

Binárias em Equações Semi-Logarítmicas


Seja a equação semi-logarítmica:
ln (Yi )    βDi  ui   βDi ui
Yi  e
ln(Y)

 +  e + 


e

0 1 D 0 1 D
• Seja Y1 o valor de Y para D=1 e Y0 o valor para D=0;
• Para obtermos a variação relativa em Y quando comparamos D=0 e D=1:

Para D=0: Para D=1: Então:


ln(Y0 )   ln(Y1 )     Y1  Y0 e e   e Y1  Y0
  e 1
Y0  e Y1  e   Y0 e Y0
8/16
Equações Semi-
Definição Categorias Nominais Aplicações Mudança Estrutural
Logarítmicas

Equação de Rendimentos - Exemplo


Sejam os dados amostrais para 164 mil ocupados no Brasil em 2011:
Considerando agora o modelo:
ln( rendai )    1anosesti   2idadei  ei
Em relação aos homens, a variação
relativa da renda para as mulheres seria:
e0,44332  1  0,3581
Em relação aos ocupados de cor preta, as
variações relativas para as cores seriam:
branca: e0,14130  1  0,1518
parda: e-0,0086  1  0,0086
amarela: e0,2228  1  0,2495
Em relação aos ocupados da região SU, as
variações relativas para as regiões seriam:
NO: e-0,1621  1  0,1497
NE: e-0,3706  1  0,3097
SE: e-0,0046  1  0,0046
CO: e0,0758  1  0,0788 9/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural

Variáveis Binárias - Aplicações


Rnd   0  1 AnosEst   2 Masc  e
Rnd Homens
Esse modelo pressupõe deslocametos da função de
Mulheres
2
rendimentos (0) mas retornos marginais da escolaridade (1)
iguais para homens e mulheres.
0 AnosEst
Rnd   0  1Masc   2 AnosEst  3 Masc  AnosEst  e
Rnd
Mulheres Esse modelo pressupõe desolocamentos da função de
Homens rendimentos (0) e retornos marginais da escolaridade
2 diferentes para homens (2+3) e mulheres (2).
0 AnosEst
Rnd   0  1 AnosEst   2 ( AnosEst  X *) D  e
Rnd
1+2 Nesse modelo a variável binária é utilizada para captar
mudanças na inclinação entre segmentos consecutivos de X.
1
0
X*
AnosEst

10/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural

Coeficientes Angulares Interativos


Sejam os dados amostrais para renda (Y), anos de estudo (X) e sexo dos ocupados:
Yi Xii Sexo Di DiXi Dado o ajuste:
1, se Homem
100 0 Mulher 0 0 Yi    1 X i   2 Di  3 Di X i  ei onde Di  
250 4 Mulher 0 0 0, c.c.
300 8 Mulher 0 0 Aplicando MQO teremos:
 100  1 0 0 0  eˆ1 
200 0 Homem 1 0      
 250  1 4 0 0  ˆ   eˆ2 
y  Xβˆ  eˆ
400 4 Homem 1 4
 300  1     
500 8 Homem 1 8 8 0 0  ˆ1  eˆ3
  
 ˆ   
  200  1 0 1 0   2  eˆ4 
Yi  (116,7  100)  (25  12,5) X i  400  1     
   4 1 4  ˆ3   eˆ5 
  500  1 8   eˆ 
Yi  116,7  25 X i    8 1  6
E as estimativas serão dada por:
βˆ  ( XT X) 1( XT y )
1
 6 24 3 12   1750  116,7 
Independente dos anos de escolaridade, o      
rendimento médio dos homens seria 100 reais ˆβ   24 160 12 80   9000  

25 
superior ao das mulheres. O retorno marginal da
 3 12 3 12   1100   100 
     
escolaridade para os homens seria ainda, em média,  12 80 12 80   5600   12,5 
12,5 reais superior ao das mulheres.
    11/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural

Regressão Poligonal - Exemplo


Sejam os dados amostrais para renda (Y) e anos de estudo (X):
Yi Xi Di (Xi-8)Di Supondo que o retorno marginal da escolaridade na
100 0 0 0 mude a partir do segundo grau (X>8), teríamos:
250 4 0 0 1, se X i  8
300 8 0 0
Yi    1 X i   2 ( X i  8) Di  ei onde Di  
0, c.c.
450 10 1 2 Aplicando MQO:
 100  1 0 0   eˆ1 
700 13 1 5
y  Xβˆ  eˆ      
800 15 1 7  250  1 4 0  ˆ  eˆ2 
        
Yi  116,6  25,1X i  46,2( X i  8)  300   1 8 0  ˆ    eˆ3 
 1
 450  1 10 2  ˆ   eˆ4 
 700  1 13 5   2   eˆ 
     5
  800  1 15 7   eˆ 
Y  116,6  25,1X      6
i i
As estimativas de MQO seriam:
8 βˆ  ( XT X) 1( XT y )
1
Espera-se, para cada ano de escolaridade, uma  6 50 14   2600  116,6 
     
βˆ   50 574 190   29000    25,1 
variação marginal de 25,1 reais na renda. Acrescenta-
se, ainda, 46,2 reais nessa variação para cada ano
 14 190 78   10000   46,2 
adicional a partir do 2º grau (8 anos ou mais de      
escolaridade) 12/16
Equações Semi- Mudança
Definição Categorias Nominais Aplicações
Logarítmicas Estrutural

Teste de Mudança Estrutural


Seja as seguintes hipóteses para a relação entre Y, X e a binária D:
Yi   0  1Di   2 X i  3 Di  X i  ei
D=1
Y D=1 eY D=1 Y Y D=0
D=0 D=0 D=1
D=0
1  0 e 3  0 1  0 e 3  0 1  0 e 3  0 1  0 e 3  0

X X X X
Regressões Regressões Regressões Regressões
Coincidentes Paralelas Concorrentes Dissimilares

H 0 : 1  3  0

Testar se há mudança estrutural significa testar
se pelo menos um dos coeficientes 1 ou 3 é 
diferente de zero: H1 : 1 e / ou 3  0

Y
Esse teste corresponde à contribuição marginal
das variáveis associadas aos coeficientes 1 e 3.
X D

D.X
13/16
Equações Semi- Mudança
Definição Categorias Nominais Aplicações
Logarítmicas Estrutural

Teste de Mudança Estrutural


SQReg devido a X, D e D.X (Irrestrito):
SQ Re g (Y / X , D, D  X ) ou SQ Re g ir Y

Variabilidade de Y explicada pelo conjunto das variáveis X, D e D.X


X D
Graus de liberdade: 3 coeficientes angulares do modelo
Y=+1D+2X+3D.X+e D.X

SQReg devido exclusivamente a X1 (Restrito):


Y
SQ Re g (Y / X ) ou SQRe g r
Variabilidade de Y explicada exclusivamente por X X D

Graus de liberdade: 1 coeficiente angular do modelo Y=+2X+e. D.X

SQReg devido ao acréscimo de X2: Y


Contribuição X 2  SQ Re gir  SQ Re g r
Variabilidade de Y explicada por D e D.X após considerada a D
variabilidade explicada por X X

Graus de liberdade: 2 novos coeficientes angulares incorporados D.X


no modelo (1 e 3). 14/16
Equações Semi- Mudança
Definição Categorias Nominais Aplicações
Logarítmicas Estrutural

Contribuição Marginal - Definição


Seja o modelo irrestrito de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para verificarmos se a contribuição de um grupo de q variáveis é significativa no modelo
devemos, primeiro, elaborar um modelo com restrição aos parâmetros . Suponha que, por
simplicidade, as q variáveis que desejamos testar são as últimas das k variáveis do
modelo irrestrito (a ordem, obviamente, não faz importância). Nosso modelo restrito
seria:
Y    1 X1   2 X 2  ...   k q X k q  e
Em outras palavras, estaríamos interesados em testar a hipótese nula de que os q
coeficientes do modelo irrestrito são nulos:
H 0 :  k q1  0, ...,  k  0
O teste estatístico consiste agora em verificar se a contribuição marginal dessas q variáveis
é significativa . A estatística F será então dada por:
( SQ Re g ir  SQ Re g r ) / q ( SQ Re sr  SQ Re sir ) / q
F ou F 
SQ Re sir /( n  k  1) SQ Re sir /( n  k  1)
Onde SQRegir e SQRegr são, respectivamente, a soma dos quadrados da regressão sem e
com restrição nos parâmetros, SQResir é a soma dos quadrados dos resíduos da regressão
irrestrita. 15/16
Equações Semi- Mudança
Definição Categorias Nominais Aplicações
Logarítmicas Estrutural

Mudança Estrutural - Exemplo


Sejam os dados amostrais para renda (Y), anos de estudo (X) e sexo dos ocupados:
Yi Xi Sexo Di DiXi Dado o modelo:
1, se Homem
100 0 Mulher 0 0 Yi    1 X i   2 Di  3 Di X i  ei
onde Di  
250 4 Mulher 0 0 0, c.c.

Para testar a hipótese de mudança H 0 :  2  3  0


300 8 Mulher 0 0

H1 :  2 e / ou 3  0
200 0 Homem 1 0
estrutural: 
400 4 Homem 1 4
Teremos, para o modelo irrestrito:
500 8 Homem 1 8
Yi  116,7  25 X i  100 Di  12,5Di X i  eˆi
SQRegir  98750 e SQResir  3333,3
E para o modelo restrito:
Yi  166,7  31,25 X i  eˆi
SQRegr  62500 e SQResr  9895,8
E a estatística de teste será:
( SQ Re g ir  SQ Re g r ) / 2 (98750  62500 ) / 2
F   10,875
SQ Re sir /( n  4) 3333,3 / 2
Onde o valor p associado a 10,875 em uma distribuição F com 2 graus de liberdade no numerador e 2 no
denominador é de 0,084. Ou seja, se afirmarmos que há mudança estrutural em relação ao sexo
estaremos sujeito a uma probabilidade de erro de 8,4%. 16/16
Heterocedasticidade
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Identificação: Análise Gráfica, Goldfeld-Quandt, Breusch-Pagan, White;
• Correção: MQP e MQGF;
• Estimadores Robustos para a Variância;

Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12..
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Modelo Clássico de Regressão Linear


1) Relação Linear entre X e Y:
O ajuste só é válido para relações lineares.
Modelo Clássico de Regressão Linear

2) Os valores de X são fixos em repetidas amostras, não aleatórios:


Quem varia é o regressando, o regressor é fixo e dado, qualquer que seja a
amostra. Fazemos a pressuposição que dado um valor de X, Y irá variar
segundo uma distribuição de probabilidade com valor esperado dado por E(Y|Xi).

3) Esperança condicional dos erros igual a zero, ou seja, E(e|xi)=0:


É a mesma coisa afirmar que E(Y|xi)=xi´b.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=s2
Os erros são homocedásticos, ou seja, sua variância é a mesma para qualquer X.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0:
Não há relação entre valores ordenados dos erros segundo tempo ou espaço.
6) Os erros apresentam distribuição normal:
Não é um pressuposto necessário para que os estimadores de MQO sejam
MELNV, mas necessário para que as inferências sejam válidas.
2/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Heterocedasticidade - Definição
Homocedasticidade:
A variância dos erros e, condicional aos valores das variáveis explanatórias, será
constante.
Var(ei / X 1i , X 2i ,..., X ki ) = s 2
Heterocedasticidade:
A variância dos erros será diferente para cada valor condicional de Xji.
Var (ei / X1i , X 2i ,..., X ki ) = s i2

Homocedasticidade Heterocedasticidade
Y Y

E(Y2) E(Y2)
Var(e2)=s2
E(Y1) E(Y1) Var(e2)=s22
Var(e1)=s2
Var(e1)=s21
X1 X2 Xj X1 X2 Xj 3/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Heterocedasticidade - Causas
Principais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente
tendência à heterocedasticia. Por exemplo, renda e poupança.
Yi = a + bX i + ei Var(ei ) = s i2
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar
a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser
devida à omissão de importantes variáveis no modelo.
Yi = a + bX i + ei Yi = a + b1 X i + b 2 X i2 + ei
- Transformação dos dados: a transformação das variáveis (por exemplo,
proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo
ao invés de linear) pode eliminar a heterocedasticidade.
Yi = a + bX i + ei ln(Yi ) = a + b ln( X i ) + ei

4/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Heterocedasticidade - Consequências
Ineficiência dos Estimadores de MQO
Na presenção de heterocedasticidade nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja b^ o estimador de
MQO, então existe outro estimador b^* tal que:
Var ( bˆ *) < Var ( bˆ )
Homocedasticia Heterocedasticia
Intervalo de
Y Variação das
Intervalo de Y Intervalo de
Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO

Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
5/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Heterocedasticidade - Consequências
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da heterocedasticidade é o fato de as estimativas dos
erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para
amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes
será viesada. Em outras palavras, na presença de heterocedasticidade teremos:
E (S b2ˆ ) ¹ Var( bˆ )
Seja o modelo: Yi = a + bX i + ei
não viesado na ausência de
åi=1 xi yi
n
ŝ 2
Pelo MQO: b̂ = e S b2ˆ = heterocedasticidade e
åi=1 xi2
n
å
n 2
i =1
xi viesado na sua presença

No caso de s2
Var (ei ) = s 2 Var ( bˆ ) =
åi=1 xi2
n
homocedasticia:

å
n
No caso de x si
2 2
Var ( bˆ ) = i =n1
i
heterocedasticia: Var(ei ) = s i2
(åi =1 xi2 ) 2

6/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Identificação
Principais testes para se detectar a autocorrelação:

Análise gráfica: ê2 ´ Xj

Teste Goldfeld-Quandt
Identificação

Testes Teste de Breusch-Pagan


Paramétricos

Teste de White

7/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Análise Gráfica
Homocedasticidade Heterocedasticidade
ê2 ê2
A dispersão A dispersão
dos resíduos é dos resíduos é
a mesma ao uma função
longo de X linear de X
σ i2 = σ 2 X i
σ 2 = constante

X X
Heterocedasticidade Heterocedasticidade
ê2 ê2 A dispersão dos
A dispersão resíduos cresce
dos resíduos de maneira
é uma função quadrática com
quadrática de os valores de X
X σ i2 = σ 2 X i2
σi = α1 X i + α2 X i2
2

X X
8/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Análise Gráfica
Sejam os gastos de 40 famílias com alimentação em função da renda:

Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi


σ i2 = σ 2 X i

A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a
renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de
heterocedasticidade, em uma relação aparentemente linear.

9/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Y Teste de Goldfeld-Quandt
Sejam os valores da amostra:
Regressão 1
Y1 Y2 ... Yn
X1 X2 ... Xn Onde: X1<X2<...<Xn
A omissão de c observações centrais objetiva acentuar a diferença
entre o grupo com variância pequena (SQReg1) e com variância
Regressão 2 grande (SQReg2).

X
Para testar a hipótese nula da homocedasticia: Fgl , gl
ìï H 0: σ12 = σ 22 SQRes2 / gl n-c
F= onde gl = - (k + 1)
í 2 p
ïî H1: σ12 < σ 22 SQRes1 / gl
F

Passos para efetuar o teste de Goldfeld-Quandt


1- Ordenar as observações da amostra de acordo com os valores de X;
2- Omitir c observações centrais para dar mais poder ao teste (c costuma ser igual a 4 para n=30 e
c=10 para n=60) e separar observações em duas subamostras de (n-c)/2 observações;
3- Ajustar uma regressão para cada subamostra (cada regressão terá k variáveis independentes);
4- Testar hipótese da igualdade dos erros quadráticos médios a partir da estatística F.
10/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Teste de Goldfeld-Quandt
Sejam os gastos de 40 famílias com alimentação em função da renda:
Das 40 observações originais, foram eliminadas 6
observações centrais para dar mais poder ao teste.
Restaram dois subconjuntos com 17 observações cada.

Regressão 1 ìï H 0: σ12 = σ 22 estatística sˆ 22 2629,9


í F= 2 = = 4,99
ïî H1: σ12 < σ 22 de teste: s1
ˆ 526, 7

Regressão 2 E para calcular a probabilidade de erro do tipo I:

F15,15 Rejeita-se H0, ou seja, pode-se afirmar


que há diferença entre as variâncias
(heterocedasticidade) com uma
0,0017 probabilidade de erro de apenas 0,17%
4,99
Amostra 1 Amostra 2
Gasto Alimenti = 12,6 + 0,18 Rendai + eˆi Gasto Alimenti = 75,1 + 0,09 Rendai + eˆi
Fonte gl SQ QM F p Fonte gl SQ QM F p
Regressão 1 5967,2 5967,2 11,33 0,0042 Regressão 1 2308,6 2308,6 0,88 0,3636
Resíduos 15 7900,0 526,7 Resíduos 15 39449,1 2629,9
Total 16 13867,2 Total 16 41757,7

11/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

ê2
Teste de Breusch-Pagan
Seja o modelo de RLM com k=2:

Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm
relação com os regressores:

eˆi2 = d 0 + d1 X1i + d 2 X 2i + ui
Xj Onde k é o número de
variáveis explanatórias,
Para testar a hipótese nula da homocedasticia: c k2 R2aux o coeficiente de
ìH 0 : d1 = d 2 = 0 2
LM = n ´ Raux
determinação do ajuste
í p auxiliar e n o número de
îH1 : d j ¹ 0 2
observações
n´ Raux

Passos para efetuar o teste de White


1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias; 12/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Teste de Breusch-Pagan - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
Do ajuste original por MQO obtivemos:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
eˆi2 = d 0 + d1Rendai + ui eˆi2 = -2,279,5 + 5,21Rendai + uˆi 2
Raux = 0,301
O teste de hipóteses será dado por:
c12
ìH 0 : d1 = 0 2
í n ´ Raux = 40 ´ 0,301 = 12,0
îH1 : d1 ¹ 0 0,0005

12,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,05%.

13/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Teste de White
ê2 Seja o modelo de RLM com k=2:

Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm relação com
os regressores, seus quadrados e seus produtos cruzados:

eˆi2 = d 0 + d1 X1i + d 2 X 2i + d 3 X1i X 2i + d 4 X12i + d 5 X 22i + ui


Xj Onde h é o número de
Para testar a hipótese nula da homocedasticia: c h2 variáveis explanatórias,
R2aux o coeficiente de
ìH 0 : d1 = ... = d 5 = 0 2
LM = n ´ Raux determinação e n o número
í p
îH1 : d j ¹ 0
de observações, todos
2 referentes ao ajuste
n´ Raux
auxiliar
Passos para efetuar o teste de White
1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original, seus quadrados e produtos cruzados;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias do ajuste auxiliar; 14/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Teste de White - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
Do ajuste original por MQO obtivemos:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:

eˆi2 = d 0 + d1Rendai + d 2 Rendai2 + ui


2
eˆi2 = 1923,5 - 7,42 Rendai + 0,01Rendai2 + uˆi Raux = 0,366

O teste de hipóteses será dado por:


c 22
ìH 0 : d1 = d 2 = 0 2
í n ´ Raux = 40 ´ 0,366 = 14,6
îH1 : d j ¹ 0 0,0008

14,58
A probabilidade de erro ao rejeitar H0 é de apenas 0,08%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,08%. 15/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Correção Heterocedasticidade
Dada a equação de RLM: A equivalente matricial:
Yi = a + b1 X1i + ... + b 2 X ki + ei y = Xβ + e
Haverá heterocedasticidade quando: Haverá heterocedasticidade quando:

Var(ei ) = E (ei2 ) = s i2 és 12 0 0 0 ù év1 0 0 0 ù


ê ú ê
ê 0 s 2
0 0 ú ê 0 v2 0 0 úú 2
Que pode ainda ser representado por: T
Var(e) = E (ee ) = 2
= s = Vs 2
ê0 0 ... 0 ú ê 0 0 ... 0 ú
onde o fator vi indica ê ú ê ú
E (ei2 ) =s 2
vi como varia a variância ëê 0 0 0 s n2 úû ë 0 0 0 vn û
de e para cada
observação Se conhecemos V podemos corrigir a equação por:
Se conhecemos vi, podemos
corrigir o modelo pela equação: é1 v1 0 0 0 ù
X1 Xk ê ú
Yi 1 e 0 1 v2 0 0 ú
=a + b1 i + ... + b 2 i + i Λy = ΛXβ + Λe onde Λ = êê
vi vi vi vi vi 0 0 ... 0 ú
ê ú
Pois, nessa equação, os erros êë 0 0 0 1 v2 úû
serão homocedásticos:
Pois:
éæ ö

e 1
E êç i ÷ ú = E (ei2 ) = s 2 E ( ΛeeT Λ) = ΛVΛs 2 = Is 2
êçè vi ÷ø ú vi
ë û 16/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Mínimos Quadrados Ponderados


Definição:
Uma vez conhecida a matriz V de variâncias e convariâncias do erros de um
modelo de RLM, podemos obter os MELNV transformando as variáveis originais
pela matriz L, tal que LTL=V–1. Em outras palavras, seja o modelo:
y = Xβ + e onde Var (e) = E (eT e) = Vs 2
Então:
Λy = ΛXβ + Λe onde ΛT Λ = V -1
Apresentará erros homocedásticos, pois: E ( ΛeeT Λ) = ΛVΛs 2 = Is 2
Os estimadores de MQP serão:

βˆ = ( XT Λ T ΛX) -1 XT Λ T Λy = ( XT V -1X) -1 XT V -1y


Analogamente, teremos:
T -1 -1 2
SQRes = y T V -1y - βˆ T XT V -1y e S ˆ = ( X V X) sˆ
2
b
Esse método é denominado de Mínimos Quadrados Ponderados (MQP), um
caso específico do método de Mínimos Quadrados Generalizados (MQG).
17/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

MQP - V Conhecida
Mínimos Quadrados Ponderados:
Seja o modelo de RLM:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Então teremos: év1 0 0 0 ù
ê0 v 0 0 ú
Var (e) = ê 2 ús 2 = Vs 2
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 v n û
Sabemos, nessas circunstâncias, que os estimadores de MQP serão os MELNV:
βˆ = ( XT V -1X) -1 XT V -1y
Caso vi seja conhecido, a matriz V–1 será dada por:
é1 v1 0 0 0 ù
ê 0 1v 0 0 ú
V -1 = ê 2 ú
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 1 vn û
18/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

MQP com V conhecida - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
As estimativas de MQO foram:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
Supondo agora que:
Var(ei ) = X is 2
Teremos a seguinte matriz de Var-Cov dos erros:
é X 1 ... 0 ù é1 X 1 ... 0 ù
Var (e) = êê ... ... ... úús 2 = Vs 2 e V -1 = êê ... ... ... úú
êë 0 ... X 40 úû êë 0 ... 1 X 40 úû

As estimativas de MQP seriam:


é31,9ù é 323,5 - 0,46 ù
βˆ = ( XT V -1X) -1 XT V -1y = ê ú
e Sβˆ2 = ( XT V -1X) -1sˆ 2 = ê ú
ë0,14û ë - 0, 46 0,0007 û
SQRes y T V -1y - βˆ T XT V -1y
sˆ =
2
= = 1,808
n - k -1 38 19/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF Robusto

MQGF - V Desconhecida
Mínimos Quadrados Generalizados Factíveis:
Seja o modelo de RLM:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Caso o fator vi seja desconhecido, podemos supor que a variabilidade dos erros
seja uma função das variáveis independentes:
d0 +d1X1i +...+d k X ki ln(ei2 ) = d 0* + d1 X1i + ... + d k X ki + ui*
ei2 =e ui
E ajustar a função linear deste modelo a partir dos resíduos de MQO:
ln(eˆi2 ) = d 0* + d1 X1i + ... + d k X ki + ui* d*0 e u*i são o intercepto e erro do modelo linear
Uma vez estimada esta função por MQO, as estimativas de vi serão dadas por:
dˆ0* +dˆ1X1i +...+dˆk X ki
vˆi = e
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora
denominada V, ^ para obtermos os estimadores consistentes (embora viesados) de
Mínimos Quadrados Generalizados Factíveis:
βˆ = ( XT V
ˆ -1X) -1 XT V
ˆ -1y
20/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF Robusto

MQGF com V Desconhecida - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
As estimativas de MQO foram:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
Supondo agora que:
d 0 +d1Rendai ln(ei2 ) = d 0* + d1Rendai + ui*
ei2 =e ui
Ajustando por MQO, estimaremos a relação de heterocedasticidade por:
ln(eˆi2 ) = 3,363 + 0,004Rendai + uˆi vˆi = e3,363+0,004 Rendai
évˆ1 ... 0 ù
ê ú
E a matriz de ponderações V será estimada por: Vˆ = ê ... ... ... ú
ê 0 ... vˆ ú
ë 40 û

Finalmente, as estimativas de MQP serão:

βˆ = ( XT V ˆ -1y = é22,6ù
ˆ -1X) -1 XT V
ê0,16 ú
ë û

21/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Estimadores Robustos
Estimadores da Variância Robustos à Autocorrelação- Esimtador de White:
Seja o modelo de RLS:
Yi = a + bX i + ei com heterocedasticidade dada por: Var(ei ) = vis 2
Embora os estimadores de MQO para b continuem não viesados, as estimativas de
suas variâncias serão viesadas.
Um estimador robusto, ou seja, igualmente válido na presença ou não de
heterocedasticidade, pode basear-se na real variância do estimador:
å å
n n
x s
2 2
xi
2 2
eˆi
ˆ
Var ( b ) = i =1 i i 2
S bˆ * = i =1

(åi =1 xi ) (åi =1 xi2 ) 2


n 2 2 n

No caso de uma RLM teríamos:


Onde ûj é o resíduo do ajuste de
åi=1uˆ 2ji eˆi2
n

Yi = a + å j =1 b j X ji + ei
k Xj em função das demais
S b2ˆ* =
(åi =1uˆ 2ji ) 2
n
j variáveis independentes

Esse estimador seja robusto à heterocedasticidade, atribuído a White, é válido


assintoticamente. Para amostras pequenas, as estatísticas t e F baseadas no
estimador robusto não serão válidas.
22/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Estimador Robusto - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
As estimativas de MQO foram:
Gasto Alimenti = a + bRendai + ei Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
^
Caso os erros sejam homocedásticos, a estimativa de MQO para Var(b ) seria:
sˆ 2 1.429
S b2ˆ = = = 0,00093 = 0,0312
åi=1 xi2
n
1.532.463
^
Por sua vez, uma estimativa robusta à heterocedasticidade para Var(b) seria:

åi=1 i eˆi
n2 2
x 3.421.453.919
S b2ˆ* = = = 0,0015 = 0,038 2

(åi =1 xi2 ) 2
n
(1.532.463) 2

Finalmente, a estatística t para testar a significância de b seria:

0,13 Embora haja evidências de heterocedasticidade no modelo, devemos ter


t= = 3,36 cautela na interpretação do teste t, já que esta baseada no estimador
0,038 robusto pode não ser válida para amostras pequenas (n=40).

23/23
Autocorrelação
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Identificação: Análise Gráfica, teste t, Durbin-Watson, Breusch-Godfrey;
• Correção: MQG e MQGF;
• Estimadores Robustos para a Variância;

Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 13.
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Modelo Clássico de Regressão Linear


1) Relação Linear entre X e Y:
Modelo Clássico de Regressão Linear

O ajuste só é válido para relações lineares.


2) Os valores de X são fixos em repetidas amostras, não aleatórios:
Quem varia é o regressando, o regressor é fixo e dado, qualquer que seja a
amostra. Fazemos a pressuposição que dado um valor de X, Y irá variar
segundo uma distribuição de probabilidade com valor esperado dado por E(Y|Xi).

3) Esperança condicional dos erros igual a zero, ou seja, E(e|xi)=0:


É a mesma coisa afirmar que E(Y|xi)=xi´.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=2
Os erros são homocedásticos, ou seja, sua variância é a mesma para qualquer X.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0:
Não há relação entre valores ordenados dos erros segundo tempo ou espaço.
6) Os erros apresentam distribuição normal:
Não é um pressuposto necessário para que os estimadores de MQO sejam
MELNV, mas necessário para que as inferências sejam válidas.
2/23
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Autocorrelação - Definição
Definição:
Autocorrelação significa a correlação de valores de uma mesma variável
ordenados no tempo (com dados de séries temporais) ou no espaço (com dados
espaciais). No contexto da regressão, dizemos que há autocorrelação nos termos de
erro quando:
Cov(et , et  s )  E (et et  s )  0
Sendo que o tipo mais comum de autocorrelação aquele dado por um processo o
autorregressivo de 1ª ordem, AR(1):
 é o coeficiente de autocorrelação dos erros (-1 <  < 1)
et  et 1  ut e ut são erros IID.

Não Autocorrelacionado Autocorrelacionado


e E (et et s )  0 e E (et et s )  0

t t

3/23
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Autocorrelação - Causas
Principais causas da autocorrelação:
- Inércia: séries temporais econômicas costumam apresentar ciclos, ou seja,
períodos de crescimento ou decaimento. Quando esse comportamento se reflete
nos fatores não observados (et), é comum que mudanças na tendência ocorreram
lentamente.
Yt    X t  et et  et 1  ut
- Falhas de especificação: a autocorrelação pode ser devida à ausência de um
importante regressor ou de transformação das variáveis existentes. Os erros
expressariam, assim, um padrão sistemático devido à ausência dessas informações.
Yt    X t  et Yt    1 X t   2 X t2  et
- Defasagens: as decisões econômicas em um período t dependem, muitas vezes,
de informações defasadas do período t–1. Desconsiderar esse tipo de relação
sujeitaria os erros à correlação serial.
Yt    X t  et Yt    1 X t   2 X t 1  et
ou Yt    Yt 1  X t  et
4/23
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Autocorrelação - Consequências
Ineficiência dos Estimadores de MQO
Na presenção de autocorrelação nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja ^ o estimador de
MQO, então existe outro estimador ^* tal que:
Var(ˆ*)  Var(ˆ )

Não Autocorrelacionados Autocorrelacionados


Intervalo de Intervalo de
Y Variação das
Intervalo de Y
Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO

Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Autocorrelação - Consequências
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da autocorrelação é o fato de as estimativas dos
erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para
amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes
será viesada. Em outras palavras, na presença de autocorrelação teremos:
E ( S 2ˆ )  Var( ˆ )
Seja o modelo: Yt  0  1 X t  et

 xt yt ˆ 2 não viesado na ausência de


n

Pelo MQO: ̂1  t n1 e S 2ˆ  autocorrelação e viesado na


t 1 xt2 t 1 xt2
1 n
presença de autocorrelação

Na ausência de E (et et s )  0 Var(et )   2 2 Cov(et , et s )  0



autocorrelação: Var( ˆ1 ) 
t 1 xt2
n

Na presença de 2 2
et  et  s  ut Var(et )  e Cov(et , et  s )  
s
autocorrelação: 1  2 1  2
 2
 2 n 1 n t
Var( ˆ1 )  n 2 n   s xt xt  s
t 1 xi2 t 1 xi2 t 1 s1 6/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Identificação
Principais testes para se detectar a autocorrelação:

Análise gráfica: ê  t

Teste t: regressores
Identificação estritamente exógenos

Testes Durbin-Watson: MCRL


Paramétricos

Breusch-Godfrey:
autocorrelação com
ordem superior a 1

7/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Análise Gráfica
Ausência de Autocorrelação Autocorrelação
ê ê

0 0
tempo tempo

Não há nenhum padrão evidente de


Há um padrão cíclico de dispersão
relacionamento no tempo
dos resíduos ao longo do tempo
Autocorrelação Autocorrelação
ê
ê

0 0
tempo
tempo

Há uma tendência quadrática de Há uma tendência linear na distribuição


dispersão dos resíduos ao longo do tempo dos resíduos ao longo do tempo

8/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Análise Gráfica
Seja a relação entre a área plantada de cana-de-açucar e seu preço:
Áreat  2,54  4,79 Preçot  eˆt

Podemos suspeitar de um comportamento cíclico dos erros. Afinal, é natural supor que
a área plantada no trimestre t não dependa apenas do preço no trimesre t, mas também
de informações observadas em períodos anteriores: área plantada em um trimestre
anterior; preço pago pela cana-de-açucar no período anterior; outros fatores não
previstos pelo ajuste (política de incentivos do governo, previsões sobre os preços
futuros e expectativas sobre o estabelecimento de usinas na região, por exemplo) que
tenham lento amortecimento no tempo.
9/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t Watson Godfrey
MQG MQGF
Robusto

Teste t para Autocorrelação


Se supormos que os erros apresentem autocorrelação de primeira ordem:
Yt    kj 1  j X jt  et et   et 1  ut

Se estimarmos os resíduos de MQO êt, podemos testar as hipóteses:


 H 0:   0 Como correlações seriais são, usualmente, positivas, sugere-se teste

 H1:   0 unicauldal para verificar existência de autocorrelação nos erros.
Poderíamos utilizar a estatística t dada por:
t(n1)1
ˆ Caso os regressores sejam estritamente exógenos e a
t p
S ˆ amostra grande seja relativamente grande, teremos:
0
t
Sendo os estimadores de MQO dados por:
Como não observamos et,

n 2

 uˆ t
n
eˆt eˆt 1 ˆ 2 a estatística t é válida
ˆ  t  2 S ˆ  ˆ 2 t 2
assintóticamente caso os
2 2
t 2 eˆt 1 (n  1)  1
t 2 et 1
n n
ˆ regressores sejam
estritamente exógenos.

10/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t Watson Godfrey
MQG MQGF
Robusto

Teste t - Exemplo
Seja a relação entre a área plantada de cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat  2,54  4,79 Preçot  eˆt eˆt  0,252 eˆt 1  uˆt
A estatística t associada ao coeficiente  foi:
ˆ 0,252
t   1,443
S ˆ 0,175
O valor p do teste de hipóteses será dado por:
Se rejeitarmos a hipótese de
 H 0:   0 t(341)1 ausência de autocorrelação pelo

 H1:   0 teste t, estaremos sujeitos a um
0,079 erro de 7,9%. A validade do
0 teste depende, entretanto, (i) da
1,443
ausência de relação entre os
erros et e os valores defasados
do preço da cana-de-açucar e
(ii) do tamanho da amostra, que
não é razoavelmente grande.
11/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Teste de Durbin-Watson
Se supormos que os erros apresentem autocorrelação de primeira ordem:
Yt    kj 1  j X jt  et et   et 1  ut

A partir dos resíduos de MQO êt, iremos testar as hipóteses:


Para autocorrelação positiva ( 1), DW aproxima-se de 0.
 H 0:   0  H 0: DW  2 Para autocorrelação negativa (–1), DW aproxima-se de
 
 1
H :   0  H1: DW  2 4. Para ausência de autocorrelação DW aproxima-se de 2.
A estatística de teste será da por:
DWn,k

n
( ˆt  eˆt 1 ) 2
e
DW  t  2
Com fdp
DW  2(1  
ˆ )
t 1 eˆt 2
n dada por: p
DW
Sendo o estimador de  dado por:
A diferença entre o estimador de  da estatística de DW e o de
 et et 1 MQO está no denominador, que, no caso da estatítstica de DW,
n
ˆ ˆ
ˆ  t 2 2
t 1 eˆt também considera a primeira observação da amostra.
n

Assintoticamente os dois estimadores são válidos.

12/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Teste de Durbin-Watson - Definição


Estatística de Durbin-Watson:
A estatística de Dubin-Watson (DW) pode ser utilizada para testar as hipóteses:

n
 H 0:   0 ˆt  eˆt 1 ) 2 t 2 eˆt eˆt 1
n
( e
 sendo DW  t  2 n ou DW  2(1  ˆ ) onde ˆ 
 H1:   0
2
 eˆt 2 t 1 eˆt
n
t 1
Teremos que:
  -1 DW  4
 0 DW  2
 1 DW  0
O fato de a estatística DW basear-se em valores estimados
DW I DWnS,k
a partir da amostra (êt), ao invés de valores observados n ,k
(et), condiciona sua distribuição de probabilidade aos
valores observados para as variáveis independentes (X).
Durbin e Watson prepararam uma tabela com possíveis 0 dI dS 4
valores extremos de DW em função no número de
variáveis independentes (k) e observações da amostra (n).
Rejeita H0: Zona
Não Rejeita H0:  = 0
Na zona de indecisão, não se pode >0 Indecisão
rejeitar nem aceitar H0, 0 dI dS 4
13/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Teste de Durbin-Watson - Exemplo


Seja a relação entre a área plantada de cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat  2,54  4,79 Preçot  eˆt
Devemos testar:

 H 0:   0  H 0: DW  2
 
supondo et   et 1  ut
 H1:   0  H1: DW  2 que:

As estatísticas de teste serão:


Distribuição para uma amostra de 34
t 2 (eˆt  eˆt 1 )2 Como o valor de DW
n

DW   1,4745 observações (n=34) e apenas uma obtido a partir dos


t 1 eˆt
n 2 variável independente (k=1), teremos:
resíduos (1,4725) está na
DW34I ,1 DW34S ,1 região de indecisão, o
Onde: teste seria inconclusivo,
5%
 eˆ eˆ
n ou seja, não há
ˆ  t 2 t 2t 1  0,2419 5% evidências, para afirmar
t 1 eˆt
n
0 1,393 1,514 4 que os erros sejam ou não
autocorrelacionados.
DW=1,4745 14/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Teste de Breusch-Godfrey
Supondo agora que os erros apresentam autocorrelação de ordens q:
Yt    kj 1  j X jt  et et   j 1  j et  j  ut
q

Para permitirmos que os erros defasados relacionem-se com os regressores:


et   0   j 1 j X t  j   j 1  j et  j  ut
k q

Como os erros et não são observados, trabalharemos com o modelo:

eˆt   0   j 1 j X t  j   j 1  j eˆt  j  ut


k q

χ q2
E o teste seria dado por:

H 0: 1  ...   q  0
 LM  (n  q) Reˆ2 p

H1:  j  0

LM
Onde Rê2 é o coeficiente de determinação do ajuste para os resíduos como função de seus
valores e dos regressores defasados. O valor p representará a probabilidade de erro ao
afirmarmos que os erros apresentam autocorrelação de ordem q.
15/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Teste de Breusch-Godfrey - Exemplo


Seja a relação entre a área plantada de cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat  2,54  4,79 Preçot  eˆt
Para testarmos a autocorrelação de 1ª ordem pelo BG:
eˆt  0,043  0,022 Precot 1  0,253eˆt 1  uˆt
As hipóteses a serem testadas seriam:
 H 0:   0

 H1:   0
χ12
E a estatística de teste seria:
0,155
LM  (n  q) Reˆ2  (34  1)0,061  2,023
2,023
Se afirmássemos que há autocorrelação de 1ª ordem, estaríamos sujeitos a um erro de 15,5%
segundo o teste de BG. Diferentemente do teste t e do teste DW, que testam apenas
autcorrelação positiva, o teste BG considera também a presença de autocorrelação negativa.

16/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Correção Autocorrelação
Seja a equação autocorrelacionada: A equivalente matricial:
Yt    1 X 1t  ...   2 X kt  et (1) y  Xβ  e
Supondo que a autocorrelação seja dada por: A autocorrelação regressiva de 1ª ordem implica:
 1   2 ...  n1 
et  et 1  ut ut  et  et 1  
  1  ...  n2 
1  2
Var(e)    ...  n3   V
2 2
O que implica em: 1
1  
2

2 2  ... ... 
Var(et )  e Cov(et , et  s )   s
  n1
... ... ...
1  2 1  2   n2
 n 3
... 1 

O objetivo é transformar o modelo para que este Se conhecemos V a equação corrigida será
apresente erros não autocorrelacionados. dada por:
Λy  ΛXβ  Λe
1º passo) A equação (1) pode ser representada
por:  1  2 0 0 ... 0 

Yt 1    1 X 1t 1  ...   2 X kt 1  et 1 (2)   1 0 ... 0 
1
Onde Λ   0  T
2º passo) Subtraindo da equação (1) a    1 ... 0  e Λ Λ  V
equação (2) multiplicada por :  ... ... ... ... ...
 
(Yt  Yt 1 )   (1   )  1 ( X 1t  X 1t 1 )  ...  (et  et 1 )  0 0 ...   1 
* Pois:
Y* X*1 ut
que apresenta erros ut não autocorrelacionados E (ΛeeT Λ)  ΛVΛ 2  I 2
17/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

Mínimos Quadrados Generalizados


Definição:
Uma vez conhecida a matriz V de variâncias e convariâncias do erros de um
modelo de RLM, podemos obter os MELNV transformando as variáveis originais
pela matriz , tal que T=V–1. Em outras palavras, seja o modelo:
y  Xβ  e onde Var(e)  E (eT e)  V 2
Então:
Λy  ΛXβ  Λe onde ΛT Λ  V 1
Apresentará erros não autcorrelacionados, pois: E (ΛeeT Λ)  ΛVΛ 2  I 2
Os estimadores de MQG serão:

βˆ  (XT ΛΛX)1 XT ΛΛy  (XT V 1X)1 XT V 1y


Analogamente, teremos:
SQRes  yT V 1y  βˆ T XT V 1y e S2ˆ  ( XT V 1X) 1ˆ 2
Esse método é denominado Mínimos Quadrados Generalizados (MQG).

18/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

MQG -  Conhecido
Mínimos Quadrados Generalizados:
Seja o modelo de RLM:
y  Xβ  e com autocorrelação de 1ª ordem: et  et 1  ut
 1  2 ...  n1 
Então teremos:  
  ...  n2 
1  2
1
2 s 
2
Var(et )  e Cov(et , et  s )   Var(e)    ...  n3   V
2 2
1
1  2 1  2 1  2  
 ... ... ... ... ... 
  n1  n2  n 3 1 
 ...

Sabemos, nessas circunstâncias, que os estimadores de MQG serão os MELNV:


βˆ  (XT V 1X) 1 XT V 1y
Caso  seja conhecido, a matriz V–1 será dada por:
 1  0 ... 0 
  1   2  ... 0 

V 1  0   1  2 ... 0 
 
 ... ... ... ... ...
 0 0 ...   1 

19/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto

MQG com  conhecido - Exemplo


Seja a relação entre a área plantada de cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat  2,54  4,79 Preçot  eˆt
Supondo agora que:
et  0,5et 1  ut ou seja   0,5
Teremos a seguinte matriz de Var-Cov dos erros:
 1 0,5 0,52 ... 0,533   1  0,5 0 ... 0
   0,5 1  0,52  0,5 ... 0 
... 0,532  
1  2
0,5 1 0,5
Var(e)  0,5  1 ... 0,531   V
2 2
e V 1   0  0,5 1  0,52 ... 0
1  0,52    
 ... ... ... ... ...   ... ... ... ... ...
0,533 0,532 0,531 1   0 0 ...  0,5 1 
 ...

As estimativas de MQG seriam:


 727 ,4  2135 
ˆβ  ( XT V 1X) 1 XT V 1y   3,34  e Sβˆ2  ( XT V 1X) 1ˆ 2   
505,64 
   2135 8233,4
SQRes y T V 1y  βˆ T XT V 1y
ˆ 
2
  1563,9
n  k 1 32 20/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF Robusto

MQGF -  Desconhecido
Mínimos Quadrados Generalizados Factíveis:
Seja o modelo de RLM:
y  Xβ  e com autocorrelação de 1ª ordem: et  et 1  ut
Então teremos:  1  2 ...  n1 
 
  ...  n2 
1  2
1
2 2
Var(et )  e Cov(et , et  s )   Var(e)  ...  n3   V
s
 
2 2
1
1  2
1  2 1  2  
 ... ... ... ... ... 
  n1  n2  n 3 1 
 ...

Caso  seja desconhecido, podemos trabalhar com uma estimativa de MQO:


eˆt  ˆeˆt 1  uˆt
Nesse caso, os estimadores consistentes de , embora viesados para amostras
pequenas, serão dados por:  1  ˆ 0 ... 0 
 ˆ 1  ˆ 2  ˆ ... 0 

βˆ  (XT V
ˆ 1X) 1 XT V
ˆ 1y onde V 1   0  ˆ 1  ˆ 2 ... 0 
 
 ... ... ... ... ...
 0 0 ...  ˆ 1 

21/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF Robusto

MQGF - Exemplo
Seja a relação entre a área plantada de
cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat  2,54  4,79 Preçot  eˆt
Temos ainda que:
eˆt  0,252 eˆt 1  uˆt ou seja ˆ  252
Teremos então as seguintes estimativas para as matrizes de transformação:
 1 0,252 0,252 2 ... 0,252 33   1  0,252 0 ... 0
   0,252 1  0,252 2  0,252 ... 0 
 0,252 1 0,252 ... 0,252 32  
ˆ 
V
1  2
 ... 0,252 31  e Vˆ   0
1
 0,252 1  0,252 2 ... 0
2 0,252 1
 
1  0,252  
 ... ... ... ... ...   ... ... ... ... ...
0,252 33 0,252 32 0,252 31 1   0 0 ...  0,252 1 
 ...

As estimativas de MQGF seriam:


 0 ,007 
βˆ  ( XT V 1X) 1 XT V 1y   
4,903 

22/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto

Estimadores Robustos
Estimadores da Variância Robustos à Autocorrelação:
Seja o modelo de RLS:
Yt    X t  et com autocorrelação de 1ª ordem: et  et 1  ut
Embora os estimadores de MQO para  continuem não viesados, as estimativas de
suas variâncias serão viesadas.
A real variância do estimador para o coeficiente angular seria:
2 2 n 1 n t
Var( ˆ )  2   s xt xt  s
t 1 xt2 t 1 xt
n n 2
t 1 s 1

Um estimador simples para a variância poderia ser obtido por:


ˆ2 ˆ 2 n1 nt s
Var( ˆ )  n 2 n  ˆ xt xt s
t 1 xt2 t 1 xt2 t 1 s1
Embora esse estimador seja robusto à presença de autocorrelação, considera
apenas autocorrelações de 1ª ordem e erros homocedásticos. Há tratamentos mais
abrangentes na literatura. Essas estimativas são válidas assintoticamente e podem
não ser apropriadas para amostras pequenas.
23/23