Regressão Linear Simples: Estimadores e Inferência

Regressão Linear Simples
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Estimador de MQO para RLS;
• Teorema de Gauss-Markov;
• Variância dos Estimadores;
• Teste t para os coeficientes;
• Análise de Varância
Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 1-3; 5.
Mínimos Quadrados - EQT
Supondo que Y seja uma função de : Yi =  + ei
e3
e2 e4 e1 = Y 1 – 
e5 Os erros ei
e1 e2 = Y 2 –  representam os
Y1 Y2 Y3 Y4 Y5
e3 = Y 3 –  erros de
mensuração de Y a
e4 = Y 4 –  partir de .
 e5 = Y 5 – 
1 Passo) Definir Erro Quadrático Total: A função EQT é

uma medida do
EQT  e12  e2 2  e3 2  e4 2  e5 2 erro total que
cometemos ao
EQT  (Y1  θ)2  (Y2  θ)2  (Y3  θ)2  (Y4  θ)2  (Y5  θ)2 utilizar  para
5 estimar Y na
EQT ( θ )   (Yi  θ)2 função Yi=+ei
i 1
EQT - Exemplo
Supondo que Y seja uma função de : Yi =  + ei
5
Seja o conjunto
EQT ( θ )   (Yi  θ)2
de valores de Y i 1
Y1 = 100
EQT()  350.000
300.000
Y2 = 200 300.000 100 250.000
Y3 = 300 150.000 200 200.000

150.000
100.000 300 100.000
Y4 = 400 150.000 400 *
50.000
0
Y5 = 500 300.000 500 0 100 200 300 400 500 600
Para este conjunto de dados, o valor de  que minimizaria a função

EQT (*) seria o 300.
Estimador de Mínimos Quadrados
Para uma amostra de tamanho n teremos:
n n
Yi  ˆ  eî EQT   eî   (Yi  θˆ)2
2
i 1 i 1
^
2 Passo) Encontrar  que minimiza EQT:
dEQT
0
EQT
dθˆ
n n n
dEQT
  2(Yi  θˆ)( 1)  2 Yi  2 θˆ
dθˆ i 1 i 1 i 1
n
EQT
dEQT n  Yi θˆ
0
 2 Yi  2nθˆ  0 θˆ  i 1
dθˆ i 1 n ^ ^
*
Função de Regressão Populacional
Seja a relação entre Y e X na população:
Yi =  + Xi + ei Modelo de Regressão
Y ou Linear Simples para Y
Yi
E(Y/Xi) =  + Xi na população
ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou explanatória
 é o intercepto ou constante do modelo
Xi X  é o coeficiente angular do modelo
Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo
Interpretação dos Coeficientes
Y Para cada valor controlado de X, teremos
e3 um valor esperado de Y.
e2 O erro representa variáveis omitidas ou
e1 mesmo dificuldades para mensurar aquelas
E(Y1) presentes no modelo.
Pressupõe-se que o efeito do erro seja
mínimo e que este esteja aleatoriamente
distriuído em torno da reta de regressão.
X1 X2 X3
X
Para compreendermos a interpretação
Y dos coeficientes do modelo:
O intercepto  representa o valor esperado de Y
quando o valor controlado de X for nulo:
E(Yi)  Y
X E (Y / 0)     (0)  
O coeficiente angular , por sua vez, representa
E(Y/0)= a variação marginal no valor esperado de Y
dada uma variação unitária em X
E (Y ) dE(Y ) d (  X )
0 Xi
X   
X dX dX
Função de Regressão Amostral
Em uma amostra, a relação entre Y e X será dada por:
Y Função de regressão amostral:

Yi = ^ + ^Xi + êi
^ Y previsto pelo ajuste:
ei
^ ^
Y i Yî = ^ + Xi
Resíduo, valor não previsto pelo ajuste:
ê = Y – Y^
i i i
Xi
X
Função de Erro Quadrático Total (EQT):
EQT  eˆ12  eˆ2 2  ...  eˆn 2
EQT  (Y1  Yˆ1 )2  (Y2  Yˆ2 )2  ...  (Yn  Yˆn )2
n n
EQT   (Yi  Yî )2   [Yi  (ˆ  βˆX i )]
2
i 1 i 1
Método de Mínimos Quadrados
Mínimos Quadrados Ordinários:
Y
O método de mínimos quadrados ordinários (MQO)
ê6
ên ajustará a reta que apresentar as menores distâncias
ê4
ê2 ê5 quadráticas entre os valores observados e a reta (êi).
ê3 Em outras palavras, os estimadores de MQO dos
ê1 parâmetros  e  minimizarão o valor da função de
Erro Quadrático Total (EQT), dada por:
n
EQT   [Yi  (αˆ  βˆX i )]2
X i 1
Para encontrar os valores que minimizam a função EQT:

EQT ˆ  Y  βˆ1 X
 2i 1[Yi  (ˆ  ˆX i )](1)  0
n
(1)
ˆ
n
EQT
 X iYi  n X Y
 2i 1[Yi  (ˆ  ˆX i )](  X i )  0
n i 1
(2) β̂ 
βˆ
n
 Xi2  n X
2
i 1
Estimadores de MQO
Estimadores de Mínimos Quadrados Ordinários:
Seja o modelo de Regressão Linear Simples (RLS) para o conjunto de dados
populacionais e sua equivalente representação na amostra:
Yi    X i  ei Yi  ˆ  ˆX i  eî (3)
Os estimadores de MQO para os parâmetros  e , ou seja, os estimadores que
minimizam o valor de êi2, serão
n
dadas por:
 X iYi  n X Y
ˆ  Y  βˆ X e βˆ  i 1
n
 Xi2  n X
2
i 1
Para simplificar os cálculos, podemos demonstrar que essas expressões podem

também ser dadas como função dos desvios de X e Y em relação às suas
respectivas médias amostrais: n n n
 xi yi  X i yi  xiYi
ˆ  Y  βˆ X (4) e βˆ  i 1
n
 i 1
n
 i 1
n (5)
 xi 2  xi 2  xi 2
i 1 i 1 i 1
Onde: xi  X i  X e yi  Yi  Y
Estimadores de MQO - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de
estudo (X) do responsável pela família: Y X
Yi    X i  ei (Renda) (Anos
Estudo)
A partir dos dados de uma amostra de 4 oobservações, os 4 1
estimadores de MQO para a função amostral serão: 8 4
Yi  ˆ  ˆX i  eî Yi  2,71  1,29 X i  eî 10 6
12 7
ˆ  Y  βˆ X  8,5  1,29(4,5)  2,71

n
 xi yi 27
βˆ  i 1
n   1,29
i 2 21
x
i 1
Para cada ano adicional de escolaridade da
pessoa responsável, espera-se um acréscimo de
1,98 SM na renda familiar. O rendimento esperado
para famílias lideradas por pessoas sem
escolaridade seria de 2,71 SMs.
Distribuição Amostral dos Estimadores
Seja uma população com 20 observações:
Y=^+^X+e
^
Y=+X+e Função ajustada
Y Função de Y para amostra 2
Regressão
Populacional
Y=^+^X+e
^
Função ajustada
para amostra 1
X X
Os estimadores de MQO variarão aleatoriamente em função dos valores

observados na amostra.
Teorema de Gauss-Markov
Sob a hipótese da veracidade de alguns pressupostos, os estimadores obtidos pelo
método de mínimos quadrados ordinários serão os Melhores Estimadores Lineares
Não Viesados (MELNV, ou BLUE - Best Linear Unbiased Estimator).
Em outras palavras:
E( ˆ )   estimador não viesado
E:
Var( ˆ )  Var( ˆ ' ) estimador mais eficiente que ^’,
qualquer que seja ^’ outro estimador
de 
1 – Relação Linear
Linearidade nos parâmetros Linearidade nos parâmetros
e nas variáveis
Yi  α  βX i2  ei
Y Yi  α  βX i  ei Y
X X
Modelo é linear nas variáveis pois todos Modelo não é linear nas variáveis pois o
os expoentes de Y e X são iguais a 1. expoente de X não é igual a 1.
Modelo é linear nos parâmetros pois Modelo é linear nos parâmetros pois
todos os expoentes dos parâmetros são todos os expoentes dos parâmetros são
iguais a 1. iguais a 1.
2- Valores de X são Fixos
Pressupõe que o valor de X seja controlado em repetidas amostras para
se observar variações aleatórias de Y.
Yi    X i  ei
Y Premissa utilizada em inúmeras
demonstrações, embora seja, muitas
vezes, pouco factível. Nessas
E(Y1)
circunstâncias, cuidados adicionais
deverão ser tomados para que as
E(Y2) estimativas de MQO não sejam viesadas.
X1 X2 X
3 - Esperança Condicional Zero
Os erros apresentam esperança condicional zero, ou seja, esses não
podem estar associados aos regressores.
E (e | X i )  E (ei )  0 E (Y / X i )    X i
Y
A média dos erros associados a cada
Yi valor controlado de X será sempre 0,
ei não importa qual seja o valor de X.
E(Y/Xi)
Xi X
4 - Homocedasticidade
A variabilidade dos erros deve ser constante, qualquer que seja o valor
de :X
Var(ei / X i )   2
Homocedasticidade Heterocedasticidade
Y Y
E(Y2) E(Y2)
Var(e2)=2
E(Y1) E(Y1) Var(e2)=22
Var(e1)=2 Var(e1)=21
X1 X2 Xj X1 X2 Xj
5 – Ausência de Autocorrelação
Não há correlação entre os erros do modelo regressão:
Cov(et , et  s )  E (et et  s )  0
Não Autocorrelacionado Autocorrelacionado

e E (et et s )  0 e E (et et s )  0
t t
A autocorrelação é frequente em análise de séries temporais de dados

espaciais.
Modelo Clássico de Regressão Linear
1) Relação Linear entre X e Y:
O ajuste só é válido para relações lineares.

2) Os valores de X são fixos em repetidas amostras, não aleatórios:
Quem varia é o regressando, o regressor é fixo e dado, qualquer que seja a
amostra. Fazemos a pressuposição que dado um valor de X, Y irá variar
segundo uma distribuição de probabilidade com valor esperado dado por E(Y|Xi).
3) Esperança condicional dos erros igual a zero, ou seja, E(e|Xi)=0:

É a mesma coisa afirmar que E(Y|Xi)=+Xi.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=2
Os erros são homocedásticos, ou seja, sua variância é a mesma para qualquer X.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0:
Não há relação entre valores ordenados dos erros segundo tempo ou espaço.
6) Os erros apresentam distribuição normal:
Não é um pressuposto necessário para que os estimadores de MQO sejam
MELNV, mas necessário para que as inferências sejam válidas.
Variância dos Estimadores
Variância dos estimadores de MQO:
Seja o modelo de RLS:
Yi    X i  ei
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, o método de
MQO oferecerá estimadores não viesados para os coeficientes do modelo e para
suas respectivas variâncias. As variâncias dos estimadores e seus respetivos
estimadores serão dados por:
Var(ˆ )  E (ˆ   ) 2 
 X i
2
 2
S 2

 X i
2
ˆ 2



1

X 2 
ˆ 2

n xi2 n xi2  n  xi 
ˆ 2
2 ˆ 2
Var( ˆ )  E ( ˆ   ) 
2
S 2ˆ 
 xi2  xi2
Onde 2=Var(ei) é a variânica dos erros ou variância da regressão e 
^ 2 seu
respectivo estimador, dado por:
 ˆ 2
 i  i  ̂  xi yi
e
ˆ 2  i onde ˆ
e 2
 y 2
n2
Teste t para os Estimadores
Então, para verificar que os estimadores de MQO são significativos:
Teste de hipótese para : ˆ~N (0, ̂2 )
H0: =0
p é a probabilidade de erro
ao afirmar que  é
Sob a hipótese de H0 ser
H1: 0 verdadeiro temos... p/2 p/2
significativo no modelo
0 ̂ valor obtido pela amostra
Teste de hipótese para 1: βˆ~N (0,  2 )

β̂
H0: =0 p é a probabilidade de erro
ao afirmar que  é
Sob a hipótese de H0 ser
H1: 0 verdadeiro temos...
p/2 p/2
significativo no modelo
0 ˆ valor obtido pela amostra

Variância dos Estimadores - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de
estudo (X) do responsável pela família:
Yi    X i  ei Y
(Renda)
X
(Anos
Estudo)
A partir dos dados de uma amostra de 4 oobservações, as
4 1
estimativas de MQO para a função amostral serão:
8 4
Yi  ˆ  ˆX i  eî Yi  2,71  1,29 X i  eî 10 6
As estimativas das variâncias dos erros e dos estimadores de 12 7

MQO serão:
ˆ 2   ˆ
ei
2

0,2857
 0,1429  0,3780 2
n2 42
1 X 2  2  1 4,52 
S2ˆ   ˆ     0,1429  0,1735  0, 4165 2
 n  xi 
2
 4 21 
ˆ 2 0,1429
S ˆ 
2
  0,0068  0,0825 2
 xi2 21
Teste t- Exemplo
Conhecendo os erros padrões e a fdp dos estimadores, temos que:
Teste de hipótese para 0: t2

Aplicando a estatística de a probabilidade de erro ao
H0: =0 teste tn–2 afirmar que o intercepto é
significativo no modelo é de
H1: 0 ˆ  0 2,71
0,2%
t  0,011 0,011
Sˆ 0,42 0 6,52
Teste de hipótese para 1: t2

Aplicando a estatística a probabilidade de erro ao
H0: =0 de teste tn–2 afirmar que a variável X é
significativa no modelo é de
H1: 0 ˆ  0 1,29 0,002 0,002 0,4%
t 
S ˆ 0,08 0 15,6
Análise de Variância
Quando X explica Y Quando X não explica Y
Y Maior Soma dos Y Menor Soma dos
Quadrados da Quadrados da
Regressão Regressão
Y Y
^
Y
^
Y
X X
n n n
STQ   (Yi  Y ) 2 ˆ  Y)2
SQReg   (Y ˆ )2
SQRes   (Yi  Y
i i
i 1 i 1 i 1
Soma dos Quadrados
Soma Total dos Quadrados (STQ)
Mensura a variabilidade total da variável dependente.
n n
STQ   (Yi  Y )   yi 2
2
i 1 i 1
Soma dos Quadrados da Regressão (SQReg)

Mensura a variabilidade da variável dependente explicada
pelo modelo. n n n
SQ Re g   (Yî  Y )2  ˆ12  xi 2  ˆ1  xi yi
i 1 i 1 i 1
Soma dos Quadrados da Regressão (SQReg)
Mensura a variabilidade residual, não explicada pelo
modelo. n n n n
SQ Re s   (Yi  Yî )2   eî 2   yi 2  ˆ1  xi yi
i 1 i 1 i 1 i 1
Coeficiente de Determinação
Coeficiente de Determinação (R2):
Definição: Estima a proporção da variabilidade da
variável dependente (Y) que é explicada pela(s) variável(eis)
independente(s) do modelo de regressão.
n n n
SQ Re g
 (Yî  Y )2  eî2  xi2
R2   i 1
n
 1 i 1
n
 ˆ12 i 1
n
STQ
 (Yi  Y )2  yi2  yi2
i 1 i 1 i 1
Escala de R2:
0 A significância das escalas depende muito da 1

independência natureza da variável dependente relação
linear linear exata
Problema: O modelo contribui para explicar Y?
H0: 1=0 (o modelo não contribui) SQReg
~ F1, n-2
SQRes/(n - 2)
H1: 10 (o modelo contribui) Sob a hipótese
de H0 ser
verdadeiro
Dados: temos...
p
 = nível de significância
F
SQReg = Soma dos Quadrados da Regressão
SQRes = Soma dos Quadrados dos Resíduos
SQReg
n = número de observações F
SQRes/n - 2
Conclusão:
Rejeito H0 se valor p  .
Tabela ANOVA (Analysis Of Variance)
Soma dos Quadrados
Fonte GL F
Quadrados Médios
n SQReg/1
Regressão 1 ˆ  Y)
SQReg   (Y 2 SQReg F
i SQRes/(n - 2)
i 1 1
n SQRes
Resíduos n-2 ˆ )2
SQRes   (Yi - Yi n-2
i 1
n
Total n -1 STQ   (Yi  Y )2
i 1
Rejeito H0 quando valor p – prob (F > F1, n-2) - for menor que
nível de significância esperado ().
Formas Funcionais
Econometria
Alexandre Gori Maia
Ementa:
• Definição: modelos lineares e não lineares;
• Modelo Linear;
• Modelo Log-Linear;
• Modelo Linear-Log;
• Modelo Log-Log.
-Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 4.
Modelos Não Lineares
Linearidade nos parâmetros Linearidade nos parâmetros
e nas variáveis
Yi  α  βX i2  ei
Y Yi  α  βX i  ei Y
X X
Modelo é linear nas variáveis pois todos Modelo não é linear nas variáveis pois o
os expoentes de Y e X são iguais a 1. expoente de X não é igual a 1.
Modelo é linear nos parâmetros pois os Modelo é linear nos parâmetros pois os
expoentes de  e  são iguais a 1. expoentes de  e  são iguais a 1.
Modelos Lineares nos Parâmetros
Modelos não lineares nas variáveis podem tornar-se lineares por anamorfose:
Yi  α  βX i2  ei Yi  α  βZ i  ei
Y Y
é a mesma coisa que...
X Z=X2
Relações não lineares nas variáveis podem ser transformadas em relações lineares por
anamorfose, ou seja, por transformações de suas variáveis originais.
A escolha da forma funcional (tipo de transformação das variáveis) depender á da análise
dos valores e, principalmente, do conhecimento prévio das relações por parte do
pesquisador.
Constatada a linearidade nas variáveis, os coeficiente (’s) de modelos lineares por
anamorfose são estimados de maneira análoga pelo método de mínimos quadrados.
Formas Funcionais
As formas funcionais mais utilizadas em análises econômicas sâo:
Y Y
Yi  β0  β1 X i  ei β0 β1  0
1) Modelo linear: β1  0 ou
β0
X X
Y β1  1
Y 0  β1  1
2) Modelo log-log: ln(Yi )  β0  β1ln(X i )  ei  1  β1  0 ou
X X
Y Y
β1  0
3) Modelo log-lin: ln(Yi )  β0  β1 X i  ei β1  0 ou
X X
Y Y β1  0
4) Modelo lin-log: Yi  β0  β1ln(X i )  ei β1  0
ou
X X
Y Y
1 β0
5) Modelo inverso: Yi  β0  β1 X  ei β1  0 ou β1  0
i
β0
X X
Modelo Linear
Forma Funcional: Yi    X i  ei
Pressupõe que Y apresente aumentos (ou reduções) absolutos constantes dadas
variações absolutas em X.
Y E[Y / 0]     (0)  
 é o valor esperado de Y para valores
+Xi+1 nulos de X
Y=
+Xi
X=1 Y dY d (  X )
  
X dX dX

 é a variação marginal absoluta no
valor esperado de Y (Y) dada uma
0 Xi Xi+1 variação unitária em X (X=1).
X
A variação marginal no valor esperado de Y é a mesma para qualquer valor de X.
Modelo Linear
Qual o efeito da temperatura média diária (°C) sobre as vendas de sorvete?
Pressupondo que a relação entre total de
vendas de uma sorveteria (Y, em 1.000
R$) e a temperatura média (X, em oC) seja
linear:
Yi    βX i  ei
De onde obtemos:
Vendasi  1,04  0,12Tempi  ei
A estimativa do coeficiente angular sugere que, para cada aumento unitário na

temperatura média (X=1 oC), haja um incremento médio e constante de 120 reais nas
vendas de sorvete (Y=0,125 1.000 R$).
O intercepto negativo não possui interpretação econômica, mas sugeririam que o valor
esperado das vendas seria negativo caso a temperatura média fosse igual a 0 oC.
Modelo Log-Linear
Forma Funcional: ln(Yi )    X i ei
Pressupõe que Y apresente crescimento (ou decaimento) exponencial em relação a
variações absolutas de X.
Y ln(Y)
e+Xi+1
+Xi+1
+Xi ln(Y)=
Y/Yi= X=1
e+Xi
e X=1 
0 Xi Xi+1 0 Xi Xi+1
X X
Temos que:
E[ln(Y ) / 0]     (0)   E[Y / 0]  e
 ln(Y ) d ln(Y ) d (  X ) Y / Yi  ln( Y ) 1 Y

    pois    ln( Y ) 
X dX dX X Y Yi Yi
Modelo Log-Linear
Qual o impacto da escolaridade sobre a renda do trabalho?
Pressupondo que a renda do trabalho (Y,
em R$ mensais) cresça exponencialmente
com os anos de escolaridade (X):
ln( Yi )    βX i  ei
De onde obtemos:
ln(Yi )  6,006  0,121 X i  eî
Espera-se, para cada ano adicional de escolaridade (X=1), um incremento relativo

de 12,1% no rendimento do trabalho (Y=0,121 Yi).
Modelo Linear-Log
Forma Funcional: Yi     ln( X i ) ei
Pressupõe que Y apresente variações absolutas constantes dadas variações relativas
em X.
Y Y
+ln(Xi+1) +ln(Xi+1)
Y= +ln(Xi) Y=
+ln(Xi)
X=Xi ln(X)=1
Xi Xi+1 ln(Xi) ln(Xi+1)

X ln(X)
Temos que:
Como variações absolutas em ln(X), ou
 ln( X ) 1 X seja, ln(X), representam variações
   ln( X ) 
X Xi Xi relativas em X (X/Xi), o coeficiente
angular  representará as variações
Então:
absolutas em Y (Y) dada uma variação
Y [   ln( X )] Y
   relativa de 100% em X (X/Xi=1=100%).
 ln( X )  ln( X ) X / X i
Modelo Linear-Log
Como a renda do trabalho afeta a disposição a trabalhar?
Pressupõe-se que o aumento da renda (X, em
R$/h) tenha um efeito positivo sobre a jornada de
trabalho (h semanais). Entretanto, à medida que a
renda cresça indefinidamente, espera-se
variações cada vez mais tênues sobre a jornada
de trabalho:
Yi    β ln( X i )  ei
De onde obtemos:
Yi  30,799  4,790 ln( X i )  eî
Espera-se que, para cada variação relativa de 1% no rendimento hora do trabalho,

haja um incremento absoluto de 0,0479 horas (2,87 minutos) na jornada de trabalho
do ocupado.
Modelo Log-Log
Forma Funcional: ln(Yi )     ln( X i ) ei
Pressupõe que Y apresente variações relativas constantes dadas variações relativas em
X.
Y ln(Y)
e+ln(Xi+1) +ln(Xi+1)
Y=Yi +ln(Xi) ln(Y)=
e+ln(Xi)
X=Xi ln(X)=1
Xi Xi+1 ln(Xi) ln(Xi+1)

X ln(X)
Sabemos que:
O coeficiente  é uma medida constante da
X Y elasticidade de Y em relação a X, ou seja,
 ln( X )  e  ln(Y ) 
Xi Yi considera que as variações relativas em Y dadas
Então: variações relativas em X sejam as mesmas para
 ln( Y ) Y / Yi quaisquer valores de Xi e Yi.
 
 ln( X ) X / X i
Modelo Log-Log
Como o custo de viagem afeta a taxa de visitação a um parque nacional?
Espera-se que haja uma elasticidade constante
entre taxa de visitação (Y, em visitas/100.000
habitantes) e custo de viagem do município de
origem ao parque (X, em R$), ou seja,
incrementos percentuais no custo de viagem
gerariam reduções percentuais na taxa de
visitação:
ln( Yi )    β ln( X i )  ei
De onde obtemos:
ln(Yi )  13,492  2,049 ln( X i )  eî
O coeficiente angular sugere um demanda relativamente elástica às variações no

custo de viagem. Para cada aumento de percentual no custo de viagem, espera-se
uma redução 2,05% na taxa de visitação.
Regressão Linear Múltipla
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Estimadores Mínimos de Mínimos Ordinários;
• Teorema de Gauss-Markov
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 6.
Definição MQO Gauss-Markov
Função de Regressão Populacional

Seja a relação entre Y e X na população:
Yi =  + Xi + ei Modelo de Regressão
Y ou Linear Simples para Y
Yi
E(Y/Xi) =  + Xi na população
ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou regressor
 é o intercepto ou constante do modelo
Xi X  é o coeficiente angular do modelo
Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo 2/11
Função de Regressão Amostral

A relação entre Y e X estimada na amostra será dada por:
Y Função de regressão amostral:

Yi = ^ + ^Xi + êi
^ Y previsto pelo ajuste:
ei
^ ^
Y i Yî = ^ + Xi
Resíduo, valor não previsto pelo ajuste:
ê = Y – Y^
i i i
Xi
X
Função de Erro Quadrático Total (EQT):
EQT  eˆ1  eˆ2  ...  eˆn
2 2 2
EQT  (Y1  Yˆ1 ) 2  (Y2  Yˆ2 ) 2  ...  (Yn  Yˆn ) 2

n
EQT   (Yi  Yî ) 2   [Yi  (αˆ  βˆX i )]
n
2
i 1 i 1 3/11
Regressão Múltipla
Regressão Linear Simples: Regressão Linear Múltipla:
Yi    X i  ei Yi    1 X 1i   2 X 2i  ei
X1 X2
Onde: Onde:
EQT (ˆ , ˆ )   eî2   [Yi  (ˆ  ˆX i )]2 EQT (ˆ , ˆ1 , ˆ2 )   eî2   [Yi  (ˆ  ˆ1 X 1i  ˆ2 X 2i )]2
Minimizando EQT: Minimizando EQT:
EQT
EQT  0  ˆ  Y  ˆ1 X1  ˆ2 X 2
 0  ˆ  Y  ˆX ˆ
ˆ
EQT ˆ ( yi x1i )(  x22i )  ( yi x2i )(  x1i x2i )
EQT  xi yi  0  1 
 0  ˆ  ˆ1 ( x12i )(  x22i )  ( x1i x2i ) 2
ˆ  xi2 EQT ( yi x2i )(  x12i )  ( yi x1i )(  x1i x2i )
 0  ˆ2 
ˆ2 ( x12i )(  x22i )  ( x1i x2i ) 2
4/11
Regressão Linear Simples: Regressão Linear Múltipla:
Yi    X i  ei Yi    1 X1i   2 X 2i  ei
X1 X2
Temos que: Temos que:

Valor esperado de Y
E[Y / X  0]   Valor esperado de Y quando X é E[Y / X1  0, X 2  0]   quando ambos X1 e X2
nulo. são nulos.
dY Y
 Variação marginal esperada em
 1
Variação marginal esperada em Y para
dX Y para cada variação unitária em X 1 cada variação unitária em X1,
X. mantendo X2 constante.
Y
 2 Variação marginal esperada em Y para
X 2 cada variação unitária em X2,
mantendo X1 constante.
5/11
Regressão Múltipla - Exemplo

Seja a relação para consumo de energia (Kwh), horas de ar condicionado
ligado (AC) e horas de secadora ligada (SEC):
Kwhi    ACi  ei Kwhi    1 ACi   2 SECi  ei
O coeficiente  indicará o consumo esperado de

energia quando ambos ar condicionado e secadora
O coeficiente  indicará o consumo esperado de permanecerem desligados.
energia quando o ar condicionado permanecer
O coeficiente 1 indicará o aumento no consumo de
desligado. energia esperado para cada hora adicional com ar
O coeficiente  indicará o consumo de energia condicionado ligado, mantendo-se constante o tempo
adicional esperado para cada hora adicional com ar de uso da secadora. Analogamente, O coeficiente 2
condicionado ligado. indicará efeito isolado de uma hora adicional com a
secadora ligada sobre o consumo esperado de
energia.
6/11
Regressão Múltipla - Definição

Em um modelo de regressão múltipla, a variável dependente (Y) será
determinada por mais de uma variável independente (X). Genericamente, um
modelo de regressão linear múltipla com k variáveis independentes e p parâmetros
(p=k+1) pode ser representado por:
Yi    1 X 1i   2 X 2i  ...   k X ki  ei
Onde:
 é o valor esperado de Y quando todos as variáveis independentes forem
nulas;
1 é a variação esperada em Y dado um incremento unitário em X1,
mantendo-se constantes todas as demais variáveis independentes;
...
k é a variação esperada em Y dado um incremento unitário em Xk,
mantendo-se constantes todas as demais variáveis independentes;
ei é o erro não explicado pelo modelo;
7/11
MQO em Notação Matricial - RLS

Dada a equação: A equivalente matricial:
Yi    X i  ei y  Xβ  e
Que representa o sistema: Que representa o sistema:
Y1    X 1  e1  Y1  1   X 1   e1   Y1  1 X1   e1 
             
Y2    X 2  e2  Y2  1   X 2   e2   Y2  1 X 2     e2 
 ...    ...     
 ...     ...    ...    ...  
...    ...
...              
Y  1   X  e   Y  1  e 
Yn    X n  en  n    n  n  n  Xn 
p1
 n
yn1 Xnp en1
Para obter os
Para obter os estimadores de MQO:
estimadores de MQO:
EQT   eî2 ˆ 
yˆ  Xβˆ eˆ  y  yˆ EQT  eˆ eˆT
onde β̂   
ˆ
 
e
EQT Então:
 0  ˆ  Y  ˆX
ˆ
EQT
EQT  xi yi  0  βˆ  ( XT X) 1 ( XT y )
 0  ˆ  βˆ
ˆ  xi2
8/11
MQO em Notação Matricial - RLM

Dada a equação: A equivalente matricial:
Yi    1 X 1   2 X 2  ...   k X k  ei y  Xβ  e
Que representa o sistema: Que representa o sistema:
Y1    1 X 11   2 X 21  ...   k X k1  e1  Y1   1 X 11 X 21 ... X k1     e1 
      
Y2    1 X 12   2 X 22  ...   k X k2  e2  Y2   1 X 12 X 22 ... X k2  1   e2 
 ...    ... ... ...

... ...  ...   ... 
...       
Yn    1 X 1n   2 X 2n  ...   k X kn  en Y   1 X
 n  1n X 2n ... X kn   k   en 
yn1 Xnp p1 en1

Para obter os estimadores de MQO: Para obter os estimadores de MQO:
EQT   eî
e
yˆ  Xβˆ eˆ  y  yˆ EQT  eˆ T eˆ
EQT Então:
 0  ˆ  ...
ˆ EQT
...  0  βˆ  ( XT X) 1 ( XT y )
EQT βˆ
 0  ˆk  ...
ˆk 9/11
Regressão Múltipla - Exemplo

Seja a relação entre renda familiar em SM (Y), anos de estudo (X1) e idade (X2) do
responsável pela família:
Yi    1 X 1i   2 X 2i  ei y  Xβ  e Y X1 X2
(Renda) (Anos (Idade)
Estudo)
A função de regressão amostral será dada por:
 4  1 1 20  ˆ  eˆ1  4 1 20
      
ˆ  8  1 4 30  ˆ   eˆ2  8 4 30
y  Xβ  e
ˆ 10   1 6 40  1    eˆ 
 ˆ   3 
10 6 40
  
12  1 7 50  2   eˆ 
     4 12 7 50
^
y41 X43 31 ê41
E as estimativas de MQO:
1
 4 18 140   34   1,9 
     
βˆ  (XT X)1(XT y)   18 102 730   180    1 
140 730 5400  1320   0,06 
     
Espera-se, para cada ano adicional de estudo do
responsável pela família, um aumento de 1 SM e,
para cada ano de idade adicional, um aumento de
0,06 SM na renda familiar. 10/11
Método de Mínimos Quadrados
Seja o modelo de regressão múltipla representado matricialmente por:
y  Xβ  e
O estimador de MQO para o vetor de coeficientes  que minimizará o erro
quadrático total do modelo será dado por:
βˆ p1  (X T X) 1 (XT y)
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, os estimadores
de MQO serão os MELNV dos coeficientes de um modelo de RLM.
1. A v.a. Yi é uma função linear das variáveis explanatórias (Xij, j=1..k);
2. Os valores de Xj são fixos;
3. Os erros possuem esperança condicional zero, ou seja, E(ei)=0;
4. Os erros são homocedásticos, ou seja, E(ei2)=2; E(ee’)=I2
5. Os erros são não-correlacionados, ou seja, E(eiej)=0, para ij;
E, para que tenhamos um modelo clássico de regressão linear:
6. Os erros estão normalmente distribuídos;
11/11
Econometria
Alexandre Gori Maia
Ementa:
• Soma dos Quadrados;
• Coeficiente de Determinação;
• Teste F para Tabela ANOVA;
• Coeficiente de Determinação Ajustado;
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 7.
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado
Soma dos Quadrados - Conceito

Quando X explica Y Quando X não explica Y
Y Maior Soma dos Y Menor Soma dos
Quadrados da Quadrados da
Regressão Regressão
Y Y
^
Y
^
Y
X X
n n n
STQ   (Yi  Y ) 2
SQReg   (Yî  Y ) 2 SQRes   (Yi  Yî ) 2
i 1 i 1 i 1
2/11
Coeficiente de
Soma dos Quadrados - Definição

Soma Total dos Quadrados (STQ): Y
n n
STQ   (Yi  Y ) 2   yi  y T y  nY 2 STQ
2
i 1 i 1
X1 X2
Variabilidade total da variável dependente. Representa as distâncias
quadráticas dos valores de Y em relação à média aritmética.
Soma dos Quadrados da Regressão (SQReg):

n Y
SQReg   (Yî  Y )  βˆ X y  nY
2 T T 2
SQReg
i 1
X1 X
Variabilidade da variável dependente explicada pelo conjunto de variáveis 2
independentes. Representa as distâncias quadráticas dos valores
ajustados pelo modelo em relação à média aritmética.
Soma dos Quadrados dos Resíduos (SQRes): Y
n SQRes
SQRes   (Yi  Yî ) 2  eˆ T eˆ  y T y  βˆ T XT y
i 1
X1 X2
Variabilidade da variável dependente não explicada pelo conjunto de
variáveis independentes. Representa as distâncias quadráticas entre os
valores observados de Y e seus valores ajustados pelo modelo.
3/11
Coeficiente de
Soma dos Quadrados
Fonte GL Quadrados F
Médios
SQReg F
SQReg/k
Regressão k βˆ T XT y  nY 2 k SQRes/ (n  k  1)
SQRes
Resíduos n  (k  1) y y  βˆ T XT y
T
n  (k  1)
Total n 1 yT y  nY 2
4/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação
Coeficiente de Determinação
Coeficiente de Determinação (R2):
Definição: Estima a proporção da variabilidade da variável dependente
(Y) que é explicada pelo conjunto das k variáveis independentes do
modelo de regressão (X).
Y
SQReg SQRes
R2   1 X1
STQ STQ X2
Escala para R2:
0 1
Independência Relação
linear linear exata
5/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação
Soma dos Quadrados - Exemplo

Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Yi  1,9  1X 1i  0,06 X 2i  eî
Y X1 X2
(Renda) (Anos (Idade)
Estudo)
4 1 20
8 4 30
10 6 40
12 7 50 SQReg 34,8
R2    0,994
4 STQ 35
  As variáveis anos de estudo e
8
STQ  y y  nY  4 8 10 12    4(8,5)  324  289  35 idade explicam, conjuntamente,
T 2 2
10
  quase a totatilidade (99,4%) da
12 
  variabilidade observada para a
 34  renda familiar na amostra.
 
SQReg  βˆ T XT y  nY 2  1,9 1 0,06  180   4(8,5)  323,8  289  34,8
2
1320 
 
SQ Re s  STQ  SQ Re g  35  34,8  0,2
6/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F para ANOVA- Exemplo

Seja o modelo de RLM com duas variáveis: Y    1 X1  2 X 2  e
H 0 : 1   2  0
E as hipóteses: 
H1 : Pelo menos um  j  0
Possíveis resultados do modelo:
Y Y Y
Y
X2 X1
X1 X2
X1 X2 X1 X2
10 20 1=0 20 10 2=0 1=0 2=0

Nenhuma variável
X1 e X2 contribuem Apenas X2 contribui Apenas X1 contribui
contribui para
para explicar Y. H0 para explicar Y. H0 para explicar Y. H0
explicar Y. H0 não
deveria ser rejeitado deveria ser rejeitado deveria ser rejeitado
deveria ser rejeitado
7/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F para ANOVA

Seja o modelo de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para testarmos a contribuição do conjunto de k variáveis independentes do modelo,
teremos as hipóteses:
H0: 1=...=k =0 (não contribui)

H1: Pelo menos um j 0 (contribui) F ~ Fn,nk 1
A estatística de teste será Considerando
H0 verdadeiro, a
SQReg/k fdp de F será... p
F
SQRes/ (n  k  1) F
Rejeitar H0 significa afirmar que o modelo contribui para explicar Y, ou seja, há
relação significativa entre pelo menos uma variável explicativa e a variável
dependente.
8/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F para ANOVA - Exemplo

idade (X2) do responsável pela família: Y  1,9  1X  0,06 X  eˆ
i 1i 2i i
SQReg/ 2
~ F2 ,1
SQRes/1
0,076
F  87,0
valor p = 0,076
Há evidências moderadas para
afirmar que o modelo contribui
para explicar a variabilidade da
renda familiar. A probabilidade de
erro ao fazermos tal afirmação é
de aproximadamente 7,6%.
9/11
Coeficiente de
Soma dos Quadrados
Determinação
R2 Ajustado - Definição
Seja o ajuste: Incorporando uma variável independente adicional (X3):
Yi    ˆ1 X 1i  ˆ2 X 2i  eî Yi    ˆ1 X 1i  ˆ2 X 2i  ˆ3 X 3i  eî
Poderemos ter: Ry2123  Ry212
Ry2123  Ry212
SQReg
Y Ry212  Y Y
STQ X3 X3
SQReg SQReg ou SQReg
X1 X X1 X2 X1 X
2 2
O R2 nunca diminui quando incorporamos variáveis

independentes adicionais no modelo.
_
Coeficiente de _Determinação Ajustado (R2):
O R2 ajustado (R2) pondera o coeficiente de determinação (R2) pelo número de variáveis
explicativas e pelo número de observações da amostra. É particularmente útil quando
desejamos comparar modelos de regressão múltipla que prevêem a mesma variável
dependente, pois penaliza aquele modelo com maior número de variáveis independentes.
Será dado por:
SQRes/ [n  (k  1)] n 1
R 2  1  1  (1  R 2 )
STQ/ (n  1) n  (k  1) 10/11
Coeficiente de
Soma dos Quadrados
Determinação
R2 Ajustado - Exemplo
idade (X2) do responsável pela família: Y  1,9  1X  0,06 X  eˆ
i 1i 2i i
R 2  0,994
4 1
R 2  1  (1  0,994)  0,982
4  (2  1)
Não há mudanças expressivas no coeficiente de determinação ajustado pelo número de
observações e variáveis do modelo é expressivamente inferior ao R2. Reflexo, sobretudo,
do elevadíssimo valor encontrado para o R2.
11/11
Inferência em Regressão Múltipla
Econometria
Alexandre Gori Maia
Ementa:
• Variância dos estimadores;
• Teste t para os coeficientes;
• Combinação linear dos parâmetros;
• Intervalo de Confiança para os valores previstos;
Maia, Alexandre Gori (2017). Econometria: Conceitos e Aplicações. Cap. 8.
Variância dos
Teste t Combinação Linear Intervalo Confiança
coeficients
Variância dos Estimadores

Variância dos estimadores de MQO:
y  Xβ  e
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, o método de
MQO oferecerá estimadores não viesados para os coeficientes do modelo e para
suas respectivas variâncias. As variâncias dos estimadores e seus respetivos
estimadores serão dados por:
Var(βˆ )  (XT X) 1 2 Sβˆ2  ( XT X) 1ˆ 2
Onde 2 é a variânica dos erros ou variância da regressão e 

^ 2 seu respectivo
estimador, dado por:
eˆ T eˆ y T y  βˆ T XT y
ˆ 
2

n  (k  1) n  (k  1)
2/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança
Teste t para Coeficientes

Yi    1 X 1   2 X 2  ...   k X k  ei
Para saber se Xj possui de fato relação isolada com Y, podemos realizar um teste de
hipóteses para o coeficiente j :
Efeito Efeito
Y isolado
H0: j=0 (Variável Xj não tem relação isolada com Y) isolado
de X1 de X2
H1: j0 (Variável Xj não tem relação isolada com Y) X1 X2
Sob as premissas do MCRL, o estimador de MQO para j , além de não viesado e de

variância mínima, apresentará distribuição normal. Assim, caso H0 seja válido, sua
distribuição será dada por:
βˆ j ~N ( 0, σ β2ˆ ) ˆ j  0 t ~ tn-(k1)
t
j
Sj 2 S ˆ
j
p/2 p/2 p/2 p/2

0 ̂ j 0 t 3/10
Teste t para Coeficientes

O parâmetro será nulo até que se prove o contrário: S^j2
βˆ j ~N ( 0, σ β2ˆ )
H0: j =0 j
Se H0 é verdadeiro, então...
H1:  j  0
Dados: p/2 p/2
^ 0 ̂ j
j = estimador de MQ
ˆ j  0 t ~ tn-(k1)
S^j = erro padrão do estimador t nk1 são os
S ˆ
valor p = nível de significância
j graus de
liberdade dos
observado
p/2 p/2 resíduos
0 t
Conclusão:
Rejeito H0 se valor p (prob de erro ao rejeitar H0) for baixa. Nestas
circunstâncias, posso afirmar que o estimador é significativo.
4/10
Teste t para Coeficientes - Exemplo

Sejam os dados da relação entre renda familiar (Y), anos de estudo (X1) e idade
(X2) do responsável pela família:
Yi  1,9  1X 1i  0,06 X 2i  eî
A matriz de estimativas das variâncias e covariâncias dos coeficientes será:
1
 4 18 140   8,95 2,5  0,57   1,79 0,5  0,114 
     
1 2 2    
S βˆ  ( X X)    18 102 730  
2 T
ˆ ˆ  2 ,5 1 0, 2  0, 2  0 ,5 0 , 2 0 ,04 
140 730 5400    0,57  0,2 0,042    0,114  0,04 0,0084  S2^j
     
Realizando testes de hipóteses para os coeficientes angulares:
H0: 1=0 ˆ1 ~ N (0,  2ˆ ) t

1 0
 2,24
1
0,2 t1
H1: 10
Se afirmarmos que anos de estudo tenham p/2 p/2 0,134 0,134
efeito isolado sobre a renda, estaremos 0 0
1 2,24
sujeitos a um erro de 27%
H0: 2=0 ˆ2 ~ N (0,  2ˆ ) t

0,06  0
 0,65
2
0,0084 t1
H1: 20
Se afirmarmos que a idade tenha efeito p/2 p/2 0,315 0,315
isolado sobre a renda, estaremos sujeitos 0 0
0,06 0,65
a um erro de 63%
5/10
Combinação Linear de Parâmetros

Combinação linear dos parâmetros:
Dado o modelo de RLM:
y  Xβ  e
Sob as premissas do Teorema de Gauss-Markov, temos que:
E (βˆ )  β e Var(βˆ )  E[(βˆ  β)(βˆ  β)T ]  (XT X) 1 2
Uma combinação linear dos parâmetros, onde cada coeficiente j seja multiplicado por
uma constante cj , seria dado por:
 
 
 
c0  c11  ...  ck  k  c0 c1 ... ck  1   cT β
...
 
 
 k
Não é difícil demonstrar que:
E(cT βˆ )  cT E(βˆ )  cT β
ou seja, uma função linear dos estimadores de MQO é um
estimador não viesado da função linear dos parâmetros
E:
a variância da função linear
Var(cT βˆ )  E[(cT βˆ  cT β)(cT βˆ  cT β)T ]  cT (XT X)1c 2 será uma grandeza escalar.
A combinação linear dos parâmetros pode ser utilizada em teste de hipóteses para
combinações dos parâmetros ou intervalos de confiança para os valores previstos.
6/10
Teste t para Combinação Linear

Seja o ajuste de MQ:
Yi  ˆ  ˆ1 X 1i  ˆ2 X 2i  ...  ˆk X ki  eî
Suponha as seguintes hipóteses para os parâmetros 1 e 2 do modelo:
Testar a hipótese nula que 1=2 é o mesmo que testar a combinação:
H 0: 1=  2
(0)  (1) 1  (1)  2 ...  (0)  k  0  
 
H 1: 1  2  
ou, matricialmente: 0 1  1 0 ... 0 1   cT β  0
...
 ˆ   
   

  ˆ  k
A estatística de teste será: 0 1  1 0 ... 0 1   cT βˆ
...
 
 ˆ 
 k
Como combinação linear de v.a.s normais é também uma normal, teremos: cT βˆ ~ N (cT β,  2T )
c β̂
1
Onde:  cT βˆ  c (X X) c
2 T T 2
Finalmente, para resolver o teste de hipóteses:
H 0: 1= 2 cT βˆ ~ N (0,  c2T β̂ ) t

cT βˆ  0
c T ( XT X) 1 cˆ 2
tn(k 1)
H 1: 1 2
Rejeito H0 quando o valor p, p/2 p/2 p/2 p/2
probabilidade de erro ao rejeitar H0, for 0 0
suficientemente pequeno. c T βˆ t
7/10
Teste t para Combinação Linear - Exemplo

Yi  1,9  1X 1i  0,06 X 2i  eî
Há evidências de que o efeito dos anos de estudo seja maior que o da idade?
Testar a hipótese nula que 1=2 é o mesmo que testar a combinação:
H 0 : 1 =  2
(0)  (1)1  (1)2  0
 
 
H 1: 1>  2 ou, matricialmente: 0 1  1 1   cT β  0
 
 2  ˆ   1,9 
   
E a estatística de teste será: cT βˆ  0 1  1 ˆ1   0 1  1 1   0,94
 ˆ   0,06 
 2  
Que estará normalmente distribuída e a estimativa de sua variância será:
 8,95 2,5  0,57  0 
  
1 2  0 1  1 2,5 
Sc2T βˆ  c (X X) cˆ
T T
 1 0, 2  1 0,2  0,2884
  0,57  0,2 0,042   1
  
H 0: 1= 2 cT βˆ ~ N (0,  c2T β̂ ) 0,94  0

t t1
H 1: 1> 2 0,2884
Se afirmarmos que o efeito isolado dos anos p/2 0,165

de escolaridade é superior ao da idade 0 0
0,94 1,75
estaremos sujeitos a um erro de 16,5%
8/10
Intervalo de Confiança
Seja o modelo de RLM: E seu ajuste de MQ:
Yi    1 X 1i   2 X 2i  ...   k X ki  ei Yi  ˆ  ˆ1 X 1i  ˆ2 X 2i  ...  ˆk X ki  ei
A esperança condicional de Y também é uma Assim como o valor previsto da amostra é uma
combinação linear dos parâmetros: combinação linear dos estimadores:
E (Yi / X 1i ,..., X ki )    1 X 1i   2 X 2i  ...   k X ki Yˆ  ˆ  ˆ X  ˆ X  ...  ˆ X
i 1 1i 2 2i k ki
ou, matricialmente: ou, matricialmente:
   ˆ 
   
   ˆ1 

E (Yi / X 1i ,..., X ki )  xT β  1 X 1i X 2i 
... X ki  1 
...

Yî  xT βˆ  1 X 1i X 2i 
... X ki  
...
   
   ˆ 
 k Tˆ  k
Onde: x β ~ N (x β,  xT β̂ )
T 2
E:  x2T βˆ  xT (XT X)1 x 2

Podemos, por exemplo, realizar intervalos de confiança para previsões:
Para uma confiança igual a :
xT βˆ ~ N (xT β,  x2T β̂ )
IC[E(Yi );  ]  [x T βˆ  t xT ( XT X) 1 xˆ 2 ] tn(k 1)
Intervalo que, em reptidas amostras,  
conterá a real esperança condicional
de Y em  das situações.
x T βˆ  t xT ( XT X) 1 xˆ 2 xT ˆ  t xT ( X T X ) 1 xˆ 2 -t t
9/10
Intervalo de Confiança para Previsão

Yi  1,9  1X 1i  0,0,6 X 2i  eî
Qual seria a estimativa por intervalo para a renda esperada de uma família com
responsável com nível superior completo (X1=15) e 30 anos de idade(X2=30)?
A renda prevista pelo ajuste de MQ seria:
Yˆ  1,9  1(15)  0,06(30)  18,7
i ou seja, 18,7 Salários Mínimos
Ou, matricialmente:  1,9 
 
Yi  x   1 15 30  1   18,7
ˆ T ˆ
onde: Yî ~ N ( E (Yi ), xT ( X T X ) 1 x 2 )
 0,06 
 
A estimativa da variância do valor previsto será:
 8,95 2,5  0,57  1 
  
S x2T ˆ  xT ( X T X ) 1 xˆ 2  1 15 30  2,5 1  0,2  15 0,2  26,51
  0,57  0,2 0,042  30 
  
Para uma confiança igual a 95%:
Yî ~ N ( E (Yi ),  x2T ̂ )
IC[E(Yi );0,95 ]  [6,983  0,452] t1
Estimativa do intervalo de 95% de 95% 95%
confiança para a real renda
esperada de uma família com tais -46,7 84,1
18,7  12 ,71 26,51 18,7  12 ,71 26,51
características. 10/10
Contribuição Marginal
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• ANOVA para Contribuição Marginal;
• Correlação Parcial;
Maia, Alexandre Gori (2017). Econometria: Conceitos e Aplicações. Cap. 9.
Definição ANOVA Correlação Parcial
Contribuição Marginal
Seja o modelo de RLS: Seja o modelo de RLM:
Y    1 X1  e Y    1 X1  2 X 2  e
Contribuição
Contribuição marginal de
marginal de Variabilidade X2 em Y
Variabilidade X1 em Y total de Y
total de Y
Variabilidade
de Y Variabilidade Variabilidade
Variabilidade explicada por total de X2
total de X1 total de X1
X1
Contribuição
conjunta de X1 e X2
sobre Y
O grau de relacionamento linear entre X1 e Y Qual a parcela da variabilidade de Y
determinará a parcela da variabilidade de Y explicada unicamente por X2?
explicada unicamente por X1. Em outras palavras, qual a contribuição
marginal de X2, depois de considerada a
contribuição de X1? 2/13
Contribuição Marginal (q=1)

SQReg devido a X1 e X2 (Irrestrito):
SQReg(Y / X 1 e X 2 ) Y
ou SQRegir
Variabilidade de Y explicada pelo conjunto das variáveis X1 e X2. X1 X2
coeficientes angulares do modelo
Graus de liberdade: 2 Y=+1X1+2X2+e.
SQReg devido exclusivamente a X1 (Restrito):

Y
SQReg(Y / X1 ) ou SQRegr
Variabilidade de Y explicada exclusivamente por X1. X1 X2
coeficiente angular do modelo
Graus de liberdade: 1 Y=+1X1+e.
SQReg devido ao acréscimo de X2:

Y
Contribuição X 2  SQRegir  SQRegr
Variabilidade de Y explicada por X2 após considerada a
variabilidade explicada por X1. X1 X2
Graus de liberdade: 1 novo coeficiente angular incorporado no modelo (2).

3/13
Contribuição Marginal (q=2)

SQReg devido a X1, X2 e X3 (Irrestrito):
SQReg(Y / X 1 , X 2 , X 3 ) ou SQRegir Y
Variabilidade de Y explicada pelo conjunto das variáveis

X1, X2 e X3: X1 X2
Graus de liberdade: 3 coeficientes angulares do modelo
Y=+1X1+2X2+3X3+e X3

Y
SQReg(Y / X1 ) ou SQRegr
Variabilidade de Y explicada exclusivamente por X1 X1 X2
Graus de liberdade: 1 coeficiente angular do modelo Y=+1X1+e. X3
SQReg devido ao acréscimo de X2 e X3: Y

Contribuição de X 2 e X 3  SQRegir  SQRegr
Variabilidade de Y explicada por X2 e X3 após considerada a X2
variabilidade explicada por X1 X1
Graus de liberdade: 2 novos coeficientes angulares incorporados X3

no modelo (2 e 3). 4/13
Teste de Restrição aos Parâmetros

Seja o modelo irrestrito de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para verificarmos se a contribuição de um grupo de q variáveis independentes é
significativa no modelo irrestrito devemos, primeiro, elaborar um modelo com restrição
aos parâmetros. Suponha que, por simplicidade, as q variáveis que desejamos testar são
as últimas das k variáveis do modelo irrestrito (a ordem, obviamente, não faz
importância). Nosso modelo restrito seria:
Y    1 X1   2 X 2  ...   k q X k q  e
Em outras palavras, estaríamos interesados em testar a hipótese nula de que os q
coeficientes do modelo irrestrito são nulos:
H 0 :  k q1  0, ...,  k  0
O teste estatístico para restrição aos parâmetros consiste em verificar se a contribuição
marginal dessas q variáveis é significativa . A estatística F será dada por:
( SQ Re g ir  SQ Re g r ) / q ( SQ Re sr  SQ Re sir ) / q
F ou F 
SQ Re sir /( n  k  1) SQ Re sir /( n  k  1)
Onde SQRegir e SQRegr são, respectivamente, a soma dos quadrados da regressão sem e
com restrição nos parâmetros, SQResir é a soma dos quadrados dos resíduos da regressão
sem restrição. 5/13
ANOVA para Contribuição Marginal

Fonte gl Soma dos Quadrados F
Quadrados Médios
Regressão Restrita k -q SQRe g r SQ Re gr /(k  q)
QMRegcontribuiç ão
Contribuição q SQ Re gir  SQ Re g r (SQ Re gir  SQ Re g r ) F  QMResir
q
QMRegir
Regressão Irrestrita k SQ Re g ir SQ Re gir / k F
QMResir
Resíduos n - (k  1) SQ Re sir SQ Re sir /( n  k  1)
Total n-1 STQ
6/13
Teste F para Contribuição Marginal

Y    1 X 1   2 X 2  ...   k X k  e
Para testarmos a contribuição marginal de um grupo de q variáveis, teremos as
hipóteses:
H0: k–q+1=...=k =0 (não contribui)

H1: Pelo menos um j 0 (contribui) F ~ Fq,n-k 1
A estatística de teste será Considerando

H0 verdadeiro, a
(SQRegir - SQRegr )/q fdp de F será...
F p
SQResir /(n - k  1)
F
Rejeitar H0 significa afirmar que o grupo de q variáveis contribui para explicar Y, ou
seja, há relação significativa entre pelo menos uma destas variáveis explicativa e a
variável dependente.
7/13
Contribuição Marginal - Exemplo

Na relação entre renda familiar (Y), anos de estudo (X1) e idade (X2) do
responsável pela família, a contribuição marginal da idade é significativa?
Modelo Irrestrito: Yi  1,9  1X 1  0,06 X 2  eî 34,714
Y
0,086
i i
Modelo Restrito: Yi  2,714  1,286 X 1  eî

i
X1 X2
Soma dos Quadrados
Fonte gl F
Quadrados Médios
SQ Re g cont / 1
Regressão Restrita
Irrestrita 1
2 34.174
34.800 34.174
17.400 87.000 ~F1,1
SQ Re s/ 1
Contribuição
Regressão Marginal
Resíduos Irrestrita 1
2 0.086
34.800
0.200 0.086
17.400
0.200 0.430
87.000
Regressão
Resíduos
Total Irrestrita 2
1
3 34.800
0.200
35.000 17.400
0.200 87.000
Resíduos
Total 1
3 0.200
35.000 0.200 0,631
Total 3 35.000
F  0,430
Não há evidências para afirmar que a contribuição marginal da idade sobre a

variabilidade da renda familiar seja significativa. A probabilidade de erro ao fazermos
tal afirmação é muito alta, de aproximadamente 63%.
8/13
Correlação Parcial - Definição

Yi    β 1 X 1i  ...  β k X ki  ei
Da mesma forma que análise de variância permite considerar a contribuição
marginal de uma variável explanatória, podemos estender o conceito de correlação
simples para ver em que medida a variável dependente e uma das variáveis
independentes estão relacionadas, depois de isolados os efeitos das demais
variáveis explanatórias do modelo:
rY 1.23...k
O rY1.23...k é a correlação parcial entre Y e X1, mantendo-se constantes os efeitos das
k–1 variáveis independentes restantes. Seu quadrado, r2Y1.23...k é o respectivo
coeficiente de determinação parcial.
9/13
Correlação Parcial - Conceito

Seja o modelo de RLM: Y    1 X1  2 X 2  e
Para calcularmos rY1.2, poderíamos seguir os seguintes passos:
Passo 1) Estimar resíduos do ajuste: Y  ˆ0  ˆ1 X 2  eˆ y 2
êy2 contém a parcela de Y não associada a X2.
Passo 2) Estimar resíduos da relação: X 1 ˆ0  ˆ1 X 2  eˆ12
ê12 contém a parcela de X1 não associada a X2.
Passo 3) Estimar correlação entre
os resíduos dos dois modelos:
rY1.2  reˆY 2eˆ12
Y Y r2y1.2
Y
X2 X2
X1 X1 X2
X1
10/13
Correlação Parcial - Cálculo

Coeficiente de Correlação Parcial
No caso de duas variáveis independentes:
Y    1 X1  2 X 2  e
Então a correlação parcial poderá ser diretamente obtida por:
rY 1  rY 2 r12 rY 2  rY 1r12
rY1.2  e rY2.1 
(1  r122 )(1  rY22 ) (1  r122 )(1  rY21 )
Analogamente, o coeficiente de determinação parcial será dado por:
R 2  rY22
r 2
Y1.2 
1  rY22
11/13
Correlação Parcial - Exemplo

Vamos considerar a relação para a renda (Y) como função dos anos de
estudo (X1) e idade (X2).
Y    1 X1  2 X 2  e Yi  1,9  1X 1i  0,06 X 2i  eî
Para calcularmos a correlação parcial entre renda e anos de estudo (rY1.2),
podemos seguir os seguintes passos:
Passo 1) Estimar resíduos do ajuste: Y  2,714  1,286 X 2  eˆ y 2
Passo 2) Estimar resíduos da relação: X 1 2,5  0,2 X 2  eˆ12
Passo 3) Estimar correlação entre rY 1.2  reˆY 2eˆ12  0,913
os resíduos dos dois modelos:
Y Y r2y1.2=0,833
Y
X2 X2
X1 X1 X2
X1
12/13
Correlação Parcial - Exemplo

Vamos considerar a relação para a renda (Y) como função dos anos de
estudo (X1) e idade (X2).
Y    1 X1  2 X 2  e Yi  1,9  1X 1i  0,06 X 2i  eî
Podemos ainda calcular a correlação parcial entre renda e anos de estudo
(rY1.2) diretamente por:
rY 1  rY 2 r12 (0,9959)  (0,9827)(0,9757)
rY1.2    0,913
(1  r12 )(1  rY 2 )
2 2
[1  (0,9759) ][1  (0,9827) ]
2 2
Onde:
 xy
n
27
rY 1  i 1 1i
  0,9959
i
 x y
n n
2 2 ( 21 )( 35 )
i 1 i
1 i 1 i
 x y
n
130
rY 2  i 1
  0,9827
2i i
 x  y
n n
2 2 ( 500 )( 35 )
i 1 2i i 1 i
 xx
n
100
r12  i 1 1i 2 i
  0,9759
 x x
n n
2 2 ( 21 )( 500 )
i 1 1i i 1 2i 13/13
Multicolinearidade
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Fator Inflacionário da Variância;
• Identificação: Estatística Conflitantes e Ajsute entre Regressores;
• Medidas Paliativas;
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 10.
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Conceito
Seja o modelo definido por: Y    1 X1i  2 X 2i  ei
Variabilidade de Variabilidade Se X1 e X2 são independentes, a
Y explicada por de Y explicada variabilidade de Y explicada pelo modelo
X1 (SQReg1) Variabilidade por X2
de RLM divide-se em duas partes
total de Y (SQReg 2 )
disjuntas: o efeito isolado de X1 (SQReg1)
e o efeito isolado de X2 (SQReg2).
Variabilidade Teríamos ainda os mesmos coeficientes
Variabilidade total de X2 angulares das regressões simples:
total de X1
Y  1  1 X1i  e1i SQ Re g1
Y   2  2 X 2i  e2i SQ Re g 2
Variabilidade No outro extremo, poderíamos ter uma
total de Y
relação linear exata entre X1 e X2 (perfeita
colinearidade), ou seja:
Efeito
conjunto de X1i  2 X 2i
Variabilidade X1 e X2
X Nesta situação, seria impossível estimar
conjunta 1de X1 sobre Y
e X2 os efeitos isolados de X1 e X2 sobre Y.
2/11
Multicolinearidade - Conceito
Seja o modelo definido por: Y    1 X1i  2 X 2i  ei
Frequentemente observamos relação entre
Efeito Efeito
Variabilidade
isolado de isolado de as variáveis independentes X1 e X2 e,
total de Y
X1 em Y X2 em Y nesses casos, oefeito sobre Y poderá ser
dividido em 3 partes: i) efeito isolado de
X1; ii) isolado de X2; e iii) efeito conjunto
Variabilidade de X1 e X2.
Variabilidade total de X2
total de X1 O problema é que quando há uma forte
relação linear entre X1 e X2
Efeito conjunto de (multicolinearidade) pode ficar muito
X1 e X2 sobre Y difícil identificar os efeitos isolados de X1
Efeito
Efeito
isolado de
isolado de
e X2 sobre Y. Ou seja, a maior parcela da
X1 em Y Variabilidade
total de Y X2 em Y variabilidade de Y é explicada pelo efeito
conjunto de X1 e X2.
Efeito
Algebricamente, essa relação de
conjunto de multicolinearidade seria dada por:
X2
X1 X1 e X2 X1i  2 X 2i  vi
sobre Y
3/11
Multicolinearidade - Definição
Colinearidade Perfeita
Duas variáveis são ditas perfeitamente colineares quando há uma relação linear
exata entre essas. De maneira genérica, podemos representar a linearidade perfeita
por: X j  1 X 1  2 X 2  ...  k X k
i i i i
Multicolinearidade
Há multicolinearidade em um modelo de regressão múltipla quando duas ou mais
variáveis independentes são fortemente relacionadas linearmente entre si. Nesse
caso, teríamos: X j  1 X 1  2 X 2  ...  k X k  vi
i i i i
Conseqüências da Multicolinearidade
A existência de uma colinearidade exata entre duas ou mais variáveis
independentes torna impossível a obtenção dos coeficientes dos parâmetros por
MQO. Por sua vez, na presença de muiltcolinearidade os estimadores de MQO
continuam sendo os MELNV. O problema é que a multicolinearidade torna muitas
vezes as estimativas dos coeficientes dos parâmetros (’s) insignificantes, já que
cada um pressupõe, por definição, a variação em Y dada uma variação unitária em
X, mantendo-se constantes as demais informações. Ou seja, se duas variáveis
independentes são fortemente correlacionadas, tornár-se-á muito difícil haver
variação em uma sem que haja em outra. 4/11
Fator Inflacionário da Variância

Sabemos que a variância dos estimadores será:
Var (βˆ )  ( XT X) 1 2
Var(ˆ j )
Alternativamente, podemos chegar às
estimativas das variâncias individuais por:
2 2 1 2
Var( ˆ j )  n 2  n  FIV j
i 1 x ji (1  R j ) i 1 x ji 
2 (1  R 2 ) n
2
j x2
i 1 ji
Onde R2j é o coeficiente de

determinação do ajuste: R 2j
X ji  0  1 X1i  ... k 1 X ki  vi
Fator Inflacionário da Variância - FIV

Representa o quanto a variância de ^j está sendo inflacionada pela relação de
multcolinearidade entre Xj e as demais variáveis independentes. Quando não houver relação
entre as variáveis independentes (R2j =0) o FIVj será igual a 1 e, à medida que aproximamo-
nos de uma relação exata (R2j =1), o FIVj tenderá a infinito.
5/11
Multicolinearidade - Identificação
Alguns sinais de multicolinearidade:
Conflito entre estatísticas R2 e F do modelo e testes t para os parâmetros : as
estatísticas R2 e F podem indicar um modelo significativo, enquanto os testes t dos
parâmetros ´s seriam insignificantes.
Y    1 X1i  2 X 2i  ei H 0 : 1   2  0 X H 0 : 1  0 e H 0 :  2  0
Ajuste linear significativo entre as variáveis independentes: uma das variáveis

independentes apresentaria forte relação de linearidade com as demais.
X ji  0  1 X1i  ... k 1 X ki  vi R 2j
Fator Inflacionário da Variância: uma consequência de uma relação linear forte
entre um dos regressores e os demais será um elevado valor para o respectivo FIV.
R 2j FIVj
6/11
Multicolinearidade - Exemplo
Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
CO2 1.5 8.7 2.8 9.4 4.4 8.4 3.2 0.9
PIB 13.2 197.0 128.6 286.4 72.6 167.8 114.4 58.0
Pop 3.2 35.5 19.1 40.4 3.1 22.3 8.4 9.0
O ajuste de MQO forneceu os seguintes resultados para o modelo:
CO2  β0  β1 PIB  β2 Pop  e CO2  0,472  0,030PIB  0,028 Pop  eˆ
Para a tabela ANOVA:
Fonte gl SQ QM F p CO2
Regressão 2 63.9 31.9 8.80 0.023
Resíduos 5 18.2 3.6
PIB Pop
Total 7 82.0
E para os testes t dos coeficientes:
Embora o ajuste seja significativo no
Variável ^ S^ t p
conjunto (teste F), as contribuições
Intercepto 0.472 1.328 0.356 0.737 marginais de cada variável são
PIB 0.030 0.025 1.226 0.275 insignificantes. Resultados que sugerem
a presença de multicolinearidade.
Pop 0.028 0.150 0.183 0.862 7/11
Multicolinearidade - Exemplo
Para nos certificarmos da presença de multicolinearidade, relacionamos os
regressores PIB e Pop:
O ajuste de MQO forneceu os seguintes resultados para a relação entre os regressores:
PIB  0  1 Pop  v PIB  29,2  5,7 Pop  vˆ
Os resultados da tabela ANOVA:

Fonte gl SQ QM F p
Regression 1 46.871,2 46.871,2 47,88 0,0005 PIB Pop
Residual 6 5.873,5 978,9
Total 7 52.744,6
2
RPIB  0,889
Podemos ainda calcular o FIV por:
1 1 Há multicolinearidade nos regressores, o que
FIV    8,98
(1  R j )
2
(1  0,889 ) estaria dificultando a identificação dos impactos
isolados dos regressores. O FIV é 9 vezes
superior ao que seria na ausência de relação
entre os regressores.
8/11
Multicolinearidade - Correção
Alguma medidas paliativas na presenção de multicolinearidade:
Aumentar o tamanho da amostra: aumentando o tamanho da amostra estaremos
aumentando a variabilidade de Xj e, conseqüentemente, reduzindo a variância do
estimador de j.
 2
Y    1 X1i  2 X 2i  ei Var ( ˆ j )  n FIV j

i1 x j
2
i
Tranformar as variáveis: a multicolinearidade pode ser eliminada a partir de

funções das variáveis independentes.
Y    1 X1i  2 X 2i  ei Y   0   0 Z i  ui onde Zi  f ( X1i , X 2i )
Omitir regressor que apresentar alta colinearidade com os demais: uma

solução simples, mas perigora, é excluir uma ou mais variáveis que apresentam
multicolinearidade. A exclusão de variáveis essenciais para compreensão do
problema pode, entretanto, gerar viés de especificação.
Y    1 X1i  2 X 2i  ei Y    1 X1i  ei
9/11
Correção Multicolinearidade - Exemplo

O ajuste de MQO nos forneceu os seguintes resultados :
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor um novo ajuste:
CO 2 PIB CO 2 PIB
 0  1 v  0,123  0,058  vˆ
Pop Pop Pop Pop
Os resultados da ANOVA seriam: CO2/
Fonte gl SQ QM F p Pop
Regressão 1 0,96 0,96 20,1 0,004

R2  0,77
Resíduos 6 0,29 0,05 PIB/
Total 7 1,25 Pop
O ajuste é significativo. Como se trata de um modelo de RLS, a significância do

teste t será igual à da estatística F.
10/11
Correção Multicolinearidade - Exemplo

O ajuste de MQO nos forneceu os seguintes resultados :
Como havia multicolinearidade e os coeficientes eram insignificantes estatisticamente,
podemos propor a exclusão de uma das variáveis:
CO 2  β0  β1 PIB  e CO2  0,401 0,035PIB  eˆ
Os resultados da ANOVA seriam:

CO2
Fonte gl SQ QM F p
Regressão 1 63,77 63,77 20,93 0,004
Resíduos 6 18,28 3,05
PIB
Total 7 82,05
Como pode-se comparar, as estimativas do segundo modelo são apenas ligeiramente

tendenciosas. E a relação entre CO2 e PIB passou a ser significativa. A decisão ideal
deveria, entretanto, basear-se em pressupostos teóricos sobre a forma de
relacionamento das variáveis... 11/11
Variáveis Binárias
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Variáveis binárias para representar 2 ou k categorias nominais;
• Variáveis binárias em equações semi-logarítmicas;
• Coeficientes angulares interativos;
• Regressão poligonal;
• Teste de mudança estrutural;
Bibliografia:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 11.
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural
Variáveis Binárias - Definição

1) Escala Nominal: Valores representam categorias (nomes). Não se pode falar que um seja
maior que o outro. Exemplo: sexo.
2) Escala Ordinal: Valores representam uma hierarquia de posições. Não se pode, entretanto,
falar quão maior é um valor em relação a outro. Exemplo: classe social.
3) Escala Intervalar: Valores representam ordem e é possível mensurar intervalo entre eles.
Não se pode, entretanto, dizer quantas vezes um é maior que outro.
Exemplo: ano.
4) Escala de razão: Valores representam ordem, é possível mensurar intervalo entre eles e
quantificar grandezas em uma escala de razão. Exemplo: renda.
Variável Binária
Uma variável binária (variável dummy) pode representar dois estados possíveis::
0, ausência da característica de interesse (Fracasso)
X 1, presença da característica de interesse (Sucesso)
Podemos, assim, estimar a influência de variáveis explicativas (independentes) nominais ou
ordinais em modelo de regressão, da mesma maneira que fazemos com variáveis
quantitativas de escala intervalar ou de razão.
2/16
Equações Semi-
Logarítmicas
Variáveis Binárias - Exemplo

Seja a relação para o número de filhos e TV a cabo no domicílio:
Podemos inicialmente supor que o no de filhos
esteja associado à escolaridade da mãe.
famílias sem TV
NFilhos = 0 + 1 AnosEst + e
Agora seja a variável binária:
famílias com TV
0 = Não tem TV
Tem TV a cabo?
1 = Tem TV
Por que não considerar dois ajustes?
N FIlhos i) para famílias sem TV a cabo;
ii) para famílias com TV a cabo;
Este problema pode ser simplificado por um
modelo de regressão linear múltipla:
NFilhos = 0 + 1 AnosEst + 2 TV + e
TV Anos Est
3/16
Equações Semi-
Logarítmicas
Variáveis Binárias - Exemplo

Seja a relação entre número de filhos (Y), anos de estudo da mãe (X1) e se tem TV
a cabo no domicílio (X2): Yi    1 X 1i   2 Di  ei
Dados da amostra :
y  Xβˆ  eˆ Espera-se, para mulheres
com TV a cabo no
 0   1 15 1  ˆ  eˆ1 
       domicílio, em média 1,45
 2  1 8 1 ˆ    eˆ2  filhos a menos que
   
 4   1 5 0  1  eˆ  mulheres sem TV,
    ˆ   3 
 6   1 3 0  2   eˆ  independente dos anos
     4 de escolaridade.
ˆ  ( XT X) 1( XT y )
Aplicando MQO: β
1 Como:
 1 15 1    0 
 1 1 1 1    1 1 1 1   Yi  6,36  0,34 X i  1,45 Di  eî
1 8 1   15 8 5 3  2 
βˆ  15 8 5 3    4 
 1 5 0  Teremos que:
 1 1 0 0  
  1 1 0 0   Quando D=0 (sem TV)
 1 3 0    6 
1
Yi  6,36  0,34 X i  eî
 4 31 12   12   6,36 
      Quando D=1 (com TV)
ˆβ   31 323 23   54     0,34 
12 23 2   2   - 1,45 
Yi  (6,36  1,45)  0,34 X i  eî
      4/16
Categorias Equações Semi-
Definição Aplicações Mudança Estrutural
Nominais Logarítmicas
Nominais com Múltiplas Categorias

Para representarmos duas categorias nominais (A e B), precisamos de apenas uma
variável binária D. A referência da análise será dada por D=0. Exemplo:
Yi    1 X i   2 Di  ei Categoria Di
Y A
O coeficiente  indicaria quanto Y seria, em B
2 A 1
média, maior (ou menor) para a categoria A 2
B 0
(D=1) que a categoria de referência B (D=0),
 X
independente do valor de X.
Para A: Yi  (   2 )  1 X i  ei
Para B: Yi    1 X i  ei
Para representarmos k categorias nominais, precisamos de k–1 variáveis binárias D’s.
A referência da análise será dada por uma das categorias. Exemplo, supondo k=3:
Yi    1 X i   2 D1i   3 D2i  ei A
O coeficiente 2 indicaria quanto Y seria, em Categoria D1i D2i Y B
média, maior para a categoria A (D1=1) que a A 1 0
2
C
categoria de referência C (D1=0 e D2=0), B 0 1 3
independente do valor de X. O coeficiente 3 C 0 0
indicaria quanto Y seria, em média, maior para  X
a categoria B (D2=1) que a categoria de
Para A: Yi  (   2 )  1 X i  ei
referência C. Pois teríamos:
Para B: Yi  (  3 )  1 X i  ei
Para C: Yi    1 X i  ei 5/16
Múltiplas Categorias - Exemplo

Sejam os dados amostrais para renda (Y), anos de estudo (X) e posição na
ocupação:
Dadas as binárias:
Yi Xi Posição Ocupação D1i D2i 
1, se Autônomo 1, se Empregador
100 0 Empregado 0 0 D1i   D2i  

0, c.c. 0, c.c.
200 4 Empregado 0 0
Terermos o ajuste:
400 8 Empregado 0 0
400 4 Autônomo 1 0 Yi    1 X i   2 D1i   3 D2i  ei
500 8 Autônomo 1 0 Por MQO:  100  1 0 0 0  eˆ1 
     
600 0 Empregador 0 1  200  1 4 0 0     eˆ2 
ˆ
 
 400  1 0  ˆ1   eˆ3 

Yi  (93,3  506,7)  35 X i y  Xβˆ  eˆ  
8 0
  
  400  1 4 1  ˆ 
0  2  eˆ4 
Yi  (93,3  146,7)  35 X i  500  1     
    8 1 0  ˆ3   eˆ5 
Yi  93,3  35 X i  600  1
E:    0 0 1   eˆ 
 6
βˆ  ( XT X) 1( XT y )
1
 6 24 2 1   2200   93,3 
Independente dos anos de escolaridade, o      
 24 160 12 0   9600   35 
rendimento médio dos autônomos seria 146,7 βˆ   
reais superior ao dos empregados e o dos 2 12 2 0   900   146,7 
     
empregadores 506,7 superior. 1 0 1   600   506,7 
   
 0 6/16
Equação de Rendimentos - Exemplo

Sejam os dados amostrais para 164 mil ocupados no Brasil em 2011:
Considerando inicialmente o modelo:
rendai    1anosesti   2idadei  ei
Discriminando por sexo pela binária:
feminino  1, se mulher; 0 se homen
Discriminando por cor pelas binárias
Discriminando por cor pela binária:
(cor preta como referência):
branca  1, se cor branca; 0 c.c.
parda  1, se cor parda; 0 c.c.
amarela  1, se cor amarela; 0 c.c.
Discriminando por região pelas binárias
(região Sul como referência):
no  1, se região norte; 0 c.c.
ne  1, se região nordeste; 0 c.c.
se  1, se região sudeste; 0 c.c.
co  1, se região centro  oeste; 0 c.c. 7/16
Equações Semi-
Definição Categorias Nominais Aplicações Mudança Estrutural
Logarítmicas
Binárias em Equações Semi-Logarítmicas

Seja a equação semi-logarítmica:
ln (Yi )    βDi  ui   βDi ui
Yi  e
ln(Y)
 +  e + 

e
0 1 D 0 1 D
• Seja Y1 o valor de Y para D=1 e Y0 o valor para D=0;
• Para obtermos a variação relativa em Y quando comparamos D=0 e D=1:
Para D=0: Para D=1: Então:

ln(Y0 )   ln(Y1 )     Y1  Y0 e e   e Y1  Y0
  e 1
Y0  e Y1  e   Y0 e Y0
8/16
Equações Semi-
Definição Categorias Nominais Aplicações Mudança Estrutural
Logarítmicas
Equação de Rendimentos - Exemplo

Sejam os dados amostrais para 164 mil ocupados no Brasil em 2011:
Considerando agora o modelo:
ln( rendai )    1anosesti   2idadei  ei
Em relação aos homens, a variação
relativa da renda para as mulheres seria:
e0,44332  1  0,3581
Em relação aos ocupados de cor preta, as
variações relativas para as cores seriam:
branca: e0,14130  1  0,1518
parda: e-0,0086  1  0,0086
amarela: e0,2228  1  0,2495
Em relação aos ocupados da região SU, as
variações relativas para as regiões seriam:
NO: e-0,1621  1  0,1497
NE: e-0,3706  1  0,3097
SE: e-0,0046  1  0,0046
CO: e0,0758  1  0,0788 9/16
Equações Semi-
Logarítmicas
Variáveis Binárias - Aplicações

Rnd   0  1 AnosEst   2 Masc  e
Rnd Homens
Esse modelo pressupõe deslocametos da função de
Mulheres
2
rendimentos (0) mas retornos marginais da escolaridade (1)
iguais para homens e mulheres.
0 AnosEst
Rnd   0  1Masc   2 AnosEst  3 Masc  AnosEst  e
Rnd
Mulheres Esse modelo pressupõe desolocamentos da função de
Homens rendimentos (0) e retornos marginais da escolaridade
2 diferentes para homens (2+3) e mulheres (2).
0 AnosEst
Rnd   0  1 AnosEst   2 ( AnosEst  X *) D  e
Rnd
1+2 Nesse modelo a variável binária é utilizada para captar
mudanças na inclinação entre segmentos consecutivos de X.
1
0
X*
AnosEst
10/16
Equações Semi-
Logarítmicas
Coeficientes Angulares Interativos

Sejam os dados amostrais para renda (Y), anos de estudo (X) e sexo dos ocupados:
Yi Xii Sexo Di DiXi Dado o ajuste:
1, se Homem
100 0 Mulher 0 0 Yi    1 X i   2 Di  3 Di X i  ei onde Di  
250 4 Mulher 0 0 0, c.c.
300 8 Mulher 0 0 Aplicando MQO teremos:
 100  1 0 0 0  eˆ1 
200 0 Homem 1 0      
 250  1 4 0 0  ˆ   eˆ2 
y  Xβˆ  eˆ
400 4 Homem 1 4
 300  1     
500 8 Homem 1 8 8 0 0  ˆ1  eˆ3
  
 ˆ   
  200  1 0 1 0   2  eˆ4 
Yi  (116,7  100)  (25  12,5) X i  400  1     
   4 1 4  ˆ3   eˆ5 
  500  1 8   eˆ 
Yi  116,7  25 X i    8 1  6
E as estimativas serão dada por:
βˆ  ( XT X) 1( XT y )
1
 6 24 3 12   1750  116,7 
Independente dos anos de escolaridade, o      
rendimento médio dos homens seria 100 reais ˆβ   24 160 12 80   9000  

25 
superior ao das mulheres. O retorno marginal da
 3 12 3 12   1100   100 
     
escolaridade para os homens seria ainda, em média,  12 80 12 80   5600   12,5 
12,5 reais superior ao das mulheres.
    11/16
Equações Semi-
Logarítmicas
Regressão Poligonal - Exemplo

Sejam os dados amostrais para renda (Y) e anos de estudo (X):
Yi Xi Di (Xi-8)Di Supondo que o retorno marginal da escolaridade na
100 0 0 0 mude a partir do segundo grau (X>8), teríamos:
250 4 0 0 1, se X i  8
300 8 0 0
Yi    1 X i   2 ( X i  8) Di  ei onde Di  
0, c.c.
450 10 1 2 Aplicando MQO:
 100  1 0 0   eˆ1 
700 13 1 5
y  Xβˆ  eˆ      
800 15 1 7  250  1 4 0  ˆ  eˆ2 
        
Yi  116,6  25,1X i  46,2( X i  8)  300   1 8 0  ˆ    eˆ3 
 1
 450  1 10 2  ˆ   eˆ4 
 700  1 13 5   2   eˆ 
     5
  800  1 15 7   eˆ 
Y  116,6  25,1X      6
i i
As estimativas de MQO seriam:
8 βˆ  ( XT X) 1( XT y )
1
Espera-se, para cada ano de escolaridade, uma  6 50 14   2600  116,6 
     
βˆ   50 574 190   29000    25,1 
variação marginal de 25,1 reais na renda. Acrescenta-
se, ainda, 46,2 reais nessa variação para cada ano
 14 190 78   10000   46,2 
adicional a partir do 2º grau (8 anos ou mais de      
escolaridade) 12/16
Equações Semi- Mudança
Definição Categorias Nominais Aplicações
Logarítmicas Estrutural
Teste de Mudança Estrutural

Seja as seguintes hipóteses para a relação entre Y, X e a binária D:
Yi   0  1Di   2 X i  3 Di  X i  ei
D=1
Y D=1 eY D=1 Y Y D=0
D=0 D=0 D=1
D=0
1  0 e 3  0 1  0 e 3  0 1  0 e 3  0 1  0 e 3  0
X X X X
Regressões Regressões Regressões Regressões
Coincidentes Paralelas Concorrentes Dissimilares
H 0 : 1  3  0

Testar se há mudança estrutural significa testar
se pelo menos um dos coeficientes 1 ou 3 é 
diferente de zero: H1 : 1 e / ou 3  0

Y
Esse teste corresponde à contribuição marginal
das variáveis associadas aos coeficientes 1 e 3.
X D
D.X
13/16
Teste de Mudança Estrutural

SQReg devido a X, D e D.X (Irrestrito):
SQ Re g (Y / X , D, D  X ) ou SQ Re g ir Y
Variabilidade de Y explicada pelo conjunto das variáveis X, D e D.X

X D
Graus de liberdade: 3 coeficientes angulares do modelo
Y=+1D+2X+3D.X+e D.X

Y
SQ Re g (Y / X ) ou SQRe g r
Variabilidade de Y explicada exclusivamente por X X D
Graus de liberdade: 1 coeficiente angular do modelo Y=+2X+e. D.X
SQReg devido ao acréscimo de X2: Y

Contribuição X 2  SQ Re gir  SQ Re g r
Variabilidade de Y explicada por D e D.X após considerada a D
variabilidade explicada por X X
Graus de liberdade: 2 novos coeficientes angulares incorporados D.X

no modelo (1 e 3). 14/16
Contribuição Marginal - Definição

Seja o modelo irrestrito de RLM:
Y    1 X 1   2 X 2  ...   k X k  e
Para verificarmos se a contribuição de um grupo de q variáveis é significativa no modelo
devemos, primeiro, elaborar um modelo com restrição aos parâmetros . Suponha que, por
simplicidade, as q variáveis que desejamos testar são as últimas das k variáveis do
modelo irrestrito (a ordem, obviamente, não faz importância). Nosso modelo restrito
seria:
Y    1 X1   2 X 2  ...   k q X k q  e
Em outras palavras, estaríamos interesados em testar a hipótese nula de que os q
coeficientes do modelo irrestrito são nulos:
H 0 :  k q1  0, ...,  k  0
O teste estatístico consiste agora em verificar se a contribuição marginal dessas q variáveis
é significativa . A estatística F será então dada por:
( SQ Re g ir  SQ Re g r ) / q ( SQ Re sr  SQ Re sir ) / q
F ou F 
SQ Re sir /( n  k  1) SQ Re sir /( n  k  1)
Onde SQRegir e SQRegr são, respectivamente, a soma dos quadrados da regressão sem e
com restrição nos parâmetros, SQResir é a soma dos quadrados dos resíduos da regressão
irrestrita. 15/16
Mudança Estrutural - Exemplo

Sejam os dados amostrais para renda (Y), anos de estudo (X) e sexo dos ocupados:
Yi Xi Sexo Di DiXi Dado o modelo:
1, se Homem
100 0 Mulher 0 0 Yi    1 X i   2 Di  3 Di X i  ei
onde Di  
250 4 Mulher 0 0 0, c.c.
Para testar a hipótese de mudança H 0 :  2  3  0

300 8 Mulher 0 0

H1 :  2 e / ou 3  0
200 0 Homem 1 0
estrutural: 
400 4 Homem 1 4
Teremos, para o modelo irrestrito:
500 8 Homem 1 8
Yi  116,7  25 X i  100 Di  12,5Di X i  eî
SQRegir  98750 e SQResir  3333,3
E para o modelo restrito:
Yi  166,7  31,25 X i  eî
SQRegr  62500 e SQResr  9895,8
E a estatística de teste será:
( SQ Re g ir  SQ Re g r ) / 2 (98750  62500 ) / 2
F   10,875
SQ Re sir /( n  4) 3333,3 / 2
Onde o valor p associado a 10,875 em uma distribuição F com 2 graus de liberdade no numerador e 2 no
denominador é de 0,084. Ou seja, se afirmarmos que há mudança estrutural em relação ao sexo
estaremos sujeito a uma probabilidade de erro de 8,4%. 16/16
Heterocedasticidade
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Identificação: Análise Gráfica, Goldfeld-Quandt, Breusch-Pagan, White;
• Correção: MQP e MQGF;
• Estimadores Robustos para a Variância;
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12..
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto


3) Esperança condicional dos erros igual a zero, ou seja, E(e|xi)=0:

É a mesma coisa afirmar que E(Y|xi)=xi´b.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=s2
2/23
White MQP MQGF
Robusto
Heterocedasticidade - Definição
Homocedasticidade:
A variância dos erros e, condicional aos valores das variáveis explanatórias, será
constante.
Var(ei / X 1i , X 2i ,..., X ki ) = s 2
Heterocedasticidade:
A variância dos erros será diferente para cada valor condicional de Xji.
Var (ei / X1i , X 2i ,..., X ki ) = s i2
Y Y
E(Y2) E(Y2)
Var(e2)=s2
E(Y1) E(Y1) Var(e2)=s22
Var(e1)=s2
Var(e1)=s21
X1 X2 Xj X1 X2 Xj 3/23
White MQP MQGF
Robusto
Heterocedasticidade - Causas
Principais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente
tendência à heterocedasticia. Por exemplo, renda e poupança.
Yi = a + bX i + ei Var(ei ) = s i2
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar
a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser
devida à omissão de importantes variáveis no modelo.
Yi = a + bX i + ei Yi = a + b1 X i + b 2 X i2 + ei
- Transformação dos dados: a transformação das variáveis (por exemplo,
proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo
ao invés de linear) pode eliminar a heterocedasticidade.
Yi = a + bX i + ei ln(Yi ) = a + b ln( X i ) + ei
4/23
White MQP MQGF
Robusto
Heterocedasticidade - Consequências
Ineficiência dos Estimadores de MQO
Na presenção de heterocedasticidade nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja b^ o estimador de
MQO, então existe outro estimador b^* tal que:
Var ( bˆ *) < Var ( bˆ )
Homocedasticia Heterocedasticia
Intervalo de
Y Variação das
Intervalo de Y Intervalo de
Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO
Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
5/23
White MQP MQGF
Robusto
Heterocedasticidade - Consequências
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da heterocedasticidade é o fato de as estimativas dos
erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para
amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes
será viesada. Em outras palavras, na presença de heterocedasticidade teremos:
E (S b2ˆ ) ¹ Var( bˆ )
Seja o modelo: Yi = a + bX i + ei
não viesado na ausência de
åi=1 xi yi
n
ŝ 2
Pelo MQO: b̂ = e S b2ˆ = heterocedasticidade e
åi=1 xi2
n
å
n 2
i =1
xi viesado na sua presença
No caso de s2
Var (ei ) = s 2 Var ( bˆ ) =
åi=1 xi2
n
homocedasticia:
å
n
No caso de x si
2 2
Var ( bˆ ) = i =n1
i
heterocedasticia: Var(ei ) = s i2
(åi =1 xi2 ) 2
6/23
White MQP MQGF
Robusto
Identificação
Principais testes para se detectar a autocorrelação:
Análise gráfica: ê2 ´ Xj
Teste Goldfeld-Quandt
Identificação
Testes Teste de Breusch-Pagan

Paramétricos
Teste de White
7/23
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto
Análise Gráfica
ê2 ê2
A dispersão A dispersão
dos resíduos é dos resíduos é
a mesma ao uma função
longo de X linear de X
σ i2 = σ 2 X i
σ 2 = constante
X X
Heterocedasticidade Heterocedasticidade
ê2 ê2 A dispersão dos
A dispersão resíduos cresce
dos resíduos de maneira
é uma função quadrática com
quadrática de os valores de X
X σ i2 = σ 2 X i2
σi = α1 X i + α2 X i2
2
X X
8/23
Análise Gráfica
Sejam os gastos de 40 famílias com alimentação em função da renda:
Gasto Alimenti = 40,8 + 0,13 Rendai + eî

σ i2 = σ 2 X i
A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a
renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de
heterocedasticidade, em uma relação aparentemente linear.
9/23
Y Teste de Goldfeld-Quandt
Sejam os valores da amostra:
Regressão 1
Y1 Y2 ... Yn
X1 X2 ... Xn Onde: X1<X2<...<Xn
A omissão de c observações centrais objetiva acentuar a diferença
entre o grupo com variância pequena (SQReg1) e com variância
Regressão 2 grande (SQReg2).
X
Para testar a hipótese nula da homocedasticia: Fgl , gl
ìï H 0: σ12 = σ 22 SQRes2 / gl n-c
F= onde gl = - (k + 1)
í 2 p
ïî H1: σ12 < σ 22 SQRes1 / gl
F
Passos para efetuar o teste de Goldfeld-Quandt

1- Ordenar as observações da amostra de acordo com os valores de X;
2- Omitir c observações centrais para dar mais poder ao teste (c costuma ser igual a 4 para n=30 e
c=10 para n=60) e separar observações em duas subamostras de (n-c)/2 observações;
3- Ajustar uma regressão para cada subamostra (cada regressão terá k variáveis independentes);
4- Testar hipótese da igualdade dos erros quadráticos médios a partir da estatística F.
10/23
Teste de Goldfeld-Quandt
Das 40 observações originais, foram eliminadas 6
observações centrais para dar mais poder ao teste.
Restaram dois subconjuntos com 17 observações cada.
Regressão 1 ìï H 0: σ12 = σ 22 estatística sˆ 22 2629,9

í F= 2 = = 4,99
ïî H1: σ12 < σ 22 de teste: s1
ˆ 526, 7
Regressão 2 E para calcular a probabilidade de erro do tipo I:
F15,15 Rejeita-se H0, ou seja, pode-se afirmar

que há diferença entre as variâncias
(heterocedasticidade) com uma
0,0017 probabilidade de erro de apenas 0,17%
4,99
Amostra 1 Amostra 2
Gasto Alimenti = 12,6 + 0,18 Rendai + eî Gasto Alimenti = 75,1 + 0,09 Rendai + eî
Fonte gl SQ QM F p Fonte gl SQ QM F p
Regressão 1 5967,2 5967,2 11,33 0,0042 Regressão 1 2308,6 2308,6 0,88 0,3636
Resíduos 15 7900,0 526,7 Resíduos 15 39449,1 2629,9
Total 16 13867,2 Total 16 41757,7
11/23
ê2
Teste de Breusch-Pagan
Seja o modelo de RLM com k=2:
Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm
relação com os regressores:
eî2 = d 0 + d1 X1i + d 2 X 2i + ui
Xj Onde k é o número de
variáveis explanatórias,
Para testar a hipótese nula da homocedasticia: c k2 R2aux o coeficiente de
ìH 0 : d1 = d 2 = 0 2
LM = n ´ Raux
determinação do ajuste
í p auxiliar e n o número de
îH1 : d j ¹ 0 2
observações
n´ Raux
Passos para efetuar o teste de White

1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias; 12/23
Teste de Breusch-Pagan - Exemplo

Do ajuste original por MQO obtivemos:
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
eî2 = d 0 + d1Rendai + ui eî2 = -2,279,5 + 5,21Rendai + uî 2
Raux = 0,301
O teste de hipóteses será dado por:
c12
ìH 0 : d1 = 0 2
í n ´ Raux = 40 ´ 0,301 = 12,0
îH1 : d1 ¹ 0 0,0005
12,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,05%.
13/23
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto
Teste de White
ê2 Seja o modelo de RLM com k=2:
Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm relação com
os regressores, seus quadrados e seus produtos cruzados:
eî2 = d 0 + d1 X1i + d 2 X 2i + d 3 X1i X 2i + d 4 X12i + d 5 X 22i + ui

Xj Onde h é o número de
Para testar a hipótese nula da homocedasticia: c h2 variáveis explanatórias,
R2aux o coeficiente de
ìH 0 : d1 = ... = d 5 = 0 2
LM = n ´ Raux determinação e n o número
í p
îH1 : d j ¹ 0
de observações, todos
2 referentes ao ajuste
n´ Raux
auxiliar
Passos para efetuar o teste de White
1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original, seus quadrados e produtos cruzados;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias do ajuste auxiliar; 14/23
Definição
White MQP MQGF
Robusto
Teste de White - Exemplo

Do ajuste original por MQO obtivemos:
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
eî2 = d 0 + d1Rendai + d 2 Rendai2 + ui

2
eî2 = 1923,5 - 7,42 Rendai + 0,01Rendai2 + uî Raux = 0,366
O teste de hipóteses será dado por:

c 22
ìH 0 : d1 = d 2 = 0 2
í n ´ Raux = 40 ´ 0,366 = 14,6
îH1 : d j ¹ 0 0,0008
14,58
A probabilidade de erro ao rejeitar H0 é de apenas 0,08%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,08%. 15/23
Definição
White MQP MQGF
Robusto
Correção Heterocedasticidade
Dada a equação de RLM: A equivalente matricial:
Yi = a + b1 X1i + ... + b 2 X ki + ei y = Xβ + e
Haverá heterocedasticidade quando: Haverá heterocedasticidade quando:
Var(ei ) = E (ei2 ) = s i2 és 12 0 0 0 ù év1 0 0 0 ù

ê ú ê
ê 0 s 2
0 0 ú ê 0 v2 0 0 úú 2
Que pode ainda ser representado por: T
Var(e) = E (ee ) = 2
= s = Vs 2
ê0 0 ... 0 ú ê 0 0 ... 0 ú
onde o fator vi indica ê ú ê ú
E (ei2 ) =s 2
vi como varia a variância ëê 0 0 0 s n2 úû ë 0 0 0 vn û
de e para cada
observação Se conhecemos V podemos corrigir a equação por:
Se conhecemos vi, podemos
corrigir o modelo pela equação: é1 v1 0 0 0 ù
X1 Xk ê ú
Yi 1 e 0 1 v2 0 0 ú
=a + b1 i + ... + b 2 i + i Λy = ΛXβ + Λe onde Λ = êê
vi vi vi vi vi 0 0 ... 0 ú
ê ú
Pois, nessa equação, os erros êë 0 0 0 1 v2 úû
serão homocedásticos:
Pois:
éæ ö
2ù
e 1
E êç i ÷ ú = E (ei2 ) = s 2 E ( ΛeeT Λ) = ΛVΛs 2 = Is 2
êçè vi ÷ø ú vi
ë û 16/23
Definição
White MQP MQGF
Robusto
Mínimos Quadrados Ponderados

Definição:
Uma vez conhecida a matriz V de variâncias e convariâncias do erros de um
modelo de RLM, podemos obter os MELNV transformando as variáveis originais
pela matriz L, tal que LTL=V–1. Em outras palavras, seja o modelo:
y = Xβ + e onde Var (e) = E (eT e) = Vs 2
Então:
Λy = ΛXβ + Λe onde ΛT Λ = V -1
Apresentará erros homocedásticos, pois: E ( ΛeeT Λ) = ΛVΛs 2 = Is 2
Os estimadores de MQP serão:
βˆ = ( XT Λ T ΛX) -1 XT Λ T Λy = ( XT V -1X) -1 XT V -1y

Analogamente, teremos:
T -1 -1 2
SQRes = y T V -1y - βˆ T XT V -1y e S ˆ = ( X V X) sˆ
2
b
Esse método é denominado de Mínimos Quadrados Ponderados (MQP), um
caso específico do método de Mínimos Quadrados Generalizados (MQG).
17/23
Definição
White MQP MQGF
Robusto
MQP - V Conhecida
Mínimos Quadrados Ponderados:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Então teremos: év1 0 0 0 ù
ê0 v 0 0 ú
Var (e) = ê 2 ús 2 = Vs 2
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 v n û
Sabemos, nessas circunstâncias, que os estimadores de MQP serão os MELNV:
βˆ = ( XT V -1X) -1 XT V -1y
Caso vi seja conhecido, a matriz V–1 será dada por:
é1 v1 0 0 0 ù
ê 0 1v 0 0 ú
V -1 = ê 2 ú
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 1 vn û
18/23
Definição
White MQP MQGF
Robusto
MQP com V conhecida - Exemplo

As estimativas de MQO foram:
Supondo agora que:
Var(ei ) = X is 2
Teremos a seguinte matriz de Var-Cov dos erros:
é X 1 ... 0 ù é1 X 1 ... 0 ù
Var (e) = êê ... ... ... úús 2 = Vs 2 e V -1 = êê ... ... ... úú
êë 0 ... X 40 úû êë 0 ... 1 X 40 úû
As estimativas de MQP seriam:

é31,9ù é 323,5 - 0,46 ù
βˆ = ( XT V -1X) -1 XT V -1y = ê ú
e Sβˆ2 = ( XT V -1X) -1sˆ 2 = ê ú
ë0,14û ë - 0, 46 0,0007 û
SQRes y T V -1y - βˆ T XT V -1y
sˆ =
2
= = 1,808
n - k -1 38 19/23
Definição
White MQP MQGF Robusto
MQGF - V Desconhecida
Mínimos Quadrados Generalizados Factíveis:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Caso o fator vi seja desconhecido, podemos supor que a variabilidade dos erros
seja uma função das variáveis independentes:
d0 +d1X1i +...+d k X ki ln(ei2 ) = d 0* + d1 X1i + ... + d k X ki + ui*
ei2 =e ui
E ajustar a função linear deste modelo a partir dos resíduos de MQO:
ln(eî2 ) = d 0* + d1 X1i + ... + d k X ki + ui* d*0 e u*i são o intercepto e erro do modelo linear
Uma vez estimada esta função por MQO, as estimativas de vi serão dadas por:
dˆ0* +dˆ1X1i +...+dˆk X ki
vî = e
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora
denominada V, ^ para obtermos os estimadores consistentes (embora viesados) de
βˆ = ( XT V
ˆ -1X) -1 XT V
ˆ -1y
20/23
Definição
White MQP MQGF Robusto
MQGF com V Desconhecida - Exemplo

Supondo agora que:
d 0 +d1Rendai ln(ei2 ) = d 0* + d1Rendai + ui*
ei2 =e ui
Ajustando por MQO, estimaremos a relação de heterocedasticidade por:
ln(eî2 ) = 3,363 + 0,004Rendai + uî vî = e3,363+0,004 Rendai
évˆ1 ... 0 ù
ê ú
E a matriz de ponderações V será estimada por: Vˆ = ê ... ... ... ú
ê 0 ... vˆ ú
ë 40 û
Finalmente, as estimativas de MQP serão:
βˆ = ( XT V ˆ -1y = é22,6ù
ˆ -1X) -1 XT V
ê0,16 ú
ë û
21/23
Estimadores Robustos
Estimadores da Variância Robustos à Autocorrelação- Esimtador de White:
Yi = a + bX i + ei com heterocedasticidade dada por: Var(ei ) = vis 2
Embora os estimadores de MQO para b continuem não viesados, as estimativas de
suas variâncias serão viesadas.
Um estimador robusto, ou seja, igualmente válido na presença ou não de
heterocedasticidade, pode basear-se na real variância do estimador:
å å
n n
x s
2 2
xi
2 2
eî
ˆ
Var ( b ) = i =1 i i 2
S bˆ * = i =1
(åi =1 xi ) (åi =1 xi2 ) 2

n 2 2 n
No caso de uma RLM teríamos:

Onde ûj é o resíduo do ajuste de
åi=1uˆ 2ji eî2
n
Yi = a + å j =1 b j X ji + ei
k Xj em função das demais
S b2ˆ* =
(åi =1uˆ 2ji ) 2
n
j variáveis independentes
Esse estimador seja robusto à heterocedasticidade, atribuído a White, é válido

assintoticamente. Para amostras pequenas, as estatísticas t e F baseadas no
estimador robusto não serão válidas.
22/23
Estimador Robusto - Exemplo

Gasto Alimenti = a + bRendai + ei Gasto Alimenti = 40,8 + 0,13 Rendai + eî
^
Caso os erros sejam homocedásticos, a estimativa de MQO para Var(b ) seria:
sˆ 2 1.429
S b2ˆ = = = 0,00093 = 0,0312
åi=1 xi2
n
1.532.463
^
Por sua vez, uma estimativa robusta à heterocedasticidade para Var(b) seria:
åi=1 i eî
n2 2
x 3.421.453.919
S b2ˆ* = = = 0,0015 = 0,038 2
(åi =1 xi2 ) 2
n
(1.532.463) 2
Finalmente, a estatística t para testar a significância de b seria:
0,13 Embora haja evidências de heterocedasticidade no modelo, devemos ter

t= = 3,36 cautela na interpretação do teste t, já que esta baseada no estimador
0,038 robusto pode não ser válida para amostras pequenas (n=40).
23/23
Autocorrelação
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Identificação: Análise Gráfica, teste t, Durbin-Watson, Breusch-Godfrey;
• Correção: MQG e MQGF;
• Estimadores Robustos para a Variância;
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 13.
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto


3) Esperança condicional dos erros igual a zero, ou seja, E(e|xi)=0:

É a mesma coisa afirmar que E(Y|xi)=xi´.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=2
2/23
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Definição
Definição:
Autocorrelação significa a correlação de valores de uma mesma variável
ordenados no tempo (com dados de séries temporais) ou no espaço (com dados
espaciais). No contexto da regressão, dizemos que há autocorrelação nos termos de
erro quando:
Cov(et , et  s )  E (et et  s )  0
Sendo que o tipo mais comum de autocorrelação aquele dado por um processo o
autorregressivo de 1ª ordem, AR(1):
 é o coeficiente de autocorrelação dos erros (-1 <  < 1)
et  et 1  ut e ut são erros IID.
Não Autocorrelacionado Autocorrelacionado

e E (et et s )  0 e E (et et s )  0
t t
3/23
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Causas
Principais causas da autocorrelação:
- Inércia: séries temporais econômicas costumam apresentar ciclos, ou seja,
períodos de crescimento ou decaimento. Quando esse comportamento se reflete
nos fatores não observados (et), é comum que mudanças na tendência ocorreram
lentamente.
Yt    X t  et et  et 1  ut
- Falhas de especificação: a autocorrelação pode ser devida à ausência de um
importante regressor ou de transformação das variáveis existentes. Os erros
expressariam, assim, um padrão sistemático devido à ausência dessas informações.
Yt    X t  et Yt    1 X t   2 X t2  et
- Defasagens: as decisões econômicas em um período t dependem, muitas vezes,
de informações defasadas do período t–1. Desconsiderar esse tipo de relação
sujeitaria os erros à correlação serial.
Yt    X t  et Yt    1 X t   2 X t 1  et
ou Yt    Yt 1  X t  et
4/23
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Consequências
Ineficiência dos Estimadores de MQO
Na presenção de autocorrelação nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja ^ o estimador de
MQO, então existe outro estimador ^* tal que:
Var(ˆ*)  Var(ˆ )
Não Autocorrelacionados Autocorrelacionados

Intervalo de Intervalo de
Y Variação das
Intervalo de Y
Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO
Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Consequências
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da autocorrelação é o fato de as estimativas dos
erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para
amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes
será viesada. Em outras palavras, na presença de autocorrelação teremos:
E ( S 2ˆ )  Var( ˆ )
Seja o modelo: Yt  0  1 X t  et
 xt yt ˆ 2 não viesado na ausência de

n
Pelo MQO: ̂1  t n1 e S 2ˆ  autocorrelação e viesado na

t 1 xt2 t 1 xt2
1 n
presença de autocorrelação
Na ausência de E (et et s )  0 Var(et )   2 2 Cov(et , et s )  0


autocorrelação: Var( ˆ1 ) 
t 1 xt2
n
Na presença de 2 2
et  et  s  ut Var(et )  e Cov(et , et  s )  
s
autocorrelação: 1  2 1  2
 2
 2 n 1 n t
Var( ˆ1 )  n 2 n   s xt xt  s
t 1 xi2 t 1 xi2 t 1 s1 6/23
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
Identificação
Principais testes para se detectar a autocorrelação:
Análise gráfica: ê  t
Teste t: regressores
Identificação estritamente exógenos
Testes Durbin-Watson: MCRL

Paramétricos
Breusch-Godfrey:
autocorrelação com
ordem superior a 1
7/23
Análise Gráfica
Ausência de Autocorrelação Autocorrelação
ê ê
0 0
tempo tempo
Não há nenhum padrão evidente de

Há um padrão cíclico de dispersão
relacionamento no tempo
dos resíduos ao longo do tempo
Autocorrelação Autocorrelação
ê
ê
0 0
tempo
tempo
Há uma tendência quadrática de Há uma tendência linear na distribuição

dispersão dos resíduos ao longo do tempo dos resíduos ao longo do tempo
8/23
Análise Gráfica
Seja a relação entre a área plantada de cana-de-açucar e seu preço:
Áreat  2,54  4,79 Preçot  eˆt
Podemos suspeitar de um comportamento cíclico dos erros. Afinal, é natural supor que
a área plantada no trimestre t não dependa apenas do preço no trimesre t, mas também
de informações observadas em períodos anteriores: área plantada em um trimestre
anterior; preço pago pela cana-de-açucar no período anterior; outros fatores não
previstos pelo ajuste (política de incentivos do governo, previsões sobre os preços
futuros e expectativas sobre o estabelecimento de usinas na região, por exemplo) que
tenham lento amortecimento no tempo.
9/23
Definição
Gráfica
Teste t Watson Godfrey
MQG MQGF
Robusto
Teste t para Autocorrelação

Se supormos que os erros apresentem autocorrelação de primeira ordem:
Yt    kj 1  j X jt  et et   et 1  ut
Se estimarmos os resíduos de MQO êt, podemos testar as hipóteses:

 H 0:   0 Como correlações seriais são, usualmente, positivas, sugere-se teste

 H1:   0 unicauldal para verificar existência de autocorrelação nos erros.
Poderíamos utilizar a estatística t dada por:
t(n1)1
ˆ Caso os regressores sejam estritamente exógenos e a
t p
S ˆ amostra grande seja relativamente grande, teremos:
0
t
Sendo os estimadores de MQO dados por:
Como não observamos et,

n 2
 uˆ t
n
eˆt eˆt 1 ˆ 2 a estatística t é válida
ˆ  t  2 S ˆ  ˆ 2 t 2
assintóticamente caso os
2 2
t 2 eˆt 1 (n  1)  1
t 2 et 1
n n
ˆ regressores sejam
estritamente exógenos.
10/23
Definição
Gráfica
Teste t Watson Godfrey
MQG MQGF
Robusto
Teste t - Exemplo
Áreat  2,54  4,79 Preçot  eˆt eˆt  0,252 eˆt 1  uˆt
A estatística t associada ao coeficiente  foi:
ˆ 0,252
t   1,443
S ˆ 0,175
O valor p do teste de hipóteses será dado por:
Se rejeitarmos a hipótese de
 H 0:   0 t(341)1 ausência de autocorrelação pelo

 H1:   0 teste t, estaremos sujeitos a um
0,079 erro de 7,9%. A validade do
0 teste depende, entretanto, (i) da
1,443
ausência de relação entre os
erros et e os valores defasados
do preço da cana-de-açucar e
(ii) do tamanho da amostra, que
não é razoavelmente grande.
11/23
Teste de Durbin-Watson
Se supormos que os erros apresentem autocorrelação de primeira ordem:
Yt    kj 1  j X jt  et et   et 1  ut
A partir dos resíduos de MQO êt, iremos testar as hipóteses:

Para autocorrelação positiva ( 1), DW aproxima-se de 0.
 H 0:   0  H 0: DW  2 Para autocorrelação negativa (–1), DW aproxima-se de
 
 1
H :   0  H1: DW  2 4. Para ausência de autocorrelação DW aproxima-se de 2.
A estatística de teste será da por:
DWn,k

n
( ˆt  eˆt 1 ) 2
e
DW  t  2
Com fdp
DW  2(1  
ˆ )
t 1 eˆt 2
n dada por: p
DW
Sendo o estimador de  dado por:
A diferença entre o estimador de  da estatística de DW e o de
 et et 1 MQO está no denominador, que, no caso da estatítstica de DW,
n
ˆ ˆ
ˆ  t 2 2
t 1 eˆt também considera a primeira observação da amostra.
n
Assintoticamente os dois estimadores são válidos.
12/23
Teste de Durbin-Watson - Definição

Estatística de Durbin-Watson:
A estatística de Dubin-Watson (DW) pode ser utilizada para testar as hipóteses:

n
 H 0:   0 ˆt  eˆt 1 ) 2 t 2 eˆt eˆt 1
n
( e
 sendo DW  t  2 n ou DW  2(1  ˆ ) onde ˆ 
 H1:   0
2
 eˆt 2 t 1 eˆt
n
t 1
Teremos que:
  -1 DW  4
 0 DW  2
 1 DW  0
O fato de a estatística DW basear-se em valores estimados
DW I DWnS,k
a partir da amostra (êt), ao invés de valores observados n ,k
(et), condiciona sua distribuição de probabilidade aos
valores observados para as variáveis independentes (X).
Durbin e Watson prepararam uma tabela com possíveis 0 dI dS 4
valores extremos de DW em função no número de
variáveis independentes (k) e observações da amostra (n).
Rejeita H0: Zona
Não Rejeita H0:  = 0
Na zona de indecisão, não se pode >0 Indecisão
rejeitar nem aceitar H0, 0 dI dS 4
13/23
Teste de Durbin-Watson - Exemplo

Devemos testar:
 H 0:   0  H 0: DW  2
 
supondo et   et 1  ut
 H1:   0  H1: DW  2 que:
As estatísticas de teste serão:

Distribuição para uma amostra de 34
t 2 (eˆt  eˆt 1 )2 Como o valor de DW
n
DW   1,4745 observações (n=34) e apenas uma obtido a partir dos

t 1 eˆt
n 2 variável independente (k=1), teremos:
resíduos (1,4725) está na
DW34I ,1 DW34S ,1 região de indecisão, o
Onde: teste seria inconclusivo,
5%
 eˆ eˆ
n ou seja, não há
ˆ  t 2 t 2t 1  0,2419 5% evidências, para afirmar
t 1 eˆt
n
0 1,393 1,514 4 que os erros sejam ou não
autocorrelacionados.
DW=1,4745 14/23
Teste de Breusch-Godfrey
Supondo agora que os erros apresentam autocorrelação de ordens q:
Yt    kj 1  j X jt  et et   j 1  j et  j  ut
q
Para permitirmos que os erros defasados relacionem-se com os regressores:

et   0   j 1 j X t  j   j 1  j et  j  ut
k q
Como os erros et não são observados, trabalharemos com o modelo:
eˆt   0   j 1 j X t  j   j 1  j eˆt  j  ut

k q
χ q2
E o teste seria dado por:
H 0: 1  ...   q  0
 LM  (n  q) Reˆ2 p

H1:  j  0

LM
Onde Rê2 é o coeficiente de determinação do ajuste para os resíduos como função de seus
valores e dos regressores defasados. O valor p representará a probabilidade de erro ao
afirmarmos que os erros apresentam autocorrelação de ordem q.
15/23
Teste de Breusch-Godfrey - Exemplo

Para testarmos a autocorrelação de 1ª ordem pelo BG:
eˆt  0,043  0,022 Precot 1  0,253eˆt 1  uˆt
As hipóteses a serem testadas seriam:
 H 0:   0

 H1:   0
χ12
E a estatística de teste seria:
0,155
LM  (n  q) Reˆ2  (34  1)0,061  2,023
2,023
Se afirmássemos que há autocorrelação de 1ª ordem, estaríamos sujeitos a um erro de 15,5%
segundo o teste de BG. Diferentemente do teste t e do teste DW, que testam apenas
autcorrelação positiva, o teste BG considera também a presença de autocorrelação negativa.
16/23
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Correção Autocorrelação
Seja a equação autocorrelacionada: A equivalente matricial:
Yt    1 X 1t  ...   2 X kt  et (1) y  Xβ  e
Supondo que a autocorrelação seja dada por: A autocorrelação regressiva de 1ª ordem implica:
 1   2 ...  n1 
et  et 1  ut ut  et  et 1  
  1  ...  n2 
1  2
Var(e)    ...  n3   V
2 2
O que implica em: 1
1  
2

2 2  ... ... 
Var(et )  e Cov(et , et  s )   s
  n1
... ... ...
1  2 1  2   n2
 n 3
... 1 
O objetivo é transformar o modelo para que este Se conhecemos V a equação corrigida será
apresente erros não autocorrelacionados. dada por:
Λy  ΛXβ  Λe
1º passo) A equação (1) pode ser representada
por:  1  2 0 0 ... 0 

Yt 1    1 X 1t 1  ...   2 X kt 1  et 1 (2)   1 0 ... 0 
1
Onde Λ   0  T
2º passo) Subtraindo da equação (1) a    1 ... 0  e Λ Λ  V
equação (2) multiplicada por :  ... ... ... ... ...
 
(Yt  Yt 1 )   (1   )  1 ( X 1t  X 1t 1 )  ...  (et  et 1 )  0 0 ...   1 
* Pois:
Y* X*1 ut
que apresenta erros ut não autocorrelacionados E (ΛeeT Λ)  ΛVΛ 2  I 2
17/23
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Mínimos Quadrados Generalizados

Definição:
Uma vez conhecida a matriz V de variâncias e convariâncias do erros de um
modelo de RLM, podemos obter os MELNV transformando as variáveis originais
pela matriz , tal que T=V–1. Em outras palavras, seja o modelo:
y  Xβ  e onde Var(e)  E (eT e)  V 2
Então:
Λy  ΛXβ  Λe onde ΛT Λ  V 1
Apresentará erros não autcorrelacionados, pois: E (ΛeeT Λ)  ΛVΛ 2  I 2
Os estimadores de MQG serão:
βˆ  (XT ΛΛX)1 XT ΛΛy  (XT V 1X)1 XT V 1y

Analogamente, teremos:
SQRes  yT V 1y  βˆ T XT V 1y e S2ˆ  ( XT V 1X) 1ˆ 2
Esse método é denominado Mínimos Quadrados Generalizados (MQG).
18/23
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
MQG -  Conhecido
Mínimos Quadrados Generalizados:
y  Xβ  e com autocorrelação de 1ª ordem: et  et 1  ut
 1  2 ...  n1 
Então teremos:  
  ...  n2 
1  2
1
2 s 
2
Var(et )  e Cov(et , et  s )   Var(e)    ...  n3   V
2 2
1
1  2 1  2 1  2  
 ... ... ... ... ... 
  n1  n2  n 3 1 
 ...
Sabemos, nessas circunstâncias, que os estimadores de MQG serão os MELNV:

βˆ  (XT V 1X) 1 XT V 1y
Caso  seja conhecido, a matriz V–1 será dada por:
 1  0 ... 0 
  1   2  ... 0 

V 1  0   1  2 ... 0 
 
 ... ... ... ... ...
 0 0 ...   1 
19/23
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
MQG com  conhecido - Exemplo

Supondo agora que:
et  0,5et 1  ut ou seja   0,5
Teremos a seguinte matriz de Var-Cov dos erros:
 1 0,5 0,52 ... 0,533   1  0,5 0 ... 0
   0,5 1  0,52  0,5 ... 0 
... 0,532  
1  2
0,5 1 0,5
Var(e)  0,5  1 ... 0,531   V
2 2
e V 1   0  0,5 1  0,52 ... 0
1  0,52    
 ... ... ... ... ...   ... ... ... ... ...
0,533 0,532 0,531 1   0 0 ...  0,5 1 
 ...
As estimativas de MQG seriam:

 727 ,4  2135 
ˆβ  ( XT V 1X) 1 XT V 1y   3,34  e Sβˆ2  ( XT V 1X) 1ˆ 2   
505,64 
   2135 8233,4
SQRes y T V 1y  βˆ T XT V 1y
ˆ 
2
  1563,9
n  k 1 32 20/23
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF Robusto
MQGF -  Desconhecido
y  Xβ  e com autocorrelação de 1ª ordem: et  et 1  ut
Então teremos:  1  2 ...  n1 
 
  ...  n2 
1  2
1
2 2
Var(et )  e Cov(et , et  s )   Var(e)  ...  n3   V
s
 
2 2
1
1  2
1  2 1  2  
 ... ... ... ... ... 
  n1  n2  n 3 1 
 ...
Caso  seja desconhecido, podemos trabalhar com uma estimativa de MQO:

eˆt  êˆt 1  uˆt
Nesse caso, os estimadores consistentes de , embora viesados para amostras
pequenas, serão dados por:  1  ˆ 0 ... 0 
 ˆ 1  ˆ 2  ˆ ... 0 

βˆ  (XT V
ˆ 1X) 1 XT V
ˆ 1y onde V 1   0  ˆ 1  ˆ 2 ... 0 
 
 ... ... ... ... ...
 0 0 ...  ˆ 1 
21/23
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF Robusto
MQGF - Exemplo
Seja a relação entre a área plantada de
cana-de-açucar e seu preço:
Temos ainda que:
eˆt  0,252 eˆt 1  uˆt ou seja ˆ  252
Teremos então as seguintes estimativas para as matrizes de transformação:
 1 0,252 0,252 2 ... 0,252 33   1  0,252 0 ... 0
   0,252 1  0,252 2  0,252 ... 0 
 0,252 1 0,252 ... 0,252 32  
ˆ 
V
1  2
 ... 0,252 31  e Vˆ   0
1
 0,252 1  0,252 2 ... 0
2 0,252 1
 
1  0,252  
 ... ... ... ... ...   ... ... ... ... ...
0,252 33 0,252 32 0,252 31 1   0 0 ...  0,252 1 
 ...
As estimativas de MQGF seriam:

 0 ,007 
βˆ  ( XT V 1X) 1 XT V 1y   
4,903 
22/23
Estimadores Robustos
Estimadores da Variância Robustos à Autocorrelação:
Yt    X t  et com autocorrelação de 1ª ordem: et  et 1  ut
Embora os estimadores de MQO para  continuem não viesados, as estimativas de
suas variâncias serão viesadas.
A real variância do estimador para o coeficiente angular seria:
2 2 n 1 n t
Var( ˆ )  2   s xt xt  s
t 1 xt2 t 1 xt
n n 2
t 1 s 1
Um estimador simples para a variância poderia ser obtido por:

ˆ2 ˆ 2 n1 nt s
Var( ˆ )  n 2 n  ˆ xt xt s
t 1 xt2 t 1 xt2 t 1 s1
Embora esse estimador seja robusto à presença de autocorrelação, considera
apenas autocorrelações de 1ª ordem e erros homocedásticos. Há tratamentos mais
abrangentes na literatura. Essas estimativas são válidas assintoticamente e podem
não ser apropriadas para amostras pequenas.
23/23

Regressão Linear Simples: Estimadores e Inferência

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Regressão Linear Simples: Estimadores e Inferência

Enviado por

Direitos autorais:

Formatos disponíveis

Regressão Linear Simples

1 Passo) Definir Erro Quadrático Total: A função EQT é

Y3 = 300 150.000 200 200.000

Para este conjunto de dados, o valor de  que minimizaria a função

Y Função de regressão amostral:

Para encontrar os valores que minimizam a função EQT:

Para simplificar os cálculos, podemos demonstrar que essas expressões podem

Yi  ˆ  ˆX i  eˆi Yi  2,71  1,29 X i  eˆi 10 6

ˆ  Y  βˆ X  8,5  1,29(4,5)  2,71

Os estimadores de MQO variarão aleatoriamente em função dos valores

Não Autocorrelacionado Autocorrelacionado

A autocorrelação é frequente em análise de séries temporais de dados

O ajuste só é válido para relações lineares.

3) Esperança condicional dos erros igual a zero, ou seja, E(e|Xi)=0:

0 ̂ valor obtido pela amostra

Teste de hipótese para 1: βˆ~N (0,  2 )

0 ˆ valor obtido pela amostra

As estimativas das variâncias dos erros e dos estimadores de 12 7

Teste de hipótese para 0: t2

Teste de hipótese para 1: t2

Soma dos Quadrados da Regressão (SQReg)

0 A significância das escalas depende muito da 1

é a mesma coisa que...

A estimativa do coeficiente angular sugere que, para cada aumento unitário na

E[ln(Y ) / 0]     (0)   E[Y / 0]  e

 ln(Y ) d ln(Y ) d (  X ) Y / Yi  ln( Y ) 1 Y

Espera-se, para cada ano adicional de escolaridade (X=1), um incremento relativo

Xi Xi+1 ln(Xi) ln(Xi+1)

Espera-se que, para cada variação relativa de 1% no rendimento hora do trabalho,

Xi Xi+1 ln(Xi) ln(Xi+1)

O coeficiente angular sugere um demanda relativamente elástica às variações no

Função de Regressão Populacional

Função de Regressão Amostral

Y Função de regressão amostral:

EQT  (Y1  Yˆ1 ) 2  (Y2  Yˆ2 ) 2  ...  (Yn  Yˆn ) 2

Temos que: Temos que:

Regressão Múltipla - Exemplo

O coeficiente  indicará o consumo esperado de

Regressão Múltipla - Definição

MQO em Notação Matricial - RLS

MQO em Notação Matricial - RLM

yn1 Xnp p1 en1

Regressão Múltipla - Exemplo

Soma dos Quadrados - Conceito

Soma dos Quadrados - Definição

Soma dos Quadrados da Regressão (SQReg):

Escala para R2:

Soma dos Quadrados - Exemplo

Teste F para ANOVA- Exemplo

Possíveis resultados do modelo:

10 20 1=0 20 10 2=0 1=0 2=0

Teste F para ANOVA

H0: 1=...=k =0 (não contribui)

Teste F para ANOVA - Exemplo

O R2 nunca diminui quando incorporamos variáveis

Variância dos Estimadores

Onde 2 é a variânica dos erros ou variância da regressão e 

Teste t para Coeficientes

H1: j0 (Variável Xj não tem relação isolada com Y) X1 X2

Sob as premissas do MCRL, o estimador de MQO para j , além de não viesado e de

p/2 p/2 p/2 p/2

Teste t para Coeficientes

Teste t para Coeficientes - Exemplo