Escolar Documentos
Profissional Documentos
Cultura Documentos
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Estimador de MQO para RLS;
• Teorema de Gauss-Markov;
• Variância dos Estimadores;
• Teste t para os coeficientes;
• Análise de Varância
Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 1-3; 5.
Mínimos Quadrados - EQT
Supondo que Y seja uma função de : Yi = + ei
e3
e2 e4 e1 = Y 1 –
e5 Os erros ei
e1 e2 = Y 2 – representam os
Y1 Y2 Y3 Y4 Y5
e3 = Y 3 – erros de
mensuração de Y a
e4 = Y 4 – partir de .
e5 = Y 5 –
Y1 = 100
EQT() 350.000
300.000
Y2 = 200 300.000 100 250.000
i 1 i 1
^
2 Passo) Encontrar que minimiza EQT:
dEQT
0
EQT
dθˆ
n n n
dEQT
2(Yi θˆ)( 1) 2 Yi 2 θˆ
dθˆ i 1 i 1 i 1
n
EQT
dEQT n Yi θˆ
0
2 Yi 2nθˆ 0 θˆ i 1
dθˆ i 1 n ^ ^
*
Função de Regressão Populacional
Seja a relação entre Y e X na população:
Yi = + Xi + ei Modelo de Regressão
Y ou Linear Simples para Y
Yi
E(Y/Xi) = + Xi na população
ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou explanatória
é o intercepto ou constante do modelo
Xi X é o coeficiente angular do modelo
Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo
Interpretação dos Coeficientes
Y Para cada valor controlado de X, teremos
e3 um valor esperado de Y.
e2 O erro representa variáveis omitidas ou
e1 mesmo dificuldades para mensurar aquelas
E(Y1) presentes no modelo.
Pressupõe-se que o efeito do erro seja
mínimo e que este esteja aleatoriamente
distriuído em torno da reta de regressão.
X1 X2 X3
X
Para compreendermos a interpretação
Y dos coeficientes do modelo:
O intercepto representa o valor esperado de Y
quando o valor controlado de X for nulo:
E(Yi) Y
X E (Y / 0) (0)
O coeficiente angular , por sua vez, representa
E(Y/0)= a variação marginal no valor esperado de Y
dada uma variação unitária em X
E (Y ) dE(Y ) d ( X )
0 Xi
X
X dX dX
Função de Regressão Amostral
Em uma amostra, a relação entre Y e X será dada por:
i 1 i 1
Método de Mínimos Quadrados
Mínimos Quadrados Ordinários:
Y
O método de mínimos quadrados ordinários (MQO)
ê6
ên ajustará a reta que apresentar as menores distâncias
ê4
ê2 ê5 quadráticas entre os valores observados e a reta (êi).
ê3 Em outras palavras, os estimadores de MQO dos
ê1 parâmetros e minimizarão o valor da função de
Erro Quadrático Total (EQT), dada por:
n
EQT [Yi (αˆ βˆX i )]2
X i 1
EQT
X iYi n X Y
2i 1[Yi (ˆ ˆX i )]( X i ) 0
n i 1
(2) β̂
βˆ
n
Xi2 n X
2
i 1
Estimadores de MQO
Estimadores de Mínimos Quadrados Ordinários:
Seja o modelo de Regressão Linear Simples (RLS) para o conjunto de dados
populacionais e sua equivalente representação na amostra:
Yi X i ei Yi ˆ ˆX i eˆi (3)
Os estimadores de MQO para os parâmetros e , ou seja, os estimadores que
minimizam o valor de êi2, serão
n
dadas por:
X iYi n X Y
ˆ Y βˆ X e βˆ i 1
n
Xi2 n X
2
i 1
Onde: xi X i X e yi Yi Y
Estimadores de MQO - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de
estudo (X) do responsável pela família: Y X
Yi X i ei (Renda) (Anos
Estudo)
A partir dos dados de uma amostra de 4 oobservações, os 4 1
estimadores de MQO para a função amostral serão: 8 4
12 7
Y=^+^X+e
^
Função ajustada
para amostra 1
X X
X X
Modelo é linear nas variáveis pois todos Modelo não é linear nas variáveis pois o
os expoentes de Y e X são iguais a 1. expoente de X não é igual a 1.
Modelo é linear nos parâmetros pois Modelo é linear nos parâmetros pois
todos os expoentes dos parâmetros são todos os expoentes dos parâmetros são
iguais a 1. iguais a 1.
2- Valores de X são Fixos
Pressupõe que o valor de X seja controlado em repetidas amostras para
se observar variações aleatórias de Y.
Yi X i ei
Y Premissa utilizada em inúmeras
demonstrações, embora seja, muitas
vezes, pouco factível. Nessas
E(Y1)
circunstâncias, cuidados adicionais
deverão ser tomados para que as
E(Y2) estimativas de MQO não sejam viesadas.
X1 X2 X
3 - Esperança Condicional Zero
Os erros apresentam esperança condicional zero, ou seja, esses não
podem estar associados aos regressores.
E (e | X i ) E (ei ) 0 E (Y / X i ) X i
Y
A média dos erros associados a cada
Yi valor controlado de X será sempre 0,
ei não importa qual seja o valor de X.
E(Y/Xi)
Xi X
4 - Homocedasticidade
A variabilidade dos erros deve ser constante, qualquer que seja o valor
de :X
Var(ei / X i ) 2
Homocedasticidade Heterocedasticidade
Y Y
E(Y2) E(Y2)
Var(e2)=2
E(Y1) E(Y1) Var(e2)=22
Var(e1)=2 Var(e1)=21
X1 X2 Xj X1 X2 Xj
5 – Ausência de Autocorrelação
Não há correlação entre os erros do modelo regressão:
Cov(et , et s ) E (et et s ) 0
t t
Var(ˆ ) E (ˆ ) 2
X i
2
2
S 2
X i
2
ˆ 2
1
X 2
ˆ 2
n xi2 n xi2 n xi
ˆ 2
2 ˆ 2
Var( ˆ ) E ( ˆ )
2
S 2ˆ
xi2 xi2
Onde 2=Var(ei) é a variânica dos erros ou variância da regressão e
^ 2 seu
respectivo estimador, dado por:
ˆ 2
i i ̂ xi yi
e
ˆ 2 i onde ˆ
e 2
y 2
n2
Teste t para os Estimadores
Então, para verificar que os estimadores de MQO são significativos:
Teste de hipótese para : ˆ~N (0, ̂2 )
H0: =0
p é a probabilidade de erro
ao afirmar que é
Sob a hipótese de H0 ser
H1: 0 verdadeiro temos... p/2 p/2
significativo no modelo
ˆ 2 ˆ
ei
2
0,2857
0,1429 0,3780 2
n2 42
1 X 2 2 1 4,52
S2ˆ ˆ 0,1429 0,1735 0, 4165 2
n xi
2
4 21
ˆ 2 0,1429
S ˆ
2
0,0068 0,0825 2
xi2 21
Teste t- Exemplo
Conhecendo os erros padrões e a fdp dos estimadores, temos que:
Y Y
^
Y
^
Y
X X
n n n
STQ (Yi Y ) 2 ˆ Y)2
SQReg (Y ˆ )2
SQRes (Yi Y
i i
i 1 i 1 i 1
Soma dos Quadrados
Soma Total dos Quadrados (STQ)
Mensura a variabilidade total da variável dependente.
n n
STQ (Yi Y ) yi 2
2
i 1 i 1
SQ Re g
(Yˆi Y )2 eˆi2 xi2
R2 i 1
n
1 i 1
n
ˆ12 i 1
n
STQ
(Yi Y )2 yi2 yi2
i 1 i 1 i 1
Escala de R2:
Conclusão:
Rejeito H0 se valor p .
Análise de Variância
Tabela ANOVA (Analysis Of Variance)
Soma dos Quadrados
Fonte GL F
Quadrados Médios
n SQReg/1
Regressão 1 ˆ Y)
SQReg (Y 2 SQReg F
i SQRes/(n - 2)
i 1 1
n SQRes
Resíduos n-2 ˆ )2
SQRes (Yi - Yi n-2
i 1
n
Total n -1 STQ (Yi Y )2
i 1
Rejeito H0 quando valor p – prob (F > F1, n-2) - for menor que
nível de significância esperado ().
Formas Funcionais
Econometria
Alexandre Gori Maia
Ementa:
• Definição: modelos lineares e não lineares;
• Modelo Linear;
• Modelo Log-Linear;
• Modelo Linear-Log;
• Modelo Log-Log.
Bibliografia Básica:
-Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 4.
Modelos Não Lineares
Linearidade nos parâmetros Linearidade nos parâmetros
e nas variáveis
Yi α βX i2 ei
Y Yi α βX i ei Y
X X
Modelo é linear nas variáveis pois todos Modelo não é linear nas variáveis pois o
os expoentes de Y e X são iguais a 1. expoente de X não é igual a 1.
Modelo é linear nos parâmetros pois os Modelo é linear nos parâmetros pois os
expoentes de e são iguais a 1. expoentes de e são iguais a 1.
Modelos Lineares nos Parâmetros
Modelos não lineares nas variáveis podem tornar-se lineares por anamorfose:
Yi α βX i2 ei Yi α βZ i ei
Y Y
X Z=X2
Relações não lineares nas variáveis podem ser transformadas em relações lineares por
anamorfose, ou seja, por transformações de suas variáveis originais.
A escolha da forma funcional (tipo de transformação das variáveis) depender á da análise
dos valores e, principalmente, do conhecimento prévio das relações por parte do
pesquisador.
Constatada a linearidade nas variáveis, os coeficiente (’s) de modelos lineares por
anamorfose são estimados de maneira análoga pelo método de mínimos quadrados.
Formas Funcionais
As formas funcionais mais utilizadas em análises econômicas sâo:
Y Y
Yi β0 β1 X i ei β0 β1 0
1) Modelo linear: β1 0 ou
β0
X X
Y β1 1
Y 0 β1 1
2) Modelo log-log: ln(Yi ) β0 β1ln(X i ) ei 1 β1 0 ou
X X
Y Y
β1 0
3) Modelo log-lin: ln(Yi ) β0 β1 X i ei β1 0 ou
X X
Y Y β1 0
4) Modelo lin-log: Yi β0 β1ln(X i ) ei β1 0
ou
X X
Y Y
1 β0
5) Modelo inverso: Yi β0 β1 X ei β1 0 ou β1 0
i
β0
X X
Modelo Linear
Forma Funcional: Yi X i ei
Pressupõe que Y apresente aumentos (ou reduções) absolutos constantes dadas
variações absolutas em X.
Y E[Y / 0] (0)
é o valor esperado de Y para valores
+Xi+1 nulos de X
Y=
+Xi
X=1 Y dY d ( X )
X dX dX
é a variação marginal absoluta no
valor esperado de Y (Y) dada uma
0 Xi Xi+1 variação unitária em X (X=1).
X
A variação marginal no valor esperado de Y é a mesma para qualquer valor de X.
Modelo Linear
Qual o efeito da temperatura média diária (°C) sobre as vendas de sorvete?
Pressupondo que a relação entre total de
vendas de uma sorveteria (Y, em 1.000
R$) e a temperatura média (X, em oC) seja
linear:
Yi βX i ei
De onde obtemos:
Vendasi 1,04 0,12Tempi ei
0 Xi Xi+1 0 Xi Xi+1
X X
Temos que:
+ln(Xi+1) +ln(Xi+1)
Y= +ln(Xi) Y=
+ln(Xi)
X=Xi ln(X)=1
e+ln(Xi+1) +ln(Xi+1)
Y=Yi +ln(Xi) ln(Y)=
e+ln(Xi)
X=Xi ln(X)=1
Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 6.
Definição MQO Gauss-Markov
ei Onde:
E(Y/Xi) Y é a variável dependente ou regressando
X é a variável independente ou regressor
é o intercepto ou constante do modelo
Xi X é o coeficiente angular do modelo
Erro de previsão:
Seja Xi a i-ésima observação de X, teremos:
Yi é o valor observado em Y para o i-ésimo valor de X
E(Y/Xi) é a esperança condicional de Y e representa o valor esperado de Y
para o i-ésimo valor de X
ei é o erro, ou variação de Yi não explicada pelo modelo 2/11
Definição MQO Gauss-Markov
i 1 i 1 3/11
Definição MQO Gauss-Markov
Regressão Múltipla
Regressão Linear Simples: Regressão Linear Múltipla:
Yi X i ei Yi 1 X 1i 2 X 2i ei
X1 X2
Onde: Onde:
EQT (ˆ , ˆ ) eˆi2 [Yi (ˆ ˆX i )]2 EQT (ˆ , ˆ1 , ˆ2 ) eˆi2 [Yi (ˆ ˆ1 X 1i ˆ2 X 2i )]2
Minimizando EQT: Minimizando EQT:
EQT
EQT 0 ˆ Y ˆ1 X1 ˆ2 X 2
0 ˆ Y ˆX ˆ
ˆ
EQT ˆ ( yi x1i )( x22i ) ( yi x2i )( x1i x2i )
EQT xi yi 0 1
0 ˆ ˆ1 ( x12i )( x22i ) ( x1i x2i ) 2
ˆ xi2 EQT ( yi x2i )( x12i ) ( yi x1i )( x1i x2i )
0 ˆ2
ˆ2 ( x12i )( x22i ) ( x1i x2i ) 2
4/11
Definição MQO Gauss-Markov
Regressão Múltipla
Regressão Linear Simples: Regressão Linear Múltipla:
Yi X i ei Yi 1 X1i 2 X 2i ei
X1 X2
7/11
Definição MQO Gauss-Markov
Y1 1 X 11 2 X 21 ... k X k1 e1 Y1 1 X 11 X 21 ... X k1 e1
Y2 1 X 12 2 X 22 ... k X k2 e2 Y2 1 X 12 X 22 ... X k2 1 e2
... ... ... ...
... ... ... ...
...
Yn 1 X 1n 2 X 2n ... k X kn en Y 1 X
n 1n X 2n ... X kn k en
Yi 1 X 1i 2 X 2i ei y Xβ e Y X1 X2
(Renda) (Anos (Idade)
Estudo)
A função de regressão amostral será dada por:
4 1 1 20 ˆ eˆ1 4 1 20
ˆ 8 1 4 30 ˆ eˆ2 8 4 30
y Xβ e
ˆ 10 1 6 40 1 eˆ
ˆ 3
10 6 40
12 1 7 50 2 eˆ
4 12 7 50
^
y41 X43 31 ê41
E as estimativas de MQO:
1
4 18 140 34 1,9
βˆ (XT X)1(XT y) 18 102 730 180 1
140 730 5400 1320 0,06
Espera-se, para cada ano adicional de estudo do
responsável pela família, um aumento de 1 SM e,
para cada ano de idade adicional, um aumento de
0,06 SM na renda familiar. 10/11
Definição MQO Gauss-Markov
Teorema de Gauss-Markov
Método de Mínimos Quadrados
Seja o modelo de regressão múltipla representado matricialmente por:
y Xβ e
O estimador de MQO para o vetor de coeficientes que minimizará o erro
quadrático total do modelo será dado por:
βˆ p1 (X T X) 1 (XT y)
Caso os pressupostos do Teorema de Gauss-Markov sejam válidos, os estimadores
de MQO serão os MELNV dos coeficientes de um modelo de RLM.
1. A v.a. Yi é uma função linear das variáveis explanatórias (Xij, j=1..k);
2. Os valores de Xj são fixos;
3. Os erros possuem esperança condicional zero, ou seja, E(ei)=0;
4. Os erros são homocedásticos, ou seja, E(ei2)=2; E(ee’)=I2
5. Os erros são não-correlacionados, ou seja, E(eiej)=0, para ij;
E, para que tenhamos um modelo clássico de regressão linear:
6. Os erros estão normalmente distribuídos;
11/11
Análise de Variância
Econometria
Alexandre Gori Maia
Ementa:
• Soma dos Quadrados;
• Coeficiente de Determinação;
• Teste F para Tabela ANOVA;
• Coeficiente de Determinação Ajustado;
Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 7.
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado
Y Y
^
Y
^
Y
X X
n n n
STQ (Yi Y ) 2
SQReg (Yˆi Y ) 2 SQRes (Yi Yˆi ) 2
i 1 i 1 i 1
2/11
Coeficiente de
Soma dos Quadrados Determinação
Teste F ANOVA R2 Ajustado
i 1 i 1
X1 X2
Variabilidade total da variável dependente. Representa as distâncias
quadráticas dos valores de Y em relação à média aritmética.
Análise de Variância
Soma dos Quadrados
Fonte GL Quadrados F
Médios
SQReg F
SQReg/k
Regressão k βˆ T XT y nY 2 k SQRes/ (n k 1)
SQRes
Resíduos n (k 1) y y βˆ T XT y
T
n (k 1)
Total n 1 yT y nY 2
4/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação
Coeficiente de Determinação
Coeficiente de Determinação (R2):
Definição: Estima a proporção da variabilidade da variável dependente
(Y) que é explicada pelo conjunto das k variáveis independentes do
modelo de regressão (X).
Y
SQReg SQRes
R2 1 X1
STQ STQ X2
0 1
Independência Relação
linear linear exata
5/11
Coeficiente de
Soma dos Quadrados Teste F ANOVA R2 Ajustado
Determinação
Y X1 X2
(Renda) (Anos (Idade)
Estudo)
4 1 20
8 4 30
10 6 40
12 7 50 SQReg 34,8
R2 0,994
4 STQ 35
As variáveis anos de estudo e
8
STQ y y nY 4 8 10 12 4(8,5) 324 289 35 idade explicam, conjuntamente,
T 2 2
10
quase a totatilidade (99,4%) da
12
variabilidade observada para a
34 renda familiar na amostra.
SQReg βˆ T XT y nY 2 1,9 1 0,06 180 4(8,5) 323,8 289 34,8
2
1320
SQ Re s STQ SQ Re g 35 34,8 0,2
6/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado
H 0 : 1 2 0
E as hipóteses:
H1 : Pelo menos um j 0
Y Y Y
Y
X2 X1
X1 X2
X1 X2 X1 X2
7/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado
8/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado
SQReg/ 2
~ F2 ,1
SQRes/1
0,076
F 87,0
valor p = 0,076
Há evidências moderadas para
afirmar que o modelo contribui
para explicar a variabilidade da
renda familiar. A probabilidade de
erro ao fazermos tal afirmação é
de aproximadamente 7,6%.
9/11
Coeficiente de
Soma dos Quadrados
Determinação
Teste F ANOVA R2 Ajustado
R2 Ajustado - Definição
Seja o ajuste: Incorporando uma variável independente adicional (X3):
Yi ˆ1 X 1i ˆ2 X 2i eˆi Yi ˆ1 X 1i ˆ2 X 2i ˆ3 X 3i eˆi
Poderemos ter: Ry2123 Ry212
Ry2123 Ry212
SQReg
Y Ry212 Y Y
STQ X3 X3
SQReg SQReg ou SQReg
X1 X X1 X2 X1 X
2 2
R2 Ajustado - Exemplo
Seja a relação entre renda familiar em salários mínimos (Y), anos de estudo (X1) e
idade (X2) do responsável pela família: Y 1,9 1X 0,06 X eˆ
i 1i 2i i
R 2 0,994
4 1
R 2 1 (1 0,994) 0,982
4 (2 1)
Não há mudanças expressivas no coeficiente de determinação ajustado pelo número de
observações e variáveis do modelo é expressivamente inferior ao R2. Reflexo, sobretudo,
do elevadíssimo valor encontrado para o R2.
11/11
Inferência em Regressão Múltipla
Econometria
Alexandre Gori Maia
Ementa:
• Variância dos estimadores;
• Teste t para os coeficientes;
• Combinação linear dos parâmetros;
• Intervalo de Confiança para os valores previstos;
Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: Conceitos e Aplicações. Cap. 8.
Variância dos
Teste t Combinação Linear Intervalo Confiança
coeficients
2/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança
Sj 2 S ˆ
j
Se H0 é verdadeiro, então...
H1: j 0
Dados: p/2 p/2
^ 0 ̂ j
j = estimador de MQ
ˆ j 0 t ~ tn-(k1)
S^j = erro padrão do estimador t nk1 são os
S ˆ
valor p = nível de significância
j graus de
liberdade dos
observado
p/2 p/2 resíduos
0 t
Conclusão:
Rejeito H0 se valor p (prob de erro ao rejeitar H0) for baixa. Nestas
circunstâncias, posso afirmar que o estimador é significativo.
4/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança
A combinação linear dos parâmetros pode ser utilizada em teste de hipóteses para
combinações dos parâmetros ou intervalos de confiança para os valores previstos.
6/10
Variância dos coeficients Teste t Combinação Linear Intervalo Confiança
Intervalo de Confiança
Seja o modelo de RLM: E seu ajuste de MQ:
Yi 1 X 1i 2 X 2i ... k X ki ei Yi ˆ ˆ1 X 1i ˆ2 X 2i ... ˆk X ki ei
A esperança condicional de Y também é uma Assim como o valor previsto da amostra é uma
combinação linear dos parâmetros: combinação linear dos estimadores:
E (Yi / X 1i ,..., X ki ) 1 X 1i 2 X 2i ... k X ki Yˆ ˆ ˆ X ˆ X ... ˆ X
i 1 1i 2 2i k ki
ou, matricialmente: ou, matricialmente:
ˆ
ˆ1
E (Yi / X 1i ,..., X ki ) xT β 1 X 1i X 2i
... X ki 1
...
Yˆi xT βˆ 1 X 1i X 2i
... X ki
...
ˆ
k Tˆ k
Onde: x β ~ N (x β, xT β̂ )
T 2
Bibliografia Básica:
Maia, Alexandre Gori (2017). Econometria: Conceitos e Aplicações. Cap. 9.
Definição ANOVA Correlação Parcial
Contribuição Marginal
Seja o modelo de RLS: Seja o modelo de RLM:
Y 1 X1 e Y 1 X1 2 X 2 e
Contribuição
Contribuição marginal de
marginal de Variabilidade X2 em Y
Variabilidade X1 em Y total de Y
total de Y
Variabilidade
de Y Variabilidade Variabilidade
Variabilidade explicada por total de X2
total de X1 total de X1
X1
Contribuição
conjunta de X1 e X2
sobre Y
O grau de relacionamento linear entre X1 e Y Qual a parcela da variabilidade de Y
determinará a parcela da variabilidade de Y explicada unicamente por X2?
explicada unicamente por X1. Em outras palavras, qual a contribuição
marginal de X2, depois de considerada a
contribuição de X1? 2/13
Definição ANOVA Correlação Parcial
QMRegcontribuiç ão
Contribuição q SQ Re gir SQ Re g r (SQ Re gir SQ Re g r ) F QMResir
q
QMRegir
Regressão Irrestrita k SQ Re g ir SQ Re gir / k F
QMResir
6/13
Definição ANOVA Correlação Parcial
7/13
Definição ANOVA Correlação Parcial
rY 1.23...k
O rY1.23...k é a correlação parcial entre Y e X1, mantendo-se constantes os efeitos das
k–1 variáveis independentes restantes. Seu quadrado, r2Y1.23...k é o respectivo
coeficiente de determinação parcial.
9/13
Definição ANOVA Correlação Parcial
Y Y r2y1.2
Y
X2 X2
X1 X1 X2
X1
10/13
Definição ANOVA Correlação Parcial
R 2 rY22
r 2
Y1.2
1 rY22
11/13
Definição ANOVA Correlação Parcial
Y Y r2y1.2=0,833
Y
X2 X2
X1 X1 X2
X1
12/13
Definição ANOVA Correlação Parcial
Onde:
xy
n
27
rY 1 i 1 1i
0,9959
i
x y
n n
2 2 ( 21 )( 35 )
i 1 i
1 i 1 i
x y
n
130
rY 2 i 1
0,9827
2i i
x y
n n
2 2 ( 500 )( 35 )
i 1 2i i 1 i
xx
n
100
r12 i 1 1i 2 i
0,9759
x x
n n
2 2 ( 21 )( 500 )
i 1 1i i 1 2i 13/13
Multicolinearidade
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Fator Inflacionário da Variância;
• Identificação: Estatística Conflitantes e Ajsute entre Regressores;
• Medidas Paliativas;
Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 10.
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Conceito
Seja o modelo definido por: Y 1 X1i 2 X 2i ei
Variabilidade de Variabilidade Se X1 e X2 são independentes, a
Y explicada por de Y explicada variabilidade de Y explicada pelo modelo
X1 (SQReg1) Variabilidade por X2
de RLM divide-se em duas partes
total de Y (SQReg 2 )
disjuntas: o efeito isolado de X1 (SQReg1)
e o efeito isolado de X2 (SQReg2).
Variabilidade Teríamos ainda os mesmos coeficientes
Variabilidade total de X2 angulares das regressões simples:
total de X1
Y 1 1 X1i e1i SQ Re g1
Y 2 2 X 2i e2i SQ Re g 2
Variabilidade No outro extremo, poderíamos ter uma
total de Y
relação linear exata entre X1 e X2 (perfeita
colinearidade), ou seja:
Efeito
conjunto de X1i 2 X 2i
Variabilidade X1 e X2
X Nesta situação, seria impossível estimar
conjunta 1de X1 sobre Y
e X2 os efeitos isolados de X1 e X2 sobre Y.
2/11
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Conceito
Seja o modelo definido por: Y 1 X1i 2 X 2i ei
Frequentemente observamos relação entre
Efeito Efeito
Variabilidade
isolado de isolado de as variáveis independentes X1 e X2 e,
total de Y
X1 em Y X2 em Y nesses casos, oefeito sobre Y poderá ser
dividido em 3 partes: i) efeito isolado de
X1; ii) isolado de X2; e iii) efeito conjunto
Variabilidade de X1 e X2.
Variabilidade total de X2
total de X1 O problema é que quando há uma forte
relação linear entre X1 e X2
Efeito conjunto de (multicolinearidade) pode ficar muito
X1 e X2 sobre Y difícil identificar os efeitos isolados de X1
Efeito
Efeito
isolado de
isolado de
e X2 sobre Y. Ou seja, a maior parcela da
X1 em Y Variabilidade
total de Y X2 em Y variabilidade de Y é explicada pelo efeito
conjunto de X1 e X2.
Efeito
Algebricamente, essa relação de
conjunto de multicolinearidade seria dada por:
X2
X1 X1 e X2 X1i 2 X 2i vi
sobre Y
3/11
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Definição
Colinearidade Perfeita
Duas variáveis são ditas perfeitamente colineares quando há uma relação linear
exata entre essas. De maneira genérica, podemos representar a linearidade perfeita
por: X j 1 X 1 2 X 2 ... k X k
i i i i
Multicolinearidade
Há multicolinearidade em um modelo de regressão múltipla quando duas ou mais
variáveis independentes são fortemente relacionadas linearmente entre si. Nesse
caso, teríamos: X j 1 X 1 2 X 2 ... k X k vi
i i i i
Conseqüências da Multicolinearidade
A existência de uma colinearidade exata entre duas ou mais variáveis
independentes torna impossível a obtenção dos coeficientes dos parâmetros por
MQO. Por sua vez, na presença de muiltcolinearidade os estimadores de MQO
continuam sendo os MELNV. O problema é que a multicolinearidade torna muitas
vezes as estimativas dos coeficientes dos parâmetros (’s) insignificantes, já que
cada um pressupõe, por definição, a variação em Y dada uma variação unitária em
X, mantendo-se constantes as demais informações. Ou seja, se duas variáveis
independentes são fortemente correlacionadas, tornár-se-á muito difícil haver
variação em uma sem que haja em outra. 4/11
Definição FIV Identificação Medidas Paliativas
5/11
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Identificação
Alguns sinais de multicolinearidade:
Conflito entre estatísticas R2 e F do modelo e testes t para os parâmetros : as
estatísticas R2 e F podem indicar um modelo significativo, enquanto os testes t dos
parâmetros ´s seriam insignificantes.
Y 1 X1i 2 X 2i ei H 0 : 1 2 0 X H 0 : 1 0 e H 0 : 2 0
6/11
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Exemplo
Sejam as informações sobre emissões de CO2, PIB e população de 8 países:
CO2 1.5 8.7 2.8 9.4 4.4 8.4 3.2 0.9
PIB 13.2 197.0 128.6 286.4 72.6 167.8 114.4 58.0
Pop 3.2 35.5 19.1 40.4 3.1 22.3 8.4 9.0
O ajuste de MQO forneceu os seguintes resultados para o modelo:
CO2 β0 β1 PIB β2 Pop e CO2 0,472 0,030PIB 0,028 Pop eˆ
Para a tabela ANOVA:
Fonte gl SQ QM F p CO2
Regressão 2 63.9 31.9 8.80 0.023
Resíduos 5 18.2 3.6
PIB Pop
Total 7 82.0
E para os testes t dos coeficientes:
Embora o ajuste seja significativo no
Variável ^ S^ t p
conjunto (teste F), as contribuições
Intercepto 0.472 1.328 0.356 0.737 marginais de cada variável são
PIB 0.030 0.025 1.226 0.275 insignificantes. Resultados que sugerem
a presença de multicolinearidade.
Pop 0.028 0.150 0.183 0.862 7/11
Definição FIV Identificação Medidas Paliativas
Multicolinearidade - Exemplo
Para nos certificarmos da presença de multicolinearidade, relacionamos os
regressores PIB e Pop:
O ajuste de MQO forneceu os seguintes resultados para a relação entre os regressores:
Multicolinearidade - Correção
Alguma medidas paliativas na presenção de multicolinearidade:
Aumentar o tamanho da amostra: aumentando o tamanho da amostra estaremos
aumentando a variabilidade de Xj e, conseqüentemente, reduzindo a variância do
estimador de j.
2
9/11
Definição FIV Identificação Medidas Paliativas
Bibliografia:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap 11.
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural
2) Escala Ordinal: Valores representam uma hierarquia de posições. Não se pode, entretanto,
falar quão maior é um valor em relação a outro. Exemplo: classe social.
3) Escala Intervalar: Valores representam ordem e é possível mensurar intervalo entre eles.
Não se pode, entretanto, dizer quantas vezes um é maior que outro.
Exemplo: ano.
4) Escala de razão: Valores representam ordem, é possível mensurar intervalo entre eles e
quantificar grandezas em uma escala de razão. Exemplo: renda.
Variável Binária
Uma variável binária (variável dummy) pode representar dois estados possíveis::
0, ausência da característica de interesse (Fracasso)
X 1, presença da característica de interesse (Sucesso)
Podemos, assim, estimar a influência de variáveis explicativas (independentes) nominais ou
ordinais em modelo de regressão, da mesma maneira que fazemos com variáveis
quantitativas de escala intervalar ou de razão.
2/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural
NFilhos = 0 + 1 AnosEst + e
Agora seja a variável binária:
famílias com TV
0 = Não tem TV
Tem TV a cabo?
1 = Tem TV
Por que não considerar dois ajustes?
N FIlhos i) para famílias sem TV a cabo;
ii) para famílias com TV a cabo;
Este problema pode ser simplificado por um
modelo de regressão linear múltipla:
NFilhos = 0 + 1 AnosEst + 2 TV + e
TV Anos Est
3/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural
ˆ ( XT X) 1( XT y )
Aplicando MQO: β
1 Como:
1 15 1 0
1 1 1 1 1 1 1 1 Yi 6,36 0,34 X i 1,45 Di eˆi
1 8 1 15 8 5 3 2
βˆ 15 8 5 3 4
1 5 0 Teremos que:
1 1 0 0
1 1 0 0 Quando D=0 (sem TV)
1 3 0 6
1
Yi 6,36 0,34 X i eˆi
4 31 12 12 6,36
Quando D=1 (com TV)
ˆβ 31 323 23 54 0,34
12 23 2 2 - 1,45
Yi (6,36 1,45) 0,34 X i eˆi
4/16
Categorias Equações Semi-
Definição Aplicações Mudança Estrutural
Nominais Logarítmicas
+ e +
e
0 1 D 0 1 D
• Seja Y1 o valor de Y para D=1 e Y0 o valor para D=0;
• Para obtermos a variação relativa em Y quando comparamos D=0 e D=1:
10/16
Equações Semi-
Definição Categorias Nominais
Logarítmicas
Aplicações Mudança Estrutural
X X X X
Regressões Regressões Regressões Regressões
Coincidentes Paralelas Concorrentes Dissimilares
H 0 : 1 3 0
Testar se há mudança estrutural significa testar
se pelo menos um dos coeficientes 1 ou 3 é
diferente de zero: H1 : 1 e / ou 3 0
Y
Esse teste corresponde à contribuição marginal
das variáveis associadas aos coeficientes 1 e 3.
X D
D.X
13/16
Equações Semi- Mudança
Definição Categorias Nominais Aplicações
Logarítmicas Estrutural
Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12..
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto
Heterocedasticidade - Definição
Homocedasticidade:
A variância dos erros e, condicional aos valores das variáveis explanatórias, será
constante.
Var(ei / X 1i , X 2i ,..., X ki ) = s 2
Heterocedasticidade:
A variância dos erros será diferente para cada valor condicional de Xji.
Var (ei / X1i , X 2i ,..., X ki ) = s i2
Homocedasticidade Heterocedasticidade
Y Y
E(Y2) E(Y2)
Var(e2)=s2
E(Y1) E(Y1) Var(e2)=s22
Var(e1)=s2
Var(e1)=s21
X1 X2 Xj X1 X2 Xj 3/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto
Heterocedasticidade - Causas
Principais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente
tendência à heterocedasticia. Por exemplo, renda e poupança.
Yi = a + bX i + ei Var(ei ) = s i2
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar
a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser
devida à omissão de importantes variáveis no modelo.
Yi = a + bX i + ei Yi = a + b1 X i + b 2 X i2 + ei
- Transformação dos dados: a transformação das variáveis (por exemplo,
proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo
ao invés de linear) pode eliminar a heterocedasticidade.
Yi = a + bX i + ei ln(Yi ) = a + b ln( X i ) + ei
4/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto
Heterocedasticidade - Consequências
Ineficiência dos Estimadores de MQO
Na presenção de heterocedasticidade nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja b^ o estimador de
MQO, então existe outro estimador b^* tal que:
Var ( bˆ *) < Var ( bˆ )
Homocedasticia Heterocedasticia
Intervalo de
Y Variação das
Intervalo de Y Intervalo de
Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO
Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
5/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto
Heterocedasticidade - Consequências
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da heterocedasticidade é o fato de as estimativas dos
erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para
amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes
será viesada. Em outras palavras, na presença de heterocedasticidade teremos:
E (S b2ˆ ) ¹ Var( bˆ )
Seja o modelo: Yi = a + bX i + ei
não viesado na ausência de
åi=1 xi yi
n
ŝ 2
Pelo MQO: b̂ = e S b2ˆ = heterocedasticidade e
åi=1 xi2
n
å
n 2
i =1
xi viesado na sua presença
No caso de s2
Var (ei ) = s 2 Var ( bˆ ) =
åi=1 xi2
n
homocedasticia:
å
n
No caso de x si
2 2
Var ( bˆ ) = i =n1
i
heterocedasticia: Var(ei ) = s i2
(åi =1 xi2 ) 2
6/23
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto
Identificação
Principais testes para se detectar a autocorrelação:
Análise gráfica: ê2 ´ Xj
Teste Goldfeld-Quandt
Identificação
Teste de White
7/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto
Análise Gráfica
Homocedasticidade Heterocedasticidade
ê2 ê2
A dispersão A dispersão
dos resíduos é dos resíduos é
a mesma ao uma função
longo de X linear de X
σ i2 = σ 2 X i
σ 2 = constante
X X
Heterocedasticidade Heterocedasticidade
ê2 ê2 A dispersão dos
A dispersão resíduos cresce
dos resíduos de maneira
é uma função quadrática com
quadrática de os valores de X
X σ i2 = σ 2 X i2
σi = α1 X i + α2 X i2
2
X X
8/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto
Análise Gráfica
Sejam os gastos de 40 famílias com alimentação em função da renda:
A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a
renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de
heterocedasticidade, em uma relação aparentemente linear.
9/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto
Y Teste de Goldfeld-Quandt
Sejam os valores da amostra:
Regressão 1
Y1 Y2 ... Yn
X1 X2 ... Xn Onde: X1<X2<...<Xn
A omissão de c observações centrais objetiva acentuar a diferença
entre o grupo com variância pequena (SQReg1) e com variância
Regressão 2 grande (SQReg2).
X
Para testar a hipótese nula da homocedasticia: Fgl , gl
ìï H 0: σ12 = σ 22 SQRes2 / gl n-c
F= onde gl = - (k + 1)
í 2 p
ïî H1: σ12 < σ 22 SQRes1 / gl
F
Teste de Goldfeld-Quandt
Sejam os gastos de 40 famílias com alimentação em função da renda:
Das 40 observações originais, foram eliminadas 6
observações centrais para dar mais poder ao teste.
Restaram dois subconjuntos com 17 observações cada.
11/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto
ê2
Teste de Breusch-Pagan
Seja o modelo de RLM com k=2:
Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm
relação com os regressores:
eˆi2 = d 0 + d1 X1i + d 2 X 2i + ui
Xj Onde k é o número de
variáveis explanatórias,
Para testar a hipótese nula da homocedasticia: c k2 R2aux o coeficiente de
ìH 0 : d1 = d 2 = 0 2
LM = n ´ Raux
determinação do ajuste
í p auxiliar e n o número de
îH1 : d j ¹ 0 2
observações
n´ Raux
12,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,05%.
13/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto
Teste de White
ê2 Seja o modelo de RLM com k=2:
Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm relação com
os regressores, seus quadrados e seus produtos cruzados:
14,58
A probabilidade de erro ao rejeitar H0 é de apenas 0,08%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,08%. 15/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto
Correção Heterocedasticidade
Dada a equação de RLM: A equivalente matricial:
Yi = a + b1 X1i + ... + b 2 X ki + ei y = Xβ + e
Haverá heterocedasticidade quando: Haverá heterocedasticidade quando:
MQP - V Conhecida
Mínimos Quadrados Ponderados:
Seja o modelo de RLM:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Então teremos: év1 0 0 0 ù
ê0 v 0 0 ú
Var (e) = ê 2 ús 2 = Vs 2
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 v n û
Sabemos, nessas circunstâncias, que os estimadores de MQP serão os MELNV:
βˆ = ( XT V -1X) -1 XT V -1y
Caso vi seja conhecido, a matriz V–1 será dada por:
é1 v1 0 0 0 ù
ê 0 1v 0 0 ú
V -1 = ê 2 ú
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 1 vn û
18/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto
MQGF - V Desconhecida
Mínimos Quadrados Generalizados Factíveis:
Seja o modelo de RLM:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Caso o fator vi seja desconhecido, podemos supor que a variabilidade dos erros
seja uma função das variáveis independentes:
d0 +d1X1i +...+d k X ki ln(ei2 ) = d 0* + d1 X1i + ... + d k X ki + ui*
ei2 =e ui
E ajustar a função linear deste modelo a partir dos resíduos de MQO:
ln(eˆi2 ) = d 0* + d1 X1i + ... + d k X ki + ui* d*0 e u*i são o intercepto e erro do modelo linear
Uma vez estimada esta função por MQO, as estimativas de vi serão dadas por:
dˆ0* +dˆ1X1i +...+dˆk X ki
vˆi = e
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora
denominada V, ^ para obtermos os estimadores consistentes (embora viesados) de
Mínimos Quadrados Generalizados Factíveis:
βˆ = ( XT V
ˆ -1X) -1 XT V
ˆ -1y
20/23
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF Robusto
βˆ = ( XT V ˆ -1y = é22,6ù
ˆ -1X) -1 XT V
ê0,16 ú
ë û
21/23
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto
Estimadores Robustos
Estimadores da Variância Robustos à Autocorrelação- Esimtador de White:
Seja o modelo de RLS:
Yi = a + bX i + ei com heterocedasticidade dada por: Var(ei ) = vis 2
Embora os estimadores de MQO para b continuem não viesados, as estimativas de
suas variâncias serão viesadas.
Um estimador robusto, ou seja, igualmente válido na presença ou não de
heterocedasticidade, pode basear-se na real variância do estimador:
å å
n n
x s
2 2
xi
2 2
eˆi
ˆ
Var ( b ) = i =1 i i 2
S bˆ * = i =1
Yi = a + å j =1 b j X ji + ei
k Xj em função das demais
S b2ˆ* =
(åi =1uˆ 2ji ) 2
n
j variáveis independentes
åi=1 i eˆi
n2 2
x 3.421.453.919
S b2ˆ* = = = 0,0015 = 0,038 2
(åi =1 xi2 ) 2
n
(1.532.463) 2
23/23
Autocorrelação
Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Identificação: Análise Gráfica, teste t, Durbin-Watson, Breusch-Godfrey;
• Correção: MQG e MQGF;
• Estimadores Robustos para a Variância;
Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 13.
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Definição
Definição:
Autocorrelação significa a correlação de valores de uma mesma variável
ordenados no tempo (com dados de séries temporais) ou no espaço (com dados
espaciais). No contexto da regressão, dizemos que há autocorrelação nos termos de
erro quando:
Cov(et , et s ) E (et et s ) 0
Sendo que o tipo mais comum de autocorrelação aquele dado por um processo o
autorregressivo de 1ª ordem, AR(1):
é o coeficiente de autocorrelação dos erros (-1 < < 1)
et et 1 ut e ut são erros IID.
t t
3/23
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Causas
Principais causas da autocorrelação:
- Inércia: séries temporais econômicas costumam apresentar ciclos, ou seja,
períodos de crescimento ou decaimento. Quando esse comportamento se reflete
nos fatores não observados (et), é comum que mudanças na tendência ocorreram
lentamente.
Yt X t et et et 1 ut
- Falhas de especificação: a autocorrelação pode ser devida à ausência de um
importante regressor ou de transformação das variáveis existentes. Os erros
expressariam, assim, um padrão sistemático devido à ausência dessas informações.
Yt X t et Yt 1 X t 2 X t2 et
- Defasagens: as decisões econômicas em um período t dependem, muitas vezes,
de informações defasadas do período t–1. Desconsiderar esse tipo de relação
sujeitaria os erros à correlação serial.
Yt X t et Yt 1 X t 2 X t 1 et
ou Yt Yt 1 X t et
4/23
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Consequências
Ineficiência dos Estimadores de MQO
Na presenção de autocorrelação nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja ^ o estimador de
MQO, então existe outro estimador ^* tal que:
Var(ˆ*) Var(ˆ )
Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
Análise Durbin- Breusch- Estimador
Definição Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Autocorrelação - Consequências
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da autocorrelação é o fato de as estimativas dos
erros padrão e de as estatísticas de teste t e F não serem mais válidas, mesmo para
amostras grandes, já que a estimativa da variância dos estimadores dos coeficientes
será viesada. Em outras palavras, na presença de autocorrelação teremos:
E ( S 2ˆ ) Var( ˆ )
Seja o modelo: Yt 0 1 X t et
Na presença de 2 2
et et s ut Var(et ) e Cov(et , et s )
s
autocorrelação: 1 2 1 2
2
2 n 1 n t
Var( ˆ1 ) n 2 n s xt xt s
t 1 xi2 t 1 xi2 t 1 s1 6/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
Identificação
Principais testes para se detectar a autocorrelação:
Análise gráfica: ê t
Teste t: regressores
Identificação estritamente exógenos
Breusch-Godfrey:
autocorrelação com
ordem superior a 1
7/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
Análise Gráfica
Ausência de Autocorrelação Autocorrelação
ê ê
0 0
tempo tempo
0 0
tempo
tempo
8/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
Análise Gráfica
Seja a relação entre a área plantada de cana-de-açucar e seu preço:
Áreat 2,54 4,79 Preçot eˆt
Podemos suspeitar de um comportamento cíclico dos erros. Afinal, é natural supor que
a área plantada no trimestre t não dependa apenas do preço no trimesre t, mas também
de informações observadas em períodos anteriores: área plantada em um trimestre
anterior; preço pago pela cana-de-açucar no período anterior; outros fatores não
previstos pelo ajuste (política de incentivos do governo, previsões sobre os preços
futuros e expectativas sobre o estabelecimento de usinas na região, por exemplo) que
tenham lento amortecimento no tempo.
9/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t Watson Godfrey
MQG MQGF
Robusto
uˆ t
n
eˆt eˆt 1 ˆ 2 a estatística t é válida
ˆ t 2 S ˆ ˆ 2 t 2
assintóticamente caso os
2 2
t 2 eˆt 1 (n 1) 1
t 2 et 1
n n
ˆ regressores sejam
estritamente exógenos.
10/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t Watson Godfrey
MQG MQGF
Robusto
Teste t - Exemplo
Seja a relação entre a área plantada de cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat 2,54 4,79 Preçot eˆt eˆt 0,252 eˆt 1 uˆt
A estatística t associada ao coeficiente foi:
ˆ 0,252
t 1,443
S ˆ 0,175
O valor p do teste de hipóteses será dado por:
Se rejeitarmos a hipótese de
H 0: 0 t(341)1 ausência de autocorrelação pelo
H1: 0 teste t, estaremos sujeitos a um
0,079 erro de 7,9%. A validade do
0 teste depende, entretanto, (i) da
1,443
ausência de relação entre os
erros et e os valores defasados
do preço da cana-de-açucar e
(ii) do tamanho da amostra, que
não é razoavelmente grande.
11/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
Teste de Durbin-Watson
Se supormos que os erros apresentem autocorrelação de primeira ordem:
Yt kj 1 j X jt et et et 1 ut
12/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
H 0: 0 H 0: DW 2
supondo et et 1 ut
H1: 0 H1: DW 2 que:
Teste de Breusch-Godfrey
Supondo agora que os erros apresentam autocorrelação de ordens q:
Yt kj 1 j X jt et et j 1 j et j ut
q
χ q2
E o teste seria dado por:
H 0: 1 ... q 0
LM (n q) Reˆ2 p
H1: j 0
LM
Onde Rê2 é o coeficiente de determinação do ajuste para os resíduos como função de seus
valores e dos regressores defasados. O valor p representará a probabilidade de erro ao
afirmarmos que os erros apresentam autocorrelação de ordem q.
15/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
16/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
Correção Autocorrelação
Seja a equação autocorrelacionada: A equivalente matricial:
Yt 1 X 1t ... 2 X kt et (1) y Xβ e
Supondo que a autocorrelação seja dada por: A autocorrelação regressiva de 1ª ordem implica:
1 2 ... n1
et et 1 ut ut et et 1
1 ... n2
1 2
Var(e) ... n3 V
2 2
O que implica em: 1
1
2
2 2 ... ...
Var(et ) e Cov(et , et s ) s
n1
... ... ...
1 2 1 2 n2
n 3
... 1
O objetivo é transformar o modelo para que este Se conhecemos V a equação corrigida será
apresente erros não autocorrelacionados. dada por:
Λy ΛXβ Λe
1º passo) A equação (1) pode ser representada
por: 1 2 0 0 ... 0
Yt 1 1 X 1t 1 ... 2 X kt 1 et 1 (2) 1 0 ... 0
1
Onde Λ 0 T
2º passo) Subtraindo da equação (1) a 1 ... 0 e Λ Λ V
equação (2) multiplicada por : ... ... ... ... ...
(Yt Yt 1 ) (1 ) 1 ( X 1t X 1t 1 ) ... (et et 1 ) 0 0 ... 1
* Pois:
Y* X*1 ut
que apresenta erros ut não autocorrelacionados E (ΛeeT Λ) ΛVΛ 2 I 2
17/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
18/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
MQG - Conhecido
Mínimos Quadrados Generalizados:
Seja o modelo de RLM:
y Xβ e com autocorrelação de 1ª ordem: et et 1 ut
1 2 ... n1
Então teremos:
... n2
1 2
1
2 s
2
Var(et ) e Cov(et , et s ) Var(e) ... n3 V
2 2
1
1 2 1 2 1 2
... ... ... ... ...
n1 n2 n 3 1
...
19/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF
Robusto
MQGF - Desconhecido
Mínimos Quadrados Generalizados Factíveis:
Seja o modelo de RLM:
y Xβ e com autocorrelação de 1ª ordem: et et 1 ut
Então teremos: 1 2 ... n1
... n2
1 2
1
2 2
Var(et ) e Cov(et , et s ) Var(e) ... n3 V
s
2 2
1
1 2
1 2 1 2
... ... ... ... ...
n1 n2 n 3 1
...
21/23
Análise Durbin- Breusch- Estimador
Definição
Gráfica
Teste t
Watson Godfrey
MQG MQGF Robusto
MQGF - Exemplo
Seja a relação entre a área plantada de
cana-de-açucar e seu preço:
As estimativas de MQO foram:
Áreat 2,54 4,79 Preçot eˆt
Temos ainda que:
eˆt 0,252 eˆt 1 uˆt ou seja ˆ 252
Teremos então as seguintes estimativas para as matrizes de transformação:
1 0,252 0,252 2 ... 0,252 33 1 0,252 0 ... 0
0,252 1 0,252 2 0,252 ... 0
0,252 1 0,252 ... 0,252 32
ˆ
V
1 2
... 0,252 31 e Vˆ 0
1
0,252 1 0,252 2 ... 0
2 0,252 1
1 0,252
... ... ... ... ... ... ... ... ... ...
0,252 33 0,252 32 0,252 31 1 0 0 ... 0,252 1
...
22/23
Análise Durbin- Breusch- Estimador
Definição Teste t MQG MQGF
Gráfica Watson Godfrey Robusto
Estimadores Robustos
Estimadores da Variância Robustos à Autocorrelação:
Seja o modelo de RLS:
Yt X t et com autocorrelação de 1ª ordem: et et 1 ut
Embora os estimadores de MQO para continuem não viesados, as estimativas de
suas variâncias serão viesadas.
A real variância do estimador para o coeficiente angular seria:
2 2 n 1 n t
Var( ˆ ) 2 s xt xt s
t 1 xt2 t 1 xt
n n 2
t 1 s 1