Você está na página 1de 21

AULA 10 – MULTICOLINEARIEDADE

1. NATUREZA DOS PROBLEMAS


2. FONTE DOS PROBLEMAS
3. MULTICOLINEARIEDADE PERFEITA
4. MULTICOLINEARIEDADE IMPERFEITA
5. CONSEQUÊNCIAS

AULA 11 – MULTICOLINEARIEDADE

1. O PROBLEMA
2. CONSEQUÊNCIAS
3. DETECÇÃO DO PROBLEMA
4. MEDIDAS DE CONTROLE

AULA 12 – HETEROCEDASTICIDADE

1. NATUREZA DO PROBLEMA
2. CONSEQUÊNCIAS
3. FORMAS DE DETECTAR
a. TESTES INFORMAIS

AULA 13 – HETEROCEDASTICIDADE

1. TESTE DE PARK
2. TESTE DE BREUSCH-PAGAN-GODFEY
3. TESTE GERAL DE WHITE

AULA 14 – HETEROCEDASTICIDADE

1. MÍNIMOS QUADRADOS PONDERADOS


2. TRANSFORMAÇÃO DE VARIÁVEIS
3. DESVIO PADRÃO ROBUSTO

AULA 15 – AUTOCORRELAÇÃO

1. INTRODUÇÃO AS SÉRIES TEMPORAIS


2. CONCEITOS BÁSICOS
3. NATUREZA DA AUTOCORRELAÇÃO
4. FONTES DO PROBLEMA

AULA 16 – CORRELAÇÃO

1. CONSEQUÊNCIA NOS RESÍDUOS


2. CONSEQUÊNCIA NA VARIÂNCIA
3. DETECÇÃO DO PROBLEMA
a. GRÁFICO
b. DURBIN-WATSON
c. BREUSCH-GODFREY
d. CORRELOGRAMA

AULA 17 – AUTOCORRELAÇÃO

1. MÍNIMOS QUADRADOS GENERALIZADOS


2. ESTIMAÇÃO DE ζ
a. PRIMEIRA DIFERENÇA
b. DURBIN-WATSON
c. RESÍDUOS

AULA 18 – TÓPICOS EM SÉRIES TEMPORAIS

1. SÉRIES ESTACIONÁRIAS
2. TÓPICOS DE TENDÊNCIA
3. TESTE ADF
4. SÉRIES INTEGRADAS

AULA 19 – TÓPICOS EM SÉRIES TEMPORAIS

1. REGRESSÃO ESPÚRIA
2. CORREÇÃO DO PROBLEMA
3. TESTE DE COINTEGRAÇÃO
MULTICOLINEARIDADE

É o excesso de correlação entre as variáveis explicativas (é a dependência linear entre as linhas


e colunas da matriz de X).

Ynx1=βkx1.Xnxk+unx1

Ynx1= Y1 βkx1= β1 Xnxk= X11 X12 … X1k unx1= u1


Y2 β2 X21 X22 … X2k u2
... ... … ...
Yn βk Xn1 Xn2 … Xnk un

Multicolinearidade
Imperfeita
X1 entre X1 e X2
Multicolinearidade
Perfeita
X2
entre X3 e X4
Y
X3
X4

variação de Y explicada por X1 explicada por X2 explicada por X3 explicada por X4

Multicolinearidade pode ser:


1. Perfeita
2. Imperfeita

Obs.: a multicolinearidade refere-se apenas a multicolinearidade linear:


Yi=β1X1+β2X22+ui
Não há correlação entre X1 e X2, ainda que o coeficiente de correlação seja alto, o uso de
variações não lineares (exponenciais) não viola a hipótese de multicolinearidade.

1. MULTICOLINEARIDADE PERFEITA

^ X +β
Yi=β ^ X +u
1 1 2 2 i

onde:

2 2
^β = Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥2𝑖 ) − Σ(𝑦𝑖 𝑥2𝑖 ).Σ(𝑥1𝑖 𝑥2𝑖 ) β
^ Σ(𝑦𝑖 𝑥2𝑖 ).Σ(𝑥1𝑖 ) − Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥1𝑖 𝑥2𝑖 )
1 2 ).Σ(𝑥 2 ) − Σ(𝑥 𝑥 )2 2= 2 ).Σ(𝑥 2 ) − Σ(𝑥 𝑥 )2
Σ(𝑥1𝑖 2𝑖 1𝑖 2𝑖 Σ(𝑥1𝑖 2𝑖 1𝑖 2𝑖
^
Os βk dão a variação de Yi quando o xk varia uma unidade, quando mantemos o xj (k≠j) constante.

Efeito marginal/elasticidade Análise ceteris paribus

Considerando X2i uma combinação linear de X1i  X2i = 𝜆X1i 𝜆 ≠ 0


x1i = X1 – X1 x2i = X2 – X2
x2i = X2 – X2 x2i = 𝜆X1i – 𝜆X1i
x2i =𝜆(X1 – X1)
x2i = x1i
Estimando:
2 2
^β = Σ(𝑦𝑖 𝑥1𝑖 ).𝜆 Σ(𝑥1𝑖 ) − 𝜆Σ(𝑦𝑖 𝑥1𝑖 ).𝜆Σ(𝑥1𝑖 𝑥1𝑖 )
1 2 ).𝜆 2 Σ(𝑥 2 ) − 𝜆2 Σ(𝑥 𝑥 )2
Σ(𝑥1𝑖 1𝑖 1𝑖 1𝑖

2 2 2 2
^β = 𝜆 Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥1𝑖 ) − 𝜆 Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥1𝑖 )
2 )2 − 𝜆2 Σ(𝑥 2 )2
1
𝜆2 Σ(𝑥1𝑖 1𝑖

^β1= 0  indeterminado
0

Ou seja, não é possível manter x1 constante e variar x1, por isso, não é possível avaliar os efeitos
parciais sobre Yi.
^ (não é possível gerar um modelo de M.Q.O.)
Neste caso, nem é possível estimar os β k

2. MULTICOLINEARIDADE MENOS QUE PERFEITA

Considerando X2i uma combinação linear de X1i, mais um termo de erro  X2i = 𝜆X1i + v1, com
𝜆 ≠ 0 e Σ X1iv1 = 0
2 2 2 2
^β = Σ(𝑦𝑖 𝑥1𝑖 ).[𝜆 Σ(𝑥1𝑖 )+Σ(𝑣𝑖 )] −[𝜆Σ(𝑦𝑖 𝑥1𝑖 )+Σ(𝑦𝑖 𝑣𝑖 )].𝜆Σ(𝑥1𝑖 )
2 [𝜆2 Σ(𝑥 2 )+Σ(𝑣 2 )] − 𝜆Σ(𝑥 2 )2
1
𝛴𝑥1𝑖 1𝑖 𝑖 1𝑖

^ e gerar o modelo de M.Q.O.


Assim, se vi não for muito próximo de zero, será possível estimar o β k

O QUE PROVOCA MULTICOLINEARIDADE?


1. O método de coleta dos dados (pode recolher uma amostra viesada ou pequena que não
incorpore todas as características da amostra)
2. Restrição ao modelo
3. Especificação do modelo
4. Modelo sobredeterminado (k > n)

CORRELAÇÃO E O FIV
rkj= correlação entre xk e xj
σ2βk
σ^βk=  se a correlação entre xk e xj for perfeita/total, então rkj1, a variância de
∑ 𝑥𝑘2 (1−𝑟𝑘𝑗
2 )

σ2βk σ2βk
^k é infinita, pois ∑ 𝑥 2 (1 − 𝑟 2 )  0: σ^βk=
β = =∞
𝑘 𝑘𝑗
∑ 𝑥𝑘2 (1−1) 0

FIV= Fator de inflação da variância


1
FIV=
1−𝑟𝑘𝑗

Na ausência de correlação (rkj= 0), FIV=1


Na presença de multicolinearidade perfeita (rkj= 1), FIV=∞

À medida que aumenta a correlação entre duas variáveis, o FIV cresce e a precisão da análise
diminui, porque a variância e os erros padrão são infinitos.

CONSEQUÊNCIAS DA MULTICOLINEARIDADE

1. OS ESTIMADORES TERÃO GRANDE VARIÂNCIA E COVARIÂNCIA, MAS CONTINUAM SENDO OS


MELHORES ESTIMADORES LINEARES NÃO VIESADOS;
2. Dificulta uma análise precisa;
3. Pois aumenta os intervalos de confiança: e consequentemente pode levar a aceitação de
Ho:β^ =0;
k

4. A razão-t pode se tornar insignificante;


5. O R2 pode se torna muito alto;
6. Os β^k e seus erros padrão podem se tornar muito sensíveis às mudanças na base de dados ou
especificação do modelo.

FORMAS DE DETECTAR

1. Simultaneamente o modelo apresentar elevado R2 e individualmente as razões-t dos


estimadores forem insignificantes (isto é incompatível);
2. Perceber alta correlação entre pares de regressores;
3. Ao realizar exames de correlação parcial;
4. Rodar regressões auxiliares: ao gerar um modelo onde uma das variáveis explicativas é
utilizada como variável dependente e as outras variáveis explicativas como variáveis
independentes (as variáveis do modelo original explicando umas as outras) e for possível
detectar um F* (calculado) maior que um Fc (crítico), então há colinearidade entre as variáveis
explicativas do modelo original;
5. Avaliar o autovalor e o índice condicional:
𝑚á𝑥𝑖𝑚𝑜 𝑎𝑢𝑡𝑜𝑣𝑎𝑙𝑜𝑟
K=número condicional=
𝑚í𝑛𝑖𝑚𝑜 𝑎𝑢𝑡𝑜𝑣𝑎𝑙𝑜𝑟
(regra de bolso)
Se 100< K <1000  multicolinearidade moderada a forte
1000< K  multicolinearidade grave

IC= √𝐾
Se 10< IC <30  moderada a forte
30< IC  grave

6. Tolerância e FIV
1
TOL= = 1 – 𝑟𝑗2 quanto maior a colinearidade, maior será o FIV e menor será o TOL
FIV

7. Avaliar o diagrama de dispersão ou a matriz de correlação;


8. Observar um sinal diferente do estimador daquele que era esperado e ele ser significante.
Obs.: para saber o verdadeiro sinal do estimador basta rodar um modelo somente com a variável
explicada e a variável explicativa que pretende conhecer o sinal.

MEDIDAS DE CORREÇÃO

1. Aumentar a amostra;
2. Excluir a variável problemática;
3. Transformar a variável;
4. Construir novos modelos, separando as variáveis que estejam correlacionadas;
5. Combinar dados de corte com séries temporais: dados em painel;
6. Analisar as variáveis principais: análise fatorial.
HETEROCEDASTICIDADE
Ocorre quando a variância dos resíduos (X – X) não é constante em toda amostra, ou seja, a
variância do termo de erro para amostra selecionada não é constante: E(ui2)≠ σ2

45
40
35
30
25
X

20
15
10
5
0
0 5 10 15 20

σ5 < σ10 < σ15 Y

O QUE PROVOCA HETEROCEDASTICIDADE?

1. Falha na coleta dos dados;


2. Dados pouco confiáveis;
3. Outliers;
4. Má especificação do modelo;
5. Dados mal distribuídos;
6. Dados de corte;
7. Processo de aprendizagem (erros mais dispersos no início da amostragem);
8. Assimetria nos dados (distribuição de renda x consumo).

CONSEQUÊNCIAS
homocedástico heterocedástico

^= 𝜎2 ∑ 𝑥𝑖2 𝜎 2
var β k var ^βk=
∑ 𝑥𝑖2 (∑ 𝑥𝑖2 )2

Portanto, a variância deixa de ser mínima  implica em perda da eficiência  não há mais
confiança nos intervalos de confiança e nos testes gerados.
1. A razão-t não segue mais a distribuição;
2. Nem a distribuição F;
3. Intervalo de confiança é alterado, podendo considerar H0 verdadeira sendo falsa;
4. Não é possível testar a significância do modelo.
Obs.: o modelo CONTINUA sendo CONSISTENTE e NÃO-VIESADO, mas a variância deixando de
ser mínima implica em PERDA de EFICIENÊNCIA.

FORMAS DE DETECTAR A HETEROCEDASTICIDADE


1. Informais:
1.1 Método gráfico
Consiste em relacionar graficamente o termo de erro e a variável explicada ou qualquer uma
das variáveis explicativas. E assim observar os padrões de distribuição (linear, exponencial,
quadrática)

2. Formais:
2.1 Teste de Park
 Formalização do método gráfico
 Gera uma regressão em que σ2 é explicado pelo xi:
𝛽
𝜎𝑖2 = 𝜎 2 𝑋𝑖 𝑒 𝑣𝑖 ou
𝑙𝑛 𝜎𝑖2 = 𝑙𝑛𝜎 2 + 𝛽 𝑙𝑛 𝑋𝑖 + 𝑣𝑖 , como σi2 pode ser desconhecido:

^ 2 = 𝛼 + 𝛽 𝑙𝑛 𝑋 + 𝑣
𝑙𝑛 𝑢 𝑖 𝑖 𝑖

 Rodado o modelo, se β for um coeficiente significativo, há heterocedasticidade.

Procedimento:
1. Gera-se um modelo de M.Q.O. e salvam-se os erros.
2. A partir dos erros é construído o modelo de teste.

Falhas:
O termo de erro vi deve ser homocedástico para que o teste tenha validade, caso contrário, as
conclusões sobre o β não serão válidas.

2.2 Teste de Breusch-Pagan-Godfrey


Testa a variância como função de um conjunto de variáveis.
𝜎𝑖2 = 𝑓(𝛼1 + 𝛼2 𝑍2𝑖 + ⋯ + 𝛼𝑛 𝑍𝑛𝑖 )
Zi= conjunto de variáveis do modelo ou fora dele ou um subconjunto de variáveis
Testa-se, portanto, se o problema foi causado pelas variáveis presentes ou omitidas

H0: α1= α2=...= αn=0


H1: αk≠0
Procedimento:
1. Gera-se o modelo de M.Q.O. para obter os termos de erro (u^i)
^𝑖2
∑𝑢
~2
2. Calcula-se o estimador de máxima verossimilhança de 𝜎 =
𝑛
^ 𝑖2
𝑢
3. Construir a variável 𝑝 = 2
𝜎~
4. Estima-se o modelo 𝑝 = 𝛼1 + 𝛼2 𝑍2𝑖 + ⋯ + 𝛼𝑛 𝑍𝑛𝑖 + 𝑣𝑖
1
5. Obter a Soma dos Quadrados Esperados e definir 𝜃 = 𝑆𝑄𝐸
2
2
6. Verificar se 𝜃𝑎𝑠𝑠 = 𝑋𝑛−1 (Se ϴ segue a distribuição qui-quadrado com n-1 graus de liberdade)
2
7. Se ϴ>𝑋𝑐𝑟í𝑡𝑖𝑐𝑜  há heterocedasticidade

Vantagem
Avalia a especificação do modelo (presença de variáveis ao quadrado ou logarítmicas)

Falha
vi deve ter distribuição normal para que haja confiabilidade

2.3 Teste de White


Procedimento
1. Gerar um modelo de M.Q.O. e obter os termos de erro;
2. Construir um novo modelo de M.Q.O. onde os termos de erro são explicados pelas variáveis
explicativas do modelo original, seus quadrados e os produtos cruzados das variáveis (isto
consome os graus de liberdade do modelo);
Ex: Modelo original Nível de informalidade (Y ^i) = ^β0 + ^β1 Taxa de urbanização + ^β2 IDH + u^i

Teste de White ^ui = ^β0+β^1 Tx urbanização+β


^ IDH+β ^ (Tx urbanização)2+β^ (IDH)2+β^ (Tx urbanização x IDH)+v
^i
2 3 4 5

3. Testar se o produto entre o tamanho da amostra e o R2 da regressão excede o valor crítico


referente ao nível de significância escolhido, e se: n.R2 𝑎𝑠𝑠
̃ X2 gl > X2c haverá problema de
heterocedasticidade.

Falha:
Por consumir muitos graus de liberdade, este teste não é indicado para pequenas amostras.

MEDIDAS CORRETIVAS
1. Quando 𝝈𝟐𝒊 é conhecido
- Utilizar o Método dos Mínimos Quadrados Ponderados
Gera um novo modelo, atribuindo maior peso às observações com baixos desvios e um peso
menor àquelas que apresentam grandes desvios.

2. Quando 𝝈𝟐𝒊 é desconhecido


- Utilizar erros padrões robustos.

Questões de multicolinearidade e heterocedasticidade


1. Responda verdadeiro ou falso, justificando.
a. Quando há multicolinearidade, os estimadores de M.Q.O. são viesados e ineficientes.
b. Uma das consequências da multicolinearidade é a obtenção de baixos valores para as razões-
t, que tendem a cair na área de não rejeição da hipótese nula H0: 𝛽𝑘 = 0.
c. Uma das consequências da multicolinearidade é a obtenção de elevados intervalos de
confiança para os coeficientes estimados.
d. Considere o modelo de regressão múltipla 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝑢. Seja 𝑉𝑎𝑟(𝛽2 ) =
𝜎2 2
∑ 𝑥22 (1− 𝑟23
2 ) a variância do estimador de 𝛽2 , onde 𝜎 2 é a variância dos resíduos do modelo e 𝑟23 é

o coeficiente de correlação entre 𝑋2 e 𝑋3 . Em caso de multicolinearidade perfeita, teremos que


𝑉𝑎𝑟(𝛽2 ) será igual a zero.
e. Mesmo na presença de perfeita multicolinearidade é possível obter os valores dos testes t e
F para testar a significância do modelo.
f. O conditional number não depende do número de variáveis do modelo.
g. Em caso de multicolinearidade perfeita, a condição de ceteris paribus para interpretação dos
coeficientes de regressão já não é mais válida.
h. Em uma pesquisa com regressão múltipla, quanto mais variáveis explicativas acrescentar ao
modelo, maior será a qualidade da minha análise.
i. Uma das consequências da multicolinearidade é a inflação da variância do modelo de
regressão, deixando o método dos mínimos quadrados ordinários ineficiente.
j. Seja o modelo de regressão por M.Q.O. dado por 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 . No caso de forte
colinearidade entre X2 e X3, tende-se a não rejeitar a hipótese nula de que β3=0.

k. Se os resíduos de uma regressão calculada por M.Q.O. apresentam um padrão sistemático,


isso quer dizer que a heterocedasticidade está presente nos dados.
l. Se existir problema de heterocedasticidade, os testes t e F convencionais deixaram de ser
válidos.
m. Sempre posso retirar os outliers da minha análise, se estes são causadores de
heterocedasticidade.

2. Suponha o modelo de regressão 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝑢, com um problema de


heterocedasticidade do tipo 𝜎𝑖2 = 𝜎 2 𝑋22 , onde 𝜎𝑖2 é a variância dos resíduos. Aplique, de maneira
adequada, mínimos quadrados ponderados sobre este modelo e prove que o resultado é
homocedástico.

AUTOCORRELAÇÃO

É a correlação entre integrantes de uma série de observações, ordenadas no tempo (séries


temporais) ou no espaço (dados de corte).

No modelo clássico pressupõe-se que não exista correlação entre os termos de erro de duas
observações diferentes. Contudo, sabemos que: 𝐸(𝑢𝑖 𝑢𝑗 ) ≠ 0.

𝑌𝑡 = 𝛽1 + 𝛽2 𝑋𝑡 + 𝑢𝑡  Regressão comum

𝑌𝑡 = 𝛽1 + 𝛽2 𝑋𝑡−1 + 𝑢𝑡  Regressão baseada em observações passadas

𝑌𝑡 = 𝛽1 + 𝛽2 𝑌𝑡−1 + 𝑢𝑡  Autorregressão defasada

𝑌𝑡 = 𝛽1 + 𝛽2 𝑋𝑡 + 𝛽3 𝑋𝑡−1 + 𝛽4 𝑌𝑡−1 + 𝑢𝑡  Autorregressão de defasagem distribuída

𝑌𝑡 = 𝛽1 + 𝛽2 𝑇𝐸𝑀𝑃𝑂 + 𝑢𝑡  Regressão baseada no tempo

Modelos dinâmicos  baseados na memória daquelas observações ao longo do tempo.

Ex.: Análise do PIB

Uma autorregressão Y=f(X1,X2,X3), tem os seguintes coeficientes de correlação: 𝜚𝑋1 𝑋2 , 𝜚𝑋1 𝑋3 ,


𝜚𝑋2𝑋3 ; que variam no intervalo de [-1,1]

X1 X2 X3 𝑐𝑜𝑣(𝑋𝑘 𝑋𝑗 )
X1 1
𝜚𝑋𝑘𝑋𝑗 =
𝜚𝑋1𝑋2 𝜚𝑋1𝑋3 √𝑣𝑎𝑟 𝑋𝑘 .𝑣𝑎𝑟 𝑋𝑗
X2 1 𝜚𝑋2𝑋3 Ou seja: a correlação é a covariância padronizada
X3 1

Quanto mais recente for a memória (mais próximas no tempo forem as observações) maior é a
correlação entre elas.
Estacionariedade: média e variância constantes no tempo.

Média Crescente
σ12= σ22= σ32
Série não estacionária
Variância e média cte Variância cte e média crescente

Ruído Branco= Quando a série não tem memória e é estacionária

Se a cov(ut, ut+j) ≠ 0, então há memória

Quando os termos de erro do modelo são ruído branco, o modelo erá homocedástico e sem
autocorrelação.

𝑢 ~ 𝑁(0, 𝜎 2 ) homocedástico
> ut ~ RB(0)
𝑐𝑜𝑣 (𝑢𝑡 ; 𝑢𝑡+𝑗 ) = 0 sem correlação

O QUE PROVOCA AUTOCORRELAÇÃO?


1. Inércia dos dados (propagação de um efeito nos dados até que ocorra um choque inesperado)
2. Erro de especificação do modelo
3. Modelo teia de aranha
4. Defasagem nas decisões
5. Manipulação dos dados
6. Ausência de estacionariedade

QUEBRA DE PRESSUPOSTOS: Modelo autorregressivo

Supondo cov(ut, ut+j) ≠ 0 e mantendo todas as demais hipóteses, ut seria:


𝑢𝑡 = 𝜚𝑢𝑡−1 + 𝜚𝑢𝑡−2 + ⋯ + 𝜚𝑢𝑡−𝑗 ou simplesmente
𝑢𝑡 = 𝜚𝑢𝑡−1 + 𝜀𝑡

𝐸(𝜀𝑡 ) = 0
𝑣𝑎𝑟(𝜀𝑡 ) = 𝜎 2 > εt ~ RB(0)
𝑐𝑜𝑣(𝜀𝑡 , 𝜀𝑡+𝑗 ) = 0
𝑢𝑡 = 𝜚𝑢𝑡−1 + 𝜀𝑡  o termo de erro no período t é igual a 𝜚 vezes o seu valor mais um termo
de erro aleatório.

É um autorregressivo de primeira ordem AR(1).

FORMAS DE DETECTAR
1. Teste de Durbin-Watson
É a razão entre a soma das diferenças ao quadrado, entre resíduos sucessivos e a Soma dos
Quadrados dos Resíduos:
∑𝑡=𝑛
𝑡=2 (û𝑡 −û𝑡−1 )
2
𝑑= ∑𝑡=𝑛 û 2 ,
𝑡=1 𝑡

∑ û2𝑡 +∑ û2𝑡−1 −2 ∑ û𝑡 û𝑡−1


Assim, 𝑑= ∑ û2𝑡
, mas ∑ û2𝑡 ≈ ∑ û2𝑡−1 ∴

2 ∑ û2𝑡 −2 ∑ û𝑡 û𝑡−1
𝑑= ∑ û2𝑡

∑ û𝑡 û𝑡−1 ∑ û𝑡 û𝑡−1
𝑑 = 2(1 − ∑ û2𝑡
), sendo 𝜚 = ∑ û2𝑡
^)
𝑑 = 2(1 − 𝜚

H0: Ausência de
autocorrelação+

Rejeição de H0 Rejeição de H0* H0*: Ausência de


Zona de Aceitação Zona de
indecisão de H0 e H0* indecisão autocorrelação–
Autocorrelação+ Autocorrelação-
Ha: Presença de
autocorrelação
0 dL dU 2 4-dU 4-dL d=4

^ varia de [-1,1]
Como 𝜚
d varia de [0,4]; assim se a autocorrelação:

é alta, 𝜚^ = 1 e d=0
for muito negativa, 𝜚^ = -1 e d=4
não existir, 𝜚^ = 0 e d=2

HIPÓTESES
1. O modelo inclui o intercepto. Para podermos obter a Soma dos Quadrados dos Resíduos.
2. As variáveis explicativas são não estocásticas, ou fixas em amostras repetidas.
3. Os termos de erro são gerados em primeira ordem, não podem ser usados para detectar
processos de ordem mas elevada.
4. ut ~ N(0, σ2)
5. O modelo não pode conter a variável dependente defasada como variável explicativa (Yt-1).
6. Não podem ocorrer missings (falta de dados).
2. Teste de Breusch-Godfrey
1. Não permite regressores não estocásticos.
2. Permite esquemas autoregressivos de ordem superior.
3. Permite o uso de erros na forma de média móvel.
4. A variável explicada defasada pode ser variável explicativa.

Procedimento

H0: 𝜚1= 𝜚2=...= 𝜚p=0 ut= 𝜚1ut-1+ 𝜚2ut-2+...+ 𝜚put-p+𝜀 t


H1: 𝜚p≠0 𝜀 t ~ RB(0)

1. Estime o modelo e extraia o erro


2. Gere o modelo û𝑡 = 𝛼1 + 𝛼2 𝑋𝑡 + 𝜚^ û ^ û
+𝜚 ^ û
+ ⋯+ 𝜚 + 𝜀𝑡
1 𝑡−1 2 𝑡−2 𝑝 𝑡−𝑝
3. Obtenha o R2 da regressão auxiliar
4. Se a amostra for grande: (n-p)R2~X2p (distribuição qui-quadrado)
5. Se (n-p)R2 > X2c, rejeita-se a hipótese nula: há autocorrelação.

3.Correlograma
Gerando um correlograma, o indicativo de ausência de correlação é obter resíduos dentro do
intervalo. Aqueles que ultrapassar o intervalo são considerados correlacionados e suas ordens
indicarão a ordem (p,q) para o teste de GF.

MEDIDAS CORRETIVAS
1. Quando 𝜚 é conhecido
A partir do modelo (Yt-1=β1+ β2Xt-1+ut-1)𝜚, teremos:
𝜚Yt-1= 𝜚β1+ 𝜚β2Xt-1+ 𝜚ut-1

Peso atribuído ao passado

Fazendo, Yt-1 – 𝜚Yt-1= β1– 𝜚β1+ β2Xt-1– 𝜚β2Xt-1+ ut-1– 𝜚ut-1


Y*t-1=β*1+ β*2Xt-1+u*t-1

2. Quando 𝜚 é desconhecido
1. Método da primeira diferença
2. Obter o 𝜚 com base na estatística d de Durbin-Watson
3. Usar o 𝜚 estimado dos resíduos

1. Método da primeira diferença


Considerando 𝜚 ≅ 1 a equação da diferença generalizada seria:

(Yt – Yt-1)=β1 – β1+ β2(Xt – Xt-1)+(ut – ut-1)


ΔYt= β2ΔXt+εt Δ=operador da primeira diferença

Estando εt livre de correlação serial, basta calcular as primeiras diferenças de Xt e Yt e efetuar a


regressão com essas diferenças.
Quando utilizar? (convencionalmente)
 Coeficiente de autocorrelação for muito alto
 d de Durbin-Watson for muito baixo
 d<R2

2. Obter o 𝜚 com base na estatística d de Durbin-Watson


Se 𝜚 não for muito próximo de 1, podemos calcular:
𝑑
𝜚^ = 1 −
2
e utilizar este valor na estimação da equação de diferença generalizada.
Obs.: Somente para grandes amostras

3. Usar o 𝜚 estimado dos resíduos


Sendo o processo AR(1) ut= 𝜚 ut-1+ εt válido, podemos estimar 𝜚 a partir da regressão de ût
contra ût-1:
ût= 𝜚 ût-1+ vt

SÉRIES TEMPORAIS
Processo estocástico estacionário: aquele que tem média e variância constante ao longo do
tempo; e a covariância depender apenas da distância, para dois períodos de tempo, ou do
intervalo, ou da defasagem entre eles.
Média: E(Yt)=µ
Variância: var(Yt)= E(Yt – µ)2= σ2
Covariância: 𝛾𝑘 =E[(Yt- µ)(Yt-1- µ)]

Yt Yt-1 Yt-2
Yt 𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡 ) 𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡−1 ) 𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡−2 )
Yt-1 𝑐𝑜𝑣(𝑌𝑡−1 , 𝑌𝑡−1 ) 𝑐𝑜𝑣(𝑌𝑡−1 , 𝑌𝑡−2 )
Yt-2 𝑐𝑜𝑣(𝑌𝑡−2 , 𝑌𝑡−2 )

Yt Yt-1 Yt-2 Yt Yt-1 Yt-2


Yt 𝜎 2 𝛾1 𝛾2 Yt 1 𝜚1 𝜚2
Yt-1 𝜎2 𝛾1 /σ 2
= Yt-1 1 𝜚1
Yt-2 𝜎2 Yt-2 1

TIPOS DE TENDÊNCIA
DETERMINÍSTICA (Quando a tendência não varia)
Quando a tendência é determinada pelo tempo ela é chamada de tendência determinística.

Yt=β1+ β2t+ β3Yt-1+ut

Em que ut ~ RB(0) e β1≠0, β2≠0, β3=0

Yt=β1+ β2t+ut
Ou seja:

- A média não é constante µ=β1+β2t


- A variância é constante var= σ2

Caso β3< 1 teremos tendência determinística com componente autorregressivo AR(1)


estacionário.

ESTOCÁSTICA (Tendência varia)

Tomando Yt=β1+ β2t+ β3Yt-1+ut, se β1≠0, β2=0, β3=1


Yt=β1+ β3Yt-1+ut

Reescrevendo: Yt – Yt-1= ΔYt = β1+ut, onde β1>0 ou β1<0, significa presença de tendência
estocástica positiva ou negativa.
Regressão espúria
Se duas séries geradas aleatoriamente com observações diferentes, não relacionadas, forem
colocadas no mesmo modelo (uma explicando a outra) e o modelo tiver β 2 significativo e um
alto grau de ajuste, há regressão espúria.

Para comprovar a existência de regressão espúria:

1. Ordem de integração diferente entre as séries


Yt ~ I(1)
Xt ~ I(2)

2. Resíduos não estacionários


Yt ~ I(1)
Xt ~ I(1)
ut ~ I(1)  não estacionário (RB)

Cointegração
Quando as séries são estacionárias de mesma ordem e ut ~ I(0) a regressão não é espúria.

Correção da tendência
Para série determinística, acrescentamos o time.
Para série estocástica (RU), diferenciar até que seja I(0).

Questões de autocorrelação e séries temporais


1. Responda verdadeiro ou falso
a. A presença de resíduos no formato de Ruído Branco é um indicador de ausência de
autocorrelação no modelo de séries temporais.
b. A exclusão de uma ou mais variáveis do modelo de regressão pode propiciar um d de Durbin-
Watson próximo de 0.
c. Sabendo que d≈2(1-p), onde p é o coeficiente de autocorrelação de primeira ordem, em caso
de perfeita autocorrelação positiva a estatística d de Durbin-Watson tende a 0.
d. A exclusão de uma ou mais variáveis do modelo de regressão pode propiciar um valor
significativo do d de Durbin-Watson.

2. Explique o que é o problema da endogeneidade em um sistema de equações simultâneas.


Cite um exemplo.
3.

Questões de interpretação

Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-200


Variável dependente: Informalidade

Coeficiente Erro padrão razão-t p-valor


Cons 0,5784 0,07076 8,1817 0,00001
Urbanização -0,00447 0,00043 -10,4584 0,00001
IDHM -0,19600 0,11563 -1,6951 0,58649

Média var. dependente 0,322505 D.P. var. dependente 0,159068


Soma resíd. Quadrados 2,827965 E.P. da regressão 0,119813
R-quadrado 0,438365 R-quadrado ajustado 0,432663
F(2, 197) 76,88082 P-valor (F) 0,000000
Log da verossimilhança 142,0883 Critério de Akaike -278,1766
Critério de Schwarz -268,2817 Critério de Hannan-Quinn -274,1723

Teste de White para a heteroscedasticidade


Mínimos Quadrados (OLS), usando as observações 1-200
Variável dependente: uhat^2

coeficiente erro padrão razão-t p-valor


Const -0,103623 0,0802045 -1,292 0,1979
Urbanização -0,000826925 0,000674463 -1,226 0,2217
Idhm -0,136371 0,264678 -0,5152 0,6070
Sq_Urbanização -2,06600e-07 2,95545e-06 -0,06990 0,9443
X2_X3 -0,000717427 0,00102401 -0,7006 0,4844
Sq_Idhm -0,0494029 0,215696 -0,2290 0,8191

R-quadrado não-ajustado = 0,12156

Hipótese nula: sem heterocedasticidade


Estatística de teste: TR^2 = 2,955367
Com p-valor = P(Qui-quadrado (5) > 2,955367) = 0,29313

1. O modelo da tabela acima utiliza uma amostra de 200 municípios para estimar a taxa de
informalidade municipal em função de sua taxa de urbanização (porcentagem de domicílios na
área urbana) e do índice de desenvolvimento humano municipal (IDHM). Baseado nestas
informações, responda às perguntas abaixo, sempre justificando.
a. O índice de desenvolvimento humano de um município tem impacto significativo sobre a sua
taxa de informalidade?
b. O modelo é globalmente significativo?
c. Existe problema de heterocedasticidade no modelo estimado?
d. Por que os testes de heterocedasticidade utilizam os resíduos de modelo estimado e alguma
hipótese sobre seu comportamento?
e. Sugira e explique algum tipo de correção para a possível heterocedasticidade desde modelo.

Modelo 2: MQO, usando as observações 1999:01-2010:07 (T=235)


Variável dependente: cheques

Coeficiente Erro padrão razão-t p-valor


Cons -24,6806 3,24095 -7,6152 0,00001
Desemprego 0,8865 0,25560 3,4684 0,00062
Cesta básica 0,123478 0,01244 9,9275 0,00001

Média var. dependente 11,20162 D.P. var. dependente 7,169201


Soma resíd. Quadrados 7421,175 E.P. da regressão 5,693756
R-quadrado 0,374643 R-quadrado ajustado 0,369252
F(2, 232) 69,49391 P-valor (F) 2,24e-24
Log da verossimilhança -740,6929 Critério de Akaike 1487,386
Critério de Schwarz 1497,765 Critério de Hannan-Quinn 1491,570
rô 0,962647 Durbin-Watson 0,075009

Teste LM para autocorrelção até a ordem 1 –


Hipótese nula: sem autocorrelação
Estatística de teste: LMF = 2840,81
Com p-valor = P(F(1,231) > 2840,81) = 0,00000

2. O modelo da tabela estima a porcentagem de cheques sem fundo recebidos no comercio em


função da taxa de desemprego e do custo da cesta básica (R$), entre janeiro de 1991 e julho de
2010, usando o seguinte modelo:
Chequest=β1+ β2Desempregot+ β3CestaBasicat+ut
Com base nas informações fornecidas, responda às questões abaixo (não se esqueça de
justificar):
a. Existe problema de autocorrelação no modelo estimado? Se sim, de que ordem é o problema?
b. Explique como poderíamos estimar este modelo pelo método de primeira diferença.
c. Explique a utilidade da matriz de variância e covariância dos resíduos nos modelos de séries
temporais.
d. Aponte e explique uma possível causa para a existência de autocorrelação em modelos de
séries temporais.
e. Além do método de primeiras diferenças e dos métodos interativos, existem outros meios
para se estimar o coeficiente de autocorrelação para este modelo para aplicar Mínimos
Quadrados Generalizados. Explique um desses meios alternativos.

Modelo 3: MQO, usando as observações 1-4615


Variável dependente: l_Informalidade

Coeficiente Erro padrão razão-t p-valor


Cons 0,728844 0,05465 13,3362 0,00001
l_Urbanização -0,105933 0,04848 -2,1849 0,02895
l_IDHM -0,511801 0,01130 -452754 0,00001

Média var. dependente -1,280009 D.P. var. dependente 0,437544


Soma resíd. Quadrados 565,0144 E.P. da regressão 0,350014
R-quadrado 0,360356 R-quadrado ajustado 0,360078
F(2, 4612) 1299,129 P-valor (F) 0,000000
Log da verossimilhança -1702,153 Critério de Akaike 3410,306
Critério de Schwarz 3429,618 Critério de Hannan-Quinn 3417,102

Teste de White para heterocedasticidade


Hipótese nula: sem heterocedasticidade
Estatística de teste: LM = 212,852
Com p-valor = P(qui-quadrado (5) > 212,852) = 0,000004

Teste de White para a heteroscedasticidade


MQO, usando as observações 1-4615
Variável dependente: uhat^2

coeficiente erro padrão razão-t p-valor


Const -1,6646 0,2136 7,790 8,23e-015
l_Urbanização -1,0424 0,4808 2,168 0,0302
l_Idhm -0,7110 0,0886 -8,025 1,28e-015
Sq_l_Urbanização -0,6469 0,3226 2,005 0,0450
X2_X3 -0,2231 0,0797 -2,800 0,0051
Sq_l_Idhm -0,0783 0,0105 7,470 9,55e-014

R-quadrado não-ajustado = 0,046122

Hipótese nula: sem heterocedasticidade


Estatística de teste: TR^2 = 212,852131
Com p-valor = P(Qui-quadrado (5) > 212,852131) = 0,000000

3. O modelo utiliza uma amostra de 4.615 municípios para estimar a taxa de informalidade
municipal em função de sua taxa de urbanização (porcentagem de domicílios na área urbana) e
do índice de desenvolvimento humano municipal (IDHM), todos em logaritmo. Baseado nestas
informações, responda às perguntas abaixo, sempre justificando.
a. existe problema de heterocedasticidade no modelo estimado?
b. Pode-se dizer que o índice de desenvolvimento humano de um município tem impacto
significativo sobre a sua taxa de informalidade?
c. Interprete o valor e o sinal do coeficiente estimado para o logaritmo da taxa de urbanização.
d. Seria justificável o uso da versão apenas com quadrados das variáveis para o teste neste
modelo?
e. Sugira e explique algum tipo de correção para a possível heterocedasticidade deste modelo
(mesmo que ela não exista).

Modelo 4: MQO, usando as observações 1991:2-2010:2 (T=77)


Variável dependente: Consumo

Coeficiente Erro padrão razão-t p-valor


Cons 1,6246 3,22665 0,4973 0,62042
RendaNacional_1 0,5821 0,08417 6,9154 0,00001
Investimento_1 1,4181 0,49897 2,8421 0,00579

Média var. dependente 54,60144 D.P. var. dependente 8,487218


Soma resíd. Quadrados 1133,206 E.P. da regressão 3,913258
R-quadrado 0,793003 R-quadrado ajustado 0,787408
F(2, 74) 141,7464 P-valor (F) 4,91e-26
Log da verossimilhança -212,7848 Critério de Akaike 431,5696
Critério de Schwarz 438,6010 Critério de Hannan-Quinn 434,3821
Durbin-Watson 2,063653

Teste LM para autocorrelção até a ordem 1 –


Hipótese nula: sem autocorrelação
Estatística de teste: LMF = 22,1292
Com p-valor = P(F(1,231) > 22,1292) = 0,00000543

4. O modelo da tabela estima o nível de consumo no período t em função da Renda Nacional em


t-1 e do nível de investimento em t-1, entre o segundo trimestre de 1991 e o segundo trimestre
de 2010, usando o seguinte modelo:
Consumot= β1+ β2RendaNacionalt-1+ β3Investimentot-1+ut
Com base nas informações fornecidas, responda às questões abaixo (não se esqueça de
justificar):

a. Existe problema de autocorrelação no modelo estimado? Em caso afirmativo, de que ordem


é o problema? Em caso negativo, qual o comportamento esperado do gráfico dos resíduos em t
contra os resíduos em t-1?
b. Aponte e explique uma possível causa para a existência de autocorrelação em modelos de
séries temporais.
c. Explique como poderíamos estimar este modelo pelo MQG.
d. Além do método de primeiras diferenças e dos métodos interativos, existem outros meios
para estimar o coeficiente de autocorrelação para este modelo para aplicar MQG. Explique um
desses meios alternativos.
e. Explique a utilidade da matriz de variância e autocovariância dos resíduos nos modelos de
séries temporais.

Você também pode gostar