Escolar Documentos
Profissional Documentos
Cultura Documentos
AULA 11 – MULTICOLINEARIEDADE
1. O PROBLEMA
2. CONSEQUÊNCIAS
3. DETECÇÃO DO PROBLEMA
4. MEDIDAS DE CONTROLE
AULA 12 – HETEROCEDASTICIDADE
1. NATUREZA DO PROBLEMA
2. CONSEQUÊNCIAS
3. FORMAS DE DETECTAR
a. TESTES INFORMAIS
AULA 13 – HETEROCEDASTICIDADE
1. TESTE DE PARK
2. TESTE DE BREUSCH-PAGAN-GODFEY
3. TESTE GERAL DE WHITE
AULA 14 – HETEROCEDASTICIDADE
AULA 15 – AUTOCORRELAÇÃO
AULA 16 – CORRELAÇÃO
AULA 17 – AUTOCORRELAÇÃO
1. SÉRIES ESTACIONÁRIAS
2. TÓPICOS DE TENDÊNCIA
3. TESTE ADF
4. SÉRIES INTEGRADAS
1. REGRESSÃO ESPÚRIA
2. CORREÇÃO DO PROBLEMA
3. TESTE DE COINTEGRAÇÃO
MULTICOLINEARIDADE
Ynx1=βkx1.Xnxk+unx1
Multicolinearidade
Imperfeita
X1 entre X1 e X2
Multicolinearidade
Perfeita
X2
entre X3 e X4
Y
X3
X4
1. MULTICOLINEARIDADE PERFEITA
^ X +β
Yi=β ^ X +u
1 1 2 2 i
onde:
2 2
^β = Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥2𝑖 ) − Σ(𝑦𝑖 𝑥2𝑖 ).Σ(𝑥1𝑖 𝑥2𝑖 ) β
^ Σ(𝑦𝑖 𝑥2𝑖 ).Σ(𝑥1𝑖 ) − Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥1𝑖 𝑥2𝑖 )
1 2 ).Σ(𝑥 2 ) − Σ(𝑥 𝑥 )2 2= 2 ).Σ(𝑥 2 ) − Σ(𝑥 𝑥 )2
Σ(𝑥1𝑖 2𝑖 1𝑖 2𝑖 Σ(𝑥1𝑖 2𝑖 1𝑖 2𝑖
^
Os βk dão a variação de Yi quando o xk varia uma unidade, quando mantemos o xj (k≠j) constante.
2 2 2 2
^β = 𝜆 Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥1𝑖 ) − 𝜆 Σ(𝑦𝑖 𝑥1𝑖 ).Σ(𝑥1𝑖 )
2 )2 − 𝜆2 Σ(𝑥 2 )2
1
𝜆2 Σ(𝑥1𝑖 1𝑖
^β1= 0 indeterminado
0
Ou seja, não é possível manter x1 constante e variar x1, por isso, não é possível avaliar os efeitos
parciais sobre Yi.
^ (não é possível gerar um modelo de M.Q.O.)
Neste caso, nem é possível estimar os β k
Considerando X2i uma combinação linear de X1i, mais um termo de erro X2i = 𝜆X1i + v1, com
𝜆 ≠ 0 e Σ X1iv1 = 0
2 2 2 2
^β = Σ(𝑦𝑖 𝑥1𝑖 ).[𝜆 Σ(𝑥1𝑖 )+Σ(𝑣𝑖 )] −[𝜆Σ(𝑦𝑖 𝑥1𝑖 )+Σ(𝑦𝑖 𝑣𝑖 )].𝜆Σ(𝑥1𝑖 )
2 [𝜆2 Σ(𝑥 2 )+Σ(𝑣 2 )] − 𝜆Σ(𝑥 2 )2
1
𝛴𝑥1𝑖 1𝑖 𝑖 1𝑖
CORRELAÇÃO E O FIV
rkj= correlação entre xk e xj
σ2βk
σ^βk= se a correlação entre xk e xj for perfeita/total, então rkj1, a variância de
∑ 𝑥𝑘2 (1−𝑟𝑘𝑗
2 )
σ2βk σ2βk
^k é infinita, pois ∑ 𝑥 2 (1 − 𝑟 2 ) 0: σ^βk=
β = =∞
𝑘 𝑘𝑗
∑ 𝑥𝑘2 (1−1) 0
À medida que aumenta a correlação entre duas variáveis, o FIV cresce e a precisão da análise
diminui, porque a variância e os erros padrão são infinitos.
CONSEQUÊNCIAS DA MULTICOLINEARIDADE
FORMAS DE DETECTAR
IC= √𝐾
Se 10< IC <30 moderada a forte
30< IC grave
6. Tolerância e FIV
1
TOL= = 1 – 𝑟𝑗2 quanto maior a colinearidade, maior será o FIV e menor será o TOL
FIV
MEDIDAS DE CORREÇÃO
1. Aumentar a amostra;
2. Excluir a variável problemática;
3. Transformar a variável;
4. Construir novos modelos, separando as variáveis que estejam correlacionadas;
5. Combinar dados de corte com séries temporais: dados em painel;
6. Analisar as variáveis principais: análise fatorial.
HETEROCEDASTICIDADE
Ocorre quando a variância dos resíduos (X – X) não é constante em toda amostra, ou seja, a
variância do termo de erro para amostra selecionada não é constante: E(ui2)≠ σ2
45
40
35
30
25
X
20
15
10
5
0
0 5 10 15 20
CONSEQUÊNCIAS
homocedástico heterocedástico
^= 𝜎2 ∑ 𝑥𝑖2 𝜎 2
var β k var ^βk=
∑ 𝑥𝑖2 (∑ 𝑥𝑖2 )2
Portanto, a variância deixa de ser mínima implica em perda da eficiência não há mais
confiança nos intervalos de confiança e nos testes gerados.
1. A razão-t não segue mais a distribuição;
2. Nem a distribuição F;
3. Intervalo de confiança é alterado, podendo considerar H0 verdadeira sendo falsa;
4. Não é possível testar a significância do modelo.
Obs.: o modelo CONTINUA sendo CONSISTENTE e NÃO-VIESADO, mas a variância deixando de
ser mínima implica em PERDA de EFICIENÊNCIA.
2. Formais:
2.1 Teste de Park
Formalização do método gráfico
Gera uma regressão em que σ2 é explicado pelo xi:
𝛽
𝜎𝑖2 = 𝜎 2 𝑋𝑖 𝑒 𝑣𝑖 ou
𝑙𝑛 𝜎𝑖2 = 𝑙𝑛𝜎 2 + 𝛽 𝑙𝑛 𝑋𝑖 + 𝑣𝑖 , como σi2 pode ser desconhecido:
^ 2 = 𝛼 + 𝛽 𝑙𝑛 𝑋 + 𝑣
𝑙𝑛 𝑢 𝑖 𝑖 𝑖
Procedimento:
1. Gera-se um modelo de M.Q.O. e salvam-se os erros.
2. A partir dos erros é construído o modelo de teste.
Falhas:
O termo de erro vi deve ser homocedástico para que o teste tenha validade, caso contrário, as
conclusões sobre o β não serão válidas.
Vantagem
Avalia a especificação do modelo (presença de variáveis ao quadrado ou logarítmicas)
Falha
vi deve ter distribuição normal para que haja confiabilidade
Falha:
Por consumir muitos graus de liberdade, este teste não é indicado para pequenas amostras.
MEDIDAS CORRETIVAS
1. Quando 𝝈𝟐𝒊 é conhecido
- Utilizar o Método dos Mínimos Quadrados Ponderados
Gera um novo modelo, atribuindo maior peso às observações com baixos desvios e um peso
menor àquelas que apresentam grandes desvios.
AUTOCORRELAÇÃO
No modelo clássico pressupõe-se que não exista correlação entre os termos de erro de duas
observações diferentes. Contudo, sabemos que: 𝐸(𝑢𝑖 𝑢𝑗 ) ≠ 0.
𝑌𝑡 = 𝛽1 + 𝛽2 𝑋𝑡 + 𝑢𝑡 Regressão comum
X1 X2 X3 𝑐𝑜𝑣(𝑋𝑘 𝑋𝑗 )
X1 1
𝜚𝑋𝑘𝑋𝑗 =
𝜚𝑋1𝑋2 𝜚𝑋1𝑋3 √𝑣𝑎𝑟 𝑋𝑘 .𝑣𝑎𝑟 𝑋𝑗
X2 1 𝜚𝑋2𝑋3 Ou seja: a correlação é a covariância padronizada
X3 1
Quanto mais recente for a memória (mais próximas no tempo forem as observações) maior é a
correlação entre elas.
Estacionariedade: média e variância constantes no tempo.
Média Crescente
σ12= σ22= σ32
Série não estacionária
Variância e média cte Variância cte e média crescente
Quando os termos de erro do modelo são ruído branco, o modelo erá homocedástico e sem
autocorrelação.
𝑢 ~ 𝑁(0, 𝜎 2 ) homocedástico
> ut ~ RB(0)
𝑐𝑜𝑣 (𝑢𝑡 ; 𝑢𝑡+𝑗 ) = 0 sem correlação
𝐸(𝜀𝑡 ) = 0
𝑣𝑎𝑟(𝜀𝑡 ) = 𝜎 2 > εt ~ RB(0)
𝑐𝑜𝑣(𝜀𝑡 , 𝜀𝑡+𝑗 ) = 0
𝑢𝑡 = 𝜚𝑢𝑡−1 + 𝜀𝑡 o termo de erro no período t é igual a 𝜚 vezes o seu valor mais um termo
de erro aleatório.
FORMAS DE DETECTAR
1. Teste de Durbin-Watson
É a razão entre a soma das diferenças ao quadrado, entre resíduos sucessivos e a Soma dos
Quadrados dos Resíduos:
∑𝑡=𝑛
𝑡=2 (û𝑡 −û𝑡−1 )
2
𝑑= ∑𝑡=𝑛 û 2 ,
𝑡=1 𝑡
2 ∑ û2𝑡 −2 ∑ û𝑡 û𝑡−1
𝑑= ∑ û2𝑡
∑ û𝑡 û𝑡−1 ∑ û𝑡 û𝑡−1
𝑑 = 2(1 − ∑ û2𝑡
), sendo 𝜚 = ∑ û2𝑡
^)
𝑑 = 2(1 − 𝜚
H0: Ausência de
autocorrelação+
^ varia de [-1,1]
Como 𝜚
d varia de [0,4]; assim se a autocorrelação:
é alta, 𝜚^ = 1 e d=0
for muito negativa, 𝜚^ = -1 e d=4
não existir, 𝜚^ = 0 e d=2
HIPÓTESES
1. O modelo inclui o intercepto. Para podermos obter a Soma dos Quadrados dos Resíduos.
2. As variáveis explicativas são não estocásticas, ou fixas em amostras repetidas.
3. Os termos de erro são gerados em primeira ordem, não podem ser usados para detectar
processos de ordem mas elevada.
4. ut ~ N(0, σ2)
5. O modelo não pode conter a variável dependente defasada como variável explicativa (Yt-1).
6. Não podem ocorrer missings (falta de dados).
2. Teste de Breusch-Godfrey
1. Não permite regressores não estocásticos.
2. Permite esquemas autoregressivos de ordem superior.
3. Permite o uso de erros na forma de média móvel.
4. A variável explicada defasada pode ser variável explicativa.
Procedimento
3.Correlograma
Gerando um correlograma, o indicativo de ausência de correlação é obter resíduos dentro do
intervalo. Aqueles que ultrapassar o intervalo são considerados correlacionados e suas ordens
indicarão a ordem (p,q) para o teste de GF.
MEDIDAS CORRETIVAS
1. Quando 𝜚 é conhecido
A partir do modelo (Yt-1=β1+ β2Xt-1+ut-1)𝜚, teremos:
𝜚Yt-1= 𝜚β1+ 𝜚β2Xt-1+ 𝜚ut-1
2. Quando 𝜚 é desconhecido
1. Método da primeira diferença
2. Obter o 𝜚 com base na estatística d de Durbin-Watson
3. Usar o 𝜚 estimado dos resíduos
SÉRIES TEMPORAIS
Processo estocástico estacionário: aquele que tem média e variância constante ao longo do
tempo; e a covariância depender apenas da distância, para dois períodos de tempo, ou do
intervalo, ou da defasagem entre eles.
Média: E(Yt)=µ
Variância: var(Yt)= E(Yt – µ)2= σ2
Covariância: 𝛾𝑘 =E[(Yt- µ)(Yt-1- µ)]
Yt Yt-1 Yt-2
Yt 𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡 ) 𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡−1 ) 𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡−2 )
Yt-1 𝑐𝑜𝑣(𝑌𝑡−1 , 𝑌𝑡−1 ) 𝑐𝑜𝑣(𝑌𝑡−1 , 𝑌𝑡−2 )
Yt-2 𝑐𝑜𝑣(𝑌𝑡−2 , 𝑌𝑡−2 )
TIPOS DE TENDÊNCIA
DETERMINÍSTICA (Quando a tendência não varia)
Quando a tendência é determinada pelo tempo ela é chamada de tendência determinística.
Yt=β1+ β2t+ut
Ou seja:
Reescrevendo: Yt – Yt-1= ΔYt = β1+ut, onde β1>0 ou β1<0, significa presença de tendência
estocástica positiva ou negativa.
Regressão espúria
Se duas séries geradas aleatoriamente com observações diferentes, não relacionadas, forem
colocadas no mesmo modelo (uma explicando a outra) e o modelo tiver β 2 significativo e um
alto grau de ajuste, há regressão espúria.
Cointegração
Quando as séries são estacionárias de mesma ordem e ut ~ I(0) a regressão não é espúria.
Correção da tendência
Para série determinística, acrescentamos o time.
Para série estocástica (RU), diferenciar até que seja I(0).
Questões de interpretação
1. O modelo da tabela acima utiliza uma amostra de 200 municípios para estimar a taxa de
informalidade municipal em função de sua taxa de urbanização (porcentagem de domicílios na
área urbana) e do índice de desenvolvimento humano municipal (IDHM). Baseado nestas
informações, responda às perguntas abaixo, sempre justificando.
a. O índice de desenvolvimento humano de um município tem impacto significativo sobre a sua
taxa de informalidade?
b. O modelo é globalmente significativo?
c. Existe problema de heterocedasticidade no modelo estimado?
d. Por que os testes de heterocedasticidade utilizam os resíduos de modelo estimado e alguma
hipótese sobre seu comportamento?
e. Sugira e explique algum tipo de correção para a possível heterocedasticidade desde modelo.
3. O modelo utiliza uma amostra de 4.615 municípios para estimar a taxa de informalidade
municipal em função de sua taxa de urbanização (porcentagem de domicílios na área urbana) e
do índice de desenvolvimento humano municipal (IDHM), todos em logaritmo. Baseado nestas
informações, responda às perguntas abaixo, sempre justificando.
a. existe problema de heterocedasticidade no modelo estimado?
b. Pode-se dizer que o índice de desenvolvimento humano de um município tem impacto
significativo sobre a sua taxa de informalidade?
c. Interprete o valor e o sinal do coeficiente estimado para o logaritmo da taxa de urbanização.
d. Seria justificável o uso da versão apenas com quadrados das variáveis para o teste neste
modelo?
e. Sugira e explique algum tipo de correção para a possível heterocedasticidade deste modelo
(mesmo que ela não exista).