Escolar Documentos
Profissional Documentos
Cultura Documentos
CURSO DE ECONOMETRIA
Nota de Aula
Heteroscedasticidade
PLANO DE AULA
Objetivos
Livro Texto:
1. - PRESSUPOSTO DE HOMOSCEDASTICIDADE
3) Variância Constante: o erro é uma variável aleatória com variância constante e igual,
isto é, E (ei2) = s2
Significa que a variância do erro é a mesma em todas as observações. Mais
especificamente, significa que as distribuições dos erros (ei), definidas aos níveis de Xi,
apresentam a mesma variância. Ou seja, por definição, V(ei) = E[ei-E(ei)]2 dado que
E(ei)=0 a V(ei) = E(ei2) = s2, para todo i.
Esta variância é, em geral, desconhecida e constitui, também um parâmetro do modelo a
ser estimado com os dados da amostra. Tecnicamente, esta pressuposição é denominada
de “homoscedasticidade” que significa variação ou variabilidade igual. O caso de
variância não constante é denominada de “heteroscedasticidade”. Dada a relação entre Y
e o erro, pode-se mostrar que a variância de Y será igual à variância de e. Desta forma,
esta pressuposição implica que a dispersão dos valores populacionais de Y é a mesma
independentemente do nível de X.
A Natureza da Heteroscedasticidade
a) Linearidade e não-viés\ E ( bˆ ) = b
~
b) Eficiência\ Min Var ( bˆ ) < Var ( b )
c) Consistência \ lim E ( bˆ ) = b
n ®¥
eˆ´eˆ
Como o estimador de s 2 é sˆ 2 = , a soma do quadrado dos resíduos tende a ser
n-k
alta e torna o estimador sˆ 2 viesado e, portanto, o estimador Var ( bˆ ) é inapropriado.
Os testes t-student e F-snedecor também serão enganosos por que a soma dos
quadrados dos resíduos não pondera a heterocedasticidade e sˆ 2 é tendencioso.
Conclusão: não levar em consideração a informação acerca da heterocedasticidade
torna o estimador não eficiente.
A pergunta que se faz é: admitindo que o parâmetro estimado bi ainda seja linear e
não-viesado, continua sendo eficiente? (ou de variância mínima?).
3. – TESTES FORMAIS
A) Teste de Park
Park (1966) formaliza o método gráfico ao sugerir que s2 seja uma função da
variável explicativa X. A forma funcional sugerida por Park é:
s i2 = s 2 X ib ev
Û ln s i2 = ln s 2 + b ln X i + vi
i
Como s2 não é conhecido, Park sugere usar o eˆi2 como uma proxy e estimar a seguinte
regressão:
ln eˆi2 = ln s 2 + b ln X i + vi
ln eˆi2 = a + b ln X i + vi
Interpretação:
Se b se revelar estatisticamente significativo, isto sugere que a heteroscesdasticidade está
presente nos dados. Se b se mostra não significativo, podemos aceitar a hipótese da
homoscedasticidade. Assim o teste de Park é um procedimento de dois estágios. No
primeiro estágio estima-se a regressão por MQO, desconsiderando a questão da
heteroscedasticidade e obtém-se os resíduos ( eˆi2 ). O segundo estágio estima-se a
regressão de PARK e efetua-se o teste de significância estatística dos parâmetros.
B) Teste de Glejser
| eˆi |= b 0 + b1 X i + vi
| eˆi |= b 0 + b1 X i + vi
1
| eˆi |= b 0 + b1 + vi
Xi
1
| eˆi |= b 0 + b1 + vi
Xi
Interpretação:
Se b se revelar estatisticamente significativo, esta sugeriria que a heteroscedasticidade
está presente nos dados. Se b se mostrar não significativo, pode-se aceitar a hipótese de
homoscedasticidade.
Obs: Goldfeld e Quandt (1972) chamaram a atenção para o fato de o termo de erro
(vi) da equação dos resíduos apresentar alguns problemas, já que seu valor
esperado é diferente de zero (os autores sugerem que o termo de erro apresenta
correlação serial e é heteroscedástico).
C) Teste de Goldfeld-Quandt
Este método foi desenvolvido por Goldfeld e Quandt (1972) e é o método mais
popular. Em síntese, o método envolve ordenar os dados a partir dos pequenos valores da
variável independente, X, e obter duas regressões, uma para pequenos valores de X e uma
para grandes valores de X, omitindo (d=1/4) observações centrais.
Se admitirmos que a variância é heteroscedástica e se relaciona positivamente com
uma das variáveis explicativas no modelo de regressão
Yi = b0 + b1 X1i + b2 X 2i + ... + bk X ki + e i e, por hipótese, admitimos que s i se relacione
2
Relacionar a variância do erro com uma variável explicativa V(ei) = X1, neste caso:
Interpretação:
Se o l calculado for maior que o F-crítico, pode-se rejeitar a hipótese de
homoscedasticidade, ou seja, pode-se dizer que é bastante provável a presença de
heteroscedasticidade à base de dados testada.
D) Teste de White
Interpretação:
se o valor de Qui-Quadrado obtido exceder o valor de Qui-Quadrado tabelado, a
conclusão é de que há heteroscedasticidade. Caso contrário, o modelo é homoscedástico,
o que significa que, na regressão auxiliar a2=a3=a4=a5=a6=0.
Intuição:
neste procedimento está implícito a hipótese de que a variância do erro é funcionalmente
relacionado com os regressores. Se todos os coeficiente parciais forem iguais a zero,
então a variância do erro é a constante - homoscedasticidade.
4 . - Medidas Corretivas
Yi 1 Xi ei
= b0 + b1 +
si si si si
MQG Þ Yi * = b 0 + b1 X i* + e *
MQG representa o uso das variáveis transformadas que satisfazem as hipóteses usuais
dos MQO. Entretanto, o MQG minimiza uma soma ponderada de quadrados dos resíduos
onde 1/si2 serve de peso (o maior peso é dado às observações mais agrupadas junto às
suas médias).
Yi + b0 + b1 X1i + b2 X 2i + ... + bk X ki + e i
Yi b 0 e 1
= + b1 + i è Yi * = b 0 + b1 + ui
Xi Xi Xi Xi
2
æe ö 1 1
Assim, E (u ) = E ç i ÷ = 2 E (e i2 ) Þ 2 • s 2 X i2 = s 2 (usando a Hipótese 1)
i
2
è Xi ø Xi Xi
Yi b e 1
= 0 + b1 X i + i è Yi* = b 0 + b1 X i + ui
Xi Xi Xi Xi
2
æ e ö 1 1
Assim, E (u ) = E ç i
2
÷ = E (e i2 ) Þ • s 2 X i = s 2 (usando a Hipótese 2)
i
ç X ÷ Xi Xi
è i ø
A correção passa por tentativas onde estamos “especulando” sobre a natureza de si2:
a) Regressão linear múltipla: qual variável deve ser escolhida para transformar os
dados?
b) Transformação em LOG: não é aplicável para casos com variáveis negativas, ou
nulas;
c) Correlação espúria: a correlação esta presente no modelo transformado, mas o
modelo original não apresenta correlação;
d) Quando si2 não é diretamente conhecido, todos os testes t e F são válidos somente
para grandes amostras.
5 . - EXERCÍCIO DE FIXAÇÃO