Você está na página 1de 9

Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

UNIVERSIDADE FEDERAL DA PARAÍBA


CENTRO DE CIÊNCIAS SOCIAIS APLICADAS
DEPARTAMENTO DE ECONOMIA

CURSO DE ECONOMETRIA

Nota de Aula
Heteroscedasticidade

PLANO DE AULA

Objetivos

Apresentar o problema de heteroscedasticidade para o modelo


estimado por MQO, bem como sua correção.

Livro Texto:

GUJARATI, D. N. Econometria Básica. São Paulo: MAKRON Books, 2006.


Capítulo 11 (p.313)..

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 1


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

1. - PRESSUPOSTO DE HOMOSCEDASTICIDADE

3) Variância Constante: o erro é uma variável aleatória com variância constante e igual,
isto é, E (ei2) = s2
Significa que a variância do erro é a mesma em todas as observações. Mais
especificamente, significa que as distribuições dos erros (ei), definidas aos níveis de Xi,
apresentam a mesma variância. Ou seja, por definição, V(ei) = E[ei-E(ei)]2 dado que
E(ei)=0 a V(ei) = E(ei2) = s2, para todo i.
Esta variância é, em geral, desconhecida e constitui, também um parâmetro do modelo a
ser estimado com os dados da amostra. Tecnicamente, esta pressuposição é denominada
de “homoscedasticidade” que significa variação ou variabilidade igual. O caso de
variância não constante é denominada de “heteroscedasticidade”. Dada a relação entre Y
e o erro, pode-se mostrar que a variância de Y será igual à variância de e. Desta forma,
esta pressuposição implica que a dispersão dos valores populacionais de Y é a mesma
independentemente do nível de X.

A Natureza da Heteroscedasticidade

a) modelos de aprendizagem do erro (a medida que o tempo passa o erro é menor);


b) renda discricionária (a variância aumenta com o aumento da renda);
c) técnica de coleta de dados;
d) presença de “outliers” (observações aberrantes);
e) modelo com erro de especificação.

Obs: o problema de heteroscedasticidade é mais comum em dados de corte do que em


séries temporais (vide tabela 11.1 pg 359 do Gujarati, 2000).

Conseqüências sobre as propriedades dos estimadores de MQO

Admita as seguintes propriedades, dadas as hipóteses do MRLC:

a) Linearidade e não-viés\ E ( bˆ ) = b
~
b) Eficiência\ Min Var ( bˆ ) < Var ( b )
c) Consistência \ lim E ( bˆ ) = b
n ®¥
eˆ´eˆ
Como o estimador de s 2 é sˆ 2 = , a soma do quadrado dos resíduos tende a ser
n-k
alta e torna o estimador sˆ 2 viesado e, portanto, o estimador Var ( bˆ ) é inapropriado.
Os testes t-student e F-snedecor também serão enganosos por que a soma dos
quadrados dos resíduos não pondera a heterocedasticidade e sˆ 2 é tendencioso.
Conclusão: não levar em consideração a informação acerca da heterocedasticidade
torna o estimador não eficiente.

Assim, apesar da estimação dos parâmetros continuarem não tendenciosos, não é


eficiente; isto é, não será estimações de variâncias mínimas se apresentar
heteroscedasticidade conduzindo a testes estatísticos incorretos. A violação do
pressuposto de que a distribuição tem variância constante ao longo das observações se dá

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 2


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

o nome de heteroscedasticidade, que é mais comum em dados de seção cruzada,


prejudicando a eficiência dos parâmetros estimados.
Dessa forma, a conseqüência do uso do MQO na presença de heteroscedasticidade
é de que os intervalos de confianças e os testes de hipóteses com as estatísticas “t” e “F”
geralmente não garantem variâncias mínimas para os parâmetros estimados. Neste
caso, os intervalos de confiança são maiores tendo como conseqüência a imprecisão dos
testes.

O Objetivo da avaliação econométrica em relação à heteroscedasticidade é:

1) Como identificar a heteroscedasticidade?


2) Quais suas conseqüências?
3) Como corrigir o problema?

Não existe uma regra firme e segura para detectar a presença de


heteroscedasticidade, somente algumas regras gerais e básicas. Em alguns casos, pode ser
uma questão de intuição, conjectura, experiência empírica anterior ou pura especulação
(Gujarati, 2000).

A pergunta que se faz é: admitindo que o parâmetro estimado bi ainda seja linear e
não-viesado, continua sendo eficiente? (ou de variância mínima?).

2. - TESTES INFORMAIS - Gráficos

A forma de detectar a presença de heterocedasticidade é:


Examinar, informalmente, os gráficos do resíduos e verificar se a distribuição se
mantém constante ao longo do tempo ou, se existe alguma forma crescente ou
decrescente da trajetória dos resíduos estimados, ao longo do tempo;
a. Se não houver nenhuma informação prévia, ou empírica, sobre a natureza
da heteroscedasticidade, podemos, na prática, fazer a análise de regressão
sob a hipótese de que não há nenhuma violação e efetuar uma análise dos
resíduos ao quadrado, para verificar se eles exibem algum padrão
sistemático. Pode-se efetuar uma análise dos resíduos em relação ao tempo
(t); em relação à (Y); ou em relação à variável explicativa (X).

Formalmente, pode-se detectar a presença de heteroscedasticidade através dos


testes de Park (1966), Teste de Glejser (1969), Teste de Goldfeld-Quandt (1972), Teste
de White (1980) e outros.

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 3


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

3. – TESTES FORMAIS

A) Teste de Park

Park (1966) formaliza o método gráfico ao sugerir que s2 seja uma função da
variável explicativa X. A forma funcional sugerida por Park é:

s i2 = s 2 X ib ev
Û ln s i2 = ln s 2 + b ln X i + vi
i

Como s2 não é conhecido, Park sugere usar o eˆi2 como uma proxy e estimar a seguinte
regressão:
ln eˆi2 = ln s 2 + b ln X i + vi

ln eˆi2 = a + b ln X i + vi

Interpretação:
Se b se revelar estatisticamente significativo, isto sugere que a heteroscesdasticidade está
presente nos dados. Se b se mostra não significativo, podemos aceitar a hipótese da
homoscedasticidade. Assim o teste de Park é um procedimento de dois estágios. No
primeiro estágio estima-se a regressão por MQO, desconsiderando a questão da
heteroscedasticidade e obtém-se os resíduos ( eˆi2 ). O segundo estágio estima-se a
regressão de PARK e efetua-se o teste de significância estatística dos parâmetros.

B) Teste de Glejser

O teste de Glejser (1969) é similar, em essência, ao teste de Park. Depois de


obtermos os resíduos da regressão por MQO, Glejser sugere que calculemos a regressão
dos valores absolutos dos eˆi sobre a variável Xi que acredita-se estar intimamente
associada à variância. Dos experimentos de Glejser, seleciona-se algumas formas
funcionais:

| eˆi |= b 0 + b1 X i + vi
| eˆi |= b 0 + b1 X i + vi
1
| eˆi |= b 0 + b1 + vi
Xi
1
| eˆi |= b 0 + b1 + vi
Xi

Glejser verificou que, para amostras grandes, os modelos dão resultados


satisfatórios na detecção da heteroscesdasticidade. Para amostras pequenas, pode ser
usada como um expediente qualitativo para descobrir algo sobre a heteroscedasticidade.

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 4


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

Interpretação:
Se b se revelar estatisticamente significativo, esta sugeriria que a heteroscedasticidade
está presente nos dados. Se b se mostrar não significativo, pode-se aceitar a hipótese de
homoscedasticidade.

Obs: Goldfeld e Quandt (1972) chamaram a atenção para o fato de o termo de erro
(vi) da equação dos resíduos apresentar alguns problemas, já que seu valor
esperado é diferente de zero (os autores sugerem que o termo de erro apresenta
correlação serial e é heteroscedástico).

C) Teste de Goldfeld-Quandt
Este método foi desenvolvido por Goldfeld e Quandt (1972) e é o método mais
popular. Em síntese, o método envolve ordenar os dados a partir dos pequenos valores da
variável independente, X, e obter duas regressões, uma para pequenos valores de X e uma
para grandes valores de X, omitindo (d=1/4) observações centrais.
Se admitirmos que a variância é heteroscedástica e se relaciona positivamente com
uma das variáveis explicativas no modelo de regressão
Yi = b0 + b1 X1i + b2 X 2i + ... + bk X ki + e i e, por hipótese, admitimos que s i se relacione
2

positivamente com Xi da seguinte forma:


s i2 = s 2 X i2
esta hipótese postula que s i2 é proporcional ao quadrado da variável X. Se esta hipótese
for apropriada, significa que s i2 seria tanto maior quanto maiores os valores de X. Se for
este o caso, é mais provável que a heteroscedasticidade esteja presente no modelo. Para
testar isto Goldfeld-Quandt (1972) sugerem os seguinte passos:

Relacionar a variância do erro com uma variável explicativa V(ei) = X1, neste caso:

a) ordenar as observações em ordem crescentes com Xj (crescentes); se a V(ei)


estiver crescendo com Xj, mostra realmente a relação existente entre as duas
variáveis; -
b) eliminar (d) observações centrais da amostra (geralmente 1/4 das observações);
c) ajustar o modelo para as duas sub-amostras e retirar dos modelos as somas dos
quadrados dos resíduos da regressão: SQRes1 da sub amostra (1) e SQRes2 da
sub amostra (2) e então verifica-se se a razão das somas dos quadrados dos erros
da segunda para a primeira regressão é significativamente diferente de zero,
usando a tabela F;
d) ou seja, testar as seguintes hipóteses:
Ho : s12 = s22 ( para sub-amostras) = homoscedasticidade
HA : s12 ¹ s22 (para sub-amostras) = heteroscedasticidade
e) calcular a razão:
SQR(2) - ( Maior S 2 ) / GL ( n - d - 2k )
l= onde GL =
SQR(1) - ( Menor S ) / GL
2
2
f) testar o resultado na distribuição de F–Assintótica;

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 5


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

Se admitirmos que os resíduos se distribuem normalmente (como geralmente fazemos) e


se a hipótese de homoscedasticidade for válida, então se pode mostrar que l segue a
distribuição F com graus de liberdade (n-d-2k)/2 no numerador e denominador.

Interpretação:
Se o l calculado for maior que o F-crítico, pode-se rejeitar a hipótese de
homoscedasticidade, ou seja, pode-se dizer que é bastante provável a presença de
heteroscedasticidade à base de dados testada.

D) Teste de White

Ao contrário do teste de Goldfeld-Quandt, que requer a ordenação das


observações referente às variáveis explicativas (X) o teste de White (1980) também é
usual por não depender da hipótese de normalidade e de fácil aplicação. Admita o seguinte
modelo de regressão de três variáveis:
Yi + b1 + b 2 X 2i + b3 X 3i + e i
o teste de White é feito da seguinte forma:

a) obtém-se os resíduos da regressão acima, estimada por MQO;


b) estima-se a seguinte equação:

eˆi2 = a1 + a2 X 2i + a3 X 3i + a4 X 22i + a5 X 32i + a 6 X 2i X 3i + n i

os resíduos ao quadrado da regressão original são regredidos sobre as variáveis


explicativas (Xis) originais, seus valores elevados ao quadrado e o produto cruzado
dos regressores (Xis). Destaca-se o R2 desta regressão “auxiliar”.

c) Sob a hipótese nula de que não há heteroscedasticidade, pode-se mostrar que o


tamanho da amostra (n) multiplicado pelo Coeficiente de Determinação, R2 (da
regressão auxiliar), assintoticamente segue a distribuição por Qui-Quadrado com GL
igual ao número de regressores da regressão auxiliar (excluindo o termo constante),
temos:

n • R2 ~ c 2GL ( numero de regressores )

Interpretação:
se o valor de Qui-Quadrado obtido exceder o valor de Qui-Quadrado tabelado, a
conclusão é de que há heteroscedasticidade. Caso contrário, o modelo é homoscedástico,
o que significa que, na regressão auxiliar a2=a3=a4=a5=a6=0.

Intuição:
neste procedimento está implícito a hipótese de que a variância do erro é funcionalmente
relacionado com os regressores. Se todos os coeficiente parciais forem iguais a zero,
então a variância do erro é a constante - homoscedasticidade.

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 6


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

4 . - Medidas Corretivas

Como salientado, a heteroscedasticidade não destrói as propriedades de


inexistência de viés de consistência dos estimadores de MQO, mas estes não são mais
eficientes, nem mesmo assintoticamente (isto é, em grandes amostras). Esta falta de
eficiência coloca em dúvida o valor do procedimento usual para o teste de hipótese.
Portanto, necessita-se claramente de medidas corretivas. Há duas abordagens para corrigir
o problema: quando a variância da população for conhecida e quando desconhecida.
Admita o modelo com heteroscedasticidade onde há variabilidade nas diferentes
classes. Para elaborar uma estimativa, seria prudente considerar esta informação no
método de estimação. Considerar esta informação permite uma estimativa mais precisa
dos parâmetros do modelo econométrico.
O método de MQO não segue a estratégia de incluir esta “informação” e confere
igual peso (ou importância) a cada observação. Para isso, usa-se o método de mínimos
quadrados generalizado (MQG). Seja o modelo:

Yi 1 Xi ei
= b0 + b1 +
si si si si

MQG Þ Yi * = b 0 + b1 X i* + e *

MQG representa o uso das variáveis transformadas que satisfazem as hipóteses usuais
dos MQO. Entretanto, o MQG minimiza uma soma ponderada de quadrados dos resíduos
onde 1/si2 serve de peso (o maior peso é dado às observações mais agrupadas junto às
suas médias).

Procedimento usual (admite variância do erro desconhecida)


Reestimar o modelo com uma “informação” a mais incorporada ao modelo, admitindo
hipóteses sobre o padrão de heteroscedasticidade. Admita o seguinte modelo
econométrico,

Yi + b0 + b1 X1i + b2 X 2i + ... + bk X ki + e i

Hipótese 1: A variância do erro é proporcional a uma das variáveis explicativas:


E (e i2 ) = s 2 X i2 .

Observação: acredita-se que a variância do erro seja proporcional ao quadrado das


variáveis explicativas, podemos transformar o modelo original da seguinte
maneira:

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 7


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

Divida o Modelo Original por Xi

Yi b 0 e 1
= + b1 + i è Yi * = b 0 + b1 + ui
Xi Xi Xi Xi

2
æe ö 1 1
Assim, E (u ) = E ç i ÷ = 2 E (e i2 ) Þ 2 • s 2 X i2 = s 2 (usando a Hipótese 1)
i
2

è Xi ø Xi Xi

Conseqüentemente, a variância do erro é agora homoscedástica, e podemos passar


a aplicar o MQO à equação transformada.

Hipótese 2: A variância do erro é proporcional a Xi. E (e i2 ) = s 2 X i

Caso se acredite que a variância do erro, em vez de ser proporcional a Xi elevado


ao quadrado, seja proporcional ao próprio Xi, então o modelo original pode ser
transformado da seguinte maneira,

Yi b e 1
= 0 + b1 X i + i è Yi* = b 0 + b1 X i + ui
Xi Xi Xi Xi

2
æ e ö 1 1
Assim, E (u ) = E ç i
2
÷ = E (e i2 ) Þ • s 2 X i = s 2 (usando a Hipótese 2)
i
ç X ÷ Xi Xi
è i ø

Portanto, podemos passar a aplicar o MQO à equação transformada.

Cuidado: o modelo transformado não deve possuir o intercepto.

Hipótese 3: uma transformação em log do tipo: ln Yi = b1 + b 2 ln X i + e

Este resultado ocorre porque a transformação em log comprime as escalas nas


quais as variáveis são medidas, reduzindo assim uma diferença de dez vezes entre dois
valores para uma diferença de duas vezes. Uma vantagem adicional da transformação em
log é que o coeficiente de inclinação mede a elasticidade de Y com relação a X (ou seja,
a variação percentual em Y para uma variação percentual em X).

A correção passa por tentativas onde estamos “especulando” sobre a natureza de si2:

a) Regressão linear múltipla: qual variável deve ser escolhida para transformar os
dados?
b) Transformação em LOG: não é aplicável para casos com variáveis negativas, ou
nulas;
c) Correlação espúria: a correlação esta presente no modelo transformado, mas o
modelo original não apresenta correlação;
d) Quando si2 não é diretamente conhecido, todos os testes t e F são válidos somente
para grandes amostras.

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 8


Curso de Economia – UFPB - Econometria2017:Heterocedasticidade

5 . - EXERCÍCIO DE FIXAÇÃO

Os dados abaixo se referem a gastos com pesquisas (P&D), vendas e lucros de 18


empresas. Considere o modelo: Yi = b0 + b1Xi1 + b2Xi2 + ei onde, ei é normalmente
distribuído e independente com E(ei) = 0, E(ei)2 = s2 e E(ei,ej) = 0 para i ¹ j. (Pg 388).

Firma PD Vendas Lucro


1 62.5 6375.3 185.10
2 92.9 11626.4 1569.5
3 178.3 14655.1 276.8
4 258.4 21869.2 2828.1
5 494.7 26408.3 225.9
6 1083.0 32405.6 3751.9
7 1620.60 35107.7 2884.1
8 421.7 40295.4 4645.7
9 509.2 70761.6 5036.4
10 6620.1 80552.8 13869.9
11 3918.6 95294.0 4487.8
12 1595.3 101314.1 10278.9
13 6107.5 116141.3 8787.3
14 4454.1 122315.7 16438.8
15 3163.8 141649.9 9761.4
16 13210.7 175025.8 19774.5
17 1703.8 230614.5 22626.6
18 9528.2 293543.0 18415.4

a) analisar o modelo com relação à heteroscedasticidade;

b) se houver evidência de heteroscedasticidade, corrigir, estimar e comparar os resultados


dos coeficientes e erros-padrão.

Prof. Dr. Sinézio Fernandes Maia - econometria2ufpb@yahoo.com.br 9

Você também pode gostar