Você está na página 1de 33

1

AULAS 25 E 26 Heteroscedasticidade
Ernesto F. L. Amaral

10 e 15 de junho de 2010 Mtodos Quantitativos de Avaliao de Polticas Pblicas (DCP 030D)

Fonte: Wooldridge, Jeffrey M. Introduo econometria: uma abordagem moderna. So Paulo: Cengage Learning, 2008. Captulo 8 (pp.243-271).

HOMOSCEDASTICIDADE A hiptese de homoscedasticidade para a regresso mltipla significa que a varincia do erro no observvel (u), condicional nas variveis explicativas, constante. A homoscedasticidade no se mantm quando a varincia dos fatores no-observveis muda ao longo de diferentes segmentos da populao. Por exemplo, a heteroscedasticidade est presente se a varincia dos fatores no-observados (u) que afetam a renda (y) aumenta com a idade (x). A homoscedasticidade necessria para estimar os testes de t e F, alm dos intervalos de confiana. A inteno aqui de: (1) discorrer sobre as consequncias da heteroscedasticidade para estimao de MQO; (2) verificar a presena da heteroscedasticidade; (3) discutir solues para a ocorrncia deste problema.

j E R2 NA HETEROSCEDASTICIDADE A heteroscedasticidade no provoca vis ou inconsistncia nos estimadores MQO de j, enquanto a omisso de uma varivel importante teria esse efeito. O R2 da populao : 1 (varincia do erro / varincia de y) Como ambas varincias no R2 da populao so incondicionais, o R2 da populao no afetado pela presena de heteroscedasticidade em Var(u|x1,..., xk). SQR/n estima consistentemente a varincia do erro, e SQT/n estima consistentemente a varincia de y, seja Var(u|x1,..., xk) constante ou no. Portanto R2 e R2 ajustados so estimadores consistentes do R2 da populao, mantendo ou no a hiptese de homoscedasticidade.

ERROS-PADRO NA HETEROSCEDASTICIDADE Os estimadores de varincias [Var(j)] so viesados sem a hiptese de homoscedasticidade. Como os erros-padro dos estimadores MQO so baseados diretamente nessas varincias, eles no mais so vlidos para construirmos intervalos de confiana e estatsticas t. Na presena de heteroscedasticidade, as estatsticas t no tm distribuies t, as estatsticas F no tm distribuio F, e a estatstica LM no tem distribuio qui-quadrada. Portanto, as estatsticas que usamos para testar hipteses no so vlidas na presena de heteroscedasticidade. Os estimadores MQO so os melhores estimadores lineares no-viesados na hiptese de homoscedasticidade: isso ocorre quando Var(u|x) for constante.

INFERNCIA ROBUSTA possvel ajustar erros-padro, estatsticas t, F e LM de forma a torn-las vlidas na presena de heteroscedasticidade de forma desconhecida. Isso significa que possvel descrever novas estatsticas que funcionam independentemente do tipo de heteroscedasticidade presente na populao. Esses mtodos so os procedimentos robustos em relao heteroscedasticidade, j que so vlidos mesmo que a varincia dos erros no seja constante. possvel ento estimar varincias consistentes na presena de heteroscedasticidade. A aplicao de mtodos robustos em relao heteroscedasticidade bastante fcil, pois muitos programas estatsticos e economtricos calculam essas estatsticas como uma opo.

ESTIMANDO VARINCIA COM HETEROSCEDASTICIDADE No caso da regresso simples e sem a hiptese de homoscedasticidade, a varincia do estimador :

Quando para todo i, a frmula se reduz a: 2/SQTx. Quando (heteroscedasticidade), a varincia derivada sob homoscedasticidade no mais vlida. Como o erro-padro baseado diretamente na estimativa da varincia, preciso estimar a equao acima quando a heteroscedasticidade est presente. Sendo ui os resduos da regresso simples de y sobre x, um estimador vlido da varincia para a heteroscedasticidade :

EM REGRESSO MLTIPLA No caso de: (1) regresso mltipla; (2) rij ser o i-simo resduo da regresso de xj sobre todas as outras variveis independentes; e (3) SQRj ser a soma dos resduos quadrados da regresso, temos:

A raiz quadrada desta frmula o erro-padro robusto em relao heteroscedasticidade de beta estimado. Os erros-padro robustos so atribudos a White (1980). A estatstica t robusta em relao heteroscedasticidade calculada aps obter os erros-padro robustos:

ERROS-PADRO USUAIS E ROBUSTOS Geralmente, os erros-padro robustos so frequentemente maiores do que os erros-padro usuais. Os erros-padro robustos podem ser estimados mesmo sem que se saiba se a heteroscedasticidade est presente. Os novos erros-padro so vlidos (assimptoticamente) haja ou no presena de heteroscedasticidade. Com frequncia, as diferenas entre os erros-padro usuais e os robustos so pequenas. Erros-padro usuais podem ser usados se a hiptese de homoscedasticidade se mantiver e erros forem normalmente distribuidos, j que estatsticas t usuais tero distribuies t. Em amostras pequenas, as estatsticas t robustas podem ter distribuies que no sejam prximas da distribuio t. Em amostras grandes, sempre podemos levar em conta somente os erros-padro robustos.

ESTATSTICAS F E LM possvel obter estatsticas F e LM robustas em relao heteroscedasticidade de forma desconhecida.

A estatstica F robusta em relao heteroscedasticidade chamada de estatstica de Wald robusta em relao heteroscedasticidade.
O clculo do teste F robusto no tem uma forma simples, mas pode ser computado por alguns programas estatsticos.

MULTIPLICADOR DE LAGRANGE (LM) ROBUSTO Nem todos programas economtricos calculam estatsticas F que sejam robustas em relao heteroscedasticidade. Uma estatstica LM robusta pode ser obtida manualmente em qualquer programa economtrico: 1. Obtenha os resduos u do modelo restrito. 2. Faa a regresso de cada uma das variveis independentes excludas, conforme a hiptese nula, sobre todas as variveis independentes includas, e salve os resduos (r1, r2, ..., rq). 3. Encontre os produtos de cada rj por u (para todas as observaes). 4. Faa a regresso de 1 sobre r1u, r2u, ..., rqu, sem um intercepto. 5. Use a soma dos resduos quadrados da ltima regresso para calcular a estatstica LM robusta (n - SQR), a qual ter distribuio de qui-quadrado.

10

TESTE DE EXISTNCIA DE HETEROSCEDASTICIDADE Os erros-padro robustos em relao heteroscedasticidade oferecem um mtodo simples para calcular estatsticas t que sejam assimptoticamente distribudas como t, haja ou no a presena de heteroscedasticidade. Porm, h razes para saber se realmente h presena de heteroscedasticidade, antes de estimar erros-padro robustos: As estatsticas t usuais so preferveis se no h heteroscedasticidade. possvel obter um estimador melhor que o MQO quando a forma da heteroscedasticidade conhecida.

11

TESTE DE EXISTNCIA DE HETEROSCEDASTICIDADE Considere um modelo linear:

12

A hiptese nula de que a homoscedasticidade se mantm : H0: Var(u|x1,x2,...,xk) = 2 Precisamos analisar os dados para saber se a hiptese nula adequada ou no. Se no rejeitamos H0, conclumos que a heteroscedasticidade no ser um problema. Como u tem esperana condicional zero, Var(u|x)=E(u2|x), e a hiptese nula ser: H0: E(u2|x1,x2,...,xk) = E(u2) = 2

TESTE F DE EXISTNCIA DE HETEROSCEDASTICIDADE Estimamos ento esta equao:

13

Utilizando o R2 da equao acima e o nmero de regressores (k), estimamos a estatstica F:

A estatstica F tem uma distribuio Fk,n-k-1 sob a hiptese nula de homoscedasticidade, permitindo o clculo de sua significncia.

TESTE LM DE EXISTNCIA DE HETEROSCEDASTICIDADE A estatstica LM para a heteroscedasticidade o tamanho da amostra multiplicado pelo R2 da equao com u2 como varivel dependente:

14

Essa verso LM do teste geralmente chamada teste de Breusch-Pagan da heteroscedasticidade (teste BP).

RESUMINDO O TESTE BP Estime o modelo MQO em que y a varivel dependente e obtenha os resduos quadrados (u2) para cada observao. Estime o modelo em que u a varivel dependente para obter o R-quadrado. Construa a estatstica F e calcule o p-valor usando a distribuio Fk,n-k-1. Construa a estatstica LM e calcule o p-valor usando a distribuio de qui-quadrado. Se o p-valor ficar abaixo do nvel de significncia selecionados, ento rejeitamos a hiptese nula de homoscedasticidade. Se for constatada que no h homoscedasticidade, os errospadro robustos em relao heteroscedasticidade e suas estatsticas de testes podero ser utilizadas. Sabemos ainda que h menos heteroscedasticidade com a varivel dependente em forma logartmica.

15

TESTE DE WHITE PARA HETEROSCEDASTICIDADE A hiptese de homoscedasticidade [Var(u|x1,...,xk)] pode ser substituda por outra hiptese: O erro quadrado (u2) no-correlacionado com: Todas as variveis independentes (xj). Os quadrados das variveis independentes (xj2). Todos os produtos cruzados (xjxh para j h). White sugeriu um testar formas de heteroscedasticidade que invalidem os erros-padro e as estatsticas de testes. Para um modelo com trs variveis independentes, temos:

16

O teste de White para a heteroscedasticidade a estatstica LM para testar se todos j na equao sejam zero, exceto 0.

TESTE DE WHITE PARA HETEROSCEDASTICIDADE O teste de White usa muitos graus de liberdade para modelos com um nmero moderado de variveis independentes. possvel obter um teste que seja mais facilmente implementado que o teste de White. Uma sugesto usar os valores estimados MQO para verificar a existncia de heteroscedasticidade. Os valores estimados so apenas funes lineares das variveis independentes. Se eles forem elevados ao quadrado, estamos na prtica obtendo uma funo particular de todos os quadrados e produtos cruzados das variveis independentes: Podemos usar as estatsticas F ou LM para a hiptese nula: H0: 1 = 0, 2 = 0

17

RESUMINDO O TESTE DE WHITE

18

Estime o modelo MQO em que y a varivel dependente e obtenha os resduos (u) e os valores estimados de y. Calcule os resduos quadrados (u2) e os quadrados dos valores estimados. Estime o modelo em que u a varivel dependente e y e y2 sejam as variveis independentes para obter o R2. Construa a estatstica F e calcule o p-valor usando a distribuio F2,n-3. Construa a estatstica LM e calcule o p-valor usando a distribuio de qui-quadrado. Se o p-valor ficar abaixo do nvel de significncia selecionados, ento rejeitamos a hiptese nula de homoscedasticidade.

CONSIDERAO IMPORTANTE

19

Se omitirmos um ou mais termos quadrticos em um modelo de regresso ou usarmos o modelo em nvel ao invs de usar o log, um teste de heteroscedasticidade pode vir a ser significante, rejeitando a hiptese de homoscedasticidade. Isso tem levado alguns pesquisadores a verem estes testes como testes de m especificao do modelo: Porm, h outros testes que podem testar melhor a m especificao de formas funcionais das variveis. Ou seja, mais apropriado: Primeiro, realizar testes especficos de formas funcionais, j que a m especificao da forma funcional mais importante que a heteroscedasticidade. Depois de satisfeitos com as formas funcionais das variveis, estimar o teste para verificar a existncia de heteroscedasticidade.

ESTIMAO DE MNIMOS QUADRADOS PONDERADOS

20

Se for detectada heteroscedasticidade com o uso de testes estatsticos, possvel estimar erros padro robustos em relao heteroscedasticidade aps a estimao MQO.
Porm, antes das estatsticas robustas, possvel modelar e estimar a forma especfica da heteroscedasticidade, calculando um estimador mais eficiente que o MQO, alm de estatsticas t e F no enviesadas. Isso requer mais trabalho, pois preciso ser especfico sobre a natureza de qualquer heteroscedasticidade.

CONSTANTE MULTIPLICATIVA

21

Considere que x representa todas as variveis explicativas em:

Assuma que h(x) alguma funo das variveis explicativas que determina a heteroscedasticidade:

Como varincias devem ser positivas, h(x)>0 para todos valores possveis das variveis independentes. Supomos que a funo h(x) conhecida. Assim, mesmo que o parmetro populacional 2 seja desconhecido, teremos condies de estim-lo a partir de uma amostra de dados.

EQUAO TRANSFORMADA

22

Com o objetivo de obter estimadores de j que tenham propriedades de eficincia melhores que MQO, estimamos esta equao:

Esta equao linear em seus parmetros (RLM.1), a hiptese de amostragem aleatria no se alterou (RLM.2), o termo de erro tem mdia condicional zero (RLM.3) e no h colinearidade perfeita entre variveis independentes (RLM.4). A equao transformada satisfar as hipteses do modelo linear clssico, se o modelo original tambm o fizer, com exceo da hiptese de homoscedasticidade (RLM.5).

MNIMOS QUADRADOS GENERALIZADOS (MQG)

23

necessrio estimar os parmetros da nova equao por mnimos quadrados ordinrios. Os novos betas so estimadores de mnimos quadrados generalizados (MQG). Estes estimadores MQG so usados para explicar a heteroscedasticidade nos erros. Os erros-padro, estatsticas t e estatsticas F podem ser obtidas de regresses que usem as variveis transformadas. Por serem os melhores estimadores lineares no-viesados de beta, os estimadores MQG so mais eficientes que os estimadores MQO. A interpretao dos resultados deve ser feita com base na equao original. O R2 indica o quanto da variao do novo y explicado pelo novo x, o que no informativo como grau de ajuste.

MNIMOS QUADRADOS PONDERADOS (MQP)

24

Os estimadores de mnimos quadrados generalizados (MQG) para correo da heteroscedasticidade so chamados de estimadores de mnimos quadrados ponderados (MQP).
Os novos betas minimizam a soma ponderada dos quadrados dos resduos. A idia colocar menos peso nas observaes com uma varincia de erro mais alta. O mtodo MQO atribui pesos iguais a todas as observaes, pois isso melhor quando a varincia do erro idntica para todas as parties da populao.

MNIMOS QUADRADOS PONDERADOS (MQP)

25

A maioria dos programas economtricos tem um recurso para computar mnimos quadrados ponderados. Juntamente com as variveis dependentes e independentes originais, especificamos a funo de ponderao (1/hi). Especificamos pesos proporcionais ao inverso da varincia. Isso nos permite interpretar as estimativas de mnimos quadrados ponderados no modelo original. Podemos escrever a equao estimada da maneira habitual. As estimativas e os erros-padro sero diferentes do MQO, mas a maneira como interpretamos essas estimativas, errospadro e estatsticas de testes a mesma. Esse procedimento corrige estimativas dos betas (aweight). Se considerarmos que a heteroscedasticidade seria um problema para os erros-padro, deveramos computar tambm os erros-padro robustos (pweight).

MAS NA PRTICA...

26

Na prtica, raramente sabemos como a varincia do erro se comporta em relao a uma varivel independente. Em equaes de regresso mltipla, complicado saber com qual varivel independente h heteroscedasticidade nos erros e qual a forma deste problema.
Existe um caso no qual os pesos necessrios para o MQP surgem naturalmente de um modelo economtrico subjacente. Isso acontece quando os dados esto em mdias de algum grupo ou regio, e no em nvel individual.

DADOS EM MDIAS POR GRUPOS

27

Se a equao no nvel individual satisfizer a hiptese de homoscedasticidade, ento a equao do nvel agrupado dever ter heteroscedasticidade. Assim, se para todo grupo i e indivduo j:
Ento, a varincia do termo de erro mdio diminui com o tamanho do grupo: Neste caso, hi = 1/mi. Portanto, o procedimento mais eficiente ser o dos mnimos quadrados ponderados, com pesos correspondentes ao nmero de indivduos nos grupos (1/hi = mi). Isso garante que grupos maiores recebam peso maior, o que oferece mtodo eficiente de estimao dos parmetros no modelo em nvel individual quando temos mdias.

HETEROSCEDASTICIDADE NO NVEL INDIVIDUAL

28

Se no caso anterior existisse heteroscedasticidade no nvel individual, ento a ponderao adequada depender da forma da heteroscedasticidade.
Por isso, vrios pesquisadores simplesmente computam erros-padro e estatsticas de teste robustos na estimao de modelos que usam dados agrupados. Uma alternativa realizar a ponderao pelo tamanho do grupo (aweight), alm de estimar as estatsticas robustas em relao heteroscedasticidade na estimao MQP (pweight). Isso assegura que qualquer heteroscedasticidade no nvel individual seja representada pela inferncia robusta.

MQG FACTVEL

29

Ao contrrio dos exemplos anteriores, a forma exata de heteroscedasticidade no bvia na maioria dos casos. Em muitos casos podemos modelar a funo h e utilizar os dados para estimar os parmetros desconhecidos. o uso de hi-chapu em lugar de hi na transformao MQG produz o estimador de mnimos quadrados generalizados factvel (MQGF), tambm chamado de MQG estimado (MQGE). Existem vrias maneiras de modelar a heteroscedasticidade, mas iremos utilizar um mtodo razoavelmente flexvel:

utilizada funo exponencial porque modelos lineares no asseguram que os valores previstos sejam positivos, e as varincias estimadas devem ser positivas para usar o MQP.

ESTIMAO DO MQG FACTVEL

30

Para estimar os parmetros i preciso transformar a equao anterior em uma forma linear para ser estimada por MQO:
Na prtica (pg. 263): 1. Execute a regresso de y sobre x1, x2, ..., xk e obtenha os resduos de . 2. Crie elevando ao quadrado os resduos MQO e depois calculando seu log natural. 3. Execute a regresso na equao acima dos parmetros i [ou log(u2) sobre y, y2] e obtenha os valores estimados. 4. Calcule o exponencial dos valores estimados, resultando em: . 5. Estime a equao y = 0 + 1x1 + ... kxk + u, pelo mtodo MQP, usando pesos (aweight) .

ESTATSTICAS F

31

Ao calcular estatsticas F, importante que os mesmos pesos sejam usados para estimar os modelos com e sem restries.
Devemos estimar o modelo sem restries por MQO com os pesos. Usamos os mesmos pesos para estimar o modelo restrito.

Posteriormente, a estatstica F pode ser calculada.


Lembrem-se que o Stata permite utilizar o comando test para testar restries conjuntas aps a estimao de um modelo, no sendo necessrio calcular manualmente a regresso restrita.

MODELO DE PROBABILIDADE LINEAR REVISITADO

32

Quando a varivel dependente binria, o modelo deve conter heteroscedasticidade, a menos que todos parmetros de inclinao sejam nulos.
A maneira mais simples de tratar a heteroscedasticidade neste caso usar a estimao MQO, e calcular os errospadro robustos nas estatsticas de testes. As estimativas MQO do MPL so simples e geralmente produzem resultados satisfatrios, mas so ineficientes. possvel utilizar o MQP para estimar o MPL. No entanto, o mtodo falhar se for negativo (ou zero) em qualquer observao.

ESTIMAO DO MPL POR MQP

33

Estime o modelo por MQO e obtenha os valores estimados de y. Verifique se todos os valores estimados esto dentro do intervalo unitrio: Se assim for, prossiga para o passo seguinte. Caso contrrio, alguns ajustes sero necessrios para trazer todos os valores estimados para dentro do intervalo unitrio: yi = 0,01 se yi < 0 yi = 0,99 se yi > 1 Construa as varincias estimadas com esta equao:

Estime a equao y = 0 + 1x1 + ... kxk + u, pelo mtodo MQP, usando pesos (aweight) .

Você também pode gostar