Você está na página 1de 23

Heterocedasticidade

Econometria
Alexandre Gori Maia
Ementa:
• Definição;
• Identificação: Análise Gráfica, Goldfeld-Quandt, Breusch-Pagan, White;
• Correção: MQP e MQGF;
• Estimadores Robustos para a Variância;

Bibliografia Básica:
- Maia, Alexandre Gori (2017). Econometria: conceitos e aplicações. Cap. 12.
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Teorema de Gauss-Markov
1) Relação linear entre os regressores x e Y:
O modelo só é válido para relações lineares.
2) Os valores de x são fixos em repetidas amostras, não aleatórios:
Quem varia é o regressando, o regressor é fixo, qualquer que seja a amostra. Em
outras palavras, dados os valores controlados de x, Y variará aleatoriamente
segundo uma distribuição de probabilidade, com valor esperado dado por E(Y|x).

3) Esperança condicional dos erros igual a zero, ou seja, E(e|x)=0:


É a mesma coisa afirmar que E(Y|x)=xi´b.
4) A variabilidade dos erros é constante, ou seja, E(ei2)=s2
Os erros são homocedásticos, ou seja, sua variância é uma constante.
5) Os erros são não autocorrelacionados, ou seja, E(eiej)=0:
Não há relação entre valores dos erros.
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Heterocedasticidade - Definição
Homocedasticidade:
A variância dos erros e, condicionada aos valores das variáveis explanatórias, será
constante.
Var(ei / X 1i , X 2i ,..., X ki ) = s 2
Heterocedasticidade:
A variância dos erros será diferente para cada valor condicional de Xji.
Var (ei / X1i , X 2i ,..., X ki ) = s i2

Homocedasticidade Heterocedasticidade
Y Y

E(Y2) E(Y2)
Var(e2)=s2
E(Y1) E(Y1) Var(e2)=s22
Var(e1)=s2
Var(e1)=s21
X1 X2 Xj X1 X2 Xj
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Heterocedasticidade - Causas
Principais causas da heterocedasticidade:
- Natureza das variáveis: alguns relacionamentos apresentam tipicamente
tendência à heterocedasticia. Por exemplo, renda e poupança.
Yi = a + bX i + ei Var(ei ) = s i2
- Valores extremos: a ocorrência de um valor extremo na amostra pode inflacionar
a variabilidade em um determinado ponto do ajuste.
- Falhas na especificação do modelo: a heterocedasticidade pode também ser
devida à omissão de importantes variáveis no modelo.
Yi = a + bX i + ei Yi = a + b1 X i + b 2 X i2 + ei
- Transformação dos dados: a transformação das variáveis (por exemplo,
proporção ao invés de valores absolutos) ou da forma funcional (modelo log-duplo
ao invés de linear) pode eliminar a heterocedasticidade.
Yi = a + bX i + ei ln(Yi ) = a + b ln( X i ) + ei
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Consequências - Ineficiência
Ineficiência dos Estimadores de MQO
Na presenção de heterocedasticidade nos erros, os estimadores de MQO continuam
sendo não viesados e consistentes, mas deixam de ser eficientes (ou seja, não
possuem mais variância mínima). Em outras palavras, seja b^ o estimador de
MQO, então existe outro estimador b^* tal que:
Var ( bˆ *) < Var ( bˆ )
Homocedasticia Heterocedasticia
Intervalo de
Y Variação das
Intervalo de Y Intervalo de
Variação das Variação das
estimativas de estimativas de estimativas de
outro método MQO MQO

Intervalo de
Variação das
estimativas de
um método
X mais eficiente X
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Consequências – Tendenciosidade
Tendenciosidade da Variância dos Estimadores:
Outra importante consequência da heterocedasticidade é o viés do estimador da
variância de ",! mesmo para amostras grandes (inconsistência). Como resultado, as
estatísticas de teste t e F deixam de ser válidas, pois dependem da variância do
estimador. Em outras palavras, na presença de heterocedasticidade teremos:
E (S b2ˆ ) ¹ Var( bˆ )
Seja o modelo: Yi = a + bX i + ei
não viesado na ausência de
åi=1 xi yi
n
ŝ 2
Pelo MQO: b̂ = e S b2ˆ = heterocedasticidade e
åi=1 xi2
n
å
n 2
i =1
xi viesado na sua presença

No caso de s2
Var (ei ) = s 2 Var ( bˆ ) =
åi=1 xi2
n
homocedasticia:

å
n
No caso de x si
2 2
Var ( bˆ ) = i =n1
i
heterocedasticia: Var(ei ) = s i2
(åi =1 xi2 ) 2
Análise Goldfeld- Breusch- Estimador
Definição Gráfica Quandt Pagan
White MQP MQGF
Robusto

Identificação
Principais testes para se detectar a heterocedasticidade:

Análise gráfica: ê2 ´ Xj

Teste Goldfeld-Quandt
Identificação

Testes Teste de Breusch-Pagan


Estatísticos

Teste de White
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Análise Gráfica
Homocedasticidade Heterocedasticidade
ê2 ê2
A dispersão A dispersão
dos resíduos é dos resíduos é
a mesma ao uma função
longo de X linear de X
σ i2 = σ 2 X i
σ 2 = constante

X X
Heterocedasticidade Heterocedasticidade
ê2 ê2 A dispersão dos
A dispersão resíduos cresce
dos resíduos de maneira
é uma função quadrática com
quadrática de os valores de X
X σ i2 = σ 2 X i2
σi = α1 X i + α2 X i2
2

X X
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Análise Gráfica
Sejam os dados de 40 famílias para gastos com alimentação (Y) e renda (X):

Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi


σ i2 = σ 2 X i

A dispersão dos resíduos em função da variável X (renda) sugere que, à medida que a
renda cresce, a dispersão dos resíduos também aumenta, indicando a presença de
heterocedasticidade, em uma relação aparentemente linear.
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Y Teste de Goldfeld-Quandt
Sejam os valores da amostra:
Regressão 1
Y1 Y2 ... Yn
X1 X2 ... Xn Onde: X1<X2<...<Xn
A omissão de c observações centrais objetiva acentuar a diferença
entre o grupo com variância pequena (SQReg1) e com variância
Regressão 2 grande (SQReg2).

X
Para testar a hipótese nula da homocedasticia: Fgl , gl
ìï H 0: σ12 = σ 22 SQRes2 / gl n-c
F= onde gl = - (k + 1)
í 2 p
ïî H1: σ12 < σ 22 SQRes1 / gl
F

Passos para efetuar o teste de Goldfeld-Quandt


1- Ordenar as observações da amostra de acordo com os valores de X;
2- Omitir c observações centrais para dar mais poder ao teste (c costuma ser igual a 4 para n=30 e
c=10 para n=60) e separar observações em duas subamostras de (n-c)/2 observações;
3- Ajustar uma regressão para cada subamostra (cada regressão terá k variáveis independentes);
4- Testar hipótese da igualdade dos erros quadráticos médios a partir da estatística F.
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Teste de Goldfeld-Quandt
Sejam os gastos de 40 famílias com alimentação em função da renda:
Das 40 observações originais, foram eliminadas 6
observações centrais para dar mais poder ao teste.
Restaram dois subconjuntos com 17 observações cada.

Regressão 1 ìï H 0: σ12 = σ 22 estatística sˆ 22 2629,9


í F= 2 = = 4,99
ïî H1: σ12 < σ 22 de teste: s1
ˆ 526, 7
Regressão 2 E para calcular a probabilidade de erro do tipo I:

F15,15 Rejeita-se H0, ou seja, pode-se afirmar


que há diferença entre as variâncias
(heterocedasticidade) com uma
0,0017 probabilidade de erro de apenas 0,17%
4,99
Amostra 1 Amostra 2
Gasto Alimenti = 12,6 + 0,18 Rendai + eˆi Gasto Alimenti = 75,1 + 0,09 Rendai + eˆi
Fonte gl SQ QM F p Fonte gl SQ QM F p
Regressão 1 5967,2 5967,2 11,33 0,0042 Regressão 1 2308,6 2308,6 0,88 0,3636
Resíduos 15 7900,0 526,7 Resíduos 15 39449,1 2629,9
Total 16 13867,2 Total 16 41757,7
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

ê2
Teste de Breusch-Pagan
Seja o modelo de RLM com k=2:

Yi = a + b1 X1i + b 2 X 2i + ei
Par verificarmos se os resíduos quadráticos têm
relação com os regressores:

eˆi2 = d 0 + d1 X1i + d 2 X 2i + ui
Xj Onde k é o número de
variáveis explanatórias,
Para testar a hipótese nula da homocedasticia: c k2 R2aux o coeficiente de
ìH 0 : d1 = d 2 = 0 2
LM = n ´ Raux
determinação do ajuste
í p auxiliar e n o número de
îH1 : d j ¹ 0 2
observações
n´ Raux

Passos para efetuar o teste de White


1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias;
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Teste de Breusch-Pagan - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
Do ajuste original por MQO obtivemos:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:
eˆi2 = d 0 + d1Rendai + ui eˆi2 = -2,279,5 + 5,21Rendai + uˆi 2
Raux = 0,301
O teste de hipóteses será dado por:
c12
ìH 0 : d1 = 0 2
í n ´ Raux = 40 ´ 0,301 = 12,0
îH1 : d1 ¹ 0 0,0005

12,0
A probabilidade de erro ao rejeitar H0 é de apenas 0,05%. Em
outras palavras, há fortíssimas evidências para afirmarmos que os
erros são heterocedásticos pois ao fazermos tal afirmação
estaríamos sujeitos a uma chance de erro de apenas 0,05%.
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan White MQP MQGF
Robusto

Teste de White
ê2 Seja o modelo de RLM com k=2:

Yi = a + b1 X1i + b 2 X 2i + ei
Para verificar se os resíduos quadráticos têm relação com os
regressores, seus quadrados e seus produtos cruzados:

eˆi2 = d 0 + d1 X1i + d 2 X 2i + d 3 X1i X 2i + d 4 X12i + d 5 X 22i + ui


Xj Onde h é o número de
Para testar a hipótese nula da homocedasticia: c h2 variáveis explanatórias,
R2aux o coeficiente de
ìH 0 : d1 = ... = d 5 = 0 2
LM = n ´ Raux determinação e n o número
í p
îH1 : d j ¹ 0
de observações, todos
2 referentes ao ajuste
n´ Raux
auxiliar
Passos para efetuar o teste de White
1- Estimar os resíduos do ajuste de MQO para o modelo original de RLM;
2- Ajustar um modelo auxiliar relacionando o quadrado dos resíduos às variáveis independentes
do modelo original, seus quadrados e produtos cruzados;
3- Calcular a estatística LM pelo produto do número de observações e o R2 do ajuste auxiliar;
4- Calcular o valor p associado à estatística em uma distribuição c2 com gl dado pelo número de
variáveis explanatórias do ajuste auxiliar;
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan White MQP MQGF
Robusto

Teste de White - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
Do ajuste original por MQO obtivemos:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
A partir dos resíduos de MQO, ajustamos o seguinte modelo auxiliar:

"̂#$ = 67 +68 ."/01# +6$ ."/01#$ + 5#


"̂#$ = 1921 − 7,413."/01# + 0,009."/01#$ + 54 # $
.9:; = 0,365

O teste de hipóteses será dado por:


c 22
ìH 0 : d1 = d 2 = 0 $
í /×.9:; = 40×0,365 = 14,6 0,0007
îH1 : d j ¹ 0
14,58
A probabilidade de erro ao rejeitar H0 é de apenas 0,07%. Em
outras palavras, há fortíssimas evidências para afirmar que os erros
são heterocedásticos pois, ao fazermos tal afirmação, estaríamos
sujeitos a uma chance de erro de apenas 0,07%.
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Correção Heterocedasticidade
Dada a equação de RLM: A equivalente matricial:

!" = $ + &' (') + ⋯ + &+ (+) + ," y = Xβ + e


Haverá heterocedasticidade quando: Haverá heterocedasticidade quando:

Var(ei ) = E (ei2 ) = s i2 és 12 0 0 0 ù év1 0 0 0 ù


ê ú ê
ê 0 s 2
0 0 ú ê 0 v2 0 0 úú 2
Que pode ainda ser representado por: T
Var(e) = E (ee ) = 2
= s = Vs 2
ê0 0 ... 0 ú ê 0 0 ... 0 ú
onde o fator vi indica ê ú ê ú
E (ei2 ) =s 2
vi como varia a variância ëê 0 0 0 s n2 úû ë 0 0 0 vn û
de e para cada
observação i
A equação matricial equivale à trasnformação :
A equação de RLM equivale à
transformação: é1 v1 0 0 0 ù
ê ú
!"∗ 1 *)+ *-+ ." 0 1 v2 0 0 ú
!" == %$ + &+'(()') + +

⋯⋯++&(+-(+∗) ++,"∗ Λy = ΛXβ + Λe onde Λ = êê
#" #" #" #" #" 0 0 ... 0 ú
ê ú
A nova equação será homocedástica, êë 0 0 0 1 v2 úû
pois:
A nova equação será homocedástica pois:
0
," ,"0 1
. =. = . ,"0 = 2 0 E ( ΛeeT Λ) = ΛVΛs 2 = Is 2
/" /" /"
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Mínimos Quadrados Ponderados


Ponderação da variáveis:
Uma vez conhecida a matriz V de variâncias e covariâncias do erros de um modelo
de RLM, podemos obter os MELNV transformando as variáveis originais. Em
outras palavras, seja o modelo:
év1 0 0 0 ù
ê0 v 0 0 ú
y = Xβ + e em que Var (e) = ê 2 ús 2 = Vs 2
ê 0 0 ... 0 ú
ê ú
ë 0 0 0 v nû

é1 v1 0 0 0 ù
ê ú
Então: Λy = ΛXβ + Λe em que Λ = ê
0 1 v2 0 0 ú e Λ T Λ = V -1
ê 0 0 ... 0 ú
ê ú
êë 0 0 0 1 v2 úû

Apresentará erros homocedásticos, pois: E ( ΛeeT Λ) = ΛVΛs 2 = Is 2


Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

Mínimos Quadrados Ponderados


Estimadores de MQP:
Seja o modelo de RLM:
y = Xβ + e com heterocedasticidade dada por %&'()) = ,- .

Então Λy = ΛXβ + Λe será homocedástico, pois %&'(!)) = /- .


Caso a matriz ! seja conhecida, eu posso aplicar MQO às variáveis transformadas
!" e !# para estimar os coeficientes $.
Alternativamente, eu posso obter os estimadores de MQP diretamente por:
βˆ = ( XT Λ T ΛX) -1 XT Λ T Λy = ( XT V -1X) -1 XT V -1y
Raciocínio análogo é válido para obter os estimadores da variância:
T -1 -1 2
SQRes = y T V -1y - βˆ T XT V -1y e Sbˆ = ( X V X) sˆ
2

Esse método é denominado de Mínimos Quadrados Ponderados (MQP), um


caso específico do método de Mínimos Quadrados Generalizados (MQG).
Os estimadores de MQP são não tendenciosos e os mais eficientes (MELNV) na
presença de heterocedasticidade.
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF
Robusto

MQP com V conhecida - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
As estimativas de MQO são:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
Supondo que: é X 1 ... 0 ù
Var(ei ) = X is 2 Var (e) = êê ... ... ... úús 2 = Vs 2
êë 0 ... X 40 úû
Para obter as estimativas de MQP, aplicamos MQO ao modelo transformado:
!"#$%&'( 1 )%&*+( %(
=- +0 + Λy = ΛXβ + Λe
)%&*+( )%&*+( )%&*+( )%&*+(
em que ΛT Λ = V -1
As estimativas de MQP seriam:
!"#$%&'( = 32.0 + 0.14)%&*+( + %̂(∗
As estimativas de MQP são não tendenciosas e as mais eficientes. O estimador da variância
também é não tendencioso. Mas a validade dessas estimativas depende de um pressuposto
forte, que a variância dos erros seja de fato uma função linear da renda.
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF Robusto

MQGF - V Desconhecida
Mínimos Quadrados Generalizados Factíveis (MQGF):
Seja o modelo de RLM:
y = Xβ + e com heterocedasticidade dada por: Var(ei ) = vis 2
Caso o fator vi seja desconhecido, podemos estimá-lo a partir da relação da
dispersão dos resíduos de MQO com as variáveis X do modelo. Há várias
especificações que podem ser assumidas. Uma estratégia simples é assumir que a
dispersão seja uma função logarítmica de X:
dˆ0* +dˆ1X1i +...+dˆk X ki
ln(eˆi2 ) = d 0* + d1 X1i + ... + d k X ki + ui* vˆi = e
A transformação exponencial garante que todas as estimativas de "! sejam positivas
(variância não assume valores negativos!).
As estimativas de vi podem ser substituídas na matriz de ponderações V, agora
^
denominada V, para obtermos os estimadores consistentes (embora possam ser
viesados) de Mínimos Quadrados Generalizados Factíveis:
βˆ = ( XT V
ˆ -1X) -1 XT V
ˆ -1y
Análise Goldfeld- Breusch- Estimador
Definição
Gráfica Quandt Pagan
White MQP MQGF Robusto

MQGF com V Desconhecida - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
As estimativas de MQO foram:
Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
Supondo agora que:
2 d 0 +d1Rendai ln(ei2 ) = d 0* + d1Rendai + ui*
!" = ei =e ui
O fator de correção vi pode então ser estimado por:
ln(eˆi2 ) = 3,363 + 0,004Rendai + uˆi vˆi = e3,363+0,004 Rendai
As variáveis transformadas seriam:
$%&'()*" 1 0()12" (" 35 = 4
3 56 + 4
37
=, +/ + 4 38 4
em que 4 3=9
3 :;
!+" !+" !+" !+"
E as estimativas de MQGF seriam:
$%&'()*" = 22,6 + 0.160()12" + (̂"∗
As estimativas de MQGF são válidas apenas para amostras grandes (consistentes). Nesse caso, as
estimativas de MQGF seriam (assintoticamente) também mais eficientes que as de MQO. Mas, para
amostras pequenas, podem ser tendenciosas.
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Estimadores Robustos
Estimadores da Variância Robustos à Heterocedasticidade - White:
Seja o modelo de RLS:
Yi = a + bX i + ei com heterocedasticidade dada por: Var(ei ) = vis 2
Embora os estimadores de MQO para b continuem não viesados, os estimadores
de suas variâncias seriam viesados.
Um estimador robusto da variância do estimador ", ! ou seja, igualmente válido na
presença ou não de heterocedasticidade, pode ser dado por:
å å
n n
x s
2 2
xi
2 2
eˆi
ˆ
Var ( b ) = i =1 i i 2
S bˆ * = i =1

(åi =1 xi ) (åi =1 xi2 ) 2


n 2 2 n

No caso de uma RLM teríamos:


Onde ûj é o resíduo do ajuste de
åi=1uˆ 2ji eˆi2
n

Yi = a + å j =1 b j X ji + ei
k Xj em função das demais
S b2ˆ* =
(åi =1uˆ 2ji ) 2
n
j variáveis independentes

Esse estimador robusto à heterocedasticidade, atribuído a White, é válido(não


tendencioso) assintoticamente. Para amostras pequenas, as estatísticas t e F
baseadas no estimador robusto não serão necessariamente válidas.
Análise Goldfeld- Breusch- Estimador
Definição White MQP MQGF
Gráfica Quandt Pagan Robusto

Estimador Robusto - Exemplo


Sejam os gastos de 40 famílias com alimentação em função da renda:
As estimativas de MQO foram:
Gasto Alimenti = a + bRendai + ei Gasto Alimenti = 40,8 + 0,13 Rendai + eˆi
^
Caso os erros sejam homocedásticos, a estimativa de MQO para Var(b ) seria:
2 sˆ 2 1.429
S bˆ = n = = 0,00093 = 0,0312
åi=1 xi2 1.532.463 ^
Por sua vez, uma estimativa robusta à heterocedasticidade para Var(b) seria:
åi=1 i eˆi
n 2 2
x 3.421.453.919
S b2ˆ* = = = 0,0015 = 0,038 2

(åi =1 xi2 ) 2
n
(1.532.463) 2

Finalmente, a estatística t para testar a significância de b seria:


Embora haja evidências de heterocedasticidade no modelo, devemos
0,13
t= = 3,36 ter cautela na interpretação desse teste t, já que o estimador robusto
0,038 pode não ser válido para amostras pequenas (n=40).

Você também pode gostar