Você está na página 1de 71

Introdução à Econometria

Aula21: ARM_Heterocedasticidade

Paulo Loureiro

Departamento de Economia
Universidade de Brasília-UnB
pauloloureiro@unb.br
https://sites.google.com/site/praloureiro/
Aula 21: ARM_Heterocedasticidade.
Este slide é baseado em Wooldrigde, J. (2011)- Introdução À Econometria:uma
abordagem moderna.

1 / 70
Heterocedasticidade - Wooldridge, Cap. 8

1. A Natureza da Heterocedasticidade
Homo=igual; cedasticidade=espalhamento

E (µ2i ) = σ 2 , i=1,2,...,n =⇒ Homoscedasticidade


E (µ2i ) = σi2 , i=1,2,...,n =⇒ Heterocedasticidade

Exemplo: poupança como função da renda - pessoas com


mais renda poupam mais, mas, maior variabilidade.

2 / 70
8.1. Consequências da Heteroscedasticidade para o
Método MQO - Wooldridge, Cap. 8

1. Análises de Regressão Múltipla:

y = β0 + β1 x1 + β2 x2 + ...βk xk + µ (8.1)

A hipótese de Variância Constante do Erro (MLR 5):

Var (µ|xi , ..., xk ) = σ 2 , i = 1, 2, ..., n =⇒ Homocedástico

3 / 70
8.1. Consequências da Heteroscedasticidade para o
Método MQO - Wooldridge, Cap. 8
1. A hipótese de homocedasticidade significa que a variância do
termo erro, µ, condicionada às variáveis explicativas, é a
mesma para todas as combinações de resultados das variáveis
explicativas. Se esta hipótese é violada, o modelo exibe
heterocedasticidade.
Na equação: salarioh = β0 + β1 educ + β2 exper + β3 perm + µ

2. A homocedasticidade requer a variância do erro


não-observado µ não depende dos níveis de educação,
experiência ou permanência. Isto é:

3. Se a variância varia com qualquer uma das três variáveis


explicativas, então a heterocedasticidade está presente.

Var (µ|educ, exper , perm) = σ 2


4 / 70
8.1. Consequências da Heteroscedasticidade para o
Método MQO - Wooldridge, Cap. 8

1. Lembre-se da hipótese de homocedasticidade: condicional às


variáveis explicativas, a variação do erro não observado, µ, é
constante.

2. Se isso não for verdade, ou seja, se a variação de µ for


diferente para diferentes valores dos x 0 s, os erros serão
heterocedásticos.

3. Exemplo: estimar retornos à educação e habilidade é


inobservável e acha que a variação na habilidade difere de
acordo com a escolaridade.

5 / 70
8.1. Consequências da Heteroscedasticidade para o
Método MQO - Wooldridge, Cap. 8

1. MQO continua não tendencioso e consistente, mesmo se não


assumirmos a homocedasticidade.

2. Os erros padrão das estimativas serão tendenciosos se houver


heterocedasticidade.

3. Se os erros padrão são tendenciosos, não podemos usar as


estatísticas t, F e LM usuais para inferências.

4. É importante lembrar que heterocedasticidade não provoca


viés ou inconsistência nos estimadores MQO de βµ , enquanto
algo como a omissão de uma variável importante teria esse
efeito.

6 / 70
Heterocedasticidade - Wooldridge, Cap. 8

7 / 70
Correlação Serial e Heterocedasticidade

8 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

1. Primeiro, considere o modelo com uma única variável


independente, onde incluímos um índice i por ênfase:

yi = β0 + β1 xi + µi

2. Assumimos ao longo do tempo que as primeiras quatro


suposições de Gauss-Markov são válidas. Se os erros
contiverem heterocedasticidade, então

Var (µ|xi ) = σ 2 ,

9 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

1. onde colocamos um i subscrito em σ 2 para indicar que a


variação do erro depende do valor particular de xi . Escreva o
estimador OLS como

Pn
(xi − x )µi
β̂i = βi + Pi=1
n 2
i=1 (xi − x)

2. De acordo com as premissas MLR.1 a MLR.4 (ou seja, sem a


suposição de homocedasticidade) e condicionando os valores
xi na amostra, podemos usar os mesmos argumentos do
capítulo 2 para mostrar que

10 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO
Pn
(xi −x )2 σi2
Var (β̂i ) = i=1
SSTx2
(8.2)

1. onde
n
X
SSTx = (xi − x )2
i=1

é a soma dos quadrados total dos xi . Quando σi2 = σ 2 para


todo os i, esta fórmula reduz a forma usual, σi2 /SSTx . A
equação (8.2) mostra explicitamente que, para o caso de
regressão simples, a fórmula de variância derivada sob a
homocedasticidade não é mais válida quando a
heterocedasticidade está presente.

11 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO
1. Como o erro=padrão de β̂i de é baseado diretamente na
estimativa de Var (β̂i ) precisamos de um modo de estimar a
equação (8.2) quando a heteroscedasticidade está presente.
White (1980) mostrou como isso pode ser feito. Façamos
Var (µ̂) representa os resíduos MQO da regressão inicial de y
sobre x . Então, um estimador válido de β̂i , para a
heteroscedasticidade de qualquer forma (forma inclusive a
homoscedasticidade), é
Pn
(xi −x )2 µ̂i 2
i=1
SSTx2
(8.3)

2. Pode ser mostrado que quando a eq.(8.3) é mult. pelo


tamanho da amostra, n, → em prob E [(xi − µx )2 µ2i ]/(σx2 )2 ,
→ = limprob n vezes eq.(8.2)

12 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO
1. Análises de Regressão Múltipla:

y = β0 + β1 x1 + β2 x2 + ...βk xk + µ (8.1)

Pode ser mostrado que um estimador válido de Var (β̂i ), sob às


hipóteses (MLR 1-4) é:
Pn
rˆ 2 µ̂i 2
i=1 µ
SSRi2
(8.4)

1. onde rˆµ 2 representa o i-ésimo resíduo da regressão de xi sobre


todas as outras variáveis independentes , a SSRi é a soma dos
quadrados dos resíduos. A raiz quadrada de eq.(8.4) é
chamada de erro-padrão robusto em relação à
heteroscedasticidade de β̂i .

13 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

1. Uma vez que os erros-padrão robustos em relação à


heteroscedasticidade tenham sido obtidos, é fácil construir
uma estatística t robusta em relação à heteroscedasticidade:
estimativa−valor hipotético
t= erro−padr ão (8.5)

14 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

Eq. do Log dos Salários com Erros-Padrão Robustos em Relação à


Heteroscedasticidade

use http://fmwww.bc.edu/ec-p/data/wooldridge/wage2

1. reg lwage marrmale marrfem singfem educ exper expersq


tenure tenursq (7.6-8.1)

2. reg lwage marrmale marrfem singfem educ exper expersq


tenure tenursq, robust (8.1)

15 / 70
Table: Exemplo 8.1. Eq. do Log dos Salários com Erros-Padrão Robustos
em Relação à Heteroscedasticidade. (8.6)

lwage β σ t βvce σ t
constante 0,321 0,100 3,21 0,321 0,109 2,94
hcasados 0,213 0,055 3,84 0,213 0,057 3,72
mcasadas 0,198 0,058 3,43 0,198 0,058 3,37
msolteiras 0,110 0,056 1,98 0,110 0,057 1,93
educ 0,0789 0,0067 11,79 0,0789 0,0074 10,6
exper 0,0268 0,0055 5,11 0,0268 0,0051 5,22
exper 2 0,0005 0,0001 4,85 0,0005 0,0001 5,03
tenure 0,0291 0,0068 4,30 0,0291 0,0069 4,19
tenure 2 0,0005 0,0002 2,31 0,0005 0,0002 2,19
N=525 F=55,3 F=51,7
R 2 =0, 461
Fonte:Wooldridge
16 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

use http://fmwww.bc.edu/ec-p/data/wooldridge/gpa3

I reg cumgpa sat hsperc tothrs female black white if


term == 2, robust. (8.7)
I reg cumgpa sat hsperc tothrs female black white if
term == 2. (.)

17 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO
Table: Example 8.2: Estatística F Robusta em Relação à
Heteroscedasticidade

cumgpa β σ t βvce σ t
constante 1,47 0,2298 6,40 1,47 0,2207 6,66
sat 0,0011 0,0002 6,39 0,0011 0,0002 5,96
hsperc -0,0086 0,0012 -6,91 -0,0086 0,0014 -6,0
tothrs 0,0025 0,0007 3,43 0,0025 0,0007 3,38
female 0,3034 0,059 5,14 0,3034 0,0591 5,13
black -0,1283 0,1474 -0,87 -0,1283 0,1192 -1,0
white -0,0587 0,145 -0,42 -0,0587 0,1114 -0,5
N=366 F=39,98 F=39,3
R 2 =0, 401
Fonte:Wooldridge.
18 / 70
Computando Testes LM Robusta em Relação à
Heteroscedasticidade

y = β0 + β1 x1 + β2 x2 + β3 x3 + β4 x4 + β5 x5 + µ

I Suponha que queiramos testar: H0 : β4 = β5 = 0.


I A Estatística LM:
I 1. Estima-se o Modelo Restrito (sem x4 , e x5 ), para obter os
resíduos, µ;
I 2. Estima a regressão de µ̃ sobre x 0 s ( 5i=1 xi );
P

I 3. LM = n.R 2

19 / 70
Computando Testes LM Robusta em Relação à
Heteroscedasticidade

I r̃1 sobre x1 , x2 , x3 ;
I r̃2 sobre x1 , x2 , x3 ;

20 / 70
Computando Testes LM Robusta em Relação à
Heteroscedasticidade

I I sobre r̃1 µ̃, r̃2 µ̃ (8.8)

21 / 70
Uma Estatística LM Robusta em Relação à
Heteroscedasticidade
I 1. Obtenha os resíduos µ do modelo restrito;
I 2. Faça a regressão de cada uma das variáveis independentes
excluídas, conforme a hipótese nula, sobre todas as variáveis
independentes incluídas, se houver q variáveis excluídas, isso
levará a q conjuntos de resíduos (r˜1 , r˜2 , ..., r˜q );
I 3. Encontre os produtos de cada r˜j por µ̃ (para todas as
observações);
I 4. Execute a regressão de 1 sobre r̃1 µ̃, r̃2 µ̃, sem interceptar. A
estatística de LM robusta é n − SSR1 , onde SSR1 é apenas a
soma dos resíduos quadrados desta última regressão final. Sob
H0 , a estatística LM é distribuído aproximadamente como χ2q .
I Uma vez obtida a estatística robusta da LM, a regra de
rejeição e o cálculo dos valores de p são os mesmos da
estatística usual da LM.
22 / 70
Estatística LM Robusta em Relação à Heteroscedasticidade

use http://fmwww.bc.edu/ec-p/data/wooldridge/crime1

I gen avgsensq=avgsen ∗ avgsen

I reg narr 86 pcnv avgsen ptime86 qemp86 inc86 black hispan,


robust. (8.9)

I reg narr 86 pcnv avgsen ptime86 qemp86 inc86 black hispan

I dib [avgsen]/(2∗b [avgsensq])

23 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

narr86 β σ t βvce σ t
constante 0,57 0,036 15,84 0,567 0,040 14
pcnv 0,132 0,040 -3,28 -0,136 0,034 -4
ptime86 -0,038 0,0085 -4,45 -0,039 0,0062 -6
qemp86 -0,051 0,0144 -3,53 -0,051 0,0142 -3
inc86 -0,002 0,0003 -4,38 -0,001 0,0002 -6
black 0,33 0,0452 7,30 0,325 0,059 5,5
hispan 0,195 0,0397 4,92 0,193 0,0403 4,8
avgsen 0,018 0,0101 1,7
avgsensq 0,001 0,0002 -2
N=2725 F=34,95 F=29,84
R 2 =0,072
Fonte:Wooldridge.

24 / 70
Estatística LM Robusta em Relação à Heteroscedasticidade

I reg narr 86 pcnv avgsen ptime86 qemp86 inc86 black hispan


I predict ubar1 , resid
I qui reg avgsen pcnv ptime86 qemp86 inc86 black hispan
I predict r1 , r
I qui reg avgsensq pcnv ptime86 qemp86 inc86 black hispan
I predict r2 , r
I qui gen ur1 = ubar1 ∗ r1
I qui gen ur2 = ubar2 ∗ r2
I gen iota = 1
I reg iota ur1 ur2 , noconstant

25 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

1. gen iota = 1
2. regression iota ur1 ur2 , noconstant

Variáveis β σ t
ur1 0,028 0,014 1.98
ur2 -0.001 0,0005 -1.91
N=2725 F=2,00
R 2 =0,015
Fonte:Wooldridge.

26 / 70
Estatística LM Robusta em Relação à Heteroscedasticidade

I scalar hetLM =e(N) − e(RSS)


I scalar pval = χ22 .(hetLM)
I displayn Robust LM statistic : "
I Robust LM statistic : 3.997
I Under H0 , distrib χ22 ., p − value : 0.136
I reg narr86 pcnv ptime86 qemp86 inc86 black hispan

27 / 70
Estatística LM Robusta em Relação à Heteroscedasticidade

I Robust LM statistic : 3.997


I Under H0 , distrib χ22 ., p − value : 0.136
I reg narr86 pcnv ptime86 qemp86 inc86 black hispan

28 / 70
8.2. Inferência Robusta em Relação Heterocedasticidade
após Estimativa de MQO

I reg narr86 pcnv ptime86 qemp86 inc86 black hispan (Eq.8.9)

narr86 β σ t
constante 0,57 0,036 15,84
pcnv -0,132 0,0403 -3,28
ptime86 -0,038 0,0084 -4,45
qemp86 -0,051 0,0144 -3,53
inc86 -0,001 0,0003 -4,38
black 0,33 0,0452 7,30
hispan 0,195 0,0397 4,92
N=2725 F=34,95
R 2 =0,072
Fonte:Wooldridge.

29 / 70
Estatística LM Robusta em Relação à Heteroscedasticidade

1. reg narr86 pcnv ptime86 qemp86 inc86 black hispan


2. predict ubar2 , resid
3. reg ubar2 pcnv avgsen avgsensq ptime86 qemp86 inc86 black
hispan
4. scalar LM1 = e(N) ∗ e(r 2 )
5. displayn "LM statistic : "
6. LM statistic : 3.5425

30 / 70
8.3. O Teste da Existência de Heteroscedasticidade
1. predict ubar2 , resid
2. reg ubar2 pcnv avgsen avgsensq ptime86 qemp86 inc86 black
hispan
ubar2 β σ t
constante -0,003 0,0361 -0,09
pcnv -0,003 0,0404 -0,08
avgsen 0,018 0,0097 1,84
avgsensq -0,0005 0,0003 -1,74
ptime86 -0,0016 0,0086 -0,18
qemp86 0,0005 0,0144 0,03
inc86 0,00001 0,0003 0,03
black -0,0051 0,0454 -0,11
hispan -0,002 0,0397 -0,05
N=2725 F=0,43
R 2 =0,0013
Fonte:Wooldridge.
31 / 70
8.3. O Teste da Existência de Heteroscedasticidade
1. Análises de Regressão Múltipla:

y = β0 + β1 x1 + β2 x2 + ...βk xk + µ (8.10)

Sob as hipóteses MLR 1 a MLR4. Particularmente, assumimos que


E (µ|x1 , x2 , ..., xk ) = 0, de forma que o MQO seja não-viesado e
consistente. A hipótese de Variância Constante do Erro (MLR 5):

H0 : Var (µ|xi , ..., xk ) = σ 2 (8.11)

Se não podemos rejeitar (8.11) em um nível de significância


suficientemente pequeno, normalmente concluímos que a
heteroscedasticidade não será um problema.
32 / 70
8.3. O Teste da Existência de Heteroscedasticidade

Como estamos assumindo que µ tem uma esperança condicional


zero, Var (µ|xi , ..., xk ) = E (µ2 |x ), e assim a hipótese nula de
homocedasticidade é equivalente a

H0 : E (µ2 |x1 , x2 , ..., xk ) = E (µ2 ) = σ 2

Para testar a violação da hipótese de homocedasticidade, queremos


verificar se µ2 está relacionado (em valor esperado) a uma ou mais
variáveis explicativas. Se H0 for falsa, o valor esperado de µ2 |x 0 s,
pode ser virtualmente qualquer função de xj .

1. µ2 = δ0 + δ1 x1 + δ2 x2 + ... + δk xk + νi (8.12)

33 / 70
8.3. O Teste da Existência de Heteroscedasticidade

1. H0 := δ1 = δ2 = ... = δk = 0 (8.13)

Sob a hipótese nula, é razoável assumir que o erro em (8.12) νi é


independente de x1 , x2 , ..., xk . A estatística F ou a estatística LM
pode ser usada para testar (8.13).

34 / 70
8.3. O Teste da Existência de Heteroscedasticidade

Como nunca conheceremos os erros efetivos no modelo


populacional , podemos fazer uso da estimativa do erro µ̂:

1. µ̂2 = δ0 + δ1 x1 + δ2 x2 + ... + δk xk + erro (8.14)


R 2 2 /k
µ̂
2. F = (1−R 2 2 )(n−k−1)
(8.15)
µ̂

3. LM = n.Rµ̂22 (8.16)

Sob a hipótese nula, a estatística LM é distribuída


assintoticamente χ2k

A estatística LM =Teste de Breusch-Pagan da


Heteroscedasticidade

35 / 70
8.3. O Teste da Existência de Heteroscedasticidade

I O teste de Breusch-Pagan irá detectar formas de


heterocedasticidade lineares.
I A variância é uma função de uma combinação linear de
variáveis conhecidas.
I É um teste para grandes amostras. É sensível à premissa de
normalidade de µ̂i

36 / 70
8.3. O Teste de Breusch-Pagan da Heteroscedasticidade

1. Estime o modelo (8.10) por MQO. Obtenha os resíduos


quadrados MQO, µ̂2 . Um para cada observação.
2. Estime a reg. (8.14). Salve o Rµ̂22
3. Construa a estatística F ou a estatística LM


 0, 5% ⇒ 0, 005

 1% ⇒ 0, 01
p − valor <

 5% ⇒ 0, 05


10% ⇒ 0, 10
⇒ rejeita − se a Homoscedasticidade

37 / 70
8.3. O Teste de Breusch-Pagan da Heteroscedasticidade

Exemplo 8.4: Heterocedasticidade nas equações do preço de


imóveis

use http://fmwww.bc.edu/ec-p/data/wooldridge/hprice1

I reg price lotsize sqrft bdrms (8.17)


I reg log(price) log(lotsize) log(sqrft) bdrms (8.18)

38 / 70
Exemplo 8.4: Heterocedasticidade nas equações do preço
de imóveis

price β σ t P > |t|


constante -21,77 29,475 -0,74 0,462
lotsize 0,002 0,0006 3,22 0,002
sqrft 0,123 0,0132 9,28 0,000
bdrms 13,853 9,0101 1,54 0,128
R 2 =0, 672
F=57, 46 whitetst=16, 27 p(χ2 ) = 2, 9e − 04
logprice β σ t P > |t|
constante -1,297 0,6512 -1,99 0,050
llotsize 0,168 0,0383 4,39 0,000
lsqrft 0,700 0,0927 7,54 0,000
bdrms 0,037 0,0275 1,34 0,183
R 2 =0, 643
F=50, 42 whitetst=3, 45 p(χ2 ) = 0, 1784
39 / 70
8.3. O Teste de Breusch-Pagan da Heteroscedasticidade

I reg lprice llotsize lsqrft bdrms


I predict µ, resid
I gen erro=µ2
I reg erro llotsize lsqrft bdrms

R 2 =0, 0480 F=1, 41 LM=n.R 2 =88.0, 0480=4, 224

whitetst, fitted: whitetst=3, 143 p(χ2 ) = 0, 2077

⇒ não rejeita H0 : Homoscedasticidade

40 / 70
8.3. O Teste de White para a Heteroscedasticidade

I Não depende da premissa de normalidade

41 / 70
8.3. O Teste de White para a Heteroscedasticidade

1. Estimar a regressão e obter os resíduos


2. µ̂2i = δ0 + δ1 x1i + δ2 x2i + δ3 x3i + δ4 x1i2 + δ5 x2i2 + δ6 x3i2 +
δ7 x1i x2i + δ8 x1i x3i + δ9 x2i x3i + νi (8.19)
Usar em 2 sempre os x’s os mesmos ao quadrado e os
produtos cruzados
3. Obter oR 2 dessa regressão
4. Sob H0 : Homocedasticidade n.R 2 ∼ χ2g.l. assintoticamente
g.l.=no de regressores (sem a constante)
5. y = β0 + β1 x1 + β2 x2 + ...βk xk + µ (8.10)

42 / 70
8.3. O Teste de White para a Heteroscedasticidade

1. ŷ = β̂0 + β̂1 xi1 + β̂2 xi2 + ...β̂k xik (8.10)

2. µ̂2i = δ0 + δ1 ŷ + δ2 ŷ 2 + erro (8.20)

3. Se n.R 2 > χ2crit,α ⇒ rejeita H0 : Homoscedasticidade


4. Qdo σi2 é conhecido: usar MQOG
5. Qdo σi2 não é conhecido: usar regressão com VCE a Hetero
de White

43 / 70
8.3.Um Caso Especial do Teste de White para a
Heteroscedasticidade

1. Estime o Modelo (8.10) por MQO.


2. Obtenha os resíduos µ̂ e os valores estimados ŷ do MQO.
3. Calcule os resíduos quadrados µ̂ e os quadrados dos valores
estimados ŷ 2 do MQO.
4. Estime a regressão a eq.(8.20). Salve o Rµ̂2 desta regressão.
5. Construa as estatísticas F ou LM e calcule o p-valor -usando
a distribuição F2,n−1 , no primeiro caso e a distribuição p(χ22 )
no último.

44 / 70
8.3.Um Caso Especial do Teste de White para a
Heteroscedasticidade

1. use http://fmwww.bc.edu/ec-p/data/wooldridge/hprice1
2. reg lprice llotsize lsqrft bdrms
3. predict u, resid
4. gen u 2 = u ∗ u
5. predict yhat, xb
6. gen yhat 2 = yhat 2
7. reg u2 yhat yhat 2
8. gen LM = 88 ∗ 0.0392 = 3.4496
9. whitetst: 6.293672 χ24 P-value = 0.1783
10. Evidência ⇒ Heteroscedasticidade

45 / 70
8.3. O Teste da Park para a Heteroscedasticidade

1. σi2 = σ 2 xiβ µνi

2. logσi2 = logσ 2 + βlogxi + νi

3. log µ̂2i = α + βlogxi + νi




 0, 5% ⇒ 0, 005

 1% ⇒ 0, 01
tcal > ttab

 5% ⇒ 0, 05


10% ⇒ 0, 10
⇒ rejeita − se a Homoscedasticidade

46 / 70
8.3. O Teste de Park para a Heteroscedasticidade

1. Estimar a regressão por MQO sem levar em consideração a


Heterocedasticidade.
2. Salvar os µ̂i
3. Estimar a regressão do teste
4. Crítica: o termo de erro νi pode não atender os pressupostos
de MQO e ser ele próprio heterocedástico. O método pode ser
estritamente exploratório.

47 / 70
8.3. O Teste de Glejser para a Heteroscedasticidade

Estimar a regressão dos erros µ̂i


1. |µ̂i | = β0 + β1 xi + νi

2. |µ̂i | = β0 + β1 x i + νi
3. |µ̂i | = β0 + β1 x1i + νi

4. |µ̂i | = β0 + β1 xi + νi
É um teste que deve ser aplicado a grandes amostras

48 / 70
8.3. Teste de Goldfeld-Quandt para a Heteroscedasticidade

1. O teste de Goldfeld-Quandt (GQ) em econometria começa


assumindo que existe um ponto de definição e que pode ser
usado para diferenciar a variação do termo de erro. As
observações da amostra são divididas em dois grupos e a
evidência de heterocedasticidade é baseada na comparação da
soma residual dos quadrados (RSS) usando a estatística F.

2. O pressuposto é que o pesquisador pode determinar os


critérios apropriados para separar a amostra. Normalmente,
um valor predeterminado para uma das variáveis
independentes é usado como limite, o que coloca algumas
observações no grupo A e outras no grupo B.

49 / 70
8.3. Teste de Goldfeld-Quandt para a Heteroscedasticidade

1. A hipótese nula para o teste GQ é a homocedasticidade.


Quanto maior a estatística F, mais evidências você terá contra
a suposição de homocedasticidade e maior a probabilidade de
você ter heterocedasticidade (variação diferente para os dois
grupos).

2. Suponha por um momento que você esteja estimando um


modelo com o registro natural do valor do contrato dos
jogadores da Major League Baseball como variável dependente
e várias características do jogador como variáveis
independentes.

50 / 70
8.3. Teste de Goldfeld-Quandt para a Heteroscedasticidade

1. As médias de três anos para porcentagens de slugging


(slg_3_avg) e at-morcegos (ab_3_avg), idade e posse (o
número de anos que um jogador passou na equipe atual) são
as variáveis independentes. Você pode dividir arbitrariamente
a amostra pelo número médio de morcegos. Jogadores do
grupo A têm tacos abaixo da média e jogadores do grupo B
têm tacos acima da média.

2. A estatística F na figura, que mostra o processo de realização


do teste GQ no STATA, sugere que a diferença no RSS para
os dois grupos é marginalmente significativa em um teste
unilateral (valor de p = 0, 0730).

51 / 70
8.3. Teste de Goldfeld-Quandt para a Heteroscedasticidade

1. Uma fraqueza do teste GQ é que o resultado depende dos


critérios escolhidos para separar as medidas da amostra em
seus respectivos grupos. Esse processo geralmente é bastante
arbitrário, portanto, não encontrar evidências de
heterocedasticidade em um teste não o exclui com critérios
diferentes usados para separar a amostra.

2. Consequentemente, o teste GQ não fornece nenhuma


orientação para corrigir ou ajustar o modelo de
heterocedasticidade, que é uma das razões pelas quais
econometristas aplicados normalmente não confiam nele para
testar a heterocedasticidade.

52 / 70
8.3. Teste de Goldfeld-Quandt para a Heteroscedasticidade

1. Ordene as observações de acordo com os valores de xi ,


começando pelo valor baixo de x
2. Omita as observações centrais c, em que c é especificado a
princípio, e divida as (n − c) observações restantes em dois
grupos, cada um com (n − c)/2 observações
3. Y = fpri (n − c/2) e Y = fseg (n − c/2), SSR1 e SSR2 (maiores
valores de xi (maior variância ), sendo que SSR1 (menores
valores de xi ) = SSR

53 / 70
8.4. MQG

A idéia básica é transformar o modelo em outro cujos erros sejam


homocedásticos.

Considere que xi representa todas variáveis explicativas na


eq.(8.10) e assumimos que

1. Var (µ|x ) = σ 2 h(x ) (8.21)

onde h(x ) é alguma função das variáveis explicativas que


determina a heterocedasticidade. Como Var (µ|x ) = σ 2 h(x ) > 0 p/
todas V.I. Supomos que a h(x ) é conhecida. O parâmetro
populacional σ 2 é desconhecido, mas pode-se ser estimado a partir
de uma pequena a amostra.

54 / 70
MQG

1. O hi muda cada observação porque as V.I. mudam ao longo


das observações. Podemos escrever a função simples de
poupança:

item σi2 = Var (µi |xi ) = σ 2 h(xi ) = σ 2 hi

2. Poupi = β0 + βi rendai + µi (8.22)

∂poupança ↑
Se β > 0, ⇒ ∂renda ↑ >0
hx = h(renda) = renda, a σµ2 é proporcional ao nível da
renda.

3. Var (µ|renda) = σ 2 renda (8.23)

55 / 70
MQG

A partir da eq. original (8.10) que contém erros heteroscedásticos,


temos que transformá-la em outra que contenha erros
homocedásticos:

1. y = β0 + β1 x1 + β2 x2 + ...βk xk + µ (8.24)

Como hi é apenas uma função de xi , E (µi / hi /xi ) = 0. E,
2 2
√ como Var (µi |xi ) = E (µi |xi )2 = σ hi , a variância de
mais,
µi / hi (condicionada em xi ) é σ .

56 / 70
MQG


E [(µi / hi )2 ] = E (µ2i )/hi = (σ 2 hi )/hi = σ 2 ,

onde suprimimos a condicionalidade em xi , por simplicidade.



Podemos dividir a eq.(8.24) por hi para obter:
√ √ √ √ √
yi / hi = β0 / hi + β1 (xi1 / hi ) + β2 (xi2 / hi ) + ... + βk (xik / hi )
(8.5) ou
∗ + β x ∗ + β x ∗ + ... + β x ∗ + µ∗
yi = β0 xi0 1 i1 2 i2 k ik i

Agora, podemos obter estimativas de βi que tem propriedades de


eficiência melhores que MQO.

57 / 70
MQG

No exemplo anterior de economia, a equação transformada


torna-se:
√ √ √
1. Poupi / rendai = β0 / rendai + beta1 / rendai + µ∗i
I O MQG é igual aos mínimos quadrados ponderados, MQP
onde cada resíduo ao quadrado é ponderado pelo inverso da
Var (µi |xi ).
I A idéia é minimizar a soma dos quadrados ponderados por
1/hi .
I Dá-se menos peso para as observações com maior variância.

58 / 70
MQG
I Matematicamente, os estimados MQP são os valores são de
bi que tornam expressão tão pequena qto possível:
Pn
i=1 (yi − β0 − β2 xi2 − ... − βk xik )2 /hi (8.27)

µ2i em (8.27) são ponderados por 1/hi


I Como MQO min SSR, concluímos que os estimadores MQP
que minimizam (8.27) são simplesmente os estimadores de
MQO de (8.26).

n
(yi∗ − β0 xi0
∗ ∗ ∗
− ... − βk xik∗ )2
X
− β1 xi1 − β2 xi2
i=1

Enquanto
√ as variáveis transformadas em (8.26) são ponderados por
1/ hi
59 / 70
MQG - Equação de Poupança Familiar

use http://fmwww.bc.edu/ec-p/data/wooldridge/saving
1. reg sav inc
2. reg sav inc [aw = 1/inc]
3. reg sav inc size educ age black
4. reg sav inc size educ age black [aw = 1/inc]

60 / 70
Exemplo 8.4: Heterocedasticidade nas equações do preço
de imóveis

poup MQO MQP MQO MQP


renda 0,147(0,058) 0,172(0,057) 0,109(0,071) 0,101(0,077)
tamanho 67,66(223) -6,87(168,4)
educ 151,82(117,3) 139,48(100,5)
idade 0,286(50,03) 21,75(41,3)
negro 518,4(1.308) 137,3(844,6)
const 124,8 -125 -1.605 -1.855
Std. Err (655,4) (480,9) (2.831) (2.352)
N 100 100 100 100
R2 0,0621 0,0853 0,0828 0,1042

Usando os resíduos do MQO obtidos da regressão descidas na


tabela (1) acima, a regressão de µ̂2 sobe a renda produz a
estatística t do coeficiente de renda de 0,96.
61 / 70
MQG - Exemplo 8.7: Demanda de Cigarros

use http://fmwww.bc.edu/ec-p/data/wooldridge/smoke
reg cigs lincome lcigpric educ age agesq restaurn

ˆ = −3, 64(24, 08) + 0, 880logrenda(0, 728) −


cigs
0, 75precigs(5, 773) − 0, 501educ(0, 167) + 0, 771idade(0, 160) −
0, 0090idade 2 (0, 0017) − 2, 83restaurn(1, 11) (8.35)
N = 807, R 2 = 0, 0526

ˆ = −5, 64(17, 80) + 1, 295logrenda(0, 44) −


cigs
2, 94precigs(4, 46) − 0, 463educ(0, 120) + 0, 4821idade(0, 097) −
0, 0056idade 2 (0, 0009) − 3, 46restaurn(0, 80) (8.36)
N = 807, R 2 = 0, 1134

62 / 70
MQG

I Change in cigs if income increases by 10%


I display _b[lincome] ∗ 10/100 =
I = 0, 08802689
I Turnover point for age
I display_b[age]/2/_b[age 2 ] =
I = −42, 708116
I whitetst, fitted
I White’s special test statistic :
26, 57258Chi − sq(2)P − value = 1.7e − 06

63 / 70
MQG

I gen lubar=log(ub*ub)
I qui reg lubar lincome lcigpric educ age agesq restaurn
I predict cigsh, xb
I gen cigse = exp(cigsh)
I reg cigs lincome lcigpric educ age agesq restaurn [aw=1/cigse]

64 / 70
8.5 O Modelo de Probabilidade Linear Revisado

Exemplo 8.8: Participação de Mulheres Casadas na Força de


Trabalho
use http://fmwww.bc.edu/ec-p/data/wooldridge/mroz
reg inlf nwifeinc educ exper expersq age kidslt6 kidsge6

ˆ = 0, 586(0, 154)[0, 151] − 0, 0034nwifeinc(0, 0014)[0, 0015] +


inlf
0, 038educ(0, 007)[0, 007] + 0, 039exper (0, 006[0, 006] −
0, 0006exper 2 (0, 00018)[0, 00019] − 0, 016age(0, 002)[0, 002] −
0, 262kidslt6(0, 034)[0, 032] − 0, 0130kidsge6(0, 0132)[0, 0135]
N = 753 R 2 = 0.264 (8.37)
Os erros-padrão usuais e robustos então entre os parênteses e
colchetes, receptivamente.

65 / 70
8.5 O Modelo de Probabilidade Linear Revisado

Exemplo 8.8: Participação de Mulheres Casadas na Força de


Trabalho
Qto a variável dependente é binária, o modelo deve conter
heteroscedasticidade, a menos que todos os parâmetros de
inclinação sejam nulos;

A maneira mis simples de tratar a heteroscedasticidade no modelo


de probabilidade linear é continuar a usar MQO, mas também
calcular os erros-padrão robustos nas estatísticas dos testes;

Geralmente, os estimadores MQO são ineficientes no MPL.


Lembre-se de que a variância condicional de y no MPL é:

Var (y |x ) = p(x )[1 − p(x )] (8.38)

66 / 70
8.5 O Modelo de Probabilidade Linear Revisado

Exemplo 8.8: Participação de Mulheres Casadas na Força de


Trabalho
p(x ) = β0 + β1 x1 + ... + βk xk (8.39)
é a probabilidade de resposta (probabilidade de sucesso y=1).
Quando os estimadores MQO são integrados na eq. (8.39),
obtemos os valores estimados do MQO. Assim, p/ cada observação
i, Var (yi |xi ) é estimada por

ĥi = ŷi (1 − ŷi ) (8.40)

onde ŷi ) é o valor estimado por MQO da observação i.

67 / 70
Estimando o Modelo Linear de Probabilidade por
Quadrados Ponderados:

1. Estime o modelo pelo OLS e obtenha os valores ajustados, ŷ .


2. Determine se todos os valores ajustados estão dentro do
intervalo da unidade. Nesse caso, vá para a etapa (3). Caso
contrário, é necessário algum ajuste para trazer todos os
valores ajustados para o intervalo da unidade.
3. Construa as variações estimadas na equação (8.40).
4. Estime a equação y = β0 + β1 x1 + β2 x2 + ...βk xk + µ
por MQP usando pesos 1/ĥ.

68 / 70
EXEMPLO 8.9 - Determinantes da Propriedade do
Computadores Pessoais.

use http://fmwww.bc.edu/ec-p/data/wooldridge/gpa1
gen parcoll = (mothcoll | fathcoll)
reg PC hsGPA ACT parcoll

ˆ = −0, 0004(0, 477)[0, 4888] + 0, 065nmem(0, 137)[0, 139] +


PC
0, 0006ACT (0, 0155)[0, 0158] + 0, 221paisfac(0, 093)[0, 087]
(8.35) N = 141, R 2 = 0, 0415 (8.41)

69 / 70
EXEMPLO 8.9 - Determinantes da Propriedade do
Computadores Pessoais.

predict phat
gen h=phat*(1-phat)
reg PC hsGPA ACT parcoll [aw=1/h]

ˆ = 0, 026(0, 477) + 0, 033nmem(0, 130) +


PC
0, 0043ACT (0, 0155) + 0, 215paisfac(0, 086)
N = 141, R 2 = 0, 0464 (8.42)

70 / 70
Example 5.10: Brackets
−1
β̂ = X 0 X X 0y (1)

Exemplo 5.13: split environment

b − β = (X 0 X)−1 X 0 y − β
= (X 0 X)−1 X 0 (Xβ + ε) − β
= (X 0 X)−1 X 0 Xβ + (X 0 X)−1 X 0 ε − −β
= β + (X 0 X)−1 X 0 ε − β
= (X 0 X)−1 X 0 ε

70 / 70

Você também pode gostar