Heterocedasticidade PDF

Heterocedasticidade
Prof. José Francisco Moreira Pessanha

professorjfmp@hotmail.com
Hipóteses do modelo de regressão linear múltipla
H0: Relação linear entre a variável dependente (Y) e as variáveis
independentes (X) – Notação do Gujarati, Econometria Básica, 4ª ed.
Yi  1   2 X 2,i  3 X 3,i     k X k ,i  ui i  1,, n
em notação vetorial
y  Xβ  u
onde
Vetor da variável Matriz das variáveis Vetor de coeficientes Vetor de erros
dependente explicativas de regressão (Vetor aleatório)
 y1  1 X 2,1  X k ,1   1   u1 
y  1 X 
 X k ,2    u 
y   2 X  2, 2
β   2 u   2
       
       
 yn  1 X 2,n  X k ,n   k  u n 
H1: E(u)=0  E u1  0
 E u  0
E u    2 
 
   
   
 E u 
n  0 
H2: Var(ui)=2 para i=1,...,n (erros com variância constante igual a 2 ou

homocedasticidade)
 
Var ui   E u  E ui   E ui2   2
2
i
2
 
= 0 (hipótese H1)
H3: Cov(ui, uj)=0 para todo ij (erros não autocorrelacionados)
Covui , u j   E ui  u j   Eui   E u j   E ui  u j   0

= 0 (hipótese H1)
Hipóteses H2 e H3 são resumidas na matriz de covariâncias do vetor de erros u
  u1    u12 u1u2  u1un 

    
    u 2u n 
 
2
u
 u  E uuT  E   2 u1 u2  un   E  2 1
u u u 2

        
 u  u u u u  un2 
 n   n 1 n 2
Pela hipótese H2  
Var ui   E ui2   2
Pela hipótese H3 Covu , u   E u  u   0
i j i j
Variâncias na diagonal principal
Covariâncias fora da diagonal principal
 u12 u1u2  u1un    2 0   0

   
 u2u1 u22  u 2u n   0  2   0 I é a matriz
Σu  E      2
I identidade
           de ordem n

u u u u
 n 1 n 2  un2   0 0 2
  
H4: A matriz X é não aleatória
H5: A matriz X tem posto k < n (k é o nº de variáveis explicativas e n o número

de observações). Isto significa que não pode haver combinações lineares entre
as variáveis explicativas,
H6: Cada erro ui ~N(0,2) para i=1,...,n, logo o vetor de erros u tem distribuição
normal multivariada (n-variada) com vetor média nulo e matriz de covariâncias
u
 u1   0  2 0  0  
u     
 0 0  2
 0 
u   2  ~ N n   ,  
         
   
   2
un   0  0 0    
Estimador de mínimos quadrados ordinários (MQO)
Estimador MQO
Vetor aleatório
 ˆ1 
ˆ 
ˆβ    2   X T X 1 X T y
 

 
 ˆk 
Matriz de covariâncias do estimador MQO
Matriz de
     
covariâncias do
vetor aleatório  Var ˆ1 Cov ˆ1 , ˆ2  Cov ˆ1 , ˆk
   
Σ βˆ  E βˆ  β βˆ  β 
T


 Cov 
ˆ , ˆ
2 1  Var ˆ2   
 Cov ˆ2 , ˆk    X X
2 T 1
       


Cov ˆk , ˆ1  
Cov ˆk , ˆ2   Var ˆk   

Estimador de mínimos quadrados ordinários (MQO)
Estimador MQO tem distribuição normal multivariada
 ˆ 1 
ˆ 
β̂  

2 

~ N k β, Σ β̂ 
ˆ 
  k 
Teorema de Gauss-Markov
Sob as hipóteses H0 até H5 (inclusive a hipótese H2 de
homocedasticidade do erro) o estimador MQO é o melhor
estimador linear não tendencioso, ou seja, o estimador MQO é
BLUE (Best Linear Unbiased Estimator)

E βˆ  β Não tendencioso
As variâncias na diagonal da matriz Σβ   X X

2
 T

1
são mínimas e por isso o MQO é o melhor estimador linear não

tendencioso
Homocedasticidade
A homocedasticidade significa que o erro e a variável explicada
(Yi) têm variância constantes, ou seja, Var(Yi|Xi)= Var(ui)=2
Note que a variância é a mesma independentemente

dos valores da variável explicativa X.
FRP:
Heterocedasticidade
A heterocedasticidade indica que a variância de Y|X não é
constante, Var(Yi|Xi)= Var(ui)=i2 (observe o subscrito i), ou seja, a
hipótese H2: Var(ui) constante é violada.
Note que as variâncias não são as mesmas

e dependem dos valores assumidos pela
variável explicativa X
Homocedasticidade x Heterocedasticidade
Homocedasticidade Heterocedasticidade
Var(ui)=2para i=1,...,n Var(ui)=i2 = 2i para i=1,...,n
erros com variância erros com variâncias
constante igual a 2 diferentes (note que a
variância está indexada por i )
Matriz de covariâncias do vetor de erros u Matriz de covariâncias do vetor de erros u

1 0  0  1 0  0
   
0 2

Σ u  E uuT  20
 

1  0
      2
I 
Σ u  E uuT  2
 
 
 0
     2
Ω
   
0 0  1  0 0  n 
 
ΩI
Exemplo ilustrativo (MADDALA, 2003)
A tabela abaixo apresenta os gastos com consumo e a renda de
20 famílias.
Família Consumo (y) Renda (x) Família Consumo (y) Renda (x)
1 19,9 22,3 11 8,0 8,1
2 31,2 32,3 12 33,1 34,5
3 31,8 36,6 13 33,5 38,0
4 12,1 12,1 14 13,1 14,1
5 40,7 42,3 15 14,8 16,4
6 6,1 6,2 16 21,6 24,1
7 38,6 44,7 17 29,3 30,1
8 25,5 26,1 18 25,0 28,3
9 10,3 10,3 19 17,9 18,2
10 38,8 40,2 20 19,8 20,1
A relação entre o consumo (y) e renda (x) pode ser especificada

pela seguinte equação econométrica:
Yi  1   2 X i  u
Neste exemplo, os coeficientes 1 e 2 são estimados por MQO a
partir da amostra de 20 famílias.
Estimação da equação de regressão por MQO
 ˆ 
 
19,9 1 22,3
ˆβ   1   X T X 1 X T y
31,2 1 32,3
31,8 1 36,6
12,1 1 12,1
 ˆ 
 2
40,7 1 42,3
6,1 1 6,2
38,6 1 44,7
25,5 1 26,1
 0,8471
10,3 1 10,3
y= X= 1 40,2
β̂   
38,8
8 1 8,1
33,1 1 34,5
 0,8993 
33,5 1 38
13,1 1 14,1
14,8 1 16,4
Yî  0,8471  0,8993 X i

21,6 1 24,1
29,3 1 30,1
25 1 28,3
17,9 1 18,2
19,8 1 20,1
Cálculo dos resíduos e da estimativa da variância do erro
Resíduos = uî  Yi  Yî  Yi  0,8471  0,8993 X i 

-1,00199
1,30476
-1,96234 Estimativa da variância do erro u
0,37112
1,81151
n  20
 uˆ
-0,32286 2
-2,44687
uˆ Tuˆ S QResíduos
i
ˆ   
1,18057 2 i 1
û 
0,18990
1,80010 nk nk nk
 1,00199   1,30476 2    0,87652 2
-0,13158 2
1,22625
-1,52139 ˆ 2 
-0,42753 20  2
-0,79598
-0,92078 ˆ 2  1,72632
1,38328
-1,29794
0,68524
0,87652
2,5
Gráfico dos resíduos
2
1,5
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
-0,5
-1
-1,5
-2
-2,5
-3
Renda
Dispersão dos resíduos cresce com a renda familiar (X), indicando que a
variância do erro não é constante, ou seja, a hipótese de homocedasticidade
do erro não é verificada.
Var(ui) cresce com a variável explicativa Xi  Var(ui)=f(Xi)  heterocedasticidade

Gráfico dos resíduos
A elevada dispersão reflete a maior
variabilidade entre os consumos das
famílias de maior renda, em função
da maior incerteza na parcela da
renda que é destinada ao consumo.
A pequena dispersão reflete a menor
2,5 variabilidade entre os consumos das
famílias de menor renda, onde a maior
2
parte da renda é consumida (não é
1,5 poupada) e as composições das
despesas são parecidas.
1
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
-0,5
-1
-1,5
-2
-2,5
-3
Renda
Erro–padrão dos estimadores MQO
1 22,3
1 32,3 Resultados obtidos sob a hipótese de homocedasticidade H2.
1 36,6
1 12,1 Como veremos mais adiante, estas estimativas são
1 42,3 tendenciosas, pois neste caso o erro é heterocedástico.
1 6,2
1 44,7
 
1 26,1
X=
1
1
10,3
40,2 ˆΣ ˆ  ˆ 2 XT X 1
1 8,1 β
1 34,5
1 38
ˆΣ   0,49471  0,01617
1 14,1
1 16,4
1 24,1
1 30,1
β̂  0,01617 0,00064 
 
1 28,3
1 18,2
1 20,1
Erro-padrão de ˆ 1
s 2ˆ  0,49471  0,70336
1
Erro-padrão de ˆ 2
s 2ˆ  0,00064  0,02531
2
Natureza da heterocedasticidade
A heterocedasticidade ocorre com freqüência quando trabalhamos com dados
em corte transversal ou cross-section (HILL et al, 2003).
O termo dados em corte transversal se refere aos dados sobre diversas

unidades econômicas, tais como firmas, famílias, municípios, estados ou
países em um dado ponto no tempo, por exemplo, um ano.
Os dados em corte transversal invariavelmente envolvem observações sobre

unidades econômicas de vários tamanhos:
 Dados sobre famílias envolvem famílias com diferentes números de membros e
diferentes níveis de renda, tais como famílias de baixa, média ou alta renda
 Dados sobre firmas envolvem firmas de tamanhos diferentes, com distintos volumes
de produção, tais como pequenos, médios e grandes firmas.
Em geral, a medida que aumenta o tamanho da unidade econômica, há maior

incerteza associada aos resultados da variável dependente, conforme
apresentado no exemplo ilustrativo da relação entre renda e consumo. Para
que o modelo econométrico descreva o processo de geração de dados com
essa propriedade, a variância do erro deve ser tanto maior quanto maior for o
tamanho da unidade econômica, ou seja o erro deve ser heterocedástico.
A heterocedasticidade não se restringe aos dados em corte transversal, mas

também pode ser observada em dados de séries temporais (HILL et al, 2003).
Uma série temporal é formada por observações de uma unidade econômica ao

longo do tempo, sendo possível que a variância do se modifique. Isso acontece
quando um choque ou variação externa cria maior ou menor incerteza sobre a
variável dependente.
Uma classe de modelos para o tratamento da heterocedasticidade em séries

temporais, em particular na análise de risco de ativos financeiros, são os
modelos ARCH-GARCH (Generalized Autoregressive Conditional
Heterocedasticity) para previsão da volatilidade (MORETTIN, 2008), tais
modelos estão fora do escopo do curso.
A heterocedasticidade também surge quando estamos trabalhando com médias de
dados ou dados per capita de algum grupo ou região geográfica, em vez dos dados
individuais (WOOLDRIDGE, 2006). Por exemplo, considere a equação de regressão
linear múltipla, onde i denota a empresa e e o empregado desta empresa:
contribi ,e  1   2 ganhosi ,e  3idadei ,e  4taxconi ,e  uie
contribie = contribuição anual do empregado e que trabalha na empresa i
ganhosie = ganho anual do empregado e
idadeie = idade do empregado e
taxcontie = montante que a empresa i deposita na conta do empregado e para cada real pago em
contribuição pelo empregado
uie = termo aleatório
Se as hipoteses H0-H5 são satisfeitas podemos estimar a equação a partir dos dados
individuais por empregado entre vários empregadores.
Porém, se dispomos apenas dos valores médios por empresa (os dados individuais não
são disponíveis) temos o seguinte modelo de regressão linear múltipla estimado a partir
dos valores médios das variáveis por empresa:
contrib i  1   2 ganhos i  3 idade i  4 taxcon i  u i

Se o erro na equação com dados individuais for homocedástico, o erro na equação com
dados médios por empresa u i será heterocedastico e a variância diminuirá com o
tamanho da empresa.
Conseqüências da heterocedasticidade para o estimador MQO
Na presença da heterocedasticidade, o estimador MQO

permanece não tendencioso, consistente e assintoticamente
normal, porém o estimador MQO torna-se ineficiente, ou seja, não
tem variância mínima.
Estimador MQO  
ˆβ  XT X 1 XT y
Na presença da heterocedasticidade o estimador MQO não é
mais BLUE.
ˆ  1

Além disso, o estimador Σβˆ  ˆ X X da matriz de covariância
2 T
fornece estimativas incorretas (tendenciosas) dos erros-padrão

dos estimadores MQO (raiz quadrada da variância na diagonal da
matriz), pois este estimador assume o pressuposto de
homocedasticidade do erro.
Não tendenciosidade do Estimador MQO βˆ  XT X XT y quando

1
erro heterocedástico:
y  Xβ  u X é não aleatório H4
    1
 
1
  1

E βˆ  E XT X XT y  E XT X XT Xβ  u   E β  XT X XTu  
E βˆ   β  X X XT E u   β
T 1

=0 H1
E βˆ  β
Note que para provar a não tendenciosidade não foi necessário
assumir a hipótese H2 sobre a variância do erro, logo a
heterocedasticidade não afeta esta propriedade do estimador
MQO.
 1
  1

βˆ  XT X XT y  XT X XT Xβ  u 
 1
 1
βˆ  β  XT X XTu  βˆ  β  XT X XTu   Desvio do estimador em
relação a sua média
Matriz de covariância dos estimadores MQO



ˆ ˆ   
Σβˆ  E β  β β  β 
T

Valor esperado dos
quadrados dos
desvios em notação
matricial
ˆ 1

Substituindo o resultado β  β  X X XTu na matriz tem-se:
T


Σβˆ  E X X T

1 T
X uu X X X  T T 1
X é não aleatório H4
  Euu XX X
1 1
Σβˆ  X X T
X T T T
Matriz de covariâncias dos erros u

Matriz de covariância dos estimadores MQO
Σβˆ  X X  T
1 T
X E uu X X X 
T T
 1
Caso homocedástico Caso heterocedástico

 
Σu  E uu   I
T 2  
Σu  E uuT   2Ω , Ω  I
 
Σβˆ   X X
2 T 1
 
T
X IX X X T 1
Σβˆ   X X
2
 T

1
X ΩX X X
T
 T

1
Σ   X X X XX X
2 T 1 T T 1
As variâncias na diagonal da matriz não são
βˆ
mínimas, por isso o estimador MQO não é
Σ   X X
2 T 1 eficiente na presença da heterocedasticidade
βˆ
ˆ X X  ˆ X X X ΩXX X
2 T 1 2 T 1 T T 1
̂ 2 XT X
1
O uso do estimador implica em perda de validade da inferência quando o erro é heterocedástico
O MQO ajusta a equação de regressão de maneira a minimizar a soma dos
quadrados dos resíduos, ou seja, define os  ’s como sendo a solução ótima do
seguinte problema de otimização:
 Y   1   2 X 2,i   3 X 3,i     k X k ,i 
n
2
Min i
1 ,  2 ,  3 ,,  k
i 1
Na presença da heterocedasticidade, os quadrados dos resíduos na região
com erros mais voláteis (maior variância) são maiores que os quadrados dos
resíduos na região com erros menos voláteis (menor variância).
2,5
1,5
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
-0,5
-1
-1,5
-2
-2,5
-3
Menor Renda Maior
volatilidade volatilidade
Na presença da heterocedasticidade, os quadrados dos resíduos na região de

maior variabilidade do erro dominam a soma dos quadrados dos resíduos.
Para minimizar a soma dos quadrados dos resíduos, o MQO faz um bom
ajustamento da equação de regressão às observações na região de maior
variabilidade do erro, pois é nesta região que se encontram os maiores
resíduos.
Ou seja, a definição dos ’s é orientada no sentido de minimizar a soma dos

quadrados dos resíduos na região de maior variabilidade do erro.
Portanto, a heterocedasticidade impõe uma ponderação implícita (PYNDICK &

RUBINFELD, 2004), em que os quadrados dos resíduos da região mais volátil
recebem “pesos” maiores que àqueles na região menos volátil.
Esta ponderação implícita torna o estimador MQO ineficiente, ou seja, o

estimador MQO perde a propriedade de variância mínima e, portanto não é
mais BLUE, embora continue sendo não tendencioso e consistente.
Soma dos quadrados dos resíduos a ser

minimizada pelo estimador MQO:
Y C uˆ A2  uˆ B2  uˆC2
ûC Note que o resíduo da observação C
domina a soma dos quadrados dos
resíduos e por esta razão o MQO vai
orientar a definição dos ’s no sentido de
A Yˆ  ˆ1  ˆ2 X minimizar uˆC2 . Este é o efeito da ponderação
implícita.
û A û B
Esta estratégia não é correta, pois atribui
B maior importância ás observações distantes
da média, representada pela reta de
X regressão, e menor importância às
observações junto a média.
Estimador de mínimos quadrados generalizados
Admitindo que as variâncias dos erros Var(ui)=i2 , i=1,...,n sejam conhecidas, a
ponderação implícita no MQO, provocada pela heterocedasticidade, é
compensada pela consideração de um sistema de pesos, em que o quadrado
de cada resíduo é ponderado pelo inverso da respectiva variância do erro:
  Y   
1   2 X 2,i   3 X 3,i     k X k ,i 
n
1 2
Min 2 i
1 ,  2 ,  3 ,,  k
i 1 i
Note a diferença entre a nova função objetivo a ser minimizada e a função

considerada pelo estimador MQO.
Note que as observações amplamente distantes da média (reta de regressão),

na região de maior variância do erro, recebem pesos menores, enquanto as
observações junto a média, nas regiões com menor variabilidade do erro,
recebem pesos maiores.
O novo estimador obtido é conhecido como estimador de mínimos quadrados

ponderados (MQP) um caso particular do mínimos quadrados
generalizados (MQG).
Inserindo a variância i2 dentro do termo quadrático obtém-se:
2
n Yi  X 2,i X 3,i X k ,i 

1
Min    1    2   3   k  

 i  i i i i
1 ,  2 ,  3 ,,  k
i 1  
Denotando
Yi 1 X 2,i X 3,i X k ,i Variáveis

Yi 
*
;X *
 ;X *
 ;X *
 ;; X *
 transformadas
i i i i i
1,i 2,i 3,i k ,i
Obtém-se uma função objetivo semelhante a considerada pelo

MQO, porém escrita com as variáveis transformadas.
 Y   X 
n
 2 X  3 X  k X
* * * * * 2
Min i 1 1,i 2,i 3,i k ,i
1 ,  2 ,  3 ,,  k
i 1
Isto significa que para aplicar o MQP basta dividir a equação de regressão por
i , o desvio-padrão de ui, e aplicar o estimador MQO para obter as estimativas
dos coeficientes ’s.
Note que dividindo a equação de regressão por i
Yi  1   2 X 2,i   3 X 3,i     k X k ,i  ui i  1,, n
1 Erro da equação
i Yi
 1
1
 2
X 2,i
 3
X 3,i
 k
X k ,i

1
transformada
ui i  1,, n
i i i i i i
Obtém-se uma equação de regressão com erro homocedástico:
 1  1
Var  ui   2 Var ui   2  i  1 ,i  1,, n
1 2
 
i  i i
Dado que os erros do modelo com variáveis transformadas são

homocedásticos, os coeficientes de regressão do modelo transformado podem
ser estimados por MQO.
Lembrando que
 i2   2i , i  1,, n
A constante 2 pode ser suprimida e a ponderação pode ser
expressa em termos de i
  Y   
1   2 X 2,i   3 X 3,i     k X k ,i 
n
1 2
Min i
1 ,  2 ,  3 ,,  k
i 1 i
A solução deste problema de minimização produz o estimador de

MQP, um caso particular do estimador de MQG, apresentado a
seguir em notação matricial:
Heterocedasticidade
 βˆ1   ω1 0  0
ˆ   
βˆ MQG  β2 
 
1  0 ω2  0
  X T Ω 1 X X T Ω 1 y Ω
     
   
 βˆ k  0 0  ωn 

 ω1 0  0 

1 0  0 
  ω1
 
 0 ω2  0 0 1  0 
Ω Ω 
1 ω2
          
   
0 0  ωn   0 0  1 
  ωn 
 1 0  0   1  
 ω1  ω1
0 0 
   
0 1  0   0 1  0 
Ω 1  
1
ω2 Ω

2
 ω2 
           
   1 
  1   0 
ωn 
0 0 0
 ωn  
1 1
Ω  Ω Ω
 
1 2 2

βˆ MQG  X T Ω 1 X 1
X T Ω 1 y
1
 T  
1

1

1

1
βˆ MQG   X Ω Ω X  X T Ω 2 Ω 2 y
2 2
 
1

Fazendo X*  Ω X 2
Yi* 
Yi
; X 1*,i 
1
; X 2*,i 
X 2,i
;
Variáveis i i i
1
 transformadas
y*  Ω y 2
X 3*,i 
X 3,i
;  ; X k*,i 
X k ,i
i i

βˆ MQG  X X *T *

1
X* T y * Semelhante ao MQO βˆ  X T X  1
XTy
Em suma o MQG é o MQO aplicado nas variáveis transformadas

e a inferência pode ser feita da maneira usual pelos testes t e F.
Propriedades do estimador MQG
ˆβ
MQG  X 
T
Ω 1
X1
X T
Ω 1
y
 X Ω X  X Ω Xβ  u 
1
βˆ MQG T 1 T 1
 β  X Ω X  X Ω u
1
βˆ MQG T 1 T 1
 
ˆ  
1
E β MQG  β  E X Ω X X T Ω 1u
T 1

E βˆ   β  X Ω X X Ω
X é não aleatório H4
Eu
T 1 1 T 1
MQG
E βˆ  β
MQG
MQG é não tendencioso =0 H1
ˆβ
MQG  β  X Ω 
T 1
X
1
X T 1
Ω u  Desvio do estimador em
relação a sua média
Propriedades do estimador MQG
Σβˆ
MQG 

 E β MQG  β β MQG  β 
 ˆ ˆ T

 
ˆβ T 1
MQG  β  X Ω X 
1 T 1
X Ω u 
Σβˆ
MQG
E X Ω X  T 1
 1
X Ω uu Ω X X Ω X
T 1 T 1
 T 1

1

Σβˆ
MQG

 X Ω X T 1
1 1
X Ω E uu Ω X X Ω X
T
  T 1
 T 1

1
Matriz de covariâncias dos erros u  

Σu  E uuT  σ 2Ω , Ω  I
Σβˆ
MQG
σ X Ω X 2
 T 1
 1
X Ω ΩΩ X X Ω X
T 1 1
 T 1
1
Σ βˆ
MQG
σ X Ω X 2
 T 1
 1
X Ω XX Ω X
T 1
 T 1

1
Σ βˆ
MQG
 σ2 X T
Ω 1 X
1
Matriz de covariância dos estimadores MQG
MQO , MQG , homocedasticidade , heterocedasticidade
Estimador MQG ˆβ
MQG  X T 1
Ω X
1
X T
Ω 1
y 
Matriz de covariância
do estimador MQG
Σβˆ
MQG
σ X Ω X
2
 T 1
1
homocedasticidade heterocedasticidade
1 0  0  1 0  0
   
20 1  0  0 2  0
Σu       2
I Σu   2     2
Ω
       
   
0 1  0 0  n 
 0  
ΩI ΩI
MQO é um caso O estimador MQG é eficiente e
particular do MQG o MQO é ineficiente.
1
βˆ MQO  XT X XT y  Matriz de covariâncias
do MQO com erros Σβˆ σ X X
2
 T
1

X ΩX X X
T T
 1
 
heterocedásticos MQO
1
Σβˆ  σ 2 XT X As variâncias em Σβˆ são maiores que as variâncias em Σ βˆ
MQO
MQO MQG
Estimador de mínimos quadrados generalizados exeqüível
Na realidade as n variâncias dos erros (ou os n elementos da matriz ) não
são conhecidas e, portanto, devem ser estimadas.
No entanto, dado que a amostra tem n observações, é impossível estimar as n

variâncias e os k parâmetros da equação de regressão.
A saída é obter alguma informação adicional que permita expressar a variância

do erro como uma função dos valores de alguma variável explicativa Xi, está
função define a forma de heterocedasticidade, por exemplo:
 i
2
  2
h  
X i
A identificação da forma de heterocedasticidade
h(Xi) não é uma tarefa simples
A forma de heterocedasticidade reduz o nº de parâmetros a serem estimados
tornando a estimação possível. Note que ao invés de estimar as n variâncias
basta estimar apenas a constante de proporcionalidade 2.
 h X 1  0  0 
 
h X 2 
Assim, tem-se o seguinte estimador para a matriz : Ωˆ   0  0 
    
 
 0  h X n 
 0
Substituindo a matriz  por sua estimativa no estimador MQG tem-se o

estimador MQG exequível (MQGE):
 βˆ1 
ˆ 
βˆ MQGE  

β2 
 
T ˆ 1 1
 X Ω X XTΩ ˆ 1y ˆˆ
Σ β MQGE

ˆ 1
 σˆ X Ω X
2 T
1

 
 βˆk 
O MQGE é tendencioso, mas assintoticamente terá as propriedades desejáveis

se ̂ for um estimador consistente de .
Implementação do MQGE
Considere a equação de regressão a ser estimada:
Yi  1   2 X 2,i   3 X 3,i     k X k ,i  ui i  1,, n
Uma vez identificado o padrão de heterocedasticidade, por exemplo, Var(ui)
proporcional a X2,i2, (Var(ui)=2X2,i2, onde 2 é uma constante de
proporcionalidade) a estimação da equação de regressão por MQGE inicia-
se com a transformação das variáveis, dividindo toda a equação pelo desvio
padrão de ui ignorando-se a constante de proporcionalidade 2. Neste caso,
basta dividir a equação por X2,i resultando na seguinte equação transformada:
X 3,i X k ,i
u*
Yi 1 u
 1   2  3  k  i i  1,, n
X 2,i X 2,i X 2, i X 2,i X 2, i
Admitindo que o padrão de heterocedasticidade tenha sido identificado
corretamente, o erro u* na equação transformada é homocedástico e, portanto,
o MQO poder ser utilizado para estimar a equação transformada:
 ui 
Var    1 Var ui   1   2 X 22,i   2 variância constante
X  X2 X 2
 2,i  2 , i 2 ,i
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Neste exemplo vamos considerar novamente uma amostra com
dados sobre rendimento e despesa familiar anual de um conjunto
com 20 famílias.
Grupo Despesas (em US$ 1000) Rendimento (US$ 1000)
1 1,8 2,0 2,0 2,0 2,1 5,0
2 3,0 3,2 3,5 3,5 3,6 10,0
3 4,2 4,2 4,5 4,8 5,0 15,0
4 4,8 5,0 5,7 6,0 6,2 20,0
7
y = 0,2372x + 0,8900
despesa anual (US$ 1000)
6 R2 = 0,9335
4 Note que neste caso o gráfico

3
das observações de
rendimento e despesas já
2
sugere heterocedasticidade
1
0
5,0 7,0 9,0 11,0 13,0 15,0 17,0 19,0
rendimento anual (US$ 1000)
Mesmo com a suspeita de heterocedasticidade vale utilizar o
MQO para estimar a equação de regressão que explica as
despesas (Y) em função do rendimento familiar (X):
Yi  1   2 X i  ui
1 5,0 1,8
1 5,0 2,0
1 5,0 2,0
1 5,0 2,0
1 5,0 2,1
1 10,0 3,0
1 10,0 3,2 MQO
ˆ1  0,89
1 10,0
 
3,5
1 10,0 3,5
X= 1 10,0
Y= 3,6
1
1
15,0
15,0
4,2
4,2
ˆ2  0,2372
1 15,0 4,5
1 15,0 4,8
1 15,0 5,0
1 20,0 4,8
1 20,0 5,0
Mais resultados da estimação
1 20,0 5,7 Coefficients Standard Error t Stat P-value
1 20,0 6,0 Intercept 0,8900 0,2043 4,3561 0,0004
1 20,0 6,2 X Variable 1 0,2372 0,0149 15,8972 0,0000
R2 = 0,9335 F= 252,7223
Análise dos resíduos MQO
 
O gráfico do resíduos contra a
uî  yi  ˆ1  ˆ2 X i variável explicativa sugere que o erro
é heterocedástico e sua variância
cresce com o rendimento anual
-0,276
-0,076
-0,076 0,8
-0,076
0,024 0,6
-0,262
-0,062 0,4
0,238
0,238 0,2
û 
resíduos
0,338
0
-0,248
-0,248 5 7 9 11 13 15 17 19
-0,2
0,052
0,352 -0,4
0,552
-0,834 -0,6
-0,634
0,066
-0,8
0,366
-1
0,566
rendimento anual (US$ 1000)
Análise dos resíduos MQO
Outra forma de identificar a presença de heterocedasticidade é
por meio do gráfico dos resíduos MQO contra os valores
ajustados Yî  ˆ1  ˆ2 X i (FOX, 1991)
0,8
O gráfico sugere
0,6 heterocedasticidade do erro
0,4
0,2
Resíduos
0
2 2,5 3 3,5 4 4,5 5 5,5 6
-0,2
-0,4
-0,6
-0,8
-1
Valores ajustados
Estimação por MQGE
1) Padrão de heterocedasticidade: com base no gráfico anterior
observa-se que a dispersão dos resíduos cresce com o
rendimento, então uma forma plausível para a
heterocedasticidade é a seguinte:
Var ui    X
2
i
2
DPui   X i
2) Transformação das variáveis: neste caso basta dividir a
equação de regressão por X, obtendo-se a seguinte equação
transformada:
Na equação
Yi 1 ui transformada  2 é o
 1  2  intercepto e  1 a
Xi Xi Xi inclinação
3) Estimação por MQO: por hipótese o erro da equação

transformada é homocedástico e, portanto, o MQO pode ser
utilizado para estimar a equação transformada.
Cálculo das variáveis transformadas
Variáveis originais Variáveis transformadas
5,0 1,8 0,360 0,2000
5,0 2,0 0,400 0,2000
5,0 2,0 0,400 0,2000
5,0 2,0 0,400 0,2000
5,0 2,1 0,420 0,2000
10,0 3,0 0,300 0,1000
10,0 3,2 0,320 0,1000
10,0 3,5 0,350 0,1000
Yi 1
 
10,0 3,5 0,350 0,1000
Xi= 10,0
15,0
Yi= 3,6
4,2
0,360
0,280
0,1000
0,0667
15,0 4,2 Xi 0,280 Xi 0,0667
15,0 4,5 0,300 0,0667
15,0 4,8 0,320 0,0667
15,0 5,0 0,333 0,0667
20,0 4,8 0,240 0,0500
20,0 5,0 0,250 0,0500
20,0 5,7 0,285 0,0500
20,0 6,0 0,300 0,0500
20,0 6,2 0,310 0,0500
Aplicação do MQO aos dados transformados
0,360 0,2000 1
0,400 0,2000 1
0,400 0,2000 1
0,400 0,2000 1
0,420 0,2000 1
0,300 0,1000 1
0,320 0,1000 1
MQO
ˆ1  0,8875
0,350 0,1000 1
Yi * 
0,350
Xi* 
0,1000 1
0,360 0,1000 1
 1
βˆ  X *T X * X *T y *
ˆ2  0,2360
0,280 0,0667 1
0,280 0,0667 1
0,300 0,0667 1
0,320 0,0667 1
0,333 0,0667 1
0,240 0,0500 1 Mais resultados da estimação
0,250 0,0500 1
0,285 0,0500 1
Coefficients Standard Error t Stat P-value
0,300 0,0500 1 Intercept 0,2495 0,0117 21,2812 0,0000
0,310 0,0500 1 1/X 0,7529 0,0983 7,6629 0,0000
O R2 menor não indica que a R2 = 0,7654 F= 58,7206

correção da heterocedasticidade
foi incorreta, pois as variáveis
foram transformadas. Na verdade o Yi 1 u
R2 do modelo transformado é Equação estimada  0,7529  0,2495  i
pouco informativo.
Xi Xi Xi
ˆ
Y
Resíduos da estimação por MQGE x valores ajustados i  ˆ 1  ˆ
1 2
Xi Xi
0,04
0,03
0,02
0,01
Resíduos
0
0,25 0,27 0,29 0,31 0,33 0,35 0,37 0,39 0,41
-0,01
-0,02
-0,03
O gráfico dos resíduos da
-0,04 estimação por MQGE sugere
homocedasticidade do erro
-0,05 da equação transformada
-0,06
Valores ajustados
Comparação dos resultados
MQO Yî  0,89  0,2372 X i
0,2043 0,0149
MQG Yî  0,7529  0,2495 X i
0,0983 0,0117
Erro padrão entre parênteses
A proximidade das estimativas pontuais reflete a não tendenciosidade do MQO

quando o erro é heterocedastico, note a pequena diferença entre 0,2372 e 0,2495.
Porém o erro padrão MQO está calculado de forma errada dada, não é robusto em
relação à heterocedasticidade.
As estimativas do MQG são mais precisas, note o menor erro-padrão.

Estimador de White (procedimento robusto em relação à heterocedasticidade)
Na ausência de conhecimento razoavelmente seguro sobre a

forma da heterocedasticidade, poderá considerar-se a a
estimação dos coeficientes  por MQO, pois este é não
tendencioso mesmo na presença de heterocedasticidade.
ˆβ
MQO  X 
T
X
1
X T
y
Porém na estimação da matriz de covariâncias, no lugar
da usual Σβˆ  σ X X deve-se utilizar a matriz
2 T 1
Halbert L. White Jr.
 σ 2 XT X XTΩXXT X ,a especificação correta da
MQO
1 1 http://weber.ucsd.edu/~mbacci/white/
Σβˆ
MQO
matriz de covariância quando o MQO é aplicado na H. White: "A Heteroskedasticity-
Consistent Covariance Matrix
estimação com erros heterocedásticos. Estimator and a Direct Test for
Heteroskedasticity," Econometrica,
Assim, o estimador de White para a matriz de 48, 817-838 (1980).
covariâncias é dado por: uˆ12 0  0 
uî2 , i  1,, n
   
1 1  
ˆˆ
Σ  X X T T
X SX X X T
onde S

0 uˆ22  0 
são os resíduos obtidos
β MQO    na estimação por MQO
 
 0 0  uˆn2 
Estimador estritamente apropriado somente para grandes amostras (WOOLDRIDGE,
2006). Os testes t e F são somente válidos assintoticamente. Note que este
procedimento consiste na aplicação do estimador MQO em uma situação com erro
heterocedástico, assim os estimadores são ineficientes, pois as variâncias são maiores
que as obtidas pelo MQG (PYNDICK & RUBINFELD, 2004), .
Comparação dos estimadores MQO, MQG e White na
presença de heterocedasticidade (GUJARATI, 2000)
Uma comparação do desempenho dos três estimadores
sob erro heterocedástico foi realizada por Davidson e
MacKinnon.
A comparação baseia-se em simulações de Monte Carlo

conduzidas com o seguinte modelo de regressão linear
simples:
Yi  1   2 X i  ui i  1,,100 James MacKinnon

http://qed.econ.queensu.c
Russell Davidson
http://people.mcgill.
a/faculty/mackinnon/ ca/russell.davidson/
em que Russell Davidson and James G.

MacKinnon, Estimation and Inference in
1  1 X i ~ U 0,1 Econometrics, Oxford University Press,
New York
2  1

ui ~ N 0, X i   é um parâmetro pré-fixado, cuja finalidade é
controlar a variabilidade do erro
Note que o erro é heterocedástico para qualquer 0. Se =1 a variância é proporcional
a X, se =2 a variância é proporcional ao quadrado de X, e assim por diante.
Para cada valor de  eles simularam 20.000 amostras, cada uma com 100 observações
e calcularam os estimadores MQO, MQG e o estimador de White.
Comparação dos estimadores MQO, MQG e White na
presença de heterocedasticidade (GUJARATI, 2000)
Erro-padrão da estimativa de 1 Erro-padrão da estimativa de 2
Erro- Erro-
(MQO) (MQO)
padrão da padrão da
 Especificação Especificação estimativa Especificação Especificação estimativa
incorreta da correta da de 1 incorreta da correta da de 2
matriz de matriz de (MQG) matriz de matriz de (MQG)
covariâncias covariâncias covariâncias covariâncias
0,5 0,164 0,134 0,110 0,285 0,277 0,243
1,0 0,142 0,101 0,048 0,246 0,247 0,171
2,0 0,116 0,074 0,0073 0,200 0,220 0,109
3,0 0,100 0,064 0,0013 0,173 0,206 0,056
4,0 0,089 0,059 0,0003 0,154 0,195 0,017
Especificação incorreta da matriz de covariâncias (MQO) Σβˆ σ X X

2
 T
 1
   
MQO
1 1
Especificação robusta em relação à Σβˆ  σ 2 XT X XTΩX XT X
heterocedasticidade (MQO) MQO
Especificação da matriz de covariâncias (MQG) Σβˆ

MQG
2

σ X Ω X T 1

1
Os resultados mostram a ineficiência do estimador MQO (maiores erros-

padrão).O MQO superestima o verdadeiro erro-padrão estimado pelo MQG,
em especial para grandes valores de .
Conclusão: na presença de heterocedasticidade utilize MQG (GUJARATI, 2000)
Detectando a heterocedasticidade
Há vários procedimentos para testar se a hipótese de
homocedasticidade é plausível:
 Análise dos resíduos do modelo original estimado por MQO
 Teste de Goldfeld-Quandt
 Teste Park
H0: homocedasticidade
 Teste de Glejser H1: heterocedasticidade
 Teste Breusch-Pagan
 Teste de White
Teste de Goldfeld-Quandt
Assume que a variância do erro é uma função monótona de alguma variável
explicativa X (em geral uma variável de tamanho), mas não assume
especificação para esta função f.
Var u   f  X  R.E.Quandt
http://www.quandt.com/req.html
O teste baseia-se em uma idéia muito simples:
 Primeiro divide-se a amostra em duas subamostras,
 Em cada subamostra estima-se o modelo sob análise y=X+u e obtém-se a série de resíduos de
cada um.
 A partir das séries de resíduos obtém-se as estimativas para a variância do erro em cada
subamostra.
 Por fim, aplica-se o teste F para testar a hipótese de igualdade das variâncias.
2,5 Subamostra II
2
1,5
ˆ 2II H 0 : 2I  2II homocedasticidade 
H1 : 2I  2II heteroceda sticidade 
1 Subamostra I
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
ˆ 2II
-0,5
-1
-1,5
Sob H0 ~F
-2
-2,5
ˆ 2I ˆ I
2
-3
Renda
S.M. Goldfeld & R.E.Quandt "Some Tests for Homoscedasticity," Journal of the American Statistical Association, 60 (1965), 539-547.
1) Ordene as observações por ordem crescente da variável X, se f(X) for uma função crescente,
ou por ordem decrescente da variável X, se f(X) for decrescente.
2) Elimine as c observações centrais (c é um número arbitrário, por exemplo, Pindyck &

Rubilfeld sugerem 1/5 da amostra). As n-c observações restantes são divididas em duas
subamostras, uma incluindo os valores menores de X (subamostra I) de tamanho n1 e outra
seus valores mais elevados (subamostra II) de tamanho n2.
3) Estime o modelo de regressão sob análise y=X+u em cada subamostra e obtenha os

respectivos resíduos, u(I,i) para i=1, ..., nI e u(2,i) para i=1, ..., n2.
4) Calcule as somas dos quadrados dos resíduos para obter as estimativas das variâncias do
erro em cada sub-amostra:
nI nII
 u1, i   u2, i 
2 2
K = nº de parâmetros no modelo de
ˆ I2  i 1
ˆ II2  i 1 regressão linear
nI  k nII  k
5) Faça o teste F para igualdade de variâncias: Sob H0
H 0 : 2I  2II homocedasticidade   II

ˆ 2
~ FnII  k ,nI k
H1 : 2I  2II heteroceda sticidade  ˆ I
2
Mais apropriado para grandes amostras, de modo que seja possível estimar as duas regressões
adequadamente.
Requer a normalidade dos resíduos.
Requer a ausência de autocorrelação serial para que tenha validade.

Teste de Park
Assume a seguinte relação entre a variância do erro e a variável explicativa X>0:
Var ui    i2  X iC
>0 é uma constante de proporcionalidade
C é uma constante a ser estimada (C 0 sugere heterocedasticidade)
Aplicando uma transformação logarítmica tem-se:
ln   ln   C ln X i
i
2
Como Var(ui) não é conhecida, substitui-se a variância pelo quadrado do resíduo MQO
do modelo y=X+u sob análise. Também admite-se uma relação estocástica:
Ruído branco
ln uˆ  ln   C ln X i  vi
2
i
O modelo acima é uma equação de regressão linear simples que pode ser estimada por
MQO. Ao final, por meio de um teste t avalia-se a significância de C:
H 0 : C  0homocedasticidade  Cˆ
Sob H0: ~ t n 2
H1 : C  0heteroceda sticidade  SC2ˆ
Teste de Breusch-Pagan
Assume que a variância do erro é uma função da combinação linear de p variáveis
Z1,...,Zp que podem ser ou não as variáveis explicativas do modelo de regressão linear
Var ui     f 1   2 Z1,i     p Z p,i 

sob análise:
2
i
1) Estime o modelo de interesse y=X + u por mínimos quadrados ordinários. n

Obtenha a série dos quadrados dos resíduos ûi2 e calcule a estimativa de máxima  uî
2
verossimilhança da variância do erro u sob a hipótese de homocedasticidade ˆ 2  i 1

(n é o número de observações) n
uî2
2) Estime por MQO o modelo de regressão auxiliar  1   2 Z 2,i     p Z p ,i  vi
ˆ 2
3) Calcule a SQExplicada da regressão auxiliar no passo 2.
4) Teste a hipótese nula H0: 2 = 3= ... = p= 0 (homocedasticidade) contra a hipótese
alternativa H1: 2  0 ou 3  0 ... ou p  0 (heterocedasticidade).
Sob a hipótese nula, a estatística teste SQExplicad a tem distribuição 2p-1

2
Se a estatística teste calculada for maior que o qui-quadrado tabelado ao nível de
significância deve-se rejeitar a hipótese nula.
Teste de White
1) Estime o modelo de interesse y=X + u por mínimos quadrados ordinários.

Obtenha a série dos quadrados dos resíduos ûi2.
2) Estime por mínimos quadrados ordinários o modelo de regressão auxiliar em que ûi2
é explicado pelas variáveis explicativas do modelo de regressão original, seus
quadrados e interações entre elas:
k k k 1 k
uî2  1   j X j ,i    j X 2j ,i   j ,l X j ,i X l ,i  vi
j 2 j 2 j  2 l 3
3) Obtenha o R2 da regressão auxiliar.
4) Teste a hipótese nula H0: 2 = 3= ... = k= 2 =...= k = 23 =...= k-1,k = 0
(homocedasticidade) contra a hipótese alternativa H 1: pelo menos um dos coeficientes é
diferente de zero (heterocedasticidade).
Sob a hipótese nula, a estatística teste nR2 tem distribuição 2 com graus de liberdade
igual ao número de variáveis explicativas no modelo de regressão auxiliar,
Se a estatística teste calculada for maior que o qui-quadrado tabelado ao nível de

significância deve-se rejeitar a hipótese nula.
Exemplo
Considere o seguinte modelo de regressão linear múltipla aplicado ao corte
transversal (referente ao ano de 1970) formado pelos 51 estados norte
americanos:
EXPi  1   2 AIDi  3 POPi   4 INCi  ui i =1 , 50 observações
Onde:
EXPi = gastos do governo no estado i

AIDi = ajuda do governo federal ao estado i
POPi = população do estado i
INCi = renda agregada do estado i
Para este modelo a expectativa é que o termo aleatório seja heterocedástico, pois
trata-se de uma cross-section formada por unidades (estados) de tamanhos
diferentes.
Neste caso, a população é a variável associada ao tamanho das unidades e,

portanto, é a variável que explica a possível heterocedasticidade.
Exemplo
AID POP INC
704,00 1 190,84 1.026 3.759.264
EXP 526,00 1 95,20 774 3.311.946
411,00 1 108,10 460 1.703.380
5.165,98 1 1.101,24 5.796 27.965.700
699,00 1 178,30 969 4.373.097 Estimação por MQO
2.545,99 1 446,60 3.080 16.675.120
 
22.749,37 1 4.408,08 18.367 96.885.928
5.911,02 1 1.036,21 7.349 39.530.272
8.840,06 1 1.619,08 11.905 54.108.220
6.867,01 1 1.200,86 10.722 49.020.980
3.456,99 1 544,46 5.286 23.068.100
8.935,04 1 1.754,06 11.244 58.041.528
7.799,04 1 1.324,91 9.013 44.902.768
ˆ1  46,80526
3.756,99 1 525,02 4.526 19.366.750
3.527,99 1 631,95 3.877 16.837.810
2.108,00 1 325,89 2.884 12.447.340
3.156,00 1 716,80 4.747 20.445.330
475,00 1 127,43 634 2.617.152
ˆ2  3,23823
521,00 1 132,60 680 2.560.880
1.052,00 1 204,75 1.528 6.801.128
1.550,99 1 299,38 2.268 10.285.380
571,00 1 97,07 571 2.981.762
3.391,98 1 546,48 4.048 20.308.820
ˆ3  0,59662
3.037,02 1 624,22 4.765 20.946.940
1.250,00 1 452,34 1.795 6.505.080
y= 2.938,01
1.512,00
X= 1
1
736,16
411,26
5.221
2.688
20.194.830
9.408.000
ˆ4  0,00019
3.197,00 1 842,47 4.733 18.723.750
4.771,00 1 837,56 7.347 32.694.150
2.063,01 1 598,39 3.306 12.014.000
2.446,01 1 712,60 4.072 15.098.980
2.104,01 1 679,55 3.521 12.239.000
1.427,01 1 575,28 2.256 7.192.128
 
1.014,00 1 399,59 2.008 6.716.760
1
2.690,99 1 732,65 3.738 13.325.970
Σ βˆ  ˆ X X 2 T
1.767,01 1 500,27 2.633 10.102.820
7.246,00 1 1.636,16 11.604 47.402.340 Raiz quadrada dos
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805 elementos da matriz
368,01 1 127,67 346 1.477.074
1.919,99 1 432,61 2.364 10.874.400
823,00 1 298,05 1.076 3.778.912 Coeficientes Erro padrão Stat t valor-P
1.522,99 1 294,45 1.963 8.387.899 Interseção -46,80526 84,21 -0,56 0,58
821,00 1 220,89 1.127 4.216.107
543,02 1 95,94 533 2.776.397 AID 3,23823 0,24 13,64 0,00
3.070,01 1 628,91 3.418 15.726.220 POP -0,59662 0,10 -5,71 0,00
1.766,00 1 439,18 2.185 9.480.715
20.051,97 1 4.082,20 20.411 103.830.800 INC 0,00019 0,00 8,12 0,00
698,00 1 185,25 325 1.697.150
940,03 1 164,83 816 4.204.848
Exemplo
Equação estimada por MQO (erros padrão entre parêntesis)
EXPi  46,80526  3,23823  AIDi  0,59662POPi  0,00019INCi  ui

(84,21) (0,24) (0,10) (0,000023)
Resíduos:
ûi  EXPi   46 ,80526  3,23823  AIDi  0 ,59662 POPi  0 ,00019 INCi 
1500
O gráfico sugere que a

1000
variância do erro cresce
com a população
500
Resíduos
População
0
0 5000 10000 15000 20000 25000
-500
-1000
-1500
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00
821,00
1.052,00
1
1
1
298,05
220,89
204,75
1.076
1.127
1.528
3.778.912
4.216.107
6.801.128
1) Ordene a amostra
1.250,00
1.522,99
1
1
452,34
294,45
1.795
1.963
6.505.080
8.387.899 na ordem crescente
1.014,00 1 399,59 2.008 6.716.760
1.766,00
1.427,01
1
1
439,18
575,28
2.185
2.256
9.480.715
7.192.128
da população dos
1.550,99 1 299,38 2.268 10.285.380
1.919,99
1.767,01
1
1
432,61
500,27
2.364
2.633
10.874.400
10.102.820
estados
1.512,00 1 411,26 2.688 9.408.000 8 observações
2.108,00 1 325,89 2.884 12.447.340
2.545,99 1 446,60 3.080 16.675.120 centrais (c=8)
2.063,01
3.070,01
1
1
598,39
628,91
3.306
3.418
12.014.000
15.726.220
2) Retire algumas
2.104,01 1 679,55 3.521 12.239.000
2.690,99
3.527,99
1
1
732,65
631,95
3.738
3.877
13.325.970
16.837.810
observações
3.391,98
2.446,01
3.756,99
1
1
1
546,48
712,60
525,02
4.048
4.072
4.526
20.308.820
15.098.980
19.366.750
centrais e forme
3.197,00
3.156,00
1
1
842,47
716,80
4.733
4.747
18.723.750
20.445.330 duas subamostras
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980
8.935,04 1 1.754,06 11.244 58.041.528
7.246,00 1 1.636,16 11.604 47.402.340
8.840,06 1 1.619,08 11.905 54.108.220
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00 1 298,05 1.076 3.778.912
821,00 1 220,89 1.127 4.216.107
1.052,00 1 204,75 1.528 6.801.128
1.250,00 1 452,34 1.795 6.505.080
1.522,99 1 294,45 1.963 8.387.899
1.014,00 1 399,59 2.008 6.716.760
1.766,00 1 439,18 2.185 9.480.715
1.427,01
1.550,99
1.919,99
1
1
1
575,28
299,38
432,61
2.256
2.268
2.364
7.192.128
10.285.380
10.874.400
3) Estime o modelo de regressão
1.767,01
1.512,00
1
1
500,27
411,26
2.633
2.688
10.102.820
9.408.000 EXPi  1   2 AIDi  3 POPi   4 INCi  ui
2.108,00 1 325,89 2.884 12.447.340
2.545,99
2.063,01
1
1
446,60
598,39
3.080
3.306
16.675.120
12.014.000
em cada subamostra e obtenha a
3.070,01
2.104,01
2.690,99
1
1
1
628,91
679,55
732,65
3.418
3.521
3.738
15.726.220
12.239.000
13.325.970
respectiva SQResíduos
3.527,99 1 631,95 3.877 16.837.810
3.391,98 1 546,48 4.048 20.308.820
2.446,01 1 712,60 4.072 15.098.980
3.756,99 1 525,02 4.526 19.366.750
3.197,00 1 842,47 4.733 18.723.750
3.156,00 1 716,80 4.747 20.445.330
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980
8.935,04 1 1.754,06 11.244 58.041.528
7.246,00 1 1.636,16 11.604 47.402.340
8.840,06 1 1.619,08 11.905 54.108.220
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00 1 298,05 1.076 3.778.912
821,00 1 220,89 1.127 4.216.107
1.052,00 1 204,75 1.528 6.801.128 ANOVA
1.250,00 1 452,34 1.795 6.505.080 df SS MS F Significance F
1.522,99 1 294,45 1.963 8.387.899
Regression 3 2.957.338,81 985.779,60 189,77 2,88174E-13
1.014,00 1 399,59 2.008 6.716.760
1.766,00 1 439,18 2.185 9.480.715 Residual 17 88.308,84 5.194,64
1.427,01 1 575,28 2.256 7.192.128 Total 20 3.045.647,65
1.550,99 1 299,38 2.268 10.285.380
1.919,99 1 432,61 2.364 10.874.400
1.767,01 1 500,27 2.633 10.102.820
1.512,00
2.108,00
1
1
411,26
325,89
2.688
2.884
9.408.000
12.447.340 SQResíduos
2.545,99 1 446,60 3.080 16.675.120
2.063,01 1 598,39 3.306 12.014.000
3.070,01 1 628,91 3.418 15.726.220
2.104,01 1 679,55 3.521 12.239.000
2.690,99 1 732,65 3.738 13.325.970
3.527,99 1 631,95 3.877 16.837.810
3.391,98 1 546,48 4.048 20.308.820
2.446,01 1 712,60 4.072 15.098.980
3.756,99 1 525,02 4.526 19.366.750
3.197,00 1 842,47 4.733 18.723.750
3.156,00 1 716,80 4.747 20.445.330
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II SQResíduos
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
ANOVA
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980 df SS MS F Significance F
8.935,04 1 1.754,06 11.244 58.041.528 Regression 3 592.513.592,29 197.504.530,76 615,64 1,56325E-17
7.246,00 1 1.636,16 11.604 47.402.340 Residual 17 5.453.827,09 320.813,36
8.840,06 1 1.619,08 11.905 54.108.220 Total 20 597.967.419,39
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
4) Calcule a estatística teste
SQ Re síduos II 5.453.827,09 5.453.827,09

nII  k 21  4 17
   61,76
SQ Re síduos I 88.308,84 88.308,84
nI  k 21  4 17
k = número de parâmetros lineares, neste caso quatro
Ao nível de significância de 5%, o F17,17 é 2,27
Como 61,76 > 2,27 rejeita-se a hipótese nula de

homocedasticidade do erro
Exemplo teste de Park
1) Estime o modelo EXPi  1   2 AIDi  3 POPi   4 INCi  ui i=1,50 por MQO e

obtenha a série de resíduos:
ûi  EXPi   46 ,80526  3,23823  AIDi  0 ,59662 POPi  0 ,00019 INCi 
2) Identifique a variável relacionada com a heterocedasticidade do erro,

neste caso é a população. Em seguida estime o modelo de regressão
linear simples, onde o logaritmo dos quadrados dos resíduos é
explicado pelo logaritmo da população:
16
ln uˆ  1   2 ln POPi
2
i 14
Ln û2
Coefficients Standard Error t Stat P-value 12
Intercept -1,1636 1,7815 -0,6532 0,5168

LnPOP 1,4133 0,2255 6,2675 0,0000 10
P-valor < 5% , logo 1 é 8
̂ 2 significativamente 6
diferente de zero e o 4
LnPOP
erro é heterocedástico 4 5 6 7 8 9 10 11
Exemplo teste de Park
3) Com base nestes resultados obtemos a seguinte especificação para o

padrão de heterocedasticidade:
Var ui  é proporcional a POPi

1, 4133
Exemplo Teste de Breusch-Pagan
1) Estime o modelo original por mínimos quadrados ordinários:

obtenha a série dos quadrados dos resíduos û2.

uî2  EXPi   46,80526  3,23823  AIDi  0,59662POPi  0,00019INCi 
2
50
e o estimador de máxima verossimilhança do  uˆ 2

i
erro na hipótese de homocedasticidade ˆ 2

 i 1  129.497,3
50
2) Estime a regressão auxiliar por mínimos quadrados ordinários:

uî2
 1   2 AIDi   3 POPi   4 INCi  vi
ˆ 2
3) Calcule a SQExplicada da regressão auxiliar, neste caso, 88,6148
4) O valor da estatística teste (SQExplicada/2) é 88,6148/2 = 44,30738. Sob

H0 a estatística teste tem distribuição qui-quadrado com 3 graus de
liberdade. O p-valor P32  44,30738  0  5% logo rejeita-se a
hipótese de homocedasticidade
Exemplo Teste de White
1) Estime o modelo original por mínimos quadrados ordinários:

e obtenha a série dos quadrados dos resíduos û2.

uî2  EXPi   46,80526  3,23823  AIDi  0,59662POPi  0,00019INCi 
2
2) Estime a regressão auxiliar por mínimos quadrados ordinários:

uî2  1   2 AIDi   3 POPi   4 INCi   2 AIDi2   3 POPi 2   4 INCi2 
 2,3 AIDi POPi   24 AIDi INCi  3, 4 POPi INCi  vi
3) Calcule o R2 da regressão auxiliar, neste caso seu valor é 0,5644.
4) O valor da estatística teste (nR2) é 50 x 0,5644 = 28,2202. Sob H0 a

estatística teste tem distribuição qui-quadrado com 9 graus de
liberdade. O p-valor P92  28,2202  0,00088  5% logo rejeita-se a
hipótese de homocedasticidade
Exemplo estimação por mínimos quadrados ponderados
1) Pelo resultado do teste de Park, estimamos o padrão de

heterocedasticidade como sendo
Var ui  é proporcional a POPi
1, 4133
Assim, podemos transformar a equação de regressão original:

EXPi 1 AIDi POPi INCi
 1  2  3  4  ui*
POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133
2) Estime a equação transformada por MQO, pois por hipótese u* é

homocedástico (erro-padrão entre parêntesis)
EXˆPi 1 AIDi POPi INCi

 15,89  2,39  0,62  0,00022
(27,96) (0,25) (0,09) (0,000019)

Exemplo estimação por mínimos quadrados ponderados
Resíduos da equação transformada x população
EXPi 1 AIDi POPi INCi

 1  2  3  4  ui*
2) Estime a equação transformada por MQO, pois por hipótese u* é

homocedástico (erro-padrão entre parêntesis)
EXˆPi 1 AIDi POPi INCi

 15,89  2,39  0,62  0,00022
(27,96) (0,25) (0,09) (0,000019)

3) Estimativa da equação original por mínimos quadrados ponderados:
EXˆPi  15,89  2,39 AIDi  0,62POPi  0,00022INCi

Referências bibliográficas
FOX, J. Regression Diagnostics, Sage University Paper Series on
Quantitative Applications on the Social Science, series, nº 07-079, 1991.
GUJARATI, D.N. Econometria Básica, 3ª edição, Pearson Makron Books,

São Paulo, 2000.
HILL, R.C.; GRIFFITHS, W.E. & JUDGE, G.G. Econometria, 2ª edição,

Editora Saraiva, São Paulo, 2003.
MADDALA, G.S. Introdução à econometria, LTC, Rio de Janeiro, 2003.
MORETTIN, P.A. Econometria Financeira: um curso em séries temporais

financeiras, Editora Blucher, São Paulo, 2008.
PYNDICK, R.S. & RUBINFELD, D.L. Econometria: Modelos & Previsões,

Elsevier, Rio de Janeiro, 2004.
WOOLDRIDGE, J.M. Introdução à econometria: uma abordagem moderna,

Thomson, São Paulo, 2006.

Heterocedasticidade PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Heterocedasticidade PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Heterocedasticidade

Prof. José Francisco Moreira Pessanha

Yi  1   2 X 2,i  3 X 3,i     k X k ,i  ui i  1,, n

H2: Var(ui)=2 para i=1,...,n (erros com variância constante igual a 2 ou

H3: Cov(ui, uj)=0 para todo ij (erros não autocorrelacionados)

Covui , u j   E ui  u j   Eui   E u j   E ui  u j   0

  u1    u12 u1u2  u1un 

 u12 u1u2  u1un    2 0   0

H4: A matriz X é não aleatória

H5: A matriz X tem posto k < n (k é o nº de variáveis explicativas e n o número

Matriz de covariâncias do estimador MQO

Estimador MQO tem distribuição normal multivariada

As variâncias na diagonal da matriz Σβ   X X

são mínimas e por isso o MQO é o melhor estimador linear não

Note que a variância é a mesma independentemente

Note que as variâncias não são as mesmas

Matriz de covariâncias do vetor de erros u Matriz de covariâncias do vetor de erros u

A relação entre o consumo (y) e renda (x) pode ser especificada

Estimação da equação de regressão por MQO

Yˆi  0,8471  0,8993 X i

Resíduos = uˆi  Yi  Yˆi  Yi  0,8471  0,8993 X i 

Var(ui) cresce com a variável explicativa Xi  Var(ui)=f(Xi)  heterocedasticidade

O termo dados em corte transversal se refere aos dados sobre diversas

Os dados em corte transversal invariavelmente envolvem observações sobre

Em geral, a medida que aumenta o tamanho da unidade econômica, há maior

A heterocedasticidade não se restringe aos dados em corte transversal, mas

Uma série temporal é formada por observações de uma unidade econômica ao

Uma classe de modelos para o tratamento da heterocedasticidade em séries

contrib i  1   2 ganhos i  3 idade i  4 taxcon i  u i

Na presença da heterocedasticidade, o estimador MQO

fornece estimativas incorretas (tendenciosas) dos erros-padrão

Não tendenciosidade do Estimador MQO βˆ  XT X XT y quando

Matriz de covariância dos estimadores MQO

Matriz de covariâncias dos erros u

Matriz de covariância dos estimadores MQO

Caso homocedástico Caso heterocedástico

Na presença da heterocedasticidade, os quadrados dos resíduos na região de

Ou seja, a definição dos ’s é orientada no sentido de minimizar a soma dos

Portanto, a heterocedasticidade impõe uma ponderação implícita (PYNDICK &

Esta ponderação implícita torna o estimador MQO ineficiente, ou seja, o

Soma dos quadrados dos resíduos a ser

Note a diferença entre a nova função objetivo a ser minimizada e a função

Note que as observações amplamente distantes da média (reta de regressão),

O novo estimador obtido é conhecido como estimador de mínimos quadrados

Yi 1 X 2,i X 3,i X k ,i Variáveis

Obtém-se uma função objetivo semelhante a considerada pelo

Obtém-se uma equação de regressão com erro homocedástico:

Dado que os erros do modelo com variáveis transformadas são

A solução deste problema de minimização produz o estimador de

Em suma o MQG é o MQO aplicado nas variáveis transformadas

Matriz de covariâncias dos erros u  

No entanto, dado que a amostra tem n observações, é impossível estimar as n

A saída é obter alguma informação adicional que permita expressar a variância

Substituindo a matriz  por sua estimativa no estimador MQG tem-se o

O MQGE é tendencioso, mas assintoticamente terá as propriedades desejáveis

4 Note que neste caso o gráfico

3) Estimação por MQO: por hipótese o erro da equação

O R2 menor não indica que a R2 = 0,7654 F= 58,7206

A proximidade das estimativas pontuais reflete a não tendenciosidade do MQO

As estimativas do MQG são mais precisas, note o menor erro-padrão.

Na ausência de conhecimento razoavelmente seguro sobre a

A comparação baseia-se em simulações de Monte Carlo

Yi  1   2 X i  ui i  1,,100 James MacKinnon