Você está na página 1de 72

Heterocedasticidade

Prof. José Francisco Moreira Pessanha


professorjfmp@hotmail.com
Hipóteses do modelo de regressão linear múltipla
H0: Relação linear entre a variável dependente (Y) e as variáveis
independentes (X) – Notação do Gujarati, Econometria Básica, 4ª ed.

Yi  1   2 X 2,i  3 X 3,i     k X k ,i  ui i  1,, n

em notação vetorial

y  Xβ  u
onde
Vetor da variável Matriz das variáveis Vetor de coeficientes Vetor de erros
dependente explicativas de regressão (Vetor aleatório)

 y1  1 X 2,1  X k ,1   1   u1 
y  1 X 
 X k ,2    u 
y   2 X  2, 2
β   2 u   2
       
       
 yn  1 X 2,n  X k ,n   k  u n 
Hipóteses do modelo de regressão linear múltipla
H1: E(u)=0  E u1  0
 E u  0
E u    2 
 
   
   
 E u 
n  0 

H2: Var(ui)=2 para i=1,...,n (erros com variância constante igual a 2 ou


homocedasticidade)

 
Var ui   E u  E ui   E ui2   2
2
i
2
 
= 0 (hipótese H1)

H3: Cov(ui, uj)=0 para todo ij (erros não autocorrelacionados)

Covui , u j   E ui  u j   Eui   E u j   E ui  u j   0


= 0 (hipótese H1)
Hipóteses do modelo de regressão linear múltipla
Hipóteses H2 e H3 são resumidas na matriz de covariâncias do vetor de erros u

  u1    u12 u1u2  u1un 


    
    u 2u n 
 
2
u
 u  E uuT  E   2 u1 u2  un   E  2 1
u u u 2

        
 u  u u u u  un2 
 n   n 1 n 2

Pela hipótese H2  
Var ui   E ui2   2
Pela hipótese H3 Covu , u   E u  u   0
i j i j
Variâncias na diagonal principal
Covariâncias fora da diagonal principal

 u12 u1u2  u1un    2 0   0


   
 u2u1 u22  u 2u n   0  2   0 I é a matriz
Σu  E      2
I identidade

           de ordem n

u u u u
 n 1 n 2  un2   0 0 2
  
Hipóteses do modelo de regressão linear múltipla

H4: A matriz X é não aleatória

H5: A matriz X tem posto k < n (k é o nº de variáveis explicativas e n o número


de observações). Isto significa que não pode haver combinações lineares entre
as variáveis explicativas,

H6: Cada erro ui ~N(0,2) para i=1,...,n, logo o vetor de erros u tem distribuição
normal multivariada (n-variada) com vetor média nulo e matriz de covariâncias
u
 u1   0  2 0  0  
u     
 0 0  2
 0 
u   2  ~ N n   ,  
         
   
   2
un   0  0 0    
Estimador de mínimos quadrados ordinários (MQO)
Estimador MQO
Vetor aleatório

 ˆ1 
ˆ 
ˆβ    2   X T X 1 X T y
 

 
 ˆk 

Matriz de covariâncias do estimador MQO

Matriz de

     
covariâncias do
vetor aleatório  Var ˆ1 Cov ˆ1 , ˆ2  Cov ˆ1 , ˆk
   
Σ βˆ  E βˆ  β βˆ  β 
T


 Cov 
ˆ , ˆ
2 1  Var ˆ2   
 Cov ˆ2 , ˆk    X X
2 T 1
       


Cov ˆk , ˆ1  
Cov ˆk , ˆ2   Var ˆk   

Estimador de mínimos quadrados ordinários (MQO)

Estimador MQO tem distribuição normal multivariada

 ˆ 1 
ˆ 
β̂  

2 

~ N k β, Σ β̂ 
ˆ 
  k 
Teorema de Gauss-Markov
Sob as hipóteses H0 até H5 (inclusive a hipótese H2 de
homocedasticidade do erro) o estimador MQO é o melhor
estimador linear não tendencioso, ou seja, o estimador MQO é
BLUE (Best Linear Unbiased Estimator)


E βˆ  β Não tendencioso

As variâncias na diagonal da matriz Σβ   X X


2
 T

1

são mínimas e por isso o MQO é o melhor estimador linear não


tendencioso
Homocedasticidade
A homocedasticidade significa que o erro e a variável explicada
(Yi) têm variância constantes, ou seja, Var(Yi|Xi)= Var(ui)=2

Note que a variância é a mesma independentemente


dos valores da variável explicativa X.

FRP:
Heterocedasticidade
A heterocedasticidade indica que a variância de Y|X não é
constante, Var(Yi|Xi)= Var(ui)=i2 (observe o subscrito i), ou seja, a
hipótese H2: Var(ui) constante é violada.

Note que as variâncias não são as mesmas


e dependem dos valores assumidos pela
variável explicativa X
Homocedasticidade x Heterocedasticidade

Homocedasticidade Heterocedasticidade
Var(ui)=2para i=1,...,n Var(ui)=i2 = 2i para i=1,...,n
erros com variância erros com variâncias
constante igual a 2 diferentes (note que a
variância está indexada por i )

Matriz de covariâncias do vetor de erros u Matriz de covariâncias do vetor de erros u


1 0  0  1 0  0
   
0 2

Σ u  E uuT  20
 

1  0
      2
I 
Σ u  E uuT  2
 
 
 0
     2
Ω
   
0 0  1  0 0  n 
 
ΩI
Exemplo ilustrativo (MADDALA, 2003)
A tabela abaixo apresenta os gastos com consumo e a renda de
20 famílias.
Família Consumo (y) Renda (x) Família Consumo (y) Renda (x)
1 19,9 22,3 11 8,0 8,1
2 31,2 32,3 12 33,1 34,5
3 31,8 36,6 13 33,5 38,0
4 12,1 12,1 14 13,1 14,1
5 40,7 42,3 15 14,8 16,4
6 6,1 6,2 16 21,6 24,1
7 38,6 44,7 17 29,3 30,1
8 25,5 26,1 18 25,0 28,3
9 10,3 10,3 19 17,9 18,2
10 38,8 40,2 20 19,8 20,1

A relação entre o consumo (y) e renda (x) pode ser especificada


pela seguinte equação econométrica:
Yi  1   2 X i  u
Neste exemplo, os coeficientes 1 e 2 são estimados por MQO a
partir da amostra de 20 famílias.
Exemplo ilustrativo (MADDALA, 2003)

Estimação da equação de regressão por MQO

 ˆ 
 
19,9 1 22,3

ˆβ   1   X T X 1 X T y
31,2 1 32,3
31,8 1 36,6
12,1 1 12,1
 ˆ 
 2
40,7 1 42,3
6,1 1 6,2
38,6 1 44,7
25,5 1 26,1

 0,8471
10,3 1 10,3

y= X= 1 40,2

β̂   
38,8
8 1 8,1
33,1 1 34,5

 0,8993 
33,5 1 38
13,1 1 14,1
14,8 1 16,4

Yˆi  0,8471  0,8993 X i


21,6 1 24,1
29,3 1 30,1
25 1 28,3
17,9 1 18,2
19,8 1 20,1
Exemplo ilustrativo (MADDALA, 2003)
Cálculo dos resíduos e da estimativa da variância do erro

Resíduos = uˆi  Yi  Yˆi  Yi  0,8471  0,8993 X i 


-1,00199
1,30476
-1,96234 Estimativa da variância do erro u
0,37112
1,81151
n  20

 uˆ
-0,32286 2
-2,44687
uˆ Tuˆ S QResíduos
i
ˆ   
1,18057 2 i 1

û 
0,18990
1,80010 nk nk nk
 1,00199   1,30476 2    0,87652 2
-0,13158 2
1,22625
-1,52139 ˆ 2 
-0,42753 20  2
-0,79598
-0,92078 ˆ 2  1,72632
1,38328
-1,29794
0,68524
0,87652
Exemplo ilustrativo (MADDALA, 2003)
2,5
Gráfico dos resíduos
2

1,5

0,5
Resíduos

0
0 5 10 15 20 25 30 35 40 45 50
-0,5

-1

-1,5

-2

-2,5

-3
Renda
Dispersão dos resíduos cresce com a renda familiar (X), indicando que a
variância do erro não é constante, ou seja, a hipótese de homocedasticidade
do erro não é verificada.

Var(ui) cresce com a variável explicativa Xi  Var(ui)=f(Xi)  heterocedasticidade


Exemplo ilustrativo (MADDALA, 2003)
Gráfico dos resíduos
A elevada dispersão reflete a maior
variabilidade entre os consumos das
famílias de maior renda, em função
da maior incerteza na parcela da
renda que é destinada ao consumo.
A pequena dispersão reflete a menor
2,5 variabilidade entre os consumos das
famílias de menor renda, onde a maior
2
parte da renda é consumida (não é
1,5 poupada) e as composições das
despesas são parecidas.
1

0,5
Resíduos

0
0 5 10 15 20 25 30 35 40 45 50
-0,5

-1

-1,5

-2

-2,5

-3
Renda
Exemplo ilustrativo (MADDALA, 2003)
Erro–padrão dos estimadores MQO
1 22,3
1 32,3 Resultados obtidos sob a hipótese de homocedasticidade H2.
1 36,6
1 12,1 Como veremos mais adiante, estas estimativas são
1 42,3 tendenciosas, pois neste caso o erro é heterocedástico.
1 6,2
1 44,7

 
1 26,1

X=
1
1
10,3
40,2 ˆΣ ˆ  ˆ 2 XT X 1
1 8,1 β
1 34,5
1 38

ˆΣ   0,49471  0,01617
1 14,1
1 16,4
1 24,1
1 30,1
β̂  0,01617 0,00064 
 
1 28,3
1 18,2
1 20,1

Erro-padrão de ˆ 1
s 2ˆ  0,49471  0,70336
1

Erro-padrão de ˆ 2
s 2ˆ  0,00064  0,02531
2
Natureza da heterocedasticidade
A heterocedasticidade ocorre com freqüência quando trabalhamos com dados
em corte transversal ou cross-section (HILL et al, 2003).

O termo dados em corte transversal se refere aos dados sobre diversas


unidades econômicas, tais como firmas, famílias, municípios, estados ou
países em um dado ponto no tempo, por exemplo, um ano.

Os dados em corte transversal invariavelmente envolvem observações sobre


unidades econômicas de vários tamanhos:
 Dados sobre famílias envolvem famílias com diferentes números de membros e
diferentes níveis de renda, tais como famílias de baixa, média ou alta renda
 Dados sobre firmas envolvem firmas de tamanhos diferentes, com distintos volumes
de produção, tais como pequenos, médios e grandes firmas.

Em geral, a medida que aumenta o tamanho da unidade econômica, há maior


incerteza associada aos resultados da variável dependente, conforme
apresentado no exemplo ilustrativo da relação entre renda e consumo. Para
que o modelo econométrico descreva o processo de geração de dados com
essa propriedade, a variância do erro deve ser tanto maior quanto maior for o
tamanho da unidade econômica, ou seja o erro deve ser heterocedástico.
Natureza da heterocedasticidade

A heterocedasticidade não se restringe aos dados em corte transversal, mas


também pode ser observada em dados de séries temporais (HILL et al, 2003).

Uma série temporal é formada por observações de uma unidade econômica ao


longo do tempo, sendo possível que a variância do se modifique. Isso acontece
quando um choque ou variação externa cria maior ou menor incerteza sobre a
variável dependente.

Uma classe de modelos para o tratamento da heterocedasticidade em séries


temporais, em particular na análise de risco de ativos financeiros, são os
modelos ARCH-GARCH (Generalized Autoregressive Conditional
Heterocedasticity) para previsão da volatilidade (MORETTIN, 2008), tais
modelos estão fora do escopo do curso.
Natureza da heterocedasticidade
A heterocedasticidade também surge quando estamos trabalhando com médias de
dados ou dados per capita de algum grupo ou região geográfica, em vez dos dados
individuais (WOOLDRIDGE, 2006). Por exemplo, considere a equação de regressão
linear múltipla, onde i denota a empresa e e o empregado desta empresa:
contribi ,e  1   2 ganhosi ,e  3idadei ,e  4taxconi ,e  uie
contribie = contribuição anual do empregado e que trabalha na empresa i
ganhosie = ganho anual do empregado e
idadeie = idade do empregado e
taxcontie = montante que a empresa i deposita na conta do empregado e para cada real pago em
contribuição pelo empregado
uie = termo aleatório
Se as hipoteses H0-H5 são satisfeitas podemos estimar a equação a partir dos dados
individuais por empregado entre vários empregadores.

Porém, se dispomos apenas dos valores médios por empresa (os dados individuais não
são disponíveis) temos o seguinte modelo de regressão linear múltipla estimado a partir
dos valores médios das variáveis por empresa:

contrib i  1   2 ganhos i  3 idade i  4 taxcon i  u i


Se o erro na equação com dados individuais for homocedástico, o erro na equação com
dados médios por empresa u i será heterocedastico e a variância diminuirá com o
tamanho da empresa.
Conseqüências da heterocedasticidade para o estimador MQO

Na presença da heterocedasticidade, o estimador MQO


permanece não tendencioso, consistente e assintoticamente
normal, porém o estimador MQO torna-se ineficiente, ou seja, não
tem variância mínima.

Estimador MQO  
ˆβ  XT X 1 XT y
Na presença da heterocedasticidade o estimador MQO não é
mais BLUE.
ˆ  1

Além disso, o estimador Σβˆ  ˆ X X da matriz de covariância
2 T

fornece estimativas incorretas (tendenciosas) dos erros-padrão


dos estimadores MQO (raiz quadrada da variância na diagonal da
matriz), pois este estimador assume o pressuposto de
homocedasticidade do erro.
Conseqüências da heterocedasticidade para o estimador MQO

Não tendenciosidade do Estimador MQO βˆ  XT X XT y quando


1

erro heterocedástico:
y  Xβ  u X é não aleatório H4

    1
 
1
  1

E βˆ  E XT X XT y  E XT X XT Xβ  u   E β  XT X XTu  
E βˆ   β  X X XT E u   β
T 1


=0 H1

E βˆ  β
Note que para provar a não tendenciosidade não foi necessário
assumir a hipótese H2 sobre a variância do erro, logo a
heterocedasticidade não afeta esta propriedade do estimador
MQO.
Conseqüências da heterocedasticidade para o estimador MQO

 1
  1

βˆ  XT X XT y  XT X XT Xβ  u 
 1
 1
βˆ  β  XT X XTu  βˆ  β  XT X XTu   Desvio do estimador em
relação a sua média

Matriz de covariância dos estimadores MQO




ˆ ˆ   
Σβˆ  E β  β β  β 
T


Valor esperado dos
quadrados dos
desvios em notação
matricial

ˆ 1

Substituindo o resultado β  β  X X XTu na matriz tem-se:
T


Σβˆ  E X X T

1 T
X uu X X X  T T 1

X é não aleatório H4

  Euu XX X
1 1
Σβˆ  X X T
X T T T

Matriz de covariâncias dos erros u


Conseqüências da heterocedasticidade para o estimador MQO

Matriz de covariância dos estimadores MQO

Σβˆ  X X  T
1 T
X E uu X X X 
T T
 1

Caso homocedástico Caso heterocedástico


 
Σu  E uu   I
T 2  
Σu  E uuT   2Ω , Ω  I

 
Σβˆ   X X
2 T 1
 
T
X IX X X T 1
Σβˆ   X X
2
 T

1
X ΩX X X
T
 T

1

Σ   X X X XX X
2 T 1 T T 1
As variâncias na diagonal da matriz não são
βˆ
mínimas, por isso o estimador MQO não é

Σ   X X
2 T 1 eficiente na presença da heterocedasticidade
βˆ

ˆ X X  ˆ X X X ΩXX X
2 T 1 2 T 1 T T 1

̂ 2 XT X
1
O uso do estimador implica em perda de validade da inferência quando o erro é heterocedástico
Conseqüências da heterocedasticidade para o estimador MQO
O MQO ajusta a equação de regressão de maneira a minimizar a soma dos
quadrados dos resíduos, ou seja, define os  ’s como sendo a solução ótima do
seguinte problema de otimização:

 Y   1   2 X 2,i   3 X 3,i     k X k ,i 
n
2
Min i
1 ,  2 ,  3 ,,  k
i 1
Na presença da heterocedasticidade, os quadrados dos resíduos na região
com erros mais voláteis (maior variância) são maiores que os quadrados dos
resíduos na região com erros menos voláteis (menor variância).
2,5

1,5

0,5
Resíduos

0
0 5 10 15 20 25 30 35 40 45 50
-0,5

-1

-1,5

-2

-2,5

-3
Menor Renda Maior
volatilidade volatilidade
Conseqüências da heterocedasticidade para o estimador MQO

Na presença da heterocedasticidade, os quadrados dos resíduos na região de


maior variabilidade do erro dominam a soma dos quadrados dos resíduos.

Para minimizar a soma dos quadrados dos resíduos, o MQO faz um bom
ajustamento da equação de regressão às observações na região de maior
variabilidade do erro, pois é nesta região que se encontram os maiores
resíduos.

Ou seja, a definição dos ’s é orientada no sentido de minimizar a soma dos


quadrados dos resíduos na região de maior variabilidade do erro.

Portanto, a heterocedasticidade impõe uma ponderação implícita (PYNDICK &


RUBINFELD, 2004), em que os quadrados dos resíduos da região mais volátil
recebem “pesos” maiores que àqueles na região menos volátil.

Esta ponderação implícita torna o estimador MQO ineficiente, ou seja, o


estimador MQO perde a propriedade de variância mínima e, portanto não é
mais BLUE, embora continue sendo não tendencioso e consistente.
Conseqüências da heterocedasticidade para o estimador MQO

Soma dos quadrados dos resíduos a ser


minimizada pelo estimador MQO:

Y C uˆ A2  uˆ B2  uˆC2
ûC Note que o resíduo da observação C
domina a soma dos quadrados dos
resíduos e por esta razão o MQO vai
orientar a definição dos ’s no sentido de
A Yˆ  ˆ1  ˆ2 X minimizar uˆC2 . Este é o efeito da ponderação
implícita.
û A û B
Esta estratégia não é correta, pois atribui
B maior importância ás observações distantes
da média, representada pela reta de
X regressão, e menor importância às
observações junto a média.
Estimador de mínimos quadrados generalizados
Admitindo que as variâncias dos erros Var(ui)=i2 , i=1,...,n sejam conhecidas, a
ponderação implícita no MQO, provocada pela heterocedasticidade, é
compensada pela consideração de um sistema de pesos, em que o quadrado
de cada resíduo é ponderado pelo inverso da respectiva variância do erro:

  Y   
1   2 X 2,i   3 X 3,i     k X k ,i 
n
1 2
Min 2 i
1 ,  2 ,  3 ,,  k
i 1 i

Note a diferença entre a nova função objetivo a ser minimizada e a função


considerada pelo estimador MQO.

Note que as observações amplamente distantes da média (reta de regressão),


na região de maior variância do erro, recebem pesos menores, enquanto as
observações junto a média, nas regiões com menor variabilidade do erro,
recebem pesos maiores.

O novo estimador obtido é conhecido como estimador de mínimos quadrados


ponderados (MQP) um caso particular do mínimos quadrados
generalizados (MQG).
Estimador de mínimos quadrados generalizados
Inserindo a variância i2 dentro do termo quadrático obtém-se:
2
n Yi  X 2,i X 3,i X k ,i 

1
Min    1    2   3   k  

 i  i i i i
1 ,  2 ,  3 ,,  k
i 1  

Denotando

Yi 1 X 2,i X 3,i X k ,i Variáveis


Yi 
*
;X *
 ;X *
 ;X *
 ;; X *
 transformadas
i i i i i
1,i 2,i 3,i k ,i

Obtém-se uma função objetivo semelhante a considerada pelo


MQO, porém escrita com as variáveis transformadas.

 Y   X 
n
 2 X  3 X  k X
* * * * * 2
Min i 1 1,i 2,i 3,i k ,i
1 ,  2 ,  3 ,,  k
i 1
Estimador de mínimos quadrados generalizados
Isto significa que para aplicar o MQP basta dividir a equação de regressão por
i , o desvio-padrão de ui, e aplicar o estimador MQO para obter as estimativas
dos coeficientes ’s.
Note que dividindo a equação de regressão por i
Yi  1   2 X 2,i   3 X 3,i     k X k ,i  ui i  1,, n
1 Erro da equação

i Yi
 1
1
 2
X 2,i
 3
X 3,i
 k
X k ,i

1
transformada
ui i  1,, n
i i i i i i

Obtém-se uma equação de regressão com erro homocedástico:

 1  1
Var  ui   2 Var ui   2  i  1 ,i  1,, n
1 2
 
i  i i

Dado que os erros do modelo com variáveis transformadas são


homocedásticos, os coeficientes de regressão do modelo transformado podem
ser estimados por MQO.
Estimador de mínimos quadrados generalizados
Lembrando que
 i2   2i , i  1,, n
A constante 2 pode ser suprimida e a ponderação pode ser
expressa em termos de i

  Y   
1   2 X 2,i   3 X 3,i     k X k ,i 
n
1 2
Min i
1 ,  2 ,  3 ,,  k
i 1 i

A solução deste problema de minimização produz o estimador de


MQP, um caso particular do estimador de MQG, apresentado a
seguir em notação matricial:
Heterocedasticidade
 βˆ1   ω1 0  0
ˆ   
βˆ MQG  β2 
 
1  0 ω2  0
  X T Ω 1 X X T Ω 1 y Ω
     
   
 βˆ k  0 0  ωn 

Estimador de mínimos quadrados generalizados

 ω1 0  0 

1 0  0 
  ω1
 
 0 ω2  0 0 1  0 
Ω Ω 
1 ω2
          
   
0 0  ωn   0 0  1 
  ωn 

 1 0  0   1  
 ω1  ω1
0 0 
   
0 1  0   0 1  0 
Ω 1  
1
ω2 Ω

2
 ω2 
           
   1 
  1   0 
ωn 
0 0 0
 ωn  

1 1
Ω  Ω Ω
 
1 2 2
Estimador de mínimos quadrados generalizados


βˆ MQG  X T Ω 1 X 1
X T Ω 1 y
1
 T  
1

1

1

1
βˆ MQG   X Ω Ω X  X T Ω 2 Ω 2 y
2 2

 
1

Fazendo X*  Ω X 2
Yi* 
Yi
; X 1*,i 
1
; X 2*,i 
X 2,i
;
Variáveis i i i
1
 transformadas
y*  Ω y 2
X 3*,i 
X 3,i
;  ; X k*,i 
X k ,i
i i


βˆ MQG  X X *T *

1
X* T y * Semelhante ao MQO βˆ  X T X  1
XTy

Em suma o MQG é o MQO aplicado nas variáveis transformadas


e a inferência pode ser feita da maneira usual pelos testes t e F.
Estimador de mínimos quadrados generalizados
Propriedades do estimador MQG
ˆβ
MQG  X 
T
Ω 1
X1
X T
Ω 1
y
 X Ω X  X Ω Xβ  u 
1
βˆ MQG T 1 T 1

 β  X Ω X  X Ω u
1
βˆ MQG T 1 T 1

 
ˆ  
1
E β MQG  β  E X Ω X X T Ω 1u
T 1

E βˆ   β  X Ω X X Ω
X é não aleatório H4
Eu
T 1 1 T 1
MQG

E βˆ  β
MQG
MQG é não tendencioso =0 H1

ˆβ
MQG  β  X Ω 
T 1
X
1
X T 1
Ω u  Desvio do estimador em
relação a sua média
Estimador de mínimos quadrados generalizados
Propriedades do estimador MQG
Σβˆ
MQG 

 E β MQG  β β MQG  β 
 ˆ ˆ T


 
ˆβ T 1
MQG  β  X Ω X 
1 T 1
X Ω u 
Σβˆ
MQG
E X Ω X  T 1
 1
X Ω uu Ω X X Ω X
T 1 T 1
 T 1

1

Σβˆ
MQG

 X Ω X T 1
1 1
X Ω E uu Ω X X Ω X
T
  T 1
 T 1

1

Matriz de covariâncias dos erros u  


Σu  E uuT  σ 2Ω , Ω  I

Σβˆ
MQG
σ X Ω X 2
 T 1
 1
X Ω ΩΩ X X Ω X
T 1 1
 T 1
1

Σ βˆ
MQG
σ X Ω X 2
 T 1
 1
X Ω XX Ω X
T 1
 T 1

1

Σ βˆ
MQG
 σ2 X T
Ω 1 X
1
Matriz de covariância dos estimadores MQG
MQO , MQG , homocedasticidade , heterocedasticidade

Estimador MQG ˆβ
MQG  X T 1
Ω X
1
X T
Ω 1
y 
Matriz de covariância
do estimador MQG
Σβˆ
MQG
σ X Ω X
2
 T 1
1

homocedasticidade heterocedasticidade

1 0  0  1 0  0
   
20 1  0  0 2  0
Σu       2
I Σu   2     2
Ω
       
   
0 1  0 0  n 
 0  
ΩI ΩI
MQO é um caso O estimador MQG é eficiente e
particular do MQG o MQO é ineficiente.

1
βˆ MQO  XT X XT y  Matriz de covariâncias
do MQO com erros Σβˆ σ X X
2
 T
1

X ΩX X X
T T
 1

 
heterocedásticos MQO
1
Σβˆ  σ 2 XT X As variâncias em Σβˆ são maiores que as variâncias em Σ βˆ
MQO
MQO MQG
Estimador de mínimos quadrados generalizados exeqüível
Na realidade as n variâncias dos erros (ou os n elementos da matriz ) não
são conhecidas e, portanto, devem ser estimadas.

No entanto, dado que a amostra tem n observações, é impossível estimar as n


variâncias e os k parâmetros da equação de regressão.

A saída é obter alguma informação adicional que permita expressar a variância


do erro como uma função dos valores de alguma variável explicativa Xi, está
função define a forma de heterocedasticidade, por exemplo:
 i
2
  2
h  
X i
A identificação da forma de heterocedasticidade
h(Xi) não é uma tarefa simples
A forma de heterocedasticidade reduz o nº de parâmetros a serem estimados
tornando a estimação possível. Note que ao invés de estimar as n variâncias
basta estimar apenas a constante de proporcionalidade 2.
 h X 1  0  0 
 
h X 2 
Assim, tem-se o seguinte estimador para a matriz : Ωˆ   0  0 
    
 
 0  h X n 
 0
Estimador de mínimos quadrados generalizados exeqüível

Substituindo a matriz  por sua estimativa no estimador MQG tem-se o


estimador MQG exequível (MQGE):

 βˆ1 
ˆ 
βˆ MQGE  

β2 
 
T ˆ 1 1
 X Ω X XTΩ ˆ 1y ˆˆ
Σ β MQGE

ˆ 1
 σˆ X Ω X
2 T
1

 
 βˆk 

O MQGE é tendencioso, mas assintoticamente terá as propriedades desejáveis


se ̂ for um estimador consistente de .
Estimador de mínimos quadrados generalizados exeqüível
Implementação do MQGE
Considere a equação de regressão a ser estimada:
Yi  1   2 X 2,i   3 X 3,i     k X k ,i  ui i  1,, n
Uma vez identificado o padrão de heterocedasticidade, por exemplo, Var(ui)
proporcional a X2,i2, (Var(ui)=2X2,i2, onde 2 é uma constante de
proporcionalidade) a estimação da equação de regressão por MQGE inicia-
se com a transformação das variáveis, dividindo toda a equação pelo desvio
padrão de ui ignorando-se a constante de proporcionalidade 2. Neste caso,
basta dividir a equação por X2,i resultando na seguinte equação transformada:
X 3,i X k ,i
u*
Yi 1 u
 1   2  3  k  i i  1,, n
X 2,i X 2,i X 2, i X 2,i X 2, i
Admitindo que o padrão de heterocedasticidade tenha sido identificado
corretamente, o erro u* na equação transformada é homocedástico e, portanto,
o MQO poder ser utilizado para estimar a equação transformada:
 ui 
Var    1 Var ui   1   2 X 22,i   2 variância constante
X  X2 X 2
 2,i  2 , i 2 ,i
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Neste exemplo vamos considerar novamente uma amostra com
dados sobre rendimento e despesa familiar anual de um conjunto
com 20 famílias.
Grupo Despesas (em US$ 1000) Rendimento (US$ 1000)
1 1,8 2,0 2,0 2,0 2,1 5,0
2 3,0 3,2 3,5 3,5 3,6 10,0
3 4,2 4,2 4,5 4,8 5,0 15,0
4 4,8 5,0 5,7 6,0 6,2 20,0

7
y = 0,2372x + 0,8900
despesa anual (US$ 1000)

6 R2 = 0,9335

4 Note que neste caso o gráfico


3
das observações de
rendimento e despesas já
2
sugere heterocedasticidade
1

0
5,0 7,0 9,0 11,0 13,0 15,0 17,0 19,0
rendimento anual (US$ 1000)
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Mesmo com a suspeita de heterocedasticidade vale utilizar o
MQO para estimar a equação de regressão que explica as
despesas (Y) em função do rendimento familiar (X):

Yi  1   2 X i  ui
1 5,0 1,8
1 5,0 2,0
1 5,0 2,0
1 5,0 2,0
1 5,0 2,1
1 10,0 3,0
1 10,0 3,2 MQO
ˆ1  0,89
1 10,0

 
3,5

ˆβ  XT X 1 XT y
1 10,0 3,5
X= 1 10,0
Y= 3,6
1
1
15,0
15,0
4,2
4,2
ˆ2  0,2372
1 15,0 4,5
1 15,0 4,8
1 15,0 5,0
1 20,0 4,8
1 20,0 5,0
Mais resultados da estimação
1 20,0 5,7 Coefficients Standard Error t Stat P-value
1 20,0 6,0 Intercept 0,8900 0,2043 4,3561 0,0004
1 20,0 6,2 X Variable 1 0,2372 0,0149 15,8972 0,0000

R2 = 0,9335 F= 252,7223
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Análise dos resíduos MQO

 
O gráfico do resíduos contra a
uˆi  yi  ˆ1  ˆ2 X i variável explicativa sugere que o erro
é heterocedástico e sua variância
cresce com o rendimento anual
-0,276
-0,076
-0,076 0,8
-0,076
0,024 0,6
-0,262
-0,062 0,4
0,238
0,238 0,2

û 
resíduos

0,338
0
-0,248
-0,248 5 7 9 11 13 15 17 19
-0,2
0,052
0,352 -0,4
0,552
-0,834 -0,6
-0,634
0,066
-0,8
0,366
-1
0,566
rendimento anual (US$ 1000)
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Análise dos resíduos MQO
Outra forma de identificar a presença de heterocedasticidade é
por meio do gráfico dos resíduos MQO contra os valores
ajustados Yˆi  ˆ1  ˆ2 X i (FOX, 1991)
0,8
O gráfico sugere
0,6 heterocedasticidade do erro

0,4

0,2
Resíduos

0
2 2,5 3 3,5 4 4,5 5 5,5 6
-0,2

-0,4

-0,6

-0,8

-1

Valores ajustados
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Estimação por MQGE
1) Padrão de heterocedasticidade: com base no gráfico anterior
observa-se que a dispersão dos resíduos cresce com o
rendimento, então uma forma plausível para a
heterocedasticidade é a seguinte:
Var ui    X
2
i
2
DPui   X i
2) Transformação das variáveis: neste caso basta dividir a
equação de regressão por X, obtendo-se a seguinte equação
transformada:
Na equação
Yi 1 ui transformada  2 é o
 1  2  intercepto e  1 a
Xi Xi Xi inclinação

3) Estimação por MQO: por hipótese o erro da equação


transformada é homocedástico e, portanto, o MQO pode ser
utilizado para estimar a equação transformada.
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Estimação por MQGE
Cálculo das variáveis transformadas
Variáveis originais Variáveis transformadas
5,0 1,8 0,360 0,2000
5,0 2,0 0,400 0,2000
5,0 2,0 0,400 0,2000
5,0 2,0 0,400 0,2000
5,0 2,1 0,420 0,2000
10,0 3,0 0,300 0,1000
10,0 3,2 0,320 0,1000
10,0 3,5 0,350 0,1000
Yi 1
 
10,0 3,5 0,350 0,1000
Xi= 10,0
15,0
Yi= 3,6
4,2
0,360
0,280
0,1000
0,0667
15,0 4,2 Xi 0,280 Xi 0,0667
15,0 4,5 0,300 0,0667
15,0 4,8 0,320 0,0667
15,0 5,0 0,333 0,0667
20,0 4,8 0,240 0,0500
20,0 5,0 0,250 0,0500
20,0 5,7 0,285 0,0500
20,0 6,0 0,300 0,0500
20,0 6,2 0,310 0,0500
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Estimação por MQGE
Aplicação do MQO aos dados transformados
0,360 0,2000 1
0,400 0,2000 1
0,400 0,2000 1
0,400 0,2000 1
0,420 0,2000 1
0,300 0,1000 1
0,320 0,1000 1
MQO
ˆ1  0,8875
0,350 0,1000 1

Yi * 
0,350
Xi* 
0,1000 1
0,360 0,1000 1
 1
βˆ  X *T X * X *T y *
ˆ2  0,2360
0,280 0,0667 1
0,280 0,0667 1
0,300 0,0667 1
0,320 0,0667 1
0,333 0,0667 1
0,240 0,0500 1 Mais resultados da estimação
0,250 0,0500 1
0,285 0,0500 1
Coefficients Standard Error t Stat P-value
0,300 0,0500 1 Intercept 0,2495 0,0117 21,2812 0,0000
0,310 0,0500 1 1/X 0,7529 0,0983 7,6629 0,0000

O R2 menor não indica que a R2 = 0,7654 F= 58,7206


correção da heterocedasticidade
foi incorreta, pois as variáveis
foram transformadas. Na verdade o Yi 1 u
R2 do modelo transformado é Equação estimada  0,7529  0,2495  i
pouco informativo.
Xi Xi Xi
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
ˆ
Y
Resíduos da estimação por MQGE x valores ajustados i  ˆ 1  ˆ
1 2
Xi Xi
0,04

0,03

0,02

0,01
Resíduos

0
0,25 0,27 0,29 0,31 0,33 0,35 0,37 0,39 0,41
-0,01

-0,02

-0,03
O gráfico dos resíduos da
-0,04 estimação por MQGE sugere
homocedasticidade do erro
-0,05 da equação transformada

-0,06

Valores ajustados
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Comparação dos resultados
MQO Yˆi  0,89  0,2372 X i
0,2043 0,0149
MQG Yˆi  0,7529  0,2495 X i
0,0983 0,0117
Erro padrão entre parênteses

A proximidade das estimativas pontuais reflete a não tendenciosidade do MQO


quando o erro é heterocedastico, note a pequena diferença entre 0,2372 e 0,2495.

Porém o erro padrão MQO está calculado de forma errada dada, não é robusto em
relação à heterocedasticidade.

As estimativas do MQG são mais precisas, note o menor erro-padrão.


Estimador de White (procedimento robusto em relação à heterocedasticidade)

Na ausência de conhecimento razoavelmente seguro sobre a


forma da heterocedasticidade, poderá considerar-se a a
estimação dos coeficientes  por MQO, pois este é não
tendencioso mesmo na presença de heterocedasticidade.
ˆβ
MQO  X 
T
X
1
X T
y
Porém na estimação da matriz de covariâncias, no lugar
da usual Σβˆ  σ X X deve-se utilizar a matriz
2 T 1
Halbert L. White Jr.
 σ 2 XT X XTΩXXT X ,a especificação correta da
MQO
1 1 http://weber.ucsd.edu/~mbacci/white/
Σβˆ
MQO
matriz de covariância quando o MQO é aplicado na H. White: "A Heteroskedasticity-
Consistent Covariance Matrix
estimação com erros heterocedásticos. Estimator and a Direct Test for
Heteroskedasticity," Econometrica,
Assim, o estimador de White para a matriz de 48, 817-838 (1980).
covariâncias é dado por: uˆ12 0  0 
uˆi2 , i  1,, n
   
1 1  
ˆˆ
Σ  X X T T
X SX X X T
onde S

0 uˆ22  0 
são os resíduos obtidos
β MQO    na estimação por MQO
 
 0 0  uˆn2 
Estimador estritamente apropriado somente para grandes amostras (WOOLDRIDGE,
2006). Os testes t e F são somente válidos assintoticamente. Note que este
procedimento consiste na aplicação do estimador MQO em uma situação com erro
heterocedástico, assim os estimadores são ineficientes, pois as variâncias são maiores
que as obtidas pelo MQG (PYNDICK & RUBINFELD, 2004), .
Comparação dos estimadores MQO, MQG e White na
presença de heterocedasticidade (GUJARATI, 2000)
Uma comparação do desempenho dos três estimadores
sob erro heterocedástico foi realizada por Davidson e
MacKinnon.

A comparação baseia-se em simulações de Monte Carlo


conduzidas com o seguinte modelo de regressão linear
simples:

Yi  1   2 X i  ui i  1,,100 James MacKinnon


http://qed.econ.queensu.c
Russell Davidson
http://people.mcgill.
a/faculty/mackinnon/ ca/russell.davidson/

em que Russell Davidson and James G.


MacKinnon, Estimation and Inference in
1  1 X i ~ U 0,1 Econometrics, Oxford University Press,
New York
2  1

ui ~ N 0, X i   é um parâmetro pré-fixado, cuja finalidade é
controlar a variabilidade do erro

Note que o erro é heterocedástico para qualquer 0. Se =1 a variância é proporcional
a X, se =2 a variância é proporcional ao quadrado de X, e assim por diante.

Para cada valor de  eles simularam 20.000 amostras, cada uma com 100 observações
e calcularam os estimadores MQO, MQG e o estimador de White.
Comparação dos estimadores MQO, MQG e White na
presença de heterocedasticidade (GUJARATI, 2000)
Erro-padrão da estimativa de 1 Erro-padrão da estimativa de 2
Erro- Erro-
(MQO) (MQO)
padrão da padrão da
 Especificação Especificação estimativa Especificação Especificação estimativa
incorreta da correta da de 1 incorreta da correta da de 2
matriz de matriz de (MQG) matriz de matriz de (MQG)
covariâncias covariâncias covariâncias covariâncias
0,5 0,164 0,134 0,110 0,285 0,277 0,243
1,0 0,142 0,101 0,048 0,246 0,247 0,171
2,0 0,116 0,074 0,0073 0,200 0,220 0,109
3,0 0,100 0,064 0,0013 0,173 0,206 0,056
4,0 0,089 0,059 0,0003 0,154 0,195 0,017

Especificação incorreta da matriz de covariâncias (MQO) Σβˆ σ X X


2
 T
 1

   
MQO
1 1
Especificação robusta em relação à Σβˆ  σ 2 XT X XTΩX XT X
heterocedasticidade (MQO) MQO

Especificação da matriz de covariâncias (MQG) Σβˆ


MQG
2

σ X Ω X T 1

1

Os resultados mostram a ineficiência do estimador MQO (maiores erros-


padrão).O MQO superestima o verdadeiro erro-padrão estimado pelo MQG,
em especial para grandes valores de .
Conclusão: na presença de heterocedasticidade utilize MQG (GUJARATI, 2000)
Detectando a heterocedasticidade
Há vários procedimentos para testar se a hipótese de
homocedasticidade é plausível:

 Análise dos resíduos do modelo original estimado por MQO

 Teste de Goldfeld-Quandt

 Teste Park
H0: homocedasticidade
 Teste de Glejser H1: heterocedasticidade
 Teste Breusch-Pagan

 Teste de White
Teste de Goldfeld-Quandt
Assume que a variância do erro é uma função monótona de alguma variável
explicativa X (em geral uma variável de tamanho), mas não assume
especificação para esta função f.

Var u   f  X  R.E.Quandt
http://www.quandt.com/req.html
O teste baseia-se em uma idéia muito simples:
 Primeiro divide-se a amostra em duas subamostras,
 Em cada subamostra estima-se o modelo sob análise y=X+u e obtém-se a série de resíduos de
cada um.
 A partir das séries de resíduos obtém-se as estimativas para a variância do erro em cada
subamostra.
 Por fim, aplica-se o teste F para testar a hipótese de igualdade das variâncias.
2,5 Subamostra II
2

1,5
ˆ 2II H 0 : 2I  2II homocedasticidade 
H1 : 2I  2II heteroceda sticidade 
1 Subamostra I
0,5
Resíduos

0
0 5 10 15 20 25 30 35 40 45 50

ˆ 2II
-0,5

-1

-1,5
Sob H0 ~F
-2

-2,5
ˆ 2I ˆ I
2

-3
Renda

S.M. Goldfeld & R.E.Quandt "Some Tests for Homoscedasticity," Journal of the American Statistical Association, 60 (1965), 539-547.
Teste de Goldfeld-Quandt
1) Ordene as observações por ordem crescente da variável X, se f(X) for uma função crescente,
ou por ordem decrescente da variável X, se f(X) for decrescente.

2) Elimine as c observações centrais (c é um número arbitrário, por exemplo, Pindyck &


Rubilfeld sugerem 1/5 da amostra). As n-c observações restantes são divididas em duas
subamostras, uma incluindo os valores menores de X (subamostra I) de tamanho n1 e outra
seus valores mais elevados (subamostra II) de tamanho n2.

3) Estime o modelo de regressão sob análise y=X+u em cada subamostra e obtenha os


respectivos resíduos, u(I,i) para i=1, ..., nI e u(2,i) para i=1, ..., n2.

4) Calcule as somas dos quadrados dos resíduos para obter as estimativas das variâncias do
erro em cada sub-amostra:
nI nII

 u1, i   u2, i 
2 2
K = nº de parâmetros no modelo de
ˆ I2  i 1
ˆ II2  i 1 regressão linear
nI  k nII  k
5) Faça o teste F para igualdade de variâncias: Sob H0

H 0 : 2I  2II homocedasticidade   II


ˆ 2
~ FnII  k ,nI k
H1 : 2I  2II heteroceda sticidade  ˆ I
2
Teste de Goldfeld-Quandt
Mais apropriado para grandes amostras, de modo que seja possível estimar as duas regressões
adequadamente.

Requer a normalidade dos resíduos.

Requer a ausência de autocorrelação serial para que tenha validade.


Teste de Park
Assume a seguinte relação entre a variância do erro e a variável explicativa X>0:
Var ui    i2  X iC
>0 é uma constante de proporcionalidade
C é uma constante a ser estimada (C 0 sugere heterocedasticidade)

Aplicando uma transformação logarítmica tem-se:

ln   ln   C ln X i
i
2

Como Var(ui) não é conhecida, substitui-se a variância pelo quadrado do resíduo MQO
do modelo y=X+u sob análise. Também admite-se uma relação estocástica:
Ruído branco
ln uˆ  ln   C ln X i  vi
2
i

O modelo acima é uma equação de regressão linear simples que pode ser estimada por
MQO. Ao final, por meio de um teste t avalia-se a significância de C:

H 0 : C  0homocedasticidade  Cˆ
Sob H0: ~ t n 2
H1 : C  0heteroceda sticidade  SC2ˆ
Teste de Breusch-Pagan
Assume que a variância do erro é uma função da combinação linear de p variáveis
Z1,...,Zp que podem ser ou não as variáveis explicativas do modelo de regressão linear

Var ui     f 1   2 Z1,i     p Z p,i 


sob análise:
2
i

1) Estime o modelo de interesse y=X + u por mínimos quadrados ordinários. n


Obtenha a série dos quadrados dos resíduos ûi2 e calcule a estimativa de máxima  uˆi
2

verossimilhança da variância do erro u sob a hipótese de homocedasticidade ˆ 2  i 1


(n é o número de observações) n
uˆi2
2) Estime por MQO o modelo de regressão auxiliar  1   2 Z 2,i     p Z p ,i  vi
ˆ 2

3) Calcule a SQExplicada da regressão auxiliar no passo 2.

4) Teste a hipótese nula H0: 2 = 3= ... = p= 0 (homocedasticidade) contra a hipótese
alternativa H1: 2  0 ou 3  0 ... ou p  0 (heterocedasticidade).

Sob a hipótese nula, a estatística teste SQExplicad a tem distribuição 2p-1


2
Se a estatística teste calculada for maior que o qui-quadrado tabelado ao nível de
significância deve-se rejeitar a hipótese nula.
Teste de White

1) Estime o modelo de interesse y=X + u por mínimos quadrados ordinários.


Obtenha a série dos quadrados dos resíduos ûi2.
2) Estime por mínimos quadrados ordinários o modelo de regressão auxiliar em que ûi2
é explicado pelas variáveis explicativas do modelo de regressão original, seus
quadrados e interações entre elas:
k k k 1 k
uˆi2  1   j X j ,i    j X 2j ,i   j ,l X j ,i X l ,i  vi
j 2 j 2 j  2 l 3

3) Obtenha o R2 da regressão auxiliar.

4) Teste a hipótese nula H0: 2 = 3= ... = k= 2 =...= k = 23 =...= k-1,k = 0
(homocedasticidade) contra a hipótese alternativa H 1: pelo menos um dos coeficientes é
diferente de zero (heterocedasticidade).

Sob a hipótese nula, a estatística teste nR2 tem distribuição 2 com graus de liberdade
igual ao número de variáveis explicativas no modelo de regressão auxiliar,

Se a estatística teste calculada for maior que o qui-quadrado tabelado ao nível de


significância deve-se rejeitar a hipótese nula.
Exemplo
Considere o seguinte modelo de regressão linear múltipla aplicado ao corte
transversal (referente ao ano de 1970) formado pelos 51 estados norte
americanos:

EXPi  1   2 AIDi  3 POPi   4 INCi  ui i =1 , 50 observações

Onde:

EXPi = gastos do governo no estado i


AIDi = ajuda do governo federal ao estado i
POPi = população do estado i
INCi = renda agregada do estado i

Para este modelo a expectativa é que o termo aleatório seja heterocedástico, pois
trata-se de uma cross-section formada por unidades (estados) de tamanhos
diferentes.

Neste caso, a população é a variável associada ao tamanho das unidades e,


portanto, é a variável que explica a possível heterocedasticidade.
Exemplo
AID POP INC
704,00 1 190,84 1.026 3.759.264
EXP 526,00 1 95,20 774 3.311.946
411,00 1 108,10 460 1.703.380
5.165,98 1 1.101,24 5.796 27.965.700
699,00 1 178,30 969 4.373.097 Estimação por MQO
2.545,99 1 446,60 3.080 16.675.120

 
22.749,37 1 4.408,08 18.367 96.885.928

ˆβ  XT X 1 XT y
5.911,02 1 1.036,21 7.349 39.530.272
8.840,06 1 1.619,08 11.905 54.108.220
6.867,01 1 1.200,86 10.722 49.020.980
3.456,99 1 544,46 5.286 23.068.100
8.935,04 1 1.754,06 11.244 58.041.528
7.799,04 1 1.324,91 9.013 44.902.768

ˆ1  46,80526
3.756,99 1 525,02 4.526 19.366.750
3.527,99 1 631,95 3.877 16.837.810
2.108,00 1 325,89 2.884 12.447.340
3.156,00 1 716,80 4.747 20.445.330
475,00 1 127,43 634 2.617.152

ˆ2  3,23823
521,00 1 132,60 680 2.560.880
1.052,00 1 204,75 1.528 6.801.128
1.550,99 1 299,38 2.268 10.285.380
571,00 1 97,07 571 2.981.762
3.391,98 1 546,48 4.048 20.308.820

ˆ3  0,59662
3.037,02 1 624,22 4.765 20.946.940
1.250,00 1 452,34 1.795 6.505.080
y= 2.938,01
1.512,00
X= 1
1
736,16
411,26
5.221
2.688
20.194.830
9.408.000

ˆ4  0,00019
3.197,00 1 842,47 4.733 18.723.750
4.771,00 1 837,56 7.347 32.694.150
2.063,01 1 598,39 3.306 12.014.000
2.446,01 1 712,60 4.072 15.098.980
2.104,01 1 679,55 3.521 12.239.000
1.427,01 1 575,28 2.256 7.192.128

 
1.014,00 1 399,59 2.008 6.716.760

1
2.690,99 1 732,65 3.738 13.325.970

Σ βˆ  ˆ X X 2 T
1.767,01 1 500,27 2.633 10.102.820
7.246,00 1 1.636,16 11.604 47.402.340 Raiz quadrada dos
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805 elementos da matriz
368,01 1 127,67 346 1.477.074
1.919,99 1 432,61 2.364 10.874.400
823,00 1 298,05 1.076 3.778.912 Coeficientes Erro padrão Stat t valor-P
1.522,99 1 294,45 1.963 8.387.899 Interseção -46,80526 84,21 -0,56 0,58
821,00 1 220,89 1.127 4.216.107
543,02 1 95,94 533 2.776.397 AID 3,23823 0,24 13,64 0,00
3.070,01 1 628,91 3.418 15.726.220 POP -0,59662 0,10 -5,71 0,00
1.766,00 1 439,18 2.185 9.480.715
20.051,97 1 4.082,20 20.411 103.830.800 INC 0,00019 0,00 8,12 0,00
698,00 1 185,25 325 1.697.150
940,03 1 164,83 816 4.204.848
Exemplo
Equação estimada por MQO (erros padrão entre parêntesis)

EXPi  46,80526  3,23823  AIDi  0,59662POPi  0,00019INCi  ui


(84,21) (0,24) (0,10) (0,000023)
Resíduos:
ûi  EXPi   46 ,80526  3,23823  AIDi  0 ,59662 POPi  0 ,00019 INCi 
1500

O gráfico sugere que a


1000
variância do erro cresce
com a população
500
Resíduos

População
0
0 5000 10000 15000 20000 25000

-500

-1000

-1500
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00
821,00
1.052,00
1
1
1
298,05
220,89
204,75
1.076
1.127
1.528
3.778.912
4.216.107
6.801.128
1) Ordene a amostra
1.250,00
1.522,99
1
1
452,34
294,45
1.795
1.963
6.505.080
8.387.899 na ordem crescente
1.014,00 1 399,59 2.008 6.716.760
1.766,00
1.427,01
1
1
439,18
575,28
2.185
2.256
9.480.715
7.192.128
da população dos
1.550,99 1 299,38 2.268 10.285.380
1.919,99
1.767,01
1
1
432,61
500,27
2.364
2.633
10.874.400
10.102.820
estados
1.512,00 1 411,26 2.688 9.408.000 8 observações
2.108,00 1 325,89 2.884 12.447.340
2.545,99 1 446,60 3.080 16.675.120 centrais (c=8)
2.063,01
3.070,01
1
1
598,39
628,91
3.306
3.418
12.014.000
15.726.220
2) Retire algumas
2.104,01 1 679,55 3.521 12.239.000
2.690,99
3.527,99
1
1
732,65
631,95
3.738
3.877
13.325.970
16.837.810
observações
3.391,98
2.446,01
3.756,99
1
1
1
546,48
712,60
525,02
4.048
4.072
4.526
20.308.820
15.098.980
19.366.750
centrais e forme
3.197,00
3.156,00
1
1
842,47
716,80
4.733
4.747
18.723.750
20.445.330 duas subamostras
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980
8.935,04 1 1.754,06 11.244 58.041.528
7.246,00 1 1.636,16 11.604 47.402.340
8.840,06 1 1.619,08 11.905 54.108.220
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00 1 298,05 1.076 3.778.912
821,00 1 220,89 1.127 4.216.107
1.052,00 1 204,75 1.528 6.801.128
1.250,00 1 452,34 1.795 6.505.080
1.522,99 1 294,45 1.963 8.387.899
1.014,00 1 399,59 2.008 6.716.760
1.766,00 1 439,18 2.185 9.480.715
1.427,01
1.550,99
1.919,99
1
1
1
575,28
299,38
432,61
2.256
2.268
2.364
7.192.128
10.285.380
10.874.400
3) Estime o modelo de regressão
1.767,01
1.512,00
1
1
500,27
411,26
2.633
2.688
10.102.820
9.408.000 EXPi  1   2 AIDi  3 POPi   4 INCi  ui
2.108,00 1 325,89 2.884 12.447.340
2.545,99
2.063,01
1
1
446,60
598,39
3.080
3.306
16.675.120
12.014.000
em cada subamostra e obtenha a
3.070,01
2.104,01
2.690,99
1
1
1
628,91
679,55
732,65
3.418
3.521
3.738
15.726.220
12.239.000
13.325.970
respectiva SQResíduos
3.527,99 1 631,95 3.877 16.837.810
3.391,98 1 546,48 4.048 20.308.820
2.446,01 1 712,60 4.072 15.098.980
3.756,99 1 525,02 4.526 19.366.750
3.197,00 1 842,47 4.733 18.723.750
3.156,00 1 716,80 4.747 20.445.330
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980
8.935,04 1 1.754,06 11.244 58.041.528
7.246,00 1 1.636,16 11.604 47.402.340
8.840,06 1 1.619,08 11.905 54.108.220
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00 1 298,05 1.076 3.778.912
821,00 1 220,89 1.127 4.216.107
1.052,00 1 204,75 1.528 6.801.128 ANOVA
1.250,00 1 452,34 1.795 6.505.080 df SS MS F Significance F
1.522,99 1 294,45 1.963 8.387.899
Regression 3 2.957.338,81 985.779,60 189,77 2,88174E-13
1.014,00 1 399,59 2.008 6.716.760
1.766,00 1 439,18 2.185 9.480.715 Residual 17 88.308,84 5.194,64
1.427,01 1 575,28 2.256 7.192.128 Total 20 3.045.647,65
1.550,99 1 299,38 2.268 10.285.380
1.919,99 1 432,61 2.364 10.874.400
1.767,01 1 500,27 2.633 10.102.820
1.512,00
2.108,00
1
1
411,26
325,89
2.688
2.884
9.408.000
12.447.340 SQResíduos
2.545,99 1 446,60 3.080 16.675.120
2.063,01 1 598,39 3.306 12.014.000
3.070,01 1 628,91 3.418 15.726.220
2.104,01 1 679,55 3.521 12.239.000
2.690,99 1 732,65 3.738 13.325.970
3.527,99 1 631,95 3.877 16.837.810
3.391,98 1 546,48 4.048 20.308.820
2.446,01 1 712,60 4.072 15.098.980
3.756,99 1 525,02 4.526 19.366.750
3.197,00 1 842,47 4.733 18.723.750
3.156,00 1 716,80 4.747 20.445.330
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II SQResíduos
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
ANOVA
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980 df SS MS F Significance F
8.935,04 1 1.754,06 11.244 58.041.528 Regression 3 592.513.592,29 197.504.530,76 615,64 1,56325E-17
7.246,00 1 1.636,16 11.604 47.402.340 Residual 17 5.453.827,09 320.813,36
8.840,06 1 1.619,08 11.905 54.108.220 Total 20 597.967.419,39
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
Exemplo teste de Goldfeld-Quandt

4) Calcule a estatística teste

SQ Re síduos II 5.453.827,09 5.453.827,09


nII  k 21  4 17
   61,76
SQ Re síduos I 88.308,84 88.308,84
nI  k 21  4 17
k = número de parâmetros lineares, neste caso quatro

Ao nível de significância de 5%, o F17,17 é 2,27

Como 61,76 > 2,27 rejeita-se a hipótese nula de


homocedasticidade do erro
Exemplo teste de Park

1) Estime o modelo EXPi  1   2 AIDi  3 POPi   4 INCi  ui i=1,50 por MQO e


obtenha a série de resíduos:
ûi  EXPi   46 ,80526  3,23823  AIDi  0 ,59662 POPi  0 ,00019 INCi 

2) Identifique a variável relacionada com a heterocedasticidade do erro,


neste caso é a população. Em seguida estime o modelo de regressão
linear simples, onde o logaritmo dos quadrados dos resíduos é
explicado pelo logaritmo da população:
16

ln uˆ  1   2 ln POPi
2
i 14
Ln û2

Coefficients Standard Error t Stat P-value 12

Intercept -1,1636 1,7815 -0,6532 0,5168


LnPOP 1,4133 0,2255 6,2675 0,0000 10

P-valor < 5% , logo 1 é 8

̂ 2 significativamente 6

diferente de zero e o 4
LnPOP
erro é heterocedástico 4 5 6 7 8 9 10 11
Exemplo teste de Park

3) Com base nestes resultados obtemos a seguinte especificação para o


padrão de heterocedasticidade:

Var ui  é proporcional a POPi


1, 4133
Exemplo Teste de Breusch-Pagan

1) Estime o modelo original por mínimos quadrados ordinários:


EXPi  1   2 AIDi  3 POPi   4 INCi  ui i =1 , 50 observações

obtenha a série dos quadrados dos resíduos û2.


uˆi2  EXPi   46,80526  3,23823  AIDi  0,59662POPi  0,00019INCi 
2

50

e o estimador de máxima verossimilhança do  uˆ 2


i

erro na hipótese de homocedasticidade ˆ 2


 i 1  129.497,3
50

2) Estime a regressão auxiliar por mínimos quadrados ordinários:


uˆi2
 1   2 AIDi   3 POPi   4 INCi  vi
ˆ 2

3) Calcule a SQExplicada da regressão auxiliar, neste caso, 88,6148

4) O valor da estatística teste (SQExplicada/2) é 88,6148/2 = 44,30738. Sob


H0 a estatística teste tem distribuição qui-quadrado com 3 graus de
liberdade. O p-valor P32  44,30738  0  5% logo rejeita-se a
hipótese de homocedasticidade
Exemplo Teste de White

1) Estime o modelo original por mínimos quadrados ordinários:


EXPi  1   2 AIDi  3 POPi   4 INCi  ui i =1 , 50 observações

e obtenha a série dos quadrados dos resíduos û2.


uˆi2  EXPi   46,80526  3,23823  AIDi  0,59662POPi  0,00019INCi 
2

2) Estime a regressão auxiliar por mínimos quadrados ordinários:


uˆi2  1   2 AIDi   3 POPi   4 INCi   2 AIDi2   3 POPi 2   4 INCi2 
 2,3 AIDi POPi   24 AIDi INCi  3, 4 POPi INCi  vi

3) Calcule o R2 da regressão auxiliar, neste caso seu valor é 0,5644.

4) O valor da estatística teste (nR2) é 50 x 0,5644 = 28,2202. Sob H0 a


estatística teste tem distribuição qui-quadrado com 9 graus de
liberdade. O p-valor P92  28,2202  0,00088  5% logo rejeita-se a
hipótese de homocedasticidade
Exemplo estimação por mínimos quadrados ponderados

1) Pelo resultado do teste de Park, estimamos o padrão de


heterocedasticidade como sendo
Var ui  é proporcional a POPi
1, 4133

Assim, podemos transformar a equação de regressão original:


EXPi 1 AIDi POPi INCi
 1  2  3  4  ui*
POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133

2) Estime a equação transformada por MQO, pois por hipótese u* é


homocedástico (erro-padrão entre parêntesis)

EXˆPi 1 AIDi POPi INCi


 15,89  2,39  0,62  0,00022
POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133

(27,96) (0,25) (0,09) (0,000019)


Exemplo estimação por mínimos quadrados ponderados

Resíduos da equação transformada x população

EXPi 1 AIDi POPi INCi


 1  2  3  4  ui*
POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133

2) Estime a equação transformada por MQO, pois por hipótese u* é


homocedástico (erro-padrão entre parêntesis)

EXˆPi 1 AIDi POPi INCi


 15,89  2,39  0,62  0,00022
POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133 POPi1, 4133

(27,96) (0,25) (0,09) (0,000019)


3) Estimativa da equação original por mínimos quadrados ponderados:

EXˆPi  15,89  2,39 AIDi  0,62POPi  0,00022INCi


Referências bibliográficas
FOX, J. Regression Diagnostics, Sage University Paper Series on
Quantitative Applications on the Social Science, series, nº 07-079, 1991.

GUJARATI, D.N. Econometria Básica, 3ª edição, Pearson Makron Books,


São Paulo, 2000.

HILL, R.C.; GRIFFITHS, W.E. & JUDGE, G.G. Econometria, 2ª edição,


Editora Saraiva, São Paulo, 2003.

MADDALA, G.S. Introdução à econometria, LTC, Rio de Janeiro, 2003.

MORETTIN, P.A. Econometria Financeira: um curso em séries temporais


financeiras, Editora Blucher, São Paulo, 2008.

PYNDICK, R.S. & RUBINFELD, D.L. Econometria: Modelos & Previsões,


Elsevier, Rio de Janeiro, 2004.

WOOLDRIDGE, J.M. Introdução à econometria: uma abordagem moderna,


Thomson, São Paulo, 2006.

Você também pode gostar