Você está na página 1de 14

167

11. HETEROCEDASTICIDADE No captulo anterior, foi visto que o termo aleatrio, alm de no autocorrelacionado, devia apresentar varincia constante. A essa caracterstica d-se o nome de Homocedasticidade, ou seja, 2 2 Var (u i ) = E (u i ) = u2 . A violao dessa ltima hiptese gera o problema denominado Heterocedasticidade. Podemos ter uma viso intuitiva do problema analisando os Grficos 11.1 e 11.2.

11.1

11.2

Verificamos no Grfico 11.1 que o incremento da varivel X (explicativa ou independente) acompanhado por uma disperso dos pontos. Isso implica que a varincia do termo aleatrio ser tanto maior quanto maiores forem os valores da varivel explicativa X. J no Grfico 11.2 ocorre o inverso. Ambas as situaes geram problemas quando utilizamos o mtodo dos mnimos quadrados ordinrios, semelhana do que ocorre na presena de autocorrelao. A seguir, sero analisadas as causas, as conseqncias, os testes e as solues para a presena de Heterocedasticidade.

Fontes da Heterocedasticidade
Prof. Me. Waldemir Santos Nogueira / 2007

168

Inicialmente, deve-se lembrar que falhas na especificao do modelo1 pode gerar um termo aleatrio Heterocedstico. Alm dessa causa, devemos alertar para o fato de que esse problema pode ser resultado de uma caracterstica intrnseca da funo que se est estudando. Nesses casos, razovel a suposio de que os resduos da regresso sigam o padro descrito nos Grficos 11.1 ou 11.2. Conseqncias da Heterocedasticidade Implica que, apesar de os estimadores dos parmetros serem no viesados, existem problemas nas concluses tiradas com base nos testes de hiptese. Concluso: A presena de Heterocedasticidade gera: 1. estimadores dos parmetros ( ) no visados, mas ineficientes. 2. as varincias estimadas dos parmetros so viesadas, gerando problemas com os testes de hiptese. Testes para detectar a presena de Heterocedasticidade Teste de Goldfeld-Quandt A idia bsica do teste verificar se existe diferena entre a varincia dos resduos estimados, ou seja, ui, localizados nas proximidades do intercepto, e aqueles que se encontram a uma distncia maior. Com o auxlio do Grfico 11.3, fcil verificar que, se a Var(u1) for igual Var(u2), poderamos considerar que os resduos so homocedsticos. Caso contrrio, devemos tratar o modelo como Heterocedstico.

Conforme ser explicitado na seo a seguir, dedicada aos problemas de especificao. Prof. Me. Waldemir Santos Nogueira / 2007

169

Var (u1 )

Var (u 2 )

11.3 importante notar que, nesse exemplo, estamos tratando de uma regresso simples, ou seja, com uma nica varivel explicativa. No caso de uma regresso mltipla, antes de mais nada, necessrio identificar com qual das variveis independentes o resduo est relacionado, O teste de Goldfeld-Quandt dever ser realizado utilizando-se cada uma das variveis explicativas suspeitas por vez. O procedimento para a realizao do teste o seguinte: 1. Ordenar todos os dados da amostra de acordo com os valores da varivel explicativa relacionada com os resduos. 2. Dividir a amostra em trs partes, separando aproximadamente 25% dos elementos centrais - c. Assim, teremos

(n c ) elementos na
2

primeira e na terceira parte, conforme ilustrado no Grfico 11.3. 3. Estimar uma regresso utilizando somente os elementos da parte 1, e calcular a soma dos quadrados dos resduos, ou seja: 2. Calcular u1 2 .
2 i =1 n

u
i =1

2 11

4. Repetir o passo 3, utilizando, agora, somente os elementos da parte

Prof. Me. Waldemir Santos Nogueira / 2007

170

5. Calcular

u i2 2 (n c ) = n 2 n c , que tem distribuio F com k 2 ui 1 2

(n

c) 2

graus de liberdade no numerador e no denominador. Obs.: Colocar sempre no numerador a soma de resduos supostamente superior. Assim, se o modelo fosse representado pelo Grfico 11.2, teramos uma inverso entre o numerador e o denominador de F*. Os critrios para realizao do teste so os seguintes: 1. Se F* > Ftabelado. Portanto, u22 > u12 rejeita-se a hiptese nula de que H0: de que ui Homocedstico. Nesse caso, pode-se dizer que existe Heterocedasticidade. 2 u12 2. Se F* > Ftabelado F* 1. Portanto, u2 Aceito a hiptese nula - H0: de que ui Homocedstico. Nesse caso, pode-se dizer que no existe Heterocedasticidade. importante destacar que o teste de Goldfeld-Quandt apresenta algumas limitaes: 1. Exige amostra relativamente grande. 2. Pressupe que a Heterocedasticidade seja decorrente da relao entre o termo aleatrio e alguma(s) das variveis explicativas. Existem, porm, outras possibilidades, tais como a Heterocedasticidade resultante da utilizao de dados grupados. 3. No d indicao sobre a exata relao existente entre a varivel X e os resduos ui 4. Depende do nmero de elementos excludos, ou seja, do valor de c. Assim, se c for muito grande, sobraro poucos graus de liberdade para o clculo de u i 2 das duas regresses. Por outro lado, se ele
Prof. Me. Waldemir Santos Nogueira / 2007

171

for muito pequeno, ser difcil captar as diferenas de varincias possivelmente existentes. Teste de Glejser Esse teste, alm da facilidade de realizao, permite que se supere a limitao 3 do teste de Goldfeld-Quandt. Assim, os resultados desse teste daro indicaes sobre o padro da Heterocedasticidade. Essa informao til para a escolha de um mtodo conveniente de estimao do modelo Heterocedstico. Os procedimentos para realizao desse teste so os seguintes: 1. Estimar a regresso original, ou seja, Y = X + u . 2. Com os resduos obtidos em 1, estimar as seguintes regresses:
ui = 0 + 1 X i
ui = 0 + 1 X i2

ui = 0 + 1

1 Xi

ui = 0 + 1 X i

ou, em termos gerais:


ui = 0 + 1 X ih

sendo X a varivel explicativa com a qual se supe que ui esteja relacionado e h qualquer potncia selecionada. O teste ser realizado pela forma usual, ou seja, H0: 1 = 0, tendo distribuio t. Os critrios para realizao do teste so os seguintes:
1

1. Se 1 = 0, para todas as regresses estimadas aceita-se H0 Consequentemente no existe Heterocedasficidade. 2. Se 1 0, para pelo menos uma das regresses estimadas Rejeitase H0 . Consequentemente existe Heterocedasticidade.
Prof. Me. Waldemir Santos Nogueira / 2007

172

A limitao mais importante desse teste refere-se ao pressuposto de que a Heterocedasticidade seja decorrente da relao entre o termo aleatrio ui e alguma(s) das variveis independentes xs. Como dito antes, esse no o nico padro existente. Resumo e Exerccios Se a hiptese do mtodo dos mnimos quadrados de que a varincia do termo erro (resduos)ui constante para todos os valores das variveis independentes no se mantm, deparamo-nos com o problema da Heterocedasticidade. Isto conduz a estimativas viesadas e ineficientes(isto , maior que a varincia mnima) dos erros padro (e, assim, h testes estatsticos e intervalos de confiana incorretos). Um teste de Heterocedasticidade de Quandt-Goldfeld envolve ordenar os dados para pequenos e grandes valores da varivel independente X, e fazer duas regresses, uma para os pequenos valores de X e uma para grandes valores de X, omitindo, digamos um quinto das observaes com valores mdios. Ento, testamos se a razo da soma 2 dos quadrados dos erros ( u ) (VR) da segunda para a primeira regresso significativamente diferente de zero, usando a tabela F com (n-d-2k)/2 graus de liberdade, onde, n o nmero total de observaes, d o nmero de observaes omitidas e k o nmero de parmetros estimados. Se a varincia do erro proporcional a X2 (caso mais freqente), a Heterocedasticidade pode ser reduzida pela diviso de cada termo do modelo por X, ento reestimando a regresso usando as variveis transformadas.

Prof. Me. Waldemir Santos Nogueira / 2007

173

Testes da Heterocedasticidade: Exemplos numricos Os exerccios resolvidos a seguir mostram como testar a Heterocedasticidade e como proceder a sua correo. Aplicao do teste de Quandt-Goldfeld Salrios Mdios e Nmero de Trabalhadores Empregados Salrios Mdios 8,40 8,40 8,60 8,90 9,10 9,30 9,50 9,80 9,90 10,30 10,60 10,90 11,60 11,80 12,10 Fonte: Salvatore (1982) 8,70 9,30 10,30 11,30 12,50 8,90 9,40 10,30 11,50 12,70 9,00 9,60 10,50 11,70 13,10 Trabalhadores Empregados 100 200 300 400 500

O exemplo acima fornece os salrios mdios Y, e o nmero de trabalhadores empregados, X, para 30 empresas de uma indstria. Fazendo a regresso de Y em relao a X para a amostra inteira, obtemos: ) Y = 7,5 + 0,009X R2 = 0,90 t (40,27) t (16,10) Os resultados da regresso de Y com relao a X para as 12 primeiras e para as 12 ltimas so:
) Y=

8,1 + 0,006X t (39,4) t (4,36) ) Y = 6,1 + 0,013X t (4,16) t (3,89)

R2 = 0,66 u12 = 0,507 R2 = 0,60 u22 = 3,095

Desde que VR2/VR1 = 3,095/0,507 = 6,10 excede F10,10 = 2,97 ao nvel de significncia de 5% a hiptese de Heterocedasticidade

Prof. Me. Waldemir Santos Nogueira / 2007

174

aceita. Reestimando o modelo transformado para corrigir a Heterocedasticidade, obtemos:


) Y / X = 0,008 + 7,8(1 / X )

t (14,43)

R2 = 0,99 t (76,58)

O coeficiente de declividade agora dado pelo intercepto (isto 0,008) e, este menor do que do ajustamento (que 0,009).

Aplicao do teste de Glejser, segundo Matos (2000) Com os dados da demanda de energia eltrica constantes da tabela abaixo, calcula-se os resduos da regresso. Ano 1981 1982 1983 1984 1985 Q 69 76 81 90 94 T 143 134 117 111 109 Y 84 85 82 86 93 D 0 0 0 0 1 Fonte: Matos(2000) Calculando a regresso de Q = temos:
Regression Analysis: Q versus T; Y; D
The regression equation is Q = 5,7 - 0,264 T + 1,27 Y - 0,60 D Predictor Constant T Y D Coef 5,73 -0,26447 1,2660 -0,596 SE Coef 40,49 0,09871 0,4491 8,594 T 0,14 -2,68 2,82 -0,07 P 0,892 0,037 0,030 0,947

1986 100 100 100 1

1987 103 137 104 1

1988 1989 1990 108 113 115 122 85 90 104 107 102 1 1 1

0+ 1T+ 2Y+ 3D+u

no MINITAB

S = 5,03671

R-Sq = 93,2%

R-Sq(adj) = 89,8%

Analysis of Variance Source Regression Residual Error Total DF 3 6 9 SS 2088,69 152,21 2240,90 MS 696,23 25,37 F 27,44 P 0,001

Prof. Me. Waldemir Santos Nogueira / 2007

175

Source T Y D Obs 1 2 3 4 5 6 7 8 9 10

DF 1 1 1

Seq SS 1079,49 1009,08 0,12 Fit 74,25 77,90 78,60 85,25 94,04 105,29 100,56 104,53 118,11 110,46 SE Fit 3,01 2,66 2,88 3,02 4,40 2,31 3,78 2,76 3,77 2,66 Residual -5,25 -1,90 2,40 4,75 -0,04 -5,29 2,44 3,47 -5,11 4,54 St Resid -1,30 -0,44 0,58 1,18 -0,02 -1,18 0,73 0,82 -1,53 1,06

T 143 134 117 111 109 100 137 122 85 90

Q 69,00 76,00 81,00 90,00 94,00 100,00 103,00 108,00 113,00 115,00

Com os dados da varivel explicativa (T) e dos resduos admitindo-se, a priori, que a varincia dos resduos seja correlacionada aos valores da tarifa (T), solicita-se testar a presena ou no de Heterocedasticidade, utilizando-se o procedimento de Glejser e um nvel de significncia de 5%. Soluo - A estimao da equao |u| = os seguintes resultados:
Regression Analysis: Residual versus T
The regression equation is Residual = 6,57 - 0,0265 T Predictor Constant T Coef 6,567 -0,02655 SE Coef 3,546 0,03049 T 1,85 -0,87 P 0,101 0,409

1T+

v (c = 1) fornece

S = 1,79966

R-Sq = 8,7%

R-Sq(adj) = 0,0%

Analysis of Variance Source Regression Residual Error Total DF 1 8 9 SS 2,455 25,910 28,365 MS 2,455 3,239 F 0,76 P 0,409

Obs 1 2 3 4 5 6 7 8 9

T 143 134 117 111 109 100 137 122 85

Residual 5,250 1,900 2,400 4,750 0,040 5,290 2,440 3,470 5,110

Fit 2,770 3,009 3,461 3,620 3,673 3,912 2,930 3,328 4,310

SE Fit 1,031 0,816 0,573 0,581 0,596 0,726 0,884 0,610 1,072

Residual 2,480 -1,109 -1,061 1,130 -3,633 1,378 -0,490 0,142 0,800

St Resid 1,68 -0,69 -0,62 0,66 -2,14R 0,84 -0,31 0,08 0,55

Prof. Me. Waldemir Santos Nogueira / 2007

176
10 90 4,540 4,177 0,946 0,363 0,24

R denotes an observation with a large standardized residual.

|| = 6,5677 - 0,0266T, t(1,85) t(-0,87)

R2 = 0,0866, F = 0,7588 e n = 10.

Pelos testes F e t, a hiptese de relao significativa entre os valores absolutos dos resduos ui e a varivel tarifa (T) rejeitada, ao nvel de significncia de 5%. Nesse nvel, o termo constante , tambm, estatisticamente nulo. Portanto, aceita-se a hiptese de ausncia de Heterocedasticidade. Isso era, de certa forma, esperado em virtude de se tratar de srie histrica, em que tal problema pouco freqente. Aplicao de testes e correo da Heterocedasticidade (outro exempo) Com os dados a seguir sobre produo (P) e mo de obra utilizada (M) no processo produtivo de oito empresas industriais, solicita-se; a) Estimar a equao de produo (forma linear) e testar a presena de Heterocedasticidade pelo procedimento de Glejser, ao nvel de produtividade 5%. b) Fazer a correo da Heterocedasticidade. Produo (P) Mo-de-obra(M) Soluo: a) Equao estimada e teste de Glejser
Regression Analysis: P versus M
The regression equation is P = 0,91 + 0,994 M Predictor Constant M Coef 0,911 0,9935 SE Coef 2,817 0,4518 T 0,32 2,20 P 0,757 0,070

3 2

5 4

3 15 3 3 10 9

8 10 5 6 7 4

S = 3,43687

R-Sq = 44,6%

R-Sq(adj) = 35,4%

Prof. Me. Waldemir Santos Nogueira / 2007

177

Analysis of Variance Source Regression Residual Error Total Obs 1 2 3 4 5 6 7 8 M 2,0 4,0 3,0 10,0 9,0 6,0 7,0 4,0 DF 1 6 7 SS 57,13 70,87 128,00 MS 57,13 11,81 F 4,84 P 0,070

P 3,00 5,00 3,00 15,00 3,00 8,00 10,00 5,00

Fit 2,90 4,89 3,89 10,85 9,85 6,87 7,87 4,89

SE Fit 2,04 1,42 1,70 2,32 1,95 1,23 1,36 1,42

Residual 0,10 0,11 -0,89 4,15 -6,85 1,13 2,13 0,11

St Resid 0,04 0,04 -0,30 1,64 -2,42R 0,35 0,68 0,04

R denotes an observation with a large standardized residual.

Utilizando-se tal equao calcula-se os seguintes resduos:


ui |ui|

0,1 0,1

0,11 -0,89 0,11 0,89

4,15 -6,85 4,15 6,85

1,13 1,13

2,13 2,13

0,11 0,11

Estimando-se a equao |u|=a+bM+u (para c=1), obtm-se os seguintes resultados:


Regression Analysis: Residual versus M
The regression equation is Residual = - 2,11 + 0,718 M Predictor Coef SE Coef Constant -2,107 1,110 M 0,7183 0,1781 S = 1,35460 R-Sq = 73,1% T P -1,90 0,107 4,03 0,007 R-Sq(adj) = 68,6%

Com esses resultados, rejeita-se a hiptese nula de ausncia de Heterocedasticidade aceitando-se, por conseguinte, a presena do problema visto que os parmetros estimados so estatisticamente diferentes de zero ao nvel de 5%. b) Correo da heterocedasticidade 2 Admitindo-se que a varincia dos resduos, i , diretamente proporcional a M poder-se- escrever:

i2 = 2 .M 2 . Portanto, 2 = i2 / M 2 e o desvio-padro dos 2 resduos Homocedsticos ser: = i / M .


Prof. Me. Waldemir Santos Nogueira / 2007

178

Assim, dividindo-se a equao original P=b+cM+v por M, obtm-se a seguinte forma transformada:

P 1 v =b +c+ M M M
Se P/M = W, 1/M=Z e v/M=u, obtm-se: W=b Z+c+u. Com essa transformao, note-se que var(u)= . Como o uma constante, est assegurada a homocedasticidade.
2 2

Dessa forma, as variveis transformadas so: W Z 1,50 0,50 1,25 0,25 1,00 0,33 1,50 0,10 0,33 0,11 1,33 0,17 1,43 0,14 1,25 0,25

A equao estimada, a partir desses dados transformados, a seguinte:


Regression Analysis: W versus Z The regression equation is W = 1,02 + 0,79 Z Predictor Constant Z Coef 1,0164 0,789 SE Coef 0,2978 1,131 T 3,41 0,70 P 0,014 0,512

S = 0,402677

R-Sq = 7,5%

R-Sq(adj) = 0,0%

Analysis of Variance Source Regression Residual Error Total Obs 1 2 3 4 5 6 7 8 Z 0,500 0,250 0,330 0,100 0,110 0,170 0,140 0,250 DF 1 6 7 SS 0,0788 0,9729 1,0517 Fit 1,411 1,214 1,277 1,095 1,103 1,150 1,127 1,214 MS 0,0788 0,1621 F 0,49 P 0,512

W 1,500 1,250 1,000 1,500 0,330 1,330 1,430 1,250

SE Fit 0,336 0,144 0,181 0,206 0,198 0,158 0,176 0,144

Residual 0,089 0,036 -0,277 0,405 -0,773 0,180 0,303 0,036

St Resid 0,40 0,10 -0,77 1,17 -2,20R 0,48 0,84 0,10

Prof. Me. Waldemir Santos Nogueira / 2007

179
R denotes an observation with a large standardized residual.

= 1 ,02 + 0 ,77 Z W
Utilizando-se a notao original e multiplicando-se a equao estimada por 1/M e acrescentando-se as estatsticas t, obtm-se os seguintes resultados:

= 0 ,77 + 1 ,02 M P t ( 0 ,68 ) t ( 3 ,43 )


Note-se que o nvel de significncia da varivel M melhorou sensivelmente aps a correo da Heterocedasticidade. Todavia, o coeficiente de determinao R2 e a estatstica F tm pouco significado em face da transformao da varivel dependente. Devem-se utilizar, nesse caso, os valores obtidos antes da transformao : R=0,446 e F=4,836. No entanto, um procedimento mais eficiente consiste em utilizar o quadrado do coeficiente de correlao simples (r) entre os valores observados de Y e os estimados a partir da equao corrigida. O valor da estatstica F pode, ento, ser calculada em termos de r, lembrando que r=R, nesse caso. Os valores de r e de F, quando esse ltimo procedimento utilizado , so virtualmente iguais aos que foram calculados a partir da estimao do modelo sem ponderao. Isso ocorreu em virtude de as equaes ponderada e sem ponderao serem idnticas. A alterao que se verificou, com a correo, refletiu-se fundamentalmente na varincia dos parmetros estimados. Aplicando-se o mesmo teste, aps a correo, foram obtidos os seguintes resultados:
Regression Analysis: residual_1 versus 1/M=Z
The regression equation is residual_1 = 0,500 - 1,02 1/M=Z Predictor Constant 1/M=Z Coef 0,4999 -1,0226 SE Coef 0,1613 0,6116 T 3,10 -1,67 P 0,021 0,146

S = 0,217951

R-Sq = 31,8%

R-Sq(adj) = 20,4%

Prof. Me. Waldemir Santos Nogueira / 2007

180

Verifica-se que a relao entre | u | e M , agora, estatisticamente nula, ao nvel de 5%.

Prof. Me. Waldemir Santos Nogueira / 2007