Você está na página 1de 74

UNIVERSIDADE FEDERAL DE VIOSA

DEPARTAMENTO DE ECONOMIA RURAL


PROGRAMA DE PS-GRADUAO EM ECONOMIA APLICADA

APOSTILA DE ECONOMETRIA BSICA


USANDO STATA

Edson Melo
Fernanda Schwantes
Glucia de Almeida Padro
Ricardo de Oliveira Gaspar

VIOSA, MG, 2010


NOTAS SOBRE OS ORGANIZADORES

EDSON MELO
Economista pela Universidade Federal de Viosa (UFV), Especialista em
Economia Empresarial pela PUC-MG, Mestrando em Economia Aplicada da
Universidade Federal de Viosa (UFV), Bolsista de Mestrado da CAPES. E-mail:
edson.melo@ufv.br

FERNANDA SCHWANTES
Economista pela Universidade Federal de Santa Maria (UFSM), Mestranda em
Economia Aplicada da Universidade Federal de Viosa (UFV), Bolsista de Mestrado da
FAPEMIG. E-mail: fe.schwantes@gmail.com

GLUCIA DE ALMEIDA PADRO


Economista pelo Centro Universitrio de Sete Lagoas (UNIFEMM), Mestranda
em Economia Aplicada da Universidade Federal de Viosa (UFV), Bolsista de
Mestrado da CAPES. E-mail: glaupadrao@gmail.com

RICARDO DE OLIVEIRA GASPAR


Engenheiro Florestal e Mestre em Cincia Florestal pela Universidade Federal
de Viosa (UFV), Doutorando em Cincia Florestal da Universidade Federal de Viosa
(UFV), Bolsista de Doutorado do CNPq. E-mail: ricogaspar.floresta@gmail.com
APRESENTAO
Este material foi desenvolvido em paralelo ao curso de ERU 626 Econometria
I, do Programa de Ps-Graduao em Economia Aplicada da Universidade Federal de
Viosa (UFV). De conhecimento do professor Clailton, foi-nos apresentada a proposta
de organiz-lo no formato de apostila, com o objetivo de auxiliar os alunos do curso de
graduao em Cincias Econmicas da Universidade Federal de Santa Maria e outros
interessados no uso dos comandos bsicos do software Stata.
No nossa pretenso, de forma alguma, fornecer um manual de utilizao do
software. Cabe ressaltar que a grande parte dos comandos nos foi repassada pelos
monitores da disciplina e que os comentrios adicionais so de nossa responsabilidade,
com base nos livros recomendados no curso de ERU 626.
Sumrio
1 COMANDOS BSICOS .............................................................................................. 5
2 TESTE DE MACKINNAN, WHITE E DAVIDSON (MWD) ..................................... 6
3 TESTE DE NORMALIDADE DOS RESDUOS ........................................................ 6
4 DIAGNSTICO SOBRE MULTICOLINEARIDADE................................................ 7
5 DIAGNSTICO SOBRE HETEROCEDASTICIDADE ............................................. 8
5.1 Mtodos informais de diagnstico de heterocedasticidade..................................... 9
5.2 Mtodos formais de diagnstico de heterocedasticidade ........................................ 9
5.2.1 Teste de Park .................................................................................................... 9
5.2.2 Teste de Glejser .............................................................................................. 10
5.2.3 Teste de Goldfeld-Quandt .............................................................................. 11
5.2.4 Teste Breusch-Pagan-Godfrey ....................................................................... 12
5.2.5 Teste de White................................................................................................ 13
5.3 Providncias corretivas para HETEROCEDASTICIDADE ................................ 13
6 DIAGNSTICO DA AUTOCORRELAO ............................................................ 15
6.1 Mtodo grfico plotagem sequencial no tempo ................................................. 15
6.2 Teste de Durbin-Watson ....................................................................................... 15
6.3 Teste de Breush-Godfrey ...................................................................................... 16
7 MODELOS DE REGRESSO COM DADOS EM PAINEL .................................... 18
7.1 Vantagens da utilizao de dados em painel ........................................................ 18
7.2 Dados em Painel: um exemplo numrico ............................................................. 19
7.3 Estimao de modelos de regresso com dados em painel: a abordagem dos
efeitos fixos ................................................................................................................. 22
7.4 Estimao de modelos de regresso com dados em painel: a abordagem dos
efeitos aleatrios ......................................................................................................... 32
7.5 Qual o melhor modelo: pooled, efeitos fixos ou efeitos aleatrios? ..................... 34
7.5.1 Teste de Chow ................................................................................................ 34
7.5.2 Teste de Hausman .......................................................................................... 36
7.5.3 Teste LM de Breusch-Pagan .......................................................................... 37
7.6 Identificao e correo de autocorrelao e heterocedasticidade em painel ....... 37
7.6.1 Autocorrelao ............................................................................................... 37
7.6.2 Teste de Wald para heterocedasticidade em grupo ........................................ 38
7.7 Procedimentos corretivos para autocorrelao e heterocedasticidade em painel . 39
8 MODELOS DE ESCOLHA QUALITATIVA ............................................................ 39
8.1 Modelos de probabilidade linear: um exemplo numrico..................................... 39
8.2 Modelos logit e probit com dados agrupados ou replicados: um exemplo numrico
.................................................................................................................................... 43
8.2.1 Modelo LOGIT .............................................................................................. 43
8.2.2 Modelo PROBIT ............................................................................................ 48
8.3 Modelos logit e probit com dados individuais: um exemplo numrico ................ 50
8.3.1 Modelo Logit .................................................................................................. 50
9 MODELOS ECONOMTRICOS DINMICOS: MODELOS
AUTORREGRESSIVOS E COM DEFASAGENS DISTRIBUDAS .......................... 53
9.1 Estimao ad hoc de modelos de defasagens distribudas .................................... 53
9.2 Modelo de Koyck .................................................................................................. 54
9.2.1 Defasagem Mediana ....................................................................................... 54
9.2.2 Defasagem Mdia ........................................................................................... 54
9.3 Teste de Breusch Goodfrey................................................................................... 54
9.4 Ajustamento parcial ou ajustamento de estoques (Nerlove) ................................. 54
9.5 Expectativas adaptativas: ...................................................................................... 55
10 MODELOS DE EQUAES SIMULTNEAS ...................................................... 63
10.1 MNIMOS QUADRADOS DE 2 ESTGIOS ................................................... 63
10.1.1 Primeira Forma:............................................................................................ 64
10.1.2 Segunda Forma de Regredir por MQ2E: ..................................................... 64
10.2 MINIMOS QUADRADOS EM TRS ESTGIOS .......................................... 65
11 SRIES TEMPORAIS NO EVIEWS ....................................................................... 65
11.1 Anlise Grfica ................................................................................................... 66
11.2 Correlograma ...................................................................................................... 66
11.3 Teste de Raiz Unitria......................................................................................... 67
11.4 Teste de Granger ................................................................................................. 67
11.5 Teste Para Verificar Co-Integrao .................................................................... 67
11.5.1 Teste de Engle Granger ................................................................................ 67
11.6 MODELOS ARIMA ........................................................................................... 67
11.7 PREVISO ......................................................................................................... 68
11.8 MODELO VAR .................................................................................................. 68
11.9 MODELOS ARCH ............................................................................................. 69
11.10 SRIES TEPORAIS NO STATA .................................................................... 69
1 COMANDOS BSICOS

1.1 Para trocar vrgula por ponto no Excel, Office 2007, clique no Boto Office (canto
superior esquerdo), Opes do Excel, Avanado:
Separador decimal: . (ponto)
Separador de milhar: , (vrgula)

1.2 Para aumentar a memria do Stata:


set mem 1m

1.3 Para entrar com os dados no Stata, copiar (Ctrl C) do arquivo em Excel ou Bloco de
notas e digitar no command do Stata edit
Abrir o Data editor, Ctrl V. Todas as variveis devem ficar em preto. Se alguma tiver
em vermelho, h erro.

1.4 Para mostrar estatsticas descritivas das variveis:


summarize ou sum e digitar o nome das variveis

1.5 Para retirar (deletar) dados:


drop if X=-1, (por exemplo)
ou keep if X~=., (por exemplo)

1.6 Para fazer uma regresso: reg ou regress e adicionar as variveis. A varivel
dependente sempre a primeira a ser colocada aps o reg.

1.7 Para obter os valores estimados de Y:


predict Yest (gera no data editor os valores estimados da varivel dependente)

1.8 Matriz var-cov:


vce

1.9 Para criar tendncia no Stata:


gen trend = _n (comea em 1)
gen trend = _n-1 (comea em zero)

1.10 Para informar ao Stata que uma srie temporal, no command:

1.10.1 ANUAL
gen timevar = y(1959)+_n-1
format timevar %ty
tsset timevar

1.10.2 TRIMESTRAL
gen timevar = q(1973q2) +_n-1
format timevar %tq
tsset timevar

1.10.3 MENSAL
gen timevar = m(2005m7)+_n-1
format timevar %tm

5
tsset timevar

1.10.4 SEMANAL
gen timevar = w(1981w1)+_n-1
format timevar %tw
tsset timevar

2 TESTE DE MACKINNAN, WHITE E DAVIDSON (MWD)

H0: modelo linear


H1: modelo log-linear
1. Estime o modelo linear e obtenha os valores estimados de Y (rodar o modelo e
predict Ychapu).
2. Estime o modelo log-log e obtenha os valores estimados de lnY (rodar o modelo
log-log e predict lnYchapu).
3. Calcule Z1 como sendo ln(Ychapeu) lnYchapeu.
4. Regrida o modelo linear dado em (1), acrescentando a varivel Z1, ou seja, Yt contra

 =  +   +    + 
 + 
as variveis explicativas utilizadas em (1) e a varivel Z1:

e teste se 
=0 pelo teste t.
Se  for estatisticamente significativo, rejeita-se H0, ou seja, rejeita-se o
modelo linear. Assim, o modelo log-log o melhor modelo.
Em seguida, testa-se:
H0: modelo log-log
H1: modelo linear

6.Regrida  =  +   +    + 


 +  e teste se 
= 0 pelo teste t.
5. Calcule Z2 = (antilog de lnYchapeu) Ychapeu.

3 TESTE DE NORMALIDADE DOS RESDUOS

3.1 Para obter os resduos:


predict resduos, residuals
histogram resduos, discrete normal
gen erro = resduos^2
Histograma dos resduos trata-se de um dispositivo grfico que usado para
conhecer algo da forma da funo de densidade de probabilidade de uma varivel
aleatria. No eixo horizontal, dividimos os valores da varivel em exame (no caso, os
resduos de MQO) em intervalos adequados e, em cada intervalo de classe, traamos
retngulos cuja altura dada pelo nmero de observaes (isto , sua frequncia) nesse
intervalo de classe. Sobrepondo mentalmente a curva em forma de sino da distribuio
normal ao histograma, teremos a ideia de se a aproximao normal (FDP) adequada.
Teste de Jarque Bera um teste assinttico ou de grandes amostras. Tambm parte
dos resduos de MQO. Esse teste calcula, primeiro, a assimetria e a curtose dos resduos

  ( 3)
e emprega o seguinte teste estatstico:
 =   + 
6 24
onde n = tamanho da amostra; s = coeficiente de assimetria e k = coeficiente de curtose.
Para uma varivel normalmente distribuda, s = 0 e k = 3. Portanto, o teste JB de
normalidade um teste de hiptese conjunta de que s e k so iguais a 0 e 3,
respectivamente. Nesse caso, espera-se que o valor da estatstica JB seja igual a 0.
6
Sob a hiptese nula de que os resduos so normalmente distribudos, Jarque e
Bera demonstraram que, assintoticamente (isto , em grandes amostras), a estatstica JB
segue a distribuio de qui-quadrado com 2 graus de liberdade. Se o valor p calculado
para a estatstica JB em uma aplicao for suficientemente pequeno, o que
acontece se o valor da estatstica for muito diferente de zero, podemos rejeitar a
hiptese de que a distribuio dos resduos normal. Mas se o valor p for
razoavelmente alto, o que acontece quando o valor da estatstica est prximo de
zero, no rejeitamos a premissa de normalidade. Quanto mais prximo de zero
estiver a estatstica calculada de JB, no rejeita-se a hiptese nula de normalidade
dos resduos. Se os resduos esto normalmente distribudos, eles seguem a
distribuio normal com mdia zero e varincia constante 2.
O valor p o menor nvel de significncia ao qual se rejeita a hiptese nula: H0:
resduos se distribuem normalmente. Se o valor p for elevado, no rejeita-se a hiptese
nula. Assim, os resduos so normalmente distribudos. (Exemplo: valor p de JB =
0,756009 somente em nvel de significncia de 75% que se rejeita H0, portanto, no
se rejeita H0).
O teste de Jarque Bera deve ser instalado no Stata, de acordo com o seguinte
comando:
ssc des jb
ssc install jb
Regredir uma regresso e obter os resduos: predict [nome da varivel resduos],
residuals
Para fazer o teste JB, digitar em command: jb [nome da varivel resduos]

4 DIAGNSTICO SOBRE MULTICOLINEARIDADE

4.1 Fazendo a regresso inicial com todas as variveis, se o R2 for substancialmente alto
e um ou mais coeficientes parciais angulares forem individualmente insignificantes do
ponto de vista estatstico de acordo com o teste t, h indcios de multicolinearidade. Em
geral, se R2 for elevado, digamos, superior a 0,8, o teste F deve ser significativo,
rejeitando a hiptese de que todos os coeficientes parciais angulares so
simultaneamente iguais a zero.
reg y x2 x3 x4

4.2 Altas correlaes simples entre pares de regressores. Se os coeficientes de


correlao entre dois regressores forem altos, digamos, maiores que 0,8, ento, a
multicolinearidade ser um problema srio. O problema deste critrio que, embora
altas correlaes simples ou de ordem zero possam sugerir colinearidade, no
necessrio que elas sejam altas para que exista colinearidade em qualquer caso
especfico. Tecnicamente, coeficientes de correlao simples elevados so uma
condio suficiente, mas no necessria, para a existncia de multicolinearidade porque
ela pode existir mesmo que as correlaes de ordem zero ou simples sejam
comparativamente baixas (digamos, de menos de 0,5).
corr x2 x3 x4

,
muito elevado mas !,
; ! ,
; !
,
4.3 Correlaes parciais. Na regresso de Y contra X2, X3 e X4, um resultado em que
   
so comparativamente baixos pode
sugerir que as variveis X2, X3 e X4 so estreitamente intercorrelacionadas e que pelo
menos uma dessas suprflua. Este mtodo no oferece uma orientao infalvel contra

7
a multicolinearidade, pois pode acontecer que tanto R2 quanto as correlaes parciais
sejam suficientemente altas.
pcorr X2 X3 X4 X5 X6 (Deve-se ir mudando a ordem das variveis para poder
interpretar, por exemplo, correlao entre x2 e x3 mantendo x4, x5 e x6 constante;
depois correlao de x3 com x4, mantendo x2, x5 e x6 constante, e assim por
diante).

4.4 Regresses auxiliares. Adotando-se a regra prtica de Klien, se pelo menos um R2


de uma das regresses auxiliares for maior que o R2 da regresso principal, a
multicolinearidade um problema srio neste modelo.
Regredir X2 contra todos os outros Xs.
Regredir X3 contra todos os outros Xs, e assim por diante, dependendo do
nmero de variveis explicativas do modelo.

1
4.5. Tolerncia e fator de inflao da varincia.
#$% =
1 '
1
()*' = = (1 ' )
#$%'
medida que ' , o coeficiente de determinao da regresso do regressor Xj


contra os regressores restantes do modelo, aumenta no sentido da unidade, isto ,


medida que a colinearidade de Xj com os demais regressores aumenta, o FIV tambm
aumenta e, no limite, pode ser infinito. Quanto maior o valor de FIVj, tanto mais

varivel for maior que 10, o que acontece quando ,.- maior que 0,9, diz-se que
problemtica ou colinear a varivel Xj. Como regra prtica, se o FIV de uma

esta varivel altamente colinear. Quanto mais prxima de zero estiver a TOLj,
maior o grau de colinearidade dessa varivel com os demais regressores. Por outro
lado, quanto mais prxima a TOLj estiver de 1, maior a evidncia de que no h
colinearidade desta varivel com os demais regressores.

regresso dependem de trs fatores 2, 0' e FIVj. Um FIV elevado pode ser
Este mtodo no est livre de crticas, j que a varincia dos parmetros da

contrabalanado por um 2 baixo ou por um alto 0' . Portanto, um FIV elevado no


nem necessrio nem suficiente para obter altas varincias e altos erros-padro.
No Stata, command vif logo aps a regresso rodada para a qual se deseja verificar o
FIV e a TOL.

5 DIAGNSTICO SOBRE HETEROCEDASTICIDADE

H0: homocedasticidade
H1: heterocedasticidade
O problema da heterocedasticidade que as estimativas de MQO, apesar de no
tendenciosos e consistentes, deixam de ter varincia mnima (deixam de ser eficientes).
Como o que desejamos no rejeitar H0, em todos os problemas como
multicolinearidade, heterocedasticidade, autocorrelao e normalidade dos resduos,
quanto maior for o valor p (ou a probabilidade), melhor, pois neste caso, a estatstica
calculada estatisticamente no significativa e, portanto, no rejeita-se a hiptese nula.
Se testarmos a estatstica calculada, devemos estabelecer um nvel de significncia
elevado inicialmente (10%), pois quanto maior o nvel de significncia, menor a
estatstica crtica. Se t calc < t crt, no rejeita-se H0. Assim, para dar mais rigor ao

8
teste, temos que escolher um t crtico bem pequeno, que s possvel com um nvel de
significncia elevado. por isso que este teste o inverso do teste t de significncia
individual dos parmetros, no sentido da escolha do nvel de significncia. Enquanto no
primeiro se inicia com um nvel de significncia elevado, para se obter um t crtico
pequeno, neste ltimo caso do teste de significncia dos parmetros individuais se inicia
com um nvel de significncia baixo, para obter um t crtico elevado, pois se deseja
rejeitar a hiptese nula.

5.1 Mtodos informais de diagnstico de heterocedasticidade

Cabe destacar, inicialmente, dois mtodos informais para detectar


heterocedasticidade. Primeiramente, espera-se que em dados de corte transversal, que
envolvam unidades heterogneas, a heterocedasticidade deve ser mais a regra do que a
exceo. Outro mtodo informal sustenta que se no existem informaes a priori ou
empricas sobre a natureza da heterocedasticidade, na prtica, podemos fazer a anlise
de regresso supondo que no h heterocedasticidade (regredir normalmente Y contra
os Xs) e depois fazer um exame dos resduos elevados ao quadrado para verificar se

contra a varivel dependente estimada (12 ), por meio do comando:


eles apresentam algum padro sistemtico. Plotando os resduos estimados ao quadrado

* Estimando o modelo e obtendo os resduos


regress y x2-x6
predict resid, residuals

* Gerando o quadrado dos resduos


gen resid_quad=resid^2

* Fazendo o plot dos resduos contra a varivel dependente ou contra as


explicativas:
twoway (scatter resid_quad Yest)

pode-se verificar se o valor mdio estimado de Y se relaciona sistematicamente com os


resduos elevados ao quadrado. Se os resduos se distribuem em torno de uma mdia no
grfico, diz-se que o modelo homocedstico; se h um padro sistemtico entre as
duas variveis (resduos elevados ao quadrado e Y estimado), h heterocedasticidade.
Os resduos tambm podem ser plotados contra qualquer uma das variveis
independentes do modelo. Dependendo do comportamento grfico da relao entre estas
duas variveis (resduos ao quadrado e uma das variveis independentes), mais fcil
identificar como os dados podem ser transformados para que a varincia do termo de
erro se torne homocedstica.

5.2 Mtodos formais de diagnstico de heterocedasticidade


5.2.1 Teste de Park
Park formaliza o mtodo grfico sugerindo que 32 funo da varivel
explanatria Xi. A forma funcional que ele sugere
32 = 3  2 5 62
4

32 = 3  + 72 + 82


ou

onde vi o termo de erro estocstico.

9
Como em geral 32 desconhecido, Park sugere usar 2 como proxy e calcular a
seguinte regresso:

 2 = 3  + 72 + 82
 2 =  + 72 + 82
Se for estatisticamente significativo, rejeita-se H0, ou seja, se o valor p da
estatstica t de for muito prximo de zero, podemos considerar que a
heterocedasticidade est presente nos dados. Caso contrrio, podemos aceitar a premissa
de homocedasticidade.
Mecnica do teste:
1. Calculamos a regresso por MQO sem levar normalmente, sem conta a questo da
heterocedasticidade.
2. Obtemos os resduos dessa regresso por MQO e geramos as seguintes variveis:
gen lnresid_quadr=ln(resid_quad)
gen lnx3=ln(x3), por exemplo, se for a varivel X3 que se suspeita seguir um padro
sistemtico com o somatrio dos resduos ao quadrado.
3. Regredimos a regresso proposta por Park:
regress lnresid_quadr lnx3
Este teste um mtodo estritamente exploratrio, pois est sujeito a crticas.

5.2.2 Teste de Glejser


Obtm-se os resduos da regresso por MQO e testa-se vrias possibilidades de
como o erro se distribui, j que Glejser sugere fazer uma regresso dos valores

32 . Glejser prope testar as seguintes formas funcionais:


absolutos dos resduos contra a varivel X que se considera estreitamente relacionada a

/ 2 /= 7 + 7 2 + 82
/ 2 /= 7 + 7 ;2 + 82
1
/ 2 /= 7 + 7 + 82
2
1
/ 2 /= 7 + 7 + 82
;2
/ 2 /= ;7 + 7 2 + 82
/ 2 /= <7 + 7 2 + 82
onde vi o termo de erro.
Cabe destacar que os dois ltimos modelos so no lineares nos parmetros e,
portanto, no podem ser estimados com os habituais procedimentos de MQO.
Em termos prticos, os quatro primeiros modelos podem ser usados para detectar
heterocedasticidade em grandes amostras, j que Glejser verificou que neste caso os
resultados so satisfatrios.
Mecnica do teste:
1. gera-se a varivel resduo em valores absolutos
gen res_abs=abs(resid)
2. No caso do modelo considerando a raiz quadrada de x3
gen sqrt_x3=sqrt(x3)
3. regress res_abs sqrt_x3
Cabe observar que todas as formas funcionais devem ser testadas e se pelo
menos uma indicar heterocedasticidade, aceita-se a presena de heterocedasticidade nos

10
dados. Se o coeficiente relativo varivel Xi for estatisticamente significativo pelo
habitual teste t, rejeita-se H0.

* Coeficiente de correlao de Spearman


* neste caso, precisa dos y estimados
qui regress y x2-x6
predict yhat, xb

* calculo do Coeficiente
spearman yhat res_abs, stats(rho p) matrix

5.2.3 Teste de Goldfeld-Quandt

32 , se relaciona de modo positivo a uma das variveis explanatrias do modelo de


Este mtodo aplicvel quando se pressupe que a varincia heterocedstica,


2 = 7 + 7 2 + 2
regresso. Para simplificar, partiremos do modelo de duas variveis:

Imagine que 32 se relaciona positivamente a 2 da seguinte forma:


32 = 3  2
onde 3 uma constante.


A pressuposio acima postula que 32 proporcional ao quadrado da varivel


X. Se esta equao for adequada, significa que 32 ser maior quanto maiores forem os
valores de Xi. Se for este o caso, muito provvel que a heterocedasticidade esteja
presente no modelo. Para testar isso explicitamente, Goldfeld e Quandt sugerem as
seguintes etapas:
Mecnica do teste:
3.1. Ordene ou classifique as observaes de acordo com os valores de Xi, comeando
pelo menor valor de X;
3.2. Omita as observaes centrais (em torno de a 1/6); uma subamostra a que est
acima das centrais e a outra subamostra a que est abaixo das centrais;
3.3. Regrida Y contra os Xi nas duas subamostras e obtenha SQR1 e SQR2, sendo que a
primeira dessas somas corresponde aos menores valores de Xi (o grupo com menor
varincia) e o segundo, o conjunto com maiores valores de Xi (grupo das maiores
varincias).

>?2/@
3.4 Calcule a razo:
==
>?1/@
Sempre colocar a SQR maior no numerador!!
3.5 Compare com a estatstica F crtica, que tem (n-k) graus de liberdade no
numerador e no denominador (atentar para n, que o nmero de observaes de cada
subamostra, e k o nmero de parmetros da regresso de cada subamostra). Se o
(=F) calculado for maior que o F crtico ao nvel de significncia selecionado, rejeita-se
a hiptese nula de homocedasticidade, isto , podemos dizer que a hiptese de
heterocedasticidade muito provvel.
Cabe destacar que a omisso das variveis centrais feita para acentuar a
diferena entre o grupo com varincias pequenas (isto , SQR1) e o grupo de grandes
varincias (isto , SQR2). Vale notar tambm que no caso de modelos com mais de uma
varivel X, o ordenamento das observaes, o primeiro passo do teste, pode ser feito em

2 = 7 + 7 2 + 7  2 + 7

2 + 2 ,
relao a qualquer uma das variveis X. Assim, no modelo:

11
podemos classificar os dados por qualquer um desses X. Se no houver certeza a priori
quanto varivel X adequada, podemos conduzir o teste para cada uma das variveis X
ou, por meio do teste de Park, para cada X. Finalmente, cabe destacar que presume-se
que os resduos se distribuem normalmente.
A limitao deste teste consiste em identificar a varivel X correta pela qual
ordenar as observaes, a qual pode ser evitada recorrendo-se ao teste de Breush-Pagan-
Godfrey (BPG).

5.2.4 Teste Breusch-Pagan-Godfrey


Para descrever este teste, recorremos ao modelo de regresso linear com k

2 = 7 + 7 2 + + 7B B2 + 2
variveis

Suponha que a varincia do erro, 32 , seja descrita como:


32 = C( +  2 + + D D2 )
isto , 32 uma funo das variveis no estocsticas Z; alguns ou todos os X podem


32 =  +  2 + + D D2
servir de Z. Suponha, especificamente, que:

isto , 32 uma funo linear dos Z. Se 2=3=...=m=0, 32 = 1, que uma constante.


Portanto, para testar se 32 homocedstico, podemos testar a hiptese de que


2=3=...=m=0. Essa a idia bsica que est por trs do teste de Breush-Pagan. O
procedimento prtico o seguinte:
Mecnica do teste:
4.1. Estime a regresso principal e obtenha os resduos.

2
4.2. Obtenha o estimador da varincia por mxima verossimilhana, dado por:
3E  =


2
Recordemos que o estimador da varincia por MQO :
3F  =
@

2
4.3. Construa variveis pi, definidas como:
G2 = 
3E
que so simplesmente cada resduo elevado ao quadrado e dividido por 3E  .

G2 =  +  2 + + D D2 + 82
4.4. Faa a regresso de pi contra os Z, como:

onde vi o termo residual desta regresso.

1
4.5. Obtenha SQE da regresso feita na etapa 4 e defina:
H = (>?I)
2

homocedasticidade e se o tamanho da amostra n aumenta indefinidamente, ento: H


Pressupondo que i se distribui normalmente, podemos demonstrar que, se h

segue distribuio de qui-quadrado com (m-1) graus de liberdade; m o nmero de

Portanto, em uma aplicao, se o H = (2) calculado for maior que o valor crtico
parmetros da regresso estimada em 4.5.
2
de ao nvel de significncia escolhido, pode-se rejeitar a hiptese de
homocedasticidade; caso contrrio, no a rejeitamos.

>?I >?I
Cabe destacar que para se obter SQE, necessria na etapa 4.5, recorremos a:
 = =
>?( >?I + >?

12
  (>?I + >?) = >?I
  >?I +   >? = >?I
  >? = >?I   >?I
  >? = >?I(1   )
  >?
>?I =
(1   )
No Stata:
qui regress y x2-x6
scalar sigmamv=e(rss)/e(N)
gen pi= resid_quad/sigmamv

* Regresso do pi contra a varivel x3


regress pi x3

* Obtendo o valor calculado e significncia


scalar chi_calc = e(rss)/2
di 1-chi2(e(df_m),chi_calc)

* Para calcular direto no Stata, digitar em command: estat hettest

5.2.5 Teste de White


* O teste de White tambm precisa ser instalado
ssc des whitetst
ssc install whitetst
regress y contra todos os Xs
whitetst
Este comando no Stata j faz todos os passos do teste de White. s interpretar.

O teste de White conduzido do seguinte modo:


1. Estime a regresso normalmente e obtenha os resduos.

2 =  +  2 +   2 + 
2 + J  2 + K 2  2 + 82
2. Calcule a seguinte regresso auxiliar:
 

Isto , feita uma regresso dos quadrados dos resduos da regresso original contra as
variveis ou regressores X originais, seus valores elevados ao quadrado e os produtos
cruzados dos regressores. Tambm podem ser includos expoentes mais altos dos
regressores. Observe que h um termo constante nessa equao mesmo que a regresso
original no o contenha. Obtenha o R2 desta regresso (auxiliar).
3. Sob a hiptese nula de que no h heterocedasticidade, pode-se demonstrar que o
tamanho da amostra (n) multiplicado pelo R2 da regresso auxiliar segue
assintoticamente a distribuio de qui-quadrado com um nmero de graus de liberdade
igual ao nmero de regressores (excludo o termo constante) da regresso auxiliar.
4. Se o valor de qui-quadrado calculado for superior ao qui-quadrado crtico no nvel de
significncia selecionado, rejeita-se H0 e conclui-se que h heterocedasticidade.

* Regresso com erros padro robustos (correo de White)


regress y x2 x3 x4 x5 x6, vce(robust)

5.3 Providncias corretivas para HETEROCEDASTICIDADE

13
A heterocedasticidade, que pode ser denotada por I( 2 ) = 32 no destri as
propriedades de no tendenciosidade (I(7)L = 7) e de consistncia ( medida que o
tamanho da amostra aumenta, o estimador se aproxima do verdadeiro valor de ) dos
estimadores de MQO; mas eles deixam de ser eficientes (um estimador eficiente
aquele que no tendencioso e tem varincia mnima). A falta de eficincia torna dbio
os habituais testes de hipteses. So necessrias, portanto, medidas corretivas, que
dividem-se em duas abordagens:

1. Quando 32 conhecido: o mtodo dos mnimos quadrados ponderados (uma vertente
dos mnimos quadrados generalizados)
O mtodo dos MQO no usa as informaes contidas na variabilidade desigual
da varivel dependente Y, ele d igual peso ou importncia a todas as observaes. O
mtodo de mnimos generalizados (MQG) leva em conta essa informao
explicitamente dando menos peso aquelas observaes provenientes de populaes com
maior variabilidade e, portanto, capaz de gerar estimadores no BLUE.

2 = 7 + 7 2 + 2
Para ver como isso feito, consideremos o modelo de duas variveis:

2 = 7 M2 + 7 2 + 2
que, para simplificar a manipulao algbrica, podemos escrever como:

onde M2 =1 para cada i.


Agora, suponha que as varincias heterocedsticas 32 so conhecidas. Dividindo

2 M2 2 2
a equao imediatamente anterior por i, obtemos:
= 7 + 7 +
32 32 32 32

2 = 7 M2 + 7 2 + 2
que, para facilitar a exposio, escreveremos como:

divididas pelo 32 conhecido. Usamos a notao 7 e 7 para os parmetros do modelo


onde as variveis marcadas com asterisco, ou transformadas, so variveis originais

transformado a fim de distingui-lo dos parmetros de MQO, 1 e 2.

Note o seguinte aspecto do termo de erro transformado, 2 :


O propsito de transformar o modelo original deve-se ao termo de erro transformado.

2 
8O!( 2 ) = I( 2 ) = I P Q
32
8O!( 2 ) = T I( 2 ), j que 32 conhecido
  
RS
8O!( 2 )

= RT (32 ) j que I( 2 ) = 32
S
8O!( 2 ) = 1
que uma constante. Isto , a varincia do termo de erro transformado 2 agora
homocedstico. Como ainda estamos mantendo as demais premissas do modelo
clssico, constatamos que * que homocedstico, sugerindo que, se aplicarmos os
MQO ao modelo transformado, ele gerar estimadores que so BLUE. Em resumo, os
estimadores de mnimos quadrados ponderados so BLUE e no os estimadores de
MQO.
U U
O fator de ponderao =V
<V.W W

2. Quando 32 no conhecido: Raramente 32 conhecido.


a) Varincia e erros-padro consistentes para heterocedasticidade de White:
14
Os erros-padro com a correo da heterocedasticidade de White tambm so
conhecidos como erros-padro robustos e podem ser obtidos diretamente com o
comando a seguir no Stata:
* Regresso com erros padro robustos (correo de White)
regress y x2 x3 x4 x5 x6, vce(robust)

Como os coeficientes da regresso desconsiderando-se qualquer problema de


heterocedasticidade so no tendenciosos, White props s mexer na varincia. Os
erros-padro ajustados heterocedasticidade (de White) podem ser tanto maiores ou
menores que os erros-padro no ajustados.

b) Assume-se uma pressuposio sobre 32


Se acreditamos, em funo de mtodos grficos, especulativos ou das
abordagens de Park e Glejser, que a varincia dos resduos , por exemplo, proporcional
ao quadrado da varivel explanatria X, ou proporcional a X, ou proporcional ao
quadrado do valor mdio de Y, ou alguma outra pressuposio, recorremos

1
transformao do modelo, adotando como fator de ponderao:
COXY! Z5 GYZ5!OY =
;G!5]GY^Y O]_^ZO
1. a varincia do erro proporcional a Xi : E(ui2)=2Xi2
2

2. a varincia do erro proporcional a Xi: E(ui2)=2Xi


3. a varincia do erro proporcional ao quadrado do valor mdio de Y: Xi2:
E(ui2)=2[E(Yi)] 2

c) uma transformao logartmica nas variveis muitas vezes reduz a


heterocedasticidade em comparao com a regresso principal.

Finalmente, cabe destacar: o impacto de uma varincia do erro no constante


sobre a eficincia do estimador de MQO e de sua inferncia depende de vrios fatores,
incluindo o tamanho da amostra, o grau de variao de i2, a configurao dos valores
de X (isto , do regressor), e a relao entre a varincia dos erros e os X. portanto, no
possvel formular concluses totalmente gerais em relao aos prejuzos trazidos pela
heterocedasticidade (John Fox, Gujarati, 2006, p. 344).

6 DIAGNSTICO DA AUTOCORRELAO

6.1 Mtodo grfico plotagem sequencial no tempo

Pode-se plotar os resduos contra o tempo ou os resduos padronizados contra o

,  /3F. Tambm podemos plotar  contra ` , isto , os resduos no perodo t contra
tempo, que so simplesmente os resduos divididos pelo erro-padro da regresso, isto

os resduos no perodo t-1, uma espcie de teste emprico do esquema AR(1).


* Grfico dos resduos e dos resduos contra resduos defasados
twoway (scatter resid ano)
twoway (scatter resid L.resid)

6.2 Teste de Durbin-Watson


Premissas que embasam o teste somente vlido se atender a estas
pressuposies:

15
1. O modelo de regresso inclui o termo de intercepto. Se este no estiver presente,
como no caso do modelo que passa pela origem, necessrio fazer a regresso para
incluir o intercepto antes de obter a SQR.
2. As variveis explanatrias, X, so no estocsticas ou fixadas em amostras repetidas.
3. Os termos de erro so gerados pelo esquema auto-regressivo de primeira ordem: t =
t-1 + t. Portanto, no pode ser empregado para detectar esquemas auto-regressivos de
ordens mais elevadas.
4. Pressupe-se que o termo de erro esteja normalmente distribudo (verificar pelo teste
de Jarque-Bera).
5. O modelo de regresso no inclui os valores defasados da varivel dependente como
uma das variveis explanatrias.

Testa-se H0: ausncia de autocorrelao para a estatstica calculada Z


6. No h falta de observaes nos dados.

2(1 bF). Como -1<= b <=1, implica que 0<=d<=4.


Esses so os limites de d; qualquer valor estimado para d deve ficar entre estes

Se bF = 0, d =2; isto , no h correlao serial de primeira ordem, espera-se que


limites.

d fique em torno de 2. Portanto, como regra prtica, se verificarmos em uma aplicao

seja positiva ou negativa. Se bF = +1, indicando perfeita correlao dos resduos, d0.
que d menor que 2, podemos pressupor que no h autocorrelao de primeira ordem,

Ento, quanto mais prximo de zero estiver d, maior a evidencia de correlao serial
positiva. Esta relao deveria ser evidente, porque se h autocorrelao positiva, os
resduos estimados se aglomeraro e suas diferenas tendero a ser pequenas. Em
consequncia, a soma dos quadrados do numerador ser menor que a do denominador,

Se bF = 1, isto , se h correlao negativa perfeita entre resduos sucessivos, d


que permanece um valor nico para qualquer regresso dada.

4. Portanto, quanto mais prximo d estiver de 4, maior a evidencia de correlao serial


negativa.
A mecnica do teste DW a seguinte, supondo que as premissas que o embasam
sejam respeitadas:
1. Calcula-se a regresso por MQO e obtm-se os resduos.
2. Calcula-se d conforme:
fij e f `d
fiT (d e fgh )T
Z= fij efT
fih d
3. Dados o tamanho da amostra e o nmero de variveis explanatrias, encontram-se os
valores de dL e dU.
4. Seguem as regras de deciso dadas pela figura abaixo:

* Teste Durbin Watson


qui regress y x2-x6
estat dwatson
dwstat

* No caso de varivel dependente defasada no modelo


* Exemplo: regress y L.y x2-x6
* pode-se usar o teste durbin alternativo
* vide - help estat durbinalt -

6.3 Teste de Breush-Godfrey

16
um teste geral, no sentido de que permite a existncia de (1) regressores no
estocsticos, como o valor defasado do regressando; (2) esquemas auto-regressivos de
ordem mais elevada, como AR(1), AR(2), etc.; (3) mdias mveis simples ou de ordens
mais elevada de termos de rudo branco, como t.
O teste BG, tambm conhecido como teste LM, feito como a seguir.
Empregaremos o modelo de regresso com duas variveis para ilustrar, mas pode-se

 = 7 + 7  + 
aplicar a modelos com muito mais regressores. Seja:

Suponha que o termo de erro t siga um esquema auto-regressivo de ordem p,

 = b ` + b ` + + bk `k + l


AR(p), como o seguinte:

onde l um termo de rudo branco. Como se v, uma simples extenso do esquema


AR(1).

m0: b1 = b2 = = bG = 0
A hiptese nula a ser testada :

Isto , no h autocorrelao serial de qualquer ordem. O teste BG envolve as


seguintes etapas:

2. Faa a regresso de  contra o Xt original (se houver mais de uma varivel X no


1. Estime a regresso principal por MQO.

modelo, elas tambm sero includas) e ` , ` , , `k , onde estes ltimos so os
valores defasados dos resduos estimados na etapa 1. Assim, se p =4, incluiremos os
quatro valores defasados dos resduos como mais um regressor do modelo. Em resumo,

 =  +   + bF ` + bF ` + + bFk `k + l


calculamos a seguinte regresso:

E obtemos seu R2.


3. Compare (n-p).R2 ao qui-quadrado crtico com p graus de liberdade. Se qui-quadrado
calculado > qui-quadrado crtico, rejeita-se H0, e neste caso, pelo menos um r
estatisticamente diferente de zero.
* Teste Breusch-Godfrey (BG)
qui regress y x2-x6
estat bgodfrey, lags(1) small
estat bgodfrey, lags(2) small

* Correo da autocorrelao com erros-padro robustos por Newey-West


newey y x2-x6, lag(2)

* Inserindo termos AR's


arima y x2-x6, ar(1/2)

* Para defasar uma srie:


gen (nome da varivel defasada) = l1.(nome da varivel)
Exemplo: gen X2def = l1.X2

* Para diferenciar uma srie:


gen (nome da varivel em primeira diferena) = d1.(nome da varivel), noconst
Exemplo: gen X2dif = d1.X2

* Lembrar: lag defasagem; Yt-1


Diferena Y= Yt Yt-1

17
7 MODELOS DE REGRESSO COM DADOS EM PAINEL

Nos dados em painel, a mesma unidade de corte transversal (uma famlia, uma
empresa, um estado) acompanhado ao longo do tempo. Em sntese, os dados em
painel tm uma dimenso espacial e outra temporal.
Os dados em painel tambm so chamados de dados combinados (combinao
de sries temporais e observaes em corte transversal), combinao de sries temporais
e de dados de corte transversal, dados em micropainel, dados longitudinais (um estudo
ao longo do tempo de uma varivel ou de um grupo de temas), anlise histrica de
eventos (como o estudo da trajetria de carreira dos formados em 1965 em uma dada
faculdade de administrao). Embora sejam variaes sutis, todos estes nomes conotam
essencialmente o movimento no tempo de unidades de corte transversal. Portanto,
empregaremos a expresso dados em painel em um sentido genrico, incluindo um ou
mais destes termos. E chamaremos os modelos de regresso embasados nesses dados de
modelos de regresso com dados em painel.

7.1 Vantagens da utilizao de dados em painel

Balgati lista as seguintes vantagens dos dados em painel em relao aos dados de
corte transversal ou s sries temporais:
1. Como os dados em painel se relacionam a indivduos, empresas, estados, pases, etc.,
tende a haver muita heterogeneidade nessas unidades. As tcnicas de estimao em
painel podem levar em conta explicitamente essas variveis individuais especficas (a
heterogeneidade das unidades de corte transversal).
2. Ao combinar sries temporais com dados de corte transversal, os dados em painel
proporcionam dados mais informativos, mais variabilidade e menos colinearidade entre
as variveis, mais graus de liberdade (pois se aumenta o tamanho da amostra) e mais
eficincia.
3. Ao estudar repetidamente um corte transversal de observaes, os dados em painel
so mais adequados ao estudo da dinmica da mudana. Perodos de desemprego,
rotatividade no emprego e mobilidade da mo de obra so melhor estudados em dados
em painel.
4. Os dados em painel podem detectar e medir efeitos melhor do que quando a
observao feita por meio de corte transversal puro ou srie temporal pura. Por
exemplo, os efeitos das leis de salrio mnimo sobre o emprego e os salrios podem ser
melhor estudados se incluirmos sucessivas rodadas de aumento do salrio mnimo
federal e/ou estadual.
5. Os dados em painel nos permitem estudar modelos comportamentais mais
complexos. Por exemplo, fenmenos como as economias de escala e a mudana
tecnolgica podem ser mais bem tratados por dados em painel do que por dados de corte
transversal puro ou de sries temporais puras.
6. Ao tornar disponveis dados referentes a vrios milhares de unidades, podemos
minimizar o vis que decorreria da agregao de pessoas ou empresas em grandes
conjuntos.

A tcnica de dados em painel ou de dados longitudinais consiste num conjunto


de dados combinados em dimenses tanto de srie temporal como de corte transversal.
Os modelos de painel permitem explorar, simultaneamente, variaes das variveis ao
longo do tempo e entre diferentes unidades ou grupos. Segundo Xavier (2007), a
disposio dos dados em painel permite o uso de um nmero mais elevado de

18
observaes, o que contribui para maior variabilidade dos dados, menor colinearidade
entre as variveis, elevao do nmero de graus de liberdade, maior eficincia do
modelo estimado e mais apropriado para o estudo de mudanas dinmicas. Alm
disso, Nonnemberg e Mendona (2005) expem que a vantagem do emprego de dados
em painel que esse mtodo permite levar em considerao as caractersticas
idiossincrticas (heterogeneidade) existentes entre as unidades estudadas.

7.2 Dados em Painel: um exemplo numrico

Os dados da Tabela 16.1 foram extrados de um famoso estudo de teoria do


investimento proposto por Y. Grunfeld, The Determinants of Corporate Investment,
Tese de Ph.D., Chicago, 1958.
Grunfeld estava interessado em verificar como o investimento real bruto (Y)
depende do valor real da empresa (X2) e do estoque real de capital (X3). Embora o
estudo original inclusse vrias empresas, para fins ilustrativos s veremos os dados de
quatro delas: General Eletric (GE), General Motors (GM), US Steel (US) e
Westinghouse. Na Tabela 16.1, apresentamos, para cada uma dessas empresas, os dados
relativos a cada uma das trs variveis durante o perodo de 1935-1954. Portanto,
temos quatro unidades de cross-section e 20 perodos temporais. Ao todo so,
assim, 80 observaes. A priori, espera-se que Y esteja positivamente relacionado a X2
e X3.

Tabela 16.1 Investimentos de quatro empresas, 1935-1954


Perodo Empresa Y X2 X3
1935 GE 33.10000 1170.600 97.80000
1936 GE 45.00000 2015.800 104.4000
1937 GE 77.20000 2803.300 118.0000
1938 GE 44.60000 2039.700 156.2000
1939 GE 48.10000 2256.200 172.6000
1940 GE 74.40000 2132.200 186.6000
1941 GE 113.0000 1834.100 220.9000
1942 GE 91.90000 1588.000 287.8000
1943 GE 61.30000 1749.400 319.9000
1944 GE 56.80000 1687.200 321.3000
1945 GE 93.60000 2007.700 319.6000
1946 GE 159.9000 2208.300 346.0000
1947 GE 147.2000 1656.700 456.4000
1948 GE 146.3000 1604.400 543.4000
1949 GE 98.30000 1431.800 618.3000
1950 GE 93.50000 1610.500 647.4000
1951 GE 135.2000 1819.400 671.3000
1952 GE 157.3000 2079.700 726.1000
1953 GE 179.5000 2371.600 800.3000
1954 GE 189.6000 2759.900 888.9000
1935 GM 317.6000 3078.500 2.800000
1936 GM 391.8000 4661.700 52.60000
1937 GM 410.6000 5387.100 156.9000
1938 GM 257.7000 2792.200 209.2000

19
1939 GM 330.8000 4313.200 203.4000
1940 GM 461.2000 4643.900 207.2000
1941 GM 512.0000 4551.200 255.2000
1942 GM 448.0000 3244.100 303.7000
1943 GM 499.6000 4053.700 264.1000
1944 GM 547.5000 4379.300 201.6000
1945 GM 561.2000 4840.900 265.0000
1946 GM 688.1000 4900.000 402.2000
1947 GM 568.9000 3526.500 761.5000
1948 GM 529.2000 3245.700 922.4000
1949 GM 555.1000 3700.200 1020.100
1950 GM 642.9000 3755.600 1099.000
1951 GM 755.9000 4833.000 1207.700
1952 GM 891.2000 4924.900 1430.500
1953 GM 1304.400 6241.700 1777.300
1954 GM 1486.700 5593.600 2226.300
1935 US 209.9000 1362.400 53.80000
1936 US 355.3000 1807.100 50.50000
1937 US 469.9000 2673.300 118.1000
1938 US 262.3000 1801.900 260.2000
1939 US 230.4000 1957.300 312.7000
1940 US 361.6000 2202.900 254.2000
1941 US 472.8000 2380.500 261.4000
1942 US 445.6000 2168.600 298.7000
1943 US 361.6000 1985.100 301.8000
1944 US 288.2000 1813.900 279.1000
1945 US 258.7000 1850.200 213.8000
1946 US 420.3000 2067.700 232.6000
1947 US 420.5000 1796.700 264.8000
1948 US 494.5000 1625.800 306.9000
1949 US 405.1000 1667.000 351.1000
1950 US 418.8000 1677.400 357.8000
1951 US 588.2000 2289.500 341.1000
1952 US 645.2000 2159.400 444.2000
1953 US 641.0000 2031.300 623.6000
1954 US 459.3000 2115.500 669.7000
1935 WEST 5 12.9300 0 191.500 0 1.800000
1936 WEST 6 25.9000 0 516.000 0 0.800000
1937 WEST 7 35.0500 0 729.000 0 7.400000
1938 WEST 8 22.8900 0 560.400 0 18.10000
1939 WEST 9 18.8400 0 519.900 0 23.50000
1940 WEST 0 28.5700 0 628.500 0 26.50000
1941 WEST 1 48.5100 0 537.100 0 36.20000
1942 WEST 2 43.3400 0 561.200 0 60.80000
1943 WEST 3 37.0200 0 617.200 0 84.40000
1944 WEST 4 37.8100 0 626.700 0 91.20000

20
1945 WEST 5 39.2700 0 737.200 0 92.40000
1946 WEST 6 53.4600 0 760.500 0 86.00000
1947 WEST 7 55.5600 0 581.400 0 111.1000
1948 WEST 8 49.5600 0 662.300 0 130.6000
1949 WEST 9 32.0400 0 583.800 0 141.8000
1950 WEST 0 32.2400 0 635.200 0 136.7000
1951 WEST 1 54.3800 0 732.800 0 129.7000
1952 WEST 2 71.7800 0 864.100 0 145.5000
1953 WEST 3 90.0800 0 1193.50 0 174.8000
1954 WEST 4 68.6000 0 1188.90 0 213.5000
Notas: Y = I = investimento bruto = expanso de fbricas e equipamentos mais manuteno e reparos, em
milhes de dlares deflacionados por P1
X2 = F = valor da empresa = preo das aes ordinrias e preferenciais em 31 de dezembro (ou
preo mdio de 13 de dezembro a 31 de dezembro do ano seguinte) vezes o nmero de aes ordinrias e
preferenciais em circulao mais o valor contbil das dvidas em 31 de dezembro, em milhes de dlares,
deflacionados por P2.
X3 = C = estoque de fbricas e equipamentos = soma acumulada de adies lquidas ao valor das
fbricas e equipamentos deflacionada por P1 menos a depreciao deflacionada por P3, nestas condies.
P1 = deflator implcito dos bens durveis de produo (1947 = 100)
P2 = deflator implcito do PNB (1947 = 100/
P3 = deflator das despesas de depreciao = mdia ao longo de dez anos de preos no atacado de
metais e produtos metlicos (1947 = 100)
Fonte: reproduzido de Vinod H. D. e Ullah, Aman. Recent Advances in Regression Methods. Nova York:
Marcel Dekker, 1981, p. 259-261.

O primeiro cuidado a ser tomado como montar o painel no Excel. Deve-se


ordenar os dados de acordo com a srie temporal para cada unidade de seo
cruzada. No esquecer de dar um nmero a cada unidade de seo cruzada,
porque o Stata no reconhece o nome do pas ou da empresa, por exemplo.
Em princpio, podemos rodar 20 regresses de corte transversal, uma para cada
ano, embora neste caso tivssemos de nos preocupar com os graus de liberdade, pois,
desta forma, para cada ano, temos apenas quatro observaes sobre o regressando e os
regressores. Se tambm incluirmos o intercepto, s poderemos estimar trs parmetros,
deixando apenas um grau de liberdade. Obviamente, esta regresso no teria muito
sentido.
Combinando todas as 80 observaes, podemos escrever a funo de
investimento de Grunfeld do seguinte modo

2 = 7 + 7 2 + 7  2 + 2 (16.2.1)

i = 1, 2, 3, 4
t = 1, 2, ..., 20
em que i representa a i-sima unidade de corte transversal e t o t-simo perodo de
tempo. Por conveno, denotaremos os dados de corte transversal por i e
identificaremos o tempo por t. Supomos aqui que h um mximo de N unidades de
observao de corte transversal e T perodos de tempo. Se cada unidade de corte
transversal tiver o mesmo nmero de observaes de sries temporais, ento um painel
como o que acabamos de descrever denominado de painel equilibrado.
No presente exemplo, temos um painel equilibrado, pois cada empresa na
amostra possui 20 observaes. Se o nmero de observaes diferir entre os
participantes do painel, teremos um painel desequilibrado.

21
Trataremos, por hora, dos painis equilibrados e assumimos, inicialmente, que

I( 2 )~q(0, 3  ).
os X so no estocsticos e que o termo de erro segue a premissa clssica, a saber,

Podemos estimar a equao (16.2.1) por trs mtodos diferentes: dados


empilhados (pooled), segundo a abordagem dos efeitos fixos e segundo a abordagem
dos efeitos aleatrios.

7.3 Estimao de modelos de regresso com dados em painel: a abordagem dos


efeitos fixos

intercepto, dos coeficientes angulares e do termo de erro, 2 . H vrias possibilidades:


A estimao de (16.2.1) depende das premissas que fazemos a respeito do

1. O intercepto e os coeficientes angulares so constantes ao longo do tempo e no


espao e o termo de erro capta as diferenas ao longo do tempo e entre indivduos.
2. Os coeficientes angulares so constantes, mas o intercepto varia entre os indivduos.
3. Os coeficientes angulares so constantes, mas o intercepto varia entre indivduos e ao
longo do tempo.
4. Todos os coeficientes (o intercepto e os coeficientes angulares) variam entre
indivduos.
5. O intercepto e os coeficientes angulares variam entre indivduos e ao longo do tempo.
Cada um destes casos vai aumentando a complexidade (e talvez o realismo) da
estimao de modelos de regresso com dados em painel, como (16.2.1). Naturalmente,
a complexidade aumentar se formos aumentando o nmero de regressores, pois
aumentar a possibilidade de colinearidade entre eles. A seguir, veremos alguns dos
principais aspectos das vrias possibilidades.

1. Todos os coeficientes so constantes ao longo do tempo e entre indivduos


(empilhamento de dados ou pooled)

A maneira mais simples desconsiderar as dimenses de tempo e espao dos


dados combinados e estimar a habitual regresso de MQO. Ou seja, empilhar as 20
observaes de cada empresa, uma em cima da outra, com o que obtemos 80
observaes para cada varivel do modelo. Neste caso, o termo de erro representa as
diferenas entre indivduos e ao longo do tempo. Os resultados desta regresso so os
seguintes:
. edit
(5 vars, 80 obs pasted into editor)
. tsset empresa periodo
panel variable: empresa (strongly balanced)
time variable: periodo, 1935 to 1954
delta: 1 unit
. reg y x2 x3

Source | SS df MS Number of obs = 80


-------------+------------------------------ F( 2, 77) = 119.63
Model | 4849457.37 2 2424728.69 Prob > F = 0.0000
Residual | 1560689.67 77 20268.697 R-squared = 0.7565
-------------+------------------------------ Adj R-squared = 0.7502
Total | 6410147.04 79 81141.1018 Root MSE = 142.37
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1100955 .0137297 8.02 0.000 .0827563 .1374348
x3 | .3033932 .0492957 6.15 0.000 .2052328 .4015535
_cons | -63.30413 29.6142 -2.14 0.036 -122.2735 -4.334734
------------------------------------------------------------------------------

22
. fitstat
Measures of Fit for regress of y
Log-Lik Intercept Only: -565.170 Log-Lik Full Model: -508.660
D(77): 1017.319 LR(2): 113.020
Prob > LR: 0.000
R2: 0.757 Adjusted R2: 0.750
AIC: 12.791 AIC*n: 1023.319
BIC: 679.903 BIC': -104.256

Se examinarmos os dados da regresso com dados empilhados e aplicarmos os


critrios convencionais, observamos que todos os coeficientes so individualmente
significativos do ponto de vista estatstico, que os coeficientes angulares tm os sinais
esperados positivos e um valor de R2 razoavelmente alto. Como esperado, Y se
relaciona de modo positivo com X2 e X3.
O nico problema que a estatstica de Durbin-Watson bastante baixa,
sugerindo que talvez haja autocorrelao nos dados. Mas j sabemos que o a estatstica
calculada de Durbin-Watson pode ser baixa devido a erros de especificao. Por
exemplo, o modelo estimado pressupe que o valor do intercepto das empresas o
mesmo para as quatro empresas. Tambm pressupe que os coeficientes angulares das
duas variveis X idntico para as quatro empresas. Portanto, apesar de sua
simplicidade, a regresso combinada (16.2.1) pode distorcer a verdadeira imagem da
relao entre Y e os X das quatro empresas. O que precisamos fazer encontrar algum
modo de levar em conta a natureza especfica das quatro empresas, como mostramos em
seguida.

2.a. Os coeficientes angulares so constantes, mas o intercepto varia entre os


indivduos: o modelo de regresso de efeitos fixos ou a varivel binria de mnimos
quadrados

Uma forma de levar em conta a individualidade de cada empresa ou cada


unidade do corte transversal fazer variar o intercepto para cada empresa,
considerando, entretanto, que os coeficientes angulares so constantes entre as
empresas. Para ver isso, escrevemos o modelo (16.2.1) como

2 = 72 + 7 2 + 7  2 + 2 (16.3.2)

Observemos que o subscrito i no termo de intercepto sugere que os interceptos


das quatro empresas podem ser diferentes; as diferenas podem ser devidas a
caractersticas especiais de cada empresa, como estilo ou filosofia gerenciais.
O modelo (16.3.2) conhecido como modelo de efeitos fixos. O termo efeitos
fixos decorre do fato de que, embora o intercepto possa diferir entre os indivduos (neste

isto , invariante no tempo. Se fssemos representar o intercepto como 72 , isso


caso, as quatro empresas), cada intercepto individual no se altera ao longo do tempo,

sugeriria que o intercepto de cada empresa ou indivduo variaria no tempo. Pode-se


verificar, ainda, que o modelo de efeitos fixos dado em (16.3.2) pressupe que os
coeficientes angulares dos regressores no variam entre indivduos nem ao longo do
tempo.
Mas como que permitimos que o intercepto (com efeito fixo) varie entre
empresas? Podemos faz-lo recorrendo tcnica das variveis binrias vista no Cap. 9,

23
especialmente as variveis binrias de intercepto diferencial. Portanto, escrevemos
(16.3.2) como

2 =  +  r2 +  r 2 + 
r
2 + 7 2 + 7  2 + 2 (16.3.3)

em que r2 = 1 se a observao pertence GM, e 0 nos demais casos; r 2 = 1 se a


observao pertence US, e 0 nos demais casos; e r
2 = 1 se pertence West, e 0 nos
demais casos.
Como so quatro empresas, s empregamos trs variveis binrias para evitar

Neste caso, no h varivel binria para a GE. Em outras palavras,  representa o


cair na armadilha das variveis binrias, isto , uma situao de perfeita colinearidade.

intercepto da GE e  ,  e 
, os coeficientes diferenciais de intercepto, nos dizem de
quanto os interceptos da GM, US e West diferem do intercepto da GE. Em resumo, a
GE se torna a empresa de referncia.
Cabe mencionar que podemos escolher qualquer uma das empresas como a
empresa de referncia e, se desejamos valores explcitos para as variveis de cada

que passa pela origem, isto , sem o intercepto comum de (16.3.3),  . Se no fizermos
empresa, podemos introduzir quatro variveis binrias desde que faamos a regresso

isso, cairemos na armadilha da varivel binria.


Como estamos empregando variveis binrias para estimar efeitos fixos, o
modelo tambm conhecido como modelo de variveis binrias de mnimos
quadrados. Assim, as denominaes efeitos fixos e variveis binrias de mnimos
quadrados podem ser usadas como sinnimos. Vale mencionar que o modelo de
variveis binrias de mnimos quadrados (16.3.3) tambm conhecido como modelo de
covarincia e X2 e X3 so conhecidos como covariantes.
Os resultados do clculo de (16.3.3) so os seguintes:
. gen D2 = 1
.replace D2 = 0 if empresa <=1
.replace D2 = 0 if empresa >= 3

. gen D3 = 1
. replace D3 =0 if empresa <=2
(40 real changes made)
. replace D3 = 0 if empresa > 3
(20 real changes made)
. gen D4 =1
. replace D4 = 0 if empresa <= 3
(60 real changes made)

. reg y x2 x3 D2 D3 D4 (16.3.4)
Source | SS df MS Number of obs = 80
-------------+------------------------------ F( 5, 74) = 211.37
Model | 5990684.14 5 1198136.83 Prob > F = 0.0000
Residual | 419462.898 74 5668.41754 R-squared = 0.9346
-------------+------------------------------ Adj R-squared = 0.9301
Total | 6410147.04 79 81141.1018 Root MSE = 75.289
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1079481 .0175089 6.17 0.000 .0730608 .1428354
x3 | .3461617 .0266645 12.98 0.000 .2930315 .3992918
D2 | 161.5722 46.45639 3.48 0.001 69.00583 254.1386
D3 | 339.6328 23.98633 14.16 0.000 291.839 387.4266
D4 | 186.5665 31.50681 5.92 0.000 123.7879 249.3452
_cons | -245.7924 35.81112 -6.86 0.000 -317.1476 -174.4371
------------------------------------------------------------------------------

24
Os resultados da regresso (16.3.3) mostram que todos os coeficientes estimados
so altamente significativos do ponto de vista individual, j que os valores p dos
coeficientes t estimados so extremamente baixos. Os valores do intercepto para as
quatro empresas so estatisticamente diferentes, com os valores de -245,7924 para GE
(que o grupo de controle); -84,220 (= -245,7924+161,5722) para a GM; 93,8774 (= -
245,7924+339,6328) para a US; e -59,2258 (= -245,7924+186,5666) para a West. Essas
diferenas no intercepto podem ser devidas a caractersticas nicas de cada empresa,
como diferena no estilo gerencial ou no talento dos gestores.
Podemos estimar esta mesma regresso diretamente por efeitos fixos no Stata, da
seguinte forma:
Inicialmente, indicar varivel de seo cruzada e varivel de srie temporal:
iis [nome da varivel] utiliza-se este comando para a varivel de seo cruzada
tis [nome da varivel] utiliza-se este comando para a varivel de srie temporal
ou por meio do comando:
tsset [nome da varivel de corte transversal nome da varivel de srie temporal]
Neste caso, o efeito fixo ser rodado para a varivel de corte transversal (que
vem primeiro na ordem). Para rodar o efeito fixo para a varivel de srie temporal,
deve-se colocar em primeiro lugar a varivel de srie temporal, ao setar o painel.
. iis empresa

. tis period
. xtreg y x2 x3, fe
Fixed-effects (within) regression Number of obs = 80
Group variable: empresa Number of groups = 4
R-sq: within = 0.8068 Obs per group: min = 20
between = 0.7304 avg = 20.0
overall = 0.7554 max = 20
F(2,74) = 154.53
corr(u_i, Xb) = -0.1001 Prob > F = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1079481 .0175089 6.17 0.000 .0730608 .1428354
x3 | .3461617 .0266645 12.98 0.000 .2930315 .3992918
_cons | -73.84946 37.52291 -1.97 0.053 -148.6155 .9165759
-------------+----------------------------------------------------------------
sigma_u | 139.05116
sigma_e | 75.288894
rho | .77329633 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(3, 74) = 67.11 Prob > F = 0.0000
. predict fecross, u
. list fecross
+-----------+ 16. | -171.9429 | 34. | -10.37068 |
| fecross | 17. | -171.9429 | 35. | -10.37068 |
|-----------| 18. | -171.9429 | |-----------|
1. | -171.9429 | 19. | -171.9429 | 36. | -10.37068 |
2. | -171.9429 | 20. | -171.9429 | 37. | -10.37068 |
3. | -171.9429 | |-----------| 38. | -10.37068 |
4. | -171.9429 | 21. | -10.37068 | 39. | -10.37068 |
5. | -171.9429 | 22. | -10.37068 | 40. | -10.37068 |
|-----------| 23. | -10.37068 | |-----------|
6. | -171.9429 | 24. | -10.37068 | 41. | 167.6899 |
7. | -171.9429 | 25. | -10.37068 | 42. | 167.6899 |
8. | -171.9429 | |-----------| 43. | 167.6899 |
9. | -171.9429 | 26. | -10.37068 | 44. | 167.6899 |
10. | -171.9429 | 27. | -10.37068 | 45. | 167.6899 |
|-----------| 28. | -10.37068 | |-----------|
11. | -171.9429 | 29. | -10.37068 | 46. | 167.6899 |
12. | -171.9429 | 30. | -10.37068 | 47. | 167.6899 |
13. | -171.9429 | |-----------| 48. | 167.6899 |
14. | -171.9429 | 31. | -10.37068 | 49. | 167.6899 |
15. | -171.9429 | 32. | -10.37068 | 50. | 167.6899 |
|-----------| 33. | -10.37068 | |-----------|

25
51. | 167.6899 | 61. | 14.62365 | 71. | 14.62365 |
52. | 167.6899 | 62. | 14.62365 | 72. | 14.62365 |
53. | 167.6899 | 63. | 14.62365 | 73. | 14.62365 |
54. | 167.6899 | 64. | 14.62365 | 74. | 14.62365 |
55. | 167.6899 | 65. | 14.62365 | 75. | 14.62365 |
|-----------| |-----------| |-----------|
56. | 167.6899 | 66. | 14.62365 | 76. | 14.62365 |
57. | 167.6899 | 67. | 14.62365 | 77. | 14.62365 |
58. | 167.6899 | 68. | 14.62365 | 78. | 14.62365 |
59. | 167.6899 | 69. | 14.62365 | 79. | 14.62365 |
60. | 167.6899 | 70. | 14.62365 | 80. | 14.62365 |
|-----------| |-----------| +-----------+

Verifica-se, portanto, que criar trs dummies para ver qual o intercepto de cada
empresa o mesmo que regredir por efeitos fixos e somar o valor da constante gerada
(-73,84946, neste caso) ao valor do termo de erro gerado para cada empresa e que, na
verdade, pertence ao intercepto. Ou seja, para a empresa GE, temos o intercepto de -
73,84946 -171,9429 = -245,7923; para a empresa GM, temos o intercepto de -73,84946
-10,37068 = -84,22014; para a empresa US, o intercepto -73,84946 +167,6899 =
93,8404; e, finalmente, para a empresa West, o intercepto -73,84946 +14,62365 = -
59,22581. Estes resultados mostram que a empresa US a mais agressiva em relao s
demais no que se refere ao investimento bruto que independe de outras variveis.

2.b. Os coeficientes angulares so constantes, mas o intercepto varia ao longo do


tempo: o modelo de regresso de efeitos fixos ou a varivel binria de mnimos
quadrados

Assim como empregamos as variveis binrias para dar conta do efeito


individual (da empresa), podemos levar em considerao o efeito do tempo, no sentido
de que a funo de investimento de Grunfeld se desloca ao longo do tempo por causa de
fatores como mudanas tecnolgicas, alteraes nas normas e/ou polticas fiscais e
efeitos externos decorrentes de guerras e outros conflitos. Esses efeitos temporais
podem ser facilmente levados em conta se introduzirmos variveis binrias de tempo,
uma para cada ano. J que temos os dados para os 20 anos, que vo de 1935 a 1954,
podemos introduzir 19 variveis binrias temporais (pois se incluirmos as 20 variveis
binrias, devemos fazer a regresso sem constante para no cair na armadilha das
variveis binrias, gerando multicolinearidade perfeita) e reescrever o modelo (16.3.3)
como

2 = = + = r J + = r K + + =s rJ + 7 2 + 7  2 + 2 (16.3.6)

em que r J assume o valor 1 para a observao relativa ao ano de 1935 e 0 para os

valor do intercepto dado por = .


demais anos e assim por diante. Estamos tratando o ano de 1954 como o ano base, cujo

Os resultados da regresso embasada em (16.3.6) so:


. gen D35 = 1
. replace D35 = 0 if periodo >= 1936
(76 real changes made)
e, assim, sucessivamente at 1953.
. reg y D35 D36 D37 D38 D39 D40 D41 D42 D43 D44 D45 D46 D47 D48 D49 D50 D51 D52 D53 x2
x3
Source | SS df MS Number of obs = 80
-------------+------------------------------ F( 21, 58) = 9.27
Model | 4938658.06 21 235174.193 Prob > F = 0.0000
Residual | 1471488.98 58 25370.4997 R-squared = 0.7704
-------------+------------------------------ Adj R-squared = 0.6873
Total | 6410147.04 79 81141.1018 Root MSE = 159.28
------------------------------------------------------------------------------

26
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
D35 | 21.02495 129.7675 0.16 0.872 -238.7329 280.7828
D36 | -14.03424 133.1953 -0.11 0.916 -280.6535 252.5851
D37 | -58.41449 135.1823 -0.43 0.667 -329.0113 212.1823
D38 | -48.66584 126.5326 -0.38 0.702 -301.9483 204.6167
D39 | -96.80262 128.0009 -0.76 0.453 -353.0243 159.4191
D40 | -36.10807 129.116 -0.28 0.781 -294.5618 222.3457
D41 | 21.16647 127.7266 0.17 0.869 -234.5062 276.8391
D42 | 30.29937 124.1757 0.24 0.808 -218.2653 278.864
D43 | -12.76907 124.8506 -0.10 0.919 -262.6847 237.1466
D44 | -17.82782 125.6498 -0.14 0.888 -269.3431 233.6875
D45 | -38.96994 126.769 -0.31 0.760 -292.7257 214.7858
D46 | 26.90836 125.7493 0.21 0.831 -224.8062 278.623
D47 | 27.81252 119.3515 0.23 0.817 -211.0954 266.7204
D48 | 26.05879 117.3271 0.22 0.825 -208.7969 260.9145
D49 | -28.65514 116.2965 -0.25 0.806 -261.4479 204.1376
D50 | -20.3938 115.8973 -0.18 0.861 -252.3874 211.5998
D51 | .9819593 116.2576 0.01 0.993 -231.733 233.6969
D52 | 21.96068 114.6821 0.19 0.849 -207.6005 251.5219
D53 | 39.43192 113.441 0.35 0.729 -187.6448 266.5087
x2 | .1159174 .01817 6.38 0.000 .0795462 .1522886
x3 | .2696593 .0833411 3.24 0.002 .1028339 .4364847
_cons | -56.33982 99.75287 -0.56 0.574 -256.0169 143.3373
------------------------------------------------------------------------------

Verifica-se que nenhuma das variveis binrias de tempo foi estatisticamente


significativa individualmente. O valor de R2 de (16.3.6) foi de 0,7704, enquanto o de
(16.3.1) foi de 0,7565, um aumento de apenas 0,0139. Com base no teste F restrito,
verifica-se que esse incremento no estatisticamente significativo, o que sugere que o
efeito tempo no significativo. Isso pode sugerir que a funo investimento no muda
muito ao longo do tempo.
Teste F restrito
H0: modelo restrito (16.3.1)
H1: modelo irrestrito (16.3.6)
No caso de variveis dependentes diferentes nos dois modelos, utilizamos a

(>?t >?ut )/( 1)


estatstica de teste
#=
>?ut /(X  )

em que >?t = soma de quadrados dos resduos do modelo restrito


>?ut = soma de quadrados do modelo irrestrito
n o nmero de unidades de corte transversal
t o nmero de perodos de tempo
k representa o nmero de variveis explicativas, excluindo a constante.
Se Fcalc > Fcrit, rejeita-se H0.

No caso em que a varivel dependente dos modelos restrito e irrestrito seja a


mesma, o teste F pode tomar a seguinte forma, j que, neste caso, podemos comparar o

(ut t )/_


coeficiente de determinao dos dois modelos

#=
(1 ut

)/( )

Cabe observar que ut 


> t , pois o coeficiente de determinao nunca diminui quando
se acrescentam variveis e, conseqentemente, >?t >?ut .
Neste caso das quatro empresas norte-americanas, em que a varivel dependente

(ut t )/_ (0,7704 0,7565)/3 0,0139/3 0,0046333


a mesma, temos que

#= = = =
(1 ut )/( ) (1 0,7704)/(80 6) 0,2296/74 0,0031027


= 1,4933

27
# ,|
;J% = 2,76
Como Fcalc < Fcrit, no rejeita-se H0. Portanto, o modelo restrito o verdadeiro
modelo e o modelo irrestrito no adequado, sugerindo que o efeito tempo no
significativo sobre os investimentos das empresas consideradas na amostra.
Ainda, podemos fazer a regresso diretamente no Stata, modificando a ordem
das variveis de corte transversal e de srie temporal, para que o Stata reconhea que ele
deve calcular o efeito fixo na varivel de tempo. Assim, deve-se setar iss para a varivel
de tempo e tis para a varivel cross-section. Abaixo, seguem os resultados.
. iis periodo
. tis empresa

. xtreg y x2 x3, fe
Fixed-effects (within) regression Number of obs = 80
Group variable: periodo Number of groups = 20
R-sq: within = 0.7273 Obs per group: min = 4
between = 0.9080 avg = 4.0
overall = 0.7552 max = 4
F(2,58) = 77.36
corr(u_i, Xb) = 0.0966 Prob > F = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1159174 .01817 6.38 0.000 .0795462 .1522886
x3 | .2696593 .0833411 3.24 0.002 .1028339 .4364847
_cons | -64.18962 34.16507 -1.88 0.065 -132.5784 4.199206
-------------+----------------------------------------------------------------
sigma_u | 36.040313
sigma_e | 159.2812
rho | .04870391 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(19, 58) = 0.19 Prob > F = 0.9999
. predict fetime, u
(4 missing values generated)
. list fetime

+-----------+ 26. | -28.25827 | 54. | 33.90859 |


| fetime | 27. | 29.01627 | 55. | -20.80534 |
|-----------| 28. | 38.14917 | |-----------|
1. | 28.87476 | 29. | -4.919267 | 56. | -12.544 |
2. | -6.184439 | 30. | -9.978021 | 57. | 8.831759 |
3. | -50.56469 | |-----------| 58. | 29.81048 |
4. | -40.81604 | 31. | -31.12014 | 59. | 47.28172 |
5. | -88.95282 | 32. | 34.75816 | 60. | 7.849801 |
|-----------| 33. | 35.66232 | |-----------|
6. | -28.25827 | 34. | 33.90859 | 61. | 28.87476 |
7. | 29.01627 | 35. | -20.80534 | 62. | -6.184439 |
8. | 38.14917 | |-----------| 63. | -50.56469 |
9. | -4.919267 | 36. | -12.544 | 64. | -40.81604 |
10. | -9.978021 | 37. | 8.831759 | 65. | -88.95282 |
|-----------| 38. | 29.81048 | |-----------|
11. | -31.12014 | 39. | 47.28172 | 66. | -28.25827 |
12. | 34.75816 | 40. | 7.849801 | 67. | 29.01627 |
13. | 35.66232 | |-----------| 68. | 38.14917 |
14. | 33.90859 | 41. | 28.87476 | 69. | -4.919267 |
15. | -20.80534 | 42. | -6.184439 | 70. | -9.978021 |
|-----------| 43. | -50.56469 | |-----------|
16. | -12.544 | 44. | -40.81604 | 71. | -31.12014 |
17. | 8.831759 | 45. | -88.95282 | 72. | 34.75816 |
18. | 29.81048 | |-----------| 73. | 35.66232 |
19. | 47.28172 | 46. | -28.25827 | 74. | 33.90859 |
20. | 7.849801 | 47. | 29.01627 | 75. | -20.80534 |
|-----------| 48. | 38.14917 | |-----------|
21. | 28.87476 | 49. | -4.919267 | 76. | -12.544 |
22. | -6.184439 | 50. | -9.978021 | 77. | 8.831759 |
23. | -50.56469 | |-----------| 78. | 29.81048 |
24. | -40.81604 | 51. | -31.12014 | 79. | 47.28172 |
25. | -88.95282 | 52. | 34.75816 | 80. | 7.849801 |
|-----------| 53. | 35.66232 | |-----------|

28
Assim, para calcularmos o intercepto para cada ano, podemos proceder de duas
formas: 1. se criamos as 19 dummies, somamos a constante a cada um dos coeficientes
da dummy de cada ano, ou seja, para 1935, temos -56,33982 +21,02495 = -35,31487;
para 1936, o intercepto -56,33982 -14,03424 = 70,37406; e assim sucessivamente para
todos os anos da srie; ou, 2. a partir do modelo rodado por efeitos fixos na varivel de
tempo, somamos a constante a cada um dos fetime gerado para cada ano (os fetime so,
na verdade, o valor do coeficiente da dummy que seria gerado se rodssemos por
MQVD) . Assim, para 1935, o intercepto -64,18962 +28,87476 = -35,31486; para
1936, o intercepto -64,18962 -6,184439 = 70,374059, e assim sucessivamente para
todos os anos da srie. Observemos que tanto por meio da criao de dummies como
regredindo por efeitos fixos na varivel de tempo, os resultados so os mesmos, como
de se esperar.

3. Os coeficientes angulares so constantes, mas o intercepto varia com os


indivduos e com o tempo

Para levar esta possibilidade em considerao, combinaremos (16.3.4) e (16.3.6)


como segue

2 =  +  r2 +  r 2 + 
r
2 + = + = r J + = r K + + =s rJ +
7 2 + 7  2 + 2 (16.3.7)
. reg y D2 D3 D4 D35 D36 D37 D38 D39 D40 D41 D42 D43 D44 D45 D46 D47 D48 D49 D50 D51
D52 D53 x2 x3
Source | SS df MS Number of obs = 80
-------------+------------------------------ F( 24, 55) = 42.58
Model | 6082748.11 24 253447.838 Prob > F = 0.0000
Residual | 327398.928 55 5952.70778 R-squared = 0.9489
-------------+------------------------------ Adj R-squared = 0.9266
Total | 6410147.04 79 81141.1018 Root MSE = 77.154
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
D2 | 105.2457 67.68668 1.55 0.126 -30.40141 240.8929
D3 | 341.1008 24.8116 13.75 0.000 291.3773 390.8244
D4 | 220.324 41.16781 5.35 0.000 137.8219 302.8262
D35 | 134.3636 72.00957 1.87 0.067 -9.946798 278.674
D36 | 87.3297 66.46131 1.31 0.194 -45.86174 220.5211
D37 | 29.58592 66.10801 0.45 0.656 -102.8975 162.0693
D38 | 48.12215 66.82507 0.72 0.474 -85.79829 182.0426
D39 | -7.886558 63.9173 -0.12 0.902 -135.9797 120.2066
D40 | 51.85022 63.78342 0.81 0.420 -75.9746 179.6751
D41 | 107.7241 63.45228 1.70 0.095 -19.43706 234.8854
D42 | 118.3592 64.92635 1.82 0.074 -11.75613 248.4745
D43 | 71.99879 63.47345 1.13 0.262 -55.20486 199.2024
D44 | 68.47821 63.65855 1.08 0.287 -59.09638 196.0528
D45 | 44.28525 62.83216 0.70 0.484 -81.63321 170.2037
D46 | 104.1942 61.82815 1.69 0.098 -19.71216 228.1006
D47 | 100.1916 62.87224 1.59 0.117 -25.80715 226.1904
D48 | 92.30316 63.16828 1.46 0.150 -34.2889 218.8952
D49 | 31.20783 62.10854 0.50 0.617 -93.26046 155.6761
D50 | 35.80472 61.1856 0.59 0.561 -86.81396 158.4234
D51 | 47.8422 57.53413 0.83 0.409 -67.45878 163.1432
D52 | 57.96435 56.39349 1.03 0.309 -55.05073 170.9794
D53 | 54.01372 54.99911 0.98 0.330 -56.20695 164.2344
x2 | .129307 .0274237 4.72 0.000 .0743487 .1842653
x3 | .3672492 .0416591 8.82 0.000 .2837625 .450736
_cons | -359.5819 82.63602 -4.35 0.000 -525.1882 -193.9756
------------------------------------------------------------------------------

Os resultados apontam que as variveis binrias tanto das empresas quanto dos
coeficientes de X so estatisticamente significativas, mas nenhuma das variveis
binrias de tempo significativa em termos estatsticos. Como nenhuma das variveis
binrias de tempo estatisticamente significativa, estamos de volta ao modelo (16.3.4).

29
Caso isso, a concluso que emerge que talvez haja um pronunciado efeito individual
de empresa, mas no haja efeito de tempo. Em outras palavras, a funo de investimento
das quatro empresas so as mesmas, exceto no intercepto. Em todos os casos
considerados, as variveis X exercem um forte impacto sobre Y.

4. Todos os coeficientes (tanto intercepto como inclinaes) variam entre


indivduos

Agora vamos supor que tanto os interceptos quanto os coeficientes angulares so


diferentes para todas as unidades de corte transversal, ou seja, as funes de
investimento da GE, GM, US e West so todas diferentes.
Podemos estender facilmente nosso modelo de variveis binrias de mnimos
quadrados para dar conta da situao. Reconsidere (16.3.4), onde inclumos as variveis
binrias individuais de forma aditiva. J sabemos que as variveis binrias de
coeficientes angulares interativos ou diferenciais podem dar conta de diferenas nos
coeficientes angulares. Para isso, no contexto da funo de investimentos de Grunfeld, o
que temos a fazer multiplicar cada uma das variveis binrias de empresa por cada
uma das variveis X (somando, assim, mais seis variveis a (16.3.4)). Isto , estimamos
o seguinte modelo

2 =  +  r2 +  r 2 + 
r
2 + 7 2 + 7  2 +  (r2 2 ) +  (r2  2 ) +
 (r 2 2 ) + 
(r 2  2 ) + J (r
2 2 ) + K (r
2  2 ) + 2 (16.3.8)

Observemos que os  so os coeficientes angulares diferenciais, do mesmo


modo que os  so os interceptos diferenciais. Se um ou mais dos coeficientes  forem
estatisticamente significativos, isso nos dir que um ou mais coeficientes angulares so
diferentes daqueles do grupo base. Por exemplo, digamos que 2 e 1 so
estatisticamente significativos. Nesse caso, (2+1) dar o coeficiente angular de X2 para
a General Motors, sugerindo que o coeficiente angular de X2 da GM diferente daquele
da General Eletric, que a empresa que nos serve como referncia.
Se todos os interceptos diferenciais e todos os coeficientes angulares diferenciais
forem estatisticamente significativos, podemos concluir que as funes de investimento
da General Motors, da United States Steel e da Westinghouse so diferentes daquela da
General Eletric. Se este for de fato o caso, pode haver pouco sentido em estimar a
regresso combinada (16.3.1).
Examinemos agora os resultados da regresso embasada em (16.3.8),
apresentados abaixo.
. gen D2X2 = D2* x2
. gen D3X2 = D3* x2

. gen D4X2 = D4* x2


. gen D2x3 = D2*x3
. gen D3x3 = D3*x3

. gen D4x3 = D4*x3


. reg y D2 D3 D4 x2 x3 D2X2 D2x3 D3X2 D3x3 D4X2 D4x3
Source | SS df MS Number of obs = 80
-------------+------------------------------ F( 11, 68) = 120.38
Model | 6097055.58 11 554277.78 Prob > F = 0.0000
Residual | 313091.46 68 4604.28617 R-squared = 0.9512
-------------+------------------------------ Adj R-squared = 0.9433
Total | 6410147.04 79 81141.1018 Root MSE = 67.855

30
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
D2 | -139.5103 109.2808 -1.28 0.206 -357.5768 78.55615
D3 | -40.12173 129.2343 -0.31 0.757 -298.0047 217.7613
D4 | 9.375908 93.11719 0.10 0.920 -176.4365 195.1884
x2 | .0265512 .0378814 0.70 0.486 -.0490399 .1021423
x3 | .1516939 .062553 2.43 0.018 .0268713 .2765164
D2X2 | .0926585 .0424167 2.18 0.032 .0080173 .1772996
D2x3 | .2198306 .0682914 3.22 0.002 .0835573 .356104
D3X2 | .1448793 .0646504 2.24 0.028 .0158714 .2738871
D3x3 | .2570148 .1204774 2.13 0.037 .0166058 .4974238
D4X2 | .0265042 .1111402 0.24 0.812 -.1952726 .2482809
D4x3 | -.0600001 .3785974 -0.16 0.875 -.8154795 .6954793
_cons | -9.956308 76.3518 -0.13 0.897 -162.314 142.4013
------------------------------------------------------------------------------

Como a tabela acima mostra, Y se relaciona significativamente com X2 e X3.


Contudo, vrios dos coeficientes angulares diferenciais so estatisticamente
significativos. Por exemplo, o coeficiente angular de X2 0,0265512 para a GE, mas
0,1192097 = (0,0265512+0,0926585) para a GM. interessante observar que nenhum
dos interceptos diferenciais () estatisticamente significativo.
Diante disso, parece que a funo de investimento de cada uma das quatro
empresas no so combinveis e, nesse caso, melhor estimar uma funo de
investimento para cada empresa separadamente. Isso nos lembra que os modelos de
regresso com dados em painel podem no ser adequados para qualquer situao, apesar
da disponibilidade de sries temporais e de dados de corte transversal.
Devemos atentar que como todos os coeficientes variam, pode haver quebra
estrutural, que deve ser testada pelo teste de Chow.
H0: modelo restrito (a estimao individual para cada unidade de cross-section)
modelo (16.2.1)
H1: modelo irrestrito modelo (16.3.8)
Ou seja, o teste de Chow nos indica se melhor utilizar cada estimao
individual para cada empresa ou o modelo de painel por efeitos fixos. Ainda, este teste
pode ser utilizado para comparar o pooled com o modelo em painel de efeitos fixos.
Apresentaremos a estatstica de teste mais adiante.

CUIDADOS COM EFEITOS FIXOS

1. Se introduzirmos demasiadas variveis binrias, como no caso do modelo


(16.3.7), nos depararemos com a falta de graus de liberdade. No caso de (16.3.7), temos
80 observaes, mas apenas 55 graus de liberdade so 3 graus de liberdade perdidos
para as trs variveis binrias de empresa (cross-section), 19 graus de liberdade
perdidos para as 19 variveis binrias de ano, 2 para os dois coeficientes angulares e 1
para o intercepto comum.
2. Com tantas variveis no modelo, sempre h possibilidade de
multicolinearidade, que pode dificultar uma estimao exata de um ou mais parmetros.
3. Imagine que, por exemplo, incluamos no modelo de efeitos fixos (16.3.1)
variveis como sexo, cor, etnia, distncia, etc., que no variam com o tempo. Em
conseqncia, a abordagem do modelo de variveis binrias de mnimos quadrados
pode no conseguir identificar o impacto dessas variveis que no mudam ao longo do

4. preciso atentar para o termo de erro 2 . Todos os resultados apresentados


tempo.

clssica de que 2 ~q(0, 3  ).


at agora se embasam na premissa de que o termo de erro segue a pressuposio

31
7.4 Estimao de modelos de regresso com dados em painel: a abordagem dos
efeitos aleatrios

O modelo de correo de erros ou modelo de efeitos aleatrios baseia-se em

2 = 72 + 7 2 + 7  2 + 2 (16.4.1)

Em lugar de tratar 72 como fixo, supomos que uma varivel aleatria com
valor mdio 7 (sem o subscrito i). E o valor do intercepto para uma empresa individual

72 = 7 + l2
representado por
i = 1, 2, ..., N (16.4.2)

em que l2 um termo de erro aleatrio com mdia zero e varincia 3~ .


Essencialmente, isso significa que as quatro empresas includas em nossa

valor mdio comum para o intercepto (= 7) e que as diferenas individuais no


amostra foram tiradas de um universo de empresas muito maior, e que elas tem um

intercepto de cada empresa se reflete no termo de erro, l2 .


Substituindo (16.4.1) por (16.4.2), obtemos:

2 = 72 + 7 2 + 7  2 + l2 + 2


2 = 72 + 7 2 + 7  2 + 2 (16.4.3)

2 = l2 + 2
em que
(16.4.4)

O termo de erro composto 2 consiste de dois elementos: l2 , que o elemento


do corte transversal ou especfico dos indivduos e 2 , que o elemento combinado da

nome do fato de que o termo de erro composto, 2 , formado por dois ou mais
srie temporal e do corte transversal. A expresso modelo de correo dos erros tira seu

elementos de erro.

l2 ~q(0, 3~ )
As pressuposies habituais do modelo de correo dos erros so:

2 ~q(0, 3d )

I(l2 2 ) = 0 I(l2 l2 ) = 0 ij

I( 2 2 ) = I 2 ' = I 2 ' = 0
(16.4.5)
i j; t s

isto , os componentes de erro individuais no esto correlacionados entre si nem esto


correlacionados entre as unidades de corte transversal e as unidades de srie temporal.
Observemos atentamente a diferena entre o modelo de efeitos fixos e o
modelo de efeitos aleatrios. No modelo de efeitos fixos, cada unidade de corte
transversal tem seu prprio valor (fixo) de intercepto, em todos esses N valores para N
unidades de corte transversal. No modelo de efeitos aleatrios, por outro lado, o

elemento de erro l2 representa o desvio aleatrio do intercepto individual de seu valor


intercepto 1 representa o valor mdio de todos os interceptos (de corte transversal) e o

mdio. Contudo, cabe observar que l2 no diretamente observvel; o que se conhece


por uma varivel no observvel ou latente.

I(2 ) = 0
Em conseqncia das premissas expostas em (16.4.5), segue-se que:
(16.4.6)
32
8O!(2 ) = 3~ + 3d (16.4.7)

Agora, se 3~ = 0, no h diferena entre os modelos (16.2.1) e (16.4.3) e, nesse


caso, podemos simplesmente combinar todas as observaes (de corte transversal e de

Como (16.4.7) mostra, o termo de erro 2 homocedstico. Contudo, pode-se


sries temporais) e estimar a regresso combinada, como fizemos em (16.3.1).

demonstrar que 2 e 2 (t s) so correlacionados, isto , os termos de erro de uma

tempo. O coeficiente de correlao, Y!! (2 2 ) o seguinte:


dada unidade de corte transversal esto correlacionados em dois pontos diferentes do

RT
Y!! (2 2 ) = RT R

T (16.4.8)

Observemos duas caractersticas especiais do coeficiente de correlao em


(16.4.8): 1. Para qualquer unidade de corte transversal dada, o valor da correlao entre
dois termos de erro em perodos diferentes se mantm inalterado por mais distantes que
estejam esses perodos, como fica claro em (16.4.8). Isso contrasta notavelmente com o
esquema de primeira ordem [AR(1)], onde verificamos que a correlao diminui ao
longo do tempo; 2. A estrutura de correlao dada em (16.4.8) permanece a mesma para
todas as unidades de corte transversal, isto , idntica para todos os indivduos.
Se no levarmos essa estrutura de correlao em conta e estimarmos (16.4.3) por
MQO, os estimadores resultantes sero ineficientes. O mtodo mais adequado, neste
caso, o mtodo dos mnimos quadrados generalizados (MQG).
Os resultados da estimao da funo de investimento de Grunfeld por meio do
modelo de efeitos aleatrios so apresentados a seguir. Vrios aspectos desta estimao
merecem destaque: 1. Se somarmos os valores dos efeitos aleatrios dados para as

mdio do componente de erro aleatrio, l2 , o valor do intercepto comum, -73,0353. O


quatro empresas, veremos que o resultado , como deveria ser, igual a zero. 2. O valor

valor do efeito aleatrio da GE, -169,9282, nos diz quanto o componente de erro
aleatrio da GE difere do valor do intercepto comum. A mesma interpretao se aplica
aos outros trs valores dos efeitos aleatrios. 3. O valor de R2 obtido a partir da
regresso de mnimos quadrados generalizados transformada.
. iis empresa
. tis periodo
. xtreg y x2 x3, re
Random-effects GLS regression Number of obs = 80
Group variable: empresa Number of groups = 4
R-sq: within = 0.8068 Obs per group: min = 20
between = 0.7303 avg = 20.0
overall = 0.7554 max = 20
Random effects u_i ~ Gaussian Wald chi2(2) = 317.79
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1076555 .0168169 6.40 0.000 .0746949 .140616
x3 | .3457104 .0265451 13.02 0.000 .2936829 .3977378
_cons | -73.03529 83.94957 -0.87 0.384 -237.5734 91.50284
-------------+----------------------------------------------------------------
sigma_u | 152.15823
sigma_e | 75.288894
rho | .80332024 (fraction of variance due to u_i)
------------------------------------------------------------------------------

33
. predict recross, u
. list recross
+-----------+ 26. | -9.507805 | 54. | 165.5613 |
| recross | 27. | -9.507805 | 55. | 165.5613 |
|-----------| 28. | -9.507805 | |-----------|
1. | -169.9282 | 29. | -9.507805 | 56. | 165.5613 |
2. | -169.9282 | 30. | -9.507805 | 57. | 165.5613 |
3. | -169.9282 | |-----------| 58. | 165.5613 |
4. | -169.9282 | 31. | -9.507805 | 59. | 165.5613 |
5. | -169.9282 | 32. | -9.507805 | 60. | 165.5613 |
|-----------| 33. | -9.507805 | |-----------|
6. | -169.9282 | 34. | -9.507805 | 61. | 13.87474 |
7. | -169.9282 | 35. | -9.507805 | 62. | 13.87474 |
8. | -169.9282 | |-----------| 63. | 13.87474 |
9. | -169.9282 | 36. | -9.507805 | 64. | 13.87474 |
10. | -169.9282 | 37. | -9.507805 | 65. | 13.87474 |
|-----------| 38. | -9.507805 | |-----------|
11. | -169.9282 | 39. | -9.507805 | 66. | 13.87474 |
12. | -169.9282 | 40. | -9.507805 | 67. | 13.87474 |
13. | -169.9282 | |-----------| 68. | 13.87474 |
14. | -169.9282 | 41. | 165.5613 | 69. | 13.87474 |
15. | -169.9282 | 42. | 165.5613 | 70. | 13.87474 |
|-----------| 43. | 165.5613 | |-----------|
16. | -169.9282 | 44. | 165.5613 | 71. | 13.87474 |
17. | -169.9282 | 45. | 165.5613 | 72. | 13.87474 |
18. | -169.9282 | |-----------| 73. | 13.87474 |
19. | -169.9282 | 46. | 165.5613 | 74. | 13.87474 |
20. | -169.9282 | 47. | 165.5613 | 75. | 13.87474 |
|-----------| 48. | 165.5613 | |-----------|
21. | -9.507805 | 49. | 165.5613 | 76. | 13.87474 |
22. | -9.507805 | 50. | 165.5613 | 77. | 13.87474 |
23. | -9.507805 | |-----------| 78. | 13.87474 |
24. | -9.507805 | 51. | 165.5613 | 79. | 13.87474 |
25. | -9.507805 | 52. | 165.5613 | 80. | 13.87474 |
|-----------| 53. | 165.5613 | |-----------|

Se compararmos os resultados do modelo de efeitos aleatrios com os obtidos no


modelo de efeitos fixos, observamos que, em geral, parece no haver grande diferena
entre os valores dos coeficientes das duas variveis X, exceto no caso daqueles dados no
modelo de efeitos fixos, onde se permite variar todos os coeficientes (inclusive os
angulares) entre as unidades de corte transversal.
As estimativas por efeitos aleatrios um MQG que leva em conta a varincia
do erro combinado. Ou seja, a heterocedasticidade j corrigida nas estimativas por
efeitos aleatrios.

7.5 Qual o melhor modelo: pooled, efeitos fixos ou efeitos aleatrios?

Na comparao do tipo de modelo utilizado para dados em painel, necessrio


identificar qual destes modelos o melhor, o que pode ser feito por meio dos seguintes
testes:
MODELO POOLED
TESTE DE CHOW

TESTE LM DE BREUSH-
MODELO DE EFEITOS
PAGAN
TESTE DE HAUSMAN
MODELO DE EFEITOS
7.5.1 Teste de Chow
H0: modelo restrito (pooled)
H1: modelo irrestrito (efeitos fixos)
A estatstica para o teste de Chow a seguinte:

34
(>?t >?ut )/( 1)
#=
>?ut /(X  )

em que >?t = soma de quadrados dos resduos do modelo restrito


>?ut = soma de quadrados do modelo irrestrito
nt = nmero total de observaes
k = nmero de parmetros do modelo restrito, excluindo a constante, j que foi
includo o nmero total de unidades de corte transversal (Lembrar da armadilha das
variveis binrias)
n = nmero de cross-section
Se Fcalc > Fcrit, rejeita-se H0.

1. Regrida o modelo pooled e obtenha o SQR.


. reg y x2 x3
Source | SS df MS Number of obs = 80
-------------+------------------------------ F( 2, 77) = 119.63
Model | 4849457.37 2 2424728.69 Prob > F = 0.0000
Residual | 1560689.67 77 20268.697 R-squared = 0.7565
-------------+------------------------------ Adj R-squared = 0.7502
Total | 6410147.04 79 81141.1018 Root MSE = 142.37

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1100955 .0137297 8.02 0.000 .0827563 .1374348
x3 | .3033932 .0492957 6.15 0.000 .2052328 .4015535
_cons | -63.30413 29.6142 -2.14 0.036 -122.2735 -4.334734
------------------------------------------------------------------------------
. scalar sqrpo = e(rss)
. scalar list sqrpo
sqrpo = 1560689.7

2. Regrida o modelo de efeitos fixos


. iis empresa
. tis periodo
. xtreg y x2 x3, fe
Fixed-effects (within) regression Number of obs = 80
Group variable: empresa Number of groups = 4
R-sq: within = 0.8068 Obs per group: min = 20
between = 0.7304 avg = 20.0
overall = 0.7554 max = 20
F(2,74) = 154.53
corr(u_i, Xb) = -0.1001 Prob > F = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1079481 .0175089 6.17 0.000 .0730608 .1428354
x3 | .3461617 .0266645 12.98 0.000 .2930315 .3992918
_cons | -73.84946 37.52291 -1.97 0.053 -148.6155 .9165759
-------------+----------------------------------------------------------------
sigma_u | 139.05116
sigma_e | 75.288894
rho | .77329633 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(3, 74) = 67.11 Prob > F = 0.0000
. scalar sqref = e(rss)
. scalar list sqref
sqref = 419462.9
. scalar k = 2
. scalar n = 4

35
. scalar nt = e(N)
. scalar chow = ((sqrpo-sqref)/(n-1))/(sqref/(nt-n-k))
. scalar list chow
chow = 63.48267
. scalar numerador = n-1
. scalar denominador = nt - n - k
. di 1-F(numerador, denominador, chow)
0

A estatstica calculada do teste de Chow estatisticamente significativa, com


valor p de zero, o que possibilita a rejeio da hiptese nula. Portanto, o modelo de
efeitos fixos parece ser o mais adequado, levando em considerao as idiossincrasias
das empresas. Este no um resultado surpreendente, visto que as empresas diferem
quanto ao estilo gerencial de seus administradores.

7.5.2 Teste de Hausman


H0: modelo de efeitos aleatrios
H1: modelo de efeitos fixos
. xtreg y x2 x3, fe

Fixed-effects (within) regression Number of obs = 80


Group variable: empresa Number of groups = 4

R-sq: within = 0.8068 Obs per group: min = 20


between = 0.7304 avg = 20.0
overall = 0.7554 max = 20
F(2,74) = 154.53
corr(u_i, Xb) = -0.1001 Prob > F = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1079481 .0175089 6.17 0.000 .0730608 .1428354
x3 | .3461617 .0266645 12.98 0.000 .2930315 .3992918
_cons | -73.84946 37.52291 -1.97 0.053 -148.6155 .9165759
-------------+----------------------------------------------------------------
sigma_u | 139.05116
sigma_e | 75.288894
rho | .77329633 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(3, 74) = 67.11 Prob > F = 0.0000
. estimates store fixed
. xtreg y x2 x3, re

Random-effects GLS regression Number of obs = 80


Group variable: empresa Number of groups = 4
R-sq: within = 0.8068 Obs per group: min = 20
between = 0.7303 avg = 20.0
overall = 0.7554 max = 20
Random effects u_i ~ Gaussian Wald chi2(2) = 317.79
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1076555 .0168169 6.40 0.000 .0746949 .140616
x3 | .3457104 .0265451 13.02 0.000 .2936829 .3977378
_cons | -73.03529 83.94957 -0.87 0.384 -237.5734 91.50284
-------------+----------------------------------------------------------------
sigma_u | 152.15823
sigma_e | 75.288894
rho | .80332024 (fraction of variance due to u_i)
------------------------------------------------------------------------------
. hausman fixed

36
---- Coefficients ----
| (b) (B) (b-B) sqrt(diag(V_b-V_B))
| fixed . Difference S.E.
-------------+----------------------------------------------------------------
x2 | .1079481 .1076555 .0002926 .0048738
x3 | .3461617 .3457104 .0004513 .0025204
------------------------------------------------------------------------------
b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
Test: Ho: difference in coefficients not systematic
chi2(2) = (b-B)'[(V_b-V_B)^(-1)](b-B)
= 0.07
Prob>chi2 = 0.9678

A estatstica calculada de Hausman no estatisticamente significativa. Por isso,


no se rejeita a hiptese nula de que o melhor modelo seja o modelo de efeitos
aleatrios.

7.5.3 Teste LM de Breusch-Pagan


H0: modelo pooled
H1: modelo de efeitos aleatrios
. xtreg y x2 x3, re
Random-effects GLS regression Number of obs = 80
Group variable: empresa Number of groups = 4
R-sq: within = 0.8068 Obs per group: min = 20
between = 0.7303 avg = 20.0
overall = 0.7554 max = 20
Random effects u_i ~ Gaussian Wald chi2(2) = 317.79
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1076555 .0168169 6.40 0.000 .0746949 .140616
x3 | .3457104 .0265451 13.02 0.000 .2936829 .3977378
_cons | -73.03529 83.94957 -0.87 0.384 -237.5734 91.50284
-------------+----------------------------------------------------------------
sigma_u | 152.15823
sigma_e | 75.288894
rho | .80332024 (fraction of variance due to u_i)
------------------------------------------------------------------------------
. xttest0
Breusch and Pagan Lagrangian multiplier test for random effects
y[empresa,t] = Xb + u[empresa] + e[empresa,t]
Estimated results:
| Var sd = sqrt(Var)
---------+-----------------------------
y | 81141.1 284.8528
e | 5668.418 75.28889
u | 23152.13 152.1582
Test: Var(u) = 0
chi2(1) = 379.08
Prob > chi2 = 0.0000

A estatstica calculada de Breush-Pagan estatisticamente significativa, com


valor p muito baixo. Assim, rejeita-se a hiptese nula de que o melhor modelo seja o
pooled.

7.6 Identificao e correo de autocorrelao e heterocedasticidade em painel


7.6.1 Autocorrelao
Para instalar, use o comando: findit xtserial click on st0039 click here to install
Para usar, simplesmente digite: xtserial varivel dependente e variveis independentes

37
O teste estatisticamente significativo indica presena de correlao serial.
. findit xtserial
. xtserial y x2 x3, output

Wooldridge test for autocorrelation in panel data


H0: no first-order autocorrelation
F( 1, 3) = 1300.479
Prob > F = 0.0000

O teste de autocorrelao serial de Wooldridge permite rejeitar a hiptese de que


no exista autocorrelao de primeira ordem, j que o valo p da estatstica calculada
muito baixo.

7.6.2 Teste de Wald para heterocedasticidade em grupo


um teste que aplicado somente para os modelos em painel de efeito fixo ou
modelos em painel de efeitos aleatrios, porm nosso foco ser direcionado para o
primeiro grupo. No caso dos efeitos fixos, a estimao se d por MQO sob as hipteses
clssicas de que o processo de erro independente e identicamente distribudo. Em
modelos pooled, estas premissas podem ser quebradas de diversas formas.
O processo de erro pode ser homocedstico dentro das unidades cross-section,
mas sua varincia pode ser diferente entre as unidades; isso o que se chama de
heterocedasticidade em grupo. O comando xttest3 calcula o teste de Wald modificado
para heterocedasticidade em grupo, nos resduos dos modelos em painel de efeitos

No caso deste teste, a hiptese testada a de que: 32 = 3  para i = 1, ..., Ng, em
fixos.

que Ng o nmero de unidades de corte transversal.


Inicialmente, preciso instalar o comando xttest3: findit xttest3 etc.
. xtreg y x2 x3, fe
Fixed-effects (within) regression Number of obs = 80
Group variable: empresa Number of groups = 4
R-sq: within = 0.8068 Obs per group: min = 20
between = 0.7304 avg = 20.0
overall = 0.7554 max = 20
F(2,74) = 154.53
corr(u_i, Xb) = -0.1001 Prob > F = 0.0000
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x2 | .1079481 .0175089 6.17 0.000 .0730608 .1428354
x3 | .3461617 .0266645 12.98 0.000 .2930315 .3992918
_cons | -73.84946 37.52291 -1.97 0.053 -148.6155 .9165759
-------------+----------------------------------------------------------------
sigma_u | 139.05116
sigma_e | 75.288894
rho | .77329633 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(3, 74) = 67.11 Prob > F = 0.0000
. xttest3
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (4) = 240.33
Prob>chi2 = 0.0000

O resultado do teste, altamente significativo, permite rejeitar a hiptese nula de


que as varincias so iguais para todos os grupos cross-section. Portanto, as varincias
so diferentes para cada grupo.

38
7.7 Procedimentos corretivos para autocorrelao e heterocedasticidade em painel

8 MODELOS DE ESCOLHA QUALITATIVA

8.1 Modelos de probabilidade linear: um exemplo numrico (Gujarati, 2006, p.


475)

A Tabela 15.1 apresenta dados fictcios relativos posse da casa prpria Y (1 =


possui casa prpria; 0 no possui) e renda familiar X (em milhares de dlares) para 40
famlias. Com esses dados, o modelo de probabilidade linear estimado por meio de
MQO apresentou os seguintes resultados:

Tabela 15.1 - Dados hipotticos relativos posse da casa prpria (Y=1 se a casa prpria, 0 em caso
contrrio) e renda X (em milhares de US$)
FAMILY Y X
1 0 8
2 1 16
3 1 18
4 0 11
5 0 12
6 1 19
7 1 20
8 0 13
9 0 9
10 0 10
11 1 17
12 1 18
13 0 14
14 1 20
15 0 6
16 1 19
17 1 16
18 0 10
19 0 8
20 1 18
21 1 22
22 1 16
23 0 12
24 0 11
25 1 16
26 0 11
27 1 20

39
28 1 18
29 0 11
30 0 10
31 1 17
32 0 13
33 1 21
34 1 20
35 0 11
36 0 8
37 1 17
38 1 16
39 0 7
40 1 17

. edit
(3 vars, 40 obs pasted into editor)
. reg y x
Source | SS df MS Number of obs = 40
-------------+------------------------------ F( 1, 38) = 156.63
Model | 8.0274948 1 8.0274948 Prob > F = 0.0000
Residual | 1.9475052 38 .051250137 R-squared = 0.8048
-------------+------------------------------ Adj R-squared = 0.7996
Total | 9.975 39 .255769231 Root MSE = .22638

------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x | .102131 .0081605 12.52 0.000 .085611 .118651
_cons | -.9456861 .1228415 -7.70 0.000 -1.194366 -.6970066
------------------------------------------------------------------------------

Inicialmente, vamos interpretar esta regresso.


O intercepto, -0,9457 d a probabilidade de que uma famlia com renda igual a
zero possua uma casa prpria. Como esse valor negativo, e como a probabilidade no
pode ser negativa, tratamos esse valor como zero, o que sensato neste caso, pois
podemos interpretar, em termos pouco rigorosos, que o alto valor negativo representa a
quase improbabilidade de se possuir uma casa prpria quando a renda zero.
O valor da inclinao, 0,1021, significa que, por uma variao de uma unidade
na renda (neste caso, US$ 1000), a probabilidade de se possuir uma casa prpria
aumenta, em mdia, em 0,1021 ou cerca de 10 pontos percentuais.
Naturalmente, dado certo nvel de renda, podemos estimar a probabilidade real

12 = 0,9457 + 0,10212


de se possuir casa prpria a partir de
(1)

12  = 12 = 0,9457 + 0,1021(12) = 0,2795


Assim, para X = 12 (US$ 12000), essa probabilidade :

Ou seja, a probabilidade de que uma famlia com renda de US$ 12000 possua
casa prpria de cerca de 28%.
Agora, consideremos que a renda desta famlia aumente para US$ 13000. Assim,

12  = 13 = 0,9457 + 0,1021(13) = 0,3816


a probabilidade desta famlia possuir casa prpria de 38,16%.

Assim, confirma-se a interpretao do coeficiente angular como: o aumento em


1 unidade na renda da famlia acarreta no aumento de cerca de 10 pontos percentuais na

40
probabilidade da famlia possuir casa prpria, j que na percentagem dado aumento
de uma unidade na renda = 0,3816 0,2795 = 0,1021.

Agora consideremos X = 8 (US$ 8000). A probabilidade de uma famlia com

12  = 8 = 0,9457 + 0,1021(8) = 0,1289


renda de 8 mil dlares possuir casa prpria de:

Ou seja, trata-se este valor como sendo zero, para evitar que a probabilidade seja
negativa.

estimadores, 12 , no necessariamente sero positivos e menores que um. Isso uma das
Cabe destacar que, embora E(YiX) seja positiva e menor que um, seus

razoes porque o modelo de probabilidade linear no recomendvel quando a varivel

Mesmo que todos os 12 fossem todos positivos e menores que 1, o modelo de
dependente for dicotmica.

probabilidade linear ainda sofre com o problema da heterocedasticidade, e, em


conseqncia, no podemos confiar nos erros-padro dados pela regresso (1).
Entretanto, podemos recorrer ao procedimento dos mnimos quadrados ponderados

para tanto, e 2 , so dados por  e 2 = 12 (1 12 ) e so apresentados na Tabela 15.2.


(MQP) para obter estimativas mais eficientes dos erros-padro. Os pesos necessrios

superiores a 1, o  e 2 correspondente a estes valores ser negativo. Assim, no podemos


Observemos que, uma vez que alguns Yi estimados so negativos e outros so

28 neste exemplo. (Para evitar a perda de graus de liberdade, podemos fazer 12 = 0,01,
empregar essas observaes em MQP, o que reduz o nmero de observaes de 40 para

quando os Yi estimados forem negativos e 12 = 0,99 quando forem maiores que 1).
. predict yest
(option xb assumed; fitted values)
. gen w = sqrt( yest*(1- yest))
(12 missing values generated)
gen y1 = y/w
(12 missing values generated)
. gen x1= x/w
(12 missing values generated)
. reg y1 const1 x1, nocons
Source | SS df MS Number of obs = 28
-------------+------------------------------ F( 2, 26) = 943.09
Model | 469.552614 2 234.776307 Prob > F = 0.0000
Residual | 6.47251527 26 .248942895 R-squared = 0.9864
-------------+------------------------------ Adj R-squared = 0.9854
Total | 476.025129 28 17.0008975 Root MSE = .49894
------------------------------------------------------------------------------
y1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
const1 | -1.245592 .1205555 -10.33 0.000 -1.493398 -.9977871
x1 | .1195889 .0068515 17.45 0.000 .1055054 .1336724
------------------------------------------------------------------------------
Estes resultados mostram que, em comparao com os anteriores, os erros-
padro so menores e as razes t estimadas (em valores absolutos) maiores. Agora,
podemos interpretar da seguinte forma o coeficiente angular: o aumento de 1 unidade
(US$ 1000) na renda familiar ponderada aumenta a probabilidade ponderada da famlia
ter casa em 11,96%.

Tabela 15.2 Valores observados, valores estimados e fator de ponderao (w), do exemplo da posse da
casa prpria
. list family y const x yest w y1 const1 x1

41
+---------------------------------------------------------------------------------+
| family y const x yest w y1 const1 x1 |
|---------------------------------------------------------------------------------|
1. | 1 0 1 8 -.1286383 . . . . |
2. | 2 1 1 16 .6884096 .4631434 2.159158 2.159158 34.54653 |
3. | 3 1 1 18 .8926715 .3095304 3.2307 3.2307 58.15261 |
4. | 4 0 1 11 .1777547 .3823061 0 2.615705 28.77276 |
5. | 5 0 1 12 .2798856 .4489428 0 2.227455 26.72946 |
|---------------------------------------------------------------------------------|
6. | 6 1 1 19 .9948025 .0719063 13.90699 13.90699 264.2329 |
7. | 7 1 1 20 1.096933 . . . . |
8. | 8 0 1 13 .3820166 .4858806 0 2.058119 26.75555 |
9. | 9 0 1 9 -.0265073 . . . . |
10. | 10 0 1 10 .0756237 .2643951 0 3.782218 37.82219 |
|---------------------------------------------------------------------------------|
11. | 11 1 1 17 .7905405 .4069228 2.457468 2.457468 41.77696 |
12. | 12 1 1 18 .8926715 .3095304 3.2307 3.2307 58.15261 |
13. | 13 0 1 14 .4841476 .4997486 0 2.001006 28.01408 |
14. | 14 1 1 20 1.096933 . . . . |
15. | 15 0 1 6 -.3329002 . . . . |
|---------------------------------------------------------------------------------|
16. | 16 1 1 19 .9948025 .0719063 13.90699 13.90699 264.2329 |
17. | 17 1 1 16 .6884096 .4631434 2.159158 2.159158 34.54653 |
18. | 18 0 1 10 .0756237 .2643951 0 3.782218 37.82219 |
19. | 19 0 1 8 -.1286383 . . . . |
20. | 20 1 1 18 .8926715 .3095304 3.2307 3.2307 58.15261 |
|---------------------------------------------------------------------------------|
21. | 21 1 1 22 1.301195 . . . . |
22. | 22 1 1 16 .6884096 .4631434 2.159158 2.159158 34.54653 |
23. | 23 0 1 12 .2798856 .4489428 0 2.227455 26.72946 |
24. | 24 0 1 11 .1777547 .3823061 0 2.615705 28.77276 |
25. | 25 1 1 16 .6884096 .4631434 2.159158 2.159158 34.54653 |
|---------------------------------------------------------------------------------|
26. | 26 0 1 11 .1777547 .3823061 0 2.615705 28.77276 |
27. | 27 1 1 20 1.096933 . . . . |
28. | 28 1 1 18 .8926715 .3095304 3.2307 3.2307 58.15261 |
29. | 29 0 1 11 .1777547 .3823061 0 2.615705 28.77276 |
30. | 30 0 1 10 .0756237 .2643951 0 3.782218 37.82219 |
|---------------------------------------------------------------------------------|
31. | 31 1 1 17 .7905405 .4069228 2.457468 2.457468 41.77696 |
32. | 32 0 1 13 .3820166 .4858806 0 2.058119 26.75555 |
33. | 33 1 1 21 1.199064 . . . . |
34. | 34 1 1 20 1.096933 . . . . |
35. | 35 0 1 11 .1777547 .3823061 0 2.615705 28.77276 |
|---------------------------------------------------------------------------------|
36. | 36 0 1 8 -.1286383 . . . . |
37. | 37 1 1 17 .7905405 .4069228 2.457468 2.457468 41.77696 |
38. | 38 1 1 16 .6884096 .4631434 2.159158 2.159158 34.54653 |
39. | 39 0 1 7 -.2307692 . . . . |
40. | 40 1 1 17 .7905405 .4069228 2.457468 2.457468 41.77696 |
|---------------------------------------------------------------------------------|

Como verificamos, o modelo de probabilidade linear afetado por vrios


problemas: (1) ausncia de normalidade em i; (2) heterocedasticidade de i; (3)
possibilidade de que os Yi estimados fiquem fora da faixa 0-1; e (4) valores geralmente
baixos de R2. Mas estes problemas podem ser contornados. Por exemplo, podemos
recorrer aos MQP para resolver o problema da heterocedasticidade ou aumentar o
tamanho da amostra para minimizar o problema da falta de normalidade.
Mas mesmo assim, o problema fundamental do modelo de probabilidade linear

Pi=E(Y=1X) aumenta linearmente com X, isto , que o efeito incremental ou marginal


que ele no um modelo atrativo do ponto de vista lgico porque pressupe que

de X permanece constante. Assim, no exemplo da casa prpria, verificamos que, sempre


que X aumenta de uma unidade (US$ 1000), a probabilidade de possuir casa prpria
aumenta sempre na mesma quantia de 0,10 ou 10 pontos percentuais. E isso acontece
quer o nvel de renda seja US$8000, US$10000, US$18000 ou US$22000, o que parece
estar claramente fora da realidade. Na verdade, seria de se esperar que Pi se relacionasse
de forma no linear com Xi: em um nvel de renda muito baixo, a famlia no possui
casa prpria, mas em um nvel suficiente de renda, digamos, X* muito provvel que a
possua. Um aumento de renda alm de X* teria pequeno efeito sobre a probabilidade de
possuir casa prpria. Assim, nos dois extremos da distribuio de renda, a probabilidade
de possuir uma moradia praticamente no seria afetada por um pequeno aumento de
renda.
42
duas caractersticas: (1) medida que Xi aumenta, Pi = E(Y=1X) aumenta, mas nunca
Portanto, o que precisamos de um modelo de probabilidade que tenha estas

sai da faixa 0-1; e (2) a relao entre Pi e Xi no linear, isto , se aproxima de zero a
taxas cada vez menores medida que Xi se reduz, e se aproxima de 1 a taxas cada vez
menores quando Xi aumenta muito. Aqui surgem os modelos logit e probit.

8.2 Modelos logit e probit com dados agrupados ou replicados: um exemplo


numrico
8.2.1 Modelo LOGIT
Para evitar as limitaes do modelo de probabilidade linear, destacando-se as
duas principais: (1) as probabilidades ajustadas podem ser menores que zero ou maiores
que um e (2) o efeito marginal de qualquer varivel explicativa constante, vrias
funes no-lineares tem sido sugeridas para garantir que as probabilidades estejam
entre zero e um.
No modelo logit, a funo adotada a funo logstica:
2 = I( 2 = 1 2 ) =

 g(h T S )
(1)
Para facilitar a exposio, escrevemos (1) como:
   S S
2 =  gS = h = S h
= 1  S =  S

(2)
S
S
em que Zi = 1+2Xi.
A equao (2) representa o que conhecemos como a funo de distribuio
logstica acumulada.
Se Pi, a probabilidade de ocorrer um evento dada pela equao (2), ento (1-
Pi), a probabilidade de no ocorrer este mesmo evento, dada por:
(1 2 ) = 1
S  S ` S 
 S
=  S =  S (3)
Podemos escrever, agora, Pi/(1-Pi), que simplesmente a razo de chances a
favor da ocorrncia do evento a razo da probabilidade de ocorrncia do evento
contra a probabilidade de no ocorrncia do evento:
S
S S  S
= hS
h =  S = 5 S
(` ) 
(4)
S
hS

2
Mas, se tirarmos o logaritmo natural de (4), obtemos:
ln = 5 S
(1 2 )

*2 = ln (`S ) = 2 = 7 + 7 2 (5)
S
isto , Li, o logaritmo natural da razo de chances a favor linear em X e tambm
linear nos parmetros, podendo ser estimado por MQO.
L denominado o logit e, em conseqncia, os modelos como (5) so
denominados modelos logit.
Para fins de estimao, escrevemos a equao (5) como:

*2 = ln (`S ) = 2 = 7 + 7 2 + 2 (6)
S
Para estimar a equao (6), precisamos, alm de Xi, dos valores do regressando,
o logit, Li. Isso depende do tipo de dados que vamos analisar, que podem ser:
1. dados em nvel individual ou micro; e,
2. dados agrupados ou replicados.
A seguir, apresentamos um exemplo numrico com as etapas de estimao para
dados agrupados.

43
Consideremos os dados da Tabela 15.4, que so dados hipotticos relativos a
vrias famlias, agrupados ou replicados (observaes repetidas), (Ni), referentes ao
nvel de renda (Xi) e nmero de famlias proprietrias de um imvel residencial (ni).

Tabela 15.4 Dados hipotticos relativos a Xi (renda), Ni (nmero de famlias com renda Xi) e ni
(nmero de famlias proprietrias de um imvel residencial)
X N n
6 40 8
8 50 12
10 60 18
13 80 28
15 100 45
20 70 36
25 65 39
30 50 33
35 40 30
40 25 20

Como os dados esto agrupados, o modelo logit denominado modelo logit


agrupado, ou, para resumir, modelo glogit. Os dados brutos necessrios e outros
clculos relevantes para a implementao do modelo glogit so apresentados na Tabela
15.5.
A seguir apresentam-se as vrias etapas anteriores estimao propriamente dita
da regresso logit:

1. Para cada nvel de renda Xi, calculamos a probabilidade da posse de casa prpria

12 = 2 /q2
como:

prpria (ni <= Ni). Portanto, se calcularmos 12 = 2 /q2 , isto , a freqncia relativa,
Para cada nvel de renda Xi, h Ni famlias , dentre as quais ni possuem casa

for bastante grande, 12 ser uma estimativa relativamente boa de Pi.


podemos empreg-la como estimativa do verdadeiro Pi correspondente a cada Xi. Se Ni

2. Usando o Pi estimado, para cada nvel de renda, Xi, obtemos o logit, *12 , como:
12
*12 = ln
1 12
que ser uma estimativa bastante boa do verdadeiro logit Li se o nmero de observaes
Ni para cada Xi for razoavelmente grande.

3. possvel demonstrar que, se Ni for suficientemente grande e se cada observao em


uma dada classe de renda Xi se distribui independentemente como uma varivel

1
binomial (que s assume dois valores), ento
2 ~q[0, ]
q2 2 (1 2 )

isto , 2 segue a distribuio normal com mdia zero e varincia igual a (` ).
S S S

44
Portanto, o termo de erro do modelo logit heterocedstico. Assim, em vez de empregar

empricos, contudo, substitumos o Pi por 12 e usamos:


os MQO, teremos de adotar os mnimos quadrados ponderados (MQP). Para fins

1
3F  = [ ]
q2 12 1 12
como estimativa de 2.
Para resolver o problema da heterocedasticidade, tomamos o fator de
ponderao:
e 2 = <q2 12 1 12

e multiplicamos todas as variveis por este fator de ponderao.

4. Agora, podemos estimar a equao do modelo logit por mnimos quadrados


ordinrios recorde-se que os MQP so os MQO sobre os dados transformados.
Observe que no h intercepto explcito aps aplicar o fator de ponderao, pois o fator
de ponderao aplicado at mesmo ao intercepto da equao principal. Portanto, temos
de empregar a rotina de regresso que passa pela origem (ou seja, no Stata reg y* x*
B*, noconst).
Tabela 15.5 Dados necessrios para estimar o modelo logit da posse da casa prpria
X N n P 1-P P/(1-P) Li Wi raiz(wi) Li1 X1
6 40 8 0.2 0.8 0.25 -1.38629 6.4 2.529822 -3.50708 15.17893
8 50 12 0.24 0.76 0.315789 -1.15268 9.12 3.019934 -3.48102 24.15947
10 60 18 0.3 0.7 0.428571 -0.8473 12.6 3.549648 -3.00761 35.49648
13 80 28 0.35 0.65 0.538462 -0.61904 18.2 4.266146 -2.64091 55.4599
15 100 45 0.45 0.55 0.818182 -0.20067 24.75 4.974937 -0.99832 74.62406
20 70 36 0.514286 0.485714 1.058824 0.057158 17.48571 4.181592 0.239013 83.63185
25 65 39 0.6 0.4 1.5 0.405465 15.6 3.949684 1.601459 98.74209
30 50 33 0.66 0.34 1.941176 0.663294 11.22 3.349627 2.221788 100.4888
35 40 30 0.75 0.25 3 1.098612 7.5 2.738613 3.008674 95.85145
40 25 20 0.8 0.2 4 1.386294 4 2 2.772589 80
Nota: As variveis foram assim obtidas:
P = n/N
Li = ln[P/(1-P)]
wi = N*P*(1-P)
Li1=Li*raiz(w)
X1=X*raiz(w)

Os resultados da regresso de mnimos quadrados ponderados com base nos


dados da Tabela 15.5 so os seguintes (observe que no caso de mnimos quadrados
ponderados, o intercepto da regresso principal tambm multiplicado pelo fator de
ponderao. Neste caso, o procedimento da regresso sem constante adequado).

. reg li x const, noconst

Source | SS df MS Number of obs = 10


-------------+------------------------------ F( 2, 8) = 183.37
Model | 7.95474049 2 3.97737025 Prob > F = 0.0000
Residual | .173522982 8 .021690373 R-squared = 0.9787
-------------+------------------------------ Adj R-squared = 0.9733
Total | 8.12826348 10 .812826348 Root MSE = .14728

45
------------------------------------------------------------------------------
li | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x | .0791661 .0041431 19.11 0.000 .069612 .0887202
const | -1.65867 .0957772 -17.32 0.000 -1.879533 -1.437808
------------------------------------------------------------------------------
. gen const1 = const* raizwi
. reg li1 x1 const1, nocons
Source | SS df MS Number of obs = 10
-------------+------------------------------ F( 2, 8) = 108.52
Model | 63.3946858 2 31.6973429 Prob > F = 0.0000
Residual | 2.33666545 8 .292083181 R-squared = 0.9645
-------------+------------------------------ Adj R-squared = 0.9556
Total | 65.7313512 10 6.57313512 Root MSE = .54045
------------------------------------------------------------------------------
li1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x1 | .0786686 .0054475 14.44 0.000 .0661066 .0912305
const1 | -1.593238 .1114944 -14.29 0.000 -1.850344 -1.336131
------------------------------------------------------------------------------
2
Cabe destacar que o R o quadrado do coeficiente de correlao entre os Li*
observado e estimado.
. list x n var1 p var2 p1p li
+--------------------------------------------------------------+
| x n var1 p var2 p1p li |
|--------------------------------------------------------------|
1. | 6 40 8 .2 .8 .25 -1.386294 |
2. | 8 50 12 .24 .76 .3157895 -1.15268 |
3. | 10 60 18 .3 .7 .4285714 -.8472978 |
4. | 13 80 28 .35 .65 .5384616 -.6190392 |
5. | 15 100 45 .45 .55 .8181818 -.2006707 |
|--------------------------------------------------------------|
6. | 20 70 36 .5142857 .4857143 1.058824 .0571584 |
7. | 25 65 39 .6 .4 1.5 .4054651 |
8. | 30 50 33 .66 .34 1.941176 .6632942 |
9. | 35 40 30 .75 .25 3 1.098612 |
10. | 40 25 20 .8 .2 4 1.386294

. list wi raizwi li1 x1 const const1


+---------------------------------------------------------------+
| wi raizwi li1 x1 const const1 |
|---------------------------------------------------------------|
1. | 6.4 2.529822 -3.507078 15.17893 1 2.529822 |
2. | 9.12 3.019934 -3.481016 24.15947 1 3.019934 |
3. | 12.6 3.549648 -3.007609 35.49648 1 3.549648 |
4. | 18.2 4.266146 -2.640912 55.4599 1 4.266146 |
5. | 24.75 4.974937 -.9983241 74.62406 1 4.974937 |
|---------------------------------------------------------------|
6. | 17.48571 4.181592 .2390132 83.63184 1 4.181592 |
7. | 15.6 3.949683 1.601459 98.74209 1 3.949683 |
8. | 11.22 3.349627 2.221788 100.4888 1 3.349627 |
9. | 7.5 2.738613 3.008674 95.85145 1 2.738613 |
10. | 4 2 2.772589 80 1 2 |
+---------------------------------------------------------------+

Interpretao do modelo logit estimado

1. Interpretao do logit
Como a estimao acima mostra, o coeficiente angular sugere que, para uma
unidade (US$1000) de aumento na renda ponderada, o logaritmo ponderado das chances
favorveis posse da casa prpria aumenta em 0,0786 unidade ou 7,86 pontos
percentuais. Esta interpretao mecnica, contudo, no muito convincente.

2. Interpretao das chances

46

Recorde-se que *2 = ln (`S ). Portanto, tomando o antilogaritmo do logit
S

estimado, obtemos (`S ), isto , a razo de chances. Logo o antilogaritmo, obtemos:
2
S

= 5 M,M|K = 1,0817
(1 2 )
Isso significa que, para uma unidade de aumento da renda ponderada, as chances
(ponderadas) favorveis posse da casa prpria aumentam de 1,0817 ou [(1,0817-
1)*100] = 8,17 pontos percentuais.
3. Clculo de probabilidades
Podemos calcular a probabilidade de se possuir a casa prpria para dado nvel de
renda. Por exemplo, imagine que desejamos calcular essa probabilidade para X = 20

*2 = 1,593238 + 0,078622
(US$20000). Inserindo este valor em:

obtemos *2 = -0,019858 (Li estimado).


S g,h M,sM |
Como 2 =  S , ento: 2 =  g,h = = 0,4903588
M,sM |
isto , dada a renda de US$20000, a probabilidade de que a famlia tenha casa prpria
de cerca de 49 pontos percentuais.

4. Efeito Marginal
Embora L seja linear em X, as prprias probabilidades no o so. Esta
propriedade contrasta com o modelo de probabilidade linear, no qual as probabilidades
aumentam linearmente com X.
   S S
Como 2 =  gS = h = S h
= 1  S =  S , em que Zi = 1+2Xi

S
S

2 C (0). @(0) C(0). @ (0)


segue que
=
2 [@(0)]

2 5 4h 4T S . 7 1 + 5 4h 4T S 5 4h 4TS (5 4h4T S . 7 )
=
2 (1 + 54h 4TS )

2 7 . 5 4h 4TS + [7 . 5 4h 4TS ] [7 . 5 4h4T S ]


=
2 (1 + 54h 4TS )

2 5 4h4T S 1
= 7
2 1+5 4h 4T S 1 + 5 h 4T S
4

2
= 7 2 (1 2 )
2

Esta equao mostra como podemos calcular a variao das probabilidades

relao a X envolve no apenas 7, mas tambm o nvel de variao da probabilidade a


medida que a renda se altera. Esta equao mostra que a derivada da probabilidade em

partir do qual a variao medida, e este depende, naturalmente, do nvel de renda no


qual a probabilidade medida.
Para ilustrar, imagine que desejamos medir a variao da probabilidade de se
possuir a casa prpria para um nvel de renda de US$20000. Ento, de acordo com a

47
equao acima, a variao da probabilidade de um aumento de uma unidade no nvel de
renda em relao ao nvel 20 (US$20000)

2
= 7 . 2 . (1 2 ) = 0,078669. 0,4903588.0,504964119 = 0,01947514
2

Para um indivduo que possui renda igual a 20 mil dlares, se a sua renda
aumentar em uma unidade (US$1000), a probabilidade ponderada deste indivduo de
possuir casa prpria fica aumentada em 1,97 pontos percentuais.
Agora, para um indivduo que possui renda de US$40000, a variao da

*2 = 1,593238 + 0,07862.40 = 1,551562


probabilidade de se possuir casa prpria de 0,01135, j que:

S h,hT
,| JJ
Como 2 =  S , ento: 2 =  h,hT = 
,| JJ = 0,825139219
isto , dada a renda de US$20000, a probabilidade de que a famlia tenha casa prpria
de cerca de 82,5pontos percentuais.
De acordo com a equao deduzida para o efeito marginal, a variao da
probabilidade de um aumento de uma unidade no nvel de renda em relao ao nvel 40
(US$40000)

2
= 7 . 2 . (1 2 ) = 0,078669. 0,825139219.0,174860781 = 0,011350716
2

Ou seja, para um indivduo que possui renda igual a 40 mil dlares, se a sua
renda aumentar em uma unidade (US$1000), a probabilidade ponderada deste indivduo
de possuir casa prpria fica aumentada em 1,97 pontos percentuais.

8.2.2 Modelo PROBIT

Podemos proceder da seguinte forma para estimar o probit, a partir dos dados da
Tabela 15.4, abaixo, que trata de dados agrupados (observaes repetidas) relativos ao
nvel de renda e ao nmero de famlias que em cada um destes nveis, possui casa
prpria.

Tabela 15.4 Dados hipotticos relativos a Xi (renda), Ni (nmero de famlias com renda Xi) e ni
(nmero de famlias proprietrias de um imvel residencial)
X N n
6 40 8
8 50 12
10 60 18
13 80 28
15 100 45
20 70 36
25 65 39
30 50 33
35 40 30
40 25 20

48
Como j temos 12 , a freqncia relativa (a medida emprica de probabilidade) de
posse da casa prpria em vrios nveis de renda, podemos utiliz-la para obter Ii a partir
da FDA normal como mostra a Tabela 15.10. Uma vez que conhecemos o Ii estimado, a
estimao de 1 e 2 bastante simples. O Ii estimado obtido a partir da FDA normal
padro (Tabela D.1 Gujarati, 2006) (Observao: sempre que Pi < 0, o Ii ser negativo).
Tabela 15.10 Estimao do ndice Ii a partir da FDA normal padro
X N n Pi 1-P P/(1-P) Ii
6 40 8 0.2 0.8 0.25 -0.84
8 50 12 0.24 0.76 0.315789 -0.7
10 60 18 0.3 0.7 0.428571 -0.52
13 80 28 0.35 0.65 0.538462 -0.38
15 100 45 0.45 0.55 0.818182 -0.12
20 70 36 0.514286 0.485714 1.058824 0.02
25 65 39 0.6 0.4 1.5 0.25
30 50 33 0.66 0.34 1.941176 0.41
35 40 30 0.75 0.25 3 0.67
40 25 20 0.8 0.2 4 0.84

O resultado do probit agrupado (gprobit) para os dados da casa prpria refrentes


a diferentes nveis de renda e diferentes fmlias apresentado abaixo:
. edit
(7 vars, 10 obs pasted into editor)
. reg ii x
Source | SS df MS Number of obs = 10
-------------+------------------------------ F( 1, 8) = 378.20
Model | 2.93453554 1 2.93453554 Prob > F = 0.0000
Residual | .062074356 8 .007759295 R-squared = 0.9793
-------------+------------------------------ Adj R-squared = 0.9767
Total | 2.99660989 9 .332956655 Root MSE = .08809
------------------------------------------------------------------------------
ii | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
x | .0481909 .002478 19.45 0.000 .0424765 .0539052
_cons | -1.010456 .0572848 -17.64 0.000 -1.142555 -.8783568
------------------------------------------------------------------------------

Interpretao do modelo probit estimado

1. Interpretao das estimativas do probit


O aumento de uma unidade na renda da famlia (ou seja, o aumento de mil
dlares) eleva o ndice de utilidade desta famlia de possuir casa prpria em 0,048
unidades ou 4,8 pontos percentuais.

2. Efeito marginal
sempre calculado no ponto. Imagine que desejamos conhecer o efeito de uma
variao unitria em X (renda medida em milhares de dlares) sobre a probabilidade de
Y = 1, isto , a aquisio da casa prpria. Para tanto, derivamos a funo de
probabilidade com relao a X (ou seja, a variao da probabilidade em relao

2
renda). Assim
= C(7 + 7 2 ). 7
2

49
em que C(7 + 7 2 ) a funo de densidade de probabilidade normal padro em
7 + 7 2 . Como verificamos, esta avaliao depender do valor das variveis X.
Tomemos como exemplo X = 6 (seis mil dlares). Com os valores dos

normal em C(1,0166 + 0,04846(6)) = C(0,72548). Se consultarmos as tabelas de


parmetros estimados anteriormente, procuraremos encontrar a funo de densidade

distribuio normal (Tabela A.1, p. 326, Maddala), verificaremos que, para Z = -


0,72548, a densidade normal de cerca de 0,3079.
Multiplicando agora este valor pelo coeficiente angular de 0,04846, obteremos
0,0144. Isso significa que partindo de um nvel de renda de US$ 6 mil, quando a renda
aumenta uma unidade (mil dlares), a probabilidade de uma famlia adquirir a casa
prpria aumenta em 0,0144 unidades ou 1,44 pontos percentuais.

3. Clculo das probabilidades


Em lugar de calcular variaes da probabilidade, imagine que desejamos
encontrar as probabilidades estimadas a partir do modelo glogit. Com os dados da
Tabela 15.10 e inserindo os valores na regresso estimada, podemos encontrar os Ii
estimados. Na Tabela Z, encontramos a probabilidade facilmente. Por exemplo, para
uma famlia com renda de US$ 6 mil, Ii estimado = -1,008857+0,048112(6) = -0,72.
Para Z = -0,72, a probabilidade 0,5 0,2642 = 0,2358. Ou seja, para uma famlia com
renda igual a 6 mil dlares, a probabilidade de que ela tenha casa prpria 23,58%.

8.3 Modelos logit e probit com dados individuais: um exemplo numrico


8.3.1 Modelo Logit
Consideremos os dados da Tabela 15.7. Fazendo Y =1 se a nota final de um
aluno na prova do curso de microeconomia fosse A e Y = 0 se fosse B ou C, utiliza-se a
pontuao mdia (GPA), o TUCE e o Sistema de Instruo Personalizado (PSI) como

2
previsores de nota. O modelo logit pode ser escrito, ento, como
*2 = = 7 + 7 2 + 7 (I2 + 7
>$2 + 2
1 2
Com o auxlio do Stata 10, podemos estimar os parmetros desta equao por
mxima verossimilhana, j que no possvel estimar modelos de escolha binria por
MQO ou MQP.

Tabela 15.7 Dados relativos ao efeito do sistema de instruo personalizado (PSI) sobre as notas do
curso
OBS GPA TUCE PSI GRADE LETTER
1 2.66 20 0 0 C
2 2.89 22 0 0 B
3 3.28 24 0 0 B
4 2.92 12 0 0 B
5 4 21 0 1 A
6 2.86 17 0 0 B
7 2.76 17 0 0 B
8 2.87 21 0 0 B
9 3.03 25 0 0 C
10 3.92 29 0 1 A
11 2.63 20 0 0 C
12 3.32 23 0 0 B
13 3.57 23 0 0 B

50
14 3.26 25 0 1 A
15 3.53 26 0 0 B
16 2.74 19 0 0 B
17 2.75 25 0 0 C
18 2.83 19 0 0 C
19 3.12 23 1 0 B
20 3.16 25 1 1 A
21 2.06 22 1 0 C
22 3.62 28 1 1 A
23 2.89 14 1 0 C
24 3.51 26 1 0 B
25 3.54 24 1 1 A
26 2.83 27 1 1 A
27 3.39 17 1 1 A
28 2.67 24 1 0 B
29 3.65 21 1 1 A
30 4 23 1 1 A
31 3.1 21 1 0 C
32 2.39 19 1 1 A
Notas: Grad Y = 1 se a nota final for A; Y = 0 se a nota final for B ou C;
TUCE

. edit
(6 vars, 32 obs pasted into editor)

1. Para calcular o logit da equao, usamos


. logit grade gpa tuce psi
Iteration 0: log likelihood = -20.59173
Iteration 1: log likelihood = -13.496795
Iteration 2: log likelihood = -12.929188
Iteration 3: log likelihood = -12.889941
Iteration 4: log likelihood = -12.889633
Iteration 5: log likelihood = -12.889633
Logistic regression Number of obs = 32
LR chi2(3) = 15.40
Prob > chi2 = 0.0015
Log likelihood = -12.889633 Pseudo R2 = 0.3740
------------------------------------------------------------------------------
grade | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
gpa | 2.826113 1.262941 2.24 0.025 .3507938 5.301432
tuce | .0951577 .1415542 0.67 0.501 -.1822835 .3725988
psi | 2.378688 1.064564 2.23 0.025 .29218 4.465195
_cons | -13.02135 4.931325 -2.64 0.008 -22.68657 -3.35613
------------------------------------------------------------------------------

Cada coeficiente angular desta equao um coeficiente angular parcial e mede


a variao no logaritmo das chances a favor (logit estimado) para uma variao unitria
no valor do regressor dado (mantendo todos os demais constantes). Assim, o coeficiente
GPA de 2,8261 significa que, mantidas as demais variveis constantes, se o GPA
aumenta de uma unidade, o logaritmo das chances a favor (logit estimado) aumenta, em
mdia, cerca de 2,83 unidades ou 283,61 pontos percentuais, sugerindo uma relao
positiva entre os dois.
Como se observa, todos os demais regressores tem um efeito positivo sobre o
logaritmo das chances a favor, embora, em termos estatsticos, o efeito de TUCE no
seja significativo. Contudo, todos os regressores em conjunto tem impacto significativo

51
na nota final, j que a estatstica calculada de mxima verossimilhana de 15,40
significativa, com valor p de aproximadamente zero.
A interpretao do logaritmo das chances a favor no tem muito sentido, sendo
mais interessante em princpio analisar os sinais dos coeficientes, o que mostra a relao
existente entre as variveis explicativas e a varivel dependente, e o coeficiente de
determinao de McFadden (pseudo R2), que neste caso, de 0,374.

2. Uma interpretao que faz mais sentido se d em termos das chances a favor, que so
obtidas tirando o antilogaritmo dos vrios coeficientes angulares. No Stata, para calcular
a razo de chances a favor, usamos
. logistic grade gpa tuce psi

Logistic regression Number of obs = 32


LR chi2(3) = 15.40
Prob > chi2 = 0.0015
Log likelihood = -12.889633 Pseudo R2 = 0.3740
------------------------------------------------------------------------------
grade | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
gpa | 16.87972 21.31809 2.24 0.025 1.420194 200.6239
tuce | 1.099832 .1556859 0.67 0.501 .8333651 1.451502
psi | 10.79073 11.48743 2.23 0.025 1.339344 86.93802
------------------------------------------------------------------------------

Ou
. logit grade gpa tuce psi, or

Iteration 0: log likelihood = -20.59173


Iteration 1: log likelihood = -13.496795
Iteration 2: log likelihood = -12.929188
Iteration 3: log likelihood = -12.889941
Iteration 4: log likelihood = -12.889633
Iteration 5: log likelihood = -12.889633
Logistic regression Number of obs = 32
LR chi2(3) = 15.40
Prob > chi2 = 0.0015
Log likelihood = -12.889633 Pseudo R2 = 0.3740

------------------------------------------------------------------------------
grade | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
gpa | 16.87972 21.31809 2.24 0.025 1.420194 200.6239
tuce | 1.099832 .1556859 0.67 0.501 .8333651 1.451502
psi | 10.79073 11.48743 2.23 0.025 1.339344 86.93802
------------------------------------------------------------------------------

Assim, se tomarmos o antilogaritmo do coeficiente PSI de 2,3786, obteremos


10,7897 (e2,3786). Isso sugere que estudantes que so submetidos ao novo mtodo de
ensino tem dez vezes mais chances de obter A do que estudantes que no so
submetidos a ele, tudo o mais mantido constante. Ou ainda, (e2,3786 - 1)X100 =
978,9786, ou seja, a chance de tirar A em microeconomia para alunos que foram
submetidos ao novo mtodo 978,97 pontos percentuais superior a chance dos alunos
que no forma submetidos a este mtodo.

3. Para obter os valores estimados do logit, ou seja, ln[Pi/(1-Pi)], utiliza-se


. predict lnchances, xb 5. | .2814147 | 14. | -1.429278 |
|-----------| 15. | -.5710702 |
. list lnchances 6. | -3.320985 | |-----------|
7. | -3.603596 | 16. | -3.469803 |
+-----------+ 8. | -2.912093 | 17. | -2.870596 |
| lnchances | 9. | -2.079284 | 18. | -3.215453 |
|-----------| 10. | .8165872 | 19. | .363438 |
1. | -3.600734 | |-----------| 20. | .6667984 |
2. | -2.760413 | 11. | -3.685518 | |-----------|
3. | -1.467914 | 12. | -1.450027 | 21. | -2.727399 |
4. | -3.627206 | 13. | -.7434988 | 22. | 2.252283 |

52
23. | -1.142986 | 27. | .5555431 | 31. | .1166004 |
24. | 1.751095 | 28. | -.8131546 | 32. | -2.080255 |
25. | 1.645563 | 29. | 1.670963 | +-----------+
|-----------| 30. | 2.850418 |
26. | -.075504 | |-----------|

4. Para obter as probabilidades de cada observao, utiliza-se


. predict prob, p
. list prob 10. | .6935114 | 22. | .9048473 |
|----------| 23. | .2417725 |
+----------+ 11. | .0244704 | 24. | .8520909 |
| prob | 12. | .1899974 | 25. | .8382905 |
|----------| 13. | .3222395 | |----------|
1. | .026578 | 14. | .1932112 | 26. | .481133 |
2. | .0595013 | 15. | .3609899 | 27. | .6354207 |
3. | .1872599 | |----------| 28. | .3072187 |
4. | .0259016 | 16. | .0301837 | 29. | .8417042 |
5. | .569893 | 17. | .0536264 | 30. | .9453403 |
|----------| 18. | .0385883 | |----------|
6. | .0348582 | 19. | .5898724 | 31. | .5291171 |
7. | .026504 | 20. | .6607859 | 32. | .1110308 |
8. | .051559 | |----------| +----------+
9. | .1111266 | 21. | .0613758 |
5. Para obter o valor da probabilidade para uma observao em especfico, usamos

prvalue, x(var1=? var2=? var3=?)

6. Para obter o efeito marginal, ou seja, a variao da probabilidade dada uma variao
em uma das variveis dependentes, usamos
. mfx
Marginal effects after logit
y = Pr(grade) (predict)
= .25282025
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
gpa | .5338589 .23704 2.25 0.024 .069273 .998445 3.11719
tuce | .0179755 .02624 0.69 0.493 -.033448 .069399 21.9375
psi*| .4564984 .18105 2.52 0.012 .10164 .811357 .4375
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1

Este o efeito marginal considerando o valor mdio de todas as variveis dependentes.

7. Para encontrar o efeito marginal em valores especficos das variveis usamos


. mfx, predict (p) at (gpa=2.66 tuce = 20 psi = 0)
Marginal effects after logit
y= Pr(grade) (predict, p)
= .02657799
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
gpa | .0731161 .06687 1.09 0.274 -.05794 .204172 2.66
tuce | .0024619 .00404 0.61 0.543 -.005461 .010385 20
psi*| .2009985 .14236 1.41 0.158 -.07803 .480027 0
------------------------------------------------------------------------------
(*) dy/dx is for discrete change of dummy variable from 0 to 1

9 MODELOS ECONOMTRICOS DINMICOS: MODELOS


AUTORREGRESSIVOS E COM DEFASAGENS DISTRIBUDAS

9.1 Estimao ad hoc de modelos de defasagens distribudas


Estima-se o modelo com defasagens sucessivas e observa-se a mudana de sinal,
aprendizagem com o tempo.

53
gen timevar = m(1969m1) + _n-1
format timevar % tm
Tsset timevar
Parar na
reg Yt l1.Xt defasagem em
reg Yt l1.Xt l2.Xt que o sinal
reg Yt l1.Xt l2.Xt l3.Xt esperado mudar.

9.2 Modelo de Koyck

 = (1 =) + 7M  + =` + (] =]` )

em que = a taxa de declnio da defasagem distribuda, e (1- =) a velocidade de


ajustamento da srie.
A equao ajustada nos fornece uma estimava de curto prazo, para acharmos a
equao de longo prazo basta dividir os parmetros da equao ajustada por =. que o
valor de =*100 indica qual percentual da diferena entre o desejado e o efetivo so
eliminados no primeiro perodo.

9.2.1 Defasagem Mediana



Defasagem Mediana = -

Interpretao = o tempo necessrio para se completar a primeira metade (50%) da


variao total de Y que se segue a uma alterao unitria de X.

9.2.2 Defasagem Mdia


`
Defasagem Media =

Interpretao = Medida sinttica da velocidade com que Y responde a X.

9.3 Teste de Breusch Goodfrey

Teste de autocorrelao para modelos autorregressivos

estat bgodfrey

9.4 Ajustamento parcial ou ajustamento de estoques (Nerlove)

54
Yt = 0 + 1Xt + (1 )Yt-1 + ut

A equao ajustada nos fornece uma estimativa de curto prazo, para acharmos a
equao de longo prazo basta dividir os parmetros da equao ajustada por (= 1-
coeficiente de Yt-1).
que o valor de *100 indica qual percentual da diferena entre o desejado e o
efetivo so eliminados no primeiro perodo.

9.5 Expectativas adaptativas:

Yt = 0 + 1 X t + (1 )Yt 1 + [ut (1 )ut 1 ]

A equao ajustada nos fornece uma estimativa de curto prazo, para acharmos a
equao de longo prazo basta dividir os parmetros da equao ajustada por ( = 1-
coeficiente de Yt-1).
que o valor de *100 indica qual percentual da diferena entre o desejado e o
efetivo so eliminados no primeiro perodo.

9.6 A abordagem de Almon aos modelos de defasagem distribudas: a defasagem


de Almon ou defasagem polinomial

O modelo de defasagens distribudas de Koyck se alicera na premissa de que os


coeficientes declinam geometricamente medida que a defasagem aumenta. Esta
premissa pode ser demasiado restritiva em algumas situaes.
Diante disso, Almon (1965) sugere que possvel expressar i como uma funo
de i, a durao da defasagem. Para ilustrar sua tcnica, consideremos o modelo de
defasagens distribudas finito, a seguir:
 =  + 7M  + 7 ` + 7 ` + + 7B `B +  (17.1.2)
que pode ser escrito resumidamente como:
 =  + B2M 72 `2 +  (17.13.1)
Seguindo o teorema matemtico de Weierstrass, Almon pressupe que i pode
ser aproximado mediante um polinmio do grau adequado em i, a durao da
defasagem. Por exemplo:
72 = M +  ^ +  ^  (17.13.2)
que um polinmio quadrtico ou de segundo grau em i. Ou, por exemplo:
72 = M +  ^ +  ^  +  ^ (17.13.3)
que um polinmio de terceiro grau em i.

55
De modo mais geral, podemos escrever:
72 = M +  ^ +  ^  +  ^ + + D ^ D (17.13.4)
que um polinmio de m-simo grau em i. Supe-se que m (o grau do polinmio)
menor que k (a durao mxima da defasagem).
Para explicar como funciona o esquema de Almon, suponhamos que os
seguem um padro polinomial de segundo grau. Substituindo (17.13.2) em (17.13.1),
obtemos:
B

 =  + (M +  ^ +  ^  )`2 + 
2M

 =  + M B2M `2 +  B2M ^`2 +  B2M ^  `2 +  (17.13.5)


Definindo
B

M = `2
M
B

 = ^`2
M
B

 = ^  `2
M

podemos escrever (17.13.5) como:


 =  + M M +   +   +  (17.13.7)
No esquema de Almon, feita a regresso de Y contra as variveis
construdas Z, e no as variveis originais X. Observemos que (17.13.7) pode ser
estimada pelo tradicional procedimento de MQO. As estimativas de e i obtidas
dessa forma tero todas as propriedades estatsticas desejveis, desde que o termo de
erro estocstico atenda as premissas do modelo de regresso linear clssico.
A este respeito, a tcnica de Almon tem uma vantagem clara sobre o mtodo de
Koyck, pois este ltimo tem graves problemas de estimao resultantes da presena da
varivel explanatria estocstica Yt-1 e est provavelmente correlacionada com o termo
de erro.
Uma vez estimados os a partir de (17.13.7), os originais podem ser
estimados a partir de (17.13.2) [ou, de modo mais geral, de (17.13.4)], como se segue:
7M = FM
7 = FM + F + F

56
7 = FM + 2F + 4F
7 = FM + 3F + 9F
... ... ... ...
7B = FM + F +   F
Antes de aplicarmos a tcnica de Almon, precisamos resolver os seguintes
problemas prticos:
1. A durao da defasagem k deve ser especificada antecipadamente. Comea-se
com um valor muito grande q (a extenso da defasagem) e depois se verifica se o
ajustamento do modelo se deteriora significativamente quando o reduzimos sem impor
qualquer restrio na forma de defasagem distribuda. Podemos, ainda, recorrer ao
critrio de informao de Akaike e Schwarz para escolher a durao adequada da
defasagem. Esses critrios tambm podem ser empregados para examinar o grau
adequado do polinmio.
2. Tendo especificado k, tambm precisamos especificar o grau do polinmio, m. Na
prtica, espera-se que um polinmio de grau bastante pequeno (digamos, m = 2 ou 3),
d bons resultados. Tendo escolhido o valor de m, se quisermos verificar se um
polinmio de grau mais alto proporcionar um melhor ajustamento, podemos estimar
sucessivas regresses que incluem as variveis explicativas Z, com equaes de
polinmios cada vez mais alto, at que o coeficiente associado ao Z mais elevado seja
no significativo, em termos estatsticos.
Porm, antes de aceitar a concluso de que este o polinmio correto, temos
de verificar se o problema de multicolinearidade no suficientemente srio, aplicando
as tcnicas j conhecidas.

EXEMPLO 17.11 (PG. 557)


Para ilustrar a tcnica de Almon, a Tabela 17.6 nos apresenta dados relativos a
estoques, Y, e vendas, X, nos Estados Unidos, durante o perodo de 1954 a 1999.
Para propsitos de ilustrao, suponhamos que os estoques dependem das
vendas no ano corrente e nos trs anos anteriores, como se segue:
 =  + 7M  + 7 ` + 7 ` + 7 ` +  (17.13.11)
Alm disso, imaginemos que i pode ser aproximado por um polinmio de
segunda ordem, como mostrado em (17.13.2). Ento, de acordo com (17.13.5),
escrevemos:

57
 =  + OM M + O  + O  +  (17.13.12)
em que

M = ` = ( + ` + ` + ` )


2M

 = ^` = (` + 2` + 3` )


2M

 = 2M ^  ` = (` + 4` + 9` ) (17.13.13)

A seqncia de procedimentos a seguir ilustra como estimar o modelo de Almon


no Stata 10:
. edit
(3 vars, 46 obs pasted into editor)

. tsset ano
time variable: ano, 1954 to 1999
delta: 1 unit

* Inicialmente, usa
usa-
sa-se um programa para criar as restries do modelo
polinomial. O programa encontra-
encontra-se abaixo. Cabe destacar que ele s
fica na memria do Stata enquanto o Stata estiver aberto; uma vez que
ele for fechado e se iniciar um novo trabalho, este programa
pdlconstraints deve ser reinstalado.
. program pdlconstraints
1.
. version 8.2
2.
. args p q matname
3.
. local r = `p'-`q'
4.
. local m = `q' + 1
5.
. matrix `matname' = J(`r',`p'+3,0)
6.
. forvalues i = 1/`r' {
7.
. local x = `i' + `q' + 1
8.
. local k = -1
9.
. local d = 1
10.
. forvalues j = `x'(-1)`i' {
11.
. local k = `k' + 1
12.
. matrix `matname'[`i',`j'] = `d'*comb(`m',`k')
13.
. local d = -1*`d'
14.
. }
15.
. }
16.
. end

*Agora vamos inserir a restrio para o modelo do exemplo 17.1, com 3


defasagens e grau de polinmio 2,
2, pelos comandos que seguem abaixo:
. pdlconstraints 3 2 A
.
. cnsreg estoques L(0/3).vendas, constraints(A)
Constrained linear regression Number of obs = 43
F( 3, 39) = 517.77
Prob > F = 0.0000

58
Root MSE = 23947
( 1) - vendas + 3 L.vendas - 3 L2.vendas + L3.vendas = 0
------------------------------------------------------------------------------
estoques | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
vendas |
--. | 1.114998 .5381723 2.07 0.045 .0264419 2.203554
L1. | .6836013 .467258 1.46 0.151 -.2615172 1.62872
L2. | .1321117 .4656369 0.28 0.778 -.8097278 1.073951
L3. | -.5394709 .5656566 -0.95 0.346 -1.683619 .6046776
_cons | 25845.06 6596.998 3.92 0.000 12501.37 39188.75
------------------------------------------------------------------------------

Mediante estes passos realizados, j encontramos diretamente os


originais, como mostrado em (17.13.11). Assim, o modelo estimado de
defasagem distribuda de Almon, que corresponde a (17.13.11) :

1 = 25845,06 + 1,1150 + 0,6836` + 0,1321` 0,5395` + 


*No temos os valores das variveis Z. Para encontr-
encontr-los, temos que
fazer uso da matriz de Vandermonde.
Vandermonde. Para isso,
isso, usa-
usa-se o seguinte
programa (este programa tambm deve ser instalado toda vez que se
inicia um trabalho novo no Stata):
. program vandermonde
1.
. version 8.2
2.
. syntax name, Numlist(numlist)
3.
. local p: word count `numlist'
4.
. tokenize `numlist'
5.
. matrix `namelist' = J(`p',`p',0)
6.
. forvalues c = 1/`p' {
7.
. forvalues r = 1/`p' {
8.
. matrix `namelist'[`r',`c'] = (``c'')^(`r' - 1)
9.
. }
10.
. }
11.
. end

*Temos que atentar para o nmero de defasagens


. vandermonde V, n(0/3)

* n(0/3) indica que o nmero de defasagens vai de zero a trs


* Agora que a matriz de Vandermonde est instalada, temos que colocar
os parmetros do grau de polinmio de das defasagens

. matrix V = V[1..3,1..4]
.
. matrix W = V'

* Agora, instalamos o programa para encontrar as variveis Z, como a


seguir:
. program zvars
1.
. version 8.2
2.
. syntax varname, Matrix(name)
3.
. local n = colsof(`matrix')
4.
. local k = rowsof(`matrix')
5.
. forvalues i = 1/`n' {
6.
. local z`i' `matrix'[1,`i']*`varlist'
7.

59
. }
8.
. forvalues j = 2/`k' {
9.
. forvalues i = 1/`n' {
10.
. local m = `j' - 1
11.
. local z`i' `z`i'' + `matrix'[`j',`i']*L`m'.`varlist'
12.
. }
13.
. }
14.
. forvalues i = 1/`n' {
15.
. generate double z`i' = `z`i''
16.
. }
17.
. end

* Finalmente, utilizamos o seguinte comando para encontrar os valores


dos coeficientes associados s variveis Z:
. zvars vendas, matrix(W)
(3 missing values generated)
(3 missing values generated)
(3 missing values generated)

.
. regress estoques z*

Source | SS df MS Number of obs = 43


-------------+------------------------------ F( 3, 39) = 517.77
Model | 8.9078e+11 3 2.9693e+11 Prob > F = 0.0000
Residual | 2.2365e+10 39 573473902 R-squared = 0.9755
-------------+------------------------------ Adj R-squared = 0.9736
Total | 9.1314e+11 42 2.1741e+10 Root MSE = 23947
------------------------------------------------------------------------------
estoques | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
z1 | 1.114998 .5381723 2.07 0.045 .0264419 2.203554
z2 | -.3713503 1.374303 -0.27 0.788 -3.151141 2.40844
z3 | -.0600464 .4549666 -0.13 0.896 -.9803033 .8602104
_cons | 25845.06 6596.998 3.92 0.000 12501.37 39188.75
------------------------------------------------------------------------------

* Assim, a equao (17.13.12) toma a seguinte forma:

1 = 25845,06 + 1,1150 M 0,3713  0,0600  + 

Observa-se que, das trs variveis Z, apenas Z0 tem significncia estatstica


individual no nvel de 5%; contudo, o valor de F to alto que podemos rejeitar a
hiptese nula de que, coletivamente, os Z no tenham efeito sobre Y. A no significncia
dos coeficientes associados s variveis Z pode ser efeito da multicolinearidade.
Ainda, se quisermos encontrar os valores dos originais, associados equao
(17.13.11), a partir dos resultados correspondentes equao (17.13.12), procedemos

7M = FM + F ^  + F ^  = FM = 1,1149


como a seguir:

7 = FM + F ^  + F ^  = 1,1149 0,3713. 1 0,0600. 1 = 0,6836


7 = FM + F ^  + F ^  = 1,1149 0,3713. 2 0,06. 2 = 1,1149 0,7426 0,24
= 0,1321
7 = FM + F ^  + F ^  = 1,1149 0,3713. 3 0,06. 3 = 1,1149 1,1139 0,54
= 0,5394

60
9.7 Causalidade de Granger

A existncia de uma relao entre variveis no prova causalidade nem direo


de influncia. A causalidade, no sentido de Granger, implica que se A acontece antes de
B, ento possvel que A cause B, ou seja, h uma relao de precedncia. A existncia
do efeito causalidade de Granger entre sries temporais um indicativo de que um
modelo de autorregresso vetorial pode ser desenvolvido para modelar e projetar
estas sries inter-relacionadas (PIMENTA JNIOR, 2000 apud SILVEIRA, 2007, p.
44).
Para explicar o teste de causalidade de Granger, consideraremos uma
pergunta frequente na macroeconomia: a variao do PIB que causa a variao da
oferta de moeda M (PIB M) ou a variao da oferta de moeda M que causa PIB (M
PIB)?, em que a seta indica a diferena da causalidade.
O teste de causalidade de Granger pressupe que a informao relevante para a
previso das respectivas variveis, PIB e M, est contida unicamente nos dados da srie
temporal dessas variveis. Isto significa que uma srie precede, e, assim, cada uma
das variveis explicada por seus valores defasados, mas no se consideram demais
variveis econmicas.
Assim, o teste envolve a estimao do seguinte par de regresses:
$ = 2 2 `2 + ' 7' $`' +  (17.14.1)
 = 2 =2 `2 + ' ' $`' +  (17.14.2)
onde se pressupe que os distrbios  e  no esto correlacionados.
Cabe mencionar que, se temos duas variveis, estamos lidando com
causalidade bilateral.
A equao (17.14.1) postula que o PIB corrente est relacionado aos seus
prprios valores passados, bem como ao de M, e (17.14.2) postula um
comportamento semelhante para M.
Podemos verificar quatro casos de causalidade, quais sejam:
1. Causalidade unidirecional de M para PIB: indicada se os coeficientes do M
defasado em (17.14.1) so, como um grupo, estatisticamente diferentes de zero, isto
, i 0, e o conjunto dos coeficientes estimados do PIB defasado em (17.14.2)
no so estatisticamente diferentes de zero, isto , j = 0.
2. Causalidade unidirecional do PIB para M: indicada se o conjunto de
coeficientes defasados de M em (17.14.1) no diferente de zero, do ponto de vista

61
estatstico, isto , i = 0, e o conjunto de coeficientes defasados do PIB em
(17.14.2) estatisticamente diferente de zero, isto , j 0.
3. Causalidade bilateral: sugerida quando os conjuntos de coeficientes de M e do
PIB so estatisticamente diferentes de zero nas duas regresses.
4. Independncia: quando os conjuntos de coeficientes de M e do PIB no so
estatisticamente significativos em nenhuma das regresses.
De modo mais geral, uma vez que o futuro no pode prever o passado, se a
varivel X causa Y no sentido de Granger, ento variaes em X deveriam preceder
variaes em Y. Portanto, em uma regresso de Y contra outras variveis (incluindo
seus valores passados), se inclumos valores passados ou defasados de X e eles
melhoram significativamente a previso de Y, ento podemos dizer que X causa Y,
no sentido de Granger. Uma definio similar se aplica anlise de Y causar X, no
sentido de Granger.
As etapas envolvidas na aplicao do teste de causalidade de Granger so
apresentadas a seguir, para o exemplo PIB oferta monetria (M), dado na equao
(17.14.1).
1. Calcule a regresso do PIB corrente contra todos os termos do PIB defasados e
outras variveis, se houver, mas ainda no inclua as variveis defasadas de M nesta
regresso. Esta uma regresso restrita. A partir dela, obtemos o somatrio dos
quadrados dos resduos restritos (SQRR).
2. Agora, calcule a regresso incluindo os termos de M defasados. Esta a regresso
sem restries. A partir desta regresso, obtemos o somatrio dos quadrados dos
resduos irrestritos (SQRIR).
3. A hiptese nula H0: i = 0, isto , os termos de M defasados no cabem na
regresso.
4. Para testar essa hiptese, aplicamos o teste F de restrio, dado por:
>?t >?ut /_
#=
>?ut /( )
que segue a distribuio F com m e (n k) graus de liberdade. No presente caso, m
igual ao nmero de termos de M defasados e k o nmero de parmetros estimados
na regresso sem restrio.
5. Se o valor de F calculado for superior ao valor crtico de F ao nvel de
significncia selecionado, rejeita-se a hiptese nula e, nesse caso, os termos de M

62
defasados cabem na regresso. outra forma de dizer que a variao de M causa a
variao do PIB.
6. As etapas 1 a 5 podem ser repetidas para testar o modelo (17.14.2), isto , para
testar se a variao do PIB causa a de M.

Cabe destacar, ainda, os seguintes aspectos:


1. Supe-se que as duas variveis, PIB e M, so estacionrias. s vezes, tirar a
primeira diferena das variveis as torna estacionrias, se elas j no forem
estacionrias em nvel.
2. O nmero de termos defasados a serem includos nos testes de causalidade uma
questo de grande importncia prtica. Os critrios de informao de Akaike e
Schwarz podem ser teis para fazer a escolha. Vale mencionar que a direo da
causalidade pode depender fundamentalmente do nmero de termos defasados
includos.
3. Supusemos que os termos de erro que entram no teste de causalidade no esto
autocorrelacionados; se estiverem, deve-se fazer a transformao adequada para
eliminar a autocorrelao serial.
4. Como nosso interesse testar a causalidade, no precisamos apresentar os
coeficientes estimados dos modelos (17.14.1) e (17.14.2) explicitamente; os
resultados do teste F sero suficientes.

No Stata:
gcause m r, lag(2) reg
Para definir o
gcause r m, lag(2)
nmero de
gcause m r, lag(4)
defasagens
gcause r m, lag(4)
utiliza-se AIC
gcause m r, lag(6)
e SIC.
gcause r m, lag(6)
gcause m r, lag(8)
gcause r m, lag(8)

10 MODELOS DE EQUAES SIMULTNEAS

10.1 MNIMOS QUADRADOS DE 2 ESTGIOS

Somente usado em equaes superidentificadas.

63
H duas formas de estimar MQ2E no Stata:

10.1.1 Primeira Forma:

tsset ano
cap gen x3=l.y1
cap gen x4=l.y2

ivreg2 y2 (y1 = x1 x2) Os Instrumentos esto


ivreg2 y1 x1 x2 (y2 = x3 x4) entre parnteses
ivreg2 y2 x3 x4 (y1 = x1 x2)

Teste de Endogeneidade (para cada regresso acima) ou de


simultaneidade de Hausman

ivendog H0: regressor exgeno no h


simultaneidade

Teste de Sargan

overid H0: Todos os Instrumentos so adequados.


H1: pelo menos um instrumento no

No queremos rejeitar H0, ou seja, queremos que as variveis instrumentais sejam


adequadas.

Para ver vrias estatsticas e demonstraes dos dois estgios, inclusive a


relevncia das variveis exgenas excludas

estat firststage

10.1.2 Segunda Forma de Regredir por MQ2E:

tsset ano
cap gen x3=l.y1
cap gen x4=l.y2

ivregress 2sls y1 x1 x2 (y2 = x3 x4) Os instrumentos esto


estat endogenous entre parnteses
estat overid

64
 Teste de Hausman (simultaneidade)

H0: Ausncia de Simultaneidade regressor exgeno


H1: Presena de Simultaneidade regressor endgeno
Para fazer o teste manualmente:
1) Obtemos as equaes na forma reduzida (as equaes na forma reduzida s tem
variveis predeterminadas do lado direito). Se as equaes so exatamente identificadas
ou superidentificadas, fazemos uma regresso para cada varivel endgena contra todas
as predeterminadas do sistema. Se uma equao for subidentificada, s fazemos a
regresso das variveis predeterminadas contra ela, pois no h como identificar esta
regresso.
2) Fazer a regresso de Y2 (que endgena) contra as suas variveis explicativas
(lembrando que se utiliza a varivel prevista na etapa 1, Y1 estimado) + o resduo
obtido em (1)

Se o coeficiente do
. reg Y2 X1 Xn
resduo for
. predict resid, resid
significativo, h
. reg Y1 X1-Xn resid
simultaneidade.

10.2 MINIMOS QUADRADOS EM TRS ESTGIOS

* Tentando estimar um sistema no identificado


cap reg3 (Renda: y1 y2 x1 x2) (O_Moeda: y2 y1), 2sls

* Estimando o sistema identificado pelo reg3


reg3 (Renda: y1 y2 x1 x2) (O_Moeda: y2 y1 x3 x4), 2sls

* Estimando a equao de oferta de moeda pelo reg3


reg3 (O_Moeda: y2 y1), 2sls exog(x1 x2) endog(y1)

11 SRIES TEMPORAIS NO EVIEWS

Para colocar os dados no Eviews:


File Open Foreign data as workfile procurar a tabela que ser usada Avanar
Concluir fechar a janela com os dados o Eviews pergunta se deseja deletar o grupo
de variveis OK Proc Structure/Resize current page Marcar as opes:
Workfile structure type: Dated regular frequency
Date specification
Frequency: Quater
Start Date: 1947
End date: 2007
OK

65
11.1 Anlise Grfica

1) Fazer o grfico das variveis e observar a tendncia.


2) Observar se tem deslocamento
Inicialmente, uma plotagem sequencial no tempo capaz de comprovar a
tendncia das variveis analisadas. Se o movimento das sries temporais tem a mesma
tendncia, pode-se dizer que as variveis flutuam na mesma onda, o que um
indicativo de cointegrao.

Segurando o Control, seleciona-se as variveis com as quais se deseja formar um grupo. Clicar
com o boto direito, selecionar: Open as a group VIEW graph line Edit copy

11.2 Correlograma

Selecionar aproximadamente do tamanho da amostra para as defasagens

a) em nvel

- Seleciona a varivel
- Open
- View
- Correlogram
- Level
- Selecionar o nmero de lags

Tipo de
Padro da FAC Padro da FAC(p)
Modelo
Declina exponencialmente ou com Apresenta picos
AR(p) padro de onda senide amortecida ou significativos at p
ambos defasagens
Apresenta picos significativos at q
MA (q) Declina exponencialmente
defasagens
ARMA (p ,q) Diminui exponencialmente Diminui exponencialmente

b) Em Primeira Diferena

- Seleciona a Varivel Se a srie for no-estacionria em nvel, para torn-la


- Open estacionria deve-se fazer o correlograma da 1
- View diferena para definir o tipo de modelo AR da srie.
- Correlogram
- 1st diference

66
11.3 Teste de Raiz Unitria

- No correlograma clicar em: VIEW


- Unit Root Test
- Selecionar DF aumentado ou normal
- Selecionar: Nvel ou 1 diferena
- Selecionar: Deslocamento, Tendncia, Deslocamento e Tendncia ou nada.

H0: tem raiz unitria (no-estacionria)


H1: a srie estacionria

11.4 Teste de Granger

- Seleciona as variveis
- open as a group
- View
- Granger Causality
- Seleciona o nmero de Lags

11.5 Teste Para Verificar Co-Integrao


11.5.1 Teste de Engle Granger

1) Obtenha a regresso co-integrante (ex.: gdp c pci) e obtenha os resduos


2) Aplique o teste de raiz unitria nos resduos
3) Analise os resduos (graficamente = deslocamento, tendncia etc)
4) regrida os resduos em primeira diferena contra ele mesmo defasado e se tiver
tendncia e deslocamento adicione estes parmetros na regresso.
5) Analisar a significncia estatstica do resduos defasado obtido em (4).

H0: a srie dos resduos no estacionria (regresso espria)


H1: a srie dos resduos estacionria (cointegrante)

11.6 MODELOS ARIMA

a) Modelos AR

- Seleciona a varivel
- Quick
- Estimation Equation
- Digitar no campo em branco:
d(nome da varivel) c AR(nmero do ar)

67
b) Modelos MA

- seleciona a varivel
- Quick
- Estimation Equation
- Digitar no campo em branco:
Nome da varivel c MA(nmero do MA)

c) Modelos ARMA

- seleciona a varivel
- quick
- Estimation Equation
- digitar no campo em branco:
Nome da varivel c AR(nmero do AR) MA(nmero do MA)

11.7 PREVISO

- Seleciona a varivel
- quick
- Equation Estimation O modelo com
- digita a equao excluindo um perodo esse valor
- Forecast menor o
- Static Forecast
- Analisao o Root Mean Squared Error

 Outra forma Calcular o EQM

- Selecionar a varivel e a varivel prevista pelo modelo


- open as a group
- Copiar as ultimas observaes
- Calcular a seguinte frmula no Excel:
(@ZG @ZGC  )
I? =

Sintaxe no Excel
1)= gdp-gdpf
2) raiz(somaquad(intervalo de dados)/n)
Em que n o nmero das ltimas observaes (quantas foram excludas)

11.8 MODELO VAR

As equaes tm que ser identificadas

- Seleciona as variveis

68
- Quick
- VAR specification
- colocar o nome das variveis no campo: Endogenous variables
- colocar o nmero de Lags no campo: Lag Interval for Endogenous
- Ok
- Na janela que abriu
- View
- Lag Structure
- Lag length Criteria
- Digitar o nmero de lags includas no modelo
- Selecionar o nmero de Lags que tiver mais asteriscos
- Estimar o modelo novamente com o nmero de lags sugerido pelos testes

Funo Impulso-Resposta

- Na janela que apareceu a estimao do VAR


- Impulse Response
- Multiple Graphs
- Selecionar o nmero de perodos

11.9 MODELOS ARCH

- Quick
- Equation Estimation
- Digitar a equao
- View
- Residual test
- ARCH LM test
- Seleciona o nmero de lags at que redid2(-k) fique nao significativo

11.10 SRIES TEPORAIS NO STATA

**********************************************************************
*OPERADORES EM SRIES TEMPORAIS *
*NO STATA *
*************************************************************
*Operador* Significado *
*************************************************************
*L. *Lag Xt-1 *
*************************************************************
*L2. *2-periodos Lag Xt-2 *
*************************************************************
*F. *lead Xt+1 *
*************************************************************

69
*F2. *2-perodos lead Xt+2 *
*************************************************************
*D. * Diferenciao Xt-Xt-1 *
*************************************************************
*D2. *2 Diferena Xt-2Xt-2+Xt-2 *
*************************************************************
*S. *Diferena Sazonal Xt-Xt-1 *
*************************************************************
*S2. *2-lag diferena sazonal Xt-Xt-2 *
*************************************************************
*S12. *12-lag diferena sazonal Xt-Xt-12 *
*************************************************************

1. Para setar as variveis:


Para informar ao Stata que uma srie temporal, no command:
Srie ANUAL
gen timevar = y(1959)+_n-1
format timevar %ty
tsset timevar

Srie TRIMESTRAL
Cria varivel quadrimestral com inicio no segundo quadrimestre de 1973
gen timevar = q(1973q2) +_n-1
format timevar %tq
tsset timevar

Srie MENSAL
Cria varivel mensal com inicio no ms 7 de 2005
gen timevar = m(2005m7)+_n-1
format timevar %tm
tsset timevar

Srie SEMANAL
Cria varivel semanal com inicio na primeira semana de 1981
gen timevar = w(1981w1)+_n-1
format timevar %tw
tsset timevar

Srie DIRIA
gen timevar = d(1jan2009)+_n-1
format timevar %td
tsset timevar

2. Para fazer uma plotagem inicial das variveis:


. plot nomedavarivel variveldetempo

70
. twoway (tsline nomedavarivel) (tsline nomedavarivel)
*Colocar entre parnteses tsline e o nome da varivel para todas as variveis que se
deseja que apaream no grfico.

3. Correlogama:
corrgram [varivel]

4. Teste de raiz unitria de Dickey-Fuller:


4.1 Passeio aleatrio com deslocamento (com constante):
dfuller [varivel]
4.2 Passeio aleatrio sem deslocamento (sem constante):
dfuller [varivel], noconst
4.3 Passeio aleatrio com deslocamento em torno de uma tendncia determinstica
(constante e tendncia):
dfuller [varivel], trend

5. Teste de raiz unitria de Phillip-Perron:


pperron [varivel]

6. Para tornar a srie estacionria, faz-se a primeira diferena:


gen nomedavariveldiferenciada = d1.nomedavarivel

7. Testa-se novamente para a presena de raiz unitria por DF, ADF ou PP. O teste ADF
utilizado no caso do termo de erro ser autocorrelacionado.

GRFICO DA AUTOCORRELAO

ac X

GRFICO DA AUTOCORRELAO PARCIAL

pac X
pac X, lag(n) srv

MODELOS AR, MA, ARMA E ARIMA

71
*Identificao: Usa-se a FAC e a FACP
ac pib
pac pib, lag(25) srv

*Verifica-se que a varivel PIB no estacionria, para torn-la estacionria temos que
diferenci-la
gen dpib=D.pib
twoway (line dpib time)
twoway (line pib time) (line dpib time)
corrgram dpib, lag(25)

*Podemos proceder de duas formas, obteremos os mesmos resultados.


arima d.pib, ar(1 8 12)

*Agora vamos comparar os valores estimados, com os valores DPIB


predict pibest
twoway (line dpib time) (line pibest time)

*Suponha que tenha-se um processo ar(2) ma(3) com a varivel pib sendo no
estacionria
*Podep-se estimar de duas formas:
arima d.pib, ar(1 2) ma(1 2 3)
arima pib, arima(2,1,3)
predict pibest2
twoway (line dpib time) (line pibest2 time)

*MODELOS VAR
*Para ilustrar esse exemplo ser utilizado a tabela 17.3 do Gujarati
*Para estimar o modelo VAR no stata, usa-se o seguinte comando:
clear
use "E:\Doutorado2\Estgio e Ensino\Econometria I\Sries Temporais 2009\tabela
17.3.dta", clear
gen time=q(1979q1)+_n-1
format time %tq
tsset time

*Rodando o modelo VAR com 4 lags exclundo os 4 ltimos perodos


var m1 r if time<=tq(1987q4), lag(1/4)

*Teste de normalidade do VAR


varnorm

*Critrio de seleo de ordem do modelo var

72
varsoc

*Teste de causalidade de Grange para o modelo VAR


vargranger

*Funo Impulso-Resposta
irf create fir, set(fir1, replace)
irf graph irf
irf graph oirf

*MODELOS ARCH E GARCH


*baseado nos dados da tabela 17.3
clear
use "E:\Doutorado2\Estgio e Ensino\Econometria I\Sries Temporais 2009\tabela
17.3.dta", clear
gen time=q(1979q1)+_n-1
format time %tq
tsset time

gen lpib=ln(pib)
gen lm1=ln(m1)
gen lr=ln(r)

73