Você está na página 1de 20

Prof. Dr.

Joilson Dias 1
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br

4. MÉTODOS ALTERNATIVOS:SOLUCIONANDO PROBLEMAS

4.1 – INTRODUÇÃO: ESPECIFICAÇÕES ALTERNATIVAS DO


MODELO

Nas aulas anteriores aprendemos a diagnosticar os problemas envolvendo as regressões.


Nesta aula vamos identificar o problema e tentar uma solução para o mesmo que seja
plausível. Começamos com o problema tradicional da heterocedasticidade. Sabemos que
ao não atendermos esta condição podemos ter coeficientes e desvios padrões viesados.
Aqui vamos usar três opções: 1)a opção cluster que identifica potenciais clusters nos
dados; 2) a opção robust que usa de forma iterativa mínimos quadrados com pesos; e a 3)
que é a regressão quantílica, também conhecida como regressão mediana.

Para este problema vamos utilizar os dados dos estados que vinhamos utilizando
anteriormente. Os dados de vocês corretos é estados9296 e o meu estados 9296a.
Portanto, atente para este detalhe. Os dados de vocês não contêm a variável IGP-Indice
Geral de Preços que iremos utilizar para deflacionar as importações. Portanto, os dados
estados9296a que distribuirei já esta correto.

Hipótese: A nossa hipótese de trabalho contínua a mesma que é explicar a taxa de


desemprego dos estados brasileiros no período 1992 a 1996. No entanto faremos uma
variação do modelo para testarmos hipóteses alternativas nesta introdução. Usaremos
inicialmente da hipótese de POOLED OLS.

use estados9296a

summarize

-Vamos testar algumas hipóteses econômicas, tais como: 1) Será que os estados mais
importadores são aqueles que possuem menor taxada de desemprego; 2) Usando os dados
da educação média dos empregadores faremos um teste se os empregadores mais
educados combinam mais eficientemente seus recursos e, portanto, demanda menos
deles; 3) A importância do mercado de conta própria, ou seja onde existe um legislação
que permite o trabalho deste genero ou existe um mercado deste genero podemos ter
menor taxa de desemprego.
Prof. Dr. Joilson Dias 2
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
. reg pdes educpea atraescol salmedpnad tecimp rico10
Source | SS df MS Number of obs = 130
-------------+------------------------------ F( 5, 124) = 9.42
Model | .021291436 5 .004258287 Prob > F = 0.0000
Residual | .056070838 124 .000452184 R-squared = 0.2752
-------------+------------------------------ Adj R-squared = 0.2460
Total | .077362273 129 .000599708 Root MSE = .02126
------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educpea | .010453 .0024641 4.24 0.000 .0055758 .0153302
atraescol | .0198593 .0044813 4.43 0.000 .0109895 .0287291
salmedpnad | .0000486 .0000129 3.76 0.000 .000023 .0000741
tecimppib | .0051406 .2277866 0.02 0.982 -.4457129 .4559941
rico10 | -.0380182 .0511251 -0.74 0.459 -.1392091 .0631727
_cons | -.0542013 .0306741 -1.77 0.080 -.1149141 .0065114
------------------------------------------------------------------------------

Na hipótese acima usamos a concentração de renda dos 10% mais ricos como alternativa
para o coeficiente GINI que é mais amplo. A variável rico10 não demosntrou ter qualquer
efeito sobre a taxa de desemprego, o que parece confirmar a hipótese de que a
distribuição da renda a posteriori não afeta o mercado de trabalho.

. reg pdes educemp atraescol salmedpnad rico10 educempres


Source | SS df MS Number of obs = 130
-------------+------------------------------ F( 5, 124) = 15.86
Model | .030178935 5 .006035787 Prob > F = 0.0000
Residual | .047183338 124 .000380511 R-squared = 0.3901
-------------+------------------------------ Adj R-squared = 0.3655
Total | .077362273 129 .000599708 Root MSE = .01951

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0135139 .0026472 5.11 0.000 .0082744 .0187534
atraescol | .0232032 .0041863 5.54 0.000 .0149173 .0314892
salmedpnad | .0000129 .0000136 0.95 0.344 -.000014 .0000399
rico10 | .0202877 .04843 0.42 0.676 -.0755689 .1161443
educempres | .0037194 .0019151 1.94 0.054 -.0000711 .0075098
_cons | -.1323322 .0325549 -4.06 0.000 -.1967675 -.0678968
------------------------------------------------------------------------------

O resultado acima aponta para um fator interessante que a educação média dos
empresários é positivamente relacionada com a taxa de desemprego dos estados. Esta
indicação nos fornece informações acidionais da combinação mais eficiente dos recursos,
ou seja os empresários tendem a utilizar empregados com maior nível de educação em
detrimento dos menos qualificados. Daí a explicação de que quanto maisor é o nível de
educação do empregados maior é a taxa de desemprego. VEJA QUE SUBSTITUÍMOS A
EDUCAÇÃO DA PEA PELA EDUCAÇÃO DO EMPREGADO (EDUCEMP). Como
salários e nível educacional se correlacionam muito bem, temos que o salário médio não
é mais significante, indicando a colinearidade potencial entre ambos.
Prof. Dr. Joilson Dias 3
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
. reg pdes educpea atraescol salmedpnad rico10 cpropria
Source | SS df MS Number of obs = 130
-------------+------------------------------ F( 5, 124) = 9.56
Model | .021521893 5 .004304379 Prob > F = 0.0000
Residual | .055840381 124 .000450326 R-squared = 0.2782
-------------+------------------------------ Adj R-squared = 0.2491
Total | .077362273 129 .000599708 Root MSE = .02122
------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educpea | .0105342 .0024232 4.35 0.000 .0057381 .0153303
atraescol | .0192611 .0045076 4.27 0.000 .0103393 .0281828
salmedpnad | .0000475 .0000129 3.69 0.000 .0000221 .000073
rico10 | -.0298823 .0518069 -0.58 0.565 -.1324227 .0726582
cpropria | -1.30e-06 1.82e-06 -0.72 0.476 -4.91e-06 2.30e-06
_cons | -.054416 .0305418 -1.78 0.077 -.1148668 .0060347
------------------------------------------------------------------------------

. reg pdes educemp atraescol salmedpnad rico10 educempres cpropria


Source | SS df MS Number of obs = 130
-------------+------------------------------ F( 6, 123) = 13.63
Model | .030897331 6 .005149555 Prob > F = 0.0000
Residual | .046464943 123 .000377764 R-squared = 0.3994
-------------+------------------------------ Adj R-squared = 0.3701
Total | .077362273 129 .000599708 Root MSE = .01944

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0126469 .0027115 4.66 0.000 .0072796 .0180142
atraescol | .0227561 .0041838 5.44 0.000 .0144745 .0310376
salmedpnad | .0000104 .0000137 0.76 0.448 -.0000167 .0000375
rico10 | .0329721 .0491237 0.67 0.503 -.0642653 .1302096
educempres | .0050321 .0021324 2.36 0.020 .0008111 .0092531
cpropria | -2.57e-06 1.86e-06 -1.38 0.170 -6.26e-06 1.12e-06
_cons | -.1380115 .0326976 -4.22 0.000 -.2027345 -.0732886

Foram feitos duas versões para considerar o efeito no mercado de trabalho do tamanho
dos trabalhadores por conta própria. A primeira resestima o modelo base, onde somente a
variável cpropria é inclusa e o segundo considera a ultima versão e adiciona o cpropria
visando verificar a robustez dos efeitos da educação do empreendedor no mercado de
trabalho. Ambas, confirmam que o mercado de conta própria não afeta o mercado de
trabalho. Ou seja, a taxa de desemprego não é minimizada pela existência de maior ou
menor facilidades de um mercado para se trabalhar por conta própria.

Qual é a conclusão de vocês?????????


Prof. Dr. Joilson Dias 4
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br

4.2 – HETEROCEDASTICIDADE-SOLUCIONANDO

Apesar de existir potencialidade para a existência de heterocedasticidade em nossos


dados, resultados anteriores (diagnóstico) rejeitaram a mesma para as especificações
anteriores. Para certificarmos para a ultima especificação, vamos refazer os mesmos.

. hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of pdes

chi2(1) = 12.08
Prob > chi2 = 0.0005

. whitetst
White's general test statistic : 53.57761 Chi-sq(27) P-value = .0017

Ambos os testes rejeitam a condição de heterocedasticidade. No entanto, admitiremos


que tal problema existe potencialmente e faremso algumas aplicações para correção. A
primeira alternativa é a utilização da hipótese de cluster. Como os nossas dados são por
estados então, temos problemas de que os estados pertencentes a uma determinada região
são mais iguais do que entre as regiões o que pode levar a existência de potencialidade de
heterocedasticidade. Assim, devemos considerar a criação de variáveis dummies que
representam as regiões e usá-la como aproximativativa de cluster. Lembro que os dados
atuais já possue as dummies por região.

Para facilitar vamos criar uma variável indicadora que representa as regiões sul e sudeste
das demais.

. gen sulsud=1 if sul==1 | sud==1


(95 missing values generated)

. list estados ano sulsud in 1/10


+-------------------------+
| estados ano sulsud |
|-------------------------|
1. | AC 1992 . |
2. | AL 1992 . |
3. | AM 1992 . |
4. | AP 1992 . |
5. | BA 1992 . |
|-------------------------|
6. | CE 1992 . |
7. | DF 1992 . |
8. | ES 1992 1 |
9. | GO 1992 . |
10. | MA 1992 . |
|-------------------------|
Prof. Dr. Joilson Dias 5
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
O problema é que os valores diferentes de um estão sendo considerados como missing
observações. Para solucionar este problema fazemos o seguinte:

. replace sulsud=0 if sulsud==.


(95 real changes made)

. list estados ano sulsud in 1/10


+-------------------------+
| estados ano sulsud |
|-------------------------|
1. | AC 1992 0 |
2. | AL 1992 0 |
3. | AM 1992 0 |
4. | AP 1992 0 |
5. | BA 1992 0 |
|-------------------------|
6. | CE 1992 0 |
7. | DF 1992 0 |
8. | ES 1992 1 |
9. | GO 1992 0 |
10. | MA 1992 0 |
|-------------------------|

Agora que já temos a nossa variável faremos a nossa regressão.

. reg pdes educemp atraescol salmedpnad rico10 educempres cpropria, cluster


(sulsud)
Regression with robust standard errors Number of obs = 130
F( 0, 1) = .
Prob > F = .
R-squared = 0.3994
Number of clusters (sulsud) = 2 Root MSE = .01944

------------------------------------------------------------------------------
| Robust
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0126469 .0013823 9.15 0.069 -.0049171 .0302109
atraescol | .0227561 .0045815 4.97 0.126 -.035457 .0809691
salmedpnad | .0000104 4.39e-06 2.38 0.254 -.0000454 .0000662
rico10 | .0329721 .0454089 0.73 0.600 -.5440031 .6099473
educempres | .0050321 .0020169 2.49 0.243 -.0205956 .0306598
cpropria | -2.57e-06 1.78e-06 -1.45 0.385 -.0000252 .00002
_cons | -.1380115 .0072722 -18.98 0.034 -.2304141 -.045609
------------------------------------------------------------------------------

Nesta opção considera que os dados dos estados do sul e sudeste não são independentes e,
portanto, ao construir a matriz de variância e co-variância considera este aspecto. Ao
utilizarmos a variável indicadora da região para considerar o problema de
heterocedasticidade deparamos com um problema de na qual os testes estatísticos t são
amplamente melhores que os sem correção, mas com as P>|t| sendo muito maiores, bem
como o teste F. Ao usarmos variáveis dummies para ponderar perdemos um monte de
observações e por consequência graus de liberdade. Veja o teste F. Assim, o correto é
Prof. Dr. Joilson Dias 6
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
utilizarmos variáveis que temos a disposição que pode caracterizar do mesmo jeito o
nosso desejo de capturar as regiões mais ricas, como por exemplo PIB per capita, rico10,
etc.

. reg pdes educemp atraescol salmedpnad rico10 educempres cpropria,


cluster(pibrealpc)
Regression with robust standard errors Number of obs = 130
F( 6, 129) = 11.24
Prob > F = 0.0000
R-squared = 0.3994
Number of clusters (pibrealpc) = 130 Root MSE = .01944

------------------------------------------------------------------------------
| Robust
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0126469 .0037752 3.35 0.001 .0051777 .0201161
atraescol | .0227561 .0041159 5.53 0.000 .0146126 .0308995
salmedpnad | .0000104 .0000134 0.78 0.436 -.000016 .0000369
rico10 | .0329721 .0599755 0.55 0.583 -.0856909 .1516351
educempres | .0050321 .0026667 1.89 0.061 -.0002439 .0103082
cpropria | -2.57e-06 1.63e-06 -1.58 0.116 -5.79e-06 6.45e-07
_cons | -.1380115 .0333225 -4.14 0.000 -.2039409 -.0720822
------------------------------------------------------------------------------

. reg pdes educemp atraescol salmedpnad rico10 educempres cpropria,


cluster(rico10)
Regression with robust standard errors Number of obs = 130
F( 6, 124) = 11.26
Prob > F = 0.0000
R-squared = 0.3994
Number of clusters (rico10) = 125 Root MSE = .01944

------------------------------------------------------------------------------
| Robust
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0126469 .0037655 3.36 0.001 .0051939 .0200999
atraescol | .0227561 .0041026 5.55 0.000 .014636 .0308762
salmedpnad | .0000104 .0000133 0.78 0.435 -.0000159 .0000368
rico10 | .0329721 .0600054 0.55 0.584 -.0857953 .1517396
educempres | .0050321 .0026547 1.90 0.060 -.0002222 .0102864
cpropria | -2.57e-06 1.63e-06 -1.57 0.118 -5.81e-06 6.64e-07
_cons | -.1380115 .0333556 -4.14 0.000 -.2040316 -.0719914
------------------------------------------------------------------------------

Como não temos problemas com heterocedasticidade, vemos que os testes t não se
alteram significativamente.
Prof. Dr. Joilson Dias 7
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
A outra opção de correção é mais direta é a utilização da opção robusta com estimativa
iterativa dos pesos, ou seja:

. rreg pdes educemp atraescol salmedpnad rico10 educempres cpropria, gen(wt)


Huber iteration 1: maximum difference in weights = .66024995
Huber iteration 2: maximum difference in weights = .05558517
Huber iteration 3: maximum difference in weights = .04657839
Biweight iteration 4: maximum difference in weights = .25646242
Biweight iteration 5: maximum difference in weights = .00928829

Robust regression estimates Number of obs = 130


F( 6, 123) = 14.32
Prob > F = 0.0000
------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0139142 .0026768 5.20 0.000 .0086157 .0192128
atraescol | .0221487 .0041302 5.36 0.000 .0139731 .0303242
salmedpnad | 9.46e-06 .0000135 0.70 0.486 -.0000173 .0000362
rico10 | .0484979 .0484948 1.00 0.319 -.0474947 .1444904
educempres | .0041587 .0021051 1.98 0.050 -8.18e-06 .0083257
cpropria | -1.80e-06 1.84e-06 -0.98 0.331 -5.44e-06 1.85e-06
_cons | -.1450156 .032279 -4.49 0.000 -.2089099 -.0811213
------------------------------------------------------------------------------

Este commando do Stata rreg seguido da opção de gen(wt) muda o peso de cada
observação. Os pesos mais altos são dados as observações com comportamento melhor.
Para fazer isto o sistema usa internamente as informações do Cook’s D. Casos extremos
em que Cook’sD é acima de 1 pode ser consideradas misssing de tal forma a não serem
inclusas na regressão. Para melhor compreender vamos dar uma olhada nos pesos
considerados.
predict p if e(sample)
(option xb assumed; fitted values)
(5 missing values generated)

predict r if e(sample), resid


(5 missing values generated)

predict h if e(sample), hat


(5 missing values generated)

Onde os commandos acima são somente outra forma de se obter as seguintes


informações:
p valores ajustados (previstos) de y;
r valores dos residuos;
h valores da leverage.

. list p r h wt in 1/10
Prof. Dr. Joilson Dias 8
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
+---------------------------------------------+
| p r h wt |
|---------------------------------------------|
1. | .0885105 -.0074105 .0962149 .98271877 |
2. | .0518397 .0321603 .030023 .71000829 |
3. | .088459 .020541 .0883343 .87633355 |
4. | .08114 -.02684 .1689403 .79027954 |
5. | .0657857 .0192143 .0641552 .89083747 |
|---------------------------------------------|
6. | .0583356 .0055644 .0421061 .99064823 |
7. | .0971995 -.0160995 .1334023 .92094427 |
8. | .0485792 .0160208 .0748431 .92408598 |
9. | .0579134 .0021866 .0304926 .99861654 |
10. | .0478028 -.0176028 .0924077 .90803031 |
+---------------------------------------------+

Vocês ainda lembram o que a leverage representa?????

Para finalizar podemos simplesmente utilizar a opção robust diretamente depois do


comando reg ou seja

. reg pdes educemp atraescol salmedpnad rico10 educempres cpropria, robust


Regression with robust standard errors Number of obs = 130
F( 6, 123) = 11.24
Prob > F = 0.0000
R-squared = 0.3994
Root MSE = .01944

------------------------------------------------------------------------------
| Robust
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0126469 .0037752 3.35 0.001 .0051742 .0201196
atraescol | .0227561 .0041159 5.53 0.000 .0146088 .0309033
salmedpnad | .0000104 .0000134 0.78 0.436 -.000016 .0000369
rico10 | .0329721 .0599755 0.55 0.583 -.0857457 .15169
educempres | .0050321 .0026667 1.89 0.062 -.0002464 .0103106
cpropria | -2.57e-06 1.63e-06 -1.58 0.116 -5.79e-06 6.47e-07
_cons | -.1380115 .0333225 -4.14 0.000 -.2039713 -.0720517

Este comando simplesmente considera que a heterocedasticidade é mais geral e, portanto,


busca solucionar este problema utilizando o estimador proposto por
Hubber/White/Sandwich. Este comando pode ser utilizado com o comando cluster para
gerar pesos diferenciados entre as observações.

Regressões Quantílicas: As regressões quantílicas em geral e a median em particular são


obtidas usando o comando qreq. Este comando sem qualquer especificação de opção faz
a regressão mediana (veja help qreq para maiores detalhes). As regressões quantílicas
consideram a distribuição da variável dependente fazendo as regressões considerando
diferentes quartils (25%, 50%, 75%, 100%). A mediana neste caso tende a ter menos
influencia de outliers comparado com a regressão normal que usa a média. Mas, não há
estudos que comprovem esta robustez. No entanto, sabe-se que valores de leverage muito
altos influencia também a regressão baseada na mediana.
Prof. Dr. Joilson Dias 9
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
. qreg pdes educemp atraescol salmedpnad rico10 educempres cpropria
Iteration 1: WLS sum of weighted deviations = 1.9234032
Iteration 1: sum of abs. weighted deviations = 2.3335005
Iteration 2: sum of abs. weighted deviations = 2.117722
Iteration 3: sum of abs. weighted deviations = 1.8898677
Iteration 4: sum of abs. weighted deviations = 1.8768541
Iteration 5: sum of abs. weighted deviations = 1.8747802
Iteration 6: sum of abs. weighted deviations = 1.8741697
Iteration 7: sum of abs. weighted deviations = 1.8738861
Iteration 8: sum of abs. weighted deviations = 1.8736025
Iteration 9: sum of abs. weighted deviations = 1.8733044
Iteration 10: sum of abs. weighted deviations = 1.8718601
Iteration 11: sum of abs. weighted deviations = 1.8716464
Iteration 12: sum of abs. weighted deviations = 1.8716021

Median regression Number of obs = 130


Raw sum of deviations 2.4619 (about .0676)
Min sum of deviations 1.871602 Pseudo R2 = 0.2398

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0109985 .0032317 3.40 0.001 .0046015 .0173955
atraescol | .0217207 .0050111 4.33 0.000 .0118015 .0316399
salmedpnad | .0000195 .0000162 1.20 0.231 -.0000126 .0000517
rico10 | -.0073849 .0590646 -0.13 0.901 -.1242996 .1095298
educempres | .001276 .0025492 0.50 0.618 -.0037699 .006322
cpropria | -3.50e-07 2.24e-06 -0.16 0.876 -4.78e-06 4.08e-06
_cons | -.0836255 .0394864 -2.12 0.036 -.1617863 -.0054647

. qreg pdes educemp atraescol salmedpnad rico10 educempres cpropria, quant(.25)


Iteration 1: WLS sum of weighted deviations = 1.5000619
Iteration 1: sum of abs. weighted deviations = 3.5842309
Iteration 2: sum of abs. weighted deviations = 1.473855
Iteration 3: sum of abs. weighted deviations = 1.4648707
Iteration 4: sum of abs. weighted deviations = 1.419667
Iteration 5: sum of abs. weighted deviations = 1.4147058
Iteration 6: sum of abs. weighted deviations = 1.4129895
Iteration 7: sum of abs. weighted deviations = 1.4038988
Iteration 8: sum of abs. weighted deviations = 1.4004695
Iteration 9: sum of abs. weighted deviations = 1.3979433
Iteration 10: sum of abs. weighted deviations = 1.3868788
Iteration 11: sum of abs. weighted deviations = 1.3865892
Iteration 12: sum of abs. weighted deviations = 1.3844533
Iteration 13: sum of abs. weighted deviations = 1.3835132
Iteration 14: sum of abs. weighted deviations = 1.3826292
Iteration 15: sum of abs. weighted deviations = 1.3814482
Iteration 16: sum of abs. weighted deviations = 1.3813596
Iteration 17: sum of abs. weighted deviations = 1.3772665
Iteration 18: sum of abs. weighted deviations = 1.3762794
Iteration 19: sum of abs. weighted deviations = 1.3758549
Iteration 20: sum of abs. weighted deviations = 1.3757303
Iteration 21: sum of abs. weighted deviations = 1.3755953

.25 Quantile regression Number of obs = 130


Raw sum of deviations 1.87865 (about .0538)
Min sum of deviations 1.375595 Pseudo R2 = 0.2678
------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0141044 .0039972 3.53 0.001 .0061923 .0220165
atraescol | .0172761 .0049233 3.51 0.001 .0075308 .0270214
salmedpnad | -2.14e-06 .0000177 -0.12 0.904 -.0000373 .000033
rico10 | .1395047 .0628292 2.22 0.028 .015138 .2638713
educempres | .0038837 .0033143 1.17 0.244 -.0026767 .010444
cpropria | 7.51e-08 2.29e-06 0.03 0.974 -4.47e-06 4.62e-06
_cons | -.1812963 .0460883 -3.93 0.000 -.2725253 -.0900674
------------------------------------------------------------------------------
Prof. Dr. Joilson Dias 10
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br

. qreg pdes educemp atraescol salmedpnad rico10 educempres cpropria, quant(.50)


Iteration 1: WLS sum of weighted deviations = 1.9234032
Iteration 1: sum of abs. weighted deviations = 2.3335005
Iteration 2: sum of abs. weighted deviations = 2.117722
Iteration 3: sum of abs. weighted deviations = 1.8898677
Iteration 4: sum of abs. weighted deviations = 1.8768541
Iteration 5: sum of abs. weighted deviations = 1.8747802
Iteration 6: sum of abs. weighted deviations = 1.8741697
Iteration 7: sum of abs. weighted deviations = 1.8738861
Iteration 8: sum of abs. weighted deviations = 1.8736025
Iteration 9: sum of abs. weighted deviations = 1.8733044
Iteration 10: sum of abs. weighted deviations = 1.8718601
Iteration 11: sum of abs. weighted deviations = 1.8716464
Iteration 12: sum of abs. weighted deviations = 1.8716021

Median regression Number of obs = 130


Raw sum of deviations 2.4619 (about .0676)
Min sum of deviations 1.871602 Pseudo R2 = 0.2398

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0109985 .0032317 3.40 0.001 .0046015 .0173955
atraescol | .0217207 .0050111 4.33 0.000 .0118015 .0316399
salmedpnad | .0000195 .0000162 1.20 0.231 -.0000126 .0000517
rico10 | -.0073849 .0590646 -0.13 0.901 -.1242996 .1095298
educempres | .001276 .0025492 0.50 0.618 -.0037699 .006322
cpropria | -3.50e-07 2.24e-06 -0.16 0.876 -4.78e-06 4.08e-06
_cons | -.0836255 .0394864 -2.12 0.036 -.1617863 -.0054647
------------------------------------------------------------------------------

Façam para o quartil .75 também. Uma alternativa é considerar o conjutno de regressões
e compará-los em um sistema.
Prof. Dr. Joilson Dias 11
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
. sqreg pdes educemp atraescol salmedpnad rico10 educempres cpropria, quant(.25
.50 .75) reps(100)
(fitting base model)
(bootstrapping ......................................................................
> ..............................)
Simultaneous quantile regression Number of obs = 130
bootstrap(100) SEs .25 Pseudo R2 = 0.2678
.50 Pseudo R2 = 0.2398
.75 Pseudo R2 = 0.2439

------------------------------------------------------------------------------
| Bootstrap
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
q25 |
educemp | .0141044 .0045218 3.12 0.002 .0051538 .023055
atraescol | .0172761 .0046492 3.72 0.000 .0080733 .0264789
salmedpnad | -2.14e-06 .0000165 -0.13 0.897 -.0000348 .0000305
rico10 | .1395047 .0745576 1.87 0.064 -.0080776 .2870869
educempres | .0038837 .0030696 1.27 0.208 -.0021924 .0099597
cpropria | 7.51e-08 1.59e-06 0.05 0.962 -3.06e-06 3.21e-06
_cons | -.1812963 .0340239 -5.33 0.000 -.2486444 -.1139482
-------------+----------------------------------------------------------------
q50 |
educemp | .0109985 .0047357 2.32 0.022 .0016244 .0203726
atraescol | .0217207 .0053814 4.04 0.000 .0110686 .0323728
salmedpnad | .0000195 .0000201 0.97 0.333 -.0000203 .0000594
rico10 | -.0073849 .0844142 -0.09 0.930 -.1744777 .1597079
educempres | .001276 .0043805 0.29 0.771 -.0073949 .009947
cpropria | -3.50e-07 2.56e-06 -0.14 0.891 -5.41e-06 4.71e-06
_cons | -.0836255 .0519555 -1.61 0.110 -.1864682 .0192172
-------------+----------------------------------------------------------------
q75 |
educemp | .0134563 .0054695 2.46 0.015 .0026297 .0242828
atraescol | .0302505 .0063468 4.77 0.000 .0176874 .0428135
salmedpnad | .000025 .0000276 0.90 0.367 -.0000297 .0000797
rico10 | -.0788984 .1242255 -0.64 0.527 -.3247951 .1669983
educempres | .0037571 .0056097 0.67 0.504 -.007347 .0148612
cpropria | -3.49e-06 3.16e-06 -1.11 0.271 -9.74e-06 2.76e-06
_cons | -.0971863 .0792844 -1.23 0.223 -.2541249 .0597524
------------------------------------------------------------------------------

Estas regressões quantílicas foram utilizadas recentemente como inovadores para explicar
os dados de desempregados dos países pelo meu amigo Pedro Portugal.

Podemos verificar se há diferenças entre os quantils se estimarmos uma versão que


considera a diferença entre os quantils das taxas de desemprego, normalmente o .25 e 0
.75. Esta regressão é efetuada utilizando o comando iqreg.

. iqreg pdes educemp atraescol salmedpnad rico10 educempres cpropria, reps(100)


(fitting base model)
(bootstrapping ......................................................................
> ..............................)
Prof. Dr. Joilson Dias 12
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
.75-.25 Interquantile regression Number of obs = 130
bootstrap(100) SEs .75 Pseudo R2 = 0.2439
.25 Pseudo R2 = 0.2678

------------------------------------------------------------------------------
| Bootstrap
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | -.0006481 .0049503 -0.13 0.896 -.010447 .0091508
atraescol | .0129744 .0069247 1.87 0.063 -.0007326 .0266814
salmedpnad | .0000271 .0000287 0.95 0.345 -.0000296 .0000839
rico10 | -.2184031 .1057026 -2.07 0.041 -.4276349 -.0091712
educempres | -.0001266 .0049816 -0.03 0.980 -.0099873 .0097341
cpropria | -3.57e-06 2.65e-06 -1.35 0.180 -8.80e-06 1.67e-06
_cons | .08411 .0628758 1.34 0.183 -.0403488 .2085689
------------------------------------------------------------------------------

Como podemos ver as variáveos atraescol e rico10 apresentam-se como significantes na


explicação da diferença entre os estados que estão entre os 25% com menor taxa de
desemprego e os 25% com maiores taxas de desempregos. Este resultado parece ser
importante e, portanto, merece ser considerado em investigação a posteriori.

O nosso resultado geral é que não temos problemas relacionados a heterocedasticidade e,


portanto, os dados parecem ok. Mas, temos problemas econômicos que requerem
aprendermos maiores detalhes sobre seus comportamentos entre os quartils.
Prof. Dr. Joilson Dias 13
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br

4.3 – AUTOCORRELAÇÃO-SOLUCIONANDO

Os dados anteriores são “pooled” e, portanto, requer que os interpretamos como série
temporal para ter sentido a análise econômica. Outra opção é utilizarmos os dados de
séries temporais da primeira aula. A aplicação aos dados de série temporal consumo e
renda será deixado como exercício para casa. Aqui vamos nos limitar a aprender os
comandos e efetuar a solução para os dados disponíveis.

Primeiro devemos informar que agora vamos trabalhar com os dados na forma de séries
temporais através do seguinte comando:

tsset seq

Neste caso informamos ao programa que a variável seq representa os anos, como ela vai
de 1 a 130 quer dizer que temos 130 anos de observação neste momento em vez de dados
pooled, que é o correto. Para efetuar os testes e poder corrigir potencial problemas,
faremos a regressão básica novamente.

. reg pdes educemp atraescol salmedpnad rico10 educempres cpropria


Source | SS df MS Number of obs = 130
-------------+------------------------------ F( 6, 123) = 13.63
Model | .030897331 6 .005149555 Prob > F = 0.0000
Residual | .046464943 123 .000377764 R-squared = 0.3994
-------------+------------------------------ Adj R-squared = 0.3701
Total | .077362273 129 .000599708 Root MSE = .01944

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0126469 .0027115 4.66 0.000 .0072796 .0180142
atraescol | .0227561 .0041838 5.44 0.000 .0144745 .0310376
salmedpnad | .0000104 .0000137 0.76 0.448 -.0000167 .0000375
rico10 | .0329721 .0491237 0.67 0.503 -.0642653 .1302096
educempres | .0050321 .0021324 2.36 0.020 .0008111 .0092531
cpropria | -2.57e-06 1.86e-06 -1.38 0.170 -6.26e-06 1.12e-06
_cons | -.1380115 .0326976 -4.22 0.000 -.2027345 -.0732886
-----------------------------------------------------------------------------

Agora fazemos os testes de autocorrelação. O primeiro é o tradicional Durbin-Watson


(dwstat), este teste calcula o valor do d e devemos olhar na tabela para decidir sobre a
sua aceitabilidade. Este teste somente é válido para autocorrelação de primeira ordem e se
as variáveis independentes forem realmente exógenas.

. dwstat
Durbin-Watson d-statistic( 7, 130) = 1.726857

O comando durbina não requer que todas as variáveis independentes sejam estritamente
exógenas.
Prof. Dr. Joilson Dias 14
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
. durbina
Durbin's alternative test for autocorrelation
---------------------------------------------------------------------------
lags(p) | chi2 df Prob > chi2
-------------+-------------------------------------------------------------
1 | 2.353 1 0.1250
---------------------------------------------------------------------------
H0: no serial correlation

E o teste proposto por Breusch-Godfrey verifica autocorrelação de ordem mais elevada se


existe.

. bgodfrey
Breusch-Godfrey LM test for autocorrelation
---------------------------------------------------------------------------
lags(p) | chi2 df Prob > chi2
-------------+-------------------------------------------------------------
1 | 2.460 1 0.1168
---------------------------------------------------------------------------
H0: no serial correlation

Como a hipótese Ho é de não serial correlation é aceitável para 12% das vezes, portanto,
está ok mas poderia ser melhor por exemplo acima de 20%. Portanto, vamos considerar
um teste conjunto de heterocedasticidade e autocorrelação para finalizar.

. archlm
LM test for autoregressive conditional heteroskedasticity (ARCH)
---------------------------------------------------------------------------
lags(p) | chi2 df Prob > chi2
-------------+-------------------------------------------------------------
1 | 0.677 1 0.4107
---------------------------------------------------------------------------
H0: no ARCH effects vs. H1: ARCH(p) disturbance

Este ultimo teste é bastante conclusivo ao informar que não a ocorrência de ambos. Neste
caso o teste aceita a hipótese nula a 41%.

A solução pode ser feita utilizando as técnicas propostas por Corchrane e Orcutt
(Mínimos Quadrados em Dois Estágios) e o Método proposto por Prais-Winstem. Ambos
usam o mesmo comando prais. Enquanto o primeiro desconsidera a primeira observação
após a correção o segundo a considera utilizando uma transofrmação (veja aula).

. prais pdes educemp atraescol salmedpnad rico10 educempres cpropria, corc


Iteration 0: rho = 0.0000
Iteration 1: rho = 0.1324
Iteration 2: rho = 0.1553
Iteration 3: rho = 0.1593
Iteration 4: rho = 0.1599
Iteration 5: rho = 0.1601
Iteration 6: rho = 0.1601
Iteration 7: rho = 0.1601
Iteration 8: rho = 0.1601
Cochrane-Orcutt AR(1) regression -- iterated estimates

Source | SS df MS Number of obs = 129


Prof. Dr. Joilson Dias 15
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
-------------+------------------------------ F( 6, 122) = 13.49
Model | .030117103 6 .005019517 Prob > F = 0.0000
Residual | .04540241 122 .000372151 R-squared = 0.3988
-------------+------------------------------ Adj R-squared = 0.3692
Total | .075519513 128 .000589996 Root MSE = .01929

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0117364 .0025919 4.53 0.000 .0066055 .0168673
atraescol | .022848 .004194 5.45 0.000 .0145456 .0311505
salmedpnad | .0000119 .000015 0.79 0.430 -.0000179 .0000417
rico10 | .0193643 .0488563 0.40 0.693 -.0773516 .1160803
educempres | .0054488 .0020596 2.65 0.009 .0013717 .0095259
cpropria | -1.72e-06 1.82e-06 -0.95 0.345 -5.32e-06 1.88e-06
_cons | -.1313763 .0323754 -4.06 0.000 -.1954666 -.067286
-------------+----------------------------------------------------------------
rho | .160077
------------------------------------------------------------------------------
Durbin-Watson statistic (original) 1.726857
Durbin-Watson statistic (transformed) 2.020042

Verificamos que agora o DW se aproxima do valor ideal que é 2. Os tests t melhoram


significativamente para as variáveis que foram consideradas signficantes anteriormente.

. prais pdes educemp atraescol salmedpnad rico10 educempres cpropria


Iteration 0: rho = 0.0000
Iteration 1: rho = 0.1324
Iteration 2: rho = 0.1573
Iteration 3: rho = 0.1615
Iteration 4: rho = 0.1623
Iteration 5: rho = 0.1624
Iteration 6: rho = 0.1624
Iteration 7: rho = 0.1624
Iteration 8: rho = 0.1624
Prais-Winsten AR(1) regression -- iterated estimates

Source | SS df MS Number of obs = 130


-------------+------------------------------ F( 6, 123) = 13.77
Model | .030538379 6 .00508973 Prob > F = 0.0000
Residual | .045464835 123 .000369633 R-squared = 0.4018
-------------+------------------------------ Adj R-squared = 0.3726
Total | .076003214 129 .000589172 Root MSE = .01923

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0115963 .0025631 4.52 0.000 .0065227 .0166698
atraescol | .0227063 .0041653 5.45 0.000 .0144612 .0309513
salmedpnad | .0000133 .0000147 0.91 0.366 -.0000157 .0000423
rico10 | .0206538 .0485533 0.43 0.671 -.0754546 .1167621
educempres | .0053463 .0020351 2.63 0.010 .001318 .0093745
cpropria | -1.62e-06 1.80e-06 -0.90 0.370 -5.18e-06 1.94e-06
_cons | -.1305057 .0322065 -4.05 0.000 -.1942566 -.0667548
-------------+----------------------------------------------------------------
rho | .1623959
------------------------------------------------------------------------------
Durbin-Watson statistic (original) 1.726857
Durbin-Watson statistic (transformed) 2.053094
Nesta segunda regressão utilizamos o Método de Prais-Winstem e podemos verificar que
a semelhança entre ambas é muito grande. O valor do ρ=0,16, portanto autocorrelação
pequena mas significativa.

Heterocedasticidade e Autocorrelação: Quando encontrada nos dados podemos estimar a


regressão usando a técnica de Prais-Winstem e corrigindo para robustez, ou seja.
Prof. Dr. Joilson Dias 16
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
. prais pdes educemp atraescol salmedpnad rico10 educempres cpropria, robust
Iteration 0: rho = 0.0000
Iteration 1: rho = 0.1324
Iteration 2: rho = 0.1573
Iteration 3: rho = 0.1615
Iteration 4: rho = 0.1623
Iteration 5: rho = 0.1624
Iteration 6: rho = 0.1624
Iteration 7: rho = 0.1624
Iteration 8: rho = 0.1624
Prais-Winsten AR(1) regression -- iterated estimates

Regression with robust standard errors Number of obs = 130


F( 7, 123) = 271.50
Prob > F = 0.0000
R-squared = 0.4018
Root MSE = .01923

------------------------------------------------------------------------------
| Semi-robust
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0115963 .0034887 3.32 0.001 .0046905 .018502
atraescol | .0227063 .0039864 5.70 0.000 .0148155 .030597
salmedpnad | .0000133 .0000143 0.93 0.353 -.0000149 .0000415
rico10 | .0206538 .0647545 0.32 0.750 -.1075239 .1488314
educempres | .0053463 .0025646 2.08 0.039 .0002698 .0104227
cpropria | -1.62e-06 1.48e-06 -1.09 0.277 -4.55e-06 1.31e-06
_cons | -.1305057 .0334218 -3.90 0.000 -.1966622 -.0643493
-------------+----------------------------------------------------------------
rho | .1623959
------------------------------------------------------------------------------
Durbin-Watson statistic (original) 1.726857
Durbin-Watson statistic (transformed) 2.053094

Para concluir sobre Hetero-Auto lembro que existem várias opções que podem ser
combinadas para solucionar estas técnicas, tais como hc2, hc3, newey, etc. Quando
encontrar ests problemas em suas pesquisas procure dedicar ao aprendizado mais
detlhado que se encontra nos manuais e no sistema help do programa.

Repitir este processo para os dados da aula2, que é uma série temporal.

4.4 – REGRESSÕES RESTRINGIDAS

O teste mais famosa deste tipo de opção é aquele de igualdade dos coeficientes da função
de produção Cobb-Douglas, ou seja você quer verificar se ambos possuem igual
participação na regressão. Podemos fazer um teste de igualdade de parâmetros e a seguir
estimar a regrssão restringido os parâmetros de ambos para serem iguais em importância.
Este será o objetivo desta seção.

. testparm educemp educempres, equal


Prof. Dr. Joilson Dias 17
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
( 1) - educemp + educempres = 0

F( 1, 123) = 3.37
Prob > F = 0.0687

. testparm educemp atraescol,equal


( 1) - educemp + atraescol = 0

F( 1, 123) = 4.77
Prob > F = 0.0309

No primeiro caso verificamos se a educação dos empregados e dos empregadores


possuem peso influência idêntica na determinação da taxa de desemprego. Básicamente
queremos responder a pergunta que empresários qualificados contratam empregados
qualificados e, portanto, basta usarmos uma das variáveis será suficiente. O resultado
demonstrou que tal fato não ocorre a informar que os coeficientes são diferentes. O
mesmo teste foi aplicado entre a educação e a proxy para qualidade desta educação
(atraescol). Este teste também rejeitou a condição de igualdade.

. prais pdes educemp atraescol educempres, twostep


Iteration 0: rho = 0.0000
Iteration 1: rho = 0.1676
Prais-Winsten AR(1) regression -- twostep estimates

Source | SS df MS Number of obs = 130


-------------+------------------------------ F( 3, 126) = 27.08
Model | .029800977 3 .009933659 Prob > F = 0.0000
Residual | .046227472 126 .000366885 R-squared = 0.3920
-------------+------------------------------ Adj R-squared = 0.3775
Total | .076028449 129 .000589368 Root MSE = .01915

------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0129505 .0021649 5.98 0.000 .0086662 .0172349
atraescol | .0224381 .003839 5.84 0.000 .0148407 .0300354
educempres | .0048238 .0017884 2.70 0.008 .0012845 .0083631
_cons | -.1216439 .0247726 -4.91 0.000 -.1706682 -.0726196
-------------+----------------------------------------------------------------
rho | .1675617
------------------------------------------------------------------------------
Durbin-Watson statistic (original) 1.657671
Durbin-Watson statistic (transformed) 2.011483

Temos a impressão que o coeficiente da educação dos empregados é aproximadamente


duas vezes a dos empregadores. Primeiro realizamos um teste e em seguida fazemos a
regressão.

. test educemp=2*educempres
( 1) educemp - 2 educempres = 0

F( 1, 126) = 0.43
Prob > F = 0.5128

O resultado acima informa que 51% das vezes é verdade, portanto podemos fazer nossa
regressão com restrição, ou seja.
Prof. Dr. Joilson Dias 18
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br

. constraint define 2 educemp=2*educempres

. cnsreg pdes educemp atraescol educempres, c(2)


Constrained linear regression Number of obs = 130
F( 2, 127) = 38.40
Prob > F = 0.0000
Root MSE = .01948
( 1) educemp - 2 educempres = 0
------------------------------------------------------------------------------
pdes | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0121762 .0013902 8.76 0.000 .0094253 .0149271
atraescol | .0234677 .003861 6.08 0.000 .0158275 .031108
educempres | .0060881 .0006951 8.76 0.000 .0047126 .0074636
_cons | -.1306564 .0250391 -5.22 0.000 -.1802042 -.0811085
------------------------------------------------------------------------------

O resultado desta restrição é que o coeficiente de educempres e seu desvio padrão


representam a metade do outro. Os níveis de significância serão os mesmos. Esta técnica
é importante quando queremos validar determinados argumentos na nossa análise
econômica. Mas, em geral a utilizamos muito pouco.

4.4 – REGRESSÕES CENSURADAS

Os dados as vezes são censuradas ao terem um limite acima e/ou abaixo. Por exemplo,
considere o caso em que medimos a taxa de desemprego até um limite de 10%, mas
sabemos que aqueles estados cuja taxa for de 10% não serão idênticos em especficação.
Neste caso, conhecendo o problema podemos utilizar uma técnica que minimiza este
fator de censuramento.

. gen pdes1=pdes

replace pdes1=0.10 if pdes1>0.1, nopromote


(12 real changes made)

Para não prejudicar as nossas variáveis criamos a seguinte variável pdes1 e depois a
censuramos através do segundo comando a ter um limite superior.

Aqui utilizamos o comando tobit indicando o censuramento superior ou a direita.

. tobit pdes1 educemp atraescol educempres, ul(0.10)


Tobit estimates Number of obs = 130
LR chi2(3) = 63.47
Prob > chi2 = 0.0000
Prof. Dr. Joilson Dias 19
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
Log likelihood = 296.72158 Pseudo R2 = -0.1198

------------------------------------------------------------------------------
pdes1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0131252 .0021224 6.18 0.000 .0089254 .0173251
atraescol | .0218152 .0035334 6.17 0.000 .0148232 .0288072
educempres | .0039747 .0017272 2.30 0.023 .0005569 .0073925
_cons | -.1146791 .0232387 -4.93 0.000 -.1606643 -.0686939
-------------+----------------------------------------------------------------
_se | .0175862 .0011679 (Ancillary parameter)
------------------------------------------------------------------------------
Obs. summary: 118 uncensored observations
12 right-censored observations at pdes1>=.1

A opção ul o commando de toda a regressão informa o valor do limite superior. Vamos


admitir que somente observamos os valores da taxa de desemprego entre 0.5 e 0.6 ou seja
agora temos um limite susperior e inferior. Estes fatos são comuns em dados de
questionários relacionados a renda e ou a perguntas específicas de salários.

. replace pdes1=0.05 if pdes1<0.05, nopromote


(22 real changes made)

. tobit pdes1 educemp atraescol educempres, ll(0.05) ul(0.10)


Tobit estimates Number of obs = 130
LR chi2(3) = 61.21
Prob > chi2 = 0.0000
Log likelihood = 319.21486 Pseudo R2 = -0.1060

------------------------------------------------------------------------------
pdes1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0115422 .0017352 6.65 0.000 .0081085 .014976
atraescol | .0193614 .0028907 6.70 0.000 .0136412 .0250816
educempres | .0018378 .0014128 1.30 0.196 -.0009579 .0046336
_cons | -.0779082 .0189954 -4.10 0.000 -.1154966 -.0403197
-------------+----------------------------------------------------------------
_se | .0144094 .0009602 (Ancillary parameter)
------------------------------------------------------------------------------
Obs. summary: 118 uncensored observations
12 right-censored observations at pdes1>=.1

4.4 – REGRESSÕES TRUNCADAS

Dados truncados são aqueles cujas observações para valores acima de determinado
patarmar e/ou inferior a outro não estão presents na base de dados. É como se não
observassemos as informações dos estados cuja taxa de desemprego seja superior a 10%.
Para solucionar este problema (minizar é a palavra correta) devemos utilizar regressões
truncadas.

. drop if pdes1>=0.10
(12 observations deleted)

. reg pdes1 educemp atraescol educempres


Source | SS df MS Number of obs = 118
-------------+------------------------------ F( 3, 114) = 17.60
Model | .008062359 3 .002687453 Prob > F = 0.0000
Prof. Dr. Joilson Dias 20
Programa de Mestrado em EConomia
Universidade Estadual de Maringá
Maringá-PR
29/11/2005 jdias@uem.br
Residual | .017410318 114 .000152722 R-squared = 0.3165
-------------+------------------------------ Adj R-squared = 0.2985
Total | .025472677 117 .000217715 Root MSE = .01236
------------------------------------------------------------------------------
pdes1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educemp | .0085042 .0016186 5.25 0.000 .0052978 .0117105
atraescol | .0151702 .0025744 5.89 0.000 .0100703 .02027
educempres | .0016925 .0012821 1.32 0.189 -.0008473 .0042324
_cons | -.0473284 .0170252 -2.78 0.006 -.0810551 -.0136017
------------------------------------------------------------------------------

O primeiro comando apaga as observações cujos valores sejam superiores a 10%. Como
sabemos que existe os dados para tal valores, portanto, devemos compensar utilizando a
técnica de dados censurados.

. truncreg pdes1 educemp atraescol educempres, ul(0.09)


(note: 11 obs. truncated)
Fitting full model:
Iteration 0: log likelihood = 340.73265
Iteration 1: log likelihood = 341.51283
Iteration 2: log likelihood = 341.52221
Iteration 3: log likelihood = 341.52222

Truncated regression
Limit: lower = -inf Number of obs = 107
upper = .09 Wald chi2(3) = 42.70
Log likelihood = 341.52222 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
pdes1 | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
eq1 |
educemp | .0070825 .0019863 3.57 0.000 .0031895 .0109756
atraescol | .0151162 .0027392 5.52 0.000 .0097475 .0204849
educempres | .0036649 .00136 2.69 0.007 .0009994 .0063305
_cons | -.0556622 .0187661 -2.97 0.003 -.0924431 -.0188813
-------------+----------------------------------------------------------------
sigma |
_cons | .0109192 .0008702 12.55 0.000 .0092135 .0126248
Como podemos ver temos várias opções para trabalhar com diferentes dados truncados
e/ou que não observmos na base de dados. Além destas opções ainda o sistema possui
várias outras que permite ser considerada. Se o seu problema comporta este tipo de
técnica não tenha medo, veja nos artigos, manuais, etc e enfrente-o com bravura.

Você também pode gostar