Você está na página 1de 27

Regresso Linear Mltipla: informaes qualitativas e

variveis binrias, dicotmicas ou "dummy"- Parte 2


Aula 21
Prof. Moiss A. Resende Filho
Introduo Econometria (ECO 132497)

02 de junho de 2014

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

1 / 27

Categorias mltiplas
Considere o modelo
log(salarioh ) = 0 + 0 feminino + 1 casado + 1 educ +

+ 2 exper + 3 exper 2 + 4 perm + 5 perm2 + u

(1)

onde a varivel binria feminino recebe o valor um se o indivduo do


sexo feminino e zero, caso contrrio; e a varivel binria casado recebe o
valor um se o indivduo casado e zero, caso contrrio.
Qual a categoria base desse modelo?
Fazendo feminino = casado = 0, obtm-se a categoria base:
"homem solteiro".
Vamos estimar esse modelo no Stata.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

2 / 27

No Stata: digite na janela de comandos


ssc install bcuse
bcuse wage1, clear
drop wage nonwhite numdep smsa northcen south west construc ndurman trcommpu
trade services profserv profocc clerocc servocc

*Traduz os nomes da variveis para o portugus


rename female feminino
rename tenure perm
rename married casado
rename lwage lsalarioh
rename tenursq permsq

*Estima o modelo (1)


reg lsalarioh feminino casado educ exper expersq perm permsq
eststo modelo1
esttab modelo1, star(* 0.10 ** 0.05 *** 0.01) se r2 ar2 label

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

3 / 27

Resultados
(1)
lsalarioh
feminino

-0.290***
(0.0361)

casado

0.0529
(0.0408)

educ

0.0792***
(0.00680)

exper

0.0270***
(0.00533)

expersq

-0.000540***
(0.000112)

perm

0.0313***
(0.00685)

permsq

-0.000574**
(0.000235)

Constant

0.418***
(0.0989)

Observations
R-squared
Adjusted R-squared

526
0.443
0.435

Standard errors in parentheses


* p<0.10, ** p<0.05, *** p<0.01

O prmio do casamento 5, 3% de aumento no salrio estimado ou,


exatamente, (exp(0.0529) 1) 100 = 5.4324%.
Ser mulher deprime o salrio estimado em 2, 9%.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

4 / 27

Problema
Considere o modelo
log(salarioh ) = 0 + 0 feminino + 1 casado + 1 educ +

+ 2 exper + 3 exper 2 + 4 perm + 5 perm2 + u


Assumindo RLM.4 (mdia condicional zero),
E (u jfeminino, casado, educ, ...) = 0, temos que:
E (log(salarioh )jfeminino = 1, casado =
1, educ, ...) E (log(salarioh )jfeminino = 1, casado = 0, educ, ...) = 1
E (log(salarioh )jfeminino = 0, casado =
1, educ, ...) E (log(salarioh )jfeminino = 0, casado = 0, educ, ...) = 1
A especicao do modelo impe que o prmio do casamento seja o
mesmo (1 ) para homens e mulheres.
Como dar maior exibilidade ao modelo?
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

5 / 27

Soluo
Alternativa 1: utilize as interaes entre feminino e casado, o que gera
quatro categorias:
"homens solteiros"(hsolteiros ).
"homens casados"(hcasados ).
"mulheres solteiras"(msolteiras ).
"mulheres casadas"(mcasadas ).
Por exemplo, dena a categoria "homens solteiros"(hsolteiros ) como a
categoria base e gere trs variveis binrias para as outras categorias.
A especicao do modelo que permite prmios diferentes para o
casamento segundo o gnero
log(salarioh ) = 0 + 0 hcasados + 1 mcasadas + 2 msolteiras +

+ 1 educ + 2 exper + 3 exper 2 + 4 perm + 5 perm2 + u


Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

(2)
6 / 27

No Stata: digite na janela de comandos


ssc install bcuse
bcuse wage1, clear
drop wage nonwhite numdep smsa northcen south west construc ndurman trcommpu
trade services profserv profocc clerocc servocc
rename female feminino
rename tenure perm
rename married casado
rename lwage lsalarioh
rename tenursq permsq

*Gera as variveis binrias


gen hcasados=(1-feminino)*casado
gen hsolteiros=(1-feminino)*(1-casado)
gen msolteiras=feminino*(1-casado)
gen mcasadas=feminino*casado

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

7 / 27

No Stata: digite na janela de comandos

*Estima o modelo (2)


reg lsalarioh hcasados mcasadas msolteiras educ exper expersq perm permsq
eststo modelo1
esttab modelo1, star(* 0.10 ** 0.05 *** 0.01) se label

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

8 / 27

Resultados e interpretao
(1)
lsalarioh
hcasados

0.213***
(0.0554)

mcasadas

-0.198***
(0.0578)

msolteiras

-0.110**
(0.0557)

educ

0.0789***
(0.00669)

exper

0.0268***
(0.00524)

expersq

-0.000535***
(0.000110)

perm

0.0291***
(0.00676)

permsq

-0.000533**
(0.000231)

Constant

0.321***
(0.100)

Observations

526

Standard errors in parentheses


* p<0.10, ** p<0.05, *** p<0.01

Cada coeciente estatisticamente signicante ao nvel de 1%.


Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

9 / 27

Resultados e interpretao
log(salarioh ) = 0.321 + 0.213hcasados 0.198mcasadas
0.110msolteiras + 0.079educ + 0.027exper 0.00053 exper 2 +
+0.029perm 0.0005perm2
Categoria base: homens solteiros.
A estimativa do prmio do casamento para os homens 21,3% ou,
exatamente, (exp(0.213) 1) 100 = 23, 738%.
Estima-se que mulheres casadas recebam 19,8% a menos que homens
solteiros ou, exatamente,(exp(0.198) 1) 100 = 21, 896%.
Estima-se que mulheres solteiras recebam 11% a menos que homens
solteiros ou, exatamente, (exp(0.110) 1) 100 = 11, 628%.
A estimativa do prmio do casamento para mulheres
( 0.198 ( 0.110)) 100 = 8, 8% ou, exatamente,
(21.896 11.628) = 10.268% a menos.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

10 / 27

Resultados e interpretao
log(salarioh ) = 0.321 + 0.213hcasados 0.198mcasadas
0.110msolteiras + 0.079educ + 0.027exper 0.00053 exper 2 +
+0.029perm 0.0005perm2
Para testar se o prmio do casamento para mulheres signicante,
1/2
d (b
d (b
d (b
utilize ep (b
1 b
2 ) = Var
1 ) + Var
2 ) 2Cov
1 , b
2 )
.
Alternativa, poder-se-ia especicar o modelo com mulheres solteiras
como categoria base e efetuar um teste t para o coeciente da varivel
mcasadas, no modelo
log(salarioh ) = 0 + 0 hcasados + 1 mcasadas + 2 hsolteiros +

+ 1 educ + 2 exper + 3 exper 2 + 4 perm + 5 perm2 + u


Regra: se existem g grupos ou categorias, inclui-se (g
dummy de intercepto no modelo.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

1) variveis
02/06/2014

11 / 27

Interao entre dummies

Alternativa 2: equivalentemente, estime o modelo


log(\
salarioh ) = 0.321

0.110feminino + 0.213 casado

(0.100 )

(0.56 )

0.301 feminino

(0.072 )

(0.055 )

casado + b
1 educ

+b
2 exper + b
3 exper 2 + b
4 perm + 5 perm2

Fazendo feminino = casado = 0, obtem-se a equao para a categoria


base, no caso, "homens solteiros".
Como antes, estima-se que homens casados ganham,
aproximadamente, 21.3% a mais que os homens solteiros.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

12 / 27

Interao entre dummies

log(\
salarioh ) = 0.321

0.110feminino + 0.213 casado

(0.100 )

(0.56 )

0.301 feminino

(0.072 )

Ainda, como antes:

(0.055 )

casado + b
1 educ

+b
2 exper + b
3 exper 2 + b
4 perm + 5 perm2

Mulheres casadas recebem 19,8%


(( 0.110 + 0.213 0.301) 100 = 19.8 ) a menos que homens solteiros.
Mulheres solteiras recebem 11% a menos que homens solteiros.
A estimativa do prmio do casamento para mulheres
( 0.198 ( 0.110)) 100 = 8.8%.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

13 / 27

Inclinaes diferentes
At aqui, as especicao do modelo s permitiam diferentes interceptos
para diferentes grupos.
Utilizando a interao entre variveis explicativas e variveis
dummy possibilita diferentes inclinaes no modelo de regresso.
Considere o modelo de regresso
log(salarioh ) = ( 0 + 0 feminino ) + ( 1 + 1 feminino ) educ + u

= 0 + 0 feminino + 1 educ + 1 feminino educ + u(3)


Para homens: E [log(salarioh )jfeminino = 0, educ ] = 0 + 1 educ
Para mulheres:
E [log(salarioh )jfeminino = 1, educ ] = ( 0 + 0 ) + ( 1 + 1 ) educ
Hipteses testveis:
H0 : 1 = 0 (teste t), o efeito ceteris paribus da educao o mesmo
para homens e mulheres;
H0 : 0 = 1 = 0 (teste F ), salrios mdios so iguais para homens e
mulheres (discriminao inexistente);
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

14 / 27

Diferentes retornos educao para mulheres e homens


Modelo economtrico
log(salarioh ) = 0 + 0 feminino + 1 educ + 1 feminino

educ + u

Em (b): fazendo 0 + 1 educ = ( 0 + 0 ) + ( 1 + 1 ) educ, obtm-se


educ = 10 .
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

15 / 27

Incorporando informao ordinal


Suponha que desejssemos estimar o efeito da qualidade da dvida do
governo municipal (CR) sobre a taxa de juros paga pelos ttulos
municipais (TTM).
Considere um esquema que classica a qualidade da dvida do
governo segundo uma escala ordinal, tal que: CR 2 f0, 1, 2, 3, 4g, onde
CR = 0 (pior qualidade) e 4 (mais alta qualidade).
Uma possvel especicao do modelo
TTM = 0 + 1 CR + outros fatores

(4)

onde 1 mede a mudana percentual em TTM quanto CR aumenta em


uma unidades, ou seja, quando a dvida do governo sobe para a classe
imediatamente superior.
Limitao: impede que a variao em TTM possa ser diferente entre
classes.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

16 / 27

Incorporando informao ordinal


A especicao alternativa que permite que a variao em TTM possa
ser diferente entre classe
TTM = 0 + 1 CR1 + 2 CR2 + 3 CR3 + 4 CR4 + outrosfatores

(5)

onde CR1 = 1 se CR = 1, caso contrrio, CR1 = 0; CR2 = 1 se CR = 2 ,


caso contrrio, CR2 = 0; CR3 = 1 se CR = 3, caso contrrio, CR3 = 0;
CR4 = 1 se CR = 4, caso contrrio, CR4 = 0.
j , j = 1, .., 4 a diferena em TTM de um municpio com classicao
CR = j em relao ao municpio com CR = 0 (categoria base).
Para testar o modelo restrito (4) onde as trs restries sob
H0 : 2 = 21 , 3 = 31 , 4 = 41 esto impostas contra o modelo
irrestrito (5), efetua-se um teste F .

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

17 / 27

Diferenas da regresso entre grupos

Objetivo: testar se duas populaes ou grupos seguem a mesma funo


de regresso.
Considere o modelo restrito
aumfGPA = 0 + 1 SAT + 2 emperc + 3 tothrs + u

(6)

onde, para atletas, aumfGPA nota mdia nal em curso superior; SAT
a nota de ingresso no curso superior; emperc o percentil de classicao
no curso mdio; tothrs o total de horas do curso superior.
O modelo o mesmo para homens e mulheres?

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

18 / 27

Diferenas da regresso entre grupos


Especique o modelo irrestrito
aumfGPA = 0 + 0 feminino + 1 SAT + 1 feminino

SAT +

+ 2 emperc + 2 feminino emperc + 3 tothrs +


+3 tothrs feminino + u
(7)
onde a varivel binria feminino recebe um se o indivduo do sexo
feminino e zero, caso contrrio.
Qual a categoria base desse modelo?
A hiptese de que o modelo que explica aumfGPA o mesmo para
homens e mulheres
H0 : 0 = 1 = 2 = 3 = 0
F =

(Rir2 Rr2 )/(k + 1)


(1 Rir2 )/(n 2 (k + 1))

F(k +1 ),(n

(8)
2 (k +1 ))

em que k o nmero de variveis no modelo restrito.


Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

19 / 27

No Stata: digite na janela de comandos


ssc install bcuse
bcuse gpa3, clear

*Elimina as observaes referentes ao primeiro semestre (fall, term=1)


drop if term <2

*Elimina variveis desnecessrias


drop season frstsem frstsem crsgpa verbmath trmgpa hssize hsrank spring black white
ctrmgpa ctothrs ccrsgpa ccrspop cseason football term id

*Traduz os nomes da variveis para o portugus


rename female feminino
rename cumgpa aumfGPA
rename hsperc emperc

*Gera variveis
gen femSAT= feminino* sat
gen fememperc= feminino* emperc
gen femtothrs= feminino* tothrs
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

20 / 27

No Stata: digite na janela de comando


*Executa um teste F indireto
*Passo 1: Estima o modelo irrestrito e armazena SQRir e g.l.
reg aumfGPA feminino sat femSAT emperc fememperc tothrs femtothrs
scalar r2_ir = e(r2)
scalar gl_ir = e(df_r)

* Passo 2: Estima o modelo restrito e armazena SQRr e g.l.


reg aumfGPA sat emperc tothrs
scalar r2_r = e(r2)
scalar gl_r = e(df_r)
scalar q = gl_r - gl_ir

*Calcula a estatstica F
scalar Festatistica = ((r2_ir - r2_r)/q)/((1-r2_ir)/gl_ir)

*Obtm o F crtico a 5%, p-valor e lista tudo


scalar Fcrit5 = invFtail(q,gl_ir,.05)
scalar pvalor = Ftail(q,gl_ir,Festatistica)
scalar list r2_ir r2_r gl_r gl_ir q Festatistica pvalor Fcrit5
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

21 / 27

Resultados e interpretao
. reg aumfGPA feminino sat femSAT emperc fememperc tothrs femtothrs
Source

SS

df

MS

Model
Residual

53.5391809
78.3545051

7
358

7.64845442
.218867333

Total

131.893686

365

.361352564

aumfGPA

Coef.

feminino
sat
femSAT
emperc
fememperc
tothrs
femtothrs
_cons

-.3534862
.0010516
.0007506
-.0084516
-.0005498
.0023441
-.0001158
1.480812

Std. Err.
.4105293
.0001811
.0003852
.0013704
.0031617
.0008624
.0016277
.2073336

t
-0.86
5.81
1.95
-6.17
-0.17
2.72
-0.07
7.14

Number of obs
F( 7,
358)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.390
0.000
0.052
0.000
0.862
0.007
0.943
0.000

=
=
=
=
=
=

366
34.95
0.0000
0.4059
0.3943
.46783

[95% Conf. Interval]


-1.160838
.0006955
-6.88e-06
-.0111465
-.0067676
.0006482
-.0033169
1.073067

.4538659
.0014078
.0015081
-.0057566
.0056681
.0040401
.0030852
1.888557

Nenhum dos termos envolvendo a varivel dummy feminino


estatisticamente, individualmente signicante a 5%.
(R 2 R 2 ) / (k +1 )
(0.40592679 0.35163639 )/4
Como F = (1 Rir2 )/(rn 2 (k +1 )) =
= 8.1791 >
(1 0.40592679 )/358
ir
F5%;4,358 = 2.40, ento, rejeita-se H0 : 0 = 1 = 2 = 3 = 0.
A varivel dummy e suas interaes so conjuntamente
signicantes.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

22 / 27

No Stata: digite na janela de comando


*Executa o teste F direto da hiptese conjunta
H0 : 0 = 1 = 2 = 3 = 0
quietly reg aumfGPA feminino sat femSAT emperc fememperc tothrs femtothrs
test feminino femSAT fememperc femtothrs
.

test feminino femSAT fememperc femtothrs


(
(
(
(

1)
2)
3)
4)

feminino = 0
femSAT = 0
fememperc = 0
femtothrs = 0
F(

4,
358) =
Prob > F =

8.18
0.0000

A varivel dummy feminino e suas interaes so conjuntamente


signicantes.
Ou,os modelos para homens e mulheres so diferentes.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

23 / 27

Teste de Chow: equivalente a abordagem anterior


Passo 1: estime, separadamente, para a categoria (homens e
mulheres) o modelo
aumfGPA = 0 + 1 SAT + 2 emperc + 3 tothrs + u
e com base em SQRh e SQRm , calcule a SQR do modelo irrestrito,
SQRir = SQRh + SQRm .
Passo 2: estime, para todos os dados juntos, o modelo
aumfGPA = 0 + 1 SAT + 2 emperc + 3 tothrs + u
obtendo a SQR do modelo restrito, SQRp .
Passo 3: calcule a estatstica do teste

(SQRp (SQRh + SQRm ))/(k + 1)


Fb =
(SQRh + SQRm ) /(n 2 (k + 1))

F(k +1 ),(n

2 (k +1 ))

e efetue o teste.
Como todo teste F , s vlido sob homocedasticidade.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

24 / 27

No Stata: digite na janela de comandos


ssc install bcuse
bcuse gpa3, clear

*Elimina as obseraes referentes ao primeiro semestre (fall, term=1)


drop if term <2

*Elimina variveis desnecessrias


drop season frstsem frstsem crsgpa verbmath trmgpa hssize hsrank spring black white
ctrmgpa ctothrs ccrsgpa ccrspop cseason football term id

*Traduz os nomes da variveis para o portugus


rename female feminino
rename cumgpa aumfGPA
rename hsperc emperc

*Executa um teste F indireto


*Passo 1A: Estima o modelo para mulheres
reg aumfGPA sat emperc tothrs if feminino==1
scalar sqr_m = e(rss)
scalar gl_m = e(df_r)
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

25 / 27

No Stata: digite na janela de comando


* Passo 1B: Estima o modelo para homens
reg aumfGPA sat emperc tothrs if feminino==0
scalar sqr_h = e(rss)
scalar gl_h = e(df_r)
scalar sqr_ir = sqr_m + sqr_h
scalar gl_ir = gl_m+gl_h

* Passo 2: Estima o modelo com dados para homens e mulheres


reg aumfGPA sat emperc tothrs
scalar sqr_p = e(rss)
scalar gl_p = e(df_r)
scalar q = gl_p - gl_ir

*Calcula a estatstica F, obtm o F crtico a 5%, p-valor e lista tudo


scalar Festatistica = ((sqr_p - sqr_ir)/q)/(sqr_ir/gl_ir)
scalar Fcrit5 = invFtail(q,gl_ir,.05)
scalar pvalor = Ftail(q,gl_ir,Festatistica)
scalar list sqr_p sqr_ir gl_ir q Festatistica pvalor Fcrit5
Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

26 / 27

Resultados e discusso

scalar list sqr_p sqr_ir gl_ir q Festatistica pvalor Fcrit5


sqr_p = 85.515067
sqr_ir = 78.354505
gl_ir =
358
q =
4
Festatistica = 8.1791117
pvalor = 2.545e-06
Fcrit5 = 2.3968824

Os modelos para mulheres e homens so diferentes.


Limitao: se H0 rejeitada no se sabe se devido a diferenas nos
interceptos, inclinaes ou nos dois.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, cap. 7)

02/06/2014

27 / 27

Você também pode gostar