Você está na página 1de 38

Regressão Linear Múltipla: Informações qualitativas e

variáveis binárias, dicotômicas ou dummy


Aula 20, Introdução à Econometria

Prof. Moisés A. Resende Filho

Capítulo 7, parte 02

12 de agosto de 2022

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 1 / 38


1. Categorias Múltiplas com Variáveis Dummy

Tomemos como ponto de partida o MRLM

lsalarioh = β0 + δ0 feminino + β1 educ +

+ β2 exper + β3 exper 2 + β4 perm + β5 perm2 + u (1)


em que lsalarioh é o logaritmo natural do salário-hora e feminino
recebe 1 se mulher, caso contrário, zero.
Todos os comandos Stata necessários para gerar os resultados nas
seções 1 e 2 desses slides estão no arquivo discriminasexo.do
disponível na página web do curso, ao lado dos slides da Aula 20.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 2 / 38


Categorias Múltiplas com Variáveis Dummy

A estimativa MQO do modelo (1) com os dados em wage1 é


. reg lsalarioh feminino educ exper expersq perm permsq, cformat(%9.3f)pformat(%5.4f) sformat(%8.3f)

Source SS df MS Number of obs = 526


F(6, 519) = 68.18
Model 65.3791002 6 10.8965167 Prob > F = 0.0000
Residual 82.9506616 519 .159827864 R-squared = 0.4408
Adj R-squared = 0.4343
Total 148.329762 525 .28253288 Root MSE = .39978

lsalarioh Coef. Std. Err. t P>|t| [95% Conf. Interval]

feminino -0.297 0.036 -8.281 0.0000 -0.367 -0.226


educ 0.080 0.007 11.868 0.0000 0.067 0.093
exper 0.029 0.005 5.916 0.0000 0.020 0.039
expersq -0.001 0.000 -5.431 0.0000 -0.001 -0.000
perm 0.032 0.007 4.633 0.0000 0.018 0.045
permsq -0.001 0.000 -2.493 0.0130 -0.001 -0.000
_cons 0.417 0.099 4.212 0.0000 0.222 0.611
,

Portanto, estimamos que mulheres ganham 29, 7% ou, exatamente,


25, 70% (= 100(exp ( 0, 297 1) 1)) menos que homens.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 3 / 38


Categorias Múltiplas com Variáveis Dummy

Consideremos o estado civil dos indivíduos com a variável casado


que recebe 1 se o indivíduo é casado, caso contrário, zero.
Se admitimos que casados são mais produtivos, casado ! lsarioh,
(+)
então casado está no erro do modelo (1).
Ainda, se admitimos que mulheres casadas participam menos do
mercado de trabalho, casado ! feminino, tal que
( )

casado
. &
( ) (+)
feminino ! lsarioh

e, com isso, a hipótese crucial RLM.4.


E (u jfeminino, educ, exper , exper 2 , perm, perm2 ) = 0 é improvável
no MRLM (1).
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 4 / 38
Categorias Múltiplas com Variáveis Dummy

Para contornar a endogeneidade de feminino no modelo (1) devido à


omissão de casado, utilizaremos o MRLM

lsalarioh = β0 + δ0 feminino + δ1 casado + β1 educ +

+ β2 exper + β3 exper 2 + β4 perm + β5 perm2 + u, (2)


no qual a categoria base ou de referência é homem não casado,
feminino = casado = 0.
Estimamos o modelo (2) com dados de wage1.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 5 / 38


Categorias Múltiplas com Variáveis Dummy

De fato, com o comando Stata corr lsalarioh casado, como


. corr lsalarioh casado
(obs=526)

lsalar~h casado

lsalarioh 1.0000
casado 0.2707 1.0000

d (lsalarioh, casado ) = 0.2707, casados ganham mais na amostra.


Corr
Ainda, com o comando Stata corr feminino casado, como
(obs=526)

feminino casado

feminino 1.0000
casado -0.1661 1.0000

d (feminino, casado ) = 0, 1661, mulheres casadas participam


Corr
menos do mercado de trabalho que homens casados na amostra.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 6 / 38


Categorias Múltiplas com Variáveis Dummy

A estimativa MQO do modelo (2) com os dados em wage1 é


. reg lsalarioh feminino casado educ exper expersq perm permsq, cformat(%9.3f)pformat(%5.4f) sformat(%8.3f)

Source SS df MS Number of obs = 526


F(7, 518) = 58.76
Model 65.6482315 7 9.37831878 Prob > F = 0.0000
Residual 82.6815303 518 .159616854 R-squared = 0.4426
Adj R-squared = 0.4351
Total 148.329762 525 .28253288 Root MSE = .39952

lsalarioh Coef. Std. Err. t P>|t| [95% Conf. Interval]

feminino -0.290 0.036 -8.036 0.0000 -0.361 -0.219


casado 0.053 0.041 1.299 0.1947 -0.027 0.133
educ 0.079 0.007 11.640 0.0000 0.066 0.093
exper 0.027 0.005 5.061 0.0000 0.016 0.037
expersq -0.001 0.000 -4.813 0.0000 -0.001 -0.000
perm 0.031 0.007 4.570 0.0000 0.018 0.045
permsq -0.001 0.000 -2.448 0.0147 -0.001 -0.000
_cons 0.418 0.099 4.226 0.0000 0.224 0.612

Portanto, estimamos que mulheres ganham 29, 0% ou, exatamente,


25, 17% (= 100(exp( 0, 290 1) 1)) menos que homens.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 7 / 38


Categorias Múltiplas com Variáveis Dummy

Assim, ao não controlarmos para casado, como j 0.297j > j 0.290j,


estaríamos superestimando a diferença salarial devido ao sexo.
A estimativa do prêmio do casamento é 5, 30% ou, exatamente,
5, 44% (= 100(exp(0, 053) 1)), e é estatisticamente signi…cante,
pois o p-valor do teste t de H0 : βcasado = 0 contra H0 : βcasado > 0 é
0.1947 2 = 0.097 < 10% de signi…cância.
Devemos manter casado no modelo?

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 8 / 38


2. Termo de Interação entre Variáveis Dummy

Questão - Na especi…cação (2) e sob RLM.4.


E (u jfeminino, casado, educ, exper , exper 2 , perm, perm2 ) = 0,
E (lsalarioh jfeminino = 1, casado =
1, educ, ...) E (lsalarioh jfeminino = 1, casado = 0, educ, ...) = δ1 e
E (lsalarioh jfeminino = 0, casado =
1, educ, ...) E (lsalarioh jfeminino = 0, casado = 0, educ, ...) = δ1 .
Ou seja, o prêmio do casamento δ1 é forçosamente igual para
homens e mulheres no modelo (2).
Como modi…car reespeci…car o modelo (2).de modo a permitir que o
prêmio do casamento possa ser diferente para homens e mulheres?

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 9 / 38


2.1. Flexibilizando o Prêmio do Casamento - Opção 1

Opção 1 - crie as seguintes variáveis de interação:

1 Homem solteiro: hsolteiro (1 feminino ) (1 casado )


2 Homem casado: hcasado = (1 feminino ) casado
3 Mulher solteiro: msolteira feminino (1 casado )
4 Mulher casada: mcasada feminino casado

Regra: se há g categorias, inclua apenas (g 1) dummies de


intercepto, evitando assim a armadilha da variável dummy.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 10 / 38


Flexibilizando o Prêmio do Casamento - Opção 1

Em seguida,por exemplo, de…na hsolteiro como a categoria base e


adicione as três outras dummies ao modelo (1), obtendo a
especi…cação

lsalarioh = β0 + δ0 hcasado + δ1 mcasada + δ2 msolteira+

+ β1 educ + β2 exper + β3 exper 2 + β4 perm + β5 perm2 + u (3)

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 11 / 38


Flexibilizando o Prêmio do Casamento - Opção 1

No MRLM (3):
O prêmio do casamento para mulheres é
E (lsalarioh jhcasado = 0, mcasada = 1, msolteira = 0, ...)
E (lsalarioh jhcasado = 0, mcasada = 0, msolteira = 1, ...) = δ1 δ2 .
O prêmio do casamento para homens é
E (lsalarioh jhcasado = 1, mcasada = 0, msolteira = 0, ...)
E (lsalarioh jhcasado = 0, mcasada = 0, msolteira = 0, ...) = δ0 .

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 12 / 38


Flexibilizando o Prêmio do Casamento - Opção 1

No MRLM (3):
A diferença salarial entre mulheres e homens casados é
E (lsalarioh jhcasado = 0, mcasada = 1, msolteira = 0, ...)
E (lsalarioh jhcasado = 1, mcasada = 0, msolteira = 0, ...) = δ1 δ0 .
A diferença salarial entre mulheres e homens solteiros é
E (lsalarioh jhcasado = 0, mcasada = 0, msolteira = 1, ...)
E (lsalarioh jhcasado = 0, mcasada = 0, msolteira = 0, ...) = δ2 .

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 13 / 38


Flexibilizando o Prêmio do Casamento - Opção 1

. reg lsalarioh hcasado mcasada msolteira educ exper expersq perm permsq, cformat(%9.3f) pformat(%5.4f) sformat(%8.3
> f)

Source SS df MS Number of obs = 526


F(8, 517) = 55.25
Model 68.3617614 8 8.54522017 Prob > F = 0.0000
Residual 79.9680004 517 .154676983 R-squared = 0.4609
Adj R-squared = 0.4525
Total 148.329762 525 .28253288 Root MSE = .39329

lsalarioh Coef. Std. Err. t P>|t| [95% Conf. Interval]

hcasado 0.213 0.055 3.842 0.0001 0.104 0.321


mcasada -0.198 0.058 -3.428 0.0007 -0.312 -0.085
msolteira -0.110 0.056 -1.980 0.0483 -0.220 -0.001
educ 0.079 0.007 11.787 0.0000 0.066 0.092
exper 0.027 0.005 5.112 0.0000 0.017 0.037
expersq -0.001 0.000 -4.847 0.0000 -0.001 -0.000
perm 0.029 0.007 4.302 0.0000 0.016 0.042
permsq -0.001 0.000 -2.306 0.0215 -0.001 -0.000
_cons 0.321 0.100 3.213 0.0014 0.125 0.518

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 14 / 38


Flexibilizando o Prêmio do Casamento - Opção 1

Estimamos que mulheres casadas recebem 19, 8% (= 100 b


δ1 )
menos que homens solteiros ou, exatamente, 17, 96%
(= 100 (exp( 0.198) 1)).
Estimamos que mulheres solteiras recebem 11% (= 100 b
δ2 )
menos que homens solteiros ou, exatamente, 10, 42%
(= 100 (exp( 0.110) 1)).
A estimativa do prêmio do casamento para mulheres é 8, 8%
(= 100 (b δ1 bδ2 ) ) ou, exatamente, 8, 42%
(= (exp( 0.198 ( 0.110)) 1) 100).
A estimativa do prêmio do casamento para homens é 21, 3%
(= 100 b δ0 ) ou, exatamente, 23, 74% (= (exp(0.213) 1) 100).

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 15 / 38


Flexibilizando o Prêmio do Casamento - Opção 1
Testar se o prêmio do casamento é igual para homens e
mulheres, consiste em testar
H0 : ( δ 1 δ2 ) δ0 = 0
contra
H1 : ( δ 1 δ2 ) δ0 < 0.
Com o comando Stata lincom mcasada- msolteira- hcasado,
. lincom mcasada- msolteira- hcasado

( 1) - hcasado + mcasada - msolteira = 0

lsalarioh Coef. Std. Err. t P>|t| [95% Conf. Interval]

(1) -.3005931 .071767 -4.19 0.000 -.4415838 -.1596024

a estimativa de (δ1 δ2 ) δ0 é 30, 1% e, como o p-valor do teste


é zero, rejeitamos H0 em favor de H1 : o prêmio do casamento é
menor para mulheres. A estimativa exata de (δ1 δ2 ) δ0 é
25, 99%, = (exp( 0.301) 1) 100.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 16 / 38
Flexibilizando o Prêmio do Casamento - Opção 1

Testar se não há diferença salarial devido ao sexo no mercado de


trabalho, consiste em testar

H0 : (δ1 δ0 ) = δ2 = 0

contra
H1 : H0 é falsa.
Com o comando Stata test (mcasada - msolteira = 0) (hcasado = 0),
. test (mcasada - msolteira = 0) (hcasado = 0)

( 1) mcasada - msolteira = 0
( 2) hcasado = 0

F( 2, 517) = 9.64
Prob > F = 0.0001 ,

concluímos que há diferença salarial no mercado de trabalho


devido ao sexo.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 17 / 38


2.2. Flexibilizando o Prêmio do Casamento - Opção 2

Opção 2 - no caso de duas variáveis dummy, a inclusão no MRLM de


um termo de interação das duas torna possível ao intercepto de uma
categoria variar segundo as categorias da outra variável dummy, como
em

lsalarioh = β0 + δ0 feminino + δ1 casado + δ2 (feminino casado ) +


2
+ β1 educ + β2 exper + β3 exper +
+ β4 perm + β5 perm2 + u (4)

com homem solteiro a categoria base ou de referência.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 18 / 38


Flexibilizando o Prêmio do Casamento - Opção 2

Sob RLM.4, se o termo de interação é entre duas variáveis dummy, os


interceptos podem diferir por categoria ou grupo, como no modelo
(4) em que:
∂E (lsalarioh j...)
= δ1 + δ2 feminino,
∂casado
mas se H0 : δ2 = 0 pelo teste t, o prêmio do casamento é o
mesmo para homens e mulheres; e

∂E (lsalarioh j...)
= δ0 + δ2 casado,
∂feminino
mas se H0 : δ0 = δ2 = 0 pelo teste F , não há diferença salarial no
mercado de trabalho devido ao sexo.
A diferença salarial entre mulheres e homens casados é δ0 + δ2 e,
entre mulheres e homens não casados, δ0 .

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 19 / 38


Flexibilizando o Prêmio do Casamento - Opção 2

. reg lsalarioh c.feminino##c.casado educ exper expersq perm permsq, cformat(%9.3f) pformat(%5.4f) sformat(%8.3f)

Source SS df MS Number of obs = 526


F(8, 517) = 55.25
Model 68.3617614 8 8.54522017 Prob > F = 0.0000
Residual 79.9680004 517 .154676983 R-squared = 0.4609
Adj R-squared = 0.4525
Total 148.329762 525 .28253288 Root MSE = .39329

lsalarioh Coef. Std. Err. t P>|t| [95% Conf. Interval]

feminino -0.110 0.056 -1.980 0.0483 -0.220 -0.001


casado 0.213 0.055 3.842 0.0001 0.104 0.321

c.feminino#c.casado -0.301 0.072 -4.188 0.0000 -0.442 -0.160

educ 0.079 0.007 11.787 0.0000 0.066 0.092


exper 0.027 0.005 5.112 0.0000 0.017 0.037
expersq -0.001 0.000 -4.847 0.0000 -0.001 -0.000
perm 0.029 0.007 4.302 0.0000 0.016 0.042
permsq -0.001 0.000 -2.306 0.0215 -0.001 -0.000
_cons 0.321 0.100 3.213 0.0014 0.125 0.518
,

como o p-valor do teste de H0 : δ2 = 0 contra H1 : δ2 < 0 é


0, 0000 2 = 0, concluímos que o prêmio do casamento é 30, 1%
menor para mulheres, ou exatamente, 25, 99% menor,
= (exp( 0.301) 1) 100.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 20 / 38
Flexibilizando o Prêmio do Casamento - Opção 2

A estimativa do prêmio do casamento para homens é 21, 3%


(= 100 b δ1 ) ou, exatamente, 23, 74% (= (exp(0.213) 1) 100).
A estimativa do prêmio do casamento para mulheres é 8, 8%
(= 100 (b δ0 + b
δ2 ) ) ou, exatamente, 8, 42%
(=(exp(0.213 0.301) 1) 100).

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 21 / 38


Flexibilizando o Prêmio do Casamento - Opção 2

. test (feminino = 0) (c.feminino#c.casado = 0)

( 1) feminino = 0
( 2) c.feminino#c.casado = 0

F( 2, 517) = 42.09
Prob > F = 0.0000

Como o p-valor do teste de H0 : δ0 = δ2 = 0 é 0, 0000 < 5%,


concluímos que há diferença salarial no mercado de trabalho
devido ao sexo.
A estimativa da diferença salarial entre mulheres e homens
casados é 41, 1% (= 100 (b δ0 + bδ2 ) ) ou, exatamente, 33, 70%
(=(exp( 0.11 0.301) 1) 100 = 33.70).
A estimativa da diferença salarial entre mulheres e homens não
casados é 11% (= 100 b δ0 ) ou, exatamente, 10, 42%
(=(exp( 0.11) 1) 100 = 10.42).
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 22 / 38
3. Termo de Interação com Variável Dummy

A inclusão de um termo de interação no MRLM permite que o efeito


marginal de uma variável dependa do nível da outra.
Logo, no caso do termo de interação ser de uma variável contínua e
uma variável dicotômica, o efeito marginal da variável contínua
passa a poder diferir segundo a categoria ou grupo da variável
dummy.
Por exemplo, se queremos permitir que além dos interceptos, os
efeitos marginais de escolaridade possam diferir entre as categorias
homens e mulheres, especi…camos

lsalarioh = ( β0 + δ0 feminino ) + ( β1 + δ1 feminino )educ + u


| {z } | {z }
Interceptos 6=s Inclinações 6=s

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 23 / 38


Termo de Interação com Variável Dummy

Assim, o MRLM a ser estimado por MQO é

lsalarioh = β0 + δ0 feminino + β1 educ + δ1 (feminino educ ) + u


(5)
em que, sob RLM.4:

1 Para homens, E (lsalarioh jfeminino = 0, educ ) = β0 + β1 educ; e


2 Para mulheres,
E (lsalarioh jfeminino = 1, educ ) = ( β0 + δ0 ) + ( β1 + δ1 ) educ.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 24 / 38


Termo de Interação com Variável Dummy

1 Ainda, sob RLM.4., como

∂E (lsalarioh jfeminino, educ )


= β1 + δ1 feminino,
∂educ
se H0 : δ1 = 0 pelo teste t, o retorno da escolaridade é o mesmo
para homens e mulheres.
2 Ademais, sob RLM.4, como

∂E (lsalarioh jfeminino, educ )


= δ0 + δ1 educ,
∂feminino
se H0 : δ0 = δ1 = 0 pelo teste F , não há diferença salarial devido
ao sexo no mercado de trabalho.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 25 / 38


Termo de Interação com Variável Dummy

salarioh = β0 + δ0 feminino + β1 educ + δ1 (feminino educ ) + u

tal que fazendo β0 + β1 educ = ( β0 + δ0 ) + ( β1 + δ1 ) educ, obtemos


educ = δδ10 na interseção na Figura 7.2.(b).
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 26 / 38
4. Incorporação de Informação Ordinal na RLM

Temos uma variável ordinal se a ordem dos seus possíveis resultados


traz informação (4 é melhor que 3, 3 é melhor que 2, ..., 1 é melhor
que zero), mas não a diferença. Por exemplo, não sabemos se a piora
de 4 para 3 é a mesma da mudança de 3 e 2,....
Suponha que quiséssemos estimar o efeito da qualidade da dívida dos
governos municipais (CR) nos juros dos títulos municipais (TTM).
A qualidade da dívida é classi…cada em uma escala ordinal
CR 2 f0, 1, 2, 3, 4g, em que 0 é a pior e 4 é a melhor.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 27 / 38


Incorporação de Informação Ordinal na RLM

Uma possível especi…cação do modelo seria

TTM = β0 + β1 CR + outros fatores (6)

em que β1 mede a mudança percentual em TTM quanto CR


aumenta em uma unidade, ou seja, quando a dívida do governo sobe
para a classe imediatamente superior.
Limitação: como, sob RLM.4,

∂E (TTM jCR, ...)


= β1
∂CR
a especi…cação (6) impõe que o efeito ceteris paribus de CR em
TTM seja o mesmo em cada nível de CR.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 28 / 38


Incorporação de Informação Ordinal na RLM

Já com a especi…cação

TTM = β0 + δ1 CR1 + δ2 CR2 + δ3 CR3 + δ4 CR4 + outros fatores (7)

em que CRj recebe 1 se CR = j, caso contrário, zero, com


j = 1, 2, ..., 4:

1 Sob RLM.4,
∆E (TTM jCR1 , ...)
= δj , j = 1, ..., 4,
∆CRj

é o efeito esperado em TTM em resposta a uma mudança ceteris


paribus de CR = 0 (categoria base) para CR = j; e
2 Com um teste F , testamos H0 : δ2 = 2δ1 , δ3 = 3δ1 , δ4 = 4δ1 (o
modelo restrito (6) é preferível) contra H1 : o modelo irrestrito (7) é
preferível.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 29 / 38
5. Testando Diferenças da Função de Regressão entre
Grupos
Objetivo: testar se duas populações ou grupos têm a mesma função
de regressão.
Veremos três maneiras equivalentes de realizar o teste.
Como exemplo, consideremos o modelo restrito

aumfGPA = β0 + β1 SAT + β2 emperc + β3 tothrs + u (8)

em que aumfGPA é a nota média …nal em curso superior, SAT é a


nota de ingresso no curso superior, emperc é o percentil de
classi…cação no curso médio (quanto menor o percentil melhor
colocado é o aluno) e tothrs é o total de horas do curso superior.
Os comandos Stata utilizados nos exemplos a seguir estão todos no
arquivo testedechow.do disponível na página web do curso que está
ao lado dos slides da aula 20.
Questão: o modelo é o mesmo para homens e mulheres?
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 30 / 38
Testando Diferenças da Regressão entre Grupos

Assim, o modelo irrestrito é

aumfGPA = β0 + δ0 feminino + β1 SAT + δ1 (feminino SAT ) +


+ β2 emperc + δ2 (feminino emperc ) + β3 tothrs +
+δ3 (tothrs feminino ) + u (9)

em que a variável feminino recebe um se o indivíduo é do sexo


feminino e zero, caso contrário.
Qual a categoria base deste modelo? feminino = 0, portanto, homem.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 31 / 38


5.1. Teste F Direto

Com o Stata obtemos o teste F direto da hipótese conjunta


H0 : δ0 = δ1 = δ2 = δ3 = 0, vide comandos Stata em testchow.do na
página web do curso:
. test feminino femSAT fememperc femtothrs

( 1) feminino = 0
( 2) femSAT = 0
( 3) fememperc = 0
( 4) femtothrs = 0

F( 4, 358) = 8.18
Prob > F = 0.0000

A variável dummy feminino e suas interações são conjuntamente


signi…cantes ou o modelo é diferente para homens e para mulheres.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 32 / 38


5.2. Teste F Indireto

A hipótese de que o modelo é o mesmo para homens e mulheres ou


que o modelo restrito (8) é preferível é formalizada como

H0 : δ 0 = δ 1 = δ 2 = δ 3 = 0 (10)

contra

H1 : pelo menos um delta é diferente de zero,


o modelo irrestrito é preferível

A estatística deste teste F e a sua distribuição são

(Rir2 Rr2 )/(k + 1)


F = F(k +1 ),(n 2 (k +1 ))
(1 Rir2 )/(n 2(k + 1))

em que k é o número de variáveis no modelo restrito.

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 33 / 38


Teste F Indireto
Com a base gpa3.dta do Wooldridge as estimativas MQO do modelo
irrestrito, vide comandos Stata em testchow.do na página web do
curso:
Source SS df MS Number of obs = 366
F(7, 358) = 34.95
Model 53.5391809 7 7.64845442 Prob > F = 0.0000
Residual 78.3545051 358 .218867333 R-squared = 0.4059
Adj R-squared = 0.3943
Total 131.893686 365 .361352564 Root MSE = .46783

aumfGPA Coef. Std. Err. t P>|t| [95% Conf. Interval]

feminino -0.353 0.411 -0.861 0.3898 -1.161 0.454


sat 0.001 0.000 5.807 0.0000 0.001 0.001
femSAT 0.001 0.000 1.949 0.0521 -0.000 0.002
emperc -0.008 0.001 -6.167 0.0000 -0.011 -0.006
fememperc -0.001 0.003 -0.174 0.8621 -0.007 0.006
tothrs 0.002 0.001 2.718 0.0069 0.001 0.004
femtothrs -0.000 0.002 -0.071 0.9433 -0.003 0.003
_cons 1.481 0.207 7.142 0.0000 1.073 1.889

Nenhum variável envolvendo feminino é estatisticamente


individualmente signi…cante a 5%.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 34 / 38
Teste F Indireto
As estimativas MQO do modelo restrito são:

Source SS df MS Number of obs = 366


F(3, 362) = 65.44
Model 46.3786195 3 15.4595398 Prob > F = 0.0000
Residual 85.5150666 362 .236229466 R-squared = 0.3516
Adj R-squared = 0.3463
Total 131.893686 365 .361352564 Root MSE = .48603

aumfGPA Coef. Std. Err. t P>|t| [95% Conf. Interval]

sat 0.001 0.000 7.191 0.0000 0.001 0.002


emperc -0.010 0.001 -8.000 0.0000 -0.012 -0.008
tothrs 0.002 0.001 3.102 0.0021 0.001 0.004
_cons 1.491 0.184 8.117 0.0000 1.130 1.852

(R 2 R 2 ) / (k +1 ) (0,4059 0,3516 )/4


No entanto, como F = (1 Rir2 )/(rn 2 (k +1 )) = (1 0,4059 )/358 =
ir
8, 18 > F5%;4,358 = 2, 40, rejeitamos H0 : δ0 = δ1 = δ2 = δ3 = 0 (o
modelo restrito é preferível) em favor do modelo irrestrito.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 35 / 38
5.3. Teste de Chow

O teste de Chow é uma forma alternativa de se testar


H0 : δ0 = δ1 = δ2 = δ3 = 0.
Em homenagem ao professor Gregory Chow,
http://www.princeton.edu/~gchow/

Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 36 / 38


Teste de Chow
Passo 1: estimamos, separadamente, para a categoria (no caso,
homens h e mulheres m) o modelo:
aumfGPA = β0 + β1 SAT + β2 emperc + β3 tothrs + u
obtendo SQRh , SQRm e a SQR do modelo irrestrito,
SQRir = SQRh + SQRm .
Passo 2: estimamos, usando os dados de todas as categorias juntas,
o modelo restrito
aumfGPA = β0 + β1 SAT + β2 emperc + β3 tothrs + u
obtendo a SQR do modelo restrito, SQRp .
Passo 3: calculamos a estatística do teste
(SQRp (SQRh + SQRm ))/(k + 1)
F = F(k +1 ),(n 2 (k +1 ))
(SQRh + SQRm ) /(n 2(k + 1))
e executamos o teste.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 37 / 38
Teste de Chow
Com comandos Stata em testchow.do na página web do curso,
obtemos:

sqr_p = 85.515067
sqr_ir = 78.354505
gl_ir = 358
q = 4
Festatistica = 8.1791117
pvalor = 2.545e-06
Fcrit5 = 2.3968824

Rejeitamos, como antes H0 , concluindo que os modelos para mulheres


e homens são diferentes.
A limitação desta abordagem do teste de Chow é que se H0 for
rejeitada não será possível saber se foi devido a diferenças nos
interceptos, inclinações ou nos dois.
Portanto, a formulação do teste de Chow com o modelo (9) é
preferível, pois permite responder essas questões.
Moisés Resende Filho (ECO/UnB) RLM: variáveis dummy explicativas 12/08/2022 38 / 38

Você também pode gostar