Você está na página 1de 12

Econometria I (IS 211)

Variáveis Dummy

Lucas Siqueira de Castro


lucascastro@ufrrj.br

Referência

 WOOLDRIDGE, J. Introdução à
econometria: uma abordagem
moderna. São Paulo: Cengage
Learning, 6a edição, 2017, capítulo
7.

Variáveis Dummy

 Variável dummy ou binária


 Fatores qualitativos
 Assume apenas dois valores
 0 quando um evento não ocorre
 1 quando um evento ocorre
 Exemplos
 Sexo (feminino = 1; masculino = 0)
 Status marital (casado = 1; solteiro = 0)
 Aplicação
 Casados ganham mais?

1
Variável Dummy

 Modelo com uma variável


quantitativa (x) e uma variável
dummy
 y = b 0 + d0d + b 1x + u

 Interpretação
 Deslocamento de intercepto
 Se d=0, então y = b0 + b1x + u
 Se d=1, então y = (b0 + d0) + b1x + u

Exemplo de d0 > 0
y = (b 0 + d0) + b 1x
y intercepto = b 0+ d0
d=1
intercepto = b 0

d0
{ d=0

y = b 0 + b 1x
}b 0
x
5

Equação de Salários

 Modelo com uma variável


quantitativa (educ) e uma variável
dummy (feminino)
salárioh = b0 + d0feminino + b1educ + u
 Interpretação
 d0 é a diferença no salário-hora entre
homens e mulheres
 O coeficiente d0 determina se existe
discriminação contra mulheres

2
Exemplo de d0 < 0
feminino = 0
salárioh = b 0 + b 1educ

inclinação = b 1

{
feminino = 1
d0
salárioh =(b 0 + d0)+ b 1educ
} b0
educ
7

Quiz

 Você deveria incluir junto de


feminino a seguinte variável dummy
também na equação de salários:
homem=1, se for homem;
homem=0, se for mulher?
 Resposta: não, porque senão as
variáveis dummy provocariam
colinearidade perfeita
 “Armadilha da variável dummy”

Variável Dummy

 Grupo-base ou grupo de referência


 É o grupo contra o qual são feitas as
comparações
 O valor do grupo de referência é
representado pelo intercepto global (a
constante) da regressão
 Na equação de salários com feminino
como variável dummy
 Homens são grupo-base ou grupo de
referência

3
Testando a Discriminação de Sexo

 Testando a discriminação salarial


por sexo
 Hipótese nula de não existência de
diferença entre homens e mulheres
 H0: d0=0

 Hipótese alternativa de que existe


discriminação contra as mulheres
 H1: d0<0

Exemplo

Interpretação quando y é log(y)

4
Interpretação quando y é log(y)
 Interpretação do coeficiente da dummy
quando y é log(y)
 Interpretação de variação percentual
 Por ex., coeficiente de feminino é -
0,297
 Cálculo aproximado
 Controlando para outros fatores, as mulheres
ganham 100*(0,297)=29,7% a menos que
os homens

Interpretação quando y é log(y)

 Cálculo exato da variação


percentual do coeficiente da dummy
 Coeficiente de feminino é -0,297
 Controlando para outros fatores, as
mulheres ganham 100*(0,297)=29,7%
a menos que os homens

logsaláriohM   logsaláriohH   0,297

Interpretação quando y é log(y)

 Mas a estimativa mais exata leva


em conta a diferença proporcional
nos salários entre mulheres e
homens, mantendo fixos os outros
fatores:
saláriohM  saláriohH   exp 0,297  1  0,257
saláriohH
 O salário da mulher é 25,7% menor do
que dos homens

5
Dummy para Categorias Múltiplas

 Categorias múltiplas
 Num modelo de preços residenciais
hedônicos
 Localização geográfica
 Centro, N, S, L e O
 Inserir 4 variáveis dummy
 N=1; caso contrário, 0
 S=1; caso contrário, 0
 L=1; caso contrário, 0
 O=1; caso contrário, 0
 Centro é a grupo-base
 Representado pela constante

Dummy para Categorias Múltiplas

 O grupo-base é representado pela


constante
 Comparação do valor da dummy com a
constante do grupo-base
 Exemplo: se constante=81.000,00 (esse
é o valor para a região Centro) e se
dSUL=15.000,00 e dNORTE=-7.000,00
 Uma casa na zona Sul vale, em média, 15
mil a mais do que no Centro
 Uma casa na zona Norte vale, em média, 7
mil a menos do que no Centro
 Se houver m categorias, inserir m-1
variáveis dummy

Dummy para Informações Ordinais

 Efeito do risco de crédito


 Varia de 0 (pior) a 4 (melhor)
 Variável ordinal (CR)
 Regressão:
 txdebenture= b0 + b1CR + outros fatores
 Problema
 Interpretação de b1
 O que significa um aumento de 0 para 1 em
CR?
 E de 3 para 4?
 Sem sentido

6
Dummy para Informações Ordinais

 Abordagem melhor
 Definir variáveis dummy para cada
valor de CR
 CR1=1 se CR=1; e zero, caso contrário
 CR2=1 se CR=2; e zero, caso contrário
 etc

 Regressão
 txdebenture = b0 + d1CR1 + d2CR2 + d3CR3
+ d4CR4 + outros fatores + u
 Note que CR0 é o grupo-base

Dummy para Informações Ordinais

 Interpretação
 d1 é a diferença em txdebenture entre
uma empresa com um risco de crédito
1 e uma empresa com um risco de
crédito zero.
 Interpretação análoga para d2, d3 e d4
 Dificuldade se houver muitas
categorias
 Ranking de faculdades
 Não é possível pôr uma variável dummy
para cada posição

Atratividade Física e Salários

 Indicadores de boa aparência física


em uma equação de salários
 Cada pessoa da amostra foi
classificada por um entrevistador
quanto à aparência física (feia,
comum, média, bonita e muito
bonita)
 Mas foram usados só 3 grupos
 Média, abaixo da média, acima da
média

7
Atratividade Física e Salários

 Equação estimada para homens:

𝑙𝑜𝑔 𝑠𝑎𝑙á𝑟𝑖𝑜 = 𝛽 − 0,164𝑎𝑏𝑎𝑖𝑥𝑜𝑚𝑒𝑑 +


0,046
0,016𝑎𝑐𝑖𝑚𝑎𝑚𝑒𝑑 + 𝑜𝑢𝑡𝑟𝑜𝑠𝑓𝑎𝑡𝑜𝑟𝑒𝑠
0,033
 n=700, 𝑅 = 0,403

 Grupo-base é a média
 Outros fatores: educ, perm, exper, estado
civil e raça

Atratividade Física e Salários

 Equação estimada para as mulheres

𝑙𝑜𝑔 𝑠𝑎𝑙á𝑟𝑖𝑜 = 𝛽 − 0,124 𝑎𝑏𝑎𝑖𝑥𝑜𝑚𝑒𝑑 +


0,066
0,035 𝑎𝑐𝑖𝑚𝑎𝑚𝑒𝑑 + 𝑜𝑢𝑡𝑟𝑜𝑠𝑓𝑎𝑡𝑜𝑟𝑒𝑠
0,049

n=409, 𝑅 = 0,330

Interações entre Variáveis Dummy

 Modelo
 log(salárioh)=b0 + d1 feminino +
d2 casado + d3 feminino.casado +
outros fatores + u
 Diferencial de salários entre os 4
grupos
 Se feminino=0 e casado=0
 Grupo de homens solteiros (b0)
 Se feminino=0 e casado=1
 Grupo dos homens casados (b0 + d2)
 Etc

8
Exemplo

Interação de Dummy com Variável


Quantitativa

 Interação de uma dummy com uma


variável quantitativa contínua
 y = b 0 + d0d + b 1x + d1d*x + u

 d=0
 y = b0 + b1x + u
 d=1
 y = (b0 + d0) + (b1+ d1) x + u
 Mudança de inclinação

Exemplo de d0 > 0 e d1 < 0


y
y = b 0 + b 1x
d=0

d=1
y = (b 0 + d0) + (b 1 + d1) x

x
27

9
Interação de Dummy com Variável
Quantitativa

 Exemplo
 log(salarioh) = (b 0 + d0 feminino) + (b1
+ d1 feminino).educ + u
 Se feminino=0
 Intercepto de homens é b0
 b1 inclinação de educ para homens
 Se feminino=1
 Intercepto para mulheres é (b0 + d0)
 d1 mede a diferença no retorno da
educação entre mulheres e homens

Interação de Dummy com Variável


Quantitativa

 Exemplo (cont.)
 Testar se o retorno à educação é o
mesmo entre homens e mulheres:

𝐻 :𝛿 = 0

 O que significa que a inclinação de


log(salárioh) em relação a educ é a
mesma entre homens e mulheres

Modelo de Probabilidade Linear

 Variável dependente dummy


 P(y = 1|x) = E(y|x)
 P(y = 1|x) = b 0 + b1x1 + … + b kxk

 Interpretação de bj
 Mudança na probabilidade de sucesso
quando xj varia
 y estimado é a probabilidade prevista
de sucesso

10
Modelo de Probabilidade Linear

 Problemas
 Previsões de y fora do intervalo [0,1]
 Violação da homocedasticidade
 Cuidado com a inferência (testes t e F)

 Bom início na análise quando y


binário
 Apesar dos problemas

Exemplo

 Modelo de participação da mulher


na força de trabalho

naft = b0 + b1nesprend + b2educ +


b3exper + b4exper2 + b5idade +
b6crianmed6 + b7crianma6 + u

Cuidado com a Interpretação!

 Na estimação do modelo anterior,


b6=-0,262.
 Interpretação:
 Então, se a mulher tiver uma criança
pequena, ela tem uma redução na
probabilidade de estar na força de
trabalho de 26,2%.
 Mas, como o modelo é linear, se ela
tiver 4 filhos:
 -0,262*(4)= -1,048
 Sem sentido!!!

11
12

Você também pode gostar