Você está na página 1de 36

Modelo Linear Geral V

Aula 10

Heij et al., 2004 Captulo 5


Wooldridge, 2011 (4. ed) Captulo 7

ANLISE DE REGRESSO LINEAR MLTIPLA


COM INFORMAO QUALITATIVA:
O USO DA VARIVEL DUMMY

Varivel Dummy
Uma forma de introduzir caractersticas qualitativas em

modelos economtricos consiste na utilizao de variveis


dummy (fictcia, postia), frequentemente chamadas de

variveis binrias ou dicotmicas, uma vez que assumem


apenas um de dois valores em geral 0 ou 1 para indicar a

presena ou ausncia de determinada caracterstica.


3

Varivel Dummy
Vale lembrar que a varivel dummy representa estados ou
nveis de fatores, ou seja representa algo que no possui
valores numricos ou, caso possua, estes valores no tm

realmente um significado numrico.


Assim, uma varivel dummy, D, pode ser descrita da seguinte
maneira:
0, se a caracters tica no estiver presente
D
1, se a caracters tica estiver presente
4

Voltando Empresa TEMCO

A senhorita Rose Jolie, gerente do departamento de RH da


empresa TEMCO, gostaria de estimar os parmetros de um
modelo de regresso linear que levasse em considerao as

variveis explicativas educ e dept na explicao da varivel


resposta salrio. Auxilie a senhorita Jolie nesta proposio.

Voltando Empresa TEMCO


Apenas para lembrar, a senhorita Jolie, coletou informaes
de uma amostra aleatria de 46 funcionrios da empresa,
sobre as seguintes variveis:
id nmero cadastral do funcionrio;
salario anual, em dlares;
anosemp tempo (em anos) na empresa;
expprev experincia anterior (em anos);
educ anos de estudo aps o segundo grau;
sexo (feminino = 0, masculino = 1);
dept departamento no qual o funcionrio atua
(Compras = 1, Engenharia = 2, Propaganda = 3, Vendas = 4);
super nmero de empregados sob responsabilidade do empregado.

Voltando Empresa TEMCO


primeira vista, como existem quatro departamentos na

empresa TEMCO, Rose Jolie poderia optar por usar a varivel


dept, com os valores 1, 2, 3 e 4.

Dessa maneira,

salrio 1 2 educ 3 dept


No entanto, ao fazer isto, Rose Jolie estaria introduzindo uma
ideia de espaamento, que ficar mais clara nos resultados
descritos nos slides a seguir.

Voltando Empresa TEMCO


Escrevendo a equao de regresso de interesse, para cada
um dos departamentos, temos que:

E(salrio|educ, dept 1 ) ( 1 3 ) 2 educ


E ( salrio | educ, dept 2) ( 1 2 3 ) 2 educ
E ( salrio | educ, dept 3) ( 1 3 3 ) 2 educ
E ( salrio | educ, dept 4) ( 1 4 3 ) 2 educ
8

Voltando Empresa TEMCO


Dessa forma, admitiramos, por exemplo, que

E ( salrio | educ, dept 2) E(salrio|educ, dept 1 )


E ( salrio | educ, dept 4) E ( salrio | educ, dept 3)
3
ou seja, que a diferena entre os salrios esperados dos

funcionrios dos departamentos de Engenharia e Compras


a mesma que a dos funcionrios dos departamentos de
Propaganda e Engenharia, mantendo constante o tempo de

escolaridade.

Voltando Empresa TEMCO


Assim, se Rose Jolie utilizasse dept da forma como foi
construda, ento ela estaria impondo uma restrio ao

modelo, que no sabemos se real.


Ainda, se a ordem das categorias da varivel departamento

fosse alterada, estaramos propondo um novo conjunto de


restries ao modelo, o que muito provavelmente nos levaria
a resultados completamente diferentes do caso anterior.
10

Voltando Empresa TEMCO

Portanto, o ideal seria utilizar um grupo de variveis que


representasse os estados de interesse, que no nosso caso
no apresentam nenhuma ordenao natural, de tal sorte a
nunca alterar o resultado final, qualquer que seja o critrio de
criao adotado para a construo destas variveis.

11

Varivel Dummy

A soluo , portanto, trabalharmos com algumas variveis


dummy.

No geral, se temos p estados, devemos trabalhar com p 1


variveis dummy.

Varivel Dummy
Para o nosso exemplo, poderamos definir as variveis
dummy DC, DE e DP da seguinte maneira, para representar os
estados da varivel departamento:

dept

DC

DE

DP

Compras
Engenharia
Propaganda
Vendas

1
0
0
0

0
1
0
0

0
0
1
0
13

Varivel Dummy
Assim, partindo do modelo de regresso linear
yi = 1 + 2 educi + 1 DCi + 2 DEi + 3 DPi + I

temos que:
Compras: yi = (1 + 1) + 2educi + i

Engenharia: yi = (1 + 2) + 2educi + i
Propaganda: yi = (1 + 3) + 2educi + i

Vendas: yi = 1 + 2 educi + i

14

Varivel Dummy
Do slide 14, o parmetro 1, por exemplo, pode ser
interpretado como a diferena esperada entre os salrios dos
profissionais das reas de

Compras e Vendas, que

apresentam o mesmo tempo de escolaridade.

Ainda, vale lembrar que, estamos admitindo que o acrscimo


mdio no salrio correspondente ao acrscimo em um ano
de escolaridade o mesmo para os quatro departamentos.
15

Varivel Dummy
Variveis binrias como DC, DE e DP, que so incorporadas
num

modelo

de

regresso

para

dar

conta

de

um

deslocamento do intercepto como resultado de algum fator


qualitativo, so chamadas de variveis binrias de intercepto
ou, simplesmente, variveis dummy de intercepto.

16

Varivel Dummy
Como criar variveis dummy no Eviews?
Exemplo
(criao da varivel DC)
(i) Clicar em QUICK;
(ii) Depois em GENERATE SERIES;
(iii) Digitar DC=(dept=1).
O que aconteceu ao realizar o procedimento anterior?
17

Voltando Empresa TEMCO


Estimao dos Parmetros do Modelo de Interesse

salario 19235,72 2952,96 educ 5393,97 DC 8065,52 DE 6664,36 DP

18

Voltando Empresa TEMCO


y vendas 19235 ,72 2952 ,96 educ
y compras 24629 ,69 2952 ,96 educ
y engenharia 27301,24 2952 ,96 educ
y propaganda 25900 ,08 2952 ,96 educ

Interprete as estimativas dos parmetros


19

Observao 1
Vale recordar que a escolha dos valores de DC, DE e DV no nica.
Entretanto, qualquer que seja a escolha, os resultados finais da
estimao devero ser sempre os mesmos.

Observao 2
INTERPRETAO DOS COEFICIENTES LIGADOS S VARIVEIS DUMMY
Correspondem diferena em relao ao valor do intercepto e, portanto,

categoria que ele representa (benchmark, ou categoria de referncia)


20

Exerccio
Num modelo de regresso linear que j que
acomodou educ como varivel explicativa para
salrio, seria interessante inserir a varivel sexo em
tal modelo?
70000

Salrio (US$)

60000

50000

40000

SEXO

30000

masculino
20000
-2

feminino
0

10

Anos de estudos aps o segundo grau

12

14

21

Exerccio (cont.)
Sexo
Masculino
Feminino

DS
1
0

Modelo:

yi = 1 + 2 educi + 3 DSi + i
Feminino: yi = 1 + 2educi + i
Masculino: yi = (1 + 3) + 2educi + i

22

Exerccio (cont.)
Estimao dos Parmetros do Modelo de Interesse

23

Exerccio (cont.)
Forma usual

salrio 26040,75 2933,16 educ 2238,26 DS

y fem 26040 ,75 2933 ,16 educ


y masc 23802 ,49 2933 ,16 educ

Interprete as estimativas dos parmetros


24

Modelo estimado com EDUC e SEXO


45.000

40.000

35.000
Fem
M asc
30.000

25.000

20.000
0

Deste modo, estamos admitindo que a reta de regresso


do salrio em funo da educao para homens
paralela reta de regresso para as mulheres.
25

Varivel Dummy
de
Inclinao
26

Varivel Dummy de Inclinao


No

exemplo

anterior,

utilizando

variveis

dummy

de

intercepto, ajustamos quatro retas com a mesma inclinao e


diferentes interceptos.

Veremos agora como podemos ajustar um modelo mais


geral, no qual, por exemplo, tambm as inclinaes podem
ser distintas.
27

Varivel Dummy de Inclinao


Sejam DC, DE e DP as variveis dummy do exemplo
anteriormente citado.
Considere, ainda, o seguinte modelo
y = 1 + 2 educ +

+ DC(0 + 1educ) + DE(2 + 3educ) + DP(4 + 5educ) +

28

Varivel Dummy de Inclinao


Assim, para cada um dos departamentos, teramos os
seguintes modelos de regresso:
yvendas = 1 + 2educ +
ycompras = (1 + 0) + (2 + 1)educ +
yengenharia = (1 + 2) + (2 + 3)educ +
ypropaganda = (1 + 4) + (2 + 5)educ +
29

Varivel Dummy de Inclinao


Ou seja, o modelo de regresso linear

y = 1 + 2 educ + DC(0 + 1educ) +


+ DE(2 + 3educ) + DP(4 + 5educ) +

faz com que sejam ajustadas quatro retas com interceptos e


inclinaes diferentes.

30

Varivel Dummy de Inclinao


Observe que o modelo anterior pode ser reescrito como
y = 1 + 2educ + 0DC + 2DE + 4DP +
+ 1educDC + 3educDE + 5educDP +

Donde, no difcil observar que os parmetros associados


s variveis dummy DC, DE e DP, isoladamente, sero
responsveis pela alterao dos interceptos.
Ainda, os parmetros associados aos produtos de DC, DE e
DP

por

educ

sero

coeficientes angulares.

responsveis

pela

alterao

dos

Varivel Dummy de Inclinao


Finalmente, as variveis educDC, educDE

e educDP so

chamadas de variveis de interao, pois so responsveis


por capturar o efeito de interao entre a escolaridade e
departamento sobre o salrio. Traduzindo, o impacto na
variao do salrio esperado de indivduos de setores
diferentes, dada a variao de um ano na escolaridade
desses indivduos, podem ser diferentes.
32

Varivel Dummy de Inclinao


Modelo Estimado

33

Varivel Dummy de Inclinao


Resultado da estimao com EDUC, DEPT e interaes

y vendas 28013 ,06 1197 ,49 educ


y compras 19121,77 4211,91 educ
y engenharia 24114 ,16 3545 ,25 educ
y propaganda 26274 ,73 2878 ,03 educ
Interprete as estimativas dos parmetros
34

Observao
As quatro retas ajustadas simultaneamente, neste exemplo,
so equivalentes s retas que obteramos se ajustssemos
separadamente um modelo para cada departamento.

No entanto, este procedimento tem a vantagem de facilitar a


construo

dos

testes

de

hipteses

envolvendo

simultaneamente parmetros das quatro retas.


35

EXERCCIO PARA ENTREGA

Ajuste um modelo de regresso para a varivel salrio que


contenha as variveis explicativas educ, anosemp, sexo e
dept. Inclua, ainda, neste modelo todas as interaes de
primeira ordem. Escreva o modelo estimado e interprete os
resultados.

36

Você também pode gostar