Você está na página 1de 157

Modelos de regresso

com variveis binrias


(dummies)
1

Vamos estudar a introduo de


variveis qualitativas, chamadas de
variveis Dummies ou Binrias.
Entram no modelo como variveis
independentes.
2

EXEMPLOS DE VARIVEIS DUMMIES

Para fatores qualitativos (categorias):

sexo
raa
cor
religio
nacionalidade
regio geogrfica ou localizao
guerras
terremotos
greves
partido poltico
mudana nas polticas de governo, etc.
4

Para variveis contnuas expressas


em classes:
Faixa etria
Classe de renda
Nvel de escolaridade

Para construir uma varivel dummy,


tem-se que quantificar um atributo
construindo uma varivel artificial,
que assumam valores 1 ou 0.

A ausncia de um atributo ou
caracterstica, d-se o valor 0 (zero);

A presena de um atributo ou
caracterstica, d-se o valor 1 (um).

Variveis binrias so essencialmente


um dispositivo para classificar dados
em categorias mutuamente
exclusivas como homem ou mulher.

O preo de uma casa (Y) explicado


como uma funo de suas caractersticas,

tais como:
Tamanho
Localizao
Nmero de quartos
9

Consumo de Cerveja (Y) depende da


renda e da estao climtica.

10

Se um modelo de regresso conter

variveis explicativas que so


exclusivamente dummies ou
qualitativas, chamamos-a de modelo
de anlise de varincia, ANOVA.
11

Os modelos ANOVA devem ser usados

para avaliar o significado estatstico da


relao entre um regressando

quantitativo (Y) e regressores binrios ou


qualitativos.
12

Eles so usados com frequncia para


comparar as diferenas nos valores
mdios de dois ou mais grupos ou

categorias.

13

Para ilustrar o modelo ANOVA, vejamos o


seguinte exemplo:

Salrios dos professores da escola pblica


segundo regio geogrfica.

14

A tabela 1 apresenta dados referentes ao


salrio mdio (em US$) dos professores das
escolas pblicas (dos Estados Unidos) de 50
estados e do Distrito de Colmbia no ano de
1986.

15

Essas 51 reas esto divididas em trs


regies geogrficas:

Nordeste e Centro-Norte (ao todo 21


estados);
Sul (17 estados);
Oeste (13 estados).
16

Tabela 1 Salrio Mdio dos professores da escola pblica, por estado, 1986.
Salrios
19583
20263
20325
26800
29470
26610
30678
27170
25853
24500
24274
27170
30168
26525
27360
21690
21974
20816
18095
20939
22644
24624
27186
33990
23382
20627
22795
21570
22080
22250
20940
21800
22934
18443
19538
20460
21419
25160
22482
20969
27224
25892
22644
24640
22341
25610
26015
25788
29132
41480
25845

D1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1

D2

D3

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0

17

Imagine que desejamos verificar


se o salrio mdio anual dos
professores das escolas pblicas

difere segundo as regies em que


o pas foi dividido.
18

Se calcularmos uma mdia aritmtica simples


dos salrios mdios vigentes nessas regies,

obteremos os seguintes resultados:


US$ 24.424,14 (Nordeste e Centro-Norte)

US$ 22.894,00 (Sul)


US$ 26.158,62 (Oeste)

19

Esses nmeros parecem diferentes,


mas o sero sob o aspecto
estatstico?

20

H vrias tcnicas estatsticas para


comparar dois ou mais valores mdios,
chamadas, em geral, de anlise de

varincia.

21

Vamos mostrar como comparar esses


valores mdios atravs da ANLISE DE
REGRESSO.

22

Para ver isso, imaginemos o seguinte modelo:

Yi 1 2 D2i 3 D3i ui
onde:
Yi = salrio (mdio) dos professores das escolas pblicas no
estado i
D2i = 1 para estados das regies Nordeste e Centro-Norte
D2i = 0 para as demais
D3i = 1 para os estados da regio Sul
D3i = 0 para os demais
23

Tabela 1 Salrio Mdio dos professores da escola pblica, por estado, 1986.
Salrios
D2
D3
19583
20263
20325
26800
29470
26610
30678
27170
25853
24500
24274
27170
30168
26525
27360
21690
21974
20816
18095
20939
22644
24624
27186
33990
23382
20627
22795
21570
22080
22250
20940
21800
22934
18443
19538
20460
21419
25160
22482
20969
27224
25892
22644
24640
22341
25610
26015
25788
29132
41480
25845

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0

24

Observe que Yi 1 2 D2i 3 D3i ui


se assemelha aos modelos de regresso

mltipla j vistos, exceto que, em lugar de


regressores quantitativos, s h regressores

qualitativos ou binrios, que assumem o


valor 1 se a observao pertence a uma
categoria especfica e zero em caso contrrio.
25

O que o modelo

Yi 1 2 D2i 3 D3i ui

mostra?

Supondo que o termo de erro satisfaa as


premissas de MQO de praxe, tomando as
esperanas dos dois lados, obtemos:
26

Salrio mdio dos professores do Nordeste e


Centro-Norte:

Yi 1 2 D2i 3 D3i ui
E (Yi | D2i 1, D3i 0) 1 2
Lembrando que E(ui) = 0
27

Salrio mdio dos professores do Sul:

Yi 1 2 D2i 3 D3i ui
E (Yi | D2i 0, D3i 1) 1 3

28

O salrio mdio dos professores do Oeste:

Yi 1 2 D2i 3 D3i ui

E (Yi | D2i 0, D3i 0) 1

29

Em outras palavras, o salrio mdio dos


professores das escolas pblicas da regio
Oeste dado pelo intercepto 1 da regresso
mltipla Yi 1 2 D2i 3 D3i ui

30

Yi 1 2 D2i 3 D3i ui
Os coeficientes angulares 2 e 3 dizem qual
a diferena dos salrios mdios dos
professores das regies Nordeste e CentroNorte e da regio Sul em relao aos dos

professores do Oeste.
31

Os resultados do clculo da regresso so:


Yt 26158,62 1734,473D2i 3264,615D3i
(0,0000)

(0,2330)

(0,0349) = p

R2 = 0,0901

32

Esses resultados mostram que:

1) os salrios mdios dos professores do Oeste


so de cerca de US$ 26158,00;
2) o dos professores do Nordeste e CentroNorte est abaixo desse valor em US$
1734,00; e
3) os do Sul so US$ 3265,00 menores.
33

Os salrios mdios destas ltimas duas


regies podem ser facilmente conhecidos
se somarmos algebricamente essas

diferenas ao salrio mdio dos


professores do Oeste.

34

Mas, como sabemos que esses salrios

mdios so estatisticamente diferentes


dos salrios mdios dos professores do
Oeste, a categoria de referncia?

35

O que temos de fazer verificar se os


coeficientes angulares so estatisticamente

significativos.
Yt 26158,62 1734,473D2i 3264,615D3i
(0,0000)

(0,2330)

(0,0349) = p

R2 = 0,0901

36

A concluso geral que os salrios mdios


dos professores das escolas pblicas do Oeste

e das regies Nordeste e Centro-Norte so


quase iguais, mas os salrios dos professores
do Sul so estatisticamente mais baixos em
cerca de US$ 3265,00.
37

As variveis binrias apenas mostram as


diferenas, quando elas existem, mas no
sugerem as suas razes.

Diferenas na escolaridade, nos ndices de


custo de vida, em gnero e raa podem afetar
de alguma forma as disparidades observadas.
38

Salrios Mdios

1 $26158,00

2 $24424,00

3 $22894,00

Regies
Oeste

Nordeste e Centro-Norte

Sul

Figura 1 Salrios mdios (em US$) dos professores das escolas pblicas em trs regies
dos Estados Unidos.

39

CAUTELA NO USO DE

VARIVEIS BINRIAS

40

Cautela
1 uma varivel dummy suficiente para
distinguir duas categorias.

41

Relembrando que:

Yi 1 2 D2i 3 D3i ui
onde:
Yi = salrio (mdio) dos professores das escolas pblicas no
estado i
D2i = 1 para estados das regies Nordeste e Centro-Norte
D2i = 0 para as demais
D3i = 1 para os estados da regio Sul
D3i = 0 para os demais

42

Suponha que escrevssemos o modelo:

Yi 1 2 D2i 3 D3i ui
como:

Yi 1 1D1i 2 D2i 3 D3i ui


onde D1i assumisse o valor 1 para os
estados do Oeste e 0 para os demais.
43

Assim, contaramos com uma varivel


binria para cada uma das trs
regies.

Usando os dados da tabela 1, o


computador se recusaria a calcular
essa regresso.
44

Tabela 1 Salrio Mdio dos professores da escola pblica, por estado, 1986.
Salrios
19583
20263
20325
26800
29470
26610
30678
27170
25853
24500
24274
27170
30168
26525
27360
21690
21974
20816
18095
20939
22644
24624
27186
33990
23382
20627
22795
21570
22080
22250
20940
21800
22934
18443
19538
20460
21419
25160
22482
20969
27224
25892
22644
24640
22341
25610
26015
25788
29132
41480
25845

D1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1

D2

D3

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0

45

A razo que, em

Yi 1 1D1i 2 D2i 3 D3i ui


ao incluir uma varivel binria para cada
categoria ou grupo e tambm um
intercepto, nos deparamos com um caso de
colinearidade perfeita, isto , uma relao
linear exata entre as variveis.

46

Portanto, se uma varivel qualitativa tem m


categorias, s podemos introduzir (m 1)
variveis binrias.

Quando no seguimos essa regra nos


deparamos com a ARMADILHA DAS VARIVEIS
BINRIAS.
47

Cautela
2 A categoria para a qual no se designa uma
varivel binria conhecida como categoria
base, de referncia, de controle, de
comparao ou omitida.
E todas as comparaes so feitas em relao
a ela.

48

Cautela
3 O valor do intercepto (1) representa o
valor mdio da categoria base ou de
referncia.

49

Cautela
4 Os coeficientes das variveis binrias em

Yi 1 2 D2i 3 D3i ui
so conhecidos como coeficientes diferenciais
de intercepto porque eles mostram de quanto o
valor do intercepto que recebe o valor 1 difere do

coeficiente da categoria de referncia.

50

Cautela
5 Se uma varivel qualitativa tem mais de

uma categoria, a escolha da categoria de


referncia depende apenas do

pesquisador.

51

Cautela
6 - H uma forma de contornar a armadilha

das variveis binrias, que incluir tantas


variveis binrias quantas forem as

categorias, desde que no se inclua o


intercepto no modelo.

52

Cautela
Assim:

Yi 1D1i 2 D2i 3 D3i ui


elimina o problema de colinearidade
perfeita.

53

suprimindo o intercepto e incluindo


uma varivel binria

para cada

categoria, obtemos diretamente os


valores

mdios

das

diversas

categorias.
54

Os resultados para os dados de nosso


exemplo so:
Yi 26158,62D1i 24424,14D2i 22894D3i
(23,1795)

(27,5072)

(23,1987) = t

R2 = 0,0901

55

7 O que melhor:

(a) incluir uma varivel binria para cada


categoria e omitir o intercepto?
(b) incluir o termo de intercepto e apenas
(m 1) variveis binrias, onde m o nmero
de categorias da varivel binria?
A equao com intercepto mais conveniente.
56

Porque permite tratar mais facilmente as


questes em que estamos mais interessados;

Isto , saber se a categorizao faz diferena e, se


fizer, de quanto ela .
Para saber se a categorizao faz diferena ou
relevante, aplica-se o teste t ao coeficiente da
varivel binria para verificar se diferente de
zero.
57

Modelos ANOVA com duas


variveis qualitativas.

58

Seja:
Y = salrio por hora ($)
D1 = estado civil; 1 = casado, 0 = outros
D2 = regio de residncia; 1 = sul, 0 = outras
A equao ser:

Yi 1 2 D1i 3 D2i ui
59

A equao do ganho por hora em relao a


estado civil e regio de residncia :

Yi 8,8148 1,0997 D2 i 1,6729 D3i


( 0 , 0000)

( 0 , 0182)

( 0 , 0006) valorp

R2 = 0,0322

60

Qual a categoria de referncia nesse


caso?
no casado, no residente no sul
Essas duas categorias so omitidas, mas
todas as comparaes so feitas em
relao a esse grupo.

61

Os ganhos mdios por hora so


estatisticamente diferentes em
comparao categoria-base, pois

todos os interceptos diferenciais so


estatisticamente significativos.
62

REGRESSES COM VARIVEIS


QUANTITATIVAS E
QUALITATIVAS: OS MODELOS
ANCOVA.

63

Na maioria dos estudos


econmicos, um modelo de
regresso contm algumas
variveis explanatrias
quantitativas e outras
qualitativas.

64

Os modelos de regresso onde


se misturam as variveis
quantitativas e qualitativas so
chamados de modelos de anlise
de covarincia (ANCOVA).

65

As variveis dummies podem ser usadas

para captar variaes (mudanas) no


intercepto, variaes na declividade e
variaes em ambos, intercepto e

declividade.

66

Variveis Dummies
A forma aditiva.
Quando a mudana temporal ou a condio
altera apenas o termo constante do modelo,

a varivel incorporada aditivamente.

67

Variveis Dummies
A forma aditiva ou paralela.

Yi 1 2 X i ui

Yi 1 2 Di 3 X i ui

Yi (1 2 ) 3 X i ui
68

Grfico de uma regresso aditiva ou paralela

Yi (1 2 ) 3 X i ui

Yi 1 2 X i ui
1 2

69

Voltando ao exemplo do salrio mdio dos


professores das escolas pblicas dos EUA;
Suponha que ele pode no ser diferente nas
trs regies quando se leva em conta
quaisquer variveis que no podem ser
padronizadas entre as regies;
Veja por exemplo, a varivel gastos das
autoridades locais com a escola pblica.
70

O modelo de regresso ser:

Yi 1 2 D2i 3 D3i 4 X i ui
Yi = salrio mdio anual dos professores das escolas
pblicas do estado i, em US$;
Xi = gastos com o ensino pblico, em US$ por aluno;
D2i = 1, se o estado se localiza na regio nordeste ou
centro-norte;
= 0, nos demais casos

D3i = 1, se o estado se localiza na regio sul;


= 0, nos demais casos
71

Tabela 1 Salrio Mdio dos professores da escola pblica, por estado, 1986.
Salrios
Gastos
D2
19583
20263
20325
26800
29470
26610
30678
27170
25853
24500
24274
27170
30168
26525
27360
21690
21974
20816
18095
20939
22644
24624
27186
33990
23382
20627
22795
21570
22080
22250
20940
21800
22934
18443
19538
20460
21419
25160
22482
20969
27224
25892
22644
24640
22341
25610
26015
25788
29132
41480
25845

3346
3114
3554
4642
4669
4888
5710
5536
4168
3547
3159
3621
3782
4247
3982
3568
3155
3059
2967
3285
3914
4517
4349
5020
3594
2821
3366
2920
2980
3731
2853
2533
2729
2305
2642
3124
2752
3429
3947
2509
5440
4042
3402
2829
2297
2932
3705
4123
3608
8349
3766

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

D3
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0

72

Observe que a regio oeste a categoria de


referncia;
Observe tambm, que alm dos dois
regressores qualitativos, temos uma varivel
quantitativa X, que, no contexto dos modelos
ANCOVA, conhecida como covarivel.

73

Os resultados do modelo estimado so os


seguintes:
Yi 13269,11 1673,514 D2i 1144,157 D3i 3,2889 X i
( 9,5115)

( 2, 0889)

( 1, 3286)

(10, 3539) t

R2 = 0,7266
n = 51
tc = 2,021

74

Graficamente, tem-se:
Y

Oeste
Sul
Nordeste
e CentroNorte

13269

12125

11595

X
Salrio dos professores da escola pblica (Y) e gastos por aluno com ensino (X)
75

Variveis Dummies
B forma multiplicativa ou interativa.

Yi 1 2 X i ui

Yi 1 2 X i 3 Di X i ui

Yi 1 (2 3 ) X i ui
76

Grfico de uma regresso multiplicativa ou concorrente

Yi 1 (2 3 ) X i ui

Yi 1 2 X i ui

1
X
77

Seja o seguinte exemplo:


Y = preo (R$)
X = tamanho da casa (m2)
D = 1 se a propriedade est em uma
vizinhana desejvel (boa
localizao)
D = 0 se a propriedade est em uma
vizinhana no desejvel
78

Na vizinhana desejvel, o preo de uma casa


por metro quadrado (2 + 3)

2 o preo em outras localizaes

Yi 1 2 X i 3 Di X i ui

3 a diferena no preo por metro quadrado


nas duas localizaes (positivo, se uma
vizinhana mais desejvel do que a outra)
79

Variveis Dummies
C forma mista ou dessemelhante.

Yi 1 2 X i ui

Yi 1 2 Di 3 X i 4 Di X i ui

Yi (1 2 ) (3 4 ) X i ui
80

Grfico de uma regresso mista ou dessemelhante

Yi 1 2 Di 3 X i 4 Di X i ui
Y

Yi 1 2 X i ui

1 2

1
X

81

A interpretao dos coeficientes


de variveis Dummy explicativas
quando a varivel dependente
expressa como lnY.

82

Seja o seguinte exemplo:


Y = preo de imvel (casa)
X2 = tamanho do terreno
X3 = quantidade de domitrios
Di = 1 casa no estilo colonial
Di = 0 caso contrrio
A equao ser:

ln Yi 1 2 ln X 2i 3 X 3i 4 Di ui
83

A equao estimada ser:


ln Yi 1,35 0,168 ln X 2i 0,027 X 3i 0,054Di
( 0 , 65)

( 0 , 038)

( 0 , 029)

( 0 , 045)

n = 88
R2 = 0,649

84

Qual o significado de 4 ?

Para nveis dados de X2 e X3, a diferena em


lnY entre um imvel de estilo colonial e outro
de outro estilo 0,054.
Isso significa prever que um imvel de estilo
colonial seja vendido por cerca de 5,4% a
mais, mantendo-se constante todos os outros
fatores.
85

Se quiser verificar a diferena


percentual exata em Y previsto
quando D = 1 versus D = 0, tem-se
que:

100 [exp(n ) 1]

86

Assim, o valor de
ser:

na equao estimada
4

ln Yi 1,35 0,168 ln X 2i 0,027 X 3i 0,054Di


( 0 , 65)

( 0 , 038)

( 0 , 029)

( 0 , 045)

100 [exp(0,054) 1]

A diferena percentual
exata
ser:
5,548%
) 1]
100

[exp(

n um imvel de estilo colonial seja


Isso significa prever que
vendido por cerca de 5,5% a mais, mantendo-se constante
todos os outros fatores.
87

EFEITOS DE INTERAO COM


O USO DE VARIVEIS
BINRIAS

88

Considere o seguinte modelo:

Yi 1 2 D2i 3 D3i X i ui
Y = salrios-hora em US$;
X = escolaridade (anos de freqncia escola);
D2 = 1 mulheres;
D2 = 0 homens;
D3 = 1 no brancos e hispnicos;
D3 = 0 outros.
89

Nas duas variveis binrias, verifica-se que:


O salrio mdio maior para os homens,
quer seja no brancos e hispnicos ou no;
Do mesmo modo, os no brancos/ hispnicos
recebem salrios mdios menores, isso se
verificar tanto no caso de homens como no
de mulheres.
90

Observe que h uma interao entre as


duas variveis qualitativas D2 e D3.

91

A regresso Yi 1 2 D2i 3 D3i X i ui estimada :


Yi 0,26100 2,3606 D2i 1,7327 D3i 0,8028 X i
( 0, 2357)

( 5, 4873)

( 2,1803)

( 9, 9095)

R2 = 0,2032
n = 528

Pode-se verificar que os coeficientes diferenciais de


intercepto so estatisticamente significativos, que apresentam os
sinais esperados e que a escolaridade tem um forte efeito positivo
sobre o salrio-hora.
A equao estimada mostra, ceteris paribus, os ganhos
mdios das mulheres por hora so inferiores em cerca de US$
2,36 e os dos trabalhadores no brancos/hispnicos so US$ 1,73
menores.

92

Portanto, seu efeito sobre Y mdio pode no ser apenas aditivo,


mas tambm multiplicativo.

Yi 1 2 D2i 3 D3i 4 ( D2i D3i ) X i ui


Y = salrios-hora em US$;
X = escolaridade (anos de freqncia escola);
D2 = 1 mulheres;
D2 = 0 homens;
D3 = 1 no brancos e hispnicos;
D3 = 0 outros.
93

Assim:
E(Yi | D2i 1, D3i 1, X i ) (1 2 3 4 ) X i

que a funo de salrio-hora mdio de mulheres no


brancas e hispnicas.

94

Observe que:

2 = efeito diferencial de pertencer ao gnero


feminino;
3 =efeito diferencial de ser no branco/
hispnico;
4 = efeito de ser mulher no branca/
hispnica.

95

regresso

Yi 1 2 D2i 3 D3i 4 ( D2i D3i ) X i ui

estimada :
Yi 0,26100 2,3606 D2i 1,7327 D3i 2,1289 D2i D3i 0,8028 X i
( 0, 2357)

( 5, 4873)

( 2,1803)

(1, 7420)

( 9, 9095)

R2 = 0,2032
n = 528

Se considerarmos todos os estimadores significativos,


somando os trs coeficientes binrios, obteremos -1,9464, o que
significa que os salrios-hora mdios de trabalhadoras no
brancas/ hispnicas so cerca de US$ 1,96 inferiores, o que est
entre o valor de -2,3605 (apenas diferena de gnero) e
-1,7327 (apenas diferena racial).

96

Exemplos de efeito interao:


Estado civil e gnero
Mulher e casada

Gnero e raa
Homem e branco

97

A VARIVEL BINRIA COMO


ALTERNATIVA AO TESTE DE
CHOW

98

O teste de Chow utilizado para


o exame da estabilidade
estrutural de um modelo de
regresso.

99

O exemplo empregado foi poltica de


investimentos de duas grandes
organizaes, Brastemp e Electrolux.
Essas firmas so concorrentes e
produzem muitos produtos do mesmo
tipo, da podermos indagar se elas tem
estratgias semelhantes de investimento.

100

A tabela a seguir apresenta dados


para os anos de 1994 a 2014 para
essas duas organizaes.

101

Tabela Sries temporais de Investimento (Y), valor da firma (X2) e estoque de


capital (X3), para as firmas Brastemp e Eletroclux.

Anos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Y
33,1
45
77,2
44,6
48,1
74,4
113
91,9
61,3
56,8
93,6
159,9
147,2
146,3
98,3
93,5
135,2
157,3
179,5
189,6

Brastemp
X2

X3

1170,6
2015,8
2803,3
2039,7
2256,2
2132,2
1834,1
1588
1749,4
1687,2
2007,7
2208,3
1656,7
1604,4
1431,8
1610,5
1819,4
2079,7
2371,6
2759,9

97,8
104,4
118
156,2
172,6
186,6
220,9
287,8
319,9
321,3
319,6
346
456,4
543,4
618,3
647,4
671,3
726,1
800,3
888,9

Y
12,93
25,9
35,05
22,89
18,84
28,57
48,51
43,34
37,02
37,81
39,27
53,46
55,56
49,56
32,04
32,24
54,38
71,78
90,08
68,6

Eletroclux
X2

X3

191,5
516
729
560,4
519,9
628,5
537,1
561,2
617,2
626,7
737,2
760,5
581,4
662,3
583,8
635,2
723,8
864,1
1193,5
1188,9

1,8
0,8
7,4
18,1
23,5
26,5
36,2
60,8
84,4
91,2
92,4
86
111,1
130,6
141,8
136,7
129,7
145,5
174,8
213,5
102

As variveis para cada uma, em dlares de


1997, so:
Y = investimento bruto em fbrica e
equipamento
X2 = valor da firma = valor das aes ordinrias
e prefernciais
X3 = estoque de capital
A funo simples de investimento :

Yt 1 2 X 2t 3 X 3t ut
103

Combinando os dados das duas firmas,


temos 40 observaes;

Mas essa combinao s ser vlida se


os parmetros de regresso e as
varincias dos erros forem os mesmos
para ambas as organizaes

104

Se esses parmetros no so idnticos, e,


mesmo assim, combinarmos os dados,

estaremos impondo que as funes de


investimento das duas firmas so
idnticas, quando, de fato, no o so.
105

Os estimadores de mnimos
quadrados dos parmetros do
modelo restrito
sero ento tendenciosos e
inconsistentes.

Yt 1 2 X 2 t 3 X 3t ut
106

Com auxlio do teste de Chow,


podemos testar se as funes de
investimento para as duas firmas so
idnticas ou no.

107

Seja:
D = 1 para as 20 observaes da
Electrolux
D = 0 caso contrrio

108

Incluimos, ento, uma varivel


binria de intercepto e um conjunto
completo de variveis binrias de
inclinao. (modelo no restrito)
Yt 1 1 Dt 2 X 2t 2 Dt X 2t 3 X 3t 3 Dt X 3t ut

109

Resultado do modelo restrito:

Yt 17,872 0,0152 X 2t 0,1436 X 3t


( 2 , 544)

( 2 , 452)

( 7 , 719)

SQE 16563,00

Yt 1 2 X 2

110

Resultado do modelo no restrito:

Yt 9,9563 9,4469 Dt 0,0266 X 2t 0,0263Dt X 2t 0,1517 X 3t 0,0593Dt X 3t


( 0 , 421)

( 0 , 328)

( 2 , 265)

( 0 , 767)

( 7 , 837)

( 0 , 507)

SQE 14989,82

Yt 1 1 Dt 2 X 2 t 2 Dt X 2 t 3 X 3t 3 Dt X 3t ut

111

A estatstica de teste para uma hiptese


conjunta :
SQE
F

SQE NR
J
SQE NR
nk
R

j o nmero de hipteses conjuntas.


H0 = 1 = 0, 2 = 0, 3 = 0
H1 = ao menos um dos i # 0
112

A estatstica de teste para uma hiptese


conjunta :

16563,00 14989,82
F

3
14989,82
40 6

1,1894

Fc = 2,8826

F < Fc; no podemos rejeitar a hiptese


nula
Ou seja, a hiptese de que as funes de
investimento para a Brastemp e
Eletroclux so idnticas.

113

As vantagens da tcnica das variveis binrias


sobre o teste de Chow so:

1 - Precisamos efetuar apenas uma regresso


porque as regresses individuais podem ser
derivadas facilmente dela;

114

As vantagens da tcnica das variveis binrias


sobre o teste de Chow so:

2 a regresso:
pode ser empregada para testar vrias
hipteses.

Yt 1 1 Dt 2 X 2 t 2 Dt X 2t 3 X 3t 3 Dt X 3t u t

115

As vantagens da tcnica das variveis binrias


sobre o teste de Chow so:

3 O teste de Chow no nos revela


explicitamente se so os coeficientes do
intercepto ou os angulares, ou ambos que
diferem nos dois perodos.
A abordagem das variveis binrias revela a
diferena e tambm aponta sua fonte:
intercepto, coeficiente angular ou ambos.
116

As vantagens da tcnica das variveis binrias


sobre o teste de Chow so:

4 Com o uso de variveis binrias, inclui-se


todas as observaes em uma nica
regresso, aumentando os graus de liberdade,
aumentando a preciso relativa dos
parmetros estimados.

117

O EMPREGO DE VARIVEIS
BINRIAS EM ANLISES
SAZONAIS

118

Muitas sries temporais econmicas so

formadas a partir de dados mensais ou


trimestrais que apresentam padres
sazonais (movimentos oscilatrios

regulares)

119

Exemplos:
Vendas de lojas de departamentos no natal;
Demanda das famlias por moeda na poca de

frias;
Demanda por sorvete e refrigerantes no
vero;
Preo dos produtos agrcolas na poca de
safra, etc.
120

Em sries temporais pode haver quatro


componentes:
Sazonal

Cclico
Tendncia

Aleatrio

121

Muitas vezes desejvel remover o fator ou


componente sazonal de uma srie temporal a
fim de nos concentrarmos nos outros

componentes, como a tendncia.

122

Esse processo de remoo do componente


sazonal conhecido como dessazonalizao
ou ajustamento sazonal e a srie assim obtida

chamada de dessazonalizada ou ajustada


sazonalmente.

123

Sries de tempos como:


Taxa de desemprego
ndice de preos ao consumidor

ndice de preos ao produtor


ndice de produo industrial

so normalmente publicados em sua forma


dessazonalizada.

124

Existem vrios mtodos de dessazonalizar


uma srie temporal.

Uma delas o de variveis dummies.

125

Tabela 3 Vendas trimestrais de eletrodomsticos (em milhares).


ANO
1978
1978
1978
1978
1979
1979
1979
1979
1980
1980
1980
1980
1981
1981
1981
1981
1982
1982
1982
1982
1983
1983
1983
1983
1984
1984
1984
1984
1985
1985
1985
1985

TRIM.
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

GELADEIRAS

1317
1615
1662
1295
1271
1555
1639
1238
1277
1258
1417
1185
1196
1410
1417
919
943
1175
1269
973
1102
1344
1641
1225
1429
1699
1749
1117
1242
1684
1764
1328

GASTOS
252,6
272,4
270,9
273,9
268,9
262,9
270,9
263,4
260,6
231,9
242,7
248,6
258,7
248,4
255,5
240,4
247,7
249,1
251,8
262
263,3
280
288,5
300,5
312,6
322,5
324,3
333,1
344,8
350,3
369,1
356,4

126

Figura 9.4 Vendas de geladeiras 1978 1985 (dados trimestrais)


2000
1800
1600
1400
Vendas

1200
1000
800
600
400
200
0

V e n d a s d e G e lad eira s

An o

127

A figura sugere que a srie talvez


apresente

um

padro

sazonal

associado aos vrios trimestres.

128

Para

verificar

se

isso

ocorre

de

fato,

consideremos o seguinte modelo:


Yt 1D1t 2 D2t 3 D3t 4 D4t ut

Y = venda de geladeiras, em milhares;


D = so variveis binrias, que tomam o valor 1
no trimestre relevante e 0 nos demais.
129

Tabela 9.4 Estados Unidos vendas trimestrais de geladeiras (em mil unidades), 19781995
ANO
1978
1978
1978
1978
1979
1979
1979
1979
1980
1980
1980
1980
1981
1981
1981
1981
1982
1982
1982
1982
1983
1983
1983
1983
1984
1984
1984
1984
1985
1985
1985
1985

TRIM.
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

GELADEIRAS

1317
1615
1662
1295
1271
1555
1639
1238
1277
1258
1417
1185
1196
1410
1417
919
943
1175
1269
973
1102
1344
1641
1225
1429
1699
1749
1117
1242
1684
1764
1328

GASTOS
252,6
272,4
270,9
273,9
268,9
262,9
270,9
263,4
260,6
231,9
242,7
248,6
258,7
248,4
255,5
240,4
247,7
249,1
251,8
262
263,3
280
288,5
300,5
312,6
322,5
324,3
333,1
344,8
350,3
369,1
356,4

D2
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0

D3
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0

D4
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1

130

Estimando, tem-se:

Yt 1222,125 D1t 1467,500 D2t 1569,750 D3t 1160,000 D4t


( 20, 37)

( 24, 46)

( 26,16)

(19, 33) t

R2 = 0,5317
Os coeficientes estimados representam as vendas mdias de
geladeiras (em milhares de unidades) em cada poca
(trimestre).
131

Se houver qualquer efeito sazonal em


dado trimestre, isso ser indicado por um
valor t estatsticamente significativo do

coeficiente binrio associado a esse


trimestre.
132

Tambm podemos ter:

Yt 1 2 D2t 3 D3t 4 D4t ut

Nesse caso, consideraremos o termo de intercepto.

133

O resultado dessa regresso ser:


Yt 1222,125 245,375 D2t 347,625 D3t 62,125 D4t
( 20, 37)

( 2,89)

( 4, 09)

( 0, 73) t

R2 = 0,5318

134

Como obtemos a srie dessazonalizada?


Estimamos, a partir do modelo:

Yt 1D1t 2 D2t 3 D3t 4 D4t ut


ou do modelo:

Yt 1 2 D2t 3 D3t 4 D4t ut


os valores de Y para cada observao e
subtraimos deles os valores efetivos de Y, isto
, obtemos os resduos da regresso.

135

Tabela 5 Regresso das vendas de geladeiras: valores observados, ajustados e


residuais
ANO
1978
1978
1978
1978
1979
1979
1979
1979
1980
1980
1980
1980
1981
1981
1981
1981
1982
1982
1982
1982
1983
1983
1983
1983
1984
1984
1984
1984
1985
1985
1985
1985

TRIM.
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

GELAD.

1317
1615
1662
1295
1271
1555
1639
1238
1277
1258
1417
1185
1196
1410
1417
919
943
1175
1269
973
1102
1344
1641
1225
1429
1699
1749
1117
1242
1684
1764
1328

Gel.Estim
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160
1222,125
1467,5
1569,75
1160

Residuos
94,875
147,5
92,25
135
48,875
87,5
69,25
78
54,875
-209,5
-152,75
25
-26,125
-57,5
-152,75
-241
-279,125
-292,5
-300,75
-187
-120,125
-123,5
71,25
65
206,875
231,5
179,25
-43
19,875
216,5
194,25
168

136

O que esses resduos representam?


so os componentes restantes da srie de

venda de geladeiras, isto , os componentes


de tendncia, cclico e aleatrio.

137

Mas se adicionarmos um regressor


quantitativo no modelo, como:
Yt 1 2 D2t 3 D3t 4 D4t 5 X t ut

O resultado ser:
Yt 456,244 242,497 D2t 325,264D3t 86,080 D4t 2,773 X t
( 2,55)

( 3, 69)

( 4, 94)

( 1, 31)

( 4, 45)

R2 = 0,7298

Observa-se que os coeficientes de intercepto diferenciais dos


segundo e terceiro trimestres so estatisticamente diferentes
daquele do primeiro trimestre, mas os interceptos do quarto
e primeiro trimestre so quase iguais, do ponto de vista
estatstico.

138

Tabela 9.4 Estados Unidos vendas trimestrais de geladeiras (em mil unidades), 19781995
ANO
1978
1978
1978
1978
1979
1979
1979
1979
1980
1980
1980
1980
1981
1981
1981
1981
1982
1982
1982
1982
1983
1983
1983
1983
1984
1984
1984
1984
1985
1985
1985
1985

TRIM.
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV

GELADEIRAS

1317
1615
1662
1295
1271
1555
1639
1238
1277
1258
1417
1185
1196
1410
1417
919
943
1175
1269
973
1102
1344
1641
1225
1429
1699
1749
1117
1242
1684
1764
1328

GASTOS
252,6
272,4
270,9
273,9
268,9
262,9
270,9
263,4
260,6
231,9
242,7
248,6
258,7
248,4
255,5
240,4
247,7
249,1
251,8
262
263,3
280
288,5
300,5
312,6
322,5
324,3
333,1
344,8
350,3
369,1
356,4

D2
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0

D3
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0

D4
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1

139

Observe a seguinte pergunta: Se as vendas de


geladeiras registram padres sazonais, as
despesas com bens durveis tambm no
deveriam apresent-los?
Como podemos considerar a sazonalidade de
X?
Na equao
as variveis binrias do modelo no apenas
removem a sazonalidade de Y, mas tambm a
Yt existe,
sazonalidade, quando
de
X.3 D3t 4 D4t 5 X t
1 2 D2
t
140

Regresso linear
segmentada

141

Seja uma empresa hipottica e a forma


de remunerao dos seus representantes
de vendas;
Ela paga comisses sobre as vendas: at
um certo patamar, o nvel meta, ou
limiar, X*, h uma estrutura (estocstica)
de comisses; e para as vendas que esto
acima desse ponto, paga outra comisso.
142

Graficamente:
Comisses sobre as vendas

II

Vendas
X*
143

A tcnica das variveis binrias pode ser

empregada para estimar os coeficientes


angulares (diferentes) dos dois
segmentos da regresso linear

segmentada.

144

O processo o seguinte:

Yi 1 1 X i 2 ( X i X ) Di ui
*

Yi = comisso sobre vendas


Xi = volume de vendas geradas por um
vendedor
X* = valor limiar das vendas, tambm
conhecido como n (conhecido
antecipadamente)
D = 1 se Xi > X*
= 0 se Xi < X*
145

Se

Yi 1 1 X i 2 ( X i X ) Di ui
*

supondo que E(ui =0), tem-se:


E (Yi | Di 0,X i , X *) 1 1 X i

o que nos d a comisso de vendas mdias


antes de atingido o nvel meta X*

146

Se
Yi 1 1 X i 2 ( X i X * ) Di ui se Di = 1

Yi 1 1 X i 2 X i 2 X *

Yi 1 (1 2 ) X i 2 X *

Yi 1 2 X * (1 2 ) X i
E (Yi | Di 1, X i , X * ) 1 2 X * (1 2 ) X i

que nos d a comisso mdia de vendas


alm do nvel meta X*.

147

Assim, 1 nos d o coeficiente angular da linha


de regresso no segmento I e 1 e 2, o
coeficiente angular no segmento II da
regresso linear segmentada.

fcil testar a hiptese de que no h quebra


na linha de regresso no limiar X*, verificando
a significncia estatstica do coeficiente
angular diferencial estimado, 2 .
148

Comisso de venda

1 + 2

1
1
X*

Vendas

1- 2X*

149

A regresso linear fragmentada que


acabamos de discutir o exemplo de
uma classe mais geral de funes
conhecidas como funes spline
(polinmios segmentados de ordem
k).
150

Variveis Dummy sob a


Heterocedasticidade e a
Autocorrelao

151

Caso de Heterocedasticidade
Sejam as seguintes equaes:

Yi 1 2 X i u1i
se D = 0

Yi (1 2 ) ( 3 4 ) X i u2i
se D = 1
152

Ao testarmos a estabilidade
estrutural (por exemplo), usando a
tcnica das variveis dummies,
supusemos que:
var(u1i) = var(u2i)=2,
ou seja, as varincias dos erros nos
dois perodos so iguais.

153

Se as varincias dos erros nas duas


equaes forem diferentes, bem
possvel tirar concluses equivocadas.
Para isso no acontecer, necessrio
aps obter a regresso com variveis
dummies, fazer o diagnstico de
heterocedasticidade, usando tcnicas
estatsticas adequadas.
154

No caso de Autocorrelao serial, esperase que os erros nas equaes no sejam


correlacionadas.
Para no ter dvida, necessrio fazer o
diagnstico e a correo de
autocorrelao serial.

155

REFERNCIAS:
GUJARATI, D. N. e PORTER, C. P. Econometria Bsica. 5
edio, McGraw-Hill e Artmed. 2011.
HILL, Carter; GRIFFITHS, William, JUDGE, Georg.
Econometria. Traduo A. Alfredo Farias, So Paulo:
Saraiva, 2011.
MADDALA, G.S. Introduo Econometria. Rio de Janeiro:
LTC-Livros Tcnicos e Cientficos Editora S.A., 2003.
WOOLDRIDGE, J.M. Introductory Econometrics. A Modern
Approach. 2nd ed. Ed. Thomson. 2010.
156

FIM

157

Você também pode gostar