Você está na página 1de 42

ECONOMETRIA

Prof. Patricia Maria Bortolon, D. Sc.

Cap. 9 Modelos de Regresso com


Variveis Binrias

Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.


Rio de Janeiro. Elsevier- Campus, 2006

Variveis Binrias
= variveis dummy assumem valores 0 ou 1
= variveis indicadoras, de categoria, qualitativas ou
binrias
So essencialmente variveis nominais
Um artifcio para classificar dados em categorias
mutuamente exclusivas como masculino e feminino
Modelos com regressores de natureza exclusivamente
binria so chamados modelos de anlise de varincia
(ANOVA)
Ver exemplo 9.1 em dummy1.txt

Exemplo 9.1

Cautela no uso de variveis binrias


Colinearidade perfeita
No exemplo com 3 regies se criarmos uma terceira
dummy D1 teremos ao somar as trs dummies uma
coluna com 51 uns, igual aos 1s implcitos em
1 = . 1 + 1 11 + 2 21 + 3 31 + 1
2 = . 1 + 1 12 + 2 22 + 3 32 + 2
3 = . 1 + 1 13 + 2 23 + 3 33 + 3

= . 1 + 1 1 + 2 2 + 3 3 +

Cautela no uso de variveis binrias


Na forma matricial
1 11
1
1 12
2
=

1 1
1

21 31
22 32

2 3

1
1
2
2 +

Colinearidade perfeita => essa matriz no tem inversa


Regra: se a varivel qualitativa tem m categorias teremos
que usar (m-1) variveis dummies!!

Cautela no uso de variveis binrias


Categoria de base, de referncia, de controle, de
comparao ou omitida => no se designa varivel
binria
1 o valor mdio dessa categoria
Outros so coeficientes diferenciais de intercepto
Se no usarmos a regra das classificaes menos 1,
ento temos que rodar o modelo sem intercepto
Da os valores mdios sero obtidos diretamente

Modelos ANOVA com duas variveis


qualitativas
Qual a categoria de
referncia nesse caso?
Qual o salrio mdio dos
casados?
Qual o salrio mdio dos
que residem no Sul?
Esses salrios so
estatisticamente diferentes
daqueles da categoria
referencial?

Regresses com variveis quantitativas e


qualitativas: os modelos ANCOVA

Um mtodo de controlar estatisticamente os efeitos de


regressores quantitativos, chamados de covariveis ou
variveis de controle, em um modelo que inclui tanto
regressores quantitativos quanto qualitativos ou
binrios.
Ser que o gasto pblico com educao afeta o salrio
dos professores?
= 1 + 2 2 + 3 3 + 4 4 +
Yi = salrio mdio anual dos professores em US$
D2i = 1 se NE ou CO; 0 c.c.
D3i = 1 se Sul e 0 c.c.
Xi = gastos com ensino pblico em US$/aluno
Ver exemplo 9.3 em dummy2.txt

A varivel binria como alternativa ao teste de


Chow

No teste de Chow no possvel dizer se a diferena se


devia ao intercepto, aos coeficientes angulares ou a
ambos.
H quatro situaes possveis:
1. Regresses coincidentes = interceptos e inclinaes so
iguais
2. Regresses paralelas = interceptos diferentes e inclinaes
iguais
3. Regresses concorrentes = interceptos iguais e inclinaes
diferentes
4. Regresses dessemelhantes = interceptos e inclinaes so
diferentes

A varivel binria como alternativa ao teste de


Chow

Exemplo poupana e renda americana de 1970 a 1995


= 1 + 2 + 1 + 2 +
Y = poupana
X = renda
t = anos
D = 1 para o perodo 1982 a 1995
0, nos demais casos (1970 1981)

Funo de poupana mdia, 1970 1981:


= 0, = 1 + 1

Funo de poupana mdia, 1982 1995:


= 1, = (1 + 2 ) + (1 + 2 )
Se significativo indica
que o intercepto diferente

Se significativo indica
que a inclinao diferente

A varivel binria como alternativa ao teste de


Chow

Varivel binria
ADITIVA => para avaliar interceptos
MULTIPLICATIVA => para avaliar inclinaes
Para saber se as retas so coincidentes preciso testar
simultaneamente 2 = 2 = 0

Ver exemplo 9.4 em pouprenda.txt

Efeitos de interao com o uso de


variveis binrias
= 1 + 2 2 + 3 3 + +
Yi = salrios-hora em US$
D2i = 1 se mulheres, 0 se homens
D3i = 1 se no brancos e no hispnicos, 0 outros
Xi = escolaridade (anos de frequncia escola)

O efeito diferencial da varivel gnero constante nas


duas categorias de raa (a diferena de salrio por ser
mulher no depende de ser branco e hispnico)
O efeito diferencial da varivel raa constante nos
dois gneros.
E se a diferena de salrio pelo gnero depender
tambm da raa?

Efeitos de interao com o uso de


variveis binrias
= 1 + 2 2 + 3 3 + +
Pode haver uma interao entre as variveis D2 e D3. O
efeito sobre Y mdio pode no ser aditivo, mas tambm
multiplicativo.
= 1 + 2 2 + 3 3 + 4 (2 3 ) + +
Mulher no branca no hispnica: D2=1 D3=1
2 = 1, 3 = 1, = (1 + 2 + 3 + 4 ) +
Homem no branco no hispnico: D2=0 D3=1
2 = 0, 3 = 1, = (1 + 3 ) +
Em todos esses
caso a inclinao no
Homem branco e hispnico: D2=0 D3=0
se altera. Poderamos
2 = 0, 3 = 0, = 1 +
criar variveis de interao
Mulher branca e hispnica: D2=1 D3=0
para ver se a inclinao
2 = 1, 3 = 0, = (1 + 2 ) +
se altera.

Variveis binrias em anlises sazonais


Uma soluo usar uma dummy para cada perodo
tendo o cuidado de estimar o modelo sem intercepto.
Usar um perodo como referncia tem a vantagem de
podermos identificar se o intercepto diferencial em
algum perodo no estatisticamente significante.
Os resduos dessa regresso sero a sria
dessazonalizada, com os componentes de tendncia,
cclico e aleatrio.
ST = s + c + t + u

Ver exemplo 9.6

Regresso linear segmentada


Quando h mudana na inclinao a partir de um
determinado valor do regressor.
= 1 + 1 + 2 +
Yi = comisso sobre vendas
Xi = volume de vendas geradas por um
vendedor
X* = valor limiar de vendas, n
D = 1 se Xi > X* e 0 se Xi < X*

Regresso linear segmentada


Para X < X* => D = 0
( | = 0, , ) = 1 + 1
Para X > X* => D = 1
= 1, , = 1 2 + (1 + 2 )

Variveis binrias em regresses


semilogartmicas
Nessas regresses o coeficiente nos d a semi-elasticidade
(variao percentual da varivel dependente para uma variao
unitria da varivel explicativa).
S se aplica se o regressor for varivel quantitativa.
Para um modelo do tipo
= 1 + 2 +
Onde Y = salrio hora em US$ e D = 1 se mulher

A funo salrio para homens ser:


( | = 0) = 1
A funo salrio para mulheres ser:
= 1 = 1 + 2

D a variao
no logaritmo mdio
dos salrios-hora

Variveis binrias em regresses


semilogartmicas
O antilogaritmo dos coeficientes nos d o salrio
mediano e no o mdio (antilog x = ex)
= 1 + 2
= 1 + ln( 2 ) => = 0
= 1

2 = 1
2 = 2

Logo, quando D varia de 0 para 1 o ln Y varia ( 2


1)
A variao no logaritmo uma variao relativa
Se multiplicarmos por 100 teremos a variao %

Variveis binrias em regresses


semilogartmicas
No modelo do exemplo 9.8

Para verificar a variao percentual no salrio mediano


de homens e mulheres fazemos:
0,2437 1 . 100 = 21,63%
O salrio mediano da trabalhadora (D=1) inferior ao
masculino em cerca de 21,63%.

A hiptese da normalidade
=
=

1 1
(1 )
2 2
(2 )
3 3

(3 )
Segue a distribuio t com n 3 graus de liberdade.
Por que 3 graus de liberdade?
t => para testar coeficientes parciais da regresso mltipla
2=> para testar hipteses sobre o verdadeiro 2 da
populao

Testes de hipteses relativos aos coeficientes


de regresso individuais

H0: 2 = 0
H1: 2 0

Comparar t com tcrtico


Qual seria o tcrtico para o caso da MI?
Na prtica olhamos o p-valor
E se eu espero um determinado sinal?
O teste no mais bilateral... no exemplo da MI poderia supor que o
coeficiente de PNBpc seja negativo. Ento:
H0: 2 0
H1: 2 < 0

Teste de significncia geral da regresso


amostral
Testa se h uma relao linear entre o Y e as variveis
explicativas em conjunto
H0: 2 = 3 = 0
o mesmo que testar 2 = 0 e 3 = 0?
No!
Usamos a mesma amostra para testar 2 = 0 e 3 = 0, portanto
no so independentes
2 = 0 3 = 0 2 = 0 . (3 = 0)
[2 2 2 , [3 2 3 ] (1 )(1 )
Ento, como testar 2 = 3 = 0?

A abordagem da ANOVA: teste F


2 = 2

STQ
2
=

2 + 3

SQE
2 + 3 3
2

3 +

SQR

2=

3
Se distribui como a distribuio F, com 2 e n-3 graus de liberdade.
Se 2 = 3 = 0 for verdadeira SQE e SQR sero muito prximos. O
modelo no agrega explicao. No se rejeitar H0. Se SQE for
muito maior que SQR rejeita-se H0.

Significncia geral de uma regresso


mltipla
Dado o modelo de regresso com k variveis:
= 1 + 2 2 + 3 3 + + +
Para testar a hiptese:
H0: 2 = 3 =...= k = 0
H1: nem todos os coeficientes angulares so simultaneamente
iguais a zero

( 1)
=
=

( )
Se F > F(k-1,n-k), rejeite H0.
k =3 no caso de 3 variveis (Y, X2 e X3)

Significncia geral de uma regresso


mltipla
Testes dos coeficientes individuais no substituem o
teste geral da regresso linear mltipla.
possvel ter regresso significativa como um todo
com poucos ou nenhum coeficiente significativo
individualmente.
E tambm R2 baixos em regresses com coeficientes
significativos. Essa uma situao comum em dados
em corte transversal.
O importante a especificao correta do modelo,
sinais corretos e significncia estatstica.

Relao entre R2 e F

( 1)
=
=
.

1
( )


=
.
1
2
=
.
1 1 2
2
( 1)
=
(1 2 )
( )
2

Relao entre R2 e F
2

( 1)
=
(1 2 )
( )
R2 = 0 => F = 0 => regresso no significante
R2 = 1 => F =>

Quando acrescentar uma nova varivel?


( )
=

( )
Se as variveis dependentes dos modelos novo e antigo
so as mesmas posso usar:
2
2

2
1

Quando acrescentar uma nova varivel?


2
A prtica de escolher modelo com
mais alto no
adequada, pois no h certeza de que o aumento
significativo.

2

aumenta se | t | da nova varivel maior que 1,
sendo | t | calculado sob a hiptese de que o coeficiente
igual a zero.
2

aumentar se t2 = F for maior que 1

Quando acrescentar um grupo de


variveis?
Quando F dado por
2
2

=
for maior que 1.

2
1

Teste da igualdade de dois coeficientes da


regresso
= 1 + 2 2 + 3 3 + 4 4 +
X3 = renda, X4 = riqueza, Y = demanda do bem
H0: 3 = 4 => (3 - 4) = 0
H0: 3 4 => (3 - 4) 0
3 4 (3 4 )

3 4 =

3 4
3 + 4 2(3 , 4 )

Onde obter as var e cov?


Ver comandos em funcaocusto.txt

Mnimos quadrados restritos: teste das


restries de igualdade linear

Funo Cobb-Douglas
2 3
= 1 2 3
Onde X2 = insumo de mo de obra, X3 = insumo de
capital, Y = produo
= 0 + 2 2 + 3 3 +
Onde 0 = 1
Se houver retornos constantes de escala = variao
equiproporcional da produo para uma variao
equiproporcional nos insumos
2 + 3 = 1

Mnimos quadrados restritos: teste das


restries de igualdade linear

A abordagem do teste t:
=

2 + 3 =

2 + 3 (2 + 3 )
2 + 3
2 + 3 + 2(2 , 3 )

Mnimos quadrados restritos: teste das


restries de igualdade linear

A abordagem do teste F:

2
2
1

Mnimos quadrados restritos: teste das


restries de igualdade linear

Como obter o modelo restrito?


2 + 3 = 1
2 1 = 3
= 0 + (1 3 )2 + 3 3 +
= 0 + 2 3 2 + 3 3 +
2 = 0 + 3 (3 2 ) +

= 0 + 3
+
2
2

Ver comandos em cobbdouglas.txt

Teste da estabilidade estrutural ou dos


parmetros nos modelos de regresso: Teste de
Chow
Quando empregamos um modelo de regresso que
envolve o uso de sries temporais pode haver mudana
dos coeficientes ao longo do tempo.
Exemplos: (i) exportaes no Brasil antes e depois da
liberao do cmbio em 1999; (ii) demonstraes
contbeis antes e depois do IFRS
Como saber se h quebra de estrutura?

Teste de Chow
Nada mais que um teste de modelo restrito x modelo
sem restries
Aqui o restrito o que supe que os coeficientes so
iguais ao longo de todo o tempo
Premissas:
1 ~ 0 , 2
Distribuio Normal
com mesma varincia
2 ~(0 , 2 )
1 e 2 tm distribuies independentes

Teste de Chow
Etapas do teste:
1.
2.
3.
4.

Estima-se as regresses separadas


Estima-se a regresso para o perodo completo
Obtm-se os SQR (soma quad. resduos)
Teste F

=
~ ,1+22

(1 + 2 2)

Ver comandos em pouprenda.txt

Teste de Chow
Advertncias:
1. As premissas devem ser respeitadas. preciso verificar se
as varincias dos erros das regresso so iguais.
2. O teste no diz se a diferena entre as regresses decorre
dos interceptos, coeficientes angulares ou de ambos.
3. O teste pressupe que conhecemos o ponto de quebra
estrutural.

Ver comandos em pouprenda.txt