Você está na página 1de 42

ECONOMETRIA

Prof. Patricia Maria Bortolon, D. Sc.


Cap. 9 Modelos de Regresso com
Variveis Binrias

Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.


Rio de Janeiro. Elsevier- Campus, 2006
Variveis Binrias
= variveis dummy assumem valores 0 ou 1
= variveis indicadoras, de categoria, qualitativas ou
binrias
So essencialmente variveis nominais
Um artifcio para classificar dados em categorias
mutuamente exclusivas como masculino e feminino
Modelos com regressores de natureza exclusivamente
binria so chamados modelos de anlise de varincia
(ANOVA)

Ver exemplo 9.1 em dummy1.txt


Exemplo 9.1
Cautela no uso de variveis binrias
Colinearidade perfeita
No exemplo com 3 regies se criarmos uma terceira
dummy D1 teremos ao somar as trs dummies uma
coluna com 51 uns, igual aos 1s implcitos em

1 = . 1 + 1 11 + 2 21 + 3 31 + 1
2 = . 1 + 1 12 + 2 22 + 3 32 + 2
3 = . 1 + 1 13 + 2 23 + 3 33 + 3

= . 1 + 1 1 + 2 2 + 3 3 +
Cautela no uso de variveis binrias
Na forma matricial
1 1 11 21 31 1
2 1 12 22 32 1 2
= 2 +

1 1 2 3 3

1 =

Colinearidade perfeita => essa matriz no tem inversa

Regra: se a varivel qualitativa tem m categorias teremos


que usar (m-1) variveis dummies!!
Cautela no uso de variveis binrias
Categoria de base, de referncia, de controle, de
comparao ou omitida => no se designa varivel
binria
1 o valor mdio dessa categoria
Outros so coeficientes diferenciais de intercepto
Se no usarmos a regra das classificaes menos 1,
ento temos que rodar o modelo sem intercepto
Da os valores mdios sero obtidos diretamente
Modelos ANOVA com duas variveis
qualitativas
Qual a categoria de
referncia nesse caso?
Qual o salrio mdio dos
casados?
Qual o salrio mdio dos
que residem no Sul?
Esses salrios so
estatisticamente diferentes
daqueles da categoria
referencial?
Regresses com variveis quantitativas e
qualitativas: os modelos ANCOVA
Um mtodo de controlar estatisticamente os efeitos de
regressores quantitativos, chamados de covariveis ou
variveis de controle, em um modelo que inclui tanto
regressores quantitativos quanto qualitativos ou
binrios.
Ser que o gasto pblico com educao afeta o salrio
dos professores?
= 1 + 2 2 + 3 3 + 4 4 +
Yi = salrio mdio anual dos professores em US$
D2i = 1 se NE ou CO; 0 c.c.
D3i = 1 se Sul e 0 c.c.
Xi = gastos com ensino pblico em US$/aluno
Ver exemplo 9.3 em dummy2.txt
A varivel binria como alternativa ao teste de
Chow
No teste de Chow no possvel dizer se a diferena se
devia ao intercepto, aos coeficientes angulares ou a
ambos.
H quatro situaes possveis:
1. Regresses coincidentes = interceptos e inclinaes so
iguais
2. Regresses paralelas = interceptos diferentes e inclinaes
iguais
3. Regresses concorrentes = interceptos iguais e inclinaes
diferentes
4. Regresses dessemelhantes = interceptos e inclinaes so
diferentes
A varivel binria como alternativa ao teste de
Chow
Exemplo poupana e renda americana de 1970 a 1995
= 1 + 2 + 1 + 2 +
Y = poupana
X = renda
t = anos
D = 1 para o perodo 1982 a 1995
0, nos demais casos (1970 1981)

Funo de poupana mdia, 1970 1981:


= 0, = 1 + 1
Funo de poupana mdia, 1982 1995:
= 1, = (1 + 2 ) + (1 + 2 )

Se significativo indica Se significativo indica


que o intercepto diferente que a inclinao diferente
A varivel binria como alternativa ao teste de
Chow
Varivel binria

ADITIVA => para avaliar interceptos

MULTIPLICATIVA => para avaliar inclinaes

Para saber se as retas so coincidentes preciso testar


simultaneamente 2 = 2 = 0

Ver exemplo 9.4 em pouprenda.txt


Efeitos de interao com o uso de
variveis binrias
= 1 + 2 2 + 3 3 + +
Yi = salrios-hora em US$
D2i = 1 se mulheres, 0 se homens
D3i = 1 se no brancos e no hispnicos, 0 outros
Xi = escolaridade (anos de frequncia escola)

O efeito diferencial da varivel gnero constante nas


duas categorias de raa (a diferena de salrio por ser
mulher no depende de ser branco e hispnico)
O efeito diferencial da varivel raa constante nos
dois gneros.
E se a diferena de salrio pelo gnero depender
tambm da raa?
Efeitos de interao com o uso de
variveis binrias
= 1 + 2 2 + 3 3 + +
Pode haver uma interao entre as variveis D2 e D3. O
efeito sobre Y mdio pode no ser aditivo, mas tambm
multiplicativo.
= 1 + 2 2 + 3 3 + 4 (2 3 ) + +
Mulher no branca no hispnica: D2=1 D3=1
2 = 1, 3 = 1, = (1 + 2 + 3 + 4 ) +
Homem no branco no hispnico: D2=0 D3=1
2 = 0, 3 = 1, = (1 + 3 ) + Em todos esses
Homem branco e hispnico: D2=0 D3=0 caso a inclinao no
2 = 0, 3 = 0, = 1 + se altera. Poderamos
criar variveis de interao
Mulher branca e hispnica: D2=1 D3=0 para ver se a inclinao
2 = 1, 3 = 0, = (1 + 2 ) + se altera.
Variveis binrias em anlises sazonais
Uma soluo usar uma dummy para cada perodo
tendo o cuidado de estimar o modelo sem intercepto.
Usar um perodo como referncia tem a vantagem de
podermos identificar se o intercepto diferencial em
algum perodo no estatisticamente significante.
Os resduos dessa regresso sero a sria
dessazonalizada, com os componentes de tendncia,
cclico e aleatrio.
ST = s + c + t + u

Ver exemplo 9.6


Regresso linear segmentada
Quando h mudana na inclinao a partir de um
determinado valor do regressor.
= 1 + 1 + 2 +
Yi = comisso sobre vendas
Xi = volume de vendas geradas por um
vendedor
X* = valor limiar de vendas, n
D = 1 se Xi > X* e 0 se Xi < X*
Regresso linear segmentada
Para X < X* => D = 0
( | = 0, , ) = 1 + 1
Para X > X* => D = 1
= 1, , = 1 2 + (1 + 2 )
Variveis binrias em regresses
semilogartmicas
Nessas regresses o coeficiente nos d a semi-elasticidade
(variao percentual da varivel dependente para uma variao
unitria da varivel explicativa).
S se aplica se o regressor for varivel quantitativa.
Para um modelo do tipo
= 1 + 2 +
Onde Y = salrio hora em US$ e D = 1 se mulher D a variao
no logaritmo mdio
A funo salrio para homens ser: dos salrios-hora
( | = 0) = 1
A funo salrio para mulheres ser:
= 1 = 1 + 2
Variveis binrias em regresses
semilogartmicas
O antilogaritmo dos coeficientes nos d o salrio
mediano e no o mdio (antilog x = ex)
= 1 + 2
= 1 + ln( 2 ) => = 0 2 = 1
= 1 2 = 2
Logo, quando D varia de 0 para 1 o ln Y varia ( 2
1)
A variao no logaritmo uma variao relativa
Se multiplicarmos por 100 teremos a variao %
Variveis binrias em regresses
semilogartmicas
No modelo do exemplo 9.8

Para verificar a variao percentual no salrio mediano


de homens e mulheres fazemos:
0,2437 1 . 100 = 21,63%
O salrio mediano da trabalhadora (D=1) inferior ao
masculino em cerca de 21,63%.
A hiptese da normalidade
1 1
=
(1 )
2 2
=
(2 )
3 3
=
(3 )
Segue a distribuio t com n 3 graus de liberdade.
Por que 3 graus de liberdade?
t => para testar coeficientes parciais da regresso mltipla
2=> para testar hipteses sobre o verdadeiro 2 da
populao
Testes de hipteses relativos aos coeficientes
de regresso individuais
H0: 2 = 0
H1: 2 0
Comparar t com tcrtico
Qual seria o tcrtico para o caso da MI?
Na prtica olhamos o p-valor
E se eu espero um determinado sinal?
O teste no mais bilateral... no exemplo da MI poderia supor que o
coeficiente de PNBpc seja negativo. Ento:
H0: 2 0
H1: 2 < 0
Teste de significncia geral da regresso
amostral
Testa se h uma relao linear entre o Y e as variveis
explicativas em conjunto
H0: 2 = 3 = 0
o mesmo que testar 2 = 0 e 3 = 0?
No!
Usamos a mesma amostra para testar 2 = 0 e 3 = 0, portanto
no so independentes
2 = 0 3 = 0 2 = 0 . (3 = 0)
[2 2 2 , [3 2 3 ] (1 )(1 )
Ento, como testar 2 = 3 = 0?
A abordagem da ANOVA: teste F

2 = 2 2 + 3 3 +

STQ SQE SQR


2 2 + 3 3
2=
=
2
3
Se distribui como a distribuio F, com 2 e n-3 graus de liberdade.
Se 2 = 3 = 0 for verdadeira SQE e SQR sero muito prximos. O
modelo no agrega explicao. No se rejeitar H0. Se SQE for
muito maior que SQR rejeita-se H0.
Significncia geral de uma regresso
mltipla
Dado o modelo de regresso com k variveis:
= 1 + 2 2 + 3 3 + + +
Para testar a hiptese:
H0: 2 = 3 =...= k = 0
H1: nem todos os coeficientes angulares so simultaneamente
iguais a zero

( 1)
= =

( )
Se F > F(k-1,n-k), rejeite H0.
k =3 no caso de 3 variveis (Y, X2 e X3)
Significncia geral de uma regresso
mltipla
Testes dos coeficientes individuais no substituem o
teste geral da regresso linear mltipla.
possvel ter regresso significativa como um todo
com poucos ou nenhum coeficiente significativo
individualmente.
E tambm R2 baixos em regresses com coeficientes
significativos. Essa uma situao comum em dados
em corte transversal.
O importante a especificao correta do modelo,
sinais corretos e significncia estatstica.
Relao entre R2 e F
2

=


( 1)
= = .
1
( )

= .
1
2
= .
1 1 2
2
( 1)
=
(1 2 )
( )
Relao entre R2 e F
2
( 1)
=
(1 2 )
( )

R2 = 0 => F = 0 => regresso no significante


R2 = 1 => F =>
Quando acrescentar uma nova varivel?
( )
.
=

( )
Se as variveis dependentes dos modelos novo e antigo
so as mesmas posso usar:

2 2

.
= 2
1

Quando acrescentar uma nova varivel?
2
A prtica de escolher modelo com mais alto no
adequada, pois no h certeza de que o aumento
significativo.
2
aumenta se | t | da nova varivel maior que 1,
sendo | t | calculado sob a hiptese de que o coeficiente
igual a zero.
2
aumentar se t2 = F for maior que 1
Quando acrescentar um grupo de
variveis?
Quando F dado por

2 2

.
= 2
1

for maior que 1.
Teste da igualdade de dois coeficientes da
regresso
= 1 + 2 2 + 3 3 + 4 4 +
X3 = renda, X4 = riqueza, Y = demanda do bem
H0: 3 = 4 => (3 - 4) = 0
H0: 3 4 => (3 - 4) 0

3 4 (3 4 )
=
3 4

3 4 = 3 + 4 2(3 , 4 )
Onde obter as var e cov?
Ver comandos em funcaocusto.txt
Mnimos quadrados restritos: teste das
restries de igualdade linear
Funo Cobb-Douglas
2 3
= 1 2 3
Onde X2 = insumo de mo de obra, X3 = insumo de
capital, Y = produo
= 0 + 2 2 + 3 3 +
Onde 0 = 1
Se houver retornos constantes de escala = variao
equiproporcional da produo para uma variao
equiproporcional nos insumos
2 + 3 = 1
Mnimos quadrados restritos: teste das
restries de igualdade linear
A abordagem do teste t:

2 + 3 (2 + 3 )
=
2 + 3

2 + 3 = 2 + 3 + 2(2 , 3 )
Mnimos quadrados restritos: teste das
restries de igualdade linear
A abordagem do teste F:

2
2

= 2
1

Mnimos quadrados restritos: teste das
restries de igualdade linear
Como obter o modelo restrito?
2 + 3 = 1
2 1 = 3
= 0 + (1 3 )2 + 3 3 +
= 0 + 2 3 2 + 3 3 +
2 = 0 + 3 (3 2 ) +
3
= 0 + 3 +
2 2

Ver comandos em cobbdouglas.txt


Teste da estabilidade estrutural ou dos
parmetros nos modelos de regresso: Teste de
Chow
Quando empregamos um modelo de regresso que
envolve o uso de sries temporais pode haver mudana
dos coeficientes ao longo do tempo.
Exemplos: (i) exportaes no Brasil antes e depois da
liberao do cmbio em 1999; (ii) demonstraes
contbeis antes e depois do IFRS
Como saber se h quebra de estrutura?
Teste de Chow
Nada mais que um teste de modelo restrito x modelo
sem restries
Aqui o restrito o que supe que os coeficientes so
iguais ao longo de todo o tempo
Premissas:
1 ~ 0 , 2 Distribuio Normal
2 ~(0 , 2 ) com mesma varincia

1 e 2 tm distribuies independentes
Teste de Chow
Etapas do teste:
1. Estima-se as regresses separadas
2. Estima-se a regresso para o perodo completo
3. Obtm-se os SQR (soma quad. resduos)
4. Teste F

= ~ ,1+22

(1 + 2 2)

Ver comandos em pouprenda.txt


Teste de Chow
Advertncias:
1. As premissas devem ser respeitadas. preciso verificar se
as varincias dos erros das regresso so iguais.
2. O teste no diz se a diferena entre as regresses decorre
dos interceptos, coeficientes angulares ou de ambos.
3. O teste pressupe que conhecemos o ponto de quebra
estrutural.

Ver comandos em pouprenda.txt

Você também pode gostar