Você está na página 1de 8

Notes

Análise Multivariada I
Graduação em Ciências Atuariais

Henrique Castro
hcastro@usp.br

Universidade de São Paulo

2017

1 of 30

Notes

Lecture 11
Análise de regressão com dados de séries
temporais: forma funcional, variáveis dummy,
números índice, tendência e sazonalidade

2 of 30

Notes
Formas funcionais
Lecture 11: Forma funcional, variáveis dummy e números índice

• Todas as formas funcionais que vimos nos modelos para dados em


cross-section se aplicam aos dados em séries temporais.
• A transformação logarítmica é a mais importante, pois regressões
de séries temporais com efeitos percentuais constantes são comuns
na pesquisa aplicada.

3 of 30

Notes
Exemplo 1: emprego e salário mínimo
Lecture 11: Forma funcional, variáveis dummy e números índice

• Pesquisadores usaram dados sobre o salário mínimo americano e outras


variáveis para estimar a taxa de emprego em Porto Rico.
• Uma versão simplificada do modelo usado é:
log(prepopt ) = β0 + β1 log(mincovt ) + β2 log(usgnpt ) + ut , (L11.1)
tal que prepopt é a taxa de emprego em Porto Rico no ano t, usgnpt é o
PIB americano em bilhões de dólares (valores reais), e mincovt mede a
importância do salário mínimo em relação ao salário médio (nos Estados
Unidos).
• Usando os dados em PRMINWGE para os anos de 1950 a 1987, temos:
\ = −1.05 − 0.154 lmincov − 0.012 lusgnp
lprepop
(0.77) (0.065) (0.089)

T = 38 R 2 = 0.661.
4 of 30
Notes
Exemplo 1: perguntas
Lecture 11: Forma funcional, variáveis dummy e números índice

• Qual o papel da importância do salário mínimo nos Estados Unidos


sobre a taxa de emprego em Porto Rico?
• Qual o paper do PIB dos Estados Unidos sobre a taxa de emprego
em Porto Rico?

5 of 30

Notes
Elasticidades de curto e longo prazo
Lecture 11: Forma funcional, variáveis dummy e números índice

• Podemos também usar transformações logarítmicas em modelos DDF.


• Suponha, para dados trimestrais, que a demanda por moeda (Mt ) e o
produto interno bruto (GDPt ) sejam relacionados por:

log(Mt ) = α0 + δ0 log(GDPt ) + δ1 log(GDPt−1 ) + δ2 log(GDPt−2 )


+ δ3 log(GDPt−3 ) + δ4 log(GDPt−4 ) + ut .

• A propensão de impacto, δ0 , é também chamada de elasticidade de


curto prazo: mede a mudança percentual imediata na demanda por
moeda, dado um aumento de 1% no PIB.
• A propensão de longo prazo, δ0 + δ1 + δ2 + δ3 + δ4 é chamada de
elasticidade de longo prazo: mede o aumento percentual na demanda
por moeda após quatro trimestres, dado um aumento permanente de 1%
no PIB.
6 of 30

Notes
Variáveis dummy
Lecture 11: Forma funcional, variáveis dummy e números índice

• Variáveis binárias ou dummies também são bastante úteis em


aplicações de séries temporais.
• Como a unidade de observação é o tempo, uma dummy indica, em
cada período de tempo, se determinado evento ocorreu.
• Por exemplo, para dados anuais, podemos indicar em cada ano se
um democrata ou um republicano é o presidente dos Estados
Unidos definindo a variável democt , que será 1 se o presidente for
democrata ou 0 caso contrário.
• Em muitas aplicações, as dummies são usadas para isolar certos
períodos que possam ser sistematicamente diferentes de outros
períodos dentro do banco de dados.

7 of 30

Notes
Exemplo 2: fertilidade
Lecture 11: Forma funcional, variáveis dummy e números índice

• A taxa geral de fertilidade (gfr ) é a quantidade de crianças


nascidas para cada 1000 mulheres em idade fértil.
• Para os anos 1913 a 1984, a equação

gfrt = β0 + β1 pet + β2 ww 2t + β3 pillt + ut ,

explica gfr em termos do valor real da dedução no imposto de


renda por dependente (pe) e duas variáveis binárias.
• A variável ww 2 assume valor 1 durante os anos de 1941 a 1945,
quando os Estados Unidos estavam na Segunda Guerra Mundial.
• A variável pill é igual a 1 a partir de 1963, quando pílulas
anticoncepcionais passaram a ser disponíveis.
8 of 30
Notes
Exemplo 2: fertilidade
Lecture 11: Forma funcional, variáveis dummy e números índice

• Usando os dados em FERTIL3, obtemos:

c = 98.68 + 0.083 pe − 24.24 ww2 − 31.59 pill


gfr
(3.21) (0.030) (7.46) (4.08)

T = 72 R 2 = 0.473.

• As variáveis são significantes?


• Interprete os coeficientes das dummies, comparando com os valores
médios da variável gfr na amostra.
• Calcule o valor médio de pe na amostra. Quanto deve aumentar
pe para que a taxa de fertilidade caia em 1 criança por 1000
mulheres em idade fértil?

9 of 30

Notes
Exemplo 2: modelo com defasagens
Lecture 11: Forma funcional, variáveis dummy e números índice

• Como é possível que os incentivos econômicos tenham efeito retardado


sobre as decisões das pessoas, vamos estimar um modelo com defasagens
da variável pe:
c = 95.87 + 0.073 pe − 0.0058 pe_1 + 0.034 pe_2
gfr
(3.28) (0.126) (0.156) (0.126)

− 22.13 ww2 − 31.31 pill, T = 70 R 2 = 0.499.


(10.73) (3.98)

• Note a diferença do tamanho da amostra em relação ao modelo anterior.


• As variáveis pet , pet−1 e pet−2 são individualmente significantes?
• Conjuntamente, elas são estatisticamente significantes (p-valor = 0.012).
Você diria que pe tem efeito sobre gfr ?
• O teste conjunto das duas defasagens não é significante (p-valor = 0.95).
O que você faria?
10 of 30

Notes
Estudo de evento
Lecture 11: Forma funcional, variáveis dummy e números índice

• Variáveis explicativas binárias são chave para realizar estudos de evento.


• No estudo de evento, queremos saber se determinado evento influencia
algum resultado.
• Rose (1985) estudou os efeitos de uma nova regulamentação do setor de
transporte rodoviário sobre os preços das ações das transportadoras.
• Uma versão simplificada da equação usada nesse estudo de evento é:

Rtf = β0 + β1 Rtm + β2 dt + ut ,

tal que Rtf é o retorno das ações da empresa f no tempo t, Rtm é o


retorno de mercado no instante t, e dt é uma dummy indicando quando
ocorreu o evento.

11 of 30

Notes
Múltiplas dummies
Lecture 11: Forma funcional, variáveis dummy e números índice

• Algumas vezes usamos múltiplas dummies para controlar os efeitos


do evento em diferentes instantes de tempo.
• Suponha a imposição de uma nova regulamentação que pode
afetar determinada empresa; podemos incluir uma dummy que
assume valor 1 algumas semanas antes da regulamentação ter sido
publicada e uma segunda dummy que assume valor 1 algumas
semanas após o anúncio.
• A primeira dummy detecta a presença (ou não) de informações
privilegiadas.

12 of 30
Notes
Exemplo 3: suspeita de dumping
Lecture 11: Forma funcional, variáveis dummy e números índice

• Vamos analisar os efeitos de queixas de dumping na indústria


química americana. Especificamente, o composto cloreto de bário,
usado para limpeza e na produção de gasolina.
• No início da década de 1980, produtores americanos acusaram
empresas chinesas de dumping e apresentaram queixa na US-ITC
em outubro de 1983.
• A US-ITC deu ganho de causa às empresas americanas em outubro
de 1984.

13 of 30

Notes
Exemplo 3: perguntas
Lecture 11: Forma funcional, variáveis dummy e números índice

• Queremos responder estas três perguntas:


1. As importações estavam estranhamente altas no período
imediatamente anterior à apresentação da queixa?
2. As importações mudaram significativamente após a apresentação da
queixa?
3. Qual foi a redução das importações após a decisão em favor da
indústria americana?

14 of 30

Notes
Exemplo 3: metodologia
Lecture 11: Forma funcional, variáveis dummy e números índice

• Para responder estas três perguntas, vamos criar um estudo de


evento usando três dummies:
◦ befile6: igual a 1 nos seis meses antes da apresentação da queixa;
◦ affile6: igual a 1 nos seis meses posteriores à apresentação da queixa;
◦ afdec6: igual a 1 nos seis meses após a decisão favorável à indústria
americana.
• A variável dependente é o volume de importações de cloreto de
bário da China, chnimp, na forma logarítmica.
• Variáveis explicativas: índice de produção química (chempi),
volume de produção de gasolina (gas), e taxa de câmbio (rtwex ).
• As duas primeiras variáveis controlam a demanda por cloreto de
bário e a terceira mede a força do dólar em relação a uma cesta de
moedas estrangeiras.
15 of 30

Notes
Exemplo 3: resultado
Lecture 11: Forma funcional, variáveis dummy e números índice

• Usando dados do arquivo BARIUM de fevereiro de 1978 a dezembro


de 1988, obtemos:

\ = −17.80 + 3.12 lchempi + 0.196 lgas + 0.983 lrtwex


lchnimp
(21.05) (0.48) (0.907) (0.400)

+ 0.060 befile6 − 0.032 affile6 − 0.565 afdec6


(0.261) (0.264) (0.286)

T = 131 R 2 = 0.305

• Há evidências de alta de importações nos 6 meses anteriores à


queixa?
• Após a queixa, o que houve com as importações?
• E o que houve após a decisão favorável?
16 of 30
Notes
Tendência em séries temporais
Lecture 11: Tendência e sazonalidade

• Muitas séries de tempo têm uma tendência comum de crescer ao


longo do tempo.
• Quando duas variáveis possuem tendência, podemos erroneamente
concluir que alterações em uma variável são causadas por
alterações na outra variável.
• Em muitos casos, dois processos estocásticos parecem ser
correlacionados somente porque ambos apresentam tendência (por
razões relacionadas com outros fatores não observados).
• Isso recebe o nome de correlação espúria.

17 of 30

Notes
Modelo com tendência linear
Lecture 11: Tendência e sazonalidade

• Para capturar adequadamente uma tendência, um modelo


estatístico pode ter a seguinte formulação:

yt = α0 + α1 t + et , t = 1, 2, . . . , (L11.2)

tal que {et } é uma sequência iid com E(et ) = 0 e V(et ) = σe2 .
• O parâmetro α1 que multiplica o tempo t captura a tendência
temporal linear.
• Este parâmetro mede a mudança em y , de um período para o
próximo, motivada pela passagem do tempo.
• Se α1 > 0, então, em média, yt tem uma tendência ascendente. Se
α1 < 0, então yt tem uma tendência descendente.
18 of 30

Notes
Modelo com tendência exponencial
Lecture 11: Tendência e sazonalidade

• Muitas séries temporais econômicas são melhor aproximadas por


uma tendência exponencial.
• Na prática, uma tendência exponencial em uma série temporal é
captada pela modelagem do logaritmo natural da série como uma
tendência linear (assumindo que yt > 0):

ln(yt ) = β0 + β1 t + et , t = 1, 2, . . . . (L11.3)

• A exponenciação mostra que yt tem uma tendência exponencial:


yt = exp(β0 + β1 t + et ).
• O coeficiente β1 é aproximadamente a taxa média de crescimento
de y por período.
19 of 30

Notes
Outras tendências temporais
Lecture 11: Tendência e sazonalidade

• Embora tendências lineares e exponenciais sejam mais comuns, as


tendências temporais podem ser mais complicadas.
• Por exemplo, poderíamos ter uma tendência temporal
quadrática:

yt = α0 + α1 t + α2 t 2 + et , t = 1, 2, . . . . (L11.4)

• Os sinais de α1 e α2 determinarão o comportamento da tendência


da variável y ao longo do tempo.

20 of 30
Notes
Exemplo 4: investimento imobiliário
Lecture 11: Tendência e sazonalidade

• Os dados HSEINV são observações anuais de investimento


imobiliário e preços de imóveis nos Estados Unidos de 1947 a 1988.
• A variável invpc é o investimento imobiliário per capita real (em
milhares de dólares) e price é um índice dos preços dos imóveis
(igual a 1 em 1982).
• Uma regressão simples que mede a elasticidade é:

\ = −0.550 + 1.241 lprice


linvpc
(0.043) (0.382)

T = 42 R 2 = 0.208.

• Interprete a elasticidade encontrada. É coerente?

21 of 30

Notes
Exemplo 4: representação gráfica
Lecture 11: Tendência e sazonalidade

lprice
0.05

-0.05

-0.1

-0.15

-0.2
1947 1954 1961 1968 1975 1982

linvpc
-0.3
-0.4
-0.5
-0.6
-0.7
-0.8
-0.9
-1
-1.1
1947 1954 1961 1968 1975 1982

22 of 30

Notes
Exemplo 4: regressão com tendência
Lecture 11: Tendência e sazonalidade

• Levando em conta a presença da tendência das variáveis, temos o


modelo:

\ = −0.913 − 0.381 lprice + 0.0098 t


linvpc
(0.136) (0.679) (0.0035)

T = 42 R 2 = 0.341.

• Interprete a elasticidade: sinal e significância.


• Interprete o coeficiente da tendência.
• O que é possível dizer sobre a regressão que não leva em conta a
tendência?

23 of 30

Notes
Exemplo 2 novamente
Lecture 11: Tendência e sazonalidade

• Quando as variáveis dependente e independente têm tendências


contrárias, a presença da tendência na regressão pode aumentar a
significância dos resultados.
gfr
130
120
110
100
90
80
70
60
1913 1925 1937 1949 1961 1973

pe
250

200

150

100

50

0
1913 1925 1937 1949 1961 1973

24 of 30
Notes
Exemplo 2: considerando tendência
Lecture 11: Tendência e sazonalidade

• Adicionando uma tendência linear na regressão, temos:

c = 111.77 + 0.279 pe − 35.59 ww2 + 0.997 pill


gfr
(3.36) (0.040) (6.30) (6.262)

− 1.15 t, T = 72, R 2 = 0.662.


(0.19)

• O coeficiente de pe é mais que o triplo do anterior (0.083) e é


mais significante.
• A variável pill deixa de ser significante.

25 of 30

Notes
Exemplo 2: tendência quadrática
Lecture 11: Tendência e sazonalidade

• Vimos no gráfico de gfr que a variável apresenta crescimento e


diminuição ao longo do tempo.
• Um modelo com tendência quadrática fica:

c = 124.09 + 0.348 pe − 35.88 ww2 − 10.12 pill


gfr
(4.36) (0.040) (5.71) (6.34)

− 2.53 t + 0.0196 tsq, T = 72 R 2 = 0.727.


(0.39) (0.0050)

• O coeficiente de pe é ainda maior e mais significante.


• pill volta a ter o sinal correto e é marginalmente significante.

26 of 30

Notes
Removendo a tendência
Lecture 11: Tendência e sazonalidade

• Seja uma variável yt que apresenta uma tendência linear.


• Se quisermos retirar a tendência desta variável, podemos seguir os
seguintes passos:
1. Estime a regressão de yt sobre uma constante e a tendência temporal
linear t;
2. Calcule os resíduos desta regressão. Eles serão a variável yt com a
tendência removida (ÿt ).
• É possível fazer isso com todas as variáveis que apresentam
tendência.

27 of 30

Notes
Sazonalidade
Lecture 11: Tendência e sazonalidade

• Se uma série temporal é observada em intervalos mensais ou


trimestrais (ou mesmo semanais ou diários), ela pode exibir
sazonalidade.
• Muitas séries já são disponibilizadas ao público após uma
dessazonalização (ajustadas sazonalmente).
• Porém, algumas vezes trabalhamos com dados não ajustados e é
bom sabermos que existem métodos simples para tratar a
sazonalidade: podemos incluir um conjunto de variáveis dummy
sazonais.

28 of 30
Notes
Sazonalidade na regressão
Lecture 11: Tendência e sazonalidade

• Se trabalharmos com dados mensais, podemos incluir uma variável


dummy para cada mês do ano (é necessário escolher um mês base
que ficará de fora da lista de dummies e β0 será o intercepto deste
mês):

yt = β0 + δ1 fevt + δ2 mart + · · · + δ11 dezt


+ β1 x1t + · · · + βk xkt + ut . (L11.5)

• Se não houver sazonalidade em yt , uma vez que xjt tenha sido


controlada, δ1 , . . . , δ11 serão todas iguais a zero. Isso pode ser
facilmente verificado com um teste F .

29 of 30

Notes
Dessazonalização
Lecture 11: Tendência e sazonalidade

• Se houver sazonalidade em uma variável, é possível exclui-la


obtendo os resíduos de uma regressão da variável com sazonalidade
contra um conjunto de dummies de tempo (dias da semana,
meses, trimestres, etc.).

30 of 30

Notes

Notes

Você também pode gostar