Escolar Documentos
Profissional Documentos
Cultura Documentos
cemig
500 1960
1000
1500
1965 Time
1970
1975
Figura 1: Gr aco da s erie de vaz oes, de jan/1960 a dez/1975. b) Verique se existe a necessidade de uma transforma ca o logar tmica na s erie, com o objetivo de estabilizar a vari ancia. Para responder a essa pergunta, voc e dever a dividir o seu conjunto de dados em seq u encias de 12 observa co es consecutivas. Com os comandos abaixo, no R, dividimos a s erie em grupos de 12 observac o es consecutivas e calculamos a m edia e o desvio padr ao para cada grupo: > y <- matrix(cemig, 12) > medias <- apply(y, 2, mean) > desvios <- apply(y, 2, sd)
1 Powered A by L TEX 2 , R 1.9.1 and Sweave
vazo
500
1000
1500
jan
fev
mar
abr
mai
jun ms
jul
ago
set
out
nov
dez
Figura 2: Gr aco Boxplot dos valores agrupados por m es. Temos na Figura 3 o diagrama de dispers ao dessas quantidades. Nota-se claramente uma associa ca o linear positiva entre a m edia e o desvio-padr ao, o que sugere que uma transforma ca o logar tmica na s erie original e necess aria para estabilizar a vari ancia. Prosseguiremos portanto com o restante das an alises na s erie transformada: Yt = ln(cemig ), cujo gr aco est a na Figura 4. c) Separe as 12 u ltimas observa co es e, com as demais, ajuste um modelo com componente sazonal estoc astica (SARIMA) e apresente gracamente a s erie original e o modelo ajustado. Comecemos olhando o gr aco das auto-correla co es e auto-correla co es parciais estimadas da s erie transformada, sem as 12 u ltimas observa co es, na Figura 5. A fac amostral indica o comportamento sazonal da s erie, e a facp se comporta de maneira similar. Consideremos agora a fac e facp amostrais das diferen cas de ordem 1 (), 12 (12 ) e 1 e 12 (1 12 ), na Figura 6. Nota-se que o uso de diferen ca simples n ao melhora signicativamente as fac e facp, optamos ent ao por usar apenas uma diferen ca sazonal, ou seja D = 1 e d = 0. Concentrando-nos no gr aco das fac e facp de 12 , vemos que um termo de m edias m oveis sazonal de ordem 1 pode ser apropriado, pois a correla ca o parcial de ordem 12 e signicante. Observemos ainda que a fac tem um comportamento de decrescimento exponencial, e que a facp, fora os lags sazonais, tem somente 11 = 0. Isso sugere um componente autoregressivo t = 1, . . . , 192, (1)
desviopadro
200 300
300
400
500
400
500 mdia
600
700
6.5
7.5
1965 Time
1970
1975
Figura 4: Gr aco da s erie transformada de acordo com a equa ca o (1). de ordem 1 na parte n ao-sazonal do modelo. Optamos ent ao por um modelo preliminar dado por: SARIMA(1, 0, 0) (0, 1, 1)12 Ajustamos esse modelo no R com o comando: > modelo1 <- arima(y, order = c(1, 0, 0), seasonal = list(order = c(0, + 1, 1), period = 12)) Obtendo as estimativas: 3 (2)
Series y
1.0 0.8
Series y
0.5
ACF
0.0
0.5
0.4
0.0
0.4
0.5
1.0 Lag
1.5
Series diff(y)
ACF
0.4
0.2
0.0
0.5
1.0 Lag
1.5
0.3
0.0
0.5
1.0 Lag
1.5
ACF
0.5
0.5
0.0
0.5
1.0 Lag
1.5
0.2 0.2
0.5
1.0 Lag
1.5
ACF
0.5
0.5
0.0
0.5
1.0 Lag
1.5
0.6
0.2
0.5
1.0 Lag
1.5
, , e
Logo ambos os coecientes s ao signicantes. O valor estimado da vari ancia tamb em e razo avel, considerando que a vari ancia dos dados transformados e 4
quase 6 vezes maior: 0.5488. Na Figura 7 temos os gr acos de diagn ostico dos res duos do modelo 2 proposto. Observa-se que a fac n ao tem nenhuma correla ca o n ao nula, e que os p-valores do teste de independ encia dos res duos est ao sempre acima de 40%. Conclu -se que o modelo est a bem ajustado, com os res duos aparentando ser ru do branco.
Standardized Residuals
3 3 1 1960 1
1965 Time
1970
1975
ACF of Residuals
0.0 0.4 0.8 0.0
ACF
0.5 Lag
1.0
1.5
p value
4 lag
10
Figura 7: Gr aco de diagn osticos do modelo 2. Na Figura 8 temos o gr aco da s erie original e da prevista (tracejada) pelo modelo 2. Observamos que em geral o ajuste foi bom, entretanto os picos de maior variabilidade n ao foram previstos.
1500
cemig ajustada
500 1960
1000
1965 Time
1970
1975
d) Fa ca o ajustamento utilizando a metodologia Sazonalidade - Determin stica - M etodo de Regress ao (Cap. 3) apresentando gracamente a s erie original e o modelo ajustado. Atrav es dessa metodologia, procuramos modelar a s erie transformada atrav es de componentes determin sticos, supondo que as observa co es s ao independentes entre si. Ajustamos um modelo do tipo: Yij = Tij + Sj + aij , i = 1, . . . , 180, j = 1, . . . , 12
onde o ndice i representa o per odo, o ndice j o m es, e aij e um ru do branco. T e um efeito de tend encia polinomial de grau m, e S e um efeito sazonal determin stico com valores xos para cada m es i :
m 12
Tt =
j =0
j t e S t =
j =1
j Djt ,
onde: 1 , 1 , 0 , se o per odo t corresponde ao m es j , se o per odo t corresponde ao m es 12, caso contr ario, j = 1, . . . , 12.
Djt =
Em particular, tomaremos m = 1, ou seja, um efeito de tend encia linear simples. Ajustemos ent ao o modelo de regress ao linear m ultipla correspondente a:
12
Yt = 0 + 1 t +
j =1
j Djt + at ,
(3)
com os comandos abaixo obtemos esse ajuste no R: > t <- 1:length(y) > modelo.det <- lm(y ~ t + mes, contrasts = list(mes = contr.sum)) Na Tabela 1 temos a Tabela de An alise de Vari ancia para as componentes do modelo 3, onde conrmamos que o efeito de tend encia e n ao signicante e o de sazonalidade mensal e. t mes Residuals Df 1 11 167 Sum Sq 0.12 66.59 31.53 Mean Sq 0.12 6.05 0.19 F value 0.64 32.06 Pr(>F) 0.4246 0.0000
Tabela 1: An alise de vari ancia para as componentes do modelo Na Figura 9 temos o gr aco da s erie de vaz oes e o modelo 3 ajustado, que considera todos os efeitos determin sticos.
1500
cemig ajustada
500 1960
1000
1965 Time
1970
1975
Figura 9: Gr aco da s erie das vaz oes e modelo 3 ajustado (sazonalidade determin stica). e) Qual metodologia foi mais adequada? Comparando as Figuras 9 e 8, ca claro que o ajuste por SARIMA e bem mais adequado nesse caso. O ajuste determin stico ignora toda a estrutura de correla ca o dos erros e n ao consegue prever nenhum dos picos da s erie, em contraste com o modelo SARIMA. f) Fa ca previs oes at e 12 passos a frente, utilizando os dois m etodos acima e apresente gracamente a s erie original e as previs oes. Pelo m etodo SARIMA, obtemos as previs oes atrav es do comando predict, no R: > predict(modelo1, 12) $pred Jan Feb Mar Apr May Jun Jul Aug 1975 6.200 6.247 6.444 6.215 5.788 5.529 5.327 5.106 Sep Oct Nov Dec 1975 4.937 5.477 5.928 6.367 $se Jan Feb Mar Apr May Jun Jul 1975 0.3116 0.3871 0.4226 0.4407 0.4502 0.4553 0.4581 Aug Sep Oct Nov Dec 1975 0.4596 0.4604 0.4608 0.4610 0.4612
Entretanto essas previs oes s ao para a vari avel transformada Y t . Se quisermos as previs oes para a vari avel na escala original, temos que a aplicar uma transforma ca o inversa. O problema e que ao fazermos:
t (h) t (h) = eY Z ,
estamos obtendo uma previs ao viesada. A previs ao o tima nesse caso, de acordo com a se ca o 9.6 do livro texto, e: eYt (h)+ 2 Vy (h) . Levando em conta essa corre ca o, temos as previs oes na escala original, pelo modelo 2 (SARIMA) dadas na Tabela 2. Na mesma Tabela, temos tamb em a previs ao para os valores atrav es do modelo determin stico 3, e os valores reais observados. jan/1975 fev/1975 mar/1975 abr/1975 mai/1975 jun/1975 jul/1975 ago/1975 set/1975 out/1975 nov/1975 dez/1975 original 747.00 669.00 401.00 409.00 285.00 202.00 179.00 130.00 99.00 159.00 378.00 419.00 sarima 517.32 556.48 687.86 550.96 361.07 279.33 228.62 183.31 154.92 266.01 417.42 647.34 det 791.19 828.16 767.52 519.87 356.65 267.77 213.69 168.76 136.97 207.11 356.51 595.48
Tabela 2: Previs oes segundo os dois modelos e s erie original. Na Figura 10 temos o gr aco s o dos u ltimos 12 meses da s erie original, com as previs oes pelos dois modelos.
800
200 1975.0
400
600
1975.2
1975.4 Time
1975.6
1975.8
Figura 10: Previs oes e s erie original do ano de 1975 para a s erie de vaz oes. Por m na Figura 11 temos a s erie completa e os valores previstos. Observamos que os dois m etodos obtiveram resultados similares para a previs ao desse per odo em particular, mas recomenda-se o uso do modelo SARIMA, entre outras raz oes, pela possibilidade de se ajustar os valores preditos de acordo com novas observa co es.
500 1960
1000
1500
1965 Time
1970
1975
Sobre
A vers ao eletr onica desse arquivo pode ser obtida em http://www.feferraz. net Copyright (c) 1999-2005 Fernando Henrique Ferraz Pereira da Rosa. E dada permiss~ ao para copiar, distribuir e/ou modificar este documento sob os termos da Licen ca de Documenta ca ~o Livre GNU (GFDL), vers~ ao 1.2, publicada pela Free Software Foundation; Uma c opia da licen ca em est a inclusa na se ca ~o intitulada "Sobre / Licen ca de Uso".