Escolar Documentos
Profissional Documentos
Cultura Documentos
Projeto 5
- Previsão de Séries Temporais
Rajendra M Bhat
Para esta tarefa em particular, os dados de diferentes tipos de vendas de vinho no século 20
devem ser analisados. Ambos os dados são da mesma empresa, mas de vinhos diferentes.
Como analista da ABC Estate Wines, você tem a tarefa de analisar e prever as vendas de
vinhos no século 20.
Venda de espumantes
Por favor, tente construir o maior número possível de modelos e tantas iterações de modelos quanto possível
com parâmetros diferentes.
Teste RMSE
RegressionOnTime 15.280000
Ingenuidade 79.741326
SimpleAverageModel 53.483727
2pontoTrailingMovingMédia 11.529811
4pointTrailingMovingMédia 14.457115
6pontoTrailingMovingMédia 14.571789
9pointTrailingMovingMédia 14.731914
Alfa=0,995,SimpleExponentialSmoothing 36.819844
Alfa=0,995,Beta=0,995:DoubleExponentialSmoothing 15.276679
Alfa=0,99,Beta=0,0001,Gama=0,005:DoubleExponentialSmoothing 20.962011
Alfa=0,02,SimpleExponentialSmoothing 36.459396
Venda de espumantes
Previsão Média Simples
Médias Móveis (MA)
Gráficos de comparação de modelos
Testar RMSE
RegressionOnTime 1389.140000
Ingenuidade 3864.279352
SimpleAverageModel 1275.081804
2pontoTrailingMovingMédia 813.400684
4pointTrailingMovingMédia 1156.589694
6pontoTrailingMovingMédia 1283.927428
Testar RMSE
9pointTrailingMovingMédia 1346.278315
Alfa=0,995,SimpleExponentialSmoothing 1316.034674
Alfa=0,995,Beta=0,995:DoubleExponentialSmoothing 2007.238526
Alfa=0,99,Beta=0,0001,Gama=0,005:DoubleExponentialSmoothing 469.591976
Alfa=0,02,SimpleExponentialSmoothing 1279.495201
5. Verificar a estacionariedade dos dados sobre os quais o modelo está sendo construído usando
testes estatísticos apropriados e também mencionar a hipótese para o teste estatístico. Se os dados
forem considerados não estacionários, tome as medidas apropriadas para torná-los estacionários.
Confira os novos dados para estacionariedade e comente. Nota: A estacionariedade deve ser
verificada em alfa = 0,05.
Para verificar se a série está estacionária, utilizamos o teste Augmented Dickey Fuller (ADF), cuja hipótese nula
e alternativa pode ser simplificada para
•Hipótese Nula H0: A série temporal não é estacionária
•Hipótese Alternativa Ha: A série temporal é estacionária
Vendas de vinho
rosé
Modelo ARIMA
Valores AIC em ordem decrescente
parapa
relhagem AIC
17 (3, 1, 3) 1273.194108
4 (1, 1, 2) 1277.359223
3 (1, 1, 1) 1277.775747
parapa
relhagem AIC
9 (2, 1, 1) 1279.045689
10 (2, 1, 2) 1279.298694
5 (1, 1, 3) 1279.312635
15 (3, 1, 1) 1279.605966
16 (3, 1, 2) 1280.969245
11 (2, 1, 3) 1281.196226
1 (1, 0, 2) 1292.053210
7 (2, 0, 2) 1292.248055
2 (1, 0, 3) 1292.929011
6 (2, 0, 1) 1292.937195
14 (3, 0, 3) 1293.042709
8 (2, 0, 3) 1294.247938
0 (1, 0, 1) 1294.510585
12 (3, 0, 1) 1333.933193
13 (3, 0, 2) 1355.403813
Resultados do Modelo
ARIMA
Dep. Variável: D.Rosa Não. Observações: 131 -
Modelo: ARIMA(3, 1, 3) Probabilidade de log 628.597
Método: CSS-MLE S.D. de inovações 28.355
Data: Sáb, 06 Mar 2021 AIC 1273.194
Hora: 14:46: 16 BIC 1296.196
Amostra: 02-01-19 80 HQIC 1282.541
- 12-01-19 90
============== Coefi ============
erro std z P>|z| [0.025
ciente 0.975]
--------------
-0.4906 0.088 -5.548 0.000 -0.664 -0.317
Const
AR. L1. D.Rosa -0.7244 0.086 -8.417 0.000 -0.893 -0.556
AR. L2. D.Rosa -0.7218 0.086 -8.349 0.000 -0.891 -0.552
AR. L3. D.Rosa 0.2763 0.085 3.236 0.001 0.109 0.444
mamã. L1. -0.0150 0.044 -0.338 0.735 -0.102 0.072
D.RosaL2.
mamã. 0.0150 0.044 0.339 0.734 -0.072 0.102
D.RosaL3.
mamã. -1.0000 0.046 -21.918 0.000 -1.089 -0.911
D.Rosa Hortaliça
============== =========
Real Imaginário Módulo
Frequência
--------------
-0.5011 -0 .8661j 1.0006 -0.3335
AR.1
AR.2 -0.5011 +0 .8661j 1.0006 0.3335
AR.3 3.6147 -0 .0000j 3.6147 -0.0000
MA.1 1.0000 -0 .0000j 1.0000 -0.0000
MA.2 -0.4925 -0 .8703j 1.0000 -0.3320
MA.3 -0.4925 +0 .8703j 1.0000 0.3320
Modelo SARIMA
Valores de AIC em ordem decrescente (registros AIC 10 mais baixos)
parapa
relhagem sazonal AIC
Resultados SARIMAX
======================== ==============
y Não. Observações:
Dep. Variável:
Modelo: ARIMAX(0, 1, 2)x(2, 1 , 2, 12) Probabilidade de 132
-380.485
Data: Sáb, 06 Março de log
AIC 774.969
Hora: 2021
13:41:44 BIC 792.622
Amostra: 0 HQIC 782.094
- 132
Covariânci Tipo: OPG
a
========== =========
Coeficiente erro std z P>|z| [0.025
0.975]
----------
-0.9524 0.184 -5.166 0.000 -1.314 -0.591
mamã. L2
mamã. L1 -0.0764 0.126 -0.605 0.545 -0.324 0.171
AR. S.L12 0.0480 0.177 0.271 0.786 -0.299 0.395
AR. S.L24 -0.0419 0.028 -1.513 0.130 -0.096 0.012
mamã. -0.7526 0.301 -2.503 0.012 -1.342 -0.163
S.L12
mamã. -0.0721 0.204 -0.354 0.723 -0.471 0.327
S.L24
sigma2 187.8679 45.274 4.150 0.000 99.132 276.604
========== Jarque-Bera ==============
(L1) (Q): 0.06 (JB) ):
Ljung-
Prob(Q): 0.81 Prob(JB): 4.86
0.09
Heteroscedasticidade (H): 0.91 Enviesar: 0.41
Prob(H) (frente e verso): 0.79 Curtose: 3.77
Venda de espumantes
Modelo ARIMA
Valores AIC em ordem decrescente
parapa
relhagem AIC
8 (2, 1, 2) 2210.616954
7 (2, 1, 1) 2232.360490
parapa
relhagem AIC
2 (0, 1, 2) 2232.783098
5 (1, 1, 2) 2233.597647
4 (1, 1, 1) 2235.013945
6 (2, 1, 0) 2262.035601
1 (0, 1, 1) 2264.906439
3 (1, 1, 0) 2268.528061
0 (0, 1, 0) 2269.582796
parapa
relhagem sazonal AIC
Resultados SARIMAX
======================================= ==============
y Não. Observações:
Dep. Variável: 132
Modelo: SARIMAX(0, 1, 2) x(0, 1, 2, 12) Log Verossimilhança
Dom, 28 Feve 2 021: -686.242
Data: AIC
reir 38 1382.484
Hora: 0 BIC
o 1395.093
Amostra: 6 0 HQIC
18: 1387.573
132
Covariância Tipo: - OPG
========== Coefi
erro std z P>|z| [0.025 0. 975]
ciente
---------- -
-0.7223 0.107 .752 0.000 -0.932 -0 .513
mamã. 6
mamã. L1
L2 -0.2292 0.137 - .671 0.095 -0.498 0.040
mamã. S.L12 -0.4113 0.087 1
- .743 0.000 -0.581 -0 .241
mamã. S.L24 -0.0419 0.138 4
- .304 0.761 -0.312 0.228
sigma2 1.736e+05 2,06e+04 0
8 .425 0.000 1. 33e+05 2,14e+05
Ljung-Caixa (L1)(Q): 0.02 Jarque-Bera (JB): 27.42
Prob(Q): 0.88 Prob(JB): 0.00
Heteroscedasticidade (H): 0.84 Enviesar: 0.80
Prob(H) (frente e verso): 0.62 Curtose: 5.15
7. Construir modelos ARIMA/SARIMA com base nos pontos de corte de ACF e PACF nos dados de
treinamento e avaliar esse modelo nos dados de teste usando RMSE.
============== Coefic
erro std z P>|z| [0.025 0.975]
iente
--------------
-0.1905 0.576 -0.331 0.741 -1.319 0.938
Const
AR. L1. D.Rosa 1.1685 0.087 13.391 0.000 0.997 1.340
AR. L2. D.Rosa -0.3562 0.132 -2.693 0.007 -0.616 -0.097
AR. L3. D.Rosa 0.1855 0.132 1.402 0.161 -0.074 0.445
AR. L4. D.Rosa -0.2227 0.091 -2.443 0.015 -0.401 -0.044
mamã. L1. -1.9506 Nan Nan Nan Nan Nan
D.RosaL2.
mamã. 1.0000 Nan Nan Nan Nan Nan
D.Rosa Hortaliça
============== =========
Real Imaginário Módulo
Frequência
--------------
1.1027 -0,4116j 1.1770 -0.0569
AR.1
AR.2 1.1027 +0,4116j 1.1770 0.0569
AR.3 -0.6863 -1,6643J 1.8003 -0.3122
AR.4 -0.6863 +1,6643j 1.8003 0.3122
MA.1 0.9753 -0,2209j 1.0000 -0.0355
MA.2 0.9753 +0,2209j 1.0000 0.0355
Resultados SARIMAX
Dep. Variável: y Não. Observações: 132
Modelo: SARIMAX(4, 1, 2) x(4, 1, 2, 12) Probabilidade de log -277.661
Data: Dom, 07 Março de 2021 AIC
Hora: 581.322
Amostra: 14:22:21 BIC 609.983
0 HQIC 592.663
Tipo de covariância: - OPG
132
======================= =======================================================
Coefic
erro std z P>|z| [0.025 0.975]
iente
----------------------- ---------------------------------------------------------
AR. L1 -0.9742 0.199 -4.899 0.000 -1.364 -0.584
AR. L2 -0.1122 0.285 -0.394 0.694 -0.670 0.446
AR. L3 -0.1044 0.277 -0.377 0.706 -0.647 0.438
AR. L4 -0.1285 0.162 -0.794 0.427 -0.446 0.189
mamã. L1 0.1605 328.137 0.000 1.000 -642.976 643.297
mamã. L2 -0.8395 275.462 -0.003 0.998 -540.734 539.055
AR. S.L12 -0.1441 0.364 -0.396 0.692 -0.858 0.569
AR. S.L24 -0.3597 0.227 -1.587 0.113 -0.804 0.085
AR. S.L36 -0.2153 0.106 -2.039 0.041 -0.422 -0.008
AR. S.L48 -0.1195 0.093 -1.281 0.200 -0.302 0.063
mamã. -0.5159 0.343 -1.503 0.133 -1.189 0.157
S.L12
mamã. 0.2086 0.373 0.559 0.576 -0.523 0.940
S.L24
sigma2 215.3512 7,07e+04 0.003 0.998 -1,38E+05 1,39e+05
======================= ===============
0.03 Jarque-Bera (JB):
Ljung-Caixa (L1)(Q): 0.86 Prob(JB): 2.41
Prob(Q): 0.49 Inclinação: 0.30
Heteroscedasticidade 0.10 Kurtosis: 0.32
(H): 3.68
Venda de espumantes
8. Crie uma tabela (crie um quadro de dados) com todos os modelos criados junto com seus
parâmetros correspondentes e os respectivos valores RMSE nos dados de teste.
RegressionOnTime 15.280000
Ingenuidade 79.741326
SimpleAverageModel 53.483727
2pontoTrailingMovingMédia 11.529811
4pointTrailingMovingMédia 14.457115
6pontoTrailingMovingMédia 14.571789
9pointTrailingMovingMédia 14.731914
Alfa=0,995,SimpleExponentialSmoothing 36.819844
Alfa=0,995,Beta=0,995:DoubleExponentialSmoothing 15.276679
Alfa=0,99,Beta=0,0001,Gama=0,005:DoubleExponentialSmoothing 20.962011
Alfa=0,02,SimpleExponentialSmoothing 36.459396
ARIMA(3, 1, 3) 15.99
ARIMA(4, 1, 2) 33.97
RegressionOnTime 1389.140000
Ingenuidade 3864.279352
SimpleAverageModel 1275.081804
Testar
RMSE
2pontoTrailingMovingMédia 813.400684
4pointTrailingMovingMédia 1156.589694
6pontoTrailingMovingMédia 1283.927428
9pointTrailingMovingMédia 1346.278315
Alfa=0,995,SimpleExponentialSmoothing 1316.034674
Alfa=0,995,Beta=0,995:DoubleExponentialSmoothing 2007.238526
Alfa=0,99,Beta=0,0001,Gama=0,005:DoubleExponentialSmoothing 469.591976
Alfa=0,02,SimpleExponentialSmoothing 1279.495201
ARIMA(2, 1, 2) 1375.03
ARIMA(3, 1, 2) 1375.10
9. Com base no exercício de construção do modelo, construa o(s) modelo(s) mais ótimo(s) sobre os
dados completos e preveja 12 meses no futuro com intervalos/bandas de confiança apropriados.
Uma vez que o conjunto de dados Rose tem um componente claro de sazonalidade SARIM. Portanto, o modelo SARIMA
com parâmetros (0,1,2)x(2,1,2,12) é selecionado para a previsão de séries de linha do tempo e os detalhes do modelo
são os seguintes.
Resultados SARIMAX
====================== ==============
Rosa Não. Observações:
Dep. Variável:
Modelo: SARIMAX(0, 1, 2)x(2, 1, 2, 12) Probabilidade de log 187
-588.604
Data: Sáb, 06 Mar 2021 AIC 1191.208
Hora: 13:41:48 BIC 1212.142
Amostra: 01-01-1980 HQIC 1199.714
- 07-01-1995
Covariânci Tipo: OPG
a
========== Coefi =========
erro std z P>|z| [0.025
ciente 0.975]
---------- ---------
-0.8254 0.080 -10.334 0.000 -0.982
mamã.
mamã. L1
L2 -0.0807 0.086 -0.934 0.350 -0.250 -0.669
0.089
AR. S.L12 0.0635 0.160 0.398 0.691 -0.249 0.376
AR. S.L24 -0.0340 0.019 -1.790 0.074 -0.071 0.003
mamã. -0.6953 0.207 -3.360 0.001 -1.101 -0.290
S.L12
mamã. -0.0547 0.150 -0.365 0.715 -0.348 0.239
S.L24
sigma2 166.0900 17.899 9.279 0.000 131.008 201.172
========== ==============
(L1) (Q): 0.07 Jarque-Bera (JB):
Ljung- 8.28
Prob(Q): 0.79 Prob(JB): 0.02
Heteroscedasticidade 0.51 Enviesar: 0.33
(H): 0.02 Curtose: 3.95
Prob(H) (frente e
verso):
Diagnóstico do Modelo Final para Rosa
Já os dados de vendas de espumantes têm componente de sazonalidade. Portanto, o modelo SARIMA com parímetros
(0,1,2) (0, 1, 2, 12) é proposto para uso para previsão para os próximos 12 meses usando dados completos. Os detalhes
do modelo estão abaixo.
SARIMAXResultados
====================== ===============
Cintilante Não. Observações:
Dep. Variável:
Modelo: SARIMAX(0, 1, 2) x(0, 1, 2, 12) ToraProbabilidade 187
-1087.003
Data: Dom, 28 Fev 2021 AIC 2184.006
Hora: 18:26:36 BIC 2198.958
Amostra: 01-01-1980 HQIC 2190.081
- 07-01-1995
Covariânci Tipo: OPG
a
========== Coefi ==========
erro std z P>|z| [0.025
ciente 0.975]
----------
-0.9094 0.104 -8.713 0.000 -1.114 -0.705
mamã.
mamã. L1
L2 -0.1316 0.087 -1.507 0.132 -0.303 0.040
mamã. -0.5456 0.065 -8.393 0.000 -0.673 -0.418
S.L12
mamã. -0.0202 0.084 -0.241 0.810 -0.185 0.145
S.L24
sigma2 1.419e+05 1,32e+04 10.755 0.000 1,16e+05 1,68e+05
========== ===============
(L1) (Q): 0.01 Jarque-Bera (JB):
Ljung-
Prob(Q): 0.91 Prob(JB): 49.28
0.00
Heteroscedasticidade : 0.79 Enviesar: 0.74
(H)
Prob(H) (frente e 0.42 Curtose: 5.41
verso):
10. Comente sobre o modelo assim construído e relate suas descobertas e sugira as medidas que a
empresa deve tomar para vendas futuras.
A tendência nas vendas da Rose é de queda contínua ao longo do período. Pode ser necessário um estudo detalhado
para ver se a tendência decrescente se deve a uma mudança na preferência do cliente ou devido à substituição.
Observa-se a sazonalidade das vendas, mantendo-se as vendas maiores no final do ano. Alguns esquemas de promoção
e melhoria/melhoria da qualidade do produto podem ser examinados de modo a atrair novos clientes da geração jovem.