Escolar Documentos
Profissional Documentos
Cultura Documentos
EMA. S.M
1
PGPDSBA Online Sep_B 2021
Índice
1. Problema 1:....................................................................................................................................................
1.1. Objetivo..........................................................................................................................................................
1.2. Análise descritiva e exploratória dos dados....................................................................................................
1.2.1. Análise descritiva dos dados:..................................................................................................................
1.2.2. Dados de Séries Temporais - Plotados:...................................................................................................
1.2.3. Análise Exploratória dos Dados:..............................................................................................................
1.3. Divisão de dados de trem e teste....................................................................................................................
1.4. Criando modelos diferentes e verificando o RMSE.......................................................................................
1.4.1. Regressão Linear:..................................................................................................................................
1.4.2. Modelo Bayes ingênuo:........................................................................................................................
1.4.3. Previsão média simples:........................................................................................................................
1.4.4. Previsão de média móvel:.....................................................................................................................
1.4.5. Alisamento exponencial simples:..........................................................................................................
1.4.6. Alisamento Exponencial Duplo:............................................................................................................
1.4.7. Triplo Alisamento Exponencial:.............................................................................................................
1.4.8. Alisamento Exponencial Triplo (Multiplicativo):...................................................................................
1.5. Verificando a Estacionariedade....................................................................................................................
1.6. ARIMA e SARIMA usando o método AIC mais baixo:....................................................................................
1.7. ARIMA e SARIMA com base nos pontos de corte de FAC e FPAC:................................................................
1.8. Comparando valores do RMSE......................................................................................................................
1.9. Construção do modelo ótimo e previsão de 12 meses.................................................................................
1.10. Achados e Sugestões.............................................................................................................................
2
Lista de Figuras
Figura Nome Página
nº. nº.
Fig. 1 Gráfico de Séries Temporais – Vendas de Sapatos 5
Fig. 2 Caixa mensal de vendas de sapatos 6
Fig. 3 Vendas mensais de calçados ao longo dos anos 6
Fig. 4 Gráfico de Séries Temporais juntamente com Média e Mediana 6
Fig. 5 Decomposição multiplicativa do conjunto de dados 7
Fig. 6 Decomposição aditiva do conjunto de dados 8
Fig. 7 Vendas de Sapatos - Trem e Teste Split 9
Fig. 8 Regressão Linear 10
Fig. 9 Modelo Bayes ingênuo 11
Fig. 10 Previsão Média Simples 11
Fig. 11 Previsão de média móvel à direita 12
Fig. 12 Alisamento exponencial único 13
Fig. 13 Alisamento exponencial simples e duplo 13
Fig. 14 Alisamento exponencial simples, duplo e triplo 14
Fig. 15 Alisamento exponencial simples, duplo e triplo (multiplicativo) 14
Fig. 16 Estacionariedade das vendas de calçados no lag 1 16
Fig 17 AIC-ARIMA(2,1,3) A. Resumo, B. Gráfico e C. Diagnóstico 18
Fig 18 AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Resumo, B. Gráfico e C. Diagnóstico 20
Fig. 19 Autocorrelação de Dados Diferenciados 21
Fig. 20 Autocorrelação parcial de dados diferenciados 21
Fig. 21 ACF/PACF- ARIMA(3,1,1) A. Resumo, B. Gráfico e C. Diagnóstico 22
Fig. 22 Figura-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Resumo, B. Gráfico e C. 24
Diagnóstico
Fig. 23 Previsão do modelo ideal para os próximos 12 meses 25
Lista de Tabelas
Tabela nº. Nome Página nº.
Tabela 1 Resumo das informações estatísticas descritivas 4
Tabela 2 Trem e teste Split 9
Tabela 3 Resumo dos resultados de todos os modelos 24
3
1. Problema 1:
1.1. Objetivo
O objetivo é construir um modelo ideal, para prever as vendas dos pares de sapatos
para os próximos 12 meses de onde os dados terminam atualmente.
Além disso, também temos que comentar sobre o modelo assim construído e relatar
nossas descobertas e sugerir as medidas que a empresa deve tomar para vendas
futuras.
Fundo: Você é analista da empresa de calçados IJK e deve prever as vendas dos
pares de sapatos para os próximos 12 meses a partir de onde os dados terminam. Os
dados relativos às vendas de sapatos foram-lhe fornecidos de Janeiro de 1980 a
Julho de 1995.
Dicionário de dados:
AnoMês: Mês e Ano de Venda de Calçados
Shoe_Sales: A venda mensal de sapatos
1.2.1. Análise descritiva dos dados:
4
Descrever função no conjunto de dados: Não há valores nulos no conjunto de dados.
5
Podemos ver a tendência mensal e anual mostrada na Figura 3. Novamente
nos mostrando que dezembro é o mês mais popular para as vendas de
sapatos, bem como o ano em que atingiu o pico de vendas entre 1986 e
1988.Este pico pode ser devido ao interesse generalizado e muitas inovações
feitas para atrair os clientes a comprar seus produtos, aumentando assim as
vendas.
A Figura 4 nos mostra as séries temporais plotadas juntamente com os
valores médios e medianos plotados ao longo de um mesmo gráfico, para
entender a flutuação dos dados dessas duas medidas de tendência central.
Além disso, uma vez que a média se mostra maior que a mediana, conclui-se
que a distribuição é positivamente assimétrica.
6
Figura 4 Gráfico de séries temporais juntamente com média e mediana
DECOMPOSIÇÃO DO CONJUNTO DE DADOS:
7
Figura 5 Decomposição multiplicativa do conjunto de dados
8
Figura 6 Decomposição aditiva do conjunto de dados
Treinar dados Chefe do conjunto de dados: Dados de teste Cabeça do conjunto de dados:
Treinar dados Cauda do conjunto de dados: Dados de teste Cauda do conjunto de dados:
9
Forma de dados de trem = (132, 1) Forma de dados de teste = (55, 1)
10
A Regressão Linear é um algoritmo de aprendizado de máquina baseado em
aprendizado supervisionado. Ele executa uma tarefa de regressão. É uma
ótima ferramenta para previsão. Podemos ver pela figura abaixo que a
regressão linear no tempo está em constante ascensão.
11
Figura 9 Modelo de Bayes Ingênuo
Os valores de RMSE parecem ser os mais baixos para Naïve Bayes até agora.
Mas como a previsão é constante ao longo dos anos, não é um modelo ideal para
o nosso conjunto de dados.
O método é muito simples. Fazemos a média dos dados por meses, trimestres ou
anos e, em seguida, calculamos a média para o período. Mais tarde, passamos a
descobrir, qual é a porcentagem que é para a grande média.
12
A Previsão de Médias Móveis é uma técnica ingênua e eficaz na previsão de
séries temporais.
O cálculo de uma média móvel envolve a criação de uma nova série onde os
valores são compostos pela média das observações brutas na série temporal
original.
Uma média móvel requer que você especifique um tamanho de janela
chamado largura da janela. Isso define o número de observações brutas usadas
para calcular o valor da média móvel. Usamos o método da média móvel à
direita.
13
Figura 12 Suavização exponencial simples
14
Tanto a sazonalidade quanto a tendência podem ser aditivas ou
multiplicativas. Este é o modelo aditivo.
O valor alfa ou nível de suavização no qual o gráfico é plotado é 0,570,
enquanto a tendência beta ou suavização é 0,0001 e gama ou suavização
sazonal é 0,293.
15
SimpleAverageModel 63.98457
2pontoTrailingMovingMédia 45.94874
4pointTrailingMovingMédia 57.87269
6pontoTrailingMovingMédia 63.45689
9pointTrailingMovingMédia 67.72365
SimpleExponentialSmoothing 196.4048
DoubleExponentialSmoothing 266.1612
TriploExponencialSuavização 128.9925
TriploExponencialSuavizaçãoMultiplicativo 83.73405
16
Figura-16 Estacionariedade das vendas de calçado no lag 1
ARIMA:
i. Primeiro criamos uma grade de todos os resultados possíveis (p,d,q). O
intervalo de 'p' e 'q' sendo (0,4) e 'd' uma constante = 1.
Modelo: (0, 1, 1)
Modelo: (0, 1, 2)
Modelo: (0, 1, 3)
Modelo: (1, 1, 0)
Modelo: (1, 1, 1)
Modelo: (1, 1, 2)
Modelo: (1, 1, 3)
Modelo: (2, 1, 0)
17
Modelo: (2, 1, 1)
Modelo: (2, 1, 2)
Modelo: (2, 1, 3)
Modelo: (3, 1, 0)
Modelo: (3, 1, 1)
Modelo: (3, 1, 2)
Modelo: (3, 1, 3)
paraparelh AIC
agem
11 (2, 1, 3) 1480.805493
15 (3, 1, 3) 1482.566450
5 (1, 1, 1) 1492.487187
6 (1, 1, 2) 1494.423859
9 (2, 1, 1) 1494.431498
2 (0, 1, 2) 1494.964605
3 (0, 1, 3) 1495.148474
14 (3, 1, 2) 1495.655855
13 (3, 1, 1) 1496.346864
7 (1, 1, 3) 1496.385878
10 (2, 1, 2) 1496.410739
1 (0, 1, 1) 1497.050322
12 (3, 1, 0) 1498.930309
8 (2, 1, 0) 1498.950483
4 (1, 1, 0) 1501.643124
0 (0, 1, 0) 1508.283772
iii. O CIA mais baixo para ARIMA é claramente (2, 1, 3) com um AIC de
1480,80. Agora ajustamos os dados do trem com o modelo e a previsão no
conjunto de teste. E obtemos o Resumo ARIMA, gráfico e resultados de
diagnóstico.
18
Um.
B.
C.
19
Figura-17 AIC-ARIMA(2,1,3) A. Resumo, B. Gráfico e C. Diagnóstico
SARIMA:
iii. O CIA mais baixo para SARIMA é claramente (0, 1, 2) (1, 0, 2, 12) com um
AIC de 1156,165429. Agora ajustamos os dados do trem com o modelo e a
previsão no conjunto de teste. E obtemos o Resumo SARIMA, gráfico e
resultados de diagnóstico. Isso pode ser visto na Figura 18 abaixo.
20
Um.
B.
C.
21
Figura-18 AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Resumo, B. Gráfico e C. Diagnóstico
1.7. ARIMA e SARIMA com base nos pontos de corte de FAC e FPAC:
ARIMA:
ii. Passamos então a encaixar o modelo ARIMA em (3,1,1). Esses valores foram
encontrados a partir das parcelas de FAC e CHAP. E obtemos o Resumo
ARIMA, gráfico e resultados de diagnóstico.
22
Um.
B.
C.
23
ACF/PACF-ARIMA(3,1,1) 144.183 66.9104
9 9
SARIMA:
ii. Passamos então a ajustar o modelo SARIMA em (3,1,1) (2, 0, 4, 12). Esses
valores foram encontrados a partir das parcelas de FAC e CHAP. E obtemos o
Resumo SARIMA, gráfico e resultados de diagnóstico.
Um.
B.
24
C.
25
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9
AIC-ARIMA(2,1,3) 184.648 85.73498
SimpleExponentialSmoothing 196.404
8
Ingenuidade 245.121
3
DoubleExponentialSmoothing 266.161
2
RegressionOnTime 266.276
5
Vemos que o melhor modelo com menos RMSE na Média Móvel Trailing de 2
pontos, seguido por todas as outras médias móveis e média simples também. Em 6ºlugar
vemos
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12).
Como os valores de RMSE não estão muito distantes do 1º ao 6º lugar para facilidade
de computação e previsibilidade precisa, escolhemos AIC-SARIMA(0, 1, 2)(1, 0, 2,
12). Além disso, os modelos ARIMA são mais eficientes computacionalmente e nos
fornecem previsões precisas.
Ele também leva em consideração o MAPE, e é sempre uma boa ideia ter mais de um
parâmetro de precisão.
Os modelos de suavização exponencial e ARIMA em toda a indústria são mais
populares quando se trata de construção de modelos. Enquanto a técnica de
suavização exponencial depende da suposição de diminuição exponencial dos pesos
para dados passados e ARIMA é empregada transformando uma série temporal em
série estacionária e estudando a natureza da série estacionária através de ACF e PACF
e, em seguida, contabilizando efeitos autorregressivos e de média móvel em uma série
temporal, se presente.
26
Figura 23 Previsão do modelo ideal para os próximos 12 meses
27
Com o lançamento dos novos sapatos, eles podem atrair os clientes e atraí-
los a pensar que precisam comprar os sapatos porque são únicos. Dando aos
fabricantes uma vantagem pioneira.
Isso garantirá um aumento nas vendas por um tempo e, em seguida, a decisão
de descontinuar a fabricação de tipos de calçados que não são tão populares
também pode ser tomada. Isso ajudará a economizar recursos importantes
que podem ser usados em outros lugares.
Há esperança de que o pico ano a ano volte a atingir o pico, porque os
sapatos são uma necessidade e a commodity nunca perderá sua importância.
28