Você está na página 1de 28

PROJETO AMPLIADO

PREVISÃO DE SÉRIES TEMPORAIS

VENDAS DE CALÇADOS - RELATÓRIO DE


NEGÓCIOS

EMA. S.M

1
PGPDSBA Online Sep_B 2021

Índice

1. Problema 1:....................................................................................................................................................
1.1. Objetivo..........................................................................................................................................................
1.2. Análise descritiva e exploratória dos dados....................................................................................................
1.2.1. Análise descritiva dos dados:..................................................................................................................
1.2.2. Dados de Séries Temporais - Plotados:...................................................................................................
1.2.3. Análise Exploratória dos Dados:..............................................................................................................
1.3. Divisão de dados de trem e teste....................................................................................................................
1.4. Criando modelos diferentes e verificando o RMSE.......................................................................................
1.4.1. Regressão Linear:..................................................................................................................................
1.4.2. Modelo Bayes ingênuo:........................................................................................................................
1.4.3. Previsão média simples:........................................................................................................................
1.4.4. Previsão de média móvel:.....................................................................................................................
1.4.5. Alisamento exponencial simples:..........................................................................................................
1.4.6. Alisamento Exponencial Duplo:............................................................................................................
1.4.7. Triplo Alisamento Exponencial:.............................................................................................................
1.4.8. Alisamento Exponencial Triplo (Multiplicativo):...................................................................................
1.5. Verificando a Estacionariedade....................................................................................................................
1.6. ARIMA e SARIMA usando o método AIC mais baixo:....................................................................................
1.7. ARIMA e SARIMA com base nos pontos de corte de FAC e FPAC:................................................................
1.8. Comparando valores do RMSE......................................................................................................................
1.9. Construção do modelo ótimo e previsão de 12 meses.................................................................................
1.10. Achados e Sugestões.............................................................................................................................

2
Lista de Figuras
Figura Nome Página
nº. nº.
Fig. 1 Gráfico de Séries Temporais – Vendas de Sapatos 5
Fig. 2 Caixa mensal de vendas de sapatos 6
Fig. 3 Vendas mensais de calçados ao longo dos anos 6
Fig. 4 Gráfico de Séries Temporais juntamente com Média e Mediana 6
Fig. 5 Decomposição multiplicativa do conjunto de dados 7
Fig. 6 Decomposição aditiva do conjunto de dados 8
Fig. 7 Vendas de Sapatos - Trem e Teste Split 9
Fig. 8 Regressão Linear 10
Fig. 9 Modelo Bayes ingênuo 11
Fig. 10 Previsão Média Simples 11
Fig. 11 Previsão de média móvel à direita 12
Fig. 12 Alisamento exponencial único 13
Fig. 13 Alisamento exponencial simples e duplo 13
Fig. 14 Alisamento exponencial simples, duplo e triplo 14
Fig. 15 Alisamento exponencial simples, duplo e triplo (multiplicativo) 14
Fig. 16 Estacionariedade das vendas de calçados no lag 1 16
Fig 17 AIC-ARIMA(2,1,3) A. Resumo, B. Gráfico e C. Diagnóstico 18
Fig 18 AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Resumo, B. Gráfico e C. Diagnóstico 20
Fig. 19 Autocorrelação de Dados Diferenciados 21
Fig. 20 Autocorrelação parcial de dados diferenciados 21
Fig. 21 ACF/PACF- ARIMA(3,1,1) A. Resumo, B. Gráfico e C. Diagnóstico 22
Fig. 22 Figura-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Resumo, B. Gráfico e C. 24
Diagnóstico
Fig. 23 Previsão do modelo ideal para os próximos 12 meses 25

Lista de Tabelas
Tabela nº. Nome Página nº.
Tabela 1 Resumo das informações estatísticas descritivas 4
Tabela 2 Trem e teste Split 9
Tabela 3 Resumo dos resultados de todos os modelos 24

3
1. Problema 1:
1.1. Objetivo

 O objetivo é construir um modelo ideal, para prever as vendas dos pares de sapatos
para os próximos 12 meses de onde os dados terminam atualmente.
 Além disso, também temos que comentar sobre o modelo assim construído e relatar
nossas descobertas e sugerir as medidas que a empresa deve tomar para vendas
futuras.

1.2. Análise descritiva e exploratória dos dados

Fundo: Você é analista da empresa de calçados IJK e deve prever as vendas dos
pares de sapatos para os próximos 12 meses a partir de onde os dados terminam. Os
dados relativos às vendas de sapatos foram-lhe fornecidos de Janeiro de 1980 a
Julho de 1995.
Dicionário de dados:
AnoMês: Mês e Ano de Venda de Calçados
Shoe_Sales: A venda mensal de sapatos
1.2.1. Análise descritiva dos dados:

 O conjunto de dados foi lido e armazenado como um quadro de dados para


análise posterior.
 O conjunto de dados fornecido consiste em um total de 2 colunas e tem 187
entradas de natureza numérica. Não há valores nulos presentes.
 A primeira coluna representa a data em que as vendas de sapatos foram
registradas. Enquanto a segunda coluna representa as próprias Vendas.
 A Tabela 1 a seguir consiste no head(), tail(), info() e descrição do conjunto
de dados em mãos.

Quadro-1: Resumo das informações estatísticas descritivas

Chefe do conjunto de Cauda do conjunto de Informações do conjunto de dados:


dados: dados:

4
Descrever função no conjunto de dados: Não há valores nulos no conjunto de dados.

1.2.2. Dados de Séries Temporais - Plotados:

 Uma série temporal é uma série de medidas sobre a mesma variável


coletadas ao longo do tempo. Essas medições são feitas em intervalos de
tempo regulares. Uma série temporal é uma série de pontos de dados
indexados em ordem temporal. Mais comumente, uma série temporal é uma
sequência tomada em pontos sucessivos igualmente espaçados no tempo.
Trata-se, portanto, de uma sequência de dados de tempo discreto.
 Podemos ver claramente uma tendência anual de vendas de sapatos na
Figura 1 plotada abaixo. Este gráfico nos dá uma visão geral dos dados sem
realmente ter que verificar cada número no conjunto de dados.

Figura 1 Gráfico de séries temporais – Vendas de sapatos

1.2.3. Análise Exploratória dos Dados:

 A Análise Exploratória de Dados refere-se ao processo crítico de realizar


investigações iniciais sobre os dados para descobrir padrões, detectar
anomalias e testar hipóteses.
 Na Figura 2 a seguir, podemos ver os Gráficos Mensais de Caixas de
Vendas de Calçados. Podemos ver que há outliers presentes em abril e maio.
Isso nos diz que houve algumas vendas feitas nesses meses que estavam fora
do normal.
 Vemos que as vendas tendem a aumentar mais no segundo semestre do que
no primeiro. Dezembro registra as maiores vendas em calçados.
 O pico pode ser devido às festas de fim de ano, e talvez os sapatos sejam
muito popularmente comprados e usados para autoconsumo ou para brindes.

5
 Podemos ver a tendência mensal e anual mostrada na Figura 3. Novamente
nos mostrando que dezembro é o mês mais popular para as vendas de
sapatos, bem como o ano em que atingiu o pico de vendas entre 1986 e
1988.Este pico pode ser devido ao interesse generalizado e muitas inovações
feitas para atrair os clientes a comprar seus produtos, aumentando assim as
vendas.
 A Figura 4 nos mostra as séries temporais plotadas juntamente com os
valores médios e medianos plotados ao longo de um mesmo gráfico, para
entender a flutuação dos dados dessas duas medidas de tendência central.
 Além disso, uma vez que a média se mostra maior que a mediana, conclui-se
que a distribuição é positivamente assimétrica.

Figura-2 Gráfico de caixa mensal de vendas de sapatos

Figura-3 Vendas mensais de calçados ao longo dos anos

6
Figura 4 Gráfico de séries temporais juntamente com média e mediana
 DECOMPOSIÇÃO DO CONJUNTO DE DADOS:

A decomposição de séries temporais envolve pensar em uma série como uma


combinação de componentes de nível, tendência, sazonalidade e ruído. A
decomposição fornece um modelo abstrato útil para pensar sobre séries
temporais em geral e para entender melhor os problemas durante a análise e
previsão de séries temporais. São de dois tipos: geralmente multiplicativos e
aditivos.

(i) Decomposição multiplicativa do conjunto de dados:


Os dados são representados em termos de multiplicação da
sazonalidade, tendência, componentes cíclicos e residuais. Usado onde
a mudança é medida em porcentagem (%) de mudança.

7
Figura 5 Decomposição multiplicativa do conjunto de dados

(ii) Decomposição aditiva do conjunto de dados:


Os dados são representados em termos de adição de sazonalidade,
tendência, componentes cíclicos e residuais. Usado onde a mudança é
medida em quantidade absoluta.

8
Figura 6 Decomposição aditiva do conjunto de dados

Como estamos analisando a mudança na quantidade absoluta para esse conjunto de


dados específico, passamos a usar o modelo aditivo.

1.3. Divisão de dados de trem e teste

A divisão train-test é usada para estimar o desempenho de algoritmos de aprendizado


de máquina que são aplicáveis para algoritmos/aplicativos baseados em previsão. Esse
método é um procedimento rápido e fácil de executar, de modo que podemos
comparar nossos próprios resultados de modelo de aprendizado de máquina com
resultados de máquina.
Ambos os conjuntos de dados foram divididos no ano de 1991. Isso significa que os
dados de teste começam a partir de 1991.

Tabela-2: Divisão de Trem e Teste

Treinar dados Chefe do conjunto de dados: Dados de teste Cabeça do conjunto de dados:

Treinar dados Cauda do conjunto de dados: Dados de teste Cauda do conjunto de dados:

9
Forma de dados de trem = (132, 1) Forma de dados de teste = (55, 1)

Representação gráfica do Trem e Teste Split:

Figura-7 Vendas de sapatos - Trem e teste dividido

1.4. Criando modelos diferentes e verificando o RMSE

 Fomos solicitados a construir vários modelos de suavização exponencial nos


dados de treinamento e avaliar o modelo usando o RMSE nos dados de teste.
 Devemos também fazer outros modelos, como regressão linear, modelos de
previsão ingênuos, modelos médios simples, etc. e verificar o desempenho
nos dados de teste usando o RMSE.
 O principal objetivo de construir tantos modelos é garantir que escolhemos
um modelo ideal com os menores valores de RMSE e MAPE.
 MAPE significa erro percentual absoluto médio. É o efeito multiplicativo
médio entre cada média estimada e o desfecho observado. RMSE significa
root mean squared error, ou seja, desvio padrão.

1.4.1. Regressão Linear:

10
 A Regressão Linear é um algoritmo de aprendizado de máquina baseado em
aprendizado supervisionado. Ele executa uma tarefa de regressão. É uma
ótima ferramenta para previsão. Podemos ver pela figura abaixo que a
regressão linear no tempo está em constante ascensão.

Figura 8 Regressão Linear

Tipo de modelo RMSE


Regressão no Tempo 266.2765

1.4.2. Modelo Bayes ingênuo:

 Classificadores como Naive Bayes fazem uso de um modelo de linguagem


para classificar e fazer previsões em dados de séries temporais. A Figura 9
afirma que a previsão ingênua sobre os dados de teste é constantemente a
mesma para todos os dados, o que não é o ideal.

11
Figura 9 Modelo de Bayes Ingênuo

Tipo de modelo RMSE


Regressão no Tempo 266.2765
Modelo ingênuo 245.1213

Os valores de RMSE parecem ser os mais baixos para Naïve Bayes até agora.
Mas como a previsão é constante ao longo dos anos, não é um modelo ideal para
o nosso conjunto de dados.

1.4.3. Previsão média simples:

O método é muito simples. Fazemos a média dos dados por meses, trimestres ou
anos e, em seguida, calculamos a média para o período. Mais tarde, passamos a
descobrir, qual é a porcentagem que é para a grande média.

Figura-10 Previsão média simples

Tipo de modelo RMSE


RegressionOnTime 266.276
5
Ingenuidade 245.121
3
SimpleAverageModel 63.9845
7

Os valores de RMSE parecem ser os mais baixos para o Método da Média


Simples até o momento. Mas como a previsão é constante ao longo dos anos,
não é um modelo ideal para o nosso conjunto de dados.

1.4.4. Previsão de média móvel:

12
 A Previsão de Médias Móveis é uma técnica ingênua e eficaz na previsão de
séries temporais.
 O cálculo de uma média móvel envolve a criação de uma nova série onde os
valores são compostos pela média das observações brutas na série temporal
original.
 Uma média móvel requer que você especifique um tamanho de janela
chamado largura da janela. Isso define o número de observações brutas usadas
para calcular o valor da média móvel. Usamos o método da média móvel à
direita.

Figura-11 Previsão de média móvel à direita

Tipo de modelo RMSE


RegressionOnTime 266.2765
Ingenuidade 245.1213
SimpleAverageModel 63.98457
2pontoTrailingMovingMédia 45.94874
4pointTrailingMovingMédia 57.87269
6pontoTrailingMovingMédia 63.45689
9pointTrailingMovingMédia 67.72365

Os valores de RMSE parecem ser os mais baixos para o Método de Média


Móvel Móvel À Direita de 2 pontos até agora.

1.4.5. Alisamento exponencial simples:

 Single Exponential Smoothing, também chamado de Simple Exponential


Smoothing, é um método de previsão de séries temporais para dados
univariados sem tendência ou sazonalidade. Requer um único parâmetro,
chamado alfa (a), também chamado de fator de suavização ou coeficiente de
suavização.
 O valor alfa ou nível de suavização no qual o gráfico é plotado é 0,605.

13
Figura 12 Suavização exponencial simples

1.4.6. Alisamento Exponencial Duplo:

 A suavização exponencial dupla emprega um componente de nível e um


componente de tendência em cada período. A suavização exponencial dupla
usa dois pesos, (também chamados de parâmetros de suavização), para
atualizar os componentes em cada período.
 O valor alfa ou nível de suavização no qual o gráfico é plotado é 0,594,
enquanto a tendência beta ou suavização é 0,0002.

Figura 13 Alisamento exponencial simples e duplo

1.4.7. Triplo Alisamento Exponencial:

 A suavização exponencial tripla é usada para manipular os dados da série


temporal que contêm um componente sazonal. Esse método é baseado em
três equações de suavização: componente estacionário, tendência e sazonal.

14
Tanto a sazonalidade quanto a tendência podem ser aditivas ou
multiplicativas. Este é o modelo aditivo.
 O valor alfa ou nível de suavização no qual o gráfico é plotado é 0,570,
enquanto a tendência beta ou suavização é 0,0001 e gama ou suavização
sazonal é 0,293.

Figura 14 Alisamento exponencial simples, duplo e triplo

1.4.8. Alisamento Exponencial Triplo (Multiplicativo):

 Esse método é baseado em três equações de suavização: componente


estacionário, tendência e sazonal. Este é o modelo multiplicativo.
 O valor alfa ou nível de suavização no qual o gráfico é plotado é 0,571,
enquanto a tendência beta ou suavização é 0,0001 e gama ou suavização
sazonal é 0,202.

Figura 15 Alisamento exponencial simples, duplo e triplo (multiplicativo)


Tipo de modelo RMSE
RegressionOnTime 266.2765
Ingenuidade 245.1213

15
SimpleAverageModel 63.98457
2pontoTrailingMovingMédia 45.94874
4pointTrailingMovingMédia 57.87269
6pontoTrailingMovingMédia 63.45689
9pointTrailingMovingMédia 67.72365
SimpleExponentialSmoothing 196.4048
DoubleExponentialSmoothing 266.1612
TriploExponencialSuavização 128.9925
TriploExponencialSuavizaçãoMultiplicativo 83.73405

Os valores de RMSE parecem ser os mais baixos para o Método de Média


Móvel Móvel À Direita de 2 pontos até agora.

1.5. Verificando a Estacionariedade

 O teste Augmented Dickey-Fuller é um teste de raiz unitária que determina se


há uma raiz unitária e, posteriormente, se a série não é estacionária.
 A hipótese de forma simples para o teste de ADF é:
H0: A série temporal tem uma raiz unitária e, portanto, não é
estacionária.
H1: A série temporal não tem uma raiz unitária e, portanto, é
estacionária.
 Gostaríamos que a série fosse estacionária para a construção de modelos
ARIMA e, portanto, gostaríamos que o valor de p deste teste fosse menor do
que o valor de Alfa.
 Quando o ADF foi aplicado no modelo, obtivemos um valor de p de 0,801 que
é maior que 0,5, portanto, não rejeitamos a hipótese nula. Concluindo que a
série não está parada.
 Agora temos que fazer uma diferença de nível no conjunto de dados e verificar
a Estacionariedade.
 O valor de p após a diferenciação do nível 1 é de 0,0361<0,05, portanto, agora
rejeitamos a hipótese nula e concluímos que a série está estacionária com uma
defasagem de 1.
 Abaixo está uma representação gráfica do mesmo. O valor da estatística de
teste é -3,532, enquanto o número de defasagens usadas é 12.
 Agora que os dados estão estacionários, podemos passar para a construção dos
modelos ARIMA e SARIMA.

16
Figura-16 Estacionariedade das vendas de calçado no lag 1

1.6. ARIMA e SARIMA usando o método AIC mais baixo:

 Um modelo ARIMA consiste na parte Auto-Regressiva (AR) e na parte Média Móvel


(MA) depois de termos feito a Série Temporal estacionária, tomando o grau/ordem de
diferenciação corretos.
 Os modelos ARIMA também podem ser construídos tendo em mente o Akaike
Information Criterion (AIC). Neste caso, escolhemos os valores 'p' e 'q' para
determinar as ordens AR e MA, respectivamente, o que nos dá o menor valor de AIC.
Abaixar o AIC melhor é o modelo.
 As linguagens de codificação tentam diferentes ordens de 'p' e 'q' para chegar a essa
conclusão. Lembre-se, mesmo para essa forma de escolher os valores 'p' e 'q',
devemos nos certificar de que a série está parada.
 A fórmula para calcular o AIC é 2k – 2ln(L), onde k é o número de parâmetros a
serem estimados e L é a estimativa de verossimilhança.
 Para os modelos SARIMA, também podemos estimar 'p', 'q', 'P' e 'Q' observando os
menores valores de AIC.

 ARIMA:
i. Primeiro criamos uma grade de todos os resultados possíveis (p,d,q). O
intervalo de 'p' e 'q' sendo (0,4) e 'd' uma constante = 1.

A seguir está a grade de todos os resultados possíveis:

Modelo: (0, 1, 1)
Modelo: (0, 1, 2)
Modelo: (0, 1, 3)
Modelo: (1, 1, 0)
Modelo: (1, 1, 1)
Modelo: (1, 1, 2)
Modelo: (1, 1, 3)
Modelo: (2, 1, 0)

17
Modelo: (2, 1, 1)
Modelo: (2, 1, 2)
Modelo: (2, 1, 3)
Modelo: (3, 1, 0)
Modelo: (3, 1, 1)
Modelo: (3, 1, 2)
Modelo: (3, 1, 3)

ii. Em seguida, passamos a ajustar o modelo ARIMA em cada uma das


combinações acima e acabamos escolhendo aquele com o menor valor de AIC.

paraparelh AIC
agem

11 (2, 1, 3) 1480.805493

15 (3, 1, 3) 1482.566450

5 (1, 1, 1) 1492.487187

6 (1, 1, 2) 1494.423859

9 (2, 1, 1) 1494.431498

2 (0, 1, 2) 1494.964605

3 (0, 1, 3) 1495.148474

14 (3, 1, 2) 1495.655855

13 (3, 1, 1) 1496.346864

7 (1, 1, 3) 1496.385878

10 (2, 1, 2) 1496.410739

1 (0, 1, 1) 1497.050322

12 (3, 1, 0) 1498.930309

8 (2, 1, 0) 1498.950483

4 (1, 1, 0) 1501.643124

0 (0, 1, 0) 1508.283772

iii. O CIA mais baixo para ARIMA é claramente (2, 1, 3) com um AIC de
1480,80. Agora ajustamos os dados do trem com o modelo e a previsão no
conjunto de teste. E obtemos o Resumo ARIMA, gráfico e resultados de
diagnóstico.

18
Um.

B.

C.

19
Figura-17 AIC-ARIMA(2,1,3) A. Resumo, B. Gráfico e C. Diagnóstico

iv. Finalmente, verificamos a acurácia do modelo com o auxílio do RMSE e


MAPE calculados.

Tipo de modelo RMSE MAPA


AIC-ARIMA(2,1,3) 184.648 85.73498

 SARIMA:

i. Criamos uma grade de todas as combinações possíveis de (p,d,q) juntamente


com sazonal (P,D,Q) e sazonalidade de 12. O intervalo de 'p' e 'q' sendo (0,4) e
'd' uma constante = 1.

A seguir está a grade de todos os resultados possíveis:

Modelo: (0, 1, 1)(0, 0, 1, 12)


Modelo: (0, 1, 2)(0, 0, 2, 12)
Modelo: (1, 1, 0)(1, 0, 0, 12)
Modelo: (1, 1, 1)(1, 0, 1, 12)
Modelo: (1, 1, 2)(1, 0, 2, 12)
Modelo: (2, 1, 0)(2, 0, 0, 12)
Modelo: (2, 1, 1)(2, 0, 1, 12)
Modelo: (2, 1, 2)(2, 0, 2, 12)

ii. Em seguida, passamos a ajustar o modelo SARIMA em cada uma das


combinações acima e acabamos escolhendo aquele com o menor valor de AIC.

paraparelha sazonal AIC


gem
23 (0, 1, 2) (1, 0, 2, 12) 1156.165429
50 (1, 1, 2) (1, 0, 2, 12) 1157.082589
26 (0, 1, 2) (2, 0, 2, 12) 1157.772313
77 (2, 1, 2) (1, 0, 2, 12) 1158.490996
80 (2, 1, 2) (2, 0, 2, 12) 1158.630324

iii. O CIA mais baixo para SARIMA é claramente (0, 1, 2) (1, 0, 2, 12) com um
AIC de 1156,165429. Agora ajustamos os dados do trem com o modelo e a
previsão no conjunto de teste. E obtemos o Resumo SARIMA, gráfico e
resultados de diagnóstico. Isso pode ser visto na Figura 18 abaixo.

iv. Finalmente, verificamos a acurácia do modelo com o auxílio do RMSE e


MAPE calculados. AIC-SARIMA tem RMSE e MAPE mais baixos até agora.

Tipo de modelo RMSE MAPA


AIC-ARIMA(2,1,3) 184.648 85.73498
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.03066 26.45588

20
Um.

B.

C.

21
Figura-18 AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Resumo, B. Gráfico e C. Diagnóstico

1.7. ARIMA e SARIMA com base nos pontos de corte de FAC e FPAC:

 Um modelo ARIMA consiste na parte Auto-Regressiva (AR) e na parte Média


Móvel (MA) depois de termos feito a Série Temporal estacionária, tomando o
grau/ordem de diferenciação corretos.
 A ordem AR é selecionada observando onde o gráfico PACF corta (para bandas
de intervalo de confiança apropriadas) e a ordem MA é selecionada observando
onde os gráficos ACF cortam (para bandas de intervalo de confiança apropriadas).
 O grau correto ou ordem de diferença nos dá o valor de 'd', enquanto o valor 'p' é
para a ordem do modelo AR e o valor 'q' é para a ordem do modelo MA.
 Para SARIMA, o parâmetro sazonal 'F' pode ser determinado observando os
gráficos de ACF. Espera-se que o gráfico de ACF mostre um pico em múltiplos de
'F', indicando assim uma presença de sazonalidade.
 Além disso, para os modelos sazonais, as parcelas ACF e PACF vão se comportar
um pouco diferente e nem sempre continuarão a decair à medida que o número de
defasagens aumenta.

 ARIMA:

i. Devemos observar as parcelas de ACF e PACF. Obtemos o valor 'p' do PACF


e o valor 'q' do gráfico ACF. A seguir estão os gráficos em d=1:

Figura-19 Autocorrelação dos Dados Diferenciados

Figura 20 Autocorrelação parcial dos dados diferenciais

ii. Passamos então a encaixar o modelo ARIMA em (3,1,1). Esses valores foram
encontrados a partir das parcelas de FAC e CHAP. E obtemos o Resumo
ARIMA, gráfico e resultados de diagnóstico.

22
Um.

B.

C.

Figura-21 ACF/PACF- ARIMA(3,1,1) A. Resumo, B. Gráfico e C. Diagnóstico

iii. Finalmente, verificamos a acurácia do modelo com o auxílio do RMSE e


MAPE calculados. AIC-SARIMA tem RMSE e MAPE mais baixos até agora.

Tipo de modelo RMSE MAPA


AIC-ARIMA(2,1,3) 184.648 85.7349
8
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.4558
6 8

23
ACF/PACF-ARIMA(3,1,1) 144.183 66.9104
9 9
 SARIMA:

i. Devemos observar as parcelas de ACF e PACF. Obtemos o valor 'p' do PACF


e o valor 'q' do gráfico ACF. Dos gráficos acima Figura 19 e 20 em d=1,
frequência=12. Além disso, encontramos P, D, Q do gráfico acima,
procurando picos sazonais.

ii. Passamos então a ajustar o modelo SARIMA em (3,1,1) (2, 0, 4, 12). Esses
valores foram encontrados a partir das parcelas de FAC e CHAP. E obtemos o
Resumo SARIMA, gráfico e resultados de diagnóstico.

Um.

B.

24
C.

Figura-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Resumo, B. Gráfico e


C. Diagnóstico

iii. Finalmente, verificamos a acurácia do modelo com o auxílio do RMSE e


MAPE calculados. AIC-SARIMA tem RMSE e MAPE mais baixos até agora.

Tipo de modelo RMSE MAPA


AIC-ARIMA(2,1,3) 184.648 85.73498
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.45588
6
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9
ACF/PACF-SARIMA(3,1,1)(2, 0, 4, 12) 109.924 46.26953
2

1.8. Comparando valores do RMSE

Tabela 3- Resultados resumidos de todos os modelos RMSE


Tipo de modelo RMSE MAPA
2pontoTrailingMovingMédia 45.9487
4
4pointTrailingMovingMédia 57.8726
9
6pontoTrailingMovingMédia 63.4568
9
SimpleAverageModel 63.9845
7
9pointTrailingMovingMédia 67.7236
5
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.45588
6
TriploExponencialSuavizaçãoMultiplicativ 83.7340
o 5
ACF/PACF-SARIMA(3,1,1)(2, 0, 4, 12) 109.924 46.26953
2
TriploExponencialSuavização 128.992
5

25
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9
AIC-ARIMA(2,1,3) 184.648 85.73498
SimpleExponentialSmoothing 196.404
8
Ingenuidade 245.121
3
DoubleExponentialSmoothing 266.161
2
RegressionOnTime 266.276
5

 Vemos que o melhor modelo com menos RMSE na Média Móvel Trailing de 2
pontos, seguido por todas as outras médias móveis e média simples também. Em 6ºlugar
vemos
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12).
 Como os valores de RMSE não estão muito distantes do 1º ao 6º lugar para facilidade
de computação e previsibilidade precisa, escolhemos AIC-SARIMA(0, 1, 2)(1, 0, 2,
12). Além disso, os modelos ARIMA são mais eficientes computacionalmente e nos
fornecem previsões precisas.
 Ele também leva em consideração o MAPE, e é sempre uma boa ideia ter mais de um
parâmetro de precisão.
 Os modelos de suavização exponencial e ARIMA em toda a indústria são mais
populares quando se trata de construção de modelos. Enquanto a técnica de
suavização exponencial depende da suposição de diminuição exponencial dos pesos
para dados passados e ARIMA é empregada transformando uma série temporal em
série estacionária e estudando a natureza da série estacionária através de ACF e PACF
e, em seguida, contabilizando efeitos autorregressivos e de média móvel em uma série
temporal, se presente.

1.9. Construção do modelo ótimo e previsão de 12 meses

Vamos construir o modelo ideal com AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) conforme


explicação já fornecida acima.

26
Figura 23 Previsão do modelo ideal para os próximos 12 meses

1.10. Achados e Sugestões

 O conjunto de dados contém um total de 187 entradas, entre as quais 2


variáveis. A primeira coluna representa a data em que as vendas de sapatos
foram registradas. Enquanto a segunda coluna representa as próprias Vendas.
Não há valores nulos no conjunto de dados.
 Há outliers presentes em abril e maio. Isso nos diz que houve algumas
vendas feitas nesses meses que estavam fora do normal.
 As vendas tendem a se recuperar mais no segundo semestre do que no
primeiro. Dezembro registra as maiores vendas em calçados.
 O pico pode ser devido às festas de fim de ano, e talvez os sapatos sejam
muito popularmente comprados e usados para autoconsumo ou para brindes.
 Na tendência mensal e anual, vemos que dezembro é o mês mais popular
para as vendas de calçados, bem como o ano em que atingiu o pico de vendas
entre 1986 e 1988. Esse pico pode ser devido ao interesse generalizado e a
muitas inovações feitas para atrair os clientes a comprar seus produtos,
impulsionando assim as vendas.
 Pela previsão, vemos um pico claro, apresentando vendas melhores do que
no ano anterior. Assim, os fabricantes devem garantir que têm o suficiente e
mais do que o ano anterior.
 A empresa pode aumentar as vendas acima do previsto se se concentrar em
publicidade e lançar novos tipos exclusivos de sapatos.

27
 Com o lançamento dos novos sapatos, eles podem atrair os clientes e atraí-
los a pensar que precisam comprar os sapatos porque são únicos. Dando aos
fabricantes uma vantagem pioneira.
 Isso garantirá um aumento nas vendas por um tempo e, em seguida, a decisão
de descontinuar a fabricação de tipos de calçados que não são tão populares
também pode ser tomada. Isso ajudará a economizar recursos importantes
que podem ser usados em outros lugares.
 Há esperança de que o pico ano a ano volte a atingir o pico, porque os
sapatos são uma necessidade e a commodity nunca perderá sua importância.

28

Você também pode gostar