Você está na página 1de 67

UNIVERSIDADE FEDERAL DE SERGIPE

CENTRO DE CINCIAS EXATAS E TECNOLOGIA


DEPARTAMENTO DE ENGENHARIA DE PRODUO

SILLAS TEIXEIRA GONZAGA

MULTIPLE AUTOMATIC FORECAST SELECTION (MAFS):


PROPOSTA DE SISTEMA DE AUTOMAO DE PREVISO DE
DEMANDA

TRABALHO DE CONCLUSO DE CURSO

So Cristvo
2016

UNIVERSIDADE FEDERAL DE SERGIPE


CENTRO DE CINCIAS EXATAS E TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA DE PRODUO

SILLAS TEIXEIRA GONZAGA

MULTIPLE AUTOMATIC FORECAST SELECTION (MAFS):


PROPOSTA DE SISTEMA DE AUTOMAO DE PREVISO DE
DEMANDA
Trabalho

de

Concluso

do

Curso

de

Graduao em Engenharia de Produo do


Centro de Cincias Exatas e Tecnologia da
Universidade

Federal

de

Sergipe,

como

requisito parcial obteno do ttulo de


bacharel em Engenharia de Produo.

Orientador: Pedro Felipe de Abreu


Coorientador: Emerson Cleister Lima Muniz

So Cristvo
2016

SILLAS TEIXEIRA GONZAGA

MULTIPLE AUTOMATIC FORECAST SELECTION (MAFS):


PROPOSTA DE SISTEMA DE AUTOMAO DE PREVISO DE
DEMANDA

Esse documento foi julgado adequado como requisito parcial obteno do ttulo de
bacharel em Engenharia de Produo e aprovado em sua forma final.

So Cristvo, 06 de Dezembro de 2016


BANCA EXAMINADORA:

Emerson Cleister Lima Muniz, MSc.


Universidade Federal de Sergipe
Professor Coorientador

Reynaldo Chile Palomino, Dr.


Universidade Federal de Sergipe
Membro da banca examinadora

Suzana Leito Russo, Dr.


Universidade Federal de Sergipe
Membro da banca examinadora

AGRADECIMENTOS

Agradeo minha famlia e s minhas tias Eliana e Cinelange por serem terem
apoiados os meus estudos.
Aos grandes amigos que fiz em quase seis anos de graduao pelo companheirismo e
pelos sempre divertidos trabalhos em equipe. A graduao foi mais fcil ao lado de vocs.
Aos professores Pedro Felipe de Abreu, Celso Sakuraba e Emerson Muniz pelos
conselhos no s acadmicos mas tambm pessoais que sero de grande importncia para
mim.
Agradeo a Rafael Magnani no s por me ajudar a obter os dados que tornaram esta
monografia possvel mas tambm pelo apoio minha ideia e pelos ensinamentos
profissionais.

RESUMO

Previso de demanda a atividade que consiste em obter valores de vendas de um


determinado produto para um perodo no futuro baseado em seu histrico de vendas e em
outros tipos de dados. A previso pode ser obtida por mtodos qualitativos, como a opinio de
gerentes e especialistas da rea, ou por quantitativos, pela aplicao de modelos estatsticos.
Previses de demanda com boa acurcia resultam no equilbrio entre oferta e demanda, sem
causar prejuzo por sobras ou por faltas. Contudo, quando se deseja realizar milhares de
previses de demanda periodicamente, surge a necessidade de uma soluo que seja no s
precisa mas tambm automatizada. O presente trabalho consiste na elaborao de um sistema
de previso de demanda denominado Multiple Automatic Forecast Selection (MAFS) que
mensura a acurcia de dezoito modelos de previso de demanda disponveis na linguagem de
programao R para uma dada srie temporal e seleciona automaticamente o de maior
preciso para prever os valores futuros para a srie. O sistema foi testado com dados de
vendas mensais de produtos de uma distribuidora de bebidas na regio Nordeste entre Janeiro
de 2015 a Agosto de 2016. Os resultados de acurcia obtidos pelo sistema para a simulao
realizada, com as sries disponveis, foram melhores que os dos mtodos utilizados pela
empresa, o que indica que o sistema proposto tem potencial para ser utilizado pela empresa e
por outras para a atividade rotineira de previso de demanda.

Palavras-chave: Previso de demanda; Mtricas de erro; Linguagem R; Indstria de bebidas.

ABSTRACT
Demand forecasting consists in obtaining future sales values for a given product based on its
historical sales and other kinds of data. The forecast can be obtained by methods either
qualitative, such as the opinion of managers or business specialists, or quantitative, through
statistical models. The result of accurate forecasts is the supply and demand equilibrium,
without great monetary losses caused by neither surplus nor lack of products. However, when
one desires to forecast hundreds or even thousands of different time series periodically, there
must exist a solution that is not only accurate but also automated. This work consists in the
development of a demand forecast system called Multiple Automatic Forecast Selection
(mafs) which measures the accuracy of eighteen different forecast models available on the R
programming language given a time series as input and automatically selects the one with the
lowest error to forecast future values. This system was tested with monthly sales data of
products sold by a brewing company in Brazil's Northeast region. The data range from
January of 2015 to August of 2016. The accuracy obtained by the developed system for the
time series used during this work is better than the forecast methods officially used by the
own company, which shows that the proposed system has potential to be used by the company
and others to routinely forecast time series.

Keywords: Demand forecasting; Error metrics; R programming language; Brewing industry.

SUMRIO

1. INTRODUO ........................................................................................................ 12
1.1 Objetivos ............................................................................................................. 12
1.1.1 Objetivos Gerais .......................................................................................... 12
1.1.2 Objetivos Especficos .................................................................................. 13
1.2 Justificativa ......................................................................................................... 13
1.3 Estrutura do trabalho ........................................................................................... 13
2 REFERENCIAL TERICO ...................................................................................... 15
2.1 Introduo previso de demanda...................................................................... 15
2.2 Sries temporais .................................................................................................. 16
2.2.1 Decomposio de Sries Temporais ............................................................ 17
2.3 Mtodos Qualitativos .......................................................................................... 19
2.4 Mtodos Quantitativos complexos ..................................................................... 20
2.4.1 Modelos ARIMA ......................................................................................... 20
2.4.2 Suavizao exponencial ............................................................................... 21
2.4.3 Redes neurais artificiais ............................................................................... 22
2.4.4 BATS e TBATS ........................................................................................... 23
2.4.5 Suavizao por splines cbicas .................................................................... 24
2.4.6 Mtodo Theta ............................................................................................... 25
2.4.7 Modelo de Croston ...................................................................................... 26
2.4.8 Regresso ..................................................................................................... 28
2.5 Mtodos Quantitativos simples........................................................................... 29
2.5.1 Modelo da Mdia Simples ........................................................................... 30
2.5.2 Modelo ingnuo ........................................................................................... 31
2.5.3 Modelo sazonal ingnuo .............................................................................. 31

2.5.4 Modelo de passeio aleatrio ........................................................................ 31


2.6 Mtricas de acurcia para seleo de modelo ..................................................... 31
2.6.1 Erros dependentes da escala ........................................................................ 32
2.6.2 Erros porcentuais ......................................................................................... 33
2.7 Intervalos de predio ......................................................................................... 33
2.8 Estratgia de criao de modelo de previso ...................................................... 34
3. PROCEDIMENTOS METODOLGICOS ............................................................. 35
4. DESCRIO DO SISTEMA PROPOSTO ............................................................. 37
5. RESULTADOS DA SIMULAO ......................................................................... 39
5.1 Anlise exploratria ............................................................................................ 39
5.2 Exemplo de aplicao do sistema ....................................................................... 40
5.3 Resultados do sistema proposto .......................................................................... 43
5.3.1 Resultados gerais ......................................................................................... 43
5.3.2 Resultados agregados por produto. .............................................................. 46
5.3.3 Resultados agregados por centro de distribuio ......................................... 47
5.3.4 Resultados totais agregados por ms ........................................................... 49
5.4 Resultados dos modelos usados no sistema ........................................................ 50
6 CONCLUSO ........................................................................................................... 51
REFERNCIAS BIBLIOGRFICAS ......................................................................... 52
APNDICE A CDIGO DO SISTEMA CRIADO .................................................. 56
APNDICE B AJUSTE DE MODELOS NA SRIE TEMPORAL DO PRODUTO
P001 .......................................................................................................................................... 59

LISTA DE FIGURAS
Figura 1 - Exemplo de tendncia e sazonalidade de uma srie temporal. .................... 17
Figura 2 Exemplos de sries de passeio aleatrio...................................................... 19
Figura 3 - Exemplo de previso realizada com mtodo Theta. .................................... 26
Figura 4 - Ilustrao do funcionamento do algoritmo de seleo de modelo de previso.
.................................................................................................................................................. 37
Figura 5 Srie histrica do volume de vendas da regio Nordeste ............................ 39
Figura 6 Curva ABC dos produtos vendidos na regio Nordeste .............................. 40
Figura 7 Srie histrica do produto de maior demanda ............................................. 41
Figura 8 Erro absoluto mdio e intervalo de confiana dos mtodos de previso
avaliados ................................................................................................................................... 44
Figura 9 Resultados dos modelos de previso usados no sistema ............................. 50
Figura 10 - Ajuste e previso obtidos pelo mtodo ARIMA ........................................ 59
Figura 11 Ajuste e previso obtidos pelo mtodo de suavizao exponencial .......... 59
Figura 12 Ajuste e previso obtidos pelo mtodo de redes neurais ........................... 60
Figura 13 - Ajuste e previso obtidos pelo mtodo TBATS ........................................ 60
Figura 14 - Ajuste e previso obtidos pelo mtodo BATS ........................................... 61
Figura 15 Ajuste e previso obtidos pelo modelo estrutural ..................................... 61
Figura 16 Ajuste e previso obtidos pelo modelo da mdia simples ......................... 62
Figura 17 Ajuste e previso obtidos pelo modelo ingnuo. ....................................... 62
Figura 18 Ajuste e previso obtidos pelo modelo sazonal ingnuo. .......................... 63
Figura 19 Ajuste e previso obtidos pelo modelo do passeio aleatrio ..................... 63
Figura 20 Ajuste e previso obtidos pelo modelo do passeio aleatrio com deriva .. 64
Figura 21 Ajuste e previso obtidos pelo modelo das splines cbicas. ..................... 64
Figura 22 Ajuste e previso obtidos pelo modelo Theta ........................................... 65
Figura 23 - Ajuste e previso obtidos pelo modelo Croston ........................................ 65
Figura 24 - Ajuste e previso obtidos pelo modelo de regresso ................................. 66
Figura 25 - Ajuste e previso obtidos pelo modelo hbrido.......................................... 66

LISTA DE QUADROS
Quadro 1 Possveis modelos de suavizao exponencial .......................................... 22
Quadro 2 - Modelos de previso utilizados no trabalho ............................................... 38

LISTA DE TABELAS
Tabela 1 Erros obtidos pelos mtodos de previso. ................................................... 42
Tabela 2 Comparao do erro de previso para o produto P001 ............................... 43
Tabela 3 Resultados gerais do sistema proposto comparados com os mtodos da
empresa ..................................................................................................................................... 44
Tabela 4 Resultados do teste ANOVA ...................................................................... 45
Tabela 5 Resultados do teste de Tukey...................................................................... 46
Tabela 6 Resultados agregados para o produto P001 ................................................ 46
Tabela 7 Pontuao agregada por produto dos mtodos de previso ........................ 47
Tabela 8 Erro absoluto agregado por produto dos mtodos de previso ................... 47
Tabela 9 Resultados agregados para o centro de distribuio C01............................ 48
Tabela 10 Pontuao agregada por centro de distribuio dos mtodos de previso 48
Tabela 11 - Erro absoluto agregado por centro de distribuio dos mtodos de previso
.................................................................................................................................................. 48
Tabela 12 - Erro absoluto agregado por ms dos mtodos de previso ........................ 49

LISTA DE SIGLAS

ARIMA

Modelo Autorregressivo Integrado de Mdia Mvel.

BATS

Transformao Box-Cox, erros ARMA e componentes Tendncia e

Sazonalidade.
CD

Centro de distribuio

MAE

Erro absoluto mdio

MAFS

Mltipla seleo automtica de previso

MAPE

Erro porcentual absoluto mdio

RMSE

Raiz do erro quadrtico mdio

TBATS

Transformao

componentes Tendncia e Sazonalidade.

trigonomtrica

Box-Cox,

erros

ARMA

1. INTRODUO
Em um cenrio de alta competividade no mercado como se observa na atualidade,
natural que as empresas busquem constantemente otimizar suas estratgias para atender s
necessidades dos clientes com investimentos baseados em previses eficazes de demanda.
Assim, necessrio tomar decises que resultem no equilbrio entre oferta e demanda, sem
causar prejuzo por perdas (oferta maior que demanda) ou por demanda no aproveitada
(oferta menor que demanda).
Previso de demanda a atividade que consiste em obter valores de vendas de um
determinado produto para um perodo no futuro. Pode ser feito quantitativamente, por meio da
aplicao de algoritmos simples ou complexos, ou qualitativamente, atravs da opinio de
especialistas.
Previses so realizadas nos mais diversos ambientes alm de empresas, como nos
setores econmico, agropecurio e energtico. Previses cujas acurcias so satisfatrias
podem ajudar um pas a planejar cenrios, uma fornecedora de energia elica a se preparar
para diferentes nveis de fora do vento um pequeno agricultor a preparar sua colheita em
funo da chuva (ROUDIER, DUCHARNE e FEYEN, 2014).
O avano tecnolgico das ltimas dcadas possibilitou para as companhias o registro
histrico de dados das mais diversas naturezas, dentre eles as sries histricas de vendas de
seus produtos. Adicionalmente, o uso de linguagens de programao gratuitas utilizadas, entre
outros, para fins analticos, como as linguagens Python (ROSSUM, 1995) e R (R CORE
TEAM, 2016), tornou simples a aplicao de algoritmos estatsticos avanados para processos
de previso em larga escala de maneira automatizada. Empresas de grande porte, que
precisam fazer dezenas de milhares de previses periodicamente, podem ser enormemente
beneficiados por esses avanos.

1.1 Objetivos
1.1.1 Objetivos Gerais
Desenvolver um sistema para automatizar a escolha do melhor mtodo de previso
12

para uma dada srie temporal.


1.1.2 Objetivos Especficos

Realizar uma reviso bibliogrfica de modelos quantitativos de previso de


demanda implementados na linguagem de programao R;

Automatizar a seleo do melhor modelo previso para mais de 7.000 sries


temporais histricas de vendas de produtos da empresa analisada;

Simular o desempenho do sistema proposto e o comparar com as previses


realizadas pela empresa estudada.

1.2 Justificativa
O desempenho de uma previso afeta diretamente a gesto do estoque de uma
organizao e, caso feita erroneamente, pode acarretar em prejuzos financeiros com
vencimentos de produtos ou operacionais com a superlotao fsica do estoque (previso
superestimada) ou com a perda de clientes para a concorrncia em decorrncia do noaproveitamento da demanda (previso subestimada).
Alm disso, uma mesma previso pode tomar um grande tempo de anlise exploratria
de dados, ajuste de parmetros e a aplicao de diversos modelos. Em um cenrio onde
necessrio realizar milhares de previses periodicamente, esse procedimento invivel. Por
isso, um sistema de previso deve ser no apenas eficiente mas tambm automatizado, isto ,
capaz de fornecer uma boa eficincia de acurcia sem interferncia humana.

1.3 Estrutura do trabalho


No captulo 1, Introduo, o tema da previso de demanda e sua importncia, alm da
justificativa e da problemtica do trabalho, so discutidos.
O captulo 2, Referencial Terico traz uma reviso bibliogrfica sobre os principais
conceitos necessrios para o entendimento do trabalho, como os modelos quantitativos
estudados e a mtrica de erro utilizada para a seleo do melhor modelo.
O captulo 3, Procedimentos Metodolgicos descreve a empresa cujos dados foram
usados para a simulao dos resultados e o processo de coleta dados.
13

O captulo 4, Descrio do Sistema Proposto, explica o passo-a-passo do algoritmo


criado e justifica a escolha da mtrica de erro usada para a seleo do melhor modelo de
previso.
O captulo 5, Discusso, apresenta dados de vendas da empresa e de seus produtos e os
resultados obtidos da previso de demanda.
O captulo 6, Concluso encerra o trabalho, apresentando ensinamentos obtidos em
seu desenvolvimento alm de outras consideraes finais.

14

2 REFERENCIAL TERICO
2.1 Introduo previso de demanda
A atividade de previso de demanda realizada em diversos segmentos de negcios e
amplamente usada por tomadores de decises. Em Economia, governos, empresas, bancos e
empresas de consultoria econmica rotineiramente projetam valores de diversos indicadores
macroeconmicos, como o Produto Interno Bruto, desemprego e inflao. (DIEBOLD, 2015).
Estratgias de negcio em torno de previses de vendas so tomadas o tempo todo e
envolvem todas as partes da empresa, como gesto de operaes (aumento ou reduo da
mo-de-obra, produo, estoque, investimentos), marketing (precificao, publicidade) e
contabilidade (balanos que usam previses de receitas e despesas). Organizaes em geral
tomam usam previses para decidir o que produzir, quando produzir, quanto produzir e em
quanto se deve aumentar a capacidade de produo. (DIEBOLD, 2015).
Pequenos agricultores se beneficiam de saber a previso do tempo para os dias,
semanas ou meses seguintes. Em um estudo em Senegal, a introduo de previses sazonais
de clima a uma comunidade de agricultores familiares afetou as decises de 75% dos
agricultores entrevistados, evidenciando que as previses tm potencial para ajudar os
fazendeiros a se adaptar a mudanas climticas e tambm a se beneficiar financeiramente da
antecipao de condies de clima favorveis (ROUDIER, DUCHARNE e FEYEN, 2014).
Segundo Hyndman e Athanasopoulos (2012), existem seis elementos bsicos que
todos os praticantes de previso deveriam conhecer:

Previso um problema estocstico;

Todas as previses esto erradas;

Algumas previses so teis;

Todas as previses podem ser melhoradas;

Preciso nunca garantida;

Ter uma segunda opinio prefervel.

15

2.2 Sries temporais


Quando uma varivel medida e registrada sequencialmente em tempo durante ou em
um intervalo fixo, chamado de intervalo amostral, os dados resultantes so chamados de srie
temporal. Observaes coletadas em um intervalo amostral no passado recebem o nome de
srie temporal histrica e so usadas para analisar e entender o passado e para prever o futuro,
permitindo que gestores e executivos tomem decises respaldadas em informaes confiveis
(COWPERTWAIT e METCALFE, 2009).
Sries temporais possuem trs tipos de padres, tambm chamados de componentes
(HYNDMAN e ATHANASOPOULOS, 2012):

Tendncia: ocorre quando a varivel da srie temporal apresenta um aumento ou


diminuio de longo prazo;

Sazonalidade: corresponde a um padro fixo que se repete no mesmo perodo de


tempo (Ex.: aumento das vendas de roupa de praia no vero);

Ciclos: ocorre quando os dados mostram subidas e quedas que no possuem um


perodo fixo;

Erro aleatrio: diz respeito aos movimentos irregulares explicados por causas
desconhecidas.
Hyndman e Athanasopoulos (2012) afirmam que podemos pensar em uma srie

temporal como uma funo yt composta pelos trs elementos descritos acima. Se a srie
temporal for descrita como um modelo aditivo, podemos escrever:
= + +

(1)

onde o valor original da srie temporal no perodo t, o componente sazonal, o


componente de tendncia e o erro aleatrio.
Por outro lado, se a srie temporal for descrita como um modelo multiplicativo, temos:
=

(2)

Uma srie temporal de N observaes sucessivas = (1, 2, . . . , ) uma amostra de


uma populao infinita de amostras do tipo que poderiam ter sido geradas pelo processo a que
ela diz respeito. Assim como em outros tipos de investigao estatstica, o objetivo principal
da previso inferir propriedades da populao a partir de uma amostra.
16

A Figura 1 mostra exemplos de sries temporais com tendncia, sazonalidade e ciclo.


Figura 1 - Exemplo de tendncia e sazonalidade de uma srie temporal.

Fonte: Silva e D'Agosto (2012)

2.2.1 Decomposio de Sries Temporais


As tcnicas de decomposio tm como objetivo isolar os diferentes componentes de
uma srie temporal, como a tendncia, a sazonalidade e padres cclicos. Apesar de no terem
sido criadas como ferramentas de previso, comum decompor uma srie temporal antes de a
modelar com um modelo preditivo, visto que os elementos decompostos so mais fceis de
serem extrapolados devido s suas naturezas determinsticas, principalmente em sries com
altos nveis de rudo (THEODOSIOU, 2011).
Mtodo STL
STL, um dos existentes mtodos de decomposio, um acrnimo para
Decomposio de Sazonalidade e Tendncia usando Loess, sendo este um mtodo de
estimao de relacionamentos no-lineares. Consegue lidar com qualquer tipo de sazonalidade
(no somente mensal e trimestral) e possui um tratamento robusto de anomalias. Foi criado
17

para atender a seis objetivos:

Algoritmo simples e de uso fcil e direto;

Flexibilidade na especificao da quantidade de variao dos componentes de


tendncia e sazonalidade;

Especificao do nmero de observaes por ciclo do componente sazonal para um


inteiro maior que um;

A habilidade de decompor sries com valores ausentes;

Componentes

de tendncia e sazonalidade

que no so distorcidos

por

comportamentos anmalos dos dados;

Fcil implementao computacional, mesmo para sries longas.


Sua formulao matemtica completa est presente em Cleveland et al. (1990).

Mtodo do modelo estrutural de Harvey


Os modelos de sries temporais estruturais foram desenvolvidos por Harvey e Peters
(1990) e tambm define a composio de uma srie como tendncia, sazonalidade e rudo.
Contudo, ele menos rgido que o modelo clssico de decomposio pois permite que os
componentes de tendncia e sazonalidade evoluam (variem) aleatoriamente ao invs de
deterministicamente. (BROCKWELL e DAVIS, 1996).
Por exemplo, um modelo estrutural simples obtido adicionando rudo em uma srie
do tipo passeio aleatrio (no-sazonal) ou random walk (Ver seo 3.5.4). O modelo clssico
de decomposio dado pela Equao (3).
= +

(3)

onde { }~(0, 2 )e = o nvel ou sinal determinstico no tempo t. A notao


(0, 2 )denota um tipo de srie temporal chamada de rudo branco (white noise), que
uma sequncia de variveis aleatrias no-correlacionadas com mdia 0 e varincia 2 .
Pode-se adicionar aleatoriedade no nvel supondo que Mt um passeio aleatrio
expresso pela Equao (4).
+1 = + ; ~(0, 2 )

(4)

A Figura 2 mostra quatro simulaes de modelos de passeio aleatrio com rudo


18

branco para diferentes combinaes de valores das varincias.


Figura 2 Exemplos de sries de passeio aleatrio

Fonte: Autoria prpria.

2.3 Mtodos Qualitativos


De acordo com Hyndman e Athanasopoulos (2012), se no h dados disponveis ou se
os dados disponveis so irrelevantes para a previso, mtodos qualitativos de previso devem
ser usados. Mais do que um exerccio de adivinhao, existem mtodos bem desenvolvidos e
estruturados para obter previses sem sries histricas.
Lawrence et al. (2006) observa que, embora mtodos qualitativos sejam pensados
como inimigos da preciso, as previses em forma de julgamento ou opinio j eram
reconhecidas na poca como componentes indispensveis da previso, atraindo a ateno de
pesquisadores parar melhor entender e melhorar o seu uso. Apenas nesse trabalho, mais de
200 referncias so mencionadas.
Lee, Song e Mjelde (2008) mostram como um modelo de previso qualitativa,
elaborado pelo mtodo Delphi, pode ser utilizado para prever eventos sem precedentes como
uma feira internacional de turismo devido falta de dados histricos. Nesses casos, possvel
combinar tcnicas quantitativas com questionrios aplicados a eventuais turistas.
19

Contudo, necessrio alertar sobre os perigos e limitaes dos julgamentos em


previses (HYNDMAN e ATHANASOPOULOS, 2012), como. Um deles a inconsistncia,
pois, ao contrrio de modelos estatsticos que so gerados por equaes matemticas
imutveis, opinies podem ser afetadas por limitao de memria, agendas polticas, m-f,
falta de ateno, otimismo ou pessimismo ou at mesmo fatores psicolgicos.

2.4 Mtodos Quantitativos complexos


Mtodos quantitativos podem ser aplicados quando trs condies so satisfeitas
(MAKRIDAKIS, WHEELWRIGHT e HYNDMAN, 1997):
1. Informao sobre o passado est disponvel;
2. Essa informao pode ser quantificada em forma de dados numricos;
3. Pode ser assumido que padres passados continuaro no futuro.
A maior parte da fundamentao terica sobre os diversos modelos de previso
existentes pode ser encontrada em Hyndman e Athanasopoulos (2012).
2.4.1 Modelos ARIMA
ARIMA uma sigla em ingls que significa Modelo Autorregressivo Integrado de
Mdia Mvel. Modelos ARIMA foram popularizados por George Box e Gwilym Jenkins na
dcada de 1970 e so at o presente um dos mtodos de previso mais populares entre
pesquisadores e praticantes, alm dos modelos de suavizao exponencial.
Segundo Wheelwright e Makridakis (1985), existem trs parmetros que so capazes
de representar uma srie temporal estacionria (uma srie temporal cujas propriedades no
dependem do tempo): um modelo autorregressivo (AR), modelo de mdias mveis (MA) e o
modelo combinado entre autoregressivo e de mdias mveis (ARMA).
O mtodo de Box e Jenkins busca um modelo ARIMA que seja capaz de entender o
processo estocstico por meio do qual a srie temporal gerada. A Equao (5) mostra a
definio formal de um modelo ARIMA.
= 1 1 +. . . + + 1 1 . . .
onde:
= +
20

(5)

o parmetro de ordem p do modelo AR.


o parmetro de ordem q do modelo MA.
o erro aleatrio no tempo t.
equivale ao grau de homogeneidade no estacionria.
A estimao dos parmetros p, d e q do modelo ARIMA pode ser realizada
automaticamente pelo pacote forecast, disponvel gratuitamente por meio da linguagem de
programao R. Os detalhes de como o algoritmo funciona esto disponveis em Hyndman e
Khandakar (2008).
2.4.2 Suavizao exponencial
Modelos de suavizao exponencial foram propostos na dcada de 1950 por Brown
(1959), Holt (1957) e Winters (1960) e consistem em usar mdias ponderadas de observaes
passadas para prever valores futuros, considerando ou no a tendncia e a sazonalidade da
srie temporal. Quanto mais recente o valor observado, maior o seu peso.
Existem diferentes verses de modelos de suavizao exponencial. Por exemplo, a
suavizao exponencial simples definida pela Equao (6).
^+1| = + (1 )1 + (1 )2 2 +. ..

(6)

onde o parmetro de suavizao do modelo e est definido entre 0 (zero) a 1 (um).


Quanto mais prximo de 1, maior o peso a observaes recentes.
Se realizarmos variaes nos parmetros de tendncia e sazonalidade da srie temporal,
possvel obter 15 diferentes modelos de suavizao exponencial. Uma explicao da
formulao matemtica e das hipteses de outros mtodos de suavizao exponenciais como o
Mtodo Linear de Holt, Mtodo de Tendncia Exponencial, Mtodo sazonal Holt-Winters,
etc., podem ser encontrados em Gardner (1985) e Taylor (2003). Os possveis modelos de
suavizao exponencial so listados no Quadro 1.

21

Quadro 1 Possveis modelos de suavizao exponencial

Sazonalidade
Tendncia

N (nenhum)

A (aditiva)

M (multiplicativa)

N (nenhum)

(N, N)

(N, A)

(N, M)

A (aditiva)

(A, N)

(A, A)

(A, M)

Ad (aditiva amortecida)

(Ad, N)

(Ad, A)

(Ad, A)

M (multiplicativa)

(M, N)

(M, A)

(M, M)

Md
(multiplicativa
amortecida)

(Md, N)

(Md, A):

(Md, M)

Fonte: Hyndman e Athanasopoulos (2012)

Cada mtodo apresentado no Quadro 1 categorizado de acordo com o tipo dos


componentes de tendncia e de sazonalidade. Por exemplo, o mtodo (N, N) corresponde
suavizao exponencial simples e o mtodo (M, N) suavizao exponencial de tendncia.
Todos esses modelos consistem de uma equao de mensurao que descrevem os
dados e equaes de transio que descrevem como os componentes - tambm chamados por
Hyndman Athanasopoulos (2012) de estados de tendncia e sazonalidade variam com o
tempo. Por isso, podem ser chamados de modelos de estado espao.
O processo de modelagem de cada um desses 15 mtodos para uma mesma srie
temporal seria muito difcil. Para isso, um algoritmo que automatiza o processo de estimao
dos parmetros de tendncia e sazonalidade foi criado por Hyndman et al. (2002), e est
disponvel gratuitamente no pacote forecast, da linguagem de programao R, pode ser usado
para automatizar o processo de estimao dos parmetros.
2.4.3 Redes neurais artificiais
Redes neurais artificiais so mtodos de previso baseados em modelos matemticos
do crebro humano. Permitem relacionamentos no-lineares complexos entre a varivel
dependente e a independente.
Uma rede neural pode ser interpretada como uma rede de neurnios organizados em
camadas. Os preditores ou inputs formam a camada de baixo e as previses ou outputs
formam a camada de cima. As camadas intermedirias, que podem existir ou no, so
chamadas de ocultas.
22

Cada preditor tem um coeficiente associado a ele, chamado de peso. Inicialmente, os


pesos atribudos aos inputs so valores aleatrios que so atualizados a medida em que a rede
neural utiliza um algoritmo de aprendizagem para minimizar uma funo de custo do modelo,
que corresponde a uma mtrica de erro.
O tipo mais utilizado de rede neural o feedforward, onde os neurnios so dispostos
geralmente em duas camadas ativas e s se conectam com os de camadas subsequentes
(CALOBA, CALOBA e SALIBY, 2002).
Redes neurais j so largamente usadas em previso de demanda, como nos seguintes
trabalhos:

Caloba, Caloba e Saliby (2002), para a previso de demanda de cerveja na Austrlia;

Branco e Sampaio (2008), para a previso de demanda de equipamentos de


infraestrutura de telecomunicaes;

Kaastra e Boyd (1996) para sries temporais econmicas e financeiras;

Claveria e Torra (2014) para a demanda turstica na Catalunha;

Lima (2015) para a irradiao de raios solares na regio Nordeste do Brasil.

2.4.4 BATS e TBATS


Com o objetivo de modelar sries temporais que apresentam uma grande variedade de
padres sazonais, Livera et al (2010) propuseram os mtodos BATS e TBATS.
BATS uma sigla para Transformao Box-Cox, erros ARMA e componentes
Tendncia e Sazonalidade. Pode ser representado matematicamente como:
()

()

( 1) , 0
={
, = 0

()
= (1) + 1 + +
= (1) + 1 +
= (1 ) + 1 +
()

(7)

()

= +
= + 1 +
onde o parmetro para a transformao de Box-Cox, representa o componente de
amortizao da tendncia que convergir para T, e so os parmetros de suavizao para
o nvel e a tendncia locais, s1, s2, , sn so os mltiplos ciclos sazonais, 1, 2, . . . , so os
23

parmetros de suavizao exponencial, dt um processo ARMA(p, q) e uma varivel


gaussiana com mdia zero e varincia 2 constante.
J o mtodo TBATS uma classe de modelo de inovao estado espao obtida pela
representao de componentes sazonais como uma formulao sazonal trigonomtrica,
permitindo, assim modelar perodos sazonais decimais. Sua formulao matemtica consiste
em:
()

()

= ,
()

()

()

()

()

*()
, = ,1 + ,1
+ 1
()

()

(8)

()

*()
*()
,
= ,1 + ,1
+ 2
()

()

()

()

onde 1 e 2 so parmetros de suavizao, = 2 , , o nvel estocstico do i*()


simo componente sazonal, ,
o crescimento estocstico do i-simo componente sazonal

usado para descrever a mudana do componente sazonal ao longo do tempo e a quantidade


de harmnicas requeridas.
Existem na literatura aplicaes de modelos BATS e TBATS em sries temporais de
trnsito de veculos (CUI e GUO, 2015) e receitas financeiros de um hotel (PEREIRA, 2016).
Leitores interessados podem conhecer a formulao matemtica desses dois mtodos por
inteiro em Livera, Hyndman e Snyder (2010). O pacote forecast, utilizado por meio da
linguagem de programao R, torna fcil o processo de estimao dos parmetros.

2.4.5 Suavizao por splines cbicas


Segundo Domingues (2014), splines cbicas so funes polinomiais contnuas por
partes e de grau menor ou igual a 3 em cada uma delas. Cada parte () est definida no
intervalo[1 , ], onde k um nmero inteiro positivo. A suavizao na transio entre ns
garantida pelo fato de as derivadas de primeira e segunda ordens da funo serem contnuas,
evitando picos sejam formados. Alm disso, a funo spline permite a interpolao de curvas
suaves com baixa probabilidade de exibir as grandes oscilaes caractersticas de funes
polinomiais de ordem elevada (ANDRIOLO, 2006).
Sejam ( )as imagens de uma funo desconhecida ()para (n + 1) valores de xi
24

com i = 0, 1, 2, , n. A funo Y3 ser chamada de spline cbica interpolante de ()se


existirem n polinmios de grau menor ou igual a 3, denotados por ()que satisfaam cinco
condies C1, C2, C3, C4 e C5, de acordo com a Equao (9).
1: 3 () = () [1 , ], = 1,2, . . . ,
2: 3 ( ) = ( ), = 0,1,2, . . . ,
3: ( ) = +1 ( ), = 1,2, . . . , ( 1)
4: ( ) = +1 ( ), = 1,2, . . . , ( 1)
5: ( ) = +1 ( ), = 1,2, . . . , ( 1)

(9)

No contexto de sries temporais, a suavizao por splines cbicas pode ser definida
como a funo ^() que minimiza a Equao (10) para todas as funes que possuem uma
derivada de segunda ordem f em S onde [1, ] .
2

( ()) + (())

(10)

corresponde taxa de suavizao que, quanto maior o valor para esse parmetro,
maior a proximidade entre ^()e uma funo linear.
Mtodos para a extrapolao linear de uma tendncia estocstica baseado em
suavizao por splines cbicas e para a estimao do parmetro so discutidos em Hyndman
et al. (2005).

2.4.6 Mtodo Theta


Assimakopoulos e Nikopoulos (2000) propuseram um mtodo baseado em modificar a
curvatura local de uma srie temporal atravs de um coeficiente representado pela letra grega
Theta ( ). As novas sries criadas, chamadas de linhas-Theta, mantm a mdia e a
inclinao da srie original mas no suas curvaturas. O mtodo, portanto, decompe a srie
original em duas ou mais linhas-Theta, que so extrapoladas separadamente e tm suas
previses combinadas para formar os valores futuros fornecidos pelo modelo.
Em vez de apenas decompor uma srie temporal nos elementos conhecidos na
literatura (tendncia, sazonalidade, ciclos e erro aleatrio), o mtodo Theta decompe tambm
a srie sazonalmente ajustada em componentes de curto e longo prazo.
O coeficiente Theta, obtido por meio de um problema de minimizao descrito em
25

Assimakopoulos e Nikopoulos (2000), aplicado s segundas diferenas da srie temporal


original, denotada X, para criar novas sries, como mostra a Equao (11).
() = , = 21 + 2

(11)

A combinao de linhas-Theta = 0 e = 2 foi empregada pelos autores para


produzir previses para sries temporais includas na competio M3. Assim, a decomposio
da srie corresponde Equao (12).
1

= 2 (( = 0) + ( = 2)), :

( = 0) =
( = 2) = 2 ( = 0)

(12)

Um exemplo de modelo criado com essas duas linhas-Theta mostrado na Figura 3.


Figura 3 - Exemplo de previso realizada com mtodo Theta.

Fonte: Assimakopoulos e Nikopoulos (2000)

2.4.7 Modelo de Croston


O modelo de Croston foi desenvolvido como uma alternativa especfica para
demandas intermitentes, que so um tipo de srie temporal que apresenta diversos zeros nos
dados, o que prejudica a preciso de modelos de previso tradicionais (CROSTON, 1972).
O mtodo baseado em aplicar separadamente uma suavizao exponencial sobre a
26

demanda (z), estimando a demanda mdia futura, e outra sobre o intervalo entre demandas (p),
estimando o intervalo mdio futuro. Aps cada ocorrncia de demanda (z diferente de 0), as
estimativas so atualizadas. Caso no ocorra demanda (z = 0) no perodo t, o mtodo apenas
incrementa a contagem dos perodos entre as demandas por meio da varivel q (KOENIG,
2014). A formulao matemtica das duas situaes expostas mostrada a seguir.
Se = 0:
= 1
= 1
=+1

(13)

Se 0:
= 1 + ( 1 )
= 1 + ( 1 )
=1

(14)

Combinando a previso do tamanho da demanda com a previso do intervalo entre


demandas, obtm-se a equao central proposta por Croston:

(15)

onde:
= indicador binrio de demanda no tempo t
= tamanho da demanda no tempo t
= = demanda para um item no tempo t
= nmero mdio de perodos de tempo entre as demandas;
= coeficiente de suavizao;
= estimativa da demanda mdia para o perodo t
= intervalo de tempo desde a ltima demanda;

O valor do coeficiente de suavizao deve ser especificado, no podendo ser estimado.


27

Croston (1972) concluiu que os melhores resultados ocorrem para 0,1 0,3.

2.4.8 Regresso
Sejam x e y duas variveis numricas aleatrias. Supe-se que y funo de x.
Portanto, deseja-se encontrar uma funo linear de x que melhor se ajusta aos dados, no
sentido de que a soma do quadrado das distncias verticais entre os pontos x e y at a reta de
ajuste mnima, como mostrado na Figura 4. Esse procedimento denominado regresso e o
mtodo de estimao dos parmetros do modelo chamado de quadrados mnimos
(DIEBOLD, 2015).
Figura 4 Reta de ajuste de regresso

Fonte: Diebold (2015).

A regresso de sries temporais diferem de uma anlise de regresso comum porque


os resduos do modelo tambm formam uma srie temporal, apresentando uma correlao
serial isto , o resduo do perodo t correlacionado um ou mais resduos passados
(COWPERTWAIT e METCALFE, 2009).
Um modelo de uma srie temporal { : = 1, . . . } linear se puder ser expresso como:
= 0 + 1 1, + 2 2, +. . . + , +

28

(16)

onde , o valor do varivel explanatria i no tempo t, zt o erro no tempo t e


0, 1, . . . , so os parmetros do modelo, que podem ser estimado pelo mtodo dos
quadrados mnimos.
Tambm possvel modelar o componente sazonal de uma srie temporal por meio de
regresso (CRYER e CHAN, 2008). Considerando uma srie de frequncia mensal que pode
ser representada como:

= +

(17)

Temos que o parmetro dever ter 12 valores diferentes, um para cada ms do ano,
que poder ser escrito como:
1 = 1,13,25, . . .
2 = 2,14,26, . . .
= {

12 = 12,24,36, . . .

(18)

Um bom exemplo de aplicao de modelos de regresso para previso realizado por


Bouzada e Saliby (2009), onde a tcnica de regresso mltipla foi utilizada para a previso de
demanda de chamadas de um determinado call center de uma grande empresa do setor.
Variveis como o dia da semana, a ocorrncia ou no de feriado e a proximidade da data com
eventos especiais foram consideradas no modelo. A acurcia obtida foi 3% superior
ferramenta que estava sendo utilizada pela prpria empresa.

2.5 Mtodos Quantitativos simples


Desde Aristteles, existe um senso comum entre cientistas de priorizar mtodos
simples em suas pesquisas (CHARLESWORTH, 1956), sendo a Navalha de Occam um
exemplo disso. A preferncia por simplicidade tambm prefervel na indstria, pois
executivos e tomadores de decises em geral tendem a no confiar em modelos que no
29

entendem (ZELLNER, 2001). De fato, Armstrong e Shapiro (1974) descrevem um caso onde
at mesmo os analistas de previso no sabiam explicar o modelo, desenvolvido por um
fornecedor, que a empresa onde trabalhavam usava. Em um outro exemplo, aproximadamente
60 dos 90 economistas de universidades de ponta entrevistados por Soyer e Hogarth (2012)
no conseguiram explicar corretamente os dados informados em outputs de modelos de
regresso.
Segundo Green e Armstrong (2015), simplicidade em previso requer que o mtodo, a
representao do conhecimento cumulativo, o relacionamento nos modelos e o
relacionamento entre modelos, previses e deciso so todos suficientemente descomplicados
para os tomadores de deciso. Nesse mesmo trabalho, 97 comparaes em 32 artigos
cientficos foram utilizadas para analisar a preciso de modelos simples contra modelos
complexos. Nenhum deles fornece evidncia para a ideia de que quanto maior a complexidade
de um modelo, maior sua eficcia. De fato, em 25 dos artigos, a complexidade aumenta os
erros de previso em 27%.
Graefe et al. (2015) encontraram que a mdia simples de previses criadas por
diversos modelos reduz o erro de previso em 5% quando comparados com modelos
Bayesianos comumente aplicados em previses de cenrios polticos e econmicos. Schnaars
(1984) usou mtodos de extrapolao para produzir previses para um intervalo de tempo de
cinco anos para 98 sries anuais que representavam vendas de produtos de consumo. A
acurcia da previso ingnua (ver 2.5.2) foi to boa quanto a dos outros cinco mtodos de
extrapolao usados.
2.5.1 Modelo da Mdia Simples
A previso de todos os valores futuros igual mdia dos valores passados. Seja
y1, , yT a notao da srie histrica temporal. Temos, ento, que as previses so
determinadas pela Equao (19):
^+| = = (1 +. . . + )

(19)

30

2.5.2 Modelo ingnuo


A previso de todos os valores futuros igual ao ltimo valor observado. utilizada
como benchmark para outros modelos e costuma obter bons resultados para sries temporais
econmicas e financeiros (HYNDMAN E ATHANASOPOULOS, 2012).

2.5.3 Modelo sazonal ingnuo


Um modelo similar ao ingnuo e til para dados altamente sazonais o mtodo
sazonal ingnuo. Cada valor previsto igual ao ltimo valor observado do mesmo perodo do
ano. Esse mtodo prever, por exemplo, para os todos os prximos meses de Fevereiro, o
valor observado no ltimo ms de Fevereiro.
2.5.4 Modelo de passeio aleatrio
Corresponde a uma variao do modelo ingnuo que permite que as previses
aumentem ou diminuam seu valor ao longo do tempo, onde o total de variao igual
variao mdia observada na srie histrica. Assim, a previso para o tempo T + h calculada
pela Equao (20).

1
( 1 ) = + (
)
1
1

(20)

Isso equivalente a desenhar uma reta entre o primeiro e o ltimo valor observado e
extrapolar os valores futuros.

2.6 Mtricas de acurcia para seleo de modelo


Existem diversas maneiras para avaliar a qualidade do ajuste de um modelo de
previso, que representa o quo bem um modelo capaz de reproduzir os dados que ele j
incorporou (MAKRIDAKIS, WHEELWRIGHT e HYNDMAN, 1997).
Se Yt uma observao real de uma srie temporal para o perodo t e^ a previso para
o mesmo perodo, ento o erro definido como:

31

^
=

(21)

A qualidade do ajuste no significa necessariamente que o modelo possui uma boa


acurcia. sempre possvel obter um erro igual a zero usando um polinmio de ordem
suficientemente grande. Contudo, no h garantia que esse ajuste ter uma boa previso para
valores futuros ou at mesmo para valores da srie que no foram usados como input para o
ajuste do modelo. A tcnica de forar um modelo a incorporar aleatoriedade em seu ajuste
para uma dada srie histrica chamada de overfitting.
Esse problema pode ser resolvido medindo a acurcia da previso fora da amostra.
Isso realizado dividindo a srie em uma srie de inicializao ou treino (training set) e uma
srie de teste (test set). Assim, a srie de treino usada para estimar os parmetros e ajustar o
modelo e a srie de treino para avaliar sua acurcia. Como a srie de treino no foi usada para
o ajuste do modelo, as previses obtidas so genunas. Portanto, as mtricas de erro devem ser
calculadas apenas para a srie de treino. (MAKRIDAKIS, WHEELWRIGHT e HYNDMAN,
1997).
As mtricas de erro podem ser classificadas em:
2.6.1 Erros dependentes da escala
O erro et est na mesma escala que os dados Yt. Mtricas de erro que so baseadas em
et so portanto dependentes da escala e no podem ser usadas em comparaes entre sries de
diferentes escalas (HYNDMAN E ATHANASOPOULOS, 2012).
As duas mtricas dependentes da escala mais comuns so o erro absoluto mdio (MAE)
e a raiz do erro quadrtico mdio (RMSE), definidos como:

= (| |)

(22)

= ((2 ))

(23)

Uma variao do MAE o erro absoluto mediano, onde a mediana dos erros usada
ao invs da mdia.
32

2.6.2 Erros porcentuais


O erro porcentual dado por:
= 100

(24)

Mtricas baseadas em erros porcentuais tm a vantagem de independerem da escala


dos dados, sendo frequentemente usados para comparar o desempenho de previses em
diferentes sries temporais. A mtrica de erro porcentual mais comum o erro porcentual
absoluto mdio (MAPE), dado por:
= (| |)

(25)

Contudo, o MAPE e outras mtricas baseadas no erro porcentual possuem a


^ prximo a
desvantagem de serem indefinidas quando = 0e ter valores extremos quando
zero. Assim, elas no devem ser usadas para sries temporais intermitentes.

2.7 Intervalos de predio


De acordo com Hyndman e Athanasopoulos (2012), intervalos de previso fornecem
um intervalo dentro do qual o valor de Yt esperado com uma certa probabilidade. Por
exemplo, assumindo que os erros de previso no so correlacionados e normalmente
distribudos, ento um intervalo de previso de 95% para a prxima observao da srie
dado por:
^ = 1,96

(26)

onde uma estimativa do desvio padro da distribuio da previso.


Uma caracterstica dos intervalos de previso que eles aumentam em tamanho a
medida em que o intervalo de previso aumenta devido a incerteza associada com a previso
aumentar.

33

2.8 Estratgia de criao de modelo de previso


De acordo com Makridakis, Wheelwright e Hyndman (1997), existem cinco etapas
bsicas de um projeto de previso quantitativa:
1. Definio do problema: algumas vezes a tarefa mais difcil do analista de previses.
Envolve o desenvolvimento de um profundo entendimento de como as previses sero
usadas, quem o pblico-alvo e como as previses se enquadram na organizao.
Previses mais detalhadas levam em considerao aspectos alm das sries histricas,
como quais produtos esto em estoque, quem os usa, qual o tempo de produo deles e
assim em diante.
2. Coletar informaes, sendo elas de dois tipos: dados estatsticos e o a expertise de
pessoas chave do negcio.
3. Anlise exploratria preliminar: antes de modelar os dados, necessrio conheclos melhor. Por isso, o analista deve calcular estatsticas bsicas como mdia, desvio
padro e valores mnimo e mximo associados com cada conjunto de dados. Quando
h mais de uma srie temporal a ser analisada, podem ser usadas tcnicas de
correlao e correlao cruzada. Uma ferramenta comumente usada em sries
temporais a decomposio dos dados para verificar componentes como tendncia,
sazonalidade e ciclos, alm de identificar anomalias.
4. Escolha e ajuste de um modelo: envolve a aplicao dos dados como inputs de
modelos quantitativos. Cada modelo envolve uma srie de suposies que devem ser
averiguadas nos dados para que a previso faa sentido.
5. Usar e avaliar um modelo de previso: uma vez que um modelo foi escolhido e seus
parmetros estimados apropriadamente, ele deve ser usado para realizar previses,
sendo monitorado regularmente pelos seus usurios pelas vrias mtricas de erros de
previso existentes na literatura.

34

3. PROCEDIMENTOS METODOLGICOS
O procedimento metodolgico seguiu o modelo das cinco etapas proposto por
Makridakis, Wheelwright e Hyndman (1997): definio do problema, coleta de dados, anlise
exploratria preliminar, ajuste de modelos e escolha do modelo.
A empresa tem mais de cem centros de distribuio (CD) espalhados por todo o Brasil.
Cada um deles armazena e vende centenas de produtos diferentes. Consequentemente, todos
os meses so realizadas mais de 12 mil previses de vendas. Portanto, a ferramenta de
previso de demanda utilizada pela empresa no s necessita fornecer previses precisas mas
tambm ser automatizada.
O mtodo do presente trabalho foi dividido nas seguintes etapas
1. Coleta de dados: Foram coletadas as sries histricas de vendas dos produtos
negociados por 23 centros de distribuio da empresa localizados na regio
Nordeste do Brasil entre Janeiro de 2015 a Agosto de 2016. As fontes dos dados
so sistemas internos da companhia. Devido s questes de confidencialidade e
segredo industrial, tais dados no podero ser disponibilizados ao pblico e
algumas informaes (como os verdadeiros nomes e a localidade exata dos centros
de distribuio) no sero reveladas no presente trabalho.
2. Anlise exploratria preliminar: A funcionalidade do sistema proposto foi
preliminarmente testada com a srie temporal das vendas do produto mais vendido
pelo centro de distribuio de maior volume de vendas dentre os 23 analisados.
3. Automao do processo: Aps a realizao bem-sucedida do teste, foi escrito um
pacote na linguagem R para automatizar o processo de ajuste de diferentes
modelos e seleo daquele com o menor erro. O pacote foi disponibilizado
gratuitamente na Internet1 e pode ser utilizado para previses das mais diversas
naturezas. O cdigo criado est disponvel no Apndice A.
Decidiu-se usar a linguagem R para o desenvolvimento do sistema proposto devido
grande quantidade de modelos de previso disponveis no pacote forecast, desenvolvido por

https://cran.r-project.org/web/packages/mafs/index.html

35

Hyndman e Khandakar (2008). A partir dessa facilidade, algoritmos estatsticos complexos


podem ser usados em poucas linhas de cdigo, recurso que no est presente em outros
programas computacionais semelhantes.

36

4. DESCRIO DO SISTEMA PROPOSTO


O ajuste de modelos a etapa de maior complexidade do trabalho. O passo-a-passo do
mtodo ser descrito a seguir.
A funo principal do mtodo chamada select_forecast() e tem como inputs do
usurio uma srie temporal, o tamanho da srie de teste (test_size), o tamanho do horizonte de
previso (horizon) e a mtrica de erro escolhida para a comparao entre modelos. Para este
trabalho, foi escolhida a mtrica MAE (desvio absoluto mdio) devido ao fato de algumas
das sries de demandas analisadas serem intermitentes, o que implicaria a inviabilidade de se
utilizar o MAPE, visto que no se pode utilizar o nmero 0 como denominador.
Inicialmente, a srie temporal dividida em uma srie de treino (training) e uma srie
de teste (test). O tamanho da srie de teste escolhida pelo usurio. Para este trabalho, devido
ao tamanho limitado de menos de dois anos de dados fornecidos, decidiu-se por criar sries de
treino de trs meses de comprimento.
A srie de treino ento aplicada em 18 modelos de previso para obter previses para
os meses da srie de teste. Tais modelos esto disponveis no pacote da linguagem R chamado
forecast (Hyndman e Khandakar, 2008). Os modelos de previso disponveis so apresentados
no Quadro 2.
A partir dos ajustes criados, so geradas previses para os trs meses seguintes ao
ltimo ms da srie de treino. As previses so ento comparadas com os valores reais da
srie de treino por meio da mtrica de erro escolhida. O modelo cuja previso obteve a melhor
acurcia ento aplicada srie temporal original, obtendo, assim, valores de demanda para
os meses futuros, alm do intervalo de predio. Este processo ilustrado pela Figura 4.
Figura 4 - Ilustrao do funcionamento do algoritmo de seleo de modelo de previso.

Fonte: Autoria prpria.

37

Quadro 2 - Modelos de previso utilizados no trabalho

Nome do modelo

Descrio

Nome da funo no pacote


forecast.

auto.arima

Modelo ARIMA

auto.arima()

ets

Suavizao exponencial por ets()


modelo de estado espao

nnetar

Redes neurais artificiais

nnetar()

tbats

Modelo TBATS

tbats()

bats

Modelo BATS

bats()

stlm_ets

Suavizao exponencial por stlm()


modelo de estado espao com
ajuste sazonal pelo mtodo
STL

stlm_arima

Modelo ARIMA com ajuste stlm()


sazonal pelo mtodo STL

StructTS

Modelo estrutural

StructTS()

meanf

Mdia simples

meanf()

naive

Modelo ingnuo

naive()

snaive

Modelo ingnuo sazonal

snaive()

rwf

Passeio aleatrio

rwf()

rwf_drift

Passeio aleatrio com deriva

rwf()

splinef

Suavizao

por

splines splinef()

cbicas
thetaf

Mtodo Theta

thetaf()

croston

Modelo de Croston

croston()

tslm

Regresso linear

tslm()

hybrid

Modelo hbrido

hybrid()

Fonte: Autoria prpria.

38

5. RESULTADOS DA SIMULAO
5.1 Anlise exploratria
A Figura 5 mostra a srie histrica agregada do volume de vendas dos CDs da regio
Nordeste da empresa.
Figura 5 Srie histrica do volume de vendas da regio Nordeste

Fonte: Autoria prpria

Como mostra a Figura 5, o desempenho mensal das vendas irregular. Existem alguns
perodos onde visualmente h um componente de tendncia. Alm disso, no possvel
observar o componente de sazonalidade na srie, muito em parte por conta de o perodo
analisado ser menor que 2 anos. O volume mensal mdio de vendas de 1,081 milhes de
hectolitros.
Os 175 produtos vendidos na regio apresentam demandas de diferentes magnitudes.
A Figura 6 mostra a curva ABC dos produtos.

39

Figura 6 Curva ABC dos produtos vendidos na regio Nordeste

Fonte: Autoria prpria.

A Figura 6 mostra que 35 ou 20% dos 175 produtos correspondem a 80% do volume
de vendas. Seria natural concentrar os esforos nesses produtos mais importantes e testar a
validade do sistema proposto no presente trabalho apenas para eles. Contudo, decidiu-se
incluir nos testes todos os produtos, independentemente da demanda.

5.2 Exemplo de aplicao do sistema


Durante o desenvolvimento do trabalho, foram realizadas 7.767 previses mensais de
diferentes produtos em diferentes centros de distribuio. Como seria impraticvel comentar
cada um desses casos, ser mostrado o funcionamento do mtodo para a srie histrica do
produto mais popular (chamado de P001 por motivos de confidencialidade) vendido pelo
maior centro de distribuio no Nordeste (chamado de C01).
A srie temporal histrica das vendas do produto P001 pelo centro de distribuio C01
mostrada na Figura 7.
40

Figura 7 Srie histrica do produto de maior demanda

Fonte: Autoria prpria.

Percebe-se pela Figura 7 que, apesar de esse ser o produto de maior demanda do
centro de distribuio C01, sua srie temporal apresenta uma tendncia de queda a partir de
Fevereiro de 2015. Portanto, espera-se que as previses obtidas prossigam com essa tendncia.
Dos modelos de previso inclusos no sistema proposto, apenas os baseados na
decomposio sazonal pelo mtodo STL no foram usados por eles precisarem de um perodo
de tempo de no mnimo dois anos. Portanto, a preciso do sistema proposto poderia ser ainda
melhor caso um perodo maior de dados fosse disponibilizados.
Os dados de Janeiro de 2015 a Maio de 2016 foram usados para obter as previses
para Junho, Julho e Agosto por cada um dos modelos disponveis, que foram ento
comparadas com os dados reais para esse trimestre.
O resultado dos ajustes obtidos em cada modelo mostrado nas figuras presentes no
Apndice B.
Os resultados dos ajustes obtidos so apresentados na Tabela 1.

41

Tabela 1 Erros obtidos pelos mtodos de previso.

Modelo
rwf_drift
splinef
naive
rwf
ets
StructTS
tslm
nnetar
bats
thetaf
meanf
auto.arima
croston
hybrid
tbats
snaive

RMSE
4180,654
4399,647
4834,035
4834,035
5422,768
5456,741
6210,356
6236,485
6726,572
7113,854
10195,56
10195,56
10284,02
10369,9
10718,98
11443,78

MAE
3963,575
4342,502
4647,575
4647,575
5257,23
5329,792
6063,455
6129,297
6581,88
7012,895
10108,49
10108,49
10197,71
10284,3
10636,19
11364,73

MAPE
16,03998
17,40861
18,75864
18,75864
21,18182
21,35556
24,33111
24,60648
26,40727
28,13093
40,46391
40,46391
40,81852
41,16272
42,56136
45,40185

Fonte: Autoria prpria.

De acordo com a Tabela 1, o modelo do passeio aleatrio com deriva (rwf_drift) teve
o melhor desempenho, apresentando um MAPE de 16% e um MAE de 3963,575 hectolitros.
Nota-se, tambm, que apesar de o sistema proposto conter 18 modelos de previso, apenas 16
foram usados. Isso ocorreu porque os modelos baseados na decomposio pelo modelo
estrutural de Harvey exigem pelo menos 24 meses para as sries temporais, o que maior que
as sries analisadas neste trabalho.
Assim, os resultados desse modelo foram comparados com as previses de trs fontes
diferentes da empresa: duas so fornecidas pelo sistema oficial de previso de demanda,
chamadas N1 e N2, e a outra obtida por meio de uma anlise qualitativa das previses
obtidas pelo sistema, considerando fatores (regressores externos) como aes de preos
promocionais, momento econmico do Brasil, preo do dlar, etc, chamada de crtica. Tal
comparao mostrada na Tabela 2.

42

Tabela 2 Comparao do erro de previso para o produto P001

Crtica
Vol.
Ms
Erro
Previsto
(%)
(hL)
Jun 26568,15 35764,11 34,61
Jul
25708,28 30722,40 19,50
Ago 23417,70 27497,34 17,42
Media
23,85
Real
(hL)

N1
Vol.
Previsto
(hL)
34219,74
34147,84
31057,33

Erro
(%)
28,80
32,83
32,62
31,42

N2
Vol.
Previsto
(hL)
35431,69
31793,98
29894,51

Erro
(%)
33,36
23,67
27,66
28,23

rwf_drift
Vol.
Erro
Previsto
(%)
(hL)
29194,95 9,89
29194,95 13,56
29194,95 24,67
16,04

Fonte: Autoria prpria.

Conforme mostra a Tabela 2, o mtodo rwf_drift apresentou um erro mdio de 16,04%,


o que 7,81% menor que o erro da crtica feita pelos profissionais de previso de vendas da
empresa. Alm disso, em dois dos trs meses avaliados, o mtodo rwf_drift obteve a melhor
preciso. Portanto, o sistema proposto no presente trabalho, na comparao realizada aqui,
apresentou um melhor desempenho que as previses usadas na empresa.

5.3 Resultados do sistema proposto


Aps mostrar na seo 5.2 um exemplo bem-sucedido de aplicao do sistema, os
resultados de sua aplicao em todas as sries temporais disponveis foram comparados com a
acurcia obtida pelas previses realizadas pela empresa no geral ou estratificados por produto,
centro de distribuio e ms.
5.3.1 Resultados gerais
Semelhantemente aos dados da Tabela 2, foram geradas 7.767 previses para os meses
de Junho, Julho e Agosto de 175 produtos em 23 centros de distribuio. O erro absoluto e o
relativo mdio obtido por cada fonte de previso so mostrados na Tabela 3. Ressalta-se que,
para o clculo do erro absoluto, foram desconsideradas as previses onde o volume real de
vendas foi 0, o que inviabiliza o clculo visto que no se pode dividir um nmero por 0.

43

Tabela 3 Resultados gerais do sistema proposto comparados com os mtodos da empresa

Mtodo
N1
N2
Crtica
mafs

Erro absoluto mdio (hL)


108,70
98,74
94,58
53,51

Erro relativo mdio (%)


238,50
215,51
196,12
55,11

Fonte: Autoria prpria.

Como mostra a Tabela 3, o sistema proposto obteve a melhor acurcia tanto em termos
absolutos quanto em relativos. A Figura 8 mostra a diferena entre as mdias e o intervalo de
confiana dos quatro mtodos.
Figura 8 Erro absoluto mdio e intervalo de confiana dos mtodos de previso avaliados

Fonte: Autoria prpria.

Nota-se pela Figura 8 que, alm do sistema proposto ter o menor erro absoluto mdio,
h pouca diferena entre os resultados dos mtodos de previso da empresa. Para avaliar se
tais diferenas so estatisticamente significantes, aplicou-se o teste da Anlise de varincia
(ANOVA) para avaliar duas hipteses:

Hiptese nula (H0): Os quatro mtodos apresentam os mesmos resultados e as


diferenas entre eles se devem a aleatoriedade;

Hiptese alternativa (HA): Existe uma diferena significativa do erro absoluto


mdio dos quatro mtodos avaliados.
44

Ou seja, deseja-se saber se os dados coletados no experimento fornecem evidncia


suficiente para rejeitar a hiptese nula. Foi utilizada a funo aov() da linguagem de
programao R para a aplicao do teste ANOVA nas condies acima. Os resultados so
apresentados na Tabela 4.
Tabela 4 Resultados do teste ANOVA

Estatstica do teste
Valor-F
Valor-p

Valor
28,78
2 x 10-16
Fonte: Autoria prpria.

Na Tabela 4, so apresentadas duas estatsticas resultantes do teste:

O valor-F, que , neste contexto, a taxa normalizada da varincia entre


diferentes etapas relativa variao dentro de uma mesma etapa (Diez et al.,
2016). Quanto maior o valor-F, maior a veracidade da hiptese alternativa
(HA).

O valor-p, que a probabilidade de observar dados no mnimo to favorveis


hiptese alternativa quanto os dados atuais, partindo do pressuposto que a
hiptese nula verdadeira. Na pesquisa cientfica, costuma usar o nvel de
significncia (valor) de 0,05 (Diez et al., 2016). Isto , se o valor-p menor
que 0,05, ento h evidncias suficientes para rejeitar a hiptese nula.

Como a estatstica F muito superior a 1 e a estatstica p muito menor que 0,05,


conforme mostrado na Tabela 4, pode-se aceitar HA e concluir que as diferenas de acurcia
dos mtodos estatisticamente significante.
Entretanto, o teste ANOVA informa apenas que nem todas os mtodos so iguais.
Como foram analisadas quatro mtodos de previso de vendas diferentes, possvel que
apenas um deles no seja igual s outras. Por isso, aps o teste ANOVA, necessrio usar
testes post hoc para identificar quais pares de mtodos diferem significativamente entre si2.
Assim, foi aplicado o teste de significncia honesta de Tukey (teste de Tukey ou teste
HSD), que aplicado quando o teste F for significativo3, para testar toda e qualquer diferena
entre as mdias de erro absoluto. Mais detalhes sobre esse teste estatstico podem ser
2
3

http://www.ufpa.br/metodologiza/decisao_testes.html
http://www.de.ufpb.br/~tarciana/MPIE/Aula19.pdf

45

encontrados em Tukey (1949). Foi usada a funo TukeyHSD(), presente na linguagem de


programao R. Tais resultados so apresentados na Tabela 5.
Tabela 5 Resultados do teste de Tukey

Comparao
N2-N1
Crtica-N1
Crtica-N2
mafs-N1
mafs-N2
mafs-Crtica

Diferena mdia (hL)


-9,957082
-14,115068
-4,157986
-55,184742
-45,227661
-41,069674

Valor-p
0,4054134
0,1225085
0,9160069
0,0000000
0,0000000
0,0000000

Fonte: Autoria prpria.

Os dados da Tabela 5 confirmam que o sistema proposto significativamente diferente


dos mtodos da empresa que, por sua vez, no apresentam diferenas significativas entre si.
5.3.2 Resultados agregados por produto.
Para calcular os resultados agregados por produto, foram obtidos os volumes reais e
previstos de cada um dos 175 produtos acumulados para os trs meses da srie de teste (Junho,
Julho e Agosto). Um exemplo da tabela resultante para o produto P001 mostrado na Tabela
6.
Tabela 6 Resultados agregados para o produto P001

Produto

P001

Volume real
(hL)

Mtodo de
previso

294033,2

N1
N2
Crtica
mafs

Vol.
previsto
(hL)
330254,5
322616,4
317795,0
305777,6

Erro
absoluto
(hL)
36221,3
28593,2
23761,8
11744,4

Erro
relativo
(%)
12,3
9,7
8,1
4,0

Ranking
de
acurcia
4
3
2
1

Fonte: Autoria prpria.

Conforme mostra a Tabela 6, o volume acumulado do produto P001 nos 23 centros de


distribuio nos trs meses da srie de teste foi 294033,2hL. A melhor acurcia observada foi
a do sistema proposto, com um erro relativo de 4,0%, seguida pela Crtica, pelo N2 e pelo N1.
Para determinar o melhor mtodo para os resultados agregados por produto, foi criado
um sistema de pontuao em que o sistema de menor erro absoluto ganhava 5 pontos, o de 2
menor erro 3 pontos, o de 3 menor 1 ponto e o de maior erro nenhum ponto. Os resultados
46

desse sistema de pontuao so apresentados na Tabela 7.


Tabela 7 Pontuao agregada por produto dos mtodos de previso

Mtodo

Menor erro
49
19
19
88

N1
N2
Crtica
mafs

Nmero de previses
2 menor erro 3 menor erro
29
35
63
63
52
58
31
19

4 menor erro
62
30
46
37

Pontuao
total
367
347
309
552

Fonte: Autoria prpria.

De acordo com a Tabela 7, o sistema proposto obteve um desempenho muito superior


aos mtodos da empresa, obtendo a melhor previso para 50,3% dos produtos. No sistema de
pontuao criado, o mtodo teve 552 pontos, 185 a mais que o mtodo de segundo melhor
desempenho, o N1.
Outra forma de analisar os resultados pela mdia do erro absoluto de cada sistema
para todos os produtos. Adicionalmente, foi calculado a mediana do erro absoluto dos
mtodos para mostrar o efeito das anomalias nos resultados. Tais resultados so apresentados
na Tabela 8.
Tabela 8 Erro absoluto agregado por produto dos mtodos de previso

Mtodo
N1
N2
Crtica
mafs

Erro absoluto mdio (hL)


2072,1
1505,5
1338,5
691,8

Erro absoluto mediano (hL)


132,9
118,0
162,8
50,8

Fonte: Autoria prpria

De acordo com a Tabela 8, novamente, o sistema proposto obteve o melhor


desempenho, tanto pela mdia quanto pela mediana.

5.3.3 Resultados agregados por centro de distribuio


Para calcular os resultados agregados por produto, foram obtidos os volumes reais e
previstos de cada um dos 23 centros de distribuio para os trs meses da srie de teste (Junho,
Julho e Agosto). Um exemplo da tabela resultante para o centro de distribuio C01
mostrado na Tabela 9.

47

Tabela 9 Resultados agregados para o centro de distribuio C01.

Centro de
distribuio

C01

Volume real
(hL)

Mtodo de
previso

467502,1

N1
N2
Crtica
mafs

Vol.
previsto
(hL)
485761,1
510258,6
506384,1
479125,5

Erro
absoluto
(hL)
18259,1
42756,6
38882,1
11623,4

Erro
relativo
(%)
3,9
9,1
8,3
2,5

Ranking
de
acurcia
2
4
3
1

Fonte: Autoria prpria.

Conforme mostra a Tabela 9, o volume acumulado do centro de distribuio C01 nos


trs meses da srie de teste foi 467502,1hL. A melhor acurcia observada foi a do sistema
proposto, com um erro relativo de 2,5%.
Para determinar o melhor mtodo de previso para os resultados agregados por centro
de distribuio, foi utilizado o mesmo sistema de pontuao descrito na seo anterior. Os
resultados desse sistema de pontuao agregados por centro de distribuio so apresentados
na Tabela 10.
Tabela 10 Pontuao agregada por centro de distribuio dos mtodos de previso

Mtodo
N1
N2
Crtica
mafs

Menor erro
2
6
1
14

Nmero de previses
2 menor erro 3 menor erro
8
7
5
4
6
8
4
4

4 menor erro
6
8
8
1

Pontuao
total
41
49
31
86

Fonte: Autoria prpria.

De acordo com a Tabela 10, semelhantemente aos resultados agregados por produto, o
sistema proposto obteve um desempenho muito superior aos mtodos da empresa, obtendo a
melhor previso para 60,9% dos produtos. No sistema de pontuao criado, o mtodo teve 86
pontos, 37 a mais que o mtodo de segundo melhor desempenho, o N2.
O erro absoluto mdio agregado por centro de distribuio dos quatro mtodos de
previso de demanda mostrado na Tabela 11.
Tabela 11 - Erro absoluto agregado por centro de distribuio dos mtodos de previso

Mtodo
N1
N2
Crtica
mafs

Erro absoluto mdio (hL)


6910,5
9128,3
9405,2
2796,9
Fonte: Autoria prpria

48

Erro absoluto mediano (hL)


4368,7
3717,1
4663,4
1718,3

De acordo com a Tabela 11, novamente, o sistema proposto obteve o melhor


desempenho, tanto pela mdia quanto pela mediana.
5.3.4 Resultados totais agregados por ms
Finalmente, foram analisados os resultados agregados de Junho, Julho e Agosto dentre
todos os centros de distribuio. Os resultados so mostrados na Tabela 12.
Tabela 12 - Erro absoluto agregado por ms dos mtodos de previso

Ms

Volume real
(hL)

Junho

1017189,0

Julho

883600,0

Agosto

890383,2

Mtodo de
previso
N1
N2
Crtica
mafs
N1
N2
Crtica
mafs
N1
N2
Crtica
mafs

Vol. previsto
(hL)
919482,8
966889,0
1031088,7
964041,7
898535,0
955158,3
963612,9
911593,8
975353,0
973076,1
945840,0
890383,2

Erro absoluto
(hL)
97706,2
50299,9
13899,7
53147,3
14935,0
71558,3
80013,0
27993,8
84969,8
82693,0
55456,8
23708,7

Erro relativo
(%)
9,6
4,9
1,4
5,2
1,7
8,1
9,1
3,1
9,5
9,3
6,2
2,7

Fonte: Autoria prpria.

Conforme mostra a Tabela 12, o sistema proposto obteve a terceira melhor acurcia
para o ms de Junho, a segunda melhor para Julho e a melhor para Agosto. Alm disso, o
mtodo mafs apresentou o menor erro relativo mximo, de 5,2%, comparado com os mtodos
N1 (9,6%), N2 (8,1%) e Crtica (6,2%). O erro relativo mdio do sistema proposto tambm
foi o menor (3,7%).
Contudo, deve-se ressaltar que os resultados apresentados no presente captulo foram
obtidos com um curto perodo de tempo usado para a modelagem das sries temporais (menos
de 24 meses), alm de sries de testes de apenas trs meses. Como sugesto para trabalhos
futuros, recomenda-se o teste do sistema proposto para sries temporais mais longas.
Alm disso, no perodo analisado, a tendncia geral do comrcio de bebidas foi de
queda devido ao momento econmico do Brasil. Isto , o sistema no foi testado para um
perodo longo o suficiente em que os dados apresentam variaes sistemticas no s de
queda mas tambm de aumento de vendas.
49

5.4 Resultados dos modelos usados no sistema


Decidiu-se analisar a eficcia dos dezoito modelos de previso utilizados no sistema
proposto. O porcentual de vezes em que os modelos obtiveram o menor MAE para cada
previso so apresentados na Figura 9.
Figura 9 Resultados dos modelos de previso usados no sistema

Fonte: Autoria prpria

De acordo com a Figura 9, o modelo de splines cbicas suavizadas obteve o melhor


desempenho em 11,16% das previses realizadas. Os modelos categorizados como complexos,
de acordo com a classificao de Hyndman (SITE FPP), obtiveram um resultado superior aos
modelos simples. Apesar disso, nota-se que alguns dos modelos clssicos amplamente
utilizados entre analistas de previso, como o de suavizao exponencial e o modelo ARIMA,
obtiveram um desempenho inferior ao de modelos simples como o ingnuo (naive).

50

6 CONCLUSO
A previso de demanda um processo chave para o planejamento estratgico e para o
processo produtivo das empresas. Alm disso, empresas de porte mdio ou grande, que
contam com centenas ou milhares de produtos em seu portflio, necessitam realizar previses
de vendas nessa mesma proporo. Portanto, h a necessidade de solues de previses que
sejam eficientes em termos de acurcia e automatizadas, com pouca necessidade de
interveno humana.
No presente trabalho, o sistema proposto, que seleciona um mtodo de previso de
demanda dentre os 18 escolhidos, foi testado para sries temporais de vendas de mais de 100
produtos de 23 centros de distribuio na regio Nordeste de uma empresa distribuidora de
bebidas. Os resultados obtidos com essa simulao foram comparados com os dos mtodos
usados pela empresa, cujas previses so realizadas por um sistema computacional e ajustadas
por especialistas de acordo com informaes sobre aes promocionais e indicadores
macroeconmicos.
Os resultados gerais do sistema proposto foram melhores que os mtodos da empresa.
Considerando todas as mais de 7000 previses realizadas, o erro relativo mdio do sistema
proposto foi de 55,11%, contra 196,12% da previso realizada por especialistas da empresa.
Na anlise dos resultados agregados por produto e por centro de distribuio, o sistema
proposto tambm apresentou os melhores resultados de acurcia. Finalmente, na anlise de
resultados agregados por ms para o trimestre Junho, Julho e Agosto, o sistema do presente
trabalho obteve o menor erro relativo mdio.
Contudo, deve-se ressaltar que o perodo das sries temporais analisadas na simulao
de resultados curto. De fato, inferior a 24 meses, o que insuficiente para que os dados
apresentem claros comportamentos sazonais. Trabalhos futuros a partir deste trabalho
poderiam ser realizados utilizando sries temporais maiores, de pelo menos 60 meses.
Outra limitao dos resultados apresentados que, como consequncia do exposto no
pargrafo anterior e do contexto macroeconmico do Brasil no perodo analisado, no pode-se
afirmar que sistema foi testado para um perodo longo o suficiente em que os dados
apresentam variaes sistemticas no s de queda mas tambm de aumento de vendas.
51

REFERNCIAS BIBLIOGRFICAS
ANDRIOLO, M. V. Anlise de mtodos no lineares para previso de vazes mdias mensais.
2006. Dissertao (Mestrado em Engenharia de Recursos Hdricos e Ambiental)
Universidade Federal do Paran, Curitiba, 2006.
ARMSTRONG, J.S.; SHAPIRO, A.C. (1974). Analyzing quantitative models. Journal of
Marketing, v. 38, p. 6166, 1974.
ASSIMAKOPOULOS, V.; NIKOLOPOULOS, K. (2000). The theta model: a decomposition
approach to forecasting. International Journal of Forecasting, v. 16, p. 521-530, 2000.
BOUZADA, M. A. C.; SALIBY, E. (2009). Prevendo a demanda de ligaes em um call
center por meio de um modelo de Regresso Mltipla. Gesto & Produo, v. 16, n.3, p. 382397, 2009.
BRANCO, S. T.; SAMPAIO, R. J. B. Aplicao de redes neurais artificiais em modelos de
previso da demanda para equipamentos de infraestrutura de telecomunicaes. In: XXVII
ENCONTRO NACIONAL DE ENGENHARIA DE PRODUO. Rio de Janeiro, 2008.
BROCKWELL, P. J.; DAVIS, R. A. Introduction to Time Series and Forecasintg. New York:
Springer, 1996.
BROWN, R.G. (1959). Statistical Forecasting for Inventory Control. New York: McGrawHill, 1959.
CALOBA, G. M.; CALOBA, L. P.; SALIBY, E. (2002). Cooperao entre redes neurais
artificiais e tcnicas 'clssicas' para previso de demanda de uma srie de vendas de cerveja na
Austrlia. Pesqui. Oper. [online]. 2002, vol.22, n.3, pp.345-358.
CHARLESWORTH, M.J. (1956). Aristotles razor. Philosophical Studies, v. 6, p. 105112,
1956.
CLAVERIA, O.; TORRA, S. (2014). Forecasting tourism demand to Catalonia: neural
networks vs. time series models. Economic Modelling, v. 36, p. 220-228, 2014.
CLEVELAND, R. B.; CLEVELAND, W. S.; McRAE, J.E.; TERPENNING, I. (1990). STL:
A Seasonal-Trend Decomposition Procedure Based on Loess. Journal of Official Statistics,
v.6, p.373, 1990.
COWPERTWAIT, P.S.P.; METCALFE, A.V. Introductory Time Series with R. New York:
Springer, 2009.
CROSTON, J. D. (1972). Forecasting and stock control for intermittent demands. Operational
52

Research Quarterly, v. 23, p.289303, 2972.


CRYER, J. D.; CHAN, K. S. Time Series Analysis with Applications in R. New York:
Springer, 2008.
CUI, W.; GUO, D. Vehicle delay series forecast based on trajectories of GPS tracked cabs. In:
23rd International Conference on Geoinformatics, 2015.
DIEBOLD, F.X. (2015). Forecasting in Economics, Business, Finance and Beyond.
Department
of
Economics,
University
of
Pennsylvania,
http://www.ssc.upenn.edu/~fdiebold/Textbooks.html.
DOMINGUES, J. S.; GONALVES, M. C.; BRAZ, S. C.; PEREIRA, F. J. Usando splines
cbicas na modelagem matemtica da evoluo populacional de Pirapora/MG. ForScience, v.
2(1):17-30, 2014a.
GARDNER, E. S. (1985). Exponential Smoothing: The state of the art. Journal of Forecasting,
v. 4, p. 1-28, 1985.
GRAEFE, A.; KCHENHOFF, H.; STIERLE, V.; RIEDL, B. (2015). Limitations of
ensemble Bayesian model averaging for forecasting social science problems. International
Journal of Forecasting, v. 31, p. 943-951, 2015.
GREEN, K. C.; ARMSTRONG, J. S. (2015). Simple versus complex forecasting: the
evidence. Journal of Business Research, v. 68, p. 1678-1685, 2015.
HARVEY, A. C.; PETERS, S. (1990). Estimation Procedures for Structural Time Series
Models. Journal of Forecasting, v. 9, p. 89-108, 1990.
HOLT, C.C. (1957). Forecasting seasonals and trends by exponentially weighted moving
averages. ONR Memorandum (Vol. 52), Pittsburgh, PA: Carnegie Institute of Technology.
HYNDMAN, R. J.; KHANDAKAR, Y. (2008). Automatic time series forecasting: the
forecast package. Journal of Statistical Software, v.26, p.1-22, 2008.
HYNDMAN, R. J.; KING, M. L.; PITRUN, I.; BILLAH, B. (2005). Local linear forecasts
using cubic smoothing splines. Australian and New Zealand Journal of Statistics, v. 47, p. 8799, 2005.
HYNDMAN, R. J.; KOEHLER, A. B.; SNYDER, R. D.; GROSE, S. (2002). A state space
framework for automatic forecasting using exponential smoothing methods. International
Journal of Forecasting, v. 18, p. 439454, 2002.
HYNDMAN, R.J., ATHANASOPOULOS, G. (2012) Forecasting: principles and practice.
53

http://otexts.org/fpp/. Acessado em 01 de Novembro de 2016.

KAASTRA, I.; BOYD, M. (1996). Designing a neural network for forecasting financial and
economic time series. Neurocomputing, v. 10, p. 215-236, 1996.
KOENIG, A. Previso de demanda em sries temporais intermitentes mediante a utilizao do
mtodo de Croston. 2014. Dissertao (Mestrado em Engenharia de Produo) Universidade
Federal de Santa Catarina, Florianpolis, 2014.
Lawrence, M.; GOODWIN, P., OCONNOR, M.; ONKAL, D. (2006). Judgmental
forecasting: a review of progress over the last 25 years. International Journal of Forecasting,
v.22, p.493-518, 2006.
LEE, C. K.; SONG, H. J.; MJELDE, J. W. (2008). The forecasting of International Expo
tourism using quantitative and qualitative techniques. Tourism Management, v.29, p.10841098, 2008.
LIMA, F. J. L. Previso de irradiao solar no nordeste do Brasil empregando o modelo WRF
ajustado por redes neurais artificiais (RNAs). 2015. Tese (Doutorado em Meteorologia)
Instituto Nacional de Pesquisas Espaciais (INPE), So Jos dos Campos, 2015.
LIVERA, A. M.; HYNDMAN, R. J.; SNYDER, R. D. (2010). Forecasting Time Series With
Complex Seasonal Patterns Using Exponential Smoothing. Journal of the American Statistical
Association v.106, p. 1513-1527, 2010.
MAKRIDAKIS, S.; WHEELWRIGHT, S. C.; HYNDMAN, R. J. Forecasting: Methods and
Applications. New York: Wiley, 1997.
PEREIRA, L. N. (2016). An introduction to helpful forecasting methods for hotel revenue
management. International Journal of Hospitality Management, v. 58, p. 13-23, 2016.
R Core Team (2016). R: A language and environment for statistical computing. R Foundation
for Statistical Computing, Vienna, Austria. Disponvel em <https://www.R-project.org/>.
Acesso em 30 de nov. de 2016.
ROSSUM, G. van. Python tutorial, Technical Report CS-R9526, Centrum voor Wiskunde en
Informatica (CWI), Amsterdam, 1995.
ROUDIER, P.; DUCHARNE, A.; FEYEN, L. Climate change impacts on runoff in West
Africa: a review. Hydrol. Earth Syst. Sci., 18, 27892801, 2014.
SCHNAARS, S.P. (1984). Situational factors affecting forecast accuracy. Journal of
Marketing Research, v. 21, p. 290297, 1984.
54

SILVA, M. A. V. da; D'AGOSTO, M. de A. Modelo de previso de oferta e demanda de


bioetanol hidratado para apoio ao planejamento estratgico de transportes no Brasil. J. Transp.
Lit., Manaus, v. 7, n. 3, p. 214-239, 2013.
SOYER, E.; HOGARTH, R. (2012). Illusion of predictability: How regressions statistics
mislead experts. International Journal of Forecasting, v. 28, v. 695711, 2012.
TAYLOR, J. W. (2003). Short-term electricity demand forecasting using double
seasonal exponential smoothing. Journal of Operational Research Society, v. 54, p. 799-805.
THEODOSIOU, M. (2011). Forecasting monthly and quarterly time series using STL
decomposition. International Journal of Forecasting, v. 27, p.1178-1195, 2011.
WHEELWRIGHT, S.; MAKRIDAKIS, S. Forecasting Methods for Management. New York:
Wiley, 1985.
WINTERS, P.R. (1960). Forecasting sales by exponentially weighted moving averages.
Management Science, v. 6, p. 324-342, 1960.
ZELLNER, A. (2001). Keep it sophisticatedly simple. Cambridge: Cambridge University
Press, 2001.

55

APNDICE A CDIGO DO SISTEMA CRIADO


apply_selected_model <- function(x, model_name, horizon) {
available_models <- available_models()
if (!(model_name %in% available_models)) stop("Your model is not available. Please run
avaiableModels() to see the list of available models")
# former aplicarMelhorModelo()
switch(model_name,
"auto.arima" = auto.arima(x, ic='aicc', stepwise=FALSE), # 1
"ets" = ets(x, ic='aicc', restrict=FALSE, opt.crit = "mae"), #2
"nnetar" = nnetar(x, p=12, size=12, repeats = 24), # 3
"tbats" = tbats(x, ic='aicc', seasonal.periods=12), # 4
"bats" = bats(x, ic='aicc', seasonal.periods=12), # 5
"stlm_ets" = stlm(x, s.window=12, ic='aicc', robust=TRUE, method='ets'), # 6
"stlm_arima" = stlm(x, s.window=12, ic='aicc', robust=TRUE, method='arima'), # 7
"StructTS" = StructTS(x), #8
"meanf" = meanf(x, h = horizon), #9
"naive" = naive(x, h = horizon), #10
"snaive" = snaive(x, h = horizon), #11
"rwf" = rwf(x, h = horizon), #12
"rwf_drift" = rwf(x, drift = TRUE, h = horizon), #13 ### NOVO
"splinef" = splinef(x, h = horizon), #14
"thetaf" = thetaf(x, h = horizon), #15
"croston" = croston(x, h = horizon), #16
"tslm" = tslm(x ~ trend + season), #17
"hybrid" = forecastHybrid::hybridModel(x) #18
)
}
apply_all_models <- function(x, horizon) {
# former aplicarTodosModelos
mods <- available_models()
models <- list() # initiates empty list to be filled by forecast models

for (i in 1:length(mods)) {
mod <- mods[i]
fit <- try(apply_selected_model(x, mod, horizon), silent = TRUE)
if (!inherits(fit, "try-error")) models[[i]] <- fit
}
return(models)
}
select_forecast <- function(x, test_size, horizon, error) {
# Checks if defined error metric is available
error_metrics <- error_metrics()
if (!(error %in% error_metrics)) stop("Your error metric is not available. Please run error_metrics() to
see the list of available metrics.")
x_split <- CombMSC::splitTrainTest(x, length(x) - test_size)

56

training <- x_split$train


test <- x_split$test
models_list <- apply_all_models(training, horizon = test_size)
available_models <- available_models()
num <- length(available_models)
# Apply forecast() function to created models
# some error handling:
# for each element in model_list, if the model was not created (model_list[i] == NULL),
# it replaces the element with a too big numeric vector of the same
# characteristics as the test set.
# This procedure, of course, needs to be improved, but it does the work for now.
forecasts <- lapply(models_list, function(i) tryCatch({forecast(i, h = test_size)},
error = function(e) {
x <- rep(1e9, test_size)
x <- ts(x, start = start(test) - test_size/12,
frequency = frequency(test))
x <- naive(x)
x <- forecast(x, h = test_size)
return(x)}))
# measures the accuracy of all forecast models against the test set
acc <- lapply(forecasts, function(f) accuracy(f, test)[2,,drop=FALSE])
# remove Theil's U (in case it exists) from matrix
removeTheil <- function(mat) {
rows <- rownames(mat)
cols <- colnames(mat)[1:7]
m <- matrix(mat[,1:7], ncol = 7)
rownames(m) <- rows
colnames(m) <- cols
return(m)
}

acc <- lapply(acc, removeTheil)


acc <- Reduce(rbind, acc)
row.names(acc) <- NULL
acc <- as.data.frame(acc)
# Adds a column to acc to indicate the model name of the forecast row.
# Depending the characteristics of the time series object, the hybridModel()
# outputs nothing, which makes acc object have 17 instead of 18 rows.
# Therefore, the line below is necessary to handle this situation
acc$model <- if (nrow(acc) == 18) available_models else available_models[-18]
# Selects row of minimum error. In case the error defined is MAPE and the
# time series is intermitent, the MAPE might be Inf. To handle this, if MAPE
# is Inf in all columns, it uses MAE as the error metric to select the best
# forecast model.
acc <- na.omit(acc) # some times stlm models produces NA.
rownames(acc) <- seq(1, nrow(acc), 1) # fixes na.omit() bug with rownames
ind_best_model
<if
(mean(acc[[error]])
!=
Inf)
which.min(acc[[error]])

57

else

which.min(acc[["MAE"]])
best_model_name <- acc$model[ind_best_model]
acc$best_model <- best_model_name
# Applys apply_selected_model using the best forecast model from the previous lines
best_forecast <- forecast(apply_selected_model(x, best_model_name, horizon), h = horizon)
best_training_forecast <- apply_selected_model(training, best_model_name, horizon = test_size)
best_training_forecast <- forecast(best_training_forecast, h = test_size)

### ===============
# creates data.frame to output the forecast from the best model
df_comparison <- data.frame(
time = Epi::as.Date.cal.yr(time(test)),
forecasted = as.numeric(best_training_forecast$mean)[1:test_size],
observed = as.numeric(test)
)
return(
list(
df_models = acc,
best_forecast = best_forecast,
df_comparison = df_comparison)
)

58

APNDICE B AJUSTE DE MODELOS NA SRIE TEMPORAL DO


PRODUTO P001
Figura 10 - Ajuste e previso obtidos pelo mtodo ARIMA

Fonte: Autoria prpria


Figura 11 Ajuste e previso obtidos pelo mtodo de suavizao exponencial

Fonte: Autoria prpria

59

Figura 12 Ajuste e previso obtidos pelo mtodo de redes neurais

Fonte: Autoria prpria.


Figura 13 - Ajuste e previso obtidos pelo mtodo TBATS

Fonte: Autoria prpria.

60

Figura 14 - Ajuste e previso obtidos pelo mtodo BATS

Fonte: Autoria prpria

Figura 15 Ajuste e previso obtidos pelo modelo estrutural

Fonte: Autoria prpria.

61

Figura 16 Ajuste e previso obtidos pelo modelo da mdia simples

Fonte: Autoria prpria.


Figura 17 Ajuste e previso obtidos pelo modelo ingnuo.

Fonte: Autoria prpria.

62

Figura 18 Ajuste e previso obtidos pelo modelo sazonal ingnuo.

Fonte: Autoria prpria.


Figura 19 Ajuste e previso obtidos pelo modelo do passeio aleatrio

Fonte: Autoria prpria

63

Figura 20 Ajuste e previso obtidos pelo modelo do passeio aleatrio com deriva

Fonte: Autoria prpria


Figura 21 Ajuste e previso obtidos pelo modelo das splines cbicas.

Fonte: Autoria prpria.

64

Figura 22 Ajuste e previso obtidos pelo modelo Theta

Fonte: Autoria prpria.

Figura 23 - Ajuste e previso obtidos pelo modelo Croston

Fonte: Autoria prpria.

65

Figura 24 - Ajuste e previso obtidos pelo modelo de regresso

Fonte: Autoria prpria.

Figura 25 - Ajuste e previso obtidos pelo modelo hbrido

Fonte: Autoria prpria.

66