Você está na página 1de 20

Machine Translated by Google

Neurocomputação 548 (2023) 126376

Listas de conteúdos disponíveis em ScienceDirect

Neurocomputação

página inicial da revista: www.elsevier.com/locate/neucom

Explorando a associação entre recursos de séries temporais e previsão por


agregação temporal usando aprendizado de máquina
Bahman Rostami-Tabar a,ÿ , Dejan Mircético b,1
a
Cardiff Business School, 3 Colum Drive, CF10 3EU Cardif, Reino Unido
b
Instituto de Pesquisa e Desenvolvimento de Inteligência Artificial da Sérvia, Fruskogorska 1, 21000 Novi Sad, Sérvia

informações do artigo abstrato

Historia do artigo: Quando é necessária uma previsão do valor total ao longo de vários períodos de tempo futuros, os previsores recebem duas
Recebido em 28 de junho de 2022
abordagens de agregação temporal (TA) para produzir as previsões necessárias: i) previsão agregada (AF) ou ii) dados
Revisado em 28 de fevereiro de 2023
agregados usando agregação temporal não sobreposta ( DE ANÚNCIOS). Muitas vezes, a recomendação é agregar dados a
Aceito em 22 de maio de 2023
uma frequência relevante para a decisão que a eventual previsão irá apoiar e depois produzir a previsão. No entanto, esta pode
Disponível on-line em 30 de maio de 2023
Comunicado por Zidong Wang
nem sempre ser a melhor escolha e argumentamos que ambas as abordagens AF e AD podem superar-se em diferentes
situações. Além disso, faltam evidências sobre quais indicadores podem determinar a superioridade de cada abordagem.
Projetamos e executamos uma estrutura experimental empírica para primeiro explorar o desempenho dessas abordagens usando
Palavras-chave:

Agregação Temporal
séries temporais mensais do conjunto de dados de competição M4. Além disso, transformamos o problema em uma aprendizagem
Previsão supervisionada de classificação, construindo um banco de dados que consiste em características de cada série temporal como
Recursos de série temporal preditor e classe de modelo rotulada como AF/AD como resposta/resultado. Em seguida, construímos algoritmos de aprendizado
Suavização Exponencial de máquina para investigar a associação entre recursos de séries temporais e o desempenho de AF e AD. Nossas descobertas
Aprendizado de máquina sugerem que as abordagens AF e AD podem não gerar resultados precisos de forma consistente para cada série individual. AF
Floresta Aleatória
mostra-se significativamente melhor que AD para a série temporal mensal M4, especialmente para horizontes mais longos.
Classificação
Competição M4
Construímos várias abordagens de aprendizado de máquina usando um conjunto de recursos extraídos de séries temporais
como entrada para prever com precisão se AD ou AF devem ser usados. Descobrimos que Random Forest (RF) é a abordagem
mais precisa para classificar corretamente o resultado avaliado tanto por medidas estatísticas como erro de classificação
incorreta, estatísticas F, área sob a curva e uma medida de utilidade. A abordagem RF revela que curvatura, não linearidade,
seas_pacf, unitroot_pp, média, ARCHM.LM, coeficiente de variação, estabilidade, linearidade e max_level_shif estão entre os
recursos mais importantes na condução das previsões do modelo.
Nossas descobertas indicam que a força da tendência, ARCH.LM, hurst, autocorrelação lag 1, unitroot_pp e seas_pacf podem
favorecer a abordagem AF, enquanto granulação, entropia, não linearidade, curvatura e força da sazonalidade podem aumentar
a chance de desempenho melhor do AD. Concluímos o estudo resumindo os resultados e apresentando uma agenda para
futuras pesquisas.
2023 O(s) Autor(es). Publicado por Elsevier BV Este é um artigo de acesso aberto sob a licença CC
BY (http://creativecommons.org/licenses/by/4.0/).

1. Introdução Uma suposição comum na previsão de séries temporais é que a granularidade da


série temporal corresponde aos requisitos de previsão, ou seja, para produzir previsões
A previsão de séries temporais tem sido usada há muitas décadas para informar diárias, usamos séries temporais diárias. No entanto, o nível de granularidade das
decisões em vários setores, como negócios, finanças, economia, cadeia de séries temporais não corresponde necessariamente ao nível de granularidade das
suprimentos e saúde [35]. Com os avanços na tecnologia, os dados muitas vezes previsões, impulsionado pelo processo de tomada de decisão. Na verdade, na prática,
podem ser coletados no momento da transação ou serviço. , por exemplo, horários de o nível de granularidade temporal nos requisitos de previsão é muitas vezes inferior
chegada de chamadas em um call center, pontos de vendas no varejo ou incidentes à granularidade das séries temporais existentes. Por exemplo, embora possa ser
atendidos em um serviço de ambulância. Em bancos de dados eletrônicos, os dados necessária uma previsão a nível anual (diário), a série temporal está disponível a nível
temporais são geralmente armazenados em um único nível de granularidade. mensal (por hora). Reconhecemos também que poderá haver casos em que a
granularidade das previsões seja superior à das séries existentes; no entanto, isto
requer a introdução de um mecanismo de desagregação e não é abordado neste
ÿ Autor correspondente.
estudo.
Endereços de e-mail: rostami-tabarb@cardiff.ac.uk (B. Rostami-Tabar), dejan. mircetic@ivi.ac.rs (D.
Geralmente, o nível de granularidade da previsão e o seu horizonte são
Mircético).
1 determinados por decisões tomadas à luz das previsões. Nesse artigo,
Contribuição igual

https://doi.org/10.1016/j.neucom.2023.126376 0925-2312/
2023 O(s) Autor(es). Publicado por Elsevier BV
Este é um artigo de acesso aberto sob a licença CC BY (http://creativecommons.org/licenses/by/4.0/).
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

consideramos uma situação em que uma série temporal original tem um valor mais alto turs. Para isso, utilizamos 48.000 séries temporais do mês
granularidade temporal (por exemplo, mensal) do que a previsão exigida (por exemplo Conjunto de dados de competição M4. Primeiro, examinamos como as características de
anual). Nosso objetivo é gerar uma previsão do valor total ao longo de vários períodos mudanças de séries temporais passando de uma alta granularidade (por exemplo, mensalmente)
de tempo futuros, o que é referido como agregação do horizonte de previsão [30] ou para um nível de baixa granularidade (por exemplo, anual). Construímos então a máquina
previsão ao longo do período de lead time [42]. modelos de aprendizagem para descrever a associação entre o original
A produção de uma previsão agregada ao longo de vários períodos é necessária recursos de séries temporais e o desempenho de previsão de temporais
em muitas situações para informar decisões sobre planejamento de capacidade, abordagens de agregação. A seguir, usamos os resultados dos modelos para descobrir
gerenciamento de estoque, logística, compras e outros. quais recursos são críticos para prever com precisão o desempenho de AF e AD, seguido
[32,48]. Por exemplo, muitas vezes é necessário gerar uma previsão para todo o período por uma interpretação dos recursos associados ao desempenho da previsão. Isto pode
de entrega para determinar o nível de estoque de segurança. nos ajudar a
na gestão de estoques. Em um pronto-socorro, enquanto o fornecer recomendações aos previsores e tomadores de decisão sobre
séries históricas de admissão por hora estão disponíveis, previsões diárias podem ser qual abordagem usar.
necessárias para escalação, enquanto previsões trimestrais Os objetivos da pesquisa são os seguintes:
pode ser útil para o planejamento de recursos [37]. Numa cadeia de abastecimento, as
previsões anuais podem ser usadas para decisões de aquisição e orçamento, enquanto 1. Medimos 42 características da série temporal no nível original
as séries temporais podem estar disponíveis mensalmente. (por exemplo, mensalmente) e em vários níveis de agregação temporal
granularidade [29]. (por exemplo, trimestral, anual) usando a competição mensal M4
Uma questão-chave a ser respondida é: a hora original deveria conjunto de dados.

ser usada para gerar a previsão para o horizonte requerido e 2. Revelamos como os recursos da série temporal mudam à medida que agregamos
em seguida, some-os para obter a previsão ao longo dos períodos de tempo (lead time), dados de alta frequência (por exemplo, mensalmente) a baixa frequência (por exemplo,
ou seja, Previsão Agregada (AF), ou devemos primeiro agregar anual).
a série temporal para corresponder à granularidade do requisito de previsão 3. Avaliamos o desempenho da precisão da previsão das abordagens AD e AF para as
e então extrapolar diretamente nesse nível, ou seja, dados agregados previsões geradas pelo Exponencial
(DE ANÚNCIOS). Isto foi ilustrado na Fig . Modelo de suavização de espaço de estados (ETS).
Para o último, frequentemente usamos a abordagem de agregação temporal não 4. Construímos modelos de aprendizado de máquina usando recursos de série temporal como
sobreposta (NOTA). Usando esta abordagem, a série original é dividida em um intervalo preditores para prever com precisão qual abordagem (ou seja, AD ou AF)
de tempo consecutivo e não sobreposto, tem melhor desempenho.
começando do período mais recente para trás. O tamanho do 5. Examinamos a associação entre características de séries temporais e
bucket é igual ao número de períodos de tempo necessários na previsão, que é referido o desempenho de previsão dessas abordagens.
como nível de agregação, m. A série agregada é então criada somando os valores
dentro de cada O restante do artigo está organizado da seguinte forma: a seção 2 fornece uma
balde. O número de observações agregadas é ½ N=m , onde N breve visão geral do uso de agregação temporal em séries temporais
é o número de períodos, e o operador ½ x retorna o número inteiro previsão. A seção 3 descreve o desenho do experimento empírico,
parte de x [40]. Quando agregamos dados para domínios de frequência mais baixa, abordagens de previsão, métodos e métricas de precisão de previsão. A seção 4
como anual, usando NOTA, perdemos algumas informações descreve os recursos da série temporal e apresenta as séries temporais
e a AD está perdendo um pouco da sensibilidade em comparação com a AF. AF recursos para conjunto de dados de competição mensal M4, seguido de análise
pode capturar melhor informações detalhadas na frequência mais alta como a agregação temporal não sobreposta afeta os recursos da série temporal. Em
resultando em melhor precisão. No entanto, isso também pode ser afetado seguida, examinamos o desempenho de previsão de AD e AF
por horizonte de previsão, já que o uso de AF pode não ser útil ao prever um futuro abordagens. A seção 5 apresenta algoritmos de aprendizado de máquina e
muito distante. seu desempenho na classificação precisa do desempenho do AD
Existem alguns estudos que investigam esta questão ao considerar a previsão em e AF para uma determinada série temporal e suas características. A seção 6 apresenta
um único nível de agregação [38,39,24] ou os recursos importantes e sua conexão com o desempenho
combinações de previsão usando vários níveis de agregação temporal de abordagens de agregação temporal. A Seção 7 fornece conclusões
[23] ou hierarquias temporais [2]. Essas abordagens foram aplicadas [32,33] tanto em observações e uma agenda para pesquisas futuras.
demanda intermitente [31] quanto em demanda rápida.
contextos de demanda [2].
A conclusão geral é que tanto as abordagens de previsão agregada como de dados 2. Contexto da investigação
agregados podem superar-se mutuamente. Seu desempenho pode depender da
presença da autocorrelação no Na prática, uma série temporal é geralmente armazenada em um único nível de
série original, nível de agregação, horizonte de previsão e método de previsão empregado granularidade do tempo. Quando a série temporal está disponível em um nível superior
(ver, por exemplo, Boylan e Babai [6]; de granularidade (por exemplo, de hora em hora), muitas vezes espera-se que gere uma
Rostami-Tabar et al. [41]; Rostami-Tabar et al. [39]; Nikolopoulos previsão em um nível de granularidade mais baixo (por exemplo, diariamente) durante vários
e outros. [32]). Devemos observar que este estudo se aplica apenas ao caso períodos de tempo. Portanto, uma previsão do valor total ao longo de vários períodos de tempo
de um único nível de agregação, podemos estender este estudo para examinar o caso períodos futuros (isto é, nível de agregação). Nestas situações, uma opção óbvia, muitas
do uso de múltiplos níveis de agregação, hierarquias temporais ou previsão de múltiplos vezes recomendada na prática [11],
resultados no futuro. seria primeiro transformar a série temporal de maior granularidade em
Apesar dos recentes desenvolvimentos nesta área, ainda falta a granularidade mais baixa que corresponde ao requisito de previsão, e
indicação sobre qual abordagem de agregação temporal deve ser em seguida, produza a previsão. A transformação geralmente é realizada usando
usado para prever uma série temporal, dadas as suas características. Para nosso conhecimento, agregação temporal não sobreposta. Outra abordagem é agregar previsões em vez de
este é o primeiro estudo que explora a associação entre o tempo dados. Nesse caso, nós
características das séries e o desempenho do modelo no contexto da previsão por primeiro produza previsões básicas usando séries temporais granulares mais altas
agregação temporal (TA). A necessidade de tal pesquisa para o horizonte de previsão (ou seja, vários períodos à frente) e depois agregá-los.
também foi enfatizado por Babai et al. [4] em um artigo de revisão. Esse
estudo contribui para a área de previsão de séries temporais e pretende A aplicação da abordagem NOTA na previsão de séries temporais tem
para esclarecer como o desempenho das abordagens de agregação temporal (ou seja, foi inicialmente estudado na literatura econométrica. Eles avaliaram
tanto AF quanto AD) está associado a características de séries temporais. como NOTA pode alterar a estrutura do Autoregressivo Integrado

2
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 1. Previsão agregada vs. abordagens de dados agregados. Supondo que uma série temporal mensal esteja disponível e seja necessária uma previsão para um trimestre (nível de agregação = 3 meses).
Primeiro geramos previsões para 3 períodos futuros e depois as somamos para criar previsões ao longo do trimestre (previsão por abordagem AF). Em seguida, criamos o agregado temporalmente
série dividindo a série original no bloco de 3 períodos. A seguir, fazemos previsão para 1 período à frente (Previsão pela abordagem AD).

Processos de média móvel (ARIMA) [46,36]. Esta literatura está em descobriu que agregar previsões mensais ou trimestrais
favor de dados agregados usando NOTA. Eles mostram que isso leva a ganhos de anual leva a mais melhorias na precisão das previsões do que as previsões anuais
precisão sob a suposição do processo ARIMA e usando um geradas a partir da série anual NOTA. Usando séries temporais de pedidos e pontos
previsão média condicional ótima. de venda em uma cadeia de suprimentos de varejo, Jin et al. [20]
Rostami-Tabar et al. [38,39] exploraram ainda mais analiticamente o efeito do avaliou os benefícios do NOTA para a precisão das previsões. Eles encontraram
NOTA no desempenho da previsão tanto no horizonte de previsão agregado (tempo que NOTA leva a previsões mais precisas quando a autocorrelação das séries
de entrega) quanto no nível desagregado usando a média. temporais não é altamente positiva. Em um estudo onde um alto
Erro quadrático (MSE). Eles assumem que Exponencial Único série temporal de frequência é usada, Luna e Ballini [26] mostraram que
O método de previsão de suavização (SES) é aplicado a um ARIMA(1,1) na previsão diária de saques em dinheiro, NOTA resulta em resultados semelhantes ou
série temporal. Eles determinam as condições sob as quais o agregado previsão mais precisa do que usar séries horárias.
os dados superam a abordagem de previsão agregada. Eles mostram isso Alguns estudos investigaram os benefícios da produção de previsões utilizando
a superioridade de cada abordagem depende dos parâmetros do processo que estão múltiplas séries temporais resultantes da abordagem NOTA, correspondendo a
afetando as características da série temporal, parâmetros do múltiplos níveis de agregação. As previsões são
método de previsão e níveis de agregação. Eles concluíram que gerado em cada nível e depois combinado para obter o necessário
NOTA tem melhor desempenho quando a autocorrelação não é altamente positiva. previsão. Kourentzes et al. [23] recomendado o uso de vários níveis
Em contraste, eles mostram que a autocorrelação positiva elevada como um dos de agregação e combinação das previsões separadas (MAPA). Vários estudos em
as principais características das séries temporais, favorece a abordagem AF. Rostami-Tabar previsão de séries temporais intermitentes, promocionais
e outros. [40] avaliaram o impacto do NOTA na previsão de demanda modelagem e gestão de estoque destacaram o ganho do uso
e pedidos em uma cadeia de suprimentos. Eles assumem que o tempo de demanda múltiplos níveis de TA [33,22,5]. Athanasopoulos et al. [2] proposto
série segue um ARMA (1,1), a política de estoque é ordem acima do nível Previsão de Hierarquias Temporais (THieF), que cria vários
e a previsão ideal é usada para produzir previsões. Eles mostraram séries agregadas temporalmente usando NOTA, geram previsões e
que embora a NOTA não conduza a uma melhoria da precisão em seguida, reconcilia-os para obter a previsão necessária.
em termos de MPE ao nível do retalhista, no entanto, pode levar a MSE Uma série de pesquisas investiga o uso de recursos na previsão de séries
redução ao nível do fabricante e redução do efeito chicote. Mohammadipour e Boylan temporais com base em múltiplos espaços de frequência de tempo em gráficos de
[30] também avaliaram analiticamente o efeito da agregação temporal quando a série visibilidade. Liu et al. [25] propuseram uma frequência de tempo múltipla
temporal modelo de previsão de intervalo difuso de espaços usando conjuntos de dados de energia
o processo é média móvel autoregressiva inteira, INARMA (p; q), e finanças. A série original é decomposta em diferentes componentes, que são então
processos. Eles demonstraram que os dados agregados levam a menores usados para reconstruir um grupo de séries temporais.
MSE comparado à abordagem de previsão agregada quando o valor de em diferentes escalas temporais. A seguir, uma previsão de intervalo de predição é
o parâmetro autorregressivo é alto. gerado para as diferentes séries temporais reconstruídas que são então
O potencial benefício de previsão da AT foi investigado por agregados usando a operação de agregação de média ponderada ordenada induzida
Willemain et al. [47] e Nikolopoulos et al. [32] no contexto para gerar a previsão final. Hu e Xiao [12]
de séries temporais intermitentes. Willemain et al. [47] empiricamente sugeriu um novo modelo de previsão de séries temporais baseado em um novo
compararam a melhoria da precisão da previsão das abordagens AF e AD. Eles similaridade de nós de medição métrica no gráfico de visibilidade. No modelo proposto,
mostraram que a agregação de séries temporais pode levar a a série temporal é primeiro convertida em um gráfico de visibilidade.
previsões mais precisas. Nikolopoulos et al. [32] mostrou que Em seguida, as semelhanças entre os nós são determinadas e, finalmente, as
A abordagem NOTA pode oferecer melhorias consideráveis em termos previsões são geradas usando a distribuição de similaridade normalizada.
de precisão da previsão. Outros estudos [3,34,23,44] confirmaram empiricamente a Hu e Xiao [13] investigaram as características de séries temporais para gerar previsões
previsão e a melhoria do controle de estoque resultou de precisão sob a perspectiva da interação difusa entre nós. Eles usaram um gráfico
da NOTA. Esses estudos cobriram tanto episódios intermitentes quanto rápidos. de visibilidade cognitiva difuso para
série temporal móvel. converta a série temporal em um par de gráficos ponderados direcionados.
Athanasopoulos et al. [1] investigou os benefícios do agregado Em seguida, a similaridade multi-subgrafo ponderada é desenvolvida para calcular a
previsão versus dados agregados em um estudo empírico que consiste em similaridade entre os nós. Eles então propuseram um romance
366 séries mensais e vários métodos de previsão, incluindo método de previsão para previsões de séries temporais com base na distribuição de
modelos de espaço de estados para suavização exponencial (ETS), ARIMA e similaridade difusa que pode capturar com eficiência o espaço-temporal
Teta. As suas conclusões são a favor da agregação de previsões. Eles dependência nos dados da série temporal. Os resultados empíricos

3
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

confirmaram os benefícios de aproveitar a interação difusa para previsão de séries 3.1. Abordagens de previsão
temporais com base nos gráficos de visibilidade.
Embora todas as abordagens, incluindo AF, AD e uso de múltiplos TA Consideramos duas abordagens diferentes para produzir a previsão
níveis demonstraram ganho de previsão, provavelmente nenhum deles agregação de horizonte (ou seja, tempo de entrega). Dado que a hora original
são adequados para serem usados em todas as situações. Quase todos os estudos da a granularidade é mensal, pretendemos gerar previsões para diversos
a literatura relata uma precisão global (por exemplo, média) em vez de uma precisão níveis de agregação que correspondem a 2 meses (m = 2), trimestral (m = 3),
ao nível da série temporal. Argumentamos que algumas características de séries quadrimestral (m = 4), semestral (m = 6) e anual
temporais podem favorecer o uso de uma abordagem específica em detrimento de outras. (m = 12) granularidade de tempo.
Entretanto, não há nenhum estudo na literatura que investigue a A primeira abordagem é agregar previsões (AF). Esta abordagem
associação potencial entre características de séries temporais e temporais primeiro envolve a geração de previsões básicas para m períodos futuros. Base
desempenho da agregação, que é o objetivo principal deste estudo. as previsões são então agregadas para criar previsões no ponto de agregação
nível do horizonte. A principal vantagem da AF é que não há perda de
informações dos dados porque as previsões básicas iniciais são geradas no nível
3. Estrutura do experimento desagregado mais baixo. A abordagem AF pode capturar o
dinâmica das séries de alta frequência; no entanto, eles podem ser barulhentos
Nesta seção, descrevemos o desenho do experimento empírico utilizado neste e difícil de modelar. No caso de séries temporais estacionárias, o AF
estudo. Apresentamos primeiro a estrutura do estudo, abordagem pode produzir uma previsão mais precisa quando a autocorrelação da
em seguida, descreva as abordagens AD e AF e a previsão ETS série de demanda subjacente é altamente positiva [39].
método, seguido pelas métricas de erro de previsão. Por outro lado, há ausência de pesquisas no caso de séries temporais não
A Figura 2 ilustra o enquadramento do desenho experimental realizado neste estacionárias. Portanto, esta pesquisa trata tanto
estudo. A estrutura consiste em várias etapas séries temporais estacionárias e não estacionárias e fornece informações sobre
que são descritos a seguir: a perplexidade das interações entre diferentes fatores que influenciam o desempenho
da abordagem AF.
1. A série temporal mensal original é transformada em temporalmente A segunda abordagem é agregar dados (AD). Esta abordagem
série agregada para um determinado nível de agregação de agregação, m consiste em aplicar a abordagem de agregação temporal não sobreposta à série
2. Um conjunto de recursos é extraído do original e agregado original, utilizando o nível de granularidade temporal para
série temporal. qual a previsão é necessária. Em seguida é realizado o processo de previsão da série
3. O método de previsão do RCLE é aplicado às séries originais para temporalmente agregada para um passo à frente. Os benefícios do AD podem ser
gerar previsão para m períodos. vistos na redução do ruído em
4. As previsões de cada período são somadas para obter a previsão os dados, bem como revelar os padrões mais suaves que existem em
ao longo do horizonte agregado (previsões do AF). as séries. O NOTA da série costuma esclarecer a chave
5. As previsões são geradas usando o modelo ETS para agregação temporal características de séries temporais, que são mais notáveis e claras à medida que
série fechada (previsões do AD). realizamos a agregação aos níveis de granularidade mais baixos (por exemplo, trimestralmente,
6. A precisão da previsão é calculada para cada série. anual).
7. É construída uma base de dados composta por características de séries temporais
e o desempenho das abordagens AF e AD. Série temporal 3.2. Método de previsão
os recursos são usados como entrada (preditores) e a abordagem vencedora
(rotulada como AF ou AD com base na métrica de erro mínimo) cria a variável de Os modelos de espaço de estado de suavização exponencial (ETS) [15] são
resposta. usado para produzir previsões fora da amostra, embora nosso projeto de experimento
8. Vários modelos de aprendizado de máquina (ML) são construídos para seja independente do modelo e possa ser expandido para qualquer
prever a superioridade das abordagens AF/AD usando os dados criados na etapa outro modelo de previsão. O ETS pode capturar tendências, sazonalidade e
7. Esses modelos incluem: 1) Regressão logística (LR), componentes de erro em uma série temporal através de várias formas, como
2) Análise discriminante linear (LDA), 3) Discriminante quadrático como aditivo, multiplicativo ou misto. O ETS é responsável por 18 modelos diferentes
análise (QDA), 4) K-vizinhos mais próximos (KNN), 5) Lasso, 6) Modelo aditivo de suavização exponencial. A exponencial automática
generalizado (GAM), 7) Boosting, 8) Vetor de suporte o modelo de suavização é aplicado usando a função ets() na previsão
Máquina (SVM), 9) Floresta Aleatória (RF), 10) Modelo Google Brain Ten-sorFlow pacote [16] em R para produzir previsões para as séries temporais originais e
(TensorFlow), 11) Aprendizado profundo do Facebook agregadas. Para cada série, ets() identifica o modelo mais preciso usando o Critério
Modelo de tocha baseado em tensores e redes neurais (DL Torch), de Informação de Akaike corrigido
12) aumento de gradiente extremo (XGBoost), 13) neural recorrente (AICc). Usar um método de previsão automática como o ETS é
rede (RNN), 14) rede neural de convolução (CNN), 15) adequado para este estudo, pois podemos assumir que o melhor modelo
rede neural feedforward (FNN) e 16) Tempo Dinâmico é selecionado para cada série e isso pode ajudar a separar o efeito do método de
Deformação (DTW). Os pesquisadores são encaminhados para James et al. [19] previsão aplicado das abordagens de AT (ou seja,
para uma descrição detalhada de algumas dessas abordagens. AF e AD).

Dado o desempenho superior de RF entre todos os modelos utilizados neste 3.3. Medidas de precisão de previsão
estudo, iremos descrevê-lo com mais detalhes na Seção 5. O modelo
pode nos ajudar a identificar os recursos de série temporal mais importantes que Neste experimento, a avaliação da precisão da previsão é necessária em
levar ao desempenho superior de RF. Além disso, também pode revelar como duas etapas diferentes. Primeiro usamos uma métrica de erro (por exemplo, Root Mean
os recursos de série temporal estão conectados ao desempenho de AD e AF. Squared Scaled Error) para quantificar a precisão da previsão de AF e
Devido às restrições da página, detalhes sobre a configuração inicial, AD na geração de previsão de série temporal ao longo do prazo de entrega para cada tempo
método de otimização e função de custo desses algoritmos são série e método ETS. Consideramos os conjuntos dentro e fora da amostra nas séries
não apresentado no artigo. Devemos observar que conduzimos um estudo abrangente temporais mensais da competição M4. Aplicamos o
e procuramos configurações ideais de cada método ETS para cada série no conjunto de dados da amostra e manter seus
modelo em vez de usar modelos de ML automáticos. Informações adicionais sobre a previsão para fora da amostra usando validação cruzada de série temporal
configuração dos modelos podem ser encontradas no Apêndice ou em com reestimativa. O horizonte de previsão para a série temporal original
o repositório GitHub. é igual a m, o nível de agregação e o horizonte para

4
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 2. Desenho da estrutura do experimento.

série agregada não sobreposta é uma delas. Calculamos então o onde ej é o erro de previsão, a diferença entre um valor observado
erros de previsão durante o período de teste de cada série temporal. Avaliar valor e sua previsão. yt é um valor observado no período t; T é o
a precisão e o viés da previsão, várias medidas, incluindo Root duração da série temporal, e m é a duração sazonal (por exemplo, para
Erro Quadrático Médio (RMSE), Erro Médio Absoluto (MAE) e Média m = 12. Para dados não sazonais, m = 1.
Erro (ME), erro percentual médio absoluto (MAPE), erro médio absoluto escalonado Em segundo lugar, precisamos relatar a precisão com que um modelo de classificação
(MASE) e raiz média quadrada do erro escalonado prevê o resultado (ou seja, a abordagem mais precisa rotulada como AF
(RMSSE) são usados. Apresentamos apenas os resultados para RMSSE devido a e AD), quando apresentado com um conjunto de características de séries temporais no
o limite de espaço da revista e também por ser a métrica de erro recomendada na série original. Para esse fim, relatamos várias medidas estatísticas
competição M5 [28]. Compartilhamos o código R incluindo erro de classificação incorreta, estatísticas F e área sob o
e o arquivo Rmarkdown através do repositório GitHub, que fornece a possibilidade de curva (AUC).
alterar a métrica de erro na seção YAML do Rmarkdown para obter resultados para outras O erro de classificação incorreta é calculado da seguinte forma:
métricas. Nós
tp + tn
também devemos observar que conclusões semelhantes são alcançadas quando se utiliza Erro de classificação incorreta ¼ 100% 1 ;
N
outras métricas de precisão.
RMSSE é dado por:
onde N é o número total de casos a serem previstos, tp é o verdadeiro positivo
(ou seja, quando o modelo prevê corretamente o desempenho superior de
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff

RMSSE ¼ significa q2 ; abordagem AF sobre AD) e tn é verdadeiro negativo (ou seja, quando o modelo
jr _
prevê corretamente o desempenho inferior da abordagem AF em relação ao AD).
onde A estatística F é definida como:

e2 tp= tp + f tp= tp þ f þ n
j p
q2
j
¼
; Festatísticas ¼ 2 100%
1 2 tp= tp + f p tp= tp þ f n;
Tm XT ð Þ yt ytm
t¼mþ1
Onde f p é falso positivo e f n é falso negativo.

5
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

A taxa de falsos positivos representa a fração de casos em que 4. Dados de séries temporais, características e agregação temporal
AD foi classificado incorretamente como um modelo certo para usar, enquanto o AF desempenho
era o correto. Da mesma forma, a taxa de falsos negativos representa
a fração de casos em que a FA foi classificada incorretamente como Nesta seção, primeiro apresentamos os recursos extraídos para cada
modelo certo para usar, enquanto AD era o correto. série temporal. Em seguida, traçamos a distribuição desses recursos para o conjunto
Também podemos ilustrar a compensação entre falsos positivos e de dados mensal da competição M4. Então, exploramos
verdadeiros positivos usando uma curva. Ela é chamada de curva característica de como a agregação temporal não sobreposta altera essas características. Finalmente,
operação do receptor, ou curva ROC [19]. A curva ROC é um gráfico do verdadeiro discutimos o desempenho de previsão do AD e
taxa positiva (tp, sensibilidade) versus a taxa de falsos positivos (f p,1- AF aplicado ao conjunto de dados M4 mensal.
especificidade) para um conjunto de limites. Podemos quantificar isso calculando a
área sob a curva, ou AUC. Quanto maior a AUC, melhor será 4.1. Recursos de série temporal
modelo faz nas previsões. O valor máximo de AUC é 1, o que
seria considerada uma previsão perfeita. Por outro lado, um modelo A Tabela 1 apresenta a descrição dos recursos utilizados neste estudo.
que não tenha um desempenho melhor do que o acaso terá uma AUC de 0,5 e Para cada série temporal (original ou agregada), calculamos um conjunto de
seria considerado pobre. medidas a partir dos dados de treinamento. Esses recursos também são descritos
Além das medidas estatísticas discutidas acima, também em detalhes por Wang et al. [45], Hyndman et al. [17] e Hyndman
realizar a avaliação de utilidade de diferentes modelos. A métrica de utilidade e Athanasopoulos [15].
aproxima os custos e benefícios da classificação errada e correta. Para tanto, o erro Dada a complexidade da relação entre as características da série temporal e o
médio RMSSE é utilizado como utilitário desempenho das abordagens de agregação temporal, consideramos todas as 42
métrica.
características como preditoras, em vez de
Para avaliar a precisão da previsão dos modelos, dividimos os dados do que usar apenas um número limitado de recursos conhecidos pelos usuários
criado na etapa 7 da Seção 3 em um conjunto de treinamento e teste. como a força da tendência ou sazonalidade, para desenvolver uma estimativa precisa
Para tanto, dividimos aleatoriamente os dados no conjunto de treinamento e teste modelo de previsão. Usar um número reduzido de recursos selecionados com base
em uma divisão de 70=30%. Os dados do trem (33.600 casos) são usados para treinamento em sua interpretabilidade ou usar técnicas de redução dimensional pode reduzir o
algoritmos diferentes, enquanto os dados de teste (14.400 casos) são usados para poder de previsibilidade do
avaliar o desempenho dos modelos. modelo, mas este pode ser um caminho interessante para pesquisas futuras.

tabela 1
Características da série temporal consideradas neste estudo e suas descrições

Recurso Descrição

significar Significar

var Variância
cv Coeficiente de variação
Força da tendência, um valor próximo de 1 indica séries com alta tendência
tendência sazonal_força Força da sazonalidade, um valor próximo de 1 indica série altamente sazonal
entropia Medida de quão fácil é prever a série. Entropia próxima de 0 mostra que uma série é fácil de prever
granulação Lumpiness é a variação das variações das janelas lado a lado (não sobrepostas)
pontos Número de seções dos dados onde a série é relativamente imutável
planos pontos de Número de vezes que uma série temporal cruza a mediana
cruzamento não Extensão da não linearidade, se os valores em torno da série 0 forem lineares. Valores grandes mostram não linearidade
linearidade Estabilidade é a variação das médias das janelas lado a lado (não sobrepostas)
Coeficiente de Hurst de uma série temporal que é uma medida de memória longa
Prevalência de picos no componente restante da decomposição do STL
estabilidade Linearidade do componente de tendência da decomposição STL
hurst pico Curvatura do componente de tendência da decomposição STL
Tempo dos picos
Tempo dos vales
Primeiro coeficiente de autocorrelação
linearidade Soma dos quadrados dos primeiros dez coeficientes de autocorrelação
curvatura Primeiro coeficiente de autocorrelação da série diferenciada
pico vale Soma dos quadrados dos primeiros dez coeficientes de autocorrelação da série diferenciada
x_acf1 Primeiro coeficiente de autocorrelação dos dados duas vezes diferenciados
x_acf10 Soma dos quadrados dos primeiros dez coeficientes de autocorrelação das séries duas vezes diferenciadas
diff1_acf1 Coeficiente de autocorrelação na primeira defasagem sazonal
diff1_acf10 Soma dos quadrados dos primeiros 5 coeficientes de autocorrelação parciais
diff2_acf1 Soma dos quadrados dos primeiros 5 coeficientes de autocorrelação parciais das séries diferenciadas
diff2_acf10 Soma dos quadrados dos primeiros 5 coeficientes de autocorrelação parciais de diferenças de segunda ordem
mares_acf1 Coeficiente de autocorrelação parcial na primeira defasagem sazonal
x_pacf5 Teste Kwiatkowski-Phillips-Schmidt-Shin (KPSS)
diff1x_pacf5 Estatística Phillips-Perron para testar se uma série é não estacionária
diff2x_pacf5 Soma dos quadrados das primeiras 12 autocorrelações da série quadrada
mares_pacf Soma dos quadrados das primeiras 12 autocorrelações de resíduos, após ajuste de um GARCH(1,1)
Valor R2 de um modelo AR aplicado à série quadrada
unitroot_kpss Valor R2 de um modelo AR aplicado aos resíduos, após ajuste de um GARCH(1,1)
unitroot_pp Estatística baseada no teste Multiplicador de Lagrange (LM) para heterocedasticidade condicional autorregressiva (ARCH)
arch_acf Primeiro coeficiente de autocorrelação da série restante
garch_acf Soma dos quadrados dos primeiros dez coeficientes de autocorrelação das séries restantes
arch_r2 garch_r2 Maior mudança média entre duas janelas deslizantes consecutivas da série temporal
ARCH.LM e_acf1 Índice temporal do maior deslocamento médio entre duas janelas deslizantes consecutivas da série temporal
e_acf10 Maior mudança de variância entre duas janelas deslizantes consecutivas da série temporal
max_level_shift time_level_shift max_var_shift time_var_shift Índice temporal da maior mudança de variância entre duas janelas deslizantes consecutivas da série temporal

6
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

4.2. Recursos de série temporal de dados M4 mensais dados de concorrência, ou seja, económicos, financeiros, demográficos e industriais.

Usamos a série temporal mensal da competição M4 para examinar empiricamente o As Figuras 3 e 4 ilustram a distribuição correspondente de cada característica. O eixo
desempenho de AD e AF e investigar a conexão entre seu desempenho e as características Y mostra a contagem ou o número de séries temporais e o eixo X indica o intervalo de
da série temporal. Os dados mensais do M4 contêm 48.000 séries temporais das áreas valores extraídos para cada recurso. Estes números mostram que os dados mensais do M4
Económica, Financeira, Demográfica e Indústria, incluindo também dados do Turismo, cobrem uma ampla gama de características de séries temporais, o que os torna um conjunto
Comércio, Trabalho e Salários, Imobiliário, Transportes, Recursos Naturais e Ambiente [27]. de dados adequado para esta pesquisa.
Os dados mensais são os dados mais importantes para as aplicações de negócios [43] e, Descrevemos algumas características significativas observadas no conjunto de dados, e os
portanto, a maior classe em M4, contendo quase metade dos dados (48.000 séries leitores são encaminhados para as Figuras 3 e 4 para obter mais detalhes.
temporais). O gráfico de entropia espectral indica que há uma gama de séries temporais de previsão
fácil (menos ruído, informações mais sistemáticas) a difícil (mais ruído, informações menos
sistemáticas). O coeficiente de variação também está inclinado para a direita e indica menor
Para cada série temporal no conjunto de dados mensal M4, extraímos 41 recursos variabilidade para a maioria das séries. A tendência atinge o pico perto de um e está
conforme descrito na Tabela 1 usando a função tsfeatue() no pacote ts-features em R [14]. distorcida para a direita, indicando a forte presença da tendência neste conjunto de dados.
Além disso, incluímos mais uma característica definida como origem, que é a origem da Observamos também que a característica de não linearidade atinge o pico próximo de zero
série temporal M4 eé

3. Características das séries temporais mensais do conjunto de dados de competição M4.

7
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

distorcido para a direita, o que indica a falta de não linearidade no a longa memória da série, que está relacionada ao
série temporal. A autocorrelação lag1 e a autocorrelação sazonal autocorrelação.
lag1 está inclinado para a esquerda e é altamente positivo para muitas séries A distribuição dos valores e_acf10 é distorcida para a direita e o
temporais. Também medimos o lag1 de autocorrelação sazonal, que é gráfico mostra que para a maior parte da série temporal e_acf10 está próximo de zero,
altamente positivo. A granulação é extremamente baixa para quase todas as séries o que significa que o que sobrou da tendência e da sazonalidade parece ser
temporais e a estabilidade varia de valores baixos a altos. Ambos sazonais aleatório.
autocorrelação parcial e a força da sazonalidade indicam uma
menor força da sazonalidade. Tanto a estacionariedade quanto a não estacionariedade 4.3. Efeito da agregação temporal nos recursos de série temporal
das séries são medidas usando estatísticas unitroot_pp e unit-root_kpss. Eles indicam
uma forte presença de estacionário Além de extrair as características das séries temporais mensais,
série temporal. A curvatura mostra uma distribuição nítida centrada em torno também computa recursos após transformar a série temporal em granularidade
zero, o que significa que a maioria das séries não possui natureza estocástica ou bimestral, trimestral, quadrimestral, semestral e anual. Usamos esses recursos para
caótica. Séries temporais de natureza estocástica estão associadas a
demonstrar como a não sobreposição
curvas exibindo curvatura positiva em uma vizinhança de seu a agregação temporal pode alterar os recursos da série temporal. Para destacar o
pontos iniciais, enquanto curvas relacionadas a fenômenos caóticos têm efeito do NOTA, começamos primeiro traçando a distribuição
uma curvatura negativa. Hurst tem uma distribuição assimétrica à esquerda com de recursos em cada nível, porém a diferença entre as distribuições não era visível
quase todas as séries com um valor próximo de um indicando a presença de porque os recursos têm caudas logarítmicas. Em vez disso, nós

4. Características das séries temporais mensais do conjunto de dados de competição M4 (continuação).

8
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

categorizar recursos da série original em quatro categorias usando quantis: pode não levar necessariamente a previsões mais precisas. Além disso,
AF demonstra ser uma estratégia de previsão muito competitiva. Esse
pode ser devido às características da série temporal mensal discutida na Seção 4.2.
Se 0 <recurso 6 0:25, Categoria = Muito baixo
Se 0:25 <recurso 6 0:5, Categoria = Baixo Também realizamos um teste estatístico usando MCB (Multiple
Se 0:5 <recurso 6 0:75, Categoria = Alta Comparação com o método Best) [21] para avaliar a significância estatística no
Se 0:75 <recurso 6 1, Categoria = Muito alto desempenho das abordagens AF e AD.
A partir da Figura 8, fica evidente que existe uma diferença estatística entre as
Em seguida, calculamos a média dos recursos para cada categoria e cada previsões geradas a partir do AF e do AD. As previsões geradas
granularidade do tempo. Os resultados foram ilustrados nas Figuras 5 e 6. da abordagem AD são menos precisos em comparação com AF. Os resultados
Eles mostram como os recursos da série temporal mudam de mensal para anual foram validados cruzadamente através de múltiplos horizontes de previsão (h = 12,
granularidade. Os resultados indicam que conforme o nível de granularidade do tempo 24 e 60) e através de várias outras métricas de erro, conforme descrito em
aumenta de mensal para anual, alguns recursos ficam mais fracos 3.3. As principais conclusões estão quase perfeitamente alinhadas com os resultados
e podem desaparecer, enquanto outros dominam a série. demonstrado na Figura 8.
Observamos uma diminuição na curvatura à medida que agregamos e ela se Na Figura 7, mostramos que tanto AF quanto AD têm desempenho divergente
aproxima de zero no nível anual, enquanto a não linearidade aumenta com a através de diferentes níveis de agregação. Além disso, Fig. 5
agregação indicando que as séries se tornam mais não lineares. Significar e 6 demonstram a evolução dos recursos da série temporal
aumenta e a variância diminui, porém o efeito é maior para através desses níveis. Acreditamos que a presença de certo tempo
categoria muito alta. Observamos também que o coeficiente de variação os recursos da série podem favorecer AD ou AF. Devemos notar que o
diminui. A linearidade é empurrada para zero se for alta ou baixa, os resultados apresentados no restante deste artigo são baseados em previsões
o que significa que a série a nível anual perde a sua característica de linearidade. Ambos produzido para o nível anual (nível de agregação = 12) usando AF
uniroot_pp e unitroot_kpss tornam-se próximos de zero com o aumento e abordagens AD. Isso ocorre porque vemos a maior diferença
nível de agregação, destacando o fato de que as séries se tornam mais no desempenho em nível anual, e quando a série temporal
não estacionário se a série mensal for estacionária, caso contrário permanece quase a granularidade é mensal, muitas vezes a previsão é necessária no nível anual.
a mesma. As medidas relacionadas à sazonalidade como
como força sazonal, autocorrelação lag1 e a soma dos quadrados Na próxima seção, construímos modelos de aprendizado de máquina para explorar
das primeiras 10 diminuições de autocorrelação. É interessante observar a associação entre recursos de séries temporais e o desempenho de previsão do
que a entropia aumenta com a agregação se não for muito alta em desempenho de AF e AD.
nível mensal, o que significa que as séries se tornam difíceis de prever.
No entanto, vemos uma redução na entropia se ela for muito alta no
nível mensal. Também observamos um aumento para ARCH.HM especialmente
se for muito baixo no nível mensal. Se estiver muito próximo de um, ele permanece 5. Modelos de aprendizado de máquina
quase inalterado.
Devemos observar que alguns recursos não são estáveis e mostram Nesta seção, usamos vários modelos para esclarecer a associação entre
comportamentos caóticos a nível anual. Isto pode ser porque estes características de séries temporais e o desempenho de
os recursos não são mensuráveis para algumas séries temporais. Portanto, eles essas abordagens. Usando os recursos de série temporal extraídos em
são retornados como NA (desconhecido) e são removidos no cálculo granularidade de tempo mensal e a métrica de erro RMSSE gerada
a média de cada categoria, daí a desordem dessas características em para cada abordagem (ou seja, AF e AD), construímos algoritmos de aprendizado de
o nível anual. máquina para revelar conjuntos relevantes de recursos que afetam o desempenho
dessas abordagens. O primeiro passo na construção de tal
modelo é construir um conjunto de dados que consiste em recursos de série temporal
4.4. Avaliação da precisão da previsão das abordagens AD e AF e rótulos de classe de modelo para uma determinada série temporal. Portanto, voltamos
este problema em uma classificação de aprendizagem supervisionada, usando
Neste estudo, pretendemos gerar previsões para uma agregação de horizonte de recursos como preditores e a abordagem vencedora rotulada como AD ou
previsão, período de lead time, usando abordagens AF e AD. AF como variável de resposta ou resultado para cada série temporal.
Embora a granularidade da série temporal original seja mensal, exigimos Descobrimos, extraímos e apresentamos os detalhes de quais séries temporais
previsões a serem produzidas bimestralmente (nível de agregação = 2), características são as mais influentes na precisão das abordagens AF e AD. Além da
Trimestralmente (nível de agregação = 3), quadrimestralmente (nível de agregação = 4), interpretabilidade, o algoritmo deve ser
Semestral (nível de agregação = 6) e anual (agregação capaz de prever com precisão qual modelo usar com um determinado conjunto
nível = 12). de recursos de série temporal na série original. Nós usamos o
A Figura 7 exibe um boxplot da medida RMSSE criada para todos RMSSE no nível anual, dada a diferença pronunciada na precisão nesse nível.
48.000 séries em vários níveis de granularidade de previsão. Resultados
demonstrar que ambas as abordagens AF e AD podem superar A Figura 9 mostra uma grade de gráficos de dispersão mostrando as interações
entre si para diferentes séries temporais. No entanto, a abordagem AF é bivariadas entre vários pares de características. Cada ponto corresponde a
gerando previsões consistentemente mais precisas em todos os níveis de agregação uma série temporal. A figura também destaca a abordagem vencedora
e a diferença se torna mais pronunciada (ou seja, AF ou AD), ao prever granularidade de tempo anual.
à medida que o nível de agregação aumenta. A diferença é especialmente inexistente Os pontos pretos representam as situações em que a AD foi mais precisa, enquanto
no nível anual. De 48.000 séries temporais mensais, o os pontos amarelos representam o oposto, ou seja, a AF foi mais precisa. Dado o
A abordagem da FA foi superior em 30.147 casos (63%) em comparação com número de recursos usados neste estudo, é
17.853 casos (37%) de DA na previsão da granularidade temporal anual. Estes inviável incluir a matriz do gráfico de dispersão para todos os pares de recursos.
resultados podem ser surpreendentes, porque a recomendação comum baseada na A Figura 9 mostra apenas o gráfico de pares para 10 características.
prática e na literatura (ver A Fig. 9 demonstra uma relação confusa entre recursos
A seção 2) é usar AD sobre AF. No entanto, devemos notar que e desempenho da abordagem AD/AF, influenciado por ruído, características confusas
quase todos esses estudos relatam a melhoria geral da precisão e falta de limites de decisão claros entre AD
em vez da precisão da previsão no nível da série. Nossos resultados e desempenho AF. É claro que alguns recursos podem ter relações lineares ou não
mostram que recomendar o AD para fazer previsões durante o lead time lineares entre si, enquanto outros podem

9
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

5. O efeito da agregação temporal não sobreposta nas características mensais da série temporal do conjunto de dados de competição M4.

10
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 6. O efeito da agregação temporal não sobreposta nas características mensais da série temporal do conjunto de dados de competição M4 (continuação).

11
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 7. Erros RMSSE através dos níveis de agregação.

Figura 8. Desempenho dos modelos AF e AD avaliados pelo teste MCB. Os valores RMSSE são usados para calcular as classificações e um nível de confiança de 95 percentis.

não estar relacionado. Para a maioria dos recursos apresentados na Fig. 9, não há e, portanto, teve um desempenho drasticamente inferior em comparação com os outros.
relacionamento forte. Todos os outros modelos de ML têm desempenho muito melhor, e o RF
Considerando os limites complicados e o relacionamento entre os preditores, sai como o vencedor final em termos de precisão da classificação média no
desenvolvemos vários algoritmos de aprendizado de máquina conjunto de dados de teste.
para descobrir padrões e conexões entre recursos de séries temporais Também realizamos a avaliação de utilidade de modelos de ML. Os resultados
e a precisão das abordagens AF e AD. são apresentados na Tabela 3. A Tabela 3 representa a média
valores de RMSSE para AD e AF se aproximam quando o correto
5.1. Avaliando a precisão da previsão para modelos em classificação a classificação foi AD e AF, respectivamente. Quando o verdadeiro modelo
usar é AD (17.853 causas), o erro RMSSE médio é 0,9028
Nesta seção, examinamos a precisão da previsão do ML para AD e 1,5204 para AF. Pelo contrário, quando o verdadeiro modelo
modelos para classificar se AD ou AF devem ser usados para prever usar é AF (30.147 causas), o erro RMSSE médio é 1,6568
a agregação do horizonte de uma determinada série temporal, com base em suas para AD e 0,8669 para AF. Desta forma, projetamos a média
características. Relatamos a precisão da previsão dos classificadores de ML usando custos e benefícios associados às decisões de classificação e
medidas discutidas na Secção 3.3. Projetamos um ShinyApp interativo que inclui somos capazes de avaliar o desempenho dos modelos de ML por meio da
a precisão de previsão de abordagens de ML e pode ser acessado pelos leitores contribuição prática da medida de utilidade conectada ao seu uso, e
2
. não apenas através de medidas estatísticas padrão. Este tipo de avaliação de
A Tabela 2 demonstra que o modelo RF tem o melhor desempenho desempenho tem muito mais valor para os profissionais que avaliam os valores
com o menor erro de classificação incorreta, estatísticas F mais altas e práticos de cada modelo de ML. O utilitário apresentado
uma das melhores estatísticas da AUC. a avaliação pode ser ainda mais ampliada na prática, ligando o
A Fig. 10 mostra o resultado do teste MCB realizado para examinar custos monetários para a decisão baseada na previsão. No entanto,
a diferença entre o desempenho dos algoritmos de ML. Os resultados mostram conhecimento de domínio sobre a área onde as previsões são implementadas
que existe uma diferença estatisticamente significativa entre o desempenho do RF é necessário.
e todos os outros modelos. De acordo com A Fig. 11 demonstra que RF tem a menor métrica de utilidade (média
o teste MCB, a abordagem AD gerou as previsões mais imprecisas cumulativa RMSSE) ao realizar a tarefa de classificação
no conjunto de dados de teste. Incluímos também o modelo Ideal, um modelo que
2 sempre prevê corretamente, para destacar o desvio do ML
https://supplychainanalytics.shinyapps.io/Evaluation_of_ML_models/.

12
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 9. Matriz de características de séries temporais. Cada ponto indica uma única série temporal com um recurso no eixo x e outro no eixo y. As cores preta e amarela mostram
desempenho superior de AD e AF, respectivamente.

mesa 2
5.2. Construindo o algoritmo de floresta aleatória
Comparação de diferentes modelos de ML.

Estatísticas F Erro de classificação incorreta CUA Individualmente, essas árvores tendem a ajustar demais os dados e gerar
LR 0,6083881 0,4383333 0,5676151 previsões futuras com grande variação. Mas, ao mesmo tempo, eles
LDA 0,7655532 0,3718750 0,5130521 produzir um viés baixo. Portanto, para reduzir a variância, o Bagging
QDA 0,7121420 0,3929861 0,5499207
processo está construindo muitas árvores em dados de trem ligeiramente diferentes (já que
KNN 0,6882851 0,3911806 0,5814969
os dados são reamostrados por bootstrap) e calcula a média das previsões de todos
Laço 0,6368112 0,4252083 0,5677939
JOGO 0,6042137 0,4383333 0,5707890 as árvores em uma previsão única. Com o objetivo de melhorar o processo de
RF 0,7773134 0,3367361 0,5704724 ensacamento, Breiman [7] introduziu o RF como um algoritmo que
Impulsionando 0,7646663 0,3640972 0,5267067 imita o processo de ensacamento, mas usa apenas uma pequena amostra aleatória
SVM 0,7646663 0,3640972 0,5318491
dos recursos disponíveis, para construção de cada árvore de classificação. O
DTW 0,7093325 0,3888889 0,5616327
FNN 0,7649972 0,3724306 0,5128323
A ideia por trás disso é, em vez de apenas “agitar” os dados via
Tocha DL 0,7649434 0,3678472 0,5230656 processo bootstrapped-reamostrado, estamos introduzindo recursos adicionais
Impulso XG 0,7688268 0,3423611 0,5728495 aleatoriedade no processo, “agitando” os recursos para a previsão por meio de
TensorFlow 0,7669575 0,3690972 0,5166527
amostragem aleatória de apenas parte dos recursos. Portanto,
RNN 0,7659351 0,3710417 0,5142032
cada vez que uma divisão em uma árvore é considerada, uma amostra aleatória de m
CNN 0,7662412 0,3700694 0,5158014
preditores é escolhida como candidata a divisão do conjunto completo de p características.
Uma nova amostra de m recursos é obtida em cada divisão e, normalmente, m
ffiffiffi

abordagens deste benchmark e revelar a margem máxima possível para reduzir o RMSSE pp [10]. Forçando esse processo cada vez usando a subamostra de
cumulativo global. Portanto, novos recursos, o RF está descorrelacionando cada árvore. Desta forma, o
nosso resultado mostra que RF também fornece o resultado mais preciso para o processo de calcular a média de muitas árvores diferentes reduzirá a variância
uma determinada série temporal examinada pela métrica de utilidade. mais eficientemente do que no caso de árvores correlacionadas.
Entre vários algoritmos, o RF forneceu o mais preciso Para gerar o modelo de RF, existem diversas questões e parâmetros de sintonia que
resultados de acordo com vários critérios. Portanto, discutiremos mais detalhadamente precisam ser otimizados para que o modelo final
essa abordagem na próxima seção. poderia gerar previsões confiáveis e precisas. Para aquele propósito,

13
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 10. Desempenho dos diferentes modelos avaliados através do teste MCB. Os erros RMSSE são usados para calcular as classificações e um nível de confiança de 95 percentis.

Tabela 3
Matriz de custos e benefícios.

Real

DE ANÚNCIOS AF

Previsto DE ANÚNCIOS 0,902872 1.6568039


AF 1,520416 0,8669348

Friedman et al. [10] propuseram a seguinte metodologia apresentada no Algoritmo1.

Algoritmo1: Metodologia Random Forest.

1: Para b ¼ 1 para B:
(a) Desenhe uma amostra bootstrap Z* de tamanho N do treinamento
dados.
(b) Cultivar uma árvore florestal aleatória Tb com os dados inicializados,
repetindo recursivamente as seguintes etapas para cada Figura 11. Comparação da precisão da utilidade.
nó terminal da árvore, até o tamanho mínimo do nó nmin
é atingido.
(i) Selecione m variáveis aleatoriamente das p variáveis. gerado por recursos em cada divisão, árvores e resultados do pacote
(ii) Escolha a melhor variável/ponto de divisão entre m. (OOB) erro de previsão. (Consulte a Fig. 12). OOB representa
(iii) Divida o nó em dois nós filhos. o erro de classificação incorreta do modelo RF durante a execução do
B
2: Produza o conjunto de árvores fg Tb 1. tarefas de classificação. Além disso, OOB é a aproximação do erro de teste com
Para fazer uma previsão em um novo ponto x: validação cruzada, uma vez que o processo de ajuste de conjuntos de dados inicializados
1 consiste em treinar o modelo apenas em parte dos dados originais e
Regressão: bf B rfð Þ¼ x B PB b=1Tbð Þx .
b em seguida, prevendo a parte restante dos dados originais (ou seja, fora de
Classificação: Seja Cbð Þx a previsão de classe do bth dados da bolsa). Calculando a média dos erros OOB de muitos modelos de árvore
árvore de floresta aleatória.
b
diferentes (que compõem o modelo de floresta aleatório final), o OOB final
B
Então é obtido.
CB rfð Þ¼ x maioria de votos Cf g bð Þx 1.
A Figura 12 revela que aumentar o número de árvores usadas para gerar o
modelo RF reduz o erro de classificação incorreta. Um cenário semelhante existe
com recursos usados em cada divisão, onde aumentar o
A primeira questão é quantos recursos escolher aleatoriamente para vários recursos (até certo ponto) reduzem erros de classificação
treinamento em cada árvore individual (ou seja, profundidade da árvore)? A questão de erro. A superfície apresentada é altamente errática e ondulada, dificultando a
surge quantas árvores usar para ajustar o modelo RF, o que também determinação visual do mínimo global. Por essa razão,
precisa ser respondida em paralelo. Para determinar o ideal o desempenho dos quatro melhores modelos de RF com divisões de recursos (m =
número de características e árvores para construir um modelo de RF, o processo de 6, 10, 21 e 42) são mostrados através de um número diferente de árvores
avaliação é realizado com um número diferente de características e usado para ajustar o modelo RF (Fig. 13).
árvores em cada divisão. Portanto, o processo resultante representa o A Fig. 13 representa o número ideal de divisões (aleatoriamente
problema de otimização de buscar o mínimo da geração de superfície recursos selecionados) usados durante o processo de construção de cada

14
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

afirma que a penalidade de escolher um número muito grande de árvores no


desempenho geral dos modelos é pequena. O critério para este julgamento é
baseado no erro de classificação OOB, que o modelo RF produz em um
determinado conjunto de dados. Portanto, o número ideal de árvores é escolhido
determinando o número de árvores onde o erro de classificação incorreta OOB é
estabilizado (Fig. 13). Na Figura 13, fica claro que o erro é estabilizado usando as
3.000 árvores.

6. Associação entre recursos de série temporal e desempenho AF/AD

Como o FR consiste em muitas árvores, não é mais possível representar o


procedimento de aprendizagem estatística resultante usando uma única árvore, e
não está claro quais variáveis são mais importantes para o procedimento [18].
Portanto, o RF melhora a precisão da previsão em detrimento da interpretabilidade.
Em vez disso, é possível obter o resumo geral da importância de cada
característica medindo a diminuição média do índice de Gini.

A Figura 14 demonstra a importância geral dos recursos utilizados na


construção de árvores durante o processo aleatório sucessivo de geração do
modelo RF. A importância dos recursos é determinada pela diminuição na
quantidade total de impureza do nó por divisões em um determinado preditor e
pela média de todas as árvores em RF. A diminuição da impureza do nó é medida
pelo índice de Gini. O grande valor do índice de Gini indica as características
importantes. É evidente que algumas características revelam-se mais importantes
Figura 12. Gráfico de superfície do número de feições (profundidade), número de árvores e erro do que outras na classificação precisa da abordagem AF versus AD. As
de classificação incorreta do modelo de floresta aleatória.
características mais importantes são: curvatura, não linearidade, seas_pacf,
unitroot_pp, média e ARCHM.LM; enquanto os pontos de origem, através, pico e
planos parecem ser os menos importantes para prever qual método de agregação
árvore de classificação, de acordo com o erro de previsão OOB. Conforme temporal usar (ou seja, AF ou AD). A quantidade que está sendo modelada aqui
demonstrado na Fig. 13, o erro OOB é minimizado na profundidade de 10. é a probabilidade de escolher corretamente AD versus AF, e vice-versa. As
Portanto, o número ideal de recursos (ou seja, profundidade da árvore) para o características menos importantes têm aproximadamente metade da importância
modelo RF é 10. das mais significativas. A diferença na diminuição da impureza do nó desde a
A segunda questão de ajuste é quantas árvores devem ser usadas para gerar curvatura até o recurso de origem é de mais de 250 unidades, indicando a ampla
o modelo RF? Um dos bons méritos que auxiliam neste processo é a resiliência gama de importância dos recursos.
do RF ao overfitting [10]. O processo de cálculo da média durante a fase de
construção de RF corrige os efeitos negativos da escolha de um grande número As Figuras 15 e 16 representam o gráfico de dependência parcial para todas
de árvores para ajustar o modelo, uma vez que isso não resultará em um aumento as características. O eixo x representa o intervalo de valores extraídos para cada
na variância no conjunto de teste. Isso im- característica e o eixo y é a probabilidade de classificar AF versus AD.

Figura 13. Determinação da profundidade ideal e do número de árvores no modelo de floresta aleatória.

15
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

14. O preditor apresenta espectro de importância para os dados M4. A importância de um recurso é calculada usando a diminuição média no índice de Gini.

Portanto, o valor dependente é a probabilidade de prever corretamente as previsões (AF), ou ii) primeiro agregar a série temporal usando dados não sobrepostos
agregadas, ou seja, a abordagem AF. agregação temporal e então gerar a previsão (AD). Nisso
Os gráficos ilustram o efeito marginal dos recursos selecionados artigo, projetamos e executamos uma estrutura de experimento empírico
na resposta (resultado) depois de integrar todas as outras variáveis e seu efeito médio usar os dados mensais de concorrência do M4 para i) explorar o desempenho de
na resposta [18]. previsão dessas abordagens; e ii) investigar a associação entre características de
As marcas do tapete na parte inferior de cada parcela mostram a distribuição séries temporais e desempenho de previsão
de recurso em todo o intervalo variável. Observe que aqui a densidade de dados de abordagens de agregação temporal (por exemplo, AF ou AD).
é mais baixo perto das bordas. Isto pode causar comportamento instável do Existe uma suposição comum de que as séries no nível mais alto de
curvas nessas áreas. As escalas verticais dos gráficos mostram a agregação temporal (frequência mais baixa) é mais suave com menos
probabilidade de a abordagem AF fornecer previsões mais precisas para ruído e padrões mais limpos, o que muitas vezes implica que as previsões
cada recurso conforme os valores desse recurso mudam. Da Fig. 15 e criados nos níveis de agregação temporal mais elevados são mais precisos. Esta
16, está claro que as características têm um efeito misto na classificação prática pode existir nas cadeias de abastecimento, onde os profissionais
Abordagens AF e AD. Embora o efeito possa ser claro para o recurso geralmente são aconselhados a agregar as séries aos níveis de frequência
como tendência ou não linearidade, é menos claro para outros, como média alinhados com seus horizontes de tomada de decisão e, em seguida, criar
ou coeficiente de variação. previsão para o período de interesse. Neste artigo questionamos isso
Observamos que a tendência crescente, ARCH.LM, hurst, autocorrelação lag 1, praticar e explorar o desempenho comparativo de AF e AD
unitroot_pp e seas_pacf podem aumentar a chance de abordagens. Conduzimos uma pesquisa comparativa da previsão
O desempenho do AF é melhor, portanto o AF se torna preferível. No entanto, desempenho usando 48.000 séries mensais de dados M4, em diferentes níveis de
aumentando a granulação, entropia, não linearidade, curvatura, força agregação temporal correspondentes à geração
da sazonalidade pode aumentar a chance de um melhor desempenho do AD, previsões bimestrais, trimestrais, quadrimestrais, semestrais e
portanto, a forte presença desses recursos pode favorecer a DA em detrimento da FA. níveis anuais. Os resultados demonstram que existe um número significativo de séries
É importante notar que estamos menos interessados na probabilidade exata nesses em que AF (63%) supera AD (37%).
gráficos. Em vez disso, estamos interessados em descobrir como Dado que faltam indicações sobre qual abordagem deve ser utilizada para uma
alterar o recurso de série temporal pode aumentar/diminuir a chance de determinada série temporal, investigamos a
AF ou AD. associação entre recursos de série temporal e previsão AF/AD
desempenho. Procuramos esclarecer o efeito da agregação temporal nas características
das séries temporais e, em seguida, investigar como elas ocorrem.
7. Conclusões pode afetar o desempenho das abordagens AD e AF. Para isso
final, primeiro construímos um banco de dados que consiste em características de cada
Na previsão de séries temporais, a granularidade temporal de uma previsão necessária séries temporais como preditor e classe de modelo rotulada como AF/AD como
para informar uma decisão pode ser diferente da granularidade temporal de uma previsão. resposta/resultado. Em seguida, examinamos 16 modelos diferentes para prever com
granularidade em si. Por exemplo, se uma série temporal for armazenada em um nível mais alto precisão a classe correta e, consequentemente, recomendamos o uso
frequência (por exemplo, mensal), poderão ser necessárias previsões em frequências a abordagem mais precisa para uma determinada série temporal e suas características.
mais baixas (por exemplo, trimestral, anual). Isto é muito comum nos tempos modernos Nossos resultados mostram que o modelo Random Forest fornece o melhor
organizações, pois os dados podem ser coletados com a menor granularidade de desempenho na classificação precisa de abordagens medidas
tempo. Portanto, há situações em que uma previsão do total através de métricas estatísticas e de utilidade. Além disso, o modelo RF é usado
é necessário valor ao longo de um período de tempo futuro (por exemplo, agregação de para revelar as características de séries temporais mais importantes na produção do
horizonte/tempo de entrega). Para gerar tal previsão para uma determinada série temporal, previsão precisa. Além disso, extraímos o gráfico de dependência parcial para
podemos considerar duas opções: i) primeiro gerar previsões, seguidas descrever a associação entre características e desempenho previsto de AD e AF. O
somando-os para obter a agregação do horizonte de previsão gráfico de dependência parcial

16
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 15. Gráfico de dependência parcial - gama de características vs. probabilidade de classificação de AF versus AD.

ajuda a mostrar como o valor de um recurso pode favorecer AF em vez de AD lação, coeficiente de variação, linearidade, curvatura e diminuição da estatística
abordagem. As principais conclusões deste estudo podem ser resumidas como de raiz unitária KPSS. No entanto, não linearidade, média, variância,
segue: ARCH.LM, tendência, estatísticas unitroot_pp aumentam. Entropia é o
meça apenas que aumenta e diminui com base em seu valor inicial.
Primeiro, quando é necessária uma previsão do valor total ao longo de vários
períodos de tempo futuros (ou seja, horizonte de agregação ou prazo de entrega), Terceiro, o modelo Random Forest é o classificador ML mais preciso
mostramos que AF é uma metodologia consideravelmente superior para ser algoritmo para prever qual abordagem fornece dados mais precisos
empregada em geral. Os resultados indicam que nenhuma das abordagens é previsão dada um conjunto de características de séries temporais como entrada.
sempre a mais precisa, quando a precisão é Quarto, o modelo RF revela que os dez principais recursos importantes para
relatado para a série temporal individual. As descobertas claramente prever se AF ou AD devem ser usados para um determinado mês
mostram que a previsão mais precisa não é necessariamente gerada por séries temporais na competição M4 incluem curvatura, não linearidade,
agregação temporal não sobreposta. Isto pode aumentar seas_pacf, unitroot_pp, média, ARCHM.LM, coeficiente de variação,
preocupações sobre a validade da prática comum em tais estabilidade, linearidade e max_level_shift.
circunstâncias. Quinto, os gráficos de dependência fornecem algumas indicações sobre como o tempo
Em segundo lugar, a agregação temporal não sobreposta altera as os recursos da série podem favorecer o AD em vez do AF e vice-versa.
características das séries temporais. A magnitude da mudança varia para Observamos que aumentar seas_pacf, trend, ARCH.LM, hurst, autocorrelation
diferentes características. Em particular, observamos que com o aumento da lag 1 e unitroot_pp aumenta a chance de AF
o nível de agregação, a força da sazonalidade, a autocorreção desempenho melhor. Enquanto, aumentando o coeficiente de variação,

17
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Figura 16. Gráfico de dependência parcial - gama de características vs. probabilidade de classificação de AF versus AD (continuação).

entropia, não linearidade e curvatura aumentam a chance de trimestral. No entanto, uma conclusão diferente pode ser alcançada ao usar
desempenho melhor do AD, portanto, a forte presença desses recursos dados de séries temporais de frequência mais alta, como subdiários, diários
pode favorecer o AD em vez do AF. ou semanais. Isto trará complicações adicionais, como a presença de
múltiplos ciclos sazonais e longas sazonalidades.
A estrutura proposta pode ser generalizada para ser usada com outros Portanto, as características das séries temporais e a forma como podem
dados de séries temporais. Acreditamos que a conclusão deve permanecer mudar com o aumento do nível de agregação podem diferir. Além disso, a
verdadeira para séries temporais de frequência mais baixa, como mensais e escolha do método de previsão torna-se importante como um método como o ETS

18
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

não consegue lidar com essas complicações. Isto seria um importante futuros e investigar sua associação com a precisão das previsões
caminho para futuras pesquisas. de abordagens de agregação temporal também pode ser um caminho
Dadas as descobertas deste estudo e o valor potencial da agregação temporal interessante para pesquisas futuras.
na previsão de séries temporais, o estudo atual
poderia ser ampliado de diversas maneiras. Pesquisa sobre qualquer um dos
Reprodutibilidade
as seguintes áreas seriam úteis:

Código R e arquivo RMarkdown para produzir todos os resultados neste artigo


Neste estudo, usamos todos os recursos para construir o modelo de ML, uma
estão disponíveis em https://github.com/bahmanrostamitabar/time-sear
abordagem alternativa seria usar abordagens de redução de dimensão para
ies-featute-agregação temporal
todos os recursos que representam o mesmo tipo de
informações como sazonalidade, autocorrelação, ruído, etc.
e então construa o modelo; Declaração de contribuição de autoria CRediT
A estrutura proposta pode ser usada para examinar a associação de
características de séries temporais e agregação temporal com Bahman Rostami-Tabar: Conceitualização, Análise formal,
dados de séries temporais subdiárias e diárias, pois apresentam mais Redação – rascunho original. Dejan Mircetic: Conceitualização, Formal
complicações. análise, Redação - rascunho original.
Dado que a relação exata entre os recursos da série temporal
e a abordagem de agregação temporal ideal não é conhecida,
Disponibilidade de dados
uma direção para pesquisas futuras poderia se concentrar no uso de meta-
aprendizagem e outras técnicas avançadas, como transformadores
Os dados estão disponíveis publicamente: https://github.com/Mcompetitions/
redes neurais e mecanismo de atenção para eliminar ainda mais
Métodos M4/árvore/mestre/Conjunto de dados
luzes sobre este problema.
Neste artigo, definimos as abordagens AD e AF para prever um
número acumulado de períodos à frente, portanto considera-se Declaração de interesse concorrente
como uma abordagem de saída única. Pode ser interessante investigar a
previsão por agregação temporal como um cenário multi-output [9], onde uma Os autores declaram que não têm interesses financeiros concorrentes ou
sequência de dois ou mais eventos futuros relações pessoais conhecidas que possam ter parecido
pontos de dados são de interesse. influenciar o trabalho relatado neste artigo.
Finalmente, usando técnicas de classificação de séries temporais [8] para classificar
dados de série temporal com base em vários fatores, incluindo série temporal
Apêndice A

Tabela 4

As principais informações de configuração para modelos de ML

Modelo Pacote R Correndo Recurso Fórmula de ativação


tempo (min) engenharia

LR Estatísticas ~3 NÃO glm(marcas~.,família = binomial, dados = trem.dados)


LDA MASSA ~3 NÃO lda(marcas~., dados = train.data)
QDA Classe ~3 NÃO qda(marcas~., dados = train.data)
KNN MASS ~20 SIM knn(Xlag[trem,], Xlag[-trem,], ClassTable[trem,''marcas”], k = 3)
LAÇO glmnet ~10 NÃO cv.glmnet(x, y, família=''binomial”, type.measure=''auc”)
JOGO gam ~12 NÃO gam(marcas~. + s(tendência, df = 3) + s(seas_acf1, df = 3) + s(linearidade, df = 3) + s(entropia, df = 3) + s(x_acf1,
df = 3) + s(força_sazonal, df = 3) + s(seas_acf1, df = 3), família = binomial, dados = train.data)
RF floresta aleatória ~2200 gbm NÃO randomForest(marcas~., dados = train.data1, mtry = 10, ntree = 3000, importância = TRUE)
Impulsionando ~3000 SIM gbm(marcas~., dados = train.data01, distribuição = ''bernoulli”, n.trees = 4500, encolhimento = 0,01, interação.
profundidade = 10)
SVM e1071 ~6000 SIM tune(e1071::svm, as.factor(marks)~., data = train.data, escala = FALSE, kernel = ''radial”, intervalos = lista
(custo = c(0,001, 0,01, 0,1, 1, 5, 10, 100), gama = c(0,5, 1, 2, 3, 4)))
FNN nnet ~10 SIM nnet(marcas~., dados = train.data, tamanho = 10, maxit = 500, decaimento = 0,001, tocou = 0,1)
DTW dtw ~5 SIM knn(train = trainData[, 5], teste = testData[, 5], cl = trainLabels, k = k, prob = TRUE, use.all = TRUE,
distância = dtw.dist)
Tocha DL tocha ~180 SIM nn_module(''Net”, inicializar = function() {self$fc1 <- nn_linear(length(features1), 40), self$fc2 <-
nn_linear(40, 30), self$fc3 <- nn_linear(30, 30), self$fc4 <- nn_linear(30, 15), self$fc5 <- nn_linear(15,
15), self$fc6 <- nn_linear(15, 10), self$fc7 <- nn_linear(10, 10), self$fc8 <- nn_linear(10, 5), self$fc9 <-
nn_linear(5, 5), self$fc10 <- nn_linear(5, 1)}, forward = function(x) {x %>% self$fc1() %>% nnf_relu() %>%
self$fc2() %>% nnf_relu() %>% self$fc3() %>% nnf_relu() %>% self$fc4() %>% nnf_relu() %>% self$fc5() %>%
nnf_relu() %>% self$fc6() %>% nnf_relu() %>% self$fc7() %>% nnf_relu() %>% self$fc8() %>% nnf_relu() %>%
self$fc9() %>% nnf_relu() %>% self$fc10()})
Impulso XG fluxo ~300 SIM xgboost(dados = xgboost_train, profundidade máxima = 23, nrounds = 500, objetivo = ''binário:logística”)
TensorFlow tensor xgboost, ~30 SIM keras_model_sequential() %>% layer_dense(unidades = 80, ativação = ''relu”, input_shape = c(42)) %>%
Keras camada_dropout(taxa = 0,6) %>% camada_dense(unidades = 40, ativação = ''relu”) %>% camada_dropout(taxa = 0,3) %
>% camada_densa(unidades = 5, ativação = ''relu”) %>% camada_densa(unidades = 1, ativação = ''sigmóide”)
RNN Keras ~30 SIM keras_model_sequential() %>% camada_lstm(unidades = 64, input_shape = c(42, 1)) %>% camada_dropout
(taxa = 0,2) %>% camada_densa(unidades = 1, ativação = ''sigmóide”)
CNN Keras ~35 SIM keras_model_sequential() %>% layer_conv_1d(filtros = 32, kernel_size = 3, ativação = ''relu”,
input_shape = c(42, 1)) %>% layer_max_pooling_1d(pool_size = 2) %>% layer_dropout(taxa = 0,2) %>%
layer_flatten() %>% layer_dense(unidades = 1, ativação = ''sigmóide”)

19
Machine Translated by Google

B. Rostami-Tabar e D. Mircetic Neurocomputação 548 (2023) 126376

Referências [31] Konstantinos Nikolopoulos, Precisamos falar sobre previsão de demanda intermitente, European
Journal of Operational Research 291 (2) (2021) 549–559.
[32] Konstantinos Nikolopoulos, Aris A. Syntetos, John E. Boylan, Fotios Petropoulos e Vassilis
[1] George Athanasopoulos, Rob J Hyndman, Haiyan Song, Doris C Wu, A competição de previsão
Assimakopoulos. Uma abordagem de demanda intermitente agregada-desagregada (adida)
de turismo, International Journal of Forecasting 27 (3) (2011) 822–844.
para previsão: uma proposição e análise empírica, Journal of the Operational Research
Society 62 (3) (2011) 544–554.
[2] George Athanasopoulos, Rob J. Hyndman, Nikolaos Kourentzes, Fotios Petropoulos, Previsão
com hierarquias temporais, European Journal of Operational Research 262 (1) (2017) 60–74.
[33] Fotios Petropoulos, Nikolaos Kourentzes, Combinações de previsão para demanda intermitente,
Journal of the Operational Research Society 66 (6) (2014) 914–924.
[3] M. Zied Babai, Mohammad M. Ali, Konstantinos Nikolopoulos, Impacto da agregação temporal
no desempenho do controle de estoque de estimadores de demanda intermitente: análise
[34] Fotios Petropoulos, Nikolaos Kourentzes, Combinações de previsão para demanda intermitente,
empírica, Omega 40 (6) (2012) 713–721.
Journal of the Operational Research Society 66 (6) (2015) 914–924.
[4] M. Zied Babai, John E Boylan, Bahman Rostami-Tabar, Previsão de demanda em cadeias de
abastecimento: uma revisão de agregação e abordagens hierárquicas, International Journal of
[35] Fotios Petropoulos, Daniele Apiletti, Vassilios Assimakopoulos, Mohamed Zied Babai, Devon K
Production Research 60 (1) (2022) 324–348.
Barrow, Souhaib Ben Taieb, Christoph Bergmeir, Ricardo J Bessa, Jakub Bijak, John E Boylan,
[5] Devon K. Barrow, Nikolaos Kourentzes, Distribuições de erros de previsão de combinações de
et al. Previsão: teoria e prática.
previsão: implicações para o gerenciamento de estoques, International Journal of Production
Jornal Internacional de Previsão, 2022.
Economics 177 (2016) 24–33.
[36] Robert J Rossana, John J Seater, Agregação temporal e séries temporais econômicas, Journal
[6] John E. Boylan, M. Zied, Babai: Sobre o desempenho de abordagens de agregação de
of Business & Economic Statistics 13 (4) (1995) 441–451.
demanda temporal sobrepostas e não sobrepostas, International Journal of Production
[37] Bahman Rostami-Tabar, Florian Ziel, Antecipando eventos especiais na previsão do
Economics 181 (2016) 136–144.
departamento de emergência, International Journal of Forecasting (2020).
[7] Leo Breiman, florestas aleatórias. Aprendizado de máquina 45 (1) (2001) 5–32.
[38] Bahman Rostami-Tabar, Zied Babai, Aris Syntetos, Yves Ducq, Previsão de demanda por
[8] Krisztian Buza, Classificação de séries temporais e suas aplicações, em: Proceedings of the 8th
agregação temporal, Naval Research Logistics (NRL) 60 (6) (2013) 479–498.
International Conference on Web Intelligence, Mining and Semantics, 2018, pp.

[39] Bahman Rostami-Tabar, Mohamed Zied Babai, Aris Syntetos, Yves Ducq, Uma nota sobre o
[9] Rafael de Oliveira Werneck, Raphael Prates, Renato Moura, Maiara Moreira Gonçalves, Manuel
desempenho previsto da agregação temporal, Naval Research Logistics (NRL) 61 (7) (2014)
Castro, Aurea Soriano-Vargas, Pedro Ribeiro Mendes Junior, M Manzur Hossain, Marcelo
489–500.
Ferreira Zampieri, Alexandre Ferreira, et al. Previsão de aprendizagem profunda baseada em
[40] Bahman Rostami-Tabar, Zied Babai, Mohammad Ali, John E. Boylan, O impacto da agregação
dados para produção e pressão de petróleo. Jornal de Ciência e Engenharia de Petróleo, 210:
temporal nas cadeias de abastecimento com processos de demanda de arma (1, 1), European
109937, 2022.
Journal of Operational Research 273 (3) (2019) 920 –932.
[10] Jerome Friedman, Trevor Hastie, Robert Tibshirani, e outros. Os elementos da aprendizagem
[41] Bahman Rostami-Tabar, Zied Babai, Aris Syntetos, Agregar ou não agregar : Previsão de
estatística, volume 1. Série Springer em estatística Nova York, 2001.
demanda autocorrelacionada finita, Journal of the Operational Research Society (2022) 1–20.
[11] Paul Goodwin, Lucre com seu software de previsão: um guia de práticas recomendadas para
previsores de vendas, John Wiley & Sons, 2018.
[42] Bahman Rostami-Tabar, Thanos E. Goltsos, Shixuan Wang, Previsão do período de lead time
[12] Hu. Yuntong, Fuyuan Xiao, Um método eficiente de previsão para séries temporais baseado em
por agregação temporal: Se combinar e como, Computadores na Indústria 145 (2023).
gráfico de visibilidade e similaridade multi-subgrafo, Chaos, Solitons & Fractals 160 (2022).

[43] Evangelos Spiliotis, Andreas Kouloumos, Vassilios Assimakopoulos, Spyros Makridakis, Os


[13] Hu. Yuntong, Fuyuan Xiao, Previsão de série temporal baseada em gráfico de visibilidade
dados de previsão de competições são representativos da realidade?, International Journal of
cognitiva difusa e similaridade multi-subgrafo ponderada, IEEE Transactions on Fuzzy Systems
Forecasting 36 (1) (2020) 37–53 [44] Georgios P Spithourakis, M.
(2022).
Fotios Petropoulos, Zied Babai, Konstantinos Nikolopoulos, Vassilios Assimakopoulos, Melhorando
[14]Rob Hyndman. tsfeatures: Extração de recursos de série temporal, 2020. URL https://
o desempenho de técnicas populares de previsão da cadeia de abastecimento, Fórum da
pkg.robjhyndman.com/tsfeatures/.
Cadeia de Fornecimento: um jornal internacional 12 (4) (2011) 16–25.
[15] Rob J Hyndman, George Athanasopoulos, Previsão: princípios e prática,
OTexts (2021), URL: https://otexts.com/fpp3.
[45] Xiaozhe Wang, Kate Smith-Miles, Rob Hyndman, Indução de regras para seleção de métodos
[16] Rob J Hyndman, Yeasmin Khandakar, Previsão automática de séries temporais: o pacote de
de previsão: Meta-aprendizado das características de séries temporais univariadas ,
previsão para r, Journal of Statistical Software 27 (2008) 1–22.
Neurocomputing 72 (10–12) (2009) 2581–2594.
[17] Rob J Hyndman, Earo Wang, Nikolay Laptev, Detecção de série temporal incomum em larga
[46] William WS Wei. Algumas consequências da agregação temporal em modelos de séries
escala , em: Conferência internacional IEEE de 2015 sobre workshop de mineração de dados
temporais sazonais. Em Análise sazonal de séries temporais econômicas, páginas 433–448.
(ICDMW), IEEE, 2015, pp.
NBER, 1978.
[18] Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, Uma introdução à aprendizagem
[47] Thomas R. Willemain, Charles N. Smart, Joseph H. Shockor, Philip A. DeSautels, Previsão de
estatística, volume 112, Springer, 2013.
demanda intermitente na manufatura: uma avaliação comparativa do método de croston,
[19] Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, Aprendizagem estatística, em:
International Journal of Forecasting 10 (4) (1994) 529–538 .
Uma introdução à aprendizagem estatística, Springer, 2021, pp.
[20] Yao Jin, Brent D. Williams, Travis Tokar, Matthew A. Waller, et al., Previsão com sinais de
[48] Giulio Zotteri, Matteo Kalchschmidt, Um modelo para selecionar o nível apropriado de
demanda temporariamente agregados em uma cadeia de suprimentos de varejo, Journal of
agregação em processos de previsão, International Journal of Production Economics 108
Business Logistics 36 (2) (2015) 199–211.
(1–2) (2007) 74–83.
[21] Alex J. Koning, Philip Hans Franses, Michele Hibon, Herman O. Stekler, A competição m3:
testes estatísticos dos resultados, International Journal of Forecasting 21 (3) (2005) 397–
409. Bahman Rostami-Tabar é professor associado em ciência de dados e gestão na Universidade de
[22] Nikolaos Kourentzes, Fotios Petropoulos, Previsão com agregação temporal multivariada: O Cardiff, Reino Unido. Ele é um líder mundial em previsões para o bem social.
caso da modelagem promocional, International Journal of Production Economics 181 (2016) Ele liderou o desenvolvimento desta área de diversas maneiras. Primeiro, ele é o primeiro chefe da
145–153. seção de Previsão para o Bem Social do Instituto Internacional de Previsores. Em segundo lugar,
[23] Nikolaos Kourentzes, Fotios Petropoulos, Juan R Trapero, Melhorando a previsão estimando organizou vários workshops internacionais sobre Previsão para o Bem Social que atraíram
componentes estruturais de séries temporais em múltiplas frequências, International Journal
considerável atenção internacional.
of Forecasting 30 (2) (2014) 291–302.
Ele também é o fundador do projeto Democratizing Forecasting, patrocinado pelo International
[24] Nikolaos Kourentzes, Bahman Rostami-Tabar, Devon K. Barrow, Previsão de demanda por
Institute of Forecasters. Através deste projeto, tem ministrado workshops em diversos países e
agregação temporal: usando níveis de agregação ideais ou múltiplos ?, Journal of Business
organizações com missões sociais. Ele também publicou cerca de 30 artigos na literatura acadêmica
Research 78 (2017) 1–9
[25] Gang Liu, Fuyuan Xiao, Chin-Teng Lin, Zehong Cao, Um modelo de previsão financeira e de sobre dados, previsão e questões científicas de gestão e palestrou em cerca de 20 conferências
energia de série temporal de intervalo difuso usando múltiplos espaços de tempo-frequência internacionais.
baseados em rede e a operação de agregação de média ponderada ordenada induzida ,
Transações IEEE em Sistemas Fuzzy 28 (11) (2020) 2677–2690. Dr. Dejan Mircetic obteve seu PhD na Universidade de Novi Sad, em previsão de séries temporais e
[26] Ivette Luna, Rosangela Ballini, Estratégias de cima para baixo baseadas em sistemas análise da cadeia de suprimentos. Dejan publicou mais de 40 artigos científicos e a inspiração para
adaptativos baseados em regras difusas para previsão diária de séries temporais, seus artigos é motivada principalmente por problemas reais nos negócios e na indústria
International Journal of Forecasting 27 (3) (2011) 708–724. contemporâneos. Além disso, atuou como analista de cadeia de suprimentos para diversas empresas
[27] Spyros Makridakis, guia do competidor M4: Prêmios e regras Relatório técnico, de logística, onde liderou equipes para projetar soluções de aprendizado de máquina para otimizar
Universidade de Nicósia, 2018. cadeias de suprimentos. Actualmente, trabalha como consultor especialista em aprendizagem
[28] Spyros Makridakis, Evangelos Spiliotis, Vassilios Assimakopoulos, competição de precisão automática para um projecto humanitário da USAID, com um forte desejo de melhorar o sistema de
M5: Resultados, descobertas e conclusões, International Journal of Forecasting 38 (4) saúde da Costa do Marfim e de melhorar a vida quotidiana das pessoas em África. No Instituto de
(2022) 1346–1364.
Investigação e Desenvolvimento de Inteligência Artificial da Sérvia, lidera o projeto Intelligent
[29] Dejan Mircetic, Bahman Rostami-Tabar, Svetlana Nikolicic, Marinko Maslaric, Previsão de
Supply, Inventory and Operations Planning (ISIOP), parte do projeto AIPlan4EU financiado pelo
séries temporais hierárquicas em cadeias de abastecimento: uma investigação empírica ,
programa de investigação e inovação Horizonte 2020.
International Journal of Production Research (2021) 1–20.
[30] Maryam Mohammadipour, John E Boylan, Agregação de horizonte de previsão em modelos
de média móvel autorregressiva inteira (inarma), Omega 40 (6) (2012) 703–712.

20

Você também pode gostar