Você está na página 1de 5

BC Blog

Métodos de Aprendizado de Máquina para Previsão de Inflação no


Brasil
Gustavo Silva Araujo, Wagner Piazza Gaglianone

26Março2024 Publicado às 10:00 Atualizado 26/03 às 16:48

Neste texto, exploramos diversos métodos de aprendizado de máquina (machine learning) para prever a
inflação no Brasil com base em um grande número de variáveis macroeconômicas e financeiras. Além disso,
apresentamos ferramentas para identificar as variáveis-chave para se prever a inflação, ajudando assim a
abrir a caixa-preta do aprendizado de máquina. Apesar da evidência de não haver melhor modelo universal,
os resultados indicam que esses métodos podem, em vários casos, superar os modelos econométricos
tradicionais. Além do mais, os resultados indicam a existência de não linearidades na dinâmica da inflação,
que são relevantes para a previsão dessa variável macroeconômica.

Produzir previsões confiáveis de inflação é um desafio constante para bancos centrais e agentes econômicos. Uma previsão acurada de
inflação é relevante para evitar distorções dos preços relativos de produtos e serviços, e para a tomada de decisões mais eficazes, por
exemplo, de política econômica, monetária e de investimentos por parte do setor real da economia.

Entretanto, construir previsões precisas geralmente não é uma tarefa fácil, pois requer uma abordagem complexa o suficiente para
incorporar variáveis relevantes, mas que também exclua dados que não possuam tanta importância. Nesse sentido, os métodos de
aprendizado de máquina (Machine Learning, em inglês), em geral, são capazes de identificar padrões não lineares nos dados, ocultos aos
modelos lineares clássicos, oferecendo assim uma abordagem alternativa e atraente aos modelos tradicionais.

Aprendizado de máquina é um ramo da inteligência artificial frequentemente descrito como a arte e ciência do reconhecimento de
padrões. É essencialmente uma abordagem baseada em dados, que envolve uma grande variedade de métodos. A maioria dos métodos
tradicionais de previsão se baseia no ajuste dos dados a uma relação pré-especificada entre variáveis dependentes e independentes,
assumindo assim um processo estatístico específico. Por outro lado, o aprendizado de máquina quase não faz suposições sobre as
relações estatísticas subjacentes aos dados. Desta forma, podemos classificar o aprendizado de máquina como uma abordagem
orientada pelos dados. O principal objetivo é transformar informações em conhecimento e valor, deixando os dados falarem por eles
mesmos (Cerulli e Drago, 2021). É importante observar que, apesar de poucas hipóteses sobre as relações entre as variáveis
dependentes e independentes, na prática, considera-se um número limitado de possibilidades de padrões sobre esses dados para que
não haja overfitting.

O aprendizado de máquina está ligado à capacidade dos computadores de aprender com a experiência sem serem explicitamente
programados. Por exemplo, no caso de aprendizado não supervisionado, não há uma variável dependente explícita, e o objetivo é
reconhecer padrões estatísticos nos dados, por exemplo, para classificá-los em categorias (e.g., análise de cluster). Já no aprendizado
supervisionado, determina-se de antemão quais são as variáveis dependentes e independentes a serem analisadas, buscando-se
identificar relações estatísticas entre os dois grupos (e.g., regressão linear ou logística). Hansen (2019) explica que o aprendizado de
máquina é uma expressão um tanto vaga, mas que normalmente é entendida como um conjunto de procedimentos usados
principalmente para estimações pontuais e que geralmente permitem ao pesquisador trabalhar com grandes tamanhos de amostra,
grande número de variáveis e forma estrutural desconhecida.

De acordo com Varian (2014), as quantidades crescentes de dados e as relações cada vez mais complexas entre variáveis justificam o
uso de abordagens de aprendizado de máquina em economia. Mesmo com a baixa frequência de dados e a usual divisão de dados em
conjuntos de treinamento e teste, há um grande incentivo para usar métodos de aprendizado de máquina em macroeconomia aplicada,
pois muitos desses métodos podem lidar com grandes quantidades de dados, ao contrário de modelos econométricos lineares,
geralmente baseados em poucas variáveis. Além disso, a melhoria contínua na tecnologia computacional permite a execução de
algoritmos de aprendizado de máquina em velocidade muito mais rápida do que há alguns anos.

Neste texto, baseado em Araujo e Gaglianone (2023), vamos falar sobre previsão de inflação no Brasil a partir de métodos de
aprendizado de máquina, comparando-os a outros métodos. O objetivo é prever o IPCA com base em um grande número de variáveis
macroeconômicas e financeiras, além de investigar se o aprendizado de máquina é capaz de melhorar a acurácia de previsões em
macroeconomia aplicada.
Utilizamos diferentes algoritmos de aprendizado de máquina, com base em modelos de regressão penalizada (Ridge Regression, Lasso,
Adaptive Lasso e Elastic Net), em métodos baseados em árvores (Random Forest, Quantile Regression Forest e XGBoost) e de redes
neurais (Recurrent Neural Network). Comparamos esses métodos com modelos econométricos tradicionais usando uma grande base de
dados com 501 séries, provenientes de 167 variáveis macroeconômicas e financeiras com 3 defasagens. Os dados são mensais de
janeiro de 2004 a agosto de 2021. No total, utilizamos 50 métodos/modelos de previsão, que incluem, além dos métodos já citados,
abordagens híbridas de aprendizado de máquina, modelos de fatores, curvas de Phillips, inflação implícita, expectativas baseadas em
survey (Focus) e métodos de combinação de previsões. A Figura 1 mostra os métodos estudados.

Figura 1 – Modelos (ou Métodos) para Previsão de Inflação

Os primeiros modelos (métodos), 1 a 10, são alguns tradicionalmente usados para prever inflação. Os modelos 11 a 18 são os métodos
de aprendizado de máquina sem combinação. Nos métodos 19 a 21 previmos inflações desagregadas (IPCA de serviços, bens industriais
e alimentação no domicílio, além dos preços administrados) por três métodos (ARMA, Adalasso e Random Forest) para depois compor o
IPCA cheio. Os métodos 22 a 27 são abordagens híbridas em que selecionamos variáveis ou com o Adalasso ou com Random Forest e
depois fazemos as previsões utilizando outros métodos. Os métodos 28 e 29 são expectativas de inflação de mercado: a inflação
implícita (breakeven inflation) extraída de títulos públicos, baseada em Val e Araujo (2019), e a pesquisa Focus conduzida pelo Banco
Central do Brasil. Por fim, os métodos 30 a 50 são combinações de outros métodos: Combinações 1 (métodos 30 a 36) envolvem a
combinação dos métodos 1 a 27, e Combinações 2 e 3 baseiam-se no model confidence set de Hansen et al. (2011) e utilizam os
métodos 1 a 27 e 1 a 29, respectivamente.

A Figura 2 apresenta a média do quadrado dos erros de previsão de inflação para diferentes horizontes de previsão. Quanto menor o
valor, melhor a previsão. O horizonte de previsão (h) varia entre 1 e 18 meses, e prevemos a variação do IPCA para um determinado
mês (parte esquerda da figura) ou para o acumulado em 12 meses (parte direita da figura) a partir de um determinado horizonte. Em
amarelo estão as 10 melhores previsões para cada horizonte.

Figura 2 – Exercício Empírico: média do quadrado dos erros de cada método de previsão de inflação
*, **, ou *** indicam que as previsões de inflação (sem ajuste sazonal) são estatisticamente significativas a 10%, 5%, e 1% de nível de significância em relação ao benchmark (ARMA) pelo teste de

Diebold-Mariano (1995).

Podemos observar que não há um único melhor método para todos os horizontes. Há também diferenças de acurácia quando a inflação
é mensal ou acumulada em 12 meses. Entretanto, podemos extrair alguns resultados interessantes:

As não-linearidades capturadas por métodos de aprendizado de máquinas, como o Random Forest, são relevantes para se prever
inflação;
Em horizontes mais curtos, as combinações de previsão são úteis, especialmente as que se baseiam no model confidence set de
Hansen et al. (2011) e as que utilizam o Focus e a inflação implícita;
Em horizontes mais longos, métodos baseados em árvores, como o Random Forest e XGBoost, funcionam bem e dominam outros
modelos em vários horizontes;
O Focus e a inflação implícita também pertencem ao conjunto das principais previsões em muitos horizontes (para a inflação
mensal, melhoram a qualidade do conjunto de informações usado como insumo nas combinações, enquanto para a inflação
acumulada em 12 meses pertencem ao conjunto de melhores previsões em quase todos os horizontes); e
O XGBoost revela-se como um método de seleção de variáveis competitivo.

Além disso, podemos utilizar ferramentas para identificar quais são as principais variáveis para prever a inflação, ajudando a “abrir a
caixa-preta” dos métodos de aprendizado de máquina. A Figura 3 apresenta, como exemplo, a seleção de variáveis ao longo do tempo
para os métodos Adalasso e Elastic Net para o horizonte de 12 meses, prevendo a inflação acumulada em 12 meses. Podemos notar
algumas quebras no padrão de seleção de variáveis em ambos os modelos, como por exemplo em 2016.

Figura 3 - Seleção de Variáveis ao Longo do Tempo para os Métodos Adalasso e Elastic Net para o Horizonte de 12 meses, Previsão da
Inflação Acumulada em 12 meses
Podemos ainda observar quais as variáveis mais relevantes na previsão de cada modelo por meio de nuvens de palavras. A Figura 4
mostra, para fins ilustrativos, a importância das variáveis para os mesmos métodos e horizontes apresentados na Figura 3. Não
necessariamente tais variáveis devem ser interpretadas como os melhores previsores no horizonte de 12 meses, pois tais resultados
devem ser analisados sob uma ótica de seleção de melhores modelos, conforme disposto na Figura 2.

Figura 4 - Variáveis mais Relevantes para a Previsão de Inflação pelos Métodos Adalasso e Elastic Net para o Horizonte de 12 meses,
Previsão da Inflação Acumulada em 12 meses

Adalasso Elastic Net

Além de conhecer as variáveis selecionadas ao longo do tempo e as variáveis mais relevantes para previsão da inflação de cada método,
podemos construir leques de inflação (fan charts, em inglês) a partir de previsões pontuais, o que permite, por exemplo, estimar a
probabilidade de a inflação futura ficar acima ou abaixo do intervalo de tolerância da meta. A Figura 5 apresenta, como exemplo, os fan
charts construídos a partir das previsões da inflação implícita (BEI) e do XGBoost para a inflação acumulada em 12 meses.

Figura 5 - Fan Charts Construídos a Partir das Previsões da Inflação Implícita (BEI) e do XGBoost para a Inflação Acumulada em 12 meses
Em suma, métodos de aprendizado de máquina representam um novo e poderoso ferramental analítico. Além de complementar os
modelos tradicionais utilizados em macroeconomia aplicada, tais métodos podem trazer novos resultados empíricos, especialmente no
que diz respeito à previsão de inflação no Brasil. Para o texto completo do trabalho, acesse:
https://www.bcb.gov.br/pec/wps/ingl/wps561.pdf <https://www.bcb.gov.br/pec/wps/ingl/wps561.pdf>

Referências

Araujo, G.S., Gaglianone, W.P., 2023. Machine learning methods for inflation forecasting in Brazil: New contenders versus classical
models. Latin American Journal of Central Banking, v. 4, p. 100087.

Cerulli, G., Drago, C., 2021. An Introduction to Machine Learning and Text Mining for economists using Stata, Python and R. Mimeo,
disponível em: https://www.side-iea.it/events/courses/introduction-machine-learning-and-text-mining-economists-using-stata-python-
and-r <https://www.side-iea.it/events/courses/introduction-machine-learning-and-text-mining-economists-using-stata-python-and-r>

Diebold, F.X., Mariano, R.S., 1995. Comparing predictive accuracy. Journal of Business & Economic Statistics 13, 253–263.

Hansen, B.E., 2019. Econometrics. Mimeo, disponível em: https://www.ssc.wisc.edu/~bhansen/econometrics/Econometrics.pdf


<https://www.ssc.wisc.edu/~bhansen/econometrics/Econometrics.pdf>

Hansen, P.R., Lunde, A., Nason, J.M., 2011. The model confidence set. Econometrica 79(2), 453-497.

Val, F.F., Araujo, G.S., 2019. Breakeven Inflation Rate Estimation: an alternative approach considering indexation lag and seasonality.
Working Paper n. 493, Banco Central do Brasil.

Varian, H.R., 2014. Big data: New tricks for econometrics. Journal of Economic Perspectives 28(2), 3-28.

As opiniões expressas nesse trabalho são exclusivamente dos autores e não refletem, necessariamente, a visão do Banco Central do Brasil.

Wagner Piazza Gaglianone e Gustavo Silva Araujo são servidores do Banco Central do Brasil e atuam no Departamento de Estudos e
Pesquisas (Depep).

Temas:

Você também pode gostar