Você está na página 1de 22

Trabalho apresentado para obtenção do título de especialista em Data

Science e Analytics – 2022

Uso de Redes Bayesianas para predição do desmatamento na Amazônia Brasileira

Annie Karoline de Lima Cavalcante¹*; Gabrielle Maria Romeiro Lombardi2


1
Mestre em Recursos Florestais. SHCES 1603 Bloco B; 70658-632 Brasília – Distrito Federal, Brasil
2
PECEGE. Doutora em Genética e Melhoramento de Plantas. Rua Alexandre Herculano, 120
Monteiro; 13.418-445 Piracicaba - São Paulo, Brasil
*autor correspondente: annie.karolinelima@gmail.com

1
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Uso de redes bayesianas para predição do desmatamento na Amazônia brasileira

Resumo

A Amazônia brasileira é considerada um dos maiores e mais diversos ecossistemas


contíguos do mundo, sofrendo forte pressão antrópica. A expansão ou intensificação da
agricultura é considerado um dos fatores de maior impacto na mudança da cobertura
florestal nesta região. Apesar do extenso conhecimento científico e acadêmico sobre a
temática, estimativas precisas de taxas de desmatamento são difíceis de serem obtidas.
Diante disto, este trabalho teve por objetivo prever o desmatamento na Amazônia Brasileira,
bem como, identificar quais são os principais fatores que contribuem para tal evento. Os
dados utilizados foram coletados em diferentes entidades governamentais. Foi calculada a
correlação de Pearson e as variáveis que apresentaram maiores correlações foram
utilizadas para previsões futuras. Foram construídas duas Redes Bayesianas, uma
adotando a evolução temporal dos dados. Para as previsões futuras foram utilizados três
modelos e o que apresentou melhor acurácia foi empregado nas previsões. A construção
das Redes Bayesianas apontou que o desmatamento tem relação com focos de incêndios
no mesmo ano em que ocorre o desmatamento e em anos consecutivos. Os modelos
ajustados apontaram que nos próximos anos as taxas de desmatamento alcançaram
patamares maiores comparados aos anos anteriores.
Palavras-chave: desmatamento, previsões futuras, machine learning, séries temporais.

Abstract

The Brazilian Amazon is considered one of the largest and most diverse contiguous
ecosystems in the world, suffering strong anthropic pressure. The expansion or
intensification of agriculture is considered one of the most impacted factors in the change in
forest cover in this region. Despite extensive scientific and academic knowledge on the
subject, accurate estimates of deforestation rates are difficult to obtain. In view of this, this
study aimed to predict deforestation in the Brazilian Amazon, as well as to identify what are
the main factors that contribute to this event. The data used were collected in different
government entities. Pearson's correlation was calculated and the variables with the highest
correlations were used for future predictions. Two Bayesian Networks were built, one
adopting the temporal evolution of the data. For forecasts, were used three time series
models and the one that presented better accuracy was used for forecast. The construction
of the Bayesian Networks pointed out that deforestation is related to outbreaks of fires in the
same year that deforestation occurs and in consecutive years. The time series adjusted
models showed that in the coming years deforestation rates going to reach higher levels
compared to previous years.
Keywords: deforestation, forecasts, machine learning, time series.

Introdução

As florestas tropicais têm sido amplamente reconhecidas como ecossistemas


essenciais que mantêm processos biofísicos locais, regionais e globais (Chadid et al., 2015).
Ainda segundo os autores, estas florestas são o habitat para uma grande diversidade de
espécies de plantas e animais, regulam importantes processos ecológicos e fornecem uma
variedade de serviços ecossistêmicos. A região da Amazônia brasileira consiste de mais de
4.000.000 km² de floresta tropical, sendo considerada uma dos maiores e mais diversos

2
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

ecossistemas contíguos do mundo (Braswell et al., 2003). As drásticas mudanças de


cobertura na Amazônia resultaram em uma gama de impactos ecológicos e biogeoquímicos
em escala global, incluindo mudanças na produção e composição florestal, dinâmica de
nutrientes, diversidade de espécies, fluxo químico e emissão de dióxido de carbono na
atmosfera (Baccini et al., 2012; Hirsch et al., 2004; Numata et al., 2011; Potter et al., 2009).
Nas últimas décadas a diminuição da cobertura florestal em zonas tropicais tem sido
uma preocupação para conservacionistas e entidades ligadas ao monitoramento de
mudanças climáticas. De acordo com Agarwal et al. (2005), apesar do reconhecimento do
problema ser de longa data é controverso e muito difícil obter estimativas precisas de taxas
de desmatamento ou mesmo relacionar a cobertura florestal atual com a extensão potencial
ou histórica da cobertura original.
O monitoramento das mudanças na cobertura, composição e fragmentação florestal
é um componente crítico no manejo de paisagens florestais (Adams et al., 2019;
Andriatsitohaina et al., 2020). Segundo os autores, o conhecimento de mudanças
observáveis e futuras na extensão florestal é indispensável para compreender como os
benefícios advindos das florestas podem mudar com o tempo. Vários estudos sobre
mudanças no uso e cobertura do solo identificaram diversos fatores determinantes no
processo de modificação da paisagem, como por exemplo, a expansão ou intensificação da
agricultura (Brown et al., 2007; Levers et al., 2016; McAlpine et al., 2009; Ruiz-Martinez et
al., 2015) ou até mesmo a eficiência da criação de áreas protegidas (Andriatsitohaina et al.,
2020; Rindfuss et al., 2007).
Chadid et al. (2015) apontam que o desmatamento em áreas tropicais é
impulsionado por diversos fatores que podem variar de um local a outro bem como ao longo
do tempo em uma única área de estudo. Os vetores do desmatamento estão fortemente
associados às atividades antrópicas, podendo estas serem agrupadas em causas
subjacentes ou diretas. Temos como causas subjacentes fatores sociais e políticos e, como
causas diretas àqueles decorrentes da atividade humana que causam alteração na
cobertura florestal (Chadid et al., 2015; Pendrill et al., 2019).
De acordo com Dlamini (2016) as abordagens estatísticas convencionais e
ferramentas para estimativa de desmatamento, embora úteis, podem não serem robustas o
suficiente para reconhecer todas as causas e influências relativas no desmatamento,
principalmente quando se trabalha com grandes conjuntos de dados, sendo necessário
empregar técnicas capazes representar e generalizar relacionamentos em dados, como os
algoritmos de aprendizado de máquina. Redes Bayesianas têm sido amplamente utilizadas
na análise de conjunto de dados de alta dimensão para entender relações causais na gestão
de recursos ambientais, aumento de número de incêndios florestais, avaliação de serviços

3
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

ecossistêmicos, conservação e gestão da biodiversidade e no setor agrícola (Adams et al.,


2019; Andriatsitohaina et al., 2020; Dlamini, 2016; Durieux et al., 2020; Lobora et al., 2017;
Salmona et al., 2017).
Para se lidar com incertezas na modelagem de fenômenos latentes faz-se
necessário a utilização de modelos probabilísticos ou estocásticos, como o método
aproximação bayesiana, baseado na construção de Redes Bayesianas (Simões et al.,
2014). De acordo com Mello et al. (2013) o uso de Redes Bayesianas [RB] é uma alternativa
para tratar matematicamente a interação entre probabilidades à medida que o número de
variáveis envolvidas nos fenômenos observado aumenta.
Redes Bayesianas são grafos acíclicos direcionados, isto é, representam as relações
causais entre variáveis aleatórias em modelos probabilísticos (Mello et al., 2010). O método
bayesiano é fundamentado no conceito de probabilidade a priori e a posteriori, consistindo
em determinar a probabilidade de ocorrência de uma determinado evento ou fenômeno de
interesse dada a presença de um condicionante ou evidência (Andriatsitohaina et al., 2020;
Dlamini, 2016; Mello et al., 2013).
Diante do exposto anteriormente, o objetivo deste trabalho é utilizar técnicas de
aprendizado de máquinas para prever e estimar o desmatamento na Amazônia Brasileira,
bem como, identificar quais são os principais fatores que contribuem para tal evento.

Material e Métodos

Coleta e tratamento de dados


Nesta pesquisa adotou-se a Amazônia Legal como área de interesse (Figura 1). Os
dados utilizados para a modelagem foram obtidos em diferentes órgãos e entidades
governamentais e compreendem diferentes intervalos de tempo.

4
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Figura 1. Recorte geográfico da Amazônia Legal


Fonte: IBGE (2020)

Inicialmente foram levantadas as principais commodities produzidas na região de


interesse e então àquelas que apresentaram maior expressividade foram selecionadas para
o estudo. Foram utilizadas informações de desmatamento, número de focos de incêndios e
informações agropecuárias para a criação da rede bayesiana e para predições futuras. As
bases de dados são apresentadas na Tabela 1.

Tabela 1. Fonte de dados adotados para predição do desmatamento.

Dado Espaço temporal Fonte


maio/2004
TERRABRASILIS –
Área desmatada (km²) a
INPE
dezembro/2021
junho/1998
Programa Queimadas -
Nº de focos de incêndios a
INPE
dezembro/2021
Área de produção de soja (km²) setembro/2006
Série Histórica –
a
Área de produção de Milho (km²) Tabela 6588 IBGE
dezembro/2021
Preço da saca de milho (R$/60kg) janeiro/2014
Preço da saca de soja (R$/60kg) a CONAB
Preço do Boi Gordo (R$/15kg) dezembro/2021
Fonte: Dados originais da pesquisa

5
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Devido as diferenças do intervalo de tempo abrangido pelos dados, além da


presença de dados faltantes, foi realizado um recorte garantindo que todas as bases de
dados cobrissem o mesmo espaço de tempo. Sendo assim, as séries temporais utilizadas
para o “forecasting” tiveram seu início em janeiro de 2014 e final em dezembro de 2021.

Figura 2. Dados temporais da Amazônia Legal


Nota:*os dados aqui apresentados correspondem aos valores médios dos estados que
compreendem a Amazônia Legal

Os dados então foram mesclados em um único conjunto de dados com frequência


mensal. A seguir são apresentadas as variáveis incluídas no banco de dados e sua
denominação no mesmo:
 desmatamento  desmat.km2.
 área plantada de soja  soja.km2.
 área plantada de milho  milho.km2.
 preço do boi gordo  boi.R..
 preço da saca de milho  milho.R..
 preço da saca de soja  soja.R..

6
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Análise exploratória
Para caracterização das séries temporais foi realizada, primeiramente, uma análise
exploratória de dados para identificar os valores médios observados, bem como os valores
de máximo e mínimo para o período. A fim de verificar a associação entre os dados foram
calculados os coeficientes de correlações (Figura 3).

Figura 3. Coeficiente de correlação de Pearson entre as variáveis observadas na Amazônia


Legal
Fonte: Dados originais da pesquisa

As variáveis que apresentaram maior correlação com o desmatamento foram


selecionadas para as previsões futuras. Apesar da variável ‘incêndios’ apresentar o maior
coeficiente de correlação com o desmatamento, apresenta comportamento sazonal, sendo
influenciada fortemente por condições climáticas, sendo assim, optou-se por não utilizar
essa variável em predições futuras. As demais variáveis: área plantada de soja [Soja.km2] e
área plantada de milho [Milho.km2], além do desmatamento [desmatamento.km2] foram
projetados para anos futuros.

Rede Bayesiana
A Rede Bayesiana é um modelo matemático que tem como base nós e arcos que
retratam, respectivamente, as variáveis de um universo e as dependências entre estas
(Sousa, 2018). As RBs possuem partes qualitativas e quantitativas; os nós e arcos são a
parte qualitativas, e as probabilidades prévias e condicionais possibilitam a análise
quantitativa (Amin et al., 2018). As redes bayesianas são governadas pelo Teorema de
Bayes.
De acordo com Bastos (2018), a modelagem pelas Redes Bayesianas permite
expressar a crença das relações de dependências entre as variáveis através de grafos,
onde as relações de dependência são apresentadas por setas ou arcos que apontam do
parâmetro para a variável dependente. A Rede Bayesiana Dinâmica [RBD] é um derivado do

7
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

RB convencional, sendo adequada para modelagem de séries temporais, pois é capaz de


capturar as relações temporais entre nós. A Figura 4 ilustra o esquema de uma Rede
Bayesiana dinâmica.

Figura 4. Diagrama representando a evolução temporal de uma Rede Bayesiana


Fonte: Mihajlovic e Petkovic (2001)

Os dados tratados neste estudo apresentam natureza temporal e por este motivo optou-
se pela esquematização de duas Redes Bayesianas, uma hierárquica ou convencional e
outra dinâmica. A estruturação das variáveis neste formato possibilitou a inferência sobre a
influência das variáveis preditoras sobre o desmatamento.
Para a montagem das redes foi utilizado o pacote do R “dbnR: Dynamic Bayesian
Network Learning and Inference” versão 0.7.5 (Quesada e Valverde, 2022). Os parâmetros
da RBD foram ajustados pelo método da máxima verossimilhança.

Séries temporais
Para a análise das séries temporais e modelagem de valores futuros foram adotados
diferentes modelos univariados para séries temporais. As bases de dados foram divididas
em treino e teste; os três últimos anos das séries (2019, 2020 e 2021) foram utilizados para
treinar os modelos e posteriormente toda a série foi utilizada para validação e predição.
O desempenho dos modelos de previsão foi mensurado pela magnitude do erro de
previsão para o ano t+2, em que t é o último ano observado. Os erros de previsão
computados foram: raiz quadrada do erro médio [RE], erro absoluto percentual da média
[EA%], erro absoluto da média [EA] e coeficiente de determinação [R²]. A seguir são
apresentados os modelos ajustados no presente estudo:
a) Modelos Autorregressivos
Modelo autorregressivo integrado de médias móveis [ARIMA] é um modelo
generalizado autorregressivo [ARMA] que combina os processos autorregressivos [AR] e de
média móvel [MA], construindo um modelo composto da série temporal (Siami-Namini et al.,
2018). A estrutura do modelo ARIMA é na forma (p, d, q), onde: p indica o número de termos
autorregressivos, d é a ordem de diferenciação e q o número de termos de média móvel.
ARIMA possui dois tipos diferentes de modelos baseados nos efeitos sazonais, como
modelo ARIMA e SARIMA. O modelo sazonal autorregressivo integrados de médias móveis
[SARIMA] é semelhante ao modelo ARIMA, sendo preferível quando a série temporal exibe

8
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

sazonalidade. O modelo SARIMA pode ser expresso como um modelo ARIMA(p, d, q)(P, D,
Q)S . Os parâmetros do modelo P, D, Q e S correspondem à ordem sazonal, diferenciação
sazonal, ordem de média móvel sazonal e tempo de repetição do padrão sazonal,
respectivamente (Samal et al., 2019).
Para obter a maior precisão dos modelos, a função “auto.arima” do pacote forecast
(Hyndman et al., 2022; Hyndman e Khandakar, 2008) foi utilizada para gerar
automaticamente um conjunto de parâmetros ideais testando todas as combinações
possíveis de (p, d, q)(P, D, Q)S , quando identificada sazonalidade, e retornando o modelo
com a melhor combinação para o conjunto de dados.
b) Random Forest
Random forest [RF] é um algoritmo de aprendizagem de conjunto que pode lidar
tanto com classificação de alta dimensão quanto regressão. RF é um método de conjunto
baseado em árvores onde todas as árvores dependem de uma coleção de variáveis
aleatórias (Yan et al., 2015). A fim de transformar um problema de previsão de séries
temporais em um modelo de regressão RF, os regressores das séries foram transformados
em um vetor T contendo as observações mais recentes de cada série na matriz
característica X (Mussumeci e Codeço Coelho, 2020). A regressão RF foi realizada no
ambiente R utilizando o pacote parsnip (Kuhn e Vaughan, 2022) definindo 500 árvores.
c) PROPHET
PROPHET é um procedimento para predições futuras de séries temporais
desenvolvido pela equipe de Cientistas de Dados do Facebook com o objetivo de ser uma
ferramenta de previsão que é automatizada por natureza, permitindo maior facilidade de uso
em métodos de ajuste temporal e permitindo que analistas de qualquer background ou
pessoas com pouco ou nenhum conhecimento prévio em séries temporais sejam capazes
de fazer previsões com sucesso (Aditya Satrio et al., 2021).
O Prophet adota um método de ajuste de curva Bayesiano para suavizar e prever
dados de série temporal, sendo a sua característica mais distinta em comparação com os
modelos tradicionais de previsão de séries temporais, como Holt Winters, ARIMA, entre
outros (Taylor e Letham, 2018; Zhao et al., 2018). Em outras palavras, o Prophet utiliza
várias funções lineares e/ou não lineares para se adequar aos componentes temporais,
tendo o tempo como o único regressor (Zhao et al., 2018).
A modelagem do Prophet foi feita de forma automática. Foi necessário separar as
variáveis em data frames com duas colunas, uma com a informação de data, formatada
como tal, para que a interface do programa reconhece a informação, e outra com a
informação da variável de interesse.

9
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Resultados e Discussão

Análise exploratória
Como uma das premissas necessárias para o estudo de séries temporárias é a
estacionariedade dos dados, foi realizado o teste de Dickey-Fuller aumentado com 4 lags e
probabilidade estatística de 0,05. Os resultados do teste estatístico são apresentados na
Tabela 2. Foi possível observar que as variáveis selecionadas para predições futuras são
estacionárias, atendendo um dos mais importantes pressupostos para a modelagem de
séries temporais.

Tabela 2. Resultado do Teste de Dickey-Fuller aumentado


Estatística
Variável p-value
Dickey-Fuller
Desmatamento -5,3968 < 0,01
Área plantada de soja -5,5977 < 0,01
Área plantada de milho -4,0198 0,01159
Fonte: Resultados originais da pesquisa

A decomposição de dados temporais permite observar o comportamento das séries


estudadas, como por exemplo, a presença de sazonalidade, ciclos, tendências de
crescimento e decrescimento. A Figura 5 apresenta estas análises, para cada série foi
realizada a decomposição em quatro partes: i) gráfico da série, ii) tendência, iii)
sazonalidade e iv) resíduos, respectivamente.
A – Desmatameto (km²) B – Produção de soja (km²)

C – Produção de milho (km²)

Figura 5. Decomposição das séries temporais de desmatamento, área plantada de soja e


milho de 2014 a 2021.
Fonte: Resultados originais da pesquisa

10
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Com a decomposição das séries foi possível observar a presença de sazonalidade


assim como uma tendência de crescimento para os dados de desmatamento, área de
produção de milho e soja. Essa tendência de crescimento corrobora os dados apresentados
por Freitas et al. (2018), Silva Junior et al. (2020) e Siqueira-Gay e Sánchez (2021). Os
autores observaram tendência de crescimento na taxa de desmatamento na Amazônia
Legal e indicaram a possibilidade de valores alarmantes para os anos seguintes.

Redes Bayesianas
A Figura 6 apresenta a Rede Bayesiana Hierárquica modelada com todas as
variáveis adotadas neste estudo. A estrutura dos dados demonstra uma separação em dois
nós pais, desmatamento e área plantada de milho, respectivamente. Inicialmente era
esperado que todas as variáveis convergissem para o desmatamento e apresentassem
algum tipo de relação entre elas. As variáveis agrícolas: preço da saca de soja e de milho,
área plantada de milho e área plantada de soja, e o preço do boi gordo, não demonstraram
relação causal com o desmatamento.

Figura 6. Modelo hierárquico de Rede Bayesiana com ‘desmatamento’ como target e demais
variáveis explicativas.
Fonte: Resultados originais da pesquisa

O desmatamento tem a variável incêndios como variável dependente, ou seja, a


ocorrência de incêndios está atrelada a presença de desmatamento. Dlamini (2016) ao
modelar uma RB com foco no desmatamento na Suazilândia, observou que incêndios têm
relação com o desmatamento. O autor observou o mesmo tipo de relacionamento observado
para a Amazônia legal, onde o desmatamento apresenta-se como um nó-pai apontando
para incêndios. De acordo com Dlamini (2016), a complexidade das variáveis

11
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

impulsionadoras do desmatamento, apesar de serem as mesmas em diferentes regiões do


mundo, apresentam elevada especificidade com a microrregião em que ela ocorre, sendo
assim, dentro de um mesmo país, em regiões próximas, às mesmas variáveis não
apresentem o mesmo comportamento de causalidade.
A Figura 7 apresenta a Rede Bayesiana Dinâmica de tamanho três. As RBDs são
Redes Bayesianas temporais que indicam a evolução de variáveis em cada instante t. Na
RBD construída é possível observar que as variáveis estudadas apresentam relação
temporal.
t2 t1 t0

Figura 7. Rede Bayesiana Dinâmica usada para modelar o desmatamento na Amazônia


Legal
Fonte: Resultados originais da pesquisa
Nota: setas indicam interação entre as variáveis

A variável incêndio em t2 apresenta relação com o desmatamento em t0 e incêndio


em t1. De acordo Reis (2018) o desmatamento é a principal fonte de incêndios na
Amazônia, uma vez que o fogo é utilizado tanto na abertura de novas áreas quanto para a
manutenção das áreas já existentes utilizadas na agropecuária. De acordo com Lemos e
Cunha (2021) e Silveira et al. (2020), aproximadamente 1/3 das ocorrências de queimadas
entre 2003 e 2019 foram registradas em um raio de até 1 km de distância de áreas
desmatadas no mesmo ano e em até 500 metros de áreas desmatadas no ano anterior.
Essa informação confirma os resultados obtidos com a RBD, onde áreas desmatadas
tendem a sofrer com incêndios no mesmo ano da ocorrência da supressão da vegetação
bem como nos anos seguintes.
A relação temporal entre as variáveis agrícolas está de acordo com o esperado, já
que estas commodities apresentaram tendência de crescimento semelhantes. Tanto a soja
quanto o milho são grãos utilizados na alimentação de animais e humanos, além de serem

12
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

oleaginosas utilizadas na produção de óleos vegetais consumidos em todo o mundo. De


acordo com o Documento 349 da Embrapa Soja, o mercado de soja é influenciado e
totalmente dependente do mercado de carnes, pois o seu principal produto derivado, o
farelo proteico, é direcionado majoritariamente para a nutrição animal. Sendo assim, um
aumento na demanda de carnes, acarretaria em um aumento na demanda de grãos de soja,
indicando uma necessidade de expansão da área plantada.

Modelagem de séries temporais


A Tabela 3 apresenta as estatísticas de acurácia dos modelos testados para os
dados de desmatamento.

Tabela 3. Acurácia dos modelos ajustados para os dados de desmatamento


Modelos EA EA% RE R²
ARIMA(1,0,0)(1,1,0)[12] 365,01 39,58 555,13 0,62
PROPHET 326,76 36,90 489,80 0,73
RANDOMFOREST 382,94 54,72 546,78 0,69
Fonte: Resultados originais da pesquisa
Nota que: RE – raiz quadrada do erro médio; EA% – erro absoluto percentual da média; EA
– erro absoluto da média.

De acordo com a avaliação da acurácia dos modelos, Prophet é o melhor modelo


para previsões futuras de desmatamento com erro percentual de 36,9% e coeficiente de
determinação de 0,73. A validação do modelo foi feita com os demais dados. A Figura 8
apresenta o “forecasting” utilizando a base de dados de desmatamento.

13
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

A – Previsão do desmatamento

B – Tendência dos dados

C – Sazonalidade anual dos dados

Figura 8. Predição futura para os dados de desmatamento e componentes da predição


Fonte: Resultados originais da pesquisa

O gráfico de tendência indica comportamento de crescimento do desmatamento para


os próximos anos, já o gráfico de tendência anual aponta os meses do ano onde ocorrem os
picos de desmatamento entre julho e outubro, considerados meses de seca. Nos meses de
maior precipitação e maior cobertura de nuvens podem dificultar a detecção de
desmatamento, já que a presença de nuvens impossibilita a obtenção de imagens de
satélite com resolução e clareza adequadas para a detecção. Conforme informa Diniz et al.
(2015), os dados de desmatamento provenientes do sistema DETER podem incluir

14
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

processos de desmatamento que ocorreram antes do mês de mapeamento, mas que eram
anteriormente indetectáveis devido ao regime de nuvens.
A Tabela 4 apresenta a estatística dos modelos ajustados para os dados de área de
soja plantada na região da Amazônia Legal. De acordo com o erro absoluto percentual e R²,
o modelo ARIMA(0,1,0)(1,1,0)[12] apresentou maior acurácia, sendo o mais indicado para
fazer o “forecasting” da série temporal.

Tabela 4. Acurácia dos modelos ajustados para os dados de área de soja plantada
Modelos EA EA% RE R²
ARIMA(0,1,0)(1,1,0)[12] 1204,26 0,90 1733,54 0,98
PROPHET 2105,78 1,58 2668,61 0,97
RANDOMFOREST 14148,97 10,73 15213,50 0,90
Fonte: Resultados originais da pesquisa

Para conferência se o modelo sazonal atende a todos os requisitos necessários para


predições futuras, a Figura 9 apresenta os gráficos de resíduos do modelo. Como pode ser
observado, o modelo apresenta resíduos com distribuição normal e os picos de
autocorrelação estão dentro dos limites.

Figura 9. Gráfico de resíduos do modelo sazonal ARIMA


Fonte: Resultados originais da pesquisa

A Figura 10 Apresenta o “forecasting” de 2 anos do modelo sazonal ARIMA(0,1,0)


(1,1,0)[12]. A previsão indica que nos próximos dois anos a área de soja plantada pode
chegar no patamar de 150.00 km². De acordo com Barrozo e Rosa (2018), esta tendência
de crescimento da soja também é observada na produção de milho, já que seu cultivo tem

15
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

sido realizado no período entressafras de leguminosas. Ainda segundo informações do


Canal Rural (2021) o aumento da produção de soja em áreas da Amazônia está associada
ao desmatamento por parte de empresas não associadas a entidades signatárias da
Moratória da Soja.

Figura 10. Projeção futura da área plantada de soja nos estados da Amazônia Legal
Fonte: Resultados originais da pesquisa

A acurácia dos modelos ajustados para os dados de área de milho plantada na


Amazônia Legal é apresentada na Tabela 5. Segundo as informações de erro médio, erro
médio percentual e coeficiente de determinação, o melhor modelo para projeções futuras é o
ARIMA(0,1,0)(1,0,0)[12] with Drift.

Tabela 5. Acurácia dos modelos ajustados para os dados de área plantada de milho
Modelos EA EA% RE R²
ARIMA(0,1,0)(1,0,0)[12] with Drift 3721,89 5,42 4223,48 0,97
PROPHET 16164,18 23,69 17628,30 0,83
RANDOMFOREST 13785,54 20,16 15184,40 0,89
Fonte: Resultados originais da pesquisa

A Figura 12 apresenta a projeção para dois anos da área cultivada de milho. A série
assume o comportamento de uma linha reta, o que indica que os valores crescerão
indefinidamente.

16
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Figura 11. Projeção futura da área cultivada de milho na Amazônia Legal


Fonte: Resultados originais da pesquisa

Conclusões

As redes bayesianas possibilitaram inferir sobre relações causais entre


desmatamento e variáveis agrícolas, não apresentando relação direta. A construção das
Redes Bayesianas Hierárquica e Dinâmica apontaram que o desmatamento tem relação
com focos de incêndios no mesmo ano em que ocorre o desmatamento e em anos
consecutivos.
Os modelos ajustados apresentaram bons resultados de acurácia, possibilitando
realizar a projeções futuras sobre os dados selecionados. Com isto, espera-se que as áreas
desmatadas assumam valores maiores aos registrados previamente, assim como, as áreas
de cultivo de soja e milho irão expandir de forma considerável, assumindo estabilidade do
mercado interno, externo e as políticas econômicas e sociais adotadas.

Referências

Adams, A.B.; Pontius, J.; Galford, G.; Gudex-Cross, D. 2019. Simulating forest cover change
in the northeastern U.S.: decreasing forest area and increasing fragmentation. Landscape
Ecology 34(10): 2401–2419.

Aditya Satrio, C.B.; Darmawan, W.; Nadia, B.U.; Hanafiah, N. 2021. Time series analysis and
forecasting of coronavirus disease in Indonesia using ARIMA model and PROPHET.
Procedia Computer Science 179: 524–532.

17
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Agarwal, D.K.; Silander, J.A.; Gelfand, A.E.; Dewar, R.E.; Mickelson, J.G. 2005. Tropical
deforestation in Madagascar: Analysis using hierarchical, spatially explicit, Bayesian
regression models. Ecological Modelling 185(1): 105–131.

Amin, M.T.; Khan, F.; Imtiaz, S. 2018. Dynamic availability assessment of safety critical
systems using a dynamic Bayesian network. Reliability Engineering & System Safety 178:
108–117.

Andriatsitohaina, R.N.N.; Celio, E.; Llopis, J.C.; Rabemananjara, Z.H.; Ramamonjisoa, B.S.;
Grêt-Regamey, A. 2020. Participatory Bayesian network modeling to understand driving
factors of land-use change decisions: insights from two case studies in northeast
Madagascar. Journal of Land Use Science 15(1): 69–90.

Baccini, A.; Goetz, S.J.; Walker, W.S.; Laporte, N.T.; Sun, M.; Sulla-Menashe, D.; Hackler,
J.; Beck, P.S.A.,;Dubayah, R.; Friedl, M.A.; Samanta, S.; Houghton, R.A. 2012. Estimated
carbon dioxide emissions from tropical deforestation improved by carbon-density maps.
Nature Climate Change 2(3): 182–185.

Barrozo, J.C.; Rosa, J. C. 2018. A expansão do cultivo da soja no brasil através dos dados
oficiais. Pampa (Santa Fe) dez. 2018: 79–98.

Bastos, M.M. 2018. Modelagem probabilística da dinâmica da Zika usando modelos


hierárquicos bayesianos. Dissertação de Mestrado. Fundação Getúlio Vargas, Escola de
Matemática Aplicada, Rio de Janeiro, RJ, Brasil.

Braswell, B.H.; Hagen, S.C.; Frolking, S.E.; Salas, W.A. 2003. A multivariable approach for
mapping sub-pixel land cover distributions using MISR and MODIS: Application in the
Brazilian Amazon region. Remote Sensing of Environment 87(2–3): 243–256.

Brown, J.C.; Jepson, W.E.; Kastens, J.H.; Wardlow, B.D.; Lomas, J.M.; Price, K.P. 2007.
Multitemporal, Moderate-Spatial-Resolution Remote Sensing of Modern Agricultural
Production and Land Modification in the Brazilian Amazon. GIScience & Remote Sensing
44(2): 117–148.

Canal Rural. 2021. Soja aumenta em 22% a área na Amazônia em 2019/20 em desacordo
com moratória, informa Abiove. Disponível em
:<https://www.canalrural.com.br/noticias/agricultura/soja/soja-aumenta-em-22-a-area-na-
amazonia-em-2019-20-em-desacordo-com-moratoria-informa-abiove/>. Acesso em: 14 abr.
2022.

18
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Chadid, M.A.; Dávalos, L.M.; Molina, J.; Armenteras, D. 2015. A Bayesian spatial model
highlights distinct dynamics in deforestation from coca and pastures in an Andean
biodiversity hotspot. Forests 6(11): 3828–3846.

Diniz, C.G.; Souza, A.A.D.A.; Santos, D.C.; Dias, M.C.; Luz, N.C.; Moraes, D.R.V.; Maia,
J.S.A.; Gomes, A.R.; Narvaes, I.D.S.; Valeriano, D.M.; Maurano, L.E.P.; Adami, M. 2015.
DETER-B: The New Amazon Near Real-Time Deforestation Detection System. IEEE Journal
of Selected Topics in Applied Earth Observations and Remote Sensing 8(7): 3619–3628.

Dlamini, W.M. 2016. Analysis of deforestation patterns and drivers in Swaziland using
efficient Bayesian multivariate classifiers. Modeling Earth Systems and Environment 2(4): 1–
14.

Durieux, A.M.S.; Ren, C.X.; Calef, M.T.; Chartrand, R.; Warren, M.S. 2020. BUDD: Multi-
modal Bayesian Updating Deforestation Detections. International Geoscience and Remote
Sensing Symposium (IGARSS), 6638–6641. Disponível em:
<https://doi.org/10.1109/IGARSS39084.2020.9323938>. Acesso em: 14 abr. 2022.

Freitas, F.L.M.; Sparovek, G.; Berndes, G.; Persson, U.M.; Englund, O.; Barretto, A.;
Mörtberg, U. 2018. Potential increase of legal deforestation in Brazilian Amazon after Forest
Act revision. Nature Sustainability 1(11): 665–670.

Hirsch, A.I.; Little, W.S.; Houghton, R.A.; Scott, N.A.; White, J.D. 2004. The net carbon flux
due to deforestation and forest re-growth in the Brazilian Amazon: analysis using a process-
based model. Global Change Biology 10(5): 908–924.

Hyndman, R.; Athanasopoulo, G.; Bergmeir, C.; Caceres, G.; Chhay, L.; O’hara-Wild, M.;
Petropoulos, F.; Razbash, S.; Wang, E.; Yasmeen, F. 2022. forecast: Forecasting functions
for time series and linear models (R package version 8.16).
https://pkg.robjhyndman.com/forecast/

Hyndman, R.J.; Khandakar, Y. 2008. Automatic Time Series Forecasting: The forecast
Package for R. Journal of Statistical Software 27(3): 1–22.

Kuhn, M.; Vaughan, D. 2022. parsnip: A Common API to Modeling and Analysis Functions
(0.2.1). https://github.com/tidymodels/parsnip,%0Ahttps://parsnip.tidymodels.org/

Lemos, N.S.A.; Cunha, J.M. 2021. Analysis of fire risk in the Amazon: a systematic review.
Ambiente e Agua - An Interdisciplinary Journal of Applied Science 16(3): e2706.

19
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Levers, C.; Butsic, V.; Verburg, P.H.; Müller, D.; Kuemmerle, T. 2016. Drivers of changes in
agricultural intensity in Europe. Land Use Policy 58: 380–393.

Lobora, A.L.; Nahonyo, C.L.; Munishi, L.K.; Caro, T.; Foley, C.; Beale, C.M. 2017. Modelling
habitat conversion in miombo woodlands: insights from Tanzania. Journal of Land Use
Science 12(5): 391–403.

McAlpine, C.A.; Etter, A.; Fearnside, P.M.; Seabrook, L.; Laurance, W.F. 2009. Increasing
world consumption of beef as a driver of regional and global change: A call for policy action
based on evidence from Queensland (Australia), Colombia and Brazil. Global Environmental
Change 19(1): 21–33.

Mello, M.P.; Risso, J.; Atzberger, C.; Aplin, P.; Pebesma, E.; Vieira, C.A.O.; Rudorff, B.F.T.
2013. Bayesian networks for raster data (BayNeRD): Plausible reasoning from observations.
Remote Sensing 5(11): 5999–6025.

Mello, M.P.; Rudorff, B.F.; Adami, M.; Rizzi, R.; Aguiar, D.A.; Gusso, A.; Fonseca, L.M. 2010.
A simplified Bayesian Network to map soybean plantations. In 2010 IEEE International
Geoscience and Remote Sensing Symposium. p. 351-354.

Mihajlovic, V.; Petkovic, M. 2001. Dynamic bayesian networks: a state of the art. Europhys.
Lett. CTIT Technical Report Series Vol. 01-34. University of Twente. Disponível em: <
http://www.ub.utwente.nl/webdocs/ctit/1/0000006a.pdf>. Acesso em: 18 de mar. 2022.

Mussumeci, E.; Codeço Coelho, F. 2020. Large-scale multivariate forecasting models for
Dengue - LSTM versus random forest regression. Spatial and Spatio-Temporal Epidemiology
35: 100372.

Numata, I.; Cochrane, M.A.; Souza Jr, C.M.; Sales, M.H. 2011. Carbon emissions from
deforestation and forest fragmentation in the Brazilian Amazon. Environmental Research
Letters 6(4): 044003.

Pendrill, F.; Persson, U.M.; Godar, J.; Kastner, T.; Moran, D.; Schmidt, S.; Wood, R. 2019.
Agricultural and forestry trade drives large share of tropical deforestation emissions. Global
Environmental Change 56: 1–10.

Potter, C.; Klooster, S.; Genovese, V. 2009. Carbon emissions from deforestation in the
Brazilian Amazon Region. Biogeosciences 6(11): 2369–2381.

Quesada, D.; Valverde, G. 2022. dbnR: Dynamic Bayesian Network Learning and Inference

20
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

(0.7.5). CRAN.R-project. Disponível em: <https://cran.r-project.org/package=dbnR>. Acesso


em: 20 mai. 2022.

Reis, M. 2018. Dinâmica espacial dos incêndios florestais em Autazes, Amazonas.


Dissertação de Mestrado em Ciências de Florestas Tropicas. INPA, Manaus, AM, Brasil.

Rindfuss, R.R.; Entwisle, B.; Walsh, S.J.; Mena, C.F.; Erlien, C.M.; Gray, C.L. 2007. Frontier
Land Use Change: Synthesis, Challenges, and Next Steps. Annals of the Association of
American Geographers 97(4): 739–754.

Ruiz-Martinez, I.; Marraccini, E.; Debolini, M.; Bonari, E. 2015. Indicators of agricultural
intensity and intensification: a review of the literature. Italian Journal of Agronomy 10(2): 74–
84.

Salmona, J.; Heller, R.; Quéméré, E.; Chikhi, L. 2017. Climate change and human
colonization triggered habitat loss and fragmentation in Madagascar. Molecular Ecology
26(19): 5203–5222.

Samal, K.K.R.; Babu, K.S.; Das, S.K.; Acharaya, A. 2019. Time series based air pollution
forecasting using SARIMA and prophet model. ACM International Conference Proceeding
Series p: 80–85.

Siami-Namini, S.; Tavakoli, N.; Namin, A.S. 2018. A Comparison of ARIMA and LSTM in
Forecasting Time Series; A Comparison of ARIMA and LSTM in Forecasting Time Series.
17th IEEE International Conference on Machine Learning and Applications (ICMLA).

Silva Junior, C.H.L.; Pessôa, A.C.M.; Carvalho, N.S.; Reis, J.B.C.; Anderson, L.O.; Aragão,
L.E.O.C. 2020. The Brazilian Amazon deforestation rate in 2020 is the greatest of the
decade. Nature Ecology & Evolution 5(2): 144–145.

Silveira, M.V.F.; Petri, C.A.; Broggio, I.S.; Chagas, G.O.; Macul, M.S.; Leite, C.C.S.S.;
Ferrari, E.M.M.; Amim, C.G.V.; Freitas, A.L.R.; Motta, A.Z.V.; Carvalho, L.M.E.; Silva Junior,
C.H.L.; Anderson, L.O.; Aragão, L.E.O.C. 2020. Drivers of Fire Anomalies in the Brazilian
Amazon: Lessons Learned from the 2019 Fire Crisis. Land 9(12): 516.

Simões, M.; Ferraz, R.; Verweij, P.; Equihual, M.; Maqueo, O.; Alvez, A. 2014. Modelo
Bayesiano de dados espaciais aplicado ao mapeamento da integridade ecossistêmica da
Amazônia brasileira. In Environnement et Géomatique: Approches Comparées France-
Brésil, Rennes. Actes du colloque.[Sl]: USP: Université Rennes, 2014. p. 371-378.

21
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022

Siqueira-Gay, J.; Sánchez, L.E. 2021. The outbreak of illegal gold mining in the Brazilian
Amazon boosts deforestation. Regional Environmental Change 21(2): 1–5.

SOUSA, L.C.A. Classificação da tríplice infecção viral transmitida pelo mosquito Ae. aegypti
por meio do sistema Especialista Aedes Expert. Dissertação de Mestrado em Engenharia
Biomédica. Universidade de Brasília, Brasília, DF, Brasil.

Taylor, S.J.; Letham, B. 2018. Forecasting at Scale. The American Statistician 72(1): 37–45.

Yan, W.; Naing, N.; Htike, Z.Z. 2015. Forecasting of monthly temperature variations using
random forests. ARPN Journal of Engineering and Applied Sciences 10(21): 101109–
110112.

Zhao, N.; Liu, Y.; Vanos, J.K.; Cao, G. 2018. Day-of-week and seasonal patterns of PM2.5
concentrations over the United States: Time-series analyses using the Prophet procedure.
Atmospheric Environment 192: 116–127.

22

Você também pode gostar