Escolar Documentos
Profissional Documentos
Cultura Documentos
Este trabalho foi apoiado em parte pelos Fundos de Pesquisa Fundamental para as Universidades Centrais sob o subsídio BLX201717 e em parte
pelo Programa Nacional de Pesquisa e Desenvolvimento Chave da China sob o subsídio 2017YFD0600901.
RESUMO Um incêndio florestal é um desastre natural que destrói os recursos florestais, causando severos impactos ao homem e aos animais
e plantas que dependem do ambiente florestal. Este artigo apresenta um modelo para prever a escala de incêndios florestais de Alberta,
Canadá. A escala de um incêndio é determinada pela combinação da duração do incêndio e do tamanho da área que ele queima. Nosso
modelo de previsão permite que os bombeiros tomem medidas apropriadas para minimizar os danos causados por um incêndio florestal com
base em sua escala prevista nos estágios iniciais do incêndio. Os dados de modelagem foram coletados do Banco de Dados Nacional de
Incêndios do Canadá (CNFDB) publicado pela Natural Resources Canada, que inclui dados meteorológicos e de incêndios florestais para
Alberta, Canadá. O tamanho da área queimada e a duração do incêndio foram usados para estimar a escala de um incêndio florestal. Após
testes de multicolinearidade e normalização de recursos, os dados foram divididos em conjuntos de treinamento e teste. Tomando os fatores
meteorológicos como valores de entrada, uma rede neural de retropropagação (BPNN), uma rede neural recorrente (RNN) e memória de
longo prazo (LSTM) foram implementadas para estabelecer modelos de previsão.
Desses métodos de classificação, o LSTM apresentou a maior precisão, 90,9%. Os resultados indicam que é viável prever a escala de um
incêndio florestal no início de sua ocorrência usando informações meteorológicas.
TERMOS DE INDEXAÇÃO Incêndio florestal, modelo LSTM, fatores meteorológicos, previsão de escala de incêndio.
O editor associado que coordena a revisão deste manuscrito e estabeleceu um índice de Poisson
aprovando-o para publicação foi Jenny Mahoney.
Esta obra está licenciada sob uma Licença Creative Commons Atribuição 4.0. Para obter mais informações, consulte http://creativecommons.org/licenses/by/4.0/
176746 VOLUME 7, 2019
Machine Translated by Google
H. Liang et al.: Modelo de Rede Neural para Previsão de Escala de Incêndios Florestais Usando Fatores Meteorológicos
ESTUDO
florestais agem não linearmente dentro de uma ampla gama de escalas
espaçotemporais. Portanto, modelos não lineares são necessários para A região de estudo, Alberta, localizada no oeste do Canadá, é ilustrada
lidar com as complexidades dos processos subjacentes. na Fig. 1. Alberta tem um clima continental úmido com verões quentes e
Nos últimos anos, métodos de inteligência artificial (IA) provaram ser invernos frios. As temperaturas médias regionais variam de -15ÿC no
muito eficazes para prever riscos naturais [16], [17]. Além disso, os inverno a 24,5ÿC no verão e a temperatura média anual é de 2,5ÿC. A
métodos de IA têm sido frequentemente usados no contexto da precipitação média sazonal varia de 200 mm a 325 mm no inverno e de
modelagem de incêndios florestais e superaram os métodos estatísticos 150 mm a 275 mm no verão e a precipitação anual é de 300 mm a 600
convencionais em muitos casos [14], [18]–[20]. Em nosso estudo, que mm. Alberta é uma província ensolarada.
usou dados de séries temporais para prever incêndios florestais,
implementamos um modelo de memória de longo prazo (LSTM) para Os totais anuais de luz solar brilhante variam entre 1.900 h e 2.600 h por
prever a escala de incêndios florestais. O modelo LSTM é um tipo especial ano. A maior parte da metade norte da província é floresta boreal e as
de rede neural recorrente (RNN) que preserva informações históricas em Montanhas Rochosas ao longo de sua fronteira sudoeste são amplamente
dados usando uma unidade de memória interna seletiva [21]. O LSTM florestadas [25].
mostrou ser mais eficaz para analisar problemas de previsão de séries
temporais do que outros métodos de IA [22]–[24]. Como as ocorrências B. PREPARAÇÃO DE DADOS
de incêndios têm regras e tendências óbvias e o LSTM tem vantagens na Os registros de ocorrência de incêndio disponíveis para a área de estudo
previsão de tendências de ocorrência, um modelo LSTM foi empregado foram obtidos do Banco Nacional de Incêndios do Canadá (CNFDB).
para prever a escala dos incêndios florestais. Este banco de dados contém as coordenadas dos locais e as datas de
ignição de todos os incêndios ocorridos na região de Alberta entre 1990
Os principais objetivos deste estudo são (1) propor uma nova definição e 2018, inclusive. O banco de dados também registra informações
de escala de incêndio florestal definida pela combinação da duração de específicas sobre os incêndios florestais, incluindo latitude e longitude,
um incêndio e o tamanho da área que queima, (2) investigar a capacidade data de ignição, data de extinção, área queimada e causa. Também
de três modelos de redes neurais (ou seja, , rede neural de retropropagação recuperamos dados meteorológicos do CNFDB para o período de 1990 a
(BPNN), RNN e modelos LSTM) para prever a escala de incêndios 2018; estes foram coletados de 6.970 estações meteorológicas. Os dados
florestais em florestas usando dados meteorológicos e (3) para fornecer continham 11 elementos meteorológicos: temperatura máxima (ÿC),
uma estimativa eficiente
temperatura mínima (ÿC), temperatura média (ÿC), graus-dia de informações também foram normalizadas. O algoritmo Min-Max Scaling
aquecimento, graus-dia de resfriamento, chuva total (mm), neve total [29] foi usado para quantificar variáveis na faixa [0,1]. A fórmula para
(mm), precipitação total (mm), neve no solo (cm), direção da rajada de quantização de características é dada pela Eq. (1):
vento máxima (dezenas de graus) e velocidade da rajada de vento
máxima (km/h). Devido à grande quantidade de dados meteorológicos e xi ÿ min(xi)
à dificuldade de obtê-los de páginas da web, a tecnologia de web crawler z= , (1)
max(xi) ÿ min(xi)
foi utilizada para extrair os dados meteorológicos.
onde z é o valor de saída após a normalização do recurso, xi é o valor
da variável, max(xi) é o valor máximo da variável e min(xi) é o valor
mínimo da variável.
C. PRÉ-TRATAMENTO DE DADOS
A normalização da área e duração do incêndio deu peso igual aos dois
1) FILTRAGEM E CORRESPONDÊNCIA DE
resultados de normalização no cálculo do valor médio, que foi usado
DADOS Um total de 377.719 registros de dados de incêndio foram obtidos.
como resultado final da normalização.
No entanto, os registros de dados não abrangeram todos os 11 elementos
meteorológicos; portanto, eliminámos os registos que careciam de qualquer
D. MODELAGEM DE PREVISÃO DE ESCALA DE INCÊNDIO
informação específica relevante sobre o incêndio florestal. Em seguida,
1) REDE NEURAL DE BACKPROPAGATION Uma
usando o tipo de incêndio florestal, os incêndios causados pelo homem
BPNN é uma rede neural multicamada feed-forward baseada em
(como os causados pelo fumo ou pela caça) foram excluídos. Os dados
backpropagation [30]. BPNNs típicos consistem em uma camada de
restantes de incêndios florestais consistiam em 35.685 registros disponíveis para modelagem.
entrada, uma ou mais camadas ocultas e uma camada de saída. Cada
Em seguida, usando sua latitude e longitude, comparamos os pontos de
camada consiste em vários neurônios (nós). O valor de saída de cada nó
ignição com as estações meteorológicas que registraram dados
é determinado por seu valor de entrada, função de ação e limite. O
meteorológicos para a data de cada incêndio florestal. Ao todo, foram
processo de aprendizado da rede inclui dois processos: propagação de
selecionados 394.366 registros de dados meteorológicos para os anos
informações para frente e propagação de erros para trás. Na propagação
de 1990 a 2018.
direta, as informações de entrada são transmitidas da camada de entrada
Um registro completo para modelagem necessária para incluir
para a camada de saída através da camada oculta, que é obtida pela
informações sobre o incêndio florestal e informações meteorológicas
operação da função de ação. Se a saída contiver erros quando comparada
correspondentes. Portanto, os registros de dados de incêndio foram
com o valor desejado, é realizada a propagação reversa do sinal de erro.
comparados com os registros de dados meteorológicos usando a latitude
Os erros são reduzidos modificando os pesos de cada camada de
e longitude dos pontos de ignição. O conjunto de dados final para
neurônios para que a saída atenda aos requisitos de precisão. Ao alternar
modelagem consistiu em 24.108 registros completos (ou amostras). Em
os dois processos, no espaço vetorial correto a função erro de execução
experimentos subsequentes, usamos esses registros como amostras
estratégia gradiente descendente, vetor de peso de busca iterativa
para treinamento do modelo.
dinâmica, a função erro de rede é minimizada, completando o processo
de extração de informação e memória. A estrutura topológica do BPNN é
2) TESTE DE MULTI-
mostrada na Fig. 2.
COLINEARIDADE A multicolinearidade refere-se a fortes correlações
nas relações entre as variáveis explicativas do modelo de regressão, que
distorcem as estimativas feitas pelo modelo e podem causar desvios da
verdade fundamental [26]. Para evitar que variáveis com colinearidade 2) REDE NEURAL RECORRENTE Uma
significativa afetem a precisão do nosso modelo de previsão de escala RNN é um modelo de rede neural para dados de séries temporais. A
de incêndio florestal, calculamos o fator de inflação de variância (VIF)
estrutura de rede especial de um RNN permite que a saída de um
[27] para avaliar a colinearidade entre as variáveis. Geralmente, acredita-
neurônio atue como entrada diretamente para si mesmo no ponto de
se que uma variável cujo VIF seja maior que 10 deve ser eliminada, pois
tempo seguinte [31], [32]. O resultado de cada camada oculta na rede é
tais valores indicam que existe colinearidade significativa entre variáveis
determinado pela saída da entrada atual e pela saída da camada oculta
independentes [28].
anterior; ou seja, uma RNN pode registrar os resultados de cálculos
anteriores [33]. No entanto, com um RNN, os problemas de
desaparecimento de gradiente ou explosão podem ocorrer facilmente
3) NORMALIZAÇÃO DE RECURSOS [34], [35]. Conforme mostrado na Fig. 3, dada a sequência de entrada
A normalização de recursos normaliza independentemente cada variável para (x1, x2, . . . , xt) e o estado da camada oculta (h1, h2, . . . , ht), no tempo
um determinado intervalo por meio de um método de normalização selecionado. t, as unidades RNN são atualizadas conforme mostrado em Eqs. (2)-(3).
Neste estudo, os valores das variáveis de entrada no conjunto de dados
ht = ÿ(Uxt + Whtÿ1 + b), ot = (2)
variaram muito, o que levou o processo de gradiente descendente usado
para encontrar soluções ótimas a ser complexo e demorado e, ainda, ÿ(Vht + b). (3)
afetar a precisão da previsão. Portanto, introduzimos um método de
normalização de recursos para transformar as variáveis em uma categoria 3) MEMÓRIA DE LONGO CURTO
espacial que deu peso igual às variáveis de entrada. As variáveis de PRAZO LSTM é uma variante RNN; ele pode aprender informações de
saída com wildfire dependência de longo prazo e evitar o desaparecimento do gradiente [36], [37].
FIGURA 2. Estrutura da rede neural BP. Símbolos: X, porta de entrada; wi = peso entre a camada de entrada e a camada oculta; wj = peso
entre a camada oculta e a camada de saída; b = bais; f(x) = função de transferência.
4) TREINANDO OS MODELOS
Em nosso estudo, a função objetivo para modelagem de previsão
de escala de incêndios florestais foi a raiz quadrada média do erro
(RMSE) que mede a magnitude do erro entre as observações e
previsões, que deve ser minimizado:
e=tÿy (9)
2
RMSE = p Média(e ) (10)
Função objetivo = min(RMSE) (11)
ot = ÿ (Wo · [htÿ1, xt] + bo) (6) A coleta e pré-processamento de dados e o estabelecimento dos
modelos de classificação foram desenvolvidos e implementados no
ct = ft ctÿ1 + it tanh (Wc · [htÿ1, xt] + bc) (7) framework TensorFlow do software Anaconda 3 (Anaconda, Inc.,
das camadas ocultas, W é a matriz de peso e b é a vetor de desvio. Após filtrar os dados originais do incêndio, obtivemos os pontos de
ignição, correspondentes às latitudes e longitudes em Alberta.
FIGURA 4. Estrutura da célula LSTM. Símbolos: c = célula; f = esquecer portão; h = camada oculta; i = porta de
entrada; o = porta de saída; Sigmod = função de ativação sigmóide; t = tempo; x = entrada; W = matriz de peso; b =
vetor de desvio.
O formato dos dados do fogo é mostrado na Tabela 1. Esses dados B. TESTE DE MULTI-COLINEARIDADE E
incluíam a latitude e longitude do ponto de ignição, as datas de ignição NORMALIZAÇÃO DAS CARACTERÍSTICAS
e extinção do fogo e o tamanho da área queimada. Como o estudo se DOS DADOS Um teste de multicolinearidade foi usado para testar a
concentrou em incêndios florestais, os incêndios com causas humanas colinearidade das variáveis meteorológicas que afetam a ocorrência
foram eliminados; os tipos que permaneceram incluíram incêndios de de incêndios florestais. Os VIFs das variáveis meteorológicas são
coroa, incêndios de grama, incêndios de solo e incêndios florestais. A mostrados na Tabela 3. As variáveis de temperatura mínima,
filtragem dos dados meteorológicos preservou os registros temperatura média e precipitação total devem ser excluídas, pois
meteorológicos que continham todas as 11 variáveis; seu formato é seus valores de VIF foram maiores que 10. Após eliminar as variáveis
apresentado na Tabela 2. meteorológicas com múltiplas colinearidades, o incêndio
e os dados meteorológicos foram combinados com base na latitude C. CORRELAÇÃO ENTRE A ESCALA DE INCÊNDIO E
conjunto de dados foi preparado. Cada amostra no conjunto de dados foi Após testes de multicolinearidade e normalização de recursos,
construída com oito variáveis meteorológicas e duas realizou análise de correlação dos fatores meteorológicos
variáveis (ou seja, a área queimada e a duração do incêndio). As variáveis e escala de fogo. Os resultados são mostrados na Tabela 6. MT, TR,
meteorológicas foram a temperatura máxima (MT), e SMG têm o maior impacto na escala de um incêndio. Além disso, MT, HDD,
graus-dia de resfriamento (CDD), graus-dia de aquecimento (HDD), total DMG e SMG foram significativamente correlacionados positivamente com a
chuva (TR), neve total (TS), neve no solo (SG), direção de escala de fogo, enquanto CDD, TR, SG e
rajada de vento máxima (DMG) e velocidade do vento máximo TS foram significativamente correlacionados negativamente com escala de fogo.
rajada (SMG). O método tradicional para avaliar a escala de incêndios florestais Além disso, a importância relativa dos fatores meteorológicos para a previsão
baseia-se no tamanho da área queimada [39]. No entanto, propomos uma da escala de incêndios florestais é mostrada na Fig. 5.
definição mais significativa de escala que engloba
não só o tamanho da área queimada, mas também a duração do fogo
[40]. As descrições estatísticas básicas das variáveis do conjunto de dados D. PREVISÃO DE ESCALA DE INCÊNDIO FLORESTA
são dados na Tabela 4. Além disso, implementamos Min-Max 1) CLASSIFICAÇÕES DA ESCALA DE INCÊNDIO SELVAGEM
Escala para normalizar as variáveis no intervalo [0,1]. o Após a normalização das características, usamos o z médio da duração
os resultados da normalização de recursos são mostrados na Tabela 5. normalizada do incêndio e o tamanho normalizado da
TABELA 7. Resultados da divisão do conjunto de dados pelo método Kennard–Stone (KS) aprimorado.
TABELA 8. Comparação de resultados por modelos de previsão usando rede neural de retropropagação (BPNN), rede neural recorrente (RNN) e memória de longo prazo (LSTM).
TABELA 9. Resultados de previsão para os cinco níveis de escalas de incêndio florestal usando LSTM.
FIGURA 6. Curvas características de operação do receptor (ROC) do modelo LSTM. (a) Conjunto de dados de teste; (b) conjunto de dados completo.
previsões. As curvas ROC dos conjuntos de treinamento e teste são 4. CONCLUSÃO E TRABALHOS FUTUROS
desenhadas de acordo com as amostras com treinamento correto e Este estudo revelou a relação entre fatores meteorológicos e escala
treinamento incorreto. Os valores da área sob a curva ROC (AUC) de incêndios florestais nas florestas de Alberta, Canadá. A principal
refletem a precisão da previsão do modelo. Quando 0,5 < AUC < 1, contribuição deste trabalho é dupla: (1) O estudo propôs uma definição
quanto maior o valor de AUC, melhor o ajuste do modelo. (Alguns mais significativa da escala de incêndio florestal que é estimada pelo
estudiosos apontaram que AUC = 0,5 indica que a equação de tamanho da área queimada e pela duração do incêndio. Essas
regressão não tem significado para a interpretação de variáveis escalas são classificadas em cinco níveis.
dependentes; quando AUC > 0,5, as variáveis independentes são
mais capazes de explicar as variáveis dependentes [44].) Os valores
de AUC de o conjunto de dados de teste e o conjunto de dados (2) Dos três modelos de rede neural examinados, o modelo LSTM
completo foram 0,918 e 0,942, respectivamente. exibiu a melhor capacidade de prever as escalas de incêndios
Os resultados experimentais indicam que o LSTM pode prever a florestais, com uma precisão preditiva geral de 90,9%. Além disso, a
escala de incêndios florestais usando variáveis meteorológicas, que curva ROC indicou que o modelo LSTM se ajusta bem aos dados
podem fornecer uma base científica para a previsão da escala de (tendo uma AUC de 0,942 para o conjunto de dados completo).
incêndios florestais em Alberta.
Os resultados deste estudo demonstram que é viável prever a escala de [12] BM Wotton e DL Martell, ''Um modelo de ocorrência de incêndio relâmpago para Ontário'',
Can. J. Forest Res., vol. 35, pp. 1389–1401, junho de 2005, doi:10.1139/x05-071.
incêndios florestais usando dados meteorológicos, que serão úteis na prevenção
e resgate de incêndios florestais, especialmente para incêndios florestais que [13] L. Vilar, DG Woolford, DL Martell e MP Martín, ''Um modelo para prever a ocorrência de
ocorrem em florestas. Os socorristas e bombeiros poderão tomar medidas incêndios florestais causados pelo homem na região de Madrid, Espanha'', Int. J. Wildland
Fire, vol. 19, pp. 325–337, jun. 2010, doi: 10.1071/WF09030.
eficazes e adequadas de acordo com a escala de incêndio prevista na sua fase
inicial, reduzindo assim as perdas causadas pelos incêndios florestais. [14] F. Guo, L. Zhang, S. Jin, M. Tigabu, Z. Su e W. Wang, "Modelagem de ocorrência de fogo
antropogênico na floresta boreal da China usando regressão logística e florestas
aleatórias", Florestas , vol. 7, não. 11, pág. 250, 2016, doi: 10.3390/f7110250.
Como os dados usados para modelagem vieram de uma única região, os [15] YJ Goldarag, A. Mohammadzadeh e AS Ardakani, "Avaliação de risco de incêndio usando
tipos de floresta e a topografia em todo o conjunto de dados foram semelhantes, rede neural e regressão logística", J. Indian Soc.
Sensoriamento Remoto, vol. 44, pp. 885–894, dez. 2016, doi: 10.1007/ s12524-016-0557-6.
e o modelo preditivo tem algumas limitações. Este estudo constitui assim um
passo em frente no domínio da previsão de incêndios florestais ao considerar [16] DT Bui, B. Pradhan, H. Nampak, Q.-T. Bui, Q.-A. Tran e Q.ÿP. Nguyen, ''Abordagem de
outros fatores, incluindo a topografia do terreno, altitude, tipo de floresta, inteligência artificial híbrida baseada em modelo de inferência nebulosa neural e
otimização metaheurística para modelagem de suscetibilidade de inundação em uma
densidade populacional e a intervenção manual na extinção de incêndios que,
área de ciclone tropical de alta frequência usando GIS'', J. Hydrol., vol. 540, pp. 317–330,
juntamente com fatores meteorológicos, podem influenciar a escala de incêndios set. 2016, doi: 10.1016/ j.jhydrol.2016.06.027.
florestais. À medida que mais fatores forem considerados, o modelo terá o
potencial de prever as escalas de uma maior variedade de ocorrências de [17] H. Hong, M. Panahi, A. Shirzadi, T. Ma, J. Liu, A.-X. Zhu, W. Chen, I. Kougias, e N. Kazakis,
"Avaliação de suscetibilidade a inundações na área de Hengfeng acoplamento sistema
incêndios florestais. de inferência neuro-fuzzy adaptativo com algoritmo genético e evolução diferencial", Sci.
Ambiente Total., vol. 621, pp. 1124–1141, abril de 2018, doi: 10.1016/j.scitotenv.2017.10.114.
[7] MP Plucinski, WL Mccaw, JS Gould e BM Wotton, ''Prevendo o número de incêndios Sinicae, vol. 52, pp. 90–98, janeiro de 2016, doi: 10.13360/j.issn.2096-1359.2019.03.020.
[32] R. Pascanu, T. Mikolov e Y. Bengio, "Sobre a dificuldade de treinar redes neurais HAO LIANG nasceu em Jinzhong, Shanxi, China, em
recorrentes", apresentado no 30º Int. Conf. 1989. Ele recebeu os graus de BS e MS em software de
Mach. Learn., Atlanta, GA, EUA, vol. 28, 2013. [On-line]. Disponível: http:// computador e teoria e Ph.D. graduação em automação de
proceedings.mlr.press/v28/pascanu13.pdf [33] ED Übeyli, ''Combinando redes neurais engenharia florestal pela Northeast Forestry University,
recorrentes com métodos de autovetores para classificação de batimentos de ECG'', Digit. China, em 2012, 2014 e 2017, respectivamente. Desde
Processo de Sinal., vol. 19, não. 2, pp. 320–329, 2009, doi: 10.1016/j.dsp.2008.09.002.
2017, ele é professor da Escola de Tecnologia da
Universidade Florestal de Pequim. Seus interesses de
[34] G. Hinton, L. Deng e D. Yu, ''Deep neural networks for acústico modelling in speech
pesquisa incluem inteligência artificial, reconhecimento de
recognition: The shared views of four research groups'', IEEE Signal Process. Mag.,
padrões, silvicultura inteligente, Internet das Coisas e
vol. 29, não. 6, pp. 82–97, novembro de 2012, doi: 10.1109/MSP.2012.2205597.
sistemas autônomos. Ele foi um destinatário dos Fundos
[35] Y. LeCun, Y. Bengio e G. Hinton, ''Deep learning'' , Nature, vol. 521, pp. 436–444, maio de Pesquisa Fundamental para as universidades centrais, em 2017.
de 2015, doi: 10.1038/nature14539.
[36] S. Hochreiter e J. Schmidhuber, "Memória de longo prazo", Neu ral Comput., vol. 9, não.
8, pp. 1735-1780, 1997, doi: 10.1162/neco. 1997.9.8.1735.
[37] M. Sundermeyer, H. Ney, e R. Schlüter, ''De feedforward para redes neurais LSTM
MENG ZHANG nasceu em Harbin, Hei longjiang, China,
recorrentes para modelagem de linguagem'', IEEE/ ACM Trans.
em 1996. Ela recebeu o diploma de bacharel em
Áudio, Fala, Processo de Linguagem., vol. 23, não. 3, pág. 517-529, mar. 2015, doi:
10.1109/TASLP.2015.2400218. automação pela Beijing Forestry University, China, em
[38] D. Monner e JA Reggia, ''Um algoritmo generalizado de treinamento semelhante ao 2018, onde atualmente está cursando o mestrado em
LSTM para redes neurais recorrentes de segunda ordem'', Neural Netw., vol. 25, pp. engenharia de controle.
70–83, jan. 2012, doi: 10.1016/j.neunet.2011.07.003. Seus interesses de pesquisa incluem processamento de
[39] A. Krasovskii, N. Khabarov e J. Pirker, "Modelagem de áreas queimadas na Indonésia: A sinais, big data, inteligência artificial e silvicultura inteligente.
abordagem FLAM", Forests, vol. 9, pág. 437, jul. 2018, doi: 10.3390/f9070437.