Escolar Documentos
Profissional Documentos
Cultura Documentos
1Grupo de Pesquisa em Recifes de Coral e Mudanças Climáticas Globais, Universidade Federal da Bahia
(UFBA), Rua Barão de Jeremoabo, Ondina, Salvador, 40170-115, Bahia, Brasil
Pontos chave:
• As relações entre El Niño, anomalias térmicas e observações de recifes foram usadas para construir modelos
sazonais de previsão de branqueamento de corais.
• Uma abordagem Bayesiana de aprendizado de máquina foi adequada para organizar cinco
variáveis baseadas em ocorrências históricas de branqueamento.
Este artigo foi aceito para publicação e submetido a uma revisão completa por pares, mas não passou pelo
processo de edição de texto, composição tipográfica, paginação e revisão, o que pode levar a diferenças
entre esta versão e a Versão do Registro. Por favor, cite este artigo como doi: 10.1029/2019GL086442
Abstrato
O branqueamento de corais no Oceano Atlântico Norte foi modelado com base na relação histórica entre
observações de recifes (1987 – 2011), indicadores de El Niño e anomalias termais da água do mar.
Os componentes do modelo foram organizados hierarquicamente em uma estrutura de rede bayesiana
de acordo com seu nível de influência no branqueamento de corais para gerar previsões sazonais a serem
confirmadas (ou não) pela previsão quase em tempo real na escala de ~ 5 km. Validações e etapas de
pontuação, utilizadas como critério de comparação entre modelos concorrentes, comprovaram a viabilidade
da abordagem bayesiana para realizar previsões sazonais da ocorrência de branqueamento, atingindo uma
taxa de acerto geral de 84%. Modelos personalizados com bancos de dados restritos a situações
específicas são apresentados como uma alternativa para melhorar os níveis de precisão, mas ao custo
da perda da capacidade preditiva. Os modelos foram desenvolvidos para serem ferramentas conceitualmente
simples e úteis para auxiliar a gestão ambiental por meio de um sistema de alerta precoce para o branqueamento de corais.
Desenvolvemos um modelo capaz de realizar previsões sazonais com base no pressuposto de que o
branqueamento de corais no Oceano Atlântico Norte é causado por uma série de fenômenos
concatenados que começam com o fenômeno El Niño e se manifestam na área de estudo como
anomalias de temperatura. Assim, construímos uma rede bayesiana a partir das relações de causa e efeito entre
um conjunto de variáveis ambientais relevantes e observações de branqueamento de corais coletadas ao longo
de 24 anos. O modelo apresentou uma ordenação coerente de variáveis que permitiu previsões com mais de
80% de precisão da ocorrência de branqueamento de corais. Além disso, os modelos construídos para
situações específicas foram ainda mais precisos, sugerindo a aplicabilidade do modelo como uma
ferramenta potencialmente útil para realizar previsões confiáveis de branqueamento de corais a curto prazo.
1. Introdução
as informações disponíveis, permitem a incorporação dos efeitos das incertezas em uma avaliação
formal dos possíveis resultados (Korb e Nicholson, 2003).
2 Dados e métodos
O agrupamento específico de variáveis usado na presente pesquisa foi selecionado por sua
capacidade de representar o pressuposto teórico sob o qual o modelo é sustentado: o branqueamento da
massa de coral é o resultado final de uma cadeia de eventos subsequentes que começa com o fenômeno
El Niño e se manifesta em a área de estudo alguns meses depois na forma de anomalias positivas de SST.
Essa lógica se mostrou extremamente eficiente na previsão do branqueamento para um caso controle
(recife de Abrolhos no Oceano Atlântico Sul; Lisboa et al., 2018), e nossa intenção aqui também se refere à
formalização de diretrizes para todas as áreas recifais do Oceano Atlântico .
Os dados de branqueamento relativos à nossa área de estudo (porção equatorial do Atlântico Norte
Oceano: 10ÿN - 30ÿN, 60ÿW - 98ÿW) foram obtidos do banco de dados de branqueamento de coral em
escala global desenvolvido por Donner et al. (2017)
(http://www.simondonner.com/bleachingdatabase). Antes de serem utilizados, foram realizados
procedimentos de controle de qualidade, e os dados com informações insuficientes foram descartados (pelo
menos coordenadas geográficas, mês de ocorrência e percentual de branqueamento devem estar presentes).
Observações de campo na mesma data e localizadas na mesma célula da matriz de dados SST foram
classificadas como réplicas, e apenas seus valores modais foram considerados. Essa escolha metodológica
é baseada na suposição de que, em vez de tentar prever a variabilidade de recife a recife ou a variabilidade
entre áreas do mesmo recife, o modelo visa prever o branqueamento em escalas temporais e espaciais
relativamente grandes (ou seja, o modelo foi treinado a partir de dados mensais com uma resolução espacial
de aproximadamente 5 km para gerar saídas mensais de probabilidade de branqueamento). Consideramos
que a parcimônia do modelo era primordial, mantendo o modelo o mais simples possível, mantendo o
número de variáveis, bem como seus estados, camadas e links, o mínimo possível.
UKMO-L4-GLOB) foram usados para calcular os índices térmicos de acordo com as seguintes equações:
ÿ89
=ÿ ÿ
Equação 1
ÿ4
5=ÿ Equação 2
ÿ89
=ÿ ÿ
ÿ ( ) Equação 3
O trimestre de grau de aquecimento (DHT; Equação 1) foi desenvolvido com base no padrão
preditor global de branqueamento: graus de aquecimento semanas (Strong et al., 1997). Esses índices,
responsáveis por rastrear o acúmulo de estresse térmico ao longo do tempo, são baseados na temperatura limiar de
branqueamento (TT; Equação 1 e Figura S1 nas Informações de Apoio (SI)), que representa o limite térmico
acima do qual os corais sofrem o efeitos do estresse térmico (mais detalhes sobre a métrica DHT são fornecidos em
Lisboa et al., 2018).
O outro indicador térmico local, escolhido pela sua reconhecida associação com eventos de branqueamento
(por exemplo, Berkelmans et al., 2004; Wooldridge et al., 2004), refere-se à SST acumulada ao longo de dias
consecutivos. O índice SST5days representa as anomalias positivas curtas e fortes necessárias para
desencadear o clareamento e foi calculado a partir dos valores máximos em cinco dias consecutivos nos três meses
imediatamente anteriores à observação do clareamento (Equação 2).
O último indicador térmico refere-se à anomalia trimestral de SST com base no mês
climatologia com defasagem temporal de seis meses (TSSTA – Equação 3). Este índice foi calculado de forma
a considerar as condições térmicas operadas na última época oposta, partindo do pressuposto de que a
realidade observada no terreno pode ter sido influenciada por condições anómalas anteriores.
Antes de poderem ser usados, os valores numéricos do conjunto de dados de entrada devem ser convertidos
em intervalos mutuamente exclusivos correspondentes às classes das variáveis (por exemplo, classes cold/
mod/warm do índice TSSTA na Figura 1b). Este procedimento foi desenvolvido com base na frequência de
ocorrência das medições no software Belief Network Power Constructor (BNPC; disponível em http://
www.cs.ualberta.ca/˜jcheng/bnpc.htm; Cheng, 1998). O número de classes de cada variável foi determinado
empiricamente comparando-se as taxas de acerto de cada combinação possível.
A arquitetura do modelo foi desenvolvida com base no algoritmo de análise de dependência (BNPC; Cheng
et al., 2002) que mede o fluxo de informações entre as variáveis para estabelecer arcos de conexão entre elas e a
intensidade dessas conexões (Hruschka et al., 2003).
Além disso, foram inseridas as seguintes restrições para refinar a arquitetura do modelo: 1 – A estrutura da rede deve
respeitar a ordem temporal dos eventos. Ou seja, variáveis passadas não podem ser influenciadas por ocorrências
futuras. 2 – Como a área de estudo está em um local remoto, os indicadores do El Niño não podem influenciar
diretamente o branqueamento. 3 – O nó de Bleaching não pode influenciar os outros nós da rede; assim, é um nó
folha.
A última etapa refere-se aos procedimentos de validação que buscam atribuir a confiabilidade e
precisão dos modelos. Os seguintes procedimentos de aprendizado de máquina foram usados
como medidas de desempenho, que foram empregados para comparar os resultados dos testes e
modelos concorrentes e serão apenas brevemente descritos aqui. 1- A validação cruzada leave-one-out
expõe a precisão dos modelos em relação à exatidão da previsão, tomando o estado mais provável
como a previsão e exclui cada caso (um de cada vez, independentemente) antes de realizar a previsão
para as observações excluídas. 2- Funções de pontuação que são definidas como medidas de
calibração de um conjunto de previsões probabilísticas que considera os níveis de crença
reais ao determinar o quão bem eles correspondem aos casos reais (Bickel, 2007). 3- A área sob
a curva de características operacionais do receptor (AUROC) é uma medida que considera
informações como especificidade e sensibilidade para gerar visualizações do nível de precisão
das previsões (Dorfman, et al., 1996). 4- Análises e testes de sensibilidade são análises sob o nó
de consulta (branqueamento) que investigam o grau de influência de cada variável na
probabilidade de branqueamento e mudanças na força de acreditar nas previsões corretas para
modelos concorrentes.
3 Resultados e Discussões
o desequilíbrio entre as categorias pode expressar diferenças reais em sua frequência de ocorrência, para fins de
modelagem, esse desequilíbrio pode comprometer a capacidade preditiva para as categorias menos frequentes.
Para resolver esse desequilíbrio, modelos concorrentes adicionais (modelos 2 e 3) foram treinados a partir de conjuntos
de dados balanceados de acordo com dois procedimentos: para o modelo 2, uma amostra aleatória de observações
foi selecionada (714 instâncias no total) contendo o mesmo número de instâncias para cada branqueamento categoria;
para o modelo 3, as categorias "Moderado" e "Grave" foram agrupadas em uma única categoria quanto à presença de
clareamento. Embora resulte em uma simplificação relevante, esse procedimento foi adotado para projetar um modelo
parcimonioso, que utiliza o maior número possível de observações (nenhum dado foi suprimido), para gerar previsões
mais confiáveis e precisas (medidas apresentadas na subseção 3.3).
Para resolver a questão da concentração de dados nas categorias "Moderado" e "Grave" dos anos
1998/1999 e 2005/2006 (88% das observações; mapas anuais de observações discriminadas pela capacidade de
previsão do modelo, SI Figuras S5- S8), foram realizados procedimentos de validação adicionais que consideraram os
dados dentro e fora dessas janelas de tempo. Taxas de acerto (SI Tabela S1) e valores de AUROC (Figura 1c)
demonstraram que a capacidade preditiva do modelo não se restringe a períodos de maior ocorrência de dados.
As taxas de acerto alcançadas pelos modelos concorrentes mostram uma evolução relevante na precisão
entre os testes realizados (da coluna 1 a 3 da Figura 1a), principalmente quando considerados os casos em que a
previsão térmica quase em tempo real confirmou a previsão sazonal anteriormente realizada pelos indicadores do
El Niño (taxa de acerto geral de 84,48% para o modelo 3). Para este modelo, todas as variáveis apresentaram influência
significativa no estado de clareamento (Figura 1d), pois foram capazes de redefinir o diagnóstico do modelo. A
análise detalhada de dois testes de sensibilidade distintos (mais detalhes SI Figuras S10 e S11), bem como a
validação por categoria de clareamento (SI Tabela S2), mostra que o balanceamento do banco de dados (ou
seja, do modelo 1 para o modelo 2) promoveu um aumento no capacidade de prever eventos “Graves”, mas não
“Moderados” e levou a uma perda em casos “Leves”. Isso é importante porque aponta para a viabilidade de modelar a
ocorrência de branqueamento, em vez da gravidade do branqueamento. Além disso, as melhores pontuações
obtidas em todas as medições justificaram a escolha do modelo 3 (doravante denominado modelo geral) para uma
análise mais detalhada e para servir de base para o desenho de modelos alternativos.
personalizado A construção de BNs a partir de uma técnica de subamostragem resulta de uma mineração de dados
processo que avalia o arranjo espacial e temporal das observações de branqueamento de acordo com as
previsões (mapas de previsão mensais para 1998 e 2005 em SI Animated Maps S7 – S8). Tomando como exemplo os
78 registros recifais de outubro de 2005, já que as observações recifais apresentaram alta representatividade
neste período (regiões mais expressivas na Figura 2a e 2b), 59 desses registros relataram “Bleaching”, sendo 56 deles
(aproximadamente 95 %) sendo corretamente previsto pelo modelo. Quando esses dados foram usados
como um análogo do passado para comparação com os valores de probabilidade alcançados em 2015 (Figura 2c), é
É notável que as previsões indiquem probabilidades ainda mais intensas de branqueamento na Flórida, nas
Bahamas e em Cuba do que em 2005. De fato, relatos de branqueamento severo nessas regiões durante 2015
levaram à declaração do terceiro evento de branqueamento global já registrado (Hughes et al., 2018). Ao analisar a
consistência das previsões para todo o período (os mapas podem ser encontrados no repositório online), fica
claro que a maioria dos casos equivocados se refere a observações coletadas de recifes próximos e aquelas com
informações contrastantes sobre a categoria de branqueamento relatada. Este fenômeno é provavelmente devido ao
padrão errático de branqueamento combinado com a falta de resolução espacial dos dados SST necessários para
monitorar esses processos no nível do recife. Além disso, essas previsões equivocadas mostram que o modelo não
é particularmente vulnerável em regiões remotas, como era esperado devido à baixa disponibilidade de dados de
branqueamento.
Para avaliar a possibilidade de melhorar a eficiência do modelo, subconjuntos de amostras dos recifes
da Flórida, Cuba, Belize e Jamaica, bem como subconjuntos de amostras de anos de El Niño (canônico ou
Modoki; ver Karnauskas 2013 para distinguir os diferentes tipos de El Niño ), foram usados para construir BNs
personalizados. Os resultados das etapas de validação e pontuação (Tabela 1; SI Tabela S3; disposição espacial
e AUROC na Figura S12; análise de sensibilidade na Figura S13) mostram vantagens significativas sobre o modelo
geral em todos os testes, em particular para as previsões convergentes, mostrando consideráveis reduções nas
taxas de erro que não necessariamente se refletem como aumentos nos níveis de acerto devido à perda de
poder de previsão. Nesse ponto, ressalta-se que à medida que o tamanho do banco de dados diminui, o modelo perde
sua capacidade de previsão (Tabela 1; e a falta de cores de fundo na Figura 3), e o mecanismo de ajuste pode
resultar em overfitting (Cheng et al. , 2002). Por outro lado, a técnica de subamostragem oferece vantagens ao
calcular a distribuição de probabilidade e discretizar as variáveis condicionadas apenas ao histórico de
branqueamento local (os intervalos numéricos correspondentes às categorias de todas as variáveis podem
ser encontrados na Tabela S4 do SI).
A série temporal mostra a variação dos nós pais do branqueamento (índices térmicos DHT, SST5days
e TSSTA) durante 2005 para recifes localizados ao redor de Jamaica e Cuba (Figura 3), destacando os períodos de
acordo com o respectivo prognóstico dos modelos (cor de fundo). As áreas não coloridas nos gráficos mostram os
períodos em que os modelos não foram capazes de gerar previsões porque essas condições não estavam presentes
no banco de dados, o que destaca o papel crucial de dados de campo consistentes ao longo do tempo. Vale
ressaltar que em ambas as regiões os valores de SST5days no início do verão foram considerados suficientes
para desencadear o branqueamento pelos diferentes modelos, que provavelmente se intensificou em agosto e
setembro por causa do calor acumulado medido pelo índice DHT (as taxas de acerto para este período específico
foram Jamaica = 85,71%; Cuba = 72,73%)
4. Conclusões
À medida que dados observacionais mais detalhados se tornam disponíveis, o modelo pode ser atualizado e
refinados para resoluções espaço/temporais mais precisas, o que inevitavelmente promoveria uma
melhoria na qualidade das previsões. Finalmente, acreditamos que o modelo aqui desenvolvido representa
um recurso útil para cientistas de recifes de corais, governos e gestores de recifes não apenas por sua
praticidade para informar o branqueamento, mas também pela possibilidade de promover um
entendimento compartilhado por meio da representação gráfica da rede sobre o principal processo
responsável por isso.
Os autores gostariam de agradecer a dois revisores anônimos por suas sugestões criteriosas.
Todo o código personalizado escrito em MATLAB R2015a, mapas animados para os componentes e
previsões do modelo, bem como todos os arquivos usados para construir, treinar e validar os modelos
estão disponíveis em https://data.mendeley.com/datasets/ 7jcpt6ppbw/4.
Este estudo foi financiado em parte pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior –
Brasil (CAPES) – Código Financeiro 001 e pelo Instituto Nacional de Ciência e Tecnologia para os
Ambientes do Atlântico Tropical (inctAmbTropic) sob a concessão no. CNPq 465634/2014-1. A RKPK se
beneficia de uma bolsa do CNPq (PQ-1C).
Referências
Ashok, K., Behera, S., Rao, S., Weng, H., Yamagata, T. (2007). El Niño Modoki e sua possível
teleconexão. J. Geophys. Res, 112(10.1029), 1–3; 9–10; 38
Ban, SS, Pressey, RL e Graham, NAJ (2014). Avaliando interações de múltiplos estressores quando os
dados são limitados: uma rede de crenças bayesiana aplicada a recifes de coral. Mudança Ambiental
Global, 27, 64–72.
Berkelmans, R., De'ath, G., Kininmonth, S., & Skirving, WJ (2004). Uma comparação dos eventos de
branqueamento de corais de 1998 e 2002 na Grande Barreira de Corais: correlação espacial, padrões e
previsões. Recifes de coral, 23, 74–83.
Bickel, JE (2007). Algumas comparações entre regras de pontuação quadrática, esférica e logarítmica.
Análise de decisão, 2, 49-65.
Brown, BE (1997). Branqueamento de Corais: Causas e Consequências. Recifes de coral, 16, 129–138.
Brown, BE, Dunne, RP, Goodson, MS e Douglas, AE (2002). A experiência molda a suscetibilidade de um
coral de recife ao branqueamento. Recifes de coral, 21, 119–126.
Cheng, J., Griener, R., Kelly, J., Bell, D., & Liu, W. (2002). Aprendendo redes bayesianas a partir de
dados: uma abordagem baseada na teoria da informação. Revista Inteligência Artificial, 137, 43-90.
Donlon, CJ, Martin, M., Stark, J., Roberts-Jones, J., Fiedler, E., & Wimmer, W. (2012).
O sistema operacional de análise de gelo e temperatura da superfície do mar (OSTIA), Remote Sens.
Environ., 116, 140–158.
Donner, SD, Rickbeil, GJM, Heron, SF (2017). Um novo banco de dados global de branqueamento de corais
em massa de alta resolução. PLoS ONE 12(4): e0175490.
Dorfman DD, Berbaum KS, Metz CE, Lenth RV, Hanley JA e Abu Dagga H (1996).
Análise adequada das características operacionais do receptor: o modelo bigamma. Academic Radiology,
4, 138-149.
Eakin, CM, Liu, G., Gomez, AM, La Cour, JLD, Heron, SF, Skirving, WJ, et al.
(2016). Branqueamento global de corais 2014-2017? Status e um apelo para observações. Reef
Encounter, 31(1), 20–26.
Gupta, MR, & Chen, Y. (2010). Teoria e utilização do algoritmo EM. Foundation Trends in Signal
Processing, 4, 223–296.
Hoegh-Guldberg, O., Mumby, PJ, Hooten, AJ, Steneck, RS, Greenfield, P., Gomez, E., et al. (2007),
Recifes de coral sob rápidas mudanças climáticas e acidificação dos oceanos. Science,
318(5857):1737-1742.
Hruschka, JRER, Hruschka, ER, & Ebecken, NFF (2003). Uma abordagem bayesiana de seleção
de recursos para extrair regras de classificação com um algoritmo genético de agrupamento.
Inteligência Artificial Aplicada, 17(5–6), 489–506.
Klein, SA, Soden, BJ, & Lau, N. (1999). Variações remotas da temperatura da superfície do mar
durante o ENSO: evidências de uma ponte atmosférica tropical. Journal of Climate, 12, 917–932.
Korb, KB e Nicholson, AE (2003). Inteligência artificial bayesiana. Londres, Reino Unido: Chapman
& Hall.
Lisboa, DS, Kikuchi, RKP, & Leão, ZMAN (2018). El Niño, anomalia da temperatura da
superfície do mar e branqueamento de corais no Atlântico Sul: uma cadeia de eventos modelada com
uma abordagem bayesiana. Jornal de Pesquisa Geofísica: Oceanos, 123.
Loya, Y., K. Yamazato, Y. Nakano, H. Sambali, R. van Woesik (2001). Branqueamento de corais: os
vencedores e os perdedores. Eco. Deixe 4, 122–131.
Napolitana, RE (2004). Aprendizagem de redes bayesianas. Upper Saddle River, NJ: Prentice Hall.
Strong, AE, Barrientos, CS, Duda, C., & Sapper, J. (1997). Técnicas de satélite aprimoradas para monitorar o
branqueamento de recifes de coral. In Proceedings of 8th International Coral Reef Symposium, 2, 1495–1498.
Wooldridge, S., & Done, T. (2004). Aprendendo a prever o branqueamento de corais em larga escala de
eventos passados: uma abordagem Bayesiana usando dados de sensoriamento remoto, dados in-situ e
proxies ambientais. Recifes de coral, 23, 96–108.
Previsão
Funções de pontuação
convergente de branqueamento
Em geral Personalizado
Base de dados Poder de LL* BS* SP*
Erro BN Erro BN AUCROC*
(Observações) previsibilidade (%)0ÿÿ 0ÿ2 0ÿ1
(%) (%) 0ÿ1
Jamaica (36) 12,50 6,67 43,9 0,05 0,04 0,98 0,99
Belize (82) 18h00 7h30 56.1 0,27 0,17 0,90 0,95
Figura 1. (a) Taxas de acerto dos modelos para as três análises de previsão realizadas e os
valores da função score utilizados como critério de comparação entre os modelos. (b) Estrutura
gráfica da BN com a tabela de probabilidades (barras e valores numéricos) condicionada por
eventos "Bleaching" (o nó consulta é tratado como um achado). O modelo condicionado por
eventos “Sem branqueamento” é apresentado na Figura S9 do SI. (c) Curvas das características
operacionais do receptor utilizadas como critério de comparação entre os desempenhos em
diferentes janelas de tempo. (d) Análise de sensibilidade para determinar o grau de influência
das variáveis ambientais no estado de branqueamento. As barras cinzas (pretas) representam a
amplitude da variação na probabilidade de ocorrência de um evento "Bleaching" ("Sem
branqueamento") de acordo com as mudanças nos nós observados no eixo Y.
Figura 2. Mapas suavizados das probabilidades de branqueamento de corais construídos a partir das informações
combinadas dos indicadores termais do modelo (DHT, SST5days e TSSTA) e suas respectivas relações com
dados de branqueamento in situ coletados ao longo de 24 anos. Exemplos para outubro de 2005 em (a) e (b)
com estrelas brancas (pretas) mostrando os locais do "Bleaching"
("Sem branqueamento") observações que o modelo foi capaz de atingir. A mesma análise foi realizada para os
casos em que o modelo errou na previsão, conforme indicado pelos círculos no mapa. Para este mês específico,
o modelo apresentou 82% de precisão (estrelas pretas e brancas), com aproximadamente 78,5% de previsões
equivocadas referentes a falsos positivos (círculos pretos). (c)
Mapa suavizado das probabilidades máximas de branqueamento de corais alcançadas em 2015, quando o
branqueamento de corais foi considerado um evento global, mostrando valores ainda mais altos para a região
plotada em (a) e valores significativamente mais baixos para a região plotada em (b) do que aqueles em 2005
( áreas são realçadas em retângulos para facilitar a comparação).
Figura 3. Séries temporais das estações de recife localizadas ao redor de Cuba (superior) e Jamaica
(inferior) para TSSTA (vermelho), DHT (preto) e SST5days (azul) para 2005, quando níveis severos
de branqueamento foram relatados também nestes recifes em grande parte da área de estudo. A cor
quente (fria) do fundo representa os períodos em que os modelos previram a ocorrência de
branqueamento (sem branqueamento).