Você está na página 1de 172

Universidade Federal de Goiás

Instituto de Ciências Biológicas


Programa de Pós-Graduação em
Ecologia e Evolução

Avaliação de modelos de distribuição de


espécies e sua aplicação na conservação da
onça-pintada (Panthera onca)

Natália Mundim Tôrres

Orientador: Prof. Dr. José Alexandre Felizola Diniz Filho


Co-orientador: Prof. Dr. Paulo De Marco Júnior

Goiânia, novembro de 2010


Universidade Federal de Goiás
Instituto de Ciências Biológicas
Programa de Pós-Graduação em
Ecologia e Evolução

Avaliação de modelos de distribuição de


espécies e sua aplicação na conservação da
onça-pintada (Panthera onca)

Natália Mundim Tôrres

Orientador: Prof. Dr. José Alexandre Felizola Diniz Filho


Co-orientador: Prof. Dr. Paulo De Marco Júnior

Tese apresentada ao Programa de


Pós-graduação em Ecologia e
Evolução da Universidade Federal
de Goiás como parte dos
requisitos necessários para a
obtenção do grau de Doutora em
Ecologia e Evolução

Goiânia, novembro de 2010

ii
Dados Internacionais de Catalogação na Publicação (CIP)
GPT/BC/UFG

Tôrres, Natália Mundim.


T864a Avaliação de modelos de distribuição de espécies e sua
aplicação na conservação da onça-pintada (Panthera onca)
[manuscrito] / Natália Mundim Tôrres . - 2010.
156 f. : il.

Orientador: Prof. Dr. José Alexandre Felizola Diniz


Filho; Co-orientador: Prof. Dr. Paulo De Marco Júnior.
Tese (Doutorado) – Universidade Federal de Goiás,
Instituto de Ciências Biológicas, 2010.
Bibliografia.
Inclui lista de tabelas e figuras.

1. Modelos de Distribuição de Espécies. 2. Onça-pintada


- Conservação. I.Título

CDU: 599.742.714

iii
Tese de Doutorado
Natália Mundim Tôrres

Título:

“Avaliação de modelos de distribuição de espécies e sua


aplicação na conservação da onça-pintada (Panthera onca)”

Comissão Examinadora:

Prof. Dr. José Alexandre Felizola Diniz Filho


Presidente / Orientador
UFG

Prof. Dr. Joaquín Hortal Prof. Dr. Daniel Brito


Membro Titular Interno Membro Titular Interno
Visitante Programa – UFG Vinculado ao Programa –
UFG

Prof. Dr. João Carlos Nabout Prof. Dr. Ricardo Machado


Membro Titular Externo não Membro Titular Externo não
Vinculado ao Programa – Vinculado ao Programa – UnB
UEG

Prof. Dr. Rafael Dias Loyola


Membro Suplente

iv
“Modelos, é claro, nunca são verdadeiros, mas felizmente,
só é necessário que eles sejam úteis. Para isso,
geralmente é preciso apenas que eles não sejam
grosseiramente errados” (Box 1979).

v
AGRADECIMENTOS

Nossa! Como é bom existir um espaço em que posso escrever


livremente, sem me preocupar com referências! As referências dessa seção
vêm das lembranças que ficaram guardadas na mente e no coração dos
últimos (quase) quatro anos...
Primeiramente, gostaria de agradecer ao meu “eterno” orientador, prof.
José Alexandre, pelos DEZ anos de orientação (o que corresponde a “Bodas
de Estanho”)! É isso mesmo! Parece difícil de acreditar, mas foi no ano 2000
que o procurei para que me aceitasse como estagiária, e desde então não
larguei do seu pé. Sei que não correspondi totalmente a todas as suas
expectativas nesse período, mas espero que tenha valido a pena para você
também, Zé! Eu só posso lhe agradecer por toda a paciência, preciosa
orientação e ensinamentos que com certeza foram fundamentais na minha
formação científica. Muito obrigada!
Na seqüência, agradeço ao meu co-orientador prof. Paulo De Marco
Júnior, que foi determinante na conclusão desse trabalho, auxiliando em
diversas análises e discussões dos resultados (claro, o queijinho fresco não
podia faltar para dar uma incentivada). Obrigada pelas palavras de estímulo
nos momentos em que desanimei e por perceber quando eu não agüentava
mais ouvir falar de modelos (e problemas correlatos) só olhando na minha
cara e notando o meu cansaço... Então, me perguntava: “Flor, você está
bem?”, e eu pensava: “Droga, minha cara não me deixa mentir! Que coisa!”.
Obrigada aos demais professores do Programa de Pós Graduação em
Ecologia e Evolução e também a todos os colegas do Laboratório de Ecologia
Teórica e Síntese (LETS) pelo apoio e boa convivência. Em especial,
agradeço ao Ludgero, Thiago Santos, Leandro Juen, Lara, Marina e João por
auxiliarem em algumas das análises realizadas nesse trabalho, e à Fernanda
Cassemiro pela ajuda na revisão e formatação.
Serei eternamente grata ao Instituto Onça-Pintada por reconhecer,
acreditar e investir no meu potencial. Por meio das atividades realizadas no
Instituto (no qual trabalho desde 2002), cresci muito profissionalmente, e tive
o privilégio de aprender tantas coisas, que jamais aprenderia se estivesse me
dedicando somente ao meio acadêmico. Esse vínculo tem sido fundamental

vi
para o meu amadurecimento profissional e pessoal também. Agradeço pela
bolsa de doutorado concedida, e pela convivência e aprendizado com todos
os amigos do IOP. Em especial, aos amigos Anah e Leandro por todo o
incentivo e apoio logístico, intelectual, moral e espiritual – muito obrigada! Ao
querido Tiaguinho pelos prazerosos momentos de brincadeiras e diversos
“causos”. Também à Mariana, Rahel, Grasiela e Marina pela ajuda em
diversas atividades, análises, e pela atenção e estimada amizade.
Aos meus vários amigos e amigas pelo apoio incondicional,
especialmente àquelas amigas “ouvido de pinico” que pacientemente
agüentaram minhas lamúrias e desabafos, oferecendo preciosos conselhos:
Silvia Dutra, Fernanda Cassemiro, Flávia Lima, Camila Chaves, Lorena
Gondim, Thais Pinheiro, Rahel Sollmann, Mariana Furtado, Renata Meyer,
Carla Reis, Mônica Aragona, minha mana Raquel e minha mãe.
Obrigada aos alunos do mini-curso que ministrei na Semana de Biologia
da Unemat em Tangará da Serra em 2009, que me receberam tão bem e me
fizeram sentir como é recompensador ser capaz de passar o conhecimento a
alguém.
Às assíduas colegas do futebolzinho semanal, que passou a ser minha
“sessão descarrego”, auxiliando na manutenção de um estado emocional
(quase) equilibrado...
Gostaria de agradecer a algumas pessoas que conheci nas minhas
andanças pelo Brasil em busca de informações sobre a onça-pintada.
Algumas delas foram marcantes pelo seu desprendimento, apoio, companhia
ou pela quantidade de informações relevantes que me forneceram. Dentre
elas, destaco: Rafael Accorsi, Samuel Nienow, Bocão, Flavia Pinto, Renata
Bocorny, Nelson Rui. Em especial, agradeço ao Sr. Danilo Santana e Sra.
Célia da Fazenda Bebedouro no Maranhão, que me acolheram em sua casa
com tanto carinho e desinteressadamente me apoiaram em uma viagem a
Oxford na qual apresentei parte dos resultados dessa tese. Ainda, parte das
viagens realizadas durante a pesquisa foi financiada pela Fundação O
Boticário de Proteção à Natureza e Monsanto Fund às quais presto aqui
meus sinceros agradecimentos.
Agradeço imensamente a toda minha família, especialmente às minhas
avós, pelo exemplo de vida e carinho. Ao meu irmão Guilherme e minha irmã

vii
Raquel pelo companheirismo e incentivo constante, e é claro aos meus
queridos pais, Luiz Fernando e Wayne Eliane, pela educação que me deram,
pelos valiosos princípios de vida, paciência e imensurável apoio. Vocês são a
base da minha vida! Agradeço também pelo apoio ao Everton, Zilda, Juliana,
Camila e à querida afilhada Ana Júlia, pelos deliciosos momentos de
descontração. E claro, como não poderia deixar de ser, agradeço ao Luiz
Ricardo, meu amado companheiro e melhor amigo. Foi ele quem
acompanhou mais de perto meus melhores e piores momentos nos últimos
anos, e com muuuuita paciência, compreensão e bom humor, conseguiu
agüentar, quase sem reclamar!! OBRIGADA!!!
Agradeço a você, que está lendo essa tese, mesmo que seja apenas a
parte dos agradecimentos! Valeu!

viii
APRESENTAÇÃO

O padrão de distribuição geográfica de espécies é, provavelmente, um


dos tópicos mais estudados na área da Ecologia e um dos aspectos de maior
preocupação por parte de biólogos da conservação, visto que podemos
proteger somente aquelas espécies para as quais possuímos algum
conhecimento sobre sua ocorrência. Entretanto, dados precisos sobre a
ocorrência de espécies demandam muito tempo e recursos financeiros para
que sejam acumulados de maneira satisfatória, sendo que essa questão
muitas vezes dificulta o estabelecimento de estratégias de conservação bem
embasadas. A modelagem de distribuição de espécies (Species Distribution
Modeling - SDM) surgiu recentemente como uma ferramenta capaz de
solucionar este problema, devido à eficiência de modelos que predizem a
distribuição espacial potencial baseado nos requerimentos ecológicos das
espécies, extrapolando para áreas desconhecidas a partir de pontos
conhecidos.
Com o rápido avanço do emprego dessa metodologia em estudos
ecológicos e de conservação, uma diversidade de métodos e questões
relacionadas à sua aplicação surgiu na literatura especializada,
principalmente em relação à quantidade de informações necessárias para a
aplicação dos modelos, maneiras de avaliá-los e empregá-los em estudos
práticos. Seguindo essa tendência, nesta tese são discutidos vários modelos
de distribuição de espécies disponíveis atualmente, bem como as formas de
manipulação dos dados de ocorrência e de avaliação dos resultados obtidos,
além da aplicação desses em práticas conservacionistas.
A onça-pintada (Panthera onca) foi escolhida como espécie modelo
visto que, por ser um predador topo de cadeia alimentar e exigir qualidade
ambiental, desempenha importante função ecológica nos ecossistemas em
que vive e funciona como referencial para o desenvolvimento de uma ciência
da conservação preditiva. Além disso, a quantidade de dados disponíveis de
ocorrência dessa espécie é relativamente alta em comparação com outras, o
que faz com que esse não seja um fator limitante nas avaliações dos
modelos, incrementando, portanto, as opções de manipulação dessas
informações.

ix
O objetivo geral da tese foi analisar o quanto os modelos de distribuição
de espécies podem ser úteis na avaliação da distribuição e conservação de
uma espécie relativamente bem conhecida e de ampla ocorrência, como a
onça-pintada. Os resultados das análises realizadas são apresentados na
forma de três artigos. O primeiro deles aborda aspectos estritamente
metodológicos, considerando o efeito da autocorrelação espacial dos pontos
de presença sobre a eficiência de dois dos mais utilizados métodos de SDM
(Apêndice 1). No segundo artigo, avalia-se a possibilidade de que estimativas
de adequabilidade climática extraídas de SDM possam ser utilizadas como
surrogates para dados de densidade populacional de onça-pintada (Apêndice
2). O terceiro artigo trata da aplicação de modelos de distribuição na
discussão de aspectos conservacionistas para a espécie, considerando
cenários de mudanças climáticas e de uso do solo (Apêndice 3).
A estruturação desta tese foi realizada por meio de seções da seguinte
forma: “introdução e fundamentação teórica”, a qual apresenta uma revisão
geral sobre os modelos de distribuição de espécies, teorias relacionadas ao
tópico, principais vantagens, desvantagens e aplicabilidades; a seção
“objetivos” expõe os objetivos do trabalho, especificando-os de acordo com
cada um dos artigos desenvolvidos; a terceira seção, “metodologia” trata dos
procedimentos metodológicos aplicados no desenvolvimento da tese;
“resultados e discussões” descreve os principais resultados obtidos em cada
um dos artigos, separadamente; assim como a seção seguinte
“considerações finais” que apresenta resumidamente as conclusões
alcançadas. Na última seção, “apêndices”, cada um dos artigos encontra-se
anexado, nos quais são descritos os detalhes das proposições, metodologias,
resultados e discussão.

x
SUMÁRIO

LISTA DE TABELAS........................................................................................xii
LISTA DE FIGURAS.......................................................................................xiii
RESUMO.........................................................................................................xv
ABSTRACT.....................................................................................................xvi
1. INTRODUÇÃO E FUNDAMENTAÇÃO TEÓRICA........................................1
1.1 A modelagem de distribuição de espécies..........................................2
1.2 O processo de modelagem de distribuição..........................................3
1.3 Pressupostos dos modelos e o conceito de nicho...............................4
1.4 Aplicação dos modelos de distribuição na conservação de
espécies...................................................................................................10
1.5 A onça-pintada (Panthera onca) como espécie modelo....................12
2. OBJETIVOS................................................................................................14
3. METODOLOGIA.........................................................................................15
3.1 Levantamento de registros de ocorrência da onça-pintada...............15
3.2 Levantamento de variáveis preditivas (explicativas)..........................17
3.3 Modelos de distribuição de espécies.................................................18
3.4 Avaliação da performance dos modelos............................................23
3.5 Efeitos da restrição de distância nos modelos de distribuição..........25
3.6 Modelos de distribuição e densidade populacional...........................27
3.7 Modelos de envelopes bioclimáticos e conservação da onça-
pintada.....................................................................................................30
4. RESULTADOS E DISCUSSÕES................................................................33
4.1 Efeitos da restrição de distância nos modelos de distribuição..........33
4.2 Modelos de distribuição e densidade populacional...........................41
4.3 Modelos de envelopes bioclimáticos e conservação da onça-
pintada.....................................................................................................47
5. CONSIDERAÇÕES FINAIS........................................................................52
6. REFERÊNCIAS BIBLIOGRÁFICAS............................................................55
APÊNDICES...................................................................................................66

xi
LISTA DE TABELAS

Tabela 1. Descrição resumida dos modelos de distribuição de espécies


utilizados neste trabalho.................................................................................20

Tabela 2. Medidas de desempenho derivadas da matriz de confusão que


foram utilizadas na avaliação da acurácia dos modelos (letras de acordo com
a tabela 3........................................................................................................24

Tabela 3. Matriz de confusão. Extraída de Fielding & Bell (1997)..................24

Tabela 4. Informação sobre as sub-amostras de dados de presença de onça-


pintada obtidas aleatoriamente sob restrições de distância a fim de testar a
influência da autocorrelação espacial na performance de SDM.....................26

Tabela 5. Combinações de modificações de adequabilidade climática e uso


do solo entre predições atuais e para o clima futuro......................................32

Tabela 6. Resultados da avaliação da performance dos modelos para cada


SDM: área sob a curva ROC (AUC), Kappa, acurácia, omissão, comissão e
erro total, para ambas as estratégias de derivação de mapas binários: limiar
baseado na curva ROC (ROC) e limiar do menor valor predito (LPV),
comparados com a distribuição de onça-pintada apresentada por Sanderson
e colaboradores (2002a) utilizada como controle nesse estudo. Em negrito
estão destacados os melhores valores para cada estatística.........................42

Tabela 7. Resultados da regressão entre densidade populacional de onça-


pintada e estimativas de adequabilidade climática derivadas de onze SDM
considerando dois grupos de dados de densidade, com 37 e 17 amostras...44

Tabela 8. Teste t e teste de Levene (F) para estimativas de adequabilidade


derivadas de 11 SDM considerando dois grupos de dados de densidade
populacional de onça-pintada, com 37 e 17 amostras, ambos separados pela
mediana da densidade (3.41 e 3.10 respectivamente) para essas análises
(grupo 1 possui o menor valor de densidade e grupo 2 o valor mais
elevado)..........................................................................................................45

xii
LISTA DE FIGURAS

Figura 1. Localização dos pontos de presença de onça-pintada (n=1819)….17

Figura 2. Localização dos pontos (n = 37) onde a densidade populacional de


onça-pintada foi estimada em levantamentos sistemáticos com armadilhas
fotográficas (adaptado de Maffei et al., 2011). Em cinza está representada a
distribuição original da espécie segundo Sanderson e colaboradores (2002a),
utilizada como controle nesse estudo.............................................................28

Figura 3. Correlograma de distância ambiental para 15 classes de distância


dos registros de presença de onça-pintada em relação ao ótimo da
distribuição modelada da espécie, utilizando coeficientes I de Moran. A linha
pontilhada indica o valor de I de Moran esperado sob a hipótese nula de
ausência de autocorrelação espacial..............................................................33

Figura 4. Resultados das avaliações de sub-amostragens testando o efeito da


distância entre registros utilizados como treino (a) (F(3, 36)=15.699; p<0.001)
e teste (b) (F(3, 36)=16.968; p<0.001) no desempenho preditivo de modelos
de distribuição (Distância de Mahalanobis e Maxent). Área média sob a curva
ROC (AUC) e intervalos de confiança de ±95% (barras verticais) para cada
classe de restrição de distância. Letras diferentes representam diferenças
significativas (p<0.05).....................................................................................35

Figura 5. Resultados das avaliações de sub-amostragens testando o efeito da


distância entre registros utilizados como treino no desempenho preditivo de
modelos de distribuição (Distância de Mahalanobis e Maxent) (F(3,36)= 48.50;
p<0.001). Valores médios de acurácia e intervalos de confiança de ±95%
(barras verticais) para cada classe de restrição de distância. Letras diferentes
representam diferenças significativas (p<0.05). ............................................36

Figura 6. Resultados das avaliações de sub-amostragens testando o efeito da


distância entre registros utilizados como treino nas taxas de erros de omissão
(a) (F(3, 36)=51.25; p<0.001) e erros de comissão (b) (F(3, 36)=9.86; p<
0.001) de modelos de distribuição (Distância de Mahalanobis e Maxent).
Valores médios das taxas de erro e intervalos de confiança de ±95% (barras
verticais) para cada classe de restrição de distância. Letras diferentes
representam diferenças significativas (p<0.05). ............................................38

Figura 7. Resultados das avaliações de sub-amostragens testando o efeito da


distância entre registros utilizados como treino no desempenho preditivo de
modelos de distribuição (Distância de Mahalanobis e Maxent) (F(3,
36)=58.59; p<0.001). Valores médios de Kappa e intervalos de confiança de
±95% (barras verticais) para cada classe de restrição de distância. Letras
diferentes representam diferenças significativas (p<0.05). ............................39

Figura 8. Adequabilidade climática para a onça-pintada considerando o


consenso (ensemble) entre os métodos do DOMAIN e BIOCLIM, para
variáveis climáticas atuais (a) e futuras de acordo com o modelo Community

xiii
Climate System Model – CCSM 3 (b). A variação entre os valores de
adequabilidade de ambas as estimativas é ilustrada no mapa c....................49

Figura 9. Mapa mostrando classificação das células de acordo com


mudanças na adequabilidade climática para onças-pintadas e no uso do solo
entre predições para o clima atual e futuro (considerando apenas variações
maiores ou menores que o percentil de 50% para diferenças positivas e
negativas). As categorias foram nomeadas como: PP - aumento de
adequabilidade ao longo do tempo e cobertura do solo passar de convertida
para área natural; NN - expectativa de declínio na adequabilidade e cobertura
do solo se alterar de natural para convertida; NP - estima-se que
adequabilidade deva aumentar e cobertura do solo se alterar de natural para
convertida; PN - adequabilidade deve sofrer redução ao longo do tempo
enquanto a cobertura do solo é prevista para passar de convertida a
natural.............................................................................................................50

xiv
RESUMO

Recentemente, a Modelagem de Distribuição de Espécies (SDM) tem sido


amplamente utilizada como base para diversos tipos de análises, incluindo
avaliações do impacto de mudanças climáticas na distribuição das espécies e
estabelecimento de estratégias de conservação. Essa metodologia possibilita
a predição da distribuição geográfica potencial com base nos requerimentos
ecológicos dos organismos, extrapolando para áreas desconhecidas a partir
de pontos conhecidos. Existe uma grande variedade de métodos que diferem
quanto à sua habilidade de sintetizar relações significativas entre a ocorrência
das espécies e as variáveis ambientais preditivas adotadas. Essas diferenças
se devem a uma série de fatores que influenciam o desempenho desses
modelos, como por exemplo, as características da espécie, o tipo e
quantidade de dados disponíveis e a escala das análises. Neste trabalho,
adotamos a onça-pintada como espécie modelo para a avaliação de onze
métodos de SDM. Foram analisados os efeitos da autocorrelação espacial
entre pontos de presença na performance dos modelos, e avaliada a relação
entre estimativas de adequabilidade climática obtidas por esses métodos e
dados de densidade populacional de onça-pintada. Os resultados obtidos
serviram como base para a avaliação de aspectos da conservação da
espécie, incluindo análises de como mudanças climáticas globais e do uso do
solo afetarão a sua distribuição e avaliação da eficiência do sistema de áreas
protegidas em manter áreas adequadas para a ocorrência da espécie no
futuro. Foi demonstrado que dependendo do método, a quantidade de dados
da espécie pode influenciar mais os resultados do que a própria
autocorrelação espacial entre os pontos de presença, e que a relação positiva
esperada entre a adequabilidade climática e densidade populacional foi
encontrada para apenas quatro dos métodos, mas sempre com fraco ajuste
dos dados. De acordo com as análises, as áreas protegidas apresentam
maior adequabilidade do que o esperado se elas fossem aleatoriamente
selecionadas, e a eficiência dessas não será comprometida no futuro em
relação à manutenção dessa adequabilidade. Em termos de predições
futuras, a principal conclusão é que algumas das regiões que devem passar
por um incremento da adequabilidade climática para a onça-pintada no futuro
serão convertidas de ambientes naturais para agricultura ou pastagem,
demonstrando que as oportunidades para ações efetivas de conservação da
onça-pintada estão a cada dia se tornando mais restritas, sendo urgente a
necessidade de estratégias pró-ativas de conservação da espécie.

xv
ABSTRACT

Recently, Species Distribution Modelling (SDM) has been widely used as


base for several types of analyses, including evaluations of climate changing
impact on species distribution and conservation strategies settlement. This
methodology enables the prediction of potential geographic distribution based
on species ecological requirements, extrapolating data from known
occurrences to unknown areas. There is a wide variety of methods which
presents different capabilities to synthesize the significant relationships
between species data and the environmental variables used as preditors.
These variations are consequences of a series of factors that influence
model’s performance, such as species characteristics, the kind and quantity of
data available, and the scale of the analyses. In this study we adopted the
jaguar as a model to evaluate eleven SDM. It was evaluated the spatial
autocorrelation effects between presence records on model’s performance,
and the relationship between environmental suitability obtained through these
methods and jaguar population density. The obtained results were used as a
basis for the evaluation of jaguar conservation topics, including analyses of
how global climate changing and land use predictions will affect its distribution
and evaluation of protected areas system in maintaining suitable areas for
species occurrence in the future. It was demonstrated that depending on the
model applied, the species data amount can be more influential than the
spatial autocorrelation between presence points, and that the expected
positive relationship between model-based suitability estimate and jaguar
density was found only for four SDM, but always with a low coefficient of
determination showing a weak data fitness. The analyses also showed that
suitability values inside protected areas are greater than expected by null
model, and this difference tend to increase with the global climate change
scenario evaluated, demonstrating that it is not expected that environmental
suitable areas for jaguars will shift out from the existing protected areas.
Considering future predictions, the main conclusion is that some regions
which must go through an environmental suitability increase for jaguar
occurrence in the future will be converted from natural vegetation to
agricultural land, indicating that the opportunities for jaguar’s effective
conservation actions are daily becoming more restricted, in such a way that
the calling for a proactive conservation approach is urgent.

xvi
1 INTRODUÇÃO E FUNDAMENTAÇÃO TEÓRICA

Recentemente, um dos principais objetivos da biologia da conservação


passou a ser identificar de maneira rápida e barata as áreas mais importantes
para a conservação da biodiversidade (Mittermeier et al. 2004; Brooks et al.
2006; Margules & Sarkar 2007). No entanto, dados precisos de distribuição
das espécies são escassos e caros de se obter em quantidades suficientes
para se implementar análises desse tipo utilizando apenas as ocorrências das
espécies (Williams & Gaston 1994). Em decorrência disso, uma variedade de
técnicas voltadas à predição de distribuição das espécies chamou a atenção
dos cientistas (Guisan & Zimmermann 2000; Elith et al. 2006; Elith &
Leathwick 2009).
No entanto, é importante considerar que essas novas metodologias
são afetadas pela extensão e resolução da escala espacial em que os
estudos são realizados, devendo ser consideradas na escolha do
procedimento que será empregado (Cabeza et al. 2010). Planos de
conservação em grandes escalas devem se basear no conhecimento da
distribuição passada e presente da espécie em questão, assim como na
distribuição dos impactos existentes sobre as populações. Isso possibilita um
maior entendimento do estado de conservação da espécie com base no
habitat remanescente e em estimativas populacionais, garantindo um melhor
planejamento de esforços conservacionistas em escalas de paisagem
(Sanderson et al. 2002b; Wikramanayake et al. 2002).
Um método muito comum utilizado para estudar a distribuição
geográfica de espécies consiste em projetar os registros de presença
disponíveis em um mapa e definir a área entre eles como uma estimativa
qualitativa da extensão de ocorrência da espécie. No entanto, esse método
simplifica excessivamente distinções bióticas e abióticas da área coberta,
como variáveis geográficas, diferenças climáticas e tipos de habitat (Lim et al.
2002). Mais recentemente, a Modelagem de Distribuição de Espécies (ou em
inglês Species Distribution Modeling ou Species Distribution Models, que dá
origem à sigla SDM) tem sido amplamente utilizada como uma alternativa.
Esse método inovador possibilita a confecção de mapas que indicam onde as
espécies podem ocorrer (Fuller et al. 2007; Pearson et al. 2007), baseado em

1
uma medida relacionada com a adequabilidade do local decorrente de suas
características ambientais. Nas últimas décadas, o método tem sido
favorecido pela maior disponibilidade de dados ambientais e ecológicos em
grandes escalas, assim como facilidade de acesso aos Sistemas de
Informação Geográfica, programas de otimização e maior poder
computacional. Consequentemente, a eficiência e opções para modelar e
mapear complexas relações entre espécies e o ambiente têm aumentado
(Rushton et al. 2004; Guisan & Thuiller 2005; Johnson & Gillingham 2005).

1.1 A modelagem de distribuição de espécies

Frequentemente os ecólogos utilizam medidas locais para avaliar


modificações em escalas de paisagem, regionais e globais, e normalmente
modelos estatísticos ou de simulação são utilizados para extrapolar dados
ambientais no espaço (Peters et al. 2004). A modelagem de distribuição de
espécies (SDM) é apenas um exemplo desse tipo de procedimento, mas de
grande importância, já que extrapola dados de distribuição de espécies no
espaço e no tempo, normalmente baseado em um modelo estatístico
(Franklin 2009). Portanto, a SDM pode ser definida como um modelo que
relaciona dados de distribuição de espécies (ocorrência ou abundância em
localizações conhecidas) com informações de características ambientais e/ou
espaciais nessas localizações (Elith & Leathwick 2009), a fim de identificar
condições ambientais nas quais populações podem ser mantidas (Pearson
2007). A técnica tem suas origens na análise de gradientes ecológicos,
biogeografia, sensoriamento remoto e ciência da informação geográfica
(Franklin 2009) e tem apresentado um crescimento acentuado na literatura
científica.
Apesar de o método estar sendo empregado há anos, ainda existe
muita controvérsia em relação à nomenclatura utilizada e sobre o quê
exatamente os modelos descrevem ou predizem, sendo que ainda não há um
consenso em relação a essa questão (Araújo & Guisan 2006; Kearney 2006;
Elith & Leathwick 2009; Soberón & Nakamura 2009). Esses têm sido
descritos de forma variada, como sendo estimativas do nicho fundamental
(potencial), nicho realizado (atual), nicho multivariado, nicho climático

2
(quando condicionados apenas a variáveis climáticas), ou ainda como
estimativas de adequabilidade de habitat (Kearney 2006; Franklin 2009).
Nessa tese o termo Modelagem de Distribuição de Espécies foi
adotado por ser mais genérico e adequado para descrever o processo de
modelagem e o resultado do modelo, seguindo outros autores (Guisan &
Thuiller 2005; Elith & Leathwick 2009; Franklin 2009). Apesar da teoria de
nicho ser a base desses modelos, SMDs descrevem correlações empíricas
entre a distribuição de espécies e variáveis ambientais, sendo que os dados
disponíveis dificilmente permitirão a completa especificação e descrição do
nicho da espécie. Além disso, esses modelos são frequentemente utilizados
para projetar simulações da distribuição potencial das espécies no espaço
geográfico, mas não são capazes de produzir uma definição de seus nichos
(ou sua posição no espaço ambiental) (Jiménez-Valverde et al. 2008; Franklin
2009).
A distinção entre espaço geográfico e espaço ambiental deve ser
muito bem esclarecida em estudos que apliquem SDM. Enquanto o espaço
geográfico é definido como um mapa de distribuição bidimensional ou um
modelo de elevação digital tridimensional, o espaço ambiental é
potencialmente muiti-dimensional, definido por um conjunto de variáveis
preditoras as quais influenciam a espécie. Portanto, quando SDMs são
ajustados utilizando somente preditores ambientais, eles modelam a variação
na ocorrência ou abundância das espécies no espaço ambiental. Esse
conceito possui suas fundações na teoria do nicho ecológico (Pearson 2007;
Elith & Leathwick 2009).

1.2 O processo de modelagem de distribuição

De modo geral, existem duas abordagens principais para desenvolver


a modelagem de distribuição de espécies. Os modelos denominados de
mecanicistas procuram incorporar mecanismos de limitação fisiológica na
tolerância da espécie às condições ambientais, relacionando o ambiente em
que o organismo vive com sua performance. Esses modelos demandam um
conhecimento detalhado das respostas fisiológicas das espécies a fatores
ambientais, restringindo o seu emprego somente para aquelas mais

3
conhecidas. Já os modelos correlativos, que são os mais comumente
empregados, utilizam informações da ocorrência conhecida da espécie para
associar estatisticamente sua presença ou abundância com variáveis
ambientais que podem afetar sua probabilidade de persistência, tais como
dados climáticos, topográficos, tipo do solo e outros. O objetivo é estimar as
condições ambientais que são apropriadas para a espécie, partindo-se do
pressuposto de que os registros utilizados oferecem informações úteis sobre
seus requerimentos ecológicos. O resultado obtido é um mapa da
probabilidade de ocorrência ao longo da paisagem ou um índice de
adequabilidade de ocupação da área (Kearney 2006; Pearson 2007).
Idealmente, um procedimento para elaboração de um modelo de
distribuição de espécie deve seguir seis passos básicos (Guisan &
Zimmermann 2000; Franklin 2009):
1. Conceitualização: definição de um modelo teórico ou conceitual
dos fatores abióticos e bióticos que controlam a distribuição da
espécie no tempo e no espaço, em diferentes escalas;
2. Preparação dos dados: informações sobre ocorrência da
espécie (localizações) no espaço geográfico (medida de
presença, uso de habitat, abundância ou outra característica) e
mapas digitais de variáveis ambientais representando aqueles
fatores que determinam a qualidade do habitat para a espécie
considerada;
3. Ajuste do modelo: aplicação de um modelo adequado
relacionando os requerimentos de habitat ou uso de habitat
(ocorrências da espécie) às variáveis ambientais. O modelo
pode ser estatístico, descritivo, lógico ou baseado em regras;
4. Avaliação do modelo: utilização de dados e critérios para validar
as predições e uma maneira de interpretar os erros ou
incertezas da análise;
5. Predições espaciais: utilizar ferramentas, tais como regras,
limiares, pesos ou coeficientes aos valores obtidos pelo modelo
para gerar um novo mapa da métrica relacionada com a
ocorrência da espécie;

4
6. Avaliação da aplicabilidade do modelo: considerando a grande
variedade de modelos existente, alguns podem ser mais
adequados para determinadas aplicações do que outros, e isso
deve ser levado em consideração.
Previamente à aplicação de um modelo de distribuição para um
determinado propósito, o ideal é que muitas decisões sejam tomadas sobre: a
teoria subjacente; os próprios modelos a serem aplicados e a maneira como
serão validados; sobre os dados da espécie em questão e as variáveis
preditivas. As características da espécie (incluindo sua ecologia, história de
vida e distribuição), a escala das análises e os dados disponíveis para a
modelagem são determinantes para a definição da melhor estratégia de
modelagem para uma determinada aplicação (Franklin 2009).
Existe uma grande variedade de métodos que podem ser utilizados na
tentativa de se relacionar dados de distribuição geográfica (ocorrência das
espécies) com variáveis ambientais preditivas (Guisan & Zimmermann 2000;
Austin 2002; Segurado & Araújo 2004), e provavelmente essas técnicas
diferem quanto à sua habilidade em sintetizar relações significativas entre a
ocorrência da espécie e estas variáveis preditivas.
A maior diferença entre estes métodos está no tipo e qualidade mínima
de dados necessários. Alguns exigem boa qualidade de dados de
presença/ausência para gerar funções estatísticas ou regras determinantes
que permitam realizar uma classificação do habitat adequado de acordo com
a distribuição dos pontos de presença e ausência da espécie. Neste grupo
estão incluídos: os Modelos Lineares Generalizados (GLM) (Miller & Franklin
2002), Modelos Aditivos Generalizados (GAM) (Lehmann 1998), além de
métodos baseados em Árvores de Decisão (CART) e Redes Neuronais
Artificiais (ANN) (Brotons et al. 2004). Um segundo grupo de metodologias
inclui Análise Fatorial do Nicho Ecológico (ENFA) (Hirzel et al. 2002),
Algoritmo Genético para Produção de Conjunto de Regras (GARP) (Stockwell
& Noble 1992), BIOCLIM (Nix 1986; Busby 1991) e DOMAIN (Carpenter et al.
1993), sendo que esses métodos exigem somente registros de presença, e
foram desenvolvidos para permitir o uso de dados de regiões onde a
informação de ausência é inadequada ou inexistente.

5
As técnicas que utilizam apenas dados de presença procuram definir
os intervalos das variáveis ambientais onde a espécie pode existir,
considerando a amplitude destas variáveis nos pontos onde a espécie está
presente. Apesar de sua utilidade, principalmente considerando a escassez
de dados confiáveis de ausência das espécies, esses modelos devem ser
interpretados com certa precaução devido à falta desses dados, que estariam
restringindo as predições obtidas (Brotons et al., 2004; Engler et al., 2004).
Desta forma, para que sejam obtidos modelos mais confiáveis, é necessário
um maior número de pontos de presença (Stockwell & Peterson, 2002).
Raramente as informações sobre ocorrência de espécies utilizadas em
modelagem de distribuição são coletadas sistematicamente com essa
finalidade, sendo que o mais comum é o uso de bancos de dados já
existentes. Apesar da existência de extensos bancos de dados de coleções
biológicas, amplamente disponibilizados online na Internet (por ex: GBIF
(http://data.gbif.org/)), eles geralmente são elaborados sem uma estratégia de
coleta pré-estabelecida (Stockwell & Peterson 2002). Por isso, esses dados
tendem a apresentar acurácias menores, variáveis ou desconhecidas, visto
que se originaram de observações oportunísticas e não planejadas, vindas de
uma variedade de fontes de integridade ignorada (Franklin 2009).
Informações de museus e herbários, levantamentos históricos ou outras
fontes muitas vezes apresentam tendências ou imprecisões na localização
dos pontos de ocorrência, comumente indicando apenas um local de
referência, como uma cidade ou um rio, em uma escala de quilômetros ou
mais (Austin 2002; Engler et al. 2004). Além disso, normalmente são
disponibilizados apenas dados de presença das espécies. Erros espaciais na
localização dos dados de espécies prejudicam a performance de modelos de
distribuição, apesar de alguns métodos de modelagem serem menos
susceptíveis do que outros a esse tipo de erro (Graham et al. 2008). Outro
problema de difícil detecção que pode ocorrer refere-se a erros de
identificação, sendo particularmente problemáticos para espécies crípticas ou
subespécies que sejam morfologicamente similares, mas que possuem
requerimentos ecológicos muito distintos, ou ainda no caso daquelas fontes
de dados que contém observações indiretas ao invés de apenas referências
aos espécimes (Lozier et al. 2009).

6
Uma outra questão central e recorrente na construção de SDMs está
relacionada com a identificação da escala apropriada para a modelagem,
sendo relevante tanto para a distribuição das espécies quanto do ambiente
(Guisan & Thuiller 2005; Elith & Leathwick 2009). A escala espacial possui
dois componentes: a extensão (ou domínio), relacionada à área na qual o
estudo é realizado, e a resolução (ou grid) definida como o tamanho da
unidade amostral em que os dados são registrados (Austin 2007).
Compreender a teoria e os processos que governam o padrão observado de
distribuição das espécies é essencial para evitar divergências entre a escala
utilizada nas modelagens e aquela na qual os processos ocorrem. Padrões
observados em uma escala podem não ser aparentes em outra, sendo que a
escala apropriada para o desenvolvimento de uma análise depende dos
objetivos do estudo, do sistema considerado e dos dados disponíveis (Guisan
& Thuiller 2005; Elith & Leathwick 2009). Alguns autores têm enfatizado a
noção de hierarquia na avaliação das influências do ambiente sobre a
distribuição das espécies, de modo que em extensões continentais o clima é
considerado o fator dominante enquanto que em escalas regionais e locais
fatores como topografia e cobertura do solo tornam-se mais importantes
(Pearson & Dawson 2003; Cabeza et al. 2010).
Tanto a natureza dos dados quanto o método adotado determinam a
interpretação apropriada da predição obtida pelos modelos de distribuição de
espécies. Uma possibilidade é utilizá-los para interpolar ou completar lacunas
de informação geográfica de onde a espécie ocorre (para aquelas cuja
distribuição esteja em equilíbrio com as condições ambientais). Por outro
lado, o modelo pode predizer condições adequadas para a espécie persistir
(mais utilizado para organismos de maior mobilidade ou aqueles que não
estão em equilíbrio com o ambiente). Dessa forma, é feita uma extrapolação
de áreas onde a espécie pode ocorrer com base nas localizações
conhecidas, tanto para o tempo presente quanto para o passado ou futuro,
dependendo do objetivo (Chefaoui & Lobo 2008). O tipo dos dados de
ocorrência da espécie estudada determina quando o SDM é mais adequado
para realizar interpolações ou extrapolações, afetando também a
interpretação do resultado e predição espacial (Franklin 2009).

7
Atualmente, os modelos de distribuição de espécies são utilizados
como base para vários tipos de análises em ecologia, biogeografia, evolução
e mais recentemente, em biologia da conservação e pesquisa de mudanças
climáticas (Guisan & Thuiller 2005). Dentre essas aplicações, podem ser
citadas: conhecer o status de reservas naturais e indicar o estabelecimento
de novas unidades de conservação (Ferrier 2002; Araújo et al. 2004), guiar
pesquisas de maneira mais eficiente, indicando possíveis locais de ocorrência
de espécies raras (Elith & Burgman 2002; Engler et al. 2004), estimar o
impacto do clima, uso do solo e outras mudanças ambientais na distribuição
de espécies (Thomas et al. 2004; Thuiller 2004) e avaliar a proliferação de
espécies invasoras (Peterson 2003).

1.3 Pressupostos dos modelos e o conceito de nicho

Considerando que tanto os dados de ocorrência das espécies quanto


as variáveis ambientais são normalmente amostrados durante um período
limitado no tempo e espaço, modelos construídos utilizando essas
informações podem refletir somente um retrato momentâneo da relação
esperada entre essas variáveis (Guisan & Thuiller 2005). Modelos de
distribuição estática são desenvolvidos a partir de ferramentas
estatisticamente simples ou derivados teoricamente, e assumem
automaticamente o equilíbrio – ou pelo menos o pseudo-equilíbrio – entre os
padrões observados da espécie e o ambiente em que ela ocorre (Guisan &
Zimmermann 2000). Apesar desse ser um pressuposto estabelecido para
projeções dos modelos no espaço e tempo, poucos são os trabalhos que
avaliam considerações críticas sobre o quanto um sistema modelado está
realmente em equilíbrio (Araújo & Pearson 2005), e quanto tempo seria
necessário para alcançar um novo estado de equilíbrio, como por exemplo,
após mudanças ambientais (Davis et al. 1998).
As áreas de distribuição das espécies são geralmente representadas
por mapas, os quais são considerados abstrações. Subjacentes a essas
abstrações estão as observações dos padrões temporais e espaciais da
distribuição dos organismos no planeta (Brown et al. 1996; Gaston 2003).
Três importantes grupos de fatores determinam esses padrões (Guisan &

8
Thuiller 2005; Soberón & Peterson 2005): a capacidade de dispersão das
espécies, seja pelos seus próprios movimentos ou pela ação de agentes
dispersores, o que determina quais as partes do globo são acessíveis aos
indivíduos; a distribuição espacial de condições favoráveis ao
estabelecimento, sobrevivência e reprodução dos indivíduos, a qual
estabelece os limites gerais das distribuições; e o ambiente biótico,
constituído pelos competidores, predadores e patógenos, juntamente com a
disponibilidade e dinâmica dos recursos, determinante da estrutura refinada
da distribuição. Apesar de outros fatores existirem, tais como o padrão de
distúrbios no meio ambiente, esses três são de fundamental importância para
a compreensão da relação entre áreas de distribuição e nichos (Soberón
2007).
Uma característica evidente dos modelos de distribuição de espécies é
seu embasamento no conceito de nicho (Guisan & Zimmermann 2000;
Soberón 2007). O nicho é considerado um conceito central em ecologia e
evolução, que remonta a Grinnell (1917) e apesar das diversas definições
existentes, a separação de seu conceito em duas classes principais tem sido
útil nas discussões desse tópico. Uma das classes é denominada de nicho
Grinnelliano, a qual pode ser definida por variáveis fundamentalmente não
interativas e condições ambientais em largas escalas, relevantes para o
entendimento das propriedades ecológicas e geográficas das espécies em
amplas escalas (Grinnell 1917; Peterson 2003). A outra classe, o nicho
Eltoniano, está relacionada a interações bióticas e dinâmicas de consumo de
recursos, podendo ser compreendida principalmente em escalas espaciais
locais (Elton 1927; Leibold 1996). As idéias iniciais de nicho fundamental e
nicho realizado de Hutchinson (1957, 1978) podem ser aplicadas a ambas as
classes respectivamente, assim como o conceito de espaço multidimensional
das variáveis que definem o nicho das espécies (Chase & Leibold 2003).
Nos estudos de modelagem de distribuição, o mais comum é encontrar
a definição de que estes métodos quantificam o nicho realizado das espécies,
visto que as ocorrências utilizadas já estão limitadas por interações bióticas e
recursos restritos (Guisan & Thuiller 2005). No entanto, a escala usada na
modelagem é essencial para a definição do quê, realmente, está sendo
modelado. Desta forma, Soberón (2007) argumenta que as modelagens

9
definem o nicho como sendo Grinnelliano, já que as condições ambientais
equivalentes à definição dessa classe do nicho são mais relevantes em
escalas de estudo maiores (> 1 km2), como ocorre nas SDMs, ao passo que
as interações bióticas, equivalentes ao nicho de Elton passam a ser mais
influentes em escalas menores (< 1 km2). Sendo assim, na escala espacial
em que as modelagens são feitas e as distribuições definidas, a presença de
competidores, por exemplo, não significa a redução da área de distribuição
de uma espécie (Soberón 2007).
No entanto, como a distribuição de uma espécie também é
determinada por interações bióticas, efeitos antropogênicos, eventos
estocásticos e outros fatores que não são incorporados nesses modelos, os
resultados devem ser considerados como distribuições potenciais (Hortal et
al. 2008, Jiménez-Valverde et al. 2008). Além disso, modelos são
reconhecidos como simplificações de uma realidade complexa e difícil de ser
compreendida que possibilitam um melhor entendimento dessa realidade (ou
de parte dela), e a modelagem de distribuição de espécies é caracterizada
pela simplicidade. Entretanto, essa propriedade pode levar a limitações na
aplicação desse tipo de método na prática, gerando, portanto, a necessidade
de inserção de fatores mais complexos e realistas nesses modelos que
estejam relacionados com fenômenos que atuam em escalas mais restritas.
Apenas dessa forma esse tipo de abordagem pode ser adotado de maneira
eficiente em trabalhos práticos, como por exemplo, de biologia da
conservação.

1.4 Aplicação dos modelos de distribuição na conservação de espécies

Diversos estudos têm discutido aspectos relacionados com as


implicações da escala espacial para planejamento sistemático da
conservação, demonstrando que a extensão e resolução espacial
necessariamente influenciam as ferramentas de modelagem que podem ser
empregadas (ver exemplos: Seo et al. 2009; Cabeza et al. 2010). Além disso,
como apresentado anteriormente, é importante identificar a escala apropriada
de análise com base nos diferentes aspectos ambientais, visto que existe
uma hierarquia de fatores atuando em diferentes escalas (Pearson & Dawson

10
2003). Desta forma, enquanto que em escalas continentais o clima é
considerado o fator dominante, regionalmente a topografia e uso do solo
passam a ser mais importantes, ao passo que reduzindo ainda mais a escala,
interações bióticas e o microclima se tornam significantes (Pearson &
Dawson 2003). Considerando esse cenário, os modelos de distribuição de
espécies estão sendo cada vez mais utilizados na definição de estratégias de
conservação, fornecendo conhecimento sobre o nicho climático das espécies
em amplas escalas e sobre sua distribuição potencial (Soberón & Peterson
2005, Araújo & Guisan 2006, Soberón 2007).
Em todo o mundo, as maiores ameaças à biodiversidade derivam da
crescente ocupação das paisagens naturais por atividades antrópicas (Ehrlich
1997; Davies et al. 2006). A remoção dos hábitats naturais e a formação de
fragmentos menores e isolados são as conseqüências diretas dessa
ocupação (Wilcox & Murphy 1985). Ainda a fragmentação dos hábitats muitas
vezes leva à ruptura de conexões, prejudicando a dispersão entre indivíduos
distribuídos em sub-populações da paisagem (Hansson 1991; Sala et al.
2000; Jenkins 2003). Além desses fatores, recentemente, mudanças
climáticas globais têm sido citadas como responsáveis por significativas
alterações nas distribuições geográficas das espécies (Burns et al. 2003). As
respostas das espécies a modificações passadas e atuais do clima sugerem
a possibilidade de que mudanças antropogênicas climáticas podem atuar
como uma causa relevante de extinção em um futuro próximo (Thomas et al.
2004; Thuiller et al. 2005). Entender como as espécies responderão a essas
modificações futuras do clima é de fundamental importância para o manejo
efetivo e conservação da biodiversidade (Hijmans & Graham 2006).
Nesse contexto, modelos de distribuição relativamente simples como
os envelopes bioclimáticos têm sido amplamente utilizados para estimar a
intensidade potencial de mudanças futuras nas distribuições, e indicar quais
espécies, hábitats e regiões estão sob maior risco em relação às mudanças
climáticas globais (Hannah et al. 2002; Pearson & Dawson 2003; Guisan &
Thuiller 2005; Thuiller et al. 2008; Coetzee et al. 2009). Esses modelos
devem ser interpretados e aplicados com cautela, sempre considerando suas
limitações, incluindo a incapacidade de modelar interações bióticas, padrões
de dispersão, mudanças evolutivas e a dificuldade em validar as predições

11
obtidas (Hannah et al. 2002; Pearson & Dawson 2003; Lawler et al. 2006).
Essas predições devem, portanto, ser interpretadas como aproximações
iniciais indicando a magnitude e padrão geral dos impactos futuros ao invés
de simulações acuradas das distribuições futuras das espécies (Pearson &
Dawson 2003). Tem sido relatado na literatura que nem sempre um método
que apresenta bom desempenho na predição da distribuição atual de uma
espécie apresenta uma performance igualmente eficiente para o futuro
(Araújo et al. 2005), sendo importante também essa ponderação ao aplicar
essa metodologia.
A combinação dos resultados dessas modelagens com modelos de
projeções de uso do solo é crucial para projetar mapas de distribuição de
espécies que sejam mais aplicáveis a problemas reais de conservação
(Hannah et al. 2002). Prever onde espécies podem sofrer com as
conseqüências da fragmentação pode permitir que tomadores de decisão
atuem de maneira pró-ativa, conservando regiões chave para a manutenção
da conexão antes que o desenvolvimento iminente torne os custos com a
conservação proibitivos nessas áreas (Ahern 1995).

1.5 A onça-pintada (Panthera onca) como espécie modelo

Nos diversos hábitats em que vivem, os predadores de topo de cadeia


alimentar desempenham importante função ecológica, tanto diretamente
através do controle de populações das espécies de presas, bem como
indiretamente na manutenção da diversidade e abundância de espécies
vegetais (Terborgh 1988; Redford 1992; Silveira 2004). Geralmente possuem
hábitos solitários, territoriais, necessitando de extensas áreas de vida e
abundância de presas naturais para se manterem, reproduzirem e
dispersarem (Crawshaw & Quigley 1991; Silveira 1999; Jácomo 1999), sendo
consideradas como espécies guarda-chuva. Portanto, espécies desse grupo
são consideradas como modelo para o desenvolvimento de uma ciência da
conservação preditiva e pró-ativa.
A onça-pintada Panthera onca (Linnaeus 1758) é o maior felino do
continente americano, sendo o seu corpo robusto, compacto e musculoso,
podendo chegar a pesar 130 kg (Oliveira & Cassaro 2005). Necessita de

12
grandes áreas com baixa influência humana para manter populações
reprodutivamente viáveis. Já foram registradas mais de 85 espécies de
presas desse predador, sendo que espécies de médio e grande porte como
antas, veados, capivaras, queixadas e tatus são as de maior preferência
(González & Miller 2002; Silveira 2004). Habita geralmente florestas,
cerradões e bosques, preferindo lugares sombrios e úmidos, principalmente
áreas com alto grau de conservação, grande disponibilidade de presas e
suprimento de água (Oliveira & Cassaro 2005; Cheida et al. 2006).
Sua distribuição histórica englobava desde o sudeste da Argentina até
o sudoeste dos Estados Unidos (Guggisberg 1975; Swank & Teer 1989).
Apesar de sua vasta distribuição, cobrindo atualmente 19 nações (hoje é
considerada regionalmente extinta em El Salvador e no Uruguai) (IUCN
2010), a onça-pintada ainda é um dos membros menos conhecidos do grupo
Panthera (Sunquist & Sunquist 2002; Zeller 2007). Em uma primeira
avaliação da situação de conservação da espécie, concluiu-se que a perda
de hábitat natural era a principal causa da redução de sua área de
distribuição (Swank & Teer 1989). Atualmente, acredita-se que sua
distribuição seja apenas 55% da extensão original, devido principalmente à
conversão de ambientes naturais causada pela ação antrópica (Zeller 2007).
Alguns estudos prévios já consideraram avaliações em larga escala
para a conservação da onça-pintada (Sanderson et al 2002a; Zeller 2007;
Rabinowitz & Zeller 2010), mas este trabalho é o primeiro que incorpora
aspectos relacionados ao nicho ambiental dessa espécie em questões
conservacionistas. O fato de ser relativamente bem estudada em comparação
com outros organismos tropicais favorece o acúmulo de informações
adicionais tanto de ocorrência quanto de densidade populacional para
incrementar as avaliações dos modelos de distribuição a serem aplicados. A
utilização de informações sobre a adequabilidade ambiental de uma espécie
que apresenta altos requerimentos ecológicos como a onça-pintada favorece
sua utilização como substituto (surrogate) em avaliações de sistemas de
unidades de conservação e na indicação de áreas importantes para a sua
persistência ao longo do tempo e da comunidade associada.

13
2 OBJETIVOS

Essa tese tem como objetivo geral analisar o quanto os modelos de


distribuição de espécies podem ser úteis na avaliação da distribuição
geográfica e da situação de conservação de uma espécie relativamente bem
conhecida e de ampla ocorrência geográfica, como a onça-pintada. Os
objetivos específicos referem-se a cada um dos artigos produzidos e seguem
relacionados a seguir:

- Avaliar qual é o impacto do grau de independência espacial que há


entre as amostras de pontos de presença sobre a qualidade dos modelos de
distribuição geográfica potencial (Apêndice 1);
- Testar se estimativas de adequabilidade climática derivadas de SDM
podem servir como substitutos (surrogates) para dados de densidade
populacional de onça-pintada ao longo de sua distribuição (Apêndice 2);
- Analisar de que maneira as mudanças climáticas globais afetarão a
distribuição e adequabilidade da onça-pintada (Apêndice 3);
- Examinar se áreas de maior adequabilidade possuem hábitats
favoráveis para a ocorrência da onça-pintada, considerando o clima atual e
um cenário de mudanças climáticas para o futuro (Apêndice 3);
- Testar se existe relação entre alterações de adequabilidade e
alterações no uso do solo, segundo cenários projetados para o futuro
(Apêndice 3);
- Avaliar a eficiência dos sistemas de áreas protegidas ao longo da
distribuição da onça-pintada em manter áreas de alta adequabilidade para a
espécie (Apêndice 3).

14
3 METODOLOGIA

3.1 Levantamento de registros de ocorrência da onça-pintada

A principal base de dados utilizada no desenvolvimento das análises


dessa tese consiste no levantamento de registros de ocorrência
(coordenadas geográficas) da onça-pintada (Panthera onca). De maneira
geral, para a extensão de ocorrência original da onça-pintada, que vai do sul
dos Estados Unidos até o sudeste da Argentina, foram realizados
levantamentos de sua presença por meio de distintas fontes: livros e artigos
científicos; bancos de dados on line, tais como: Global Biodiversity
Information Facility GBIF - http://www.gbif.org/, SpeciesLink -
http://splink.cria.org.br, Museum of Vertebrate Zoology -
http://www.mip.berkeley.edu/mvz/index.html e informações de pesquisadores
que trabalham com a espécie em outros países. Especialmente para o Brasil,
foram adicionados registros obtidos em trabalhos de campo realizados pela
Organização Não-Governamental Instituto Onça-Pintada (IOP) através de
armadilhas fotográficas e entrevistas com moradores locais e dados não
publicados de pesquisadores parceiros que gentilmente autorizaram o uso
dessas informações.
Como parte dos esforços para levantamento de informações sobre
ocorrência da onça-pintada em regiões consideradas como “lacunas de
conhecimento”, foram realizadas viagens a campo, sendo visitados alguns
locais nos Estados de Rondônia, Roraima, Acre, Mato Grosso e Goiás.
Nessas ocasiões, foram realizadas entrevistas com professores de
universidades, fiscais e analistas técnicos do IBAMA, policiais do Batalhão de
Polícia Ambiental, funcionários de museus e instituições de pesquisa,
moradores locais e caçadores. Quando informações precisas de localização
da espécie eram disponibilizadas por essas pessoas, as mesmas eram
adicionadas ao banco de dados.
Apesar dos registros não terem sido levantados de forma sistemática e
poderem apresentar alguma imprecisão em sua localização, esses erros são
dissipados devido à escala de trabalho, de maneira que esses dados
(adquiridos de diversas fontes e metodologias) são a melhor alternativa para

15
desenvolver as análises realizadas em larga escala. Não foram consideradas
informações de ausência, visto que essas dificilmente estão disponíveis em
coleções ou bancos de dados, além da dificuldade de diferenciação entre
uma ausência verdadeira e falha de detecção (Gu & Swihart 2004).
No total, foram acumulados 1819 registros georreferenciados de
presença de onça-pintada, os quais foram padronizados para um sistema de
coordenadas geográficas em graus decimais (Figura 1). Uma lista completa
das referências desses dados pode ser encontrada no Anexo (arquivo digital).
Considerando que a acurácia dos modelos de distribuição de espécies
é limitada pela qualidade dos dados de distribuição e do conjunto de dados
climáticos e topográficos, optou-se por utilizar uma grid de 0.0417 graus
decimais (aproximadamente 4 km em células próximas à Linha do Equador).
Sob essa restrição, obtivemos 1409 registros espacialmente únicos para
utilizar nos processos de modelagem.

16
!

! !
!
!

!!
!

!
!
! !
!!
±
!
!!
!
! ! ! !
!
!
!! !!
!
!
!!
!!! !
! !! ! !!!!!
!!!
! !
!!
!
!!
!!!!!
!!
!!
!!!
!
! !
!!
!!
!! !
!!
!!
!!
!
!!
!
!
! ! !
!!!!
!!
!
!! !! ! ! !!
!
!! ! ! ! !!!
!!!
!! !! ! !!!! !
!!
!!! !!!
!! !
!! ! !

! !
!!
!!!!!
!! !!
!!
! !!! ! ! !!
!!
!
!! !
!!!!
!! ! !
!!!
! !!!!
!! ! !!! !
! !! !
!
!
!
!
!
!
!!
! !!! ! !!!
!
!
!
!
!!
!
!
!
!! !! !
!
!!!!
!!
!!!
!! ! !
!! ! !! !!
! ! ! ! !
! ! ! !
!
!
!! ! !! !! !!
! !! !! !!! ! ! !! !
! !! ! !! ! !!
! !! ! !! ! ! ! !! !! !
!
!
! !!
! !
!!!
! ! !! ! !!
!!!! !
!!
!!!!
! !!
!!! ! !!! !
!
!
! !
!!
! !! ! !
! ! ! ! !!
!
! ! ! ! ! ! !
! ! !
!!!
!! ! !
!! !
! !!
! !
! !! !
! !! ! !
! !! ! !! ! !! !!
! !! !
! !! ! !! ! !
! ! ! !!
! !! !!
!! !! !! !!
! ! !
! ! !!! ! !! ! !! ! ! !
! !! ! ! !!
! ! !!!
! !!! ! !! !
! ! !!
! !!! ! ! !! !!!
!!! !! !
!! ! !!!!! !! !! ! ! !!!
!!
! ! ! ! !!!! !!!!!! !
!!
!!!!!!
!! ! !!!
!!!
! !
!
!
!!! !
!
!!
!
! ! !!!
!! !
!!
!
!
!
!!
! !! ! !! !!! ! ! !!
!!!!!
! !!!! !!
!
!!
!
!! ! !! ! !
!!!!!!! !!
!
!!!
!
!
!
!
!
!
!
!!
! ! !
! !
! ! ! ! ! !
!! ! !!! !!!
!
! !!! !!! !! !!!! !!
!
!!!
!!!!!
! !!
!!
!!!!!! !
!!
!!! ! !
!!
! !! !!! !!
!
! !! ! !!!!! ! ! !!!!! !
!! !
!!!!! ! !!
!!! !!! !!
!
! !
!!!! !!!! !!!!! !!!!
!! !!! !
!!
!! ! !
!!
!!! !!
!!! ! ! ! !!! !!!!! ! !!!!!! !! !
!!!! ! ! ! !!!
!!!
!
! ! ! ! !!! !
! !!!!!! ! !! !!
! !!
!
!
!
! !
! !!!! !! !! !!! !!! !! !! !! !!
!!!! !! ! !! !!! ! ! !
!! !!! !!
!
!
!
! ! ! ! !!! ! ! !! ! !
! !!
!!!!!!!! !!!!! !!!
! !
! ! !! ! !!
!!
!!!
!!
!!
!
!!
!
!
!
!
!
!
!
!!
!!
! ! ! !
! ! !
!!
! !!
!!
!! !! ! !
!
!
!
!! !! ! !! ! ! !
!
!
!
!
!!! !
! ! !
!! !! !!
! !
!!
!
!!
!!
!!
!
!
!
!! !!!!
!
! ! !
!
!
!! ! !! ! ! !
! ! !! !!
!!! ! !
!! ! !
! ! !
!!
! ! ! !!!
! !
!
!
!!!!! !! !
! ! !!!!! !! !!!!!!!! !
!
!
!
!
!
!!
! ! !! !! ! ! !! !
!
!
!
!!!
!!!! ! ! ! ! ! ! !
!!
!!!! ! ! !! !
!
!! ! ! !!!
!!! ! ! !
!! ! ! ! !!
!! !! ! !
! !! ! ! !!! !!
! !! !!!
!!! ! !
!
!
!!

Figura 1. Localização dos pontos de presença de onça-pintada (n = 1819).

3.2 Levantamento de variáveis preditivas (explicativas)

As variáveis preditivas utilizadas nesse trabalho consistiram de dez


variáveis climáticas derivadas do WORLDCLIM (http://www.worldclim.org/) e
duas variáveis topográficas derivadas do modelo de elevação global digital
Hydro-1K (http://edcdaac.usgs.gov/gtopo30/hydro/):
- precipitação no trimestre mais frio,
- precipitação no trimestre mais quente,
- sazonalidade da precipitação (coeficiente de variação),
- precipitação anual,
- temperatura média no trimestre mais úmido,

17
- temperatura média no trimestre mais seco,
- temperatura máxima do período mais quente,
- temperatura mínima no período mais frio,
- sazonalidade da temperatura (desvio padrão *100),
- temperatura média anual,
- altitude;
- inclinação.

Todas as variáveis foram convertidas para uma grid de resolução 2,5


minutos (≈ 0,0417 graus), a mesma resolução adotada para os dados de
ocorrência da onça-pintada.
Para modelar a distribuição futura da onça-pintada (Apêndice 3), as
mesmas variáveis ambientais listadas acima foram utilizadas, considerando o
Modelo Community Climate System Model – CCSM 3 (Vertenstein et al.
2004). Composto por quatro modelos separados que simulam
simultaneamente a atmosfera terrestre, oceano, superfície terrestre e gelo
oceânico, e um componente acoplador central, esse modelo permite
avaliações de situações climáticas futuras (Vertenstein et al. 2004).

3.3 Modelos de distribuição de espécies

As onze técnicas de modelagem de distribuição de espécies


empregadas nesse trabalho foram selecionadas com base na restrição de se
utilizar apenas dados de presença, visto que dados de ausência raramente
são disponíveis, como explicado anteriormente. Entretanto, para vários dos
métodos aplicados foi necessário utilizar dados de ausência simulada (ou
pseudo-ausências), que consistem em pontos amostrados aleatoriamente ao
longo da área considerada onde a espécie não foi registrada (Elith et al.
2006) (i.e. Maxent, CTA, RF, GBM, MARS, MDA, ANN, GARP). Ainda,
considera-se que o uso de um extenso banco de dados de presença de onça-
pintada possa reduzir os problemas inerentes relacionados a métodos que
utilizam apenas esses dados, visto que representam uma descrição mais
completa do nicho ecológico da onça-pintada. Os SDM utilizados variam
quanto à sua complexidade, dos mais simples como envelopes bioclimáticos

18
e métodos baseados em distância a métodos mais complexos baseados em
regressão e inteligência artificial. Uma descrição resumida de cada um deles
encontra-se na Tabela 1.

19
Tabela 1. Descrição resumida dos modelos de distribuição de espécies utilizados neste trabalho.
SDM Descrição Resumida Software Referências

Envelope O BIOCLIM prediz locais com condições climáticas DIVA-GIS Nix (1986),
Bioclimático favoráveis à espécie com base no cálculo de um envelope Busby (1991)
(BIOCLIM) retilíneo mínimo no espaço climático multidimensional. O
modelo cria um perfil climático a partir de um conjunto de
fatores ambientais utilizando dados de treino. Para cada
variável, os valores de todos os pontos utilizados como
treino são classificados em ordem numérica, e os valores
mínimo, de 5%, 95% e máximo são definidos. Os dados
climáticos para cada grid são comparados com o perfil
climático para definir se o clima é adequado ou não para a
espécie.

Distância de A Distância de Mahalanobis é um método que classifica as Modelo Farber &


Mahalanobis (MD) áreas potenciais pela sua distância de Mahalanobis a um implementado Kadmon (2003)
vetor que expressa as condições médias do ambiente de no MATLAB
todos os registros no espaço ambiental. Para cada célula do
grid, a distância dessa média é projetada e representa uma
variável quantitativa que espera-se ser inversamente
correlacionada ao valor de adequabilidade ambiental da
célula para a espécie.

DOMAIN No DOMAIN, a distância de Gower é calculada entre os DIVA-GIS Carpenter et al.


valores das variáveis ambientais de cada célula e de cada (1993)
ponto de ocorrência. Essa distância é utilizada como uma
medida de similaridade ponto a ponto para definir um valor
de classificação a cada célula da grid com base na sua
proximidade no espaço ambiental ao ponto de maior
similaridade.

20
Máxima Entropia O Maxent estima a probabilidade de uma espécie estar MaxEnt Phillips et al.
(Maxent) presente ao buscar a distribuição de máxima entropia (ou (2006)
seja, a mais amplamente distribuída ou mais próxima da
uniforme) sujeita a um conjunto de restrições que
representam as informações incompletas sobre a
distribuição da espécie em questão.

Classification Tree O CTA consiste em repetidas partições do espaço BIOMOD Breiman et al.
Analysis (CTA) dimensional definido pelos preditores em grupos da maneira (1984),
mais homogênea possível, tomando como base as variáveis Segurado &
preditivas. A árvore que minimiza a heterogeneidade de Araújo (2004)
cada ramo com o número mínimo de ramos é determinada
por uma validação cruzada entre todas as árvores
possíveis.

Random Forest O método do RF gera muitas árvores de classificação com BIOMOD Prasad et al.
(RF) base em um conjunto aleatório dos preditores. Cada árvore (2006)
é completa e o resultado final é obtido calculando a média
de todos os resultados parciais.

Generalized O GBM procura gerar um grande número de modelos BIOMOD Friedman


Boosting Models relativamente simples cujas predições são combinadas para (2001),
(GBM) originar estimativas mais robustas da resposta. O algoritmo Segurado &
utiliza uma boosted regression tree onde cada modelo Araújo (2004),
individual consiste de uma árvore de classificação ou Elith et al.
regressão. (2006)

21
Multivariate O método do MARS irá sistematicamente identificar e BIOMOD Moisen &
Adaptive estimar um modelo no qual os coeficientes diferem com Frescino
Regression Spline base nos níveis das variáveis explanatórias. O limiar que (2002), Elith et
(MARS) define uma mudança no coeficiente do modelo é al. (2006)
denominado de spline knot, sendo que o método é similar a
uma regressão piecewise.

Mixture Esse é um método de classificação baseado em uma BIOMOD Manel (1999)


Discriminant combinação de modelos, reconhecido como uma extensão
Analysis (MDA) da análise linear discriminante. Ele cria combinações
lineares de variáveis com uma combinação de erros
normais que melhor diferenciam entre grupos de localização
definidos pela presença ou ausência da espécie.

Artificial Neural Redes neurais são modelos não lineares com um grande BIOMOD Segurado &
Network (ANN) número de parâmetros. Esses modelos são uma forma Araújo (2004)
flexível de gerar um modelo linear. A melhor rede é
selecionada através de um procedimento de validação
cruzada baseado na acurácia de cada resultado possível.

Algoritmo O GARP é um modelo que define o nicho fundamental DK-GARP Stockwell &
Genético para através da produção de um conjunto de regras que são Noble (1992)
Produção de selecionadas através de um algoritmo genético. O programa
Conjunto de opera sobre o conjunto de regras, realizando uma espécie
Regras (GARP) de “seleção natural”, excluindo regras menos eficientes e
criando novos conjuntos de regras a partir de “indivíduos”
sobreviventes.

22
3.4 Avaliação da performance dos modelos

Inicialmente, foi computada a área sob a curva ROC (AUC) para cada
um dos modelos gerados, a fim de diferenciar e comparar a performance dos
resultados obtidos. O AUC é um dos métodos de avaliação do poder
discriminatório de modelos mais amplamente utilizado, de maneira
independente de limiares (Fielding & Bell 1997). A curva é obtida inserindo
em um gráfico a sensitividade em função dos erros de comissão (1 -
especificidade) para todos os valores de limiares possíveis de uma predição
probabilística da ocorrência da espécie em questão. Modelos que
apresentam elevada performance são indicados por grandes áreas sob a
curva ROC (Manel et al. 2001). Normalmente, valores de AUC entre 0.5 e 0.7
sugerem baixa acurácia, valores entre 0.7 e 0.9 indicam resultados úteis para
aplicações e valores acima de 0.9 demonstram alta acurácia do modelo
avaliado (Swets 1988). Apesar do AUC não ser uma medida absoluta e ser
sensível ao método pelo qual as ausências ou pseudo-ausências são
selecionadas na avaliação (Lobo et al. 2008), ele permanece como uma
medida válida da performance relativa de modelos quando comparados entre
métodos diferentes ou entre tamanhos de amostras para a mesma espécie e
área de estudo (Wisz et al. 2008).
Além disso, foram calculadas outras métricas de performance,
incluindo acurácia total, taxa de omissão, taxa de sobreprevisão (comissão) e
Kappa (Tabela 2). Para realizar essas análises, foi necessário obter as
matrizes de confusão que identificam verdadeiros positivos (a), falsos
positivos (b), falsos negativos (c) e verdadeiros negativos (d) dos casos
preditos por cada um dos modelos avaliados (Fielding & Bell 1997) (Tabela
3).

23
Tabela 2. Medidas de desempenho derivadas da matriz de confusão que
foram utilizadas na avaliação da acurácia dos modelos (letras de acordo com
a tabela 3 abaixo, sendo N = a+b+c+d).
Medidas Cálculo
Taxa de omissão c/(a + c)
Taxa de sobreprevisão b/(b+d)
Sensitividade a/(a+c)
Especificidade d/(b+d)
Acurácia (a+d)/N
(((a+c)(a+b)+(b+d)(c+d))/N)]/[N-
Kappa
(((a+c)(a+b)+(b+d)(c+d))/N)]

Tabela 3. Matriz de confusão. Extraída de Fielding & Bell (1997)

Distribuição Controle
Presente Ausente
Distribuição Presente a (verdadeiro positivo) b (falso positivo)
prevista Ausente c (falso negativo) d (verdadeiro negativo)

Foram implementadas duas estratégias distintas para derivar mapas


binários de presença-ausência de onça-pintada a partir de mapas contínuos
de adequabilidade (e assim obter as matrizes de confusão): o limiar baseado
na curva ROC (corresponde ao ponto na curva ROC que possui a menor
distância ao canto superior esquerdo da curva), maximizando a soma da
sensibilidade com a especificidade; e o limiar do menor valor predito (que é o
menor valor predito para a adequabilidade climática correspondente a um
registro de presença) (Liu et al. 2005; Phillips et al. 2006; Pearson 2007). A
sensitividade é a proporção de presenças observadas que são preditas como
presença, e quantifica erros de omissão, enquanto que a especificidade é a
proporção de ausências observadas que são preditas como tal, quantificando
erros de comissão (Allouche et al. 2006). O Kappa oferece um índice que
considera tanto erros de omissão quanto comissão e corrige a acurácia total
das predições do modelo pela acurácia que seria esperada para ocorrer ao

24
acaso (Cohen 1960). Os valores de Kappa variam de -1 a +1, sendo que +1
indica um ajuste perfeito e valores menores ou iguais a zero indicam uma
performance não melhor do que a randômica (Cohen 1960).
Para avaliar as predições binárias obtidas conforme explicado acima,
foi adotada como “distribuição controle” as regiões geográficas da onça-
pintada (Jaguar Geographic Regions - JGRs) apresentadas por Sanderson e
colaboradores (2002a), as quais são unidades geográficas definidas por
habitat potencial e bioregiões ao longo da distribuição histórica da onça-
pintada (Figura 2).

3.5 Efeitos da restrição de distância nos modelos de distribuição

Com o intuito de testar o impacto do nível de independência espacial


dos registros de presença utilizados como entrada nos modelos de
distribuição de espécies (Apêndice 1), foram realizadas subdivisões
aleatórias dos dados originais de onça-pintada em diferentes grupos, sujeitos
a restrições de distância espacial. A fim de se definir qual seria a distância
mínima para separar os registros e, assim garantir a independência espacial
entre eles, foi feita uma análise através de índices I de Moran com a
adequabilidade climática obtida por Distância de Mahalanobis, considerada
como uma síntese da variação espacial das variáveis ambientais utilizadas
na modelagem de distribuição. Foram consideradas 15 classes de distância
para calcular a autocorrelação espacial, separadas de forma eqüitativa,
variando de 184 km a 1798 km.
O correlograma foi utilizado como um guia para avaliar como o
aumento na distância mínima entre os registros de ocorrência pode afetar os
modelos de distribuição. Foram obtidas 10 sub-amostras para cada uma das
distâncias estabelecidas (300 km, 500 km, 700 km e 900 km), sendo que a
maior distância, de 900 km, segundo o correlograma, gera a restrição na qual
a independência ambiental máxima entre os pontos de ocorrência é
estabelecida. É importante ressaltar que, devido às restrições geométricas na
distribuição espacial, o aumento da distância mínima reduz necessariamente
o número de ocorrências disponíveis para cada sub-amostra. Desta forma,
buscou-se também encontrar aleatoriamente o número máximo de registros

25
de presença para cada uma das restrições de distância, que foram de 100
pontos, 50, 30 e 20 respectivamente (Tabela 4). Os pontos restantes do
conjunto original de dados de presença de onça-pintada foram utilizados
como dados teste para avaliação dos modelos obtidos. Para cada uma das
sub-amostras, foram gerados modelos utilizando os métodos de Distância de
Mahalanobis e Maxent.

Tabela 4. Informação sobre as sub-amostras de dados de


presença de onça-pintada obtidas aleatoriamente sob restrições
de distância a fim de testar a influência da autocorrelação espacial
na performance de SDM
N. amostras Restrição de distância N. pontos de treino
(km)
10 300 100
10 500 50
10 700 30
10 900 20

Para testar o efeito da restrição de distância (e consequentemente do


número de pontos das sub-amostras) na performance dos resultados obtidos
através da Distância de Mahalanobis e Maxent, foi realizada uma Análise de
e Variância de Medidas Repetidas (Zar 1999), considerando todas as
métricas de avaliação dos modelos (AUC, Kappa, acurácia, erros de omissão
e erros de comissão). Os pressupostos de normalidade e homogeneidade de
variâncias foram testados (teste de Levene) e quando violados,
transformações logarítmicas foram utilizadas para estabilizar a variância. O
teste de Tukey foi aplicado quando a ANOVA apresentou resultados
significativos, com o objetivo de determinar qual restrição de distância possui
médias significativamente diferentes.

26
3.6 Modelos de distribuição e densidade populacional

Para as análises realizadas no Apêndice 2, primeiramente foi


necessário levantar dados de densidade populacional de onça-pintada ao
longo de sua distribuição. Em uma publicação recente, Maffei e
colaboradores (2011) compilaram informações de 83 estudos que utilizaram
armadilhas fotográficas para amostrar populações de onça-pintada em 14
países diferentes, discutindo o desenho amostral e resultados desses
trabalhos. Do total de estudos, 44 apresentaram estimativas de densidade
populacional, sendo que sete deles falharam em detectar a presença de
onça-pintada, apesar do registro de indivíduos por outros meios (como por
exemplo, rastros, fezes, observação direta). Esses últimos não foram
considerados porque alguns problemas podem explicar os resultados
negativos, incluindo falha nos equipamentos, esforço insuficiente de
amostragem ou localização das armadilhas fotográficas combinada com falta
de conhecimento das rotas das onças-pintadas. Desconsiderando esses
casos, foram obtidas informações de densidade de onça-pintada para 37
localizações (Figura 2).

27
Figura 2. Localização dos pontos (n = 37) onde a densidade populacional de
onça-pintada foi estimada em levantamentos sistemáticos com armadilhas
fotográficas (adaptado de Maffei et al. 2011). Em cinza está representada a
distribuição original da espécie segundo Sanderson e colaboradores (2002a),
utilizada como controle nesse estudo.

No entanto, estimativas de densidade muitas vezes não são


consistentes para serem utilizadas em comparações porque dependem da
escala espacial na qual os valores de abundância foram originalmente
estimados (Smallwood 1999). Devido a isso, é preciso ponderar que as
estimativas de densidade são extremamente sensíveis ao cálculo da área
efetivamente amostrada, a qual depende do tamanho do buffer considerado
no entorno das armadilhas (Maffei et al. 2011). Discussões a respeito desse
tópico levaram à recomendação de que pesquisas com armadilhas
fotográficas que tenham como objetivo estudar densidade populacional

28
devem abranger uma área equivalente a pelo menos a área de vida de quatro
indivíduos da espécie em questão (Maffei & Noss 2008). Para a onça-
pintada, esse valor varia ao longo de sua distribuição, sendo de 100 a 180
km2 na América Central e entre 500 e 600 km2 na América do Sul (Maffei et
al. 2011). Considerando essa restrição, e adotando uma estratégia mais
conservadora, o grupo de 37 localizações com dados de densidade decai
para 17 localizações, ao aplicar essa recomendação. Foram utilizados os
dois conjuntos de dados para analisar e comparar a relação entre estimativas
de adequabilidade climática obtidas pelos SDM e estimativas de densidade
populacional.
Para realizar essas análises, primeiramente foram extraídos os valores
de adequabilidade para as localizações dos estudos de densidade
populacional. Foi testada uma regressão linear entre esses valores para os
dois conjuntos de dados (com 37 e 17 pontos), na qual definimos densidade
como variável resposta e adequabilidade climática de cada modelo como
variável explanatória. Além disso, foi testada uma regressão linear entre os
valores de AUC e Kappa para cada SDM e o coeficiente de regressão entre
adequabilidade e densidade, a fim de verificar se os melhores modelos
identificados pelo AUC e Kappa são os que apresentaram melhor relação
com as estimativas de densidade populacional.
Os dados de densidade (de ambos os conjuntos, de 37 e 17 valores)
foram divididos em dois grupos de acordo com o valor de sua mediana, e um
teste t para amostras independentes foi conduzido para determinar se existe
diferença na média de adequabilidade dos grupos para cada um dos SDM.
Também foi realizada uma comparação das distribuições dos resultados
utilizando um teste de Levene para determinar se os desvios padrão (ou
variâncias) são iguais entre regiões com valores de densidade altos e baixos,
já que a relação entre adequabilidade climática e densidade populacional
aparentemente pode formar um envelope de restrição espacial (ver Brown
1995).

29
3.7 Modelos de envelopes bioclimáticos e conservação da onça-pintada

Para o terceiro artigo (Apêndice 3), foram elaboradas algumas


questões com o objetivo de orientar as análises realizadas, sendo elas:
1. Áreas de maior adequabilidade climática de acordo com os
modelos de envelopes bioclimáticos apresentam hábitats
favoráveis para a ocorrência e persistência local da onça-pintada?
2. Qual é o nível de eficiência dos sistemas de áreas protegidas ao
longo da distribuição da onça-pintada em manter áreas de alta
adequabilidade climática para essa espécie?
3. Como as mudanças climáticas globais afetarão a
representatividade da onça-pintada em termos de adequabilidade
ao longo de sua distribuição?
4. Qual é a relação entre variação de adequabilidade climática para a
onça-pintada de acordo com as mudanças climáticas e
modificações previstas para o uso do solo, e como essas
alterações afetam a distribuição da espécie?
Parte dos métodos utilizados foi definida com base nas análises
realizadas anteriormente (Apêndice 1 e 2). Assim, com o objetivo de reduzir a
autocorrelação espacial dos pontos de ocorrência de onça-pintada, foram
consideradas as dez sub-amostras geradas com uma distância mínima de
500 km entre os registros (cada uma delas possuindo 50 pontos de
ocorrência). Essa opção foi selecionada com base nas avaliações de
desempenho dos modelos realizadas no primeiro artigo, de forma a equilibrar
o controle da autocorrelação espacial e a restrição do número de registros a
serem utilizados nos modelos de distribuição, que, neste caso, foram
escolhidos com base nas análises do segundo artigo. Foram adotados o
DOMAIN (Carpenter et al. 1993) e o BIOCLIM (Nix 1986; Busby 1991) como
métodos eficientes na descrição dos limites da distribuição potencial da onça-
pintada e correlação com dados de densidade populacional.
Desta forma, foram gerados modelos para cada uma das dez sub-
amostras, e calculadas as médias das adequabilidades ambientais obtidas,
considerando ambos os métodos. Os resultados foram combinados aplicando
a técnica de ensemble forecasting (Araújo & New 2007), tanto para o clima

30
atual quanto futuro, a fim de produzir mapas que apresentem soluções mais
conservativas.
Em relação aos dados de uso do solo, foi adotado o modelo Integrated
Model to Assess the Global Environment (IMAGE) (IMAGE, version 2.2)
(IMAGE Team 2001), que é uma avaliação dinâmica integrada das mudanças
ambientais globais em decorrência das atividades humanas. Esse modelo
quantifica a importância relativa dos principais processos e interações no
sistema sociedade/biosfera/clima, explorando a dinâmica das alterações
ambientais globais em longo prazo. Para mapear a extensão de áreas de
agricultura, consideram-se variáveis que influenciam o uso da terra, tais como
cobertura prévia do solo, cobertura vegetal potencial, produtividade da
lavoura, fatores de manejo, densidade da população humana e demanda por
comida, combustível e madeira (IMAGE Team 2001). A cobertura do solo foi
mapeada utilizando uma resolução de 0.5 por 0.5 graus decimais para os
anos de 2000 e 2080. Duas categorias foram consideradas: vegetação
natural (classes 2 a 19) e áreas de agricultura ou convertidas (classe 1).
A fim de avaliar a eficiência potencial do Sistema de Áreas Protegidas
ao longo da distribuição da onça-pintada, foi utilizado o banco de dados
World Database on Protected Areas (http://www.wdpa.org/) (UNEP-WCMC
2009), sendo selecionadas áreas das categorias I a IV da IUCN.
Para analisar se regiões com maior adequabilidade climática possuem
hábitats favoráveis para a onça-pintada, a distribuição de freqüência de
adequabilidade em áreas de vegetação natural foi comparada com um
modelo nulo gerado por meio de 5000 aleatorizações das posições das
células com cobertura natural. A distribuição média das freqüências dessas
aleatorizações foi utilizada como modelo nulo nas comparações, tanto para o
clima atual quanto futuro. Essa mesma metodologia foi adotada na avaliação
das áreas protegidas, considerando os valores de adequabilidade no interior
das mesmas.
Foram produzidos dois mapas de distribuição potencial da onça-
pintada, com base no método do consenso (ensemble forecast): um
correspondente à adequabilidade climática atual em termos de clima e o
outro relativo às predições futuras. Comparando as duas estimativas, foi

31
possível avaliar de que maneira as mudanças climáticas globais devem afetar
a distribuição da espécie e sua adequabilidade ambiental.
As estimativas do IMAGE (IMAGE, version 2.2) (IMAGE Team 2001)
foram adotadas na avaliação da relação entre ganho ou perda de
adequabilidade e alterações de uso do solo de áreas naturais para
convertidas ou vice-versa. Para isso, foram calculadas as diferenças entre as
predições atuais e futuras para ambas as variáveis. Os dados foram
organizados em uma tabela de contingência divididos em quatro grupos,
correspondendo a: 1) número de células onde se espera que a
adequabilidade aumente ao longo do tempo e a cobertura do solo mude de
convertida para natural; 2) quantidade de células onde a adequabilidade deve
sofrer redução e a cobertura do solo passar de natural a convertida; 3)
número de células onde a adequabilidade deve aumentar e a cobertura ser
alterada de natural para convertida; 4) células para as quais espera-se uma
redução de adequabilidade climática e alteração da cobertura do solo de
convertida para natural (Tabela 5). A relação foi analisada pela estatística de
Odds Ratio (Jewell 2004), sendo que para evitar variações insignificantes,
apenas diferenças maiores ou menores que o percentil de 50% foram
consideradas (este corte foi determinado tanto para células com diferenças
positivas quanto negativas, separadamente).

Tabela 5. Combinações de modificações de


adequabilidade climática e uso do solo entre
predições atuais e para o clima futuro

Uso do Solo
Positiva Negativa
Positiva PP (1) PN (3)
Adequabilidade
ambiental Negativa NP (4) NN (2)

32
4 RESULTADOS E DISCUSSÕES

4.1 Efeitos da restrição de distância nos modelos de distribuição

A análise do correlograma obtido (Figura 3) permite concluir que a


adequabilidade climática está fortemente autocorrelacionada ao longo do
espaço geográfico com significativos valores de I de Moran nas primeiras
quatro classes de distância. Os valores de I de Moran decrescem até
aproximadamente 900 km de distância entre os pontos, quando tornam-se
próximos aos valores esperados ao acaso, sugerindo que as ocorrências de
onça-pintada passam a ser independentes a partir desse ponto. Sendo
assim, essa restrição foi adotada como a maior distância entre ocorrências de
onça-pintada para gerar as sub-amostras independentes.

0.35

0.30

0.25

0.20

0.15
I de Moran

0.10

0.05

0.00

-0.05

-0.10

-0.15
0 2000 4000 6000 8000 10000 12000 14000 16000 18000
Distância (km)

Figura 3. Correlograma de distância ambiental para 15 classes de distância dos


registros de presença de onça-pintada em relação ao ótimo da distribuição
modelada da espécie, utilizando coeficientes I de Moran. A linha pontilhada
indica o valor de I de Moran esperado sob a hipótese nula de ausência de
autocorrelação espacial.

33
Considerando todas as métricas de avaliação utilizadas nesse estudo,
os resultados obtidos com ambos os modelos de Distância de Mahalanobis e
Maxent apresentaram padrões de variação bastante distintos para os valores
médios entre as classes de distância empregadas.
Para os valores de AUC obtidos com os dados de treino, foi possível
notar que os resultados dos modelos de MD são sensíveis à distância entre
os registros utilizados (F(3, 36)=15.699; p<0.001), de modo que o AUC
aumenta principalmente nas maiores classes de distância (700 e 900 km).
Obviamente, esses efeitos de distância são também devido ao tamanho
amostral, já que distâncias maiores para controlar a autocorrelação espacial
somente podem ser adotadas com o consequente decréscimo das amostras.
Por outro lado, os resultados do Maxent são muito menos afetados pelo
tamanho das amostras (e distância entre os registros), com a maior parte dos
valores de AUC para as classes de distância sendo equivalentes (p>0.05)
(Figura 4a).
De maneira geral, os valores de AUC de ambos os métodos com
dados de teste foram menores do que aqueles obtidos com dados de treino,
como era de se esperar. Ainda assim, o padrão geral das curvas foi parecido,
com o Maxent demonstrando menos sensibilidade do que MD (F(3, 36)=16.968;
p<0.001) (Figura 4b), o qual apresentou alguma variação entre as classes de
distância.

34
0.95 0.95

0.94
(a) 0.94
(b) Distância de Mahalanobis
c
Maxent
0.93 0.93
c
0.92 d c 0.92
b
b d
0.91 b 0.91
AUC - dados de treino

AUC - dados de teste


d
0.90 b d 0.90

0.89 0.89 a a

a
0.88 0.88 d
a b
b
0.87 0.87 b d b
b
0.86 a 0.86 c
Distância de Mahalanobis
0.85 0.85
Maxent c
0.84 0.84

0.83 0.83
300 500 700 900 300 500 700 900
Classes de distância Classes de distância

Figura 4. Resultados das avaliações de sub-amostragens testando o efeito da distância entre registros utilizados como treino (a)
(F(3, 36)=15.699; p<0.001) e teste (b) (F(3, 36)=16.968; p<0.001) no desempenho preditivo de modelos de distribuição (Distância
de Mahalanobis e Maxent). Área média sob a curva ROC (AUC) e intervalos de confiança de ±95% (barras verticais) para cada
classe de restrição de distância. Letras diferentes representam diferenças significativas (p<0.05).

35
Para os valores de acurácia, os resultados do Maxent apresentaram
novamente menos sensibilidade às restrições de distância do que MD, com uma
fraca influência nas classes extremas (de 300 e 900 km). Os resultados dessas
duas classes foram equivalentes (p>0.05) assim como aqueles obtidos com 500
e 700 km (Figura 5). Diferentemente, resultados da MD são influenciados
principalmente nas últimas duas classes de distância, nas quais se observa uma
redução significativa na acurácia das amostras separadas por 700 e 900 km
(F(3,36)=48.50; p<0.001) (Figura 5). Além disso, é evidente a distinção entre os
valores de acurácia para os dois métodos avaliados: enquanto os valores
médios para Maxent variaram entre 0.10 e 0.14, para MD essa variação ficou
entre 0.77 e 0.89.

1.0
Distância de Mahalanobis

0.9 Maxent
a a
b
0.8
c
0.7

0.6
Acurácia

0.5

0.4

0.3

0.2

0.1 d d
e e

0.0
300 500 700 900
Classes de distância

Figura 5. Resultados das avaliações de sub-amostragens testando o efeito da


distância entre registros utilizados como treino no desempenho preditivo de
modelos de distribuição (Distância de Mahalanobis e Maxent) (F(3,36)= 48.50;
p<0.001). Valores médios de acurácia e intervalos de confiança de ±95% (barras
verticais) para cada classe de restrição de distância. Letras diferentes
representam diferenças significativas (p<0.05).

36
Em relação aos erros de omissão, para os modelos gerados com o
Maxent, as sub-amostras da primeira (300 km) e última (900 km) classes de
distância apresentaram resultados estatisticamente equivalentes (p>0.05) e
menores do que das classes mediadas (de 500 e 700 km) (Figura 6a). Além
disso, foi detectada influência da restrição de distância para a última classe
dos modelos gerados pela MD (F(3, 36)=51.25; p<0.001).
Ao contrário das demais métricas de performance analisadas, os erros
de comissão dos resultados da MD não foram influenciados pelas restrições
de distância entre os registros, com valores médios baixos, variando de 0.003
a 0.008. O mesmo padrão de falta de sensibilidade foi encontrado para as
predições realizadas pelo Maxent, no entanto, os valores médios de erros de
comissão foram bem superiores, indo de 0.98 a 0.99 (F(3, 36)=9.86; p< 0.001)
(Figura 6b).

37
1.1 1.1

1.0
(a) 1.0
(b)
c d d d
0.9 0.9

0.8 0.8
d
e c e
0.7 e 0.7

0.6 d d 0.6

Comissão
Omissão

0.5 0.5

0.4 0.4 Distância de Mahalanobis


b
0.3 a 0.3 Maxent
a
0.2 0.2
Distância de Mahalanobis
0.1 0.1
Maxent a a a b
0.0 0.0

-0.1 -0.1
300 500 700 900 300 500 700 900
Classes de distância Classes de distância

Figura 6. Resultados das avaliações de sub-amostragens testando o efeito da distância entre registros utilizados como treino nas
taxas de erros de omissão (a) (F(3, 36)=51.25; p<0.001) e erros de comissão (b) (F(3, 36)=9.86; p< 0.001) de modelos de
distribuição (Distância de Mahalanobis e Maxent). Valores médios das taxas de erro e intervalos de confiança de ±95% (barras
verticais) para cada classe de restrição de distância. Letras diferentes representam diferenças significativas (p<0.05).

38
As comparações dos índices Kappa apresentaram o padrão de
variação mais frequentemente observado, visto que as predições realizadas
pelo Maxent foram menos sensíveis à distância entre os registros enquanto
que as predições de MD sofreram influência nas últimas duas classes (F(3,
36)=58.59; p<0.001). Como os resultados obtidos para acurácia em relação ao
Maxent, os valores médios do Kappa com a restrição de distância de 300 ou
900 km foram equivalentes, da mesma forma que aqueles obtidos com 500 e
700 km (Figura 7). No entanto, todos os valores obtidos para os modelos
gerados pelo Maxent foram negativos, indicando que essas performances
não foram melhores do que previsões obtidas meramente ao acaso (Allouche
et al. 2006).

1.0
Mahalanobis Distance

0.8 Maxent

a a
0.6
b

0.4
c

0.2
Kappa

0.0

-0.2

-0.4

d
d
-0.6 e
e

-0.8
300 500 700 900
Distance constraint

Figura 7. Resultados das avaliações de sub-amostragens testando o efeito da


distância entre registros utilizados como treino no desempenho preditivo de
modelos de distribuição (Distância de Mahalanobis e Maxent) (F(3,
36)=58.59; p<0.001). Valores médios de Kappa e intervalos de confiança de
±95% (barras verticais) para cada classe de restrição de distância. Letras
diferentes representam diferenças significativas (p<0.05).

39
Visto que a quantidade de dados de ocorrência não é um fator
limitante para onça-pintada, justifica-se a adoção dessa espécie como
modelo para as análises realizadas aqui. Além disso, a existência de uma
distribuição original bem aceita pela comunidade científica (Sanderson et al.
2002a) utilizada como controle incrementa as possibilidades de comparação
e avaliação dos modelos.
Fatores que influenciam a distribuição de espécies sempre apresentam
algum nível de autocorrelação, e restrições de distância podem facilmente ser
aplicadas em conjuntos de dados de presença, reduzindo os erros causados
por sobre estimativas e melhorando a acurácia das modelagens de
distribuição (Allouche et al. 2008). No entanto, como demonstrado aqui,
diferentes métodos respondem de forma distinta às mudanças no número de
registros considerados na calibração (ou treino), sendo essa uma
conseqüência esperada do estabelecimento de restrições de distância entre
os registros (quanto maior a restrição de distância, menor será o número
disponível de registros). De acordo com as análises das métricas de
desempenho dos modelos empregados aqui, os resultados do Maxent são
menos influenciados pelas restrições de distância (e consequentemente pelo
número de registros utilizados). Diferentemente, a performance dos modelos
obtidos pela Distância de Mahalanobis pode ser afetada pelo decréscimo no
número de registros em decorrência das restrições de distância
principalmente nas duas últimas classes analisadas (700 km com 30 pontos e
900 km com 20 pontos). Portanto, dependendo do método aplicado, a
quantidade de dados da espécie pode ter maior influência do que a própria
autocorrelação espacial entre os pontos de presença.
Foi detectado que para alguns métodos (por ex. Distância de
Mahalanobis), a restrição no conjunto de registros de ocorrência dos modelos
de distribuição de espécies pode melhorar os resultados de desempenho de
forma significativa. No entanto, é importante notar que esse não é um padrão
geral para todos os modelos, como demonstrado aqui, indicando a
necessidade de testar essa influência especificamente para a metodologia
aplicada e também para a espécie e questão considerada. O desafio é
encontrar um equilíbrio entre o controle da autocorrelação espacial e o

40
número de registros que serão utilizados como entrada nos modelos de
maneira a evitar uma interferência na performance desses (Brito et al. 1999).

4.2 Modelos de distribuição e densidade populacional

Os resultados da avaliação geral da performance de cada um dos


SDM encontram-se na Tabela 6. Foram realçados aqueles valores que se
destacaram, sendo os maiores valores de AUC, Kappa e acurácia, e os
menores para taxas de omissão, comissão e erro total dos modelos. Com
base nas métricas utilizadas, os modelos mais bem avaliados foram o ANN
(apresentando quase todos os melhores resultados considerando o limiar
baseado na curva ROC) e o DOMAIN (o qual apresentou o maior valor de
AUC (0.975) e a maioria dos melhores resultados para o limiar do menor
valor predito) (Tabela 6).
Para alguns métodos (GARP, CTA, MDA e BIOCLIM), foi necessário
fazer um ajuste no limiar do menor valor predito para acima de zero, visto que
para essas metodologias, pontos de presença da espécie foram preditos
como ausência (com adequabilidade zero) mesmo quando os parâmetros do
SDM foram definidos para considerar omissão zero (GARP, por exemplo).
Excetuando-se os métodos CTA e ANN, para todos os outros o erro
total considerando o limiar do menor valor predito foi inferior em relação
àqueles obtidos pelo limiar da curva ROC, assim como a acurácia foi maior
para quase todos os métodos (exceto CTA, MARS e ANN) e o índice Kappa
(menos para CTA e ANN, ambos com Kappa negativo). Além disso, é
importante enfatizar que mesmo obtendo o maior valor de AUC, os resultados
do DOMAIN considerando o limiar da curva ROC apresentaram o segundo
maior valor para erro de omissão (0.689), abaixo apenas do RF (0.779).

41
Tabela 6. Resultados da avaliação da performance dos modelos para cada SDM: área sob a curva ROC (AUC), Kappa, acurácia,
omissão, comissão e erro total, para ambas as estratégias de derivação de mapas binários: limiar baseado na curva ROC (ROC) e
limiar do menor valor predito (LPV), comparados com a distribuição de onça-pintada apresentada por Sanderson e colaboradores
(2002a) utilizada como controle nesse estudo. Em negrito estão destacados os melhores valores para cada estatística.
ROC LPV
SDM AUC Kappa Acurácia Omissão Comissão Erro Total Kappa Acurácia Omissão Comissão Erro Total
BIOCLIM 0.885 0.678 0.864 0.363 0.011 0.374 0.888 0.949 0.063 0.044 0.101
MD 0.885 0.687 0.868 0.358 0.008 0.366 0.848 0.929 0.054 0.080 0.134
DOMAIN 0.975 0.367 0.754 0.689 0.001 0.690 0.897 0.952 0.047 0.048 0.095
MAXENT 0.928 0.524 0.807 0.529 0.007 0.536 0.873 0.943 0.124 0.020 0.144
CTA 0.926 0.678 0.863 0.357 0.015 0.372 -0.025 0.346 0.041 0.993 1.000
RF 0.973 0.264 0.720 0.779 0.003 0.782 0.814 0.917 0.195 0.020 0.215
GBM 0.921 0.491 0.795 0.562 0.007 0.569 0.850 0.931 0.082 0.062 0.144
MARS 0.898 0.599 0.833 0.448 0.010 0.458 0.616 0.807 0.054 0.270 0.324
MDA 0.880 0.731 0.884 0.292 0.019 0.311 0.841 0.923 0.130 0.039 0.170
ANN 0.937 0.739 0.887 0.280 0.021 0.301 -0.006 0.356 0.016 0.992 1.000
GARP 0.930 0.708 0.876 0.332 0.010 0.342 0.825 0.921 0.142 0.045 0.186

42
Apesar da expectativa de se encontrar uma relação positiva entre a
adequabilidade climática estimada pelos modelos e a densidade populacional
de onça-pintada, esse padrão foi encontrado apenas para três SDM
considerando o grupo de 37 dados de densidade (Maxent, GBM e Bioclim) e
para dois métodos na avaliação do grupo de 17 dados (GARP e Bioclim
novamente), mas sempre com um baixo coeficiente de determinação,
demonstrando um fraco ajuste dos dados (Tabela 7). O Bioclim apresentou a
relação mais acentuada e significativa (r = 0.579, P = 0.01, R2 = 0.33),
considerando o conjunto de 17 registros de densidade (adotando a versão
mais conservadora de análise). A análise do teste t entre as médias de
adequabilidade mostrou uma diferença significativa apenas para o Bioclim
(Tabela 8), o qual foi o modelo que apresentou a relação positiva mais forte
com os valores de densidade de onça-pintada.

43
Tabela 7. Resultados da regressão entre
densidade populacional de onça-pintada e
estimativas de adequabilidade climática
derivadas de onze SDM considerando dois
grupos de dados de densidade, com 37 e
17 amostras.
SDM R2 r p
Grupo de 37 dados
BIOCLIM 0.245 0.495 0.002
MD 0.030 -0.173 0.305
DOMAIN 0.032 0.179 0.288
Maxent 0.133 0.365 0.026
CTA 0.056 0.236 0.159
RF 0.037 0.192 0.255
GBM 0.108 0.328 0.048
MARS 0.000 0.010 0.954
MDA 0.001 -0.022 0.895
ANN 0.028 0.166 0.326
GARP 0.094 0.307 0.064
Grupo de 17 dados
BIOCLIM 0.335 0.579 0.015
MD 0.125 -0.353 0.164
DOMAIN 0.054 0.232 0.371
Maxent 0.071 0.267 0.301
CTA 0.030 0.173 0.506
RF 0.000 0.019 0.943
GBM 0.045 0.211 0.417
MARS 0.000 -0.018 0.946
MDA 0.162 -0.402 0.110
ANN 0.055 0.234 0.367
GARP 0.257 0.507 0.038

As variâncias de adequabilidade foram maiores para valores menores


de densidade do que para valores mais elevados, considerando muitos dos
SDM (F de Levene significativo para Maxent, GARP, CTA, GBM e RF para o
grupo de 37 dados; e para Maxent, Distância de Mahalanobis, GARP, CTA e
GBM considerando o grupo de 17 dados) (Tabela 8).

44
Tabela 8. Teste t e teste de Levene (F) para estimativas de adequabilidade derivadas de
11 SDM considerando dois grupos de dados de densidade populacional de onça-pintada,
com 37 e 17 amostras, ambos separados pela mediana da densidade (3.41 e 3.10
respectivamente) para essas análises (grupo 1 possui o menor valor de densidade e
grupo 2 o valor mais elevado).
t Desv. Desv. Levene
Média 1 Média 2 gl p gl p
separ. Pad.1 Pad.2 F
Grupo de 37 dados
BIOCLIM 109.368 185.722 -2.453 34.658 0.019 92.488 96.625 0.126 35 0.724
MD 3.643 3.295 0.782 35.000 0.439 1.592 1.038 2.035 35 0.163
DOMAIN 98.789 98.944 -0.357 32.996 0.724 1.512 1.110 0.420 35 0.521
Maxent 58.628 69.426 -1.111 31.389 0.275 35.030 23.186 9.637 35 0.004
CTA 0.688 0.766 -1.282 26.957 0.211 0.237 0.120 13.339 35 0.001
RF 0.810 0.855 -0.748 28.334 0.461 0.232 0.128 4.186 35 0.048
GBM 0.693 0.755 -1.248 26.984 0.223 0.191 0.097 8.460 35 0.006
MARS 0.706 0.693 0.352 30.522 0.727 0.135 0.085 3.717 35 0.062
MDA 0.842 0.837 0.059 29.470 0.954 0.287 0.170 1.494 35 0.230
ANN 0.864 0.876 -0.200 32.040 0.842 0.216 0.149 0.155 35 0.697
GARP 16.000 18.389 -1.321 29.842 0.197 6.700 4.046 7.696 35 0.009
Grupo de 17 dados
BIOCLIM 94.556 205.125 -2.383 14.466 0.031 92.065 98.417 0.397 15 0.538
MD 3.976 3.017 1.239 15.000 0.234 2.132 0.495 7.207 15 0.017
DOMAIN 98.556 98.875 -0.476 11.529 0.643 1.810 0.835 1.594 15 0.226
Maxent 58.182 63.684 -0.445 10.223 0.666 34.688 12.398 9.951 15 0.007
CTA 0.670 0.782 -1.359 8.323 0.210 0.246 0.033 9.249 15 0.008
RF 0.868 0.867 0.009 14.435 0.993 0.137 0.099 0.196 15 0.664
GBM 0.675 0.736 -0.898 8.371 0.394 0.205 0.029 5.579 15 0.032
MARS 0.667 0.671 -0.069 9.746 0.947 0.136 0.043 4.127 15 0.060
MDA 0.858 0.730 1.248 14.208 0.232 0.248 0.171 0.000 15 0.994
ANN 0.794 0.887 -0.905 9.818 0.387 0.291 0.094 0.923 15 0.352
GARP 13.667 19.750 -2.255 8.059 0.054 8.078 0.463 36.763 15 0.000

Através do teste de Levene, foi possível observar que alguns métodos


(Maxent, Mahalanobis Distance, GARP, CTA, GBM e RF) podem discriminar
regiões que tenham valores de densidade altos ou baixos, mas eles não
apresentam uma relação contínua entre a adequabilidade prevista e a
densidade populacional de onça-pintada. Pôde-se notar que densidades
baixas de onça-pintada podem ocorrer em áreas com baixas ou altas
adequabilidades, enquanto que valores de densidade elevados estão restritos
a regiões em que a adequabilidade também seja alta. Esse resultado indica
que a relação entre densidade e adequabilidade aparentemente é melhor
descrita como um envelope de restrição poligonal do que por uma relação
linear positiva.

45
Uma possível explicação para esse resultado seria a de que áreas
localizadas em regiões com alta adequabilidade que apresentam baixas
estimativas de densidade estão sujeitas a fatores atuando em escalas locais
impedindo que a população atinja densidades mais elevadas como seria
esperado pelas condições ambientais regionais favoráveis. Esses fatores
podem ser, por exemplo: baixa abundância de presas, impossibilidade de
dispersão entre fragmentos florestais ou degradação de habitat por fatores
antrópicos. No entanto, apenas seis (16%) das 37 localidades consideradas
nesse estudo estão sob alguma influência de fazendas utilizadas para
pecuária, enquanto que todos os outros estudos de densidade foram
realizados em áreas protegidas (parques nacionais, reservas florestais,
reservas privadas, e outras). Portanto, a hipótese de que fatores
antropogênicos poderiam influenciar o padrão encontrado não foi
corroborada.
Além disso, é importante ressaltar que estamos buscando relações
entre metodologias aplicadas em diferentes escalas espaciais e sob distintas
bases conceituais, o que complica o estabelecimento de uma relação clara
entre elas. Enquanto os modelos de distribuição de espécies são aplicados
sobre toda a extensão geográfica, gerando o que poderia ser esperado como
a distribuição geográfica potencial (conceitualmente ligada ao nicho
fundamental), estudos que procuram estimar densidade populacional
consideram uma escala muito mais local sujeita a distintos fenômenos,
incluindo interações com outras espécies (conceitualmente relacionado ao
nicho realizado). Outros autores (VanDerWal et al. 2009) que encontraram o
mesmo tipo de relação entre adequabilidade climática e abundância local
indicaram outros fatores ignorados pelos SDM que podem causar essa
relação, incluindo capacidade de dispersão, adequabilidade microambiental e
efeitos estocásticos, que poderiam levar a uma ausência ou raridade de uma
espécie em locais que possuem alta adequabilidade.

46
4.3 Modelos de envelopes bioclimáticos e conservação da onça-pintada

De acordo com as análises realizadas no terceiro artigo, áreas com


vegetação natural tendem a possuir maiores valores de adequabilidade
climática para onça-pintada do que o esperado pelo acaso (χ2 = 20696.58, df
= 39) e a expectativa é de que essa tendência persista no futuro (χ2 =
24366.13, df = 38), desde que as predições do IMAGE e das mudanças
climáticas globais se confirmem.
As estimativas de adequabilidade obtidas para grids dentro de áreas
protegidas são maiores do que aquelas obtidas pelo processo de
aleatorização dos dados (χ2 = 7160.072, df = 37) e essa diferença deve
aumentar com as mudanças climáticas globais (χ2 = 5963.473, df = 35),
principalmente em células com adequabilidade variando de 65 a 73. Apesar
desses valores não serem extremos (seria melhor se todas as células
protegidas apresentassem adequabilidade próxima de 100), apenas 2.26%
dos grids da distribuição histórica da onça-pintada (dentro ou fora de áreas
protegidas) deverá apresentar valores de adequabilidade maiores que 73 de
acordo com os modelos de envelopes bioclimáticos utilizados.
Comparando as estimativas de adequabilidade climática para as
variáveis do clima atual e para o futuro, observa-se que, em geral, os
potenciais limites climáticos para a distribuição da espécie não sofrem
alterações, mas é estimada uma redução e modificação na localização das
áreas mais adequadas (Figura 8a e 8b). A variação da adequabilidade
ilustrada na Figura 8c indica regiões nas quais a mesma deve sofrer redução
(valores negativos, em azul e verde), localizadas principalmente no Brasil
central, Amazônia brasileira e peruana, além das Guianas e Suriname,
enquanto que as áreas onde a adequabilidade deve aumentar ocorrem
principalmente no meio-leste da Amazônia, partes da transição com o
Cerrado, sul do Brasil, norte do Paraguai e sul da Bolívia.
Não há evidências de um padrão comum entre as modificações
previstas para adequabilidade climática (como resultado das mudanças
climáticas) e mudanças no uso do solo conforme predições do modelo
IMAGE (Odds ratio (ln)[± 95% intervalo de confiança]= 0.1104 [± 0.1731]). No
entanto, algumas áreas onde um incremento de adequabilidade é esperado,

47
tornando-as regiões de valor estratégico para a conservação da onça-
pintada, na realidade deverão perder qualidade devido à conversão de
hábitats naturais para agricultura ou pastagem (ver na Figura 9 - categoria NP
representada em vermelho). Além disso, em algumas células onde é
esperado um decréscimo na adequabilidade ambiental, um cenário ainda pior
pode ocorrer caso a cobertura natural dessas áreas seja perdida (ver na
Figura 9 - classe NN em amarelo).

48
a) b)

c)

Figura 8. Adequabilidade climática para a onça-pintada considerando o consenso (ensemble)


entre os métodos do DOMAIN e BIOCLIM, para variáveis climáticas atuais (a) e futuras de
acordo com o modelo Community Climate System Model – CCSM 3 (b). A variação entre os
valores de adequabilidade de ambas as estimativas é ilustrada no mapa c.

49
Figura 9. Mapa mostrando classificação das células de acordo com mudanças
na adequabilidade climática para onças-pintadas e no uso do solo entre
predições para o clima atual e futuro (considerando apenas variações maiores
ou menores que o percentil de 50% para diferenças positivas e negativas). As
categorias foram nomeadas como: PP - aumento de adequabilidade ao longo
do tempo e cobertura do solo passar de convertida para área natural; NN -
expectativa de declínio na adequabilidade e cobertura do solo se alterar de
natural para convertida; NP - estima-se que adequabilidade deva aumentar e
cobertura do solo se alterar de natural para convertida; PN - adequabilidade
deve sofrer redução ao longo do tempo enquanto a cobertura do solo é prevista
para passar de convertida a natural.

Discussões sobre modelos de envelopes bioclimáticos têm enfatizado as


limitações inerentes a esses métodos correlativos, principalmente em relação à
incapacidade de modelar relações bióticas, padrões de dispersão e mudanças
evolutivas (Hannah et al. 2002; Pearson & Dawson 2003; Lawler et al. 2006).
Apesar disso, alguns autores têm confirmado que a importância das predições

50
dos modelos bioclimáticos em avaliar os potenciais efeitos das mudanças
climáticas não deve ser subestimada, devendo os resultados ser interpretados
como uma primeira aproximação dos potenciais efeitos dessas mudanças em
grandes escalas espaciais, ao invés de serem tratados como predições
precisas das distribuições futuras das espécies (Pearson & Dawson 2003). Na
realidade, como o clima pode ser considerado um fator dominante em escalas
regionais e continentais, a modelagem de distribuição em grandes escalas é
um importante primeiro passo no planejamento da conservação, seguindo uma
estratégia hierárquica (Pearson & Dawson 2003; Cabeza et al. 2010).
Avaliações em grandes escalas já foram anteriormente realizadas em
estudos sobre a conservação da onça-pintada (Sanderson et al. 2002a; Zeller
2007; Rabinowitz & Zeller 2010), mas essa é a primeira vez que aspectos
relacionados ao nicho ambiental da espécie são considerados em questões de
conservação. Visto que áreas com alta probabilidade de ocorrência obtidas por
modelos de distribuição são regiões onde as espécies apresentam maior
chance de persistir (Araújo & Williams 2000), os métodos desenvolvidos aqui
podem ser ferramentas úteis para incrementar os esforços de conservação
dessa ameaçada espécie de felino, como tem sido feito com outras espécies
pelo mundo (ex. Hilty et al. 2006; Cabeza et al. 2010; Wilting et al. 2010).
Especialmente adotando a combinação com cenários de mudanças de uso do
solo, esses modelos são capazes de identificar áreas onde onças-pintadas
podem ser mantidas hoje, e estimar as mudanças na distribuição que podem
ocorrer em decorrência da conversão adicional de hábitats naturais.
Foi demonstrado que algumas regiões que devem passar por um
incremento da adequabilidade climática para a onça-pintada no futuro serão
convertidas de ambientes naturais para agricultura e pastagem. Para certas
áreas, essa tendência é esperada porque elas se localizam no chamado “arco
do desmatamento” (Nogueira et al. 2008), uma região atualmente sob forte
pressão de conversão de hábitats para plantações de soja e cana-de-açúcar;
onde as onças-pintadas estarão fadadas à extinção local, caso ações urgentes
e em curto prazo não sejam tomadas. Essas conclusões mostram que as
oportunidades para ações efetivas de conservação da onça-pintada estão a
cada dia se tornando mais restritas, sendo urgente a necessidade de
estratégias pró-ativas de conservação da espécie.

51
5 CONSIDERAÇÕES FINAIS

Nos últimos anos, é evidente o acentuado incremento de estudos


utilizando modelos de distribuição de espécies. O acesso facilitado a bancos de
dados disponíveis online e a programas computacionais cada vez mais
“amigáveis” favoreceu uma rápida expansão de análises e de “especialistas”
em modelagem. As promissoras abordagens que podem ser adotadas com o
uso dessa metodologia se apresentam como atraentes possibilidades para a
solução de uma diversidade de problemas nos campos da ecologia e da
biologia da conservação.
Entretanto, deve ser enfatizado que a modelagem de distribuição de
espécies não deve ser considerada como uma panacéia, visto que “A natureza
é muito complexa e heterogênea para ser predita eficazmente em cada aspecto
do tempo e do espaço por um único, mesmo que complexo, modelo” (Guisan &
Zimmermann 2000). Ainda assim, alguns autores parecem ignorar as nuances
e limitações dessa ferramenta e aplicá-la sem grandes preocupações ou
critérios. Atualmente existe uma grande variedade de métodos, métricas de
avaliação, critérios de validação e questões relacionadas aos dados de
ocorrência das espécies e variáveis preditivas utilizadas como entrada nos
modelos. Cada um desses elementos apresenta suas peculiaridades, podendo
tornar o resultado de um modelo mais próximo ou distante da realidade que ele
procura representar, e, portanto, devem ser levados em consideração,
previamente ao emprego dessa metodologia. Além disso, as próprias
características ecológicas das espécies podem favorecer ou não o
desempenho dos modelos, sendo que para aquelas especialistas de habitat,
por exemplo, tem sido observada uma maior robustez dos resultados.
A avaliação e controle da autocorrelação espacial entre os pontos de
ocorrência da onça-pintada utilizados em dois dos modelos de distribuição
(Distância de Mahalanobis e Maxent) nesse estudo demonstrou como esse
fator pode influenciar (ou não) a performance dos resultados, dependendo do
método aplicado. Ficou evidenciado que para uma espécie que possui muitos
pontos, como a onça-pintada, esse acúmulo pode não significar
necessariamente uma vantagem. Mas já que a quantidade de informação sobre
essa espécie não é um fator limitante, nesse caso a sub-amostragem com

52
restrição de distância é uma solução que maximiza o desempenho de alguns
dos métodos a serem aplicados, reduzindo a interferência da autocorrelação
espacial. Além dessa questão, outro problema que pode ser levantado em
relação aos registros de ocorrência é que o ideal seria utilizar apenas dados de
populações com taxa de crescimento positiva (Guisan & Thuiller 2005), mas
devido à inexistência dessa informação não houve a possibilidade de filtrar os
registros de onça-pintada seguindo esse critério. Apesar dessa limitação, a
grande quantidade de dados disponível reduz o viés que indivíduos registrados
em locais onde não há uma população estabelecida possam causar nos
resultados dos modelos.
Neste trabalho também foi demonstrado como alguns métodos de
modelagem de distribuição podem responder de maneira diferenciada às
métricas de avaliação, ainda que utilizando um mesmo conjunto de dados. A
seleção de um modelo que seja mais adequado para a espécie considerada
deve passar por essa avaliação e outras que possam ser adotadas em relação,
por exemplo, à resposta da espécie a fatores regionais e/ou locais. Por esse
motivo, a relação entre a adequabilidade climática obtida através dos modelos
e os valores de densidade populacional da onça-pintada foi considerada como
um ponto primordial na definição daqueles métodos aplicáveis para questões
conservacionistas da espécie (no caso, o BIOCLIM e DOMAIN). O interesse
não é modelar a distribuição geográfica em si, mas procurar converter a
adequabilidade obtida em um parâmetro demográfico, relacionado à
performance da espécie em menor escala. Com isso, o resultado obtido pela
modelagem passa a ter sentido em questões ligadas à conservação da
espécie.
Essa discussão está diretamente relacionada à questão da escala
espacial e temporal em que diferentes processos atuam influenciando a
distribuição das espécies, tema amplamente explorado na literatura. Desta
forma, tem sido reconhecido que o clima é o principal fator em amplas escalas
espaciais, enquanto que alterações de uso do solo influenciam em escalas
regionais ou locais. A questão temporal de influência desses aspectos também
deve ser considerada, de modo que as mudanças climáticas afetam a
distribuição da onça-pintada de maneira muito mais sutil ao longo do tempo do
que as alterações previstas para o uso do solo, aspecto mais dinâmico e

53
susceptível às alterações antrópicas de maneira mais acentuada e acelerada
do que o próprio clima. De forma geral, a onça-pintada deverá ser mais afetada
pelas mudanças antropogênicas na paisagem para produção agropecuária do
que pelas alterações climáticas globais. Ainda, por ser uma espécie generalista
e que apresenta alta tolerância, esse último fator não é tão significativo em
comparação com o que tem sido demonstrado para outras espécies.
Avaliações das distribuições das espécies em grandes escalas são
importantes em estudos cujo objetivo é orientar o estabelecimento de
estratégias de conservação, mas também é fundamental compreender os
mecanismos que atuam em menores escalas, pois as ações práticas de
conservação são adotadas em escalas regionais ou de paisagem. Portanto, a
interface entre esses panoramas deve ser levada em conta em programas
conservacionistas de longo prazo. Nesse sentido, as análises combinando as
modificações de adequabilidade climática para onça-pintada e de uso do solo
associam esses aspectos de forma a proporcionar uma avaliação mais realista
dos cenários futuros. Ainda assim, faz-se necessário inserir fatores mais
complexos nesses modelos, tais como interações bióticas, restrições de
dispersão, eventos estocásticos e fatores históricos, os quais estão
relacionados à dinâmica espacial da distribuição das espécies. Contudo, esse
refinamento das análises de modelos de distribuição geográfica só pode ser
realizado para espécies cujos dados estejam disponíveis.

54
6 REFERÊNCIAS BIBLIOGRÁFICAS

Ahern, J. 1995. Greenways as a planning strategy. Landscape Urban Planning


33: 131–155.
Allouche, O., Steinitz, O., Rotem, D., Rosenfeld, A. & Kadmon, R. 2008.
Incorporating distance constraints into species distribution models. Journal
of Applied Ecology 45: 599–609.
Allouche, O., Tsoar, A. & Kadmon, R. 2006. Assessing the accuracy of species
distribution models: prevalence, kappa and the true skill statistic (TSS).
Journal of Applied Ecology 43: 1223–1232.
Araújo, M.B., Cabeza, M., Thuiller, W., Hannah, L. & Williams, P.H. 2004.
Would climate change drive species out of reserves? An assessment of
existing reserve-selection methods. Global Change Biology 10: 1618–1626.
Araújo, M.B. & Guisan, A. 2006. Five (or so) challenges for species distribution
modelling. Journal of Biogeography 33: 1677–1688.
Araújo, M.B. & New, M. 2007. Ensemble forecasting of species distributions.
Trends in Ecology and Evolution 22: 42–47.
Araújo, M.B. & Pearson, R.G. 2005. Equilibrium of species’ distributions with
climate. Ecography 28: 693–695.
Araújo, M.B., Pearson, R.G., Thuiller, W. & Erhard, M. 2005. Validation of
species-climate impact models under climate change. Global Change
Biology 11: 1504–1513.
Araújo M.B. & Williams P.H. 2000. Selecting areas for species persistence
using occurrence data. Biological Conservation 96: 331–345.
Austin, M.P. 2002. Spatial prediction of species distribution: an interface
between ecological theory and statistical modelling. Ecological Modelling
157: 101–118.
Austin, M.P. 2007. Species distribution models and ecological theory: A critical
assessment and some possible new approaches. Ecological Modelling 200:
1–19.
Box, G.E.P. 1979. Some problems of statistics and everyday life. Journal of the
American Statistical Association 74: 1–4.
Breiman, L., Friedman, J.H., Olshen, R.A. & Stone, C.J. 1984. Classification
and regression trees. Chapman and Hall, New York.

55
Brito, C., Crespo, E.G. & Paulo, O.S. 1999. Modelling wildlife distributions:
Logistic Multiple Regression vs Overlap Analysis. Ecography 22: 251–260.
Brooks, T.M., Mittermeier, R.A., Da Fonseca, G.A.B., Gerlach, J., Hoffmann, M.,
et al. 2006. Global biodiversity conservation priorities. Science 313: 58–61.
Brotons, L., Thuiller, W., Araújo, M.B. & Hirzel, A.H. 2004. Presence-absence
versus presence-only based habitat suitability models for bird atlas data: the
role of species ecology and prevalence. Ecography 27: 285–298.
Brown, J.H. 1995. Macroecology. University of Chicago Press, Chicago, 269p.
Brown, J.H., Stevens, G.C. & Kaufman, D.M. 1996. The geographic range: size,
shape, boundaries and internal structure. Annual Review of Ecology and
Systematics 27: 597–623.
Burns, C.E., Johnston, K.M. & Schmitz, O.J. 2003. Global climate change and
mammalian species diversity in U.S. national parks. Proceedings of the
National Academy of Sciences of the United States of America 100: 11474–
11477.
Busby, J.R. 1991. BIOCLIM - a bioclimatic analysis and prediction system. In:
Nature Conservation: Cost Effective Biological Surveys and data Analysis.
(eds. Margules, C.R. & Austin, M.P.) CSIRO, Melbourne, pp. 64–68.
Cabeza, M., Arponen, A., Jäättelä, L., Kujala, H., Van Teeffelen, A. & Hanski, I.
2010. Conservation planning with insects at three different spatial scales.
Ecography 33: 54–63.
Carpenter, G., Gillison, A.N. & Winter, J. 1993. DOMAIN: a flexible modelling
procedure for mapping potential distributions of plants and animals.
Biodiversity and Conservation 2: 667–680.
Chase, J.M. & Leibold, M. 2003. Ecological Niches: Linking Classical and
Contemporary Approaches. University of Chicago Press, Chicago and
London.
Chefaoui, R.M. & Lobo, J.M. 2008. Assessing the effects of pseudo-absences
on predictive distribution model performance. Ecological Modelling 210:
478–486.
Cheida, C.C., Oliveira, E.N., Costa, R.C., Mendes, F.R. & Quadros, J. 2006.
Ordem Carnivora. In: Mamíferos do Brasil. (eds. Reis, N.R., Peracchi, A.L.,
Pedro, W.A. & Lima, I.P.) Londrina, pp. 231–275.

56
Coetzee, B.W.T., Robertson, M.P., Erasmus, B.F.N., Van Rensburg, B.J. &
Thuiller, W. 2009. Ensemble models predict Important Bird Areas in
southern Africa will become less effective for conserving endemic birds
under climate change. Global Ecology and Biogeography 18: 701–710.
Cohen, J. 1960. A coefficient of agreement for nominal scales. Psychological
Bulletin 20: 37–46.
Crawshaw Jr., P.G. & Quigley, H.B. 1991. Jaguar spacing, activity and habitat
use in a seasonally flooded environment in Brazil. Journal of Zoology 223:
357–370.
Davies, R.G., Orme, C.D.L., Olson, V., Thomas, G.H., Ross, S.G., Ding, T.,
Rasmussen, P.C., Stattersfield, A.J., Bennet, P.M., Blackburn, T.M., Owens,
I.P.F. & Gaston, K.J. 2006. Human impacts and the global distribution of
extinction risk. Proceedings of The Royal Society B 273: 2127–2133.
Davis, A.J., Jenkinson, L.S., Lawton, J.H., Shorrocks, B. & Wood, S. 1998.
Making mistakes when predicting shifts in species range in response to
global warming. Nature 391: 783–786.
Ehrlich, P.R. 1997. A perda da biodiversidade: causas e consequências. In:
Biodiversidade (ed. Wilson, E.O.). Nova Fronteira, Rio de Janeiro, pp. 27–
35.
Elith, J. & Burgman, M.A. 2002. Predictions and their validation: rare plants in
the Central Highlands, Victoria, Australia. In: Predicting Species
Occurrences: Issues of Accuracy and Scale (eds. Scott, J.M., Heglund, P.J.,
Morrison, M.L., Raphael, M.G., Wall, W.A. & Samson, F.B.). Island Press,
Covelo, CA, pp. 303–314.
Elith, J., Graham, C.H., Anderson, R.P., Dudík, M., Ferrier, S., Guisan, A.,
Hijmans, R.J., Huettman, F., Leathwick, J.R., Lehmann, A., Li, J., Lohmann,
L., Loiselle, B.A., Manion, G., Moritz, C., Nakamura, M., Nakazawa, Y.,
Overton, J.M., Peterson, A.T., Phillips, S., Richardson, K., Schachetti
Pereira, R., Schapire, R.E., Soberón, J., Williams, S.E., Wisz, M. &
Zimmermann, N.E. 2006. Novel methods improve prediction of species
distributions from occurrence data. Ecography 29: 129–151.
Elith, J. & Leathwick, J. 2009. Species distribution models: Ecological
explanation and prediction across space and time. Annual Review of
Ecology, Evolution and Systematics 40: 677–697.

57
Elton, C. 1927. Animal Ecology. Sedgwick and Jackson, London.
Engler, R., Guisan, A. & Rechsteiner, L. 2004. An improved approach for
predicting the distribution of rare and endangered species from occurrence
and pseudo-absence data. Journal of Applied Ecology 41: 263–274.
Farber, O. & Kadmon, R. 2003. Assessment of alternative approaches for
bioclimatic modeling with special emphasis on the Mahalanobis distance.
Ecological Modelling 160: 115–130.
Ferrier, S. 2002. Mapping spatial pattern in biodiversity for regional
conservation planning: where to from here? Systematic Biology 51: 331–
363.
Fielding, A.H. & Bell, J.F., 1997. A review of methods for the assessment of
prediction errors in conservation presence/absence models. Environmental
Conservation 24: 38–49.
Franklin, J. 2009. Mapping Species Distributions: Spatial Inference and
Prediction. Cambridge University Press, Cambridge.
Friedman, J.H. 2001. Greedy function approximation: A gradient boosting
machine. Annals of Statistics 29: 1189–1232.
Fuller, T., Sánchez-Corderdo, V., Illoldi-Rangel, P., Linaje, M. & Sarkar, S.
2007. The Cost of Postponing Biodiversity Conservation in Mexico.
Biological Conservation 134: 593–600.
Gaston, K. 2003. The Structure and Dynamics of Geographic Ranges. Oxford
University Press, Oxford.
González, C.A.L. & Miller, B.J. 2002. Do jaguars (Panthera onca) depend on
large prey? Western North American Naturalist 62: 218–222.
Graham, C.H., Elith, J., Hijmans, R.J., Guisan, A., Peterson, A.T., Loiselle, B.A.
& NCEAS Predicting Species Distributions Working Group. 2008. The
influence of spatial errors in species occurrence data used in distribution
models. Journal of Applied Ecology 45: 239–247.
Grinnell, J. 1917. The niche-relationships of the California Thrasher. Auk 34:
427–434.
Gu, W. & Swihart, R.K. 2004. Absent or undetected? Effects of non-detection of
species occurrence on wildlife-habitat models. Biological Conservation 116:
195–203.

58
Guggisberg, C.A.W. 1975. Wild Cats of the World. Taplinger Publications Co.,
New York.
Guisan, A. & Thuiller, W. 2005. Predicting species distribution: offering more
than simple habitat models. Ecology Letters 8: 993–1009.
Guisan, A. & Zimmermann, N.E. 2000. Predictive habitat distribution models in
ecology. Ecological Modelling 135: 147–186.
Hannah, L., Midgley, G.F. & Millar, D. 2002. Climate change-integrated
conservation strategies Global ecology and biogeography 11: 485–495.
Hansson, L. 1991. Dispersal and connectivity in metapopulations. In:
Metapopulation dynamics: empirical and theoretical investigations. (eds.
Gilpin, M.E. & Hanski, I.) Linnean Society of London and Academic Press,
London, pp. 89–103.
Hijmans, R.J. & Graham, C.H. 2006. The ability of climate envelope models to
predict the effect of climate change on species distributions. Global Change
Biology 12: 2272–2281.
Hilty, J.A., Brooks, C., Heaton, E. & Merenlender, A.M. 2006. Forecasting the
effect of land-use change on native and non-native mammalian predator
distributions. Biodiversity and Conservation 15: 2853–2871.
Hirzel, A.H., Hausser, J., Chessel, D. & Perrin, N. 2002. Ecological-niche factor
analysis: how to compute habitat suitability maps without absence data?
Ecology 83: 2027–2036.
Hortal, J., Jimenez-Valverde, A., Gómez, J.F., Lobo, J.M. & Baselga, A. 2008.
Historical bias in biodiversity inventories affects observed environmental
niche of the species. Oikos 117: 847–858.
Hutchinson, G.E. 1957. Concluding remarks. Cold Spring Harbor Symposia on
Quantitative Biology 22: 415–427.
Hutchinson, G.E. 1978. An Introduction to Population Ecology. Yale University
Press, New Haven.
IMAGE Team. 2001. The IMAGE 2.2 Implementation of the SRES Scenarios. A
Comprehensive Analysis of Emissions, Climate Change and Impacts in the
21st Century. Netherlands Environmental Assessment Agency (MNP) CD-
ROM Publication 500110001, Bilthoven, Netherlands.
IUCN. 2010. 2010 IUCN Red List of Threatened Species.
<www.iucnredlist.org>. Downloaded on 03 August 2010.

59
Jácomo, A.T.A. 1999. Nicho Alimentar do lobo guará (Chrysocyon brachyurus
Illiger, 1811) no Parque Nacional das Emas – GO. Dissertação de mestrado.
Universidade Federal de Goiás. Goiânia-GO. 30p.
Jenkins, M. 2003. Prospects for biodiversity. Science 302: 1175–1177.
Jewell, N.P. 2004. Statistics for Epidemiology. 1st Edition, Chapman & Hall.
Jiménez-Valverde, A., Lobo, J.M., Hortal, J. 2008. Not as good as they seem:
the importance of concepts in species distribution modelling. Diversity and
Distributions 14: 885–890.
Johnson, C.J. & Gillingham, M. 2005. An evaluation of mapped species
distribution models used for conservation planning. Environmental
Conservation 32: 1–12.
Kearney, M. 2006. Habitat, environment and niche: what are we modelling?.
Oikos 115: 186–191.
Lawler, J.J., White, D., Neilson, R.P. & Blaustein, A.R. 2006. Predicting climate-
induced range shifts: model differences and model reliability. Global Change
Biology 12: 1568–1584.
Lehmann, A. 1998. GIS modeling of submerged macrophyte distribution using
Generalized Additive Models. Plant Ecology 139: 113–124.
Leibold, M. 1996. The niche concept revisited: mechanistic models and
community context. Ecology 76: 1371–1382.
Lim, B.K., Peterson, A.T. & Engstrom, M.D. 2002. Robustness of ecological
niche modelling algorithms for mammals in Guyana. Biodiversity and
Conservation 11: 1237–1246.
Liu, C.R., Berry, P.M., Dawson, T.P. & Pearson, R.G. 2005. Selecting
thresholds of occurrence in the prediction of species distributions.
Ecography 28: 385–393.
Lobo, J.M., Jimenez-Valverde, A. & Real, R. 2008. AUC: a misleading measure
of the performance of predictive distribution models. Global Ecology and
Biogeography 17: 145–151.
Lozier, J.D., Aniello, P. & Hickerson, M.J. 2009. Predicting the distribution of
Sasquatch in western North America: anything goes with ecological niche
modelling. Journal of Biogeography 36: 1623–1627.

60
Maffei, L. & Noss, A.J. 2008. How small is too small? Camera trap survey areas
and density estimates for ocelots in the Bolivian Chaco. Biotropica 40: 71–
75.
Maffei, L., Noss, A.J., Silver, S. & Kelly, M.J. (2011) Abundance/Density Case
Study: Jaguars in the Americas. In: Camera Traps in Animal Ecology:
Methods and Analyses. (eds. by O'Connell, A.F., Nichols, J.D. & Karanth,
U.K.). Springer.
Manel, D., Dias, J.M., Buckton, S.T. & Ormerod, S.J. 1999. Alternative methods
for predicting species distribution: an illustration with Himalayan river birds.
Journal of Applied Ecology 36: 734–747.
Manel, S., Williams, H.C. & Ormerod, S.J. 2001. Evaluating presence-absence
models in ecology: the need to account for prevalence. Journal of Applied
Ecology 38: 921–931.
Margules, C.R. & Sarkar, S. 2007. Systematic conservation planning.
Cambridge University Press, Cambridge.
Miller, J. & Franklin, J. 2002. Modeling the distribution of four vegetation
alliances using generalized linear models and classification trees with spatial
dependence. Ecological Modelling 157: 227–247.
Mittermeier, R.A., Robles-Gil, P., Hoffman, M., Pilgrim, J., Brooks, T., et al.
2004. Hotspots revisited: Earth’s biologically richest and most endangered
terrestrial ecoregions. CEMEX, Mexico City.
Moisen, G.G. & Frescino, T.S. 2002. Comparing five modelling techniques for
predicting forest characteristics. Ecological Modelling 157: 209–225.
Nix, H.A. 1986. A biogeographic analysis of Australian elapid snakes. In: Atlas
of Elapid Snakes of Australia. (ed. Longmore, R.). Australian Flora and
Fauna Series No. 7. Australian Government Publishing Service, Canberra,
pp. 4–15.
Nogueira, E.M., Nelson, B.W., Fearnside, P.M., França, M.B. & Oliveira, A.C.A.
2008. The height in Brazil’s ‘arc of deforestation’: Shorter trees in south and
southwest Amazonia imply lower biomass. Forest Ecology and Management
255: 2963–2972.
Oliveira, T.G. & Cassaro, K. 2005. Guia de campo dos felinos do Brasil.
Instituto Pró-Carnívoros, São Paulo.

61
Pearson, R.G. 2007. Species’ distribution modeling for conservation educators
and practitioners. Synthesis. American Museum of Natural History. Available
at http://ncep.amnh.org.
Pearson, R.G. & Dawson, T.P. 2003. Predicting the impacts of climate change
on the distribution of species: are bioclimate envelope models useful?
Global Ecology & Biogeography 12: 361–371.
Pearson, R.G., Raxworthy, C.J., Nakamura, M. & Peterson A.T. 2007.
Predicting species distributions from small numbers of occurrence records: a
test case using cryptic geckos in Madagascar. Journal of Biogeography 34:
102–117.
Peters, D.P.C. & Herrick, J.E. 2004. Strategies for ecological extrapolation.
Oikos 106: 627–636.
Peterson, A.T. 2003. Predicting the geography of species invasions via
ecological niche modeling. The Quarterly review of biology 78: 419–433.
Phillips, S.J., Anderson, R.P. & Schapire, R.E. 2006. Maximum entropy
modeling of species geographic distributions. Ecological Modelling 190:
231–259.
Prasad, A.M., Iverson, L.R. & Liaw, A. 2006. Newer classification and
regression tree techniques: bagging and random forests for ecological
prediction. Ecosystems 9: 181–199.
Rabinowitz, A. & Zeller, K.A. 2010. A range-wide model of landscape
connectivity and conservation for the jaguar, Panthera onca. Biological
Conservation 143: 939–945.
Redford, K.H. 1992. The empty forest. Bioscience 42: 412–423.
Rushton, S.P., Ormerod, S.J. & Kerby, G. 2004. New paradigms for modelling
species distributions? Journal of Applied Ecology 41: 193–200.
Sala, O.E., Chapin III, F.S., Armesto, J.J., Berlow, E., Bloomfield, J., Dizo, R.,
Huber-Sanwald, E., Huenneke, L.F., Jackson, R.B., Kinzig, A., Leemans, R.,
Lodge, D.M., Mooney, H.A., Oesterheld, M., Poff, N.L., Sykes, M.T., Walker,
B.H., Walker, M., Wall, D.H. 2000. Global biodiversity scenarios for the year
2100. Science 287: 1770–1774.
Sanderson, E., Redford, K.H., Chetkiewicz, C., Medellin, R.A., Rabinowitz, A.,
Robinson, J.G. & Taber, A. 2002a. Planning to save a species: the jaguar as
a model. Conservation Biology 16: 58–72.

62
Sanderson, E., Redford, K.H., Vedder, A., Coppolillo, P.B. & Ward, S.E. 2002b.
A conceptual model for conservation planning based on landscape species
requirements. Landscape and urban planning 58: 41–56.
Segurado, P. & Araújo, M.B. 2004. An evaluation of methods for modelling
species distributions. Journal of Biogeography 31: 1555–1568.
Seo, C., Thorne, J.H., Hannah, L. & Thuiller, W. 2009. Scale effects in species
distribution models: implications for conservation planning under climate
change. Biology Letters 5: 39–43.
Silveira, L. 1999. Ecologia e conservação dos mamíferos carnívoros do Parque
Nacional das Emas, Goiás. Dissertação de Mestrado. Universidade Federal
de Goiás. Goiânia-GO, 99p.
Silveira, L. 2004. Ecologia comparada e conservação da onça-pintada
(Panthera onca) e onça-parda (Puma concolor) no Cerrado e Pantanal.
Tese de Doutorado. Universidade de Brasília, Brasília-DF, 240p.
Smallwood, K.S. 1999. Scale domains of abundance amongst species of
mammalian Carnivora. Environmental Conservation 26: 102–111.
Soberón, J. 2007. Grinnellian and Eltonian niches and geographic distributions
of species. Ecology Letters 10: 1115–1123.
Soberón, J. & Nakamura, M. 2009. Niches and distributional areas: concepts,
methods and assumptions. Proceedings of the National Academy of
Sciences USA 106: 19644–19650.
Soberón, J. & Peterson, A.T. 2005. Interpretation of models of fundamental
ecological niches and species’ distributional areas. Biodiversity Informatics
2: 1–10.
Stockwell, D.R.B. & Noble, I.R. 1992. Induction of sets of rules from animal
distribution data – A robust and informative method of data analysis.
Mathematics and Computers in Simulation 33: 385–390.
Stockwell, D.R.B. & Peterson, A.T. 2002. Effects of sample size on accuracy of
species distribution models. Ecological Modelling 148: 1–13.
Sunquist, M. & Sunquist, F. 2002. Wild cats of the world. University of Chicago
Press, Chicago.
Swank, W.G. & Teer, J.G. 1989. Status of the Jaguar-1987. Oryx 23: 14–21.
Swets, J.A. 1988. Measures of the accuracy of diagnostic systems. Science
240: 1285–1293.

63
Terborgh, J. 1988. The big things that run the world – a sequel to E. O. Wilson.
Conservation Biology 2: 402–403.
Thomas, C.D., Cameron, A., Green, R.E., Bakkenes, M., Beaumont, L.J.,
Collingham, Y.C. et al. 2004. Extinction risk from climate change. Nature
427: 145–147.
Thuiller, W. 2004. Patterns and uncertainties of species’ range shifts under
climate change. Global Change Biology 10: 2020–2027.
Thuiller, W., Albert, C., Araújo, M.B., Berry, P.M., Cabeza, M., Guisan, A.,
Hickler, T., Midgley, G.F., Paterson, J., Schurr, F.M., Sykes, M.T. &
Zimmermann, N.E. 2008. Predicting global change impacts on plant species’
distributions: future challenges. Perspectives in Plant Ecology, Evolution and
Systematics 9: 137–152.
Thuiller, W., Lavorel, S. & Araújo, M. B. 2005, Niche properties and
geographical extent as predictors of species sensitivity to climate change.
Global Ecology and Biogeography 14: 347–357.
UNEP-WCMC. 2009. Data structure of the World Database on Protected Areas
(WDPA). Annual Release 2009, New WDPA Schema, Web-download
Version – February 2009.
VanDerWal, J., Shoo, L.P., Johnson, C.N. & Williams, S.E. 2009. Abundance
and the environmental niche: environmental suitability estimated from niche
models predicts the upper limit of local abundance. The American Naturalist
174: 282–291.
Vertenstein, M., Craig, T., Henderson, T., Murphy, S., Carr, G.R.J. & Norton, N.
2004. CCSM 3.0 User’s Guide. Community Climate System Model. National
Center for Atmospheric Research, Boulder, CO.
Wikramanayake, E., Dinerstein, E., Loucks, C., Olson, D., Morrison, J.,
Lamoreux, J., Mcknight, M. & Hedao, P. 2002. Ecoregions in Ascendance:
Reply to Jepson and Whittaker. Conservation Biology 16: 238–245.
Wilcox, B.A. & Murphy, D.D. 1985. Conservation strategy: the effects of the
fragmentation on extinction. The American Naturalist 125: 879–887.
Williams, P.H. & Gaston, K.J. 1994. Measuring more of biodiversity: can higher-
taxon richness predict wholesale species richness? Biological Conservation
67: 211–217.

64
Wilting, A, Cord, A., Hearn, A.J., Hesse, D., Mohamed, A., et al. 2010.
Modelling the Species Distribution of Flat-Headed Cats (Prionailurus
planiceps), an Endangered South-East Asian Small Felid. PLoS ONE 5:
e9612.
Wisz, M.S., Hijmans, R.J., Li, J., Peterson, A.T., Graham, C.H., Guisan, A. &
NCEAS Predicting Species Distributions Working Group. 2008. Effects of
sample size on the performance of species distribution models. Diversity
and Distributions 14: 763–773.
Zar J.H. 1999. Biostatistical analysis. 4th ed. Prentice-Hall International, New
Jersey.
Zeller, K. 2007. Jaguars in the New Millennium Data Set Update: The State of
the Jaguar in 2006. Unpublished Report. Wildlife Conservation Society, New
York, USA.

65
APÊNDICE I

66
A ser submetido para: Ecography

Effects of distance constraints on performance of species distribution models

Natália Mundim Tôrres1,2*, José Alexandre Felizola Diniz-Filho3, Leandro Silveira1,

Anah Tereza de Almeida Jácomo1, Paulo De Marco Júnior3

1
Jaguar Conservation Fund, C.P. 193, CEP 75.830-000, Mineiros, GO, Brazil
2
Graduate program in Ecology and Evolution, ICB, Universidade Federal de Goiás,

Campus Samambaia (Campus II), C.P. 131, CEP 74001-970 Goiânia, GO, Brazil.
3
Departamento de Biologia Geral, Instituto de Ciências Biológicas-ICB, Universidade

Federal de Goiás, Campus Samambaia (Campus II), C.P. 131, CEP 74001-970 Goiânia,

GO, Brazil

*Correspondence: Natália Mundim Tôrres, Jaguar Conservation Fund, C.P. 193, CEP
75.830-000, Mineiros, GO, Brazil. E-mail: nats.torres@jaguar.org.br

Short Running Title Distance constraints effects on distribution models

67
Abstract

Species distribution modelling (SDM) has raised as one of the most used methodologies
in the recent literature about distribution ecology, and several studies show that the
quality of data on species occurrences in geographical space had a great impact on final
performance of the model. As SDM are based on the idea that models results are the
expression of an accurate response of species to environmental changes, non-
independent distributed data must generate an underestimated species niche prediction
due to spatial autocorrelation. Our objective was to evaluate how spatial distance
constraints can affect SDM performance, adopting the jaguar potential distribution in
the Neotropics as a case study. We applied two of the main SDM methods that have
been used recently: Mahalanobis Distance (MD) and Maxent, using randomly split
jaguar sub samples locations, subjected to distance constraints (300, 500, 700 and 900
km), performing 10 resamples for each of these distances. For all performance metrics
considered at this study, Mahalanobis Distance and Maxent model results showed very
different patterns of variation between median values among the distance constraint
classes, and for MD the restriction of species occurrence data can improve results
performance significantly. Factors influencing species’ distributions always show some
level of autocorrelation, and distance constraints can be easily applied with presence-
only data, reducing errors caused by overestimation and improving the accuracy of
SDM. Nonetheless, as showed in this study, different methods respond differentially to
changes in the number of records included in the calibration (or training) data set, which
is an expected consequence of the establishment of a distance constraint between the
records (higher distance constraints will reduce the number of available records).
Depending on the model applied, the species data amount can be more influential than
the spatial autocorrelation between presence points.

Keywords

Jaguar, model performance, spatial autocorrelation, species distribution modeling

68
Introduction

Species distribution modelling (SDM) has raised as one of the most used

methodologies in the recent literature about distribution ecology (Guisan and

Zimmermann 2000, Elith and Leathwick 2009), and as a top issue, many studies have

detailed the necessary elements to apply this interesting and multi-functional tool (e.g.,

Araújo and Guisan 2006, Austin 2007, Jimenez-Valverde et al. 2008). Several studies

show that the choice of the proper modeling method (Segurado and Araújo 2004, Elith

et al. 2006), the selected environmental data used as predictors (Austin et al., 2006;

Syphard and Franklin 2009) and the quality of data on species occurrences in

geographical space (Marmion et al. 2008; Wisz et al. 2008; Veloz 2009) had a great

impact on final performance of the model. Moreover, these problems are not expected

to be independent. For example, the number of species occurrence points can be

determinant of the most appropriated method to be applied or the autocorrelation level

between these data can lead to some procedures that need to be done before running the

modeling process (which is ignored in several studies).

Species data characteristics, such as spatial and temporal sampling, can

influence SDM performance, so it is important to select the appropriate data set for

modeling and recognize the limitations of the results they produce considering spatial or

environmental bias, or small sample size (Luoto et al. 2005, Hernandez et al. 2006,

Franklin 2009). Particularly, when using existing distributional data sampled in a non-

random subset of the total area where the species occurs – that is the case in most

studies –, the spatial distribution of observations, sample size, scale of the observations,

temporal resolution and other aspects must be taken into account (Hirzel and Guisan

2002, Franklin 2009, Phillips et al. 2009, Veloz 2009).

69
The main issue is that some statistical methods (for example generalized linear

model – GLM) rely on strong assumptions regarding the data (need to be independently

and identically distributed), and violation of these statements may lead to biased model

estimations and to a predictive capability decrease (Hirzel and Guisan 2002). As SDM

are based on the idea that models results are the expression of an accurate response of

species to environmental changes, non-independent distributed data must generate an

underestimated species niche prediction due to spatial autocorrelation. Some authors

have stated that the absolute number of species observations may be less important than

having data that are well-distributed throughout the environmental space occupied by

the species (also called “climatic completeness”) (Kadmon et al. 2003, Franklin 2009).

Consequently, a critical step related to this question is to know how to choose an

optimal sampling strategy to model a species’ distribution (Hirzel and Guisan 2002).

It is well known in spatial analysis that the simple count of sample units is not a

good estimator of the effective sample size in most part of the studies. A set of closely

spaced observations provides less information than the same number of records better

distributed in space. Spatial autocorrelation leads to an overestimation of the effective

sample size (leading to pseudo replication), and thus increases the type I errors (false

positive values) (Segurado et al. 2006). Because of the potential meaning of these types

of biases, many methods have been developed to help account for spatial

autocorrelation in SDM, including a posteriori procedures, such as sub sampling of the

original species’ distribution data, using distance constraints that will reduce spatial

autocorrelation at a given amount (Brito et al. 1999, Guisan and Theurillat 2000).

Also, researchers of this topic have questioned what is an adequate or optimum

sample size and sample density for SDM or if is always better to have more data (Hirzel

and Guisan 2002, Franklin 2009). Some studies have found that sample size is

70
positively related to performance of SDM (Cumming 2000, Hirzel and Guisan 2002,

Reese et al. 2005), but others concluded that only 50 – 100 species presence records

were enough to achieve acceptable models performance (Stockwell and Peterson 2002,

Kadmon et al. 2003, Loiselle et al. 2008), and for some methods even less information

is required to generate satisfactory outcomes (Elith et al. 2006). These analyses have a

practical importance because although some databanks used in SDM have thousands of

observations, is common to find studies that only have much smaller presence

observations of the considered species (Franklin 2009).

Our objective in this study was to evaluate how spatial distance constraints can

affect SDM performance, adopting the jaguar (Panthera onca) potential distribution in

the Neotropics as a case study. To accomplish this purpose we applied two of the main

SDM methods that have been used recently: Mahalanobis Distance and Maxent. We

expect that both methods will be sensitive to spatial autocorrelation in some degree, but

that spatial constrains will represent more important limitation for more complex

species distribution algorithm, like the Maxent.

Methods

Jaguar occurrence data

We compiled information (geographic coordinates) on jaguar occurrence

through four distinct sources: 1) scientific books and papers; 2) online data bases

(including information of natural history museums and collections): Global Biodiversity

Information Facility database – GBFI <http://www.gbif.org/>; SpeciesLink -

<http://splink.cria.org.br>; Museum of Vertebrate Zoology -

<http://www.mip.berkeley.edu/mvz/index.html>); and 3) field records from the NGO

Jaguar Conservation Fund obtained through camera trapping and interviews with locals

71
throughout Brazil. We accumulated a total of 1819 occurrence points that were

standardized to decimal degrees (Fig. 1). A detailed list of references and locations is

available from the main author upon request.

Taking into consideration that the modeling accuracy is a balance of the quality

of distribution data and the available climatic and topographic datasets, we opted to use

a cell precision of 0.0417 degrees (nearly 4 km precision in cells near the Equator Line).

Under this constrain there were 1409 spatially unique records to use in the modeling

process.

Predictive variables

The predictive data consist of 10 climatic variables (precipitation of coldest

quarter, precipitation of warmest quarter, precipitation seasonality (coefficient of

variation), annual precipitation, mean temperature of wettest quarter, mean temperature

of driest quarter, maximum temperature of warmest period, minimum temperature of

coldest period, temperature seasonality (coefficient of variation), annual mean

temperature) derived from the WORLDCLIM (<http://www.worldclim.org/>); and two

topographic variables (altitude and slope) derived from the Hydro-1K global digital

elevation model (<http://edcdaac.usgs.gov/gtopo30/hydro/>). All variables above were

converted to a grid resolution of 0.0417 degrees.

Spatial partition of jaguar occurrence data

To test the impact of the sample point’s degree of spatial independence used as

input in the SDM and over the model’s performance, we randomly split the total jaguar

occurrence records in different groups, subjected to diverse distance constraints.

72
To define the minimum distance to separate the sub samples locations

guaranteeing a spatial independence considering the predictive variables used as input at

the SDM, we analyzed Moran’s I correlograms (Legendre and Legendre 1998) for the

environmental suitability obtained by Mahalanobis distances, as a synthesis of the

spatial variation in environmental variables used in niche modeling. We considered 15

classes of distance to calculate autocorrelation, ranging from 184 km to 17198 km. The

correlograms usually display a decrease in Moran’s I with increasing distances, so that

the distance at which the coefficient became non-significant can be considered as an

approximation of the independence distance among spatial sampling units for that

variable (Diniz-Filho and Telles 2002; see also Hawkins et al. 2007).

The correlogram was thus used as a guide to evaluate how increasing minimum

distances among occurrences affect species distribution modeling, and the intercept was

equal to 994 km. Because this metrics is used here as an overall guide for independent

sampling, we analyzed data by randomly sampling occurrence points with minimum

distances equal to 300 km, 500 km, 700 km and 900 km, performing 10 resamples for

each of these distances. This last distance, according to the correlogram, generates a

constrained sampling scheme in which maximum environmental independence among

occurrence points exist. It is also important to emphasize that, because of geometrical

constraints in spatial distribution, increasing minimum sampling distances will

necessarily reduce the number of occurrences available for each analysis. Thus, we also

seek to randomly find the maximum number of occurrences for each of these distance

constraints, which were 100 points, 50, 30 and 20 respectively, following the summary

at Table 1. The remaining records from the original data set were used as testing (or

evaluation) datasets. For each treatment we run species distribution models as described

below.

73
Species Distribution Modeling Methods

Modeling techniques employed in this work were chosen based on the constrain

to use presence-only data, as absence data are rarely available (the collections typically

have no information about the failure to observe the species at any given location, and

true absence can usually not be distinguished from failure of detection) (Gu and Swihart

2004). At this exercise, we selected two popular SDM algorithms that have performed

particularly well at other studies which compared the relative performance of different

methods (Elith et al. 2006, Tsoar et al. 2007).

The Maximum Entropy (Maxent) technique is a general-purpose method for

making predictions or inferences from incomplete information. The baseline of Maxent

is to estimate a target probability distribution by finding the probability distribution of

maximum entropy (i.e. that is most spread out, or closest to uniform), subject to a set of

constraints that represent our incomplete information about the target distribution

(Phillips et al. 2006). For species distribution modeling, the occurrence localities of the

species serve as the sample points, the geographical region of interest is the space on

which this distribution is defined, and the features are the environmental variables

(Phillips et al., 2004). The output format was set to be cumulative, convergence

threshold value was 10-5 (program default), and the number of maximum iterations was

set to 1000. The cumulative format is scale-independent and is more easily to be

interpreted when projected (Phillips and Dudik 2008) – the value assigned to a pixel is

the sum of the probabilities of that pixel and all other pixels with equal of lower

probability, multiplied by 100 to give a percentage (Phillips et al. 2006).

The Mahalanobis Distance (MD) is a method that ranks potential sites by their

Mahalanobis distance to a vector that expresses the mean environmental conditions of

all the records in the environmental space (Farber and Kadmon 2003). Then, the

74
distance from each cell in the grid is simultaneous projected and represent a quantitative

variable that is expected to be monotonic inversely correlated to the cell habitat

suitability for this species. This methodology provides a robust way of measuring how

similar a set of conditions is to an optimum set of conditions, and can be useful for

identifying which regions in a landscape are most similar to an optimum landscape

(Jenness 2003), in accordance with niche theory, which suggests the existence of

optimal environmental conditions for a species in addition to maxima and minima,

outside which the species cannot exist (Hutchinson 1957, Whittaker 1973). Besides,

Mahalanobis distance is based on both the mean and variance of the predictive

variables, as well as the covariance matrix of them, and as a result makes use of the

covariance between the considered variables (Jenness 2003). The result from MD is not

constrained so values can range from zero to infinity (Sangermano and Eastman 2007).

Evaluation of Model Performance and Thresholds

First of all, we computed the area under the curve (AUC) of the receiver-

operating characteristic (ROC) plot for each treatment for both SDM to differentiate and

compare the performance of the models. AUC is one of the most widely used threshold-

independent evaluators of model discriminatory power (Fielding and Bell 1997). The

curve is obtained by plotting sensitivity versus (1 – specificity) for a range of increasing

predictive threshold values. High performance models are indicated by large areas under

the ROC curves (Manel et al. 2001). Usually AUC values of 0.5 – 0.7 indicates low

accuracy, values of 0.7 – 0.9 indicates useful applications and values higher than 0.9

indicate high accuracy (Swets 1988). Although AUC is not an absolute measure and is

sensitive to the method in which absences in the evaluation data are selected (Lobo et al

75
2008), it remains as a valid measure of relative model performance between models and

between sample size for the same species and study area (Wisz et al. 2008).

Moreover, we calculated performance measures, including overall accuracy (or

correct classification rate), sensitivity, specificity and Cohen’s Kappa. To evaluate

these, it was required the deviation of matrices of confusion that identified true positive

(a), false positive (b), false negative (c) and true negative (d) cases predicted by each

model (Fielding and Bell 1997).

To derive binary presence-absence maps from continuous maps of suitability

(and to obtain the matrices of confusion) we adopted the “ROC plot-based approach”

threshold (it corresponds to the point on the ROC curve which has the shortest distance

to the top-left corner in ROC plot) (Liu et al. 2005, Pearson 2007). Sensitivity is the

proportion of observed presences that are predicted as such, and quantifies omission

errors, while specificity is the proportion of observed absences that are predicted as

such, quantifying commission errors (Allouche et al. 2006). Kappa provides an index

that considers both omission and commission errors and it corrects the overall accuracy

of model predictions by the accuracy expected to occur by chance (Cohen 1960). The

Kappa statistic ranges from -1 to +1, where +1 indicates perfect agreement and values

of zero or less indicate a performance no better that random (Cohen 1960).

We assumed as a “control distribution” the Jaguar Geographic Regions (JGRs)

presented at Sanderson et al. (2002), which are geographic units defined by potential

habitat and bioregion across the jaguar’s historic range, based on a detailed review of

the literature and expert knowledge in the field. The limits of this historic range were

approximated from Seymour (1989) as the range of jaguars around 1900.

76
Comparisons between treatments

To test the effect of the distance constraint (and consequently number of points

between sub samples) on the performance of both Mahalanobis Distance and Maxent

distribution models results, we run a Repeated Measures Analysis of Variance,

considering all performance metrics (Zar 1999). The assumptions of normality and

homogeneity of variances were tested (Levene’s test) and when the assumptions were

violated, logarithmic transformations were used to stabilize the variance. The post-hoc

Tukey test was applied when the ANOVA showed significant results, with the aim to

determine which distance constraints showed different means.

Results

Based on the correlogram (Fig. 2) it is possible to conclude that the

environmental suitability is strongly autocorrelated across geographical space with

significant Moran’s I in the first five geographical distances classes. The Moran’s I

decrease up to approximately 900 km, when it becomes close to the null expectation and

thus suggest that the occurrences become independent. We adopted this distance

constraint as the highest distance among occurrences to generate sub samples of

independently defined occurrences.

For all performance metrics considered at this study, Mahalanobis Distance


(MD) and Maxent model results showed very different patterns of variation between
median values among the distance constraint classes. The potential geographic
distribution predictions can be seen in Supplementary Material.

77
AUC - for training data

Considering the area under the receiver operating characteristic curve (AUC) for

the training data, it is possible to note that MD is sensitive to distance between locations

(F(3, 36)=15.699; p<0.001), showing an AUC increasing, especially at the highest classes

(700 and 900 km). The AUC value with points separated by at least 900 km was 0.028

(p<0.001) higher than for points 700 km apart, and 0.075 (p<0.001) higher than for

models using points with a spatial constraint of 500 km. Obviously these distance

effects are actually an effect of sample size since higher distance to control spatial

autocorrelation are only achieved by decreasing sample sizes. Thus, Maxent results are

much less affected by sample size, with the majority of constraint classes equivalent

(p>0.05) (Fig. 3a).

AUC - for testing data

In general, AUC for test data are lower than for training data for both methods

(Fig. 3). If we consider only the model results with testing data, the area under the

receiver operating characteristic curve (AUC) for Maxent showed a less sensitive

pattern than for MD (F(3, 36)=16.968; p<0.001), which showed some variation between

the distance classes. For MD, the mean AUC value with points separated by at least 700

km was 0.034 (p<0.001) higher than for points 500 km apart, the higher significant

difference (Fig. 3b).

Accuracy

Maxent results showed less sensitivity to distance constraints between locations

than MD, with a slightly influence at the extreme classes (300 km and 900 km). Results

obtained with constraints of 300 and 900 km were equivalent (p>0.05) as well as the

78
500 and 700 km (Fig. 4). Differently, MD is influenced mainly at the last two classes,

with an accuracy decreasing for the samples constrained by 700 km and 900 km

(F(3,36)=48.50; p<0.001). Considering this method, the mean accuracy values with points

separated by at least 500 km was 0.032 (p<0.001) higher than for points 700 km apart,

and 0.118 (p<0.001) higher than for models using points with a spatial constraint of 900

km. (Fig. 4). Also, it is evident the distinction between accuracy values for the two

evaluated methods: while mean values for Maxent ranged from 0.10 to 0.14, MD values

were between 0.77 and 0.89.

Omission Errors

For the omission errors encountered at the Maxent models we found that the first

(300 km) and last (900 km) distance constraints presented results statistically equivalent

(p>0.05) and lower than the two middle classes (500 and 700 km). Moreover, some

influence of distance constraint was found for the last class for MD results (F(3,

36)=51.25; p<0.001) (Fig. 5a). Considering MD, the mean omission error for the sub

samples with locations 900 km apart is 0.282 (p<0.001) higher than for samples

constrained by 700 km and 0.391 (p<0.001) higher in comparison with the 500 km

class.

Commission Errors

Differently from the other performance metrics patterns, the commission errors

of MD results were not influenced by distance constraints between the locations, with

small mean values, ranging from 0.003 to 0.008. The same pattern of sensitivity lack

was encountered for Maxent predictions, nonetheless the mean values of commission

errors for this methodology were higher, ranging from 0.98 to 0.99 (F(3, 36)=9.86; p<

0.001) (Fig. 5b).

79
Kappa

Results from comparisons between Kappa indexes showed the most frequent pattern

observed, as Maxent predictions were less sensitive to the different distance constraints

among the locations, whereas MD results were influenced at the last two classes (F(3,

36)=58.59; p<0.001). For MD, the mean Kappa values with samples separated by at least 900

km was 0.281 (p<0.001) lower than with samples with 700 km and 0.377 (p<0.001) lower

than 500 km. As the results obtained for accuracy estimates for Maxent, mean values

constrained by 300 or 900 km were equivalent (p>0.05) as well as the 500 and 700 km

distance classes (Fig. 6). However, all Kappa values obtained for Maxent models were

negatives, indicating that these performances were not better than a simple random prediction

(Allouche et al. 2006).

Discussion

Despite the recognition that spatial autocorrelation is relevant across all groups of

organisms and all spatial scales, this is only one more potential problem of which ecologists

should be careful (Dormann 2007). Although the general knowledge about the importance of

spatial autocorrelation (Legendre 1993, Lichstein et al. 2002), researchers frequently ignore or

minimize the extent to which the use of non independent data might affect the explanatory

power and predictive accuracy of models (Araújo et al. 2005, Segurado et al. 2006).

Some studies results have reinforced the idea that conclusions raised from niche-based

models could be compromised because of the autocorrelated nature of both predictor variables

and species’ occurrence (Hampe 2004, Segurado et al. 2006, De Marco et al. 2008).

Considering this, it is important to highlight the need of evaluating the suitability of data sets

prior to their use in SDM (Lozier et al. 2009). Model quality is clearly influenced by the

number of records used (Wisz et al. 2008) and also by the distribution of these records

80
(Allouche et al. 2008). Whereas several previous researchers have investigated the effect of

sample size on model accuracy, the majority has not explicitly manipulated sample size by

species (Segurado and Araújo 2004, Brotons et al. 2004), complicating the evaluation of

species ecological characteristics in opposition to sample size on model accuracy (Hernandez

et al. 2006). When sample size is not a limiting factor, re-sampling the original data adding a

distance constraint is an appropriate possibility (Segurado et al. 2006).

As shown here, sample size is not a limiting factor for jaguar, justifying the adoption

of this species as a model for the done analyzes. Moreover, the existence of a well accepted

distribution (Sanderson et al. 2002) used as a control at this study maximizes the possibilities

of comparison and evaluation of the models. But it is necessary to highlight that even this

“control distribution” presents some limitations as indicated by the own author. Sanderson et

al. (2002) admit that it can be slightly overestimated as it includes areas that likely were never

occupied by resident jaguars, including some areas above 2000 m in the Andes and Tepuis

(Venezuela). Also, it may be somewhat underestimated on its margins, particularly in the

southwestern United States, but authors estimated that less than 5% of the area in the JGRs is

subject to these problems.

Factors influencing species’ distributions always show some level of autocorrelation,

and distance constraints can be easily applied with presence-only data, reducing errors caused

by overestimation and improving the accuracy of SDM (Allouche et al. 2008). Nonetheless,

as showed in this study, different methods respond differentially to changes in the number of

records included in the calibration (or training) data set, which is an expected consequence of

the establishment of a distance constraint between the records (higher distance constraints will

reduce the number of available records). Besides, it is not possible to disconnect the obtained

result influence due to the effect of the distance constraints between points from the number

of occurrence points of each sub sample.

81
The methodology applied here to control spatial autocorrelation presents a conceptual

advantage comparing with other sampling strategies used before (i.e. random, regular grid or

stratified sampling) (Hirzel and Guisan 2002), due to the more accurate and objective criteria

provided by the Moran’I correlogram to choose a minimum distance to guarantee the spatial

independence between the locations. Nonetheless, in some cases, the “price” of assuring

spatial independence can be high, since with higher distance constraints the number of

available locations decrease, which can compromise some model’s performance metrics (such

as accuracy and Kappa index) as we observed for Mahalanobis Distance. Both accuracy and

Kappa’s graphics showed the same general pattern, indicating that for Maxent results are less

influenced by distance constraints (and consequently by the number of species locations used

as input) whereas Mahalanobis Distance performance can be affected by the decreasing

number of locations due to distance constraints mainly at the last two classes (700 km with 30

points and 900 km with 20 points each sub sample). Thus, depending on the model applied,

the species data amount can be more influential than the spatial autocorrelation between

presence points.

Considering the AUC values obtained with training data, Mahalanobis Distance

results with samples separated by 700 or 900 km seemed to show a better performance than

the other two distance classes, opposing to the results obtained for accuracy and Kappa as

discussed above. Nonetheless the approach using AUC has received some criticism,

particularly when absence records are not available, and some authors have stated that used as

the only measure of SDM predictive performance, the AUC “does not tell the whole story”

(Austin 2007, Pearson 2007, Lobo et al. 2008, Franklin 2009). These differences between the

metrics applied occurred mainly because of the variation in the way they are calculated. While

AUC is a threshold independent metric which describes the probability that the model scores

a random presence site higher than a random background site (Phillips et al. 2009), accuracy

82
and Kappa are threshold dependent, the last one is a measure of categorical agreement that

describes the difference between the observed agreement and chance agreement (Franklin

2009).

While omission error almost did not varied between Maxent sub sampling results,

using Mahalanobis Distance the error for the last two classes (700 and 900 km) was

significantly higher than for the first two (constrained by 300 or 500 km), mainly as a

consequence of location points decreasing. Differently, commission error did not presented

any variation for Mahalanobis Distance whereas for Maxent the same pattern was observed,

but in a much higher level of values (near 1.0 of commission error for all constraint distance

classes). As each method applies a different algorithm to define the environmental niche of

the species it was expected to find these dissimilar behaviors to different training sub sample

of set data. Nonetheless, the choice of minimizing one type of error to the detriment of the

other depends on the study application, for example, low omission errors should be prioritized

in studies for inventory orientation (Peterson 2006, Freeman and Moisen 2008) while

commission errors must be strongly avoided in studies intending to indicate priority

conservation areas (Loiselle et al. 2003).

At this study, we detected that for some methods (i.e. Mahalanobis Distance) the

restriction of species occurrence data used in SDM can improve the results performance

significantly. It is important to note that this is not a general pattern to all methods, as shown

here, indicating the necessity to test this influence for the specifically methodology that is

been adopted and also for the species and issue considered. The challenge here is to find a

balance between the spatial autocorrelation control and the number of presence records to be

used as input avoiding interference at the model’s performance (Brito et al. 1999).

83
References

Allouche, O. et al. 2008. Incorporating distance constraints into species distribution models. –
J. Appl. Ecol. 45: 599–609.
Allouche, O. et al. 2006. Assessing the accuracy of species distribution models: prevalence,
kappa and the true skill statistic (TSS). – J. Appl. Ecol. 43: 1223–1232.
Araújo, M. B. and Guisan, A. 2006. Five (or so) challenges for species distribution modelling.
– J. Biogeog. 33: 1677–1688.
Araújo, M.B. et al. 2005. Validation of species-climate impact models under climate change.
– Glob. Change Biol. 11: 1504–1513.
Austin, M.P. 2007. Species distribution models and ecological theory: A critical
assessment and some possible new approaches. – Ecol. Model. 200: 1–19.
Austin, M.P. et al. 2006. Evaluation of statistical models used for predicting plant species
distributions: Role of artificial data and theory. – Ecol. Model. 199: 197–216.
Brito, C. et al. 1999. Modelling wildlife distributions: Logistic Multiple Regression vs
Overlap Analysis. – Ecography 22: 251–260.
Cohen, J. 1960. A coefficient of agreement for nominal scales. – Psychol. Bull. 20: 37–46.
Cumming, G.S. 2000. Using between-model comparisons to fine-tune linear models of
species ranges. – J. Biogeogr. 27: 441–455.
De Marco, P. et al. 2008. Spatial analysis improves species distribution modelling during
range expansion. – Biol. Lett. 4: 577–580.
Diniz-Filho, J. A. F. and Telles, M. P. C. 2002. Spatial autocorrelation analysis and the
identification of operational units for conservation in continuous populations. – Conserv.
Biol. 16: 924–935.
Dormann, C. F. 2007. Effects of incorporating spatial autocorrelation into the analysis of
species distribution data. – Global Ecol. Biogeogr. 16: 129–138.
Elith, J. et al. 2006. Novel methods improve prediction of species distributions from
occurrence data. – Ecography 29: 129–151.
Elith, J. and Leathwick, J. 2009. Species distribution models: Ecological explanation and
prediction across space and time. – Ann. Rev, Ecol. Evol. Syst. 40: 677–697.
Farber, O. and Kadmon, R. 2003. Assessment of alternative approaches for bioclimatic
modeling with special emphasis on the Mahalanobis distance. – Ecol. Model. 160: 115–
130.
Franklin, J. 2009. Mapping Species Distributions: Spatial Inference and Prediction. –
Cambridge University Press.

84
Freeman, E. A. and Moisen, G. G. 2008. A comparison of the performance of threshold
criteria for binary classification in terms of predict prevalence and kappa. – Ecol. Model.
217: 48–58.
Fielding, A. H. and Bell, J. F. 1997. A review of methods for the assessment of prediction
errors in conservation presence/absence models. – Environ. Conserv. 24: 38–49.
Gu, W. and Swihart, R. K. 2004. Absent or undetected? Effects of non-detection of species
occurrence on wildlife–habitat models. – Biol. Conserv. 116: 195–203.
Guisan, A. and Theurillat, J. P. 2000. Assessing alpine plant vulnerability to climate change: a
modeling perspective. – Integrat. Assess. 1: 307–320.
Guisan, A. and Zimmermann, N. E. 2000. Predictive habitat distribution models in ecology. –
Ecol. Model. 135: 147–186.
Hampe, A. 2004. Bioclimate envelope models: what they detect and what they hide. – Global
Ecol. Biogeogr. 13: 469–471.
Hawkins, B. A. et al. 2007. Red herrings revisited: spatial autocorrelation and parameter
estimation in geographical ecology. – Ecography 30: 375–384.
Hernandez, P. A. et al. 2006. The effect of sample size and species characteristics on
performance of different species distribution modeling methods. – Ecography 29: 773–785.
Hirzel, A. and Guisan, A. 2002. Which is the optimal sampling strategy for habitat suitability
modelling. – Ecol. Model. 157: 331–341.
Hutchinson, G. E. 1957. Population Studies - Animal Ecology and Demography - Concluding
Remarks. – Cold Spring Harbor Symposia on Quantitative Biology 22: 415–427.
Jenness, J. 2003. Mahalanobis distances manual.
<http://jennessent.com/arcview/arcview_extensions.htm> Accessed 23 May 2007.
Jiménez-Valverde, A. et al. 2008. Not as good as they seem: the importance of concepts in
species distribution modelling. – Divers. Distrib. 14: 885–890.
Kadmon, R. et al. 2003. A systematic analysis of factors affecting the performance of climatic
envelope models. – Ecol. Appl.13: 853–867.
Legendre, P. 1993. Spatial autocorrelation: trouble or new paradigm? – Ecology 74: 1659–
1673.
Legendre, P. and Legendre , L. 1998. Numerical Ecology. – Elsevier.
Lichstein, J. W. et al. 2002. Spatial autocorrelation and autoregressive models in ecology. –
Ecol. Monogr. 72: 445– 463.
Liu, C. R. et al. 2005. Selecting thresholds of occurrence in the prediction of species
distributions. – Ecography 28: 385–393.
Lobo, J. M. et al. 2008. AUC: a misleading measure of the performance of predictive
distribution models. – Global Ecol. Biogeogr. 17: 145–151.

85
Loiselle, B. A. et al. 2003. Avoiding pitfalls of using species distribution models in
conservation planning. – Conservation Biology 17: 1591– 1600.
Loiselle, B. A. et al. 2008. Predicting species distributions from herbarium collections: does
climate bias in collection sampling influence model outcomes? – J. Biogeogr. 35: 105–116.
Lozier, J. D. et al. 2009. Predicting the distribution of Sasquatch in western North America:
anything goes with ecological niche modelling. – J. Biogeogr. 36: 1623–1627.
Luoto, M. et al. 2005. Uncertainty of bioclimate envelope models based on the geographical
distribution of species. – Global Ecol. Biogeogr. 14: 575–584.
Manel, S. 2001. Evaluating presence-absence models in ecology: the need to account for
prevalence. – J. Appl. Ecol. 38: 921–931.
Marmion, M. 2009. The performance of state-of-the-art modelling techniques depends on
geographical distribution of species. – Ecol. Model. 220: 3512–3520.
Pearson, R. G. 2007. Species’ distribution modeling for conservation educators and
practitioners. Synthesis. American Museum of Natural History. Available at
http://ncep.amnh.org.
Peterson, A. T. 2006. Uses and requirements of ecological niche models and related
distributional models. – Biodivers. Inform. 3: 59–72.
Phillips, S. J. 2006. Maximum entropy modeling of species geographic distributions. – Ecol.
Model. 190: 231–259.
Phillips, S. J. and Dudik, M. 2008. Modeling of species distributions with Maxent: new
extensions and a comprehensive evaluation. – Ecography 31: 161–175.
Phillips, S.J. et al. 2009. Sample selection bias and presence-only distribution models:
implications for background and pseudo-absence data. – Ecol. Appl. 19: 181–197.
Phillips, S. J. 2004. A maximum entropy approach to species distribution modeling. –
Proceedings of the Twenty-First International Conference on Machine Learning, 655–662.
Reese, G. C. et al. C.H., 2005. Factors affecting species distribution predictions: a simulation
modeling experiment. – Ecol. Appl. 15: 554–564.
Sanderson, E. et al. 2002. Planning to save a species: the jaguar as a model. – Conserv. Biol.
16: 58–72.
Sangermano, F. and Eastman, R. 2007. Linking GIS and Ecology - The use of Mahalanobis
typicalities to model species distribution. 1–13. – In: Buzai, G. D., editor. Memorias XI
Conferencia Iberoamericana de Sistemas de Información Geográfica Buenos Aires.
Segurado, P. and Araújo, M. B. 2004. An evaluation of methods for modelling species
distributions. – J. Biogeogr. 31: 1555–1568.
Segurado, P. et al. 2006. Consequences of spatial autocorrelation for niche-based models. – J.
Appl. Ecol. 43: 433–444.
Seymour, K. L. 1989. Panthera onca. – Am. Soc. Mamm. Mammalian Species 340: 1–9.

86
Stockwell, D. R. B. and Peterson, A. T. 2002. Effects of sample size on accuracy of species
distribution models. – Ecol. Model. 148: 1–13.
Swets, J. A. 1988. Measures of the accuracy of diagnostic systems. – Science 240: 1285–
1293.
Syphard, A.D. and Franklin, J. 2009. Differences in spatial predictions among species
distribution modeling methods vary with species traits and environmental predictors. –
Ecography 32: 907–918.
Tsoar, A. et al. 2007. A comparative evaluation of presence-only methods for modelling
species distribution. – Divers. Distrib. 13: 397–405.
Veloz, S. D. 2009. Spatially autocorrelated sampling falsely inflates measures of accuracy for
presence-only niche models. – J. Biogeogr. 36: 2290–2299.
Wisz, M.S. et al. 2008. Effects of sample size on the performance of species distribution
models. – Divers. Distrib. 14: 763–773.
Whittaker, R. H. 1973. Niche, habitat and ecotope. – Amer. Naturalist. 107: 321–338.
Zar J. H. 1999. Biostatistical analysis. 4th ed. – Prentice-Hall International.

87
Table 1. Information about the jaguar occurrence sub samples randomly
generated at this study to test the spatially influence on the SDM performance

N. samples Distance constraints N. train points


(km)
10 300 100
10 500 50
10 700 30
10 900 20

88
Figure Captions

Figure 1. Map showing jaguar (Panthera onca) presence records (n = 1819). In gray is shown
the original jaguar distribution (Sanderson et al. 2002) used as control at this study.

Figure 2. Environmental distance correlogram for 15 classes of distance from locations to the
optimum center of the distribution modeled using Moran’s I coefficients. Dashed line
indicates the Moran’s I value expected under the null hypothesis of spatial autocorrelation
absence.

Figure 3. Results of sub-sampling experiments testing the effect of distance between locations
used as training (a) (F(3, 36)=15.699; p<0.001) and used as testing (b) (F(3, 36)=16.968;
p<0.001) on predictive performance of niche-based models (Mahalanobis Distance and
Maxent). Median area under the receiver operating characteristic curve (AUC) and confidence
intervals of ±95% (vertical bars) for each distance constraint class. Different letters represent
significant differences (p<0.05).

Figure 4. Results of sub-sampling experiments testing the effect of distance between locations
used as training on predictive performance of niche-based models (Mahalanobis Distance and
Maxent) (F(3,36)= 48.50; p<0.001). Accuracy median values and confidence intervals of ±95%
(vertical bars) for each distance constraint class. Different letters represent significant
differences (p<0.05).

Figure 5. Results of sub-sampling experiments testing the effect of distance between locations
used as training on omission error (a) (F(3, 36)=51.25; p<0.001) and commission error (b) (F(3,
36)=9.86; p< 0.001) of niche-based models (Mahalanobis Distance and Maxent). Error median
values and confidence intervals of ±95% (vertical bars) for each distance constraint class.
Different letters represent significant differences (p<0.05).

Figure 6. Results of sub-sampling experiments testing the effect of distance between locations
used as training on predictive performance of niche-based models (Mahalanobis Distance and
Maxent) (F(3, 36)=58.59; p<0.001). Kappa median values and confidence intervals of ±95%
(vertical bars) for each distance constraint class. Different letters represent significant
differences (p<0.05).

89
Figure 1.

90
0.35

0.30

0.25

0.20

0.15
Moran's I

0.10

0.05

0.00

-0.05

-0.10

-0.15
0 2000 4000 6000 8000 10000 12000 14000 16000 18000
Distance Units

Figure 2.

91
0.95 0.95
(a) (b) Mahalanobis Distance
0.94 0.94
c
Maxent
0.93 0.93
c
0.92 d c 0.92
b
b d
0.91 b 0.91
d
AUC - training data

AUC - testing data


0.90 b d 0.90

0.89 0.89 a a

a
0.88 0.88 d
a b
b
0.87 0.87 b d
b b
0.86 a 0.86 c

0.85 Mahalanobis Distance 0.85 c

0.84 Maxent 0.84

0.83 0.83
300 500 700 900 300 500 700 900
Distance constraint Distance constraint

Figure 3.

92
1.0
Mahalanobis Distance

0.9 Maxent
a a
b
0.8
c
0.7

0.6
Accuracy

0.5

0.4

0.3

0.2

0.1 d d
e e

0.0
300 500 700 900
Distance constraint

Figure 4.

93
1.1 1.1
(a) (b)
1.0 1.0
c d d d
0.9 0.9

0.8 0.8
d
e c e
0.7 e 0.7

0.6 d d 0.6

Commission
Omission

0.5 0.5

0.4 0.4 Mahalanobis Distance


b
0.3 a 0.3 Maxent
a
0.2 0.2
Mahalanobis Distance
0.1 0.1
a a a b
Maxent
0.0 0.0

-0.1 -0.1
300 500 700 900 300 500 700 900
Distance constraint Distance constraint

Figure 5.

94
1.0
Mahalanobis Distance

0.8 Maxent

a a
0.6
b

0.4
c

0.2
Kappa

0.0

-0.2

-0.4

d
d
-0.6 e
e

-0.8
300 500 700 900
Distance constraint

Figure 6.

95
Supplementary Material

Potential geographic distribution predictions for jaguar (Panthera onca) accordingly


with Mahalanobis Distance and Maxent, using median between 10 sub samples
separated by different distance constraints (300 km , 500 km, 700 km and 900 km).
Darker colors indicate progressively higher environmental suitability.

Mahalanobis 300 km Maxent 300 km

Mahalanobis 500 km Maxent 500 km

96
Mahalanobis 700 km Maxent 700 km

Mahalanobis 900 km Maxent 900 km

97
APÊNDICE II

98
Submetido a: Diversity and Distributions

Can species distribution modelling provide estimates of population densities? A


case study with jaguars in the Neotropics

Natália Mundim Tôrres1,2*, Paulo De Marco Júnior3, Leandro Silveira1, Anah Tereza de

Almeida Jácomo1, José Alexandre Felizola Diniz-Filho3

1
Jaguar Conservation Fund, C.P. 193, CEP 75.830-000, Mineiros, GO, Brazil
2
Graduate program in Ecology and Evolution, ICB, Universidade Federal de Goiás,

Campus Samambaia (Campus II), C.P. 131, CEP 74001-970 Goiânia, GO, Brazil.
3
Departamento de Biologia Geral, Instituto de Ciências Biológicas-ICB, Universidade

Federal de Goiás, Campus Samambaia (Campus II), C.P. 131, CEP 74001-970 Goiânia,

GO, Brazil

*Correspondence: Natália Mundim Tôrres, Jaguar Conservation Fund, C.P. 193, CEP
75.830-000, Mineiros, GO, Brazil. E-mail: nats.torres@jaguar.org.br

Short Running Title Distribution models and population density

99
ABSTRACT (A)

Aim To test the prediction that environmental suitability derived from species
distribution modelling (SDM) could be reliable surrogates for jaguar population density
estimates.

Location Americas

Methods Species distribution modelling methods were employed using jaguar


presence-only records. Results were compared using performance metrics. Information
about jaguar population density estimates was used from 37 different sites along its
distribution. The relationship between these data and habitat suitability predicted by
SDM was analyzed by a linear regression. Dividing density values in two groups
accordingly to its median value, we conducted a samples t test to determine if there was
a difference in group suitability means for each SDM. A Levene F-test was applied to
test if the relationship between abundance and suitability form a constraint envelope.

Results Considering the usual SDM evaluation metrics the better evaluated models
were ANN and Domain. The positive relationship between suitability estimate and
jaguar density was found only for four methods (Maxent, GBM, Bioclim and GARP)
but always with weak data fitness. Bioclim showed the strongest relationship.
Suitability variances for lower densities values were greater than for higher density
values for many SDM models.

Main conclusions Results indicate that the relationship between density and suitability
could be better described as a polygonal constraint envelope than by a straight positive
relationship. Some methods can discriminate regions with high or low densities. We
notice that low jaguar densities can occur in areas with low or high suitability, whereas
high density values are restricted to areas where the suitability is also superior. Areas
located in high suitability regions which present low density estimates must be
subjected to factors acting in local scales avoiding that the population reaches a higher
density value as expected by the favorable regional environmental conditions.

Keywords
Correlation, jaguar, population density estimates, polygonal envelope, species
distribution modelling, suitability.

100
INTRODUCTION (A)

Geographical patterns of distribution and abundance of species are important


topics in ecology and several empirical studies suggest and test cross-species
relationship between these variables (Brown, 1984; Kunin, 1998; He & Gaston, 2007;
Figueiredo & Grelle, 2008). Both of these issues are of fundamental importance to
conservation biology, as we can only protect species that we know where they occur
and considering abundance information it is possible to analyze species’ probabilities of
persistence (rather than only its presence), an issue that has been discussed as an ideal in
longer-term conservation approaches (Schonewald-Cox et al., 1991; Williams &
Araújo, 2000).
Abundance, or population density, is considered a crude statistical representation
of the spatial distribution of individuals, and its measure requires choosing arbitrary
boundaries, count the individuals within them and then divide by the area (Brown,
1995). The resulted number, N individuals per unit area, discards much of the
information embodied in the distributional data. Moreover, comparisons between
densities estimates are not absolutely reliable because they depend on the spatial scale at
which the abundance was originally estimated (Schonewald-Cox et al., 1991;
Smallwood, 1999), as well as other variables (such as habitat quality). Although density
is a basic requirement for assessing the status of any population, accurate estimations
are expensive and time consuming, especially if we are concerned about large scale
conservation strategies.
Otherwise, geographic range is also a trick variable. Considered as a simplified
abstraction of a complex phenomenology driven by multiple ecological and
evolutionary processes acting at distinct temporal scales (Brown et al., 1996), mapping
the range of a species can usually follow two procedures: the “dot map”, in which the
points represent all known locations where the species is registered; and the “boundary
map”, a common approach consisting in interpolating the presence records to establish
an overall area or extent of occurrence. This “boundary map” based-estimation
excessively simplifies biotic and abiotic distinctions such as geographic variables,
historic effects, climatic differences and habitat types (Lim et al., 2002), and it is not
possible to known if the blank spaces represent areas where the species does not occur
or areas that have not been sampled sufficiently (Brown, 1995). However, neither
methodology is able to capture the detailed information of the geographic range of a

101
species, a complex and dynamic reflection of the distribution of all the individuals
(Brown, 1995).
More recently, species distribution modelling (SDM) based on Geographical
Information System methods has been widely used as an alternative to this previous
subjective approach. This innovative method produce maps that indicate where
elements (i.e., species, ecological community types, etc.) are likely to occur (Pearson et
al., 2007; Fuller et al., 2007). A measure related to the suitability is quantified as a
function of the underlying environmental variables at the locations of known
occurrences. This modelling approach has been favored as large scale climatic and
ecological datasets became available, in the last ten or fifteen years. Consequently, the
efficiency and options to model and map complex relationships between species and
environment have been more accessible (Rushton et al., 2004; Johnson & Gillingham,
2005).
The use of models to predict potential distribution based on species ecological
requirements extrapolating data to unknown areas can be useful for several analyses,
such as evaluate natural reserve status, indicate the establishment of new conservation
units, guide field research more efficiently, predict climatic changing effects, estimate
the real distribution of threatened and rare species and indicate areas to restoration
habitat and species reintroduction (Stockwell & Peters, 1999; Lim et al., 2002; Peterson
et al., 2002; Johnson & Gillingham, 2005; Ortega-Huerta & Peterson, 2005). However,
for the application of several of these questions, it is expected that the models reflect the
extent to which local environments meet the multivariate Hutchinsonian niche
requirements of the species, in a way that the predictions are thought to be good
indicators of habitat suitability and, consequently, of species’ performance (Thuiller et
al., 2010). One of the models’ statements is that observed species distributions are in
equilibrium with environmental factors that limit those distributions (Guisan & Thuiller,
2005, but see De Marco et al., 2008). Consequently, the basic assumption is that the
more frequent occupied habitat are also the ones with highest suitability values
reflecting the best environmental conditions – an issue that has been little investigated
or tested (Albert & Thuiller, 2008; VanDerWal et al., 2009; Thuiller et al., 2010).
Considering this, it would be expected that the suitability values derived from SDM
should be good surrogates for species density, with important application especially for
large scale conservation efforts.

102
Taking into consideration the wide options of SDM approaches and recent
discussions about this topic (e.g., Guisan & Zimmermann, 2000; Elith et al., 2006;
Austin, 2007; Elith & Graham, 2009; Elith & Leathwick, 2009), it is recommended to
apply more than one of these methods, compare the results and test their performance to
evaluate which one provides the best estimation for the species and for the research
purpose (McNyset & Blackburn, 2006; Stockman et al., 2006a,b; Araújo & New, 2006).
Also, it is interesting to evaluate the relationship between this probability of occurrence
with biological traits such as abundance, density or persistence to justify the use of
SDM as a tool for conservation strategies.
The choice between alternative modelling approaches relies mainly on the
characteristics of the distributional data of the species under concern. If both presence
and absence occurrence data are available, general-purpose statistical methods can be
used to generate functions or determinant rules that allow suitable habitat classification
(Guisan & Zimmermann, 2000; Austin, 2002; Segurado & Araújo, 2004; Elith et al.,
2006). Nevertheless, while vast sources of presence-only data exist (particularly in
natural history collections) (Graham et al., 2004), absence data are rarely accessible,
especially for poorly sampled tropical regions where modelling potentially has the most
value for conservation planning (Phillips et al., 2004; Phillips et al., 2006). Hence,
another group of techniques requires just presence data, searching for climatic variables
intervals where the species can occurs, considering the amplitude of these variables in
locations where the species is present (Stockwell & Noble, 1992; Lehmann, 1998;
Hirzel et al., 2002; Brotons et al., 2004).
In this paper, we estimate jaguar Panthera onca (Linnaeus, 1758) potential
geographical distribution for the entire American continent applying and comparing 11
different predictive modelling approaches, using more than 1800 jaguar presence point
locations. More specifically, we test the prediction that suitability measures derived
from SDM could be reliable surrogates for jaguar population density data of locations
along its distribution.

103
METHODS (A)

Jaguar occurrence data (B)

We compiled information (geographic coordinates) on jaguar occurrence from


four distinct sources: 1) scientific books and papers; 2) online data bases (including
information of natural history museums and collections): Global Biodiversity
Information Facility database – GBFI - http://www.gbif.org/; SpeciesLink -
http://splink.cria.org.br; Museum of Vertebrate Zoology -
http://www.mip.berkeley.edu/mvz/index.html); and 3) field records from the NGO
Jaguar Conservation Fund obtained through camera trapping and interviews with locals
throughout Brazil. We accumulated a total of 1819 presence records points that were
standardized to decimal degrees (Fig. 1). A detailed list of references and locations is
available from the main author upon request.
Considering that the modelling accuracy is constrained by the quality of
distribution data and the available climatic and topographic datasets, we opted to use a
cell precision of 0.0417 degrees (nearly 4 km precision in cells near the Equator Line).
Under this constrain there were 1409 spatially unique records to use in the modelling
process.

Predictive variables (B)

The predictive data consist of 10 climatic variables (precipitation of coldest


quarter, precipitation of warmest quarter, precipitation seasonality (coefficient of
variation), annual precipitation, mean temperature of wettest quarter, mean temperature
of driest quarter, maximum temperature of warmest period, minimum temperature of
coldest period, temperature seasonality (coefficient of variation), annual mean
temperature) derived from the WORLDCLIM (http://www.worldclim.org/); and two
topographic variables (altitude and slope) derived from the Hydro-1K global digital
elevation model (http://edcdaac.usgs.gov/gtopo30/hydro/). As with the jaguar
occurrence data, all variables above were converted to a grid resolution of 0.0417
degrees.

104
Species Distribution Modelling Methods (B)

The 11 modelling techniques employed here were chosen based on the


constraint to use presence-only data, as absence are rarely available (the collections
typically have no information about the failure to observe the species at any given
location, and true absence can usually not be distinguished from failure of detection)
(Gu & Swihart, 2004). However, for several of the applied methods it was necessary to
use samples of the background environment, also called pseudo-absences (random
points through the considered area where the species was not recorded) (Elith et al.,
2006) (i.e. Maxent, CTA, RF, GBM, MARS, MDA, ANN, GARP). We also considered
that the use of a large dataset of jaguar occurrence may diminish the inherent problems
related to presence-only data, since it represents a better description of the jaguar
environmental niche.
The methods are conceptually and statistically different, varying from the
simplest ones to more complex techniques. As they have been widely described and
compared in recent studies, detailed descriptions of their implementation can be found
elsewhere (Segurado & Araújo, 2004; Elith et al., 2006; Tsoar et al., 2007; Phillips &
Dudík, 2008), thus we only list them here: Bioclimatic Envelope (BIOCLIM) (Busby,
1991), Mahalanobis Distance (MD) (Farber & Kadmon, 2003), DOMAIN (Carpenter et
al., 1993), Maximum Entropy (Maxent) (Phillips et al., 2006), Classification Tree
Analysis (CTA) (Breiman et al., 1984), Random Forests (RF) (Breiman, 2001),
Generalised Boosting Models (GBM) (Friedman, 2001), Multivariate Additive
Regression Spline (MARS) (Moisen & Frescino, 2002), Mixture Discriminant Analysis
(MDA) (Manel et al., 1999), Artificial Neural Networks (ANN) (Segurado & Araújo,
2004) and Genetic Algorithm for Rule Set Production (GARP) (Stockwell & Noble,
1992).

Evaluation of Model Performance and thresholds (B)

Primary, we computed the area under the receiver operating characteristic


(ROC) curve (AUC) for each SDM to differentiate and compare the performance of the
models. AUC is one of the most widely used threshold-independent evaluators of model
discriminatory power (Fielding & Bell, 1997). The curve is obtained by plotting
sensitivity versus (1 – specificity) for a range of increasing predictive threshold values.

105
High performance models are indicated by large areas under the ROC curves (Manel et
al., 2001). Usually AUC values of 0.5 – 0.7 indicates low accuracy, values of 0.7 – 0.9
indicates useful applications and values higher than 0.9 indicate high accuracy (Swets,
1988). Although AUC is not an absolute measure and is sensitive to the method in
which absences in the evaluation data are selected (Lobo et al., 2008), it remains as a
valid measure of relative model performance between models and between sample size
for the same species and study area (Wisz et al., 2008).
Also, we calculated other performance measures, including overall accuracy,
sensitivity, specificity and Cohen’s kappa. To evaluate these, it was required the
deviation of matrices of confusion that identified true positive (a), false positive (b),
false negative (c) and true negative (d) cases predicted by each model (Fielding & Bell,
1997).
We implemented two approaches to derive binary presence-absence maps from
continuous maps of suitability (and to obtain the matrices of confusion): the “ROC plot-
based approach” threshold (it corresponds to the point on the ROC curve which has the
shortest distance to the top-left corner in ROC plot) and the “lowest predicted value”
threshold (LPV) (that is the lowest predicted value of environmental suitability
corresponding with a presence occurrence record) (Liu et al., 2005; Phillips et al., 2006;
Pearson, 2007). Sensitivity is the proportion of observed presences that are predicted as
such, and quantifies omission errors, while specificity is the proportion of observed
absences that are predicted as such, quantifying commission errors (Allouche et al.,
2006). Kappa provides an index that considers both omission and commission errors
and it corrects the overall accuracy of model predictions by the accuracy expected to
occur by chance (Cohen, 1960). The kappa statistic ranges from -1 to +1, where +1
indicates perfect agreement and values of zero or less indicate a performance no better
than random (Cohen, 1960).
To evaluate the binary predictions obtained as explained above, we adopted as a
“control distribution” the Jaguar Geographic Regions (JGRs) presented at Sanderson et
al. (2002), which are geographic units defined by potential habitat and bioregion across
the jaguar’s historic range (Fig. 1). The limits of this historic range were approximated
from Seymour (1989) as the range of jaguars around 1900. Sanderson et al. (2002)
admit that it can be slightly overestimated as it includes regions that likely were never
occupied by resident jaguars, including some areas above 2000 m in the Andes. Also, it
may be somewhat underestimated on its margins, particularly in the southwestern

106
United States, but it is estimated that less than 5% of the area in the JGRs is subject to
these problems.

Jaguar density data (B)

Recently, the use of camera-traps, in combination with capture-recapture


sampling methods to estimate the abundance, has been widely applied to estimate
density of jaguar populations throughout the species’ entire Neotropical range (Cullen et
al., 2005; Kelly, 2003; Maffei et al., 2004; Silver et al., 2004; Soisalo & Cavalcanti,
2006). To date, at least 83 different camera trapping efforts have been carried out to
survey jaguars in 14 countries, and Maffei et al. (2011) summarized information on
these studies, discussing their design and results.
From the 44 studies that presented population density estimates (see Table 8.2
from Maffei et al., 2011), seven fail to detect the presence of jaguars, despite
documentation of individuals from these areas by other means (e.g. tracks, scats, direct
observation, camera trap records from other studies). We did not consider these studies
because a number of problems can explain these negative results, including camera
failure, insufficient camera trapping period or location of cameras combined with a lack
of knowledge of jaguar’s routes. Without these sites, we have 37 locations with jaguar
density information (Fig. 1).
Nevertheless, density estimates frequently are not reliably used in comparisons
because they depend on the spatial scale at which the abundance was originally
estimated (Smallwood, 1999). Because of that, we need to consider that density
estimates are extremely sensitive to the calculation of the effective survey area, which in
turn depends on the size of the buffer surrounding traps (Maffei et al., 2011). This issue
has been discussed among some authors (Parmenter et al., 2003; Soisalo & Cavalcanti,
2006; Maffei & Noss, 2008), and Maffei & Noss (2008) recommend that camera trap
surveys should encompass at least four average home ranges of the target species. For
jaguars, this value would be in the range of 100-180 km2 in Central America while in
South America should vary between 500-600 km2 (Maffei et al., 2011). Considering
this restriction, and adopting a more conservative approach, the group of 37 density data
locations decreases to 17 localities, when we apply this recommendation. We used both
data groups to analyze and compare the relationship between distribution models
suitability estimation and jaguar density estimates.

107
Figure 1

Relationship between jaguar density and suitability measures derived from SDM
(B)

To analyze the relationship between jaguar density estimates and habitat


suitability predicted by SDM used here, first we extract the suitability values from the
density studies locations. We tested a linear regression between these values for both
groups (of 37 and 17 density values) where we defined density as the response variable
and habitat suitability of each model as a fixed explanatory variable.
In addition we tested a linear regression between the AUC and Kappa values of
each SDM and the regression coefficient between suitability and densities to analyze if
the best models identified by AUC and Kappa values are the ones more related with
density estimates data.
Density values (for both 37 and 17 data groups) were divided in two groups
accordingly to its median value and an independent samples t test was conducted to
determine if there was a difference in group suitability means for each adopted SDM
methodology. Also, the resulting distributions were compared using Levene F-test to
determine if the standard deviations (or equivalent variances) are equal between regions
with lower and higher density values, since relationship between abundance and habitat
suitability may form a complex constraint envelope space (see Brown, 1995). This
envelope appears because high abundances may be found in highly suitable places, but
low abundances can be found in both highly and low suitable places (because of other
factors driving abundance and the way environmental suitability was defined here,
derived from climate data only).

RESULTS (A)

Potential geographic distribution predictions for jaguar accordingly with the 11


methods adopted in this study can be seen in Appendix S1 in Supporting Information.
Results from evaluation of model performance for each SDM are shown in
Table 1. We highlighted the highest values for AUC, Kappa and accuracy and the
lowest values for omission, commission and total errors (indicating the best SDM for

108
jaguar). The better evaluated models were ANN (presenting almost all the best results
considering ROC plot-based threshold) and DOMAIN (which showed the highest AUC
value (0.975) and the majority of best values for the threshold adopting the lowest
predicted value approach) (Table 1).
For some methods (GARP, CTA, MDA and BIOCLIM), it was necessary to
adjust the LPV threshold for > 0 because there were presence points predicted as
absences by the models (with zero suitability), even when the SDM parameters were set
to consider zero of omission (GARP, for example).
Excluding CTA and ANN methods, for all other SDM the total errors where
lower when considering the threshold with the lowest predicted value (LPV) than with
the ROC plot-based, as well as the accuracy was higher for almost all methods (except
for CTA, MARS and ANN) and also the Kappa index (apart from CTA and ANN, both
with negative Kappa values). In general, for both thresholds tested, commission errors
were low while omission errors were higher, determining the total error. Markedly
exceptions are CTA and ANN with LPV threshold which showed 0.993 and 0.992 of
commission error and only 0.041 and 0.016 of omission respectively. Also, it must be
emphasized that even with the highest AUC value, Domain model with ROC threshold
presented the second highest value for omission error (0.689), after RF (0.779).
Comparing all models constrained by ROC plot-based threshold, ANN is the
one with lower total errors (0.301). Besides that, a group of other methods showed
similar values, smaller than 0.4 (MDA, GARP, MD, CTA, BIOCLIM). All of these
presented omission errors ranging from 0.280 to 0.363 and commission errors varying
between 0.008 and 0.021. So, considering these performance evaluators and the adopted
threshold approach, these methods were also well evaluated.
Although we expecting a general positive relationship between model-based
suitability estimate and jaguar density, we found this pattern only for three SDM within
the 37 data group (Maxent, GBM and BIOCLIM) and for two SDM within the 17 data
group (GARP and also BIOCLIM), but always with a low coefficient of determination
showing a weak data fitness (Table 2 and Fig. 2). BIOCLIM showed the strongest
relationship (r = 0.579, P = 0.01, R2 = 0.33), considering the 17 density records (in a
more conservative approach) (Fig. 2 (e)). The t test analysis between suitability means
showed a significant difference only for BIOCLIM model, which was also the model
that presented the strongest positive relationship with density values (Table 3).

109
Figure 2

Suitability variances for lower densities values were greater than for higher
density values for many SDM models (significant Levene F for Maxent, GARP, CTA,
GBM and RF for the 37 data group; and for Maxent, Mahalanobis Distance, GARP,
CTA and GBM considering the 17 data group) (Table 3) indicating that low jaguar
densities can occur in areas with low or high suitability, while high density values are
restricted to areas where the suitability is also high. This result indicates that the
relationship between density and suitability could be better described as a polygonal
constraint envelope than by a straight positive relationship. In this case, tests based on
the heterogeneity of variances for distinct classes of suitability (or abundance) may be
more appropriate.
The linear regression between AUC and Kappa values for each SDM and the
regression coefficient between suitability and densities did not show any significant
relationship between these variables (r = 0.256, P = 0.448, R2 = 0.06 for AUC; r = -
0.16, P = 0.637, R2 = 0.02 for Kappa/ROC; r = 0.053, P = 0.877, R2 = 0.003 for
Kappa/LPV). These results were obtained for the 37 density data sample, but the same
pattern was observed considering the restricted 17 data sample values.

DISCUSSION (A)

Predictions from SDMs are usually considered as indicators of habitat


suitability, and consequently of species’ performance (Thuiller et al., 2010). The basic
assumption for this relation is that among the habitats occupied by the species, the more
frequent are also the more suitable (Albert & Thuiller, 2008). Nonetheless, this
assumption has been rarely properly evaluated (Wrigh et al., 2006; Elmendorf &
Moore, 2008; VanDerWal et al., 2009; Thuiller et al., 2010) as it is difficult to obtain
real measures of species performance along environmental gradients or other variables
that could be used as surrogates of that. If habitat suitability models are related to
changes in functional traits (for example physiological, morphological or phenological),
they provide appropriate proxy for species performance (Thuiller et al., 2010). In fact, it
is expected that species should have a higher performance in the core of their niche
(where conditions are more suitable) than at their edges (Pulliam, 2000).

110
Thuiller et al. (2010) tested if habitat suitability models are able to predict
variation in plant functional traits (used as species’ performance surrogates) and showed
that they closely covary for some species while no relationship was detectable for other
species, demonstrating moderate support to the application of empirical habitat
suitability models to express functionally meaningful descriptions of species’ niches.
Also, Montoya et al. (2009) have found that SDMs captured the nature and scale of
spatial structure in trees very accurately, however the models could not account for the
intensity of the observed spatial structure within species ranges (the level of aggregation
of species in space was poorly captured). As Thuiller et al. (2010), they detected
substantial variation among species, indicating that there is some variation among
species in the weight of environmental influence versus other mechanisms in
determining spatial structure within the range (Montoya et al., 2009).
We have shown here that the relationship between model-based suitability
estimates and jaguar density values is not expressed as a positive relationship for the
majority of SDM analyzed as we were primary expecting. Most of the eleven SDM
tested showed a relationship more similar to a polygonal envelope, and in fact, the few
that showed a positive significant relationship did not presented a reasonable fit.
Through the Levene’s test we are able to notice that some methods (Maxent,
Mahalanobis Distance, GARP, CTA, GBM and RF) can discriminate regions with high
or low densities, but they do not show a continuous relationship between the predicted
suitability values and jaguar population density estimates. We were able to notice that
low jaguar densities can occur in areas with low or high suitability, whereas high
density values are restricted to areas where the suitability is also superior.
One possible explanation for this result would be that areas located in high
suitability regions which presented low density estimates are subjected to factors acting
in local scales avoiding that the population reaches a higher density value as expected
by the favorable regional environmental conditions, such as low prey abundance,
dispersion impossibility between forested fragments or even natural habitat degradation
caused by man, for example. Nonetheless, only six (16%) from the 37 jaguar density
studies considered here were carried out in areas under some influence of cattle ranches
and all the others were conducted in protected areas (i.e. national parks, forestry
reserves, private reserves). Thus, the hypothesis of anthropogenic factors influencing
the founded pattern is not corroborated. Also, it is important to highlight that we are
searching for relationships between methodologies applied in different spatial scales and

111
under distinct conceptual backgrounds, complicating the establishment of clear
relationship between them. While SDM is applied through the whole species geographic
extension, generating what would be expected as the potential geographical distribution
(conceptually connected to fundamental niche), studies that raise population density
estimates consider a much more local scale subjected to distinct phenomena, including
interactions with other species (conceptually related to realized niche). Results from
Montoya et al. (2009) also suggested that environmental variables predict broad spatial
structures, while population or bionomic variables tend to present much more fine
grained spatial structures and predict spatial patterns at lower scales.
Recently, another study tested the relationship between environmental suitability
predicted from presence-only SDM and local abundance for 69 vertebrates in the
Australian wet tropics (VanDerWal et al., 2009) and found the same pattern
encountered here. Mostly relationships were positive, but the amount of variation
explained was generally low. The majority of species showed a polygonal or wedge-
shaped spread of points in the space defined by environmental suitability and local
abundance, revealing that suitability predicts the upper limit of abundance better than
mean abundance. They also recognized some possible factors ignored by models of
environmental suitability that cause this form of relationship, such as dispersal
capabilities, biotic interactions, microenvironment suitability and stochastic effects,
which could result in a species absence or rarity at sites that have high environmental
suitability (VanDerWal et al., 2009). They assert that spatial patterns of species
abundance can be reconstructed using environmental suitability knowledge estimated
from species occurrence records.
Therefore it is possible to conclude that understand the intern structure of the
jaguar distribution based on SDM seems to be more complex than describe only the
distribution limits, which, based on the statistic evaluation metrics adopt at this study,
was best described by DOMAIN method (using LPV threshold) or ANN (considering
ROC-based threshold). In general, the relationship between density and suitability may
provide other important criteria for comparing SDMs, beyond their statistical
properties/performance as suggested by Lobo et al. (2008), and actually, it has broad
implications for conservation biology in applications where environmental suitability is
expected to change over time (VanDerWal et al., 2009). It is not obvious that more
sophisticated methods, generating more complex surfaces, will provide better density
predictions. In fact, since BIOCLIM, the simplest of the eleven SDM methods applied

112
here, presented the better capability in estimating jaguars performance (in terms of
population density), it should be considered a powerful choice at least in studies
designed to evaluate species distribution under a conservation point of view, allowing
the prediction of possible changes in population size associated with distributional
changes.
The application of such models which can describe suitable habitat/environment
related to species performance is of key importance for conservation biology of
threatened species like the jaguar (Seoane et al., 2006; Wilting et al., 2010) as they
provide knowledge about species-environment relationship allowing the prioritization
of management and conservation strategies amongst regions that vary in their
contribution to regional species persistence. Although the wide use of SDM as a tool for
conservation biogeography, its limitations as a static, empirical modelling approach
need to be considered, in such a way that the incorporation of greater biological realism
must be necessary in future evaluations.

ACKNOWLEDGEMENTS (A)

This study was partially funded by Monsanto Fund and Fundação O Boticário de
Proteção à Natureza. Also Jaguar Conservation Fund is particularly indebted with The
Memphis Zoo and the Earthwatch Institute. Work by JAFDF and PMJ has been
continuously supported by CNPq productivity grants, whereas our work on species
distribution modelling and climate change has been funded by the BBVA Foundation
BIO-IMPACT project, coordinated by M. B. Araújo. We are thankful to the researchers
that provided basic information freely available used in this study.

REFERENCES (A)

Albert, C. & Thuiller, W. (2008) Favourability functions against probability of


presence: advantages and misuses. Ecography, 31, 417–422.
Allouche, O., Tsoar, A. & Kadmon, R. (2006) Assessing the accuracy of species
distribution models: prevalence, kappa and the true skill statistic (TSS). Journal of
Applied Ecology, 43, 1223–1232.
Araújo, M.B. & New, M. (2006) Ensemble forecasting of species distributions. Nature,
427, 145–148.

113
Austin, M.P. (2002) Spatial prediction of species distribution: an interface between
ecological theory and statistical modelling. Ecological Modelling, 157, 101–118.
Austin, M.P. (2007) Species distribution models and ecological theory: A critical
assessment and some possible new approaches. Ecological Modelling, 200, 1–19.
Breiman, L. (2001) Random Forests. Machine Learning, 45, 5–32.
Breiman, L., Friedman, J.H., Olshen, R.A. & Stone, C.J. (1984) Classification and
regression trees, Chapman and Hall, New York.
Brotons, L., Thuiller, W., Araújo, M.B. & Hirzel, A.H. (2004) Presence-absence versus
presence-only based habitat suitability models for bird atlas data: the role of species
ecology and prevalence. Ecography, 27, 285–298.
Brown, J.H. (1984) On the relationship between abundance and distribution of species.
American Naturalist, 124, 255–79.
Brown, J.H. (1995) Macroecology, University of Chicago Press, Chicago.
Brown, J.H., Stevens, G.C. & Kaufman, D.M. (1996) The geographic range: Size,
shape, boundaries, and internal structure. Annual Review of Ecology, Evolution, and
Systematics, 27, 597–623.
Busby, J.R. (1991) BIOCLIM: a bioclimate analysis and prediction system. Nature
conservation: cost effective biological surveys and data analysis, (ed. by C.R.
Margules and M.P. Austin), pp. 64–68. CSIRO, Australia.
Carpenter, G., Gillison, A.N. & Winter, J. (1993) DOMAIN: a flexible modelling
procedure for mapping potential distributions of plants and animals. Biodiversity and
Conservation, 2, 667–680.
Cohen, J. (1960) A coefficient of agreement for nominal scales. Educational and
Psychological Measurement, 20, 37–46.
Cullen Jr., L., Sana, D., Abreu, K.C. & Nava, A.F.D. (2005) Jaguars as landscape
detectives for the upper Paraná river corridor, Brazil. Natureza e Conservação, 3,
124–146.
De Marco, P., Diniz-Filho, J.A.F. & Bini, L.M. (2008) Spatial analysis improves
species distribution modelling during range expansion. Biology Letters, 4, 577–580.
Dudík, M., Phillips, S.J. & Schapire, R.E. (2007) Maximum entropy density estimation
with generalized regularization and an application to species distribution modelling.
Journal of Machine Learning Research, 8, 1217–1260.

114
Elith, J. & Graham, C.H. (2009) Do they? How do they? WHY do they differ? On
finding reasons for differing performances of species distribution models. Ecography,
32, 66–77
Elith, J., Graham, C.H., Anderson, R.P., Dudík, M., Ferrier, S., Guisan, A., Hijmans,
R.J., Huettman, F., Leathwick, J.R., Lehmann, A., Li, J., Lohmann, L., Loiselle, B.A.,
Manion, G., Moritz, C., Nakamura, M., Nakazawa, Y., Overton, J.M., Peterson, A.T.,
Phillips, S., Richardson, K., Schachetti Pereira, R., Schapire, R.E., Sober_on, J.,
Williams, S.E., Wisz, M., & Zimmermann, N.E. (2006) Novel methods improve
prediction of species' distributions from occurrence data. Ecography, 29, 129–151.
Elith, J. & Leathwick, J. (2009) Species distribution models: Ecological explanation and
prediction across space and time. Annual Review of Ecology, Evolution and
Systematics, 40, 677–697.
Elmendorf, S.C. & Moore, K.A. (2008) Use of community composition data to predict
the fecundity and abundance of species. Conservation Biology, 22, 1523–1532.
Farber, O. & Kadmon, R. (2003) Assessment of alternative approaches for bioclimatic
modeling with special emphasis on the Mahalanobis distance. Ecological Modelling,
160, 115–130.
Fielding, A.H. & Bell, J.F. (1997) A review of methods for the assessment of prediction
errors in conservation presence/absence models. Environmental Conservation, 24,
38–49.
Figueiredo, M.S.L. & Grelle, C.E. (2008) Predicting global abundance of a threatened
species from its occurrence: implications for conservation planning. Diversity and
Distributions, 15, 117–121.
Friedman, J.H. (2001) Greedy function approximation: A gradient boosting machine.
Annals of Statistics, 29, 1189–1232.
Fuller, T., Sánchez-Cordero, V., Illoldi-Rangel, P., Linaje, M. & Sarkar, S. (2007) The
cost of postponing biodiversity conservation in Mexico. Biological Conservation,
134, 593–600.
Graham, C.H., Ferrier, S., Huettman, F., Moritz, C. & Peterson, A.T. (2004) New
developments in museum-based informatics and applications in biodiversity analysis.
Trends in Ecology & Evolution, 19, 497–503.
Gu, W. & Swihart, R.K. (2004) Absent or undetected? Effects of non-detection of
species occurrence on wildlife–habitat models. Biological Conservation, 116, 195–
203.

115
Guisan, A. & Thuiller, W. (2005) Predicting species distribution: offering more than
simple habitat models. Ecology Letters. 8, 993–1009.
Guisan, A. & Zimmermann, N.E. (2000) Predictive habitat distribution models in
ecology. Ecological Modelling, 135, 147–186.
He, F. & Gaston, K.J. (2007) Estimating Abundance from Occurrence: An
Undetermined Problem. The American Naturalist, 170, 655–659.
Hirzel, A.H., Hausser, J., Chessel, D. & Perrin, N. (2002) Ecological-niche factor
analysis: how to compute habitat suitability maps without absence data? Ecology, 83,
2027–2036.
Johnson, C.J. & Gillingham, M. (2005) An evaluation of mapped species distribution
models used for conservation planning. Environmental Conservation, 32, 1–12.
Kelly, M.J. (2003) Jaguar monitoring in the Chiquibul Forest, Belize. Caribbean
Geography, 13, 19–32.
Kunin, W.E. (1998) Extrapolating species abundance across spatial scales. Science, 281,
1513–1515.
Lehmann, A. (1998) GIS modelling of submerged macrophyte distribution using
Generalized Additive Models. Plant Ecology, 139, 113–124.
Lim, B.K., Peterson, A.T. & Engstrom, M.D. (2002) Robustness of ecological niche
modelling algorithms for mammals in Guyana. Biodiversity Conservation, 11, 1237–
1246.
Liu, C.R., Berry, P.M., Dawson, T.P. & Pearson, R.G. (2005) Selecting thresholds of
occurrence in the prediction of species distributions. Ecography, 28, 385–393.
Lobo, J.M., Jimenez-Valverde, A. & Real, R. (2008) AUC: a misleading measure of the
performance of predictive distribution models. Global Ecology and Biogeography,
17, 145–151.
Maffei, L., Cuéllar, E. & Noss, A.J. (2004) One thousand jaguars (Panthera onca) in
Bolivia’s Chaco? Camera trapping in the Kaa-Iya National Park. Journal of Zoology,
262, 295–304.
Maffei, L. & Noss, A.J. (2008) How small is too small? Camera trap survey areas and
density estimates for ocelots in the Bolivian Chaco. Biotropica, 40, 71–75.
Maffei, L., Noss, A.J., Silver, S. & Kelly, M.J. (2011) Abundance/Density Case Study:
Jaguars in the Americas. Camera Traps in Animal Ecology: Methods and Analyses,
(ed. by A.F. O'Connell, J.D. Nichols and K.U. Karanth). Springer.

116
Manel, S., Dias, J.M., Buckton, S.T. & Ormerod, S.J. (1999) Alternative methods for
predicting species distribution: an illustration with Himalayan river birds. Journal of
Applied Ecology, 36, 734–747.
Manel, S., Williams, H.C. & Ormerod, S.J. (2001) Evaluating presence-absence models
in ecology: the need to account for prevalence. Journal of Applied Ecology, 38, 921–
931.
McNyset, K.M. & Blackburn, J.K. (2006) Does GARP really fail miserably? A
response to Stockman et al. (2006). Diversity and Distributions, 12, 782–786.
Moisen, G.G. & Frescino, T.S. (2002) Comparing five modelling techniques for
predicting forest characteristics. Ecological Modelling, 157, 209–225.
Montoya, D., Purves, D.W., Urbieta, I.R. & Zavala, M.A. (2009) Do species
distribution models explain spatial structure within tree species ranges? Global
Ecology and Biogeography, 18, 662–673.
Ortega-Huerta, M.A. & Peterson, A.T. (2005) Modelling spatial patterns of biodiversity
for conservation prioritization in North-eastern Mexico. Diversity and Distributions,
10, 39–54.
Parmenter, R.R., Yates, T.L., Anderson, D.R., Burnham, K.P., Dunnum, J.L., Franklin,
A.B., Friggens, M.T., Lubow, B.C., Miller, M., Olson, G.S., Parmenter, C.A.,
Pollard, J., Rexstad, E., Shenk, T.M., Stanley, T.R. & White, G.C. (2003) Small-
mammal density estimation: A field comparison of grid-based vs. web-based density
estimators. Ecological Monographs, 73, 1–26.
Pearson, R.G. (2007) Species’ distribution modeling for conservation educators and
practitioners. Synthesis. American Museum of Natural History. Available at
http://ncep.amnh.org.
Pearson, R.G., Raxworthy, C.J., Nakamura, M. & Peterson, A.T. (2007) Predicting
species distributions from small numbers of occurrence records: a test case using
cryptic geckos in Madagascar. Journal of Biogeography, 34, 102–117.
Peterson, A.T., Ball, L.G. & Cohoon, K.P. (2002) Predicting distributions of Mexican
birds using ecological niche modelling methods. Ibis, 144, E27–E32.
Phillips, S.J., Anderson, R.P. & Schapire, R.E. (2006) Maximum entropy modelling of
species geographic distributions. Ecological Modelling, 190, 231–259.
Phillips, S.J. & Dudík, M. (2008) Modeling of species distributions with Maxent: new
extensions and a comprehensive evaluation. Ecography, 31, 161–175.

117
Phillips, S.J., Dudík, M. & Schapire, R.E. (2004) A maximum entropy approach to
species distribution modelling. Proceedings of the Twenty-First International
Conference on Machine Learning, 655–662.
Pulliam, H.R. (2000) On the relationship between niche and distribution. Ecology
Letters, 3, 349–361.
Rushton, S.P., Ormerod, S.J. & Kerby, G. (2004) New paradigms for modelling species
distributions? Journal of Applied Ecology, 41, 193–200.
Sanderson, E., Redford, K.H., Chetkiewicz, C., Medellin, R.A., Rabinowitz, A.,
Robinson, J.G. & Taber, A. (2002) Planning to save a species: the jaguar as a model.
Conservation Biology, 16, 58–72.
Schonewald-Cox, C., Azari, R. & Blume, S. (1991) Scale, Variable Density, and
Conservation Planning for Mammalian Carnivores. Conservation Biology, 5, 491–
495.
Segurado, P. & Araújo, M.B. (2004) An evaluation of methods for modelling species
distributions. Journal of Biogeography, 31, 1555–1568.
Seoane, J., Justribo, J.H., Garcia, F., Retamar, J., Rabadan, C. & Atienza, J.C. (2006)
Habitat-suitability modelling to assess the effects of land-use changes on Dupont's
lark Chersophilus duponti: A case study in the Layna Important Bird Area, Biological
Conservation, 128, 241–252.
Seymour, K.L. (1989) Panthera onca. Mammalian Species, 340, 1–9.
Silver, S.C., Ostro, L.E.T., Marsh, L.K., Maffei, L., Noss, A.J. & Kelly, M. (2004) The
use of camera traps for estimating jaguar (Panthera onca) abundance and density
using capture/recapture analysis. Oryx, 28, 148–154.
Soisalo, M.K. & Cavalcanti, S.M.C. (2006) Estimating the density of a jaguar
population in the Brazilian Pantanal using camera-traps and capture-recapture
sampling in combination with GPS radio-telemetry. Biological Conservation, 129,
487–496.
Smallwood, K.S. (1999) Scale domains of abundance amongst species of mammalian
Carnivora. Environmental Conservation, 26, 102–111.
Stockman, A.K., Bearner, D.A. & Bond, J.E. (2006a) An evaluation of a GARP model
as an approach to predicting the spatial distribution of non-vagile invertebrate
species. Diversity and Distributions, 12, 81–89.

118
Stockman, A.K., Bearner, D.A. & Bond, J.E. (2006b) Predicting the distribution of non-
vagile taxa: a response to McNyset and Blackburn (2006) and re-evaluation of
Stockman et al. (2006). Diversity and Distributions, 12, 787–792.
Stockwell, D.R.B. & Noble, I.R. (1992) Induction of sets of rules from animal
distribution data – A robust and informative method of data analysis. Mathematics
and Computers in Simulation, 33, 385–390.
Stockwell, D.R.B. & Peters, D. (1999) The GARP modelling system: problems and
solutions to automated spatial prediction. International Journal of Geographical
Information Science, 13, 143–158.
Swets, J.A. (1988) Measures of the accuracy of diagnostic systems. Science, 240, 1285–
1293.
Thuiller, W., Albert, C.H., Dubuis, A., Randin, C. & Guisan, A. (2010) Variation in
habitat suitability does not always relate to variation in species’ plant functional
traits. Biology Letters, 23, 120–123.
Tsoar, A., Steinitz, O., Rotem, D. & Kadmon, R. (2007) A comparative evaluation of
presence only methods for modelling species distribution. Diversity and
Distributions, 13, 397–405.
VanDerWal, J., Shoo, L.P., Johnson, C.N. & Williams, S.E. (2009) Abundance and the
environmental niche: environmental suitability estimated from niche models predicts
the upper limit of local abundance. The American Naturalist, 174, 282–291.
Williams, P.H. & Araújo, M.B. (2000) Using probability of persistence to identify
important areas for biodiversity. Proceedings of the Royal Society, 267, 1959–1966.
Wilting, A., Cord, A., Hearn, A.J., Hesse, D., Mohamed, A., Traeholdt, C., Cheyne,
S.M., Sunarto, S., Jayasilan, M., Ross, J., Shapiro, A.C., Sebastian, A., Dech, S.,
Breitenmoser, C., Sanderson, J., Duckworth, J.W. & Hofer, H. (2010) Modelling the
Species Distribution of Flat-Headed Cats (Prionailurus planiceps), an Endangered
South-East Asian Small Felid. PLoS ONE, 5, e9612.
Wisz, M.S., Hijmans, R.J., Li, J., Peterson, A.T., Graham, C.H., Guisan, A. & NCEAS
Predicting Species Distributions Working Group. (2008) Effects of sample size on
the performance of species distribution models. Diversity and Distributions, 14, 763–
773.
Wright, J.W., Davies, K.F., Lau, J.A., McCall, A.C. & McKay, J.K. (2006)
Experimental verification of ecological niche modelling in a heterogeneous
environment. Ecology, 87, 2433–2439.

119
SUPPORTING INFORMATION

Additional Supporting Information may be found in the online version of this article:

Appendix S1 Potential geographic distribution predictions for jaguar accordingly with


the 11 methods adopted in this study.

As a service to our authors and readers, this journal provides supporting information
supplied by the authors. Such materials are peer-reviewed and may be re-organized for
online delivery, but are not copy-edited or typeset. Technical support issues arising
from supporting information (other than missing files) should be addressed to the
authors.

BIOSKETCH

Natália Tôrres is currently completing her PhD in Ecology and Evolution,


(Universidade Federal de Goiás, Brazil) and is the communication manager of the NGO
Jaguar Conservation Fund. She is interested in macroecology and conservation biology
of mammals, especially Carnivores. Lately she has studied species distribution
modelling and its application in conservation strategies and public policies.

Author contributions: N.M.T., J.A.F.D.F. and P.M.J. conceived the ideas; N.M.T.,
A.T.A.J. and L.S. collected the data; N.M.T. and P.M.J. analyzed the data; and N.M.T.
led the writing.

120
FIGURE LEGENDS

Figure 1 Map showing jaguar (Panthera onca) presence records (n = 1819),


highlighting the ones with jaguar density information (n = 37) obtained by systematic
camera trapping surveys (adapted from Maffei et al., 2011). In gray is shown the jaguar
original distribution (Sanderson et al., 2002) used as control at this study.

Figure 2 Graphs of positive relationship between model-based suitability estimate and


jaguar (Panthera onca) density. Considering the 37 data group for Maxent (a), GBM (b)
and Bioclim (c); and considering the group of 17 density locations for GARP (d) and
Bioclim (e).

121
Fig. 1

122
12 12

(a) (b)
10 10

8 8
Density Values

Density Values
6 6

4 4

2 2

0 0

-2 -2
-20 0 20 40 60 80 100 120 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Maxent Suitability Values GBM Suitability Values

12

10
(c)

8
Density Values

-2
-50 0 50 100 150 200 250 300 350
Bioclim Suitability Values

12 12

10
(d) 10
(e)

8 8
Density Values
Density Values

6 6

4 4

2 2

0 0

-2 -2
2 4 6 8 10 12 14 16 18 20 22 -50 0 50 100 150 200 250 300 350

GARP Suitability Values Bioclim Suitability Values

Fig. 2

123
TABLES

Table 1 – Results from evaluation of model performance for each species distribution modelling: area under the receiver operating characteristic
(ROC) curve (AUC); Kappa, accuracy, omission, commission and total errors, for both approaches to obtain binary presence-absence maps: ROC
plot-based approach (ROC) and the lowest predicted value (LPV), compared with the jaguar (Panthera onca) distribution presented at Sanderson
et al (2002) used as control at this study. In bold are highlight the best values for each statistic.
ROC LPV
SDM AUC Kappa Accuracy Omission Commission Total Error Kappa Accuracy Omission Commission Total Error
BIOCLIM 0.885 0.678 0.864 0.363 0.011 0.374 0.888 0.949 0.063 0.044 0.101
MD 0.885 0.687 0.868 0.358 0.008 0.366 0.848 0.929 0.054 0.080 0.134
DOMAIN 0.975 0.367 0.754 0.689 0.001 0.690 0.897 0.952 0.047 0.048 0.095
MAXENT 0.928 0.524 0.807 0.529 0.007 0.536 0.873 0.943 0.124 0.020 0.144
CTA 0.926 0.678 0.863 0.357 0.015 0.372 -0.025 0.346 0.041 0.993 1.000
RF 0.973 0.264 0.720 0.779 0.003 0.782 0.814 0.917 0.195 0.020 0.215
GBM 0.921 0.491 0.795 0.562 0.007 0.569 0.850 0.931 0.082 0.062 0.144
MARS 0.898 0.599 0.833 0.448 0.010 0.458 0.616 0.807 0.054 0.270 0.324
MDA 0.880 0.731 0.884 0.292 0.019 0.311 0.841 0.923 0.130 0.039 0.170
ANN 0.937 0.739 0.887 0.280 0.021 0.301 -0.006 0.356 0.016 0.992 1.000
GARP 0.930 0.708 0.876 0.332 0.010 0.342 0.825 0.921 0.142 0.045 0.186

124
Table 2 – Regression results between jaguar (Panthera
onca) density and suitability measures derived from eleven
SDM considering two groups of jaguar population density
data, with 37 and 17 sample.
SDM R2 r p

37 data group
BIOCLIM 0.245 0.495 0.002
MD 0.030 -0.173 0.305
DOMAIN 0.032 0.179 0.288
Maxent 0.133 0.365 0.026
CTA 0.056 0.236 0.159
RF 0.037 0.192 0.255
GBM 0.108 0.328 0.048
MARS 0.000 0.010 0.954
MDA 0.001 -0.022 0.895
ANN 0.028 0.166 0.326
GARP 0.094 0.307 0.064
17 data group
BIOCLIM 0.335 0.579 0.015
MD 0.125 -0.353 0.164
DOMAIN 0.054 0.232 0.371
Maxent 0.071 0.267 0.301
CTA 0.030 0.173 0.506
RF 0.000 0.019 0.943
GBM 0.045 0.211 0.417
MARS 0.000 -0.018 0.946
MDA 0.162 -0.402 0.110
ANN 0.055 0.234 0.367
GARP 0.257 0.507 0.038

125
Table 3 – t test and Levene F-test results from suitability measures derived from eleven SDM
considering two groups of jaguar (Panthera onca) population density data, with 37 and 17 sample,
both separated by its density median (3.41 and 3.10 respectively) for these analysis (group 1 has the
lowest density values and group 2 the highest).
t Levene
Mean 1 Mean 2 df p Std.Dev.1 Std.Dev.2 df p
separ. F

37 data group
BIOCLIM 109.368 185.722 -2.453 34.658 0.019 92.488 96.625 0.126 35 0.724
MD 3.643 3.295 0.782 35.000 0.439 1.592 1.038 2.035 35 0.163
DOMAIN 98.789 98.944 -0.357 32.996 0.724 1.512 1.110 0.420 35 0.521
Maxent 58.628 69.426 -1.111 31.389 0.275 35.030 23.186 9.637 35 0.004
CTA 0.688 0.766 -1.282 26.957 0.211 0.237 0.120 13.339 35 0.001
RF 0.810 0.855 -0.748 28.334 0.461 0.232 0.128 4.186 35 0.048
GBM 0.693 0.755 -1.248 26.984 0.223 0.191 0.097 8.460 35 0.006
MARS 0.706 0.693 0.352 30.522 0.727 0.135 0.085 3.717 35 0.062
MDA 0.842 0.837 0.059 29.470 0.954 0.287 0.170 1.494 35 0.230
ANN 0.864 0.876 -0.200 32.040 0.842 0.216 0.149 0.155 35 0.697
GARP 16.000 18.389 -1.321 29.842 0.197 6.700 4.046 7.696 35 0.009

17 data group
BIOCLIM 94.556 205.125 -2.383 14.466 0.031 92.065 98.417 0.397 15 0.538
MD 3.976 3.017 1.239 15.000 0.234 2.132 0.495 7.207 15 0.017
DOMAIN 98.556 98.875 -0.476 11.529 0.643 1.810 0.835 1.594 15 0.226
Maxent 58.182 63.684 -0.445 10.223 0.666 34.688 12.398 9.951 15 0.007
CTA 0.670 0.782 -1.359 8.323 0.210 0.246 0.033 9.249 15 0.008
RF 0.868 0.867 0.009 14.435 0.993 0.137 0.099 0.196 15 0.664
GBM 0.675 0.736 -0.898 8.371 0.394 0.205 0.029 5.579 15 0.032
MARS 0.667 0.671 -0.069 9.746 0.947 0.136 0.043 4.127 15 0.060
MDA 0.858 0.730 1.248 14.208 0.232 0.248 0.171 0.000 15 0.994
ANN 0.794 0.887 -0.905 9.818 0.387 0.291 0.094 0.923 15 0.352
GARP 13.667 19.750 -2.255 8.059 0.054 8.078 0.463 36.763 15 0.000

126
Appendix S1

Potential geographic distribution predictions for jaguar (Panthera onca) accordingly


with the 11 methods adopted in this study (methods’ name abbreviation follow article’s
text). We considered the suitability values above the “lowest predicted value” threshold
in red, which were divided in proportional classes for each SDM to highlight suitability
differences between them. It is showed in green the jaguar original distribution
(Sanderson et al. 2002) used as control at this study.

BIOCLIM MD

DOMAIN MAXENT

127
CTA RF

GBM MARS

128
MDA ANN

GARP

129
APÊNDICE III

130
A ser submetido para: Biodiversity and Conservation

Applying bioclimate envelope models to assess jaguar conservation issues

Natália Mundim Tôrres1,2*, Thiago Santos2, Paulo De Marco Júnior3, Leandro Silveira1,

Anah Tereza de Almeida Jácomo1, José Alexandre Felizola Diniz-Filho3

1
Jaguar Conservation Fund, C.P. 193, CEP 75.830-000, Mineiros, GO, Brazil
2
Graduate program in Ecology and Evolution, ICB, Universidade Federal de Goiás,

Campus Samambaia (Campus II), C.P. 131, CEP 74001-970 Goiânia, GO, Brazil.
3
Departamento de Biologia Geral, Instituto de Ciências Biológicas-ICB, Universidade

Federal de Goiás, Campus Samambaia (Campus II), C.P. 131, CEP 74001-970 Goiânia,

GO, Brazil

*Correspondence: Natália Mundim Tôrres, Jaguar Conservation Fund, C.P. 193, CEP
75.830-000, Mineiros, GO, Brazil. Phone / fax: +55 64 36618026. E-mail:
nats.torres@jaguar.org.br

Running Head Bioclimate envelope models and jaguar conservation

131
Abstract

Coupling species bioclimatic envelope models with land use models is crucial to

produce distribution models that are more applicable to real conservation problems.

Adopting this approach, potential distribution shift of a species estimated by bioclimatic

models is then reduced to the available habitat as projected by the land use model,

improving the understanding of land cover dynamics and its associated impact on

species distribution. Here we applied a consensus of two bioclimatic envelope models

(DOMAIN and BIOCLIM) to discuss some aspects related to jaguar conservation in

large scale, considering values for current and future climate, combined with land use

scenarios for 2000 and 2080. We demonstrated that areas with natural vegetation tend to

show higher environmental suitability for jaguars than expected by chance and this

tendency is likely to persist in the future. The suitability values found in map cells

inside conservation units are higher than expected by chance and this difference is likely

to increase with global climate changes. Comparing jaguar suitability for current and

future climate variables, we observe that the potential climate limits of the distribution

is not expected to change, but it is estimated a decrease and shift in the most suitable

areas. Some areas where a suitability improvement is expected, making them of

strategic value for jaguar conservation, actually will lose quality due to natural

vegetation conversion to agriculture/pastures. Results show that the opportunities for

jaguar’s effective conservation actions are becoming restricted, and the calling for a

proactive conservation approach is urgent.

Keywords BIOCLIM, Bioclimatic envelope models, conservation, DOMAIN, jaguars,


land use changes

132
Introduction

The jaguar Panthera onca (Linnaeus 1758) is the largest feline of the Americas,

with historical distribution ranging from southern Argentina to southwestern United

States (Guggisberg 1975; Swank and Teer 1989). Despite its wide distribution, currently

covering 19 nations (it is considered regionally extinct in El Salvador and Uruguay)

(IUCN 2010), the jaguar is still one of the least known members of the Panthera group

(Sunquist and Sunquist 2002; Zeller 2007). Some studies indicate that jaguars show a

trend to use habitats close to water and with denser vegetation cover (Astete et al.

2008), but the species is able to use a large variety of habitat types, like tropical moist

forests, xeric shrub lands, tropical dry forests, grasslands and savannas (Zeller 2007),

demonstrating an expressive ecological plasticity. However, under the pressure of an

exponential human population increase, parallel natural habitat conversion and hunting

as retaliation for domestic livestock predation, the jaguar have reduced significantly its

geographical distribution, actually estimated to be around 55% of the historical range

(Zeller 2007). Besides the listed factors above, global climate changes have been

suggested as potential responsible for significantly species distribution shifts (Sala et al.

2000; Burns et al. 2003; Araújo et al. 2004; Coetzee et al. 2009). Species responses to

past and present climate changes suggest the possibility that human-caused climate

changes can act as a relevant cause of species extinction in a short future (Thomas et al.

2004).

The baseline for a species range-wide conservation plan should rely on the

knowledge of its present and future geographic distribution, combining all information

from studies in the different habitat types throughout its range. This would allow a more

precise assessment of the species conservation status grounded on remaining habitat and

133
estimated population size yielding better design of conservation efforts at a landscape

level (see Sanderson et al. 2002a,b; Wikramanayake et al. 2002). Recent studies have

addressed aspects related to the implications of the spatial scale for systematic

conservation planning, showing that the spatial scale and spatial grain necessarily

influence which modeling approach can be employed (Seo et al. 2009; Cabeza et al.

2010). Furthermore, it is important to identify appropriate scales of analysis based on

different environmental drivers, since it seems that there is a hierarchy of factors

operating at different scales (Pearson and Dawson 2003). Thus, while at the continental

scale climate is considered the dominant factor, at more local scales topography and

land-cover are more important, whereas further down the hierarchy, biotic interactions

and microclimate may become significant (Pearson and Dawson 2003). Considering this

framework, bioclimatic envelope modelling fits well in identifying large-scale

distribution limitations at regional to global scales.

Statistical bioclimatic envelope models represent one specific type of species

distribution modelling (SDM), and can be defined as the climatic element of the

fundamental ecological niche, termed as the ‘climatic’ or ‘Grinnelian’ niche (see

Soberón 2007). Hence, bioclimatic models in their primary form takes into

consideration only climatic variables, not including other environmental factors such as

soil or land-cover type (Pearson and Dawson 2003). Bioclimatic envelope models have

been widely used to estimate the potential magnitudes of future changes to distributions,

and to indicate which species, habitats and regions are most at risk from climate change

(Hannah et al. 2002; Pearson and Dawson 2003; Guisan and Thuiller 2005; Thuiller et

al. 2008; Coetzee et al. 2009). Such models should be interpreted and applied with due

caution, with an awareness of their limitations, including the inability to model biotic

134
interactions, dispersal patterns, evolutionary changes and the difficulty to validate the

predictions (Hannah et al. 2002; Pearson and Dawson 2003; Lawler et al. 2006).

Coupling species bioclimatic envelope models with land use projection models

is crucial to produce distribution models that are more applicable to real conservation

problems (Hannah et al. 2002). Models projecting land use represent the current pattern

of habitat fragmentation and are used to predict future patterns based on projections of

parameters such as population and consumption levels (Sala et al. 2000). Adopting this

approach, the potential distribution shift of a species estimated by bioclimatic models is

then reduced to the available habitat as projected by the land use model (Hannah et al.

2002), improving the understanding of land cover dynamics and its associated impact

on species distribution.

Here we estimate jaguar potential distribution for the entire American continent

applying two different bioclimatic envelope models chosen based on previous analysis

which demonstrated that DOMAIN and BIOCLIM over performed other methods used

to describe jaguar potential distribution limits and estimate jaguar performance (Torres

et al. submitted). A consensus of model outputs was calculated for both current and

future climate scenarios and the relationship with land use predictions was analyzed.

Our objective in this study was to apply species distribution modelling (specifically

bioclimatic envelope models) to discuss some aspects related to jaguar conservation in

large scale. We aimed to answer the following questions:

1) Do areas with higher environmental suitability, according to

bioclimatic envelope models, have favorable habitats to jaguar’s local

occurrence and persistence?

135
2) How efficient is the Protected Areas System throughout the jaguar

distribution extent to maintain high environmental suitability areas

for the jaguar in the future?

3) How global climate changes will affect jaguar representativity in

terms of environmental suitability through its distribution?

4) Which is the relationship between environmental suitability

alterations due to global climate changes and land use modifications

predicted for the future, and how these changes affect jaguar

distribution?

Methods

Jaguar occurrence data

We used a compiled data bank on jaguar presence (geographic coordinates)

(Torres et al. in prep) with a total of 1819 occurrence points that were standardized to

decimal degrees. Considering that the modeling accuracy is a balance of the quality of

distribution data and the available climatic and topographic datasets, we opted to use a

cell precision of 0.0417 degrees (nearly 4 km precision in cells near the Equator Line).

Under this constrain there were 1409 spatially unique records to use in the modeling

process.

With the objective to reduce spatial autocorrelation of jaguar occurrence points,

we randomly generated sub samples from the original dataset considering a distance

constraint of at least 500 km between records (Torres et al. in prep). Adopting this

approach we produced 10 sub samples with 50 presence points each one. Using these

sub samples as input we run species distribution models for the jaguar (see below) and

calculated a median of these results for each SDM applied.

136
Predictive variables

The predictive data consist of 10 climatic variables (precipitation of coldest

quarter, precipitation of warmest quarter, precipitation seasonality (coefficient of

variation), annual precipitation, mean temperature of wettest quarter, mean temperature

of driest quarter, maximum temperature of warmest period, minimum temperature of

coldest period, temperature seasonality (coefficient of variation), annual mean

temperature) derived from the WORLDCLIM (http://www.worldclim.org/); and two

topographic variables (altitude and slope) derived from the Hydro-1K global digital

elevation model (http://edcdaac.usgs.gov/gtopo30/hydro/). All variables above were

converted to a grid resolution of 0.0417 degrees.

The same climatic variables were used considering Community Climate System

Model – CCSM 3 (Vertenstein et al. 2004), to model jaguar future distribution in terms

of environment suitability. Composed of four separate models simultaneously

simulating the earth’s atmosphere, ocean, land surface and sea-ice, and one central

coupler component, it allows evaluation of future climate states (Vertenstein et al.

2004). It is considered an optimistic scenario, which estimates a temperature increase of

2,6oC over the next 100 years.

Species Distribution Modelling methods

A recent study comparing 11 presence-only SDM methods (Torres et al.

submitted) indicated that both DOMAIN and BIOCLIM are efficient methodologies to

respectively describe jaguar potential distribution limits and to estimate jaguar

performance (in terms of population density). Considering this, these models were

selected to be applied here, as implemented in DIVA-GIS software (Hijmans et al.

2005). For both current and future climate predictions, we combined the two models

137
applying an ensemble forecasting approach to produce maps which have been indicated

as a better and more conservative solution (Araújo and New 2007).

The Bioclimatic Envelope (BIOCLIM) (Nix 1986; Busby 1991) predicts regions

with favorable climatic conditions for the species, based on the analysis of a minimum

rectilinear envelope in the multidimensional climatic space. It suggests that a species

can tolerate locations where values of all predictive variables fit within the extreme

values determined by the set of known locations. For each climate factor, values from

all training sites are ranked into numerical order and the minimum, 5 percentile, 95

percentile and maximum values are determined. The climate values for each grid cell

are compared with the climate profile to determine if the climate is suitable for the

species. If values of all climatic factors for the grid cell fall between the 5–95% values

of the climate profile, the grid cell is considered to be suitable for the species. If values

for one or more factors fall outside the 90 percentile range, but are within the total

range, the climate is considered to be marginal, and if values for any one of the factors

fall outside the total range, the climate condition at the grid cell is considered to be

unsuitable (Li and Hilbert 2008). BIOCLIM has been further developed to calculate the

position in the percentile distribution for each grid cell/variable and to identify the

limiting factor for each grid cell in DIVA-GIS (Hijmans et al. 2005).

The DOMAIN (Carpenter et al. 1993) uses a point-to-point similarity metric to

assign a classification value to a candidate grid cell based on its proximity in

environmental space to the most similar training site. The similarity is quantified by

Gower distance statistic metric, which is calculated between the values of the

environmental variables of each cell and of each occurrence point. The distance

between point A and grid cell B for a single climate variable k is calculated as the

absolute difference between A and B divided by the range of k across all points. The

138
Gower distance (G) is the mean of the distances for all climate variables and the

Domain similarity statistic is calculated as 100 x (1-G). The maximum similarity

between a grid cell and any point is mapped. The maximum value is 100 (all cells in

which presences occurred will have this score) (Hijmans and Graham 2006).

Land use scenarios

We adopted the Integrated Model to Assess the Global Environment (IMAGE)

(IMAGE, version 2.2) (IMAGE Team 2001) which is a dynamic integrated assessment

modelling framework for global environmental change due to human activities. This

model quantifies the relative importance of major processes and interactions in the

society-biosphere-climate system, exploring the long-term dynamics of global

environmental change. To map the extent of agricultural land it considers variables that

influence global land cover/land use, such as previous land cover, potential vegetation

cover, crop productivity, management factors, human population density and demand

for food, biofuel and timber products (IMAGE Team 2001). Here, land cover was

mapped by IMAGE 2.2 on a resolution of 0.5 by 0.5 degree grid for 2000 and 2080. We

consider two grouped categories of land cover: natural vegetation (IMAGE classes 2 –

19) and converted / agricultural land (IMAGE class 1).

Protected Areas System

To evaluate the potential efficiency of the Protected Areas System throughout

the jaguar distribution we selected protected areas based on the World Database on

Protected Areas (http://www.wdpa.org/) (UNEP-WCMC 2009). The selected areas

encompassed IUCN categories I to IV along jaguar original distribution (Sanderson et

al. 2002a).

139
Analysis

Aiming to analyze if areas with higher suitability accordingly to SDM have

favorable habitats to jaguar’s occurrence, we compared the suitability frequency

distribution within natural areas (defined by map cells with IMAGE classes 2-19, if

present) with a randomized null model. The null model was generated by shuffling the

natural area cells position 5000 times and computing the frequency distribution each

time, then the results were averaged and used as a null model. Also, the evaluated

region was defined by the jaguar original distribution (Sanderson et al. 2002a).

Considering the ensemble forecast, we produced two jaguar potential

distribution maps: one corresponding to the current suitability in terms of climate and

other corresponding to future predictions. Comparing both estimates we evaluated how

global climate changes must affect jaguar suitability.

We used IMAGE assessment to analyze the relationship between suitability loss

or gain (between current time and future predictions) and changes in land use from

natural to converted or converted to natural. To accomplish that, we calculated the

difference between current and future predictions for both variables. The data was

organized in a contingency table divided into four groups corresponding to: 1) number

of map cells where suitability is expected to improve over time and land cover is

expected to change from converted to natural; 2) number of map cells where suitability

is expected to decline over time and land cover is expected to change from natural to

converted; 3) number of map cells where suitability is expected to improve over time

and land cover is expected to change from natural to converted; 4) number of map cells

where suitability is expected to decline over time and land cover is expected to change

from converted to natural. The relationship was analyzed by an Odds Ratio statistics

(Jewell, 2004). In order to avoid small, and therefore, meaningless variation, only

140
differences greater or smaller than the 50th percentile was used (this threshold value was

determined to cells with positive differences and negative differences separately).

The evaluation of Protected Areas System potential efficiency was made

through a frequency analysis the same way that was done with the suitability and

favorable habitats analysis (described above), the only exception is that the suitability

frequency distribution was calculated to cells within the selected protected areas. All

analyses were done using SAGA GIS 2.0.4 (SAGA development team 2009) and R 2.11

64 bits version (R Development Core Team 2010).

Results

Areas with natural vegetation tend to show higher environmental suitability

values for jaguars than expected by chance (x2 = 20696.58, df = 39) and this tendency is

likely to persist in the future (x2 = 24366.13, df = 38), as long the IMAGE and global

climate change predictions confirms (Figure 1 and Figure 2). Considering the current Figure 1

condition, the main difference between observed suitability frequency distribution in

map cells with natural vegetation and what was expected by chance occur for
Figure 2
intermediate suitability values where the observed distribution shows more cells with

values ranging from 55 to 61 while the null model shows much more cells with values

of 45 to 51 (Figure 1b). However, the future forecasting shows a smaller, yet

statistically significant difference between the observed and randomized values (Figure

2b). This result is the opposite to the predicted trend concerning the future suitability

quality of protected areas (see below), therefore, a quality increase of cells within

conservation units are likely to come with a consequently decrease of natural areas

quality that are not protected.

141
The suitability values found in map cells inside conservation units are higher

than expected by chance (x2 = 7160.072, df = 37) and this difference is likely to

increase (x2 = 5963.473, df = 35) with global climate changes, mainly on cells with Figure 3

suitability values ranging between 65 and 73 (Figure 3 and Figure 4). Although this

values are not extreme ones (it would be better if all conserved cells show suitability
Figure 4
values near 100), only 2.26% of the map cells in jaguar historical distribution (inside

and outside conservation units altogether) will present suitability value greater than 73

accordingly to the ensemble bioclimatic envelope models used.

Comparing jaguar environmental suitability for current and future climate

variables, we can observe that in general the potential climate limits of the species

distribution is not expected to change, but it is estimated a decrease and shift in the most

suitable areas (Figure 5a and 5b). The suitability variation shown in Figure 5c indicates
Figure 5
regions where it may decrease (negative values, in blue and green), located mainly in

central Brazil, Brazilian and Peruvian Amazon, besides Guyanas and Suriname,

whereas the main areas presenting suitability increasing occur in the middle east of

Amazon, parts of its transition with Cerrado biome, south Brazil, north Paraguay and

south Bolivia.

There is no evidence of a common trend between the expected changes in map

cells environmental suitability (as a result of climate changes) and the land use changes

as predicted by the IMAGE model (Odds ratio (ln)[± 95% confidence interval]= 0.1104

[± 0.1731]). Nevertheless, some areas where a suitability improvement is expected,

making them of strategic value for jaguar conservation, actually will lose quality due to
Figure 6
natural vegetation conversion to agriculture/pastures (Figure 6 – category labeled as NP

in red). Furthermore, at some cells where an environmental suitability decrease is

142
expected, a worst scenario might take place if those cells lose its natural coverage

(Figure 6 – category labeled as NN in yellow).

Discussion

Different approaches to predict changes in species distributions as a result of

climate change have been applied in the recent literature (Pearson et al. 2002; Araújo et

al. 2004; Thomas et al. 2004; Lawler et al. 2006; Coetzee et al. 2009), but with poor

consistency in the performance of these alternative methodologies. Some authors have

demonstrated that certain modelling techniques work differently for groups of species

which demonstrate qualitatively dissimilar relationships with their environments

(Segurado and Araújo 2004). Thus, different models present different abilities to deal

with particular species or geographic data with specific environmental conditions

(Thuiller 2004). Here we adopted two bioclimatic envelope methods that in spite of not

being well evaluated by other studies (Elith et al. 2006; Hijmans and Graham 2006),

showed robustness in describing the potential distribution limits and performance (in

terms of population density) of the focal species, the jaguar (Torres et al. submitted).

Considering the model uncertainties and the fact that one model showing good fits on

present-day distribution data do not necessarily translate into good predictions of future

ranges (Araújo et al. 2005), we adopted a consensus approach (ensemble) between two

models, summarizing agreements among projections generated by both techniques

(Araújo and New 2007).

Discussions about bioclimatic envelope models have emphasized the inherent

limitations of these correlative approaches, mainly the inability to model biotic

interactions, dispersal patterns and evolutionary changes to cite only three (Hannah et

143
al. 2002; Pearson and Dawson 2003; Lawler et al. 2006). Despite these limitations,

authors have also stated that the importance of bioclimatic model predictions in

assessing the potential effects of climate change must not be underestimated, but should

be interpreted as a first approximation of climate change potential effects at broad

spatial scales, rather than precise predictions of future species distributions (Pearson and

Dawson 2003). In fact, as the climate can be considered the dominant factor at regional

and continental scale, large-scale distribution modelling is an important first step of

conservation planning, following a hierarchical framework (Pearson and Dawson 2003;

Cabeza et al. 2010).

Environmental niche and range-wide conservation approaches for jaguars

Some studies have previously considered range-wide conservation approaches

for jaguars (Sanderson et al. 2002a; Zeller 2007; Rabinowitz and Zeller 2010), but this

study is the first attempt to include aspects related to environmental niche of the species

into conservation issues. As optimum niche space in the landscape, or areas with higher

probabilities of occurrence from species distribution models, is where species are likely

to persist (Araújo and Williams 2000), the approach developed here can be an useful

tool to improve conservation efforts for this threatened felid, as it has been done for

other species worldwide (e.g. Hilty et al. 2006; Cabeza et al. 2010; Wilting et al. 2010).

Specially adopting the combination with land-use change scenarios, these models are

able to identify areas where jaguars are more likely to be supported today, and estimate

the distribution changes that may result due to additional habitat conversion.

Environmental suitability in natural and proteced areas

144
We have shown here that areas with higher environmental suitability for jaguars

have more natural vegetation than what would be expect simply by chance for current

and also for future estimations. Thus, these areas present favorable habitats for jaguar’s

occurrence and may be important to maintain the species persistence along its

distribution. Also, suitability values inside protected areas are greater than expected by

null model, and this difference tend to increase with the global climate change scenario

evaluated, demonstrating that it is not expected that environmental suitable areas for

jaguars will shift out from the existing protected areas differently from evaluations for

other species (Araújo et al. 2004; Coetzee et al. 2009).

Mismatch between environmental suitable areas and favorable land use

Comparing jaguar environmental suitability predictions for current and future

climate variables, we found a general pattern similar to results obtained by Torres et al.

(2008) who used Mahalanobis Distance only for Brazil. Nonetheless, the methods

applied here are more adequate for this species (Torres et al. submitted). Shifts on areas

presenting higher suitability should be supported by areas that permit the connection

between them, improving jaguar dispersion through space and time. This must be a next

step on this kind of analysis. Moreover, combining these evaluations with a land use

change scenario, we demonstrated that some regions which must go through an

environmental suitability increase for jaguar occurrence in the future will be converted

from natural vegetation to agricultural land. For some areas this trend is expected

because they are located in the called ‘arc of deforestation’ in Brazil (Nogueira et al.

2008), a region currently under strong pressure of habitat conversion to soybean and

sugarcane plantations; jaguars will be fated to local extinctions in these places if no

short-time action is made. These conclusions show that the opportunities for jaguar’s

145
effective conservation actions are daily becoming more restricted, in such a way that the

calling for a proactive conservation approach is urgent.

References

Araújo MB, Cabeza M, Thuiller W et al (2004) Would climate change drive species out
of reserves? An assessment of existing reserve-selection methods. Glo Ch Biol
10:1618–1626
Araújo MB, New M (2007) Ensemble forecasting of species distributions. Trends Ecol
Evol 22:42–47.
Araújo MB, Pearson RG, Thuiller W et al (2005) Validation of species–climate impact
models under climate change. Glo Ch Biol 11:1504–1513.
Araújo MB, Williams PH (2000) Selecting areas for species persistence using
occurrence data. Biol Conserv 96:331–345.
Astete S, Sollmann R, Silveira L (2008) Comparative Jaguar Ecology in Brazil. Cat
News Special Issue 4:9–14.
Burns CE, Johnston KM, Schmitz OJ (2003) Global climate change and mammalian
species diversity in U.S. national parks. PNAS 100:1474–11477
Busby JR (1991) BIOCLIM - a bioclimatic analysis and prediction system. In: Margules
CR, Austin MP (eds) Nature Conservation: Cost Effective Biological Surveys and
data Analysis. CSIRO, Melbourne
Cabeza M, Arponen A, Jäättelä L et al (2010) Conservation planning with insects at
three different spatial scales. Ecography 33:54–63.
Carpenter G, Gillison AN, Winter J (1993) DOMAIN: a flexible modelling procedure
for mapping potential distributions of plants and animals. Biodiversity Conserv
2:667–680.
Coetzee BWT, Robertson MP, Erasmus BFN et al (2009) Ensemble models predict
Important Bird Areas in southern Africa will become less effective for conserving
endemic birds under climate change. Glo Ecol Biog 18:701–710.
Elith J, Graham CH, Anderson RP et al (2006) Novel methods improve prediction of
species distributions from occurrence data. Ecography 29:129–151.
Guggisberg CAW (1975) Wild Cats of the World. Taplinger Publications Co., New
York.

146
Guisan A, Thuiller W (2005) Predicting species distribution: offering more than simple
habitat models. Ecol Lett 8:993–1009.
Hannah L, Midgley GF, Millar D (2002) Climate change-integrated conservation
strategies. Glo Ecol Biog 11:485–495.
Hijmans RJ, Guarino L, Bussink C et al. (2005) DIVA-GIS, version 5.2. Manual.
Available at http://www.diva-gis.org/
Hijmans RJ, Graham CH (2006) The ability of climate envelope models to predict the
effect of climate change on species distributions. Glo Ch Biol 12:2272–2281.
Hilty JA, Brooks C, Heaton E et al (2006) Forecasting the effect of land-use change on
native and non-native mammalian predator distributions. Biodiversity Conserv
15:2853–2871.
IMAGE Team (2001) The IMAGE 2.2 Implementation of the SRES Scenarios. A
Comprehensive Analysis of Emissions, Climate Change and Impacts in the 21st
Century. Netherlands Environmental Assessment Agency (MNP) CD-ROM
Publication 500110001, Bilthoven, Netherlands
IUCN (2010) 2010 IUCN Red List of Threatened Species. <www.iucnredlist.org>.
Downloaded on 03 August 2010.
Jewell NP (2004) Statistics for Epidemiology, 1st Edition, Chapman & Hall.
Lawler JJ, White D, Neilson RP et al (2006) Predicting climate-induced range shifts:
model differences and model reliability Glo Ch Biol 12:1568–1584.
Li J, Hilbert DW (2008) LIVES: a new habitat modelling technique for predicting the
distribution of species’ occurrences using presence-only data based on limiting factor
theory. Biodiversity Conserv 17:3079–3095.
Nix HA (1986) A biogeographic analysis of Australian elapid snakes. In: Longmore R
(ed.) Atlas of Elapid Snakes of Australia. Australian Flora and Fauna Series No. 7.
Australian Government Publishing Service, Canberra.
Nogueira EM, Nelson BW, Fearnside PM et al (2008) The height in Brazil’s ‘arc of
deforestation’: Shorter trees in south and southwest Amazonia imply lower biomass.
For Ecol Manage 255:2963–2972.
Pearson RG, Dawson TP (2003) Predicting the impacts of climate change on the
distribution of species: are bioclimate envelope models useful? Glo Ecol Biog
12:361–371.
Pearson RG, Dawson TP, Berry PM et al. (2002) SPECIES: a Spatial Evaluation of
Climate Impact on the Envelope of Species. Ecol Model 154:289–300.

147
R Development Core Team (2010) R: A language and environment for statistical
computing. Austria.
Rabinowitz A, Zeller KA (2010) A range-wide model of landscape connectivity and
conservation for the jaguar, Panthera onca. Biol Conserv 143:939–945.
SAGA Development Team (2009) System for Automated Geoscientific Analyses
(SAGA GIS). Germany.
Sala OE, Chapin III FS, Armesto JJ et al. (2000) Global biodiversity scenarios for the
year 2100. Science 287:1770–1774.
Sanderson E, Redford KH, Chetkiewicz C et al (2002a) Planning to save a species: the
jaguar as a model. Cons Biol 16:58–72.
Sanderson E, Redford KH, Vedder A et al (2002b) A conceptual model for conservation
planning based on landscape species requirements. Land Urb Plan 58:41–56
Segurado P, Araujo MB (2004) An evaluation of methods for modelling species
distributions. J Biogeogr 31:1555–1568.
Seo C, Thorne JH., Hannah L et al (2009) Scale effects in species distribution models:
implications for conservation planning under climate change. Biol Lett 5:39–43.
Soberón J (2007) Grinnellian and Eltonian niches and geographic distributions of
species. Ecol Lett 10:1115–1123.
Sunquist M, Sunquist F (2002) Wild cats of the world. University of Chicago Press,
Chicago.
Swank WG, Teer JG (1989) Status of the Jaguar-1987. Oryx 23:14–21.
Thomas CD, Cameron A, Green RE et al (2004) Extinction risk from climate change.
Nature 427:145–148
Thuiller W (2004) Patterns and uncertainties of species' range shifts under climate
change. Glo Ch Biol 10:2020–2027.
Thuiller W, Albert C, Araújo MB et al (2008) Predicting global change impacts on plant
species’ distributions: future challenges. Perspect Plant Ecol Evol Syst 9:137–152.
Tôrres NM, De Marco Jr P, Diniz Filho JAF, Silveira L (2008) Jaguar Distribution in
Brazil: Past, Present and Future. Cat News Special Issue 4:4–8.
Tôrres NM, De Marco Jr P, Silveira L, Jacomo ATA, Diniz Filho JAF (submitted) Can
species distribution modelling provide estimates of population densities? A case
study with jaguars in the Neotropics.
Tôrres NM, Diniz Filho JAF, Silveira L, Jacomo ATA, De Marco Jr P (in prep) Effects
of distance constraints on performance of species distribution models.

148
UNEP-WCMC (2009) Data structure of the World Database on Protected Areas
(WDPA) Annual Release 2009, New WDPA Schema, Web-download Version –
February 2009.
Vertenstein M, Craig T, Henderson T et al (2004) CCSM3.0 User’s Guide. Community
Climate System Model. National Center for Atmospheric Research, Boulder, CO.
Wikramanayake E, Dinerstein E, Loucks C et al (2002) Ecoregions in Ascendance:
Reply to Jepson and Whittaker. Cons Biol 16:238–245.
Wilting A, Cord A, Hearn AJ et al (2010) Modelling the Species Distribution of Flat-
Headed Cats (Prionailurus planiceps), an Endangered South-East Asian Small Felid.
PLoS ONE 5: e9612.
Zeller K (2007) Jaguars in the New Millennium Data Set Update: The State of the
Jaguar in 2006. Unpublished Report. Wildlife Conservation Society, New York,
USA.

149
Figure Legends

Figure 1. Relative frequencies of observed environmental suitability in map cells with


natural vegetation for current climate and values expected by chance (a) and relative
difference between the two frequencies distributions (b).

Figure 2. Relative frequencies of observed environmental suitability in map cells with


natural vegetation for future climate and values expected by chance (a) and relative
difference between the two frequencies distributions (b).

Figure 3. Relative frequencies of observed environmental suitability in map cells within


protected areas throughout jaguar distribution for current climate and values expected
by chance (a) and relative difference between the two frequencies distributions (b).

Figure 4. Relative frequencies of observed environmental suitability in map cells within


protected areas throughout jaguar distribution for future climate and values expected by
chance (a) and relative difference between the two frequencies distributions (b).

Figure 5. Jaguar environmental suitability considering an ensemble approach using


DOMAIN and BIOCLIM methods, for current climate variables (a) and future climate
adopting the Community Climate System Model – CCSM 3 (b). The variation between
suitability values among both estimations is shown in (c).

Figure 6. Map showing cells classified accordingly with jaguar environmental


suitability and land use changes between current time and future predictions
(considering only differences greater or smaller than the 50th percentile for positive and
negative differences). Categories where labeled as: PP - suitability is expected to
improve over time and land cover is expected to change from converted to natural; NN -
suitability is expected to decline over time and land cover is expected to change from
natural to converted; NP - suitability is expected to improve over time and land cover is
expected to change from natural to converted; PN - suitability is expected to decline
over time and land cover is expected to change from converted to natural.

150
90000
a)
Observed Values
80000 Null Model

70000

60000
Relative frequence

50000

40000

30000

20000

10000

0
10 20 30 40 50 60 70 80 90 100
Suitability

10000
b)
5000
Relative difference

0
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97

-5000

-10000

-15000

-20000

-25000

Suitability

Figure 1.

151
60000
a) Observed Values
Null Model
50000

40000
Relative frequence

30000

20000

10000

0
10 20 30 40 50 60 70 80 90 100
Suitability

10000
b)
5000
Relative difference

0
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
-5000

-10000

-15000

-20000

-25000

Suitability

Figure 2.

152
8000
a) Observed Values
7000 Null Model

6000

5000
Relative frequence

4000

3000

2000

1000

0
10 20 30 40 50 60 70 80 90 100
Suitability

2500

2000 b)
1500
Relative difference

1000

500

0
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
-500

-1000

-1500

-2000

-2500

-3000

Suitability

Figure 3.

153
7000
a) Observed Values
Null Model
6000

5000
Relative frequence

4000

3000

2000

1000

0
20 40 60 80 100
Suitability

1500

b)
1000

500
Relative difference

0
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97
-500

-1000

-1500

-2000

-2500

-3000

Suitability

Figure 4.

154
a) b)

c)

Figure 5.

155
Figure 6.

156

Você também pode gostar