Você está na página 1de 122

Universidade Tcnica de Lisboa

Instituto Superior de Agronomia

MODELAO DA DISTRIBUIO E DA ABUNDNCIA LOCAL


DO CGADO-MEDITERRNICO (Mauremys leprosa) E DO
CGADO-DE-CARAPAA-ESTRIADA (Emys orbicularis)
EM PORTUGAL

Pedro Segurado

Orientador:
Doutor Jos Miguel Oliveira Cardoso Pereira
Jri
Presidente:
Doutor Antnio Manuel Dorota Fabio
Professor Associado do Instituto Superior de Agronomia da Universidade Tcnica de Lisboa

Vogais:
Doutor Jos Miguel Oliveira Cardoso Pereira
Professor Associado do Instituto Superior de Agronomia da Universidade Tcnica de Lisboa

Doutor Jorge Manuel Mestre Marques Palmeirim


Professor Auxiliar da Faculdade de Cincias da Universidade de Lisboa

Mestrado em Gesto de Recursos Naturais


Lisboa
2000
Universidade Tcnica de Lisboa

Instituto Superior de Agronomia

MODELAO DA DISTRIBUIO E DA ABUNDNCIA LOCAL


DO CGADO-MEDITERRNICO (Mauremys leprosa) E DO
CGADO-DE-CARAPAA-ESTRIADA (Emys orbicularis) EM
PORTUGAL.

Pedro Segurado

Orientador:
Doutor Jos Miguel Oliveira Cardoso Pereira
Jri
Presidente:
Doutor Antnio Manuel Dorota Fabio
Professor Associado do Instituto Superior de Agronomia da Universidade Tcnica de Lisboa

Vogais:
Doutor Jos Miguel Oliveira Cardoso Pereira
Professor Associado do Instituto Superior de Agronomia da Universidade Tcnica de Lisboa

Doutor Jorge Manuel Mestre Marques Palmeirim


Professor Auxiliar da Faculdade de Cincias da Universidade de Lisboa

Dissertao apresentada neste Instituto


para efeitos de obteno de grau de Mestre

Mestrado em Gesto de Recursos Naturais


Lisboa
2000

RESUMO

Dados sobre a presena/ausncia de Mauremys leprosa e de Emys orbicularis em


quadrculas UTM decaquilomtricas foram utilizados para ajustar modelos preditivos da
distribuio. Recorreu-se a duas tcnicas estatsticas: modelos baseados em rvores de
classificao e modelos de regresso logstica multivariada. As variveis preditoras foram
obtidas a partir do Atlas do Ambiente de Portugal e incluam variveis macroclimticas,
geomorfolgicas, ecolgicas e de cobertura do solo. Por forma a maximizar o leque de
escolhas na seleco do modelo mais adequado, foram ajustados um grande nmero de
modelos estatisticamente vlidos. Os mapas preditivos da distribuio foram obtidos
atravs de um Sistema de Informao Geogrfica. Como complemento a esta informao
estudou-se a influncia de variveis locais na presena ou abundncia das espcies.
Ambos os mtodos e as variveis ambientais disponveis revelaram-se
razoavelmente eficazes na modelao da distribuio, tendo-se obtido precises totais de
classificao na ordem dos 80% para M. leprosa e de 84% para E. orbicularis. As
variveis mais importantes na distribuio das espcies foram sobretudo de natureza
climtica, como a radiao solar, humidade, escoamento, evapotranspirao, precipitao
e regies ecolgicas. Os resultados apontam para fortes indcios de regresso de E.
orbicularis em Portugal. Os mapas resultantes sero teis para seleccionar reas
prioritrias para a conservao das espcies.
Palavras chave: Mauremys leprosa, Emys orbicularis, biogeografia, conservao,
regresso logstica, rvores de classificao.

Predictive models of the distribution and local abundance of the mediterraneanterrapin (Mauremys leprosa) and the stripe-necked-terrapin (Emys orbicularis) in
Portugal.

ABSTRACT
Information on the presence/absence of Mauremys leprosa and Emys orbicularis in UTM
10 x 10 km grid cells was used to build predictive models of their distribution in Portugal.
Two types of statistical models were used: tree-based models and multivariate logistic
regression models. The predictive variables were obtained from the Environment Atlas of
Portugal, which includes climatic, geomorphological, ecological and land cover variables.
A great number of statistically valid models were adjusted in order to maximise the span
of choices in model selection. The predictive maps were obtained using a Geographic
Information System.
Both methods and the available environmental variables provided a reasonable
predictive power of the models. About 80% (M. leprosa) and 84% (E. orbicularis) of the
cells were correctly classified. The variables with stronger predictive power were mainly
climatic: solar radiation, humidity, drainage, evapotranspiration, rainfall and ecological
region. The results suggests strong evidence on the decline of E. orbicularis populations
in Portugal. The predictive maps will be very useful for the future selection of priority
areas for conservation.
Key-words: Mauremys leprosa, Emys orbicularis, biogeography, conservation, logistic
regression, classification trees.

AGRADECIMENTOS
Ao Dr. Jos Miguel Pereira por ter aceite a orientao cientfica desta dissertao e pela
disponibilidade que sempre manifestou.
Ao Dr. Octvio Paulo pela co-orientao desta dissertao e ter facultado o acesso ao seu
gabinete e respectivo recheio.
Dra. Paula Rito de Arajo pelas facilidades concedidas na realizao desta tese,
nomeadamente por ter facultado os dados para a sua realizao, pelas sugestes sempre oportunas e
sobretudo pela simpatia que demonstrou como patroa durante os trs anos em que trabalhei no
servio.
Ao Jos Santos, que me acompanhou muitas vezes por esse pas fora.
Constana Camilo-Alves e ao Jos Carlos Brito, por terem gentilmente cedido a base de dados
e os mapas das variveis. Muito obrigado.
Aos amigos, conhecidos, amigos de amigos, irmos de amigos, etc., que amavelmente me
disponibilizaram as suas informaes sobre observaes de cgados: Francisco Pereira, Francisco
lvares, Antnio Monteiro, Jos Carlos Brito, Rui Rebelo, Gonalo Rosa, Patrcia Brito, Ana Rainho,
Maria Joo Marques, Humberto Rosa, Filipe Catry e Miguel Lecoq. Desculpa se me esqueci de ti.
Outra vez ao Jos Carlos pelo arroz com queijo, o mau cheiro, a tenda, o cho duro, as
derrocadas de estradas, os troncos a barrarem caminhos, o jipe atolado, as ribeiras putrefactas, o
acidente, a muita sorte, a ausncia de companhia feminina, os copos e as consequentes e inevitveis
consideraes metafsicas luz das estrelas, etc, etc, que partilhmos durante as amostragens e que
deram origem a alguns dados que usei nesta tese.
Aos amigos de infncia Alberto e Henrique, por terem aceite mais uma vez ser meus colegas,
apesar de os ter abandonado antes de o serem. Obrigado por terem feito tanta publicidade ao S-PLUS.
A todos os colegas de Mestrado que partilharam comigo a imensa alegria de voltar a estudar para
os exames.
Aos meus pais, claro.
S para acabar e agora numa ordem totalmente aleatria e sem qualquer tipo de preferncia
tirando algumas excepes, s amigas e aos amigos: Isabel Pinto, Ins&Paulo, Rui Rebelo, e ainda
talvez ao Pedro Moreira, ou no? Sim. E tambm Ana Campos e ao Paulo Catry. E Susana Rosa
que entretanto apareceu e ainda me ajudou a rever o texto. Obrigado por me terem deixado trabalhar
nos minutos em que no estava convosco.

ndice

NDICE
1 Introduo...............................................................................................................

1.1 Enquadramento geral........................................................................................

1.2 As espcies em estudo......................................................................................

1.3 Objectivos.........................................................................................................

11

2. Metodologia............................................................................................................

13

2.1 Recolha de dados..............................................................................................

13

2.2 Anlise da distribuio conhecida das espcies...............................................

13

2.3 Modelao da distribuio................................................................................

15

2.3.1. Matriz de dados........................................................................................

15

2.3.2 Anlise exploratria dos dados.................................................................

17

2.3.3 Modelos probabilsticos............................................................................

18

2.3.3.1 Escolha das tcnicas..........................................................................

18

2.3.3.2 Regresso logstica multivariada.......................................................

18

2.3.3.3 rvores de classificao....................................................................

24

2.3.3.4 Comparao e integrao dos modelos.............................................

26

2.3.4 Representao geogrfica dos modelos....................................................

26

2.4 Influncia de variveis locais...........................................................................

27

2.4.1 Matriz de dados.........................................................................................

27

2.4.2 Anlise univariada....................................................................................

29

2.4.3 Anlise multivariada.................................................................................

29

3 Resultados...............................................................................................................

31

3.1 Distribuio conhecida das espcies................................................................

31

3.2 Modelos preditivos da distribuio...................................................................

32

3.2.1 Mauremys leprosa.....................................................................................

32

3.2.1.1 Anlise exploratria..........................................................................

32

3.2.1.2 Regresso logstica............................................................................

39

3.2.1.3 rvores de classificao....................................................................

48

3.2.1.4 Comparao e integrao dos modelos.............................................

52

3.2.2 Emys orbicularis.......................................................................................

55

3.2.2.1 Anlise exploratria..........................................................................

55

3.2.2.2 Regresso logstica............................................................................

58

ndice

3.2.2.3 rvores de classificao....................................................................

65

3.2.2.4 Comparao e integrao dos modelos.............................................

67

3.3 Comparao entre a distribuio de Mauremys leprosa e Emys orbicularis....

70

3.4 Representao geogrfica dos modelos............................................................

73

3.4.1 Mauremys leprosa.....................................................................................

73

3.4.2 Emys orbicularis.......................................................................................

77

3.5 Influncia de variveis locais...........................................................................

81

3.5.1 Mauremys leprosa.....................................................................................

81

3.5.1.1 Anlise univariada.............................................................................

81

3.5.1.2 Anlise multivariada.........................................................................

84

3.5.2 Emys orbicularis.......................................................................................

92

4 Discusso.................................................................................................................

95

4.1 Interpretao ecolgica dos modelos................................................................

95

4.2 Avaliao e interpretao dos modelos segundo a sua representao


geogrfica...............................................................................................................

99

4.3 Influncia de varveis locais.............................................................................

102

5 Consideraes finais...............................................................................................

105

6 Referncias..........................................................................................................

107

1. Introduo

1. INTRODUO
1.1 Enquadramento geral
Padres de distribuio das espcies
Cada espcie tem uma rea de distribuio geogrfica nica que reflecte tanto o seu nicho
ecolgico actual como a sua histria evolutiva (Brown & Gibson, 1983). Com efeito, os
limites actuais de distribuio das espcies no so apenas condicionados pelas
caractersticas ecolgicas e fisiolgicas destas, mas resultam, em grande medida, do espao
geogrfico onde ocorreu a sua evoluo e especiao.
A rea ocupada por uma espcie no homognea, apresentando uma alternncia
de parcelas com diferentes caractersticas ambientais, que determinam a ocorrncia e a
densidade das populaes (Forman, 1995). Por sua vez, a dinmica de metapopulaes
(Gilpin, 1987; Hanski & Gilpin, 1991; Hanski, 1996) mostra que o padro de distribuio,
a dimenso, a forma e conectividade das parcelas mais adequadas sobrevivncia de uma
espcie determinam a sua subsistncia a longo prazo numa dada regio, ao actuarem na
dinmica da extino e recolonizao locais.
Existe no entanto algum determinismo nos padres de distribuio da abundncia
na rea geogrfica em que a espcie ocorre. A distribuio da abundncia ao longo de um
gradiente ambiental geralmente descrito por uma curva gaussiana (Begon, 1996). Deste
modo, no centro da rea de distribuio a abundncia tendencialmente maior do que na
periferia (Lawton et al., 1994), traduzida quer pela densidade populacional a nvel local,
quer pelo nmero de registos de presena a vrias escalas. Segundo o modelo de fluxo de
centrfugo de Grinnel (Antunez & Mendonza, 1992), muitas populaes perifricas
apresentam taxas de mortalidade que superam as de reproduo e so mantidas por um
fluxo de imigrantes das populaes centrais. Este fenmeno essencialmente vlido para
espcies com grande capacidade de disperso como o caso das aves (Brown & Gibson,
1983), ou para escalas geogrficas ao nvel dos habitats.

1. Introduo

Factores limitantes da distribuio


Em ltima anlise os factores que afectam a distribuio das espcies so aqueles que
actuam directa ou indirectamente na sobrevivncia, reproduo e movimento dos
indivduos nas populaes perifricas. Nos animais, em comparao com o que sucede
com a vegetao, o efeito de factores fsicos limitantes menos aparente, em parte porque
mais difcil de detectar variaes na mortalidade e no sucesso reprodutor e em parte
porque tm a capacidade de se refugiar em microclimas com condies mais favorveis
(Brown & Gibson, 1983). Outra dificuldade surge da interaco entre os factores que
determinam os limites da distribuio de uma espcie (Brown & Gibson, 1983; Begon,
1996).
Os factores limitantes da distribuio mais frequentemente apontados so (Brown
& Gibson, 1983; Wiens, 1989; Antunez & Mendonza, 1992; Cox & Moore, 2000):
(1) factores climticos (constrangimentos fisiolgicos das espcies), (2) disponibilidade de
habitats (recursos alimentares, locais de reproduo e refgio), (3) factores biticos
(competio, predao e mutualismo), (4) barreiras topogrficas (cadeias montanhosas,
oceanos, etc.), (5) capacidade de disperso da espcie (mobilidade, tamanho corporal), (6)
distrbios (muitas espcies dependem de distrbios regulares do meio ambiente), (7) fluxo
gentico (o fluxo gentico das populaes centrais para as perifricas impede a adaptao
destas a novas condies ambientais) e (8) aco humana (capturas e alterao dos
habitats).
Diferentes factores ecolgicos podem limitar a distribuio espacial duma espcie
em diferentes zonas da sua rea geogrfica (Cox & Moore, 2000), e por isso as concluses
que se extraem a nvel local no so generalizveis (Antunez & Mendonza, 1992).
A relao entre os factores ambientais e a distribuio de uma espcie pode ser
estudada a vrias escalas espaciais. A escala mais apropriada e a resoluo a ser empregue
dependem do objectivo do estudo (May, 1994), podendo estudos do mesmo fenmeno,
efectuados a vrias escalas, levar a resultados contraditrios (Gaston & Lawton, 1990). A
escolha de escalas erradas pode inclusivamente levar a generalizaes que podem ser
perigosas quando aplicadas conservao (Murphy, 1989).
Por sua vez, a natureza dos factores a ter em considerao depende igualmente da
escala de estudo (Antunez & Ramirez, 1992; Cox & Moore, 2000). Por exemplo, o padro
de ocorrncia de uma espcie a nvel local determinado sobretudo pelas caractersticas
dos habitats e por factores biticos. J o padro de ocorrncia ao nvel regional sobretudo

1. Introduo

influenciado por factores macro-ambientais (que influenciam igualmente as caractersticas


dos habitats). A resoluo adoptada na escala regional necessariamente menor do que na
escala local, no s por razes logsticas, mas porque o excesso de resoluo pode
obscurecer o padro geral que se pretende estudar. Por outro lado, suponhamos que se
adopta uma baixa resoluo espacial (por exemplo baseada numa rede UTM 10 x 10 km);
mais difcil associar a cada quadrcula determinada caracterstica de habitat (por
exemplo, profundidade do meio aqutico) do que determinada varivel macro-ambiental
(por exemplo temperatura mdia anual), uma vez que apresenta variaes (que podem ser
determinantes para a espcie) apenas detectveis com resolues espaciais muito finas.
Modelao ambiental e SIG
Os mtodos de identificao dos principais factores ambientais envolvidos no padro de
ocorrncia e abundncia das espcies bem como da sua modelao geogrfica, sofreram
recentemente um grande desenvolvimento associado aos avanos nos domnios da
estatstica espacial e do armazenamento e manipulao de dados espaciais por Sistemas de
Informao Geogrfica (SIG) (Haslett, 1990; Walker, 1990; Maurer, 1994; Johnston,
1998).
Com um modelo ambiental pretende-se relacionar uma determinada caracterstica
ou fenmeno (varivel dependente ou varivel resposta) com factores ambientais (variveis
independentes ou covariveis) cuja variao no espao conhecida, por forma a permitir a
sua extrapolao por toda a rea geogrfica que se pretende estudar. Os modelos podem ser
dinmicos ou estticos consoante integrem ou no uma componente temporal.
Como seria de esperar, a integrao de SIG com modelos ambientais tem emergido
como uma rea muito significativa do desenvolvimento dos SIG (Johnston, 1998). Podem
distinguir-se trs tipos principais de modelos usados em ambiente SIG: modelos
cartogrficos, modelos baseados em regras e modelos estatsticos (Johnston, 1998).
Os modelos cartogrficos resultam da simples combinao de vrias camadas de
informao, recorrendo s capacidades operativas dos SIG (Berry, 1993; Johnston, 1998),
com o objectivo de localizar as reas com as propriedades ecolgicas desejadas. Estes
modelos tm sido frequentemente utilizados para cartografar o grau de adequao dos
habitats, numa perspectiva de gesto do territrio. Palmeirim (1985), a partir de uma
imagem Landsat TM classificada produziu camadas de informao relevantes para a
avaliao e seleco de habitats para repovoamentos de galinholas no Nordeste do Kansas.

1. Introduo

Ormsby (1987) produziu mapas de disponibilidade de alimento do veado-de-cauda-branca


igualmente a partir de camadas de informao resultantes da classificao de uma imagem
Landsat TM. Breininger et al. (1991) usou mapas de solo e vegetao obtidas a partir de
fotografias areas para cartografar os habitats primrios e secundrios do gaio da Florida.
Uma das desvantagens destes modelos que a relao entre as camadas de informao e as
propriedades que se pretendem mapear tem de ser conhecida partida, muitas vezes
atravs da imposio regras subjectivas.
A modelao baseada em regras recorre a sistemas periciais para o estabelecimento
de regras de deciso. O prprio sistema aprende a relao entre as camadas de
informao e estabelece uma srie de critrios para a modelao ambiental. Uma tcnica
relativamente simples para o estabelecimento de regras de deciso baseia-se em rvores de
classificao (para variveis resposta categoriais) e regresso (para variveis resposta
contnuas). Esta tcnica recorre a parties binrias que vo subdividindo a amostra inicial,
segundo regras de deciso, em subconjuntos de crescente homogeneidade (Clark &
Pregibon, 1992). Por exemplo, Walker (1990) usou rvores de classificao integradas com
uma base de dados e um SIG para gerar modelos de distribuio de trs espcies de
cangurus na Austrlia.
Nos modelos estatsticos estabelece-se uma relao emprica entre as variveis
ambientais e determinada propriedade ecolgica (varivel resposta), atravs da estimao
de parmetros cuja validade estatisticamente testvel. Diferentes abordagens estatsticas
so utilizadas caso se pretenda modelar uma varivel resposta contnua ou categorial. Para
variveis resposta contnuas a tcnica mais utilizada a regresso linear mltipla. Quando
as variveis resposta so categoriais recorre-se frequentemente a modelos de regresso
logstica (Hosmer & Lemeshow, 1989; MacCullagh & Neller, 1989; Trexler & Travis,
1993). Esta tcnica, ao contrrio do que sucede por exemplo com a anlise discriminante
linear, apresenta a vantagem das estatsticas no assumirem quer uma distribuio normal
das variveis quer a homogeneidade de varincias entre as classes. Por outro lado, permite
a modelao quer de variveis dicotmicas quer de variveis politmicas ordinais
(definidas de forma arbitrria ou subjectiva) ou nominais (MacCullagh & Neller, 1989).
Austin et al. (1996) utilizou funes de anlise discriminante e regresses logsticas para
prever a distribuio espacial de reas de nidificao da guia-de-asa-redonda, tendo
obtido com a ltima tcnica modelos mais simples, mais robustos e mais precisos do que
com a primeira. Mais recentemente tem havido uma tendncia crescente para a utilizao

1. Introduo

de mtodos estatsticos bayesianos (Ellison, 1996; Hoef, 1996) em detrimento da estatstica


frequentista usual.
Outro conjunto de modelos baseia-se em tcnicas de interpolao espacial em que a
modelao geogrfica duma caracterstica ou fenmeno baseada exclusivamente em
informao de natureza espacial. Estas tcnicas tm vindo a ser aplicadas na anlise de
padres espaciais da abundncia das espcies e no desenvolvimento de mtodos de
descrio da fragmentao demogrfica das populaes (Maurer, 1994).
O ajustamento de modelos ambientais estatsticos na maioria dos casos realizado
em programas de estatstica separados dos SIG. No entanto, tem-se verificado uma
tendncia para o desenvolvimento de programas especficos que estabelecem a ligao
entre os SIG e programas de estatstica e de mdulos estatsticos includos nos prprios
SIG (Johnston, 1998).
Modelos de distribuio
No caso da modelao da distribuio, a varivel resposta categorial dicotmica
(presena/ausncia). A regresso logstica multivariada tem sido a tcnica mais
frequentemente utilizada na modelao da probabilidade de ocorrncia de espcies a
diversas escalas de estudo (Walker, 1990; Hill, 1991; Pereira & Itami, 1991; Buckland &
Elston, 1993; Chandler et al.,1995; Augustin, et al., 1996; Austin et al., 1996, Brito et al.,
1996; Romero & Leal, 1996; Franklin, 1998; Brito et al., 1999). No caso de se dispor de
dados de abundncia possvel produzir modelos espaciais da abundncia das espcies
atravs de modelos de regresso logstica ordinal, associando a cada unidade espacial uma
probabilidade de possuir determinado nvel de abundncia (Gates et al., 1994; North &
Reynolds, 1996). Outras tcnicas de modelao da distribuio de espcies incluem
funes discriminantes (Rogers & Williams, 1994; Austin, et al., 1996), distncias de
Mahanalobis (Clark et al., 1993), anlises de correlao cannica (Andries et al, 1994),
mtodos baseados em critrios de deciso mltiplos (MCDM) (Pereira & Duckstein, 1993)
e rvores de classificao (Walker, 1990; Franklin, 1998; Iverson & Prasad, 1998). Os
modelos probabilsticos de distribuio so tambm frequentemente utilizados no domnio
da arqueologia, para a seleco de reas geogrficas a prospectar (Parker, 1985; Kvamme,
1990; Kvamme, 1992; Warren, 1990). Descrevem-se de seguida, muito sucintamente,
alguns exemplos de trabalhos de modelao da distribuio de espcies.

1. Introduo

Walker (1990) utilizou rvores de classificao e regresso logstica para modelar


trs espcies de canguru na Austrlia com base em variveis climticas, tendo obtido
resultados ligeiramente melhores com a primeira tcnica.
Franklin (1998) recorreu s mesmas duas tcnicas para prever a distribuio de
espcies de arbustos na eco-regio do sul da Califrnia em funo de variveis climticas,
tendo igualmente obtido erros de classificao menores com os modelos baseados em
rvores de classificao.
Gates et al. (1994) modelaram a ocorrncia e a abundncia de oito espcies de aves
agrcolas da Gr-Bretanha numa rede UTM 10 x 10 km. Obtiveram um mximo de 16
modelos por espcie, tendo sido escolhido aquele que possua melhores medidas de
qualidade de ajustamento.
Brito et al. (1996; 1999) e Teixeira et al. (1996) recorreram a modelos de regresso
logstica para gerar mapas da probabilidade de ocorrncia, respectivamente, de lagarto-degua e de salamandra-dourada em Portugal, a partir de variveis ambientais extradas do
Atlas do Ambiente de Portugal (C.N.A., 1983). A resoluo adoptada foi tambm baseada
na rede UTM 10 x 10 km. Brito et al. (1999) compararam ainda os resultados obtidos com
os modelos de regresso logstica, com os mapas originados a partir da simples
combinao de camadas de informao (modelo cartogrfico).
Pereira & Itami (1991) geraram dois modelos de regresso logstica de presena do
esquilo-vermelho de Mount Graham (Arizona, E.U.A.) - um modelo ambiental e um
modelo baseado unicamente nas coordenadas dos locais de ocorrncia (utilizando um
polinmio do 4 grau) - e integraram a informao recorrendo a um modelo bayesiano,
utilizando o segundo modelo para gerar probabilidades a priori.
Aspinall & Veitch (1993) recorreram igualmente a um modelo bayesiano para obter
um mapa de probabilidade de ocorrncia de maarico-real no NE da Esccia. As
probabilidades condicionais foram calculadas com base nos valores espectrais de uma
imagem Landsat TM e de um modelo digital do terreno e foram posteriormente usadas
para classificar a imagem.
Buckland & Elston (1993) efectuaram uma reviso dos modelos empricos de
distribuio, utilizando dados de ocorrncia de pica-pau-verde, de rabirruivo e de veado no
NE da Esccia. Utilizaram, como variveis independentes, as componentes principais do
espao das variveis ambientais, como forma de reduzir a sua dimensionalidade.
Recomendaram a tcnica de bootstrap para avaliar a preciso do modelo.

1. Introduo

Como forma de contornar os problemas provenientes da autocorrelao espacial,


Augustin et al. (1996) propuseram a adio de um termo designado por autocov equao
logstica. Para testar o procedimento utilizaram os mesmos dados de ocorrncia de veado
que Buckland & Elston (1993).
Iverson & Prasad (1998) desenvolveram modelos baseados em rvores de regresso
para avaliar potenciais alteraes nos limites de distribuio de 80 espcies arbreas do
Este dos Estados Unidos face a mudanas climticas globais.
Biogeografia e conservao
Os limites de distribuio de uma espcie no so estticos no tempo, estando em
constante mudana em resposta a alteraes climticas e geolgicas a longo prazo. Para
muitas espcies estes processos foram acelerados pela actividade humana, de forma que
grandes mudanas na distribuio e abundncia ocorreram dentro de escalas de tempo sem
antecedentes na histria evolutiva (Brown & Gibson, 1983; Lawton, et al., 1994).
As populaes mais vulnerveis aco humana encontram-se geralmente nas
periferias das respectivas reas de distribuio, uma vez que esto em geral mais isoladas
(Rapoport,

1982),

apresentam

densidades

menores

(segundo

os

modelos

metapopulacionais) e esto mais susceptveis a alteraes globais de factores limitantes.


Dum simples inventrio da distribuio, possvel extrair informaes de diversa
natureza (Harding, 1991), como por exemplo: (1) os limites de distribuio das espcies,
(2) informaes sobre as preferncias de habitat das espcies e (3) variaes espaciais da
biologia das espcies. Por outro lado, os estudos biogeogrficos contribuem para a gesto
dos recursos naturais e problemas de conservao a grande escala, nomeadamente no que
se refere aos planos de ordenamento territorial (Ramirez & Vargas, 1992) e
monitorizao das populaes (Harding, 1991).
Os efeitos a larga escala, como o caso da possvel alterao climtica global do
planeta, requerem necessariamente estudos a uma escala suficientemente grande, por forma
a poder relacionar esses efeitos com eventuais alteraes na rea geogrfica de uma
espcie. Para tal, importante identificar os principais factores que influenciam a
distribuio a larga escala das espcies e construir modelos vlidos que permitam prever os
futuros efeitos de alteraes globais.

1. Introduo

Os modelos ambientais so tambm importantes para aces de restauro de


populaes ou comunidades, uma vez que ajudam a localizar as reas com maiores
potencialidades para levar a cabo aces de reintrodues de espcies.
A determinao e a modelao de reas de ocorrncia podem ser importantes para a
localizao de zonas de maior vulnerabilidade para as espcies. Aplicando a escala e as
resolues certas possvel determinar o grau e o padro de fragmentao ou isolamento
das populaes. Esta informao pode ser importante para prever a maior ou menor
vulnerabilidade das populaes,

juntamente com dados demogrficos e padro de

disperso dos indivduos, de acordo com modelos metapopulacionais (Harrison, 1994).


Por ltimo, os modelos de distribuio so importantes para a delimitao de reas
prioritrias para a conservao a nvel nacional de uma ou vrias espcies. A informao
sobre os limites de distribuio, grau de fragmentao, deteco de populaes isoladas,
coincidncia na distribuio de diferentes espcies, etc., integrada com outro tipo de
informao (demografia, avaliao de habitats, etc.) pode ser til na seleco de reas
potencialmente importantes para a conservao de determinada espcie ou para a
biodiversidade em geral.

1.2 As espcies em estudo


Morfologia
Em Portugal continental ocorrem duas espcies de cgados autctones: O cgadomediterrnico, Mauremys leprosa (Schweigger, 1812) e o cgado-de-carapaa-estriada,
Emys orbicularis (Linnaeus, 1758), ambos pertencentes famlia Emydidae (Ernst &
Barbour, 1989). No texto que se segue passar-se-o a adoptar as respectivas abreviaturas:
Mle e Eor. As duas espcies distinguem-se essencialmente pelo padro de cores e pela
forma e estrutura da carapaa (Barbadillo, 1987; Ernst & Barbour, 1989).
Mle apresenta uma carapaa com uma tonalidade castanho-esverdeada com uma
quilha longitudinal mais ou menos evidente; os membros interiores e pescoo so
percorridos por listas amarelo-alaranjadas; o plastro rgido e possui placa inguinal.
Eor possui uma carapaa mais escura e geralmente com o lado dorsal mais convexo
do que a espcie anterior e no possui quilha dorsal; apresenta uma cor preta ou
acastanhada com pintas e estrias amarelas mais ou menos evidentes; a cabea, pescoo e
8

1. Introduo

patas so igualmente escuras com pintas amarelas; possuem um plastro ligeiramente


mvel na sua regio anterior atravs de uma charneira transversal; no possuem placa
inguinal.
Distribuio
As duas espcies apresentam uma distribuio distinta, sendo Eor mais setentrional e
cosmopolita. Vivem em simpatria na Pennsula Ibrica e nalgumas regies do Norte de
frica, como por exemplo no Norte de Marrocos (Bons & Geniez, 1996).
Mle distribui-se por maior parte da Pennsula Ibrica, prolongando-se um pouco
para Norte dos Pirinus orientais, no Sul de Frana; a sua distribuio prolonga-se ainda
por todo o Magreb mediterrneo (Marrocos, Arglia e Tunsia) at Tripolitnia (Oeste da
Lbia). Ocorrem ainda populaes isoladas mais a Sul, prximo das margens meridionais
do Saara (Sul da Mauritnia, Mali e Nger) (Bons & Geniez, 1996).
Eor possui uma distribuio caracteristicamente centroeuropeia. A sua rea de
distribuio estende-se desde a Pennsula Ibrica at ao mdio-oriente (Mar Cspio), e
desde o Norte de frica (Marrocos, Arglia e Tunsia) at ao Norte da Europa (Alemanha,
Polnia, Pases Blticos e Rssia). Ocorre ainda na Grcia, Itlia, Frana, pases do Leste
Europeu e em ilhas mediterrneas como a Crsega, Sardenha e Baleares (Ernst & Barbour,
1989).
Habitat
As duas espcies ocupam habitats semelhantes, partilhando com frequncia o mesmo meio
aqutico nas regies de simpatria. A informao disponvel sobre a utilizao dos habitats
destas espcies tem essencialmente um carcter descritivo.
Mle vive em praticamente todo tipo de habitats de gua doce na sua rea de
distribuio (Ernst & Barbour, 1989), incluindo rios, ribeiros, valas agrcolas, tanques,
charcos, lagoas, albufeiras e pauis. frequentemente encontrado em locais com ndices de
poluio relativamente elevados (Barbadillo, 1987; observao prpria).
Eor prefere cursos ou massas de gua estanque ou de corrente lenta, de fundo
lodoso e uma boa cobertura de vegetao aqutica (Arnold & Burton, 1978; Barbadillo,
1987; Ernst & Barbour, 1989). Pode tambm encontrar-se em rios e ribeiros com alguma
corrente. Os juvenis preferem massas de gua de pequenas dimenses, pouco profundas ou

1. Introduo

mesmo de carcter temporrio (Neas et al., 1997). Esta espcie pode tambm encontrar-se
em locais com ndices de poluio elevados (Ernst & Barbour, 1989; observao prpria).
Da Silva (1993) encontrou ncleos populacionais de Eor na provncia de Badajoz
apenas nos ribeiros de gua limpa e pouco alterados das zonas serranas, ao contrrio da
outra espcie, que foi observada em todo tipo de habitats, poludos ou no. J na regio de
Doana (SW de Espanha) verifica-se uma certa segregao espacial das espcies: Mle
tende a ocupar sobretudo as massas de gua de maiores dimenses e de carcter
permanente e Eor tende a ocupar charcos temporrios (Keller et al., 1994).
Estado das populaes
Mle considerado comum na maioria das regies onde ocorre (Barbadillo, 1987; Crespo &
Oliveira, 1990; Da Silva, 1993; Malkmus, 1995; Bons & Geniez, 1996; Arajo et al.,
1997), havendo no entanto alguns indcios de regresso a nvel local.
Pelo contrrio Eor considerado raro e em regresso na grande parte da sua rea de
distribuio (Servan & Pieau, 1984; Corbett, 1986; Barbadillo, 1987; Crespo & Oliveira,
1990; Frisenda & Ballasina, 1990; Amo, 1991; Astudillo & Arano, 1995; Malkmus, 1995;
Bons & Geniez, 1996; Neas et al., 1997; Arajo et al., 1997) e especialmente na Europa
central e do Norte, onde ocorrem populaes muito isoladas. Em todos os pases europeus
onde se dispe de informao sobre o estado das populaes, a espcie considerada rara e
em regresso (Arajo et al., 1997.). A alterao e destruio de zonas hmidas (drenagens,
regularizao das margens, etc.), a poluio industrial e agrcola , a introduo de espcies
de tartarugas exticas e a captura para comrcio so alguns dos factores mais apontados
para a situao actual desta espcie.
Em termos da situao legal a nvel internacional, ambas as espcies esto includas
no Anexo II da Conveno de Berna e, mais recentemente, nos anexos II e IV da Directiva
da Unio Europeia - Directiva Habitats - relativa Preservao de Habitats Naturais e
Seminaturais e da Fauna e Flora Selvagens (Directiva 92/43/CEE).
Situao em Portugal
Em Portugal o estado das populaes de Mle no parece preocupante (Arajo et al., 1997),
apesar de haver algumas informaes sobre desaparecimentos ou declnios a nvel local.

10

1. Introduo

Esta espcie considerada No Ameaada pelo Livro Vermelho dos Vertebrados de


Portugal (SNPRCN, 1990).
Eor apresenta alguns indcios de regresso em Portugal. Possui uma distribuio
muito fragmentada e nos locais onde ocorre surge invariavelmente com valores de
abundncia muito inferiores aos de Mle (Segurado, 1996; Arajo et al., 1997). Os estudos
efectuados at agora em Portugal nas populaes consideradas mais importantes revelam a
quase inexistncia de juvenis e recm nascidos e uma taxa de gravidez muito baixa
(Segurado, 1996; Arajo et al., 1997.). Esta espcie possui o estatuto de
Insuficientemente Conhecida, apesar de haver fortes motivos (Arajo et al., 1997) para a
incluir, segundo os critrios da IUCN, no estatuto de Vulnervel. Em Espanha esta
espcie j possui este estatuto.
Em Portugal estas espcies encontram-se numa regio perifrica da sua distribuio
(limite Noroeste para Mle e Sudoeste para Eor), o que representa um factor adicional na
vulnerabilidade das populaes, sobretudo de Eor.

1.3 Objectivos
Tendo em considerao o que foi exposto pretendeu-se com este trabalho:
1. Obter modelos preditivos da distribuio de Mle e de Eor em Portugal, com base nas
variveis macro-ambientais disponveis;
2. Comparar os resultados da aplicao de diferentes modelos de classificao;
3. Determinar quais as variveis com mais influncia na ocorrncia das espcies a duas
escalas: a nvel nacional (influncia de variveis macro-ambientais) e a nvel local
(influncia de variveis locais).
Este trabalho poder, no futuro, fornecer bases para a gesto das populaes destas
espcies, nomeadamente quanto delimitao de reas prioritrias para a conservao.
A distribuio a nvel nacional foi estudada apenas com base em dados de
presena/ausncia das espcies, devido dificuldade em associar abundncias a cada
unidade de amostragem (quadrculas UTM 10 x 10 km), e sobretudo grande margem de
erro que tal procedimento acarretaria. Considerando que os factores a nvel local

11

1. Introduo

apresentam uma maior relao com a densidade populacional, os modelos a esta escala
basearam-se em dados de abundncia relativa. Devido escassez de dados de Eor, a
influncia de variveis locais foi estudada com base apenas em anlises univariadas.

12

2. Metodologia

2. METODOLOGIA
2.1 Recolha dos dados
A maioria dos dados analisados neste trabalho foram obtidos no mbito do projecto
avaliao da situao de Emys orbicularis e de Mauremys leprosa em Portugal (Arajo
et al., 1997), decorrido entre 1992 e 1997. Neste projecto, os resultados relativos
distribuio das espcies basearam-se na compilao de informao, quer bibliogrfica
quer fornecida por colaboradores, e em amostragens no terreno. Os mtodos de
amostragem consistiram essencialmente na realizao de transectos ao longo de cursos de
gua, em capturas com armadilhas e em observaes ad-hoc (Arajo et al., 1997). Os
transectos e as armadilhagens permitiram a obteno de abundncias relativas, expressas
respectivamente por um ndice horrio de abundncia (nmero de observaes por unidade
de tempo) e por um ndice segundo o nmero de armadilhas e o nmero de horas de
armadilhagem (nmero de indivduos capturados por armadilha e por hora).
Em 1997 e 1998, j no mbito do presente estudo, com o objectivo de obter dados
adicionais sobre a distribuio e abundncia das espcies, foram realizados transectos em
119 locais onde se dispunha ainda de pouca informao.

2.2 Anlise da distribuio conhecida das espcies


Representao da distribuio
A todos os locais de amostragem foram retiradas as respectivas coordenadas UTM com
resoluo de 1 Km, com base em cartas 1:25000 do Instituto Cartogrfico do Exrcito. A
distribuio das espcies foi representada segundo a sua ocorrncia em quadrculas da rede
UTM 10 x 10 km. Apesar da cartografia de Portugal do Instituto Cartogrfico do Exrcito
basear-se no sistema de projeco Gauss, as coordenadas UTM tm sido utilizadas com
mais frequncia nos atlas de distribuio de espcies em Portugal, razo pela qual se optou
por este sistema, apesar dos erros que da advm.

13

2. Metodologia

ndices de raridade
A representao da distribuio com base numa rede quadricular de 10 km tem sido usada
com alguma frequncia na quantificao da raridade e na determinao do grau de ameaa
das espcies (Harding, 1991; Spellerberg, 1992). Podem considerar-se dois tipos de
raridade: a distribuio pode estar confinada a uma determinada regio restrita e ento
considera-se a espcie como rara a nvel nacional, ou a distribuio pode ser mais alargada
mas muito fragmentada e ento considera-se a espcie como rara a nvel local (Spellerberg,
1992).
Para quantificar a raridade foram criados dois ndices: um ndice de Raridade
Global (IRG) e um ndice de Raridade Mdia Local (IRML), calculados da seguinte forma:

IRG =

A
A+ P

A = n total de quadrculas de ausncia


P = n total de quadrculas de presena
P

IR
IRML =

Li

em que IRL o ndice de Raridade Local e mede o grau de isolamento de cada quadrcula
de presena, sendo expresso da seguinte forma:

IRL =

Av Pv
V

Av = n de quadrculas de ausncia na vizinhana da quadrcula


Pv = n de quadrculas de presena na vizinhana da quadrcula
V = n total de quadrculas na vizinhana da quadrcula
Para determinar o nmero de quadrculas de cada tipo (ausncia, presena, no
amostrada) na vizinhana das quadrculas de presena utilizou-se o mdulo pattern
(funo class frequency) do programa IDRISI (Eastman, 1990), a partir duma imagem com
14

2. Metodologia

informao sobre a presena/ausncia, em que cada pixel correspondia a uma quadrcula


UTM 10 x 10 km. Consideraram-se as quadrculas includas numa janela de 5 x 5,
excluindo as quadrculas dos cantos (V = 22). Aps as operaes algbricas entre as
camadas para o clculo dos IRL calculou-se o valor mdio (IRML) atravs do mdulo
extract.
O ndice de Raridade Local varia entre -1 (todas as quadrculas da vizinhana so
presenas) e 1 (todas as quadrculas da vizinhana so ausncias) e nulo quando o n de
quadrculas de cada classe igual. Quando o IRG baixo e o IRML elevado a espcie
considerada rara a nvel nacional; quando ambos os ndices so baixos a espcie
considerada rara a nvel local.

2.3 Modelao da distribuio


2.3.1 Matriz de dados
Para cada espcie construiu-se uma matriz de dados com informao sobre a
presena/ausncia da espcie por quadrcula UTM 10 x 10 km. A cada quadrcula UTM
10 x 10 km associaram-se variveis ambientais extradas do Atlas do Ambiente (C.N.A.,
1983). Para tal, considerou-se a moda das variveis, ou seja, a classe que ocupava uma rea
maior na quadrcula. Incluram-se na matriz um total de 12 variveis quantitativas e 20
variveis qualitativas (Tabela 2.1). As variveis quantitativas consideradas so intervalares
e por isso houve a necessidade de associar um nmero inteiro a cada classe de varivel, por
forma a que as variaes se dessem em intervalos unitrios (Anexo I). As variveis
qualitativas so sobretudo de presena/ausncia de determinado tipo de cobertura.
Foram ainda includas na matriz duas variveis espaciais (n da linha e n da coluna
da quadrcula, no sistema UTM 10 x 10 km), apenas como forma de controlo. No caso
extremo de nenhuma varivel ambiental estar relacionada com a distribuio das espcies,
os modelos gerados incluiriam apenas estas duas variveis.

15

2. Metodologia

Tabela 2.1 Variveis includas nas anlises, classes e respectivos cdigos.


Variveis quantitativas
Temperatura mdia do ar (C, diria)
Precipitao total anual (mm)
Humidade relativa do ar (%, s 9.00T.M.G.)
Escoamento (mm)
Evapotranspirao real (mm)
Insolao total anual (hora)
Radiao solar (Kcal/cm2)
Altitude (m, acima do nvel mdio das guas do mar)
Carta ecolgica (informao Fito-Edafo-Climtica)
Solo (tipo predominante de solo)
Geada (n de meses - poca do ano agrcola)
Densidade populacional humana (n de hab./km2 - por concelho)
N da coluna (UTM 10 x10)
N da linha (UTM 10 x10)
Variveis qualitativas
Folhosas
Resinosas
Olival
Sobreiral
Azinheira
Carvalhal
Pinhal
Eucaliptal
Castanheiro
Figueira
Medronheiro
Alfarrobeira
Amndoeira
Culturas arvenses
Cultura arbustiva
Culturas arbrias
Consociaes arvense-arbreas
Consociaes arbreo-arvenses
Incultos
Salinas e sapais

Classes
1-6
1 - 13
1-6
1 - 14
1-8
1 - 14
1-7
1-9
1-8
1-5
1 - 10
1-7
1 - 28
1 - 58

Cdigo
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT

0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1
0/1

FOLH
RESI
OLIV
SOBR
AZIN
CARV
PINH
EUCT
CAST
FIGU
MEDR
ALFA
AMEN
CUARV
CARBS
CARBR
CAVAB
CABAV
INCT
SAL

Um dos problemas decorrentes da modelao espacial o da autocorrelao


espacial das amostras (Cliff & Ord, 1973; Anselin, 1993). Quadrculas vizinhas tendem a
apresentar condies semelhantes e, consequentemente, os resduos de um modelo ajustado
tm tendncia a exibir autocorrelao espacial, originando estimativas enviesadas da
varincia residual e dos coeficientes de regresso. Para alm deste efeito, a probabilidade
de ocorrncia da espcie numa quadrcula pode no ser independente da presena nas
quadrculas vizinhas (Augustin et al., 1996).
Na tentativa de obviar este problema optou-se por adoptar uma amostragem
sistemtica, tendo-se criado sub-conjuntos de quadrculas em que se excluam as
16

2. Metodologia

quadrculas adjacentes, quer na horizontal e vertical, quer na diagonal. A escolha deste


esquema de subamostragem foi em parte suportado pelo clculo do valor do Morans I
(Cliff & Ord, 1973), atravs do mdulo autocorr do programa IDRISI (Eastman, 1990),
para a varivel resposta. Com um factor de contraco de segunda ordem o valor do ndice
baixou cerca de 50% (de I = 0.482 para I = 0.259). Procedimentos idnticos foram
adoptados por outros autores (Pereira & Itami, 1991; Gates et al., 1994; Brito et al., 1999).
Deste modo, para Mle criaram-se 4 matrizes de dados, com 66, 58, 63 e 60
quadrculas de ausncia e, respectivamente, 91, 82, 86 e 80 quadrculas de presena. Estas
matrizes serviram tanto de amostras de treino como de amostras de validao. Para Eor
criaram-se duas matrizes com objectivos diferentes. Uma para discriminar entre
quadrculas de presena e de ausncia, com respectivamente 30 e 48 quadrculas, e outra
para discriminar entre quadrculas de presena de ambas as espcies e a presena apenas de
Mle (apenas recorrendo a uma anlise univariada), com respectivamente 30 e 56
quadrculas. Como amostra de validao criou-se, para cada abordagem, uma matriz com
19 quadrculas de ausncia e 19 de presena. A subamostragem das quadrculas de
ausncia para esta espcie foi efectuada com base nas quadrculas de ausncia das duas
espcies, por forma a garantir com maior segurana a real ausncia da espcie.

2.3.2. Anlise exploratria dos dados


Para testar diferenas entre as classes presena e ausncia das espcies relativamente a
cada varivel quantitativa foram usados testes no paramtricos, uma vez que se
detectaram desvios significativos normalidade em todas as variveis. Utilizaram-se o
teste U de Mann-Whitney para testar diferenas nas medianas e o teste de KolmogorovSmirnov de duas amostras para comparar a distribuio de frequncias em cada classe
segundo cada varivel quantitativa (Zar, 1984). Estes testes foram realizados
separadamente para cada matriz de dados.
Para testar eventuais diferenas entre as distribuies de cada varivel nas quatro
matrizes de Mle, separadamente para ausncias e presenas, efectuaram-se ainda uma
ANOVA de Kruskal-Wallis e um teste da mediana (Zar, 1984).

17

2. Metodologia

No caso das variveis qualitativas foram realizados testes de 2 de modo a testar se


as classes presena e ausncia estavam distribudas aleatoriamente nas categorias das
variveis.

2.3.3 Modelos probabilsticos


2.3.3.1 Escolha das tcnicas

Com o objectivos de conhecer a combinao de variveis com maior influncia na


presena das espcies e de obter um modelo preditivo da distribuio, recorreram-se a duas
tcnicas: regresso logstica e rvores de classificao.
Como j foi referido anteriormente, a primeira tem sido frequentemente utilizada na
modelao da distribuio de espcies faunsticas. O mtodo das rvores de classificao
no tem sido muito utilizado em problemas biolgicos, mas apresenta grandes
potencialidades, sobretudo na rea de gesto de recursos naturais, devido sua
simplicidade de interpretao.
Ambos os mtodos apresentam a vantagem das estatsticas no assumirem quer
uma distribuio normal das variveis, quer a homogeneidade de varincias entre as
classes, ao contrrio do que sucede com outros mtodos clssicos como a funo
discriminante linear. Por outro lado, permitem ambas uma anlise conjunta do efeito de
covariveis quantitativas e qualitativas.
2.3.3.2 Regresso logstica multivariada

O modelo logstico
A regresso logstica inclui-se nos designados modelos lineares generalizados, que so
extenses do modelo linear clssico em que o preditor linear relaciona-se com o valor
esperado da varivel resposta y por meio de uma funo g designada funo de ligao
(Hosmer & Lemeshow, 1989; MacCullagh & Neller, 1989). No caso da regresso logstica,
na sua verso mais simples em que a varivel resposta binria, a funo de ligao o
logit e toma a seguinte forma:

18

2. Metodologia


= g( ) = log

1
O valor esperado equivale neste caso probabilidade (x) de se dar uma das duas
respostas, dado um vector de covariveis x. A fraco entre parntesis designa-se por odds.
A expresso pode ser rescrita em funo do logit (agora expresso em funo de x) do
seguinte modo:

e g( x)
(x) =
1 + e g( x)
Esta expresso descreve uma curva logstica para (x) em funo do preditor linear g(x),
restringindo os seus valores ao intervalo [0,1]. O logit tem ento como finalidade
transformar (x) numa funo com as propriedades desejadas de um modelo de regresso
linear, podendo deste modo tomar a forma clssica:
g(x) = 0 + 1x1 + 2x2 + ...+ pxp,,
em que 0 uma constante, 1 ... p so os coeficientes das x1 ... xp covariveis ou variveis
independentes. A principal diferena entre o modelo linear clssico e o modelo logstico
que a distribuio da varivel resposta dado x no segue uma distribuio normal, mas sim
uma distribuio binomial de parmetro (x) (Hosmer & Lemeshow, 1989).
Para avaliar a qualidade de ajustamento dos modelos aos dados so geralmente
estimadas duas estatsticas baseadas nos resduos: A deviance (D) e a estatstica X

de

Pearson, baseadas respectivamente na soma dos quadrados dos resduos deviance e de


Pearson. A sua distribuio segue uma distribuio 2 com J - p + 1 graus de liberdade (J

n de amostras, p = n de variveis no modelo), assumindo o modelo como correcto


(Hosmer & Lemeshow, 1989). So calculadas do seguinte modo:
J

Deviance: D = d y j , $ j
j =1

19

2. Metodologia

em que, para yi = 0:

[ (

d y j , $ j = 2m j ln m j 1 $ j

)] ,

e para yi = 1:

d y j , $ j = 2m j ln m j $ j

X 2 de Pearson:

X 2 = r y j , $ j
j =1

em que:

r y j , $ j =

(y

m j $ j

m j $ j 1 $ j

yj = resposta observada para o valor distinto j de x


J = n de valores distintos de x (J n de amostras)
mj = n de amostras para cada valor distinto de x (mj 1)
Aps a fixao de uma probabilidade a partir da qual se considera que a espcie
est presente (ponto de corte), torna-se possvel a validao do modelo atravs das
percentagens de classificaes correctas em amostras independentes (amostras de
validao) amostra que lhe deu origem (amostra de treino). Para tal, passam a ser
aplicadas as metodologias usualmente empregues em classificao de imagens (Congalton,
1991).

Ajustamento dos modelos


A cada uma das matrizes de treino foram, em primeiro lugar, ajustados modelos
univariados de modo a seleccionar as covariveis a incluir na anlise multivariada. Assim,
foram includas na anlise posterior todas as covariveis com p<0.25 no teste de Wald ou
20

2. Metodologia

cuja importncia biolgica se considerou relevante, segundo o procedimento recomendado


por Hosmer & Lemeshow (1989). Assim, todas as variveis quantitativas foram includas
na anlise multivariada. Verificou-se ainda o efeito de transformaes de cada varivel
quantitativa ( x 2,

x , ln x , x ln x ), bem como de interaces entre variveis ( x i . x j) no

ajustamento univariado.
Seguidamente, foram ajustados para cada matriz de treino modelos multivariados
atravs de processos de seleco forward e de eliminao backward das covariveis. As
variveis includas em cada um dos modelos finais, teriam de contribuir significativamente
para a reduo da deviance do modelo, estimada pela estatstica do quociente de
verosimilhanas (teste G), e o intervalo de confiana do respectivo odds ratio (taxa de
incremento do odds para cada alterao unitria da covarivel) no poderia conter o valor
unitrio (Hosmer & Lemeshow, 1989). Ajustaram-se ainda oito modelos em que se
foravam cada uma das oito covariveis com maior significado na anlise univariada a
entrar no respectivo modelo final. Os mesmos modelos foram ajustados com e sem as
variveis de localizao espacial (n da linha e n da coluna). Aps o ajustamento das
variveis verificava-se ainda o efeito de transformaes e de interaces entre covariveis;
sempre que aumentavam o poder explicativo eram includas num novo modelo final.
Este procedimento levou ao ajustamento de um grande nmero de modelos, por
forma a maximizar o leque de escolhas possveis do modelo mais adequado. Por outro
lado, a produo de vrios modelos preditivos independentes aconselhvel, uma vez que
permite avaliar a importncia relativa de cada covarivel (Gates et al., 1994). As variveis
que surgem com mais frequncia nos modelos so provavelmente as que mais determinam
a presena ou abundncia das espcies.
No processo de ajustamento dos modelos foi utilizado o programa EGRET (1991).
Os mesmos modelos finais foram posteriormente ajustados recorrendo funo glm, do
programa S-PLUS - version 3.3 for Windows (Statistical Science, 1995; Venables &
Ripley, 1997) uma vez que apresenta algumas vantagens na validao e diagnstico dos
modelos. Em ambos os programas o mtodo de estimao dos parmetros o da mxima
verosimilhana, pelo mtodo IRLS (iteratively reweighted least-squares), no se tendo
detectado qualquer diferena no resultado das estimativas.

21

2. Metodologia

Avaliao dos modelos


Na escolha do melhor modelo procurou-se avaliar os modelos atravs de uma soluo de
compromisso entre dois tipos de avaliao: (1) baseadas nas taxas de classificao; (2)
baseadas na quantificao dos desvios reais (resduos) em relao ao modelo.
Uma vez que o objectivo principal era o de extrapolar o modelo para quadrculas
no amostradas, o primeiro critrio na escolha do melhor modelo foi baseado nas taxas de
classificao da amostra de validao (Hosmer & Lemeshow, 1989). Para cada modelo
produzido foram determinadas as percentagens de quadrculas da amostra de treino bem
classificadas, ao longo de sucessivos pontos de corte (Walker, 1990, Pereira & Itami,
1991). Na determinao das taxas de classificao das quadrculas nas amostras de
validao usou-se o ponto de corte em que havia um maior equilbrio entre a percentagem
de quadrculas de presena e de ausncia da amostra de treino bem classificadas. Os
valores de probabilidade para todas as quadrculas, previstos segundo cada modelo, foram
obtidos com a funo predict.glm do S-PLUS.
Para cada amostra e para a amostra completa foram construdas matrizes de
classificao (2 x 2) em que as colunas representam as classes de presena e ausncia reais
e as linhas representam as classes presena e ausncia aps a classificao, segundo
determinado ponto de corte. Os valores includos representam o nmero de quadrculas
afectas a determinada classe relativamente categoria real da quadrcula. A partir destas
tabelas foram calculados os valores de preciso do produtor (fraco de observaes
pertencentes a determinada classe que foram correctamente classificadas) e do utilizador
(fraco de observaes afectas a uma classe e que na realidade so dessa classe). Em
deteco remota a preciso do produtor (relativa ao erro do tipo I) uma medida da
probabilidade de um pixel pertencente a determinada classe estar bem classificado, ao
passo que a preciso do utilizador (relativa ao erro do tipo II) indica a probabilidade de
uma quadrcula classificada numa imagem representar na realidade essa classe no terreno
(Congalton, 1991). A preciso do utilizador reflecte assim o grau de fiabilidade do mapa
resultante da extrapolao.
Na modelao da distribuio de Mle, cada modelo ajustado com uma das quatro
matrizes era validado separadamente com as trs matrizes restantes. Para Eor foi usada
uma matriz no ajustamento do modelo e outra na sua validao.
Para os dez modelos com as melhores precises do produtor da amostra de
validao, determinaram-se os respectivos valores de deviance (D) e da estatstica de

22

2. Metodologia

Pearson (X 2), quer para as amostras de treino quer para as amostras de validao. Para Mle
determinaram-se os valores mdios de D e X 2 entre as trs amostras de validao.
Da comparao entre estas estatsticas, ponderadas pelos graus de liberdade, e da
respectiva avaliao do significado biolgico, seleccionou-se o modelo mais adequado
para a modelao da distribuio das espcies em Portugal. Optou-se por nunca seleccionar
os modelos que incluam as variveis espaciais, uma vez que perdiam o significado
biolgico.
Diagnstico do modelo
Recorreu-se s capacidades grficas do S-PLUS (funes plot.glm e plot.gam) para efectuar
um diagnstico informal (MacCullagh & Neller, 1989) do modelo. Para avaliar a
linearidade de cada varivel com o logit ajustou-se, com as mesmas variveis do modelo
seleccionado, um modelo aditivo generalizado (Statistical Sciences, 1995; Venables &
Ripley, 1997) com a funo gam (operao de suavizao s - cubic B-splines) do S-PLUS.
Um modelo aditivo generalizado semelhante a um modelo linear generalizado, sendo,
contudo, baseado na combinao linear de diferentes funes de suavizao associadas a
cada covarivel, e no das prprias covariveis. A partir da visualizao grfica da
covarivel versus a covarivel ajustada, decidiu-se quais as transformaes de escala das
covariveis a efectuar no modelo linear (considerando, por exemplo, apenas o intervalo de
valores da varivel onde se verificava a linearidade). Se o decrscimo no deviance no
modelo

linear

era

significativo,

substituam-se

as

variveis

pelas

respectivas

transformaes.

2.3.3.3 rvores de Classificao

Os modelos baseados em rvores


As rvores de classificao fornecem uma alternativa aos modelos logsticos lineares e
aditivos em questes de classificao (Clark & Pregibon, 1992). Os modelos baseados em
rvores, segundo os mtodos S (Clark & Pregibon, 1992; Statistical Sciences, 1995;
Venables & Ripley, 1997) e a metodologia CART (Walker, 1990), so ajustados atravs
de regras de deciso, baseadas em parties binrias recursivas, dividindo a matriz de
dados em subconjuntos de crescente homogeneidade. De modo a prever a resposta y dado
23

2. Metodologia

o vector de covariveis x tem de se seguir o caminho desde a raiz, correspondente matriz


de dados inicial, at aos ns terminais, ou folhas, s quais esto associadas probabilidades
segundo as regras, ou cises, no interior dos ns. No caso da funo tree do programa SPLUS que utiliza a metodologia S, a construo da rvore continua at o nmero de casos
que chega a cada folha ser inferior a 10, ou a deviance na folha ser inferior a 1% da
deviance no n da raiz (Clark & Pregibon, 1992; Statistical Sciences, 1995; Venables &
Ripley, 1997). Nas rvores de classificao a varivel resposta nominal - por oposio s
rvores de regresso em que a varivel resposta numrica - e as covariveis podem ser
contnuas, intervalares ou nominais.
Uma das justificaes para o uso da metodologia S a de que providencia um
modelo probabilstico (Venables & Ripley, 1997). Em cada n terminal da rvore est
associada uma probabilidade pik (i - n, k - classe). Cada observao da amostra de treino
afecta a um n terminal, cada um incluindo uma amostra aleatria nik de uma distribuio
multinomial especificada por pik. As probabilidades so estimadas a partir das propores
das classe em cada n (pik = nik/ni). A deviance da rvore ento definida por:
D = Di
i

Di = 2 nik log pik ,


k

e a deviance explicada em cada separao dada por Di - Di1 - Di2 (i1 e i2 so os dois ns
gerados pelo n i).
Clark & Pregibon (1992) enumeram algumas vantagens destes modelos
relativamente aos baseados em combinaes lineares: (1) a interpretao do modelo
bastante facilitada, especialmente quando h mistura de variveis numricas e nominais;
(2) so invariantes a transformaes monotnicas das covariveis; (3) o tratamento de
valores ausentes mais satisfatrio; (4) a questo da interaco entre variveis resolvida
automaticamente. Outra vantagem a de permitirem hierarquizar as variveis explicativas
quanto escala de actuao sobre a varivel resposta (Franklin, 1998). As variveis que
operam a grandes escalas tendem a ser usadas como critrio nas primeiras parties do
modelo, ao passo que as variveis que influenciam a varivel resposta a nvel mais local
so usadas como regras de deciso perto dos ns terminais. A maior desvantagem desta
tcnica prende-se com o facto de ainda no se terem desenvolvido procedimentos formais
para a sua inferncia estatstica, o que a leva a que seja mais utilizada como uma tcnica de
anlise exploratria (Clark & Pregibon,1992).
24

2. Metodologia

Ajustamento e avaliao do modelo


Os modelos foram ajustados e avaliados com as mesmas matrizes utilizadas na regresso
logstica. Tambm neste caso os mesmos modelos foram ajustados com e sem as variveis
de localizao espacial (n da linha e n da coluna). Uma vez ajustada cada rvore,
procedia-se sua simplificao de modo a evitar o sobre-ajustamento do modelo s
amostras de treino. Esta simplificao foi realizada atravs de operaes de poda
implementadas pelo programa S-PLUS atravs das funes prune.tree e snip.tree. O nmero
ideal de ns terminais resultou de uma soluo de compromisso entre as taxas de
classificao correcta e os valores de deviance para a amostra de treino e para a amostra de
validao, tendo-se seguido o procedimento do S-PLUS (Clark & Pregibon, 1992;
Statistical Sciences, 1995) com as correces implementadas pelo mdulo Treefix de
Venables & Ripley (1997). Na avaliao da qualidade de ajustamento dos modelos as
probabilidades 1 e 0 foram substitudas respectivamente por 0.999 e 0.001, de acordo com
a recomendao de Venables & Ripley (1997), de modo a possibilitar o clculo da
deviance.
Resultaram assim dois modelos por matriz, perfazendo um total de oito modelos.
Tal como para a regresso logstica, a seleco do modelo final resultou de uma soluo de
compromisso entre os valores de deviance ponderados pelos graus de liberdade (nmero de
observaes subtrado pelo nmero de ns terminais), as taxas de classificao da amostra
de treino e das amostras de validao, a simplicidade do modelo e o seu significado
biolgico.

2.3.3.4 Comparao e integrao dos modelos

As medidas de qualidade de ajustamento dos modelos finais baseados em rvores e de


regresso logstica foram comparadas entre si com base na amostra completa. Por outro
lado, estimaram-se as medidas de qualidade de ajustamento para as quadrculas de
consenso entre os dois modelos (quadrculas afectas mesma classe por ambos os
modelos), por forma a determinar o aumento de confiana da classificao para estas
quadrculas.

25

2. Metodologia

2.3.4 Representao geogrfica dos modelos


Para representar geograficamente os modelos optou-se pela resoluo original dos mapas
das covariveis do Atlas do Ambiente de Portugal. Os mapas, aps a sua importao
atravs de um scanner, foram georeferenciados com base no sistema U.T.M. e, para cada
covarivel, os polgonos correspondentes s classes de varivel foram digitalizados
recorrendo ao programa TNTMips (Microimages, 1997). Criou-se igualmente uma camada
com informao sobre a presena/ausncia das espcies em quadrculas U.T.M. 1 x 1 km.
As camadas assim criadas foram posteriormente convertidas em formato raster e
transferidas para o programa IDRISI. Com este programa procedeu-se reclassificao das
camadas de acordo com as escalas das respectivas variveis utilizadas nos modelos, bem
como posterior representao espacial dos modelos.
Para os modelos de regresso logstica aplicaram-se directamente as frmulas dos
modelos probabilsticos s camadas das variveis includas nos modelos, dando origem a
uma superfcie de probabilidade de ocorrncia das espcies, a qual foi posteriormente
reclassificada em duas classes - ausncia e presena - de acordo com o respectivo ponto de
corte.
No caso dos modelos baseados em rvores, aplicaram-se operaes lgicas s
camadas de acordo com as regras de deciso impostas pelos modelos e as probabilidades
associadas aos ns terminais. A camada resultante com informao sobre a probabilidade
de ocorrncia da espcie foi reclassificada em duas classes de acordo com a regra de
deciso de Bayes (os pixels eram afectos classe com maior probabilidade, ou seja,
segundo um ponto de corte de 0.5).
Os mapas preditivos correspondentes aos dois tipos de modelos foram sobrepostos
de modo a determinar as reas de consenso entre os modelos, onde teoricamente o grau de
confiana da classificao maior.

26

2. Metodologia

2.4 Influncia de variveis locais


2.4.1 Matriz de dados
A modelao da influncia de variveis locais na presena e abundncia de Mle foi baseada
em 249 pontos de amostragem. Apenas se consideraram os pontos situados nas quadrculas
onde os modelos de distribuio previam a ocorrncia da espcie, de modo a evitar
misturar o efeito das variveis macro-ambientais. Devido impossibilidade de se obter
valores de abundncia suficientemente precisos em tantos pontos de amostragem, as
abundncias foram ordenadas em apenas trs nveis subjectivos: (1) ausncia, (2)
abundncia baixa a mdia e (3) abundncia elevada. Considerou-se uma abundncia
elevada para locais onde foi obtido um ndice horrio de abundncia superior a 60
indivduos/hora. Foram includas na anlise 7 variveis qualitativas e 14 variveis
quantitativas (Tabela 2.2).
As classes da varivel Tipo de habitat aqutico foram criadas de acordo com a
dominncia relativa dos sistemas riverino, palustre e lacustre - segundo definies
semelhantes s adoptadas no programa Medwet (Farinha et al., 1996) - presentes nos
pontos de amostragem. Consideraram-se assim 7 classes:
1. Riverino - cursos de gua corrente durante a maior parte do ano, com baixa ou nula
cobertura de vegetao emergente.
2. Riverino-palustre - cursos de gua corrente durante a maior parte do ano, com pequenos
troos de gua parada (pegos) com caractersticas palustres.
3. Palustre-riverino - cursos de gua que durante os meses mais secos transformam-se em
poas e charcos com caractersticas palustres.
4. Palustre - poas, audes e charcos com uma rea inferior a 8 ha e profundidade mxima
inferior a 2 metros.
5. Palustre-lacustre - lagoas e albufeiras com as margens maioritariamente ocupadas por
ambientes palustres.
6. Lacustre-palustre - lagoas e albufeiras com algumas margens ocupadas por ambientes
palustres.
7. Lacustre - lagoas e albufeiras sem ambientes palustres.
27

2. Metodologia

Tabela 2.2 Variveis locais e respectivos cdigos incluidas na anlise (* - explicao no texto)
Variveis

Classes/unidades

Cdigo

Riv, Riv-pal, pal-riv pal, pal-lac, lac-pal, lac

HABI

N, NE, E, SE, S, SW, W, NW

ORIE

Afloramento rochoso

0/1

AFLO

Cascalho

0/1

CASC

Substrato arenoso

0/1

AREN

Substrato lodoso

0/1

LODO

Largura mdia

metros

LARG

Altitude

metros

ALTI

0: 0-0.25m; 1: 0.25 - 0.5m; 2: 0.5 - 1m; 3: > 1m

PROF

Cobertura de vegetao emergente

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

EMER

Cobertura de vegetao flutuante

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

FLUT

Cobertura de vegetao imersa

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

IMER

Cobertura de extracto herbceo

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

HERB

Cobertura de extracto arbustivo

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

ARBS

Cobertura de extracto arbreo

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

ARBR

0 - nula; 1 - baixa; 2 - moderada; 3 - alta

VCOR

Turbidez da gua

0 - nula; 1 - baixa; 2 - moderada; 3 - alta

TURB

Insolao

0 - nula; 1 - baixa; 2 - moderada; 3 - alta

INSO

Variveis qualitativas nominais:


Tipo habitat aqutico*
Orientao
Variveis qualitativas de presena/ausncia:

Variveis contnuas:

Variveis ordinais
Profundidade mxima

Variveis ordinais subjectivas


Velocidade da corrente

Inclinao dominante da margem


Relevo

0: 0-25%; 1: 25-50%; 2: 50-75%; 3: 75-100%

INCL

N de curvas de nvel (100 m) num raio de 2 km

RELE

Para Eor, devido escassez de dados, apenas se efectuaram testes univariados por
forma a detectar diferenas na presena e ausncia entre esta espcie e Mle para cada
varivel considerada.
2.4.2. Anlise univariada
Para testar diferenas entre os trs nveis de abundncia de Mle relativamente a cada
varivel quantitativa foi usado o teste ANOVA de Kruskal-Wallis (Zar, 1984). No caso das
variveis qualitativas, foram realizados testes de 2 com base em tabelas de contingncia
de modo a testar se os trs nveis de abundncia estavam distribudos aleatoriamente nas
categorias das variveis.

28

2. Metodologia

2.4.3 Anlise multivariada


Ajustou-se uma rvore de classificao segundo o procedimento descrito na seco 2.3.3.3.
De forma a escolher o grau de simplificao da rvore de classificao recorreu-se s
funes prune.tree, prune.misclass e cv.tree do programa S-PLUS (Clark & Pregibon, 1992;
Statistical Sciences, 1995; Venables & Ripley, 1997). As duas primeiras funes permitem
graficar, respectivamente, a evoluo do deviance e do erro de classificao medida que
se podam os ramos terminais da rvore original. A funo cv.tree efectua uma validao
cruzada para um grau crescente de simplificao da rvore. Esta funo divide a amostra
de treino em 10 subamostras, ajusta uma rvore com base em 9 e testa-a com a dcima. O
resultado para cada nvel de simplificao a mdia das validaes das 10 rvores
possveis, cada uma validada com a amostra que sobra, e pode ser expresso em termos de
deviance ou em termos de erro de classificao (Venables & Ripley, 1997). Esta funo
serviu igualmente para validar o modelo final.
Foram ajustadas duas rvores de classificao: uma em que se consideraram todas
as variveis e outra em que apenas se considerava a influncia de caractersticas associadas
directamente aos meios aquticos.
Para cada modelo construram-se as matrizes de classificao e foram determinadas
as precises do produtor e do utilizador (Congalton, 1991).

29

3. Resultados

3 RESULTADOS
3.1 Distribuio conhecida das espcies
Na figura 3.1 esto representadas as distribuies de Mle e de Eor em Portugal. Verifica-se
que Mle muito mais comum do que Eor, possuindo-se informaes sobre a sua
ocorrncia em 340 quadrculas UTM 10 km x 10 km, correspondendo a cerca de 70% das
quadrculas amostradas. Esta espcie apresenta uma distribuio praticamente contnua a
sul do Rio Tejo. A Norte do Rio Tejo as observaes so mais dispersas, excepto na regio
de Castelo Branco/Tejo Internacional, e na regio da Beira-Alta interior e Nordeste
Transmontano, ou seja, as observaes vo-se dispersando no sentido SE para NW do pas.
No foram detectadas populaes nem encontradas informaes recentes sobre a
ocorrncia desta espcie na regio entre Douro e Minho.
Mauremys leprosa

Emys orbicularis

5
6
7
3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 34 5 6 7 8 9 0 1 2 3 4

46

45

44

43

42

41

6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0

MG

NG

PG

5
6
7
3 4 5 6 7 8 9 0 1 2 3 4 5 6 78 9 0 1 2 34 5 6 7 8 9 0 1 2 34

QG

46

MF
QF

ME

QE

MD

QD

MC

QC

MB

QB

PB

45

44

43

42

41

6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0
9
8
7
6
5
4
3
2
1
0

MG

NG

PG

QG

MF
QF

ME

QE

MD

QD

MC

QC

MB

QB

PB

Ausncias
Presenas

Figura 3.1 Presena das espcies nas quadrculas UTM decaquilomtricas (para Eor
esto representadas apenas as presenas).

31

3. Resultados

A informao sobre a ocorrncia de Eor , pelo contrrio, muito escassa e dispersa,


possuindo-se informaes sobre a sua presena em 49 quadrculas UTM 10 km x 10 km,
correspondendo a cerca de 10% das quadrculas amostradas. O padro geral de distribuio
semelhante ao de Mle, tendo uma distribuio predominantemente mediterrnea, tendo-se
no entanto detectado a sua ocorrncia na regio do Minho. Por outro lado, ao contrrio de
Mle, no foram detectadas populaes na regio da Beira-Alta interior e Nordeste
Transmontano. Excepto numa quadrcula situada no Minho, a espcie ocorre sempre em
quadrculas de ocorrncia de Mle.
Na tabela 3.1 apresentam-se os valores das medidas de raridade para as duas
espcies segundo o ndice de Raridade Global (IRG) e o ndice de Raridade Mdia Local
(IRML). Ambos os ndices so consideravelmente mais elevados para Eor, podendo por isso
considerar-se, comparativamente a Mle, como uma espcie localmente rara.
Tabela 3.1 ndices de raridade por espcie (IRG - ndice de
Raridade Global; IRML - ndice de Raridade Mdia Local)
IRG

IRML

Mauremys leprosa

0.325

-0.412

Emys orbicularis

0.892

0.276

Espcie

3.2 Modelos preditivos da distribuio


3.2.1 Mauremys leprosa
3.2.1.1 Anlise exploratria
Na tabela 3.2 encontra-se representada a matriz de correlaes para as covariveis
quantitativas da matriz de dados original. Apenas para dois pares de variveis INSO/RADS e PREC/ESCO - os valores de correlao so superiores a 0.8.

32

3. Resultados

Tabela 3.2 Matriz de correlao para as covariveis quantitativas (valores superiores a 0.80 a bold).

NORT
INSO
TEMP
PREC
HUMI
ESCO
EVAP
ALTI
ECOL
DPOP
SOLO
GEAD
RADS

EAST NORT INSO TEMP PREC HUMI ESCO EVAP ALTI ECOL DPOP SOLO GEAD
0.26
0.22
-0.72
-0.21 -0.65
0.55
-0.19
0.60
-0.73 -0.55
-0.39 -0.08 -0.09 -0.07
0.09
-0.12
0.61
-0.73 -0.56
0.06
0.95
-0.38
0.55
-0.69 -0.40
0.86
0.08
0.80
0.58
0.50
-0.33 -0.59
0.34
-0.31
0.40
0.09
-0.28 -0.61
0.52
0.67
-0.50
0.05
-0.54 -0.34 -0.66
-0.51
0.26
-0.39 -0.08
0.40
0.26
0.36
0.49
-0.26 -0.04
0.37
0.32
-0.25 -0.39
0.31
-0.11
0.37
0.09
0.58
-0.41 -0.08
0.49
0.43
-0.09 -0.33
0.08
-0.23
0.11
0.04
0.45
-0.35 -0.23
0.27
0.33
-0.72
0.46
-0.70 -0.06 -0.66 -0.75 -0.17
0.42
-0.44 -0.14 -0.17
0.83

Os resultados dos testes no paramtricos (Tabelas 3.3 A a 3.3 B) mostram que o


comportamento das covariveis quantitativas semelhante nas quatro matrizes de dados
criadas. Efectivamente, para todas as covariveis, o teste de ANOVA de Kruskal-Wallis e
o teste da mediana, separadamente para presenas e ausncias, no revelaram diferenas
significativas (p<0.05) entre as quatro matrizes. Em todas as matrizes e para a maioria das
variveis, a classe ausncia apresenta maior disperso dos dados.
Os resultados do teste de Kolmogorov-Smirnov de duas amostras revelam que em
todas as matrizes as distribuies das covariveis em cada classe da varivel resposta no
so significativamente diferentes (p<0.05) para trs variveis: ALT, SOLO e GEAD. Na
primeira (Tabela 3.2 A) e na quarta matriz (Tabela 3.2 D), no ocorrem igualmente
diferenas significativas entre as duas classes, respectivamente para a varivel TEMP e
HUMI. Nas matrizes restantes os valores de confiana para estas duas variveis so sempre
mais baixos do que para as variveis restantes.
Os testes de Mann-Whitney (Tabelas 3.3 A a 3.3 B) mostram que os locais de
presena de Mle apresentam valores mdios significativamente mais elevados (p<0.05)
para as variveis TEMP, INSO, RADS, ECOL e ESTE, e valores mdios
significativamente mais baixos para as variveis PREC, HUM, ESCO, EVAP, DPOP e
NORT. Os grficos da figura 3.2 mostram como variam a mdia e a disperso dos dados
com a ausncia e a presena da espcie para estas variveis. O mesmo teste mostra a
ausncia de diferenas significativas entre os valores mdios para as variveis ALT, SOLO
e GEAD. Para a quarta matriz, tal como o resultado do teste anterior, no se observam
igualmente diferenas significativas entre as mdias para a varivel HUMI.
33

3. Resultados

Tabela 3.3(A) Matriz 4 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do


teste de Mann-Whitney (M.-W.) para cada varivel quantitativa (SD - desvio padro).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT

Ausncias
Mdia
s
4.242
0.895
6.273
2.421
3.864
1.021
6.985
2.344
5.439
1.178
8.379
2.319
2.652
1.196
3.606
1.822
4.848
1.384
3.727
1.247
4.758
2.163
3.258
1.774
12.212
6.012
36.909
13.882

Presenas
Mdia
s
4.637
0.768
4.143
1.419
3.253
1.039
4.791
1.418
3.923
1.046
10.824
1.761
4.220
1.104
3.747
1.305
5.571
1.117
3.582
1.034
4.978
1.938
1.802
1.118
16.714
5.526
24.121
14.973

K. - S.
p
n.s.
< .001
< .010
< .001
< .001
< .001
< .001
n.s.
< .001
n.s.
n.s.
< .001
< .001
< .001

M. - W.
p
<.005
<.0001
<.0005
<.0001
<.0001
<.0001
<.0001
n.s
<.0001
n.s
n.s
<.0001
<.0001
<.0001

Tabela 3.3(B) Matriz 2 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste


de Mann-Whitney (M.-W.) para cada varivel quantitativa (s - desvio padro).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
N da coluna
N da linha

34

Ausncias
Mdia
s
4.121
0.957
6.448
2.521
3.776
0.992
7.310
2.458
5.379
1.167
8.500
2.401
2.741
1.278
3.741
2.014
4.603
1.521
3.690
1.143
4.862
2.180
3.259
1.888
12.534
6.009
36.810
14.462

Presenas
Mdia
s
4.841
0.618
3.866
1.312
3.220
1.043
4.512
1.493
3.878
1.047
11.085
1.642
4.220
1.111
3.463
1.390
5.707
1.094
3.671
1.166
4.890
1.778
1.939
1.200
15.756
5.355
22.707
13.394

K. - S.
p
< .001
< .001
< .01
< .001
< .001
< .001
< .001
n.s.
< .001
n.s.
n.s.
< .001
< .001
< .001

M. - W.
p
<.0001
<.0001
<.005
<.0001
<.0001
<.0001
<.0001
n.s.
<.0001
n.s.
n.s.
<.0001
<.0005
<.0001

3. Resultados

Tabela 3.3(C) Matriz 3 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do


teste de Mann-Whitney (M.-W.) para cada varivel quantitativa (s - desvio padro).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
N da coluna
N da linha

Ausncias
Mdia
s
4.143
0.948
6.349
2.424
3.730
1.096
7.016
2.530
5.286
1.263
8.571
2.388
2.762
1.292
3.778
1.879
4.841
1.526
3.619
1.224
4.778
2.210
3.127
1.718
12.651
5.982
37.000
14.507

Presenas
Mdia
s
4.616
0.800
4.267
1.662
3.140
0.922
4.895
1.645
3.988
1.046
10.686
1.917
4.233
1.081
3.779
1.418
5.593
1.131
3.721
1.059
5.116
1.711
1.895
1.302
16.581
5.012
24.558
14.914

K. - S.
p
< .05
< .001
< .01
< .001
< .001
< .001
< .001
n.s.
< .001
n.s.
n.s.
< .001
< .001
< .001

M. - W.
p
<.001
<.0001
<.0005
<.0001
<.0001
<.0001
<.0001
n.s.
<.0005
n.s.
n.s.
<.0001
<.0001
<.0001

Tabela 3.3(D) Matriz 4 - Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do


teste de Mann-Whitney (M.-W.) para cada varivel quantitativa (s - desvio padro).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT

Ausncias
Mdia
s
4.183
0.965
6.167
2.458
3.717
1.010
6.900
2.454
5.317
1.127
8.617
2.300
2.833
1.181
3.800
2.024
4.833
1.509
3.667
1.145
4.700
2.204
2.967
1.766
12.383
6.352
35.267
14.099

Presenas
Mdia
s
4.700
0.736
3.950
1.606
3.325
1.041
4.663
1.591
3.863
1.099
10.900
1.893
4.238
1.094
3.675
1.430
5.550
1.101
3.738
1.040
5.112
1.772
1.900
1.186
17.000
5.021
24.275
14.929

K. - S.
p
< .01
< .001
n.s.
< .001
< .001
< .001
< .001
n.s.
< .001
n.s.
n.s.
< .01
< .001
< .01

M. - W.
p
<.0005
<.0001
n.s.
<.0001
<.0001
<.0001
<.0001
n.s.
<.0005
n.s.
n.s.
<.0005
<.0001
<.0001

35

3. Resultados

Figura 3.2 Mdia Desvio padro (SD) das variveis quantitativas (testes de Mann-Whitney e
Kolmogorov-Smirnov significativos p<0.05) para cada classe. (continua na pgina seguinte).

36

3. Resultados

Figura 3.2 (continuao) Mdia Desvio padro (SD) das variveis quantitativas (testes de MannWhitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe.

Os resultados dos testes de 2 (Tabela 3.4) mostram algumas diferenas no


comportamento das covariveis qualitativas nas quatro amostras. Verifica-se, porm, para
todas as matrizes, uma preferncia significativa (p<0.01) de Mle por locais com a presena
de AZIN, CUARV, CABAV e com a ausncia de RESI e PINH. Nos grficos da figura 3.3
esto representados os histogramas por classe de presena/ausncia da espcie destas
variveis.

Tabela 3.4 Resultados dos testes de 2 (1 grau de liberdade) para cada varivel qualitativa (os valores
a bold so significativos a 99% de confiana; (+) - influncia positiva sobre a presena, (-) - influncia
negativa sobre a presena).
Variveis
FOLH
RESI
OLIV
SOBR
AZIN
CARV
PINH
EUCT
CAST
FIGU

Matriz 1
X2
p
0.97
0.325
0.000 (-)
27.56
2.43
0 .119
2.25
0.134
22.52 0.000 (+)
2.38
0.123
0.009 (-)
6.93
0.004 (-)
8.53
0.72
0.398
0.19
0.660

Matriz 2
X2
p
0.02
0.885
0.000 (-)
29.88
4.30
0 .038
1.03
0 .310
0.000 (+)
18.22
0.12
0.724
0.000 (-)
20.96
0.05
0.825
1.65
0.200
5.14
0.023

Matriz 3
X2
p
0.000
0.998
0.000 (-)
22.05
6.29
0.012
0.38
0.537
14.73 0.000 (+)
2.33
0.127
0.003 (-)
9.15
1.85
0.173
0.69
0.406
4.58
0.032

Matriz 4
X2
p
0.180
0.669
28.95 0.000 (-)
4.64
0.031
0.52
0.472
12.72 0.000 (+)
6.90 0.009 (-)
9.07 0.003 (-)
6.93 0.009 (-)
0.01
0.921
5.53
0.019

37

3. Resultados

Cont.
MEDR
ALFA
AMEN
CUARV
CARBS
CARBR
CAVAB
CABAV
INCT
SAL

X2
0.19
3.75
2.32
14.15
2.32
1.61
1.65
20.29
3.30
0.73

p
0.660
0 .053
0.128
0.000 (+)
0.128
0.204
0.199
0.000 (+)
0.069
0.393

X2
0.46
3.64
2.93
10.44
5.34
3.84
3.67
17.59
3.56
0.71

p
0.499
0 .056
0.087
0.001 (+)
0.021
0.050
0.056
0.000 (+)
0.059
0.399

X2
0.75
4.58
3.07
15.49
1.59
4.70
1.05
11.29
3.43
0.50

p
0.388
0.032
0.080
0.000 (+)
0.207
0.030
0.305
0.001 (+)
0.064
0.478

X2
0.09
4.75
3.19
10.77
13.17
6.35
3.19
11.25
1.01
0.76

p
0.770
0.029
0.074
0.001 (+)
0.000 (-)
0.012
0.074
0.001 (+)
0.315
0.385

Figura 3.3 Histogramas das variveis qualitativas (testes 2 significativos a p<0.05) para cada classe.

38

3. Resultados

3.2.1.2 Regresso logstica


Anlise univariada
Os resultados da regresso logstica univariada (Tabela 3.5) no divergem do padro geral
descrito atrs para os testes no paramtricos. A partir destes resultados foram
seleccionadas as variveis a entrar na anlise multivariada, estando as variveis excludas
representadas a bold na tabela 3.5. Note-se que as variveis excludas no foram as
mesmas para as diferentes matrizes.

Tabela 3.5 Resultado da regresso logstica univariada para cada matriz de dados (LRS - decrscimo do
Deviance em relao ao modelo nulo, p(G) - resultado do teste G, p(t) - resultado do teste de Wald; * - no se
alcanou a convergncia no clculo dos parmetros).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT
FOLH
RESI
OLIV
SOBR
AZIN
CARV
PINH
EUCT
CAST
FIGU
MEDR
ALFA
AMEN
CUARV

Matriz 1

Matriz 2

Matriz 3

Matriz 4

LRS

p(G)

p(t)

LRS

p(G)

p(t)

LRS

p(G)

p(t)

LRS

8.506
41.79
12.95
45.80
59.65
47.38
57.46
0.32
12.75
0.64
0.46
34.06
21.81
26.64
0.98
28.02
2.48
6.30
24.66
2.35
6.87
8.53
0.71
0.20
0.20
4.39
2.64
14.38

0.004
<.001
<.001
<.001
<.001
<.001
<.001
0.569
<.001
0.424
0.500
<.001
<.001
<.001
0.321
<.001
0.115
0.043
<.001
0.125
0.009
0.004
0.401
0.656
0.656
0.036
0.104
<.001

0.005
<.001
<.001
<.001
<.001
<.001
<.001
0.570
<.001
0.425
0.501
<.001
<.001
<.001
0.327
<.001
0.122
0.136
<.001
0.139
0.010
0.004
0.403
0.661
0.661
0.087
0.163
<.001

26.34
50.64
9.83
55.72
51.53
46.61
44.03
0.94
23.30
0.01
0.01
22.60
10.76
30.53
0.02
30.45
4.41
1.05
20.01
0.123
21.59
0.049
1.62
6.16
0.49
4.28
3.39
10.58

<.001
<.001
0.002
<.001
<.001
<.001
<.001
0.332
<.001
0.923
0.933
<.001
0.001
<.001
0.886
<.001
0.036
0.306
<.001
0.726
<.001
0.825
0.203
0.013
0.486
0.039
0.066
0.001

<.001
<.001
0.003
<.001
<.001
<.001
<.001
0.333
<.001
0.923
0.933
<.001
0.002
<.001
0.885
<.001
0.040
0.312
<.001
0.725
<.001
0.825
0.219
0.052
0.508
0.091
0.123
0.001

10.46
34.06
12.33
33.86
41.45
31.83
47.16
0.00
11.62
0.30
1.12
22.36
17.88
23.62
0.00
22.28
6.47
0.39
15.94
2.31
9.11
6.90
0.68
5.42
0.74
5.42
3.55
15.83

0.001
<.001
<.001
<.001
<.001
<.001
<.001
0.997
<.001
0.585
0.289
<.001
<.001
<.001
1.000
<.001
0.011
0.535
<.001
0.128
0.003
0.009
0.409
0.020
0.390
0.020
0.059
<.001

0.002
<.001
<.001
<.001
<.001
<.001
<.001
0.996
0.002
0.585
0.293
<.001
<.001
<.001
0.998
<.001
0.013
0.537
<.001
0.142
0.003
0.009
0.411
0.064
0.407
0.064
0.116
<.001

12.33
36.36
4.972
37.28
48.98
35.92
44.17
0.19
10.30
0.15
1.52
16.84
21.15
18.08
0.18
29.65
4.76
0.52
13.66
7.35
9.07
6.94
0.01

p(G)

<.001
<.001
0.026
<.001
<.001
<.001
<.001
0.667
0.001
0.701
0.217
<.001
<.001
<.001
0.668
<.001
0.029
0.470
<.001
0.007
0.003
0.008
0.921
*
0.09 0.771
5.60 0.018
3.68 0.055
10.87 <.001

p(t)
0.001
<.001
0.030
<.001
<.001
<.001
<.001
0.667
0.003
0.701
0.221
<.001
<.001
<.001
0.670
<.001
0.033
0.473
<.001
0.030
0.004
0.009
0.921
0.770
0.060
0.110
0.001

39

3. Resultados

Cont.
CARBS
CARBR
CAVAB
CABAV
INCT
SAL

2.29
1.62
1.84
22.18
3.28

0.130
0.202
0.175
<.001
0.70
*

0.132 5.27 0.022


0.205 3.90 0.048
0.230
*
<.001 18.75 <.001
0.71 3.51 0.061
*

0.025
0.051

1.57
4.75
1.15
<.001 11.96
0.063 3.40
0.53

0.210
0.029
0.284
<.001
0.065
0.465

0.211 13.92 <.001 0.002


0.031 6.45 0.011 0.013
0.328 3.68 0.055 0.110
0.001 11.88 <.001 0.001
0.067 1.00 0.317 0.316
*
0.489

Anlise multivariada
Foram ajustados um total de 41 modelos, incluindo modelos com as variveis de
localizao (ESTE e NORT), com transformaes das variveis e com interaces entre
variveis. Na tabela 3.6 esto representadas as frequncias e a relao das covariveis com
a varivel resposta ajustada, incluindo as transformaes e interaces, nos 41 modelos de
regresso. As variveis mais importantes na ocorrncia da espcie, tendo em conta a sua
frequncia nos modelos e a sua frequncia em relao s matrizes de treino que deram
origem aos modelos, so o escoamento (ESCO), a humidade relativa do ar (HUMI), a
radiao solar (RADS) e as variveis de localizao (ESTE e NORT). Entre as variveis
qualitativas, a varivel olival (OLIV) a que surge com maior frequncia. A interaco
entre covariveis mais frequente nos modelos a interaco entre a humidade e o
escoamento (HUMI*ESCO).

Tabela 3.6 Frequncia total, frequncia em relao s quatro matrizes de treino e relao das covariveis
com a varivel resposta ajustada.
Covarivel
ESCO
HUM
RADS
ESTE
NORT
SOLO
EVAP
PREC
INSO
GEAD
ECOL
DPOP
OLIV
EUC

40

Frequncia
18
16
10
10
10
9
7
6
3
3
2
2
12
9

N de matrizes Relao positiva Relao negativa


9
4
9
3
9
4
9
4
9
4
9
2
9
3
9
2
9
2
9
1
9
1
9
1
9
2
9
1

3. Resultados

Cont.
CARBS
PINH
FIG
CARV
(HUMI)2
ln(RADS)
ln(ESCO)
(EVAP)2
ln(ESTE)
(ECOL)2
HUMI*ESCO
RADS*GEAD
ln(RADS)*GEAD
PREC*RADS
HUMI*EVAP
HUMI*SOLO
INSO*ECOL
ALT*SOLO
ESTE*NORT

7
3
2
1
9
7
6
4
2
1
4
2
1
1
1
1
1
1
1

2
1
1
1
2
3
2
2
1
1
3
1
1
1
1
1
1
1
1

9
9
9
9
9

9
9
9
9
9
9
9
9
9
9
9
9
9
9

Os dez modelos com menores erros de classificao da amostra de validao esto


representados na tabela 3.7, por ordem decrescente da preciso de classificao. Para todos
os modelos o ponto de corte de 0.6 foi o que produziu taxas de classificao da amostra de
treino mais equilibradas, pelo que se utilizou este valor para determinar os valores de
preciso de classificao das amostras de validao. A maioria dos modelos tm origem
nas amostras de treino 3 e 4, excepto o primeiro que tem origem na amostra de treino 1. A
varivel ESCO e respectiva transformao a mais frequente, estando presente em oito dos
dez modelos. Seis dos modelos possuem as variveis espaciais ESTE e NORT. As
variveis HUMI e RADS e respectivas transformaes surgem em quatro modelos.

41

3. Resultados

Tabela 3.7 Os dez modelos com menores erros de classificao da amostra de validao.
Modelo

Matriz

Frmula

0 +1(PREC) + 2(HUMI) + 3(ESCO) + 4(EVAP) + 5(RADS)

0 + 1(ESTE) + 2(NORT) + 3(OLI) + 4(PINH)

0 + 1(NORT*ESTE) + 2(ESTE) + 3(EVAP)

0 + 1(ESCO) + 2(ESTE) + 3(NORT) + 4(OLIV)

0 + 1(PREC) + 2(HUMI) + 3(ESCO) + 4(RADS) + 5(SOLO) + 6(GEAD) + 7(FIGU)

0 + 1(ln(ESCO)) + 2(DPOP) + 3(ln(EAST)) + 4(NORT) + 5 (CARV)

0 + 1(PREC) + 2(HUMI)2 + 3(ESCO) + 4(ln(RADS)) + 5(SOLO) + 6(GEAD) + 7(FIGU)

0 + 1(ln(ESCO)) + 2(ln(ESTE)) + 3(NORT)

0 +1(ESCO) + 2(HUMI)2 + 3(HUMI*SOLO) + 4(ln(RADS)) + 5(OLIV)

10

0 + 1(ESCO) + 2(ESTE) + 3(NORT)

Seleco do modelo final


Na Figura 3.4 apresentam-se as percentagens de classificaes correctas para um ponto de
corte de 0.6 e as estatsticas Deviance, para a amostra de treino e para a amostra de
validao. Os valores de deviance e da estatstica de Pearson da amostra de treino, bem
como o valor tabelado de 2, apresentam-se na tabela 3.8.
O modelo 6 apresenta as precises de classificao mais elevadas e possui o menor
valor de D para a amostra de treino (Figura 3.4). Porm, a estatstica de Pearson no
significativa (X2 < 2 0.001; Tabela 3.10) e apresenta os maiores valores mdios de D e de
X2 (ponderados pelos respectivos graus de liberdade) para as amostras de validao (Figura
3.6).
O modelo 10 apresenta simultaneamente os valores mdios mais baixos de D para
as amostras de validao (Figura 3.4). No entanto, apresenta menores valores mdios de
preciso de classificao da amostra de validao, as precises de classificao da amostra
de treino so tambm relativamente baixas e o respectivo valor de D ponderado pelos graus
de liberdade o mais elevado (Figura 3.4).
Os modelos 2, 3 e 4 so os que apresentam valores mais equilibrados entre as
amostras de treino e de validao, no que se refere aos valores de preciso da classificao
e aos valores de D (Figura 3.4). Estes trs modelos incluem, no entanto, as variveis
espaciais (ESTE e NORT), possuindo assim um significado biolgico pouco preciso.
O modelo 1, para alm de possuir as melhores precises de classificao das
amostras de validao, apresenta simultaneamente valores de preciso da classificao da
amostra de treino comparativamente elevados e valores de D da amostra de treino e das

42

3. Resultados

amostras de validao relativamente baixos (Figura 3.4). Por outro lado, inclui as cinco
variveis macroclimticas que surgiram com maior frequncia nos modelos. Tendo em
considerao estas caractersticas e ao facto de possuir um razovel significado biolgico,
considerou-se este modelo como o mais adequado para a modelao da distribuio da

86

1.2

84

1.0

82

0.8

80

0.6

78

0.4

D / g. l.

% de classificaes correctas

espcie.

T.c. - validao
76

0.2

T.c. - treino
D/g.l. - validao

74

0.0
1

D/g.l. - treino

10

Modelos
Figura 3.4 Comparao entre as taxas de classificao (colunas) e os valores ponderados de deviance
(linhas) da amostra de treino e das amostras de validao.

Tabela 3.8 Valores das estatsticas deviance e de Pearson


(g. l. - graus de liberdade)
Modelo

g. l.

2 0.001

X2

151

210.57

121.61

162.21

144

202.31

126.81

187.29

136

192.82

117.13

178.94

135

191.63

114.74

168.24

141

198.75

122.61

127.62

134

190.44

103.55

213.67

141

198.75

119.37

126.17

136

192.82

113.76

126.94

143

201.12

125.07

139.07

10

136

192.82

119.25

131.95

43

3. Resultados

Diagnstico e aperfeioamento do modelo


Na tabela 3.9 apresenta-se o sumrio do modelo seleccionado, incluindo os resultados dos
testes t aos parmetros, os valores do odds ratio e os respectivos intervalos de confiana.

Tabela 3.9 Sumrio dos resultados do ajustamento do modelo 1 (LRS - teste G ou estatstica do quociente de
verosimilhanas; s -desvio padro).
Deviance = 121.613 (para 151 g.l.)
Termos

LRS = 92.037
Intervalo de confiana

Coeficientes

Odds ratio

3.627

1.708

2.123

0.034

37.600

1.316

1075

1.164

0.411

2.828

0.005

3.201

1.428

7.18

(HUMI)

-0.125

0.037

-3.425

<0.001

0.882

0.821

0.948

ESCO

-1.061

0.344

-3.086

0.002

0.346

0.176

0.680

-0.163

0.048

-3.384

<0.001

0.850

0.773

0.934

0.607

0.241

2.517

0.012

1.835

1.143

2.946

PREC
2

(EVAP)
RADS

Na figura 3.5 encontra-se representada a relao de cada varivel com a respectiva


varivel ajustada, aps o ajustamento de um modelo aditivo generalizado com as variveis
do modelo 1. Verifica-se que para a varivel PREC ocorre um desvio considervel
linearidade. Entre as classes 2 e 7 a relao linear positiva e a partir da classe 7 a relao
torna-se linear negativa. Para as restantes variveis os desvios so claramente menores. Os
testes parciais includos no sumrio do modelo aditivo generalizado (Tabela 3.10) indicamnos a importncia da suavizao para cada termo no modelo. Os testes so significativos
apenas para as variveis PREC e ESCO.
Tendo em conta este diagnstico, efectuaram-se transformaes das duas variveis
de modo a tornar a relao o mais linear possvel, e testou-se o seu efeito no modelo
logstico. Para a varivel PREC consideraram-se apenas as classes de 1 a 7, uma vez que a
maioria das observaes se situavam neste intervalo, tendo as observaes includas nas
classes de 8 a 13 sido afectas classe 7. Para a varivel ESCO efectuou-se uma
transformao polinomial. A transformao da varivel PREC originou um decrscimo de
cerca de trs valores no deviance da amostra de treino e um ligeiro aumento no valor
mdio da taxa de classificao das amostras de validao. A transformao da varivel
ESCO apenas teve um efeito significativo no modelo logstico quando se ajustou um
polinmio de quarto grau. Uma vez que tal procedimento aumentava demasiado a
complexidade do modelo optou-se por no transformar esta varivel.
44

3. Resultados

Figura 3.5 Relao entre cada varivel includa no modelo 1 e a respectiva varivel ajustada
com um modelo aditivo generalizado.

Tabela 3.10 - Sumrio do modelo aditivo generalizado (s - funo de


suavizao, g. l. - graus de liberdade, LRS - teste G ou estatstica de
quociente de verosimilhanas).
Deviance = 105.954 (para 136.535 g. l.) LRS = 107.696
Variveis

g. l.

Teste 2

s(PREC)

3.0

11.541

0.009

s(HUMID2)

2.9

0.644

0.873

s(ESCOA)

3.0

11.050

0.011

s(EVAP2)

2.7

1.564

0.611

s(RADSOL)

2.9

0.623

0.885

O modelo final
Na tabela 3.11 apresenta-se o sumrio do resultado do ajustamento do modelo 1 aps o reescalonamento da varivel. Relativamente ao modelo anterior verifica-se um decrscimo
de 3.22 valores do deviance e um acrscimo de 0.391 no valor de t para a varivel PREC.
Os coeficientes e os respectivos valores de t das restantes variveis mantiveram-se
idnticos.

45

3. Resultados

Neste modelo, as covariveis PREC e RADS possuem um efeito positivo na


ocorrncia da espcie, ao passo que a (HUMI)2, o ESCO e a (EVAP)2 possuem um efeito
negativo. A PREC e o ESCO so as que provocam uma maior variao na probabilidade de
ocorrncia por cada mudana unitria.

Tabela 3.11 Sumrio dos resultados do ajustamento do modelo 1 aps o re-escalonamento da varivel PREC
(LRS - teste G ou estatstica do quociente de verosimilhanas; s -desvio padro).
Deviance = 118.392 (para 151 g.l.)
Termos
0

LRS = 95.259

Coeficientes

Odds ratio

3.314

1.728

1.918

0.057

27.530

Intervalo de confiana
0.912

830.8

PREC

1.359

0.422

3.219

0.001

3.894

1.692

8.958

(HUMI)2

-0.126

0.037

-3.402

<0.001

0.882

0.820

0.949

ESCO

-1.090

0.336

-3.247

0.001

0.336

0.173

2.885

-0.176

0.049

-3.601

<0.001

0.839

0.761

0.924

0.579

0.244

2.374

0.018

1.785

1.104

2.885

(EVAP)
RADS

Na figura 3.6 est representada a variao das precises de classificao da amostra


completa para pontos de corte sucessivamente maiores. Tal como para os modelos
anteriores, o ponto de corte de 0.6 o que origina um maior equilbrio entre as
percentagens de quadrculas de presena e de ausncia bem classificadas.
Na tabela 3.12 apresentam-se as medidas de qualidade de ajustamento do modelo
para o melhor ponto de corte incluindo as precises do produtor e do utilizador e os valores
absolutos e ponderados de deviance e de X

de Pearson. O modelo classifica

correctamente 80.72% do total de quadrculas amostradas e as quadrculas afectas a uma


das classes esto em mdia 80.22% bem classificadas. Quer em termos da preciso do
produtor quer em termos da preciso do utilizador o modelo classifica consideravelmente
melhor as quadrculas de presena.

46

3. Resultados

Preciso do produtor (%)

A
100
90
80
70
60
50
40
30
20

Total
Presenas
Ausncias

10
0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.7

0.8

0.9

Pontos de corte

B
Preciso do utilizador (%)

100
90
80
70
Mdia

60

Presenas
50

Ausncias

40
0

0.1

0.2

0.3

0.4

0.5

0.6

Pontos de corte

Figura 3.6 Preciso de classificao da amostra completa para cada ponto de corte. A preciso do produtor; B - preciso do utilizador

Tabela 3.12 Medidas de qualidade de ajustamento do modelo para um ponto de corte de 0.6 (Aus.
- ausncias; Pres. - presenas; * - valores mdios).
Modelo

D/g.l.

X2

X2/g.l.

118.39

0.78

153.83

1.02

76.69* 83.14* 79.92*

133.03* 0.97*

80.24*

1.76*

76.80

517.47

875.99

1.51

Preciso do produtor

Preciso do utilizador

Aus.

Pres.

Total

Aus.

Pres.

Mdia

Amostra de
treino

80.60

83.52

82.28

77.94

85.39

81.67

Amostra de
validao

76.87* 82.77* 80.28*

Amostra
total

77.73

82.89

80.72

83.63

80.22

0.89

47

3. Resultados

Os grficos de diagnstico do modelo (Figura 3.7), mostram que os outliers mais


importantes correspondem a quadrculas de ausncia da espcie, o que justifica os menores
valores de percentagem de quadrculas correctamente classificadas obtidos para esta classe.

Figura 3.7 Grficos de diagnstico da regresso logstica

3.2.1.3 rvores de classificao


Na tabela 3.13 apresentam-se as variveis e o nmero de ns terminais dos oito modelos
resultantes, numerados por ordem decrescente do valor mdio da preciso de classificao
das amostras de validao. Os modelos 3 e 4 so os que apresentam simultaneamente
menor nmero de variveis e de ns terminais. As variveis EVAP e RADS so as mais
frequentes, estando presentes em cinco dos oito modelos. As variveis HUMI e ESTE
surgem em quatro modelos, a DPOP e a NORT em trs, a ESCO, a PREC e a ECOL em
dois..
Tabela 3.13 As oito rvores de classificao resultantes por ordem decrescente do valor mdio dos erros de
classificao das amostras de validao.
Matriz

N de ns terminais

Variveis includas na rvore

PREC, EVAP, ESTE, NORT

HUMI, EVAP, ESCO, RADS, ALTI, SOLO, CUARV

PREC, HUMI, RADS, ECOL

EVAP, ESTE, NORT

TEMP, EVAP, RADS, GEAD, RESI, CARBR

HUMI, RADS, DPOP, ESTE, OLI, CARBS

HUMI, EVAP, ESCO, ECOL, DPOP

RADS, DPOP, ESTE, NORT, FOL

Modelo

48

3. Resultados

Por forma a facilitar as comparaes esto representadas na figura 3.4 as


percentagens totais de classificaes correctas (preciso total) e os valores do deviance
ponderados pelos graus de liberdade.
No que se refere amostra de treino o modelo 2 o que possui simultaneamente
maiores valores de preciso de classificao e menores valores de deviance ponderado
pelos graus de liberdade (Figura 3.8). No entanto, o modelo mais complexo (Tabela 3.13)
e no que se refere s amostras de validao possui um valor mdio de deviance
relativamente elevado (Figura 3.8).
O modelo 1 o que apresenta globalmente as melhores medidas de qualidade de
ajustamento simultaneamente para a amostra de treino e para as amostras de validao
(Figura 3.8). Este modelo no foi seleccionado uma vez que inclui as variveis espaciais
ESTE e NORT, sendo por isso limitado do ponto de vista da sua interpretao ecolgica.
Assim, considerou-se o modelo 3 como o mais adequado uma vez que apresenta
medidas de qualidade de ajustamento bastante equilibradas entre a amostra de treino e as
amostras de validao (Figura 3.8). Por outro lado um modelo simples, com quatro

88

1.8

86

1.6
1.4

84

1.2

82

1.0
80
0.8
78

D / g. l.

% de classificaes correctas

variveis e 5 ns terminais, e possui um razovel significado biolgico.

0.6

76

0.4

T.c. - validao
T.c. - treino

74

0.2

D/g.l. - validao

72

0.0

D/g.l. - treino

Modelo
Figura 3.8 Comparao entre as precises de classificao (colunas) e os valores ponderados de
deviance (linhas) da amostra de treino e das amostras de validao.

49

3. Resultados

Na figura 3.9 est representada a rvore de classificao referente ao modelo 3 com


a estrutura interna apresentada na tabela 3.14. Segundo o modelo a espcie ocorre para
valores de RADS superiores ou iguais a 3 (145Kcal/km2) e valores de PREC inferiores ou
iguais a 3 (500-600 mm), ou para valores de PREC superiores ou iguais a 4 (600-700mm)
e valores de HUMI inferiores ou iguais a 3 (70-75%) e classes de ECOL superiores ou
iguais

(desde

regio

Sub-Montano

Termo-Subatlntico

regio

Psamo/Eolo/Aluvio/Halo - Mediterrnico).
Note-se que o espaamento entre os nveis proporcional importncia do
respectivo n. Assim, a separao com maior significado introduzida pela varivel
RADS, dando origem ao primeiro n terminal (ausncia) com uma probabilidade de erro
apenas de 0.09 (Tabela 3.14). Os ns terminais com maior probabilidade de erro so o
terceiro e o quinto, respectivamente com probabilidades de 0.333 e 0.307, correspondendo
ambos resposta ausncia. Os dois ns terminais correspondentes resposta presena
possuem probabilidades de erro relativamente baixas (0.105 e 0.152). Deste modo, as
maiores probabilidades de erro deste modelo resultam da classificao como ausncia
das quadrculas em que a radiao solar toma valores superiores classe 2.

Figura 3.9 rvore de classificao seleccionada.

50

3. Resultados

Tabela 3.14 Estrutura interna da rvore de classificao seleccionada (n - n de


observaes; D - deviance; * - ns terminais; os nmeros dos ns
correspondem aos nmeros da rvore original, antes de se proceder sua
simplificao).
N

Resposta

Probabilidades

1) raiz 149 203.000 presena ( 0.4228, 0.5772 )


2) RADS<2.5 33

20.110 ausncia ( 0.9091, 0.0909 ) *

3) RADS>2.5 116 138.500 presena ( 0.2845, 0.7155 )


6) PREC<3.5 38

25.570 presena ( 0.1053, 0.8947 ) *

7) PREC>3.5 78 102.900 presena ( 0.3718, 0.6282 )


14) HUMI<3.5 52
28) ECOL<3.5

53.660 presena ( 0.2115, 0.7885 )


6 7.638 ausncia ( 0.6667, 0.3333 ) *

29) ECOL>3.5 46 39.230 presena ( 0.1522, 0.8478 ) *


15) HUMI>3.5 26 32.100 ausncia ( 0.6923, 0.3077 ) *

Na tabela 3.15 apresentam-se as medidas de qualidade de ajustamento do modelo


incluindo as precises do produtor e do utilizador, os valores de deviance e respectivos
valores ponderados pelos graus de liberdade. O modelo classifica correctamente 80.72%
do total de quadrculas amostradas e as quadrculas afectas a uma das classes esto em
mdia 80.29% bem classificadas. Em termos da preciso do produtor o modelo classifica
ligeiramente melhor as quadrculas de ausncia. A preciso do utilizador no entanto
consideravelmente superior para as quadrculas de presena.

Tabela 3.15 Medidas de qualidade de ajustamento do modelo para um ponto de


corte de 0.5 (Aus. - ausncias; Pres. - presenas; * - valores mdios).
Modelo

D/g.l.

80.31

124.65

0.87

85.33

78.95

136.84

0.97

85.76

80.29

535.16

0.92

Preciso do produtor

Preciso do utilizador

Aus.

Pres.

Total

Aus.

Pres.

Mdia

Amostra de
treino

82.54

84.88

83.89

73.31

87.01

Amostra de
validao

81.41

78.26

79.58

72.57

Amostra
completa

81.78

79.94

80.72

74.81

51

3. Resultados

3.2.1.4 Comparao e integrao dos dois modelos


Os melhores modelos de distribuio de Mle segundo os duas abordagens estatsticas
adoptadas - rvores de classificao e regresso logstica - apresentam em comum a
incluso de trs covariveis: RADS, PREC e HUM. Para alm destas covariveis a rvore
de classificao inclui ainda a covarivel ECOL e o modelo de regresso logstica inclui
ainda as covariveis ESCO e EVAP.
Na figura 3.10 apresentam-se os valores de preciso do ponto de vista do produtor
para a amostra original, segundo os dois modelos de distribuio. A preciso total igual
para os dois modelos (80.72%), mas no modelo de regresso logstica, ao contrrio do que
sucede para a rvore de classificao, as quadrculas de presena so melhor classificadas
do que as de ausncia. Por outro lado, para a rvore de classificao verifica-se um maior
equilbrio entre as quadrculas de presena e de ausncia bem classsificadas.

84
Preciso do produtor (%)

82
80
Ausncia

78

Presena

76

Total

74
72
70
rvore de
classificao

Regresso
logstica

Figura 3.10 Preciso de classificao do ponto de vista do produtor das


quadrculas de ausncia, de presena e do total da amostra original.

Do ponto de vista do utilizador (Figura 3.11), a preciso mdia de classificao dos


dois modelos resulta muito idntica (80.29% para a rvore de classificao e 80.22% para
o modelo de regresso logstica). Segundo ambos os modelos, a preciso do utilizador
maior para as quadrculas de presena. Para o modelo de regresso logstica h, no entanto,
um maior equilbrio entre a preciso para as quadrculas de ausncia e a preciso para as
quadrculas de presena.

52

3. Resultados

Em termos das medidas de qualidade de ajustamento baseadas nos resduos, o


modelo de regresso logstica apresenta menores valores de deviance residual para a
amostra original (rvore de classificao: D = 535.16; Regresso logstica: D = 517.47).

88
Preciso do utilizador (%)

86
84
82
Ausncia

80

Presena

78

Mdia

76
74
72
70
rvore de
classificao

Regresso
logstica

Figura 3.11 Preciso de classificao do ponto de vista do utilizador das


quadrculas de ausncia e de presena da amostra original e respectiva mdia.

Cerca de 83% das quadrculas da amostra original foram classificadas de igual


modo pela rvore de classificao e pelo modelo de regresso logstica. Por outro lado,
cerca de 72% das quadrculas foram simultaneamente bem classificadas pelos dois
modelos.
Na tabela 3.16 apresentam-se as precises de classificao da amostra completa
considerando apenas as quadrculas de consenso entre os dois modelos. H um aumento de
confiana de 6.32% do ponto de vista do produtor em relao aos modelos considerados
separadamente avaliados com a amostra completa de quadrculas. Do ponto de vista do
utilizador esse aumento de 6.30% em relao preciso da rvore de classificao e de
6.37% em relao ao modelo de regresso logstica. Por outro lado, existe para estas
quadrculas um maior equilbrio entre as precises de classificao para ausncias e
presenas. Os valores de deviance ponderados pelos graus de liberdade para estas
quadrculas apresentam um decrscimo de 0.18 e de 0.16 valores em relao aos valores
obtidos, respectivamente, com a rvore de classificao e com o modelo de regresso
logstica para o total de quadrculas amostradas.

53

3. Resultados

Tabela 3.16 Medidas de qualidade de ajustamento do modelo para as quadrculas de consenso entre
os modelos.
Precises de classificao

Deviance dos resduos

Preciso do produtor

Preciso do utilizador

Aus.

Pres.

Total

Aus.

Pres.

Mdia

D/g.l.

D/g.l.

86.21

87.63

87.04

83.33

89.86

86.59

355.27

0.74

349.27

0.73

54

rvore de classificao

Regresso logstica

3. Resultados

3.2.2 Emys orbicularis


3.2.2.1 Anlise exploratria
Os resultados dos testes de Kolmogorov-Smirnov e dos testes de Mann-Whitney (Tabela
3.17) mostram que no ocorrem diferenas significativas (p<0.05) entre as duas classes,
respectivamente, nas distribuies e valores mdios das covariveis HUMI, ALTI, SOLO e
GEAD. Os grficos da figura 3.12 mostram como variam a mdia e a disperso dos dados
com a ausncia e a presena da espcie para as variveis onde se verificaram diferenas
significativas.
Tabela 3.17 Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de
Mann-Whitney (M.-W.) para cada varivel quantitativa (s - desvio padro).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT

Ausncias
Mdia
s
4.167
0.930
6.208
2.501
4.000
0.899
6.875
2.481
5.396
1.267
8.375
2.321
2.604
1.198
3.542
1.901
4.729
1.469
3.729
1.216
4.792
2.163
3.208
1.762
12.250
6.296
36.771
14.227

Presenas
Mdia
s
4.767
0.504
3.433
1.569
3.867
1.008
3.967
1.650
3.667
1.322
11.433
1.888
4.767
1.278
2.767
1.382
6.100
1.029
3.267
1.285
4.167
1.877
1.767
1.501
15.400
5.506
17.367
11.657

K. - S.
p
< 0.05
< 0.001
n.s.
< 0.001
< 0.001
< 0.001
< 0.001
n.s.
< 0.001
n.s.
n.s.
< 0.01
< 0.01
< 0.001

M. - W.
p
<0.005
<0.0001
n.s.
<0.0001
<0.0001
<0.0001
<0.0001
n.s.
<0.0001
n.s.
n.s.
<0.0005
<0.05
<0.0001

Figura 3.12 Mdia Desvio padro (SD) das variveis quantitativas (testes de Mann-Whitney e
Kolmogorov-Smirnov significativos p<0.05) para cada classe. (continua na pgina seguinte).

55

3. Resultados

Figura 3.12 (continuao) Mdia Desvio padro (SD) das variveis quantitativas (testes de MannWhitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe.

Quanto s variveis quantitativas verifica-se uma preferncia significativa (p<0.01)


de Eor por locais com a presena de AZIN, CUARV, CABAV e com a ausncia de RESI e

56

3. Resultados

CARBS (Tabela 18). Nos grficos da figura 3.13 esto representados os histogramas por
classe de presena/ausncia da espcie destas variveis.
2
Tabela 3.18 Resultados dos testes de (1 grau de
liberdade) para cada varivel qualitativa (os valores a bold
so significativos a 99% de confiana; (+) - influncia
positiva sobre a presena, (-) - influncia negativa sobre a
presena).
Variveis

X2 (1 g.l.)

FOLH
RESI
OLIV
SOBR
AZIN
CARV
PINH
EUCT
CAST
FIGU
MEDR
ALFA
AMEN
CUARV
CARBS
CARBR
CAVAB
CABAV
INCT
SAL

0.390
20.850
0.240
0.390
15.350
1.300
3.980
4.150
0.03
2.380
1.280
3.280
3.280
7.800
7.170
0.150
0.630
15.170
2.650
1.620

0.532
<0.000 (-)
0.626
0.532
<0.000 (+)
0.253
0.046
0.042
0.852
0.123
0 .257
0.070
0.070
0.005 (+)
0.007 (-)
0.698
0.426
<0.000 (+)
0.103
0.203

Figura 3.13 Histogramas das variveis qualitativas (testes 2 significativos a p<0.05) para cada classe.

57

3. Resultados

Figura 3.13 (continuao) Histogramas das variveis qualitativas (testes 2 significativos a p<0.05)
para cada classe.

3.2.2.2 Regresso logstica


Analise univariada
Na tabela 3.19 apresentam-se os resultados da regresso logstica univariada para cada
covarivel. O padro encontrado idntico ao obtido com os testes no paramtricos,
excepto para seis variveis qualitativas em que a convergncia do algoritmo no foi
possvel. Todas as variveis quantitativas e nove variveis qualitativas foram seleccionadas
partida para o ajustamento dos modelos multivariados (Tabela 3.19).

58

3. Resultados

Tabela 3.19 Resultado da regresso logstica univariada


(LRS - decrscimo do Deviance em relao ao modelo nulo,
p(G) - resultado do teste G, p(t) - resultado do teste de Wald;
* - no se alcanou a convergncia no clculo dos
parmetros; valores a bold - variveis excludas da anlise
multivariada).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT
FOLH
RESI
OLIV
SOBR
AZIN
CARV
PINH
EUCT
CAST
FIGU
MEDR
ALFA
AMEN
CUARV
CARBS
CARBR
CAVAB
CABAV
INCT
SAL

LRS
11.55
29.30
0.38
31.58
27.82
30.64
39.87
3.84
21.51
2.54
1.74
13.60
4.96
31.287
0.38
23.26
0.24
0.40
15.36
1.46
4.34
4.27
0.04
2.33

7.97
0.15
15.14
2.76

p(G)
p<.001
p<.001
0.539
p<.001
p<.001
p<.001
p<.001
0.050
p<.001
0.111
0.187
p<.001
0.026
p<.001
0.536
p<.001
0.628
0.527
p<.001
0.227
0.037
0.039
0.851
0.127
*
*
*
0.005
*
0.699
*
p<.001
0.097
*

p(t)
0.005
p<.001
0.540
p<.001
p<.001
p<.001
p<.001
0.062
p<.001
0.115
0.196
0.001
0.031
p<.001
0.534
p<.001
0.626
0.534
p<.001
0.278
0.056
0.045
0.853
0.161

0.006
0.698
p<.001
0.108

Analise multivariada
Para esta espcie foram obtidos nove modelos possveis, incluindo modelos com as
variveis de localizao (ESTE e NORT), com transformaes das variveis e com
interaces entre variveis. Para todos os modelos o melhor ponto de corte foi de 0.4. Na
tabela 3.20 apresentam-se as frequncias com que surgem as covariveis nos modelos e a
respectiva relao com os valores esperados da varivel resposta. O termo mais frequente
nos modelos a transformao logartmica de ALTI, que aparece em cinco dos nove
modelos, tendo uma relao negativa com a probabilidade de presena da espcie. As
covariveis no transformadas mais frequentes so a RADS e o NORT, surgindo em trs
59

3. Resultados

dos nove modelos, estando relacionadas, respectivamente, positiva e negativamente com a


probabilidade de ocorrncia da espcie.
Tabela 3.20 Frequncia nos modelos e relao das covariveis com o valor
esperado da varivel resposta.
Covarivel
RADS
NORT
ESTE
ESCO
ALTI
RESI
AZI
Ln(ALT)
(RADS)2
Ln(ESTE)
ESCO*RADS
RADS*Ln(ALTI)
NORT*ESTE

Frequncia
3
3
2
1
1
1
1
5
1
1
1
1
1

Relao positiva Relao negativa


9
9
9
9
9
9
9
9
9
9
9
9
9

Os modelos obtidos encontram-se esquematizados na tabela 3.21, por ordem


decrescente dos erros de classificao da amostra de validao. Todos os modelos so
muito simples, com duas a trs covariveis. As variveis espaciais surgem em quatro dos
nove modelos.

Tabela 3.21 Os nove modelos por ordem decrescente dos erros de


classificao da amostra de validao.
Modelo

Frmula

0 +1(RADS) + 2(ESCO)

0 + 1(NORT) + 2(AZI)

0 + 1(ESTE) + 2(NORT*ESTE) + 3(ln(ALTI))

0 + 1(RADS) + 2(ESCO*RADS)

0 + 1(ln(ESTE)) + 2(NORT) + 3(ln(ALTI))

0 + 1(ESTE) + 2(NORT) + 3(ALTI)

0 + 1(RADS)2 + 2(ln(ALTI)) + 3(RES)

0 + 1(RADS*ln(ALTI)) + 2(ln(ALTI)) + 3(RES)

0 + 1(RADS) + 2(Ln(ALTI)

60

3. Resultados

Seleco do modelo final


Quanto s medidas de qualidade de ajustamento do modelo (Figura 3.14), os modelos 3 e 5
so os que apresentam globalmente os melhores valores, quer para a amostra de treino,
quer para a amostra de validao. Porm, estes modelos contm as variveis espaciais, no
tendo por isso sido seleccionados. O modelo 1 o que melhor classifica a amostra de
validao, mas, no entanto, o resultado do teste X

de Pearson para este modelo no

resultou significativo (X2 < 20.001; Tabela 3.22). O modelo 4, resultante da substituio no
modelo 1 da varivel ESCO pela interaco ESCO*RADS, um modelo com medidas
equilibradas entre as duas amostras e possui um significado biolgico razovel, pelo que
foi escolhido como o mais adequado modelao da distribuio desta espcie.

1.0
0.9

88

0.8

86

0.7

84

0.6

82

0.5
0.4

80

0.3

78
76
74
1

D / g. l.

% de classificaes correctas

90

T.c. - validao

0.2

T.c. - treino

0.1

D/g.l. - validao

0.0

D/g.l. - treino

Modelos
Figura 3.14 Comparao entre as taxas de classificao (colunas) e os valores ponderados de
deviance (linhas) da amostra de treino e da amostra de validao.

61

3. Resultados

Tabela 3.22 Valores das estatsticas deviance e de Pearson


(g. l. - graus de liberdade)
Modelo

g. l.

2 0.001

X2

76

119.91

59.74

283.20

76

119.91

61.60

112.10

75

118.65

50.68

75.00

76

119.91

56.02

94.92

75

118.65

51.10

68.28

75

118.65

54.97

76.51

75

118.65

55.12

69.07

75

118.65

53.79

62.25

76

119.91

59.35

70.81

Diagnstico do modelo
Na tabela 3.23 apresentam-se os resultados do ajustamento do modelo 4, incluindo os
valores dos coeficientes, testes t, os odds ratio e os respectivos intervalos de confiana.
Neste modelo, a covarivel RADS apresenta um efeito positivo muito acentuado na
ocorrncia da espcie, ao passo que a interaco entre ESCO e RADS possui um efeito
negativo e pouco acentuado.

Tabela 3.23 Sumrio dos resultados do ajustamento do modelo 4 (LRS - teste G ou estatstica do quociente
de verosimilhanas; s -desvio padro).
Deviance = 56.021 (para 75 g.l.)
Termos

LRS = 47.919
Intervalo de confiana

Coeficientes

Odds ratio

-3.597

1.189

-3.025

0.003

0.027

0.003

0.282

RADS

1.880

0.427

4.407

<0.001

6.554

2.837

15.140

ESCO*RADS

-0.213

0.084

-2.555

0.011

0.808

0.686

0.952

Na figura 3.15 est representada a variao das precises de classificao correctas


da amostra completa, para pontos de corte sucessivamente mais elevados. O ponto de corte
de 0.4 o que produz um maior equilbrio entre as percentagens de quadrculas de
presena e de ausncia bem classificadas.

62

3. Resultados

A
100
Preciso do produtor (%)

90
80
70
60
50
40

Total

30

Presenas

20

Ausncias

10
0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Pontos de corte

Preciso do utilizador (%)

100
90
80
70

Mdia
Presenas

60

Ausncias
50
40
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Pontos de corte

Figura 3.15 Preciso de classificao da amostra completa para cada ponto de corte. A preciso do produtor; B - preciso do utilizador

Na tabela 3.24 apresentam-se os valores de preciso do produtor e do utilizador e os


valores absolutos e ponderados de deviance para a amostra de treino, para a de validao e
para a amostra completa. A rvore classifica correctamente 84.48 % do total de quadrculas
e em mdia 84.04% das quadrculas afectas a uma das classes esto bem classificadas. Em
termos de preciso do produtor da amostra completa o modelo tende a classificar
ligeiramente melhor as quadrculas de ausncia. A preciso do utilizador no entanto
superior para as quadrculas de presena.

63

3. Resultados

Tabela 3.24 Medidas de qualidade de ajustamento do modelo para um ponto de corte de 0.6 (Aus.
- ausncias; Pres. - presenas).
Modelo

Preciso do produtor

Preciso do utilizador

Aus.

Pres.

D/g.l.

X2

X2/g.l.

Total

Aus.

Pres.

Mdia

Amostra de
treino

85.42 83.33 84.62

78.13

89.13

83.63

56.02

0.74

94.92

1.25

Amostra de
validao

84.21 84.21 84.21

84.21 84.21 86.55

23.14

0.66

19.03

0.54

Amostra
completa

85.07

80.39

79.16

0.70

113.95

1.01

83.67

84.48

87.69

84.04

Na figura 3.16 est representada a relao de cada varivel com a respectiva


varivel ajustada, aps o ajustamento de um modelo aditivo generalizado com as variveis
includas no modelo 4. Verifica-se um desvio linearidade mais acentuado na covarivel
RADS, confirmado pelo resultado dos testes estatsticos do modelo aditivo (Tabela 3.25).
Porm, verificou-se que o re-escalonamento da varivel no provocava um acrscimo
significativo das medidas de qualidade de ajustamento do modelo.

Figura 3.16 Relao entre cada varivel includa no modelo 4 e a respectiva varivel
ajustada com um modelo aditivo generalizado.

Tabela 3.25 Sumrio do modelo aditivo generalizado (s - funo de


suavizao, g. l. - graus de liberdade, LRS - teste G ou estatstica de
quociente de verosimilhanas).
Deviance = 47.707 (para 69.457 g. l.) LRS = 56.232
Variveis

g. l.

Teste 2

s(RADS)

2.8

6.291

0.082

s(ESCO*RADS)

2.8

2.274

0.477

64

3. Resultados

Os grficos de diagnstico do modelo (Figura 3.17), mostram que os outliers mais


importantes correspondem a quadrculas de presena da espcie, o que justifica os menores
valores de percentagem de quadrculas correctamente classificadas obtidos para esta classe.

Figura 3.17 Grficos de diagnstico da regresso logstica

3.2.2.3 rvores de classificao


Para esta espcie foi obtido apenas um modelo, uma vez que para ambas as
matrizes de treino (com e sem as variveis ESTE e NORT), aps as operaes de poda,
as rvores resultaram iguais. O modelo resultante inclui as variveis RADS, ESCO e
ECOL e possui 4 ns terminais (Figura 3.18).
Segundo o modelo a espcie ocorre para valores de RADS superiores ou iguais a 4
(150-155 kcal/cm2) e valores de ESCO inferiores ou iguais a 3 (50-100mm) ou para
valores de ESCO superiores ou iguais a 4 (100-150mm) e classes de ECOL superiores ou
iguais a 6 (apenas regies mediterrnicas).
A covarivel mais importante na discriminao das classes a RADS, dando
origem a um n terminal de ausncia com uma probabilidade de erro apenas de 0.075
(Tabela 3.26). De seguida a covarivel ESCO d origem a um n terminal de presena
com uma probabilidade de erro nula (Tabela 3.26). Por fim, a covarivel ECOL origina
dois ns terminais, um de ausncia e um de presena, ambos com uma probabilidade
de erro de 0.2857 (Tabela 3.26).

65

3. Resultados

Figura 3.18 rvore de classificao.


Tabela 3.26 Estrutura interna da rvore de classificao (n - n de observaes;
D - deviance; * - ns terminais; os nmeros dos ns correspondem aos
nmeros da rvore original, antes de se proceder sua simplificao).
N

1) raiz

78

D
103.900

Resposta

Probabilidades

ausncia

( 0.6154, 0.3846 )

2) RADSOL<3.5

40

21.310

ausncia

( 0.9250, 0.0750 ) *

3) RADSOL>3.5

38

45.730

presena

( 0.2895, 0.7105 )

6) ESCOA<3.5

10

0.000

presena

( 0.0000, 1.0000 ) *

7) ESCOA>3.5

28

37.520

presena

( 0.3929, 0.6071 )

14) ECOL<5.5

8.376

ausncia

( 0.7143, 0.2857 ) *

15) ECOL>5.5

21 25.130

presena

( 0.2857, 0.7143 ) *

Na tabela 3.27 apresentam-se os valores de preciso do produtor e do utilizador e os


valores absolutos e ponderados de deviance, respectivamente, para as amostras de treino,
validao e completa. A rvore classifica correctamente 84.48 % do total de quadrculas e
em mdia 84.07% das quadrculas afectas a uma das classes esto bem classificadas. Em
termos de preciso do produtor da amostra completa, as quadrculas de presena so
ligeiramente melhor classificadas do que as de ausncia. A preciso do utilizador no
entanto superior para as quadrculas de ausncia.

66

3. Resultados

Tabela 3.27 Medidas de qualidade de ajustamento do modelo para um ponto de


corte de 0.5 (Aus. - ausncias; Pres. - presenas).
Modelo

D/g.l.

82.39

54.83

0.74

80.65

85.00

29.66

0.87

79.25

84.07

84.49

0.75

Preciso do produtor

Preciso do utilizador

Aus.

Total

Aus.

Pres.

Mdia

Amostra de
treino

87.50 83.33 85.90

87.50

77.27

Amostra de
validao

73.68 89.47 81.58

89.36

Amostra
completa

83.58

88.89

Pres.

85.71

84.48

3.2.2.4 Comparao e integrao dos modelos


Os melhores modelos de distribuio de Eor segundo os duas abordagens estatsticas
adoptadas - rvores de classificao e regresso logstica - apresentam em comum a
incluso de duas covariveis: RADS e ESCOA. Segundo ambos os modelos estas variveis
interagem entre si no seu efeito sobre a presena da espcie. A rvore de classificao
inclui ainda a covarivel ECOL.
Na figura 3.19 apresentam-se os valores de preciso do ponto de vista do produtor
para a amostra completa, segundo os dois modelos de distribuio de Eor. A preciso total
igual para os dois modelos (84.48%), mas para a rvore de classificao, ao contrrio do
que sucede para o modelo de regresso logstica, as quadrculas de presena so melhor
classificadas do que as de ausncia. Por outro lado, para o modelo de regresso logstica
verifica-se um maior equilbrio entre as quadrculas de presena e de ausncia bem
classsificadas.

67

3. Resultados

86
Preciso do produtor (%)

85.5
85
84.5

Ausncia

84

Presena
Total

83.5
83
82.5
82
rvore de
classificao

Regresso
logstica

Figura 3.19 Preciso de classificao do ponto de vista do produtor das


quadrculas de ausncia, de presena e do total da amostra original.

Do ponto de vista do utilizador (Figura 3.20), a preciso mdia de classificao dos


dois modelos resulta muito idntica (84.07% para a rvore de classificao e 80.04% para
o modelo de regresso logstica). Ao passo que para a rvore de classificao a preciso do
utilizador mais elevada na classificao das quadrculas de ausncia, para a regresso
logstica mais elevada na classificao das quadrculas de presena. Para o modelo de
regresso logstica h um maior equilbrio entre a preciso para as ausncias e a preciso
para as presenas.
Em termos das medidas de qualidade de ajustamento baseadas nos resduos, o
modelo de regresso logstica apresenta menores valores de deviance residual para a
amostra original (rvore de classificao: D = 84.49; Regresso logstica: D = 76.16).

90
Preciso do utilizador (%)

88
86
84

Ausncia

82

Presena

80

Total

78
76
74
rvore de
classificao

Regresso
logstica

Figura 3.20 Preciso de classificao do ponto de vista do utilizador das


quadrculas de ausncia e de presena da amostra original e respectiva mdia.

68

3. Resultados

Cerca de 90% das quadrculas da amostra completa foram classificadas de igual


modo pela rvore de classificao e pelo modelo de regresso logstica. Por outro lado,
cerca de 79% das quadrculas foram simultaneamente bem classificadas pelos dois
modelos.
Na tabela 3.28 apresentam-se as precises de classificao da amostra completa
considerando apenas as quadrculas de consenso entre os dois modelos. H um aumento de
confiana de 3.98% do ponto de vista do produtor em relao aos modelos considerados
separadamente, avaliados com a amostra completa de quadrculas. Do ponto de vista do
utilizador esse aumento de 4.39% em relao preciso da rvore de classificao e de
4.42% em relao ao modelo de regresso logstica. Os valores de deviance ponderados
pelos graus de liberdade para estas quadrculas apresentam um decrscimo de 0.12 e de 0.1
valores em relao aos valores obtidos, respectivamente, com a rvore de classificao e
com o modelo de regresso logstica para o total de quadrculas amostradas.
Tabela 3.28 Medidas de qualidade de ajustamento do modelo para as quadrculas de consenso entre
os modelos.
Precises de classificao

Deviance dos resduos

Preciso do produtor

Preciso do utilizador

rvore de classificao

Regresso logstica

Aus.

Pres.

Total

Aus.

Pres.

Mdia

D/g.l.

D/g.l.

90.32

85.71

88.46

90.32

85.71

88.46

65.42

0.63

62.41

0.60

69

3. Resultados

3.3 Comparao entre a distribuio de Mauremys leprosa e de


Emys orbicularis
O resultado do teste de Kolmogorov-Smirnov para duas amostras (Tabela 3.29) revela a
ocorrncia de diferenas significativas (p<0.05) entre as duas classes (presena das duas
espcies e presena apenas de Mle) nas distribuies de seis covariveis quantitativas:
PREC, HUMI, ESCO, RADS, ALTI e NORT. Segundo o teste de Mann-Whitney (Tabela
3.29) ocorrem diferenas significativas (p<0.05) entre os valores mdios das duas classes
em mais duas covariveis: INSO e ECOL. As diferenas mais significativas verificam-se
nas covariveis ESCO e ALTI (p<0.0005).
Os grficos da figura 3.21 mostram como variam a mdia e a disperso dos dados
com a ausncia e a presena da espcie para as variveis onde se verificaram diferenas
significativas. Nas quadrculas onde surgem as duas espcies os valores de HUMI e RADS
so tendencialmente mais elevados e os de PREC, ESCO, ALTI e NORT tendencialmente
mais baixos.
Tabela 3.29 Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de MannWhitney (M.-W.) para cada varivel quantitativa (s - desvio padro).
Variveis
TEMP
PREC
HUMI
ESCO
EVAP
INSO
RADS
ALTI
ECOL
SOLO
GEAD
DPOP
ESTE
NORT

70

M. l.
Mdia
s
4.571
0.850
4.446
1.413
3.107
0.966
5.071
1.333
4.054
1.017
10.446
1.877
4.036
1.095
3.946
1.257
5.393
1.139
3.625
1.019
5.125
1.779
1.875
1.096
17.000
5.474
27.179
14.890

M. l. / E. o.
Mdia
s
4.767
0.504
3.433
1.569
3.867
1.008
3.967
1.650
3.667
1.322
11.433
1.888
4.767
1.278
2.767
1.382
6.100
1.029
3.267
1.285
4.167
1.877
1.767
1.501
15.400
5.506
17.367
11.657

K. - S.
p
n.s.
<0.05
<0.05
<0.05
n.s.
n.s.
<0.05
<0.05
n.s.
n.s.
n.s.
n.s.
n.s.
<0.05

M. - W.
p
n.s.
<0.005
<0.005
<0.0005
n.s.
<0.05
<0.005
<0.0005
<0.05
n.s.
n.s.
n.s.
n.s.
<0.005

3. Resultados

Figura 3.21 Mdia Desvio padro (SD) das variveis quantitativas (testes de Mann-Whitney e
Kolmogorov-Smirnov significativos p<0.05) para cada classe. (continua na pgina seguinte).

Figura 3.21 (continuao) Mdia Desvio padro (SD) das variveis quantitativas (testes de MannWhitney e Kolmogorov-Smirnov significativos p<0.05) para cada classe.

71

3. Resultados

No que se refere s covariveis qualitativas, no se observa uma influncia


significativa (p<0.01) de nenhuma das variveis consideradas (Tabela 3.30).

2
Tabela 3.30 Resultados dos testes de (1 grau de
liberdade) para cada varivel qualitativa (os valores a bold
so significativos a 99% de confiana; (+) - influncia
positiva sobre a presena de ambas as espcies, (-) influncia negativa sobre a presena de ambas as espcies).
Variveis

X2 (1 g.l.)

FOLH
RESI
OLIV
SOBR
AZIN
CARV
PINH
EUCT
CAST
FIGU
MEDR
ALFA
AMEN
CUARV
CARBS
CARBR
CAVAB
CABAV
INCT
SAL

0.750
1.330
1.790
3.070
2.380
0.210
1.330
0.480
0.520
1.470
1.670
0.060
1.380
2.180
5.380
1.040
1.670
0.400
0.470
1.890

0.385
0.248
0.182
0.080
0.123
0.650
0.248
0.489
0.472
0.225
0.197
0.805
0.240
0.140
0.020
0.309
0 .197
0.526
0.494
0.169

72

3. Resultados

3.4 Representao geogrfica dos modelos


3.4.1 Mauremys leprosa
Modelos probabilsticos
Nas figuras 3.22 A e B esto representadas as superfcies de probabilidade de ocorrncia
de Mle em Portugal segundo, respectivamente, o modelo de regresso logstica e o modelo
baseado em rvores de classificao. Em ambos os modelos as probabilidades de
ocorrncia da espcie mais elevadas situam-se nas regies do Alentejo, Algarve, Beira
Interior e Nordeste Transmontano. Note-se que modelo baseado em rvores de
classificao (Figura 3.22 B) bastante mais simples, gerando apenas cinco nveis de
probabilidade, correspondentes ao nmero de ns terminais da rvore.
A

Figura 3.22 Superfcie de probabilidade de ocorrncia de Mle. A - Regresso logstica; B - rvore de


classificao.

73

3. Resultados

Para simplificar a representao do modelo de regresso logstica (Figura 3.23)


consideraram-se trs nveis de acordo com a relao entre as probabilidades (pontos de
corte) e as medidas de preciso do utilizador (ver seco 3.2.1.2, figura 3.6, pg.47): (1)
zona com uma preciso de classificao de ausncias superior a 90% (aproximadamente
para probabilidades de ocorrncia inferiores a 0.2), (2) zona de confuso (precises
inferiores a 90%) e (3) zona com uma preciso de classificao de presenas superior a
90% (aproximadamente para probabilidades de ocorrncia superiores a 0.8)

Figura 3.23 Modelo de regresso logstica segundo nveis de preciso do utilizador.

74

3. Resultados

Modelos determinsticos
Quando se agrupam os nveis de probabilidade em classes de presena/ausncia segundo os
melhores pontos de corte, originam-se os mapas das figuras 3.24 A e B , respeitantes ao
modelo de regresso logstica e ao modelo baseado em rvores de classificao,
respectivamente. Nestes mapas esto representados tambm os locais de ocorrncia
conhecidos para a espcie, de modo a permitir uma avaliao visual dos modelos. Verificase que segundo o modelo de regresso logstica a rea correspondente classe de presena
(71.2% da rea total) consideravelmente superior mesma rea segundo o modelo
baseado em rvores de classificao (51% da rea total).

Figura 3.24 Representao espacial dos modelos e locais de ocorrncia de Mle (assinalados a branco).
A - Regresso logstica; B - rvore de classificao.

75

3. Resultados

Integrao dos modelos


A figura 3.25 resulta da sobreposio dos mapas preditivos segundo os dois modelos
originando 3 tipos de reas: duas reas classificadas como ausncia e como presena por
ambos os modelos (reas de consenso) e uma rea onde os resultados da classificao
foram diferentes para os dois modelos (rea de discordncia).

Figura 3.25 Sobreposio dos mapas resultantes dos dois modelos (os locais de
ocorrncia esto assinalados a branco).

76

3. Resultados

3.4.2 Emys orbicularis


Modelos probabilsticos
As superfcies de probabilidade de ocorrncia de Eor esto representadas nas figuras 3.26
A e B. Segundo ambos os modelos a maioria do territrio, principalmente a Norte do Tejo,
possui baixas probabilidades de ocorrncia da espcie. Os modelos tm algumas
semelhanas entre si, diferindo sobretudo na sua complexidade. Para ambos os modelos as
maiores probabilidades de ocorrncia situam-se principalmente nas zonas de plancie
alentejana e costa algarvia, e as mais baixas situam-se a Norte do Tejo, nas serras algarvias
(Serras do Caldeiro, de Monchique e de Espinhao de Co) e alentejanas (Serras do
Cercal, de Grndola e de Monfurado).
A

Figura 3.26 Superfcie de probabilidade de ocorrncia de Eor. A - Regresso logstica; B - rvore de


classificao.

77

3. Resultados

Na figura 3.27 est representado o mapa simplificado relativo ao modelo de


regresso logstica. Consideraram-se trs nveis de acordo com a relao entre as
probabilidades (pontos de corte) e as medidas de preciso do utilizador (ver seco 3.2.2.2,
figura 3.15, pg. 63): (1) zona com uma preciso de classificao de ausncias superior a
90% (aproximadamente para probabilidades de ocorrncia inferiores a 0.3), (2) zona de
confuso (precises inferiores a 90%) e (3) zona com uma preciso de classificao de
presenas superior a 90% (aproximadamente para probabilidades de ocorrncia superiores
a 0.7).

Figura 3.27 Modelo de regresso logstica segundo nveis de preciso do utilizador.

78

3. Resultados

Modelos determinsticos
Nas figuras 3.28 A e B esto representados os mapas preditivos da distribuio de Eor
segundo, respectivamente, o modelo de regresso logstica e o modelo baseado em rvores
de classificao. Tambm se encontram assinalados os locais conhecidos de ocorrncia. A
rea de distribuio potencial da espcie no difere muito entre os dois modelos,
representando 35,7 % da rea total para o modelo baseado em rvores de classificao e
34,3% da rea total para o modelo de regresso logstica. Ambos os modelos classificaram
erradamente como ausncia alguns locais com populaes conhecidas, tais como o Paul
da Tornada (Caldas da Rainha, Estremadura) e as Lagoas do Prado (Vila Verde, Minho).

Figura 3.28 Representao espacial dos modelos e locais de ocorrncia de Eor (assinalados a branco). A
- Regresso logstica; B - rvore de classificao.

79

3. Resultados

Integrao dos modelos


Na figura 3.29 esto representadas as reas de consenso e de discordncia entre os
modelos. Para esta espcie a rea de discordncia resultou relativamente pequena.

Figura 3.29 Sobreposio dos mapas resultantes dos dois modelos


(os locais de ocorrncia esto assinalados a branco).

80

3. Resultados

3.5 Influncia de variveis locais


3.5.1 Mauremys leprosa
3.5.1.1 Anlise univariada
Os testes ANOVA de Kruskal-Wallis (Tabela 3.31) mostram que ocorrem diferenas
significativas (p<0.01) entre os nveis de abundncia para nove variveis quantitativas:
LARG, PROF, VCOR, INSO, EMER, IMER, HERB, ARBS e ARBR. Os grficos da
figura 3.30 mostram como variam a mdia e a disperso dos dados com os nveis de
abundncia para estas variveis. A abundncia de cgados parece assim estar
positivamente relacionada com a profundidade, a insolao, a cobertura de vegetao
emergente e imersa, e negativamente relacionada com a velocidade da corrente, o grau de
cobertura de vegetao herbcea, arbustiva e arbrea da margem. A largura em mdia
superior e tem, simultaneamente, maior variao nos pontos onde se observaram nveis
intermdios de abundncia.

Tabela 3.31 Resultados dos testes ANOVA de Kruskal-Wallis para cada varivel
quantitativa. (+) - influncia positiva na presena da espcie; (-) - influncia negativa
sobre a presena da espcie; (n.s.) - resultado no significativo a 99% de confiana.
Variveis
ALTI
RELE
LARG
PROF
VCOR
TURB
INSO
INCL
EMER
FLUT
IMER
HERB
ARBS
ARBR

Rank

Teste de Kruskal-Wallis

ausncia

mdia

alta

8465.5
9591.5
7222
6544
10961
8005.5
7809
8084
7050.5
8879
7462.5
10520
10897.5
11477

18828
17820.5
19359.5
19827
17582
18896.5
18137
19112.5
18316.5
17838.5
17983.5
17389.5
16169
17110

3831.5
3713
4543.5
4754
2582
4223
5179
3928.5
5758
4407.5
5679
3215.5
39.68.5
2538

1.611
1.662
12.487
25.343
28.319
4.079
14.163
5.286
34.531
2.940
27.702
11.890
17.326
33.182

0.447 (n.s.)
0.436 (n.s.)
0.002 (+)
<0.000 (+)
<0.000 (-)
0.130 (n.s.)
0.001 (+)
0.071 (n.s)
<0.000 (+)
0.230 (n.s.)
<0.000 (+)
0.003 (-)
<0.000 (-)
<0.000 (-)

81

3. Resultados

Figura 3.30 Mdia Desvio padro (SD) das variveis quantitativas (testes de Kruskal-Wallis
significativos p<0.05) para cada classe. (continua na pgina seguinte).

82

3. Resultados

Figura 3.30 (continuao) Mdia Desvio padro (SD) das variveis quantitativas (testes de KruskalWallis significativos p<0.05) para cada classe.

Quanto s variveis qualitativas, os testes de 2 (Tabela 3.32) mostram que as


variveis EOR, ORIE, HABI, e AFLO apresentam uma influncia significativa (p<0.01) na
abundncia da espcie. Nos grficos da figura 3.31 esto representados os histogramas por
nvel de abundncia para estas variveis. O nvel de abundncia da espcie parece estar
positivamente relacionado com a presena de Eor, com a presena de habitats palustre e
palustre-riverino e com a presena de substrato rochoso. A influncia da orientao
dominante no clara devido ao elevado nmero de classes.
2
Tabela 3.32 Resultados dos testes de para cada varivel qualitativa. g. l.
- graus de liberdade; (+) - influncia positiva na abundncia da espcie; (-) influncia negativa sobre a abundncia da espcie; (n.s.) - resultado no
significativo a 99% de confiana.
Variveis

g. l.

X2

EOR
ORIE
HABI
AFLO
CASC
AREN
LODO

2
14
12
1
1
1
1

30.619
36.697
129.576
10.233
1.082
6.630
0.329

<0.000 (+)
0.001
<0.000
0.006 (+)
0.582 (n.s.)
0.036 (n.s.)
0.848 (n.s.)

83

3. Resultados

2
Figura 3.31 Histogramas das variveis qualitativas (testes de significativos p<0.01) para cada classe.

3.5.1.2 Anlise multivariada


Modelo completo
O resultado do ajustamento da rvore de classificao em que todas as variveis foram
inicialmente consideradas na anlise (Figura 3.32) sugere que, para os diferentes tipos de
habitat considerados, diferentes variveis associadas aos habitats aquticos influenciam a
abundncia das espcies. Com efeito, as duas separaes principais so introduzidas pela
varivel HABI, dando origem a trs grupos de habitats: (1) habitats palustre, palustrelacustre e palustre-riverino; (2) habitat riverino; e (3) habitats lacustre, lacustre-palustre e
riverino-palustre.
Segundo este modelo, no primeiro grupo de habitats a abundncia das espcie alta
ou mdia. Neste grupo as variveis EMER e PROF so as mais importantes na separao
entre os nveis mdio e alto de abundncia; as maiores abundncias verificam-se para
maiores percentagens de cobertura de vegetao emergente (25% a 100%) ou para nveis
de profundidade intermdios (0.5 a 1 m).

84

3. Resultados

Nos habitats riverinos a espcie ou no ocorre ou surge com nveis intermdios de


abundncia. As variveis PROF, IMER e HERB so as que mais determinam a presena ou
ausncia da espcie neste tipo de habitats; a espcie ocorre quando o nvel de profundidade
superior a 0.25 m, quando a percentagem de cobertura de vegetao imersa superior a
50% ou quando a percentagem de cobertura de vegetao herbcea na margem inferior a
25%.
No terceiro grupo de habitats a espcie surge com abundncias intermdias ou
altas. Neste grupo as variveis ARBR e INSO so as mais importantes na separao entre
os nveis mdio e alto de abundncia; as maiores abundncias verificam-se para
percentagens de cobertura arbrea superiores a 50% e para nveis de insolao superiores a
2.
Na tabela 3.23 apresenta-se a estrutura interna da rvore de classificao que inclui
o nmero de casos, os valores de deviance e as probabilidades associadas a cada classe em
cada n. Cerca de 65% das observaes no primeiro grupo de habitats foram classificadas
no nvel de abundncia alta, 54% das observaes do segundo grupo foram classificadas
no nvel ausncia, e 92% das observaes no terceiro grupo foram classificadas no nvel
mdia. A partir das probabilidades associadas aos ns terminais foi possvel determinar a
preciso mdia de classificao da rvore para cada um dos trs grupos de habitats. Assim,
para o primeiro grupo de habitats a probabilidade mdia de classificaes correctas de
81.65%, para o segundo grupo de 83.02% e para o terceiro grupo de 67.36%.

Figura 3.32 rvore de classificao aps as operaes de poda.

85

3. Resultados

Tabela 3.33 Estrutura interna da rvore de classificao seleccionada (n - n de


observaes; D - deviance; * - ns terminais; os nmeros dos ns
correspondem aos nmeros da rvore original, antes de se proceder sua
simplificao).
N

1) raiz 249

Resposta

466.80

Probabilidades (alta ausncia mdia)

mdia

( 0.1285 0.2892 0.5823)

2) HABITATS:pal,pal/lac,pal/riv 49
4) EMER<1.5

32

53.15

8) PROF<3.5 20

alta

(0.0500 0.4500 0.5000)

5.00

mdia

(0.2000 0.8000 0.0000) *

alta

(0.0000 0.3333 0.6667) *

6.88 mdia

5) EMER>1.5 17 15.09 alta


84

(0.0833 0.9167 0.0000) *

(0.0588 0.0588 0.8824) *

3) HABITATS:lac,lac/pal,riv,riv/pal
6) HABITATS:riv

(0.5102 0.0612 0.4286)

(0.0625 0.6250 0.3125)

17) PROF>2.5 15 19.10


9) PROF>3.5 12

alta

mdia

34.23

16) PROF<2.5 5

85.99

123.20

200

312.30

ausncia

mdia

(0.3450 0.6200 0.0350)

(0.5833 0.4048 0.0119)

12) PROF<1.5 23 13.59 ausncia

(0.9130 0.0870 0.0000) *

13) PROF>1.5 61 93.12

(0.4590 0.5246 0.0164)

mdia

26) IMER<1.5 55 84.78 ausncia


52) HERB<0.5 10

(0.5091 0.4727 0.0182)

6.50 mdia

(0.1000 0.9000 0.0000) *

53) HERB>0.5 45 68.30 ausncia

(0.6000 0.3778 0.0222)

106) LARG<3.5 22 28.59 ausncia

(0.7727 0.1818 0.0455) *

107) LARG>3.5 23 31.49

(0.4348 0.5652 0.0000) *

27) IMER>1.5

0.00 mdia

mdia

(0.0000 1.0000 0.0000) *

7) HABITATS:lac,lac/pal,riv/pal 116 151.50 mdia

(0.1724 0.7759 0.0517)

14) ARBR<1.5 60 39.42

mdia

(0.0667 0.9167 0.0167) *

15) ARBR>1.5 56 97.15

mdia

(0.2857 0.6250 0.0893)

30) INSOL<2.5 47 67.77 mdia

(0.3191 0.6596 0.0213) *

31) INSOL>2.5

(0.1111 0.4444 0.4444) *

17.37

alta

As medidas de qualidade de ajustamento do modelo apresentam-se na tabela 3.34.


O modelo classificou correctamente 77.5% dos pontos de amostragem com um valor
ponderado de deviance de 1.1. A validao cruzada resultou numa mdia de cerca de 70%
de classificaes correctas e um valor mdio ponderado de deviance de 1.9.

86

3. Resultados

Tabela 3.34 Medidas de qualidade de ajustamento do modelo amostra de


treino e segundo a validao cruzada (D - deviance; g.l. - graus de liberdade =
237).
Preciso total (%)

D / g.l.

Amostra de treino

77.51

258.962

1.088

Validao cruzada

69.88

445.436

1.879

Os resultados da matriz de confuso esto representados graficamente na figura


3.33. Do ponto de vista da preciso do produtor (n de observaes pertencentes a
determinada classe que foram correctamente classificadas) cerca de 53% das observaes
correspondentes ao nvel ausncia, 89% correspondentes ao nvel mdia e 91%
correspondentes ao nvel alta foram correctamente classificadas. Do ponto de vista da
preciso do utilizador (n de observaes afectas a uma classe e que na realidade so dessa
classe) cerca de 83% das observaes classificadas como ausncia, 79% classificadas
como mdia e 73% classificadas como alta, pertenciam realmente a essas classes.
Tanto do ponto de vista do produtor como do utilizador verificou-se um nmero
maior de trocas entre os nveis de abundncia ausncia e mdia e entre os nveis mdia e
alta do que entre os nveis ausncia e alta.

87

3. Resultados

A
100%

Preciso do produtor (%)

90%
80%
70%
60%
50%
40%

...classificados como:

30%
20%

alta

10%

mdia
ausncia

0%

ausncia

mdia

alta

Nveis de abundncia reais...

B
100%

Preciso do utilizador (%)

90%
80%
70%
60%
50%
40%

...que na realidade

alta

30%
20%

mdia

10%

ausncia

0%

ausncia

mdia

alta

Nveis de abundncia aps a classificao...

Figura 3.33 Medidas de preciso (%) do ponto de vista do produtor (A) e do utilizador (B) obtidas a
partir da matriz de confuso.

Influncia das caractersticas dos meios aquticos


Na figura 3.34 est representada a rvore de classificao em que se considerou apenas o
efeito de variveis associadas s caractersticas dos meios aquticos (no entraram na
anlise as variveis: tipo de habitat, orientao, declive e altitude), apresentando-se a
estrutura interna na tabela 3.35. A separao mais importante introduzida pela varivel
PROF que d origem ao nico n de ausncia para valores inferiores a 0.25 m
88

3. Resultados

(probabilidade de 0.77) (Tabela 3.35). A segunda separao mais importante introduzida


pela varivel EMER. Para coberturas de vegetao emergente inferiores a 50%, as
variveis com maior influncia so a ARBR, a INSOL e a TURB na separao entre
abundncias mdia e alta; dos quatro ns terminais apenas um corresponde a abundncias
altas (probabilidade de 0.6) para coberturas de vegetao arbrea superiores a 50%, nveis
de insolao superiores a 2 e nveis de turbidez inferiores a 1. Para valores de cobertura de
vegetao emergente, a varivel mais importante na discriminao entre abundncias
mdias e altas a IMER; para valores de cobertura de vegetao imersa inferiores a 0.25 a
abundncia mdia (probabilidade de 0.73); para valores superiores a 25% a abundncia
alta (probabilidade de 0.7).

Figura 3.34 rvore de classificao aps as operaes de poda.

89

3. Resultados

Tabela 3.35 Estrutura interna da rvore de classificao seleccionada (n - n de


observaes; D - deviance; * - ns terminais; os nmeros dos ns
correspondem aos nmeros da rvore original, antes de se proceder sua
simplificao).
N

1) raiz

249

466.80

2) PROF<1.5 35

Resposta
mdia

Probabilidades (alta ausncia mdia)


( 0.1285 0.2892 0.5823 )

37.63 ausncia

3) PROF>1.5 214 384.20

( 0.0000 0.7714 0.2286 ) *

mdia ( 0.1495 0.2103 0.6402 )

6) EMER<1.5 176 287.40 mdia ( 0.0852 0.2386 0.6761 )


12) ARBR<1.5 88 112.10 mdia ( 0.1364 0.0682 0.7955 ) *
13) ARBR>1.5 88 142.00 mdia ( 0.0341 0.4091 0.5568 )
26) INSOL<2.5 77 104.50 mdia ( 0.0000 0.4156 0.5844 ) *
27) INSOL>2.5 11 23.98 ausncia

( 0.2727 0.3636 0.3636 )

54) TURB<0.5 5 6.73 alta ( 0.6000 0.4000 0.0000 ) *


55) TURB>0.5 6 7.64 mdia ( 0.0000 0.3333 0.6667 ) *
7) EMER>1.5

38 69.48 mdia

( 0.4474 0.0790 0.4737 )

14) IMER<0.5 15 21.90 mdia ( 0.0667 0.2000 0.7333 ) *


15) IMER>0.5 23 28.27

alta

( 0.6957 0.0000 0.3043 ) *

A classificao obtida com este modelo, segundo as suas medidas da qualidade de


ajustamento (Tabela 3.36), apresenta piores resultados do que o modelo anterior, em que se
incluiu na anlise todas as variveis locais. O modelo classificou correctamente cerca de
70% dos pontos de amostragem, com uma deviance ponderada de 1.317. A validao
cruzada resultou numa mdia de cerca de 64% de classificaes correctas e um valor
mdio ponderado de deviance de 2.141.
Tabela 3.36 Medidas de qualidade de ajustamento do modelo amostra de
treino e segundo a validao cruzada (D - deviance; g.l. - graus de liberdade =
242).
Preciso total (%)

D / g.l.

Amostra de treino

70.68

318.800

1.317

Validao cruzada

63.86

469.484

2.141

Os resultados da matriz de confuso esto representados graficamente na figura


3.35. Do ponto de vista da preciso do produtor foram correctamente classificadas cerca de
90

3. Resultados

38% das observaes correspondentes ao nvel ausncia, 90% correspondentes ao nvel


mdia e 59% correspondentes ao nvel alta. Do ponto de vista da preciso do utilizador
cerca de 77% das observaes classificadas como ausncia, 70% classificadas como mdia
e 69% classificadas como alta, pertenciam realmente a essas classes.
Tal como para o modelo anterior, tanto do ponto de vista do produtor como do
utilizador verificou-se um nmero maior de trocas entre os nveis de abundncia ausncia
e mdia e entre os nveis mdia e alta do que entre os nveis ausncia e alta.

A
100%

Preciso do produtor (%)

90%
80%
70%
60%
50%
40%

...classificados como:

30%
20%

alta

10%

mdia
ausncia

0%

ausncia

mdia

alta

Nveis de abundncia reais...

B
100%

Preciso do utilizador (%)

90%
80%
70%
60%
50%
40%

...que na realidade
so:
alta

30%
20%

mdia

10%

ausncia

0%

ausncia

mdia

alta

Nveis de abundncia aps a classificao...

Figura 3.35 Medidas de preciso (%) do ponto de vista do produtor (A) e do utilizador (B) obtidas a
partir da matriz de confuso.

91

3. Resultados

3.5.2 Emys orbicularis


Os testes de Mann-Whitney (Tabela 3.37) mostram que ocorrem diferenas significativas
(p<0.05) entre os valores mdios das variveis quantitativas ALTI, RELE, VCOR, EMER,
IMER e ARBR, dos locais com apenas Mle e dos locais onde as duas espcies coexistem.
Os grficos da figura 3.36 mostram como variam a mdia e a disperso dos dados para
estas variveis. Segundo os resultados Eor, relativamente a Mle, tende a ocupar habitats
aquticos situados a menores altitudes, em regies com menor relevo, com menor
velocidade da corrente, maior cobertura de vegetao emergente e imergente e com maior
cobertura de estrato arbreo na margem. Estes resultados no so no entanto confirmados
pelo teste Kolmogorov-Smirnov (Tabela 3.37), significando que no existem diferenas
significativas nas distribuies das variveis nas duas classes.

Tabela 3.37 Resultados do teste de Kolmogorov-Smirnov (K.-S.) e do teste de MannWhitney (M.-W.) para cada varivel quantitativa (s - desvio padro).
Variveis
ALTI
RELE
LARG
PROF
VCOR
TURB
INSO
INCL
EMER
FLUT
IMER
HERB
ARBS
ARBR

92

Mle

Mle + Eor

K. - S.

M. - W.

Mdia

Mdia

160.46
2.19
23.15
2.76
0.62
1.26
2.20
1.24
0.65
0.24
0.84
1.33
1.57
1.41

129.36
1.800
58.47
1.04
0.74
0.99
0.77
0.53
0.77
0.62
0.81
0.87
0.99
1.02

88.00
1.05
20.45
2.75
0.25
1.35
2.45
1.25
1.05
0.25
1.50
1.25
1.65
0.75

103.75
1.10
31.67
1.12
0.44
0.93
0.69
0.64
0.83
0.55
0.89
0.91
0.88
0.97

n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.
n.s.

<0.01
<0.01
n.s.
n.s.
<0.05
n.s.
n.s.
n.s.
<0.05
n.s.
<0.01
n.s.
n.s.
<0.01

3. Resultados

Figura 3.36 Mdia Desvio padro (SD) das variveis quantitativas (testes deMann-Whitney significativos
p<0.05) para cada classe.

Quanto s variveis qualitativas, os testes de 2 (Tabela 3.38) mostram que as variveis


MLE, HABI, e CASC apresentam uma influncia significativa (p<0.01) na presena de
ambas as espcies relativamente presena nica de Mle. Nos grficos da figura 3.37 esto
representados os histogramas por nvel de abundncia para estas variveis. Segundo os
resultados a espcie apresenta uma maior tendncia para ocupar locais com abundncias
mais elevadas de Mle, surge com maior frequncia em habitats palustres e palustresriverinos, e tem menor tendncia para ocupar habitats com substrato de cascalho.

93

3. Resultados

2
Tabela 3.38 Resultados dos testes de para cada varivel qualitativa. g. l.
- graus de liberdade; (+) - influncia positiva na abundncia da espcie; (-) influncia negativa sobre a abundncia da espcie; (n.s.) - resultado no
significativo a 99% de confiana.
Variveis
MLE
ORIE
HABI
AFLO
CASC
AREN
LODO

g. l.

X2

2
7
6
1
1
1
1

11.53
6.575
20.140
0.392
6.937
0.293
0.208

<0.000 (+)
0.476 (n.s.)
<0.005
0.531 (n.s.)
<0.01 (-)
0.588 (n.s.)
0.656 (n.s.)

2
Figura 3.37 Histogramas das variveis qualitativas (testes de significativos p<0.01) para cada classe.

94

4. Discusso

4. DISCUSSO
4.1 Interpretao ecolgica dos modelos de distribuio
Os modelos de distribuio que foram produzidos explicaram uma percentagem razovel
(cerca de 80% para Mle e cerca de 84% para Eor) da distribuio observada das espcies
escala e resoluo adoptadas. Estas estimativas de preciso total foram da mesma ordem de
grandeza das obtidas em trabalhos idnticos (Walker, 1996; Pereira & Itami, 1991; Brito et
al., 1996), sendo raros os trabalhos onde os modelos ultrapassam os 90% de preciso (por
exemplo: Austin et al., 1996; Teixeira et al., 1996).
A preciso dos modelos de distribuio depende em grande medida da capacidade
preditiva das variveis disponveis e da resoluo e robustez dos dados, mas tambm do
maior ou menor grau de exigncia das espcies em relao a determinados factores. Por
exemplo, Teixeira et al. (1996) construiu modelos de regresso logstica para uma espcie
com exigncias ecolgicas muito restritas (salamandra-dourada), tendo estimado uma
preciso total de 94.2%, sendo a sua presena fortemente influenciada pela precipitao e
declive.
A interpretao ecolgica dos modelos geralmente uma tarefa difcil, uma vez que
os factores envolvidos nos modelos podem no actuar directamente na distribuio das
espcies mas antes estar correlacionados ou interactuar com factores no considerados na
anlise. Pode at suceder o caso extremo de nenhuma das variveis includas num modelo
actuarem sobre as espcies. Por outro lado, outra dificuldade de interpretao advm do
facto das variveis macro-ambientais influenciarem no apenas directamente a
distribuio, mas tambm o tipo de habitats disponveis.
Numa tentativa de obviar parte do problema, recorde-se que se ajustaram um
grande nmero de modelos vlidos, tendo-se seleccionado aquele que simultaneamente
possua melhores medidas de qualidade de ajustamento e o maior significado possvel luz
dos conhecimentos sobre a ecologia das espcies. Partiu-se ainda do pressuposto que o
nmero de vezes que determinada varivel entrava em modelos independentes era, de certo
modo, uma indicao da sua importncia relativa na distribuio das espcies. Por ltimo,
o nmero de vezes que as variveis que eram simultaneamente includas nos modelos
segundo as duas tcnicas de modelao adoptadas, foi tambm considerado como uma
medida da sua importncia para a ocorrncia da espcie.
95

4. Discusso

importante salientar que as variveis includas no Atlas do Ambiente de Portugal


so muito incompletas, faltando nomeadamente variveis que reflictam a sua variao
sazonal, o que seria til por exemplo para avaliar a instabilidade climtica (Romero &
Real, 1996). Por outro lado, o grau de detalhe da cartografia das variveis muito baixo, o
que pode limitar a sua capacidade preditiva.
Mauremys leprosa
Para Mle as variveis que surgiram mais do que duas vezes no conjunto dos modelos e
simultaneamente nas duas abordagens estatsticas utilizadas foram a radiao solar, a
evapotranspirao real, a humidade relativa, as variveis espaciais (n da linha e n da
coluna na rede UTM 10 x 10 km), o escoamento, a precipitao e as regies ecolgicas
(informao fito-edafo-climtica).
A elevada frequncia de ocorrncia nos modelos das variveis espaciais mostra que
provavelmente existem outros factores importantes que esto correlacionados com elas.
Outra hiptese a distribuio ser tambm influenciada por factores meramente
biogeogrficos, ou seja, mesmo que em determinadas regies hajam condies para a
ocorrncia da espcie, ela no est presente porque outros factores (por exemplo barreiras
naturais) impediram a sua colonizao. Estas variveis nunca foram includas nos modelos
seleccionados, uma vez que retiravam o seu significado ecolgico. Note-se que as restantes
seis variveis mais importantes so todas de natureza climtica, pelo que se deduz que o
clima um factor importante na distribuio desta espcie.
O factor mais importante na ecologia dos rpteis a temperatura, uma vez que
dependem de fontes externas de calor para manterem a temperatura ideal sobrevivncia e
reproduo (Spellerberg, 1982; Heatwole & Taylor, 1987). Em ltima anlise dependem da
energia radiante do sol, quer directamente (radiao directa) quer indirectamente (radiao
reflectida ou atravs de objectos aquecidos por energia radiante) (Heatwole & Taylor,
1987). Segundo os modelos obtidos, a varivel temperatura mdia do ar por si s no se
revelou uma varivel importante. Outras medidas de temperatura como os respectivos
mximos e mnimos, ou a temperatura mdia por estao do ano, contribuiriam certamente
com mais informao. No obstante este facto e atendendo a que as tartarugas da famlia
Emydidae em geral controlam a temperatura atravs da menor ou maior exposio
radiao solar directa (Crawford et al., 1983), medidas como a radiao solar ou a
insolao so provavelmente mais determinantes do que as medidas de temperatura. Com

96

4. Discusso

efeito, segundo os modelos obtidos a radiao solar das variveis mais importantes,
seno a mais importante, na distribuio desta espcie. Tal no de estranhar uma vez que,
ao contrrio, por exemplo, da insolao (n de horas de exposio solar), esta varivel
uma medida da quantidade de energia radiante que chega ao solo. Segundo a rvore de
classificao a espcie ocorre apenas para valores de radiao solar superiores ou iguais a
145 kcal/cm2. Esta varivel provavelmente a que tem um efeito mais directo na presena
de Mle.
Uma vez que os cgados ocorrem em meios aquticos, a precipitao um factor
que pode influenciar a sua ocorrncia. No entanto, segundo os modelos obtidos o seu efeito
no muito evidente. De acordo com a rvore de classificao seleccionada, a espcie est
presente quando a precipitao inferior a 600 mm. Para valores de precipitao
superiores, esta varivel interage com as variveis humidade e regies ecolgicas. No
entanto, o ajustamento do modelo aditivo generalizado baseado no primeiro modelo de
regresso logstica seleccionado, mostra que a relao positiva para valores de
precipitao inferiores a 1200 mm e negativa para valores superiores a este nmero. Estes
resultados contraditrios podero estar relacionados com possveis interaces com outras
variveis. Porm, a precipitao apresenta certamente uma grande influncia ao nvel dos
habitats, uma vez que actua directamente na disponibilidade e no tipo predominante de
meios aquticos. Pode ainda pensar-se que para valores baixos de precipitao o seu efeito
positivo uma vez que determina a quantidade de gua disponvel; para valores elevados o
seu efeito negativo uma vez que provoca um aumento da velocidade da corrente dos
cursos de gua. Segundo os resultados do estudo da influncia de variveis locais na
abundncia da espcie, a velocidade da corrente apresenta um efeito claramente negativo.
No caso do escoamento, que resulta em grande medida da quantidade de
precipitao e do declive dos terrenos, o seu efeito directo mais evidente. Segundo os
modelos obtidos, esta varivel apresenta um efeito marcadamente negativo sobre a
presena da espcie. A relao directa entre o escoamento e a velocidade da corrente nos
leitos dos cursos de gua explica muito provavelmente este comportamento.
Quer a anlise univariada quer os modelos obtidos mostram uma influncia
considervel da evapotranspirao real na distribuio de Mle. Para todos os modelos a sua
influncia na presena da espcie negativo. Segundo trs das oito rvores de classificao
ajustadas a espcie est presente apenas para valores de evapotranspirao inferiores ou
iguais a 700 mm (resultados no apresentados), sendo este o primeiro factor que divide a
raiz. Porm, o seu efeito directo sobre a espcie no claro. Esta varivel depende de
97

4. Discusso

muitos factores como a quantidade de gua nos solos, da densidade de cobertura de


vegetao e da temperatura. provvel que este factor actue ao nvel dos habitats,
nomeadamente no que se refere ao grau e tipo de cobertura das margens dos meios
aquticos. Por outro lado, pode estar correlacionado com outras variveis no disponveis
que actuam directamente sobre a espcie.
Quanto humidade, por um lado as anlises univariadas no mostram uma
influncia muito acentuada na presena da espcie, mas por outro lado surge num grande
nmero de modelos, incluindo os dois seleccionados. Nas rvores de classificao esta
varivel surge principalmente nas separaes com menor significado. De acordo com a
rvore de classificao seleccionada, a espcie est ausente para valores iguais ou
superiores a 75% de humidade. Segundo os modelos de regresso logstica o seu efeito
igualmente negativo, sendo a varivel que mais vezes est includa nos modelos. Uma vez
que se trata de uma espcie tipicamente aqutica o papel da humidade no balano hdrico
muito reduzido, no sendo por isso partida um factor limitante da sua presena. Tal como
a evapotranspirao, este factor deve actuar ao nvel dos habitats ou estar correlacionado
com outra varivel importante.
Quanto s regies ecolgicas, a sua categorizao baseada sobretudo nas
comunidades vegetais, resultando assim do efeito de uma gama diversificada de variveis
climticas. As regies ecolgicas devem portanto determinar os tipos de habitat aqutico
dominantes. Para ambas as abordagens estatsticas, a percentagem de presenas da espcie
maior para os climas de carcter mais mediterrneos. Segundo a rvore de classificao a
espcie est presente nas quatro regies mediterrneas e ainda na regio Sub-Montano Termo-Subatlntico.

Emys orbicularis
Quanto a Eor, foram simultaneamente includas nos dois modelos seleccionados as
variveis radiao solar e escoamento. Tal como para a espcie anterior, a radiao solar
parece ser a varivel mais importante para esta espcie. Segundo a rvore de classificao
a espcie ocorre apenas para valores de radiao solar superiores ou iguais a 150 kcal/cm2.
As consideraes feitas para Mle aplicam-se igualmente a esta espcie.
Segundo as duas abordagens estatsticas, a radiao solar e o escoamento interagem
no efeito sobre a presena da espcie. Na regresso logstica a interaco expressa pelo

98

4. Discusso

produto entre as duas, tendo um efeito negativo na presena. Com a rvore de classificao
a interaco expressa de uma forma mais simples: o escoamento apenas tem efeito para
valores de radiao solar superiores a 150 kcal/cm2.
Outro factor importante includo na rvore de classificao a regio ecolgica.
Segundo este modelo a espcie est presente, para valores de escoamento superiores a 100
mm, apenas nas trs regies de carcter mais mediterrnico.
Por ltimo, apesar de no estar includa no modelo de regresso logstica
seleccionado, a varivel altitude (e respectiva transformao logartmica) surge em seis dos
nove modelos ajustados. Esta espcie tende a ocupar regies de menor altitude, o que
tambm se verificou a nvel local. Este efeito pode estar relacionado com uma preferncia
mais marcada desta espcie por habitats palustres (confirmada pelo estudo do efeito das
variveis locais), que dum modo geral so mais frequentes a baixas altitudes. Por outro
lado, se a espcie se encontra em regresso em Portugal, tender a ocupar apenas os
habitats de melhor qualidade.

4.2 Avaliao e interpretao dos modelos segundo a sua


representao geogrfica
As precises estimadas dos modelos podem ser extrapoladas com algum erro em termos de
rea geogrfica segundo a sua representao espacial. Assim, por exemplo, do ponto de
vista do produtor do mapa pode afirmar-se que cerca de 83% da rea onde Mle est
presente (no esquecendo, porm, que a espcie se limita ao meio aqutico) foi bem
classificada pela representao geogrfica do modelo de regresso logstica. Do ponto de
vista do utilizador do mapa pode afirmar-se que cerca de 84% da rea representada como
estando a espcie presente est correctamente classificada.
Mauremys leprosa
As superfcies de probabilidade de ocorrncia de Mle so bastante diferentes segundo os
dois mtodos de modelao (Figura 3.22, pg. 73). Ao passo que no caso da rvore de
classificao apenas se geram cinco nveis de probabilidade correspondentes ao ns
terminais das rvores, no caso do modelo logstico as reas possuem uma gama mais
contnua de probabilidades, resultando numa representao aparentemente mais realista.
99

4. Discusso

Quando se reclassifica a imagem correspondente ao modelo de regresso logstica


de acordo com a distribuio da preciso do utilizador pelos pontos de corte, verifica-se
que uma grande parte das reas mal classificadas situam-se na regio perifrica da
distribuio desta espcie (Figura 3.23, pg. 74), como por exemplo na Beira Litoral e
Estremadura. Esta zona de confuso pode ser interpretada como uma zona de maior
fragmentao da distribuio sentida pela resoluo adoptada, uma vez que ocorre uma
mistura maior de quadrculas de presena com quadrculas de ausncia. Este padro
sugere a existncia de um limite no abrupto da distribuio, estando de acordo com a
ideia de que as populaes tendem a fragmentar-se no limite da rea de distribuio,
restringindo-se apenas aos habitats mais propcios (Brown & Gibson, 1983). O erro de
classificao pode ento em parte ser interpretado como uma medida do grau de
fragmentao da distribuio e, em ltima anlise, da prpria abundncia das espcies.
Quanto aos mapas resultantes da classificao das imagens segundo os melhores
pontos de corte (Figura 3.24, pg. 75), o mapa relativo ao modelo de regresso logstica
est, aparentemente, mais de acordo com a distribuio real da espcie. Tal no de
estranhar, uma vez que apresenta valores de preciso das quadrculas de presena
superiores aos obtidos com a rvore de classificao. Por outro lado, os pontos de
ocorrncia includos na rea classificada como ausncia no se encontram muito
distanciados dos limites da distribuio segundo o modelo de regresso logstica.
A rvore de classificao, no entanto, classifica melhor as quadrculas de ausncia,
pelo que se considerou importante integrar a informao dos dois modelos de modo a
definir zonas de consenso entre os dois modelos. Nestas zonas o grau de certeza da
classificao das reas aumenta consideravelmente, segundo os resultados da preciso
quando se consideram apenas as quadrculas classificadas de igual modo pelos modelos
(seco 3.2.1.4, pg. 52).
No entanto, uma vez que se tem mais confiana nos dados de presena da espcie,
pensamos que o modelo que melhor reflecte a distribuio real da espcie o modelo de
regresso logstica.
Emys orbicularis
Tal como para a espcie anterior, a superfcie de probabilidades resulta mais realista
segundo o modelo de regresso logstica (Figura 3.26, pg. 77). Tambm para esta espcie
a zona de confuso situa-se nas regies perifricas da distribuio, sobretudo no Alto

100

4. Discusso

Alentejo, nas serras do Algarvias e da costa Sudoeste e na regio do Alto Douro. A zona
de confuso neste caso ocupa uma rea substancialmente maior relativamente rea de
presena da espcie (133% da rea de presena), do que no caso de Mle (43.7% da rea de
presena). Isto deve-se a uma maior fragmentao da distribuio desta espcie, alis
tambm confirmada pelo resultado do ndice de raridade mdia local (Tabela 3.1, pg. 32).
Para Eor as precises de classificao foram consideravelmente superiores do que
para Mle. No entanto, basearam-se numa amostra bastante mais reduzida, no tendo sido
construdos tantos modelos alternativos. Os mapas resultantes da classificao (Figura
3.27, pg. 78) so bastante idnticos entre os dois mtodos, embora o mapa referente
rvore de classificao esteja aparentemente um pouco mais de acordo com a distribuio
da espcie. Isto confirmado pela preciso do produtor ligeiramente superior da rvore de
classificao para as quadrculas de presena. No entanto, ambos os modelos no
conseguiram prever a ocorrncia da espcie em trs pontos (situados na zona das Caldas da
Rainha, na zona da Goleg e no Minho, prximo de Vila Verde) que, por serem muito
distantes do limite da distribuio prevista, pem em causa a prpria validade dos modelos.
De facto, os modelos revelaram-se muito eficazes na classificao da maioria das
quadrculas de presena uma vez que estas esto concentradas em regies restritas do pas.
A regio classificada como ausncia dever ser ento interpretada no como uma regio de
ausncia real das espcies, mas antes como uma regio onde ocorre um elevado grau de
fragmentao, resultando em populaes extremamente isoladas. Durante a fase terminal
deste trabalho foi-me relatada mais uma nova ocorrncia desta espcie situada na regio de
Chaves (Francisco lvares, com. pess.), sendo de esperar que no futuro venham a ser
detectados novos pontos de ocorrncia, situados igualmente muito longe dos limites de
distribuio segundo os modelos aqui apresentados.
A distribuio muito dispersa desta espcie e o facto de ser mais setentrional e
cosmopolita faz supor que esta dever ter apresentado uma distribuio em Portugal
bastante mais alargada no passado, inclusivamente mais alargada do que a de Mle. Com
efeito, Bocage (1863 in Bosc, 1881) no sculo passado descreveu esta espcie como
sendo comum em Portugal. Estes resultados constituem ento uma forte evidncia da sua
regresso em Portugal.

101

4. Discusso

4.3 Influncia de variveis locais


A influncia de variveis locais foi estudada com um carcter mais exploratrio e de
complemento informao sobre a distribuio das espcies, sem a pretenso de se
efectuarem extrapolaes e interpretaes ecolgicas muito exaustivas.
Mauremys leprosa
Esta espcie foi encontrada em todos as categorias de habitat aqutico consideradas neste
trabalho. No entanto, os resultados da anlise estatstica univariada e dos modelos baseados
em rvores de classificao mostram uma clara preferncia de Mle por habitats com uma
forte componente palustre, ou seja, ambientes de guas paradas, baixa profundidade e com
uma cobertura razovel de vegetao aqutica. Segundo a rvore de classificao que
incluiu todas as variveis consideradas, a espcie apenas est ausente em habitats riverinos
sem qualquer componente palustre, sobretudo em locais com profundidades inferiores a
0.25 m. De acordo com este modelo, verifica-se uma forte interaco entre a varivel tipo
de habitat e as caractersticas associadas ao meio aqutico; ou seja, em diferentes habitats
actuam diferentes factores na abundncia, de forma mais ou menos complexa.
Segundo o modelo que entra em considerao apenas com as variveis associadas
directamente s caractersticas dos meios aquticos, a profundidade o parmetro mais
importante na presena desta espcie (ausente para profundidades inferiores a 0.25 m).
Para os locais onde a espcie ocorre, os factores mais importantes na abundncia so a
cobertura de vegetao emergente e imersa. As maiores abundncias verificam-se para
valores simultaneamente elevados destes factores.
A preferncia por locais com maior cobertura de vegetao deve-se provavelmente
ao facto de constituir uma importante componente alimentar (Sidis & Gasith, 1985), de
albergar uma maior concentrao de fauna aqutica consumida por esta espcie e de
desempenhar um papel importante como abrigo. O maior grau de cobertura de vegetao
aqutica pode tambm estar correlacionado com menores velocidades da corrente, que
dificultam a sua movimentao na gua.
Para ambos os modelos, tanto do ponto de vista do produtor como do utilizador
verificou-se um nmero maior de trocas entre os nveis de abundncia ausncia e mdia e
entre os nveis mdia e alta do que entre os nveis ausncia e alta. Apesar dos modelos
baseados em rvores de classificao no pressuporem partida a existncia de um
102

4. Discusso

gradiente entre as classes da varivel resposta, este resultado sugere um padro contnuo da
abundncia ao longo de um gradiente ambiental.
Emys orbicularis
Esta espcie foi encontrada em todos as categorias de habitat aqutico consideradas neste
trabalho, excepto em habitats de carcter lacustre, como por exemplo albufeiras. Alguns
dados esto de acordo com os modelos de distribuio, como o caso da maior frequncia
de presena em locais de menor altitude do que Mle. Um dado curioso o facto da sua
presena ser mais frequente em locais onde se verificam maiores densidades de Mle. Isto
significa que as exigncias ecolgicas das duas espcies ao nvel do habitat so muito
semelhantes, mas que Eor tende a no ocupar os habitats menos propcios. Este facto pode
ser mais um indcio da sua regresso em Portugal, uma vez que, como j foi referido, as
populaes sujeitas a uma grande fragmentao tendem a ocupar apenas os habitats de
melhor qualidade.

103

5. Consideraes finais

5. CONSIDERAES FINAIS
Os resultados obtidos neste trabalho mostram que ambas as espcies de cgados
apresentam uma distribuio predominantemente mediterrnea em Portugal. Entre as
variveis macro-ambientais disponveis, a radiao solar aquela que parece ter maior
influncia na distribuio de ambas as espcies escala geogrfica. escala local ambas
as espcies preferem habitats aquticos de guas paradas, baixa profundidade e com uma
cobertura razovel de vegetao aqutica. Para Emys orbicularis essa preferncia parece
ser ainda mais marcada do que para Mauremys leprosa.
A distribuio de Emys orbicularis em Portugal contrasta com o seu padro global
de distribuio; na Europa Emys orbicularis apresenta uma distribuio mais setentrional
do que Mauremys leprosa, estando partida melhor adaptada a climas mais frios. A maior
frequncia desta espcie no sul do pas pode dever-se a uma maior disponibilidade de
habitats favorveis nesta regio. Por outro lado, se as suas populaes esto em regresso,
a preferncia por habitats favorveis torna-se ainda mais vincada; o que, de resto,
sugerem os resultados das anlises efectuadas a nvel local.
As metodologias empregues neste trabalho mostraram ser eficazes na modelao da
distribuio em Portugal das duas espcies de cgados. A regresso logstica originou
modelos mais realistas, embora com uma interpretao bastante mais complexa do que as
rvores de classificao. No entanto, as medidas de preciso total dos modelos resultaram
muito semelhantes ou mesmo iguais.
Uma hiptese a considerar futuramente seria a de modelar a distribuio com base
no grau de isolamento de cada quadrcula de presena (utilizando por exemplo o ndice de
raridade local - ver pg. 14), entendido como uma medida grosseira da abundncia da
espcie. A zona de confuso seria certamente mais bem modelada resultando numa
maior preciso de classificao. A regresso logstica ordinal e as rvores de regresso ou
classificao constituem dois mtodos possveis para a modelao de variveis resposta
quantitativas.
Por outro lado, as rvores de classificao revelaram-se bastante teis na anlise
exploratria da influncia de variveis locais na abundncia de Mauremys leprosa,
sobretudo atendendo s bvias limitaes da recolha dos dados, que impossibilitaram um
tratamento estatstico mais aprofundado.

105

5. Consideraes finais

Os resultados obtidos com este trabalho reflectem razoavelmente bem o estado das
populaes a nvel nacional das duas espcies. No se possuem dados histricos
suficientemente precisos para fundamentar uma eventual regresso de Emys orbicularis em
Portugal, embora a sua elevada fragmentao da distribuio e o seu declnio global em
toda a Europa constituam fortes indcios.
A situao das populaes de Emys orbicularis em Portugal, comparativamente s
de Mauremys leprosa, nomeadamente em relao sua raridade e s baixas densidades
observadas, podem ser o resultado de muitos factores, tais como: (1) o resultado da
ocorrncia de flutuaes naturais das populaes, nomeadamente devido a factores
climticos; (2) fenmenos de competio com Mauremys leprosa; (3) factores intrnsecos
prpria estratgia demogrfica da espcie; (4) maior vulnerabilidade desta espcie
alterao dos habitats e a agentes poluidores; (5) Portugal constituir o limite de distribuio
da espcie, sendo natural a fragmentao observada; (6) a conjugao de todos os factores
atrs mencionados. Apenas estudos mais aprofundados e comparativos da demografia,
gentica de populaes e biogeografia desta espcie podero fornecer pistas nesse sentido.
Os dados obtidos com este trabalho, tais como a probabilidade de ocorrncia, o
grau de fragmentao, o isolamento das populaes e a coexistncia das duas espcies,
complementadas com informaes sobre a distribuio geogrfica do grau de adequao
dos habitats e da abundncia, sero teis para a seleco de reas prioritrias para a
conservao destas espcies a nvel nacional.

106

6. Referncias

6. REFERNCIAS
Amo, O. A. (1991). Estatus y distribuicion del galapago europeu (Emys orbicularis) en
Catalua. VIII Trabada JuvesNat. Catalunya. 35-39.
Arajo, P. R., Segurado, P., & Raimundo, N. (1997). Bases para a conservao das
tartarugas de gua doce, Mauremys leprosa e Emys orbicularis. Estudos de
Biologia e Conservao da Natureza, 24. Instituto da Conservao da Natureza,
Lisboa.
Astudillo, G., & Arano B. (1995). Europa y su Herpetofauna: responsabilidades de cada
pais en lo referente a su conservacion. Bol. Aso. Herpetol. Esp. 6, 14-45
Andries, A.M., Gulinck, H., & Herremans, M. (1994). Spatial modelling of the barn owl
Tyto alba habitat using landscape characteristics derived from SPOT data.
Ecography, 17, 278-287.
Antunez, A., & Mendoza, M. (1992). Factores que determinan el rea de distribucin
geogrfica de las espcies: conceptos, modelos y mtodos de anlisis. In J.M.
Vargas, R. Real, & A. Antnez (Eds.), Objectivos y Mtodos Biogeogrficos.
Aplicaciones en Herpetologia. (pp. 51-72). A.H.E, Madrid.
Anselin, L. (1993). Discrete space autoregressive models. In Goodchild, M.F., Parks, B.O.
& Steyaert, L.T.New (Eds) Environmental Modeling with GIS (pp. 454-469),
Oxford University Press, York.
Arnold, E.N., Burton, J.A., & Ovenden, D.W. (1978). A Field Guide to the Reptiles and
Amphibians of Britain and Europe. Collins, London.
Aspinall, R., & Veitch, N. (1993). Habitat Mapping from Satelite Imagery and Wildlife
Survey Data Using a Bayesian Modeling Procedure in a GIS. Photogrammetric
Engineering & Remote Sensing, 59, 537-543.
Augustin, N.H., Mugglestone, M.A., & Buckland, S.T. (1996). An autologistic model for
the spatial distribution of wildlife. Journal of Applied Ecology, 33, 339-347.
Austin, G.E., Thomas, C.J., Houston, D.C., & Thompson, B.A. (1996). Predicting the
spatial distribution of buzzard Buteo buteo nesting areas using Geographical
Information System and remote sensing. Journal of Applied Ecology, 33, 15411550.
Barbadillo, L.J. (1987). La Guia de INCAFO de los Anfibios Y Reptiles de la Peninsula
Iberica, Islas Baleares y Canarias. INCAFO, Madrid
Begon, M., Harper, J.L., & Townsend, C.R. (1996). Ecology. Blackwell Science, Oxford.

107

6. Referncias

Berry, J.K. (1993). Cartographic modeling: the analytical capabilities of GIS. In M.F.
Goodchild, B.O. Parks, & L.T. Steyaert (Eds.), Environmental Modeling with
GIS. (pp. 58-74). Oxford University Press, New York.
Bons, J., & Geniez, P. (1996). Amphibiens et Reptiles du Maroc. Atlas biogeographique.
Asociacin Herpetolgica Espaola, Barcelona.
Bosc, E. (1881). Catalogue des reptiles et amphibiens de la Peninsule Iberique et des iles
Balares. Bulletin de la Societ Zoologuique de France: 1-47.
Breininger, D.R., Provancha, M.J., & Smith, R.B. (1991). Mapping Florida Scrub Jay
Habitat for Purposes of Land-Use Management. Photogrammetric Engineering
& Remote Sensing, 57, 1467-1474.
Brito, J.C., Abreu, F.B., Paulo, O.S., Rosa, H.D., & Crespo, E.G. (1996). Distribution of
Schreiber's lizard (Lacerta Shreiberi) in Portugal: a predictive model.
Herpetolical Journal, 6, 43-47.
Brito, J.C., Crespo, E.G., & Paulo, O.S. (1999). Modelling wildlife distributions: logistic
multiple regression vs. overlap analisys. Ecography, 22, 251-260.
Brown, J.H., & Gibson, A.C. (1983). Biogeography. Mosby, St Louis.
Buckland, S.T., & Elston, D.A. (1993). Empirical models for the spatial distribution of
wildlife. Journal of Applied Ecology, 30, 478-495.
Chandler, S.K., Fraser, J.D., Buehler, D.A., & Seegar, J.K.D. (1995). Perch trees and
shoreline development as predictors of bald eagle distribution on Chesapeake
Bay. Journal of Wildlife Management, 59, 325-332.
C.N.A. (1983). Atlas do Ambiente. Direco-Geral do Ambiente. Ministrio do Ambiente e
dos Recursos Naturais, Lisboa.
Clark, J.D., Dunn, J.E., & Smith, K.G. (1993). A multivariate model of female black bear
habitat use for a geographic information system. Journal of Wildlife
Management, 57, 519-526.
Clark L.A., Pregibon, D. (1992). Tree-based Models. in Statistical Models in S. Chambers,
J. M., Hastie, T. J. (eds.). Chapman and Hall, New York.
Cliff, A.D. & Ord, J.K. (1998). Spatial autocorrelation, Pion Limited, London.
Congalton, R.C. (1991). A review of assessing the accuracy of classification of remotely
sensed data. Remote Sens. Environ. 37, 35-46.
Corbett, K. (1989). Conservation of European Reptiles & Amphibians. Cristopher Helm
Ltd, London.
Cox, C.B., & Moore, P.D. (2000). Biogeography. An Ecological and evolutionary
approach. Blackwell Science, Oxford.
108

6. Referncias

Crawford, K.M., Spotila, J.R., & Standora, E.A. (1983). Operative environmental
temperature and basking behavior of the turtle Pseudemys scripta. Ecology
64(5), 989-999.
Crespo, E.G., & Oliveira, M.E. (1989). Atlas da Distribuio dos Anfbios e Rpteis de
Portugal Continental. Lisboa: S.N.P.R.C.N.
Da Silva, E. (1991). Contribucion al conocimiento de la biologia reproductora y dinamica
del crescimento oseo de Mauremys caspica leprosa (Schw. 1812). Resumo da
Tese de Doutoramento, Universidade de Extremadura, badajoz.
Eastman, J.R. (1990). IDRISI: AGrid-Based Geographic Information System. Version 3.2.
(Worcester, MA: Clark University Graduate School of Geography)
EGRET. (1991). EGRET: Statistical Analysis Package. Seattle: Statistics and
Epidiomological Research Corporation.
Ellison, A.M. (1996). An introduction to bayesian inference for ecological research and
environmental decision-making. Ecological Applications, 6, 1036-1046.
Ernst, C.H., & Barbour, R.W. (1989). Turtles of the world. Smithsonian Institution Press,
Washington, D.C.
Farinha, J.C., Costa, L.T., Zalidis, G., Mantzavelas, A., Fitoka, E., Hecker, N. & Toms
Vives, P. (1996). Mediterranean Wetland Inventory: Habitat Description
System..Medwet / Instituto da Conservao da Natureza (ICN) / Wetlands
International / Greek Biotope/Wetland Centre (EKBY) Publication.Volume III.
Forman, R.T.T. (1995). Land Mosaics. Cambridge University Press, Cambridge.
Franklin, J. (1998). Predicting the distribution of shrub species in southern California from
climate and terrain-derived variables. Journal of Vegetation Science, 9, 733-748.
Frisenda, S.,& Ballasina, D. (1990). Le Statut des Chloniens Terrestres et dEau Douce en
Italie. Bull. Soc. Herp. Fr. 53,:18-23
Gaston, K.J., & Lawton, J.H. (1990). Effects of scale and habitat on the relationship
between regional distribution and local abundance. Oikos, 58, 329-335.
Gates, S., Gibbons, D.W., Lack, P.C., & Fuller, R.J. (1994). Declining farmland bird
species: modelling geographical patterns of abundance in Britain. In P.J.
Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale ecology and
conservation biology. (pp. 153-177). Blackwell Scientific Publications, London.
Gilpin, M.E. (1987). Spatial structure and population vulnerability. In M.E. Soul (Ed.),
Viable Populations for Conservation. (pp. 125-139). Cambridge Uinversity
Press, Cambridge

109

6. Referncias

Hanski, I. (1996). Metapopulation ecology. In O.E. Rhodes, Jr (Ed.), Population dynamics


in ecological space and time. (pp. 13-43). University of Chicago Press, Chicago.
Hanski, I., & Gilpin, M.E. (1991). Metapopulation dynamics: brief history and conceptual
domain. Biological Journal of the Linnean Society, 42, 3-16.
Harding, P.T. (1991). National species distribution surveys. In F.B. Goldsmith (Ed.),
Monitoring for conservation and ecology. (pp. 133-154). Chapman & Hall,
London.
Harrison, S. (1994). Metapopulations and conservation. In P.J. Edwards, R.M. May, &
N.R. Webb (Eds.), Large-scale ecology and conservation biology. (pp. 111128). Blackwell Scientific Publications, London.
Haslett, J.R. (1990). Geographic information systems: a new approach to habitat definition
and the study of distributions. TREE, 5, 214-218.
Heatwole, H., & Taylor, J. (1987). Ecology of Reptiles. Surrey Beatty & Sons, Shipping
Norton.
Hill, M.O. (1991). Patterns of species distribution in Britain elucidated by canonical
correspondence analysis. Journal of Biogeography, 18, 247-255.
Hoef, J.M.V. (1996). Parametric empirical bayes methods for ecological applications.
Ecological Applications, 6(4), 1047-1055.
Hosmer Jr, D.W. & Lemeshow, S. (1989). Applied Logistic Regression. Wiley, New York.
Iverson, L.R. & Prasad, A.M. (1998). Predicting abundance of 80 tree species following
climate change in the Eastern United States. Ecological Monographs, 68(4),
465-485.
Johnston, C.A. (1998). Geographic Information Systems in Ecology. Blackwell Science,
Oxford.
Keller, C., Daz-Paniagua C.,& Andreu A.C. (1994). Distribucin de Mauremys leprosa y
Emys orbicularis en Doana (SO de Espaa). III Congresso Luso-espaol, VII
Congresso Espaol, Badajoz.
Kvamme, K.L. (1990). The fundamental principles and practice of predictive
archaeological modeling. In A. Voorrips (Ed.), Mathematics and information
science in archaeology: a flexible framework. (pp. 257-295). Holos-Verlag,
Bonn.
Kvamme, K.L. (1992). A predictive site location model on the high plains: an example
with an independent tes. Plains Anthropologist, 37, 19-40.
Lawton, J.H., Nee, S., Letcher, A.J., & Harvey, P.H. (1994). Animal distributions: patterns
and processes. In P.J. Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale

110

6. Referncias

ecology and conservation


Publications, London.

biology.

(pp.

41-58).

Blackwell

Scientific

Malkmus R. (1995). Die Amphibien und Reptilien Portugals, Madeiras und Der Azoren.
Westarp Wissenschaften, Magdeburg. 105-109.
Maurer, B.A. (1994). Geographical Population Analysis: Tools for the Analysis of
Biodiversity. Blackwell Science, Oxford.
May, R.M. (1994). The effects of spatial scale on ecological questions and answers. In P.J.
Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale ecology and
conservation biology. (pp. 1-17). Blackwell Scientific Publications, London.
McCullagh, P. & Nelder, J.A. (1989). Generalized Linear Models. Chapman & Hall.
MicroImages (1997). The Map and Image Processing System version 5.7. Lincoln, USA.
Murphy, D.D. (1989). Conservation and confusion: Wrong species, wrong scale, wrong
conclusions. Conservation Biology, 3 (1), 82-84.
Neas, P.; Modr, D; Zavadil, V (1997). Czech Recent and Fossil Amphibians and
Reptiles. Edition Cuimaira, Frankfurt.
North, M.P., & Reynolds, J.H. (1996). Microhabitat analysis using radiotelemetry locations
and polytomous logistic regression. Journal of Wildlife Management, 60, 639653.
Ormsby, J.P., & Lunetta, R.S. (1987). Whitetail Deer Food Availability Maps from
Thematic Mapper Data. Photogrammetric Engineering & Remote Sensing, 53,
1585-1589.
Palmeirim, J.M. (1985). Using Landsat TM Imagery and Spatial Modeling in Automatic
Habitat Evaluation and Release Site Selection for the Ruffed Grouse
(Gallifomes: Tetraonidae). Proceedings 19th International Symposium of
Remote Sensing and Environment.
Parker, S. (1985). Predictive modeling of site settlement systems using multivariate
logistics. In C. Carr (Ed.), For concordance in archaeological analysis. (pp.
173-207). Westport, Kansas City.
Pereira, J.M.C., & Duckstein, L. (1993). A multiple criteria decision-making approach to
GIS-based land suitability evaluation. Int J Gographical Information Systems,
7, 407-424.
Pereira, J.M.C., & Itami, R.M. (1991). GIS-based Habitat Modeling Using Logistic
Multiple Regression: A Study of the Mt. Graham Red Squirrel.
Photogrammetric Engineering & Remote Sensing, 57, 1475-1486.
Rapoport, E.H. (1982). Aerography. Geographical strategies of species. Pergamon Press,
Oxford.
111

6. Referncias

Rogers, D.J., & Williams, B.G. (1994). Tsetse distribution in Africa: seeing the wood and
the trees. In P.J. Edwards, R.M. May, & N.R. Webb (Eds.), Large-scale ecology
and conservation biology. (pp. 247-271). Blackwell Scientific Publications,
London.
Romero, J., & Real, R. (1996). Macroenvironmenteal factors as ultimate determinants of
distribution of common toad and natterjack toad in the south of Spain.
Ecography, 19, 305-312.
Segurado, P. (1996). Estudo da estrutura das populaes e de alguns parmetros
demogrficos de Mauremys leprosa e de Emys orbicularis em Portugal. Actas do
IV Congresso Luso-Espanhol, VII Congresso Espanhol de Herpetologia. Porto.
Servan J., & Pieau C. (1984). La cistude d'Europe (Emys orbicularis): Mensuration d'oeufs
et de jeunes individus.Bull. Soc. Herp. Fr. 1984, 31:20-26
S.N.P.R.C.N.(ed.). (1990). Livro Vermelho dos Vertebrados de Portugal. Vol. I Mamferos, Aves, Rpteis e Anfbios. Lisboa: S.N.P.R.C.N.
Sidis, I & Gasith, A. (1985). Food Habits of the Caspian Terrapin (Mauremys caspica
rivulata) in Unpolluted and Polluted Habitats in Israel. Journal of Herpetology.
19 (1), 108-115.
Spellerberg, I.F. (1982). Biology of Reptiles. An ecological approach. Blackie & Son Ltd,
London.
Spellerberg, I.F. (1992). Evaluation and assessment for conservation Chapman & Hall,
London.
Statistical Sciences (1995). S-PLUS Guide to Statistical and Mathematical Analysis,
Version 3.3.StatSci, MathSoft, Inc., Seatle.
Teixeira, J., Arntzen, J.W., Ferrand, N., & Alexandrino, J. (1996). Elaborao de um
modelo preditivo da distribuio de Chioglossa lusitanica em Portugal. Actas do
IV Congresso Luso-Espanhol, VII Congresso Espanhol de Herpetologia. Porto.
Trexler, J.C., & Travis, J. (1993). Nontraditional regression analysis. Ecology, 74, 16291637.
Vernaples W. N., & Ripley, B. D. (1997). Modern Applied Statistics with S-PLUS.
Springer-Verlag, New York.
Walker, P.A. (1990). Modelling wildlife distributions using a geographic information
system: Kangaroos in relation to climate. Journal of Biogeography, 17, 279-289.
Warren, R.E. (1990). Predictive modelling in archaeology: a primer. In K.M.S. Allen, S.W.
Green, & E.B.W. Zubrow (Eds.), Interpreting space: GIS and archaeology. (pp.
90-111). Taylor & Francis, London.

112

6. Referncias

Zar, J.H. (1984). Biostatistical analysis. Prentice-Hall, New Jersey.

113

ANEXO I

SIGNIFICADO DAS CLASSES DAS VARIVEIS

Variveis intervalares
Classes
1
2
3
4
5
6
7
8
9
10
11
12
13
14

TEMP
C

PREC
mm

HUMI
%

ESCO
mm

EVAP
mm

INSO
n horas

RADS
kcal

ALTI
m

GEADA
n meses

DPOP
n hab/km2

<7.5
7.5-10.0
10.0-12.5
12.5-15.0
15.0-17.5
17.5-20

<400
400-500
500-600
600-700
700-800
800-1000
1000-12000
1200-1400
1400-1600
1600-2000
2000-2400
2400-2800
>2800

<65
65-70
70-75
75-80
80-85
>85

<25
25-50
50-100
100-150
150-200
200-300
300-400
400-600
600-800
800-1000
1000-1400
1400-1800
1800-2200
>2200

<400
400-450
450-500
500-600
600-700
700-800
>800

<1800
1800-2000
2000-2100
2100-2200
2200-2300
2300-2400
2400-2500
2500-2600
2600-2700
2700-2800
2800-2900
2900-3000
3000-3100
>3100

<140
140-145
145-150
150-155
155-160
160-165
>165

0-50
50-100
100-200
200-400
400-700
700-1000
1000-1300
1300-1600
>1600

<1 ms
1-2 meses
2-3 meses
3-4 meses
4-5 meses
5-6 meses
6-7 meses
7-8 meses
8-9 meses
>9 meses

<20
20-50
50-100
100-250
250-500
500-1000
>1000

Variveis nominais
Classes
1
2
3
4
5
6
7
8

ECOL

SOLO

Erminiana - Oro-Atlntica
Altimontano - 1000/1300 m
Montano - Sub-Atlntico - 700/100 m
Sub-Montano - Termo-Subatlntico - 400/700 m
Basal - Atlntico-Mediterrnico - <400 m
Basal - Mediterrnico - <400
Calco-Mediterr^nico
Psamo/Eolo/Aluvio/Halo - Mediterrnico

Dunas, Aluvies
Arenitos
Clacreos
Xistos
Granitos

Você também pode gostar