Você está na página 1de 25

VI Congresso da Geografia Portuguesa

Lisboa, 17-20 de Outubro de 2007

INTEGRAO DE REDES NEURONAIS ARTIFICIAIS E SIG PARA A


MODELAO DE HABITATS POTENCIAIS NO PARQUE NATURAL
DAS SERRAS DE AIRE E CANDEEIROS
Csar Capinha1; Raquel Melo2; Antnio Flor3

Resumo
A Geografia e mais propriamente a Biogeografia tm desempenhado um papel de extrema
importncia na preservao da biodiversidade. Uma das principais ferramentas na definio
de estratgias com esse fim tem sido a modelao de habitats potenciais.
Este trabalho apresenta uma metodologia de obteno de habitats potenciais atravs da
integrao de modelos espaciais representativos de vrios factores biofsicos com registos de
ocorrncia de trs espcies de flora (variveis dependentes): Thymus villosus L. sub. villosus;
Teucrium chamaedrys L. e Silene longicilia (Brot.) Otth. A rea de estudo corresponde ao
Parque Natural das Serras de Aire e Candeeiros (PNSAC), tendo sido utilizada uma resoluo
mnima considerada de elevado detalhe (900 m2).
Para a caracterizao biofsica da rea foram modelados diversos factores ecolgicos
(variveis independentes) como a radiao solar potencial, intensidade de vento, profundidade
do horizonte A do solo, geologia do substrato, drenagem acumulada, e uso do solo. Como
modelo estatstico de integrao foram utilizadas regresses no paramtricas obtidas a partir
de redes neuronais artificiais. Este um mtodo de utilizao recente na rea cujos valores de
desempenho se tm revelado superiores mdia em vrios trabalhos.
A avaliao dos modelos foi realizada efectuando uma validao cruzada K-fold, em que as
amostras iniciais foram particionadas em K amostras sendo apenas uma delas utilizada para
validao e o processo repetido K vezes, permitiu atingir valores de desempenho entre os
74% e os 85%.
Palavras-chave: Modelao, habitats, redes neuronais artificiais, flora, factores ecolgicos
1,2

Departamento de Geografia da Faculdade de Letras da Universidade de Lisboa, Alameda da Universidade, 1600 214

Lisboa, Tel: +351 217910000,


e-mail: 1cesarcapinha@hotmail.com; 2raquel_m@netcabo.pt
3

Parque Natural das Serras de Aire e Candeeiros, e-mail: serradeaire@hotmail.com

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

I - Introduo
Actualmente, na comunidade cientfica, consenso geral que a biodiversidade est sob
ameaa. Umas das principais causas, responsvel pelo aumento percentual das espcies em
risco, e tambm apontada como sendo a de maior impacte, a destruio de habitats.
Contudo, a geografia no tem estado alheia luta pela conservao da biodiversidade e uso
sustentvel dos recursos naturais. Sendo no espao fsico que se manifestam muitos dos
impactes causados sobre os seres vivos, o conhecimento e o estudo biogeogrfico tm
desempenhado um papel de extrema importncia na sua conservao. Este papel,
desempenhado pela biogeografia, levou a uma definio recente do conceito de Biogeografia
da Conservao (Whittaker et al., 2005). Uma das principais ferramentas desta cincia em
conjunto com a Macroecologia prende-se com a realizao de modelos preditivos, com
recurso a informao espacializada, da distribuio biogeogrfica ou de habitats potenciais. A
criao destes modelos preditivos de ocorrncia ou adequao a uma determinada espcie ou
comunidade permite, por um lado, identificar locais no inventariados onde estas possam
ocorrer e, por outro, identificar reas com condies favorveis sua existncia, ainda que
esta no se verifique. A utilidade destes resultados bvia, pois a obteno de locais de
adequabilidade potencial proporciona um conhecimento mais aprofundado da importncia
ecolgica da rea em estudo, tornando-se uma mais valia na planificao de estratgias de
conservao, estudos de avaliao de impactos, planos de ordenamento, aces de reintroduo, entre outros.
De um modo simples, este tipo de modelos pode ser interpretado como a anlise multivariada
de dados espacializados, passveis de esclarecer a relao existente entre a varivel
dependente (como por exemplo, presena de espcie ou comunidade), com uma ou mais
variveis independentes representativas de factores fsicos ou biticos com influncia na sua
distribuio.
At muito recentemente, grande parte da realizao destes modelos preditivos era aplicada a
extensas reas, com contrastes elevados e nveis de detalhe reduzidos. Actualmente, um dos
desafios vigentes prende-se com a aplicao destes modelos a reas cada vez mais reduzidas e
com escalas de modelao mais detalhadas.
1 Caracterizao da rea de estudo
A rea de estudo corresponde ao Parque Natural das Serras de Aire e Candeeiros (PNSAC)
(39 30' N; 8 50W). Os seus limites encerram, aproximadamente, uma rea total de 389 km2
nos quais se integram a totalidade da Serra dos Candeeiros, a Oeste, o Planalto de Santo
2

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Antnio, ao centro, uma pequena parte do Planalto de So Mamede, a Norte, e a Serra de


Aire, a Nordeste. O substrato predominantemente calcrio sendo escassa a disponibilidade
de gua superfcie. Em termos climticos, a rea do PNSAC situa-se numa zona de transio
entre o domnio Atlntico e o Mediterrneo. Fitogeograficamente, encontram-se trs situaes
clmax distintas: cercais, azinhais e sobreirais (Flor, 2005) correspondendo, grande parte da
vegetao natural do parque, s suas etapas de degradao.
O PNSAC uma rea protegida, detentora de uma grande diversidade de fauna e flora, e de
um elevado nmero de espcies com estatuto de proteco legal. No obstante a sua
importncia ecolgica, tem-se confrontado com diversas ameaas sustentabilidade destas
espcies, na sua maioria relacionadas com a extraco de inertes, a implantao de infraestruturas de vrios gneros ou a expanso urbana.
2 Espcies em estudo
Para a realizao dos modelos de habitat potencial foram seleccionadas trs espcies de flora
existentes na rea do PNSAC: Thymus villosus L. sub. villosus; Teucrium chamaedrys L. e
Silene longicilia (Brot.) Otth.
A escolha destas espcies baseou-se em dois pressupostos fundamentais: um primeiro, ligado
a um maior interesse na conservao ou conhecimento acerca da espcie, e outro, de carcter
metodolgico, relacionado com a existncia de um nmero significativo de dados, indicadores
da sua presena nesta rea. Assim, esses dados de presena de cada espcie foram,
posteriormente, completados com dados que indicam a sua ausncia, obtidos atravs de
levantamentos no terreno. Para a sua recolha foi utilizado um GPS, equipado com correco
diferencial WASS, que permite auferir um erro posicional mximo de, sensivelmente, 3
metros. Para a espcie Thymus villosus sub. villosus foram registados 23 locais de presena e
20 de ausncia, para o Teucrium chamaedrys 22 locais de presena e 36 de ausncia e para a
Silene longicilia 95 locais de presena e 15 de ausncia.
II - Introduo aos modelos independentes
A realizao de modelos de habitat potencial requer, na quase totalidade das abordagens
possveis, a existncia de factores considerados explicativos da distribuio da espcie ou
comunidade que se est a analisar. a partir destes factores que a modelao vai interagir
com os dados de presena da espcie, de modo a calibrar os resultados.
Guisan & Zimmermann (2000), citando Austin (1980 e 1985), referem a distino entre os
recursos e os factores directos e indirectos. Como recursos so designadas as variveis que
3

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

representam elementos consumveis pelas espcies, como os nutrientes, a gua ou a luz para
as plantas. Os factores directos so tambm variveis biofsicas de importncia fisiolgica,
mas que no so passveis de ser consumidos, como o pH ou a intensidade do vento. Por
ltimo, consideram-se ainda as variveis indirectas, que no representam directamente uma
importncia ecolgica directa para as espcies ou comunidades, como o caso do declive, da
exposio e da altitude.
Do ponto de vista metodolgico, para a sua aplicao em sistemas de informao geogrfica,
so apenas considerados dois grupos de variveis. O primeiro grupo rene as variveis que
determinam directamente a ocorrncia ou no de determinada espcie, ou seja, os factores
ecolgicos. Os segundos correspondem a factores indirectos que apresentam, regra geral, uma
maior preciso devido exactido dos seus processos de criao, correspondendo muitas
vezes a uma derivao directa de modelos digitais do terreno (como o declive, a posio
topogrfica e a exposio), no entanto, no explicam de uma forma directa a ocorrncia das
espcies. Para a realizao deste trabalho optou-se por escolher variveis, na sua maioria,
pertencentes ao primeiro tipo por diversas razes: a incluso de factores ecolgicos possibilita
um melhor conhecimento da relao dos objectos de estudo (espcies) com o meio, os
resultados obtidos so mais realistas e de interpretao directa e, por ltimo, a construo
destes factores em sistemas de informao geogrfica , em si mesmo, um objectivo para este
trabalho, possibilitando a divulgao de metodologias para a realizao de representaes
espaciais de alguns factores ecolgicos mais importantes, alguns deles ainda pouco
explorados nesta rea. Esta escolha acarreta consigo a necessidade de que os modelos
realizados possuam um rigoroso controlo do erro, de modo a evitar a sua propagao nos
resultados finais. Alm do reduzido erro, a sua definio espacial dever ainda ser elevada,
uma vez que a rea a trabalhar (PNSAC) de reduzidas dimenses no contexto de um
trabalho deste tipo. No obstante a primazia dada a estes factores, optou-se, tambm, por
incluir dois outros modelos indirectos, representativos de factores ecolgicos considerados
importantes e, para os quais, no se conseguiu realizar modelos directos, ou com reduzidos
valores de erro.
Odum (2004), refere os principais factores fsicos limitantes para a regulao de populaes,
sobretudo produtores: a temperatura, a luz, a gua, os gases atmosfricos, os nutrientes, as
correntes e presses, o solo e o fogo. A representao espacial de alguns destes factores
difcil, sobretudo para aqueles que apresentam uma relao difusa com as variveis espaciais
mais facilmente modeladas, como a altitude ou o declive. neste contexto que os gases
atmosfricos e os nutrientes so praticamente excludos dos trabalhos de modelao de
4

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

habitats. O fogo no ser tambm contemplado e, embora este tenha exercido uma forte
influncia sobre vrias reas do PNSAC, a construo de modelos de habitat potencial
pressupe que as populaes se encontram em equilbrio com o ecossistema, no sendo, desta
forma, apropriado para populaes que se encontrem em dinmicas de crescimento ou
regresso a curto prazo.
A gua, embora constitua um factor limitante de elevada importncia, aqui representada por
um factor indirecto, o modelo de fluxo acumulado de gua. O desconhecimento de
metodologias adequadas de modelao espacial directa desta varivel, dentro das
necessidades deste trabalho, fez com que se utilizasse este ndice em sua substituio. Para
tal, h ainda que considerar a elevada permeabilidade da maioria do substrato do PNSAC.
Assim, reconhece-se, partida, a possibilidade de impreciso quantitativa deste modelo, no
entanto, considerando-se uma permeabilidade uniforme pela rea, pressupe-se que a
hierarquizao espacial traduz a variabilidade relativa existente entre as clulas.
Nas correntes e presses, para ecossistemas terrestres, o elemento mais significativo
corresponde ao vento e intensidade com que fustiga o terreno. Assim, para representar este
factor, foi considerado um modelo de intensidade do vento. A temperatura e a luz,
correlacionadas em termos de distribuio espacial, encontram-se traduzidas por um modelo
de radiao solar potencial. Por fim o solo. Para a rea de estudo, uma das melhores
caractersticas encontradas para a sua representao, foi o seu grau de desenvolvimento (ou
disponibilidade) que foi traduzido por um modelo de profundidade do horizonte A. A somar a
esta caracterizao, foi tambm considerada a incluso do factor indirecto substrato
geolgico, pela importncia que tem nos vrios atributos dos solos. Alm dos factores
citados por Odum (2004), foi ainda considerado um modelo de uso do solo, pela implicao
que os diversos usos tm na variao espacial, ao nvel do solo, de muitos destes factores.
1 - Criao do modelo digital do terreno
Muitas das variveis utilizadas neste trabalho so derivadas de um modelo digital do terreno
(MDT) da rea do Parque, pelo que a sua correcta criao reveste-se de extrema importncia,
diminuindo a propagao de erros e permitindo obter resultados mais precisos, como tem sido
posto em evidncia por vrios autores (Felicsimo, 1994 e Reis, 1996).
A criao do modelo digital do terreno foi efectuada com base na informao altimtrica
vectorial de curvas de nvel e pontos cotados, das cartas militares de Portugal, escala
1: 25 000. Com esta informao, procedeu-se criao de um modelo de rede triangular
irregular (TIN), com uma margem envolvente rea do PNSAC.
5

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

2 Modelo de radiao solar potencial


A construo de modelos de interaco da radiao solar com a superfcie terrestre assenta na
geometria entre uma determinada posio do Sol e o modelo digital do terreno da rea de
interesse. Segundo Oke (1996), as principais medidas angulares que definem esta relao, so
as seguintes:
Latitude do local; ngulo Sol Znite; Declinao solar; h ngulo horrio;
ngulo do azimute solar

Considerando estas componentes, e atravs da lei do co-seno da iluminao e da equivalncia


trigonomtrica,
cos = sin sin + cos cos cos h

(0.1)

pode-se calcular a quantidade de radiao ( S ) que atinge um determinado local num


determinado perodo de tempo, obtida atravs da frmula
S = 0 cos

(0.2)

onde 0 representa a constante solar de 1367 kWh/m2.


O valor desta radiao deve, ainda, entrar em conta com os efeitos de atenuao da atmosfera
causados pela presena de partculas em suspenso e gases, e pela distncia que os raios
solares tm que percorrer, sendo esta distncia varivel de acordo com a altura do Sol em
relao ao horizonte.
Por ltimo, o valor obtido vlido apenas para uma superfcie plana, no entrando em conta
com a geometria do terreno.

)
A relao dos raios solares com a morfologia do terreno dada pelo ngulo de incidncia (
entre a normal da vertente e os raios solares, sendo traduzida pela equao

= cos cos Z + sin sin Z cos(


)
cos

(0.3)

em que:

Z ngulo zenital; - ngulo da vertente (declive); - ngulo do azimute solar;

- ngulo de incidncia entre a radiao e a


ngulo azimutal da vertente (exposio);
normal vertente.
O valor da radiao solar potencial para cada vertente , ento, dado pelo produto do ngulo

) com a radiao potencial na normal do plano horizontal ( S ).


de incidncia (cos
No entanto, esta relao representa unicamente o efeito de sombra (quando ocorre) por auto ocultamento, ou seja, o efeito de sombra gerado pela prpria clula, no considerando o
ocultamento com origem em unidades de relevo adjacentes (Felicsimo, 1994). A obteno

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

das reas de sombra pode ser facilmente realizada atravs de programas SIG que contenham
mdulos de clculo de modelos de sombra, como o caso do Software livre SAGA GIS
(Conrad, 2003), que foi aqui utilizado.

Clculo do modelo
A operao de clculo do valor de radiao potencial, para o PNSAC, realizada para cada
uma das clulas que compem o modelo de terreno, sendo ainda necessrio integrar o modelo
de declives e um modelo de exposio das vertentes, de modo a relacion-la com a
morfologia do terreno, como dado na equao do ngulo de incidncia. No entanto, tal como
evidenciado no ponto anterior, a quantidade de radiao solar para um local varia em termos
temporais com o ngulo horrio e com a declinao do Sol, ou seja, uma representao
correcta da quantidade total anual de radiao potencial recebida teria que compreender a
radiao de todos os dias do ano, por unidade temporal diria (por exemplo, hora a hora).
Desta forma, quanto mais detalhada esta resoluo temporal, mais preciso ser o valor obtido,
devido variao do ngulo de incidncia com a forma do terreno. Na impossibilidade
tcnica da realizao de um nmero to elevado de modelos e, tendo em conta que o interesse
maior deste derivado se prende com a variao da distribuio espacial da radiao no terreno
e no com os valores totais anuais, realizou-se a construo do modelo para o que podemos
chamar de dia mdio, ou seja, um dia de equincio com valores horrios acumulados da
radiao potencial recebida nas 24 horas.
O clculo foi realizado com recurso programao de uma rotina no Software ILWIS, que
aplica as equaes anteriores ao valor de cada clula para cada meia hora. Posteriormente,
foram retirados os valores de clulas que os modelos automticos do SAGA GIS (Conrad,
2003) indicam como estando sombra naquele perodo de tempo. O modelo final corresponde
ao somatrio das 48 meias horas, convertidos para kJ/m2.
Por se tratar de um modelo derivado de equaes de carcter exacto, no se considerou
necessrio recorrer sua validao.
O mapa resultante encontra-se na figura 1.

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Figura 1 Modelo da radiao solar potencial num dia de equincio.

3 Modelo de profundidade do horizonte A do solo


A formao do horizonte A do solo um processo complexo onde interagem diversas
variveis com relaes difusas. Como a modelao espacial da profundidade do horizonte A
no dispe de algoritmos especficos de clculo, recorreu-se utilizao de dois mtodos
estatsticos, e um com base em conhecimento experimental. Cada uma destas abordagens foi
utilizada para a realizao de um modelo, sendo por fim utilizado o que proporcionou
melhores resultados. Os modelos estatsticos escolhidos correspondem regresso linear
mltipla e probabilidade bayesiana, esta ltima utilizada no sentido da probabilidade de
cada clula pertencer a uma determinada classe de profundidade. Foi tambm realizado um
outro, por combinao linear ponderada, com valores atribudos numa base experimental.
Estes mtodos foram considerados, conceptualmente, os mais adequados em funo do
pretendido e da informao disponvel.
Para a realizao que qualquer um destes modelos foi necessrio recolher, inicialmente, uma
amostra de profundidades deste horizonte na rea em estudo. No total foram efectuados 78
levantamentos, recorrendo a um mtodo de amostragem aleatria estratificada, considerando a
variao das diversas variveis categricas adiante descritas. A realizao deste tipo de
amostragem para variveis contnuas , obviamente, impraticvel, tendo-se neste caso optado
por efectuar levantamentos em reas o mais contrastadas possvel.
Do total de pontos amostrados foram extrados, aleatoriamente, 12 ( 15%) para validao
dos modelos, sendo estes calibrados apenas com os restantes 66 ( 85%).
A escolha das variveis independentes para o clculo de um modelo deste gnero requer,
partida, algum conhecimento dos factores que influenciam o desenvolvimento do solo. As

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

variveis consideradas baseiam-se no trabalho de Costa (2004), que refere como principais
factores de formao do solo: o clima, os organismos, a rocha-me, o relevo e o tempo.
O factor climtico no considerado, uma vez que se admite que a rea de estudo no
apresenta contrastes suficientemente significativos para o processo de formao do solo.
Tambm o factor tempo no foi considerado por no ser espacialmente representvel, pelo
menos considerando um modelo esttico, como se pretende. Deste modo foram apenas
considerados os restantes factores. Os organismos (neste caso apenas macroscpicos) so
representados por um ndice de vegetao, a rocha-me pela geologia do substrato e o relevo
por alguns modelos representativos da sua complexidade. A geologia foi obtida a partir da
vectorizao das Cartas Geolgicas de Portugal 26-B, 26-D, 27-A e 27-C, escala 1: 50 000.
No que respeita aos ndices topogrficos foram considerados o declive, o ndice CTI
(Compound Topographical Index) e o ndice STI (Sediment Transport Index) (Hengl et al.,
2003), assim como um modelo de reas planas classificadas em topo, patamar e base. Este
modelo foi obtido atravs de um algoritmo desenvolvido para o presente trabalho, e tendo
como base a comparao de valores de altitude das ltimas clulas, consideradas planas, com
as clulas limtrofes. Por fim, como representao da influncia biolgica, considerou-se um
ndice NDVI (Normalized Difference Vegetation Index) obtido a partir de bandas LANDSAT.

Modelao com recurso regresso linear mltipla


O modelo de regresso linear mltipla apresenta, partida, algumas limitaes para o
presente estudo. Com efeito, a integrao de variveis categricas neste modelo limitada,
sendo apenas passvel de realizar atravs da sua simplificao para variveis binomiais.
Assim, a integrao da informao foi realizada atravs de uma regresso passo a passo
forward, pois, com este processo, o modelo alm de recusar as variveis que no
contribuem para melhorar significativamente as previses da varivel dependente, comunica
tambm o contributo de cada uma das aceites.
A aplicao do modelo atingiu um coeficiente de determinao (R2) de 70,9%. Neste modelo
apenas foram consideradas as variveis com um grau de confiana de 95% (p< 0,05) e, por
conseguinte, somente integraram o modelo o CTI (p=0,0), as Bases (p< 0,0), o Declive
(p= 0,03) e os Topos(p= 0,048). Entre os resultados do modelo constam, tambm, os
valores dos parmetros que expressam a equao da regresso 1.4
Horizonte A = 13,8 + 13, 9 Bases 5, 21 Topos 0, 219 Declive + 1,16 CTI2

(0.4)

Esta equao foi executada utilizando os mapas como variveis. O mapa gerado visvel na
figura 2.
9

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Figura 2 Modelao da profundidade do horizonte A do solo com recurso regresso linear mltipla.

Modelao com recurso anlise ponderada de factores


Este mtodo assenta, essencialmente, na atribuio de valores a cada classe dentro de cada
varivel e, por fim, entre as vrias variveis. O modelo resultante ter os seus valores mais
elevados para os locais considerados com maior grau de desenvolvimento. Estes quantitativos
foram atribudos, tendo por base algum conhecimento de especialistas, e os valores de
coeficiente de correlao de Pearson, entre os valores de profundidade amostrados e as
diversas variveis consideradas. Para a execuo deste modelo foram apenas consideradas as
variveis contnuas que apresentaram coeficientes de correlao considerados significativos
(declives e CTI) e as restantes variveis categricas iniciais (geologia e reas planas). Estes
modelos foram escalonados de acordo com a interpretao de vrios resultados estatsticos
entre estes e as profundidades medidas no terreno e por fim agregados e re-escalonados entre
si para a obteno do modelo final.
O modelo resultante foi reescalonado linearmente, atribuindo-se o valor mximo registado de
profundidade (40cm) ao valor mximo do escalonamento, e o mesmo para o valor inferior
(1cm).

Modelao com recurso probabilidade bayesiana


A metodologia de implementao com recurso probabilidade bayesiana teve por base o
trabalho de Reis et al. (2003), e compreende quatro fases antes da integrao: clculo das
probabilidades priori de encontrar cada classe numa varivel, probabilidade conjunta de
encontrar as classes das vrias variveis e a probabilidade condicionada, ou seja, a

10

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

probabilidade de encontrar cada um dos eventos (classe de profundidade de horizonte A)


associado a cada classe de cada varivel e o clculo da probabilidade de encontrar cada um
dos eventos na rea de estudo.
A utilizao deste mtodo requer, partida, que todos os temas integrantes sejam categricos,
incluindo a varivel dependente. Com base na interpretao de um histograma de pontos e nos
objectivos a que o mapa final se destina, foram efectuados trs mapas matriciais de eventos,
cada um contendo uma das seguintes classes: 0 7 cm; >7 19 cm; >19 40 cm.
Tal como na combinao ponderada, tambm os modelos considerados para integrar esta
anlise probabilstica, foram os que apresentaram coeficientes de correlao considerados
significativos com a varivel dependente (declives e CTI) e restantes variveis categricas
iniciais (geologia e reas planas).
Uma vez criados todos os temas necessrios, foi ento efectuada a integrao da informao
para cada um dos trs temas, atravs da frmula 1.5, adaptada da teoria da probabilidade de
Bayes.

PClasse =

pxi cxi
py n 1 Cjxi

(0.5)

Sendo: pxi a probabilidade priori de cada varivel independente; cxi a probabilidade


condicionada de cada varivel independente; py a probabilidade de encontrar cada um dos
eventos na rea de estudo; e Cjxi a probabilidade conjunta.
Os temas com probabilidades de 0 a 100 foram congregados num nico, que atribui o valor da
classe com maior valor de probabilidade de ocorrer.

Avaliao e validao dos modelos


Para avaliao do desempenho de cada um destes modelos foi ento aplicada uma validao
cruzada com os 15% de pontos amostrados no includos na calibrao dos modelos. Para esta
avaliao foram calculadas, para os modelos contnuos, vrias estatsticas bsicas dos valores
de erro, como o seu desvio-padro e o erro mdio, de acordo com a frmula 1.6
E.M. = | Xi Yi | / n

(0.6)

Para o modelo categrico, derivado da probabilidade de Bayes, foi efectuada uma comparao
directa entre as classificaes obtidas e os valores dos pontos de validao.

11

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Quadro I Erro mdio e estatsticas sumrias (cm) dos valores de erro do modelo originado por regresso
linear mltipla e ponderao de factores

Regresso linear
Ponderao de
factores

E. M.

Desvio-padro

Mnimo

Mximo

Mediana

12

4,2

2,9

8,2

12

6,5

5,1

18,44

4,9

Quadro II - Percentagens de validao das classes obtidas com modelao


por probabilidades de Bayes

n
12

% de
% de
% de classe incorrecta que
% de classe incorrecta que no
classe
classe
pertencem classe
pertencem classe imediatamente
seguinte
correcta incorrecta imediatamente seguinte
66,6

33,3

75,3

24,7

O modelo que, partida, apresentou os melhores resultados foi o derivado da regresso linear
mltipla. O erro mdio apresentado foi menor que o do mtodo de modelao por ponderao
de factores (-2,3 cm), o desvio-padro foi menor (-2,2 cm) e o erro mximo foi tambm
bastante inferior (-10,2 cm). O modelo derivado das probabilidades de Bayes tambm no
atingiu um grau de desempenho muito elevado (66%), muito possivelmente devido
necessidade de desagregao da varivel dependente em trs sub-amostras.
Considerando-se estes resultados, a modelao de habitats ir integrar o mapa obtido por
regresso linear mltipla.

4 - Modelo da geologia do substrato


A geologia do substrato, surge tambm como uma das variveis que melhor pode ajudar
diferenciao das propriedades do solo, complementando o modelo anterior. A sua obteno
foi efectuada a partir da digitalizao das cartas geolgicas de Portugal 26-B, 26-D, 27-A e
27-C, escala 1: 50 000. Apesar desta escala ser menor que a restante informao integrada
neste trabalho, o peso que empiricamente esta varivel aparenta representar e o facto de
muitas das formaes geolgicas aqui presentes apresentarem reas de grandes dimenses
originando erros cartogrficos considerveis apenas nos seus limites, fez com que a sua
integrao como modelo independente fosse considerada adequada.
As classes de geologia das formaes foram amplamente simplificadas, tendo-se optado por
manter unicamente a referncia designao mais geral de cada classe indicada nas cartas.

12

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Assim foram individualizadas as seguintes classes: Calcrios; Calcrios e margas; Detritos;


Aluvies; Arenitos; Rochas vulcnicas e Grs.

5 - Modelao da intensidade do vento


A modelao, quer da intensidade do vento quer da sua direco escala local, tem sido uma
das reas menos exploradas e menos acessveis no mbito da modelao espacial,
particularmente no que diz respeito sua integrao com Sistemas de Informao Geogrfica.
Apesar da existncia de diversos modelos exteriores aos SIG, a especificidade da rea de
estudo, dotada de uma topografia complexa, e o elevado detalhe requerido, fez recair as
possibilidades de escolha em sistemas ainda pouco desenvolvidos e que requerem um elevado
esforo de configurao.
Aps uma pesquisa acerca das possibilidades de modelao e da sua adequao rea de
estudo, optou-se pela utilizao do algoritmo em desenvolvimento pelo United States Forests
Service (USFS), denominado WindWizard, sob o regime de utilizadores de teste (beta testers).

Este ambiente de modelao assenta nos princpios da dinmica de fluidos, pelo que aplica as
equaes de Navier-Stokes, para descrever o fluxo do vento ao longo das variaes do terreno.
A turbulncia, sendo a principal debilidade das equaes referidas, modelada com a
aproximao rng (Butler et al., 2006).
A aplicao destas equaes implementadas no WindWizard computa clulas tridimensionais
de dimenso varivel sobre o modelo de altitudes, interpretando para cada uma o fluxo e a
intensidade, de acordo com os valores das clulas vizinhas. A sua aplicao sobre a rea de
estudo requer vrios parmetros de entrada, sendo necessrio fornecer, logo partida, um
modelo digital do terreno em estrutura matricial, pelo que se forneceu um modelo matricial
com resoluo de clula de 30 metros. Neste modelo digital do terreno foi includa uma rea
envolvente de 5 km em redor dos limites do PNSAC, de modo a entrar em conta com o efeito
da orografia circundante. Relativamente representao do terreno ainda necessrio indicar
a sua rugosidade dominante. A rugosidade corresponde ao nvel de atrito e tipo de obstculos
que o fluxo de ar encontra no seu percurso. Assim, e considerando o domnio arbustivo
existente na rea de estudo, foi indicada uma rugosidade mdia adequada a este tipo de
cobertura. Os parmetros da velocidade e orientao do fluxo de vento, tambm necessrios
como parmetro de entrada, foram obtidos com base nas aero-sondagens de Lisboa-Portela.
Apesar do afastamento geogrfico entre os dois locais, o WindWizard assenta a sua
modelao em valores registados em altitude, de preferncia ligeiramente acima do ponto
mais elevado que se encontre na rea, que de 678 m na Serra de Aire. Assim, as leituras
13

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

foram efectuadas aos 925 hPa que, com a reduo da atraco gravitacional da terra,
corresponde aproximadamente aos 800 metros de altitude. As leituras realizadas a 925 hPa,
ainda que com algum afastamento da rea de estudo, mantm-se fiveis, pois altitude que
este nvel de presso se reporta no so sentidos, para esta rea, os efeitos da orografia que
caracterizam as medies das estaes meteorolgicas superfcie. Assim, foram utilizados
os registos gratuitos das aero-sondagens de Lisboa-Portela, compreendendo um perodo
disponvel de 7 anos, de 1999 a 2005, com interrupes. Os valores de velocidade e
orientao aos 925 hPa foram agrupados e separados por octante de provenincia, tendo sido
calculada a frequncia de cada um deles ao longo do ano, bem como a sua velocidade mdia.
Na modelao foi ento introduzido o valor central de cada octante, em graus, e a velocidade
mdia correspondente, tendo sido efectuado, a posteriori, a ponderao final dos modelos.

Validao do modelo
A validao deste modelo est condicionada pelos dados das estaes meteorolgicas
existentes na rea. Dentro dos limites do PNSAC existem duas estaes meteorolgicas
automticas, uma localizada a Norte de Minde e a outra no Arrimal, junto Lagoa Pequena.
Para a validao, alm destas, foram ainda consideradas outras quatro estaes, situadas fora
dos limites do PNSAC, mas consideravelmente afastadas dos limites do modelo de altitudes
que serviu de base modelao do vento. As quatros estaes automticas exteriores ao
PNSAC so as de Abr, Porto de Ms, Aljubarrota e Crespos. Os registos destas estaes no
vo alm de 3-4 anos, o que de certo modo impossibilita a avaliao do modelo total. Assim,
e tendo em conta este factor limitante, optou-se por avaliar um modelo por estao que entra
em conta unicamente com o perodo para o qual esta possui valores registados, ou seja,
procedeu-se criao de um modelo para cada estao com os valores em altitude (LisboaPortela) ponderados pelo perodo de tempo que a estao meteorolgica disponibiliza. Aps a
construo ponderada de cada um destes modelos, procedeu-se comparao dos seus valores
com os valores registados nas estaes, visvel na figura 3.
m/s

4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5

Modelados
Registados

0,0
Abr

Aljub.

Arrimal

Minde

Crespos

P. Ms

Figura 3 Comparao entre os valores de intensidade do vento modelados e registados.

14

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Como se pode verificar, os resultados modelados aproximam-se bastante dos valores


registados pelas estaes, sendo a diferena mxima de 0,6 m/s na estao de Porto de Ms.
Com uma amplitude de variao total de 8,7 m/s, um erro mximo registado na ordem dos 7%
considerado bastante adequado para o fim a que se prope o modelo. Nota-se, no entanto,
uma tendncia para a modelao de valores mais elevados que, efectivamente, os registados.
Tal facto poder dever-se existncia de barreiras progresso do vento, que no estejam
contempladas no modelo digital do terreno, como habitaes ou vegetao de grande porte.
O modelo resultante encontra-se na figura 4.

Figura 4 Modelo da intensidade mdia do vento.

6 - Modelo de fluxo acumulado de gua


Como referido na introduo deste captulo, a varivel gua traduzida apenas por um
modelo indirecto, derivado do modelo digital do terreno. Este modelo corresponde
representao quantitativa do fluxo acumulado, que passa por cada uma das clulas, como
resultado da drenagem das clulas a montante.
Este modelo traduz o somatrio do nmero de clulas das quais recebe fluxo, acrescido do seu
prprio valor (1). Desta forma possvel hierarquizar as clulas de acordo com a maior ou
menor quantidade de gua recebida. Esta hierarquizao foi realizada sem que se tivesse
efectuado a remoo de reas que funcionam como poo, ou seja, reas que no drenam
para o exterior, resultantes da sua natureza crsica e da existncia de uma elevada quantidade
de depresses. O clculo foi realizado directamente com recurso ao mdulo de
hidroprocessamento do Software ILWIS. Aps o seu clculo, foi necessrio efectuado em

15

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

escalonamento de 0 a 100 dos seus valores originais, devido aos valores de acumulao
extremamente elevados que estes modelos por vezes atingem.

7 - Modelo do uso do solo


A informao utilizada para este processo corresponde s bandas espectrais captadas pelo
sensor Enhanced Thematic Mapper plus (ETM+) do satlite Landsat 7, para o ano de 2001, e
com uma resoluo espacial de 30 metros.
Antes de se proceder a qualquer processo de extraco de informao til, foi necessrio
realizar um conjunto de procedimentos com vista correco de eventuais erros decorrentes
do processo de aquisio de informao. Estes procedimentos incluem a georreferenciao ou
correco geomtrica e a correco radiomtrica da imagem.
Para a obteno deste modelo, optou-se por realizar uma classificao supervisionada, a qual
se baseia num conhecimento prvio da rea em estudo. Este conhecimento prvio resultou de
levantamentos do uso de solo na rea de estudo. No total foram efectuados 46 levantamentos,
correspondentes a diferentes usos do solo, dos quais foram seleccionados, com base num
mtodo de amostragem aleatria estratificada, 27 pontos para a realizao do modelo e 19
para a validao do mesmo.
No presente trabalho, as reas de teste necessrias para este mtodo foram delimitadas como
base na agregao das bandas espectrais 3, 2 e 1, da qual resulta uma composio colorida
correspondente cor real, e nos 27 pontos de amostragem destinados realizao do modelo
que, por conseguinte, correspondem a diferentes usos do solo. A individualizao das classes
que iro constar no mapa foi realizada com base em observaes no terreno, nas quais se
constatou 7 classes predominantes: misto de rocha e solo nu com vegetao dispersa, terreno
agrcola, vegetao herbcea, vegetao arbustiva, vegetao arbrea, pedreira, e em
informao j existente, no caso da rea edificada. Dadas as dificuldades que surgiram na
distino entre a vegetao herbcea e a arbustiva, optou-se por integrar estes dois usos na
mesma classe. Estas reas de teste so, ento, definidas como um ficheiro vectorial de
assinaturas, ao qual se atribui o nome de cada classe, sendo este ficheiro de assinaturas
processado sobre as 7 bandas.
Para a realizao da classificao utilizou-se o classificador de mxima verosimilhana, por
ser um dos mtodos de classificao mais utilizados e considerado um dos que apresenta
melhores resultados (por ex. Miskov (2007)).
Este mtodo pressupe o clculo do vector mdio e da matriz de co-varincia das respostas
espectrais de cada classe. Ao assumir que os nveis radiomtricos de cada amostra se
16

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

encontram prximos da distribuio normal (Gaussiana), dada atravs do vector mdio da


classe, a atribuio do pixel feita classe segundo a qual ele ter mais probabilidade de
pertencer. O mapa resultante pode ser observado na figura 5.

Figura 5 Mapa do uso do solo.

Validao do modelo
Para a validao do modelo realizou-se uma sobreposio entre o mapa originado
anteriormente e os pontos amostrados no terreno que se encontravam destinados a este fim.
Assim, foram calculadas as percentagens relativas aos pontos cujas classes foram
correctamente atribudas e, consequentemente, foram tambm calculadas as percentagens de
carcter errneo. A preciso obtida foi de 89,5%.

III - Introduo aos mtodos de modelao de habitats potenciais


Definido em termos gerais, um modelo de habitat potencial representa a relao entre as
espcies e os factores que se considera controlarem a sua existncia. A avaliao desta relao
pode ser efectuada de vrias formas e deve ter em considerao, sobretudo, o tipo de dados
existente e o grau de conhecimento acerca das relaes da espcie com o meio.
No que diz respeito aos dados so, sobretudo, os de carcter dependente que ditam a natureza
da formulao a utilizar. Estes podem-se referir a levantamentos de presena-ausncia,
abundncia, ou taxas demogrficas. O tipo mais comum de dados relaciona-se com a
presena-ausncia, sendo muitas vezes pautado apenas por dados de presena, obtidos, por
exemplo, em herbrios. Esta condio dos dados impossibilita a utilizao de muitos dos
mtodos estatsticos utilizados para modelao de habitats, aspecto em relao ao qual este

17

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

trabalho se precaveu, atravs do levantamento de diversas localizaes onde nunca se


verificou a ocorrncia das espcies de interesse.
O tipo de relao existente entre a espcie e os factores do meio tambm deve ser tido em
conta. As relaes mais conhecidas so as lineares, que correspondem, por exemplo, a
situaes de aumento do nmero de indivduos proporcionalmente ao aumento da
disponibilidade de gua. Esta relao, na maioria das vezes, tende a ser vlida apenas para
intervalos de variao curtos. Assim, tal como descrito pela lei da tolerncia de Shelford, o
contnuo aumento da disponibilidade de gua faria atingir um limiar a partir do qual esta
inverteria a tendncia de crescimento, originando uma relao em forma de sino (relao
Gaussiana). Apesar de se possuir algum conhecimento sobre este tipo de relaes
estabelecidas entre as diversas espcies e alguns factores, este no de todo completo.
McCune (2006) refere que, apesar do papel central destas relaes na modelao de habitats
potenciais, o nosso conhecimento relativamente a elas ainda primitivo, sobretudo quando
so considerados vrios factores em simultneo.
O mtodo de integrao da informao considerando os aspectos anteriormente descritos
pode, ainda assim, assumir diversas formas. A sua escolha, segundo Guisan e Zimmerman,
(2000), corresponde escolha de um algoritmo apropriado ao contexto da modelao e para
previso de um tipo particular de varivel de resposta, de estimao de coeficientes. Os
mesmos autores referem sete categorias de modelos estatsticos possveis de utilizar, os quais,
na nossa opinio, devero ainda ser acompanhados de mtodos baseados em conhecimento de
especialistas atravs de ponderaes directas. As categorias compreendem: regresses lineares
e no lineares paramtricas e no paramtricas; mtodos de classificao; modelos de
medio de similaridade; tcnicas de ordenao; modelos de probabilidade de Bayes; redes
neuronais e por ltimo uma categoria que conjuga vrias destas tcnicas. A primeira categoria
compreende os mtodos mais comummente utilizados, como a regresso linear mltipla ou a
regresso logstica. Paralelamente a estas, ocorre tambm a regresso aditiva generalizada
(GAM), um mtodo no paramtrico surgido recentemente nesta rea, com resultados
geralmente superiores aos modelos anteriores (Segurado e Arajo, 2004). Os mtodos de
classificao compreendem tcnicas como as rvores de deciso ou tcnicas de anlise de
semelhana. Os mtodos de medio de similaridade, baseiam-se na construo de ndices de
semelhana dos dados de presena existentes e, como tal, dispensam dados de ausncia.
Tambm as tcnicas de ordenao utilizam somente os dados de presena e compreendem
modelos, como a anlise factorial do nicho ecolgico (ENFA), que utilizada, por exemplo,
em modelos como o BIOMAPPER. A quinta categoria compreende a probabilidade de Bayes,
18

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

j descrita na modelao da profundidade do horizonte A do solo. As redes neuronais,


includos

na

penltima

categoria,

correspondem

modelos

no

paramtricos,

conceptualmente semelhantes regresso aditiva generalizada, e que podem ser utilizadas


tanto em classificao como para regresso.
Segurado e Arajo (2004), que efectuam uma comparao do desempenho de alguns destes
mtodos para modelao de habitats, referem ainda os interpoladores espaciais, onde se pode
referir a interpolao linear simples ou a krigagem. Estes autores, utilizando um volume
elevado de dados de presena e ausncia de espcies, efectuaram uma comparao das
performances de cada uma destas tcnicas. Os resultados obtidos neste trabalho indicam um
melhor desempenho geral das redes neuronais. Guisan e Zimmerman (2000) referem que a
utilizao de redes neuronais uma rea promissora na modelao de habitats, apesar do
ainda reduzido nmero de exemplos existentes. Inversamente, as tcnicas com resultados
inferiores, corresponderam s que utilizam apenas dados de presena, ou seja, os ndices de
semelhana e as tcnicas de ordenao. Entre estes nveis de desempenho situaram-se as
restantes tcnicas, com destaque pela positiva para a GAM.
Considerando os resultados obtidos por estes vrios trabalhos, optou-se pela utilizao das
redes neuronais como mtodo estatstico de integrao. Este mtodo, pela sua natureza no
paramtrica, apresenta a vantagem de no assumir nenhuma forma para a relao entre as
espcies e os factores considerados, o que se coaduna com o grau de conhecimento das
espcies deste trabalho.

1 - Introduo s redes neuronais artificiais como mtodo de regresso no paramtrico


As redes neuronais artificiais podem ser entendidas como modelos estatsticos adaptativos,
baseados na estrutura de funcionamento do crebro (Abdi, 2003). Dizem-se adaptativos
porque conseguem aprender a estimar os parmetros de uma populao, utilizando um
pequeno nmero de exemplares desta. A sua estrutura basicamente constituda por unidades
simples, designadas de neurnios, por analogia com as unidades cerebrais, sendo que estas
unidades esto ligadas por um conjunto de arcos com ponderaes associadas. O processo de
aprendizagem corresponde, de um modo geral, simples modificao dos valores de
ponderao atribudos a cada arco que liga os neurnios.
As redes neuronais artificiais estruturam comummente as suas unidades em camadas (layers).
A primeira a camada de entrada (input layer) e a ltima a de sada (output layer). As
camadas intermdias, quando existentes, so designadas de camadas escondidas (hidden
layers). A informao a ser analisada pela rede d, ento, entrada pelos neurnios da camada

19

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

de entrada e propagada atravs dos arcos para a camada seguinte. Posteriormente, o


resultado deste processamento propagado para os neurnios da camada seguinte, e assim por
diante at que seja atingida a camada de sada. Este processamento em rede tem como
objectivo apreender as associaes existentes entre os padres das variveis consideradas no
dependentes (de entrada) e as dependentes (de sada). Este processo de aprendizagem
realizado atravs da alterao dos valores de ponderao (por atenuao ou amplificao),
atribudos aos arcos que ligam cada neurnio, em funo da performance obtida.
A aprendizagem, tal como j foi referido, definida pelo valor de ponderao atribudo a cada
arco, podendo as suas alteraes de valor serem separadas em processos de aprendizagem
supervisionada e no supervisionada. A aprendizagem supervisionada, adoptada neste estudo,
ocorre quando os valores de sada so conhecidos e utilizados, e se entra em linha de conta
com os sinais de erro derivados da ponderao.
O modelo utilizado para efectuar esta investigao apresenta uma estrutura de mltipla
camada perceptro (multilayer perceptron) e, para o efeito, recorreu-se ao software Tiberius
Data Mining. Esta estrutura, sendo uma das mais populares, constituda por uma camada de

entrada, uma ou mais camadas escondidas e uma camada de sada. Com excepo da camada
de entrada, todas as outras so constitudas por neurnios que apresentam capacidade de
aprendizagem. Estas redes so do tipo progressivo, ou seja, o fluxo processa-se unicamente no
sentido da sada de uma camada, para a entrada da camada seguinte, sem que ocorram
processos de retrocesso. A camada de entrada integra as variveis consideradas
condicionantes dos resultados da camada de sada. Assim, a camada de entrada vai
corresponder s variveis independentes e a camada de sada presena ou ausncia das
espcies. Deste modo, ainda necessrio configurar o nmero de camadas escondidas e o
nmero de neurnios presente em cada uma destas camadas.
Aps a configurao da rede, indicado o tipo de aprendizagem que esta vai efectuar. O
sistema Tiberius utiliza a retropropagao do erro, correspondendo este processo a um
mtodo de aprendizagem por correco do mesmo. A forma de aprendizagem realiza-se em
duas fases: inicialmente emitido um valor de teste, no sentido directo (das camadas de
entrada para a de sada), em que as ligaes das camadas apresentam um valor fixo.
Posteriormente, ao atingir a camada de sada, gerado um sinal de erro atravs da subtraco
dos valores chegados com os encontrados na camada de sada. Por conseguinte, este sinal de
erro obtido propagado de volta atravs dos mesmos neurnios, sendo os pesos das ligaes
ajustados de forma a aproximar, o mais possvel, os valores obtidos com os da camada de
sada.
20

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Assim, a utilizao de redes neuronais , sobretudo, indicada nos casos em que no


conhecida a natureza exacta das relaes existentes entre os inputs e os outputs ou quando os
sistemas so demasiado complexos, para que se conheam relaes directas ou lineares, como
acontece nas relaes entre as espcies consideradas e os restantes factores.

2 Modelao do habitat potencial para as espcies de estudo


A realizao dos modelos de habitat potencial assenta, inicialmente, na interseco entre os
pontos de presena e ausncia de determinada espcie, e os valores obtidos, atravs dos
modelos espaciais das variveis independentes, nessa mesma localizao.
Os resultados adquiridos nesta operao so agrupados numa tabela nica, que passa a conter
a indicao de presena ou ausncia, e correspondentes valores das variveis consideradas
para a construo dos modelos de habitat potencial.
Antes de se proceder construo da rede neuronal artificial necessrio converter as
variveis categricas em variveis binomiais e proceder sua simplificao. O elevado
nmero de classes que estas apresentam, torna necessria a sua simplificao, de forma a
reduzir o nmero de variveis integrantes da regresso. Este processo permite, tambm,
reduzir a influncia de classes para as quais no se conhecem registos acerca da existncia ou
no da espcie.
A natureza heurstica das redes neuronais artificiais faz com que os seus resultados finais
apresentem ligeiras diferenas. Este aspecto implica a realizao de mais de um modelo,
sendo o final obtido atravs de uma mdia aritmtica simples. Assim, foram realizados cinco
modelos preliminares, com vista obteno de cada um dos modelos finais.
O mtodo de aprendizagem escolhido, para o treino das redes, corresponde tentativa de
reduo do erro quadrtico mdio, sendo cada um dos cinco modelos treinados por um
perodo de cerca de 1 hora. As equaes que traduzem as regresses so aplicadas,
directamente, aos modelos de variveis independentes. Os seus valores resultantes vo,
tendencialmente, aproximar-se do valor de presena (1) ou de ausncia (0). No entanto, o
intervalo de variao pode percorrer toda a amplitude que separa estes valores ou at
ultrapass-la. Para uniformizar os valores finais, tornou-se necessrio proceder a um
escalonamento linear simples, baseado nos valores mximo e mnimo modelados para um
intervalo de probabilidade de ocorrncia de 0 a 100. Os modelos resultantes so visveis nas
figuras 6, 7 e 8.

21

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

Figura 6 Habitat potencial de Thymus villosus L. sub. villosus.

Figura 7 Habitat potencial de Teucrium chamaedrys L.

Figura 8 Habitat potencial de Silene longicilia Otth.

Validao dos modelos


A validao destes modelos foi realizada de forma a minimizar a necessidade de se extrair
dados da amostra que serve de calibrao regresso. Para isso foi efectuada uma validao
22

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

cruzada K-fold. Este mtodo de validao consiste na reteno, para efeitos de validao, de
um reduzido nmero de registos de presenas aleatrias, sendo o modelo calibrado com os
restantes. Os valores obtidos pela regresso so, ento, comparados com os valores extrados
para validao. O processo repetido vrias vezes, com sub-amostras distintas, sendo o valor
de validao final obtido atravs da mdia aritmtica simples das diferentes comparaes.
Para a criao de cada uma das sub-amostras de validao foram extrados quatro registos. O
quadro III mostra os valores estatsticos simples do erro obtido de cada um dos modelos finais
para cada um dos cinco modelos preliminares, que lhes deram origem. Estes valores de erro
correspondem diferena entre o valor de probabilidade modelada, e o valor de presena (1)
ou de ausncia (0) efectivamente registados.
Quadro III Erro mdio e estatsticas sumrias dos valores de erro para os trs modelos de habitat
potencial

E. M.

Desvio-padro

Mnimo

Mximo

Mediana

Thymus villosus

20

0,26

0,12

0,96

0,22

Teucrium chamaedrys

20

0,21

0,09

0,78

0,21

Silene longicilia

20

0,15

0,08

0,86

0,17

Interpretao dos resultados


Atravs da anlise aos valores de validao obtidos verifica-se uma maior prestao do
modelo representativo do habitat potencial da espcie Silene longicilia, atingindo uma
preciso mdia de 85% (100 E.M.x100). O modelo seguinte, em termos de desempenho,
corresponde ao realizado para a espcie Teucrium chamaedrys, com 79 % e, por fim, o
correspondente ao Thymus villosus sub. villosus com 74%. Os valores de desempenho
verificados aparentam estar relacionados com o nmero de registos utilizados para a
calibrao das redes neuronais. O modelo da Silene longicilia, para o qual foi includo o
maior nmero de registos de presena-ausncia (110), apresentou o melhor desempenho,
tendo este diminudo, progressivamente, nos outros dois modelos, de acordo com a reduo
do nmero destes registos.

Concluses
A realizao deste trabalho permitiu, sobretudo, identificar uma metodologia vlida para a
obteno de habitats potenciais. Com resultados de desempenho entre os 74% e os 85% podese confirmar, em grande parte, a aplicabilidade das redes neuronais artificias em trabalhos
23

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

desta natureza. de referir o aumento do desempenho com o respectivo acrscimo de nmero


de pontos amostrados, o que evidencia a elevada importncia de levantamentos de campo
exaustivos.
Identificou-se que os softwares de SIG, de um modo geral, apresentam ainda muitas
limitaes no campo da anlise estatstica multivariada, tendo sido necessrio recorrer a
programas no direccionados, de forma directa, para a anlise de informao espacial. Este
factor depreende-se como o mais limitante para a realizao e uso deste tipo de modelos.
A modelao de muitas das propriedades biofsicas dos ecossistemas j possvel, quer por
mtodos determinsticos, quer por aproximao estatstica. Estes modelos devem, no entanto,
atingir elevados valores de preciso de forma a diminuir, o mximo possvel, a multiplicao
do seu erro. Esta situao foi, possivelmente, um dos principais agentes a contribuir para a
diminuio do desempenho dos modelos de habitat potencial realizados neste trabalho.
De entre os factores considerados, so vrios os que ainda no possuem metodologias de
representao espacial muito desenvolvidas. Foi, no entanto, na hidrologia, uma das reas
com maior desenvolvimento em sistemas de informao geogrfica, onde se verificou a maior
inadequao dos seus resultados, como varivel ecolgica.
O elevado nvel de detalhe utilizado neste trabalho (900 m2) tambm permitiu diminuir a
generalizao de informao, que pauta muitos dos trabalhos de modelao de habitats
potenciais, e que dificulta o reconhecimento de reas com reduzida expresso espacial. Os
constantes avanos na tecnologia tornam cada vez mais evidentes as vantagens de se trabalhar
a estas escalas de detalhe, outrora condicionadas pela capacidade de processamento dos
sistemas.

Referncias bibliogrficas:
ABDI, H. - Neural Networks. Pp. 1-5. In: LEWIS-BECK, M. ; BRYMAN, A.; FUTING, T. (eds.). Encyclopaedia of Social Sciences Research Methods. Thousand Oaks (CA): Sage.
2003.
BUTLER, B. W. Et al. WindWizard: a new tool for fire management decision support [Em
linha]. [S.l.]: USDA Forest Service Proceedings, 2006. p. 787-796. [Consult. 26 Fev. 2007].
Disponvel em: http://www.fs.fed.us/rm/pubs/rmrs_p041/rmrs_p041_787_796.pdf.
CONRAD, O. - SAGA: System for Automated Geo-scientific analysis. Saga team, Gottingen.
2003.

24

VI Congresso da Geografia Portuguesa


Lisboa, 17-20 de Outubro de 2007

COSTA, J. Caracterizao e constituio do solo. 7 ed. Lisboa: Fundao Calouste


Gulbenkian, 2004.
FELICSIMO, A. M. Modelos digitales del terreno [Em linha]: introduccin y aplicaciones
en las ciencias ambientales. Oviedo: Pentalfa, 1994. [Consult. 26 Fev. 2007]. Disponvel em:
http://www.etsimo.uniovi.es/~feli/pdf/libromdt.pdf.
FLOR, A. Plantas a proteger no Parque Natural das Serras de Aire e Candeeiros. Lisboa:
Instituto da Conservao da Natureza, 2005.
GUISAN, A.; ZIMMERMANN, N.E. Predictive habitat distribution models in ecology.
Ecological modelling. Netherlands: Elsevier. N. 135 (2000), pp. 147-186.

HENGL, T.; GRUBER, S.; SHRESTHA, D. P. Digital terrain analysis in ILWIS [Em
linha]. Enschede: International Institute for Geo-Information Science & Earth Observation,
2003,

actual.

Jul.

2003.

[Consult.

26

Fev.

2007].

Disponvel

em:

http://www.itc.nl/personal/shrestha/DTA.
McCUNE, B. Nonparametric multiplicative regression for habitat modeling [Em linha].
[Oregon: s.n.], 2006. [Consult. 26 Fev. 2007]. Disponvel em: http://soil.scijournals.org
/cgi/content/full/ 64/6/2046.
MISKOV, L. Mapping of urban green cover using different image processing techniques
on VHR satellite data. In: Proceedings of: High-Resolution Earth Imaging for Geospatial
Information, ISPRS Hannover Workshop, 2007.
ODUM, E. P. Fundamentos de ecologia. 7 ed. Lisboa: Fundao Calouste Gulbenkian,
2004.
OKE, T. R. Boundary layer climates. 2nd ed. London: Routledge, 1996.
REIS, E. Aplicao dos sistemas de informao geogrfica na anlise morfolgica de
bacias hidrogrficas. Lisboa: Universidade Tcnica de Lisboa, 1996. Dissertao de

Mestrado.
REIS, E. et al. Integrao de dados espaciais em SIG para avaliao da susceptibilidade
ocorrncia de deslizamentos. Finisterra. Lisboa: Centro de Estudos Geogrficos. Vol.
XXXVIII, N. 76 (2003), p. 3-34.
SEGURADO, P.; ARAJO, M. An evaluation of methods for modelling species
distributions. Journal of Biogeography. [S.l.]: Blackwell Publishing. N. 31 (2004), p. 15551568.
WHITTAKER, R.; ARAJO, M. Conservation biogeography: assessment and prospect.
Diversity and distributions. [S.l.]: Blackwell Publishing. N. 11 (2005), p. 3-23.

25

Você também pode gostar