Você está na página 1de 68

;a JEAN LOUIS VALENTIN

ECOLOGIA
NUMERICA
Uma introdu^ao
a analise multivariada
de dados ecologicos
JEAN LOUIS VALENTIN

ECOLOGIA
NUMERICA
Uma introducao
a analise multivariada
de dados ecologicos

EDITORA INTERCIENCIA

Rio de Janeiro
2000
i

Coptvright Cc 2000, by
Jean Louis Valentin

Dircitos rescr%ados cm 2000 por


Editora Intercicncia Ltda.

('apa
Cleber I ,

[ditoracao
Vera Barros

CIP-Brasil. Catalogar 5o- na-fonts


Sindicalo Nacional dos Editores de I,ivros, R.I.

V252c
Valentin, lean Louis, 1942-
Leologia num&ica : uma introdu4ao a analise multivariada de dados
ecologicos / Jean Louis Valentin. - Rio de Janeiro : Intcrcicncia, 2000

Anexos
Inclui hihliografia
IS13N 85-7193-032-5

1. Lcologia - Mctodos cstatisticos. 2. Analisc nmltivariada. I. Iitulo.


/1 miuba esposa.
00-0702. ('1)1) 574.5018 /l o.r meu .r /7lbo s.
CD[J 502:519.237 /1 gnem /ii (lei mitba rvda
um oceano de I'a Amor e I'elicidade.
E proihida a reprodu4ao total on parcial, por yuaisyucr meios.
scm autoriracao por escrito da cditora.

EDITORA INTERCIEN (' IA LT'DA.


Av. Pres. Vargas , 435/I8" andar - Rio do Janeiro - RJ - 20077-900
Tel.: (21)242-28(,1 /242-9095 - Fax: (21 )242-7787
e-mail: editora (a intercicncia . com.br

Impresso no Brasil - 1'rinled in Brazil


flos alunos, colega.r e a lodas as pessoa.r que, de a/guma forma,
contribuiram coin suas criticas ou sugestoes Para
o enriquecimento desta obra, agora publicada.
PREFACIO

No Brasil, poucas sao as Areas do ConhCCinacnto due tcm aprescntado indi-


ces tau clevados do creseimento Como a I{cnlugia, por cstar esta area da ciencia
diretamcntc associada cum a gestao raciunal dos rccursos naturais. Van<>s sao IS
naotiv<S yuc podcna ser apontadus Kara o inters I crescirncntu (lit I col<gia hrasi-
Icira. I?ntrc cstcs, it 1<>rniacao tic pessoal especializado ms difcrentcs arras da eco-
I<>kia c certamcnte una dos mais incisivos. A fonnac:io da massa critica do cc(' )Iogos
hrasilciros tcm proporcionado varias inscrcoes no descnvolvimento da 1=.colo-
gia no nosso pals. () a>nsidcravcl aumento do numcro do publicacocs geradas
na area nos ultimos anus no Brasil c a manifcstacao mais evidentc dcste d sen-
volvinaento, Kara 0 yual essay puhlicacoes tena tido um papel central.

A publica4ao da ohra l:ro/o is 1Nrnnrrird rcprescnta unia t rands cuntribui-


cao ao dcsenvulvinacnto da I.cologia quanutativa, uma das areas mais impurtan-
tCS da kcologia due sc encontra cm fasc do constants cvolur ao no Brasil. Os scis
capitulos clue comp ism a ohra proporcionarao ao lcitor uma ampla c modcrna
visto das possibilidadcs do aplica4ao da analisc nwltivariada a pcsyuisa ccologica.
Na pratica, csta ohra representa uma fcrr:unenta do grandc iniportancia, vista
yuc possihilitara ao cc<Slogo uma mancira eticicntc c ohjetiva do orianizacao,
desc64:io c interpretacao Cie Sens dados. Outrn aspccto relevante dcsta obra c 0
tau> yuc, cm todos OS capitulos, os exemplos tratados Sao dc amhientes tropi-
Cais, o yuc cm muito contrihuira Para a aplic:ahilidadc nos ccossistcmas brasi-

Iciros.

Parahenizo o Profess( > r lean V alentin por nos to proporeionacio csta ohra,
a yual c fruto do una lont;o e c11id :ados>1 procCSS<< do clahorm;iio. com grande
prazcr yuc a euniunidadc cicntitica hrasileira rccchc 1 ir-oh>,ia .\`umrrir<r c, ao
nacsnio tempo, agradece a cste grandc pesquisador por fornccer a c<nnunidadc
do cc<ilogos brasilciros subsidies indispcnsaveis a analisc c intcrpretacao do sells
dados.

Pro/. i'iaorisr-a de /l.r.ri.r i1--sieves


I

PROLOGO

I" com o objctivo de colocar a disposicao dos estudantes e dos profissio-


nais das areas dc eicncias ambientais e ecologia as bases nccessarias Para iniciar-se
na pratica da analise dc dados multivariados, yue resolvi transformar em manual
a apostila do mcu curso de Ecologia Numcrica , dispensado durante esses ulti-
mos anon corno disciplina de pus-graduacao eni diversas universidades do pail.
Nao pretendo, ncste livro basico, ter esgotado o assunto. Longc disso, pois
etc visa apcnas a um publico de principiantes, nao familiarizado com os metodos
de tratamcnto de dados em ecologic. Procurei rcalizar urn compromisso entre
uma excessiva simplificacao c urea abordagem matcmatica completa. Trata-se, do
certo modo, de uma obra de "vulgarizacao", no sentido de divulgar as principals
tccnicas de tratamcnto dc dados, clue os manuals existentes, todos em lingua
inglesa ou francesa, descrevem geralmente dentro do um contexto matematico
complexo, dc dificil compreensao Para o leigo.
l;ssa complcxidade, aliada a crescente disponibilidade do prograrnas de com-
putador, leva o usuario nao avisado ao carninho pcrigoso do use indiscriminado
dessas tccnicas c conscquentemcnte, no melhor dos casos, a inutilidade do trata-
mcnto c, na pior das hipotcscs, na formula4ao de conclusocs erroneas.
O livro c subdividido cm capitulos distintos. No (::ehitulo 1, o Icitor fara
uma revisao das stets bases matematicas minimas Para cntendcr o rncctnisnw das
tccnicas apresentadas. Trata -se de nocctes do algebra linear (e:ilculo vetorial c
matricial), cujo mcrito sera de mostrar de yue mancira uma matriz de dados
ccolcigicos pole ser gralica c matcntatieamente representada. () conccito de Ala-
dos multivariados" sera explicitado no Capitulo 2. No Capitulo 3 scrio apresen-
taclos alguns dos cocficientcs mail utilirados Para a claboracao da matriz do intcr-
rcla5 cs. I-ssa matriz constitui o panto de partida dc todas as tccnicas de analiscs
multivariadas descritas nos capitulos seguintes: o nxrdelo nutltilincar (regressao
multipla) (Capitulo 4), as analiscs de agrupaniento (Capita!,) 5) c do ordonacao
(analiscs fatoriats) (Capitulo 6). No final, scrao oferecidos exercit-ius a ,crem
desenvolvidos "na mao " ou pelo contputador, e uma lista, nao cxaustiva, de progra-
mas (IC coniputador disponivcis ii comcrcio sera apresentada.
SUMARIO

INTRODUQAO ................................................................................. XVII

Capitulo 1 - NOQOES DE ALGEBRA LINEAR ............................. 1

1. RI.Plu.SI.N 'I'A(,AO V'1:'1'ORIAI . DI: [\( PRO131.1:A1;1


I?COI.OG ICO ................................................................................................

2. OPFRA(r(I;S NOS VI 1'ORI?S ...............................................................


2.1 Multiplicacio do um \'ctor por um lEscalar ................................... 2
2.2 Adicio dc dais Vetores ......................................................................... 2
2.3 Produto Escalar do dois Vctores ........................................................ .i
2.4 Comprimcnto de urn Vctor ................................................................ 4
2.5 Normalizacio do urn \ 'ctor ................................................................ 4
2.6 Ortogonalidade do dois Vctores ......................................................... 5

3. NO(,AO DE DISTANCIA ........................................................................ 6


4. (:AI,CULO MATRICIAI ............................................................................ 7

4.1 Dcfini4<ics ...............................................................................................


4.2 Opcraq cs Matriciais .............. ............................................................. 9

5. RI?SOI .U(,AO DI'. UM SISI'RMA 1)1 n l:QUA(,OES CO,AI


INCOGNITAS .......................................................................................... 14
6. AUTOVALORES I; A11'I'O\'GTORI:S DI: UMMA i\IATRI ............. 16

Capitulo 2 - OS DADOS MULTIDIMENSIONAIS ........................ 19

1. A NO(,AO DE VARIA\'EI. DIi DIMF.NSAO m ............................... 19

2. OS DIVERSOS TIPOS DL DADOS ....................................................... 21


2.1 Os Dados Quantitativos .................................................................... 21
2.2 Os Dados Semiquantitativos .............................................................. 21
2.3 Os Dados Qualitativos ........................................................................ 22
2.4 Codificacio do uma Tabela de Dados Uctcrogcricos ......................22
I

xv
XIV ECOL(X;IA Nt mM RICA St INIARIO

1.3 Metodo pela Associacao Media ............................................................. 58


Capitulo3 - A MEDIDA DE SEMELHAN(;A .................................. 25
1.4 Metodo dos Pesos Proporcionais .......................................................... 58
1. PARA OS ESTUDOS EM MODO Q ..................................................... 25 c
1.5 Metodo pela Variancia Minima ............................................................. 5)

1.1 Coeficientes de Similaridade .............................................................. 25 1.6 Modelo Geral de Agrupamcnto ............................................................ 59


1.7 Qual Metodo I:scolhcr? .......................................................................... 60
1.1.1 Coeficicntc binarios, incluindo as duplas-ausencias ....... 27
1.8 A Intcrprctacao do Dcndrograma ........................................................ 61
1.1.2 Coeficientcs binarios, cxcluindo a dupla- ausencia .......... 27
1.1.3 Coeficientcs yuantitativos, incluindo a dupla-ausencia . 28 2. AGRUPAMIENTOS DIVISIVOS - PROGRAMA TWINSPAN
1.1.4 Coeficientes quantitativos, cxcluindo a dupla-ausencia . 28 (I11"0 WAY INDICATOR .ti'1'1?C11?S /INAI.PSIS) .................................. 61
1.2 Os Coeficientcs de Distancia ............................................................. 28
Capitulo 6 - OS METODOS DE ORDENACAO ............................ 67
1.2.1 A distancia euclidiana ............................................................. 29
1. OS DIVERSOS M1TODOS DL ORDENA(SAO ................................. 69
1.2.2 A distancia do Bray-Curtis .................................................... 29
2. A ANALISE EM COMPONLNTES PRINCIPALS .............................. 75
2. PARA OS ESTUDOS EM MODO R ..................................................... 30
2.1 A Prcparacao dos Dados ......................................................................... -5
2.1 Os Coeficientes de Dependencia ....................................................... 30
2.2 Os Calculos de uma ACP ...................................................................... 75
2.1.1 Para descritores metricos ....................................................... 30
2.2.1 Calculo dos cixos fatoriais .......................................................... 75
2.1.2 Para descritores ordenados nao-metricos ........................... 35
2.2.2 Calculo das coordenadas das amostras e das variavcis ........ 76
2.2 As Associacocs de Especies ................................................................ 38 2.2.3 Calculo das contribuicbcs das amostras c das variavcis ...... 76

A REGRESSAO MULTIPLA .................................... 41 2.3 Exemplo Numerico (adaptado de I,egcndtc & Legendre, 1998) ... 78
Capitulo 4 -
2.3.1 Calculos prcliminares .................................................................. 78
1. CALCULO DO MODELO MULTILINEAR I DOS
2.3.2 Cilculo dos autovalores (k) ........................................................ 79
COEFICIENTES DE CORRELA4AO ................................................. 42
2.3.3 Calculo dos autovalores (U) 80
1.1 Caso de Tres Variaveis ......................................................................... 42 2.3.4 Calculo das coordenadas dos pontos-amostra ....................... 81
=.3.5 Calculo das coordcnadas dos pontos-cspecic ......................... 82
1.1. i Calculos intermediarios ......................................................... 42
2.3.6 Calculo das contribuicc cs das espccics ................................... 83
1.1.2 Calculo de a e b ........................................................................ 43
2.3.7 Calculo das contribuicocs das amostras .......+ ......................... 84
1.1.3 Calculo do erro medio da estimativa ................................. 44
1.1.4 Calculo do coeficiente de corrclacao e de determinacao 4 A lnterprctacao dos Resultados ............ .............................................. 85
1
mtiltipla . .................................................................................................. 44 2. 5 A Validadc dos Rcsultados ..................................................................... 86
i.1.5 Calculo dos eoeficientes de correlacao parcial ........... ...... 45 2.6 Aprescntacao dos Resultados ................................................................. 88
2.7 Intcrprctacao do uma Ordenacao com Base em Dados Externos. 89
1.2 Caso Gera] pelos Metodos Matriciais .............................................. 46
2.7.1 Analises indiretas .......................................................................... 89
2. SELECAO DL VARIAVEIS E,XPLICATIVAS- MITODO
2.7.2 Analises diretas - a ordcnacao canonica ................................. 90
DA REGRESSAO MULTIPLA "PASSO A PASSO.. ......................... 48
2.8 Apresentacao Gri ica dos Pianos Fatoriais ........................................ 91
Capitulo 5 - A ANALISE DE AGRUPAMENTO ............................. 53
3. A ANAI.ISE FATORIAi. DI? CORR1.SPONDLNCIA ...................... 94
1. AGRUPAMENTOS SL.QUENCIAIS AGLOMLRATIVOS ............ 55
3.1 Transformacao dos Dados ...................................................................... 94
1.1 Metodo por Ligacao Simples ............................................................. 55 3.2 Calculo da Matrix dc Variincias-Covariancias .................................. 94
1.2 Metodo por Ligacocs Completas ...................................................... 56
X vI
ECOLtx;IA Nuntr',R[(.A

3.3 Calculo
3 . 4 Cal cu l o dos Autovctores c Autovalore ................................................ 95
das Coordenadas das Linhas (F) ............................................
3.5 Calculo this Coordenad 95
as d as Colunas (I' ) .............
3.6 95
Calculo das Contribuic6es .........................

4. A ANALISF. DISCRIMINANTE ......


............................................
4.1 An1lise Discriminants Simples INTRODUcAO
(ADS) ................. .............................. . 97
4 . 2 A n a l i sc
Discriminants Mfultipla (ADM) ..............

Anexo I - ALGUNS PROGRAMAS DE COMPUTADOR


............. 105
A pr6pria natureza c do caracteristica multifatorial. Numerosos processor
Anexo II -EXERCICIOS ............
.........................................................107 bi6ticos c abi6ticos interagem, c mtribuindo Para a formacao de padr6es estrutu-
REFERENCIAS BIBLIOGRAFICAS ............. ...................... .......115 rais, espaciais c temporais nas comunid,tdcs bioiugicas. Detcetar e descrever esses
padr6es, bent coma formular hipt>tcscs sabre as possivcis causas que os regent,
constituent os principals objetivos das tecnicas de analiscs multivariadas. Fssas
tecnicas, de aplicacao gcneralizada a todos os conjuntos de dados multidimen-
sionais, sao conhecidas no clominio da Ecologia pelo name de Ecologia Numeri-
ca, ramo da Ecologia Quantitativa, clue refine tambcnt a Bioestatistiea e a Modc-
lagem Ecologica.
A Ecologia Numeriat tcm par objetivo a analise de grander tabclas de
dados, visando descrever sua cstrutura, quantiticando o grau de associacao entrc
variaveis e objetos, detinindo, assim, comunidades biol6gicas e areas ou periodus
de mesmas caracteristicas ecol igicas. As tecnicas oferecidas pela Ecologia Numc-
rica permitem, alem disso, evidcnciar c hicrarquizar os fatores responsavcis pcla
variabilidadc dos dados c da cstrurura do sistema estudado.
Dc mancira geral, sao tecnicas esscncialmente dcscritivas. Has Icvam o
pesquisador a fornuda4ao de hipotcses, mas nao testant Issas hip6tcses, o que e
uma atribui4ao da estatistica infercncial.
As faeilidades oferecidas polo desenvolvintento acelcrado dos nicios compu-
taeionais c dos pacotes estatisticos estao provocando urn use crescente das tecni-
cas de analise multivariada. 1 semprc bom insistir sobre algumas prccaucC)es
basicas.
A Matematica e apcnas um instrumcnto a scrvico da I?culogia. Existcm
duas atitudcs contradiu'rrias c igualmentc erruncas do pesquisador cm rclacao as
tecnicas matetnaticas. A primcira c pensar que a Matematica c semprc capaz,
cortto por magia, do iu,rneccr resultados dctinitiros c inatacaveis cum base cm
qualqucr tabcla de dados. A segunda stria rejciti-la, considcrando clue apcnas
confrma evidcncias. Na rcalidade, devemos scr conscientes dos Iimitcs intrinsc-
cos de um tratamento. A Matematica nao cria inforniacao uncle nao exists, e nao
1

XVIII Ecot.ocIA NUMI RICA

dove, em nenhum caso, substituir-se a reflexao ecologica. 0 grande merito dcssas


( api(U O
tecnicas e o de colocar cm evidencia fatos novos, hierarquizar esses fatos, desta-
cando o essential do anedotico, permitindo, enfim, a transposicao dos resultados
ecologicos numa forma facilitando a comunica4ao objetiva. E urn aspecto essen-
cial, pois o pesquisador nao dove satisfazer-se apenas pela aquisiSao do conheci-
k'k oOes d[e '. lltAl' 9r t l_iIlIIlt aii' --
menro, rnas procurar transmiti-lo da maneira mais clara possive].
Tres pontos devem set perfeitamente definidos antes de iniciar o trata-
mento dos dados. Embora pareccndo obvios, eles nao sio sempre seguidos polo
pesquisador:
(a) ter sempre cm mcnte o objetivo do trabalho, pcrguntando-sc tom que 1. REPRESENTA00 VETORIAL PE UM PROBLEMA ECOLOGICO
finalidade sera aplicado tal ou tal tipo de tratamento. Do objetivo de-
Imaginamos os resultados obtidos por urn pesquisador fazendo um cstu-
pende a escolha da tecnica;
do quantitativo de tres espccies de organismos, charnadas Sp1, .Sp2 c .Sp3, em dual
(b) definir a unidade da amostra, no espaco e no tempo, scus descritores
estaS6cs de coleta, indicadas 1i1 c E2 (I'abcla 1). Seja x o numcro de individuos
(e.g. organismos, variivcis ambientais) e a natureza dos dados (qualita-
encontrados dc cada espccic em cada cstaSao: .t, corresponde ao numcro dc
tivos, quantitativos...);
individuos da primeira espccic, na primeira esta4ao, xi, ao numcro de individuos
(c) estabelecer claramente a tabela de dados, suas dimensoes (n linhas, m da primcira espccic na :cgunda esracao, c assinn por diante. Pot couven(;ao, o
colunas), quais os objetos e quaffs os dcscritores. Urn peixe, por exem- primciro indite indica o numcro da linha c o segundo o numcro da coluna.
plo, sera considcrado "dcscritor" da area onde ele foi coletado, mas tor-
na-se "objeto" quando forem realizadas mediSoes ncle (e.g. biometria,
Tabela 1 . f_xemplo de 7alela de Dado.r .Sfu/tidimensionais
pesagem, composicao quimica). Essa distinSao e importante, ja que
existem mctodos exclusivos para analise comparativa dos objetos (ana-
1:1
lise ern modo Q), outros para analise comparativa dos descritores
Si
(analise em modo R).
.S2 X1. N"

5 3

Gcncralizando para tabclas do n linhas c p colunas, o numcro .v do indivi-


duos sera posicionado na tabela pelos indices i e/ sendo i E { 1,n; c l E i 1 p
Podemos rcprescntar grtficamente csses dados de dual manciras ditcren-
tes, de acordo Conn o espa4o considcrado:

a) no cspaco das cstaS cs (l igura 1a), plotando os pontos rcprescntativos


de cada espccic a partir dos valores de v num sistema de dots Cixos-
csta4ao ortogonais V1 c 1:2;

b) no espa4o das cspccics (Figura 1b), plotando os pontos represcntativo^


de cada estacao a partir dos valores de x num sistema de tres eixos-
cspccie ortoi;onais SI, S2 c .53.

10
I

NWcOES DR AI.GERRA LINEAR 3


2 EcoLO(;iA NtJ t ERICA

E2

S2'

------ Z, S2

1., ura 2 - Nultip!icatao do tun victor por urn cscalar.

1i ura ! - Representacao vctorial das cspecics no espaco das cstag6cs (A)


c das csta46cs no cspaco das especics (B).

A cada panto assim posicionado , no cspaco bi ou tridimensional , associa-


sc um vctor. I'cmos os vetores-especic 51, S2 e S3 formados do dots clemcntos
(= as suns respcctivas abundancias nas dual cstac <) cs) c os vetores-cstaSao 1; I c 1;2
formados de tres clcmentos (= as suas respcctivas abundancias nas tres cspccics).

2.OPERAcOES NOS VETORES

2.1 Multiplicac ao de um Vetor por um Escalar

Seja urn vctor-especic A sua multiplicacatr pcio cscalar 3, por cxcm-


plo, rcsulta num out to vctor cujos clcmentos foram multiplicados polo

cscalar (Figura 2).


^ j^urr 3 - Adis io do dais vetores.

2.2 Adicao do dois Vetores


2.3 Produto Escalar do dois Vetores

Sc adicionarmos as aLund :incras tlc dual cspccics rcprc :; cntadas pclos vetores Scjam duns cspccics represrntadas p.l vetores c 52..1,,,_: O
c 32, o resultado sera urn vetor S3, cujos clcmentos scrag iiu::is a
produto cscalar dcsscs dois vctores c o numcro (x,tx + xt,x), obtido fazendo -
soma dos clemcntos correspondcntcs dos dois vetores: (x,i+ x,, )
sc a soma dos produtos dos clemcntos respcctivos.
(Figura 3).
t

N(x;OEs DE ALGEBRA LINEAR 4 5


4 ECOL(K;IA NUMI`iRICA

2.4 Comprimento de um Vetor


1

() produto cscalar de urn vctor por ele mesmo correspondc ao seu com-
12+42 +82 0,111
4
= 0,444
primento, tamhcrn charnado de norma, representada por IIS2II = X;, , sc- J,2+42+82
0,888
gundo o tcorcrna d o PiLigoras. (In) caso particular c quando o com pri men to do 8
vetor e igual a 1. Diz -sc yue elc tern norma 1. Nesse caso, os scus clcmentos 12+422+82
respcitam a igualdadc cos' a + Sen a= 1 (Figura 4). Fsscs clcmentos S ao cha-
mados de cossenos dirctores do vetor. O vctor 1. 1 tern agora norma 1, pois 0,111` + 0,444' + 0,888' = 1

2.6 Ortogonalidade de dois Vetores

Sejam dois vetores-especic Si c .S2 difcrentes de zero, fazendo urn angulo a


X2
A cntrc Iles. Existc a seguinte rcla4io:

-0 ,S 1.52
u
ms a
X,
I1 111.I S'211
() cosseno do ingulo entre dois vetores e igual a razao entre o produto
cscalar e o produto das suas normas. Essa rclacao ofcrece uma importante aplica-
cao cstatistica: scjam as duas cspecies S1 e S2, contadas cm n amostras, e de media
nip c m,. Supomos os efetivos x centrados. Cada especic tern a seguinte represen-
tacao vctorial Si corr. clemcntos (.v-, - mi , .1', - mi ) c S2 corn clemcntos (v-,, - nf
.v - m, ). Calculamos a norma de cada vetor:

,X/

I[vIII I (N/I
-n/1)
2
+(x,2 --l
_
N ,,, l l -`iron ,

l
2 ^
1 {Glanj 4 - \'ctor h do norma 1. =Vl (x: -n^2 )' = ^Srl!),
IN211= [(x 7 -nr2 ) +(.v2,-nt ?)

Vcrificamo s yuc, para dados ccntrados, a norms de urn vctor cxpressa a


2.5 Normaliza^ao de um Vetor Sonia dos Quadrados dos Desvios (SQD), i.e., a dispersio dosses dados cm rela-
cio a media. Calculamos o produto escalar desses dois vetores:
lint ecologia nwncriea, a represcntacao vctorial simultinea dc diversas
variaveis ecol<",gicas cxigc yuc todos os vetores rcprescntativos &ssas var.ivcis X-\:22-n' :)=^(.v, -in1 Jlv-2,-m2)=5PU12
lxll-m1^(x21 -nr1) T\x,2-111 1
tenham norma 1. A normalizacao a l de urn vctor faz-se dividindo cada elemento
do vetor pcla sua norma.
NoGOrs ur AIA; EBRA LINEAR 7
6 Ec:ot.0 (;IA NUAMI RICA

L.sta distancia, chamada Distancia l uclidiana, e calculada com base no


c constatamos que cle e igual a Soma dos Produtos dos Desvios (SPD), i.e., a
teorcma de Pitagoras:
codispersao entre a : duas espccics. Logo,

.SPI) 1.2 1) 113=V^.^.u xrir/ +(X a,


cos a =
..SQl) r I 9
ou seja, gencralizando para dual amostras contendo ni espccics, a dist.incia
O cosseno do angina cntre os vetores rcpresentativos de dugs vari avcis c cuclicliana expressa-se pur:
igual ao cocficiente de correlacao linear dc Pearson entre essas duas variavcis. No
caso de vetores com norma 1, a equacao ( 1.1) se simplifica em cos a = 51.52. O
cocficiente de corrclacao linear entre duas cspccies r igual ao produto escalar dos .yrs.,) (1.2)
rr
vetores rcpresentativos donnas dual espccics. Conscgucntementc , duas variavcis
independentcs , i.e., corn coca cientc r do Pearson il'ual a 0, sao representadas por Outran mcdidas do scmelhan4a scrao apresentadas no Capitulo 2.
Bois vetores ortogonais (a = 90" c cos (X = 0).

3. IrOCAO DE DISTANCIA 4. CALCULO trIATRICIAL

Lxiste uma grande atinidadc entre o calculo matricial c a ecologia. Os


A nocao dc scmelhan4a entre objetos ou atributos sempre preocupa os tabela cle a linhas c
dados cook' )gicos apresentam-se gcralmentc sob forma de
ectilogos. Vimos , c podemos sentir intuitivamente , que a scmelhan4a entre, por
p colunas.
exempla, duas amostras caracterizadas por dois vetores A e B, no espa4o das
variavcis Xl c X2, pode scr expressa polo cosseno do angulo a entrc esses doffs
4.1 Dcfinir,ocs
vetores. 0 cosseno varia entre 0 e 1 c e chamado de distancia angular entre as
duas amostras . Uma outra medida de semclhanca pode ser expressa pela distan- Seja a tabela de dados de ahundancia de 3 espccics, cm 2 estaS3es, apresen-
cia 1) entre as extrcmidadcs dos dois vetores (Figura 5). tada no paragrafo I dcstc eapituio (l'abcla I). I.sta tabela pode ser apresentada
sob forma matricial:
X2

-xrr .xr
XA2
[.\: 1=x =[.x.,1=

l'nia matriz c uma tabela retangular de numcros .x;, dispostos cm n linhas c p co-
lunas, tondo i E (1 ,n} c j E Uma matriz tormada de uma tinica coluna ou
tinica linha c chamada de vetor-coluna ou vetor-linha. Os n elementos de um
vetor constituem uma sucessao ordcnada dc ntinteros que s:io as coordcnadas dc
um ponto no cspaco a n dimcnsocs. lima represcnta4ao grafica c possivel Para
n = 2 (piano, Iigura 1) c n = 3 (volume, Figura 2). Para n > 3, a rcpresenta4.io

XBI Xl
pode scr imaginada coma urn hipcrespaco a n dimcnsitcs. Lxistem diversos tipos
xAI
dc matrix.:
Eigura 5 - Distancia cuclidiana D,,, entre dois vetores A c B.

No(ORs m., ALGEBRA LINEAR 9


$ E(.o [AO[A Nt)M(RR:A

4.2 Operag6es Matriciais


- Matriz retangular : quando r p. L o caso de urna matriz de dimensao
(= ordcm) 3x2. Transposiciio . A transposicao dc uma matriz consiste em inverter as
linhasc as colunas . A matriz transposta (Ie A e a matriz A . Consequcntcmente,
- Matriz quadrada (A): quando n = p a transposta de uma matriz quadrada simetrica e igual a ela mesma, c a transposta
de um victor-linha c urn vctor-coluna. Por convcncao cscrcvc-sc A' transposta de A.

art a17 att]


I} 4 6
a, ll, a,3 1
A3^)= 4 2 A ' 3 ,=A>3 -[3
aid 1132 a3ij 2 -2J
6 -2

A c uma matriz quadrada dc ordcm 3. Os clcmcntos ,1 , a c ,a,, formam a


Adicao c subtra45o . As opcracclcs de adi4:w c subtra4ao dc duns nt:urixcs
diagonal principal da matriz. A soma dos clemcntos da diagonal principal cha-
or.{em. A matrix resultante c obtida
silo somcntc possiveis para matrixes de mcsma
nia-sc traco. somando-se (ou subtraindo-se) os el' entos correspondcntcs das duns matrixes.

Matriz simetrica : c uma matriz quadrada ondc os clcmcntos acima da


diagonal principal sag iguais aos elcmcntos abaixo, i.e., u = ,l
54+1 1+55 6
2 1) +[3 1]-[2+3 0+1]
--r 1--
-[5 C
1]

- Matriz triangular (B): e uma matriz quadrada ondc todos os clcmcntos A B


do um lado da diagonal principal siio nulos
Adicao c subtracao de ntatrizes silo operacues comutativas c associativas.

Assim temos:
3 0 0 3 0 0
A + B = B + A c A+ (B+C) _ (A+B) + C
B=4 1 0 C=0 5 0
5 3 2 0 0 8 Multiplicacao pot escalar . i\lultiplica-se calla clcmcnto da matrix pelo
cscalar

- Matriz diagonal (C): e uma matriz quadrada ondc todos os clcmcntos


3. [2 3 11 ]-[6 9 33
]
silo nulos, cxccto os da diagonal principal.

- Matriz cscalar (D): c uma matrix diagonal ondc todos os tcrmos da


diagonal principal silo iguais. Multiplicacao do duas matrizes. A nutltiplicacao de duns matrizcs e
somentc possivel se o numero do colunas da primcira for igual an numero dc
- Matriz unidadc (1): e uma matrix cscalar onde todos os tcrmos da linhas da segunda. 0 resultado sera uma matriz com o numero de linhas da
diagonal principal sac) igUais a 1. primcira c o numero de colunas da segunda.

A,,.p.Bp.,,, =Cn.,
3 0 0 1 0 0
Os clcmcntos dc C scrag obtidos somando-se os produtos dos elcmcntos
D= 0 3 0 1=0 1 0
0 0 3 0 0 1 do cads linha dc A pclos elcmcntos do cada coluna de B. Por exemplo:
10 E COLOGIA NtIM(:RICA Noc,-)Fs DE Al.GEI;RA LINEAR 11

c) Para matriz de ordem 3 . 0 determinante e calculado pela regra de


all a,2 1 -[bit 612 b,l
Sarrus, exemplifcada a seguir. Scia a matriz quadrada M.
sejam A, , = a,, a,, eB2.1-
b b,2 ]
a b 2,
[a,, a12 a,1

M= a21 a22 (12;

O resultado da multiplicacao de A par B sera: La,, a12 ail

all b+a,,b,, aI I b,,+a,,b allbr,+ a,zbz3 As etapas do calculo do determinante pela rcgra de Sarrus sao:

a,,bi, +a;,b,, a,,b,,+ab n,,b,, +a7762, - repent do lado dircito da matriz as dugs primciras colunas , obtendo-se,
a1,b,1+a ;,b,, anb,,+a;,b,, a1,b,1+ 01262, assim, uma matriz N de ordem 3,5;
multiplicar os clcmcntos das tres diagonais principals e sonar estcs tres
A nnlltiplicacao de duas matrizes e associative , mas nao e comutativa. produtos;
- nultipliear os clcmcntos das tres diagonais secundarias c sonar estcs
A (B p,,,, C,,,,,,) _ (A n,j, . B p,m) ' C -,v
tres produtos;

# Bi.n A'p fazcr a difcrcn4a entrc as duas somas. O result-ado e o detcrminantc da


A,, 1,Bp,n
matriz M.
Inversao de urna matriz . Uma matriz B e invcrs, a de A sc A.B = B.A = I
(matriz unldadc). Escreve-se, por conven4ao, A' inversa de A. Uma matriz so c all a3, Alf all d12

invcrsivcl se for quadrada, mas nem todas as matrizes quadradas podem scr invcr- N= a13 a,, a
1121
tidas. Unia matriz quc nao admite inversao e chamada de matriz singular. Uma
matriz quc admite inversao c chamada do matriz regular ( ou normal). Veremos,
L a,, a12 a,, ail a321
a seguir, como calcular os clcmcntos de uma matriz invcrsa . Para isso, dcvcrnos
introduzir o conccito de determinante do uma matriz. IM I= ( a 11a22 a 33+a12a2.3a3,+a11a21ai2/ (a ,aa,+a52a2;a11+a, a21a

uma matriz cujo detcrminantc c igual a zero e singular (nao admite in-
Dctcrminante de uma matriz . Para cada matrix existc um numcro real
versao).
dennnlinado detcrminantc da matriz, unico para cada matriz . Por convencao,
escrcve-se detcrminantc de A = det . A = JAI. 0 scu calculo dcpende das di- (1) Para matriz do qualquer ordem.Aplica-se a rcgra dc Laplace, quc
niens < es da matriz: necessita do algurnas deftni5ibes e calculus intermediarios:

a) Para matriz de ordem 1. O determinante c o proprio esealar: - Menor confllemenlar M., do um elemento a do unma m:uriz A: c u
detcrminantc da matriz clue se obtem clinlinando-se a linha e a colu-
de t[5J= 151 =5. na quc contcm a.
I?xcmplo: scja a matriz A. Calcular o Mcnor Conlplenlcntar ;V, do
h) Para matriz de ordem 2 . 0 detcrminantc a calculado fazendo-se o
produto dos clcmcntos da diagonal principal mcnos o produto dos clc- elcmcnto a,,:

mcntos da outra diagonal.


1 2 -3
2 -3
all a,2 A= 0 -1 5 = M,,= =26
de( M = =a,,a27-
a.,a12 4 7
a2, 3 4 7

L
1

NocOEs DE ALGEBRA LINEAR 13


12 L(:oLOGIA NusII:RICA

- Cofator C. . do elemento a : e o Menor Complementar do elemento Adj. A


11 1/ (1.3)
multiplicado polo termo (-1)" . Assirn, Cij = (-1)", M. 0 cofator de
urn elemento correcponde an seu complemento algebrico: se (i+j) for
4 1 2
par M,, = C11 c se (i+j) for impar, entao M = -C. No cxcmplo ante-
rior, ondc M, = 26, o cofator deste elemento e CI, _ (1)'" .26 = -26. Exempla: calcular a matriz inversa de A= 5 -1 3
2 2 0
- Matri.Z adjunla: e a matriz transposta da matriz dos cofatores:
Adj. A = C. Detcrminantc dc A = 6

A partir dessas definicoes, podemos calcular o determinante de A pcla -6 -6 12


rcgra de Laplace, segundo a qua] o determinante do qualquer matriz quadrada dc Matriz dos menores M = -4 -4 6
ordcm t1 e igual a soma dos produtos dos elementos de uma linha i (ou de urns 5 2 -9
coluna /) pelos sous respectivos cofatores:

-6 6 12
det.A =Ian C1 Para uma coluna j ou Para uma linha i. Matriz dos cofatores C= 4 -4 -6
5 -2 -9

Exemplo: calcular o determinante da matriz A


-6 4 5
3 4 1 5 C'= 6 -4 -2
Matriz adjunta
6 0 0 7 12 -6 -9
A=
8 0 2 1
0 3 1 2 -1 0,66 0,83

Para facilitar os calculos, escolhemos a linha (ou a coluna) corn inaior 1 -0,66 -0,33
Matriz invcrsa
6 2 -1 -1,5
nurttcro de zeros, por exemplo a coluna 2.

- A/gunlas propriedade .r do determinante: Podcmos vcrificar quc A ' A = I


a) o determinante de uma matriz triangular ou diagonal e igual ao
- Propriedades da matriz inversa
produto dos elementos da diagonal principal;
b) o determinante e igual a zero quando todos os elementos de uma
linha (ou coluna ) sao iguais a zero ou quando duas linhas (ou colu-
nas) sao identicas ou em rclacao linear (uma mtiltipla da outra);
c) o determinante muda de sinal quando intcreambiam -se duas linhas
ou duas colunas.

- Inversao de uma matriz do ordem rc A matriz invcrsa de uma matriz [A']_'=[A`]'

I
quadrada A, caso cla exists (determinante diferente dc zero), a igual a razao cntrc [A. BI -/ =[ B -''A-' 11
sua matriz adjunta c seu determinante:
14 ECOLOGIA NIIMI?RICA NocOFs DE ALGE BRA LINEAR 0 15

5. RESOLUCAO DE UA SISTEMA PE n EQUAcOES COA1 n INCOGNITAS Este exemplo pods ser tambcm resolvido polo metodo dc Cramer. Se-
gundo a regra de Cramer, calla inccignita x pole ser calculada dividindo-se
Esses sistemas sao a base dos modelos de regressao multipla. Scja um siste- sucessivamente, pelo determinants de A, os dcterminantes auxiliares da
ma de n equacoes com n incdgnitas, no qual o determinants c diferente de zero matrix A, obtidos apds se substituir a /coluna pcla coluna dos tsrmos
(sistema normal due admits uma tiniea solucao). Quais os valorcs de x yuc Sao independentes (B):
solucoes do sistema?

Determinants dc A = 15
a,,x-,+a,,.v,+...+a,x = br

a,, +ax,+...+a1x = 11 Calculi) de Ai , substituindo-se a printcira coluna do A polo vetor B:

3 4 1
+a ,.x,+...+a x = 1,
4 1 4
Este sistema pode ser escrito sob forma matricial:

a a,, ... a 1,, Calculo de 0, , substituindo - se a segunda coluna de A pelo vetor B:


x1

mod,=-1,1'

a,,, an 2 h,

no seia: X = A` B. Calculo do Di , substituindo-se a tcrceira coluna do A pelo vctor B:

2y+Z. = S
2x+4p+,. = 3
Iixemplo nuntcricu: achar as snluSocs do sistema A,- mod;=-39
3.v4- +4;Z. = 4

1 -2 1Z.1x i 1
2 4 = 3 :\s solu4ncs do sistema san:
nu seja, sob forma especial
3 1 4 4
Y

A X B

As snluciies, obtidas pelt cyuacao matricial X - A - B cnm A = 9 d/' A


Al
san:
.x = 5,2 ,) = -1,2 e Z. = -2,6
16 ECOLOGIA NUAMERICA NocOr:s ot: AIx;rmtA LINEAR 17

6. AUTOVALORES E AUTOVETORES VE UMA MATRIZ 3 2 ] _ [,,:


[2 -2 J L
Urn dos objetivos comuns aos trabalhos de ecologia c evidenciar os prin-
cipais fatores ambientais yuc regem a estrutura de um ecossistcma. 0 ecrilogo
3x+2y = A.x (3-A).v+2y = U
procura descrevcr essa estrutura pot um grande numcro de variaveis bibticas e
{2x-2y = ^y 12x-(2+R)r = 0
abioticas clue servirao de base do dados Para a extracao desscs fatores pclas tccni-
cas de analise multivariada. Fsses fatores deverao explicar aspcctos diferettes do
ecossistema, c Para isso deverao set independentes, i.e., rcprescntados or cixos I?stc sistema cm x ey admits unrt solucao cinica x =j = 0 clue nao satil:rz.
ortogonais (produto escalar igual a zero). A solucao deste problema, yue esta na Para obter outrts solucocs, devcmos fazcr o determinants da matriz dos coe-
base dos analiscs ditas "fatoriais", consists em se passar do uma matriz A do ticientes igual a 0:
coeficientes de dependcncia (correla45o ou covariancia) entre dcscritores Para
urna matriz diagonal A, onde todos os coeficicntes sat nulos, exceto os da
(3-k) 2
diagonal principal (X). = 0, ou seja, k - a. - 10 =0
2 -(2+X

a,1 a12 rAl 0 .. 0


eyua4ao do segundo grau cujas raizes sao X , = 3,7 e X, _ -2,7. ()bservanuts
a21 a22 a2m 0 A, 0
A= =44= que ?i + ?, = 1 (= tra4o de A) e Xi ^z = -10 (= determinants dc A).

La,,,, 0 0 .. A,,. I 3,7 0


A matriz A=[ 0 -2,7 c eyuivalente a matriz A, com mesmo tra4o c

Fsta operacao e chamada diagonalizasao da matriz A. ()s tei mos I da mesmo determinante.
diagonal sao os autovalores (= raizes latentes) da matriz A, calculados pela eyua-
Apos calcular os autovalores de A, vamos calcular os autovetores 1. I.xistc
cao matricial:
um autovetor Para cada autovalor:

AUI=X .U ou JA-AI1 U,=0 (1.4) - Para V. Substituimos os valor de X no sistema de eduacocs acinta:

onde U, sao os autovetores (=vctores latcntes) da matriz A. A calla autovalor X ((3-3,7).-,-+2y = 0 -0,7_v+2y = 0

corresponds urn autovetor U , (sen(lo j E { 1, m}). 2x-(2+3,7)y = 0 2x-5,7), = (1

O sistema c indetcrminado , com a solucao trivial = - )' = 0, indicando


Exemplo numcrico:
yue o vetor passa pela origem. Para obter um segundo ponto do vctor, atribui-
mos urn valor yualyucr a x, pot exempla, x = 1, e calculamos o valor correspon-
Scja urna matriz A= de associacao entre duas vari:iveis. Qucrc- dente y = 0,35. <) nossri primciro autovetor c

mos transforr.. a-la nun-, .t matriz diagonal A, cujos termos da diagonal sao us 111 -[ 1 1
autovalores k, e X, de A, c calcular, para cada , o autovetor U de elementos x c 3
y , ou seja, resolver a equacao matricial:
1R ECOLOCIA NUMf RICA

- Para a,,= -2,7, realizamos o mesmo procedimento, obtendo o Segundo

autovetor:

1 allnulanb) 2

UZ -[-285

A matrix dos autovctores c U= Os ][ aILDs MUII d i mmm aIIISiOun,tus


[0,35 -2,85 -------------------

A N0cA0 DE VARIAVEL PE DIMENSA0 m

Nos estudos de ecossistemas, o ecology' cntrenta uma multi picid"Ide dc

variavcis bi6ticas c abiciticas, ligadas por uma complexa retie de inter-relacocs


clue rcgc o funcionamento desse ecossistema. t'ma seric de n amostras (objetos)
especie)
descritas por apcnas uma variavel (c.g. abundincia numa determinada
constitui uma variavel alcat6ria unidimensional, em clue calla valor representa

urea rcaliza4ao dessa variavel. Considerando-se dois descritores dcssas amostras


(contagem do duas especics distintas por cxemplo), tcremos duas variaveis aleat6-

rias simultancas (bivariavei ou variavel bidimensional). No caso mais geral, o

ccologo utilizara m descritores (contagem de m especics distintas cm cada amos-


simultancas , ou seja,
tra) 'Icremos entao um conjunto de m variavcis aleat6rias
uma multivariavcl a m dimens5cs . No cxcmplo a seguir (Figura 6, Tabcla 2),
urn individuo de uma determinada espccic de peixe constitui uma rcalizaSau da
multivariavcl a tres din1cnsoes (os valores (as bionictrias B l, B2 e U3). As colctas
de cinco individuos constitucrn cinco rcaliza5 cs fiesta multivariavcl, cujos valo-

res podem set ordenados cm tabcla do cinco linhas (pcixes = objetos) c tres

colunas (biomctria = descritor), ou representados graticamente, num espaco do

tris dimensoes, once calla pcixc se posiciona do acordo com os scus valores cm
l;l, B2 c 133. (;ada peixe X pods assim ser represcntado por urn vetor de tres
clcmentos X,,., . No caso geral de n pcixes caracterizados por in descri-

tores (sendo in > 3), a represcntacao grifica c impossibilitada, mas no e dificil

isuaginar o conceito de um "vetor peixe" posicionado num hipcrespa4o de di-

mensao in.
Os DADOS MULTIDIMENSIONAIS 4 21
20 EcouxuIA NtINI ICA

lise cm modo Q) ou entre os descritores (analise em modo R), dependendo do


objetivo do trabalho. A escolha deste coeficiente constitui uma etapa importante
L 113 da analise c dove ser feita de maneira critcriosa.

2. 05 DIVERSOS TIIPOS DE DADOS

Um objeto pode ser descrito por caract, res de diversos tipos: quantitati-
11,
vos, semiquantitativos ou qualitativos.

2.1 Os Dados Quantitativos


B

Os dados quantitativus podcm ser discrctos, coma por cxcmplo, as conta-


1;,:ns de individuos do detcrnlinados organismos, on continuos, coma as medidas
do variavcis fisicas c quimicas.

2.2 Os Dados Semiquantitativos

Sao dados oriurdos de variavcis quantitativas codificadas por mein de


1-igura 6 - Rcprescntacao vctorial do ulna variavel multidimensional.
valores intciros crescentcs. I .ssa coditicacao i util quando, por razao nlctodologica,
Cada pcixc posiciona-sc no cspaco a tres dimensocs, do acordo
ha inlpossibilldadc de Sc medir cons precisao a variavel quantitativa. A segruir sao
cam seas valores cm 131, B2 c 113.
apresentados tres exemplos simples:

Exemplo 1: numcro de cclulas do fitoplancton


Tabela 2. 1ixeml/o de zrnma I 'ariav e/ roui 1 Trr.c D infeusocs
T I Cr lulas/ml Codigos
iJiometrias
BI B2 B3 (1-1(1 1
Nixes
11-10(1 2
X1 -^ 3
-`11 12 \'n 1(11-111(1(1
X2 X22 ! .\'` 1 1001- l O0t (( I -^ 4
X3 .\
11 -"' 32 '\ .33
Exemplo 2: recobrinlcnto do substrata por vegetacao, cst i ma d o v i su al -
X4 .\01
.102 .\i3
InCntc

X5 -"s1 xs2 ts3


Recobrimcnto (%) Codigos
<10
-- 1

As an:iliscs nntltivariadas (agrupamcnto c ordcna4an) visam ao cstudo des- 1(1-25 --^ 2


tc tipo de ,.ahcla, c da distribui4ao dos pontos -objetos no espaco dos ru descritores. 26-50 -4 3
Istc cstudo recorrc ao c:ilculo matrieial , no qual o primciro passo r scmprc a 51-75 -4 4
76-1(1(1 --> 5
claboracao dc unlit nlatriz de coeficicntcs de semelhansa entrc as amostras (ana-

L
Os DAnos Mt PI.TtniMMENSEONAIS 23
22 15 COLOGIA Nt rRICA

Exemplo: num estudo sobre a ecologic da alga macrosc6pica Pteroc/adia


Exemplo 3: batimento das ondas no litoral marinho
foram consideradas as seguintes variaveis , medidas em quatro csta4cics de coleta:
a ocorrencia de uma alga parasita
Codigos a percentagern de recobrimento de Pteroc/adia,
Modo
^ - 1 Gelidiocola\^, o hidrodinamismo e a tmperatura media da agua . O s dados cons-
Calmo -
tam da Tabela 4:
Agirulo -4 2
Batido -9 3 Tabela 4. Dados Brulos de urn f ' xerplo de I' ludo I.(() / 'c(

Estacoes ( 1) (2) (3) (4)


2.3 Os Dados Qualitativos
25 60 75 1(1
Plerorladia
Sao atributos. Para calla obj^to s6 ha uma alternativa, possuir ou nao pos- Prescntc Auscnte
Gelidinrola.\: Ausente Prescntc
suir um (Icterminado caracter. F. um., resposta em Simi ou No, cm Tudo ou
Fracas MIcdio Forte I'raco
Ilidrodinamismo
Nada, cm 1 ou 0 (dados binarios). Una caso de dados qualitativos frc 1ucntemente
21,0 17,5 15,0 24,0
usado cm ecologia e a presenria ou ausencia do uma especte na amostra. Por Tempcratura ("C)
convcflcao, se atribui 1 a presenca, 0 a ausencia, embora qualqucr outro c6digo
possa ser utilizado. No excmplo a seguir (Tabcla 3), uni c6digo binario foi utili- Uma analise integrada dcsta tabcla exige a sua homogencizacao, que deve scr
zado para definir os tipos de substrato em esta45es de colcta de organismos fcita pela codificacao hiniria dos dados, comp proposta na Tabela 5:
bentemicos.
Tabela 5. Codi/ieacdo Bin ,iria da 7a,be/a 4
Tabcla 3. h.venplo de Codi/icacdo Bindria
Estacocs (1) (2) (3) ( 4)
Tipos de substratos 0 l
Pterocladia (<50') 1 0

Estacbes Calcario Cascalho Areia Lama Pterocladia (>50,,) (1 1 1 (1

A Gelidiocolax prescnte (1 1 1 (1

B (;elidiorola.t- auscntc 1 (1 (l. 1

C 1 (1 0 0 Ilidrodinamismo fraco 1 0 (I 1

I) 0 0 (1 1 Ilidrodinamisim media (I I (1 (I
0 l (1 0 Hidrodinamismo forte (1 (1 1 (1
Tempcratura < 18"C O 1 1 I1
'I'emperatura > I8"C 1 (1 (1 1
2.4 Codifcacao do uma Tabela de Dados Heterogeneos
suhdivisao cm classes dc variaveis quantitativas deve respcitar uma cer-
Nos c.,tudos eccl6gicos , necessita - se de u:ma grandc divcrs^dade do ta equipondcracao das classes , a tim de atribuir pesos Iguais as diversas classes.
descritores , com diferentcs tipos de dados. A comparacao de objetos a partir Em outras palavras, devem set dctinidos os limites de classes de tal mancira clue
dcssas variiveis hctcrogcncas nao podc ser rcalizada scm uma prcvia homogc- a frec1ucncia dos dados scja aproximadamcnte igual em calla classe.
ncizacao dos dados.
I

24 EcOLOGIA NUA1t:RICA

A transformadao dos dados e, as vezes , necessaria para outras finalidades,


tais como diminuir o espaco - memoria pars armazenamento no computador. Capafun1o i)
Por exemplo , dados de densidades de fitoplancton , que ocupam ate mais de sete
digitos quando expressos em numero de celulas por litro, podem ser expressos
em apenas tres digitos, quando transformados em logaritmos (Tabcla 6).
A
.ediithi di
-------------------
Tabela 6. Densidades de Fitoplancton
(1 alores brutos e apds a trans/w-mucuo /cq aritniica)

Cel./litro 100.1og (cel./litro)


As mcdidas de scmclhanca s,io grandezas numericas quc quantificam o
300 248 grau de associacao entre um par de objetos ou de descritores. l of tom o indice
floral de jaccard (1908) quc assistimos ao surgimento de um numero cada vez
10500 402
maior de mcdidas de semclhan(a relacionadas a aplicarr es biol6gicas e ecolcigi-
1200000 608
cas. Elas podem ser consultadas numa abundance bibliografia, dentro da qual
520000 572 podcmos citar algumas das rcfcrcncias mais rccentes quc apresentam uma sintesc
1500 318 sobre o assunto: Sneath & Sokal (1973), Wolda (1981), Piclou (1984), Ludwig &
Reynolds (1988), Legendre & Legcndre (1998).

Em certos casos, a transformadao logaritmica proporciona, alcm disso, Qual indice cscolhcr? A respusta a cssa pcrgunta depcnde da resposta a
uota normalizacaao da distribui4ao de frequcncias dos dados, possibilitando a unia writ do outran perguntas:
aplicacao dc testes estatisticos parametricos. As transformaccies normalizantes
- o estudo comparativo sera entrc amostras (modo (2, segundo a termino-
sao um aspecto importante da estatistica inferential e podem ser consultadas nos
logia de Sokal & Sneath, 1973) ou entre descritores (modo R)?
manuais especializados (Sokal & Rohlf, 1969).
- os dados sao qualitativos bin :rips (prescn4a-ausencia), quantitativos
meristicos (contagem de organismos), quantitativos continuos (variavel
ambiental) ou scmicluantitativos (ccidigos de abundaancia)?
- a tabela c homogcnca (= contingcncia) ou heterogenea (descritores cone
unidadcs diferentes)?

Daremos allmns exemplos de indices frequentemente usados em ecologia.

1. PARA 05 ESIUDOS EM MODO Q

1.1 Cocficicntes do Similaridadc

Os coefieicntes dc sill, ilarid Ic foram desenvolv idos iniciaimentc par.L


medidas binirias ( presen4a - ausencia ), obedecendo a seguintc convcnsao:
1 = cspceic prescnte , 0 = espccic ausentc.
A MEDIDA DE SI:MMGLUTANGA 27
26 I3coisxan Nt^ntfaucA

1.1.1 Cocficientes binarios , incluindo as duplas-ausencias


Ohjeto A

0 Tabela 7. Alitnrs C:oe/icienles de Similaridade Para Dados Iiindrios,


1
Inc/rriudo a 1)upla-AusMcia (Raseado em Romesburq, 1984)
1 a h a+h
Expressao Intervalo de
Objetr, 13 Nome
c d c+d variacao

a+c h+d p
a + d
(1-1
Coincidcncia simples a+b+c+d
onde:

a = nincr(, do especies COmuns aos dois objctos (1-1); 2a+2d


() 1
Sokal & Sncath a+2b+2c+d
b = numero de presen4a-auscncia (1-0);
c = numero de auscncia-presenca (0-1); 0
0- 1
d = numero de dupla-auscncia (0-0); Russel & Rao a+b+c+d

p = numero total de especies (= a + b + c + d). ad - be


-1 -1
0 (phi) de Pearson I(a+b)(a+c)(b +d)(1- +d)105
Os diversos cocftcicntes difercm-se pcla inclusio ou cxclusao da dupla-
ausencia (d). A escolha dcpcndc do significado ecolcigico do dado nulo: a auscn- till
u-1
cia de urna especie na amostia indica realmente que esta especie nao existe no Ochiai ((a+b)(a +c) (b+d)(r +d)lo.s
ambiente, ou e simplesmente devida a urna dcfieiencia metodologica (seletividade
do arnostrador, amostra pequcna demais...)? 1", evidentc quc a auscncia de "balcias"
nas amostras de plincton nao pock ser levada cm conta para comparar Issas 1.1.2 Coeficientes binarios , excluindo a dupla-auscncia

amostras ! 0 problema torna-se mail serio para as comunidades do elcvada riquc- Tabela 8. Os Corfcienles de .timilaridade nnais 17sados para Dados Rindrios,
za especifica. As amostras dificilmente possuem todas as especies e o numero do Hxcluindo a Dupla Aasrncia (Raseado em Romesbmg, 1984)
pares de dados nubs aumenta, provocando uma falsa semelhanca entre amostras.
Assim, nos estudos de comunidades e geralmente desaconselhado o use do coefi-
Expressao Intervalo de
cientes quc incluem a duh!a-auscncia. Nome
variacao

a
0-1
l.iccard a+b +c

2a
()-1
Sorensen 2a+b +c

Sorensen teria prefcrcncia sobre laccard quando se pretende valorizar a


ocorrencia simuhanca do dual cspccies.
28 Ecoi .OGIA Nu I RICA A MuoUJA i)1S SIiMGLHANC.a 29

1.1.3 Coeficientes quantitativos , incluindo a dupla -ausencia (1) I).i n = D, 1,


(2) sc A = B, entao 1)_i 0,
Gower (1971) claborou urn coeficiente geral de similaridade permitindo
combinar diferentes tipos de descritores apps ter tratado cada um de acordo com (3) se is ve 13, entio I) it > (), e

seu tipo matematico. Urn outro cocficiente, com as mcsmas caracteristicas, foi (4) 1) n + 1) n >_ 1) , c (regra do triangulo).
proposto por Istabrook & Rogers (1966). Estes coetieientes, de calculo mmple-
xo, sio cxplicitac!,Is cm I.cgcndre & I.cgcndre (1998). 1.2.1 A distancia Euclidiana

Esta disuincia, unia das mais conliecidas, c perfeitamente mctrica. Sua for-
1.1.4 Coeficientes quantitativos , excluindo a dupla-ausencia
mula, ja dcscrita no CapituIo 2 (cqua4:ur 1.2), c bascada no teorema do Pit: Boras
() indice do antropologo Czekanowski (1913, in I,egendre & I.egendre sobre a hipotenusa do triangulo retangulo:
199$), atribuido tambcm ao matematico Stcinhaus, compara, para cada cspccic,
a menor abundancia (\x/) entre as duas amostras e a soma (/I c 13) nas duas antos-
1) 1 -13 = J (.. u-..v1i 1 ) +^.^ - .x-1i z )
D _H e a distancia cuclidiana entre as amostras .-I e 13, cm fun4io da abundancia .^
21,17
tras : .S'3 . Este indicc, que varia entre 0 e 1, c dcrivado dos indices hinarios, de duns cspecies I c 2.
A+B
A distancia cuclidiana nio tern limite superior . Isla aumenta a medida que
pois quando aplicado a dados de prescnca-ausencia, etc e igual ao indice dc
aurnenta o nurncro de descritores. Alern disso, eta depends da escala de valores de
Sorensen. Etc foi muito utilizado nos estudos fitossociologicos, baseados nas ta- cada descritor. Este incomcniente pode set corrigido pela padroniza(;io dos da-
xas de recobrimento vegetal.
l)
Morisita (1959) elaborou um indice, atualmente muito usado, para mcdir dos (dados ccntrados e reduzidos) e pclo use da distancia cuclidiana media -
11
a similaridade cntrc duas comunidades. Etc varia de 0 ate um valor maximo
onde n c o numero do descritores. Dc mancira geral, a distancia cuclidiana dove
proximo de 1. Inicialmentc formulado para contagem de organismos, elc foi em
set cvitada para comparar amostras cm termo dc abundancia de cspecies, prinei-
seguida sirnplificado, tornando-o mais apropriado Para percentagens e valores de
palmente quando ocorrer um grandc numero de duplas-auscncias.
biomassa, recobrimento, produtividade... A literatura considera o indice do
Morisita urn dos melhores pars estudos ecologicos. Sua formula, relativamente
1.2.2 A distancia de Bray-Curtis
complexa, e exemplificada em Krebs (1989).
A distancia de bray-Curtis (1957) c do use fregiicnte, parr set disponivcl na
maioria dos pacotes estatisticos. Fla varia entrc (1 (similaridade) 1
1.2 Os Coeficientes de Distancia
(dissimilaridadc). Este indice n:io considera as duplas-auscncias e c f trtemente
FIcs sio prefcrencialrnentc aplicados quando se pretends visualisar grafi- influenciado pclas espccics dominantcs. As espccies rams acresccntam muito pouco
carncntc a pr:rximidade cntre duas amostras, cm fun4io da composicao cspccifica ao seu valor. Stu calculo c bascado nits diferencas absolutas c nas somas das abun-
ou do qualyucr outro descritor dessas amostras. Quanto mais prciximas forem as dancias de cada especic (1) nas duas amostras:
amostras, i.e. mcnor a distancia metrica cntrc os pontos representativos dessas
duas arnostras, major sera a similaridade cntre clas. Urn indict do distancia ll t-fl-
x +
co,respoudc entio a uma dissimilaridadc. Logo, c possivcl passar de uma simila-
ridade S para uma, distancia 1) fazendo, por exemplo, D = 1 - S Entretanto, para \'arios autores prefercm detinir esta tncdida comp "Sir. ilartdade", fazendo (1-D).

scr realmcnte uma distancia, no sentido metrico do termo, este coeficiente dove Ncsse caso, o indice dc 13rav-Curtis equivale ao coeficiente de similaridade de
respeitar os seguintcs axiomas de "metricidade": Czckanowski.
30 Ecot.otaA NuA1tiRIcA A MtiDInA 1)E SFMMELHANcA 31

Outras medidas dc distancia podem ser encontradas na literatura, com ondc v c o grail do libcrdadc igual a //-1. A matrix. S escreve-sc:
formulacao parecida i de Bray-Curtis, tail como as distincias de Manhattan c dc
(:amhcrra. .r1, .. Sr r

S,t S>2 .. S -1,

2. PARA OS ESIUDOS Ell\ MODO R Sp.,=

LSp, Sp2 .. I
O estudo Cm modo R do unla rnatriz do dodos ecolci gicos tem por tinali-
dadc detinir as rclacocs cntrc dcscritores. Isla c sinutrica. Os clcmentos da diagonal principal s:io as variincias c os
outros clentcttos as cov a ri:incias. S podc ser ohtida inultiplicando-se a matrix
2.1 Os Coeficientes de Dependencia dos dodos centrados Y _ It ///J pcla sua transpo<ta Y'.

lies Sao utilizados Para dctcrminar as rcla<ocs cnrrc (Icscritores (variavcis, S= Y'-Y
cspccics), i.e., para OS estudos cm modo It. O's coctkicntcs gue modem a depen-
dencia podem ser, na sua ntaioria, submetidos a testes estatisticos de signiticancia, Exemplo: cal. .,. tr a matrix de variancias covxriancias entre guatro es-
devendo, para isso, respeitar certas exigencias, conut a normalidadc dos dodos no pecics (p = 4) contadas cm n = 5 cstac<ics do eoleta.
caso do coehciente de corrclacao linear r de Pearson.
Dados brutos
2.1.1 Para descritores mctticos
Espccies Y l
Os dcscritores mctricos sao csscs nos guais e possivcl aplicar medidas de
(1) 1 2 6
dcpcndencia parametricas, i.e., gue depcndem dos paratnctros (media c desvio 2
(2) 2 1 8
padrao) da sua distribui4ao do frcc1 icncia.
(3) 3 3 4
(4) 4 5 (1
Matriz de %,ari$ncias - covariancias 2
(5) 5 4
Ao nivel popul: tcional, no scntido cstatistico do tcrmo , a covari : incia, e a
\tedias 3 3 3 . 4
n edida de dispcrsao conjunta dc dual variavcis ) c ) em tornu das Silas nudias
n/F C /// :
Dados centrados

Espccies Yt-3 Y' -.A Yt-3 Y,-4


Considerando -se a amostr as ondc foram medidas p variavcis )', on sc ja, o ve(tr
I)',. ) ) obSCrVado n vexes, podc set construida a matrix de covariancia 1 (1) -2 2 -1 2
para as p variavcis tornados duos a duns . A formula geral da covari:incia cnrrc As (2) -1 -1 -2 4
variavcis Y c )- Lie nudias respcctivas mk c m e: Amostras (3) 0 -2 (1 (1
(4) 1 ? 2 -4
17
(5) 2 2 1 -2
t. Yl)^i' wi:m
Medias 0 (1 (1
32 EcoL(x;IA NUNIl RICA A Mrntn, DE, SIMBLHAN(:A 33

0 grau de liberdade e v = n - I = 4. R= L .Z'.Z


v
2 2 -1 2
-2 -1 0 1 2 1 0 0,8 -o,Bl
-1 -1 -2 4
1 2 -1 -2 -1 2 0 1 0 0
S= 0 -2 0 0 R=
4 -1 -2 0 2 1 0,8 0 1 -1
1 -1 2 -4
2 4 0 -4 -2 -0,8 0 -1 1
2 1 -2
12,5 0 2 -4
0 3,5 0 01 O cocficiente de eorrelacio linear r de Pearson c um dos mail utilizado.
S= Para yuantificar a dependcncia linear entre duns variaveis heterogcneas. Seu Us')
2 0 2,5 -5
adeyuado exige, entretanto, certos cuidados:
-4 0 -5 10
elc expressa exclusivaniente a intcnsidade da rclacao linear entre duos va-
riaveis. He varia, cm valor absoluto, entre O (nenhuma relapur linear) c I
Matriz de correlacao
(rclacao linear pcrfcina, seja direta Para r = +1, spa inversa Para r = -1);
f', a matriz R do dispcrsao conjunta cntrc variaveis centradas c reduzidas
elc pode ser submeudo a urn testc estatistico Para verificar se scu valor e
y-M signiticativamentc diferente do zero, i.e., se podemos afirmar, dentro de
. 0 cocficiente calculado corn base nesses dados padronizados c o
uma determinada probabilidade, yuc existe uma rela4ao linear cntre as
variaveis;
coetieiente de correlacao linear r de Pearson. A matriz R e calculada da mesma
forma quc a matriz S, multiplicando a matriz do dados centrados c rcduzidos Z a auscncia de significincia (baixo valor de ,) revcla somente a auscncia
pela sua transposta Z'. titilizando o excmplo anterior, dividirnos cada elemento do relacao linear cntre duas variaveis, podendo set cla nao-linear. 1? scm-
da matriz de dados centrados polo desvio padrao .r da respectiva variivel. Os pre born tracar o diagrama de dispersao dos pantos , e assim visualizer a
valores de s cncontram-se na diagonal do S. existencia de unia possivel relacao nao-linear. Nesse caso, o calculo de r
necessita de unia transtormacao linearizante dos dados. Por excmplo,
Dados centrados c rcduzidos
log(x) part uma rela4ao logaritmica, + A, + c pare tuna rcla(;ito
Rspccics ZI Z2 Z3 Z4 yuadritica, ou entao utilizar um coetieiente nao-paranctrico, coma ve-
remos a seguir;

(1) -2/ 2,5 -2/ 3,5 -1/ 2,5 -2/ 1(J o teste do significancia de r nao pode set aplicado se as distribuiritics des
variaveis nao forcm normais, i.e, seguindo a Ici de Gauss (distribuicao
(2) -1/ 2,5 -0,53 -1,27 1,27
simetrica em rclaSao a media). Nessc caso, novamente, c possivel, seja
Arnostras (3) (1 -1,07 0 0 aplicar uma transformacao normalizante nos dados, seja utilizar uni coeti-
eiente nao-paramctrico;
(4) -1/ 2,5 -0,53 1,27 -1,27
o cocficiente r sri pods ser aplicado em nurdo R (associacao entre
(5) -2/ J5 1,07 0,63 -063 descritores), exceto Para tabelas homogincas, do tipo contingencia (da-
Media 0 0 0 0 dos de contagem ou do frcyiicncia), yuando c entao possivel calcular r
Variancia 1 1 1 1 entrc objctos (modo Q.
A MHDIDA 1)1; SFMtit.t1ANc,:A 35
34 Lr:ot.cxan Nuntt tttcn

r-0
r 0
Na Figura 7 ilustramos diversas situacoes do dependcncia entrc duas variavcis: Y

a) indcpcndcncia (r = 0);
b) relacsto linear positiva (r > 0);
13
A
c) rclae io linear negativa (r < 0);
d) rclacao nao-linear necessitando de uma transformacio cm (luc r tendc
para 1;
c) variavcis biniodais (nao-normais), onde os dados dcvem ser subdividi-
dos em dual populacoes, e o teste do linearidade aplicado a calla uma
dclas separadatnente. F o caso quando as amostras sao representativas
do dual situacoes ccologieas distintas. Y

Nocao do Distribuicao Multinormal


I)
A estatistica paramctrica unidimensional exige, para aplicacao dos testes
de hipcitcscs, clue a distribuicao de frcgiiencia dos dados siga a Lei Normal. No
cspa4o bidimensional de duas variavcis Y, e Y2 , sao exigidas as normalidades de
r--0
Y, e Y,Y, , representadas, no cbagrama dc dispersao, pcla distribuicao dos a
x
pontos dentro de clipses de mesmas probabilidades (distribuicao hinormal) (Fi-
gura 8).

1?sta clipsc possui dois cixos pcrpcndiculares, cujas coordenadas sao (>s
autovetores I e 11 da matrix do dispersao S ou de corrclacao R. Os clcmentos
desses vctores defincm rta posicao, i.e., o ingulo quc Iles fazem corn os cixos
originais Y c Y, . () coml,rimento desses vctores s:io os autovalores ct>rrespon-
dentes X dcssa matrix quc representam a variincia dos novas cixos. Autovalores e
autovctores sao calculados pela cquacao IS - XII U = 0, ji descrita no Capitulo I
(cquacio 1.4).
X
Ida mcsma maneira, no cspa4o tridimensional, os pontos sao distrihuidos
dcntro de um elipsciide (distribui4 io multinormal ), corn tres cixos perpendicula-
res, de dircyao c comprimcnto detinidos pclos autovetores c autovalores da ma-
trix de dispersao (Figura 9). 1 riura 7 - l?xemplos de relactics lineares c n:ao-lincrares entre duns variavcis.

l{sscs conccitos podern ser estendidos da mesma maneira an cspat;o do


2.1.2 Para descritores ordenados nao-mctricos
(i mens6cs m (hipcrespaco). 'I'cremos entio um hiperelipsoidc corn m cixos pcr-
pendiculares, do dirc4ao c comprimcnto definidos pelos nm autoveto res e autovalores 0 coeficiente de correla4ao p (rhi)) de Spearman e chamado "nao-
da matri x do dispersao do ordem ni. parametrico" par ser aplicavcl em dcscritores nao-mctricos, cujas medidas sao
A MEnInA 1)h. SEMEL11AN(,A 37
36 Fcot.oXIA NuuI RICA

Y,

Yi

io dos pantos num cspaco a


F,K,ira 9 - l?lipsoidc rcprescntati,o da distribui4 :
Y,
tres dimcnsoes . Os cixos I, II c III sao os autovetores da matriz de corrclacao

entrc as variivcis Y,, Y, c Y,.

Este eoeficicnte pode scr tambem aplicado a descritores metricos, apps a


transformacao dos dados cm "postos ", nias cons ncenos cficiencia yuc o r de
linear, o
Y, Pearson . Fntrctanto , no caso de descritores metricos cm rclacao nao -
de Spearman stria mais eticiente (a "eficicncia" de urn eoeficicnte e a sua capaci-
Y., dade de detectar mais facilmcnte uma rela4ao entre descritores , i.e., rejeitar a
hips tese nula do independcneia).
Da mesma mancira clue o r do Pearson , o p de Spearman varia tambem
entre -1 e + 1, sendo o valor U a auscncia de relacao monotona. 0 caleulo de r e
bastante simples, podcndo sua significancia ser testada da mesma mancira clue o
Y, r de Pearson . Para comparar dais descritores corn pcyueno numero dc aniostras
Y, (< 10), existe urna tabela de significancia de p.
A formula do cocticientc de correlacao p de Spearman escreve-se:
f i ,mi S - Rcprescntacao gr5fica da hinormalidadc.
61d ;
.
ordinals (postos) c, conscyucntcmcntc, a distrihui4ao de frcg6 ncia nao dcpcndc ='
do media nem do dcsvio padri;o. P-l 11 ' -
A MonrDA no SEMMEI.IIANc`.A 39
38 Gcot.cx;IA Numtfaitc,^

Fspccie Xl
onde d c a difcrcn4a entre os postos de calla arnostra nos dois descritores c n o
nunlcro de amostras. No caso, bastantc frequents, tic amostras ann o mesmo prescntc ausentc
posto, atribui-sc a calla urn o valor mcdio dos postos. Sc a quantidadc do empatcs (1) (0)
for muito clcvado, dcvc ser aplicado um fator de corrccao no calculo tie r.
I?spCcic X2 prescntc (1) a b a+b
Como para o r do Pearson, c desaconsclhado utilizar r cm ntudo O, pois anSCme (I1) C d c+d
nests nwdo a no4ao tic posto nio faz scritido quando os descritores sao variavcis a+c b+d
anihientais corn unidades c escalas diferentes.
on tie:
I?m tabclas tic contagem tie organisntos ocorre fi-co-i6em CnicniC unl grandc
a = nunlcro tie amostras possuindo as dots espccics (1 - 1);
numcro tic espccics raras. O valor real do post() do cada uma delay nog ecossistcma
b = nunlcro do amostras onde \ I c prescntc c \2 c ausentc (1 - 0);
c hastantc incerto c inlprcciso c, conscg6tentcmente, calculo do p entrc dual
c = numcro do amostras onde \1 c ausentc c \2 c presente (Il - 1);
amostras scria fortcmcntc influenciado pelts espccics nlcnos abundantcs, geral-
d = numcro do amostras onde nao ocorrem is duas espccics (0 - 0).
mcntc mal amos:,alas.

A soma n=a+b+c+d corresponds ao total tie amostras.


O coefieicnte T (tau) de Kendall c um outro coelicientc tic corrclacao do
pasta com aplicacao identica ao p do Spearman. Elc c dcscrito cm todos os ma- Assim, o indicc binario de Sorensen foi aplicado por Dice, sob o nonic

nuais tic estatistica nao-pararnctrica. dc coehcicntc do coincidcncia, para rclacionar especics (calculo cm modo R).

Por outro lado, urn teste do qui 2 podc scr aplicado para vcriticar sc
existe urea dependencia entre as distribuio; es de duas espccics. A formula cscre

2.2 As Associacoes do Especies ve-se:

As comunidades biolt gicas sao geralniente compostas dc um pequeno Y9


P[l ad
-bC
numcro do espccics dominantes e do urn grandc numcro dc especics raras, o quc
proporciona um grande numcro tic valores nulos. Esscs valores nulos sao prcju- x =(a+G)((-+d)(a+c)(b+d)
-
diciais para cstahclecer associacoes biologicas coal base no calculo do cocfrcien-
tes do dcpcndcncia paramctricos quc cute a nornlalidade dos dados (corrcla4io).
qui 2
As unicas solu4ocs, cnlbora nao totalmcntc satisfat6rias para o ccologista, sao: tcstada com ( 2 - 1) (2 - 1) = 1 gran do libcrdadc . I?sta f^'>rmula do
correspondc ao indicc 0 (phi) tic Pearson (conforms a Tabela 1 ), Pais X = p
- climinar as espccics raras; Para pequcnas amostras , aplica-se a corrc4ao do Yates (-p/2).
- climinar os zeros coma se fosscm dados faltando;

- climinar os duplos zeros.

Alesmo o use do cocticientes nao-paramctricos nao c aconsclhado nests


caso, pelo motivo aprescntado anteriormcntc.

Ar. associacocs biologicas podcnl scr, cntretan.o, dcfinhias a partir do co-


ocorccncias entre espccics, em vez do correlacbes entre abund$ncias, utitizando-se a
seguintc convcncao para o calculo dos cocficicntcs:
i

( .tihitta1ly 4

A Ra ^g"nrsstl,ct -'^^i`tl

A rcgressao do uma vari:ivel )' (dcpendcntc nu explicada) a partir do uma


vari:ivcl .A' (indcpcndcntc ou cxplicativa) pods scr traduzida sob a forma da equa-
Gao linear )' = aX + b, sendo a () coehcientc do regressao do Y em .A' c G o enehci-
cnte linear (= constantc)- A introducao do um detcrminado valor do AT na cqua-
4ao resulta num valor, cstimativa de )-. Assim temps

u.\+b+F,
onde constitui o residuo (= ecru) da estimativa, pois _ )- - (a,A-+b), i.c,
_ )" - Y (, uanto mcnor E , melhor sera o modclo para estimar I a partir dc X.
I:m ccologia, os modelos lincares bivariaveis sao geralmente insatisfat6rios para
cxplicar os fcn6mcnos, os quaffs depcndcm frequentemente de duns on mais vari-
avcis explicativas c da claboracao de urn modclo ntultilinear que visa a diminui-
Gao do residuo para uma melhor estimativa do Y .

} =ar,Xr +a ,-\ ,+...+a X, +h,V +

Uma anahse em rcgressao nuiltipla consists em claborar um modclo que


possa explicar a maior parts possivel ci., variancia de V, i.e., diminuir ao m:ixirno
o crro da cstimativa.

A scguir, scrap aprescntados os calculos para a claboracao do modclo c


para testar a sua validade. Vcrcmos o caso de tres variaveis (duas indcpcndcntcs e
uma dependents), cujos calculus podern scr facilmentc desenvolvidos manual-
mcntc, c o ease mail gcral a III variavcis que cxigc a aplicae ao dos inctodos
matrieiais c o use do rccursos computacionais. Na ultima partc dcste capitulo,
sera aprescntado, por mcio dc urn cxcmplo nutnerico, o tr. -todo do analise de

regressao multipla chamado "passer a passo" (Stepwise Multiple Regression), o


mais rccomcndado para uma cscolha objctiva das variaveis cxplicativas.
A Rrc:atssA o M(,i.Tirt.A 43
42 I;UOUX;IA Nt1Dtfatt(A

1. CALCULO DO A1OPELO MULTILINEAR E DOS COEFICIENTES 1.1.2 Calculo de a e b


DE CORRELAcAO O calculo dos coeftcientes do modelo podc ser feito de diversas maneiras:

pela equat;ao gcral


1.1 Caso de Tres Variavcis
r,,- +'l;r,- rri -r,, r,, .S_,
+ (X,-mi)
X ,,4J
Sejam tres variaveis X, , X, c X,. Descjamos elaborar um modelo multilincar - , _
1-ra S2 1-rr S,
ligando .V, a V, C X ,, ou seja, numtar a cquacao:
quc cquiv:dc a scguintc cquacao:

V a1, 1 JN, - a, r , m,
1 12J
Para isso, dcvcnlos calcular os cocttcicntes de rcgressao parcial a,, c a,, , e
a constante b . I?m seguida, calcularcmos os cocticicntes de correlacao mtiltipla - pclo sistema de Ire's CgUaCOCS

KI c parcial re, e III-- expiicando o significadn destes cocticicntes. a,,, + IJI i..' Y-.\, + bI ,,

Y-.\7, x-, = a,2., 'A, +a,,,E V"eV1 +/'1.2+ L\,


1.1.1 Calculos interrnediarios EX,X, , + a,1 , Fps + Eb, ,, A,

As solucocs dcstc sistema podem ser obtidas pelo mctodo matricial, apli-
Organizar os dados cnl tabela, da scguintc mancira (Tabcla 9):
cando a regra de Cr amer (cf. (;apitulo 1).
pela transforma4ao,
Tabela 9. Ca/ca/os Preliminary r Para ama rI na/i.re em Regressao MJi/life/a Para dados padronizados , i.e., centrados c reduzidos
o sistema sinlplitica-se cm duns equa4ocs corn duas incognitas, ja quc temos
eu/re Tres I arilireis X, , .V, e X,
EN2: =Ex,= 11,
Obs. XI X, X, Xi' X; X I X, X I X, X,X, e, ctlnsequentementc , a constante b, ,, e igual a zero.

.\1!1I1
XI, X X. 12 -1; X'11X1, X11X1,
Scndo r,, =
.v,,1",,

r,,=a1,,r+a1i._1r1i
N X; r XI ; A,
if eSte SiStema egtitvale aO sistema: r,i=a,,,r,,+a,i ,rii

r,i rJ r,,

oil B ela, na forma ma trici al: J',1 ri,j [a,,'J -[rl t


E\, E,A2 L\ , y.\2 E,A ; Y .\72 E,A,X, EX,XJ L\,X,

Os cocticicntes a,. , c a,, 2 , calculados pcla rcgra dc Cramer, sao:

Conl isso, podenios calcttlar as medias n1,, m, e ill, c Os lk:;vios padnccs .c,,
r22 r2 1 j 1,12 r,, r r12
Jl c s, das tres variaveis, bcrn conlo os cocticicntes de corrclacao simples entre
clan, r,,, r c r.
I R 1= r,, rii
02=
r,, r,,
I

44 Ecot,oc aA Nt )IERICA A REoRI ssAO MUI.TIPL:\ 45

0 cocficicntc de dctcrrninacao multiple , Rj ,, (multiplicado por 10(1),


sendo : a12.3 = IRJ a 1;. 2 -
I--1 informa sobre a percentagem de cxplicacao d.i varianeia dc N, pelo modelo
Neste caso , o modelo apresenta-se sob a forma simpliftcada X, = a,,, X, + multilincar.
a,,. X; I uni modelo padronizado onde os coeficientes dc rcgressao rcprescntam
a conrribuic o de calla variavel independente A:, c X, a variancia dc X,. Ian ou-
tros termos , cste modelo , claborado a partir de dados eentraclos c reduzidos, 1.1.5 Calculo dos coeficientes de correlacao parcial

permitc comparar a importancia respcctiva de calla variavel independente na


cxplicacao da variavel dependcntc , mas nao pode set utilizado para cstimar V', a A corrcla4ao parcial entre dual variavcis corresponde a corrclacao simples

partir de X, c X, , ja yuc o efcito das unidadcs tin eliminado. cxcluindo o efeito das clemais. Assinr, r,,, e o coeticiente do corrclacao parcial
entrc \', c X,, mantcndo .\', constantc. IPlc i c.tlculaclo pcla lihrnuila:

1.1.3 Calculo do erro mcdio da estimativa

A difcrcnca cntrc o ^,alor do X, observado e o valor do X, cstimado polo r/2


modelo constitui o erro mcdio da cstimativa .1', de X, a parer do \, c .A lilc
c calculado pela formula: Para calcular r,, _ , , a feirmula c a mesma , iltcrnando somentc ,IS indices
2 c 3.
A significancia destcs coeficientes e tcstada a partir da tabela dc r para 11-3
Sr.:3=
n trans do liberdade.
O c dculo dos cocficicntcs do corrclaGao parcial c muito importantc cm
ou, utilizando-se os coeficientes de correlacao linear re o desvio padrao s, de A-,,
ecologia, onde as variavcis sao frecliicntcmentc inrerligadas c a correlacao simples
pcla formula:
podendo induzir a erros do intcrprctacao . Duas variavcis podem parcccr corrclatas
pelo unico motivo de screm correlatas a uma terccira , coma verenios no exem-
1-r, -r13 - r;^+2rr,r33r23
pla a scguir:
1
l`,xcntplo : scja uma matriz do correlacoes simples R cnirc duas cspceics N.
c .\'_, e uma variavel ambicntal I ', indicandu a existrncia de uma corrclac:io posi-
1.1.4 Calculo do cocficicntc de corrclacao a de determina55o multipla tiva entre as espccies c a variavel anthicntc (respccuvamentc 0,P+ c 0,5), hem coma
entre as duas cspceics (0,4).
( ) cocficicntc do corrclaSao multipla eorrespondc a corrcla4ao cntre os
valores obscrvados c cstimados do A', . Calcula-se pelas formulas:
X,
R= .\
r'23 r+
L,L
2' r,-; - 2 rte rr3 r23
K,,3= on Rr.23 =
si 1 - rz3

A si},^viiic:incia destc cocficicntc pods set testada por um tcstc F. 0 valor Porem, se calcularmos os cocficicntcs de corrclacao parcial ( matriz R )
entre essas tres variavcis , vertticaremos que existe rcalmente uma corrcla4ao line-
(n-3)R
do 1 = - -- - c comparado ao valor F da tabela pars 2 c n 3 grans do liberdade. ar positiva cntre X, c I ', hem como entre X, c I i mbora menos intensa , mas quc
2 (1-R-)
nao cxistc nenhuma eorrclasao linear cntre as duas cspceics.
;\ IZI{(;R -'SSA() M t , \ 47
46 EcoLo ;IA NUAMI;RICA

1.2 Caso Geral pelos Metodos Matriciais

Os mctodos matriciais permitcm gencralizar o calculo do urn modelo


multilinear com m variavcis. Para simplificar a denlonstracao, vamos descnvol-
vcr os calculus do urn modelo para somente tres variavcis: V = a, A + a, Z + b,
mcdidas cm it amostras.

Os cocficicntcs a, e b sao solucocs do seguintc sistcma dc cyua46cs: ondc:


R c a matrix do corrclaCao cntrc as variavcis indepcndcntcs .\ C. /.:

bn+a R r :t nt:urii dr cr>t-17I:IC:U7 do ) cum cl:t ntcsma (oU iCja, igual a 1):

b1."'+a 1 1., -2 +a, ^^'%=


^,^7
R c IZ sao its cit trcc (1as c. in clac ics do ) (1)1)1 .\ c Z.

\ p.iri i drstcs 1u:111-1) conjuotos do coCt1CICI1tCS, pudcmus calcular:


cuja rcprescntaciw matricial podc ser escrita da scguintc mancir:c
a ntatriz Jai dos cocficicntc, :c regress,.-to, pcla formula:
b
tit Ia1 =I R n 1 ' IR, I I
a, R c de dctcrminacao R', pcla
o cocficicntc dc corrclacao mirltipla
ttunnd:t:
o c uc c. uivalc, para n = 3 amostras, por cxcmplu, a:
R',-= IR,,1.IaI
I 1 1 1 1 .%-I , It 1 I 1I F I.. Compar:utdo
.\ signific:incia do 1( c vcrificada com unt ICSIC
x- A, ' I a Z o, _ .x, x ,
l)I?-'
^1.1 1. _' 1 i l .A"i 1 i a, 11 : 1.i iL )1
I - ao I' da tahcla par; p c n-I'-l gr 1iS do lihcrdadc, ondc
,, r o

X' X A X' Y
niunen, do ohscrv:trrocs c ft a niimcro de variavcis indcpcndcntcs.

ou srja, A = (X' X)-' X' Y. a matriz It' .1 (le cocficicntcs de co rrcla^ao parcial, pcla it"trmul
Cutn os dados ccntrados c rcduzidos, podemos utilizar a matrix do corrc-

laSao:

(1) (2)
i a matrix inversa da matriz do cochcicntcs do rorrcLt^ao R cnur ((), ! .IS
\/. Y ondc R '
t diagonal e ti>rmada pclu
variavcis, e D ti 11111:1 ntatriz diagonal, ondc i

invcrso da raiz yu: tdrada dos icrmos da diagonal tic R .


(1)
.\ signiticancia dos coctici, itcs do currclacao parcial e vcrtticada pelf ta-
o nitmcro dc obscrva4ocs c k a
hcla de r com ii-k-2 graus dc lihcrdadc , ondc it c
ntintcro do variavcis tixadas.
1
At

48 ECOLOGIA NUMIRICA A R FGRESSAO MOLTIPLA 49

2. SELECAO PE VARIAVEIS EKPLICATIVAS - MtTOVO PA REGRESSAO


X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
MOLTIPLA "PASSO A PASSO"
1 0,295 0,520 (1,107 0,075 0,149 0,632 0,068 0,068 -0,782 X1

Uma selecao criteriosa das variaveis explicativas constitui uma decisao 1 -0,177 -0,703 0,516 0,670-0,071-0,744-0,632 -0,614 X2
importante no estabelecimento de um modelo niultilincar. Cot-no selecionar as 1 (1,761 0,169 -0,465 0,909 0,484 (1,769 -0,319 X3
variaveis e cm funcao de yuc criterios? A regressao multipla "passo a passo" 1 -0,109-0,744 (1,620 0,842 0,928 0,123 X4
(Stepwise Multiple Regression - SW MR) e o metodo mais recomcndado para X5
1 0,232 0,163 -0,260 -0,031 -0,398
cste fim. A variavel explicative mais fortentente correlata corn a variiivel depen-
dente e selecionada cnm primeiro lugar. Em seguida, sao incorporadas as variaveis
R 1 -(1,225 -(1,658 -0,832 -0,425 X6

I (1,375 0,551 -0,545 X7


com maior cocficiente de correla4ao parcial com it dependentc. Porem, antes do
1 0,798 (1,146 Xg
cada nova introducao de vari:i.vcl explicativa, it corrclacao parcial da variavel de-
pcndcntc corn as variavcis antcriormcntc introduzidas e vcriticada. As v:tri;ivcis 1 0,090 X9

eujo cocficiente dcixou do scr significativo sao rctiradas do model). O exemplo I


numerico a seguir ilustrara os passos sucessivos do calculo.
Noma erapa prclintinar , a tiro de simplificar os c5lculos , sclccionamos as
Exemplo numerico : Coro objetivo de conhecer a ecolo;,ia do um fora ni-
variaveis explicativas, cuja corrclacao corn a variavel XI() c significativa, i.c,
nifero bentcinico, foram realizadas 22 amostragens. I:m each amostra foram me-
r superior ou igual ao valor da tabela de r para 11-2 = 2(1 grans do liberdadc
didas as variavcis scguintcs:
(r > 0,423 para p = 0.05). De acordo com os valores da matriz R, selecionamos

X 1 = Salinidadc da agua intcrsticial apenas as variavcis Xl, X2, NO e X7 conic suscetiveis de entrar no modelo
explicativo da variiIncia dc X10. A matriz R c entio reduzida:
X2 = Numero dc predadores

X3 = Profundidade do local
N 1 X2 NO X7 X10
X4 = Clorofila do sedimenro -0,782 Xl
1 ((,295 (1,149 0 ,632
X5 = Tempcratura do sedimento 1 0,670 -0,071 -0,614 X2

X6 = Pracao mineral inferior a 50mm 1 -0,225 -0,425 X6

1 -0,545 X7
X7 = Carbono organico total
I X1()
X8 = Numero dc parasitos

X9 = Recobrimento do scdimento por fanerogamas marinhas


Agora conurram os calculos da regressao passo a passo.
X10 = Numero de foraminiferos vivos
PASSO I
Queremns estabelecer o modelo de regressao multipla, unindo a variavel A variavel X1 c a primeira selecionada para entrar no modelo por ter a
X10 as demais. e -0,7822
maior correlacao corn X10 (r = -0,782). 0 coeficiente dc determina4ao
Os coeficientes de correlacao simples entre as dez variaveis sao apresenta- (1,612. Ou seja, a variiivel XI explica 61,2% da variancia de X10. 0 residuo e de
dos na matriz R a segui;: I - 0,612 = 0,388, i.e., resta a expliear ainda 38,8'Yo da variancia de X10.
A 12r:ctuss;u) Mtn.Ttrt..4 51
50 I:caL x;Ia Nt NII RICA

Os dais cocficicntcs permanecem significativos . A variavel X7 pode ser


PASSO 2
intruduzida ao modclo. Scu coeheicnte do detcrminacao c 0,4592 = 0,2107. I3la
una facao dc variancia do N10 igual
CaIculanuts us cocficicntcs do currclacao parcial entre \10 c as uutr:ts c.\plica 21,07/, do residua anterior, Ott scja ,
vari:iveis, ntantcndu A 1 const:rntc. Tcnu,s canto resultados: a (1,2107 x 11,227 = 11,0478 . O nova residua c agora 11,227 - 0,0478 = 11,179.
h. 1'.1e cxpli-
O not-(t modclo , ncstc passes, c N111 = 3,X1 + a,X, + a-N,+
ern. r =-0,644
ca 11.773 + (1,048 = 11,821, uU scja , 82,1'% da vari.incja de X10.

rlu_'rl^=-f1,50(1-- PASSO 4

;\inda falta inU-uduzir A6 as nu,dclo.^V'antes ver Sc a p:j rticipacao do N6 a


Os cocticicntes, tcstados na tabela de r para r; - 2 -- 1 = 19 gratis d o Iih er d a-
explicacao do unit parts des residuo 6 signiticativ;t. Para isso, calcul:unns a cocti-
de, sao si-nilicativus para r > 0,433, (p = 0.05). A prosiuta variavel :t ser
cicntc do corrcla4itu parcial dc N6 cant \10, mantendo oinst:uucs as vari:ivcis j:i
i ntru d uz id a str i a e ntity N2 , nuts antes tlcvcnx)S testae a a,cticicntc do currrla4:in
intraduzidas Xl, N2 e NT. 'l'cnuos:
ltarcial do XI para vcriticar sc, corn a incorporacao do X2, clc continua significa-

tive. '1'cmos: -0,296".


err._.',
r = - 0,797***
0 cocticicntc nau c signitwativo, pois para n - 2 - 3 = 17 graus d e
liberda-

Ingo, X2 pods ser introduzida ao ntodelo, tom cocticicntc do deterntinacaa dc de, o B=ite de signihcancia a p = (I.05 c r = 0,456. A variavel X6 nao sera

-0,6642 = 0,4147, i.e., cxplicando 41,47% du residua anterior, ou scja, 0,388 x incorporada ao modclo.
0,4147 = 0,161. 0 nova residua c 0,388 - 0,161 = 0,227.
0 nuxlclo XII) = a,N' + a X, + b explica uma fra4 io do 0,612 + 0,161 = PASSO 5 - Calculo dos cocficicntcs do modelo.multilincar
(),773, uu scja, 77,3'%o do variancia total do X10. Os cocficicntcs tie rcgressai) a do modclo padronizado sao calculados cum
base no,,, coeticictites de correlacao linear simples da matriz original R.
PASSO 3

Ainda tentos X7 c X6 para introduir cventualmcnte ao modclo, (:alculanos NI X2 X7 X10


os cucticientcs de cttrrela4:i0 parcial entre X111 c N7 c cntrc X10 C X6. Tenturs: Xl 1 0,295 0,6 32 - 0,782
t*
N2 0,295 1 - 0,071 - (1,614

X7 (1,632 -0,071 1 -0,545


.arr. ^, - -0,129"'
X 10 -0,782 -0,614 - 0,5 45 1
Para n - 2 - 2 = 18 graus do lihcrdade , a lintitc do sit,titicancia a p = 1).05 c
r = 0,444.
Aplicando a regra de Cramer ao sisterna matricial:
Somme r,r1 r.2 c signitica tivo. Cones na ctapa anterior, dcvernos vcriticar
sc, corn a introducaa do \7 ao nu)dclo , as variancis X1 c X2 permanecem si),mi- r i o,2('5 0,6321 a, -0,7X2
ticativas . Ternos:
0,295 1 -0,071 . a, -0,614
rra.rrzz) = 0,58 8**
0,632 -0,071 1 a-- -0,545
rrn.l(l. r)
_ -0,7 3 0 ***

52 ECOLOGIA NUMER[CA

obtemos os seguintes resultados:


Capitulo 5
a, _ -0,442 a2 = -0,504 a7 = -0,301

0 modelo e padronizado (b = 0), pois foi baseado em dados centrados e


reduzidos, ja que foram utilizados os coeficientes de correlacao para o calculo de
A n'liso ie Agrupamento
a. Ele permite comparar a importancia relativa de cada variavel X1, X2 e X7 na
explicacao da varUncia de X10, mas nao permite efetuar estimativas de X10. Para

X-X Ha uma tendencia normal do ecologo em procurar agrupar amostras de


calcular o modelo nao-padronizado, a preciso substituir X por S , Para cada ou associar especies em comunida-
x mesmas caracteristicas bioticas ou abioticas ,
Ele visa com isso descrever, da
des, de acordo com o objetivo do seu trabalho .
variavel. , determi-
maneira mais clara e sintetica possivel, a estrutura de um ecossistema
Finalmente, calculamos o coeficiente de determinacao multipla R2 pela nando a composicao e a extensao das suas unidades funcionais.
equacao matricial vista anteriormente: Fy.,=[R211 1a1. Temos:
Agrupar objetos consiste em reconhecer entre eles um grau de similarida-
los num mesmo conjunto. Os metodos ecologicos de
de suficiente para reuni -
-0,442 agrupamento devem poder destacar os grupos de objetos similares entre si, dei-
R2 =[-0,782 -0,614 -0 ,5451 -0. 504 =0,821 xando de lado os pontos intermediarios que permanecam geralmente entre os
-0.301 grupos quando a amostragem a suficientemente extensa. A nao ser que o meio
fisico seja fortemente descontinuo e que a amostragem tenha sido realizada de
que corresponde a um coeficiente de correla4ao multipla de R= 0,821=0,906 . o ecologo tera geralmente dificuldade em definir
cada lado de um forte gradiente ,
em virtude do conceito de
0 modelo explica 82,1% da varia4ao dos foramintferos vivos. Verificamos nitidamente grupos de amostras ou de especies ,
que este valor corresponde ao encontrado no final do passo 3. continuum que caracteriza os ccossistemas.
em ingles) sao
Concluindo, a abundancia de foraminiferos vivos no sedimento parece As etapas de uma analise de agrupamcnto ( cluster ana /yrir,
depender principalmente da ausencia dc predadores (variavel X2 ), da baixa as seguintes:
salinidade (variavel X1 ) e de baixo teor cm materia organica (variavel X7). 1- coleta dos dados, que serao reunidos numa tabela com m colunas

(descritores) e n linhas ( objetos);


agrupamento de objetos) ou
2 -escolha do modo de analise : modo Q (
modo R (agrupamento de descritores), de acordo com o objetivo do

trabalho;
, depen-
3 -escolha do coeficiente de associacao ( similaridade, distancia
dencia);
que depende de criterios baseados
4 -escolha do metodo de agrupamento ,
no menor grau de distorcao (maior coefiacnte cofenctico), e sua capa-
cidade de evidenciar melhor a estrutura dos dados, i.e., a existencia de
grupos;
5 -elabocasao e interpretasao do dendrograma (Figura 10).
I

54 Ecot.oct-a Nt stf:utc:n ANrit. tst, on AGIu nAnnnNTO 55

0-6
probabilisticos : rcconlendados Para o agrupamento de espccies, elcs

0-5 Sao, porcnl, poucO usados cm razao da conlplcxidade dos calculos e da


IICCCSSidadC do nntito espaco de menuiria em computador. Com Iles
0.4
dcvc scr entpregado o indite do sinlilaridade prohahilIStiCO (IC Goodall
0.3 (Cf. Lcgendre & I.CgciIdrC, 1998). OS nletodos tie agrup:uncnn)

02 prohahilisticos pcrmitCill, para um Conjunu) (IC C1C11)CIltOS, definir to-


dos ON grupos Cllj: t lll:ttri/.. (IC associaSao intra(ru;`I) tell Llllla certa pO)-
0.1
hahilidadc do set- hon),gcnca. i\ vantagenl desses nlctodos c de p(Jet
estahclecer grupos do nlancira ohjctiva, haseando-se cm prohahiIidadc.
6 5
t:C\posi(ao, I11000iOlarC111OS, a seguir, sonlcnte :11guns clos n e-
Ncsta Clint
todos Ill:tls Llsadoti Clll CCOI()gl;l, clue 5:11) ()s Il1CIOdl)S dc :IgrlIpallienlo poilictl(as
;,;iaa 10 - Difcrcntcs rcprescnta4ocs do LIM nlesnlo dcnclr< granla.
ll1O-prahahilislic >s, por aglonlertcao sCC1uCI1Clal IIICra121LIIca. () nlctodo (lip isico
T\\ 1NS1)i\N sera tanlbenl apresentad)) coal mai1,. dctalhanlcntll.
\ cscolha slo mctodo do agrupamento c t:io critica quarto :t cscolha do
coeticiente de associ:tcao. DCIC dependera a eorrcu classiticacao dc uma anlostra 1. AGRUPAMENTOS SEQUENCIAIS AGLOMERATIVOS
dentro de. um ou outro grupo ja ford ado. ,Os mctodos, do agrupanlento foram
descnvolvidos co{n base nos modclos c dados divcrsos. Sncath & Sokol (1973) O criteria basico da fusao entre um objet) C um grupo, ou entre (I) is
apresentam a scguinte classiticacao, dividindo os nmtoclos cnl:
grupas , c senlpre 0 nlesnlo : scrao rcunidos cis grupos t ue ti: m manor sin , ilarida-
segiienciais : os objetos sao rcunidos um apOs o outro, respeirAnda aria dc entre Iles . ( ) problema c: comp calcular esta similaridade ? O mctodo de ealcu-
dctcrminada seyiicncia de operac6 es, ou simultaneos : o a;grupanrento la dcpende do mctodo do aglomcracao escolhido.
e realizado numa . nica etapa,
1.1 Mctodo pot Lilac; to Simples
aglomerativos : os objetos inicialn )cnte isolados sao progressivanlentc

rcunidos Cnl grupos SUCCSSi'OS ate format unl uiniCO grupO, Oil uiViSiVOS: Este mctodo, tamhcn) ch:u)iado do "salto mitlinlo" e de "mats proximo

inicia-se cons unl 6IliCO grupo o yu:tl, Cnl razao (IC deternlinados cri
vizinho", c do concepcao simples, podendo scr realizado Sent :ijuda do conlputa-

terios, dividido cm sul>grupos, para chei:tr no final aos ohjctos indiv i-


dor. () dcndrogr:una c nlontado con base nos pares de objetos mais sinlilares (Os
do nlenot- distancia), e cnl scguid:l, os objctos oil grupx)s ja formados vao sc rcu-
duais. I: o mctodo aplicado nas chavcs do identi ficlcao enl taxonoII) 1,
nir em razao (IL' similaridades deerescentes (on de distaneias crescentes). O exctll-
bens Como polo Progranla 'l1C'INSPAN aplicadi) a dad)s dc ocorrrn-
cia' de espccies nun) conjunto de :unostras,
ph) a seguir ilustra o mctodo de agionleracao por ligacao simples, coil base em
uma matriz do distancias titre cnnco amostras:
monotcticos : bascados nuns tinico dcscritor do cada.vcz ou politeticos:
bascados em varios dcscritores, ( )bjeto (1) (2) (3) (4) (5)
hierarquicos : OS cementos-objet( de um grupo tornani-se clemcntos (1) 0 0.40 0.10 0.40. 1 0:37
do grupo superior, constituindo, assim, Lima serie bicrarquizada ou nao- (2) 0 0.4S 1).36 0.2(1
hicrarquicos : p'rocuram maximizar a homogencidade intragrupo, scnl (3) 0 (1.42 ((.4(1
considerar a hierarguia cntrc grupos, tats como os nletoclos de ordena- (4) 0 0.18
4.,o e de otimizacao ua matrjz do as;ociacao, c .
(5) 0
ANALISE DE AGRUPAMENTO 57
56 ECOLOGIA NUMERICA

a maior parte das amostras inter-


grupos sao facilmente evidenciados, mas onde
O dendrograma sera montado da seguinte maneira (Figura 11): isolada. 0 metodo a recomendado em ecologia, quando o
mediirias permanece
- no eixo horizontal (ou vertical, tanto faz) serao posicionadas as amos- objetivo e descobrir fortes descontinuidades.
tras. 0 intervalo entre elas a arbitrario, sem valor metrico;
- no eixo vertical (ou horizontal) sao plotados os valores de distancia,
S
iniciando por 0;
9
- procura-se na matriz a menor distancia (= a main: similaridade): e a
distancia de valor 0,10, entre as amostras (1) e (3), que serao reunidas no 0.4-
0,4 9
dendrograma na altura do valor 0,10. E assim formado um primeiro 8
grupo (6);
- a segunda menor distancia da matriz a entre as amostras (4) e (5) que 0,2-
devem ser posicionadas no eixo horizontal e reunidas no valor 0,18, 0,2- 7
7 6
constituindo o segundo grupo (7);
- a proxima distincia e 0,20, entre a amostra (5) que ji pertence ao grupo
(7), e a amostra (2). A amostra (2) deve ser entio reunida no grupo (7) ao
0,0 (4) (5) (2) 0'0J (1) (3) (4) (5) (2)
nivel da distancia 0,20, formando o grupo (8);
- a proxima distancia a 0,36, entre o (2) e (4). Mas como o (4) pertence ao B
A
grupo (7), ja ligado a (2), passamos a proxmma distancia, que a 0,37, entre
a amostra (1) pertencendo ao grupo ( 6) e a amostra (5) pertencendo ao - Dendrograma da matriz de distincias pelos metodos de aglomeracao
Figxra 11
grupo ( 8). Ficam assim ligados ao nivel 0,37 de distancia os grupos (6) e por ligagao simples (A) e completa (B).
(8). 0 dendrograma ficou completo , com um t nico grupo, o (9) aglome-
rando todas as amostras.
A Figura 12 representa de maneira esquematica a diferenca entre os me-
Em razao da sua simplicidade, este metodo apresenta grande desvantagem. (II). Sejam doffs grupos ja
todos por "ligacoes simples" (I) e pelo "diametro
0 fato de reunir um objeto ao clemento "mais proximo" do grupo ja formado, a) e (B) composto de amostras ( b), e uma
formados , (A) composto de amostras (
faz com que os objetos intermediarios entre os grupos sejam rapidamente aglo- amostra isolada X. A que grupo
ira se juntar esta amostra X, ml como posicionada

merados a esses . Ocorre entao um encadeamento de objetos que dificulta a sepa- no espaco? A resposta depende do metodo escolhido:
ra4ao dos grupos. Nos estudos ecologicos em que as amostras de caracteristicas Pelo metodo (
I), a amostra X sera incluida no grupo A, em razao da sua
intermediarias sao geralmente numerosas , este metodo deve ser evitado. , comparativamente com a amostra
proximidadc com a amostra ( a) deste grupo
ao grupo B em
(b) do grupo B. Pelo metodo (11), a amostra X sera atribuida
comparativamente
1.2 Metodo por Ligacoes Completas razao de sua menor distancia com a amostra (b) deste grupo ,
(a) e (b) sao as mais afastadas dos
com a amostra (a) do grupo A. As amostras
Este metodo, tambem chamado de "metodo de aglomerasao pelo diame- respectivos grupos e situadas na extremidade do diametro ,
dal o nome do me-
tro", a de "vizinho mais distante ", e o oposto do anterior. A fusio de dois grupos
todo.
depende do par de objetos mais distantes . Em outros termos, urn elcmento Entre os metodos por ligacoes simples a por ligacocs completas existern
fusionara a um grupo unicamente se for ligado a todos os elementos dente grupo.
outros metodos que utilizam a media como criterio de aglomeracio. Sao os me-
Com isso, a medida que os grupos crescem, a cada mais dificil incluir elementos todos pela associacio media a pelos pesos proporcionais.
a esses grupos . 0 resultado a um dendrograma dilatado ( Figura 11b), no qual os
58 ECOLO(,IA NUMf-AUCA
A;NAt.tsi: ut: Acau PA91INTO 59

1.5 Mctodo pela Vari .Incia Minima

Ncstc ntctodo, tamhcm chantado de Mctodo do Wards (Romesburg, 1984),


un) ^grupo seta rcunido a unt norm SC essa reuni.Io proporcionar o 111cnor au-
mcnto da vari;incia intragrupo. A sari;incia inrra rupo sera calculada Tara codas
sts alternativas de aglonuraSao, cscolhendo a yuc pn,poreiona a Inenot' ^ari:incia.
O ntcsmo procClinuCnto i aplicado a todos os pass)', da nn;ilisc. O mctodo i
altantcntc chcicntc na torma(^ito dc grupos.

1.6 Modelo Geral do Agrupamcnto

Lance & \\'illitnts (I906, in 1.cgcnchr & LCLCndre, 1998) hrohuscrant unt
modclu gcral incluindo os dlVcrsos mc}todos dc a lontrra4:io. Iatc ntodclo utirc-
I;an 12 - Au-ihui4ao ilc un1 objcto X a urn dos doffs grupos A c B, do acurdo con) cc a vanctgent de poder scr trailuzido n;t Brenta de Lill) prc,granr.) nicn (IC contpu-

o ntctodo do aglemtcracao pot. ligacio simples ou por.Iigacao complcta. tador, permitindo passar de unt ntctodo aglomeraci)o a urn outtu iarcndo Sitt-,-
plcsmcntc variar tres par:intctros ((X, 3, Y) yue drtcrminatn a cstrati,,ia do agru-
pantcnto. Assim, a distancia 1) entrc urn objcto c um grupo Li forn)ado
de clots suhgrupos / C ///, (Figura 13) scria igual a:
1.3 Mctodo pela Associa^iIo Media

1) . =a, +a,,0, +f3l) r,. YI)ri,e,-I),,,


1ate ntctodo conhccido cm ingics polo none de ",Arithmetic Average
Clustering" ou t.1PG\IA (Sncath & Sokal, 1973) caicula a media aritmctica da
sintil;u idadc (ou (1a disr;incia) entre o objcto yuc Sc doer incluir null
) grupo C
cada tbjeto dcsse grupo. O objeto c atribuido ao grupo corn o yual ele tern a
major similaridadc media (ott mcncrr distancia media) corn todos os ohjctos.

1.4 Mctodo dos Pesos Proporcionais

Lan Gcolocia acontece fre(l6entemente de g*rupos de anu)stras, oriundas


por exemplo do regi6es distintas, serer) os de tamanhos difcrentes (uma rcgiao
mais amostrada vue a outra). Para evitar cluecssa ditercnca dc csfor4) de amostra-
gem \ enha interferir no calculo da associa4ao media (mctodo' anterior), Sokal &
Michener (1958) sugeriram a aglomeraFao por pesos proporcionais (Weighted
Clustering, ou WPGMA). 0 mctodo consiste cm atribuir um peso igual a dois
ramos'do dendrograma yuc estao para fusionar. Para isso, no calculo da associa-
cao media, cada similaridadc (ou distancia) c multiplicada por Bois coeticic^tcs
(um para cada objeto),.e a associacao media c calculada fa4endo-se a sonic politic-
radii dos difereatcs. parses de Ubjetos,dos dois grupos a fusionar (cI I.egendre & I', :, m 13 - Calculo (fit distancia I) entrc um objcto,{ c um grupo b, formado
l.egcn(.ire, 1998, para um exc mplo. numerico). por dais subgrupos / c m, pelo mctodo geral do Lance & Williams (1966).

It
I

ANALISE DE AGRUPAMENTO 61
60 EcoLoclA NuMERICA

1.8 A Interpretacao do Dendrograma


A Tabela 10, di os valores dos parametros da equacao geral de Lance &
W illiams para alguns modus de agrupamento. O passo final, numa analise de agrupamento, c a interpretacao do dendro-
grama, i.e., a identifica4ao dos grupos de cspecies ou de objctos. A excecao dos
mctodos probabilisticos, pouco usados pela complexidade do algoritmo de cal-
Tabela 10. I 'a/ores dos Parinie/ros da l:gna,ao de 1-auce c-';'' lUi/lianur
culo, h:i uma grande parte do subjetividadc na decisao do destacar e interpretar os
Mara Tres A e/odo.r de r1 okwerecao
grupos quc podcriam, aparentcmente, constitUir uma rcalidadc ecolbgica.
((/Ide _ e silo os respeclivos liemeros de obje/r r uns subornro.+ j e nt).
Algumas dicas para interprctar, pot exempla, uma analise de agrupamen-

Mctodos/ Parametros a. to em modo Q (entre objetos):


p Y
- escrcvcr no proprio dendrograma, cm ticnte do cada amostra (quc gcral-
I.igacao simples (1,5 0,5 t) -0,5 mente aparecc sob a forma de um numcro na saida do computador), as
I.igacao cumplcta 0,5 O,5 0 0,5 suas caracteristicas: local c epoca de coleta, cspecies doniinantes, diversi-
dade, caracteristicas fisico-quinticas, etc. I?ntim, tudo quc poderia reve-
(0
. \ssocia4ao media II II
lar os asnectos comuns cntre as anx>sn-as de um mcsmu grupo c as difc-
(0, +(0, (0, +(0
ren4as corn as amostras tie outros grupos,
- come4ar a "lcr" o dendrograma de circa para baixo, isto c, dos baixos
Mais explicacoes sabre csses e outros mctodos do aglomeracao podem ser valores de similaridade para os maiores. Assim, deverau ser intcrprcta-
obtidas cm abundantc bibliogratia, entre as quais dcstacam-sc Sncath & Sokal dos em primciro }cigar os "grandcs grupos", s;craltncntc pouco nuniero-
(1973), Orloci (1978), Gaucli (1982), l.cgcndre & I.egcndre (1998), Piclou (1984), sos (dais ou tres apenas). Ides rcprescntam a macroestrutura do
it
Romcsbut;g (1984), I,udsvig & Reynolds (1988), Krebs (1989). eeossistema, ligatia ao efcito dos principais tauores ambicntais: fortes gra-
dientes, descontinuidades espaciaiS on remporais, etc. Scria vao tentar
explicar os grupos menores scm ter C'>nseguido formular ant,:s unia hi-
1.7 Qual Metodo Escolher? p6tese plausivcl sobre os grandes,
- quando possivel, desenvolver paralelamente, coin os mcsmos dados, urns
Llm mctodo c mclhor do quc um out'- ' quando o dendrograma tornccc analise de ordenacao (cf. Capitulo 6) que evidenciara os tatores respon-
uma imagem menos distorcida da rcalidadc. L possivel avaliar o gran de detirrma- saveis pclos agrupamentoS.
uao provocado pela construcao do dendrograma calculando-se o chantado "cocti-
cicnte de corrcla4ao cofenctico". F o cocticicnte r de Pearson, ca!culado colic os 2. AGRUPAMEN TOG DIVISIVOS - TWINSPAN (TWO WAY INDICATOR
indices do similaridade da matrix original c os indices reconstituidos corn base SPECIES ANALYSIS)
no dendrograma (chamados valores cofencticos). Quanto maitrr o r, menor sera
a distor$ao. Ohviamctne ha sempre urn certo gran dc distorr ao, pois o r nunca Trata-se de um programa de computador para dados de ocorrencia de es-
Seri igual a 1, mas a literatura considera accit5vel urn coehciente cofenctico supe- pccics Horn conjunto do arnostras . Essc mctodo, publicado por 1-lill et al, (1975)
rior a 0,8. Certos pacotes estatisticos ofcrecem a possibilidade tic se calcular este sob o name "Indicator Species Analysis", classifica as amostras e, eni seguida,
coeficiente, o quc facilita muito a escolha do mclhor mctodo de aglonteracao. utiliza esta class ificacao para classificar as cspecies. As duas classiftca4oes sao
Ent geral, alem do metodo tic Wards (variancia minima) considerado unanimc- fcitas simultancamente. O resultado final c urns tabela ordenada nos dais modos,

mente corno o mais eficiente, embora nao apresentando o mclhor cocticicnte Q (pclas iinhas) c R (pelas colunas) (Ordered Twn Il'^._p Tuble), cal corno excmpli-

cofenctico, os mctodos dc agrupamento bascados nas similaridades ou distancias ficado a seguir (Tabela 11). 0 programa nao tra4a o dendrograma, que pode ser
media., pondcradas ou nao, sao os mais recomendados. montado manualmente sem grande dificuldadc.
ANALISE DE AGRUPAMENTO 63
62 ECOLOGIA NuNII RICA

Tabela 11. A9ode / de Saida do Prgt raiiia TI1'l\`SPAT",7 Para identificar condicoes ambientais peculiares. A especie Spa, por exemplo, e
boa indicadora, ao contrario da especie Sp6.

I"spccics Amostras 0 principio basico do TWINSPAN e a dicotomia. 0 programa divide as


amostras em grupos por dicotomias sucessivas e, cm seguida, faz o mesmo Para
12 11 9 8 10 7 6 3 1 2 4 5
as especies. As etapas da dicotomia podem set assim resumidas: (1) achar um
Sp I 2 1 I primciro grupo de especies indicadoras, i.e., que ocorrem juntas nas mesmas
.Sp? 5 3 4 l 5 O II O arnostras, Para construir uma ordenacao, atribuindo o peso 1 a cada uma dessas
especies, e somando os valores Para cada amostra; (2) dividir a ordenacao num
Sp 3 4 5 2 1 1 3 0 0 1
detcrminado nivel, onde seja possivel distinguir comunidades de especies; c (3)
.Sp4 3 2 5 4 1 5 I () lI I
dividir as especies em categories de acordo com o faro de set preferential ou nao,
Spy 1 5 3 O I A dessas comunidades. Exemplificando com base na tabela anterior (Tabela 11),
'VO 5 4 1 4 5 4 5 4 2 4 1 0 (I vamos supor que Spy, Sp9 e $p11 tendem em ocorrer juntas . Elas podern ser
consideradas como indicadoras e as amostras ser ordenadas de acordo corn a
.Sp7 3 I 3 12 2 1 4 1 1 1 u 1
ocorrencia dessas especies, da seguinte maneira:
Sp^S' 2 2 2 3 4 1 1 11 (1
\
Sp9 1 4 2 1 3 5 5 5 3 1 1 0 Amostras 9, 11, 12 Peso + 3 (pois contem as tres especies)

.Splo 3 4 11 1 Amostras 8, 10 Peso + 2 (pois contem duas especies)

Sp1I 5 4 1 1 1 Amostra 7 Peso + 1 (contem uma especie)

.Sp1? 5 1 1 1 1 Demais amostras Peso 0 (nao contem nenhuma das tres especies

0 0 0 (1 (1 0 1 1 1 1 1 1 indicadoras)

(1 0 () 0 0 1 (1 0 1 1 1 1 Ordenamos as amostras por oodem crescente de peso . Constatamos, en-


O 0 l) 1 1 0 1 0 O I 1 tao, que Sp3 a tambem . uma especie indicadora do mesmo grupo. Logo, alteramos
B os pesos das amostras, que ficam assim:

Amostras 9, 11, 12 Peso + 4 (pois contem agora quatro especies)


As linhas (A) c (B) mostram a primcira dicotomia das especies c das amos-
Amostras 8, 10 Peso + 3 (contem tres especie
tras, respectivamcnte. A tabela foi ordenada para exibir a rclasao entre Lspecies C
Amostra 7 Peso + 2 ( contem dual especies)
amostras da mancira mais clara possivel. Assim, vcrificamos que:
Demais amostras Peso 0 (nao contem nenhuma das quatro especies
- as especies Spl a .Sp5 sio mais abundantes a esquerda da primcira divisao
indicadoras) 2
que a dircita;
- as especies 3p8 a 3p11 sao mats abundantes a dircita; Com a introducao de Sp3, verificamos uma certa descontinuidade de peso
- as demais (.Sp6, Sp7) sao indiferentes, ocorrcndo nos dois lados; entre as amostras com peso 0 e as demais.
- uma especie, 3p12, parece fora da scqucncia, devido a sua abundancia Com base nessa ponderacao das amostras, podemos entao completar os pas-
sos que levam a ordenacao completa (das linhas c das colunas) da tabela original:
exclu^; a na amostra 6.

A partir dessa dupla ordena4ao e possivel definir "especies indicadoras", 1. realizar uma primeira ordenagio das amostras (ordenacao primaria),
com claras prcferencias ccologicas , de tal modo que sua prescnca pole ser usada utilizando, por exemplo, uma anilise de correspondencia - AFC;
I

ANALISE DE AGRUPAMENTO 65
64 EcoLOGIA NUMERICA

Agora, suponhamos uma especie cujo recobrimento e 18% na estacao A


2. dividir as amostras em dois grupos ( as de coordenadas positives e as de
e 36% na estacao B. Embora a estacao B esteja duas vezes mais recoberta do que
coordenadas negativas , no primeiro eixo fatorial da AFC), realizando,
a A, as dual tem uma parte importance em comum: elas possuem as pseudo-
assim, uma primeira dicotomia grosseira das amostras;
especies PSI (0-4%), PS2 (5-25%), e somente diferem pela pseudo-especie PS3
3. identificar as especies indicadoras que tern preferencia Para um lado ou
(26 50%). Essa pseudo especie PS3 torna-se indicadora para diferenciar as esta-
outro da dicotomia primaria;
4oes A e B. Ela ocorre unicamente quando a taxa de recobrimento da especie
4. otimizar a ordena45o das amostras usando as especies indicadoras como
criterio (ordenasao " refinada"); ultrapassa 25%.
As criticas atribuidas ao metodo residem no fato de que os resultados
5. dividir a ordena4ao " refinada" num determinado ponto, que
podem ser diferentes, de acordo com a escolha dos limites de classes de abundan-
correspondera a dicotomia "desejada";
cia. Alem disso, urn numero elevado de pseudo-especies exige uma maior capaci-
6. construir uma ordena4ao " simplificada" (= ordenacao indicadora) ba-
seada em algumas das especies mais indicadoras , o que permite caracte- dade de memoria do computador e urn maior tempo de calculo.

rizar sucintamente a dicotomia; e


7. verificar entao se a dicotomia sugerida pela ordenacao " refinada" pode
ser reproduzida pela divisao da ordena4ao indicadora.

Em resumo , TWINSPAN realiza dicotomias sucessivas nas tres ordena45es:

- ordenacao primaria dicotomia grosseira;


- ordenacao refinada dicotomia desejada;
- ordenacao indicadora dicotomia final.

Pelo que podemos constatar, o metodo nao a propriamente dito, uma


anilise de especies indicadoras, mas, sim, uma analise de ordenacao dicotomizada,
assim chamado por Hill (1979).

0 Conceito de Pseudo -especie

A ideia de "especies indicadoras" a puramente qualitativa. Para levar em


conta a abundancia, as especies devem ser substituidas por equivalentes quantita-
tivos, chamados "Pseudo-especies". A ideia a expressar a quantidade por codigos
semiquantitativos de abundancia. Os limites de abundancia utilizados em
TWINSPAN Para definir a dicotomia grosseira sao chamados de "Pseudospecies
Cut Levels" (= niveis de dicotomia das pseudo-especies).

Seja, por exemplo, a seguinte escala de recobrimento do solo por uma


determinada especie vegetal expressa em percentagens:

(1) 0-4 (2) 5-25 (3) 26-50 (4) 51-75 (5) 76-100.

Para cada faixa de abundancia a atribuido urn nome de pseudo-especie (PS).

I
C&PA1n1>D ()

O1 ^`:^^L{-tmllos tItn rtlt^nn^^


- - - - - - - - - - - - - - - - - - -

A ordenacao c, Para o cccilogo, unla operacao muito familiar. Ordc-


nar anlostras cm fcrncao do um critcrio, por exemplo o numcro de individuos de
unla espccie A p/, CofSiStC em posicionar essay anlostras ao longo de um eixo
rrpresentativo da escala de abundancia dcssa espccie. Assim, na Figura 14a, as
amostras A c C, prciximas uma da outra, tom uma forte similaridade em razao
day Silas fracas abundancias cm .SS1. Da mesma maneira, pela sua riqueza em .Slit,
as anlostras D, E c 13 Sao similares entrc si c dcssimilares com A e C.
A ordcnacao em fun4ao de dois criterios, por exemplo a abundancia em
individuos de duas espccies Sp1 c Sp2, posiciona as amostras nurn piano de acor-
do coin suas coordenadas (abundancias) nos eixos Spl e Sp2. Assim, na Figura 14b
veriticamos que as amostras A e C tern pouco individuos das duas especies, ao
contrario clas amostras D, h. e B mais ricas em ambas as cspeeies, e, consequen-
temente, distantes das amostras A c C. Podemos obscrvar com isso que as amos-
tras se distribuem ao longo de urn eixo U,, que sintetiza os dois criterios de
i abundancia. Este eixo representa a tendencia do maior dispersao das amostras,
i.c., "cxplica" a maior parts da variancia dos dados. Uma segunda tendencia de
dispcrsao c rcprescntada polo eixo U., perpendicular ao prime iro. Os eixos U, c
U, sao os eixos principals da elipse dcntro da qual se posicionam as anlostras.
Eles rcpresentam a totalidadc da variancia dos dados, cada urn contribuindo Para
unla detcrminada fray ao.
Com tres criterios de ordenacao (abundancia em tres especics: Spl, Sp2 c
Sp3), os pontos-amostra se posicionam dent o de urn clipsoide, com projecoes ao
longo dos tres eixos principals deste e lipsoidc, t',, U, c U,, represcntativos da
totalidadc da variancia dos dados. Cada urn desses eixos, de comprimento decres-
cente, contribui Para urna fracao cada vex menor dessa variincia (Figura 14c).
Em Ecologia, as amostras sao geralmente ordenadas em funcao do urn
grande numcro de criterios (m especies), e se posicionam dcntro de urn espaco de
rn dinlensbes (hiperespaco), corn projecoes ao longo dos m eixos de urn


r
I I

68 Ecoux.IA NUMERICA OS MI'.TODOS DE ORDENAQAO I 69

hiperelipsoide (as suas abundancias nas in especies). Obviamente, a representa- informacao sobre suas semelhancas ecologicas. Essas tecnicas, tambem chamadas
4ao grafica e impossivel, mas gracas ao calculo matricial podemos projetar as de "tecnicas fatoriais", visam definir esses eixos de dispersao como fatores ambien-
amostras num piano, como o formado pelos dois primeiros eixos, e ter, assim, tais responsiveis pelo determinismo dessa estrutura. Em suma, o principio da or-
uma imagem simplificada dessa estrutura multidimensional. denacao consiste em simplificar, condensar e represcntar sinteticamente vastos con-
juntos de dados, na esperanca de que as inter-rela46es ecologicas possam emergir.

Spi
dW' +Sp2 Ili
1. OS VIVERSOS MTOPOS PE ORPEMAcAO

0 principio dos metodos de ordcnacao c antigo, mas seu dcsenvolvimento


e sua diversificacao sao relativamente recentes e ligados as facilidades de calculo
oferecidas pela informatica.

(a)
Analise Fatorial Stricto Sensu (AF)
(b)
Embora nao sendo um metodo de ordena4ao propriamente dito, esta ana-
lise deve ser citada como pioneira das tecnicas fatoriais. Inventada e aperfeicoada
Sp!
por Spearman (1904) e Thurstone (1947), ela foi aplicada aos estudos da psicolo-
gia. Assim, as notas obtidas em testes psicologicos poderiam ser "explicadas" a
partir de um pequeno numero de fatores inerentes ao ser humano, tais como a
intellgencia e a memoria, por exemplo. Esta anilise a baseada unicamente na
rela4ao entre descritores. A posicao relativa dos pontos-objeto no piano fatorial
(C) nao pode ser calculada, o que torna este metodo de pouca utilidade em ecologia.
0 metodo consiste na procura das "comunidades" (comuna/ity), que e a parte da
variancia explicada apenas pelos fatores comuns, excluindo, assim, a parte da
variancia, chamada "unicidade", ligada aos fatores especificos, proprios e exclusi-
vos do cada variavel . 0 modelo ligando o conjunto das obsjvag6es aos fatores
hipoteticos escreve - se da seguinte maneira:

X, =F .P Ap., . +E,,,,
onde:

X = matriz dos dados;


Figura 14 - Ordenagao de amostras (A - E) em fungao de (a) um descritor (Spl); F = matriz dos fatores comuns;
(b) dois descritores (Spl e Sp2); a (c) tres descritores (Spi, Sp2 e Sp3). A= matriz dos coeficientes de cada fator;
E = matriz dos residuos (fatores especificos e aleatorios);
Em vista disso , definiremos a Ordena4ac como um conjunto de tecnicas n = numero de observacoes;
pelas quais objetos sao posicionados em rela4ao a um ou mais eixos, de tal mane ;- m= numero de variaveis;
ra que suas posicoes relativas aos cixos , e entre dies, proporcionem o miximo de p = numero de fatoics comuns.


Os M I TOt x>s DE O RDrNA cAO 71
70 ECOLOGIA NUDIIiRICA

cc^rrespondcncia entre as linhas e as colunas, permitindo, assinn, analisar indife-


Analise em Componentes Principais (ACP)
rentementc em modo Q ou cm modo R. Os autovetores das matrixes entrc linhas

A analise cm componentes principals foi c, talvez, continua sendo o m6to- e cntre colunas sao os mesmos, podcndo cntao ser escolhida a menor dimensio da

do de ordena4ao mais usado em ecologia. A sua primeira aphcacao nesta area lot tabcla para fazer a analise. Por exemplo, sc tivcrnlos 50 espccics coletadas cm ape-

de Goodall (1954), com base no desenvolvimento da tecnica por Pearson (1901, nas 3 amostras, podercnlos rcalizar a AFC sobre a matrix do 3 x 3, c projctar no
mcsmo piano as 50 espccics c as 3 amostras para uma intcrprctacao conjunta. Uma
in Ludwig R. Reynolds, 1988). A ACP estabelcce, corn base cm unla matrix do
semelhanca (correlacocs, variancias-covarianeias ou ate t esmo de similaridades), outra pcculiaridade dcstc nlctodo reside na possibilidadc do analisar quaisqurr ti-
um conjunto de eixos (componentes ou fatores) perpendiculares. Cada comlpo- pos do dados quantitativos c positives, qualitativos (binarios) ou semiquantitativos

nente corresponds a um autovetor dessa matrix. Assim, corn base cm uma ma- (ccidigos de abundancia), desde quc tiles sejatn hontogeneos. Nao ha exigencia no
clue se refers a normalidadc das distribuicoes, podendo ser incluidas, por CXcmlplo,
triz de correlacao entre ni variaveis, scrao calculados ,n autovetores (= sixes
fatoriais) de comprimento Al, 22,... Am decrescente cm razao da sua contrihui- espccics rants. As ctapas dos calculos scrap apresentadas Mai,"' adiantc.
cao a variancia total dos dados. lasses connprimcntos correspondcm aos ni
autovalores (= raizcs latentec) da matrix. Desse modo, o prinnciro eixu cla ACP, Analisc Fatorial dos Postos (AFP)
sobre o qual serao ordenadas as amostras, representara a maior parts da variacao
uma analise dc componcotes principais aplicada a uma matrix
dos dados. 0 resultado disso e urn sistcma rcduzido de coordenadas, proporcio- ']'rata -sc do
, por cxenlplo).
nando informa46cs sobre as semelhancas ecolcigicas das amostras. do coeticicntes do corrclacao nao-paramctrica ( p de Spearman
os dados sao ordinais (postos)
Esta tecnica c cscolhida no lugar da ACP quando
Em razao da sua importancia, apresentaremos, mais adiante, as etapas do
ou quando as distribuicc cs do frcgOi ncias das variavcis nao segucm uma distri-
calculo corn base em um exemplo numerico, assinl comp comentarios sobre a ON proccdimcntos do calculos sao
buiGao normal, mcsmo al-)()s a t ransformacao .
interpretacao dos resultados dessa analise. P. 1?xiste uma tabela clue fornece o valor limits do X para quc
identicos aos da AC
(]. chart el
o cixo scja significativo, em funcao das dimensocs da matrix de dados
Analise Fatorial do Correspondcncia (AFC)
at, 1982).
A analise fatorial de correspondencia foi dcsenvolvida scparadamcntc por
diversos autores. Primeiramente descrita para a analise de tabelas dc contingen- Analisc cm Coordenadas Principais (AC)

cia por Fisher (1940) sob o nomc de contingency fable analysis c por llenzccri Dcscrita por Grnacr (1966), essa teenier corresponds a uma ACl> cm modo
(1969), eta foi aplicada a Ecologia para analise dc tabelas Especies x Amostras por
Q, com base em unta matrix (IC distancias cuclidianas cntrc amostras. A analise cm
(corresponding
Hatheway (1971) sob o nomc dc RQ analysis, Hill (1973, 1974) coordenadas principais prescrv.1, em espa4o do dimens cs rcduzidas, as distancias
c outros, mas scu use tot generaliza-
anal)ysis), Orloei (1975) (reciprocal areraz;inc cntrc objetos caracterizadas por descritores dc qualqucr tipo. O inconvcniente do
do por Benzecri (1973) (analyse artorielle des correspondences). metodo e a impossibilidadc de intcrpretar os eixos com base na projecao dos descri-
0 ponto forte dessa analise c quc as ordenacocs das espccics c this amostras tores, ja quc des nao participam do calculo dosses eixos. Esta tecnica de analise c
sao obtidas simultaneamcnte, pcrmitindo clue o ecolcogo examine as rclacires en- nornlalmentc aplicada em paralclo cons um mctodo dc agrupamcnto.
tre amostras e especies a partir de urna 6nica analise. A APC utiliza a mcsma
As tecnicas acttna citadas visam a analise descritiva da cstrutura de um
abordagern quc a analise em componentes principais, pelo calculo dos autovetores
conjunto dc dados, i.e., a ordenacao das amostras e dos descritores em gradientes
e autovalores de uma matrix de variancias-covarianeias, corn a diferen4a clue calla cm subconjuntos. Para interprctar essa estrutura,
dado c previamentc transfotmado cm probabilidade (dividido p.la soma total dentro de .gym conlinnnm, e;u
i.e., formular hipOtcscs sobre os fatores respons; vets, c I,rceiso relacionar essa
dos dados) c, cm seguida, duplannentc centrado pelas probabilidadcs marginais
cstrutura Co111 os descritores idcntificados cono potencialmcnte explicativos pe-
da linha e da coluna correspondentes. Conn essas transformacfies, it calculo das
las tcorias ecol igicas. As tccnicas a seguir sao dcstinadas a esta finalidade.
variancias-covarianeias eorresponde a distincia do x, e possibilita uma perfcita

10
1

72 4 ECOLOGIA NUMI:RICA Os METODOS DE ORDENAcAO 73

Analise das Correlacoes Canonicas (ACC) Analises de Ordenacao Canonica

O metodo das correlacoes canonicas a uma generalizacao da correlacao A ordenac,ao canonica e urn conjunto de tecnicas visando relacionar a
B
multipla. Ele tern par finalidade achar a correlacao maxima entre combina4oes composigao em especies de amostras corn as variaveis ambientais . E uma combi-
A interpretacao e
lineares de dois conjuntos de descritores Y e X. nacao dc ordenacao (ACP e AFC) e de regressao multipla .
realizada corn a ajuda dc dados externos, calculando - se o coeficiente de correla-
O calculo inicia pela elaboracao de uma matriz de correlacao S formada
cao cntre variaveis ambientais e as eixos fatoriais . Esses eixos sao determinados
por quatro blocos:
par urna combinacao linear das variaveis ambientais . 0 programa CANOCO
SII = correlacoes entre descritores;
( Canonical Community Ordination, Ter Braak , 1988) desenvolve essas tecnicas.
S22 = correlacoes entre descritores X; Etc e uma extensao do programa DECORANA ( Detrended Correspondence
S12 = correlacoes entre descritores Y e X; Analysis, Hill, 1979), cujo objetivo e eliminar a dependencia quadratica (efcito

S21 = transposta de S12. dc arco) entrc o segundo e o primeiro eixo fatorial.

Em seguida, o problema consiste em tornar maxima a correlacao inter-


Analise Discriminante (ADS e ADM)
grupos (S12 c S21), comparativamente as correla46es intragrupos (Sit e S22). 0
que corresponds fazer: Este tipo de analise e destinado a interpretar grupos de objetos, definidos

S12.S21 a priori pelos metodos de agrupamento e ordenacao. A tecnica nao consiste em


=maximoou seja, S12 . S22' . S21 . S11' = maximo estabelecer grupos, ja clue eles sao previamente conhecidos, mas interprets-los
511.522
corn base em variaveis ambientais. Os dados devem ser apresentados comp mos-

A solu4ao e dada pelo calculo dos eixos (autovalores e autovetores ) de S, trado na Figura 15:
resolvendo a equacao:
(S12.S22-1 .S21 .Sll-I-?, h.I)Uh=0 Varisveis
[species ambientais

As correla46es canonicas sao as raizes quadradas dos autovalores I d I,

e os autovetores correspondem a uma combinacao linear dos dois grupos de


descritores. I
Teoricamente, else metodo deveria se constituir numa boa ferramenta para
ordenar e analisar matrizes duplas de dados formados por descritores biologicos
0
e fisicos, par exemplo, ou interpretar as componentes principais de uma ACP V
corn base em urn conjunto de descritores. Entretanto, em virtude da complexida- v
de dos calculos, da dificuldade de interpretacao e, sobretudo, da exigencia de
linearidade nas rela46es entre variaveis, as autores aconselham proceder em duas
etapas, corn base em uma ACP:
1. ordenar as descritores bioltigicos; c
I II

2. interpretar essa ordenacao corn projecao de variaveis ambientais nos


Figura 15 - Organizasao dos dados para realizar uma analise descriminante
pianos fatoriais. entre dois grupos de objctos (I e II).
OS MITODOS DE ORDENAcAO 75
74 Ecoi ocIA NUMI:RICA

A analise discriminante e dita "simples" (ADS) quando ela e aplicada a


No excmplo da Figura 16, nenhuma das dual variavcis Y, e Y, pcrmitc
somente dois grupos. Nesse caso, uma unica fun4ao e calculada Para separar esses
discriminar perfcitamente os dois grupos dc amostras A c B. E preciso utilizar
dois grupos. Para mais dc dois grupos, a analise e dita "multipla" (ADM). Nesse
uma cotnbinacao das duas, representada polo eixo d, charnado dc frrnfao
caso, sao calculadas fun46es discriminantes multiplas, charnadas tambcm de "va-
ditrrinlinanle, cuja cquacao e: d = UiYI + U,'',. Apos calcular os coeficicntes
riaveis canonicas". Mais detalhes serao apresentados mais adiantc sobre a ADM,
U, utiliza-se esta func5o para posicionar calla amostra no cixo discriminante.
c um exemplo numcrico de ADS sera dcsenvolvido.

2. A ANALISE Em cOmPONENTES PRINCIPALS (ACP)

2.1 A Prcparacao dos Dados

A tabela de dados ecologicos c claborada com nr variavcis (dcscritores) c n


objetos (amostras). A ACP dcve scr realizada em modo R. Conseguentemente, e
preciso definir perfcitamente, a priori, o que corresponds aos "descritores" e aos
"objetos". Deve see verificada a necessidadc de uma transformacao normalizantc
dos dados, quando utilizar o coeficiente r de Pearson como indite do semelhanca.
Nesse ciso, nio ha necessidade dc uma padretnizacao dos dados, ja clue ela csta
incluida no proprio calculo de r (os dados sao previamente centrados e reduzidos).

2.2 Os Calculos de uma ACP

Com base em urna matriz S de coeficientes de correlacao linear (ou


variancias-covariancias) entre n descritores medidos sobre n amostras, sao efe-
tuados os seguintes calculos:

2.2.1 C'alculo dos cixos fatoriais


1 i ura /6 - Rcprcscntacao gratica de urna analise discriminant: os dois grupos dc
amostras, A c l:, nao podem scr separados apenas pclos sects valorcs cm Y, c Os cixos fatoriais (componentes principais) sao definidos em dirccao e
mas polo cixo discriminantc (d), cuja funcao e d = cos (45) Y, + cos (45) Y, comprimento pela resolucao da cqua4ao caracteristica.
(adaptado de Legcndre & Lcgcndre, 1998).

(S-x,,. I) Uh = 0
A analise discriminantc e aplicada nos seguintcs problemas:
onde:
- atribuir uma amostra isolada a urn ou outro grupo, conhccendo suas
S matriz de correlacao;
caractcristicas ccol6gicas (valores dos descritores) c a fun4ao discriminante;
- h S m;
U h= autovetor h de S, com 1 <
- calcular un,a distancia D2 ntre dois grupos dc arnostras, chamada "dis-
tancia gencralizadla de \lahalanobis", c vcrificar se cla c signi6cativa; h = autovalor b do S;
- determinar a pcrcentagem explicative de calla xariavel ambiental na sc- T = matriz-unidadc.
para4ao do dois grupos de arnostras.
0

OS METODOS DE ORDENAcAO 7/
76 ECOLOGIA NuMERICA

Considerando dois pontos P1 e P2 num espaco de tres dimensoes (eixos


2.2.2 Calculo das coordenadas das amostras e das variaveis
fatoriais 1, II e III). Cada ponto P e definido pelas suas coordenadas F nos eixos:
As coordenadas das n amostras (scores) e das m variaveis (factor loading ou
"saturacoes") no novo sistema de eixos sao calculadas pelas seguintes equacoes Eixos
matriciais:
I II III
a) Coordenadas das amostras 111
13;2
P l= Fr . 1 Fr , 1t Fr,ut

F = X U 11r
'
P2 = 132 , 1 F2 111 "2.111
onde:

F a matriz das coordenadas das n amostras sobre os n/ eixos fatoriais;


X = a matriz dos dados, (n amostras e m descritores) centrados (e reduzi-
do se for utilizado o coeficiente de correlacao em vez da covariancia); Para cada eixo, o somatorio dos quadrados das coordenadas dos dois pontos
U = a matriz dos m autovetores com suss coordenadas sobre os m corresponde ao valor total da variincia explicada pelo eixo (i.e. = o autovalor X do
descritores. 2
eixo). Por exemplo Fr21+FZ1=A1. Em consegiiencia , a razao -'t representa a
XI
b) Coordenadas dos descritores
contribui4io absoluta (CA) do ponto P1 a variancia do eixo I, been como a
f , =U,, jDxs],,,,n, F2
2,1 1
contribuiyio absoluta do ponto P2 a variincia do eixo 2 e dada pela razao
A.11
onde:

f a matriz das coordenadas dos m descritores sob.- os m eixos fatoriais; Para cada ponto P, o somatorio dos quadrados das coordcnadas sobre os
eixos a igual a variincia total de P.
D xO'= a matriz diagonal de ^I ^t 111
Assim, E2 1 + 1321, + F.21u = 132 =variancia de P1 e a razao corresponde

2.2.3 Calculo das contribuicoes das amostras e das variaveis


a contribuicio relativa (CR) do eixo I a variincia de P1.
A interpretacio correta de um eixo fatorial deve ser baseada nas amostras
e nos descritores que mais contribuern para a formacio deste eixo (maior contri- Em termos gerais as contribui46es expressam-se pelas equacoes:
buicio absoluta , CA). Por outro lado, o cilculo da contribuicio relativa (CR)

0
das amostras e descritores permite avaliar a importincia de cada cixo sobre a 2
posicio relativa dessas amostras e descritores . Em ACP, essas contribuisoes sio =" =contribui4 io absoluta do ponto i ao eixo a
iouais is coordenadas dos pontos sobre o eixo, o que dispensa o seu cilculo. Na a
anilise fatorial de correspondencia (AFC), entretanto , as contribuiacs levam
CRi = F2o =contribuic io relativa do eixo a ao ponto i
em conta o "peso" (total das fregiiencias) das linhas c das colunas, e devem ser jFA
calculadas Para a interpretayio dos cixos.
78 E COLOCIA NUMMERICA 79
Os A ITO DOS DE OKDENAcAo

2.3 Exemplo Numerico (Adaptado de Legendre & Legendre, 1998)


Distancia (D) Calculo D2
Sejam as abundancias de duas especies Xl e X2 em cinco amostras. entre as amostras

(1) e (2) (3-2)2 + (4-1)2 = 10


2.3.1 Calculos preliminares
(1) c (3) (5-2)' + (0-1)' = 1()

Especies (1) c (4) (7-2)2 + (6-1)' = 50


(1) c (5) (9-2)' + (2-1)'- = S(1
Amostras Xi X2
(2) c (3) (5-3)' + (0_4)' = 20
(1) 2 1 (2) c (4) (7-3) -' + ((--4) ' = 20

(2) 3 4 (2) e (5) (9-3)' + (2_4)' = 40


(3) 5 0 (3) e (4) (7-5)' + (6--0)2 = 40
(4) 7 6 (3) e (5) (9-5)2 + (2-0)' = 20
(5) 9 2 (4) e (5) (9-7)2 + (2-6)2 = 20
Ex 26 13
Total 280
Ex ' 168 57
Media 56 (= 32,8 + 23,2)
Exlx2 74
Media 5,2 2,6
Dispcrsao 32,8 23,2
Codispersao 6,4 Por esta razao, as analises fatoriais sao tambem chamadas de "analise da
inercia".
Variancia 8,2 5,8
Covariancia 1,6
I 2.3.2 Calculo dos autovalores (L.)

A equacao caracteristica dos autovalores e 1 V - AI I = 0, onde V e a ma-


Podemos verificar que o somatorio das distancias euclidianas entre os
8,2 1,6
cinco pontos-amostra, representados graficamente no espaco das especies (Figu- triz de variancias-covariancias , V= podcndo ser tambem a matriz de
1,6 5,8
ra 17), dividido pelo n6mcro de amostras (5) a igual a soma das dispersoes das
duas especies. Este valor a chamado de inercia da nuvem de pontos. Ffetiva- corrclacocs.
mente, temos:
8,2 1,61-IA 01 =0 8,2-A 1,6 =0
1,6 5,8 0 A 1,6 5,8-R

(8,2 - A)(5,8 - A) - 1,6 . 1,6 = 0 AI - 14A + 45 = 0,


cujas raizes sao A, = 9 e A, = 5.
I

OS MI`TODOS Dr: ORDENAcAO 4 81


80 4 ECOLOCIA NUMGRICA

Este sistema esta indcterminado. Ele admite como solucao UII = U2I= 0,
Observamos que:
i.e., vetor passando pela origem. Para calcular um Segundo ponto do vetor, dcve-
A, + A2 = 14, traco de V e que A, . A2 = 45, determinante de V; mos atribuir um valor qualquer a um dos elemcntos, por exempla U,,= 1, e
a variancia total, igual a 8,2 + 5,8 = 14. (traco da matriz V), e agora calcular o valor do segundo elemento, U21. Temos, nesse caso, -0,8 + 1,6U21= 0,
distribuida entrc A.,= 9 e A2 = 5. Ou seja, 64,3% da variancia c explicada logo, U 0,5.
polo primeiro eixo fatorial, e 35,7%, pelo Segundo.
- Para X, = 5, fazcmos o mesmo ealculo que o anterior. Em seguida, atribu-
7 imos, por cxemplo, U2, = 1, c calculamos U, = -0,5.

6
-0,>
[ I. Para quc esses dais vctores
A matrix dos autovetores c U=1
r0 5 1
5
possam ser comparados, e preciso que Iles estejam name mcsma escala (climinar
o ctcito das unidadcs). Para isso, devemos normalize-los a 1, dividindo cada clc-
,X 4
mento pcla rain quadrada da soma dos quadrados dos elemcntos. A matriz dos
autovetores normalizados torna-sc Igual a:
3
....................................................... ...

2 UI U2

1 -0,5
I [0,894 -0,447
11 +0,51 11 +(-0,5)1
0 , 447 0 , 894
0,5 1
0
I 2 3 4 5 6 7 8 9 9 10
L 1'+0,5' 1 2+(-0 5)2
Especie X 1

Figrrra 17 - Representaca , I das amostras ( 1-5) no espaco das especies X1 c X2 Observamos que:
e no espaco das componentes principais I c II. - esses dais vctores sail ortogonais, pois o produto escakir e igual a zero;

- os elemcntos desscs dois vetores do norma l sac os cusscnos -diretores


2.3.3 Calculo dos autovetores (U) dos angulos que Iles fazern com o sistema de origem;

A equacao caractcristica dos autovetores e - X.l I U = 0. Existc um - csses vctores correspondem a uma rota4ao dos eixos originais dc um

vetor U para cada valor do A: angulo a, tal que cos a = 0,894 (ou sen a = (1,447). Este angulo vale
26"33'. Verificamos que cos2(2633') + serr'(2633') = I (Figura 17).
para A, = 9, as coordenadas UII c U,, do autovetor U, sao calculadas

pela equacao matricial


2.3.4 Calculo das coordenadas dos pontos -amostra

P ,2-9 1,6 U;; -0,8U;;+1,6U,;=0


=0
1,G 5,8-9 U z; +1,6U ;; -3,2L1,, =0 As coordenadas dos pontos- amostra sao calculadas pcla cqua4ao (6.2).
Os MIToDos nt'. ORDENA CAO 83
82 Ecol ,ocaA Nu NtfatnCA

I.sses novas cixos (componentes) correspondem a fatores ecol6gicos responsa-


vcis pcla dispersao dos dados. Nutna ctapa scguintc, csscs cixos scrao interprcta-

-3,2 -1,6 - 3,5 76 0 dos calculando-se as contribuicoes absolutas c rclativas das especies e das esta-

-1,341 2,235 c6cs. Como dito antcriormentc, as contrihuicocs nao sao ncccssarios em ACP, a
-2, 2 1 , 4
0 , X94 -0 , 447 J interpretacao podendo ser cfetuada diretanicnre cons base nas coordenadas. Mes-
-0,2 -2,6 -1,341 -2,235
0 , 447 0 , 894 nul assim, apresentaremos esscs c:ilculos quc servirdo de exemplo ilustrativo,
1,8 3,4 3,129 2, 23 5
U sobrctudo pant a anali e fatrial de corrL.<l-umdencia (:AFC), ondc Iles sao obriga-
3,8 -0,6 3,129 -2,235
t6rios para a intcrpretacao.
X

Podemos verificar quc Issas novas coordcnadas prescrvam a incrcia dos 2.3.6 Calculo das contribuiSocs das especies
pantos. A distancia media cntre as cinco estacocs continua igual a 56 (= soma
a) Contribuicocs absolutas (CA)
das dispersi es das dual especies).
,A contribuicao do uma cspecic a forinacao do um cixo e dada pela equacao
2.3.5 Calculo das coordenadas dos pontos-especie (6.4).

As coordenadas das especies no novo sistema de cixos sao dadas pela equa- Eixos
cao (6.3). I II

a 1 0,894 -0,447 F9 0 2,682 -1 2,6,S'2- -1 '


cspcclc XI =0,80 =0,20
1,341 2 9 S
X2 0,447 0,894 0 .
U ` D r
cspecic X2 1,311 =0,20 2^=0,80
Q 5
\'crificamos, a seguir, que a soma dos quadrados das coordenadas de ulna
especie sobrc os dois cixos e igual a variancia dcsta especie, c quc a soma dos
1 especie \ 1 cuntrihui Para Sll "i. da v,i:incla do cixo I c a cspecic X2
quadrados das dual especies sobre urn dctcrminado eixo e igual a variancia destc
c(inirihui p;tra 4(l" (a V: Iri,incia d eiz,I II.
eixo, i.e., seu autovalor.

17 h) Contribui45cs rclativas (CR)


Eixo I Eixo II 1,2
1
I 1 Inllclcncla do unt deterntinado f:uur sohrc uma cspecic c dada polo Cal-
culo da sua conurihuicao relativa ( CR), Seg undo a cquacao (6.5).
especie X1 2,682 -1 8,2 = variancia do X 1

especie X2 1,341 2 5,8 = variancia do X2


1 II
9,0 5,0 = variancias de I c Il
If2 cspecic Xl =0,878 =0,122
8 8,2

A analise em componentes principais realizou uma rota4ao dos eixos ini- cspecic X2 , 1,341 =0,310 2' =0,690
S,8 5,8
ciais de 2633', o que definiu as direr 6cs de maior variabilidade (Figura 17).
OS METODOS DE ORDENAcAO 4 85
84 ECOLOGIA NUMI:RICA

A especie Xl e fortemente influenciada (87,8%) pelo fator I. A especie X2 Eixos


e influenciada principalmente pelo fator II (69%), e levemente pelo fator I (31%). II
EstaSao I

2.3.7 Calculo das contribuicoes das amostras 2


(1) -3,576
= 1,00 0 = 0,00
a) Contribui56es absolutas 12,79 12,79

Eixos 2,2352
Amostras (2) -1,3412 = 0,74
_ 0,26
I II 6,79 6,79

2
(1) -3,576 (3) -1,3412 -2,2352 = 0,74
= 1,421 v_ = 0,0000 = 0,26
9 5 6,79 6,79
(2) -1,3412 2,2352 = 0
= 0,200 , 999 2,2352
9 5 (4) 3,1292 = 0,34
= 0,66
(3) -1,3412 14,79 14,79
= 0,200 -2,2352 = 0,999
9 5
3,1292 2,2352
(4) 3,1292 2,2352 = 0,999 (5) = 0,66 = 0,34
= 1,088 14,79 14,79
9 5
(5) 3,1292 -2,2352 =0,999
= 1,088 0 fator I e responsavel pela totalidade da variancia da amostra (1), 66%
9 5
das amostras (4) e (5), 26% das amostras (2) e (3). Quanto ao fator II, verificamos
que ele influencia fortemente (74%) as amostras (2) e (3), fracamente (34%) as
amostras (4) e (5), e nao tern nenhuma influencia sobre a amostra (1).
0 eixo 16 definido pela abundancia das especies nas amostras (4) a (5) e as
baixas densidades das esF "ties na amostra (1). 0 fator II a ligado a oposicao
entre as amostras (2) e (4), e (3) e (5). 2.4 A Interpretacao dos Resultados
Interpretar uma ACP consiste em tentar definir o que representa cada
b) Contribuicoes relativas
eixo em termos de fator ecologico, responsavel pela ordenacao das amostras.
Precisamos calcular os somatorios dos quadrados das coordenadas de cada Na medida em que a importancia dos eixos, i.e., a sua participacao a variancia
amostra sobre os eixos (EF). total (autovalor), vai diminuindo, a sua interpretasao torna-se calla vez mais
dificil. A interpretacao de um eixo deve set baseada nas coordenadas dos
Amostras EF2 descritores (variaveis, especies, etc.) neste cixo, a partir dos quais foi elaborada a
(1) -3,576' + 02 = 12,79 matriz de correla4ao que deu origem aos autovetores. As coordenadas das amos-
tras vem ajudar, cm seguida, nessa interpretac3o. Os principios da interpreta4ao
(2) -1,341' + 2,235' = 6,79
de uma ACP sao os seguintes:
(3) -1,341' + 2,235' = 6,79
(4) 3,129' + 2,235' = 14,79 - ttma proximidade maior ou meiior entic dois pontos-variaveis no pia-
no traduz uma maior ou menor correlacio entre essas variaveis, princi-
(5) 3,129' + 2,2352 = 14,79
palmente quando elas sao afastadas do ccntro do piano;
86 ECot.(x.oA Nuntr:RtcA Os Ml TOnOS DE ORnENA(:Ao 87

a coordenada do um ponto-variavel sobre um ciao fatorial c igual ao quentementc, aconselha-se parar a interpretacao a partir do cixo cujo autovalor
coeficiente de correlacao entre csta variavel e o eiso. Uma variavel e c anormaltnente inferior all anterior (Figura 18).
eonsiderada significativamente ligada a urn eixo e, por eonsequencia,
suscetivel de ser utilizada part a interpretacao deste eixo quando a sua

2
distincia d ao Centro do piano c d? 2 , ondc ni = numcr) de varia-
lll

vcis (Legendre & Legendre, 1998);


a proximidadc cntrc dais pantos-amostra traduz unla certa similarida- A
de entry essay duns amostras, em tcrnios de conlposicao ertt cspcciCS
por cxentplo;

a proximidadc cntre um panto-cspccic c urn ponto-amostra signitica


(.]tic, em media, esta cspccic tern urn alto valor nesta an-lostra. "I'm
media", porquc a posl4ao da dita amostra no piano nao depcnde unica-
mente da abundancia delta cspccic, mas de todas as csp&ics.

>n
2.5 A Validade dos Resultados I 2 3 a 5 (6 7
FiXOS

Ao terms de uma analisc fatorial, o pesquisador (2ntrcnta uma scric do ^{mu IN - Decaimcnto dos autovalores (X) pars dados alcu< "orios (A) c dados
dtividas na hora ac intcrprctar os resultados saidos do eontputador. cam cixos fatoriais I e 11 signiticativos (l1).

a) Significancia dos cixos Geralntcnlc, :11c111 dos dais ou u-es primeiros cixos, a intcrprctacao tor-
na-sc mail dificil. licnzccri (t<)r.i) considers v:ilida o quc CIC chanla (IC ,.pruc:t
Ouantos fatores cxtraidos pcla analisc Sao Cstati:cticanlcntc Signiticativos,
scnlantica': till) cis,) si1nific3tiv1) p,>de na' set- inicrpreta\cl, por raus.i, I ,r
i.e., rcpresentanl uma varisincia littorial c nao-residual=. Lill outrt)S ternlos, a par-
C\cn1plo, (IC MILL insuliciCnri:l do intIInnati>cs sabre (I Mill) icntc, 11:15 Lill) eiso
tir de (ill(' eiso dcVetnos parar a intcrprctacao? Nao cxistc tuna respost:l prrfcita pcrtcitainontc intrrl)rctado tern gr:utdc chance do set signilie tip,).
nicntc Clara a csta pcrgunta. t'nt nlulodo indirct,' consistc cut conlp:n-ar oS
Na nlaioria dos t all.llhos, 15 )mare', p.o:anl a ill tcrplci:tc:lo :t 1.1r.ir do
autovalorCS coil] os quo: seri:un obtidos SC oS dados tOsSCltt tudos alcatorios (seta
sc:t,undo Cis). 1'. hrceiso insistir n.i intp<n-t:incia de 1cnt:ur proSSCguir cons a .111,ili-
inllucncia fat(rial). ()s cixos cujos autovalotes ultrapassanl ns ohtidos idol dl- sc dos dCmais cixos, due podcm rcVCI:u cstruturas suhjaccntCS im isicciS a 'olb
dos alcat<irios podCtn Set Con''derados C'Inlo represent:utdo hula Certa variancia no. I. nesse aspecto c111 reside tads a t()rc:t Ills tccnicas tatnrrl.lls. P:ur:a isso, c
fatorial c suscetivcis do intcrpretacao ccologica. nccess:irio, cntrctanto, dispor:

Este mctodo, recentemcnte incluido ent certos prograntas de conlputador - (IC d:ulos c111 qu:tntid:tdc sMticienic: Issas ticnicas silo dcstinadas :1 gr:u1-
(PCORD, por exemplo), realiza uma pcrmutacao, tambcm chamada dc des conjuntos do dados;
randonlizacao, dos dados da tahcht original. i .ssa randomizaFao pode scr cfctua- - de dados de qualidadc, sent vicios de amostragem, e adcyuadamcntc
da do divcrsas manciras, dcpcndcn(,') do algoritu-t: utiliz:!do: Alanlr Carlo, jack.ur/i, coletados do acordo com os ohjctivos do tralmillo; c
BooJ,dn)p (Manly, 1997). Este tipo do tcstc levou a scguinte constatacao: nunta - do informacocs exausuvas sobrc o mcio anthicnte c a ecologic dos or-
tabcia de dados ao acaso, o decaimento dos autovalores e progressivo. Conse- ganisill 's.

a
I

88 EcOLOCIA NUM$RICA OS METODOS DE ORDENAGAO 4 89

b) Estabilidade a validade dos resultados 2.7 Interpretacao de uma Ordenacao corn Base em Dados Externos

Apos ter evidenciado uma estrutura, o ecologo pode se perguntar se essa Uma vez efetuada a ordenacao de especies corn base numa analise em
estrutura que caracteriza o ecossistema a estivel, i.e., see representativa de uma componentes principals ou de correspondencia, o diagrama devera ser interpre-
realidade e nao ligada a algum artefato dos proprios dados: valores aberrantes, tado corn ajuda de informacoes suplementares sobre os sitios de coleta (por exern-
influencia de variaveis nao-conformer as exigencias do metodo (normalidade, plo, variaveis ambientais medidas simultaneamente). Duas abordagens sao possi-
excesso de valores zero ...), influencia das unidades , da transformacao ou codifica45o vcis: pela analise indireta ou pela analise direta.
aplicadas aos dados . Sempre que for necessario devera ser refeita a analise, elimi-
nando-se os dados aberrantes ou duvidosos para verificar esta estabilidade. Isso
leva, as vezes , a um trabalho repetitivo de computadoo, indispensavel para se tirar 2.7.1 Analises indiretas

conclusoes seguras sobre a estrutura do sistema estudado e dos fatores que a


Variaveis e observaq es suplementares
regem . Por fim, essas conclusoes so serao validas na certeza de que a estrutura
evidenciada pela analise a um reflexo da realidade fatorial , e nao somente fruto Alem das variaveis utilizadas para o calculo dos autovetores (variaveis cha-
do acaso. Um teste de significancia baseado em "modelo nulo" (metodo de per- madas de "ativas"), podemos eventualmente dispor de outras variaveis, as quais,
mutacao de Monte Carlo, Jacknife ou Bootstrap) deve ser , sempre que possivel, por motivos diversos (especies raras, nao-normalidade,...), nao puderam ser
aplicado ao termino da analise (Peres-Neto et al., 1995). introduzidas na analise. Essas variaveis, chamadas de "ilustrativas, suplementares
ou passivas", podem ser projetadas nos pianos fatoriais, pelo calculo das suas
coordenadas nos eixos, e contribuir, assim, para a interpretacao desses eixos. Do
2.6 Apresentacao dos Resultados
mesmo modo, podemos utilizar observacoes suplementares. Essas variaveis ou
Raramente todos os resultados de uma analise fatorial merecem ser publi- observacoes suplementares devem constar de arquivos separados a serem chama-
cados. Isso depende essencialmente da contribuicao que eles podem dar a inter- dos pelo programa de computador quando necessario. Poucos programas, entre-
preta4ao dos dados e a elaboracao das conclusoes do trabalho. A parte publicivel tanto, possuem essa oP4ao de calculo.
pode ser infima comparativamente ao esfor4o dispensado.
E recomendado fornecer ao leitor as figuras dos pianos fatoriais que me- Correlacao entre eixos fatoriais e variaveis ambientais
lhor ilustram sua interpretacao. Essas figuras sao o melhor veiculo da comunica-
Em ACP e adotada a premissa segundo a qual a relacao entre especies e
cao entre pesquisadores, o mesmo que uma fotografia ou urn mapa. Mas para
fatores ambientais a linear. Assim, podemos tentar interpretar um eixo, seja grafica-
isso ha de se ter o major cuidado corn a clareza da apresentagao do piano (cf.
mente, por regressao linear entre as coordenadas das amostras (scores) a cada vari-
2.8).
avel ambiental, seja pelo calculo de um coeficiente de correlacao nao-parametrico
As informasoes que devem previamente constar na publicacao sao:
(coeficiente de correla4ao de postos, de Spearman, por exemplo).
as dimensoes da matriz de dados: numero de variaveis e observa6es; Em vez da correlacao simples, pode ser elaborado um modelo multilinear
a natureza dos dados a as transforma4oes eventuais; entre um eixo (E) e p variaveis ambientais (Z):

a listagem das variaveis corn indicacoes, eventualmente, dos seus valores


E=CO+C1Z1 +C2Z2 +...+CpZp
de media, frequencia, dispersao, o codigo ou a abreviatura utilizada na
figura. Dizer se sao variaveis "ativas" ou "ilustrativas" (cf. 2.7.1); e
0 calculo do coeficiente de determina4ao ir.altiplo, R2, permite verificar
a necessidade de analises preliminares para testar a estabilidade e, se for o quanto o modelo explica da variancia do eixo, c os coeficientes de regressao
preciso, eliminar ccrtas variaveis ou observacoes. parcial C informam sobre a importancia de cada varisvel na explicacao do eixo E.

I
90 Ecot_ociA Nunttauc.a Os Mf.TOnos n E ORDENAGAO 91

Os metodos do corrclacao simples ou multipla cntrc cixos c . varniveis das especics. No caso contrario, essas variavcis serio descartadas corno nao sen-
ambientais sao, porem , frcg entementc dcficicntes para Sc concluir objetivamen- do explicativas da estrutura das comunidades. Entretanto, sc existir uma relacao
te sobre o significado ecologies de um cixo . Uma das razoes e que o cixo foi signiticativa entrc uma variavel c urn quints cixo, por exemplo, esta rclagao nao
"matcmaticamcntc " calculado Para maximizar a variancia , mas pock nao ter sig- scri pcrccbida, ja quc a maioria das analises nao vai alem do tcrceiro ou quarto
nificado ecokit;ico , i.e., n5n apresentar rclacoes com as variavcis ambientais dis- eixo fatorial. hssa limitacao pole scr contornada pelos metodos do ordenacao
ponivcis. Nesse cash, porque nao procurar um eixo cujos scores estariam em cor- cant>nica.
rclacao maxima com urta dcterminada variavel ambiental ? Seja uma ordenacao 1?ssas tecnicas combinam a ordenacao e a regressao multipla. 131as visarn
de amostras c cspccics sobre o piano fatorial forntado pelos cixos E/ e 1`2 c uma detectar os padr6es de variacao das especics mais bem explicados pclas variavcis
variavel amhiental I : Q ueremos posicionar I' no piano . Q ual seria o cixo que :unbicntais.
maximiza a corrcla4ao cant I -^ l ie pode set cncontrado fazcndo urna regressao A ordenacao canonica pode set aplicada a Analise cm Componentes Prin-
multipla de I ' cm funcao de l:1 e 1;2- cipais (ACP), sendo chamada, nesse caso, de Analise da Redundancia (Rrdandanc),

I "=h(1+b11:1+b212 .-lnalpsis, RDA, Rao, 1964), bem corno a Analise Fatorial de Correspondence,
sendo chamada entio de Analise Canonica de Correspondencia (Canonical
O cocficicntc de correla4ao mititipl :t correspondc it coirrclacao nt:ixinta Correspondence llnalysis , CCA, Ter Braak, 1986).
dos eixos i ii c E2 com i A Analise Canonica de Correspondencia e tambem chamada do Analise
A variavel I posicionada no piano pcias coord e nadas b! c 1;2 sobre is Canonica das Comunidades, a fim de enfatizar o seu use nos aspectos da ecologia

cixos 1:1 e 112. I? lac rcpresentada pm- uma sent quc aponta Para it direcao do das comunidades. Os calculos sao complexos. Os eixos fatoriais (scores) sao calcu-
Hill, 1973,
major intluincia sobre as especics . A import:inci:t dessa variavel Para calla cspe- lados polo mctodo iterativo da media reeiproca (Reciprocal Areragin, ,
equivalents a AFC). A cada passo da itera4ao, os scores sao ajustados com base em
cie c dada pela proje4ao de eada ponto-cspecic sobre o cixo que suportc I , it
intlucncia podcndo ser positita (projecit positiva), negativa (projecao negativa) uma regressao multipla corn as variavcis ambientais. Este mctodo considcra, alem
ou Hula (prnjcca I po'>xint:t an ccntro ). Divcrsas variavcis ambientais poclem assist disso, que a resposta das especies aos fatores ambientais e do tipo Gaussiano (ao

scr inn-oduzidas nn pl:uu , c rontribuir para o cstudo d:a auteca>Io gia d:ts especies. contrario da ACP, quc considcra linear essa relacao), sendo as coordenadas das

I o principio do mctodo Biplot, do use cunttun nos proWramas mail rcecntcs. especics nos eixos fatoriais ajustadas pela equacao da lei normal. Por fern, os
resultados fornccidos polo computador (autovalores, pcrcentagens do variancia
\ao i aronceihado, cnthora pr :aric:tdn per alcum autores , ineluir as vari:i-
explicada, coordenadas das especies e das amostras, para oseixos canonicos c
veis :unhicntais junto as cari .iccis cspccics meta ntcsnta an:ilisc, ncnl realir:u
nao-canonicos) sao dc intcrpretacao relativarncnte complcxa para os usuarios
unto . \(: P cool IS v auiavcis antbicntais C, crtt scguida , pn>jcuut as cspccics , puffs us
inexperientes. 0 use da regressao multipla entre gradientcs de comunidades c
resultados sou li, rten>entc intlucnciados pcias v :ui.i cis de pouca intportancia,
variavcis ambientais e sujcito aos problemas inerentes a estc mctodo. Alem disso,
due ntascarant a intlucncia das 111:11s explicativas. I. scillp-c ntclhor procurar des-
quando o numero do variavcis aumenta muito, comparativamente a.> numero do
crevcr a estrutura clay aanunidades corn A('P (ou \I C; c, can seguida , detcrnti-
amostras, os rcsultados se tornam duvidosos. Etapas de calculos e exemplos
tar as variavcis dc major rcicvancia para a intcrprct a 4.io dessa estrutura.
numericos podem ser consultados em Legendre & Legendre (1998), Rcyment &
Joreskopg (1996), Jongman el at (1995).
2.7.2 Analiscs diretas - it ordcna4ao can6nica

Sejant duns planilhas de dsulos, unt:a do especies, uutra de variavcis am- 2.8 Apresentacao Grafica dos Pianos Fatoriais
Iucntais. Na auurdagcm anterior, it ordena4ao das cspccics pelos metodos indire-
E com a proje4ao grafica dos pontos-variavel e pontos-observacao no
tos c intcrpretada a poctermri pcla variavcis ;ambientais. I sscs metodos darao re-
sultados sontcntc sc as vanavcis ambientais cxplicarcnt as principals variasocs primeiro piano (formado pelos eixos I e 11) que deve iniciar a interpretacio. E
1

OS MI`sTODOS DE ORDENAcAO 93
92 ECOLOGIA NUMERICA

cao do plancton, corn a alternancia de agua profunda fria e rica em nutrientes e


neste piano que dove set possivel explicar a maior parte da variabilidade dos
de agua tropical quente.
dados e descrever as grandes Gnhas da sua estrutura. Os pianos sucessivos (por
exemplo, I-I11, II-111, 111-TV, etc.) dcverao ser projetados para descrever estrutu- EIXO II (18%)
ras mais finas, e tentar identificar fatores de menor importancia, mas que so-
mente este tipo de analise poderia colocar em cvidencia. Tie c formado pelas contribuicc cs positives da especie SpS, abundante
na amostra (9), c negativa da especie Sp6 abundante nas amostras (10) e (11). Em
Certos procedimentos elementares tornam mais clara a leitura dos pla-
nos. Alcor de indicar obrigatoriamente, na extremidade do cada eixo, seu ntime- razao da projecao positiva da vari ivel Salinidade sobre cste cixo, podemos

ro e sua percentagem explicativa da variancia, podemos: interprets-lo como sendo urn fator de influcncia continental. A especie Sp6 deve
ser de afinidade dulcicola, preponderantc nos pontes de coleta pr(iximos aos
- destacar por simlx)logia diferente os pontos van vets e observacocs de mes- efluentes continentais (rio, despejos, etc.). Alcor disso, as coordenadas negativas
mas earactcristieas ecol6gieas (mesmo pcriodo do ano, regiao, regime ali-
das variaveis N114 e Clorofila revclam urn ambiente rico em an16nia (poluicao
mentar, sexo, etc.), podendo, inclusive com a ajuda dos resultados da analise organica) favoravel ao crescimento do tuoplancton. As amostras (5), (6) e (7), no
do agrupamento, delimitar no piano os grupos assim identificados; ccntro do piano, apresentam caracteristicas bi6ticas c abioticas intermediarias.
- escrever no piano fatorial informacdes concisas que sintetizem a inter-
pretacao; e
I
- tracar eventnalmentc urn cixo diagonal que ilustre melhor a interpreta-
4ao dada ao piano fatorial; urn cixo, mesmo que sigrtificativo, pode nao
ter uma definicao clara. I'GMP
F preciso lembrar, por ftm, que a interpretacao de urn cixo deve ter urn NOS
tipI
caracter "residual" cm rclacao aos anteriores ja interpretados. Nao devera ser X13
dada uma mesma dcfiniao a dois ou mais eixos, ja que Iles sao matematicamente Agua
Profunda
independcntcs (ortogonais). Entretanto, se dois cixos sucessivos tem autovalores
iguais ou muito proximos, e, nesse caso, preferivel tentar interpretar o piano
globalmente, sem definir espeeificamcnte o papel dc cada urn no piano.
A Figura 19 pode servir dc excmplo de apresentacao de um piano fatorial.
0 estudo visa descrever a cstrutura de comunidades planctemicas, nurna regiao
costeira marinha ondc ocorre alternancia de massas de as,*ua de origem tropical e Nll4 ' CLOROF
profunda. A sua interpretacao poderia set assim formulada: Intlucncia IO \
/ Cuntinenl tl Spb
11
EIXO I (52% da variancia explicada)
I
Ele e positivamente ligado as espccies .Sp1, 3p3, Sp7 e Sp9, as quail ocor-
renm com maior abundancia nas amostras (1), (2), (3) e (4), contribuindo para
I igura 19 - 1?xcmplo ilustrativo do um plato fatorial numa analise cm componen-
uma elevada diversidade especifica, em aguas rclativamcnte quentcs (coordc- (.Sp1, .Sp2...),
tes principais . Foram pr.ojetados no piano I-II os vetores espccies
nadas positives das variaveis Tc:nperatura e Diver-idadc). Em oposicao, pro- ( I'1'.^iP = tempcratura,
os pontos amostras (I), (2) .. . . as vari;ivcis suplcmcntares
jetam-se negativamcnic no cixo I as espccies Sp2 e Spy, as amostras (8), (12),
DI\'ERS = diversidade cspecitica, CLOROF = teor de clorofina "a",
(13), (14) e (15), a os valores de Nitrato. Essa prirrcira componente principal
SALIN = salinidade , NO c NI 1, = tcores em nitrato a amonia).
sintetiza o efeito preponderante das condicoes hidrol6gicas sobre a distribui-

10
94 l:cot.ociA NUNu`RK:A Os Mf'rooos DE O RDENAC AO 95

Embora sucinto, estc exemplo de analise fatorial revela o poder de sinte- V = Q'.Q se houver menos colunas do Clue linhas (m<n); ou
se dessa tecnica, para dcscrever de mancira integrada a estrutura de dados
V = Q.Q' se houvcr menos linhas do que colunas (n<m)
multidirnensionais e, em particular, a complexa rede de interacdes Clue earactcri-
zam os ecosSistemas. "1'endo as linhas c as colunas de uma tabela de contingencia papel equi-

valente, e preferivel calcular os autovetores da menor matrix, pois V c V tern


3, A AN4ILISE FATORIAL DE CORRESPOND NCIA (AFC)
mesmos autovalores e os seus autovetores U c V sao ligados pela relacao U =
Q.I '. Consideramos, a seguir, Clue temos menos colunas do que linhas (m<)/) e
A analise de corrcspondcncias tem por objetivo a analise de tabelas de
yuc foi calculada a matriz de covariancias V entre as ni colunas.
contingeneias. Lima tabela c chamada de "contingcncia" yuando c formada pelas
frcyucncias de objetos possuindo a caracteristica da linha i e da coluna k. Assim,
cm ecologia podenios considcrar como sendo de contingencia uma tabela do 3.3 Calculo dos Autovetores e Autovalores
eontagem de organismos dc determinadas espc cics em determinadas amostras. O
Os autovetores e autovalores do V sao calculados pela equacao (6.1) utili-
numero de inclividuos .x na intersc4ao da linha i c da coluna k constitui urna
zada em ACP.
fregiiencia dc ocorrencia da espccie k na arnostra i. A AFC nao considers os
valorcs absolutos, mas as correspondencias entre caracteres, i.e., os valores relati-
3.4 Calculo das Coordenadas das Linhas (F)
vos cuja soma e igual a 1. Fla analisa os "perfis" de frcg6encias rclativas (probabi-
lidades) a partir do calculo dos autovetores da matriz de variancias-covariancias Como em ACP, se os autovetores normalizados a I foram obtidos com
entre as linhas (ou as colunas). base na matriz de variancias-covariancias V entre as colunas de uma tabela, a
As etapas de calculo sao as seguintes: posicao F das linhas desta tabela no espaco fatorial e dada pela equacao matricial, I

3.1 Transformacao dos Dados F=Q.U

Cads free ii ncia (f ) de urea tabela de contingencia, sendo i variando dc 1 onde, no caso da AFC, Q e a matriz das probabilidades p,,,, transformados enr
a n c k variando de 1 a m, e inicialmente transformada cm probabilidade (p,,.) 4, pela equacao
dividindo V;^ pelo total das frcyucncias da tabela. I:m seguida, calla valor de p 1
e transformado ens probabilidade q,k , duplamente centrada pela linha e coluna Pik
correspondentes, Segundo a formula:
Pr Pk
_ P ik - PiPk
9 rk -
Esta transformacao tem por objetivo manter a distancia do qui 2 entre as linhas
-PIN
ou as colunas da tabela de contingencia, apos a mudansa dos cixos originais para
onde p, e a probabilidadc marginal da linha i e Pk e a probabilidade marginal da os eixos fatoriais (autovetores).
coluna k.

3.5 Calculo das Coordenadas das Colunas (F )


3.2 Calculo da Matriz de Variancias-Covariancias

A matriz ( F) das coordenadas das colunas no espaco fatorial poderia ser


Uma matriz do variancias-covariancias, V, cntrc as m colunas, ou V
entre as n linhas e calculada a partir da matriz Q dos termos q , , acima, fazendo: obtida utilizando a mesma equacao (F) apos calcular a matriz de covariancias V


I
96 ECOLOGIA NUMI RICA OS Mr:TODOS DE ORDENAcAO 4 97

entre as linhas. Porem, ja que em AFC os autovalores de V e V sao iguais, c 4. ANALISE DISCRIININANTE
mais facil calcular a matriz dos autovetores t pela equacao U = Q.U., ja vista
acima. Os autovetorcs que resultam desta multiplicacao tern norms VX, e serao 4.1 Analise Discriminante Simples (ADS)

padronizaclos fazcndo: 0 exercicio numerico a seguir foi adaptado de Ludwig & Reynolds ( 1988).
Sejam cinco amostras ( de 1 a 5) descritas pela abundincia em tres especies
U = Q.U.A-
(Si, S2 e S3 ) e duas variavcis ambicntais (Al e A2):

ondc A e a matriz diagonal com clemcntos da diagonal iguais a J.. S1 S2 S3 Al A2


,1 matriz ( F) das coordcnadas das colunas e dada, entao , pela cquacao (1) 2 0 2 4,2 6,1
(2) 5 3 0 1,6 7,7
F= Q '.U (3) 5 4 1 2,4 8,3
(4) 3 2 0 2,0 8,O
(5) 0 1 2 3,8 5,9
Pik
ondc Q' e a matriz transposta dos elementos
9ik -pk pt Queremos verificar se existem duas areas de caracteristicas populacionais
distintas e, nesse caso, se e possivel explicar essas diferentes areas por mcio das
variavcis ambientais Al e A2. Realizaremos as seguintes etapas de calculos:
3.6 Calculo das Contribuicoes 1 -uma anilise de agrupamento em modo Q para evidenciar os dois gru-
pos de amostras,
O calculo das contribui4oes absolutes e relativas das linhas e das colunas e 2 -un,a anilise discriminante simples sobre as variaveis ambientais , calcu-
identico ao da ACP, exceto que a contribuicao absoluta de uma coluna k (ou de lando:
uma linha i) a formacao de um eixo deve levar em conta a massa da coluna k - a fnncao discriminants Z;
(probabilidadc marginal P. ) ou da linha i (probabilidade marginal p). Conse-
- a dirt ncia generalizada de Mahalanobis D2 entre os dois grupos;
qucntemente, as equacoes tornam-se iguais a:
- a contribui4ao de cada variavel a discrimina4ao dos grupos;
- as coordenadas das amostras sobre o cixo discriminante.
2

C.1i a =P, a = contribui4 ao absoluta da linha i ao cixo a Resultados

Matriz de distincias euclidianas entre as amostras:


k,
= contribuic lo absoluta da coluna k ao eixo a
CAk, a = Pk ' Ig
(1) (2) (3) (4) (5)
2
0 4,7 5,1 3,0 2,2
CR, a = r' a = co ntribuic ao relatvva do eixo a a linha i
0 1,4 2,2 5,7
2
0 3,0 5,9
CRk, a = ^k 2a =contribuis lo relativa do eixo a a coluna k
0 3,7
0
Os METODOS DE ORDENAcAO 99
r
98 EcoI.ocIA NUMERICA

Grupo II
d
3 Al (Al)2 A2 (A2)2 A1.A2
Iti

(2) 1,6 2,56 7,7 59,29 12,32


Figura 20 - Identifica4ao dos grupos
(3) 2,4 5,76 8,3 68,89 19,92
de amostras I e II, com base no den-
I drograma de uma analise de agrupa- (4) 2,0 4,00 8,0 64,00 16,00
mento , visando a aplicacao de uma 12,32 24,0 192,18 48,24
Total 6,0
analise discriminants simples.
0 Media 2,0 8,0
2 3 4 (d =distincia euclidiana)
11 I Variancia 0,16 0,09

Covariancia 0,12

0 dendrograma da analise de agrupamento (Figura 20) revela a existencia


b) Calculo das variancias e covariancias dos grupos reunidos (pooled)
de dois grupos de amostras com caracteristicas especificas distintas: um grupo I
composto das amostras 1 e 5 c um grupo II composto das amostras 2, 3 e 4. Na formula geral da variancia, a dispersao (SQD = soma dos quadrados
Vamos verificar, por meio de uma analise discriminante, se a difercnca cntre esses dos desvios) e dividida pelo grau de liberdade. No caso de grupos reunidos, a
dois grupos pode ser explicada significativamente pelas variiveis ambientais A l dispersao SQD1 11 e igual a soma das dispersoes de cada grupo (SQD, + SQDii ) c
e A2. Vamos desenvolver os seguintes cilculos: o grau de liberdade = nl + n2 - 2, onde of e n2 sio os n6meros de dados dos
grupos I e II. Logo, a variincia de Al para os grupos reunidos e igual a:

a) Calculo das medias , variancias e covariancias de cada grupo 82


32,08- 2 12,32-G'3? ^-
tar (A1)- X -0,133
Grupo I 3

Al (A1)2 A2 (A2)2 A1.A2 Da mesma mancira, a variancia de A2 para os grupos reunidos e igual a:

(1) 4,2 17,64 6,1 37,21 25,62 z


- 72,02-1 192,18-?3
(5) 3,8 14,44 5,9 34,81 22,42
par (A2) = =0,067
72,02 48,04 3
Total 8,0 32,08 12,0

6,0 A covariincia Para os grupos reunidos a igual a soma das codispersoes


Media 4,0
dividida pelo grau do liberdade. Assim: 1
Variancia 0,08 0,02

Covariincia 0,04 - 48,04-^8^(:^ + 48,24-(6)(24) -


Cov (Al, A2) 3
J =0,093
I

100 ECOLOGIA NuhwRlCA Os MOTOnos DE ORDt:NA(:AO 101

Logo, a matriz de variancia -covariancia dos grupos reunidos e Para testar a significancia dcsta distancia, realiza-se urn teste F, cuja for-
mula c:
Al A2
D2.n,.u ,.(n,+n,-3)
F0,133 0,093 F Al 2(n,+n.,Xn,+n,-2)
S =
0,093 0,067 A2 c os graus de liberdade, y, = 2 e y, = n, + n, - 3, onde it, c ii, sao os numeros de
dados cm cada grupo. Assim, temps: F = 3480 superior ao F da tabela (= 999,

c) Calculo da funcao discriminante Z entre os grupos I e II para p=0,001 c yt = y, = 2). Logo, a diferenca cntre os baricentros de I c 11
:dt:uncntc significativa.

Z= IC,,!\,,, onde: ni = numero de variaveis, C = coeficientes rclati-


et
e) Calculo das contribuicoes CR, e CR, das variaveis Al e A2 a distancia D2
vos as variaveis A,,. Neste exemplo, com apenas duas variaveis Al c A2, a fun-
cao discriminants cscrcvc-se:

Z = C,.AI + C _,.A2 CR C,d, =(1x00)(2,0)=0,41


' D2 8700
Os cocficientes C obtem -se pelo calcuao matricial seguinte : [S] [C] _ C,d, -(-2550)(-2,0)
[d], onde [ C] e o vetor dos coe6cientes e [d] o vetor das diferencas entre as CR2- = 0,59
D2 8700
medias de cada variavel nos dois grupos, ou seja, sendo d, = 4,0 - 2,0 = 2,0 e d,
= 6,0 - 8,0 = -2,0, tcmos:
Concluimos que a variavel A2, contribuindo para 59% da distancia 1)2,
mais importante que a variavel Al Para separar os grupos I e 11.
10,133 0,093 C, 2
0,093 0,067][C,J-[-2]' 4 ndo o sisterna de duas equag6cs,

f) Representacao grafica

5 0, 133C, +0,093Cz =2,0 A representacao grafica eonsiste em tracar urn eixo baseado na fun4ao
0,0930, +0,0670, =-2.0 ' cujas solu^ocs sao C, = 1800 e C, = -255u
discriminantc e posicionar as amostras e o baricentro de cads grupo de acordo
com as coordenadas que podemos calcular subsutuindo os valores de Al e A2 na
A funcao discriminante escreve-se entao : Z = 1800 Al - 2550 A2. funcao Z.

d) Calculo da distancia generalizada de Mahalanobis ( 1)2) entre os baricentros


Coordenadas dos baricentros Zt a Zu
dos dois grupos I e II

Z, _ (1800)(4,0) - (2550)(6,0) _ -3100


D2=EC^d,
N=l Z (1800)(2,0) - (2550)(8,0) _ -16800

ou seja, D2 = C,d, + Cl d. = 1800 2,0 + (-2550) (-2,0) = 8700.

I
i

102 EcoLcx ;IA NumtIRICA OS METODOS DE ORDENAcAO 103

Coordenadas das amostras Nesse caso , os autovetores nao serao ortogonais , pois [V-' A] nao e simetrica
(Figura 21).

Amostras Coordenadas

(1) (1800) (4,2) - (2550) (6,1) _ -7995


(2) (1800) (1,6) - (2550) (7,7) = -16755

(3) (1800) (2,4) - (2550) (8,3) = -16845


(4) (1800) (2,0) - (2550) (8,0) = -16800
(5) (1800) (3,8) - (2550) (5,9) _ -8505

Concluindo, os grupos I e 11 formados corn base na composicao especifica


\-----------------
das amostras foram cxarninados tendo em vista uma possivel interpretacao b
a
ambiental.dual variaveis Ale A2 foram consideradas sign ificativamente dife-
rentes entre os dois grupos e poderiam ser utilizadas para essa intcrpretacao,
sendo A2 mais importante que Al pars isso.
A possibilidade de atribuir uma amostra isolada a um ou outro grupo 1 ^,not 21- Principio (la An:ilisc Discriminantc';ultipla (tres grupos):
(a) vctores I C I I (cixos canr-mie(is) nao ortogonais no cspay' dos
constitui tambem um dos objetivos da analise discriminante. Por exemplo, seja
descritotes (traccjado); (b) Vrtores I c I ortogonais c nornlaliradnS.
uma amostra X cujos valores em Al e A2 sejam respectivamente 3,0 e 5,0. A
partir da funcao discriminante Z calculamos sua coordcnada no eixo discriminante: Ncssc caso,:1 distrihuiSao das amostras torna-se circular
(i.e., a vari:incia intragrnpo dinlinui). f:\dapctdo do I.ceiidre & I.c rcndre, 1998.)
Z = (1800) (3,0) - (2550) (5,0) = -7350

A amostra X parece pertencer prcferencialmente an grupo I.


SC trac:nllos os auto\Ttu(CS enl 7ingtdo reto c nlornlaliz:tntns ad '(1 uadamcnte

csses \ctores, a distrihui4ao das anu>str-.ts no piano t:uorial torna-sc circular (i.c. a
4.2 Analise Discriminante Multipla (ADM)
variancia inn;\grupo dinlinui) (I igurl 221sT:. Para isso, a matriz U dos autuVctores

No exemplo de ADS da Figura 16, verificamos que o eixo discriminante d dove ser transt'>rmada col matriz C = U (U' VU)-"". Ist:t matriz (. detn11 n espa(-o

posiciona-se na dirc4ao de maior variabilidade entre os grupos. Podemos prever canonico da an;ilisc discriminante. ( )s suns autov ctores, chanlados C1xOS canonicos,
entao que este eixo representa um autovetor da matriz de dispersao intergrupos. dcserovenl :l variahrlidade entre is grupos. O primeiro cixo indicando a dire4:in da
Este modelo de analise pode ser generalizado no caso de varios grupos com maior variabilidadc entre os ccntros dos grupos.
varios descritores. 0 problema consiste entao em achar as combinacocs lineares de
Para veriticar sc os centros dos grupos Sao significativarncntc diferentes,
descritores que maximizam a diferenca entre grupos, diminuindo a variabilidade
WI
intragrupo. Sao os autovetores e autovalores da matriz que descrevem a razao aplica-sc o teste A (lambda) de Wilks A = nude W r it matriz do variabili-
entre a matriz de dispersao geral intergrupo (A) e a rnatriz de dispersao geral
dade intern, de todos os grupoS, obtida somando-se as nlatnzes nos produtos
intragrupo (V). Em calculo matricial, escrevemos V-'.A, c os autovetores que
maximizam a diferenca intragrupo sao calculados pela equa4ao: c.,calarcs dos descritores dos t; grupos ( W = WI + WZ + ...W R ) c T a matriz de

(V-' A - a.l) U =0. variabilidade total obtida fazcndo-sc n produto escalar dos descritores centrados,

14
1

104 EcoI.oGIA NUMrRICA

para todos os objetos de todos os grupos reurudos. A varia entrc 0 (dispersao maxi- AMINO A
ma entre grupos) e I (nao ha dispersao intergrupo). Ele e testado corn qni 2 para n
(g - 1) grans de liberdade (n descritores e g grupos), apps a transformacao:

^1D0'g7tr; Il:filinas Jr Col1Il11p 1LataQllor


Alpians
X z= + -1 )-^ (f1-g /A
p
Autor Distribui}ao
Este teste de Wilk e uma generalizacao do teste t de Student para varios grupos.
N'I'SYS-PC 1. ^. Rohlf Uxter Software Inc. 100 North Country
Numa ultima etapa do calculo, a posicao F das amostras no cspa(;o dos Road, Bldg. 13, Sctatiket, New York 11733 USA

cixos can6nicos e calculada, multiplicando-se a matriz transposta dos dados h/l p . / / u'rrn . e.^ el e, So//ware. rnnr

cu/hin!/lrtrnArr
R P:ACKAGI; P.I.cgendre l rll/r:/Iurru . l.r,umoulrral.
centrados pela matriz C dos autovetores F=[x-xJC
CLt S'I'AN D. AV' ishart (:LUSTAN l imited, 16 Kingsburgh Road,
;lfais detalhes dos calculos e exemplos de aplicacao da analise discriminants I^.dinburt{ h H11! 61)s, Scotland.
podem ser encontrados em diversos manuais (Legendre & Legendre, 1998). blip: l l u u u . clu; tau. c om
Gleneclen Beach,
PC-ORD Bruce McCune MjM Software , P.().Box 129 ,
Oregon 97388, USA
I)Ilp :ll oiiru,orld . conipuseri,,e . com/hottiepa. ges/
!61 f A4Softu'a rr/ pcordu'in. him
I,ane, Ithaca,
CANOCO C. F. Ter Braak Micro -computer Power, 113 Clover
NY 14850, US:\
bilp ://u.u u.fnicrot,ompulerpou,er.com
Kalmia Company, Inc., 71 Dudley St.
I \CINSTA'i'
Cambridge, MA 02140
I PRIMER v4.0 Linda Ilorsflcld Centre for Coastal & Marine Sciences . Plymouth
Marine Laboratory. Prospect Place , Plymouth
P1.131)11, UK
I'.-mail: Lbors/isle u , cenf.aeuk

SYN-TAX Podani Fxetcr Software , I(H) North Country Rd.


Sctaukct , N.Y. 11733

Exeter Software, 1011 North Country Rd.


SYSTAT
Sctaukct , N.Y. 11733
Statsoft Brasil, Rua Pinto Fcrraz, 24, sala 1,
SI'ATISTICA
Sao Cactano do Sul, SP, Brasil.
Fone (11)4414870 Fax: (11)42274293
blip: / / u'u'u . fialsoft. com. br
Inc. 444 North Michigan Ave.
SPSS SPSS
Chicago II, 60611

FITOPAC G. J. Shepherd Universidadc Estadual de Campinas.


CxP. 1170 13083 -970 Campinas, SP
Aexo u

lf^
I.-4xe rcicuo.s

SERIE I - Calculo Vetorial e Matricial

1-1 Vcrificar a desigualdadc AB ' BA:

4 -3 1 2 5 0
A= 0 -1 -2 e B= 3 0 1
3 2 0 -2 -1 2

1-2 Calcular M'M c MM' c constatar a simetria das matrizcs resultantcs:

M=[ -l 5 5
3 -1 5

1-3 Calcular o determinants das seguintes matrizes:

4 29 -7 6
3 -1 -1
12 15 28 18 1 3
B= 5 18 16 C=
A=[ -1
1 7] 4 36 -48 13
6 -2 2
12 0 24 3

1-4 Calcular a matriz adjunta de:

[4 31
A=
5 7
I

108 A NEXO II 109


ECOL(H;IA NUMGRICA

1-5 Calcular a matriz inversa A-'; verificar que A.A-' = A-' .A = I d) Calcular o cocficiente de corrclacao linear r de Pearson entre as duas
especies. Comparar com o resultado de (c).
1 4 6 e) A partir da matriz de coeficicntes de correlacao linear R entre as espe-
A= 0 1 3 cies, calcular:

0 0 1 - a matriz A dos autovalores de R. Aerificar sc cla e e(.Iuivalentc a R


(mesmo traco c mesmo determinantc);
- a matriz U dos autovetores de R. Verificar se cles sao ortogonais.
1-6 Resolver o sistema de equa46cs polo metodo de Cramer:

3x+2)--ti=18 SERIE II - A Rcgressao Mitltipla


2x-5),-7Z=-5
x+4y+.Z=2 11-1 0 crescimento de uni organismo Y e funcao de dois fatorcs X e Z.
Verificar se esta hipotese e vilida calculando:

1-7 Calcular os autovalores e autovetores de A: a) os coeficicntes de correlacao simples;

b) os coeficicntes do corrcla4ao parcial;


2 0 0
c) o modelo multilincar Y = aX + hZ c sua percentagem de ezpli-
A= 1 7 3 ca4ao.
S4 3
Os dados brutos sao:
c verificar quc A.U = U.D., onde U e a matriz dos autovetores c DA
a matriz diagonal dos autovalores.
rt = (1) (2) (3) (4) (5) (6) (7) (8)
I-8 Sejam duas especies S1 e S2 contadas em tres amostras Al, A2 c A3:
Y = 75 76 82 82 76 83 76 74
X = 110 95 75 90 85 80 105 120
SI S2
7. = 26 28 34 31 29 36 25 23
Al 9 5
A2 2 3
A31 4 1 11-2 Qucremos estimar a quantidade do algas cianoficcas da esp6cie
Osci/latoria rubescens com base na dosagem de pigmentos. Foram
medidas, em 1.000 amostras, as tres variiveis seguintes:
a) Representar graficamente as especies no espaco das amostras a as amos-
tras no espaco das especies. Y = quantidadc dc cianoficeas;

Calcular a distincia euclidiana cnt,c as amostras. X = tcor cm ficocianina;

c) Centrar os dados (por coluna) a calcular a distincia angular entre as Z = teor em ficocritrina.

duas especies.
I
110 E'coLOGIA NIJ MI:RICA ANEXO 11 4 111

Apos a transformacao logaritmica (log,,) dos dados brutos, obtemos a) Estabelecer a matrix de coeficientes de associacao inter-especifica.
os seguintes resultados: b) Considerando que tcmperaturas infcriores a 18"C revelam a pre-
senca do uma massa de aqua diferente, vcrificar se exists uma rcla-
EY = 1999,00 EX2 = 4018,36 EYX = 4854,11 cio entre as massas de igua e as especies de fitoplancton.
EX = 2423,10 EY2 = 5896,38 EYZ = 4119,35

EZ = 2054,40 EZ2 = 4243,74 EXZ = 4994,47 111-2 Doze espccies de copepodes (de A a 1.) foram contadas cm arnostras
de plancton oriundas de duas regi6cs diferentes (ZI e Z2). Na tabcla
do resultados a seguir as especies (X) foram colocadas por ordern de
a) estabelecer o modelo de regressao linear multipla permitindo ramanho crescents (A < 13 < C < ...< I).
estimar a quantidade do cianoficeas corn base nos teores em fico-
cianina c ficocritrina. Os cocficicntes de regressao scrao calcula-
dos polo metodo classico e pelo metodo matricial; I?spccics X A 13 C D F F G 1-I 1 J K 1.

Regiao `/.I = 14 30 9 8 Il 53 7 4 56 84 12 3
b) goal e a percentagem de variacao de Y explicada pelo modelo?;
Regiao Z2 = 12 3 0 36 0 54 72 0 0 4 9
c) para as arnostras quc tern o mesmo teor cm ticoeritrina, qual c a
eorrclacao entrc a quantidade de cianoficeas c o teor em
ficocianina? Comcntar o resultado. Existe uma correlarao linear signiticativa entre:

(a) as duas regiocs em termos de abundincia de copepodes?


(b) o tamanho c a abundincia dos copepodes?
SERIE III - A Medida da Semelhanca

Nos exercicios a seguir, escolher a medida de scmelhan4a mais adcquada SERIE IV - A Analise de Agrupamento
para responder as perguntas, justificando esta escolha.
t
111-1 Coletas de fitoplancton realizadas durante 15 dias (uma por dia) numa IV-1 Efectuar uma analise de agrupamento sobre os dados do exercicio

mesma estacao revelaram as seguintes ocorrencias de cinco csprcies III-1 a fim de colocar em evid%ncia grupos de especies associadas.

de diatomiccas : X 1 = Leplocylindrus danicus; X2 = Rbi,osolenia


fra{i/issinna; X3 = .Vkelelonen,a coslalunr X4 = Para/la su/cala, X5 SERIE V - A Ordenacao
= Diploneis honsbus ( 1 = presenca , 0 = auscncia ). Simultancamentc
as colctas , foi medida a ternperatura da agua (T"C). V-I Utilizando os resultados do exercicio 1-8(e), calcular as coordenadas
clan amostras e das espccies sobre os cixos I c II. Posicionar os pon-
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) tos-amostra e vetores-espccie no piano fatorial 1-11. Veriticar se o

xI I I I 0 0 I 0 0 1 I 1 I I 1 0
cosscno do angulo entre os vetores-especie SI c S2 e igual a distancia
X2 1 0 I 1 0 0 0 0 I I 1 0 1 I (1 angular calculada cm 1-8(c).
X3 I I I 0 0 0 0 (1 0 1 I 1 0 1 I)
V-2 Durantc 11 anos consecutivos foram medidas, no miss de julho do
X4 0 0 0 1 I I 1 1 1 0 0 0 1 0 1
Ilemisfcrio N :rtc (vcrao), tres variivcis metcorologicas: TE (tem-
X5 0 0 1 I I I 1 I 0 0 (1 0 0 0 I
peratura), PR (prccipitacao) c RA (radiagao solar). Os dados foram
T 22.5 22. 2 19.0 18 . 3 15.1 18.(1 16 . 3 17.0 19 . 1 20.2 21 . 0 20.0 19.1 21.0 15.8 rcunidos na tabela a seguir:
112 Ecoi,oclA NunlfaticA ANEx0 11 113

Os dados do presenca (1) ou ausencia (0) de 27 cspecics do bivalves nas leis


Variiveis TE PR RA
estag6cs, constam da tabela seguinte:
Ano (1) 19,6 1,0 1661
Estacoes A B C D E F
(2) 15,2 90,1 968
Espccies
(3) 19,7 56,6 1353
I Nucula puelc;.t 1 l 1 1 1 1
(4) 17,0 91,0 1293 1 0 1 1
2 Mallelia cuminhii 0 1
(5) 18,3 93,7 1153 3 Adrana lellinoides 0 l 1 1 1 1

(6) 17,8 106,9 1286 4 .Volenlya pa/a'oui a 0 1 1 O 0 1

5 Anadara sp. 0 (1 (1 0 1 1
(7) 17,7 65,5 1104
Lunarca otwlis 0 (1 0 0 1 0
6
(8) 18,3 41,8 1574
7 Glycemeris lo{iior 1 0 0 0 0 0
(9) 17,8 57,4 1222 0 1 0 0 1 0
8 Perna Perna
(10) 16,8 140,6 902 9 Chlamys tehuerchus 0 1 1 1 1 1

Lima thryptica 0 0 1 0 0 1
(11) 17,0 74,3 1150 10
11 Crasso.Nrea rhy.Zophora 0 0 1 0 0 0

12 Co dakia pectinella 0 1 0 0 0 tl
Realizar uma analise cm componentcs principais sobre as variaveis a O 1 i
13 Trachycardium sp 0 1 0
fim de caractcrizar as condi4ocs climaticas no verso dos diferentes anos.
14 Mactra janeroensis 1 0 1 1 1 1

15 Mactra sp 0 0 1 0 1 0
V-3 Urn estudo da distribuicao de moluscos bivalves foi realizado na plata- 1 0
16 Tellina petillana 1 1 0 1
forma costcira entrc as cidades do Rio de Janeiro c de Cabo Frio. As
17 Maroma urutuayensis 0 0 0 0 1 0
eolctas foram cfctuadas cm scis esta4c cs (A a F), situadas nas isobatas
Abra Iioica 0 1 1 '0 1 1
de 30m(Ac1)),45m(13cF)e6On(Ce ), sendoasestacocsA,13 18
e C 4o longo dc uma radial perpendicular a costa, proxima ao Rio do 19 Pitar rostratus 0 1 1 0 1 1
Janeiro, e as estacocs D, E e F numa radial proxima a Cabo Frio. 20 Transenpitar sp 1 1 0 1 1 0
As condicoes ambientais yue caracterizam a regiao de estudo sao: 21 Chione puhera 1 0 0 0 1 0
- natureza do fundo: arcia a 3 Om, lama a 60 m e arcia + lama a 45 m; 22 Corhula caribea 1 1 1 1 1 1
- hidrodinamismo: forte turbulencia na faixa mail costcira por ven- 23 Martesia fragilis 0 1 0 0 0 0
tos de SW; Poriploma compressa 0 0 1 0 0 1
24
- temperatura da agua: ocorrcncia de agua fria (<18 "C), oriunda 25 Cardiomya cleryana 0 1 1 0 0 1
da ressurgencia do Cab.; Frio, cluase permancntc nas estacocs mais Americuna sp 0 0 0 0 1 0
26
profundas, esporadica nas estacoes mais rasas; 1 0 0 0
27 Cooperella sp 0 0
- nenhuma influencia continental.
I

114 ECOLOGIA NUM(;RICA

Aplicar os methdos de analise multivariada (agrupamento e ordenacao)


con ohjetivo de evidenciar grupos de especies associadas e areas de mesma com- Referencias Bibliograficas
posicao faunistica, e os fatores responsaveis pela estrutura dessas populacoes
(adaptado de Soares Gomes, 1989, Dissertacao de Mestrado em Zoologia, AIu- BENZECRI, J. P. 1969. Statistical analysis as a tool to make patterns emerege
seu Nacional, Universidade Federal do Rio de Janeiro). from data. pp. 35-60, In: S. Watanabe, (ed.), Methodologies of pattern
recognition. Academic Press, New York.
BENZECRI, J. P. 1973. L' analyse des donnees. Tome I: La taxinomie, Tome II: L'
analyse des correspondences. Dunod, Paris.
BRAY, R. J. & J. T. CURTIS. 1957. An ordination of the upland forests
communities of southern Winsconsin. Iirolo{ical Monogarapbr, 27: 325-349.
l?STABROOK, G. F. & D. 1. ROGI?RS, 1966. A general method of taxonomic
description for a computed similarity measure. 13iorcirlllr, 16: 789-793.
FISI(F.R, R. A. 19411. The precision of discriminant functions. Ann I:n{en. Lond,
10:422-429.
GAICII, ll. G. 1982. _11x//irariatr . Iaah:rii in C/uawnniir Cambrid(^c
I'nivcrsit Press, \. lark, 298 pp .
(lOOD,AI.1., 1). V. 1954. Objective m etllods for the classification of vemetation.
III. An essay in the use of factor :analysis. . Instr,I,,ll Jnurvnr/ n/ bolero),

2:3114- 124.

GO\VI R, I. (:. 1966. Sr inc /lisutnce properties of LIIC:rt tort and vcclo methods
used in multivariate analysis. l3io/nr/,i,(.1, 53: 325-338.
)\\ I ;R, 1. C. I')-I..1 .neral roc ,:dent of simil.triiv and sr )ntr (,I 11s properties.
27: $5^
I I.\'1I II .\\.\l, \\. 11. 1')-1. Contingency -t,tlllc .tn.tl\sis of rain f rrc^,t \cgcr.ttion.
pp. 271-313. 1u: (i. P. Patil, I.. C. Piel ou & V. I.. \\:uers (cds.), Staristical

I %Co)logy, Vol. 3: .11.:'I !pc, ICs popItI,l/loll/, rioil'stp ins r1/1'l sti/ell/s r11/,111 i/s.
Pennsylvania State t niversity Press, latndon.

I II1.1., M. O. 1973. Reciprocal avcr:Igini4: an eigenvector method of ordination.


Journal o/ 1:en/o )', 61:23--249.
HILL, M. O. 1974. Cotrespondcnee analysis: a nei Iected multivariate analysis.
.,Ipplied S'latistics, 23:3411-354.
HILL, M. O. 1979. 1)cCUR; N.-1 - - 1 1LOR7R.l,N' pro auu for Oetreatded
Correspondence . 1ual)sii and Reciprocal . lrerr{>in{. Ithaca, N.Y. Cornell
University.

RraFiatfNCiAS BiIii.Kx;R,k1--1CAS 117


116 Ecot.ociA NUMf1RICA

HILL, M. O. 1994. DECORANA and TUINSPAN, for ordination and RAO, C. R. 1964. The use and interpretation of principal component analysis
classification of multivariate species data: a new edition with supporting programs in applied research..Vankbi,ad, Ser. A26: 329-358.
in FORTRAN 77. Institute of Terrestrial Ecology. REYMENT, R. & K. G. JORESKOPG, 1996. Applied /icclor analysis in Natural
HILL, M. 0., R. G. H. BUNCE & M. W. SHAW. 1975. Indicator species Sciences (3"' ed.) Cambridge University press, 371 pp.
analysis, a divise polythetic method of classification and its application to a ROMESBURG, 11. C. 1984. ClusterAnalysis for Re.rearc% er:r. R .E. Krieger Publ.
survey of native pinewoods in Scotland. Journal o/ Ecology, 63: 597-613. Co., Malabar, Florida, 334 pp.
JACCARD, P. 1908. Nouvelles rccherches sur la distribution florale. Bulletin SNEAl'I I, P. H. A. & R. R. SOKAI.. 1973. Numerical ' laxonomp. Freeman, San
Soc/I/i Sciences Naturelles, 44:223-270. Francisco.
JONGMAN, R. If. G., C. J. F. TI;R BRAAK & VAN TONGIL.RIF.N (eds.), SOKAI., R. R. & C. D. \11C1ENFR 1958. A statistical method for evaluating
1995. Data analysis in community and landrrape ecolop)-. Cambridge University systematic relationship . I'nirerrilp of Kansas Science 13u//etin, 38: 1409-1438.
Press, 299 pp. SOK.vI., R. R. & F. J. itOl11,1', 1995. 13iomelri. !-he principles and practice of
KRFBS, C. J. 19u9. lcological Methodology. Harper & Row, New Fork. statistics in luolo,iral research, 3"' edition. W. I I. Freeman, New York, 887 pp.
LANk,i:, G. N. & W. T. WILLIAMS. 1966. A generalized sorting strategy for SPI?ARMAN, C. 1904. "General intelligence", objectively determined and
computer classifications. Nature (London), 212:218. measured . American Journal of Psychocoly, 15:201-293.
LEBART, L., A. MORINEAU & J-P. FENELON. 1982. Traitement des donnies. TER BRAAK, C. J. F. 1986. Canonical correspondence analysis : a new cigenvector
Dunod, Paris, 158 pp. technique for multivariate direct gradi ,nt analysis . 1colggy, 67: 1167-1179.
LEGENDRE, P. & L. LEGENDRE. 1998. Numerical Ecology. 2"" FInglish edition. TER BRAAK, C. J. F. 1988. CANOCO - A 1'OR7'RAN program for canonical
Developments in Environmental Modelling, 20, Elsevier, New York, 853 pp community ordination . Microcomputer Power, Ithaca.
LUDWIG, J. A. & J. F. REYNOLDS. 1988. Statistical Ecology. A primer on TI IURSTONE, I.. L. 1947. Multiple-laclor Analysis - A development and e.\panrion
Methods and Computing. J. Wiley & Sons, Inc., New York. of the vectors of mind. Chicago University Press, Illinois.
MANLY, B. F. J. 1997. Randomi.Zalion, bootstrap and tllonte Carlo methods in \\'OI.DA, 11. 1981. Similarities indices, sample size, and diversity. Oecologia,
biology. 2"`{ edition. Chapman and Hall, London, 399 pp. 50:296-302.
MORISITA, M. 1959. Measuring of interspecific association and similarity
between communities. Memoirs Faculty Kyus y University, Series E3:65-80.
ORLOCI, L. 1975. Multivariate Analysis in Vegetalior Research. W. Junk, The
Hague, 276 pp.
ORLOCI, L. 1978. Multivariate Analysis in I'egetation Research (2"" Ed.). W. Junk,
The Hague, 451 pp.
PEARSON, K. 1901. On lines and planes of closest fit to systems of points in
space. Philosophical Magazine, Sixth Series 2:559-572.
PERES-NETO, P. R., J. L. VALENTIN & F. FERNANDEZ, 1995. T6picos
em tra/amento de dados bio/dgicus. Ecologic Brasiliensis , vol.2, 161 pp.
PIELOU, E. C. 1984. The Interpretation of Ecological Data. A Primer on
Classification and Ordination . Wiley, New York, 263 pp.