Você está na página 1de 13

Similaridade

e
Anlise Aglomerativa
Joana Patrcio

Biologia e Ecologia Marinha prticas


2009

Medidas desimilaridade
Numa anlise de similaridade:
1 passo: colocar os dados na forma de uma matriz na qual os objectos
1
(estaes, amostras, etc) so colocados em colunas e os descritores (taxa,
variveis ambientais) so colocados em linhas
Espcies

A1 A2 A3 A4 A5

B1

B2

B3

B4

B5

C1 C2 C3

C4

C5

D1

D2

D3

D4

D5

Acanthochitona crinitus

Amphipholis squamata

0 15

1 108

0
0

Bittium reticulatum

Chthamalus montagui

0 234 624 389

Chthamalus stellatus

15

Cymodoce truncata

Diptera (larva)

Dynamene bidentata

Dynamene magnitorata

Eulalia viridis

Gibbula pennanti

11 641

Gibbula umbilicalis

Hyale perieri

45

Idotea baltica

Idotea granulosa

Idotea pelagica

0 115 43

27 121

Lepidochitona cinerea

Littorina neritoides

30

35

Lumbrineris sp.

31

13

Modiolus modiolus

Modiolus phaseolina

13

2 259 516 433

283

19

19

Musculos costulatus
Mytilus edulis

15

4 15

71

78

47

31

49 868

N i sp.
Nereis

Nucella lapillus

Ocenebra erinacea

Pachygrapsus marmoratus

Paracentrotus lividus

Patella aspera

15

Medidas desimilaridade
2 passo: A matriz de dados pode ser estudada de 2 pontos de vista:
2
1)Similaridade entre objectos (amostras) Anlise Q
2)Similaridade entre descritores Anlise R
Estes 2 modos de anlises baseiam-se
baseiam se em diferentes medidas de associao
Para escolher a medida de similaridade apropriada tm que se ter em conta as
seguintes
g
consideraes:

1)A natureza do estudo (questo inicial e hiptese) determina o tipo de estrutura


ecolgica
g
a ser evidenciada p
pela matriz de similaridade e logo
g do tipo
p de
medidade de similaridade a ser usada;
1)As diferentes medidas tm constrangimentos matemticos, e os mtodos de
anlise a que a matriz de similaridade vai estar sujeita (cluster, ordenao)
frequentemente requerem medidas de similaridade com propriedades
matemticas especificas
1)Disponibilidade oferecida pelos softwares de clculo

Medidas desimilaridade
AnliseR:noscoeficientesdedependncia,ZEROcorrespondeaausnciade
p
,
p
associao

AnliseQ:
noscoeficientesdesimilaridade,maximoquando2objectossoidnticos;
minimoquando2objectossocompletamentediferentes
Noscoeficientesdedistncia (oudissimilaridade)ocontrrio

Maiornmerodecoeficientesexistentenaliteraturasoosdesimilaridade.Estas
nuncasomtricas,porissoassimilaridadesnopodemserusadas
directamente para posicionar objectos no espao mtrico tm que ser
directamenteparaposicionarobjectosnoespaomtrico,tmqueser
convertidasemdistncias

Medidas desimilaridade
Coeficientes de similaridade podem ser:
1)Simtricos: os zeros para 2 objectos so tratados como qualquer
outro par de valores (2 lagos com 0 mgL-1
mgL 1 de O2)
Binrios: Rogers & Tanimoto; Yule, Hamann, Pearsons phi (R)
Quantitativos: Gowers
2) Assimtricos: os zeros so tratados de forma diferente dos outros
valores (exclui double-zeros)
Binrios: Jaccards, Sorensens, Kulczynski
Quantitativos: Bray-Curtis; (dados em bruto)

Medidas desimilaridade

Coeficientes de distncia podem ser:


1)Mtricos:
)
distncia Euclideana ((no deve ser usado com
abundncias double zero problem), Manhattan, Czekanowski, etc
2)Semimtricos: percentage difference
3)No mtricos

Anlise aglomerativa (Clustering)


Anliseaglomerativa(Clustering)
A anlise aglomerativa
g
uma tcnica da anlise multivariavel
que consiste em dividir um conjunto de objectos (ou descritores).
Desta forma cada objecto ou descritor pertence a um e apenas a
um subconjunto do total. Esta definio impe uma estrutura
descontinua dos dados, mesmo que originalmente os dados
tenham sido amostrados num continuo.

x1 est mais prximo de x2 do que de x3

As amostras so unidas por linhas como ramos de rvores. As


amostras mais similares estaro em ramos prximos, as
amostras mais diferentes esto localizadas em ramos afastados.

Anlise aglomerativa (Clustering)


Anliseaglomerativa(Clustering)

Anlise aglomerativa (Clustering)


Anliseaglomerativa(Clustering)

As tcnicas mais usadas de anlise aglomerativa so os


mtodos aglomerativos hierrquicos (dendogramas)
Partem de uma matriz de similaridade e vo fundindo
sucessivamente as amostras em grupos e estes grupos em grupos
maiores, comeando com as similaridades mutuas mais elevadas
e descendo gradualmente o nivel de similaridade em que os
grupos so formados
formados.

Anlise aglomerativa (Clustering)


Anliseaglomerativa(Clustering)

Anlise aglomerativa hierrquica:


1.Single
1
Single linkage agglomerative clustering
2.Complete linkage agglomerative clustering
3.Intermediate linkage agglomerative clustering
4 Unweighted arithmetic average clustering (UPGMA)
4.Unweighted
5.Weighted arithmetic average clustering (WPGMA)
6.Unweighted centroid clustering (UPGMC)
7.Weighted
g
Centroid clustering
g ((WPGMC))

Anlise aglomerativa (Clustering)


Anliseaglomerativa(Clustering)

Recomendaes:
1.A
1
A hierarchical clustering with group-average linking
linking, baseada
na medidade de similaridade de Bray Curtis, provou ser uma
tcnica til em muitos estudos ecolgicos. apropriada para
delinear grupos de locais com distintas comunidades
2.A anlise aglomerativa menos til quando h apenas um
gradiente na estrutura das comunidades de local p
g
para local.
Nestes casos as tcnicas de ordenao so preferveis.
3.Mesmo p
para amostras fortemente agrupadas
g p
p
preferivel
usar a anlise aglomerativa juntamente com a ordenao.

EXERCCIO:
Em termos de similaridade, o que podem concluir sobre
os 4 estratos amostrados?

Mos obra!!!!
Abrir o programa PRIMER
File Open estratos.xls OK
Sample data properties title: estratos
Number of columns: 20
Number of rows: 45
Samples as columns: OK
Edit Factors
Factors Add estrato colocar a mesma letra para cada rplica de um mesmo estrato OK
CLUSTER
Data similarity
Analyse between samples
Transformation: square root
Measure: Bray-Curtis similarity
OK
Analyse Cluster
Cluster mode: group average
Plot dendogram:
OK

1) Testar cenrios:
Alterar o tipo de transformao
transformao, a
medida de similaridade e o modo de
agrupamento
2) discutir qual a influencia destas
alteraes nosresultados

Você também pode gostar