Você está na página 1de 96

Machine Translated by Google

Capítulo

9 Ordenação em
espaço reduzido

9.0 Projetando conjuntos de dados em algumas dimensões

Ordenação (do latim ordinatio, a ação de colocar em ordem) é o arranjo de unidades em alguma ordem.
Ordenação Gower (1984) aponta que o termo ordenação, amplamente utilizado em estatística multivariada, na verdade
vem da ecologia onde se refere à representação de objetos (locais, estações, relevés, etc.) como pontos
ao longo de um ou vários eixos de referência. Em 1954, o ecologista de vegetação David Goodall foi o
primeiro a aplicar a análise fatorial na ecologia de comunidades. Goodall propôs o termo “ordenação” para
designar esse tipo de análise, termo hoje amplamente utilizado em livros e publicações de ecologia
comunitária. A ordenação consiste em plotar pontos-objetos ao longo de um eixo que representa uma
relação ordenada ou formar um diagrama de dispersão com dois ou mais eixos. As relações ordenadas
costumam ser quantitativas, mas bastaria que fossem do tipo “maior que”, “igual a” ou “menor que” (relações
semiquantitativas) para servir de base para ordenações, como é o caso em nMDS (Seção 9.4).

Em ecologia, vários descritores são geralmente observados para cada objeto em estudo. Na maioria
dos casos, os ecologistas estão interessados em caracterizar as principais tendências de variação dos
objetos em relação a todos os descritores, não apenas a alguns deles. Observar gráficos de dispersão dos
objetos em relação a todos os pares possíveis de descritores é uma abordagem tediosa, que geralmente
não lança muita luz sobre o problema em questão. Em contraste, a abordagem multivariada consiste em
representar a dispersão de objetos em um diagrama multidimensional, com tantos eixos quantos forem os
descritores no estudo. No entanto, não é possível desenhar tal diagrama no papel com mais de duas ou
eventualmente três dimensões, embora seja uma construção matemática perfeitamente válida. Para fins
de análise, os ecologistas, portanto, projetam o diagrama de dispersão multidimensional em gráficos
bivariados cujos eixos são conhecidos por serem de particular interesse. Os eixos desses gráficos são
escolhidos para representar uma grande fração da variabilidade da matriz de dados multidimensional, em
um espaço com dimensionalidade reduzida (ou seja, menor) em relação ao conjunto de dados original.
Métodos de ordenação em espaço reduzido também permitem
Machine Translated by Google

426 Ordenação em espaço reduzido

Tabela 9.1 Domínios de aplicação dos métodos de ordenação apresentados neste capítulo.

Método Distância preservada Variáveis

Análise do componente principal Distância euclidiana Dados quantitativos, relações lineares


(PCA) (cuidado com zeros duplos)

Análise de correspondência (CA) !2 distância Dados quantitativos ou binários


não negativos, dimensionalmente
homogêneos; frequências de espécies
ou dados de presença/ausência

Análise de coordenadas principais Qualquer medida de distância Quantitativa, semiquantitativa,


(PCoA), escala métrica (multidimensional), qualitativa ou mista
escala clássica

Multidimensional não métrico Qualquer medida de distância Quantitativa, semiquantitativa,


escalonamento (nMDS) qualitativa ou mista

um para obter informações quantitativas sobre a qualidade das projeções e estudar as


relações entre os descritores, bem como entre os objetos.

A ordenação em espaço reduzido é muitas vezes referida como análise de fator (ou
inércia) , uma vez que se baseia na extração dos autovetores ou fatores da matriz de associação.
A análise fatorial sensu stricto é usada principalmente nas ciências sociais; visa representar
a estrutura de covariância dos descritores em termos de um modelo causal hipotético. Não é
discutido mais adiante neste livro.

Os domínios de aplicação das técnicas discutidas no presente capítulo estão resumidos


na Tabela 9.1. A Seção 9.1 é dedicada à análise de componentes principais (PCA), uma
poderosa técnica de ordenação em espaço reduzido que, no entanto, é limitada a descritores
quantitativos. Por preservar as distâncias euclidianas, os resultados do PCA são sensíveis à
presença de zeros duplos. A Seção 9.2 discute a análise de correspondência (CA), um
método de ordenação útil para analisar dados de presença/ausência ou abundância de
espécies. As seções 9.3 e 9.4 são dedicadas à análise de coordenadas principais (escala
métrica, PCoA) e escala multidimensional não métrica (nMDS), respectivamente. Ambos os
métodos projetam, em espaço reduzido, matrizes de distância entre objetos calculadas antes
da ordenação, com base em medidas de distância escolhidas pelo usuário (Capítulo 7); em
algumas dessas medidas, os descritores podem ser de qualquer tipo matemático. PCA, CA
e PCoA são métodos baseados em autovetores, não nMDS. A apresentação de várias
formas de análise canônica, que também são baseadas em autovetores, é adiada para o
Capítulo 11.
Machine Translated by Google

Projetando conjuntos de dados em algumas dimensões 427

Muitas vezes acontece que a estrutura dos objetos em estudo não é contínua. Nesse caso, uma ordenação em
espaço reduzido, ou um diagrama de dispersão produzido a partir de duas variáveis importantes, pode ser suficiente
para evidenciar a estrutura de grupo dos objetos.
Os métodos de ordenação podem, portanto, às vezes ser usados para delinear grupos de objetos (Fig. 8.1,
Subseção 8.7.3). As ordenações também podem ser usadas como complementos para análises de cluster. A razão
é que o agrupamento investiga distâncias par a par entre objetos, procurando relações finas, enquanto a ordenação
em espaço reduzido considera a variabilidade de toda a matriz de associação e, assim, revela gradientes gerais.

Diferentes métodos para sobrepor os resultados do agrupamento em ordenações dos mesmos objetos são descritos
na Seção 10.1.

Os ecologistas geralmente usam métodos de ordenação para estudar as posições relativas dos objetos no
Reduzido espaço reduzido. Um aspecto importante a considerar é a representatividade da representação em espaço reduzido,
espaço que costuma ter d = 2 ou 3 dimensões. Até que ponto o espaço reduzido preserva as relações de distância entre os
objetos? Para responder a isso, pode-se calcular as distâncias entre todos os pares de objetos, tanto no espaço
multidimensional dos descritores p originais quanto no espaço d-dimensional reduzido. Os valores resultantes são
plotados em um diagrama de dispersão como na Fig. 9.1. Quando a projeção no espaço reduzido responde por
uma alta fração da variância, as distâncias entre as projeções dos objetos no espaço reduzido são bastante
semelhantes às distâncias originais no espaço multidimensional (caso a). Quando a projeção é menos eficiente, as
distâncias entre os objetos no espaço reduzido são muito menores do que no espaço original. Duas situações
podem então ocorrer. Quando os objetos estão em distâncias proporcionalmente semelhantes nos dois espaços
(caso b), a projeção ainda é útil mesmo que represente uma pequena fração da variância. Quando, porém, as
posições relativas dos objetos não são as mesmas nos dois espaços (caso c), a projeção é inútil. Os ecologistas
muitas vezes desconsideram a interpretação das ordenações quando o espaço reduzido não responde por uma alta
fração da variância. Isso não é totalmente justificado, pois uma projeção em espaço reduzido pode ser informativa
mesmo que esse espaço represente apenas uma pequena fração da variância (caso b).

Diagrama O diagrama de dispersão da Fig. 9.1, frequentemente referido como diagrama de Shepard (Shepard, 1962;
de Shepard diagramas no artigo de Shepard tiveram seus eixos transpostos em relação à Fig. 9.1), pode ser usado para estimar
a representatividade das ordenações obtidas usando qualquer redução -método de ordenação espacial. Na análise
de componentes principais (Seção 9.1), as distâncias entre os objetos, tanto no espaço multidimensional dos
descritores originais quanto no espaço reduzido, são calculadas usando distâncias euclidianas ( D1, eq. 7.32). A
matriz F de componentes principais (eq. 9.4 abaixo) dá as coordenadas dos objetos no espaço reduzido. Na análise
de coordenadas principais (Seção 9.3) e escalonamento multidimensional não métrico (Seção 9.4), as distâncias
euclidianas entre os objetos no espaço reduzido são comparadas com as distâncias Dhi encontradas na matriz D
usada como base para calcular a ordenação. Na análise de correspondência (Seção 9.2), é a distância !2 (D16, eq.
7.55) entre os objetos que é usada na abcissa do diagrama de Shepard. Diagramas do tipo Shepard também podem
ser construídos para análise de cluster (Fig. 8.24).
Machine Translated by Google

428 Ordenação em espaço reduzido

dhi)

(a)

(b)
Distância
reduzido
espaço
em
(

45° (c)

Distância no espaço multidimensional (Dhi)

Figura 9.1 Diagrama de Shepard. Três situações encontradas na comparação de distâncias entre objetos, no espaço
p-dimensional dos p descritores originais (abcissas) versus o espaço d-dimensional reduzido (ordenadas).
A figura mostra apenas os contornos da dispersão de pontos. (a) A projeção em espaço reduzido responde
por uma alta fração da variância; as posições relativas dos objetos no espaço reduzido d-dimensional são
semelhantes às do espaço p-dimensional. (b) A projeção responde por uma pequena fração da variância,
mas as posições relativas dos objetos são semelhantes nos dois espaços. (c) O mesmo que (b), mas as
posições relativas dos objetos diferem nos dois espaços. Adaptado de Rohlf (1972). Compare com a Fig.
8.24.

As seções a seguir discutem os métodos de ordenação mais úteis para os ecologistas.


As seções são escritas para serem facilmente compreendidas pelos ecologistas, de modo
que podem não atender inteiramente às expectativas dos estatísticos. Muitos programas
estão disponíveis para realizar análises de ordenação; vários deles são descritos por
Michael Palmer*. As funções do R estão listadas na Seção 9.5. Para discussões detalhadas
sobre a teoria ou métodos de computação, pode-se consultar ter Braak (1987c) e Legendre
& Birks (2012). Referências importantes sobre análise de correspondência são Benzécri e
col. (1973), Hill (1974), Greenacre (1983) e ter Braak (1987c). Gower (1984, 1987) revisou
os métodos de ordenação descritos neste capítulo, além de várias outras técnicas
desenvolvidas por psicometristas. Algumas delas estão progressivamente encontrando seu
caminho para a ecologia numérica. Eles incluem métodos de escalonamento métrico além
da análise de coordenadas principais, desdobramento multidimensional, análise ortogonal
de Procrustes (Subseção 11.5.2) e sua forma generalizada, métodos de escalonamento
para várias matrizes de distância e um método para ordenação de matrizes não simétricas.

* Página da Web: http://ordination.okstate.edu/.


Machine Translated by Google

Análise de componentes principais (PCA) 429

Vocabulário de ordenação* Caixa 9.1

Eixo principal. Eixo na direção da variância máxima de uma dispersão de pontos.

Primeiro eixo principal (do elipsóide de concentração em uma distribuição multinormal;


Fig. 4.9). Linha passando pela maior dimensão do elipsóide; eixo maior do elipsóide.

Componentes principais. Novas variáveis (variates = variáveis aleatórias) especificadas


pelos eixos de uma rotação rígida do sistema de coordenadas original, e correspondentes
às direções sucessivas de variância máxima da dispersão de pontos. Os componentes
principais fornecem as posições dos objetos no novo sistema de coordenadas.

Eixos componentes principais (também chamados de eixos principais ou eixos


componentes). Sistema de eixos resultante da rotação descrita acima.

*Adaptado de Morrison (1990, pp. 87 e 323-325).

9.1 Análise de componentes principais (PCA)

Neste livro, a análise de componentes principais* é definida como a autoanálise da matriz de


dispersão S = (n – 1)–1Yc'Yc, onde Yc é a matriz Y centrada em colunas. Em outros livros,
pode ser definido como a autoanálise de Yc'Yc sem divisão por (n – 1).
Como calcular os eixos principais (Caixa 9.1) de S foi explicado na Seção 4.4. Em poucas
palavras, em uma distribuição multinormal, o primeiro eixo principal é a linha que passa pela
maior dimensão do elipsóide de concentração que descreve a distribuição. Os seguintes eixos
principais (ortogonais entre si e sucessivamente mais curtos) passam pelas seguintes maiores
dimensões do elipsóide p-dimensional.
Um máximo de p eixos principais pode ser derivado de uma matriz de dados contendo p
variáveis (Fig. 4.9). Os eixos principais de uma matriz de dispersão S são encontrados resolvendo

(S – "kI) uk = 0 (9.1)

(eq. 4.23) cuja equação característica

#S – "kI# = 0 (9.2)

* Como a pronúncia de “principal” e “principle” é semelhante em inglês, o erro


O nome “ Análise de componentes de princípios” é algumas vezes encontrado na literatura, mesmo recente.
Machine Translated by Google

430 Ordenação em espaço reduzido

Autovalor é usado para calcular os autovalores "k. Os autovetores uk associados aos autovalores "k são
Autovetor encontrados colocando os diferentes valores "k por sua vez na eq. 9.1. Esses autovetores são os
eixos principais da matriz de dispersão S (Seção 4.4). os autovetores são normalizados (ou seja,
dimensionados para comprimento unitário, Seção 2.4) antes de calcular os componentes principais,
que fornecem as coordenadas dos objetos nos eixos principais sucessivos. A análise de
Componentes principais
componentes principais (PCA) foi originalmente descrita por Pearson (1901), embora seja mais
frequentemente atribuído a Hotelling (1933), que o propôs de forma independente. O método e
várias de suas implicações para a análise de dados são apresentados no artigo seminal de Rao
(1964). O PCA possui as seguintes propriedades, que o tornam uma ferramenta poderosa para a
análise de dados ecológicos:

1) Como qualquer matriz de dispersão S é simétrica, seus eixos principais uk são ortogonais
entre si. Em outras palavras, eles correspondem a direções linearmente independentes no elipsóide
de concentração da distribuição de objetos (Seção 2.9).

2) Os autovalores "k de uma matriz de dispersão S são todos positivos ou nulos porque S é
positivo semidefinido (Seção 4.1, Tabela 2.2). PCA não produz autovalores negativos. Os autovalores
representam as quantidades de variância dos dados ao longo do principal sucessivo eixos (Seção
4.4).

3) Por causa das duas primeiras propriedades, a análise de componentes principais pode
muitas vezes resumir, em poucas dimensões, a maior parte da variabilidade de uma matriz de
dispersão de um grande número de descritores. Ele também fornece uma medida da quantidade de
variância explicada por esses poucos eixos principais independentes.

A presente seção mostra como calcular as relações entre objetos e entre descritores, bem como
as relações entre os eixos principais e os descritores originais. Um exemplo numérico simples é
desenvolvido, envolvendo cinco objetos e dois descritores quantitativos:

21 3.2– 1.6–
34 2.2– 1.4
S= 50 Depois de centralizar na coluna significa, Yc = [ ] yy – = 0,2– 2,6–
76 1,8 3,4
92 3,8 0,6–

onde Yc é a matriz de dados centrados na coluna. Na prática, a análise de componentes principais


nunca é usada apenas para dois descritores; nesse caso, os objetos podem simplesmente ser
representados em um diagrama de dispersão bidimensional (Fig. 9.2a). Um exemplo bidimensional
é usado aqui para simplificar, a fim de mostrar que o principal resultado da análise de componentes
principais é rotacionar os eixos, usando o centróide dos objetos como pivô.
Machine Translated by Google

Análise de componentes principais (PCA) 431

y2 y2
(y2 - y2)

6
(a) 6
(b)

4 4

2 2
(a1 – a1)

0 0
y1 y1
0 2 4 6 8 10 0 2 4 6 8 10

y2
(y2 - y2)
II (c) (d)
6 II
2 EU
4 2
1
4
1
EU 2
–4 –2 2 4 2 (a1 – a1)
–1
–2
–1
–2
26° 34' –2
0 –4
0 2 4 6 8 10 y1

Figura 9.2 Exemplo numérico de análise de componentes principais. (a) Cinco objetos são plotados em
relação aos descritores y1 e y2. (b) Após centralizar os dados, os objetos agora são plotados
em relação ey1
referência a ( y1
) –y2
( ) y2
– , representado por eixos tracejados. (c) Os objetos são traçados com
aos
eixos principais I e II, que são centrados em relação à dispersão de pontos. (d) Os dois sistemas
de eixos (b e c) podem ser sobrepostos após uma rotação de 26°34'.

1 — Calculando os autovetores de uma matriz de dispersão


A matriz de dispersão (eq. 4.6) dos descritores no exemplo acima é:

1 8,2 1,6
S = =
-----------
Yc n 1– Yc' 1,6 5,8
Machine Translated by Google

432 Ordenação em espaço reduzido

A equação característica correspondente (eq. 2.23) é:

= 8,2 1,6 – "k 0 = 0


S "k - eu
1,6 5,8
0 "k

Tem dois autovalores, "1 = 9 e "2 = 5. A variância total (soma dos valores diagonais) na matriz de
autovalores é a mesma que em S, mas é particionada de forma diferente: a soma das variâncias em
S, (8,2 + 5,8 = 14), é igual à soma dos autovalores, (9 + 5 = 14). "1 = 9 representa 64,3% da variância
e "2 compensa a diferença (35,7%). Existem tantos autovalores quanto descritores. Os autovalores
sucessivos respondem por frações progressivamente menores da variância.

Apresentando, por sua vez, os "k's na equação matricial 9.1:

(S – "kI) uk = 0

fornece os autovetores associados aos autovalores. Uma vez que esses vetores tenham sido
normalizados (ou seja, dimensionados para comprimento unitário, u'u = 1), eles se tornam as colunas
da matriz U:

0,8944 0,4472–
U=
0,4472 0,8944

Se um sinal diferente tivesse sido atribuído arbitrariamente a um dos termos da matriz U durante o
cálculo dos autovetores, uma imagem espelhada teria sido produzida para as Figs. 9.2c. Essa
imagem teria sido tão boa para representar os dados quanto a Fig. 9.2c.

É fácil verificar a ortogonalidade dos dois autovetores: seu produto vetorial u' 1u2 = (0,8944 × (–
Ortogonalidade 0,4472)) + (0,4472 × 0,8944) = 0. Além disso, a Seção 4.4 mostrou que os elementos de U são de
direção cossenos dos ângulos entre os descritores originais e os eixos principais. Usando esta
propriedade, descobre-se que o sistema de eixos principais especifica uma rotação de (arco cos
0,8944) = 26°34' do sistema de referência definido pelos descritores originais. Portanto, a Figura 9.2
mostra que a análise de componentes principais realizou uma rotação do sistema de eixos
(descritores) sem alterar as posições dos objetos uns em relação aos outros.

2 — Calcular e representar os componentes principais


Carregando Os elementos dos autovetores também são pesos, ou carregamentos dos descritores originais, na
combinação linear de descritores a partir dos quais os componentes principais são calculados. Os
Principal componentes principais fornecem as posições dos objetos em relação ao novo sistema de eixos
componente principais. Assim, a posição de um objeto xi no primeiro eixo principal é dada pela seguinte função,
ou combinação linear:

f = ++ = [ ] aa – i u1 (9.3)
i1 ( yi1( y1
) – u11 … sim ) – up1
p
Machine Translated by Google

Análise de componentes principais (PCA) 433

Os valores ( cargas
) – são
uj1 são as coordenadas do objeto xi nos vários descritores centrados yij yj j e os valores
as
dos descritores no primeiro autovetor. As posições de todos os objetos em relação ao sistema de eixos
principais são dadas pela matriz F das variáveis transformadas. Também é chamada de matriz de
componentes principais:
Matriz de
FY = c
você (9.4)
componentes principais
onde U é a matriz de autovetores e Yc é a matriz de observações centradas. O sistema de eixos
principais é centrado em relação à dispersão dos objetos pontuais. Este não seria o caso se U tivesse
sido multiplicado por Y em vez da matriz centrada Yc, como em algumas formas especiais de análise
de componentes principais (PCA não centrada). Para o exemplo numérico, os componentes principais
são calculados da seguinte forma:

3.2– 1.6– – 3.578 0


2.2– 1.4 1.342– 2.236
0,8944 0,4472– =
F= 0,2– 2,6– 1.342– 2.236–
0,4472 0,8944
1,8 3,4 3.130 2.236
3,8 0,6– 3.130 2.236–

A variação das duas colunas de F são "1 = 9 e "2 = 5, respectivamente. Como as duas colunas da
matriz de pontuações dos componentes são as coordenadas dos cinco objetos em relação aos eixos
principais, elas podem ser usadas para plotar os objetos em relação aos eixos principais I e II (Fig.
9.2c). É fácil verificar (Fig. 9.2d) que, neste exemplo de dois descritores, os objetos são posicionados
pelos componentes principais da mesma forma que no sistema original de eixos-descritores. A análise
de componentes principais simplesmente girou os eixos em 26° 34' de forma que os novos eixos
correspondam aos dois componentes principais da variabilidade. Quando há mais de dois descritores,
como costuma acontecer em ecologia, a análise de componentes principais ainda realiza apenas uma
rotação do sistema de eixos-descritores, mas agora no espaço multidimensional. Nesse caso, os
componentes principais I e II definem o plano permitindo a representação da maior quantidade de
variância. Os objetos são projetados nesse plano de forma a preservar, tanto quanto possível, as
distâncias euclidianas relativas que possuem no espaço multidimensional dos descritores originais.

As posições relativas dos objetos no espaço p-dimensional girado dos componentes principais são
as mesmas do espaço p-dimensional dos descritores originais (Fig. 9.2d). Isso significa que as
Distância distâncias euclidianas entre os objetos (D1, eq. 7.32) foram preservadas pela rotação dos eixos. Essa
euclidiana importante propriedade da análise de componentes principais é observada na Tabela 9.1. A qualidade
da representação em um espaço euclidiano reduzido com apenas m dimensões (m $ p) pode ser
avaliada usando a seguinte razão:

m p
tipo R2 * + * +

razão ) %"k ' (ÿ


) %"k ' (9.5)
(&
k 1= & k 1=
Machine Translated by Google

434 Ordenação em espaço reduzido

Essa razão é equivalente a um coeficiente de determinação (R2, eq. 10.20) na análise de regressão. O
denominador da eq. 9,5 é realmente igual ao traço da matriz S (soma dos elementos diagonais). Assim,
com o exemplo numérico atual, uma representação dos objetos, apenas ao longo do primeiro
componente principal, daria conta de uma proporção 9/(9+5) = 0,643 da variância total na matriz de
dados. Este valor é idêntico ao dado na Subseção 9.1.1 para a fração da variância de Y que é
contabilizada por "1.

Quando as observações forem feitas ao longo de um eixo temporal ou espacial, ou em uma


superfície geográfica (ou seja, um mapa com as coordenadas dos locais de amostragem), pode-se
plotar os valores dos componentes principais ao longo do eixo de amostragem ou no mapa geográfico.
A Figura 9.15 mostra um exemplo de tal mapa para o primeiro eixo de ordenação de uma análise de
correspondência sem tendência. A mesma abordagem pode ser usada com os resultados de uma
análise de componentes principais ou qualquer outro método de ordenação.

3 — Contribuições dos descritores

A análise de componentes principais fornece as informações necessárias para entender o papel dos
descritores originais na formação dos componentes principais. Também pode ser usado para mostrar
as relações entre os descritores originais. O papel dos descritores na análise de componentes principais
é agora examinado sob vários aspectos.

1. A matriz de autovetores U. — Na Subseção 9.1.1, as relações entre os autovetores normalizados,


que são as colunas da matriz U, foram estudadas usando uma expressão da forma U'U. Para o exemplo
numérico:

0,8944 0,4472 0,8944 0,4472– = 10


U'U = = eu
0,4472– 0,8944 0,4472 0,8944 01

Os termos diagonais de U'U resultam do produto escalar dos autovetores consigo mesmos. Esses
valores são o (comprimento)2 dos autovetores, aqui igual à unidade porque os autovetores foram
escalados para 1. Os termos não diagonais, resultantes da multiplicação de dois autovetores diferentes,
são iguais a zero porque os autovetores são ortogonais. Este resultado seria o mesmo para qualquer
matriz U de autovetores normalizados calculados a partir de uma matriz simétrica. A matriz U é uma
matriz matriz quadrada ortonormal (Seção 4.4); várias propriedades de tais matrizes são descritas na Seção
ortonormal 2.8.

Da mesma forma, as relações entre descritores, que correspondem às linhas da matriz U, podem
ser estudadas através do produto UU'. Os termos diagonais e não diagonais de UU' têm o mesmo
significado que em U'U, exceto que agora dizem respeito às relações entre descritores. Este é o
Escala 1 escalonamento 1 do PCA, explicado com mais detalhes na Subseção 9.1.4. As relações entre as linhas
de uma matriz ortonormal quadrada são as mesmas que entre as colunas (Seção 2.8, propriedade 7),
de modo que:

UU' = eu (9.6)
Machine Translated by Google

Análise de componentes principais (PCA) 435

Os descritores são, portanto, de comprimentos unitários no espaço multidimensional e


estão a 90° um do outro (ortogonalidade).

A análise de componentes principais é simplesmente uma rotação, no espaço


multidimensional, do sistema original de eixos (Figs. 9.2 e 9.3a, para um espaço
bidimensional). Portanto, segue-se que, após a análise (rotação), os eixos-descritores
originais ainda estão a 90° um do outro. Além disso, normalizar os autovetores
simultaneamente normaliza os eixos-descritores (os comprimentos dos vetores linha
e coluna são dados fora da matriz):

2
u11 . . . u1 p -u1k = 1
. . .
você = . . . (9.7)
. . .
. 2
up1 . . para cima
-upk = 1
2 2
-uj1 = 1 . . =1
. -ujp

Existe uma segunda abordagem para o estudo das relações entre descritores.
Consiste em dimensionar os autovetores de tal forma que os cossenos dos ângulos entre
os eixos-descritores sejam proporcionais às suas covariâncias. Nesta abordagem, os
ângulos entre os eixos-descritores estão entre 0° (máxima covariância positiva) e 180°
(máxima covariância negativa); um ângulo de 90° indica uma covariância nula
(ortogonalidade). Esse resultado é obtido dimensionando cada autovetor k para um
Escala 2 explicado na Subseção 9.1.4. comprimento igual a *. Este é o escalonamento 2 do PCA,
ao seu desvio padrão "k Com esta escala para os autovetores, as distâncias euclidianas
entre os objetos não são preservadas.

Usando a matriz diagonal , de autovalores (eq. 2.20), a nova matriz de autovetores,


denominada Usc2 (ou seja, U para escala 2), pode ser calculada diretamente por meio
da expressão U,1/2. Para o exemplo numérico:

Usc2 = U,1/2 = 0,8944 0,4472– 90 = 2,6833 1,0000–


(9.8)
0,4472 0,8944 05 1,3416 2,0000

Na escala 2, as relações entre os descritores são as mesmas da matriz de


dispersão S (na qual se baseia a análise), pois

(U,1/2) (U,1/2)' = U,U' = U,U–1 = S (9.9)

* Em alguns pacotes de computador, o PCA apenas dimensiona os autovetores para comprimento e apenas"
fornece um gráfico dos eixos do descritor; nenhum gráfico dos objetos em espaço reduzido está disponível.
Machine Translated by Google

436 Ordenação em espaço reduzido

A equação U,U–1 = S é derivada diretamente da equação geral dos autovetores SU


= U, (eq. 2.27). Em outras palavras, a nova matriz U,1/2 tem a seguinte forma (os
comprimentos dos vetores linha e coluna são dados fora da matriz):

2
u11 "1 . . . u1 p "p ( -u1k "k ) = s1
. . .
Usc2 = U,1/2 = . . . (9.10)
. . .
2
up1 "1 . . . upp "p - =s
( upk "k ") p

2 2
"1( ) - uj1 = .. =
"1 . "p( ) - ujp "p

Esta equação mostra que, quando os autovetores são dimensionados para os


2
comprimentos de seus respectivos , os comprimentos
"kdesvios padrão sj dos eixos-descritores
= (ou são padrão)
seja, seus desvios sj
no espaço multidimensional. O produto de dois eixos descritores, que corresponde
ao seu ângulo no espaço multidimensional, é portanto igual à sua covariância sjl.

2. Projeção de descritores em espaço reduzido, escala 1: matriz U. — Quando a matriz U


é usada para projetar os eixos-descritores em um gráfico PCA, os eixos-descritores são de
comprimentos unitários e em ângulos retos no espaço multidimensional (Fig. 9.3a). Os
ângulos entre os eixos descritores e os eixos principais são projeções dos ângulos de rotação
correspondentes aos elementos da matriz U (Fig. 4.10). Para o exemplo numérico, os ângulos
entre descritores e eixos principais são calculados como na Seção 4.4 usando a matriz U:

= 0,8944 0,4472– arco cos 26°34' 116°34'


você

0,4472 0,8944 63°26' 26°34'

Os valores dos ângulos na inserção da Fig. 9.3a são assim: . = 26°34', / = 63°26', 0 =
26°34'. As correlações entre os descritores j e os eixos principais k são as mesmas da
escala 2 (abaixo) porque as duas escalas diferem apenas pelo alongamento dos eixos.
Na escala 1, as correlações entre os descritores são iguais a 0 porque os descritores são
ortogonais (isto é, em ângulos retos) nesta representação.

A projeção ujk de um eixo descritor j em um eixo principal k é proporcional à


covariância desse descritor com o eixo principal. O fator de proporcionalidade é diferente
para cada eixo principal, de modo que não é possível comparar a projeção de um
descritor em um eixo com sua projeção em outro eixo. É correto, no entanto, comparar
as projeções de diferentes eixos descritores no mesmo eixo principal. Pode-se mostrar
que uma projeção isogonal (com ângulos respectivamente iguais) de eixos p ortogonais
de comprimentos unitários dá um comprimento d pÿ a cada eixo no espaço d-
dimensional. Na Fig. 9.4, a projeção de equilíbrio de cada um dos três eixos unitários ortogonais, em dois
Machine Translated by Google

Análise de componentes principais (PCA) 437

II II
1 y2 II
6 0
(a) 2 y2

/
(b)
0 EU

4 y2
. 1 0
y1
1 = 76° 35'
/
–1
2
–1 0 1 0 EU

0 EU

–1 y1

–2 y1
–2

–2 –1 0 1 2 3
–6 –4 –2 0 2 4

Figura 9.3 Exemplo numérico da Fig. 9.2. Os biplots de distância e correlação são discutidos na Subseção 9.1.4.
(a) Biplot de distância (escala 1). Os autovetores são dimensionados para comprimentos 1. Inserção:
descritores (matriz U). Gráfico principal: descritores (matriz U; setas) e objetos (matriz F; pontos). A
interpretação das relações objeto-descritor não se baseia em sua proximidade, mas em projeções
ortogonais (linhas tracejadas) dos objetos nos eixos-descritores ou suas extensões.
Os comprimentos das setas foram multiplicados por 4 para maior clareza do diagrama. (b) Biplot de
correlação (escala 2). Descritores (matriz U,1/2; setas) com um ângulo de covariância de 76°35'.
Objetos (matriz G; pontos). Projetar os objetos ortogonalmente em um descritor (linhas tracejadas)
reconstrói os valores dos objetos ao longo desses descritores, dentro de uma constante multiplicativa.

2 3ÿse. deve ao fato de que uma projeção isogonal resulta


espaço dimensional, tem um comprimento de Isso
em uma associação igual de todos os eixos descritores com os eixos principais.

círculo de Um círculo de descritores em equilíbrio, com raio d pÿ , pode ser traçado como referência para
equilíbrio avaliar a contribuição de cada descritor para a formação do espaço reduzido (Fig. 9.4). O círculo
também é desenhado na inserção da Fig. 9.3a; seu raio é 2 2ÿ = 1 porque, no exemplo numérico, tanto
o espaço reduzido quanto o espaço total são bidimensionais. Se alguém estivesse interessado
apenas na contribuição de equilíbrio dos descritores para o primeiro eixo principal, o “círculo”
unidimensional teria então um “raio” de 1 2ÿ = 0,7071. Por exemplo, a projeção do primeiro descritor no
primeiro eixo principal é igual a 0,8944 (examine a matriz U e a Fig. 9.3a), de modo que este descritor
contribui de maneira importante para a formação do eixo I. Este não é o caso do segundo descritor, cuja
projeção no primeiro eixo é de apenas 0,4472.

3. Projeção de descritores em espaço reduzido, escala 2: matriz Usc2. — Os ecologistas que usam
a análise de componentes principais não estão interessados em todo o espaço multidimensional, mas
apenas em uma projeção simplificada dos objetos em um espaço reduzido (geralmente um plano
são
bidimensional). Os elementos ujk "k dos autovetores escalados para as coordenadas das "k
projeções dos descritores j nos diferentes eixos principais k.
Machine Translated by Google

438 Ordenação em espaço reduzido

comprimento = 1

projeção = 2/3

Figura 9.4 Projeção de equilíbrio, no plano, de três vetores ortogonais com comprimentos unitários, e círculo
de equilíbrio dos três descritores.

Eles são dimensionados de forma que as projeções dos eixos-descritores possam ser
desenhadas no espaço reduzido formado pelos eixos principais (Fig. 9.3b). Assim como na
escala 1, os descritores são representados por setas por serem eixos. Em um plano de
dimensão reduzida, as projeções dos eixos descritores são menores ou iguais aos seus
comprimentos no espaço multidimensional. No caso da Fig. 9.3b, os comprimentos são os
mesmos no plano de projeção e no espaço original porque este último tem apenas duas dimensões.

No plano do espaço reduzido, os ângulos entre os descritores são projeções de seus


verdadeiros ângulos de covariância. Assim, é importante considerar apenas os descritores
que estão bem representados no plano de projeção. Para tanto, deve-se reconhecer, no
espaço multidimensional, os descritores que formam pequenos ângulos com o plano
reduzido; são os descritores cujas projeções se aproximam de seus comprimentos reais s
no espaço multidimensional. Como o comprimento da projeção de um eixo-descritor j é
igual ou menor que sj , deve-se escolher um critério para avaliar o valor das representações
no plano de projeção.

Se um descritor j fosse igualmente associado a cada um dos p eixos principais, todos


os elementos da linha j (que tem comprimento sj ) da matriz Usc2 seriam iguais, seus
2 1 2ÿ
ÿp) ]
valores sendo 1 ÿ p . O comprimento do eixo do descritor seria [ p sj ( = sj1no espaço
multidimensional sj . O comprimento da projeção deste eixo do descritor em um espaço
reduzido com dimensões d seria, portanto, sj d pÿ . A última expressão define, no espaço d-
Contribuição dimensional, uma medida da contribuição de equilíbrio de um descritor para os vários eixos
de equilíbrio de todo o espaço multidimensional. Quando aplicado à escala 1, onde o comprimento da
projeção de um descritor no espaço p-dimensional é 1 (eq . 9.7) em vez de sj (eq. 9.10), a
fórmula para a projeção de equilíbrio de p eixos ortogonais no espaço d-dimensional torna-
se d pÿ , como mostrado acima.
Machine Translated by Google

Análise de componentes principais (PCA) 439

O comprimento real de um descritor no espaço reduzido pode ser comparado a essa medida, para
ajudar a julgar se a contribuição do descritor para o espaço reduzido é maior ou menor do que seria
sob a hipótese de uma contribuição igual para todos os eixos principais. Para o exemplo numérico, os
comprimentos das linhas da matriz Usc2 (eq. 9.8), no espaço bidimensional, são:

2
comprimento do primeiro descritor (linha) = 2,68332 ( +
) 1,0000– = 2,8636 = s1

comprimento do segundo descritor (linha) = 1,34162 2,00002 + = 2,4083 = s2

Como esse exemplo numérico simples tem apenas duas dimensões, esses comprimentos são iguais
às suas contribuições de equilíbrio no espaço bidimensional. Isso é facilmente verificado, usando as
variâncias dos descritores, que são conhecidas (Subseção 9.1.1):

projeção de equilíbrio do primeiro descritor = s1 2 2ÿ = =


8,2 2 2ÿ 2,8636

projeção de equilíbrio do segundo descritor = s2 2 2ÿ = =


5,8 2 2ÿ 2,4083

Em estudos reais, onde os conjuntos de dados ecológicos são multidimensionais, os comprimentos dos
descritores no espaço reduzido não são iguais às suas contribuições de equilíbrio.

Na escala 1 acima, a interpretação angular do produto de dois eixos descritores era simples: os
eixos descritores estavam em ângulos retos no espaço multidimensional. Na escala 2, o ângulo entre
dois descritores pode ser encontrado aplicando a eq. 2.9 às linhas da matriz de autovetores: o produto
escalar de duas linhas da matriz Usc2 (eq. 9.10) dividido pelo produto dos comprimentos das linhas
(que são os desvios padrão sj), dá o cosseno desse ângulo.

O produto escalar de duas linhas da matriz Usc2 está relacionado ao coeficiente de correlação dos
descritores correspondentes. Os ângulos entre todos os descritores são obtidos reduzindo à unidade
(ou seja = 1) os comprimentos dos vetores linha da matriz Usc2 = U,1/2, depois calculando a matriz de
produtos escalares entre as linhas:

[D(s) –1U,1/2] [D(s) –1U,1/2]' = D(s) –1 U,U'D (s) –1 = D(s) –1 S D(s) –1 = R (9,11)
}
S

O resultado desta equação é a matriz de correlação entre os descritores. No último passo da equação,
a matriz de correlação R é ligada à matriz de dispersão S pela matriz diagonal dos desvios padrão
D(s), seguindo a eq. 4.10.

em multidimensional
O cosseno do ângulo 1jl entre dois descritores yj e yl , espaço, está
portanto relacionado com a sua correlação (rjl); na verdade, pode-se mostrar que cos (1jl) = rjl. Este
ângulo é o mesmo da covariância porque a padronização das linhas para comprimentos unitários
mudou apenas os comprimentos dos eixos-descritores e não suas posições no espaço multidimensional.
Para o exemplo numérico, a correlação entre os dois descritores é igual a ÿ 1,6 8,2 5,8 × 0,232= (eq.
4,7). O ângulo
Machine Translated by Google

440 Ordenação em espaço reduzido

correspondente a esta correlação é (arco cos 0,232) = 76°35', que é o mesmo que o ângulo da
covariância na Fig. 9.3b.

Da mesma forma, o ângulo entre um descritor j e um eixo principal k, no espaço multidimensional,


é o arco cosseno da correlação entre o descritor j e o componente principal k. A correlação rjk é o
elemento jk da matriz de autovetores (eq. 9.10) normalizada por linha (o comprimento de um vetor
linha na eq. 9.10 é sj ):

rjk = ujk "k sj ÿ (9.12)

Em outras palavras, a correlação é calculada ponderando o elemento do autovetor pela razão entre o
desvio padrão do componente principal e o do descritor. Para o exemplo numérico, essas correlações
e ângulos correspondentes são calculados usando a matriz U,1/2 (calculada acima) e os desvios
padrão dos dois descritores (s1 = 2,8636, s2 = 2,4083):

= 0,9370 0,3492– arco cos 20°26' 110°26'


ujk "k sj[ ] ÿ [rjk] =
0,5571 0,8305 56°09' 33°51'

Os valores dos ângulos na Fig. 9.3b são assim: . = 20°26', / = 56°09', 0 = 33°51'. Essas correlações
podem ser usadas para estudar as contribuições dos descritores para os vários componentes, sendo
removidos os fatores de escala dos descritores. As maiores correlações (valores absolutos), na matriz
de correlação entre descritores e componentes, identificam os descritores que mais contribuem para
cada autovetor. A significância das correlações entre descritores e componentes não pode ser testada
usando um teste padrão para coeficientes de correlação de Pearson, entretanto, porque os
componentes principais são combinações lineares dos próprios descritores.

Quando os eixos descritores da matriz U,1/2 são dimensionados para comprimentos unitários, o
que é feito calculando [D(s) –1U,1/2] como na eq. 9.11, não é recomendado desenhar suas projeções
no espaço dos eixos principais. Isso ocorre porque os autovetores redimensionados não são
necessariamente ortogonais e podem ter qualquer comprimento:

[D (s) –1 U,1/2]' [D (s) –1 U,1/2]2 I (9.13)

Os eixos principais não são, portanto, necessariamente em ângulos retos.

As projeções dos eixos-descritores da matriz U,1/2 podem ser examinadas, em particular, com
relação aos seguintes pontos:

• As coordenadas da projeção de um eixo-descritor especificam a posição do vértice desse eixo-


descritor no espaço reduzido. Recomenda-se o uso de setas para representar as projeções dos
eixos-descritores. Alguns autores os chamam de descritores de pontos ou variáveis de pontos e os
representam por pontos no espaço reduzido. Essa representação é ambígua e enganosa. É
aceitável apenas se a natureza dos descritores de pontos
Machine Translated by Google

Análise de componentes principais (PCA) 441

é respeitado; na verdade, são ápices de eixos-descritores, de modo que as relações entre eles são
definidas em termos de ângulos que representam suas correlações, não em termos de proximidades
(Fig. 9.5).

A projeção de um eixoujk
descritor
"k • j em um eixo principal k mostra sua covariância com o eixo principal
e, consequentemente, sua contribuição positiva ou negativa para a posição dos objetos ao longo do
eixo. Segue-se que um eixo principal pode frequentemente ser qualificado pelos nomes dos descritores
que mais contribuem, e de forma preferencial, para a sua formação.Assim, na Fig. 9.5, o eixo principal
I é formado principalmente pelos descritores 6 a 10 e o eixo II pelos descritores 1 a 4 .

• Os descritores que mais contribuem para a formação do espaço reduzido são aqueles cujos
comprimentos projetados atingem ou superam os valores de suas contribuições de equilíbrio.
Eixos-descritores claramente mais curtos que esses valores contribuem pouco para a formação do
espaço reduzido em estudo e, portanto, pouco contribuem para a estrutura que pode ser encontrada
na projeção dos objetos nesse espaço reduzido.

• As correlações entre os descritores são expressas pelos ângulos entre os eixos dos descritores,
não pelas proximidades entre seus ápices. No espaço reduzido, muitas vezes podem ser identificados
grupos de eixos-descritores que formam pequenos ângulos entre si, ou possuem ângulos próximos a
180° (cos 180° = –1, o que refletiria uma correlação negativa perfeita). Deve-se lembrar, entretanto,
que as projeções dos ângulos de correlação em um espaço reduzido não traduzem as correlações
completas entre as variáveis. Assim, pode ser informativo para descritores de agrupamento por
análise de agrupamento (Capítulo 8) de uma matriz de distância calculada como o complemento único
das correlações (D = 1 – cor(Y)) ou o complemento único dos valores absolutos do correlações.

• Objetos em biplots de escala 2 (ou correlação) podem ser projetados em ângulos retos nos eixos do
descritor para aproximar seus valores ao longo dos descritores (Fig. 9.3b). As distâncias entre os
objetos em um biplot de escala 2 não são aproximações de suas distâncias euclidianas; eles
aproximam suas distâncias de Mahalanobis (Subseção 9.1.4).

As principais propriedades de uma análise de componentes principais de descritores centrados


estão resumidas na Tabela 9.2.

4. Tabelas de ajuste cumulativo. — Quão bem a variância de cada descritor é explicada, ou


ajustada, por 1, 2 ou mais eixos da solução PCA? Para obter essa informação, os coeficientes R2
(eq. 10.20) podem ser calculados entre os descritores (que possivelmente foram padronizados ou
transformados de alguma outra forma antes do PCA) e o principal k encontrado nas matrizes F ou G
uma tabela de ajuste (Subseção 9.1.4). Então, para cada componente 1, 2, …, descritor, é criada
Ajuste cumulativo por descritor . O coeficiente R2 para o eixo 1 sozinho é escrito na coluna 1; a soma
acumulada dos coeficientes R2 sobre os eixos 1 e 2 é escrita na coluna 2; a soma acumulada dos
coeficientes R2 sobre os eixos 1, 2 e 3 é escrita na coluna 3; e assim por diante. Para os dados de
cumulativo por descritor
exemplo numérico de
Machine Translated by Google

442 Ordenação em espaço reduzido

Tabela 9.2 Análise do componente principal. Propriedades principais para descritores centrados j.

Escala 1 Escala 2
(biplot de distância) (biplot de correlação)

Comprimento dos autovetores escalados 1


"k

Comprimento do descritor j em U ou Usc2 1 sj

Ângulos em espaço 90°, ou seja, rotação rígida projeções de covariâncias


reduzido do sistema de eixos (correlações)

Comprimento da círculo com raio d pÿ d pÿ


sj
contribuição de equilíbrio

Projeção no eixo principal k ujk ujk "k


ou seja, proporcional à ou seja, covariância com
covariância com k o componente k

Correlação com o componente ÿ ÿ


ujk "k sj ujk "k sj
principal k

a presente seção, que produz uma solução PCA em duas dimensões, a tabela possui apenas
duas colunas:

Cumul. eixo 1 Cumul. eixo 2

Descritor y1 0,8780 1,0000

Descritor y2 0,3103 1,0000

Os valores de R2 na última coluna são sempre 1 no PCA. Resultados idênticos podem ser
computados diretamente da matriz Usc2: os coeficientes encontrados naquela matriz (eq. 9.8)
são elevados ao quadrado e somados cumulativamente da esquerda para a direita; então a
soma acumulada para a linha j é dividida pela variância total do descritor j. Essa tabela se
mostra muito útil para a interpretação de análises envolvendo muitas variáveis, em particular no
caso de assembleias ricas em espécies em estudos de comunidades: permite decidir quais
espécies estão bem ajustadas e devem ser representadas, por exemplo, em uma escala
bidimensional PCA biplot (Subseção 9.1.4). Esta tabela de saída está disponível no programa
CANOCO , onde é chamada de “Ajuste cumulativo por espécie como fração de variância de espécie”.

Os objetos são vetores no espaço A multivariado (Fig. 7.2) e os vetores têm comprimentos
(Seção 2.4). O comprimento ao quadrado de cada objeto, calculado como a soma dos valores
ao quadrado na matriz Yc submetida ao PCA, é o valor de referência. Um comprimento quadrado
total idêntico pode ser calculado usando a matriz F em vez de Yc. Use a matriz F para calcular o
Machine Translated by Google

Análise de componentes principais (PCA) 443

comprimento quadrado de cada objeto em 1, 2, 3 … dimensões PCA. Por exemplo, o comprimento


quadrado total do objeto 2 do exemplo numérico é (–2,22 + 1,42) = 6,8 e o comprimento quadrado da
projeção do objeto 2 no eixo PCA I, lido da matriz F = (–1,342)2 = 1,8 . Portanto, a proporção de ajuste
2
é 1,8/6,8 = 0,2647. O comprimentopara aquele (Subseção 9.1.2), é (f21) objeto ao longo do eixo PCA I
residual quadrado do objeto 2 após ajustá-lo ao longo do eixo I é 6,8 – 1,8 = 5. Para os dados de
Ajuste exemplo numérico, a tabela de ajuste percentual cumulativo dos objetos é:
cumulativo de objetos

Cumul. eixo 1 Cumul. eixo 2

Objeto 1 1,0000 1,0000

Objeto 2 0,2647 1,0000

Objeto 3 0,2647 1,0000

Objeto 4 0,6622 1,0000

Objeto 5 0,6622 1,0000

Este tipo de tabela de saída é útil para decidir quais objetos são bem representados em um gráfico PCA:
as distâncias entre objetos bem representados podem ser confiáveis e interpretadas.
Uma tabela relacionada chamada “Comprimento residual quadrado por amostra” está disponível na
saída do programa CANOCO; ele fornece valores residuais quadrados em vez de valores relativos ou
ajuste percentual.

4 — Biplots PCA

As duas subseções anteriores mostraram que, na análise de componentes principais, tanto os eixos-
descritores quanto os vetores-objetos podem ser plotados no espaço reduzido. Isso levou Jolicoeur &
Mosimann (1960) a plotar essas projeções juntas no mesmo diagrama.
Gabriel (1971) propôs o nome biplot para esses diagramas e desenvolveu a teoria dos biplots em Gabriel
(1971, 1982). Outros contribuidores importantes para a teoria dos biplots são ter Braak (1983 e outros
artigos) e Gower (1990 e outros artigos).
Detalhes matemáticos sobre a teoria dos biplots PCA são encontrados em Greenacre (2010) e Gower et
al. (2011); esses livros oferecem funções R para produzir vários tipos de biplots.

Dois tipos de biplots podem ser usados para representar os resultados do PCA (Gabriel, 1982; ter
Braak, 1994). Os biplots de distância representam graficamente as matrizes U (autovetores escalados
para comprimentos 1) e F (eq. 9.4); em F, a variância do componente principal (coluna) k é "k Biplots .
de correlação usam a matriz Usc2 para descritores, onde o autovetor k é dimensionado para comprimento
, objetos, onde
"kpara
e a matriz G

G = F,–1/2 (9.14)

As colunas da matriz G possuem variâncias unitárias. As distâncias euclidianas entre os objetos na


distância de matriz G são iguais às distâncias de Mahalanobis (D5, eq. 7.38) entre os objetos na matriz de dados
Mahalanobis original Y, de modo que as distâncias em um biplot de correlação são
Machine Translated by Google

444 Ordenação em espaço reduzido

projeções dessas distâncias de Mahalanobis, não das distâncias euclidianas originais.


Como as distâncias de Mahalanobis são independentes do escalonamento dos descritores, segue-
se que as distâncias euclidianas entre os objetos na matriz G são as mesmas para uma PCA
conduzida em descritores não padronizados ou padronizados ao considerar todos os eixos.

As matrizes F e U, ou G e Usc2, podem ser usadas juntas em biplots porque os produtos dos
autovetores com as matrizes de pontuação do objeto reconstroem a matriz original (centrada) Y
perfeitamente:

FU' = Y e G(U,1/2)' = Y.

Na verdade, os autovetores e vetores de pontuação de objeto podem ser multiplicados por qualquer
constante sem alterar a interpretação de um biplot PCA.

Biplot de • Biplot de distância, escala 1 (Fig. 9.3a). — As principais características de um biplot de distância
são as seguintes: (1) Distâncias entre objetos no biplot são aproximações de suas distâncias
distância (escalaeuclidianas
1) no espaço multidimensional. (2) Projetar um objeto em ângulo reto em um descritor
aproxima a posição do objeto ao longo desse descritor. (3) Como os descritores têm comprimento 1
no espaço full-dimensional (eq. 9.7), o comprimento da projeção de um descritor no espaço reduzido
indica o quanto ele contribui para a formação desse espaço. (4) Os ângulos entre os eixos descritores
não têm sentido.

Biplot de • Biplot de correlação, escala 2 (Fig. 9.3b). — As principais características de um biplot de correlação
são as seguintes: (1) As distâncias entre objetos no biplot são aproximações de suas distâncias de
correlação (escala 2)
Mahalanobis no espaço multidimensional; eles não são aproximações de suas distâncias euclidianas.
(2) Projetar um objeto em ângulo reto em um descritor aproxima a posição do objeto ao longo desse
descritor. (3) Como os descritores têm comprimentos sj no espaço full-dimensional (eq. 9.10), o
comprimento da projeção de um descritor no espaço reduzido é uma aproximação de seu desvio
padrão. (4) Os ângulos entre os descritores no biplot refletem suas correlações. (5) Quando as
relações de distância entre os objetos são importantes para a interpretação, esse tipo de biplot é
inadequado; um biplot de distância deve ser usado.

Para o exemplo numérico, a matriz G é calculada a partir da eq. 9.14 da seguinte forma:

– 3.578 0 1,193– 0,000


1.342– 2.236 0,447– 1,000
0,3333 0 =
G = F,–1/2 = 1.342– 2.236– 0,447– 1,000–
0 0,4472
3.130 2.236 1.044 1.000
3.130 2.236– 1.044 1.000–

Pode-se verificar que as colunas de G possuem variâncias unitárias. Neste exemplo particular, as
relações entre objetos e descritores são totalmente representadas em um espaço bidimensional.
Os leitores são convidados a repetir o PCA usando descritores padronizados e verificar o fato de
que as distâncias euclidianas entre objetos na matriz G
Machine Translated by Google

Análise de componentes principais (PCA) 445

são as mesmas para descritores não padronizados e padronizados: em ambos os casos, são
as distâncias de Mahalanobis entre os objetos na matriz Y.

As coordenadas do descritor geralmente devem ser multiplicadas por uma constante para
produzir uma exibição visual clara. Na Fig. 9.3a, por exemplo, os comprimentos das setas
descritoras seriam muito curtos para uma avaliação visual se fossem plotados no mesmo
sistema de coordenadas dos objetos. No software de computador, o redimensionamento dos
descritores é feito pela função PCA ou pela função de plotagem. Alguns pesquisadores foram
tentados a interpretar as relações entre objetos e descritores em termos de sua proximidade
no espaço reduzido, enquanto uma interpretação correta requer a projeção dos objetos nos
eixos-descritores (centrados em relação à dispersão dos pontos) ou em suas extensões (Fig.
9.3a). Na Fig. 9.2a, por exemplo, não passaria pela cabeça interpretar a relação entre os
objetos e o descritor y1 em termos da distância entre os pontos-objetos e o ápice (cabeça da
seta) do eixo y1. Na Fig. 9.3a, a posição do ápice de y1 é arbitrária e depende da constante
multiplicativa usada.
As projeções de objetos em um eixo especificam as coordenadas dos objetos em relação a
esse eixo descritor, levando em consideração a constante multiplicativa.

5 — Componentes principais de uma matriz de correlação

A análise de componentes principais realiza um particionamento da variância total da matriz Y.


Se as variáveis não estiverem nas mesmas dimensões físicas, suas variâncias, que são
expressas nas unidades ao quadrado das variáveis, não podem ser somadas (Seção 3.2).
Como consequência, antes de somar as variâncias das p variáveis de Y, deve-se ter certeza
de que as variáveis são dimensionalmente homogêneas, ou seja, expressas nas mesmas
dimensões físicas. Caso contrário, devem ser padronizados (eq. 1.12). A análise é então
descrita como um PCA realizado em uma matriz de correlação R, uma vez que as correlações
são covariâncias de descritores padronizados (Seção 4.2).

Em uma matriz R , todos os elementos diagonais são iguais a 1. Segue-se que a soma dos
autovalores, que corresponde à variância total da matriz de dispersão, é igual à ordem de R,
dada pelo número de descritores p. Antes de calcular os componentes principais, pode ser
uma boa prática verificar que R 2 I (eq. 4.14).

Os componentes principais extraídos das matrizes de correlação não são iguais aos
calculados das matrizes de dispersão. [Cuidado: alguns pacotes de computador permitem
apenas o cálculo de componentes principais a partir de matrizes de correlação; isso é
inadequado para muitos estudos.] Considere a equação básica para os autovalores e
autovetores, (S – "k I) uk = 0. A soma dos autovalores de S é igual à soma das variâncias s 2,
enquanto a soma de autovalores de R é igual a p, de modo que os autovalores das duas
matrizes, e portanto também seus autovetores, são necessariamente diferentes, devido ao
fato de que as distâncias entre os objetos não são as mesmas nas duas análises.

No caso de correlações, os descritores são padronizados. Segue-se que as distâncias


entre os objetos são independentes das unidades de medida, enquanto as
Machine Translated by Google

446 Ordenação em espaço reduzido

o espaço dos descritores originais varia de acordo com as escalas de medida. Quando os
descritores são todos do mesmo tipo e ordem de grandeza, e possuem as mesmas unidades, fica
claro que a matriz S deve ser usada para calcular o PCA. Nesse caso, os autovetores, por um lado,
e os coeficientes de correlação entre descritores e componentes, por outro lado, fornecem
informações complementares. Os primeiros fornecem as cargas dos descritores e os segundos
quantificam sua importância relativa. Quando os descritores são de diferentes tipos ou ordens de
grandeza, ou possuem unidades diferentes, deve-se conduzir o PCA na matriz R ao invés da matriz
S.

Os ecólogos que desejam estudar as relações entre os objetos em um espaço reduzido de


S ou R componentes principais podem basear sua decisão de conduzir a análise em S ou R na resposta à
matriz? seguinte pergunta:

• Caso se queira agrupar os objetos no espaço reduzido, o agrupamento deve ser feito em relação
aos descritores originais (ou qualquer transformação destes descritores; Seção 1.5), preservando
assim suas diferenças de magnitude? Ou todos os descritores devem contribuir igualmente para o
agrupamento de objetos, independentemente da variância exibida por cada um? Na segunda
instância, deve-se partir da matriz de correlação. Uma alternativa neste caso é transformar os
descritores por variação, usando a eq. 1.10 para descritores de escala relativa e eq. 1.11 para
descritores de escala intervalar e realizar a análise na matriz S dos descritores transformados.

Outra maneira de olhar para o mesmo problema foi sugerida por Gower (1966):

• A distância euclidiana (eq. 7.32) é a distância preservada entre os objetos por meio da análise de
componentes principais. É com os dados brutos (covariâncias) ou com os dados padronizados
(correlações) que a configuração espacial dos objetos, em termos de distâncias euclidianas, é mais
interessante para interpretação? No primeiro caso, conduza o PCA na matriz S; no segundo caso,
use a matriz R.

Os principais componentes de uma matriz de correlação são calculados a partir da matriz U


dos autovetores de R e da matriz de observações padronizadas:

aa- _
F = ----------- (9.15)
Você

A análise de componentes principais ainda é apenas uma rotação do sistema de eixos (Subseção
9.1.2). No entanto, uma vez que os descritores agora estão padronizados, os objetos não são
posicionados da mesma forma como se os descritores tivessem sido simplesmente centralizados
(isto é, componentes principais calculados a partir da matriz S nas subseções anteriores).

No que diz respeito à representação dos descritores no espaço reduzido calculado a partir da
matriz R , podem ser usadas as conclusões da Subseção 9.1.3, que dizia respeito à matriz S, após
substituir a covariância pela correlação, sjl por rjl e a matriz de dispersão S pela matriz de correlação
R.
Machine Translated by Google

Análise de componentes principais (PCA) 447

II
4

0,4
2
3

0,3

11
0,2
5
6
8

0,1
7

10
EU

0,1 0,2 0,3 0,4


12
9
14 13
15

4
2
3

11
5
8 6

10 7

12
9
15 14 13
1

Figura 9.5 Quinze descritores plotados no plano determinado pelos dois primeiros eixos principais. As coordenadas de cada
descritor são os dois primeiros elementos da linha correspondente da matriz U,1/2 (ou seja, os autovetores de R
escalados para " ). O círculo do descritor de equilíbrio = 0,365. A
contribuição é sacada em 2 15 ÿ figura inserida mostra os mesmos eixos-descritores usando apenas os
ápices dos vetores. Essa representação, que às vezes é encontrada na literatura ecológica, deve ser evitada por
causa da possível confusão com objetos pontuais.

As variâncias e, portanto, também os desvios padrão dos descritores padronizados são iguais
à unidade (ou seja, = 1), o que leva a algumas propriedades especiais para a matriz U,1/2 .
Primeiro, D(s) = I, de modo que U,1/2 = D(s) –1U,1/2, ou seja, os coeficientes ujk "k são os
coeficientes de correlação entre os descritores j e os componentes k. Além disso, o equilíbrio
contribuição correspondente a cada descritor, no espaço reduzido de U,1/2, é sj d pÿ = d pÿ (uma
vez que si = 1). Portanto, é possível julgar se a contribuição de cada descritor para o espaço
reduzido é maior ou menor do que o esperado sob a hipótese de uma contribuição igual para
todos os eixos principais, comparando os comprimentos de suas projeções a um círculo de
equilíbrio com raio d pÿ (Fig. 9.5).

As principais propriedades para descritores padronizados estão resumidas na Tabela 9.3, que
é paralela à Tabela 9.2 para descritores centralizados.
Machine Translated by Google

448 Ordenação em espaço reduzido

Tabela 9.3 Análise do componente principal. Principais propriedades dos descritores padronizados j.

Escala 1 Escala 2
(biplot de distância) (biplot de correlação) "k

Comprimento dos autovetores escalados 1

Comprimento do descritor j em U ou Usc2 1 1

Ângulos em espaço 90°, ou seja, rotação rígida do projeções de correlações


reduzido sistema de eixos

Raio do círculo de d pÿ d pÿ
contribuição de equilíbrio

Projeção no eixo principal k ujk ujk "k


ou seja, proporcional à ou seja, correlação com
correlação com k o componente k

Correlação com o componente ujk "k ujk "k


principal k

6 — Os componentes significativos

As sucessivas componentes principais correspondem a frações progressivamente menores


da variância total. Um problema é, portanto, determinar quantos componentes são
significativos em termos ecológicos ou, em outras palavras, qual deve ser o número de
dimensões do espaço reduzido. A melhor abordagem pode ser verificar visualmente a
representatividade das projeções em espaço reduzido para duas, três ou mais dimensões,
usando diagramas de Shepard (Fig. 9.1). No entanto, sendo a análise de componentes
principais uma forma de particionamento de variância, os pesquisadores podem querer
testar a significância da variância associada aos sucessivos eixos principais.

Há várias abordagens estatísticas clássicas para essa questão, como o teste de


esfericidade de Bartlett (1950). Essas abordagens foram revisadas por Burt (1952) e
Jackson (1993). O problema é que esses testes formais exigem normalidade de todos os
descritores, uma condição que raramente é atendida por dados ecológicos.

Existe uma regra empírica sugerindo que só se deve interpretar um componente


principal se o autovalor correspondente " for maior que a média dos "'s. No caso particular
de dados padronizados, onde S é uma matriz de correlação, a média dos "'s é 1 de forma
que, de acordo com a regra, apenas devem ser interpretadas as componentes cujos "'s
kaiser são maiores que 1. Este é o chamado critério de Kaiser-Guttman. Ibanez (1973) forneceu
Guttman uma estrutura teórica para essa regra empírica. Ele mostrou que, se uma variável feita de
critério números selecionados aleatoriamente é introduzida entre os descritores, é
Machine Translated by Google

Análise de componentes principais (PCA) 449

não é possível interpretar os autovetores que seguem aquele em que esta variável de número
aleatório tem o carregamento mais alto. Pode-se mostrar que esta variável de número aleatório, que
tem covariâncias próximas de zero com todos os outros descritores, introduz na análise um autovalor
de 1 se os descritores forem padronizados. Para descritores não padronizados, este autovalor é a
média dos "'s se a variância da variável de número aleatório for igualada à variância média dos
outros descritores.

Frontier (1976) propôs comparar a lista de autovalores decrescentes com os valores


Quebrado decrescentes do modelo do palito quebrado (Subseção 6.5.2). Esta comparação é baseada na
grudar seguinte ideia. Considere a variância compartilhada entre os eixos principais como um recurso
embutido em um bastão de comprimento unitário. Se a análise de componentes principais tivesse
dividido a variância aleatoriamente entre os eixos principais, as frações da variação total explicadas
pelos vários eixos seriam aproximadamente as mesmas que os comprimentos relativos das peças
obtidas quebrando-se a unidade aleatoriamente em tantos pedaços quantos existem eixos. Se uma
unidade de bastão é quebrada aleatoriamente em p = 2, 3, … pedaços, os valores esperados (E)
dos comprimentos relativos dos pedaços sucessivamente menores (j) são dados pela eq. 6,50:

p
1
---
1
--
( j
E peça ) (9.16)
= %p x xj =

Os valores esperados são iguais aos comprimentos que seriam obtidos quebrando o bastão
aleatoriamente um grande número de vezes e calculando o comprimento médio dos pedaços mais
longos, dos segundos pedaços mais longos, etc. Um bastão de comprimento unitário pode ser
quebrado aleatoriamente em p pedaços colocando no bastão (p – 1) pontos de quebra aleatórios
selecionados usando um gerador de número aleatório uniforme [0, 1]. Uma função R está disponível
para calcular os valores esperados da distribuição do palito quebrado para qualquer número de peças (Seção 9.5).

Voltando aos autovalores, não faria sentido interpretar os eixos principais que explicam uma
fração da variância tão pequena quanto ou menor do que a prevista pelo modelo nulo do palito
quebrado. O teste pode ser realizado de duas maneiras. Pode-se comparar autovalores individuais
com previsões individuais do modelo de vara quebrada e selecionar para interpretação apenas os
autovalores que são maiores do que os valores previstos pelo modelo. Ou, para decidir se o
autovalor "k deve ser interpretado, pode-se comparar a soma dos autovalores, de 1 a k, com a soma
dos valores de 1 a k previstos pelo modelo. Este teste geralmente reconhece os primeiros dois ou
três principais componentes como significativos, o que corresponde à experiência dos ecologistas.

Depois de um estudo empírico usando uma variedade de tipos de matrizes, usando dados
ecológicos simulados e reais, Jackson (1993) concluiu que dois métodos apontavam consistentemente
para o número correto de componentes ecologicamente significativos em conjuntos de dados: o
modelo de palito quebrado e um autovalor-eigenvetor inicializado método proposto em seu artigo.

O Capítulo 10 discutirá como usar variáveis explicativas para interpretar ecologicamente os


primeiros componentes principais que são considerados significativos de acordo com um dos
critérios mencionados na presente subseção.
Machine Translated by Google

450 Ordenação em espaço reduzido

7 — Usos indevidos da análise de componentes principais

Dado o poder da análise de componentes principais, alguns aplicativos a utilizam de maneiras que
excedem os limites do modelo. Alguns desses limites podem ser transgredidos sem grandes
consequências, enquanto outros são mais críticos. Os erros mais comuns são: o uso de descritores
para os quais uma medida de covariância não é adequada e a interpretação das relações entre os
descritores, em espaço reduzido, com base nas posições relativas dos ápices dos eixos ao invés
dos ângulos entre eles.

A análise de componentes principais foi originalmente definida para dados com distribuições
multinormais (Seção 4.4), de modo que seu uso ideal (Cassie & Michael, 1968) exige a normalização
dos dados (Subseção 1.5.6). Entretanto, desvios da normalidade não necessariamente distorcem a
análise (Ibanez, 1971). É importante apenas certificar-se de que as distribuições dos descritores
sejam razoavelmente não distorcidas. Normalmente, em análises conduzidas com distribuições
fortemente assimétricas, os primeiros componentes principais separam apenas alguns objetos com
valores extremos dos objetos restantes, em vez de exibir os principais eixos de variação de todos
os objetos do estudo.

Uma matriz de dispersão de posto completo S não pode ser estimada usando um número de
observações n menor ou igual ao número de descritores p. Quando n $ p, uma vez que existem n –
1 graus de liberdade no total, o posto da matriz de dispersão resultante de ordem p é (n – 1). Nesse
caso, a autodecomposição de S produz (n – 1) valores próprios reais e [p – (n – 1)] nulos. De fato,
posicionar n objetos respeitando suas distâncias requer apenas (n – 1) dimensões. O PCA de uma
matriz de dados onde n $ p produz (n – 1) autovalores maiores que 0 e os (n – 1) correspondentes
autovetores e componentes principais. Para obter uma matriz de dispersão de postos completos S
e p componentes principais, o número de objetos n deve ser maior que p.

Os componentes principais são calculados a partir dos autovetores de uma matriz de dispersão.
Isso significa que o método deve ser usado em uma matriz de covariâncias (ou possivelmente
correlações) com as seguintes propriedades: a matriz S (ou R) foi calculada entre descritores que
são quantitativos e para os quais estimativas válidas das covariâncias (ou correlações ) pode ser
obtido. Estas condições são violadas nos seguintes casos:

1) Alguns autores transpuseram a matriz de dados e calcularam correlações entre os objetos


(ou seja, modo Q) em vez de entre os descritores (modo R). Seu objetivo era posicionar os
descritores no espaço reduzido dos objetos. Existem várias razões pelas quais esta operação é
incorreta, sendo a menor delas que é inútil, considerando que a análise de componentes principais
fornece informações sobre os relacionamentos entre objetos e descritores. As razões pelas quais
as correlações não devem ser calculadas no modo Q são explicadas na Caixa 7.1, onde os pontos
1, 2 e 4 também se aplicam às covariâncias.

Na literatura, a expressão “componentes em modo Q” pode algumas vezes designar uma


análise legítima realizada em uma matriz R. Essa expressão vem do fato de que se pode usar a
análise de componentes principais principalmente como um método para posicionar objetos
Machine Translated by Google

Análise de componentes principais (PCA) 451

em espaço reduzido. Os significados de “modo Q” e “modo R” são variáveis na literatura científica; seus
significados em ecologia numérica são definidos na Seção 7.1.

Rao (1964), Gower (1966) e Orlóci (1967a) mostraram que, como uma técnica computacional, os
componentes principais podem ser obtidos pelo cálculo dos autovalores e autovetores de uma matriz Q-
mode. As etapas são as seguintes:

n 1– .
• Começando com a matriz Y centralizada por colunas, Yc, calcule a matriz Cnp = Yc/ Esta
matriz é tal que C'C = Spp, que é a matriz usual de variância-covariância de Y.

• Calcule a matriz de produtos cruzados Qnn = CC' em vez de Spp = C'C.

• Determine os autovalores diferentes de zero de Q e seus autovetores associados.

• Escale cada autovetor k para o comprimento "k , depois multiplique cada valor por n 1– .

• Os autovalores da matriz Q são os mesmos da matriz S, e os autovetores escalados são a matriz F


dos componentes principais de Y. Esta técnica computacional perfeitamente válida é diferente da
abordagem criticada no parágrafo anterior.

2) Covariâncias e correlações são definidas apenas para descritores quantitativos (Seção 7.5). Isso
implica, em particular, que não se deve usar descritores qualitativos multiestado em análises baseadas
em matrizes de covariância, porque médias e variâncias calculadas a partir de estados não ordenados
não têm sentido.

Precisão A análise de componentes principais é muito robusta, no entanto, para variações na precisão dos
De dados dados. As variáveis podem ser recodificadas em algumas classes sem alteração perceptível nos
resultados (Frontier & Ibanez, 1974; Dévaux & Millerioux, 1976a). Os coeficientes de correlação de
Correlação Pearson calculados usando dados semiquantitativos são equivalentes aos coeficientes de correlação de
de Spearman Spearman (eq. 5.3). Em uma discussão sobre a análise de componentes principais calculada usando
dados semiquantitativos, Lebart et al. (1979) fornecem, para vários números de objetos e descritores,
valores acima dos quais os "'s dos dois primeiros componentes principais podem ser considerados
significativos. Gower (1966) também mostrou que, com descritores binários, a análise de componentes
principais posiciona os objetos , no espaço multidimensional, a distâncias proporcionais às raízes
quadradas dos complementos de coeficientes de emparelhamento simples, ou seja, D = 1 S1 – (S1: eq.
7.1).

3) Quando calculados sobre conjuntos de dados com muitos zeros duplos, coeficientes como
covariância e correlação levam a ordenações PCA com estimativas inadequadas das distâncias entre
os locais de amostragem. O problema surge do fato de que a rotação da componente principal preserva
a distância euclidiana entre os objetos (Tabela 9.1, Fig. 9.2d). O problema do duplo zero foi discutido na
Subseção 7.2.2 e o paradoxo associado à distância euclidiana foi apresentado após a eq. 7.32. Com
dados de abundância de espécies não transformados, a análise de componentes principais só deve ser
usada quando os locais de amostragem cobrirem gradientes curtos (consulte a Subseção 9.1.10). Para
gradientes ecológicos mais longos, os dados das espécies devem ser transformados usando um dos
Machine Translated by Google

452 Ordenação em espaço reduzido

transformações da Seção 7.7. Além disso, as ordenações podem ser obtidas usando análise
de correspondência (CA, Seção 9.2) quando a distância qui-quadrado é apropriada, ou por
análise de coordenadas principais (PCoA, Seção 9.3) ou escalonamento multidimensional não
métrico (nMDS, Seção 9.4) usando outras distâncias adequadas.

Esta última observação explica por que, na literatura ecológica, a análise de componentes
principais às vezes não forneceu resultados interessantes, por exemplo, em estudos de
associações de espécies (por exemplo, Margalef & Gonzalez Bernaldez, 1969; Ibanez, 1972;
Reyssac & Roux, 1972). Este problema também foi observado por Whittaker & Gauch (1973).
A busca por associação de espécies é discutida na Seção 8.9.

Tentativas de interpretar as proximidades entre os ápices dos eixos-espécies no espaço


reduzido, em vez de considerar os ângulos que separam esses eixos-descritores (por exemplo,
Fig. 9.5, inserção), também podem levar a conclusões incorretas e resultados inúteis.

A Tabela 9.4 resume, com referência ao texto, as várias questões que podem ser abordadas
no curso de uma análise de componentes principais.

8 — Aplicações ecológicas

Aplicação ecológica 9.1a

De 1953 a 1960, armadilhas de queda foram instaladas em 100 locais em quatro vales na área de dunas de Meijendel, ao norte
de Haia, na Holanda. Eles foram visitados semanalmente durante 365 semanas. Nos 36.500 relevés, foram identificadas
aproximadamente 425 espécies animais, sendo cerca de 90% delas artrópodes. Aart (1973) estudou as aranhas-lobo (Lycosidea
e Pisauridae: 45.030 espécimes) para avaliar como as espécies de licosídeos compartilhavam o espaço multidimensional de
recursos (ver Seção 1.0 para o conceito de nicho). O artigo de Aart (1973) relata um PCA baseado em uma tabela de dados de
100 locais × 12 espécies obtidas pela adição dos valores das diferentes capturas semanais para cada armadilha; duas das 14
espécies foram eliminadas por terem sido encontradas apenas duas vezes e uma vez, respectivamente.

O PCA foi aplicado aos dados de espécies padronizados, que continham cerca de 30% de valores zero.
As edições anteriores do presente livro reproduziram as parcelas PCA separadas de espécies e locais encontrados no artigo de
Aart (1973).

Outro conjunto de armadilhas de queda foi colocado em 100 locais durante 60 semanas, em 1969-1970, em Bierlap, um
dos vales de dunas do levantamento anterior. Onze das 12 espécies de aranhas eram as mesmas do artigo de Aart (1973).
Descritores ambientais foram obtidos para 28 desses locais. Os dados de aranhas (28 locais × 12 espécies, dados acumulados
ao longo das semanas) foram analisados por Aart & Smeenk Enserink (1975) e relacionados às variáveis ambientais usando
análise de correlação canônica (CCorA, Seção 11.4); esses dados são reanalisados no aplicativo ecológico 11.1b usando
análise de redundância (RDA, Seção 11.1) em vez de CCorA.

Os dados do spider dos 28 sites* são analisados aqui pelo PCA para ilustrar o interesse das transformações de dados. A
Figura 9.6a mostra os resultados da análise dos dados brutos de abundância das espécies e a Fig. 9.6b o biplot resultante da
análise dos mesmos dados após uma transformação log(y + 1), a mesma transformação que havia sido usada por Aart &
Smeenk-Enserink (1975).

* O arquivo de dados das espécies está disponível eletronicamente. Consulte a nota de rodapé na aplicação ecológica 11.1b.
Machine Translated by Google

Análise de componentes principais (PCA) 453

Tabela 9.4 Questões que podem ser abordadas no decorrer de uma análise de componentes principais e as respostas
encontradas na Seção 9.1.

Antes de iniciar uma análise de componentes principais Páginas

1) Os descritores são apropriados?

3 Descritores quantitativos; multinormalidade; sem muitos zeros. 450-452

2) Os descritores são dimensionalmente homogêneos?

3 Se SIM, conduza a análise na matriz de dispersão 3 Se NÃO, 442, 446

conduza a análise na matriz de correlação 445-448

3) Finalidade da ordenação em espaço reduzido:

3 Para preservar e exibir as posições relativas dos objetos: dimensione os


autovetores para unidades de comprimento para obter a matriz U 432

Desenhe um biplot de distância (descritores: U; objetos: F = YU) 444

3 Para exibir as correlações entre os descritores: dimensione


os autovetores para " para obter a matriz Usc2 436

Desenhe um biplot de correlação (descritores: Usc2; objetos: G = F,–1/2)


(cuidado: as distâncias euclidianas entre os objetos não são preservadas) 444

Ao examinar os resultados de uma análise de componentes principais

1) Quão informativa é uma representação dos objetos em um


espaço reduzido m-dimensional?

3 Calcule a eq. 9.5 433

2) As distâncias entre os objetos estão bem preservadas no espaço


reduzido?

3 Compare as distâncias euclidianas usando um diagrama de Shepard 427-428

3) Quais autovalores são importantes?

3 "k é maior que a média dos "'s? 448

3 É a porcentagem da variância correspondente a "k


maior que o valor correspondente no modelo de palito quebrado? 449

4) Quais são os descritores que mais contribuem para a formação do


espaço reduzido?

3 Calcule a contribuição de equilíbrio dos descritores e, quando


apropriado, desenhe o círculo 437, 439, 442, 448

3 Calcular correlações entre descritores e eixos principais 440, 442, 448

3 Calcule a tabela de “Ajuste cumulativo por descritor” 441-442

5) Como representar os objetos no espaço reduzido?

3 Escala 1: F = YcU; scaling 2: G = F,–1/2 3 Calcule a 433-435, 443-444

tabela de “Ajuste percentual cumulativo dos objetos” 443


Machine Translated by Google

454 Ordenação em espaço reduzido

Figura 9.6 Biplots de correlação PCA de (a) os dados brutos (não transformados) e (b) os dados de aranha
transformados em log (28 locais, 12 espécies). O escalonamento tipo 2 foi usado em ambos os
biplots para enfatizar as covariâncias entre as espécies. As espécies são: Alopecosacentuata
(abreviação: Alop.acce), Alopecosa cuneata (Alop.cune), Alopecosa fabrilis (Alop.fabr), Arctosa
lutetiana (Arct.lute), Arctosa perita (Arct.peri), Aulonia albimana (Aulo .albi), Pardosa lugubris
(Pard.lugu), Pardosa monticola (Pard.mont), Pardosa nigriceps (Pard.nigr), Pardosa pullata
(Pard.pull), Trochosa terricola (Troc.terr) e Zora spinimana (Zora.spin ).
Machine Translated by Google

Análise de componentes principais (PCA) 455

(a) (b) (c)


Aureobasidium Penicillium
Pedologia canescens (tipo I)
pullulans
BL banco de dados

BL
banco de dados

B
primeiro
eixo primeiro
eixo
primeiro
eixo

DG

segundo eixo segundo eixo segundo eixo

Figura 9.7 Análise de componentes principais calculada a partir da presença-ausência de 51 microfungos do solo.
(a) Informações pedológicas desenhadas na ordenação dos 26 locais de amostragem, plotadas no
espaço reduzido dos dois primeiros componentes principais. De norte a sul, os tipos de solo são: G =
cinza, DG = cinza escuro, BL = preto, DB = marrom escuro, B = marrom. (b) e (c) Distribuições dos locais
(envelopes) onde duas espécies da microflora estiveram presentes. Modificado de Morrall (1974).

Está claro que a Fig. 9.6b é mais fácil de interpretar do que a Fig. 9.6a. A razão é encontrada examinando
a tabela “Ajuste cumulativo por descritor” descrita na Subseção 9.1.3: na análise de dados brutos, os
componentes principais I e II explicaram mais de 60% da variação para apenas quatro das 12 espécies,
enquanto em na análise dos dados log-transformados, os dois primeiros componentes principais
explicaram mais de 60% da variação para 10 das 12 espécies.

Os leitores são convidados a comparar a Fig. 9.6b com os resultados da análise canônica (RDA) na
Fig. 11.7; a última figura fornece uma interpretação do local e dos agrupamentos de espécies usando as
variáveis ambientais. Compare também os agrupamentos de espécies (espécies com pequenos ângulos)
na Fig. 9.6b com as associações de espécies descritas na Aplicação ecológica 11.1b.

Aplicação ecológica 9.1b

Um estudo dos microfungos do solo que vivem em associação com o álamo Populus tremuloides Michx.
fornece outro tipo de utilização da análise de componentes principais. Este estudo de Morrall (1974)
cobriu 26 estações com 6 locais cada, espalhadas pela Província de Saskatchewan (Canadá). Evidenciou
relações entre as distribuições de algumas espécies e os tipos de solo.

Das 205 espécies ou entidades taxonômicas identificadas, 51 foram incluídas no estudo de


ordenação. As demais não, considerando critérios de eliminação de táxons raros, que poderiam ser
constituintes efêmeros da microflora do solo ou mesmo contaminantes das culturas de laboratório. As
observações foram transformadas em dados de presença-ausência.

Após a análise de componentes principais, os 26 locais de amostragem foram plotados no espaço


reduzido dos dois primeiros componentes principais, aos quais informações sobre a natureza dos solos
foram sobrepostas (Fig. 9.7a). Os solos de Saskatchewan podem ser classificados em 5 tipos, ou seja, (G) o
Machine Translated by Google

456 Ordenação em espaço reduzido

solos arborizados cinza da floresta boreal do norte, seguidos ao sul pelos solos de transição cinza
escuro (DG) e os solos pretos (BL). Mais ao sul estão os solos marrons escuros (DB), que dão
lugar aos solos marrons (B) das pastagens. Como os componentes principais foram calculados a
partir de dados de presença-ausência, espera-se que a distribuição dos sítios no espaço reduzido
reflita a das espécies de fungos. O autor testou isso para as espécies mais abundantes no estudo,
traçando, no espaço reduzido, as distribuições dos locais onde algumas espécies de fungos
estavam presentes; dois exemplos são dados nas Figs. 9.7b e c. O autor poderia então comparar
essas distribuições com as dos tipos de solo.

9 — Algoritmos
Três métodos diferentes estão disponíveis para calcular os autovalores e autovetores de uma matriz
simétrica real, como uma matriz de covariância S.

chefe de família 1. O método de autodecomposição mais utilizado é a redução de Householder.


Este é o método implementado na função eigen() de R. É muito eficiente para casos em que todos os
autovalores e autovetores devem ser calculados.

2. Clint & Jennings (1970) publicaram um artigo pioneiro descrevendo como calcular um subconjunto
apenas dos autovalores e autovetores correspondentes de uma matriz simétrica real, usando um método
iterativo. Hill (1973b) usou essa ideia para desenvolver um algoritmo de “média recíproca” para análise de
correspondência; O trabalho de Hill será discutido mais adiante na Seção 9.2 sobre análise de
correspondência. Com base nessas bases, ter Braak (1987c) propôs um algoritmo de soma ponderada de
TWW duas vias (TWWS) para análise de componentes principais. Este algoritmo é descrito em detalhes aqui por
algoritmo três razões: (1) está intimamente ligado às equações básicas do método PCA, de modo que pode ajudar
os leitores a entendê-las; (2) é fácil de programar; (3) usando-o, pode-se calcular apenas os primeiros
componentes, quando estes são os de interesse. O algoritmo é resumido na Tabela 9.5.

O exemplo numérico elaborado na Tabela 9.6 deve ajudar a entender como o algoritmo calcula os
componentes principais, os autovetores e os autovalores.
Os dados são os do exemplo numérico apresentado no início da Seção 9.1 e utilizado nas Subseções
9.1.1 a 9.1.4. O procedimento começa com a matriz de dados centralizados, Yc, mostrada em uma caixa
no canto superior esquerdo da Tabela 9.6.

Para estimar o componente principal I, pontuações arbitrárias são primeiro atribuídas às linhas da
matriz de dados centralizada (Tabela 9.6, coluna R0); valores [fi1] = [1 2 3 4 5]' são usados aqui.
Qualquer outra escolha inicial levaria à mesma estimativa para o primeiro componente principal [fi1] ,
embora o número de iterações necessárias para alcançá-lo possa diferir. A única escolha a evitar é igualar
todos os valores fi1 iniciais . A partir delas, as pontuações das colunas são encontradas multiplicando a
transposição da matriz de dados pelas pontuações das linhas (Tabela 9.6, linha C1):

'
[coluna pontuações1j ] = [] aa – [fi1] (9.17)
Machine Translated by Google

Análise de componentes principais (PCA) 457

Tabela 9.5 Algoritmo de soma ponderada de duas vias (TWWS) para PCA. Modificado de ter Braak (1987c).

a) Procedimento de estimação iterativa

Passo 1: Considere uma tabela de n objetos (linhas) × p variáveis (colunas).


Centralize cada variável (coluna) em sua média.

Decida quantos autovetores são necessários e, para cada um. FAÇA o seguinte:

Passo 2: Considere a ordem das linhas conforme as pontuações iniciais arbitrárias do objeto (1, 2, …).
Defina a estimativa de autovalor inicial como 0.

O procedimento iterativo começa


Passo 3: Calcule os novos carregamentos de variáveis: colscore(j) = - y(i,j) × rowscore(i) rowscore(i) =

Etapa 4: Calcular novas pontuações de objetos: - y(i,j) × colscore(j)

Passo 5: Para os eixos de segunda ordem e de ordem superior, torne as pontuações do objeto não correlacionadas com todos os eixos
anteriores (procedimento de ortogonalização de Gram-Schmidt: consulte b abaixo).

Passo 6: Escale o vetor de pontuações de objeto para comprimento 1 (procedimento de normalização c, abaixo); obter S.

Passo 7: Na convergência, o autovalor é S/(n – 1) onde n é o número de objetos. Assim, ao final de cada iteração, S/(n – 1) fornece uma estimativa
do autovalor. Se esta estimativa não diferir da iteração anterior em mais do que uma pequena quantidade (“tolerância”, definida
pelo usuário), vá para a etapa 8. Se a diferença for maior que o valor da tolerância, vá para a etapa 3.

Fim do procedimento iterativo

Passo 8: Normalize o autovetor (cargas variáveis), ou seja, dimensione-o para o comprimento 1 (procedimento c, abaixo).
Redimensione o componente principal (pontuações do objeto) para variância = autovalor.

Passo 9: Se mais autovetores devem ser calculados, vá para a etapa 2. Se não, continue com a etapa 10.

Passo 10: Retorne o autovalor, % de variância, % de variância cumulativa, autovetor (carregamentos de variáveis) e componente principal
(pontuações do objeto).

b) Procedimento de ortogonalização de Gram-Schmidt

FAÇA o seguinte, por sua vez, para todos os componentes principais k calculados anteriormente :

Passo 5.1: Calcule o produto escalar SP = - [rowscore(i) × v(i,k)] da estimativa do vetor de pontuação do objeto atual com o componente
anterior k, onde o vetor v(i,k) contém as pontuações do objeto do componente k, escalado para comprimento 1. Este produto varia
entre 0 (se os vetores forem ortogonais) e 1.

Passo 5.2: Calcule novos valores de rowscore(i) de modo que o vetor rowscore se torne ortogonal ao vetor v(i,k): rowscore(i) = rowscore(i) –
(SP × v(i,k)).

c) Procedimento de normalização
2 2
Passo 6.1: Calcule a soma dos quadrados das pontuações do objeto: S2 = - rowscore(i) , e o comprimento S = S .

Passo 6.2: Calcule as pontuações normalizadas do objeto: rowscore(i) = rowscore(i)/ S.


Machine Translated by Google

458 Ordenação em espaço reduzido

Subscrito 1 designa a primeira iteração. Ao final do processo de iteração, os escores das colunas fornecerão
estimativas da primeira coluna da matriz U. A justificativa para essa operação vem da equação básica de
autoanálise (eq. 2.27) aplicada à matriz S:

SU = U ,

Substituindo S pelo seu valor na definição da matriz de covariância (eq. 4.6), S = (n – 1)–1 [ ] yy – ' [ ] yy –
obtém-se: ,

[ ] aa – ' [ ] aa – U = (n - 1) U ,

Como F = [ ] yy – U (eq. 9.4), segue-se que:

'
[ ] aa – F = (n – 1) U ,

Portanto, as pontuações da coluna obtidas da eq. 9.17 são os valores do primeiro autovetor (primeira
coluna da matriz U) multiplicados pelo autovalor "1 (que é o primeiro elemento diagonal da matriz ,) e por
(n – 1).

A partir da primeira estimativa das pontuações das colunas, uma nova estimativa das pontuações das linhas é
calculada usando a eq. 9.4, F = [ ] aa – U:

[pontuação da linhai1] = [] aa – [ui1] (9.18)

O algoritmo alterna entre estimar pontuações de linha e pontuações de coluna até a convergência. Em
cada etapa, as pontuações das linhas (colunas denominadas R na Tabela 9.6) são dimensionadas para
comprimento 1 a fim de evitar que as pontuações se tornem muito grandes para o computador manipular,
o que eles podem fazer facilmente. Antes dessa normalização, o comprimento do vetor de pontuação da
linha, dividido por (n – 1), fornece a estimativa atual do autovalor. Na verdade, esse comprimento mede a
quantidade de “alongamento” que o vetor de pontuação de linha incorreu durante uma iteração.

Esta descrição sugere um dos vários critérios de parada possíveis (Tabela 9.5, passo 7): se a
estimativa do autovalor não mudou, durante a iteração anterior, em mais do que um valor de tolerância pré-
selecionado, o processo de iteração é interrompido. Valores de tolerância entre 10–10 e 10–12 produzem
estimativas satisfatórias ao computar todos os autovetores de grandes matrizes, enquanto valores entre
10–6 e 10–8 computam apenas os primeiros dois ou três autovetores. Outro possível são suficientes para
critério de parada seria um percentual mínimo de mudança na estimativa do autovalor.

Ao final do processo de estimação iterativa (Tabela 9.5, passo 8),

• o autovetor (Tabela 9.6, linha C13) é normalizado (ou seja, dimensionado para comprimento unitário) e

• o componente principal é dimensionado para ( ) n 1– "1 . Isso faz com que sua variação
comprimento igual ao seu autovalor.
Estimativas
de
"2
#
2.000
4

18.000
4.000
C1
C2
comprimento=1
0,447
0.000
– ,894 x1
x2
x3
x4
x5 ! Objetos x1
x2
x3
x4
x5 ! Objetos Tabela
9.6
Var.
1var.
2
R0 Estimativas
de
"1
#
5.642
1.905
5.544
2.257
5.473
2.449
5.428
2.554
5.401
2.612
5.386
2.644
5.377
2.661
5.373
2.671
5.370
2.677
5.368
2
0,680
5,368
2,681
5,367
2,682
18,000
4,000
C1
C2
C3
C4
C5
C6
C7
C8
C9
C10
C11
C12
C13
comprimento=1
0,895
0,447 Var.
1var.
2
R0 Estimativa
dos
eixos
I(superior)
e
II(inferior)
para
os
dados
centralizados
do
exemplo
numérico
(valores
em
caixas),
utilizando
o
algoritmo
“two-
way
Weighted
Summation”
Tabela
9.5).
Iterações
1a
13:
estimativas
das
pontuações
de
linha
(R1
a
R13)
e
pontuações
de
coluna
(C1
a
C13). (TWWS,
1,4
3,4
1,8
3,8
0

3
1–
2
0,6
,2
,2
,6 1,4
3,4
1,8
3,8
0

3
1–
2
0,6
,2
,2
,6
(arbitrário) (arbitrário)
46.000
66.000
1–
6
2
3–
14
54.000
4.000 3,130
3,131
0,521
18,780
0,523
18,786
0,492
18,752
0,550
18,813
0,421
16,633
0,605
20,297
1–
6
0
2
–352
0
20
–3

20
94,000
–,586
0

1,103
,593
8
1.

,595
0
1,466
1
,596
3
,578
1

4,000
,311
0

,745
6
,274
,037

,252
0
,080
8
,224

,053
0
,342
14
–4,000
5,128
,082
,171
,977
,195
,019
,223
,047
,224
,341
*orto:
as
pontuações
são
ortogonais
ao
R13
encontrado
na
parte
superior
da
tabela.
46.000
66.000
R1 R1
R1
comprimento
=
1
27.295
R1
orto*
comprimento=1
0,001
9,996
9,994
9,995
– ,996
R2
4.998
R1
R2
comprimento
=
1
8.895 0,467
17,653
0,570
19,713
R2
R3
R2
orto*
0,001
9,999
10,000
0,002
9,998
10,001
9

10,000
0,500
01–
– 1,999
0,000
,500
0,002
0,001

R9
R3
comprimento=1
8.967
R2
comprimento
escalado
=
1(var=")
5.000 0,000
0,500
0,500

R9

comprimento
=
1
0,000
2,236
2,236

9.000
R13
comprimento=1
(var=")
9.000 0,522 R13
escalado
459 Análise de componentes principais (PCA)
Machine Translated by Google
Machine Translated by Google

460 Ordenação em espaço reduzido

Observe que os autovalores, autovetores e componentes principais obtidos usando este


procedimento iterativo e mostrados na Tabela 9.6 são os mesmos das Subseções 9.1.1 e 9.1.2,
exceto pelos sinais do segundo autovetor e componente principal, que são todos alterados neste
exemplo. Pode-se alterar arbitrariamente todos os sinais de um autovetor e o componente principal
correspondente, uma vez que os sinais resultam de uma decisão arbitrária tomada ao calcular os
autovetores (Seção 2.9). Isso equivale a girar o diagrama de ordenação em 180° se os sinais
forem alterados no primeiro e no segundo componentes principais, ou olhando para ele no verso
da página, ou em um espelho se os sinais forem alterados apenas para um eixo.

Para estimar o segundo componente principal, autovalor e autovetor, as pontuações de linha


são novamente atribuídas arbitrariamente no início do processo iterativo. Na Tabela 9.6 (parte
inferior), foram efetivamente escolhidos os mesmos valores do eixo I, conforme indicado no passo
2 do algoritmo (Tabela 9.5). As iterações procedem da mesma maneira que acima, com a exceção
de que, durante cada iteração, as pontuações das linhas são ortogonais à estimativa final obtida
para o primeiro componente principal (coluna R13 na parte superior da Tabela 9.6). Isso decorre
da regra básica de que os componentes principais devem ser linearmente independentes (ou
seja, ortogonais) uns dos outros. Para o terceiro e seguintes eixos principais, os vetores que
estimam as pontuações das linhas são feitos ortogonais, por sua vez, para todos os componentes
principais calculados anteriormente.

O algoritmo converge rapidamente, mesmo com pequenos valores de tolerância. Para o


exemplo da Tabela 9.6, foram necessárias 13 iterações para alcançar a convergência para o eixo
I e 2 iterações apenas para o eixo II, usando um valor de tolerância de 10–6. Com um valor de
tolerância de 10–10, foram necessárias 21 e 2 iterações, respectivamente. Os valores iniciais
arbitrários atribuídos às pontuações de linha também têm um efeito (imprevisível) no número de
iterações; por exemplo, com um conjunto diferente de valores iniciais [2 5 4 3 1], foram necessárias
14 iterações em vez de 13 para atingir a convergência do primeiro eixo (tolerância = 10–6).

Objeto Objetos ou variáveis suplementares podem ser facilmente incorporados nos cálculos usando
suplementar este algoritmo. Estes são objetos ou variáveis que não foram usados para calcular os autovalores
e variável e autovetores do espaço de ordenação, mas cujas posições são buscadas em relação ao conjunto
original de objetos e variáveis que foram usados para calcular os autovalores e autovetores. No
aplicativo Ecológico 9.1a, por exemplo, onde a análise de componentes principais foi calculada
usando os dados de abundância das espécies, os descritores ambientais usados no aplicativo
Ecológico 11.1b poderiam ter sido adicionados à análise como variáveis suplementares. Além
disso, como havia 100 armadilhas de queda de observações de aranhas, as armadilhas que foram
excluídas da análise poderiam ter sido adicionadas ao gráfico de ordenação como objetos
suplementares. São necessárias transformações preliminares: (1) as variáveis suplementares
devem ser centradas em suas respectivas médias; (2) para cada variável usada no PCA original
(por exemplo, as 12 espécies de aranhas), os objetos suplementares devem ser centralizados
usando o valor médio dessa variável calculado para o conjunto original de objetos. Quando o
algoritmo atinge a convergência para um eixo usando o conjunto original de objetos, é simples
calcular as pontuações das colunas das variáveis suplementares usando a eq. 9.17 e as
pontuações de linha dos objetos suplementares usando a eq. 9.18. A etapa final consiste em
aplicar ao
Machine Translated by Google

Análise de componentes principais (PCA) 461

variável suplementar pontua o escalonamento que foi aplicado aos termos do autovetor
correspondente ao conjunto original de variáveis e, para os escores de objetos suplementares, o
escalonamento que foi aplicado ao conjunto original de objetos.

SVD 3. Outra forma de calcular os componentes principais envolve a decomposição de valores


singulares (SVD, Seção 2.11). SVD também é uma abordagem amplamente usada para calcular a
análise de correspondência (Seção 9.2).

A relação com a análise de componentes principais é a seguinte. Centralize os vetores coluna


de Y em suas respectivas médias, formando a matriz Yc, e calcule a matriz de covariância S = (n
– 1)–1Yc'Yc (eq. 4.6). Faça uma decomposição de valor singular: Yc = VW Usvd' (eq. 2.31). O
seguinte raciocínio mostrará que a matriz U produzida por SVD, Usvd, é igual à matriz U calculada
pela decomposição própria, Ueigen. Use estes resultados SVD para reconstruir S:

1
-----------
1
-----------
S= Yc'Yc = (UsvdW' V') (VW Usvd')
n 1– n 1–

Como V é ortonormal (Seção 2.11), V'V = I e obtém-se:

1
-----------
1
-----------
S= Yc'Yc = Usvd W'W Usvd' (9.19)
n 1– n 1–

Na teoria da autodecomposição, a eq. 2.28


–1 afirma que S = Ueigen !Ueigen –1.
Como Ueigen é ortonormal, Ueigen e a = Ueigen' (propriedade 7 dos inversos, Seção 2.8)
equação podem ser reescritas:

S = Ueigen !Ueigen'

Combinando a última equação com a eq. 9.19 mostra que

$ Ueigen !Ueigen' = Usvd n 1– "


%
-----------W'W Usvd'
#

1
-----------
2
por isso: Ueigen = Usvd W'W = ----------- wj n 1– n 1– 1[]e!= (9.20)

Essas correspondências podem ser prontamente verificadas, para os dados de exemplo numérico,
pela decomposição de valor singular da matriz de dados centrados Yc:

Yc = V C Usvd'

3.2– 1.6– 0,5963– 0,0000


2.2– 1.4 0,2236– 5,0000
= 6,0000 0 0,8944 0,4472
0,2– 2,6– 0,2236– 5,0000–
0 4.4721 0,4472– 0,8944
1,8 3,4 0,5217 5,0000
3,8 0,6– 0,5217 5,0000–
Machine Translated by Google

462 Ordenação em espaço reduzido

(Quanto à decomposição de valores próprios, diferentes funções SVD podem reverter os sinais
de algumas colunas de V e U.) Pode-se verificar que os valores singulares ao quadrado divididos
por (n – 1) são os valores próprios, &1 = 9 e &2 = 5, e que Usvd = Ueigen calculado em
Subseção 9.1.1.

A matriz G, que fornece as posições do objeto no biplot de correlação (escala 2), é


obtido de V como segue:

G= n 1– V (9.21)

A matriz F, que dá as posições do objeto no biplot de distância (escala 1), pode ser calculada a
partir de V de duas maneiras diferentes:

F = VW ou F= n 1– V!1/2 (9.22)

Quando há tantas ou mais variáveis do que objetos (ou seja, p ' n, por exemplo em
comunidades ricas em espécies), autovalores e autovetores ainda podem ser calculados usando
qualquer um dos três métodos descritos acima: Redução de Householder, o algoritmo TWWS ,
ou decomposição de valor singular. A matriz de covariância é semidefinida positiva nesses casos,
de modo que autovalores nulos são produzidos (Tabela 2.2). Quando p é muito maior que n e
todos os autovalores e autovetores devem ser calculados, economias importantes no tempo do
computador podem ser feitas aplicando redução de Householder ou decomposição de valor
singular à matriz de produtos cruzados [ YY'], que é de tamanho (n × n), em vez de [Y'Y] que é
de tamanho (p × p)*e, portanto, muito maior; Y é centralizado por colunas. Os autovalores de
[YY'] são iguais aos autovalores diferentes de zero de [Y'Y].
A matriz U dos autovetores de [Y'Y] pode ser encontrada a partir da matriz V dos autovetores de
[YY'] usando a transformação U = Y'V!–1/2. A matriz F dos componentes principais é encontrada
a partir da equação F = V!1/2.

Autovalores negativos podem ocorrer na análise de componentes principais devido ao


tratamento de valores omissos. A exclusão de pares de dados ausentes (Subseção 1.6.2), em
particular, cria covariâncias calculadas com diferentes números de graus de liberdade; esta
situação pode tornar a matriz de covariância indefinida (Tabela 2.2). Um algoritmo de Householder
deve ser usado nesse caso porque os autovalores negativos saem de SVD como valores
singulares positivos (Seção 2.11, Aplicação 2).

10 — Ordenação métrica dos dados de composição da comunidade

Diferentes abordagens estão disponíveis para obter ordenações métricas de dados de


composição da comunidade (espécies) (Fig. 9.8): as abordagens clássicas de ordenação (PCA,
esta seção e CA, Seção 9.2), a PCA baseada em transformação (tb-PCA) e o

* A matriz S difere da matriz de produtos cruzados [Y'Y] pela divisão dos produtos cruzados
por (n – 1) em S. Os autovalores de [Y'Y] são maiores que os de S por este fator (n – 1), mas
os autovetores são idênticos.
Machine Translated by Google

Análise de componentes principais (PCA) 463

(a) Abordagem clássica

biplot de ordenação
Y = dados brutos Gradientes curtos: CA ou PCA
(locais × espécies) Gradientes longos: CA

(b) Abordagem baseada em transformação (tb-PCA)

Y=Dados
Dados não tratados PCA

(locais × espécies) transformados (locais × espécies)


Representação de elementos:
Espécie = setas
Sites = símbolos

Ordenação de sites

(c) Abordagem baseada em distância (PCoA)

Dados não tratados PCoA


Matriz de
distância
(locais × espécies)

Representação de elementos:
Sites = símbolos

Figura 9.8 Diferentes abordagens estão disponíveis para a ordenação métrica dos dados de composição da
comunidade: (a) PCA e CA clássicos, (b) abordagem baseada em transformação e (c) abordagem baseada
em distância (PCoA). Os métodos de ordenação métrica produzem ordenações que preservam totalmente
as distâncias entre os sítios, conforme especificado na Tabela 9.1. Modificado de Legendre & Gallagher (2001).

método baseado em distância de análise de coordenadas principais (PCoA, Seção 9.3). Esses
métodos de ordenação métrica produzem ordenações que preservam totalmente as distâncias
entre os sites. Eles são discutidos aqui sucessivamente. A distância preservada por cada
método é especificada na Tabela 9.1. O método não métrico do nMDS (Seção 9.4) não é
mencionado na Fig. 9.8 porque as ordenações que ele produz distorcem as distâncias entre os sítios.

Na abordagem clássica (Fig. 9.8a), a relação espécie-ambiente é analisada por PCA (esta
Seção) ou por CA (Seção 9.2). Nas primeiras aplicações do PCA à ecologia de comunidades,
o CA foi considerado preferível ao PCA para tabelas de dados de espécies amostradas em
regiões altamente diversificadas (“gradientes longos”) porque essas tabelas contêm muitos
zeros. Este é o caso, por exemplo, da amostragem de comunidades ao longo
Machine Translated by Google

464 Ordenação em espaço reduzido

extensos gradientes espaciais ou temporais, onde a composição de espécies pode mudar muito
ao longo do gradiente. Para grupos de sítios bastante homogêneos na composição de espécies
(“gradientes curtos”), o PCA foi considerado apropriado. Uma gama mais ampla de opções está
agora disponível.

O PCA pode ser feito para preservar alguma distância que seja apropriada para o estudo
de dados de composição em regiões altamente diversificadas, por exemplo, ao longo de
gradientes, em vez da distância euclidiana D1 (Fig. 9.8b ) . Os dados de composição podem
ser transformados usando as transformações descritas na Seção 7.7, levando à abordagem
tb-PCA PCA baseada em transformação, ou tb-PCA. O PCA calculado em dados transformados usando
essas equações realmente preservará a corda, perfil, distância de Hellinger ou qui-quadrado,
ou a métrica qui-quadrado entre sites, dependendo da transformação usada. Observe que as
distâncias correspondentes (D3 e D15 a D18 na Tabela 7.3) têm a propriedade de serem euclidianas.

Pode-se também (Fig. 9.8c) calcular diretamente uma das funções de distância apropriadas
para os dados de composição da comunidade (Tabela 7.4) e realizar uma análise de
coordenadas principais (PCoA, Seção 9.3) da matriz de distância para obter uma ordenação.
Esta é a abordagem baseada na distância. O PCoA obtém ordenações métricas de matrizes
D , enquanto o escalonamento multidimensional não métrico (nMDS, Seção 9.4) produz
ordenações não métricas que distorcem as distâncias entre os locais. Esses métodos devem
ser usados em análises envolvendo funções de distância que não podem ser obtidas por uma
transformação de dados seguida de PCA (abordagem tb-PCA, Fig. 9.8b). Entre as distâncias
desenvolvidas especificamente para dados de espécies (Tabela 7.4) estão a maioria dos
binário), bem como dados quantitativos, por exemplo, Jaccard ( 1 coeficientes projetados para
S7 – ) e Sørensen (D13 ou 1 S8 – medidas de distância como o coeficiente assimétrico de
Gower ( 1 S19 – ), a métrica geodésica (D4), Whittaker (D9), Canberra (D10), Clark (D11),
diferença percentual (D14) e diferença de caráter média modificada para dados de espécies D19.

9.2 Análise de correspondência (CA)

A análise de correspondência (AC) foi desenvolvida de forma independente por diversos


autores. Foi proposto pela primeira vez para a análise de tabelas de contingência por Hirschfeld
(1935), Fisher (1940), Benzécri (1969) e outros. Em uma revisão histórica do assunto, Nishisato
(1980) remonta a 1933. Foi aplicado em ecologia à análise de sítios × tabelas de espécies por
Roux & Roux (1967), Hatheway (1971), Ibanez & Séguin (1972 ), Hill (1973b, 1974), Orlóci
(1975), entre outros. Seu uso foi generalizado para outros tipos de tabelas de dados por
Benzécri e seus colaboradores (Escofier-Cordier, 1969; Benzécri e col., 1973). Outros livros
importantes sobre análise de correspondência são os de Nishisato (1980), Greenacre (1983,
2007), ter Braak (1988) e van Rijckevorsel & de Leeuw (1988). No curso de sua história, o
método foi sucessivamente designado sob os nomes ingleses análise de tabela de contingência
(Fisher, 1940), RQ-technique (Hatheway, 1971), média recíproca (Hill, 1973b), análise de
correspondência (Hill, 1974), ordenação recíproca (Orlóci, 1975), escalonamento dual (Nishisato,
Machine Translated by Google

Análise de correspondência (CA) 465

1980) e análise de homogeneidade (Meulman, 1982), embora seja conhecido em francês como
analise fatorial das correspondências (Cordier, 1965; Escofier-Cordier, 1969).

A análise de correspondência de contingência foi proposta pela primeira vez para analisar tabelas de tabelas
de contingência bidirecionais (Seção 6.2). Nessas tabelas, os estados de um primeiro descritor (linhas) são
comparados aos estados de um segundo descritor (colunas). Os dados em cada célula da
Frequências tabela são frequências, ou seja, números de objetos codificados com uma combinação de
estados dos dois descritores. Essas frequências são inteiros positivos ou zeros. A aplicação
mais comum da CA em ecologia é a análise da composição da comunidade (presença-ausência
de espécies ou valores de abundância) em locais de amostragem (Subseção 9.2.4). As linhas
e colunas da tabela de dados correspondem a locais e espécies, respectivamente. Tal tabela é
análoga a uma tabela de contingência porque os dados são frequências.

Em geral, a análise de correspondência pode ser aplicada a qualquer tabela de dados que
seja dimensionalmente homogênea, o que significa que as dimensões físicas de todas as
variáveis são as mesmas (Capítulo 3) e que não contém valores negativos (ou seja, apenas
números inteiros ou zeros positivos são permitidos) . Os valores devem ser aditivos em linhas
e colunas (aditividade: consulte a Subseção 1.4.2) para permitir o cálculo das somas de linhas
colunas e a transformação Q da tabela de dados eme matriz
(eq. 9.24). Os dados de frequência têm
essas características. A distância ( D16, eq. 7.55), que é um coeficiente que exclui zeros
duplos, é usada para quantificar as relações entre linhas e colunas no CA (Tabela 9.1).

A análise de correspondência também pode ser realizada em tabelas de contingência que


comparam dois grupos de descritores. O método é então chamado de análise de correspondência
Múltiplas múltipla (MCA). Por exemplo, as linhas da tabela podem ser espécies diferentes, cada uma
dividida em algumas classes de abundância, e as colunas, diferentes descritores do ambiente
físico com, para cada uma, um número de colunas igual ao número de seus estados. Cada site
correspondências análise
(objeto) então contribui para várias frequências da tabela, mas isso não invalida os resultados
por causa das transformações descritas na próxima subseção. A análise pode ser feita usando
uma função CA padrão. Também existem programas especiais e funções R para MCA, que
não são descritos mais adiante nesta seção. Para uma tabela de espécies × variáveis
ambientais, uma maneira melhor de comparar espécies com dados ambientais é a análise de
correspondência canônica (CCA, Seção 11.2), que não exige que as espécies e os dados
ambientais sejam recodificados em algumas classes.

A análise de correspondência é principalmente um método de ordenação. Como tal, é


semelhante à análise de componentes principais; ele preserva, no espaço dos eixos principais
(ou seja, após a rotação), a distância euclidiana entre perfis de condicional ponderada
probabilidades. Isso é equivalente a preservar a (2 distância (D16, eq. 7.55) entre as linhas ou
colunas da tabela de contingência. As relações entre a análise de correspondência e a análise
de componentes principais serão descritas em mais detalhes em
as próximas subseções.
Machine Translated by Google

466 Ordenação em espaço reduzido

1 — Computação

Esta descrição da análise de correspondência prosseguirá em três etapas. (1) A tabela de contingência
(ou composição da comunidade) será transformada em uma tabela de contribuições para a estatística
qui-quadrado de Pearson após o ajuste de um modelo nulo aos dados de frequência. (2) A tabela de
dados transformada será decomposta para obtenção dos autovalores e autovetores, como no PCA. (3)
Outras operações com matrizes levarão às várias tabelas necessárias para traçar diagramas úteis. Além
de seu papel como método de ordenação, o CA pode ser usado para estudar as proximidades entre as
linhas (ou as colunas) de uma tabela de contingência, bem como a correspondência entre linhas e
colunas como na Seção 6.4.

Considere uma tabela de contingência com r linhas ec colunas, como na Seção 6.2. Suponha que a
tabela seja escrita de forma que r ' c; a tabela pode ser transposta para atender a essa condição, pois
as linhas e colunas de uma tabela de contingência desempenham papéis idênticos.
O simbolismo é o seguinte:

• As frequências absolutas são representadas por fij e as relativas (“probabilidades” ou “proporções”)


por pij.

• pij é a frequência fij na célula ij dividida pela soma f++ dos fij's ao longo do todo
mesa. A tabela contendo as frequências relativas pij é denominada Q; seu tamanho é (r×c).

• O peso atribuído à linha i é pi+ = fi+/f++, onde fi+ é a soma dos valores da linha i. O vetor [pi+] tem
tamanho r = número de linhas.

• Da mesma forma, o peso atribuído à coluna j é p+j = f+j /f++, onde f+j é a soma dos valores da coluna
j. O vetor [p+j] é de tamanho c = número de colunas.

As etapas de cálculo são as seguintes:

Transforme a tabela de dados. — A estatística qui-quadrado de Pearson, (valores2 (eq. 6.5), é 1.


valor quadrado (ij é o P , calculados para cada célula ij da tabela de contingência. Cada soma do
(ij . resíduo padronizado de uma frequência fij após ajustar um modelo nulo à tabela de contingência
A O modelo nulo afirma que não há relação entre as linhas e colunas da tabela (eq. 6.4). A álgebra
simples mostra que o componente de (ij cada célula (eq. 6.26) é: para


Componente Oij Eij - =
= ------------------- pij pi+p+ j
--------------------------
(eu j f++ (9.23)
do qui-quadrado
Eij pi+p+ j

Q neste livro:
A análise de correspondência é baseada em uma matriz chamada (r×c)


= pij pi+p+ j
= --------------------------
Q qij [ ] (9.24)
pi+p+ j
Machine Translated by Google

Análise de correspondência (CA) 467

valores , que estão na base da análise de correspondência, diferem apenas da (eu j


valores qij pela constante numérica f++ qij :=/ . Essa diferença faz com que todos os
(i f++
autovalores sejam menores ou iguais a 1, conforme mostrado abaixo. Os valores também
qij podem ser
calculados diretamente dos fij's:


fijf++ fi+f+ j
= --------------------------------
qij (9.25)
f++ fi+f+ j

2
Inércia total ,a)inércia
soma dos quadrados de todos os valores na matriz Q qij ,A
mede total em Q É também igual à
Q . soma de todos os autovalores a serem extraídos pela autoanálise de .

SVD 2. Decomposição de . Q — Decomposição de valor singular (SVD, eq. 2.31) pode ser com o
aplicado à matriz Q em , seguinte resultado (o simbolismo é ligeiramente modificado
comparação com a Seção 2.11):

Q (r×c) = (r×c) W(diagonal, c×c) U'(c×c)


VOCÊ
(9.26)

Uˆ onde ambos U e são matrizes ortonormais (ou seja, matrizes contendo vetores coluna que são
normalizados e ortogonais entre si; Seção 4.4) e W é uma matriz diagonal D(wi ). Os valores diagonais
wi em W, que são todos não negativos, são Q os valores singulares de .

Porque Q UˆWU'
= (eq. 9.26), a multiplicação Q'Q dá o seguinte
resultado:

Q'Q (c×c) = UW' ( ˆ Uˆ


VOCÊ' ) W U' (9.27)
ˆ
Como éUˆ ˆ Uˆ
ortonormal, VOCÊ' = Uˆ U' = eu por isso:
,

Q'Q = U W'W U' (9.28)

A Equação 2.28 mostra que os autovalores (formando a matriz diagonal !) e os autovetores (matriz U)
de uma matriz quadrada A obedecem à relação:

A = U!U–1

Se os vetores em U forem normalizados, como aqui, U é uma matriz ortonormal com a propriedade
U–1 = U'. Como consequência, a eq. 2.28 pode ser reescrita como

A = U!U' (9.29)

Segue-se que a matriz diagonal [W'W], que contém valores singulares quadrados em sua diagonal, é
a matriz diagonal !(c×c) dos autovalores de Q'Q . Da mesma forma, a matriz ortonormal U das eqs.
9.27 e 9.28 é igual à matriz U da eq. 9.29; é a matriz de autovetores de Q'Q (c×c), contendo as cargas
das colunas da tabela de contingência.Um raciocínio semelhante aplicado à matriz QQ' (r×r) mostra
que o
Machine Translated by Google

468 Ordenação em espaço reduzido

matriz ortonormal Uˆ produzida


A pela decomposição em valores singulares é a matriz dos
autovetores QQ' de , contendo as cargas das linhas da tabela de contingência.

A relação entre a eq. 9.26 e a decomposição de autovalores (eq. 2.22) é a mesma que na
análise de componentes principais (Subseção 9.1.9). Antes da decomposição de valores próprios,
uma cruzados é calculada. Isso é semelhante
matriz quadrada Q'Q de somas de quadrados e produtos
ao uso da matriz de somas de quadrados e produtos cruzados Y'Y para decomposição de autovalor
em PCA; Y'Y é a matriz de covariância S multiplicada pela constante (n – 1). No PCA, a matriz Y foi
centrada nas médias das colunas antes de calcular Y'Y enquanto, noQCA, a matriz é centrada pela
operação (Oij – Eij) (eqs. 9.23 e 9.24). Apesar desta operação de centralização, as somas das linhas
Q colunas deenão são iguais a zero.

análise Resultados idênticos aos de SVD seriam obtidos aplicando autovalores que decomporiam
própria 9.1) ou a matriz de covariância produziria as matrizes de autovalores ! e Q'Q , (eqs. 2.22 e
autovetores U, ou à matriz QQ' , qual
Uˆ forneceria as matrizes de autovalores ! e autovetores. Na verdade, Uˆ não é necessário
repetir a autoanálise para obter U e , porque:

Uˆ !–1/2 (r×c) = QU (9h30)

e U(c×c) = Q'Uˆ !–1/2 (9.31)

Na sequência, todas as matrizes derivadas de U ficarão sem chapéu e todas as matrizes


derivadas de Uˆ terão um chapéu.

A decomposição de valor singular da matriz Q , ou análise de autovalor da matriz Q'Q ,


sempre produz um autovalor nulo. Isso se deve à centralização na eq. 9.24, onde (pi+p+j ) é
subtraído de cada valor pij. O número de autovalores positivos é min(r – 1, c – 1). Assim,
quando r ' c, existem (c – 1) autovalores positivos. A parte da matriz U que é considerada para
interpretação é de tamanho c × (c – 1); da mesma forma, a parte de Uˆ considerada é de
tamanho r × (c – 1).

A análise, por SVD ou decomposição de autovalor, é geralmente realizada na matriz Q com


r ' c, por conveniência. A razão é que nem todos os programas SVD podem lidar com matrizes
com r < c (a função svd() de R não apresenta esse problema). Além disso, ao usar a
autoanálise, a computação é mais curta quando realizada na menor das duas matrizes de
covariância possíveis, ambas as soluções levando a resultados idênticos. Se procedemos de
uma matriz tal que r < c, os primeiros autovalores r – 1 são os mesmos que na análise da matriz
transposta, sendo os restantes autovalores nulos.

Considere agora a matriz não centrada (r×c)Q˜na qual (pi+p+j ) não é subtraído
de cada termo pij no numerador:

= = pij
-------------------- fij
= -------------------
Q˜ q˜ij [] (9.32)
pi+p+ j fi+f+ j
Machine Translated by Google

Análise de correspondência (CA) 469

O que acontece se a análise for baseada na matriz em Q˜ P A única diferença é


vez de (eq. 9.24)?
que a decomposição de produz um autovalor Q˜ extra; todos os outros resultados são idênticos.
Esse autovalor extra é fácil de reconhecer porque seu valor é 1 na análise de correspondência.
Este autovalor não tem sentido porque reflete apenas a distância entre o centro de massa dos
pontos de dados no espaço de ordenação e a origem do sistema de eixos. Em outras palavras,
reflete a falta de centralização da dispersão dos pontos na origem (Hill, 1974); não explica nada
da dispersão (Lebart & Fénelon, 1971). Existem programas de computador que não fazem a
centralização; nesse caso, o primeiro autovalor (&1 = 1) e o autovetor devem ser descartados.
Todos os programas que realizam os cálculos na matriz produzem um autovalor menor que
min[r, c]; se a tabela de dados Q é tal queQr ' c, a análise de correspondência produz (c – 1)
autovalores positivos e não nulos.

Alternativamente, o que acontece se a análise for baseada na matriz de (ij valores


(eq. 9.23) em vez de matriz ? Como Q os valores (ij = f++ qij , segue-se que o total
2 f++ ( )
variância na matriz [(ij] é maior que o da matriz por um fator, Q
portanto, todos f++ = ;
os autovalores obtidos analisando a matriz [(ij] são maiores que os de por Uˆ . Os autovetores Q
um fator normalizados nas matrizes U e permanecem inalterados .f ++ Quando a análise é
,
realizada na matriz Q todos os autovalores são menores ou iguais a 1, o que é conveniente.

3. Calcular matrizes para biplots. — Matrizes U e podem ser usadas para plotar as posições
VOCÊ

Biplot dos vetores linha e coluna em dois diagramas de dispersão separados. Para biplots, que são
gráficos conjuntos dos vetores de linhas e colunas, várias escalas foram propostas. Primeiro, as
matrizes U e podem ser ponderadas pelo inverso das raízes quadradas dos pesos das colunas
VOCÊ

e das linhas, escritas em matrizes diagonais D(p+j ) –1/2(tamanho c × c) e D(pi+) –1 /2(tamanho


r × r), respectivamente:

–1/2
V(c×c) = D(p+j ) você (9.33)

–1/2
Vˆ (r×c) = D(pi+) VOCÊ
(9.34)

Descartando o autovalor nulo, a parte da matriz V a considerar para interpretação é de tamanho


Vˆ c × (c – 1) e a parte da matriz a considerar é de tamanho r × (c – 1).

A matriz F, que dá as posições das linhas da tabela de contingência no espaço de análise


de correspondência, é obtida a partir da matriz transformada de autovetores V, que dá as
posições das colunas nesse espaço. Isso é feito aplicando a equação usual para pontuações de
componentes (eq. 9.4) à matriz de dados Q, com divisão pelos pesos das linhas:

F(r×c) = !1/2 Vˆ (9.35a)

ou F(r×c) = D(pi+) –1QV (9.35b)


Machine Translated by Google

470 Ordenação em espaço reduzido

Fˆ ,
Da mesma forma, a matriz que dá as posições das colunas da tabela de contingência no espaço de análise de
correspondência, é obtida a partir da matriz de autovetores transformada Vˆ , que dá as posições das linhas nesse
espaço. A equação é a mesma acima, exceto que a divisão aqui é pelos pesos da coluna:

Fˆ (c×c) = V!1/2 (9.36a)

ou –1 Q'Vˆ (9.36b)
Fˆ (c×c) = D(p+j )

Descartando o autovalor nulo, a parte da matriz F a considerar para interpretação é de tamanho r × (c – 1) e a parte
da matriz a considerar é de tamanho c × (c – 1). ComFˆeste escalonamento, as matrizes F e V formam um par tal
que as linhas (dadas pela matriz F) estão no centróide (também chamado de centro de massa, ou “baricentro”, do
grego *+,-., Fˆ pronuncia-se “barus ”, pesada) das colunas da matriz V. Da mesma forma, as matrizes Vˆ Fˆ e
formam um par tal que as colunas (dadas pela matriz ) estão nos centróides de Vˆ as linhas da matriz

. Esta propriedade é ilustrada no exemplo numérico abaixo.

Biplots das linhas (por exemplo, sites) e colunas (por exemplo, espécies) podem ser desenhados usando
diferentes combinações de escalas de matriz descritas acima. Os tipos de escalonamento 1 e 2, descritos abaixo,
são os mais comumente usados por ecologistas ao analisar dados de composição da comunidade (ter Braak, 1990).

Escalas • Escala tipo 1. — Desenhe uma plotagem conjunta com os sítios (matriz F) nos centróides das espécies (matriz
em CA V). Para tabelas de dados sítios × espécies, este escalonamento é o mais apropriado se estiver interessado
principalmente em representar as relações de distância entre os sítios porque, na matriz F, as distâncias entre os
sítios são projeções de suas (2 distâncias (D16) (ter Braak, 1987c; ver Exemplo numérico, Subseção 9.2.2).

Fˆ • Escala tipo 2. — Desenhe uma plotagem conjunta com as espécies (matriz ) nos centróides dos sítios (matriz ).
Para tabelas de dadosVˆ
de sítios × espécies, este escalonamento é o mais apropriado se estiver interessado
principalmente em representar as relações de distância entre as distâncias entre as espécies são projeções de
numérico, Subseção 9.2.2 ). Fˆ , suas (2 espécies porque , em distâncias matriciais (consulte Exemplo

• Escalonamento tipo 3. — Este é um compromisso entre os escalonamentos 1 e 2. Este escalonamento, chamado


“simétrico” no programa CANOCO, não preserva as distâncias qui-quadrado entre as espécies ou entre os pontos
dos sítios. É obtido reunindo matrizes Vˆ Fˆ !1/4 (ou F!–1/4) para sítios e V!1/4 (ou !–1/4) para espécies.

• Escalonamento tipo 4. — Este escalonamento é útil na análise de correspondência de uma tabela de contingência
que cruza dois descritores qualitativos ou dois fatores. Desenhe um gráfico conjunto usando F, que preserva as
distâncias qui-quadrado entre as linhas e que preserva as distâncias qui-quadrado entre as colunas da Fˆ
tabela de
contingência. Essa escala híbrida representa corretamente as relações de distância qui-quadrado entre os estados
dos dois descritores qualitativos. Nesta escala, as posições relativas da linha
Machine Translated by Google

Análise de correspondência (CA) 471

e os símbolos de coluna ao longo de cada eixo do gráfico são os mesmos que na escala 3. O intervalo &k do eixo
1 4ÿ
na escala 3 multiplicado por fornece o intervalo desse
k eixo no tipo de escala 4.
Os eixos na escala 4 são assim comprimidos em comparação com os eixos correspondentes na escala 3 porque
os autovalores são sempre menores que 1 em CA. A compressão não é isotrópica, entretanto, porque os
autovalores diferem entre os eixos.

Outros métodos de escalonamento possíveis, mas menos usados, são discutidos por ter Braak (1987c, 1990).

4. Tabelas de ajuste cumulativo. — Tabelas de ajuste cumulativo para colunas e linhas podem ser calculadas
em CA, como acontecia no PCA (Subseção 9.1.3.4). A soma dos quadrados dos valores na linha j da matriz dá a
variância total da coluna (descritor) j noFˆ
espaço de ordenação multidimensional. O ajuste cumulativo relativo do
descritor j é encontrado calculando a soma dos valores quadrados para o eixo 1, eixos 1 e 2, eixos 1, 2 e 3, e
assim por diante, e dividindo-o pela variância total de j . Essa estatística representa o ajuste do descritor j em 1, 2
ou mais dimensões; pode ser interpretado como um coeficiente de determinação múltipla (R2).

A soma dos valores ao quadrado da linha i da matriz F dá o comprimento ao quadrado do vetor que representa
o objeto i no espaço de ordenação multidimensional. Use a matriz F para calcular o comprimento ao quadrado de
cada vetor de objeto i nas dimensões 1, 2, 3 … CA e divida esses comprimentos pelo comprimento quadrado total
do vetor de objeto i. Veja o exemplo na próxima subseção. Os comprimentos residuais quadrados podem ser
calculados subtraindo do comprimento de i a soma dos valores quadrados para o eixo 1, eixos 1 e 2, eixos 1, 2 e
3, etc.

2 — Exemplo numérico
O exemplo numérico a seguir ilustra os cálculos envolvidos na análise de correspondência. Este exemplo
assume que três espécies foram observadas em três lagos (Tabela 9.6)* . A justificativa para analisar os
dados de composição da comunidade por CA é fornecida na Subseção 9.2.4. A tabela de dados é de
tamanho pequeno (3 × 3) para permitir que os leitores acompanhem ou repitam os cálculos facilmente.

A matriz Q contém as proporções pij, a partir das quais as distribuições marginais das linhas e
colunas, pi+ e p+j, são computadas. Os identificadores de linha e coluna são os da Tabela 9.6:

Sp1 Sp2 Sp3 [pi+]

L1 0,10 0,10 0,20 0,40


Q = [pij] = L2 0,10 0,15 0,10 0,35
L3 0,15 0,05 0,05 0,25

[p+j ] = 0,35 0,30 0,35

* A Tabela 9.6 também pode representar uma tabela de contingência cruzando os estados de dois
descritores qualitativos, para ilustrar a CA de uma tabela de contingência. Um biplot dos resultados usaria
o tipo de escala 4 (Subseção 9.2.1.3).
Machine Translated by Google

472 Ordenação em espaço reduzido

Tabela 9.6 Exemplo numérico: uma tabela de dados local por espécie.

Espécie 1 Espécie 2 Espécie 3 Linha


(Sp1) (Sp2) (Sp3) somas

Lago 1 (L1) 10 10 20 40

Lago 2 (L2) 10 15 10 35

Lago 3 (L3) 15 5 5 25

Somas de coluna 35 30 35 100

A calculada com a eq. 9.24:


Matriz Q é

Sp1 Sp2 Sp3

– L1 0,10690– 0,05774– 0,16036


= pij pi+p+ j
= --------------------------- = L2 0,06429– 0,13887 0,06429–
Q qij []
pi+p+ j L3 0,21129 0,09129– 0,12677–

Q˜ e matriz com eq. 9.32:

Sp1 Sp2 Sp3

L1 0,26726 0,28868 0,53452


pij
Q˜ = q˜ [ij] = --------------------- = L2 0,28571 0,46291 0,28571
pi+p+ j L3 0,50709 0,18257 0,16903

Os autovalores de Q'Q são &l = 0,09613 (70,1%), &2 = 0,04094 (29,9%) e &3 = 0 (por causa da centralização).
Os dois primeiros autovalores também são autovalores de seu terceiro autovalor sendo 1 porque não
˜ Q˜é ,
Q'centrado

(eq. 9.32). Os autovetores normalizados


Q˜ de Q'Q correspondentes a &l e &2, são (em colunas): ,

(&l ) (&2)

Sp1 0,78016 0,20336–


U= Sp2 0,20383– 0,81145

Sp3 0,59144– 0,54790–


Machine Translated by Google

Análise de correspondência (CA) 473

2.0 2.0

1,5 Sp2 (a) 1,5


L2
(b)
1,0 1,0

0,5 0,5
L2 Sp2

0 0
eixo
CA
II eixo
CA
II

L1 L3 Sp3 Sp1
–0,5 Sp1 –0,5
L3
–1,0 Sp3 –1,0 L1

–1,5 –1,5

–2,0 –2,0
–2,0 –1,5 –1,0 –0,5 0 0,5 1,0 1,5 2,0 –2,0 –1,5 –1,0 –0,5 0 0,5 1,0 1,5 2,0

CA eixo I CA eixo I

Figura 9.9 Biplots de análise de correspondência. (a) Escalonamento tipo 1: as linhas da tabela de dados (lagos L1 a L3
representados por círculos, matriz F) estão nos centróides (baricentros) das colunas (espécies Sp1 a Sp3
Fˆ Vˆ
representadas por quadrados, matriz V). (b) Escalonamento tipo 2: as espécies (quadrados, matriz ) são
nos centróides (baricentros) dos lagos (círculos, matriz ).

Os autovetores normalizados de QQ' são (em colunas):

(&l ) (&2)

L1 0,53693– 0,55831–
Uˆ = L2 0,13043– 0,79561
L3 0,83349 0,23516–

O terceiro autovetor não tem utilidade e, portanto, não é fornecido. A maioria dos programas não o calcula.

No escalonamento tipo 1 (Fig. 9.9a), as linhas da matriz de dados (L1, L2 e L3 no exemplo), cujas
coordenadas serão armazenadas na matriz F, devem ser plotadas nos centróides das colunas (Sp1, Sp2 e
Sp3 no exemplo). A escala para as colunas é obtida usando a eq. 9.33:

(&l ) (&2)

Sp1 1,31871 0,34374–


–1/2 U =
V = D(p+j ) Sp2 0,37215– 1,48150

Sp3 0,99972– 0,92612–

Para colocar as linhas (matriz F) nos centróides das colunas (matriz V), a posição de cada linha ao longo de
um eixo de ordenação é calculada como a média das posições das colunas, ponderadas pelas frequências
relativas das observações nas várias colunas dessa linha. Considere a primeira linha da tabela de dados
(Tabela 9.6), por exemplo. As frequências relativas das três colunas em
Machine Translated by Google

474 Ordenação em espaço reduzido

nessa linha são 0,25, 0,25 e 0,50. A multiplicação da matriz V por esse vetor fornece as coordenadas da
primeira linha no diagrama de ordenação:

1,31871 0,34374–
[0,25 0,25 0,50] 0,37215– 1,48150 = [–0,26322 –0,17862]
0,99972– 0,92612–

Essas coordenadas colocam a primeira linha no centróide das colunas da Fig. 9.9a; eles são armazenados na
primeira linha da matriz F. As probabilidades condicionais de linha para toda a tabela de dados são encontradas
usando a operação de matriz D(pi+) –1Q, de modo que a matriz F é calculada usando a eq. 9.35b:

(&l ) (&2)

L1 0,26322– 0,17862–
F = D(pi+) –1QV = L2 0,06835– 0,27211
L3 0,51685 0,09517–

Utilizando as fórmulas das distâncias Euclidianas (D1, eq. 7.32) e (2 (D16, eq. 7.55), pode-se verificar que as
distâncias Euclidianas entre as linhas da matriz F são iguais às (2 distâncias entre as linhas da tabela de dados
original (Tabela 9.6):

L1 L2 L3

L1 0
D= L2 0,49105 0
L3 0,78452 0,69091 0

A matriz F fornece assim uma ordenação adequada das linhas da matriz de dados original (temperaturas no
exemplo numérico).

Fˆ Na escala tipo 2 (Fig. 9.9b), as colunas, cujas coordenadas serão armazenadas na matriz , são
Vˆ a eq. 9.34:
Vˆ a ser plotado nos centróides das linhas (matriz ). A escala para a matriz é obtida usando

(&l ) (&2)

L1 0,84896– 0,88276–
–1/2
Vˆ = D(pi+) VOCÊ
= L2 0,22046– 1,34482
L3 1,66697 0,47032–

Vˆ Para colocar as colunas (matrizFˆ) nos centróides das linhas (matriz ), a posição de cada coluna ao longo de
um eixo de ordenação é calculada como a média das posições das linhas, ponderada pelas frequências relativas
das observações nas várias linhas de aquela coluna. Considere a primeira coluna da tabela de dados (Tabela
9.6), por exemplo. As frequências relativas das três linhas nessa coluna são (10/35 = 0,28571), (10/35 =
0,28571) e (15/35 = 0,42857). A multiplicação da matriz por esse vetor fornece as coordenadas da primeira
coluna noVˆdiagrama de ordenação:
Machine Translated by Google

Análise de correspondência (CA) 475

0,84896– 0,88276–
[0,28571 0,28571 0,42857] 0,22046– 1,34482 = [0,40887 –0,06955]

1,66697 0,47032–

Essas coordenadas colocam a primeira coluna no centróide das linhas da Fig. 9.9a; eles são armazenados em Fˆ a
primeira linha da matriz. As probabilidades condicionais de coluna para toda a tabela de dados são Q' é calculada
–1 matriz Fˆ
encontrado através da operação matricial D(p+j ) usando , então aquela
a eq. 9.36a
ou 9.36b:

(&l ) (&2)

Sp1 0,40887 0,06955–


–1
Fˆ = V!1/2 = D(p+j ) Q'Vˆ = Sp2 0,11539– 0,29977

Sp3 0,30997– 0,18739–

Utilizando as fórmulas das distâncias Euclidianas (D1, eq. 7.32) e (2 (D16, eq. 7.55), pode-se verificar que as
Fˆ as colunas da matriz original tabela
distâncias Euclidianas entre as linhas da matriz são iguais às (2 distâncias entre
de dados (Tabela 9.6):

Sp1 Sp2 Sp3

Sp1 0
D= Sp2 0,64128 0

Sp3 0,72843 0,52458 0


Matrix, portanto, fornece uma ordenação adequada das colunas da matriz de dados original (classes de abundância
de espécies no exemplo numérico).

Para o exemplo numérico, a tabela de ajuste cumulativo por espécie (3 espécies) é de tamanho
(3 × 2) porque a solução CA tem apenas duas dimensões (ou seja, dois autovalores positivos):

Cumul. eixo 1 Cumul. eixo 2

Sp1 0,9719 1,0000

Sp2 0,1290 1,0000

Sp3 0,7323 1,0000

Na coluna que corresponde ao último autovalor, os valores são sempre 1 em CA. A tabela de ajuste cumulativo dos
objetos (3 lagos) também é de tamanho (3 × 2) neste exemplo numérico:

Cumul. eixo 1 Cumul. eixo 2

L1 0,6847 1,0000

L2 0,0594 1,0000

L3 0,9672 1,0000

As duas tabelas indicam que a espécie 2 e a lagoa 2 estão mal ajustadas ao longo do eixo 1, como pode ser
observado na Fig. 9.9, e que todas as espécies e lagoas estão perfeitamente representadas em 2 dimensões.
Machine Translated by Google

476 Ordenação em espaço reduzido

3 — Interpretação
Vˆ , das colunas e linhas da tabela de dados de
A relação entre as matrizes V e que fornecem as ordenações
espécies (ou contingência), respectivamente, é encontrada combinando as eqs. 9.30, 9.33 e 9.34 na seguinte
expressão:

–1/2 Q (9.37)
Vˆ !1/2 = D(pi+) D(p+j ) 1/2V

Vˆ Esta equação significa que a ordenação das linhas (matriz ) está relacionada com a ordenação das
colunas (matriz V), ao longo do eixo principal h, pelo valor &h que é uma medida da “correlação” entre essas
duas ordenações. O valor (1 – &h) na verdade mede a dificuldade de ordenar, ao longo do eixo principal h,
as linhas da tabela de contingência a partir de uma ordenação das colunas, ou vice-versa (Orlóci, 1978).

O autovalor mais alto (0,096 no exemplo numérico acima), ou sua raiz quadrada ( &1 0,31= ), é, portanto,
uma medida de dependência entre dois descritores não ordenados, a ser adicionada às medidas descritas
no Capítulo 6. Williams (1952) discute diferentes métodos para testar a significância de R2 = &h.

Parcelas conjuntas (por exemplo, Fig. 9.9) podem ser usadas para tirar conclusões sobre a ecologia
relacionamentos exibidos pelos dados.

• Com o tipo de escalonamento 1, (a) as distâncias entre linhas (ou sítios no caso de uma tabela de dados
de espécies × sítios) em espaço reduzido aproximam-se de (2 distâncias, e (b) as fileiras (sítios) estão nos
centróides de as colunas (espécies). As posições dos centróides são calculadas usando pesos iguais às
frequências relativas das colunas (espécies); colunas (espécies) que estão ausentes de uma linha (site) têm
pesos nulos e não contribuem para a posição de aquela linha (sítio). Assim, a ordenação das linhas (sítios) é
significativa. Além disso, qualquer linha (sítio) encontrada perto do ponto que representa uma coluna
(espécie) provavelmente terá uma alta contribuição dessa coluna (espécie); para dados binários (ou presença-
ausência de espécies), é mais provável que a linha (site) possua o estado daquela coluna (ou contenha
aquela espécie).

• No escalonamento tipo 2, são as distâncias entre as colunas (espécies) em espaço reduzido que aproximam
suas (2 distâncias, enquanto as colunas (espécies) estão nos centróides das fileiras (sítios). Conseqüentemente,
(a) a ordenação das colunas (espécie) é significativo e (b) qualquer coluna (espécie) que se encontra próxima
ao ponto que representa uma linha (local) tem maior probabilidade de ser encontrada no estado dessa linha
(local) ou com maior frequência (abundância) do que em linhas (locais) que estão mais distantes na parcela
conjunta.

Para dados de presença-ausência ou abundância de espécies, na medida em que uma espécie tem uma
curva de resposta unimodal (ou seja, em forma de sino) ao longo dos eixos de variação ecológica
correspondentes aos eixos de ordenação, o ótimo para essa espécie deve estar próximo ao ponto que a
representa em o diagrama de ordenação e sua frequência de ocorrência ou abundância devem diminuir com
a distância daquele ponto. As espécies que estão ausentes na maioria dos locais geralmente aparecem na
borda do gráfico de dispersão, perto do ponto que representa um local onde elas estão presentes - por acaso
ou porque são favorecidas por alguns
Machine Translated by Google

Análise de correspondência (CA) 477

condição rara ocorrendo naquele local. Essas espécies têm pouca influência na análise porque suas
contribuições numéricas são pequenas (somas de colunas na Tabela 9.6). Finalmente, as espécies que
estão próximas ao centro do diagrama de ordenação podem ter seu ótimo naquela área da parcela, ou ter
dois ou vários ótimos (espécies bi ou multimodais), ou então não estar relacionadas ao par de eixos de
ordenação sob consideração. Espécies do último grupo podem se expressar ao longo de algum outro eixo
ou eixos; um exame minucioso da tabela de dados brutos pode ser necessário nesse caso. São as
espécies afastadas do centro do diagrama, mas não próximas das bordas, que têm maior probabilidade
de apresentar relações claras com os eixos de ordenação (ter Braak, 1987c).

4 — Local × tabelas de dados de espécies

A análise de correspondência foi aplicada a tabelas de dados que não sejam tabelas de contingência.
A justificação é fornecida por Benzécri e col. (1973). Observe, porém, que os elementos de uma tabela a
serem analisados por análise de correspondência devem ser dimensionalmente homogêneos (isto é,
mesmas unidades físicas, para que possam ser somados), não negativos (' 0, para que possam ser
transformados em probabilidades ou proporções), e aditivo para que as somas de linhas e colunas, fi+ ef
+j, façam sentido (aditividade: ver Subseção 1.4.2). Vários tipos de dados possuem essas características,
como valores de (bio)massa, concentrações, dados financeiros (em $, € , ¥, etc.) e abundâncias de
espécies.

Outros tipos de dados podem ser recodificados para tornar os descritores dimensionalmente
homogêneos e positivos; as transformações de dados mais usadas são discutidas na Seção 1.5. Para
descritores com unidades físicas diferentes, os dados podem, por exemplo, ser padronizados (o que os
torna adimensionais; eq. 1.12) e tornados positivos por tradução, ou seja, subtraindo o valor mais negativo;
ou podem ser divididos pelo máximo ou pela faixa de valores (eqs. 1.10 e 1.11). Os dados também podem
ser recodificados em classes ordenadas. Independentemente do método, a recodificação é uma etapa
crítica da análise de correspondência. Consultar Benzécri e col. (1973) sobre este assunto.

Vários autores, mencionados no início desta seção, aplicaram a análise de correspondência para a
análise de matrizes sítio x espécie contendo dados de presença/ausência ou abundância de espécies.
Esta generalização do método é baseada no seguinte modelo de amostragem. Se a amostragem tivesse
sido projetada de forma a coletar organismos individuais (o que geralmente não é o caso, sendo os
elementos amostrados, na maioria das vezes, locais de amostragem), cada organismo poderia ser descrito
por dois descritores: o local onde foi coletado e o táxon ao qual pertence. Esses dois descritores podem
ser registrados em uma matriz de dados inflada, que possui tantas linhas quantos forem os organismos
Matriz de individuais, e duas colunas identificando o sítio e o táxon do indivíduo (descritores qualitativos). A tabela
dados inflada de dados de sítios familiares × espécies é a tabela de contingência resultante do cruzamento dos dois
descritores da matriz de dados inflada, ou seja, os sítios e táxons. Essa tabela pode ser analisada usando
qualquer um dos métodos aplicáveis às tabelas de contingência. A maioria dos métodos que envolvem
testes de significância estatística não podem ser usados, no entanto, porque a hipótese de independência
dos organismos individuais, seguindo o modelo de amostragem descrito acima, não é atendida pela
presença-ausência de espécies
Machine Translated by Google

478 Ordenação em espaço reduzido

ou dados de abundância coletados em locais de amostragem. Uma matriz de dados inflada será
usada novamente na descrição da análise de correspondência canônica, Subseção 11.2.1.

A teoria do nicho nos diz que as espécies têm preferências ecológicas, o que significa que
são encontradas em locais onde encontram condições favoráveis. Esta afirmação está enraizada
na ideia de que as espécies têm distribuições unimodais ao longo das variáveis ambientais (Fig.
9.10), mais indivíduos sendo encontrados perto de algum valor ambiental que é “ótimo” para a
espécie em questão. Isso foi formalizado por Hutchinson (1957) em seu modelo de nicho
Nicho fundamental . Além disso, o princípio de exclusão competitiva de Gause (1935) sugere que, em
sua microevolução, as espécies deveriam ter desenvolvido nichos não sobrepostos. Esses dois
princípios indicam juntos que as espécies devem ser aproximadamente igualmente espaçadas
no espaço n-dimensional de recursos. Este modelo foi usado por ter Braak (1985) para justificar
o uso de análise de correspondência em tabelas de dados de presença ou ausência; ele mostrou
que a (2 distância preservada através da análise de correspondência (Tabela 9.1) é um modelo
apropriado para espécies com distribuições unimodais ao longo de gradientes ambientais.

Sigamos o caminho percorrido por Hill (1973b), que redescobriu a análise de correspondência
ao explorar a análise da variação da vegetação ao longo de gradientes ambientais; ele chamou
Média seu método de “média recíproca” antes de perceber que isso era análise de correspondência
recíproca (Hill, 1974). Hill partiu do método mais simples de análise de gradiente, proposto por Whittaker
(1960, 1967) para analisar tabelas de dados de sítio x espécie.
A análise de gradiente utiliza uma matriz Y (sítio × espécie) e um vetor inicial v de valores vj que
são atribuídos às diversas espécies j como indicadores do gradiente físico a ser evidenciado. Por
exemplo, uma pontuação (escala de 1 a 10) pode ser atribuída a cada espécie por sua preferência
com relação à umidade do solo. Esses coeficientes são usados para calcular as posições dos
sites ao longo do gradiente. A pontuação de um sítio i é calculada como o vˆi … p) presente
média da espécie (j = 1 naquele sítio, usando a fórmula: pontuação

) yijv j
j 1=
-------------------= (9.38)
vˆi
sim+

onde yij é a abundância de espécies j no sítio i e yi+ é a soma dos organismos neste sítio (ou
seja, a soma dos valores na linha i da matriz Y).

A análise de gradiente vˆ produz um vetor das posições dos locais ao longo do gradiente em
estudo. Hill (1973b, 1974) sugeriu continuar a análise, usando agora o vetor de ordenação dos
vˆ calcular uma nova ordenação (v) das espécies:
sítios para

)
eu 1=
yijvˆi
------------------= (9.39)
vj
y+ j
Machine Translated by Google

Análise de correspondência (CA) 479


em que y+j é a soma dos valores na coluna j da matriz Y. A alternância entre v e
(dimensionando os vetores em cada etapa conforme mostrado na etapa 6 da Tabela 9.8)
define um procedimento iterativo que Hill (1973b) chamou de “média recíproca ”. Este
procedimento converge para uma única ordenação unidimensional das espécies e sítios,
independente dos valores inicialmente atribuídos aos vj 's; diferentes suposições iniciais
quanto aos valores vj podem, no entanto, alterar o número de etapas necessárias para alcançar a convergência.
Estando ciente do trabalho de Clint & Jennings (1970), Hill percebeu que havia descoberto
um método de autovetor para análise de gradiente, daí o título de seu artigo de 1973b. Ocorre
que o método de Hill produz os vetores baricêntricos v e para espécies e sítios, que vˆ

correspondem ao primeiro autovetor de uma análise de correspondência. Hill (1973b) mostrou


como calcular o autovalor (&) correspondente a essas ordenações e como encontrar os
outros autovalores e autovetores. Hill então criou um algoritmo simples, descrito na Subseção
9.2.7, para análise de correspondência.

Ao interpretar os resultados da análise de correspondência, deve-se ter em mente que a


ordenação simultânea de espécies e sítios visa determinar o quão útil é a ordenação das
espécies, como um todo, para prever a ordenação dos sítios. Em outras palavras, busca o
valor preditivo de uma ordenação em relação à outra.
A subseção 9.2.3 mostrou que, para qualquer dimensão h, (1 – &h) mede a dificuldade de
ordenar, ao longo do eixo principal h, os estados das linhas da tabela de contingência a partir
de uma ordenação dos estados das colunas, ou o inverso. A interpretação da relação entre
as duas ordenações deve ser feita com referência a esta estatística.

Quando utilizada como método de ordenação, a análise de correspondência fornece uma


ordenação dos sítios algo semelhante àquela resultante de uma análise de componentes
principais da matriz de correlação entre espécies (dados padronizados). Isso é de se esperar,
pois o primeiro passo do cálculo consiste, na verdade, em ponderar cada dado pelas somas
(ou frequências relativas) da linha e coluna correspondentes (eq. 9.24 e 9.25), o que elimina
os efeitos devidos às grandes variações que certas linhas ou colunas podem ter. No caso de
gradientes acentuados (ou seja, muitos zeros na matriz de dados), a análise de
correspondência deve produzir uma melhor ordenação do que o PCA (Hill, 1973b). Isso
também foi mostrado por Gauch et al. (1977) usando dados florísticos simulados e
observacionais. Este resultado decorre logicamente do fato de que a distância ( D16 ) é um
coeficiente que exclui zeros duplos da estimativa de semelhança. O mesmo não ocorre com
a distância euclidiana (eq. 7.32), que é a distância preservada em análise de componentes
principais. Por esta razão, a análise de correspondência é um dos métodos recomendados
na Fig. 9.8 para ordenação em espaço reduzido de abundâncias de espécies quando os
dados contêm um grande número de valores nulos; esta situação é encontrada ao amostrar
gradientes ambientais que são longos o suficiente para que as espécies substituam umas às
outras Tabelas de dados com muitos zeros podem conter espécies raras A Caixa 9.2 descreve
um procedimento para lidar com espécies raras na CA.

Conforme mencionado na Seção 8.9, para o agrupamento de espécies em associações,


a análise de correspondência não parece escapar dos problemas encontrados com a análise
de componentes principais (Reyssac & Roux, 1972; Ibanez & Séguin, 1972; Binet et al.,
1972 ) . O problema mais grave é que as espécies, que são multidimensionais
Machine Translated by Google

480 Ordenação em espaço reduzido

Espécies raras na CA Caixa 9.2

No Capítulo 7, foi mostrado que espécies raras contribuem fortemente para a distância qui-
quadrada (D16, eq. 7.55), que é a distância preservada na análise de correspondência.
A presente discussão enfoca as espécies com pequenos valores de ocorrência; eles ocorrem
apenas em uma pequena fração dos locais de estudo. Essas espécies geram um grande
número de zeros na matriz de dados. Como os zeros têm alta alavancagem, eles Q
contribuem fortemente para a inércia total da matriz (eq. 9.24). Essas espécies contribuem
muito pouco para os primeiros eixos de ordenação CA, mas são altamente visíveis em
biplots porque são encontradas na periferia do gráfico. Devemos manter espécies raras na
CA? Se não, quais devem ser eliminados?

Por um lado, os ecologistas que veem o que estão coletando (por exemplo, vegetação) podem considerar
espécies raras como potenciais indicadores de condições ambientais especiais, mas não é papel da AC mostrar
essas condições. O objetivo principal do CA é exibir os principais eixos de variação dos dados, não lidar com
exceções. Por outro lado, os ecologistas que fazem amostragem às cegas muitas vezes consideram a
ocorrência de espécies raras um evento fortuito que não deve ser fortemente ponderado na análise. No caso
de animais móveis, a presença de um animal em um local não indica que o local oferece condições favoráveis
para aquela espécie.

Métodos empíricos para reduzir o peso de espécies raras foram propostos e estão disponíveis em alguns
programas de computador, mas esses métodos carecem de fortes fundamentos ecológicos.
É melhor simplesmente eliminar as espécies mais raras da CA. O seguinte método passo a passo foi
desenvolvido por Daniel Borcard (comunicação pessoal):

• Por conveniência, ordene as espécies na tabela de dados em ocorrências crescentes ou decrescentes.


Isso facilitará a eliminação gradual das espécies com pequenos valores de ocorrência.

• Efetuar uma primeira CA. Observe a inércia total, bem como os primeiros autovalores (por exemplo, 4).

• Repita esse passo após remover a espécie com ocorrência 1; as espécies com ocorrência 1 e 2; as espécies
com ocorrência 1 a 3; e assim por diante. Após cada análise, observe a inércia total, bem como os primeiros
autovalores.

• Plote esses resultados. Um salto deve ser observado na inércia total e em alguns dos autovalores.
O salto indica que alguém foi longe demais na remoção de espécies raras. [Continua na próxima página.]

eixos-descritores, são projetados em um espaço de baixa dimensão tanto pelo PCA quanto
pelo CA. Isso explica a tendência das espécies de formar uma dispersão mais ou menos
uniformemente densa centrada na origem, exceto em situações simples. No entanto, pode ser
interessante sobrepor um agrupamento de espécies, determinado pelos métodos da Seção 8.9,
em uma ordenação em espaço reduzido obtida por análise de correspondência.
Machine Translated by Google

Análise de correspondência (CA) 481

Caixa 9.2 (continuação)

O exemplo a seguir diz respeito a dados de biomassa de peixes (47 transectos subaquáticos,
156 espécies de peixes) coletados pelos pesquisadores Pierre Labrosse e Eric Clua (Secretariado
da Comunidade do Pacífico) perto da vila de Manuka nas Ilhas Tonga, no âmbito do projeto
DemEcoFish financiado pela Fundação MacArthur (dados aqui utilizados com autorização dos autores).

6.0 0,60

5.5 Inércia total em CA 0,55

0,50
5.0
0,45 Autovalor 1
4.5 Autovalor 2
0,40
4.0 Autovalor 3
0,35
Autovalor 4
3.5 0,30

3.0 0,25
01234567 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Ocorrências de espécies removidas Ocorrências de espécies removidas

As curvas mostram que as 61 espécies com ocorrências de 1 a 4 podem ser removidas da análise
com poucos efeitos nos quatro primeiros autovalores (gráfico à direita). Estas espécies Q geram
24% da inércia na matriz (gráfico da esquerda) submetida à decomposição de autovalores em CA.

Para comparação, os mesmos dados foram submetidos ao PCA após a transformação de


Hellinger (Seção 7.7). A variância total diminuiu apenas 4,6% após a remoção das 61 espécies com
ocorrências 1 a 4 e os primeiros quatro autovalores não foram afetados pela remoção de espécies
raras. A transformação de Hellinger foi recalculada após cada etapa de remoção de espécies.

Quando sítios (objetos) e espécies (descritores) são plotados juntos, o gráfico


conjunto deve ser interpretado com cuidado. A prática que consiste em apenas associar
espécies com espécies vizinhas na parcela muitas vezes dá bons resultados, embora
possa ignorar indícios de evitação de locais por certas espécies. Um complemento
interessante para a análise de correspondência é a análise direta da tabela sítio ×
espécie pelos desvios de Freeman-Tukey e métodos de resíduos padronizados descritos
na Seção 6.4. Esses métodos são melhores para evidenciar todas as correspondências
entre locais e espécies (atração e evitação). A aplicação da análise de tabelas de
contingência às tabelas sítios × espécies justifica-se pela mesma lógica que permite a
aplicação da análise de correspondência a tais matrizes de dados.
Machine Translated by Google

482 Ordenação em espaço reduzido

5
Abundância Espécie 1 Espécie 2 Espécie 3
3

0 2 4 68 10 12 14 16 18 20
Locais de amostragem

Figura 9.10 Distribuições de três espécies em 19 locais de amostragem ao longo de um gradiente ambiental hipotético
Esses dados artificiais são encontrados na Tabela 9.7.

5 — Efeito arco e análise de correspondência sem tendência

Gradientes ambientais ou temporais geralmente suportam a sucessão espacial ou temporal


das espécies. Uma vez que as espécies que são controladas por fatores ambientais (versus
gradiente dinâmica populacional, eventos históricos etc.) não linear.

ambiental

Exemplo numérico 1. Um conjunto de dados foi criado (Fig. 9.10; Tabela 9.7) para representar as
abundâncias de três espécies hipotéticas em 19 locais ao longo de um gradiente ambiental ao longo
do qual se supõe que as espécies tenham distribuições unimodais (Whittaker, 1967).

As três espécies na Fig. 9.10 têm distribuições unimodais; cada um mostra um modo bem
definido ao longo do gradiente representado pelos sítios 1 a 19. Os métodos de ordenação
visam tornar este fenômeno não linear em um espaço euclidiano, em particular em plotagens
bidimensionais. Em tais plotagens, as não linearidades acabam sendo representadas por curvas,

Tabela 9.7 Dados artificiais ilustrados na Fig. 9.10.

Locais de amostragem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Espécie 1 1247874210000000000

Espécie 2 0000012478742100000

Espécie 3 0000000000124787421
Machine Translated by Google

Análise de correspondência (CA) 483

chamados arcos ou ferraduras, descritos no próximo parágrafo. Enquanto a maioria dos ecologistas
se contenta em interpretar os gráficos de ordenação pelas informações que exibem sobre as
distâncias entre os locais, alguns acham que deveriam tentar reconstruir o gradiente original
Fora de tendência subjacente aos dados observados. Daí a preocupação com o destrending, que é uma operação
realizada sobre os eixos de ordenação da análise de correspondência. Nessa operação, o arco é
dobrado para exibir o gradiente como um arranjo linear dos locais.

As distâncias euclidianas calculadas nos dados de espécies da Fig. 9.10, entre o sítio 1 e os
sítios 2, 3, etc., não aumentam monotonicamente de uma extremidade do gradiente para a outra.
Essas distâncias formam a primeira linha da matriz de distância euclidiana entre os sítios; eles
são relatados na primeira linha da Tabela 9.11 na Subseção 9.3.5. As distâncias do ponto 1
aumentam até o ponto 5, após o que diminuem; eles aumentam novamente até o local 10, depois
diminuem; eles aumentam até o local 15 e diminuem novamente. As outras linhas da matriz de
distância euclidiana exibem padrões igualmente complexos; eles não são mostrados na Tabela
9.11 para economizar espaço. Um algoritmo PCA enfrenta a tarefa de representar esses padrões
complexos em no máximo três dimensões porque as ordenações PCA não podem ter mais eixos
do que o número de variáveis originais (ou seja, três espécies na Fig. 9.10). O resultado é ilustrado
na Fig. 9.11, painéis a e b. O efeito mais dramático é encontrado nas extremidades do transecto,
que são dobradas para dentro ao longo do eixo I. Isso ocorre porque a fórmula de distância
euclidiana considera os locais extremos muito próximos uns dos outros (pequenas distâncias
Ferradura devido a zeros duplos para a espécie 2) . Esta forma é chamada de ferradura.
A Figura 9.11b mostra que os sites finais também “descem” ao longo do terceiro eixo. Na análise
de correspondência, ao contrário, as extremidades do gradiente não são, na maioria dos casos,
dobradas para dentro do gráfico (mas ver Wartenberg et al., 1987, Fig. 3, para um caso em que
isso ocorre); um gráfico de ordenação dobrado com extremidades não dobradas para dentro é
Arco chamado de arco, por exemplo, Fig. 9.11c.

A presença em parcelas de ordenação de arco (Swan, 1970), ferradura (Kendall, 1971) ou


arco (Gauch, 1982) já havia sido notada pelo ecologista Goodall (1954).
Benzécri e col. (1973) discutem o arco sob o nome de efeito Guttman. Vários autores explicaram
a natureza dessa construção matemática, que ocorre quando a composição de espécies dos
locais muda progressivamente ao longo de um gradiente ambiental. A análise de correspondência
sem tendência sem tendência (DCA; Hill & Gauch, 1980; Gauch, 1982) visa eliminar o efeito arco.
CA (DCA)

A Figura 9.11c ajuda a entender o significado dos gráficos de juntas CA. Este gráfico conjunto
foi produzido usando o tipo de escala 1 para preservar as (2 distâncias (D16) entre os sites; nesse
aspecto, esse gráfico é comparável à ordenação PCA mostrada na Fig. 9.11a. A ordenação é
bidimensional, pois os dados conjunto contém apenas três espécies. As espécies (quadrados
pretos) ocupam as bordas de um triângulo; linhas grossas são desenhadas para materializar suas
distâncias ao centro da parcela. Sítios 1-5, 10 e 15-19, que possuem apenas um espécies
presentes, ocupam a mesma posição que o ponto que representa aquela espécie porque os sítios
estão nos baricentros (centróides) das espécies; CA não espalha sítios que possuem uma única e
mesma espécie, mesmo que em quantidades diferentes.
Os sítios 6-9 e 11-14, que possuem duas espécies em várias combinações, situam-se em uma
linha entre as duas espécies; suas posições ao longo dessa linha dependem da relativa
Machine Translated by Google

484 Ordenação em espaço reduzido

8,0 6.0
PCA ou PCoA 10 PCA ou PCoA
(distância = D1)
(a) (distância = D1)
(b)
6.0 4.0
9 11

5 15
4.0 2.0 6 14
10
9 11
4 7 13 16
PCA
eixo
II
8 12
2.0 0,0
PCA
eixo
III

8 12
3 17
7 13
0,0 -2,0
2 18

1 19 1 19
6 2 18 14
-2,0 -4,0
3 17

4 16
5 15
-4,0 -6,0
-6,0 -4,0 -2,0 0,0 2,0 PCA 4.0 6.0 -6,0 -4,0 -2,0 0,0 2,0 PCA eixo I 4.0 6.0
eixo I

2.0 2.0
CA ou PCoA DCA, sem tendência por
(distância = D16) 10
(c) polinômio quadrático
(d)
1,5 1,5
Esp. 2 Esp. 2

9 11
1,0 1,0

8 12
eixo
CA
II

0,5 DCA
eixo
II

0,5
10
1a5 15 a 19
7 13 9 11
0,0 0,0
6 8 12 14

7 13
-0,5 6 14 -0,5

Esp. Esp. Esp. 1 Esp. 3


11a5 3 15 a 19
-1,0 -1,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 -1,5 -1,0 -0,5 0,0 0,5 DCA 1,0 1,5
CA eixo I eixo I

Figura 9.11 Ordenações dos dados da Fig. 9.10 e Tabela 9.7. Os círculos são locais e os quadrados nos painéis c e d
são espécies. Análise de componentes principais, escala 1: (a) PCA eixos I e II (&1 = 50,1%, &2 =
40,6%), (b) eixos I e III (&1 = 50,1%, &3 = 9,3%). (c) Análise de correspondência, escala 1, CA eixos I
e II (&1 = 58,1%, &2 = 41,9%). Uma função polinomial quadrática do eixo I também é mostrada (curva
convexa): (eixo II) = 1,056 – 1,204 (eixo I)2 . (d) Análise de correspondência sem tendência
(escalonamento tipo 1, desalinhamento por polinômio quadrático), eixos DCA I e II (&1 = 58,1%, &2 =
1,6%). (c) e (d) Linhas em negrito desenhadas a partir dos centros das parcelas representam os eixos das espécies.

abundância das duas espécies em cada local. Nenhum site tem três espécies neste exemplo, de
modo que nenhum ponto está dentro da forma triangular da dispersão de sites. Considerando o local
1 (canto inferior esquerdo na Fig. 9.11c), examine suas distâncias (D16) para todos os outros locais
na última linha da Tabela 9.11: elas aumentam do local 6 para 10, após o que permanecem constantes.
Isso corresponde às posições relativas dos sites na figura. Se o exemplo contivesse mais espécies,
os pontos do site teriam exibido uma forma arredondada.
Machine Translated by Google

Análise de correspondência (CA) 485

2.0 2.0

(a) (b)
1,5 10 1,5

9 11
1,0 1,0
8 12
7 13
eixo
CA
II
0,5
/ eixo
CA
II

0,5 10

6 9 11 14
7 13
0,0 0,0

1a5 15 a 19
-0,5 6 14 -0,5 8 12

1a5 15 a 19
-1,0 -1,0
-1,5 -1,0 -0,5 0,0 0,5 CA 1,0 1,5 -1,5 -1,0 -0,5 0,0 0,5 CA 1,0 1,5
eixo I eixo I

Figura 9.12 Desencadeando tendências por segmentos. (a) Três segmentos definidos arbitrariamente são delimitados por
linhas verticais na ordenação CA (da Fig. 9.11c). (b) Após a retirada da tendência, a média dos pontos em
cada segmento é zero.

Duas abordagens foram propostas para remover arcos na CA, produzindo


análise de correspondência: determinação de tendências por segmentos e por polinômios.

1. Na destendência por segmentos (Hill & Gauch, 1980), o eixo I é dividido em uma série de segmentos
e, dentro de cada um, a média das pontuações ao longo do eixo II é igualada a zero; em outras palavras, os
pontos de dados em cada segmento são movidos ao longo do eixo II para fazer sua média coincidir com a
abcissa. A Figura 9.12b mostra o resultado do desvio da ordenação da Fig. 9.11c usando os três segmentos
definidos na Fig. 9.12a.
O ponto principal é que as pontuações ao longo do eixo II sem tendência não têm sentido. Proximidades entre
pontos não devem, em nenhum caso, ser interpretadas ecologicamente, porque a segmentação gera grandes
diferenças nas pontuações para pontos que estão próximos uns dos outros na ordenação original, mas que
estão em ambos os lados das divisões do segmento (Fig. 9.12). O número de segmentos é arbitrário; diferentes
segmentações levam a diferentes ordenações ao longo do eixo II.

O método é usado apenas com um número razoavelmente grande de segmentos. Os programas


DECORANA (Hill, 1979b) e CANOCO usam um mínimo de 10 e um máximo de 46 segmentos, sendo 26 o
valor padrão que os usuários geralmente consideram o número 'recomendado'. Isso requer um número de
pontos de dados maior do que o da Fig. 9.10.

Para lidar com a contração das extremidades do gradiente quando os locais são projetados no primeiro
eixo, o redimensionamento não linear dos eixos é frequentemente realizado após a eliminação de tendência.
Um caso extremo é representado pela Fig. 9.11c, onde os sítios 1 a 5 e 15 a 19 ocupam cada um um único
ponto ao longo do eixo I. Para equalizar as larguras das curvas de resposta das espécies, o eixo é dividido
em pequenos segmentos e segmentos com pequenos dentro As variações de grupo são expandidas,
enquanto os segmentos com grandes variações dentro do grupo são contraídos (Hill, 1979b). A Figura 5.5
de ter Braak (1987c) fornece uma boa ilustração do processo; ter Braak (1987c) desaconselha o uso
rotineiro de redimensionamento não linear.
Machine Translated by Google

486 Ordenação em espaço reduzido

Após a destendência por segmentos e reescalonamento não linear dos eixos, a ordenação DCA tem a
propriedade interessante de que os eixos são redimensionados em unidades do desvio padrão médio (DP) da
rotatividade das espécies (Gauch, 1982). Ao longo de um gradiente regular, uma espécie aparece, atinge seu
valor modal e desaparece em uma distância de cerca de 4 DP; da mesma forma, ocorre uma mudança completa
na composição das espécies, ao longo dos sítios, em cerca de 4 unidades SD. Uma meia mudança na
composição de espécies ocorre dentro de cerca de 1 a 1,4 unidades SD. Assim, o comprimento do primeiro eixo
Comprimento DCA é uma medida aproximada do comprimento do gradiente ecológico, medido em unidades de renovação de
do gradiente espécies. A este respeito, DCA com redimensionamento não linear dos eixos é um método útil para estimar os
comprimentos de gradientes ecológicos. O comprimento de um gradiente revelado por um estudo piloto pode
ajudar a determinar a extensão (Seção 13.0) a ser dada a um estudo subseqüente em grande escala.

2. Detendência por polinômios (Hill & Gauch, 1980; ter Braak, 1987c) decorre diretamente
do fato de que um arco é produzido quando um gradiente de comprimento suficiente está
presente nos dados. Quando um número suficiente de espécies está presente e se substitui
ao longo do gradiente, o segundo eixo CA se aproxima de uma função quadrática do primeiro
(ou seja, um polinômio de segundo grau), e assim por diante para os eixos subsequentes.
Este claramente não é o caso dos dados da Tabela 9.7, que consistem em apenas três espécies.
A Figura 9.11c mostra que o 'arco' é reduzido a uma forma triangular nesse caso.

O efeito de arco é removido impondo, no algoritmo CA, a restrição de que o eixo II não seja correlacionado
apenas com o eixo I (procedimento de ortogonalização na Tabela 9.8), mas também com seu quadrado, seu
cubo e assim por diante; o grau da função polinomial é escolhido pelo usuário. Da mesma forma, o eixo III é
desassociado do 1º, 2º, 3º … k-ésimo polinômio de grau dos eixos I e II. E assim por diante. Quando se busca a
eliminação de tendências, a eliminação de tendências por polinômio é um método atraente. O resultado é uma
função contínua dos eixos anteriores, sem as descontinuidades geradas pela desalinhamento por segmentos.
No entanto, a detendência por polinômios impõe um modelo específico aos dados, de modo que o sucesso da
operação depende de quão próximo o modelo polinomial corresponde aos dados. Detendência por polinômio
não resolve o problema de compressão dos sítios nas extremidades dos eixos de ordenação.

Detendência por polinômio quadrático foi aplicada aos dados de teste. A Figura 9.11c mostra o polinômio
quadrático (curva convexa; entre os termos do polinômio quadrático, apenas o termo (eixo I)2 foi significativo)
que foi ajustado à ordenação CA, que tem forma triangular no presente exemplo. Detendência envolve calcular
e plotar as distâncias verticais (residuais) entre os pontos de dados e o polinômio ajustado. A ordenação sem
tendência é mostrada na Fig. 9.11d. Os resíduos da regressão exibem uma forma elegante, mas sem sentido,
ao longo do eixo II.

A controvérsia sobre o destrending se alastrou na literatura por mais de 10 anos.


Os principais artigos são os de Wartenberg et al. (1987), Peet et ai. (1988) e Jackson &
Somers (1991b). Wartemberg et ai. (1987) argumentaram que o arco é um atributo importante
e inerente das distâncias entre os sítios, não um artefato matemático. O único efeito do DCA
é nivelar a distribuição dos pontos no eixo I sem afetar a ordenação dos locais ao longo
desse eixo. Eles também apontaram que a eliminação de tendências por segmentos é um
método arbitrário para o qual nenhuma justificativa teórica foi oferecida. Da mesma forma, o
procedimento de reescalonamento não linear assume que, em média, cada espécie aparece
e desaparece na mesma taxa ao longo do transecto e que a variância paramétrica é uma
medida adequada dessa taxa; essas suposições não foram comprovadas. Apesar dessas
críticas, Peet et al. (1988) ainda apoiava o DCA com base no fato de que a redução da tendência
Machine Translated by Google

Análise de correspondência (CA) 487

e o reescalonamento pode facilitar a interpretação ecológica. Jackson & Somers (1991b)


mostraram que a ordenação DCA dos locais varia muito com o número de segmentos que se
decide usar arbitrariamente, de modo que a interpretação ecológica dos resultados pode variar
amplamente, assim como as correlações que se podem calcular com as variáveis ambientais.
Deve-se sempre tentar diferentes números de segmentos se decidir usar DCA.

Estudos de simulação envolvendo DCA foram conduzidos em dados artificiais representando


respostas de espécies unimodais a gradientes ambientais em uma (cenoclinal) ou duas
(cenoplanos) dimensões, seguindo o método pioneiro de Swan (1970). Kenkel & Orlóci (1986)
relatam que o DCA não teve um desempenho particularmente bom na recuperação de
gradientes complexos. Usando as estatísticas de Procrustes (Subseção 11.5.2) como medidas
de recuperação da estrutura, Minchin (1987) mostrou que o DCA não teve um bom desempenho
com modelos de resposta complexos e esquemas de amostragem não regulares. Ambos os
estudos concordaram que o nMDS (Seção 9.4) era um método melhor do que o DCA para
recuperar gradientes complexos.

As evidências atuais indicam que a despromoção deve ser evitada, exceto para o propósito
específico de estimar os comprimentos dos gradientes; tais estimativas permanecem sujeitas à
condição de que as premissas do modelo sejam verdadeiras. Em particular, DCA deve ser
evitado ao analisar dados que representam gradientes ecológicos complexos. A maioria das
técnicas de ordenação é capaz de recuperar gradientes ambientais simples e unidimensionais.
Quando há um único gradiente nos dados, a retirada de tendência é inútil, pois o gradiente é
bem representado pelo eixo CA I.

Soluções matemáticas satisfatórias para o problema de desalinhamento ainda precisam ser


encontradas. Entretanto, os resultados da ordenação devem ser interpretados com cautela e
considerando o tipo de distância preservada por cada método.

6 — Aplicações ecológicas

Aplicação ecológica 9.2a

Os dados de aranhas (28 locais × 12 espécies) de Aart & Smeenk-Enserink (1975) que foram analisados pela
análise de componentes principais (PCA) no aplicativo ecológico 9.1a são reanalisados aqui pela análise de
correspondência (CA). A Figura 9.13 apresenta dois biplots CA (tipos de escala 1 e 2) obtidos para esses
dados. Compare os grupos de espécies e as ordenações dos locais com o biplot PCA apresentado na Fig. 9.6b
(dados log-transformados).

Aplicação ecológica 9.2b

Cadoret et ai. (1995) investigaram a composição de espécies (presença/ausência e abundância) de grupos de


peixes chaetodontídeos na Ilha de Moorea, Polinésia Francesa, a fim de descrever a distribuição espacial dos
peixes-borboleta e determinar suas relações com grupos de organismos bentônicos. A amostragem foi realizada
em quatro áreas ao redor da ilha: (a) Baía de Opunohu, (b) Baía de Cook, (c) Tiahura atravessando o recife na
parte noroeste da ilha, e (d) Afareaitu atravessando o recife em a parte oriental da ilha.

A análise de correspondência (Fig. 9.14) mostrou que as assembleias de peixes responderam aos principais
gradientes ambientais que caracterizaram os locais de amostragem. Para as áreas c e d (transectos através do
recife), o eixo I correspondeu a um gradiente da linha de costa para o oceano; da esquerda para a direita, em
Machine Translated by Google

488 Ordenação em espaço reduzido

Figura 9.13 Biplots de análise de correspondência dos dados do spider. (a) Escalonamento tipo 1: os sítios (círculos sólidos)
estão nos centróides das espécies (quadrados abertos). (b) Escalonamento tipo 2: as espécies (quadrados
abertos) estão nos centróides dos sítios (círculos sólidos). Abreviações de espécies: ver Fig. 9.6.
Machine Translated by Google

Análise de correspondência (CA) 489

a11 Áreas
4 a12 a

b
3 c
a13
d
2
b43
eixo
CA
II

c8
b22 d10
1
a23 a43
a42 a22, b33 d9
c5
b23 b41
0 c4, d4
a21 d2 b32
d3 b31 c6 d8
a33
d5,b42
–1 a31
b11 b12c3 c7d7
b21
c1,c2,d1 a32 b13 a41 d6
–2
–2 –1,5 –1 –0,5 0 0,5 1 1,5 2 2.5
CA eixo I

Figura 9.14 Análise de correspondência (CA): ordenação dos locais de amostragem em relação aos eixos I e II a partir de
observações de presença/ausência de peixes-borboleta (21 espécies) em quatro áreas (símbolos diferentes)
ao redor da Ilha de Moorea. Os eixos I e II explicam juntos 29% da variação entre os sites. As espécies não
são desenhadas; eles teriam sobrecarregado o enredo. Modificado de Cadoret et al. (1995).

o lote, são os locais do recife em franja, os baixios (encontrados apenas no setor c), o recife de barreira e o
talude externo. Os sites das baias (áreas aeb) também são encontrados na parte esquerda do gráfico. O Eixo
II separa os sítios localizados na parte superior da Baía de Opunohu (a11, a12 e a13, no canto superior
esquerdo do lote) de todos os outros. Esta aplicação será desenvolvida, na Subseção 11.2.2, para identificar
assembleias de espécies e evidenciar as relações entre espécies e variáveis ambientais, usando análise de
correspondência canônica.

Aplicação ecológica 9.2c

Em um estudo sobre a dinâmica da vegetação do sul de Wisconsin, Sharpe et al. (1987) realizaram um
levantamento de campo sistemático de todas as áreas florestais em dois municípios. A análise de
correspondência de tendência foi usada para exibir as relações entre os povoamentos com relação à
composição de espécies. As pontuações dos primeiros eixos de ordenação foram utilizadas para construir
mapas tridimensionais. No mapa do primeiro eixo (Fig. 9.15), os escores foram geralmente baixos nas
porções sul e central da área, e aumentaram em direção ao oeste e norte. Uma vez que o primeiro eixo
mostrou uma tendência de áreas florestais dominadas por Acer saccharum para florestas dominadas por
carvalhos (não mostradas), a Fig. 9.15 indica que povoamentos dominados por A. saccharum estavam
localizados na porção centro-sul da área, enquanto carvalhos as arquibancadas dominadas estavam a oeste,
norte e, em menor grau, leste. Esse mapeamento, usando uma representação tridimensional ou bidimensional,
costuma ser uma maneira útil de exibir informações sintéticas fornecidas pelas pontuações de objetos ao longo dos primeiros eixos
Machine Translated by Google

490 Ordenação em espaço reduzido

0
E1
N
Figura 9.15 Mapa tridimensional dos escores do primeiro eixo de ordenação (análise de correspondência de tendência),
baseado em árvores observadas em 92 trechos florestais do sul de Wisconsin, EUA (área de
levantamento: 11 × 17 km). Modificado de Sharpe et al. (1987).

Mapas como o exibido na Fig. 9.15 podem ser produzidos para as pontuações de ordenação
calculado por qualquer um dos métodos descritos no presente capítulo; consulte a Seção 13.2.

7 — Algoritmos
Existem vários programas de computador e funções R disponíveis para análise de correspondência;
consulte a Seção 9.5.

CANOCO (ter Braak, 1988b, 1988c, 1990; ter Braak & Smilauer, 1998) usa o algoritmo de
TWWA média ponderada bidirecional de Hill (TWWA), conforme resumido por ter Braak (1987c).
algoritmo Esse algoritmo é descrito na Tabela 9.8. Existem três diferenças principais com o algoritmo TWWS
para PCA apresentado na Tabela 9.5: (1) as variáveis são centralizadas no PCA, não no CA; (2)
em CA, o centróide das pontuações do site não é zero e deve, portanto, ser estimado (passo 6.1);
(3) no CA, os somatórios são padronizados pela soma da linha, coluna
Machine Translated by Google

Análise de correspondência (CA) 491

Tabela 9.8 Algoritmo de média ponderada de duas vias (TWWA) para análise de correspondência. De Hill (1973b) e ter Braak (1987c).

a) Procedimento de estimação iterativa

Passo 1: Considere uma tabela Y com n linhas (sites) × p colunas (espécies).


NÃO centralize as colunas (espécies) em suas médias.

Determine quantos autovetores são necessários. Para cada um, FAÇA o seguinte:

Passo 2: Considere a ordem das linhas conforme as pontuações iniciais arbitrárias do local. (1, 2, …)

Defina a estimativa de autovalor inicial como 0. A seguir, yi+ = soma de linhas para o local i, y+j = soma de colunas para
espécies j e y++ = total geral para a tabela de dados Y.

O procedimento iterativo começa

Passo 3: Calcular novos carregamentos de espécies: colscore(j) = 2 y(i,j) × rowscore(i)/ y+j rowscore(i)

Passo 4: Calcule as novas pontuações do site: = 2 y(i,j) × colscore(j)/ yi+

Passo 5: Para os eixos de segunda e ordem superior, torne as pontuações do local não correlacionadas com todos os eixos
anteriores (procedimento de ortogonalização de Gram-Schmidt: veja b abaixo).

Passo 6: Normalize o vetor de pontuações do local (procedimento c, abaixo) e obtenha uma estimativa do autovalor. Se esta
estimativa não diferir da anterior em mais que a tolerância definida pelo usuário, vá para o passo 7. Se a diferença for maior
que a tolerância, vá para o passo 3.

Fim do procedimento iterativo

Etapa 7: Se mais autovetores devem ser calculados, vá para a etapa 2. Caso contrário, continue com a etapa 8.

Passo 8: Vˆ As pontuações da linha (local) correspondem à matriz . As pontuações das colunas (carregamentos de espécies)
correspondem
matriz . Matrizes e fornecemaescalonamento
Fˆ Fˆ Vˆ à tipo 2 (Subseção 9.2.1). As escalas 1 ou 3 podem ser calculadas, se
necessário. Retorne os autovalores, % de variância, cargas de espécies e pontuações do local.

b) Procedimento de ortogonalização de Gram-Schmidt

FAÇA o seguinte, por sua vez, para todos os componentes k calculados anteriormente :

Passo 5.1: Calcule o produto escalar SP = 2 (yi+ × rowscore(i) × v(i,k)/y++) da estimativa atual do vetor de pontuação do site com o
componente anterior k. O vetor v(i,k) contém as pontuações do local do componente k escalado para comprimento 1. Este
produto está entre 0 (se os vetores forem ortogonais) e 1.

Passo 5.2: Calcule novos valores de rowscore(i) de modo que o vetor rowscore se torne ortogonal ao vetor v(i,k): rowscore(i) =
rowscore(i) – (SP × v(i,k)).

c) Procedimento de normalização†

Passo 6.1: Calcule o centróide das pontuações do site: z = 2 (yi+ × rowscore(i)/y++).


2
Passo 6.2: Calcule a soma dos quadrados das pontuações do site: S2 = 2 (yi+ × (rowscore(i) – z)2 /y++); S = Calcular as S .

Passo 6.3: pontuações normalizadas do site: rowscore(i) = (rowscore(i) – z)/S.

Passo 6.4: Ao final de cada iteração, S, que mede a quantidade de encolhimento durante a iteração, fornece uma estimativa do
autovalor. Após a convergência, o autovalor é S.

† A normalização no CA é tal que a soma ponderada dos quadrados dos elementos do vetor é igual a 1.
Machine Translated by Google

492 Ordenação em espaço reduzido

soma, ou total geral, conforme apropriado, que produz o encolhimento das pontuações de ordenação no
final de cada iteração no CA (etapa 6.4), em vez de aumentar como no PCA.

SVD As funções R para CA usam decomposição de valor singular (SVD, função svd() de R) ou redução de
chefe de família Householder (função eigen() de R). SVD e autodecomposição foram usados para descrever o algoritmo
CA na Subseção 9.2.1; eles fornecem os autovalores de Uˆ, bem como as matrizes U e . As várias matrizes
para as pontuações de linha e coluna usadas em escalas são então obtidas usando as eqs. 9.33 a 9.36.

9.3 Análise de coordenadas principais (PCoA)

A análise de componentes principais (PCA) é aplicável apenas a dados para os quais a distância euclidiana
(D1) é apropriada, enquanto a análise de correspondência (CA) é aplicável apenas a dados do tipo
frequência para os quais a distância ( D16) é apropriada. Para outros tipos de dados, as relações entre os
objetos são calculadas com um dos coeficientes de semelhança descritos no Capítulo 7. A lista inclui
coeficientes que podem lidar com dados binários (S1 a S14, S24 a S27) e misturas de descritores
quantitativos e qualitativos (S15, S16 ). O PCA não pode ser aplicado a esses dados. O CA pode ser usado
com dados de presença-ausência para os quais zeros duplos devem ser excluídos das comparações de
objetos, mas não com misturas de descritores quantitativos e qualitativos.

euclidiano Gower (1966) descreveu um método para obter uma representação euclidiana (ou seja, uma
representação em um sistema de coordenadas cartesianas) de um conjunto de objetos cujas relações são
representação medidas por qualquer coeficiente de distância escolhido pelos usuários. Este método, conhecido como
análise de coordenadas principais (abreviado PCoA), escalonamento métrico multidimensional (em
contraste com o método não métrico descrito na Seção 9.4), ou escalonamento clássico por referência ao
trabalho pioneiro de Torgerson (1958), permite posicionar objetos em um espaço de dimensionalidade
reduzida, preservando ao máximo suas relações de distância; ver também Rao (1964).

O interesse do método PCoA reside no fato de que ele pode ser usado com todos os tipos de
Misturado descritores - até mesmo conjuntos de dados com descritores de níveis mistos de precisão, desde que um
precisão coeficiente apropriado aos dados tenha sido usado para calcular a matriz de semelhança (por exemplo
S15 ou S16, Capítulo 7). Será mostrado que, se a matriz de distância for métrica, ou seja, se não contém
violação da desigualdade triangular, as relações entre os objetos podem, na maioria dos casos, ser
totalmente representadas no espaço euclidiano. No caso de violações da desigualdade triangular, ou
quando ocorrem problemas de “não-euclideanaridade” com distâncias métricas (Gower, 1982; Fig. 9.16),
autovalores negativos são produzidos. Na maioria dos casos, isso não prejudica a qualidade da
representação euclidiana obtida para as primeiras coordenadas principais. Também é possível transformar
a matriz de distância, ou usar uma medida de semelhança alternativa, para eliminar o problema. Esses
tópicos são discutidos na Subseção 9.3.4.
Machine Translated by Google

Análise de coordenadas principais (PCoA) 493

Pode-se olhar para as coordenadas principais como o equivalente dos componentes principais.
Os componentes principais, por um lado, são combinações lineares dos descritores originais (ou
padronizados); linear é o conceito-chave. As coordenadas principais, por outro lado, também são
funções das variáveis originais, mas mediadas pela função de distância que foi calculada entre os
objetos. Em qualquer caso, PCoA só pode incorporar (ou seja, representar totalmente), no espaço
euclidiano, a parte euclidiana de uma matriz de distância. Isso não é uma propriedade dos dados,
modelo mas um resultado do modelo euclidiano, que é imposto aos dados porque o objetivo é desenhar
euclidiano diagramas de dispersão em folhas de papel. Ao fazer isso, deve-se aceitar que tudo o que não é
euclidiano não pode ser desenhado no papel. Isso pode ser visto como o problema de desenhar
pontos separados por distâncias não euclidianas em um espaço euclidiano.

Assim como o PCoA, o método de escalonamento multidimensional não métrico (nMDS, Seção
9.4) produz ordenações de objetos a partir de qualquer matriz de semelhança. Ele comprime as
relações de distância entre os objetos em, digamos, duas ou três dimensões de uma forma mais
eficiente do que o PCoA. nMDS sempre obtém uma representação euclidiana, mesmo a partir de
distâncias incorporáveis não euclidianas. No entanto, o nMDS comprime as distâncias de forma não
linear e seu algoritmo é intensivo em computação, exigindo mais tempo de computação do que o
PCoA. O último é mais rápido para matrizes de grandes distâncias.

1 — Computação

Gower (1966) explicou como calcular as coordenadas principais de uma distância


matriz:

• O cálculo começa com uma matriz de distância D = [Dhi]. Também é possível realizar os cálculos
a partir de uma matriz de similaridade S = [Shi]; o método é detalhado na Subseção 9.3.3.

• A matriz D é transformada em uma nova matriz A = [ahi] definindo:

1 2
= (9.40)
ai – --Dhi
2

O propósito desta transformação é explicado na Subseção 9.3.3.

• A matriz A é centralizada para fornecer a matriz 31 = [4hi], usando a seguinte equação:

4hi ahi ah ai +––= a (9.41)

onde e são
ah as médias
ai da linha e da coluna correspondentes ao elemento ahi da matriz A,
a
respectivamente, e é a média de todos os ahi's da matriz. A seguinte equação matricial produz a
centralização descrita na eq. 9.41:

11' 11' $ % $ %
AI
31 = ------- " # -------
EU
(9.42)
n "# n
Machine Translated by Google

494 Ordenação em espaço reduzido

onde I é uma matriz identidade de ordem n e 1 é um vetor coluna de comprimento n contendo


valores “1”. A centralização tem o efeito de posicionar a origem do novo sistema de eixos no
centróide da dispersão dos objetos sem alterar as distâncias entre os objetos.

euclidiano No caso particular das distâncias calculadas pelo coeficiente de distância euclidiana (D1,
distância eq. 7.32), é possível obter a matriz 31 centrada em Gower diretamente, ou seja, sem calcular
uma matriz D de distâncias euclidianas e passando pelas eqs. 9.40 e 9.41, porque 31 = YcYc',
onde Yc é Y centrado por colunas. Isso pode ser verificado por meio de exemplos numéricos.
Nesse caso particular, 31 é sempre uma matriz semidefinida positiva (Tabela 2.2).

• Os autovalores &k e os autovetores normalizados (matriz U) são calculados e cada autovetor


uk é multiplicado pela raiz quadrada de seu autovalor. Como resultado, os autovetores são
dimensionados para comprimentos iguais às raízes quadradas de seus autovalores:

u'kuk & k =

Devido ao centramento, a matriz 31 sempre tem pelo menos um autovalor nulo. A razão
é que no máximo (n – 1) eixos reais são necessários para representar n pontos no espaço
euclidiano. Pode haver mais de um autovalor nulo se a matriz de distância for degenerada,
Degenerar ou seja, se os objetos puderem ser representados em menos de (n – 1) dimensões. Na
matriz D prática, existem c autovalores positivos e c eixos reais formando a representação euclidiana
dos dados, sendo a regra que c 5 n – 1.

Com a distância euclidiana (D1), quando há mais objetos do que descritores (n > p), o
valor máximo de c é p; quando n 5 p, então c 5 n – 1. Tome como exemplo um conjunto de
três objetos ou mais e dois descritores (n > p). Os objetos, tantos quantos forem, podem ser
representados em um espaço bidimensional — por exemplo, o diagrama de dispersão dos
dois descritores. Considere agora o caso em que existem dois objetos e dois descritores (n 5
p); os dois objetos requerem apenas uma dimensão para representação.

• Após o escalonamento, se os autovetores forem escritos como colunas (eg Tabela 9.9), as
linhas da tabela resultante serão as coordenadas dos objetos no espaço das coordenadas
principais, sem nenhuma transformação posterior; eles formam a matriz PC das coordenadas
principais. Traçar os pontos, digamos, nas duas primeiras coordenadas principais produz um
diagrama de ordenação de espaço reduzido dos objetos em duas dimensões.

2 — Exemplo numérico
Os leitores podem ter uma ideia melhor do que a análise de coordenadas principais faz
comparando-a com a análise de componentes principais. Considere uma matriz de dados Y
na qual uma análise de componentes principais (PCA) foi calculada, com autovalores
resultantes, autovetores (matriz U) e componentes principais (matriz F). Se alguém também
calculasse uma matriz de distância euclidiana D = [Dhi] para os mesmos n objetos, os
autovetores obtidos pela análise de coordenadas principais seriam exatamente os mesmos
que os componentes principais. Os autovalores do PCoA são iguais aos autovalores que alguém teria
Machine Translated by Google

Análise de coordenadas principais (PCoA) 495

Tabela 9.9 As coordenadas principais dos objetos (linhas) são obtidas dimensionando os autovetores para &.

Autovalores

&1 &2 ... &c

Objetos Autovetores

x1 u11 u12 ... u1c


x2 u21 u22 ... u2c

. . .
. . .
. . .
xh uh1 uh2 ... uhc

. . .
. . .
. . .
XI ui1 ui2 ... uic

. . .
. . .
. . .
xn un1 un2 ... unc

2
= ...
Comprimentos:
) uik &1 &2 &c
eu

Centróide: = 0 0 ... 0
reino unido [ ]

obter de um PCA realizado na matriz de produtos cruzados [ ] yy – ' [ ] yy – ; estes são maiores que
os autovalores de um PCA conduzido na matriz de covariância S pelo fator (n – 1) porque S = (1/(n
– 1)) [ ] yy – ' [ ] yy – . Como o PCA foi definido, neste livro, como a autoanálise da matriz de
covariância S, os mesmos autovalores do PCA podem ser obtidos a partir de uma análise de
coordenadas principais calculada na matriz de distância Euclidiana entre os objetos e dividindo os
autovalores PCoA resultantes por (n – 1). Se alguém estiver interessado apenas na magnitude
relativa dos autovalores, esse passo de escalonamento não é necessário e pode ser ignorado.

O parágrafo anterior não significa que a análise de coordenadas principais esteja limitada a
matrizes de distâncias euclidianas. Na verdade, pode ser calculado para qualquer matriz de
distância. Se as distâncias não puderem ser prontamente incorporadas no espaço euclidiano,
autovalores negativos podem ser obtidos, com as consequências descritas na Subseção 9.3.4.
Machine Translated by Google

496 Ordenação em espaço reduzido

Exemplo numérico 2. O exemplo numérico para análise de componentes principais (Seção 9.1) é
usado aqui para ilustrar as principais etapas no cálculo das coordenadas principais.
O exemplo também mostra que calcular as coordenadas principais de uma matriz de distâncias euclidianas
D = [Dhi] fornece exatamente os mesmos resultados que uma análise de componente principal dos dados
brutos, com a exceção de que as cargas do descritor não são obtidas em PCoA. De fato, informações
sobre os descritores originais não são passadas para o algoritmo PCoA. De fato, como o PCoA é calculado
a partir de uma matriz de distância entre os objetos, ele não pode retornar os carregamentos dos descritores.
Um método para calculá-los a posteriori é descrito na Subseção 9.3.3 (eq. 9.45).

1) A matriz de distâncias euclidianas entre os 5 objetos da matriz de dados Y usada para ilustrar a
Seção 9.1 é:

0,00000 3,16228 3,16228 7,07107 7,07107


3,16228 0,00000 4,47214 4,47214 6,32456
D = 3,16228 4,47214 0,00000 6,32456 4,47214
7,07107 4,47214 6,32456 0,00000 4,47214
7,07107 6,32456 4,47214 4,47214 0,00000

2) A matriz 31 obtida pela centralização de Gower (eqs. 9.40 e 9.41) é:

12.8 4.8 4.8 11.2– 11.2–


4.8 6,8 3,2– 0,8 –9,2
31 = 4,8 –3,2 6.8 –9,2 0,8
11.2– 0,8 9,2– 14.8 4.8
11.2– 9.2– 0,8 4.8 14.8

O traço (soma dos elementos diagonais) desta matriz é 56. Isso é (n – 1) = 4 vezes o traço da matriz de
covariância calculada no PCA, que foi 14. Os elementos diagonais são as distâncias ao quadrado dos
pontos a o centróide multivariado. Observe que a matriz 31 poderia ter sido obtida diretamente da matriz
de dados Y centrada por colunas (Yc), conforme mencionado na Subseção 9.3.1 para o caso particular em
que D é calculado usando o coeficiente de distância euclidiana (D1, eq. 7.32): 31 = YcYc'. Os leitores
podem verificar essa propriedade numericamente para o exemplo.

3) Os autovalores e autovetores da matriz 31, escalados para & , são mostrados na Tabela 9.10.
Existem apenas c = 2 autovalores diferentes de zero; isso era esperado, pois as distâncias foram calculadas
a partir de p = 2 variáveis apenas (c = p = 2). As coordenadas principais, que são os autovetores
redimensionados do PCoA, são idênticas aos componentes principais (Subseção 9.1.2 e Tabela 9.6) neste
exemplo. Medidas de semelhança diferentes da distância euclidiana podem produzir um número diferente
de autovalores e coordenadas principais e, é claro, posicionariam os objetos de maneira diferente.

PCA e Embora o exemplo numérico ilustre o fato de que um PCoA calculado em um


PCoA A matriz de distância euclidiana fornece os mesmos resultados que um PCA conduzido nos
dados originais, o inverso também é verdadeiro: tomando as coordenadas dos objetos no espaço
total (todos os autovetores) obtidos de um PCoA e usando-os como entrada de uma análise de
componentes principais produziria os mesmos autovalores do PCA que os do PCoA original (para um
Machine Translated by Google

Análise de coordenadas principais (PCoA) 497

Tabela 9.10 Coordenadas principais calculadas para o exemplo numérico para PCA desenvolvido na Seção 9.1.
Compare com os resultados do PCA na Subseção 9.1.2 e na Tabela 9.6.

Autovalores

&1 &2

Objetos Autovetores

x1 –3,578 0,000
x2 –1,342 –2,236
x3 –1,342 2,236
x4 3,130 –2,236
x5 3,130 2,236

Autovalores de PCoA 36.000 20.000

Autovalores de PCoA/(n – 1)
= autovalores do PCA correspondente 9.000 5.000

Comprimentos: ) 2=
você ik
6.000 = 36 4,472 = 20
eu

fator n – 1), e os componentes principais serão idênticos às coordenadas principais. Todos os


sinais de qualquer componente podem ser invertidos, porém, conforme explicado na Subseção
9.1.9; os sinais dependem de uma decisão arbitrária tomada durante a execução das funções
de autodecomposição (Subseção 2.9.2). Por isso, antes de apresentar seus resultados, os
usuários dos métodos de ordenação são livres para inverter todos os sinais de qualquer
componente principal ou coordenada principal, se isso lhes for mais conveniente.

3 — Fundamentação do método

Gower (1966) mostrou que as relações de distância entre os objetos são preservadas no espaço
de coordenadas principal full-dimensional. Sua prova é resumida como segue.

• No espaço total das coordenadas principais (ou seja, todos os autovetores), a distância entre
os objetos h e i pode ser encontrada calculando a distância euclidiana entre as linhas h e i da
Tabela 9.9:

c 1 2ÿ c c c 1 2ÿ
2 2 2
D' oi =
) ( ) – uhk uik
=
) uik+)–2)uhkuik
uhk
(9.43)
k 1= k 1= k 1= k 1=
Machine Translated by Google

498 Ordenação em espaço reduzido

• Como os autovetores são dimensionados de forma que seus comprimentos sejam &k (em outro
palavras, U é dimensionado aqui para !1/2), os autovetores têm a propriedade de que 31 = UU'. Um
pode assim escrever:

+ +2+… ucu' c
31 = [4hi] = u1u' 1 u2u'

a partir do qual pode ser mostrado, seguindo a eq. 9.43, que:

1 2ÿ
D' oi = [ 4hh 4ii 24hi ] –+

Os leitores podem verificar essa propriedade no exemplo numérico acima.

• Uma vez que 4hi


da=equação
(eq. 9.41), substituindo os valores de 4 na mão direita ahi ah ai +–– um membro
anterior dá:

4hh 4ii 24hi –+ ahh aii 2ahi –+=


1 2ÿ
por isso D' oi = [ ahh aii 2ahi ] –+

A transformação de A em 31 não é essencial. Destina-se simplesmente a eliminar um dos


autovalores, que poderia ser o maior e apenas representaria a distância entre o centróide e a origem.

• A transformação da matriz de distâncias originais Dhi em A é tal que as distâncias são preservadas
no decorrer dos cálculos. Na verdade, pode-se substituir
2 os termos ahi na equação anterior por –0,5
Dhi (eq. 9.40), o que produz a equação

1 2ÿ
1 2 1 2 2
D' oi = – --Dhh +–--Dii
2 Dhi
2

e, como Dhh = Dii = 0 (propriedade das distâncias),

1 2ÿ
2
D' oi = []Dhi

A análise de coordenadas principais preserva as distâncias originais, independentemente da


fórmula usada para calculá-las. Se as distâncias foram calculadas a partir de semelhanças, Dhi = 1
– Shi será preservado no espaço de coordenadas principais de dimensão total. Se a transformação
de semelhanças em distâncias foi feita por Dhi = Dhi = então são essas distâncias 1 Shi- _ ou
2

1 Shi , pelo PCoA. Como corolário, essas várias representações no espaço de
que são preservadas
coordenadas principais devem ser tão diferentes umas das outras quanto as próprias distâncias.

Gower (1966) também mostrou que as coordenadas principais podem ser calculadas diretamente a partir
de uma matriz de similaridade S em vez de uma matriz de distância D, como segue: (1) certifique-se de que a
diagonal da matriz S contém 1's e não 0's antes da centralização; (2) centro da matriz S usando a eq. 9.41 ou 9.42
Machine Translated by Google

Análise de coordenadas principais (PCoA) 499

sem aplicar a eq. 9,40 primeiro; (3) calcular os autovalores e autovetores; (4) multiplique os elementos de
D' oi reconstruídos no espaço de
cada autovetor k por &k 0,5. As distâncias entre os objetos pontuais
coordenadas principais de dimensão total não são as mesmas que as distâncias Dhi = (1 – Shi); eles são
=
distorcidos, sendo tais que D' 2 Dhi . Olhando de outro ponto de
D' 0,5
vista, as distâncias reconstruídas por um sem oi
mais
sãodistorção.
maiores Essas
que asrelações são
distâncias válidas
Dhi = (1 –apenas
Shi) se a
matriz centrada S for fator 2
semidefinida positiva, ou seja, se sua autodecomposição não produzir autovalores negativos.

Para resumir, a análise de coordenadas principais produz uma representação de objetos


no espaço euclidiano que preserva as relações de distância calculadas usando qualquer
medida selecionada pelos usuários. Esta é uma grande diferença com o PCA, onde a
distância entre os objetos é sempre, por definição, a distância euclidiana (Tabela 9.1). No
PCoA, a representação de objetos no espaço reduzido das primeiras coordenadas principais
forma a melhor aproximação euclidiana possível das distâncias originais, porque a soma
dos comprimentos quadrados dos objetos no subespaço selecionado é máxima (Gower,
1982). A qualidade de uma representação euclidiana em um espaço de coordenadas
principais pode ser avaliada usando um diagrama de Shepard (Fig. 9.1).

Ao contrário da análise de componentes principais, as relações entre as coordenadas


principais e os descritores originais não são fornecidas por uma análise de coordenadas
principais. De fato, os descritores, a partir dos quais as distâncias foram inicialmente
calculadas entre os objetos, não desempenham nenhum papel durante o cálculo do PCoA da matriz D.
PCoA No entanto, calcular as projeções dos descritores no espaço das coordenadas principais
biplot para produzir biplots é bastante simples:

1
Esp. ------------------Yc'Ust = (9.44)
( ) n 1–

0,5–
= (9.45)
Uproj n – 1 Spc!

Yc é a matriz centrada dos descritores originais ou qualquer outro conjunto de variáveis


explicativas que os usuários desejam projetar no biplot PCoA. Y pode precisar ser
transformado antes de ser centrado e usado na eq. 9,44; por exemplo, variáveis físicas
dimensionalmente heterogêneas precisam ser padronizadas. Ust é a matriz de autovetores
de PCoA (n × c) padronizada por colunas (eq. 1.12); pode conter apenas um subconjunto
dos autovetores, por exemplo, os dois primeiros. Spc é a matriz de covariância entre Y e as
coordenadas principais padronizadas Ust; no cálculo dessa matriz de covariância, a eq. 9.44
assume que os descritores na matriz Y são quantitativos. As linhas da matriz Uproj
correspondem aos p descritores a serem adicionados ao biplot, e suas colunas correspondem
às coordenadas principais. Para um PCoA conduzido em uma matriz de distância euclidiana
(D1) calculada a partir de Y, o biplot de PCoA com matriz PC para objetos e matriz Uproj
para descritores é idêntico a um biplot de distância PCA de Y (Subseção 9.1.4), não obstante
possíveis mudanças de sinais ao longo de alguns dos eixos entre as duas análises.
Machine Translated by Google

500 Ordenação em espaço reduzido

x1

D D
1 1

x4
D D

D D

x2 1 x3

Figura 9.16 Esta figura, de Gower (1982), ilustra um caso em que a desigualdade triangular não é violada, mas nenhuma representação
euclidiana dos quatro pontos (x1 a x4) é possível porque as distâncias D, que são todas iguais, são muito pequenas
para que as três representações do ponto interno (x4) se unam em um único ponto. Assumindo que as arestas
externas são todas de comprimento 1, a desigualdade triangular será violada se D for menor que 0,5. Pelo contrário,
uma representação euclidiana bidimensional dos quatro pontos será possível com D = porque então as três
1 Com
representações de x4 se encontrarão no centróide. 3 ÿ D > a representação euclidiana dos quatro pontos, x1 a
13ÿ
x4, formará uma pirâmide tridimensional. ,

4 — Autovalores negativos

Existem matrizes de distância que não permitem uma representação completa das relações de distância entre
os objetos no espaço euclidiano (ou seja, um conjunto de coordenadas cartesianas reais).

• Problemas de representação euclidiana podem resultar do uso de uma medida de distância que viole a
desigualdade triangular. Tais distâncias são chamadas semimétricas e não métricas nas Tabelas 7.2 e 7.3.

• Tais problemas também podem resultar de um desequilíbrio na matriz de distância, devido ao


tratamento de valores ausentes. Veja, por exemplo, como os valores ausentes são tratados nos
coeficientes S15, S16, S19 e S20 do Capítulo 7, usando as funções delta de Kronecker.

anaridade não • Algumas matrizes de distância métrica apresentam problemas de “não-euclideanaridade”, conforme descrito
euclidiana por Gower (1982, 1985). A Figura 9.16 ilustra tal caso; o fechamento de todos os triângulos individuais
(condição de desigualdade triangular, Seção 7.4) é uma condição necessária, mas não suficiente para garantir
uma representação euclidiana completa de um conjunto de objetos.
Esta “não-Euclideanaridade”, quando presente, traduz-se em autovalores negativos.
Machine Translated by Google

Análise de coordenadas principais (PCoA) 501

Por exemplo, a maioria das distâncias métricas resultantes da transformação de um coeficiente


de similaridade usando a fórmula D = 1 – S são não-euclidianas (Tabela 7.2). Isso não significa
que todas as matrizes de distância calculadas usando esses coeficientes não sejam euclidianas,
mas podem ser encontrados casos em que PCoA produz autovalores negativos.
Entre os coeficientes métricos descritos na Subseção 7.4.1, vários demonstraram ser euclidianos
enquanto outros não são euclidianos (Tabela 7.3).

As Tabelas 7.2 e 7.3 mostram que, para muitos coeficientes, as distâncias D 1 –= D ou


S são euclidianas, embora as distâncias D ou D = (1 – S) não sejam euclidianas. O uso de Dhi 1
Shi –= deve, portanto, ser preferido
ouantes
a transformação
de calcular o PCoA usando esses coeficientes. Essa
D
transformação resolve o problema de autovalor negativo mesmo para coeficientes conhecidos
como semimétricos.
É o caso, por exemplo, dos coeficientes S8, S17 e da diferença percentual (D14 = 1 – S17),
amplamente utilizados por ecólogos para analisar tabelas de dados de presença ou abundância
de espécies. Uma transformação de raiz quadrada de D14 = 1 – S17, por exemplo, elimina
autovalores negativos na análise de coordenadas principais; veja Exemplo numérico 1
(continuação) na Subseção 9.3.5. Em apoio a esta afirmação, Gower & Legendre (1986)
mostraram que o coeficiente S8, que é a forma binária de S17, é euclidiano quando transformado
,
em e as simulações nunca D 1 S8 –= é não-euclidiano. casos descobertos onde D 1 S17 –=

Quando não se deseja aplicar uma transformação de raiz quadrada às distâncias, ou quando
problemas de autovalores negativos persistem apesar de uma transformação de raiz quadrada,
Gower & Legendre (1986) mostraram que o problema da “não-Euclideanaridade” e da autovalores
negativos que vêm com ela, podem ser resolvidos adicionando uma constante (grande o
suficiente) a todos os valores de uma matriz de distância que não se presta à representação
euclidiana completa. Nenhuma correção é feita ao longo da diagonal, porque a distância entre
um objeto e ele mesmo é sempre zero. Na verdade, adicionar alguma constante grande faria os
autovalores negativos desaparecerem e produziria uma representação totalmente euclidiana,
mas também criaria uma dimensão extra (e autovalor) para expressar a variância adicional assim
gerada. Na Fig. 9.17c, por exemplo, adicionar um valor grande, como 0,4, a todas as seis
distâncias entre os quatro pontos no gráfico criaria uma pirâmide, exigindo três dimensões para
uma representação euclidiana completa em vez de duas.

O problema é adicionar a quantidade certa a todas as distâncias na matriz para eliminar


todos os autovalores negativos e produzir uma representação euclidiana das relações de
distância entre os objetos, sem criar dimensões extras desnecessárias.
Seguindo Gower & Legendre (1986, Teorema 7*), este resultado pode ser obtido por ou pelas
2
uma constante c às distâncias ao quadrado Dhi Isso fornece distâncias originais Dhi. adicionar
dois métodos para ajustar as distâncias originais e corrigir seu comportamento não-euclidiano.

* A presente subseção corrige dois erros de impressão no teorema 7 de Gower & Legendre (1986).
Machine Translated by Google

502 Ordenação em espaço reduzido

x3
x3

x4
(a) (b) (c)
D = 0,777 x3

x4 x4
D = 0,377
x1
D = 0,577
D=
1,2
x1 D = 0,8 x2
x1 D = 1,0 x2 x2

Figura 9.17 (a) Distâncias entre quatro pontos construídos de tal forma que o sistema não pode ser representado no
espaço euclidiano porque as três retas indo em direção ao ponto x4 não se encontram. (b)
Adicionando uma constante a todas as distâncias (c2 = 0,2 no caso presente), o método de correção
2 torna o sistema euclidiano; neste exemplo, as distâncias podem ser associadas a uma
representação dos pontos no espaço bidimensional. (c) Ao aumentar ainda mais as distâncias
(adicionando novamente 0,2 a cada distância no presente caso), o sistema permanece euclidiano,
mas requer mais dimensões para representação (três dimensões neste exemplo).

• Método de correção 1 (derivado


2 do trabalho de Lingoes, 1971). — Adicione uma constante a todas as
distâncias ao quadrado , exceto aquelas na diagonal, criando uma nova matriz de distâncias Dhi DˆDˆ
através da seguinte
oi transformação:

2
Dˆoi 2c1 += Dhi para h 6 eu
(9.46)

Como obter c1 é descrito algumas linhas abaixo. Em seguida, prossiga para a transformação de Dˆ em
matriz usando a eq.A 9.40. As duas operações podem ser combinadas em uma única transformação Aˆ =
[ produzindo a nova matriz aˆ diretamente das distâncias hi originais] Dhi:

1 2 1 2
= 1 2
= – --Dˆ oi = – – c1 para h 6 eu
aˆ oi
2 ( 2c1
– -- Dhi 2 )+ --Dhi
2

Em seguida, prossiga com a eq. 9.41 e recalcule o PCoA. A constante a ser adicionada, c1, é o valor
absoluto do maior autovalor negativo obtido pela análise da matriz original 31. A constante c1 também é
usada na eq. 9,48 abaixo. Após a correção, todos os autovalores diferentes de zero são aumentados por
um valor igual a c1, de modo que o maior autovalor negativo é agora deslocado para o valor 0. Como
consequência, a solução corrigida tem dois autovalores nulos (portanto, um máximo de n - 2 dimensões ),
ou mais se a matriz for degenerada. A constante c1 é o menor valor que produzirá o efeito desejado.

Qualquer valor maior que c1 também eliminaria todos os autovalores negativos e tornaria o sistema
totalmente euclidiano, mas também criaria uma solução que requeria mais dimensões.
Machine Translated by Google

Análise de coordenadas principais (PCoA) 503

• Método de correção 2 (proposto por Cailliez, 1983). — Adicione uma constante c2 a todos

os elementos Dhi da matriz D, exceto os da diagonal, criando uma nova matriz de distâncias
Dˆ através da transformação:
oi

Dˆ hi Dhi c2 += para h 6 eu
(9.47)

para a transformação usando a eq. 9.40. AsDˆ Aˆ


naeoperações
duas prossiga podem ser combinadas em
matriz
uma única transformação produzindo a nova matriz Aˆ = [ aˆ diretamente das distâncias
originaisDhi:] hi

2
–= 1 Dhi
( ) +c2See para h 6 eu
aˆ oi --
More 2

Em seguida, prossiga com a eq. 9.41 e recalcule o PCoA. A constante a ser adicionada, c2,
é igual ao maior autovalor positivo obtido pela análise da seguinte matriz especial, que é de
ordem 2n:

0 231
– EU
4 32 –

onde 0 é uma matriz nula, I é uma matriz identidade, 31 é a matriz centrada definida pelas
eqs. 9.40 e 9.41, e 32 é uma matriz contendo valores (–0.5Dhi) centrados usando a eq.
9.41. A ordem de cada uma dessas matrizes é n. Cuidado: a matriz especial é assimétrica.
Pressione e outros. (2007) descrevem um algoritmo para calcular os autovalores de tal
matriz. A função eigen() do R também pode computá-los. A solução tem dois autovalores
nulos (daí um máximo de n – 2 dimensões), ou mais se a matriz for degenerada. A constante
c2 é o menor valor que produzirá o efeito desejado; qualquer valor maior que c2 também
eliminaria todos os autovalores negativos e tornaria o sistema totalmente euclidiano, mas a
solução exigiria mais dimensões. A Figura 9.17ab mostra o efeito de adicionar a constante
c2 a um grupo não euclidiano de quatro pontos, e a Fig. 9.17c mostra o efeito de adicionar
um valor maior que c2.

Os dois métodos de correção não produzem a mesma representação euclidiana.


Isso pode ser entendido examinando as consequências de adicionar c2 às distâncias Aˆ em
D. Quando é Dˆ
transformado em (eq. 9.40), (Dhi + c2) torna-se:

2 2 2
= –
= – (Dhi
0,52c2Dhi c2 ) ++ para h 6 eu
aˆ oi ( 0,5 Dhi c2
+ )

O efeito em aˆ não depende apenas do valor de c2 , mas também varia com cada valor hi
Dhi. Isso claramente não é o mesmo que subtrair uma constante de todos os valores de ahi
(ou seja, método de correção 1). Os autovetores resultantes de uma ou outra correção
também diferem daqueles resultantes de um PCoA sem correção para autovalores negativos.
Os dois métodos de correção, e PCoA sem correção, correspondem assim a diferentes
partições da variação porque a variância total, dada pelo traço da matriz centrada 31, difere
entre os métodos.
Machine Translated by Google

504 Ordenação em espaço reduzido

Quão grandes devem ser as constantes c1 e c2 para o coeficiente D14 = 1 – S17, o que é importante
para a análise de dados de abundância de espécies? Para responder a esta questão, Legendre &
Anderson (1999) simularam matrizes de dados de abundância de espécies. Depois de calcular a distância
D14, as constantes de correção (c1 para o método 1, c2 para o método 2) aumentaram quase linearmente
com a razão (número de locais: número de espécies). Em ecossistemas extremamente pobres em
espécies, as correções foram as maiores; por exemplo, com uma proporção de 20:1 (por exemplo, 200
locais, 10 espécies), c1 estava próximo de 0,4 e c2 estava próximo de 0,8. Quando a proporção era
próxima de 1:1 (ou seja, número de locais 7 número de espécies), c1 era de cerca de 0,06 e c2 era de
cerca de 0,2. Em ecossistemas ricos em espécies, as correções foram pequenas, tornando-se menores
à medida que a riqueza de espécies aumentava para um número constante de sítios; com uma proporção
de 1:2, por exemplo (por exemplo, 100 locais, 200 espécies), c1 foi próximo a 0,02 e c2 foi cerca de 0,1.
Os resultados também dependeram, até certo ponto, dos parâmetros de geração de dados.

Para resumir, todos os métodos para eliminar autovalores negativos operam tornando as pequenas
distâncias maiores, em comparação com as grandes distâncias, a fim de permitir que todos os triângulos
se fechem (Figs. 9.16, 9.17a e b). Conforme explicado acima, a primeira abordagem consiste em tirar a
raiz quadrada de todas as distâncias; isso reduz as maiores distâncias mais do que as pequenas. As
outras duas abordagens (descritas acima como métodos de correção 1 e 2) envolvem a adição de uma
constante a todas as distâncias não diagonais; pequenas distâncias são proporcionalmente mais
aumentadas do que grandes distâncias. No método de correção 1, uma constante (2c1) é adicionada ao
2
quadrado das distâncias Dhi , enquanto no próprio método 2.* uma constante (c2) é adicionada às
distâncias Dhi

Exemplo numérico 3. Considere o exemplo numérico usado na Subseção 7.4.2 para demonstrar a
natureza semimétrica da diferença percentual (D14). A matriz de dados continha 3 objetos e 5 espécies.
– 2
Matriz D, matriz A = [ e matriz 31 são: 0,5 Dhi ] ,

0,00000 0,05882 0,60000 0,00000 0,00173– 0,18000– 0,04916 0,03484 0,08401–


D= 0,05882 0,00000 0,53333 A= 0,00173– 0,00000 0,14222– 31= 0,03484 0,02398 0,05882–
0,60000 0,53333 0,00000 0,18000– 0,14222– 0,00000 0,08401– 0,05882– 0,14283

O traço de 31 é 0,21597. Os autovalores são: &1 = 0,21645, &2 = 0,00000 e &3 = –0,00049. A soma dos
autovalores é igual ao traço.

Para o método de correção 1, o valor c1 = 0,00049 é subtraído de todos os valores não diagonais de A
Aˆ para fornecer , que é então centralizado (eq. 9,41) para fornecer a matriz corrigida 31:

0,00000 0,00222– 0,18049– 0,04949 0,03468 0,08417–


A = 0,00222– 0,00000 0,14271– 31 = 0,03468 0,02430 0,05898–
0,18049– 0,14271– 0,00000 0,08417– 0,05898– 0,14315

O traço da matriz corrigida 31 é 0,21694. Os autovalores corrigidos são: &1 = 0,21694, &2 = 0,00000 e &3 =
0,00000. Esta solução euclidiana é unidimensional.

*
Na linguagem R, a função pcoa() no APE oferece essas duas correções.
Machine Translated by Google

Análise de coordenadas principais (PCoA) 505

Para o método de correção 2, valor c2 = 0,00784, que é o maior autovalor do especial que é então
matriz, é adicionado a todos os elementos não diagonais da matriz D para obter Aˆ Dˆ ,
transformado em (eq. 9.40) e centrado (eq. 9.41) para dar a matriz corrigida 31:

0,00000 0,06667 0,60784 0,00000 0,00222– 0,18474– 0,05055 0,03556 0,08611–


Dˆ = 0,06667 0,00000 0,54118 A = 0,00222– 0,00000 0,14644– 31= 0,03556 0,02502 0,06058–
0,60784 0,54118 0,00000 0,18474– 0,14644– 0,00000 0,08611– 0,06058– 0,14669

O traço da matriz corrigida 31 é 0,22226. Os autovalores corrigidos são: &1 = 0,22226, &2 = 0,00000 e &3
= 0,00000. Esta solução euclidiana é unidimensional, como foi o caso do método de correção 1.

Usando a raiz quadrada do coeficiente D14, as matrizes D, A e 31 são:

0,00000 0,24254 0,77460 0,00000 0,02941– 0,30000– 0,08715 0,04662 0,13377–


D= 0,24254 0,00000 0,73030 A= 0,02941– 0,00000 0,26667– 31 = 0,04662 0,06492 0,11155–
0,77460 0,73030 0,00000 0,30000– 0,26667– 0,00000 0,13377– 0,11155– 0,24532

O traço de 31 é 0,39739. Os autovalores são: &1 = 0,36906, &2 = 0,02832 e &3 = 0,00000.
Nenhum autovalor negativo é produzido usando este coeficiente. Esta solução euclidiana é bidimensional.

Se autovalores negativos estiverem presentes em uma solução PCoA full-dimensional e


nenhuma correção for feita nas distâncias para eliminar autovalores negativos, surgem
problemas de interpretação. Como os autovetores uk são dimensionados para &k ,comprimento,
segue-se que os eixos correspondentes aos autovalores negativos não são reais, mas
complexos. De fato, para que a soma dos quadrados dos uik's em um autovetor uk seja
negativa, as coordenadas uik devem ser números imaginários. Quando alguns dos eixos do
espaço de referência são complexos, as distâncias não podem ser totalmente representadas
no espaço euclidiano, como no exemplo das Figs. 9.16 e 9.17a.

É, no entanto, legítimo investigar se a aproximação euclidiana correspondente aos autovalores


positivos (isto é, as coordenadas principais não imaginárias) fornece uma boa representação,
quando nenhuma correção para autovalores negativos é aplicada. Cailliez & Pagès (1976)
mostraram que tal representação é significativa desde que o maior autovalor negativo seja menor,
em valor absoluto, do que qualquer um dos m autovalores positivos de interesse para representação
em espaço reduzido (geralmente, os primeiros dois ou três ).

Quando não há autovalores negativos, a qualidade da representação em um espaço


euclidiano reduzido com m dimensões pode ser avaliada, como na análise de componentes
principais (eq. 9.5), pela razão semelhante a R2:

m c
R2-like $ %$
9 )" 8 &k ÿ
# % 9 ) &k (9.5)
ratio 8" #
k 1= k 1=
Machine Translated by Google

506 Ordenação em espaço reduzido

onde c é o número de autovalores positivos. Isso vem do fato de que os autovalores de um


PCoA são os mesmos (para um fator n – 1) que os de um PCA executado nas coordenadas
dos mesmos pontos no espaço full-dimensional das coordenadas principais, por exemplo, as
coordenadas do objeto na Tabela 9.10. Cailliez & Pagès (1976) sugeriram ainda que, quando
autovalores negativos estão presentes, uma estimativa correta da qualidade de uma
representação de espaço reduzido pode ser obtida pela razão corrigida do tipo R2:
m
$

% &k mc1 + #
9)
corrigido 8"
k 1=
-------------------------------------------------- --

n (9.48)
R2-like ratio
$

%
+ ( c1
) n 1–
8"
9) &k #
k 1=

onde m é a dimensionalidade do espaço reduzido, n é a ordem da matriz de distância (número


total de objetos), e c1 é o valor absoluto do maior autovalor negativo; c1 foi encontrado no
método de correção 1 acima. A Equação 9.48 fornece o mesmo valor como se o método de
correção 1 tivesse sido aplicado à matriz de distância, o PCoA tivesse sido recalculado e a
qualidade da representação tivesse sido calculada usando a eq. 9.5. Todos os autovalores
diferentes de zero seriam aumentados por um valor igual a c1 = |&n|, produzindo as mesmas
alterações no numerador e no denominador da eq. 9.48.

5 — Aplicações ecológicas

A análise de coordenadas principais é um método de ordenação de grande interesse para os


ecologistas porque a natureza dos descritores ecológicos muitas vezes torna necessário o uso
de outras medidas de semelhança além da distância euclidiana preservada pela análise de
componentes principais ou a (2 distância preservada pela análise de correspondência (Tabela
9.1 ) . Métodos de ordenação, como análise de coordenadas principais e escala
multidimensional não métrica (Seção 9.4), fornecem representações euclidianas de objetos
pontuais para qualquer medida de distância selecionada pelos usuários.

Exemplo numérico 1 (continuação da Subseção 9.2.5). A partir dos dados mostrados na Fig. 9.10 e
na Tabela 9.7, quatro medidas de distância em modo Q foram calculadas entre os locais (Tabela 9.11) para
ilustrar algumas propriedades da análise de coordenadas principais.

• Linha 1 da Tabela 9.11 — A distância euclidiana D1 é um coeficiente simétrico. Não é ideal para dados de
abundância de espécies e é usado aqui apenas para comparação. Uma análise de coordenadas principais
dessa matriz levou a 19 autovalores: três positivos (representando 50, 41 e 9% da variação, respectivamente)
e 16 nulos. Isso era esperado, pois a matriz de dados original continha três variáveis.

• Linha 2 — A distância D14 é frequentemente aplicada a dados de abundância de espécies. Como seu
S17 de um complemento, ele exclui zeros duplos. A análise de coordenadas principais desta matriz de
distância levou a 19 autovalores: 11 positivos, um nulo e 7 negativos. A matriz de distância foi corrigida
usando o método 1 da Subseção 9.3.4, que faz uso do maior autovalor negativo. O PCoA produziu 17
autovalores positivos e dois nulos, sendo o maior responsável por 31% da variação. A matriz de distância
também foi corrigida usando o método 2 da Subseção 9.3.4, que
Machine Translated by Google

Análise de coordenadas principais (PCoA) 507

Tabela 9.11 Matrizes de distância calculadas a partir dos dados artificiais da Fig. 9.10 e da Tabela 9.7. Cada linha desta tabela
corresponde à primeira linha de uma matriz de distância, comparando o site 1 consigo mesmo e com os outros 18
sites. As linhas restantes das matrizes de distância não são mostradas para economizar espaço; os leitores podem
calcular essas matrizes a partir dos dados da Tabela 9.7. Os valores são arredondados para uma única casa decimal.

Locais de amostragem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

D1 (euclidiano) 0,0 1,0 3,0 6,0 7,0 6,1 3,6 4,1 7,0 8,1 7,1 4,6 4,6 7,1 8,1 7,1 4,1 2,2 1,4

D14 = (1 – S17) 0,0 0,3 0,6 0,8 0,8 0,8 0,7 0,7 0,8 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

D14 0,0 0,6 0,8 0,9 0,9 0,9 0,8 0,8 0,9 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0

D16 ((2 distâncias) 0,0 0,0 0,0 0,0 0,0 0,3 0,8 1,6 2,1 2,4 2,3 2,2 2,2 2,3 2,4 2,4 2,4 2,4 2,4

faz uso do maior autovalor da matriz especial. O PCoA também produziu 17 autovalores positivos e dois
nulos, sendo o maior responsável por 34% da variação.

• Linha 3 — A análise de coordenadas principais também foi realizada usando a raiz quadrada do
coeficiente D14. A análise resultou em 18 autovalores positivos, um nulo e nenhum negativo, sendo o
maior responsável por 35% da variação.

• Linha 4 — Uma quarta matriz de distância foi calculada usando a (2 distância D16, que exclui zeros
duplos. A análise de coordenadas principais produziu 19 autovalores: dois positivos (representando 4 e
36% da variação, respectivamente) e 17 nulos. A (2 distância (D16) é o coeficiente preservado na análise
de correspondência (CA, Seção 9.2), que também produziria dois autovalores positivos com esses dados.
De fato, CA sempre produz uma dimensão a menos que o número original de espécies, ou menos no
caso de matrizes degeneradas.

Este exemplo mostra que diferentes medidas de distância podem levar a números muito diferentes
de dimensões das representações euclidianas. Nas análises aqui relatadas, os números de dimensões
obtidos foram 3 para distância D1, 11 para D14 não corrigido (sem contar os eixos complexos
correspondentes a autovalores negativos), 17 para D14 após correção pelo maior autovalor negativo, 18
para a raiz quadrada de D14 e 2 para D16.

Para os dados de exemplo, a ordenação PCA (Fig. 9.11a, b) é idêntica à ordenação que teria sido
obtida do PCoA de uma matriz de distâncias euclidianas entre sítios, conforme mostrado no Exemplo
numérico 2 (Subseção 9.3.2). Da mesma forma, a ordenação dos sítios no gráfico CA (Fig. 9.11c), que
utilizou o escalonamento tipo 1, é semelhante a uma ordenação PCoA que seria obtida a partir de uma
matriz de (2 distâncias (D16) entre os sítios ) . As ordenações (Fig. 9.18) obtidas dos coeficientes de
distância D14 e os coeficientes são frequentemente D14 também são interessantes porque
usados para analisar dados de composição da comunidade, eles são ilustrados na Fig. 9.18ad. As
ordenações produzidas por esses coeficientes são bastante semelhantes entre si e apresentam ferraduras,
que não são tão pronunciado quanto no PCA porque os coeficientes D14 e D14 excluem zeros duplos
dos cálculos. Na Fig. 9.18a (coeficiente D14), os locais 6 a 14 formam um arco representando o
gradiente de três espécies, com braços estendendo-se em uma perpendicular
Machine Translated by Google

508 Ordenação em espaço reduzido

0,8 0,5

10 (a) (b)
0,6 0,3
9 11 6 14
5 15
7 13
0,4 0,1 4 16
8 12 10

PCoA
eixo
II
PCoA
eixo
III
3 8 12 17
0,2 -0,1 9 11
7 13
0,0 -0,3 2 18

6 14
1 19
-0,2 -0,5 1 19
PCoA, distância = D14 PCoA, distância = D14
Análise corrigida para autovalores negativos Análise corrigida para autovalores negativos
-0,4 -0,7
-0,6 -0,4 -0,2 0,0 0,2 PCoA eixo 0,4 0,6 -0,6 -0,4 -0,2 0,0 0,2 PCoA eixo I 0,4 0,6
I

0,6 0,5
10
0,5 9 11
(c) 0,4 (d)
0,4 0,3
6 14
8 12
0,3 0,2 4 16
5 7 13 15
0,2 0,1 10
PCoA
eixo
II
PCoA
eixo
III

0,1 0,0
89 11 12
7 13 3 17
0,0 -0,1

-0,1 1 19 -0,2
6 14
-0,2 -0,3 2 18

-0,3 -0,4 1 19

PCoA, distância = quadrado(D14) PCoA, distância = quadrado(D14)


-0,4 -0,5
-0,5 -0,3 -0,1 0,1 PCoA 0,3 0,5 -0,5 -0,3 -0,1 0,1 PCoA 0,3 0,5
eixo I eixo I

Figura 9.18 Ordenações de coordenadas principais dos dados da Fig. 9.10 e Tabela 9.7. Distância D14,
análise corrigida para autovalores negativos: (a) eixos PCoA I e II (&1 = 30,8%, &2 = 18,6%),
(b) eixos I e III (&1 = 30,8%, &3 = 8,3%). Distância D14 : (c) PCoA eixos I e II (&1 = 34,5%,
&2 = 22,9%), (d) eixos I e III (&1 = 34,5%, &3 = 10,5%).

direção (eixo III, Fig. 9.18b) para dar conta da dispersão dos sítios 1 a 5 e 15 a 19, cada
grupo contendo apenas uma espécie, conforme Tabela 9.7. A ordenação produzida pelo
coeficiente D14 é muito semelhante à anterior (Fig. 9.18cd). Porém, há duas vantagens em
D14 relação a D14 : nuncaD14produz autovalores negativos e, pelo menos no presente caso,
a ordenação explica mais variação do que D14 em duas ou três dimensões.

Somente a distância euclidiana e os coeficientes derivados levam a um número de eixos


principais igual ao número original de descritores. Outros coeficientes podem produzir menos
ou mais eixos. A dimensionalidade de um espaço de coordenadas principais é uma função da
Machine Translated by Google

Análise de coordenadas principais (PCoA) 509

número de descritores originais, mediados pela medida de distância selecionada para


análise.

Existem muitas aplicações da análise de coordenadas principais na literatura ecológica.


Este método pode ser usado em conjunto com técnicas de agrupamento; um exemplo é
apresentado na aplicação Ecológica 10.1. As aplicações diretas do método estão resumidas
em Aplicações ecológicas 9.3a e 9.3b. A aplicação da análise de coordenadas principais ao
agrupamento de grandes números de objetos é discutida na Subseção 8.7.3.

Aplicação ecológica 9.3a

Field & Robb (1970) estudaram os moluscos e cracas de uma costa rochosa (21 quadrats) em False Bay,
África do Sul, a fim de determinar a influência dos fatores emergência (altura da costa em relação ao nível
médio do mar ) e onda nessas comunidades. Os quadrantes 1 a 10, em um transecto paralelo à linha de costa,
diferiram em sua exposição à ação das ondas; quadras 11 a 21, localizadas em um transecto em ângulo reto
com a linha de costa, cobriam o espectro entre as marés altas médias e baixas médias das marés vivas.
Foram enumeradas 79 espécies, uma atingindo 10864 indivíduos em um único quadrante. Ao subir a costa,
os quadrats apresentavam números progressivamente maiores de indivíduos e números menores de espécies.
Isso ilustra o princípio de que o aumento do estresse ambiental (aqui, o fator de emergência ) é acompanhado
pela diminuição da diversidade. Também mostra que as poucas espécies que podem suportar um alto grau
de estresse não encontram muita competição interespecífica e podem, portanto, tornar-se muito abundantes.

A mesma ordenação das coordenadas principais poderia ter sido obtida estimando-se as abundâncias
das espécies com menor grau de precisão, por exemplo, usando classes de abundância. A Tabela 7.4 fornece
as medidas de associação que seriam apropriadas para tais dados. ( ) foram

Abundância de espécies primeiro normalizados por transformação logarítmica y' ij ), para formar a
= ( ) 1+ ,
loge y' ij matriz
analisados. Produtos escalares entre Y =foram
vetores[yij] contendo
usados o y''ij e centrado ( y''ij yij yi –= dados a serem
quadrat
como medidas de similaridade:

= Y Y'
Sn n × np × pn ×

As coordenadas principais foram calculadas usando um procedimento variante proposto por Orlóci (1966).
A Figura 9.19 mostra a ordenação dos quadrantes 1 a 19 no espaço das duas primeiras coordenadas
principais. A ordenação também foi calculada incluindo os quadrantes 20 e 21 mas, como estes vieram da
parte mais alta da costa, introduziram tanta variação na análise que o fator emergência dominou as duas
primeiras coordenadas principais. Para a presente aplicação ecológica, apenas a ordenação dos quadrantes
1 a 19 é mostrada. Os autores procuraram uma relação entre esta ordenação e os dois fatores ambientais,
calculando os coeficientes de correlação de postos de Spearman (eq. 5.3) entre os postos dos quadrantes em
cada eixo principal e seus postos nos dois fatores ambientais. Isso mostrou que o primeiro eixo principal teve
uma correlação significativa com a elevação em relação à linha de costa (emergência), e o segundo eixo foi
significativamente relacionado à ação das ondas. Os autores concluíram que o PCoA é bem adaptado ao
estudo de gradientes ecológicos, desde que o conjunto de dados seja bastante homogêneo. (A análise de
correspondência, descrita na Seção 9.2, teria sido outra forma apropriada de obter uma ordenação desses
quadrantes.)
Machine Translated by Google

510 Ordenação em espaço reduzido

1
8 2

3
4
10

2 9
PCoA
eixo
II

15
11 13
0
6
12
4
8
–2 7 16
5 14
17
–4
18

19
–6
–6 –4 –2 0 2 4 6 8 10 12

PCoA eixo I

Figura 9.19 Ordenação dos quadrantes 1 a 19 no espaço das duas primeiras coordenadas principais (eixos I e II do
PCoA). Modificado de Field & Robb (1970).

Aplicação ecológica 9.3b

Ardisson et ai. (1990) investigaram a organização espaço-temporal de comunidades epibentônicas


no Estuário e Golfo de St. Lawrence, uma área ca. 1150 × 300 km. Dados quantitativos foram
obtidos ao longo de 8 anos, entre 1975 e 1984, de 161 coletores (bóias de navegação de verão)
ancorados anualmente de maio a novembro e recuperados pela guarda costeira canadense antes
da formação do gelo no inverno.

Cada ano foi representado por uma tabela de dados de 161 locais (bóias) × 5 espécies
dominantes (biomassa seca). Uma matriz de similaridade entre os locais foi calculada para cada
ano separadamente, usando a forma assimétrica do coeficiente de similaridade de Gower (S19). As
lareira oito matrizes anuais foram comparadas entre si usando estatísticas de Mantel (Subseção 10.5.1).
estatística Uma análise de coordenada principal (Fig. 9.20) foi realizada na matriz resultante das estatísticas (1
– Mantel) para determinar se as diferenças ano a ano eram aleatórias ou organizadas. O padrão de
dispersão entre os anos sugeriu a existência de um ciclo de variação cuja duração era
aproximadamente igual à duração do estudo. Este ciclo pode representar a resposta do sistema
Estuário-Golfo, como uma unidade integrada, a entradas externas de energia auxiliar, embora o
processo causal específico, físico ou biótico, permaneça desconhecido.

O mesmo tipo de análise desta aplicação ecológica, ou seja, comparando várias matrizes de
dados sobre os mesmos objetos, pode ser baseado em coeficientes RV (equação 11.66) calculados
entre todos os pares de matrizes de dados. Os correspondentes coeficientes do tipo distância (1 –
RV) seriam montados em uma matriz de distância quadrada e PCoA seria calculado nessa matriz
para obter uma ordenação do tipo ilustrado na Fig. 9.20.
Machine Translated by Google

Análise de coordenadas principais (PCoA) 511

0,4
1975
0,3

0,2
1984
1976
0,1

coordenada
Segunda
principal
1981
0

–0,1
1977
–0,2 1983 1982
1980
–0,3

–0,4
–0,5 –0,4 –0,3 –0,2 –0,1 0 0,1 0,2 0,3 0,4 0,5

Primeira coordenada principal

Figura 9.20 Variabilidade interanual ilustrada no espaço das duas primeiras coordenadas principais, obtida a partir da
análise de uma matriz de estatísticas de Mantel comparando matrizes de similaridade anual. Recalculados
a partir dos valores estatísticos de Mantel fornecidos na Fig. 8 de Ardisson et al. (1990).

Esta última aplicação ecológica mostrou que a utilidade da análise de coordenadas


principais não se limita a projetar, em espaço reduzido, matrizes clássicas de semelhança
entre objetos. Nesse exemplo, as relações entre as tabelas de dados, conforme expressas
pelas estatísticas de Mantel, foram representadas em um espaço euclidiano usando PCoA.
O método pode realmente ser aplicado a qualquer tipo de matriz de semelhança simétrica.
Isso inclui casos em que as medidas de semelhança são obtidas diretamente da observação
(por exemplo, matrizes de interação em estudos comportamentais) ou do trabalho de
laboratório (resultados de hibridação de DNA, dados sorológicos, etc.). Se a matriz resultante
for assimétrica, ela pode ser decomposta em um componente simétrico e outro simétrico
(Seção 2.3), que podem ser analisados separadamente por PCoA.

6 — Algoritmo

A análise de coordenadas principais é fácil de calcular para qualquer matriz de distância,


usando uma função de autoanálise padrão. Siga as etapas resumidas na Tabela 9.12.
Machine Translated by Google

512 Ordenação em espaço reduzido

Tabela 9.12 Calculando as coordenadas principais.

a) Centralize a matriz de distância

Transforme e centralize a matriz de distância seguindo o método de Gower (eqs. 9.40 e 9.41).

b) Calcule os autovalores e autovetores

Use uma função de autodecomposição† .

c) Escala final

Escale cada autovetor k para o comprimento &k para obter as coordenadas principais.

† Para uma matriz de distâncias euclidianas D1, os autovalores obtidos de PCoA são maiores que os de PCA por um fator (n
– 1).

9.4 Escala multidimensional não métrica (nMDS)

Os métodos de ordenação de espaço reduzido das seções anteriores produziram uma ordenação
(dimensionamento) dos objetos no espaço full-dimensional. Os usuários poderiam então selecionar
as primeiras dimensões e verificar como as relações de distância entre os objetos foram
preservadas naquele espaço reduzido. Há casos, no entanto, em que a preservação exata das
distâncias entre os objetos não é de importância primordial, sendo a prioridade, em vez disso, a
representação dos objetos em um número pequeno e especificado de dimensões, geralmente
duas ou três. Nesses casos, o objetivo é plotar objetos dissimilares distantes no espaço de
ordenação e objetos semelhantes próximos uns dos outros. Isso é chamado de preservação de
relacionamentos de ordenação entre objetos. O método para fazer isso é chamado de
escalonamento multidimensional não métrico (nMDS, ou simplesmente MDS). Foi desenvolvido
pelos psicometristas Shepard (1962, 1966) e Kruskal (1964a, b). Os programas para nMDS foram
originalmente distribuídos pelos Bell Laboratories em Nova Jersey, onde o método se originou;
ver Carroll (1987) para uma revisão. O método está agora disponível em vários pacotes de
computador principais (SPSS, SAS, SYSTAT, etc.) e especializados, bem como em R*. Uma
referência útil é o livro de Kruskal & Wish (1978). As relações entre nMDS e outras formas de
ordenação foram descritas por Gower (1987).
Extensões de nMDS para várias matrizes, modelos ponderados, análise de dados de preferência,
etc. são discutidos por Young (1985) e Carroll (1987). Uma forma de escalonamento híbrido,
combinando critérios de escalonamento métricos e não-métricos, foi proposta por Faith et al.
(1987); foi explicado em Belbin (1991) e está disponível nos pacotes DECODA (escrito por Peter
R. Minchin) e PATN.
Machine Translated by Google

Escalonamento multidimensional não métrico (nMDS) 513

Como a análise de coordenadas principais (PCoA), o nMDS não está limitado a matrizes de distância
euclidianas; ele pode produzir ordenações de objetos de qualquer matriz de distância. O método também
pode prosseguir com distâncias ausentes - na verdade, quanto mais distâncias ausentes houver, mais
fáceis serão os cálculos - desde que haja medidas suficientes para posicionar cada objeto em relação a
alguns dos outros. Esse recurso o torna um método de escolha para a análise de matrizes obtidas por
observação direta (por exemplo, estudos de comportamento) ou ensaios de laboratório, onde frequentemente
ocorrem distâncias pareadas ausentes. Alguns programas podem lidar com matrizes de distância não
simétricas, para as quais fornecem uma solução de compromisso entre as distâncias nas partes triangulares
superior e inferior da matriz. Ao contrário de PCA, PCoA ou CA, que são métodos baseados em autovetores,
os cálculos nMDS não maximizam a variabilidade associada a eixos individuais da ordenação; Os eixos
nMDS são arbitrários, de modo que os gráficos podem ser rotacionados, centralizados ou invertidos
arbitrariamente. As razões para isso ficarão claras a partir da apresentação do método.

Considere uma matriz de distância Dn× = [Dhi] calculado usando uma medida apropriada para os
n
dados disponíveis (Capítulo 7). A Matriz D também pode resultar de observações diretas, por exemplo,
afinidades entre indivíduos ou espécies encontradas em estudos sorológicos, de pareamento de DNA ou
comportamentais; essas matrizes podem ser não simétricas. O dimensionamento multidimensional não
métrico da matriz D pode ser resumido nas etapas a seguir.

1) Especifique o número m de dimensões escolhidas a priori para dimensionar os objetos. A saída


fornecerá as coordenadas dos n objetos em máximos eixos. Se várias configurações para diferentes
números de dimensões forem procuradas — digamos, 2, 3, 4 e 5 dimensões, elas devem ser calculadas
separadamente. Vários programas realmente permitem soluções em cascata de números altos para baixos
de dimensões - por exemplo, de 4 para 3 para 2 para 1.

2) Construa uma configuração inicial dos objetos em m dimensões, para ser usada como ponto de
partida para o processo de ajuste iterativo dos passos 3 a 7. A forma como essa configuração inicial é
escolhida é crítica porque a solução para a qual o algoritmo eventualmente converge depende até certo
ponto nas posições iniciais dos objetos. O mesmo problema foi encontrado com o particionamento K-means
(Seção 8.8); o “espaço de

* O nMDS está disponível nas funções R listadas na Seção 9.5. Também é encontrado nos seguintes pacotes
disponíveis comercialmente (lista não exaustiva):
• NTSYSPC. Distribuição: ver nota de rodapé na Seção 7.8.
• PATN. Distribuição: ver nota de rodapé na Seção 7.8.

• PRIMÁRIO. Esse pacote foi desenvolvido por MR Carr e KR Clarke no Plymouth Marine Laboratory, Prospect Place,
West Hoe, Plymouth PL1 3DH, Grã-Bretanha. • PC-ORD. Distribuição: ver nota de rodapé
na Seção 11.7. Além do nMDS, o PC-ORD contém muitos outros métodos de análise multivariada de dados ecológicos.
Machine Translated by Google

514 Ordenação em espaço reduzido

Local soluções” podem conter vários mínimos locais além do mínimo geral (Fig. 8.17).
mínimo As soluções usuais para este problema são as seguintes:

• Execute o programa várias vezes, começando com diferentes posicionamentos iniciais aleatórios dos
objetos. A solução que minimiza a função objetivo (etapa 5) é mantida.

• Iniciar a execução a partir de uma ordenação obtida por outro método, por exemplo, PCoA.

• Se os dados forem estruturados espacialmente e as posições geográficas dos objetos forem


conhecidas, essas posições geográficas podem ser usadas como configuração inicial para nMDS de
uma matriz D calculada a partir dos dados.

• Trabalhe passo a passo da dimensionalidade superior para a inferior. Calcule, por exemplo, uma
primeira solução nMDS em 5 dimensões a partir de um posicionamento inicial aleatório dos objetos.
Observe o valor da tensão (eqs. 9,49 a 9,51), que deve ser baixo porque o alto número de dimensões
impõe pouca restrição às distâncias. Utilizar 4 das 5 dimensões assim obtidas como configuração inicial
para um percurso em 4 dimensões, e assim sucessivamente até atingir o número desejado (m) de
dimensões de ordenação.

3) Calcule uma matriz de distâncias ajustadas dhi no espaço de ordenação, usando uma das
métricas de Minkowski (D6, eq. 7.43). Na maioria das vezes, escolhe-se o segundo grau da métrica de
Minkowski, que é a distância euclidiana. (a) Na primeira iteração, as distâncias dhi são calculadas a
partir da configuração inicial (muitas vezes aleatória). (b) Nas iterações subsequentes, a configuração é
a obtida no passo 6.

Diagrama 4) Considere o diagrama de Shepard (Figs. 9.1 e 9.21b) comparando as distâncias ajustadas dhi
de Shepard com as distâncias empíricas (isto é, originais) Dhi. Regredir dhi em dhi. Os valores dˆ previstos pela
linha de regressão são chamados . A escolha do tipo de
oi regressão fica a cargo do usuário, dadas as
opções implementadas no programa de computador. As escolhas usuais são as regressões lineares,
polinomiais ou monótonas (também chamadas de “não paramétricas”, embora existam outros tipos de
métodos de regressão não paramétrica).

A regressão monótona é uma função degrau restrita para sempre aumentar da esquerda para a
direita (Fig. 9.21b); esta é uma escolha comum em nMDS. Uma regressão monótona é equivalente a
uma regressão linear realizada após a transformação monotônica das distâncias originais Dhi, de modo
a maximizar a relação linear entre Dhi e dhi.
A regressão é ajustada por mínimos quadrados.

valores empatados Se houver valores empatados entre as distâncias empíricas, Kruskal (1964a, b) propôs duas
abordagens que podem ser seguidas na regressão monótona. É provável que ocorram empates quando
as distâncias empíricas Dhi são calculadas a partir de uma tabela de dados brutos usando um dos
coeficientes descritos no Capítulo 7; eles são menos prováveis de ocorrer quando as distâncias resultam
de observações diretas. Na Fig. 9.21b, por exemplo, existem empates para vários dos valores da
abcissa; o maior número de empates é encontrado em D = Dmax = 1.

• Na abordagem primária de Kruskal , aceita-se o fato de que, se uma distância empírica Dhi corresponde
a diferentes valores ajustados dhi, ela também corresponde a diferentes previsões
Machine Translated by Google

Escalonamento multidimensional não métrico (nMDS) 515

valores dˆoi . Portanto, a linha de regressão monótona pode subir em uma coluna de valores empatados,

sujeita à restrição de que a linha de regressão não pode diminuir em comparação com os valores anteriores D. A
linha de regressão monótona não é uma função matemática nesse caso , no entanto. Para garantir a
monotonicidade, a única restrição dˆ nos valores é:
oi

dˆ quando Dgi < Dhi, então kimono


dˆ 5 hi

dˆ • Na abordagem secundária, o valor previsto é o mesmo para todas as distâncias


oi ajustadas dhi que estão
vinculadas a um determinado valor de distância empírica Dhi. Para garantir a monotonicidade dˆ, as restrições
nos valores são: oi

dˆ quando Dgi < Dhi, então gi dˆ 5 hi

dˆ = oi
dˆ quando Dgi = Dhi, então kimono

dˆ Nessa abordagem, a solução de mínimos quadrados para é a média


oi dos dhis empatados ao considerar um
único valor Dhi. A diferença vertical no diagrama entre dhi e dˆ é usada como a contribuição desse ponto para a
fórmula
oi de tensão abaixo. Na Fig. 9.21b, a abordagem secundária é aplicada a todos os valores empatados
encontrados para Dhi < (Dmax = 1) e a abordagem primária quando Dhi = Dmax = 1.

Os programas de computador podem diferir na maneira como lidam com gravatas. Isso pode causar grandes
diferenças entre os valores de tensão relatados correspondentes às soluções finais, embora as configurações
finais dos pontos sejam geralmente muito semelhantes de programa para programa, exceto quando dois
programas identificam soluções finais diferentes com valores de tensão muito semelhantes.

Uma escala de espaço reduzido seria perfeita se todos os pontos no diagrama de Shepard caíssem
exatamente na linha de regressão (linha reta, curva suave ou função degrau); a ordenação das distâncias
ajustadas dhi seria exatamente a mesma das distâncias originais Dhi e o valor da função objetivo (etapa 5) seria
zero.

Função 5) Meça a qualidade do ajuste da regressão usando uma função objetiva. Todas as funções objetivas usadas
objetiva no nMDS são baseadas na soma das diferenças quadradas dˆ entre os valores ajustados e os valores
correspondentes previstos pela função de regressão; esta é a soma usual dos resíduos
oi quadrados da análise de
dhi
regressão (critério dos mínimos quadrados, Subseção 10.3.1). Várias variantes foram propostas e são usadas em
programas nMDS:

2 2
Estresse (fórmula 1) = )oi,
( dhi
) dˆ – oi ÿ)
oi ,eu
dhi (9.49)

2 2
Estresse (fórmula 2) = )oi,
( dhi
) dˆ – oi ÿ)
oi ,eu
dhi ( ) – d (9,50)
Machine Translated by Google

516 Ordenação em espaço reduzido

2 2
2
Estresse =
)
oi ,eu
( ) – dhidˆoi (9.51)

Os denominadores nas duas fórmulas de Estresse (eqs. 9.49 e 9.50) são termos escalonados que
tornam as funções objetivo adimensionais e produzem valores de Estresse entre 0 e 1. Essas funções
objetivo podem aplicar a raiz quadrada, ou não, sem alterar a questão; uma configuração que minimiza
essas funções objetivas também minimizaria as formas sem raiz quadrada. Outros critérios objetivos,
como Strain, foram propostos. Todas as funções objetivas medem o quão longe a configuração de
espaço reduzido está de ser monotônica para as distâncias originais Dhi. Seus valores são apenas
relativos, medindo a diminuição da falta de ajuste entre as iterações do procedimento de cálculo.

6) Melhore a configuração movendo-a levemente no sentido de diminuir a tensão. Isso é feito por
um algoritmo de otimização numérica chamado método de descida mais íngreme; o método é explicado,
Descida por exemplo, em Numerical Recipes (Press et al., 2007) e em Kruskal (1964b). A direção da descida
mais íngreme mais íngreme é a direção no espaço de soluções ao longo da qual a tensão diminui mais rapidamente.
Essa direção é encontrada analisando as derivadas parciais da função de tensão (Carroll, 1987). A
ideia é mover os pontos no gráfico de ordenação para novas posições que provavelmente diminuirão
o estresse mais rapidamente.

7) Repita os passos 3 a 6 até que a função objetivo atinja um valor pequeno e pré-determinado
(falta de ajuste tolerado), ou até que a convergência seja alcançada, ou seja, até que atinja um mínimo
e nenhum progresso adicional possa ser feito. As coordenadas calculadas na última passagem pelo
passo 6 tornam-se as coordenadas dos n objetos nas m dimensões da ordenação de escala
multidimensional.

8) A maioria dos programas nMDS gira a solução final usando a análise de componentes principais,
para facilitar a interpretação.

Na maioria das situações, os usuários do nMDS decidem que desejam uma representação dos
objetos em duas ou três dimensões, para ilustração ou outro propósito. Em alguns casos, porém,
questiona-se qual seria o “melhor” número de dimensões para um conjunto de dados, ou seja, qual
seria o melhor compromisso entre um resumo dos dados e uma representação precisa das distâncias.
Conforme apontado por Kruskal & Wish (1978), determinar a dimensionalidade de uma ordenação
nMDS é tanto uma questão substantiva quanto uma questão estatística. Os aspectos substantivos
dizem respeito à interpretabilidade dos eixos, facilidade de uso e estabilidade da solução. O aspecto
estatístico é mais fácil de abordar, pois o estresse pode ser usado como um guia para a
dimensionalidade. Trace os valores de tensão em função da dimensionalidade das soluções, usando
uma das fórmulas de tensão acima (eqs. 9.49 a 9.51). Como a tensão diminui à medida que a
dimensionalidade aumenta, escolha para a solução final a dimensionalidade onde a mudança na
tensão se torna pequena.

Para dados de contagem de espécies, Faith et al. (1987) mostraram, por meio de simulações, que
a seguinte estratégia produz resultados de ordenação informativos: (1) padronizar os dados por
Machine Translated by Google

Escalonamento multidimensional não métrico (nMDS) 517

dividindo cada valor pela abundância máxima para aquela espécie no conjunto de dados; (2)
usar a medida de similaridade Steinhaus (S17) ou Kulczynski (S18) ; (3) calcular a ordenação
por nMDS.

Além das vantagens mencionadas acima para o tratamento de distâncias não métricas ou
matrizes não simétricas (consulte também as Seções 2.3 e 8.10 sobre este tópico), Gower (1966)
apontou que o nMDS pode resumir distâncias em menos dimensões do que a análise de
coordenadas principais (ou seja, menor tensão em, digamos, duas dimensões). Os resultados
dos dois métodos podem ser comparados examinando os diagramas de Shepard dos resultados
obtidos por PCoA e nMDS, respectivamente. Se a dispersão de pontos no diagrama de Shepard
para PCoA for estreita, como na Fig. 9.1a ou b, a ordenação de espaço reduzido é útil porque
reflete corretamente as posições relativas dos objetos. Se a dispersão for ampla ou quase
circular (Fig. 9.1c), o diagrama de ordenação é de pouca utilidade e pode-se tentar o nMDS para
encontrar uma solução mais satisfatória em algumas dimensões. Uma solução de PCoA
permanece mais fácil de calcular na maioria dos casos, no entanto, porque não requer várias
execuções e é obtida usando um algoritmo de autoanálise direta em vez de um procedimento iterativo.

Exemplo numérico 1 (continuação das Subseções 9.2.5 e 9.3.5). A matriz de distância de diferença percentual (D14)
calculada na Tabela 9.11 foi submetida à análise nMDS usando o pacote DECODA escrito por Peter R. Minchin. Este
programa nMDS usa a fórmula Stress 1 (eq. 9.49). Corridas repetidas, usando m = 2 dimensões, mas diferentes
configurações iniciais aleatórias, produziram resultados muito semelhantes; o melhor tinha um valor de tensão de 0,0181
(Fig. 9.21a).

A abordagem secundária de Kruskal, explicada com a etapa de cálculo 4 acima, foi usada na Fig. 9.21b para todos
os valores empatados encontrados quando Dhi < Dmax, enquanto a abordagem primária foi usada quando Dhi = Dmax =
1. A justificativa para isso decorre do fato de que as distâncias empíricas Dhi são bloqueadas por um teto artificial Dmax
da função de distância, sobre a qual não podem aumentar. Assim, não se espera que pares de sítios empatados na
distância Dmax = 1, para os quais dhi seja maior que o valor anterior, tenham a mesma distância na ordenação. daí esses
valores dˆ ,

não devem contribuir para o estresse, apesar de seus laços.

Usando D14 como medida de distância, ao invés de D14, produziu uma ordenação idêntica, pois nMDS é invariante
a transformações monotônicas das distâncias. O valor do estresse não

também muda, porque a transformação de raiz quadrada de D14 afeta apenas a abcissa da Fig. 9.21b, enquanto a tensão
é calculada ao longo da ordenada. O efeito de arco encontrado na Fig. 9.18a não aparece na Fig. 9.21a. O eixo horizontal
da ordenação nMDS reproduz o gradiente original quase perfeitamente neste exemplo.

Os pontos em um gráfico nMDS podem ser girados, transladados, invertidos ou dimensionados a posteriori de
qualquer maneira considerada apropriada para alcançar a máxima interpretabilidade ou para ilustrar os resultados. Isso
pode ser feito manualmente ou, por exemplo, por meio da análise canônica dos eixos nMDS em relação a um conjunto de
variáveis explicativas (Capítulo 11).

Com os dados presentes, uma ordenação unidimensional (stress = 0,1089) reconstruiu perfeitamente o gradiente dos
sites 1 a 19; a mesma ordenação sempre foi obtida ao repetir a execução de diferentes configurações iniciais aleatórias e
cascateando de 3 para 2 para 1 dimensões. Essa configuração e o baixo valor de tensão dificilmente foram obtidos ao
realizar a ordenação nMDS diretamente em uma dimensão, sem o procedimento em cascata.
Machine Translated by Google

518 Ordenação em espaço reduzido

3.0
(b)
(a) 2.5
1,0

5 4 15 16 14 2.0
0,5 6

3 17 1,5
7 13
Distâncias
ajustadas
MDS
ddhi)
(em
2-

0,0
2 18
8 12 1,0
-0,5
1 19
9 11
0,5
10
-1,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
0,0
0,0 0,2 0,4 0,6 0,8 1,0

Distâncias empíricas (Dhi)

Figura 9.21 (a) Ordenação nMDS (2-dimensional) da matriz de distância D14 na Tabela 9.11. Os locais de amostragem são
numerados como na Fig. 9.10 e na Tabela 9.7. (b) Diagrama de Shepard da solução final (2-dimensional)
mostrando a linha de regressão monótona ajustada por regressão não paramétrica. A dispersão sobre a
linha é medida por uma função de tensão (eq. 9.49 a 9.51).

Aplicação ecológica 9.4a

Sprules (1980) usou escalonamento multidimensional não métrico para analisar mudanças sazonais em
conjuntos de zooplâncton em um local localizado no Lago Blelham, no Lake District do norte da Inglaterra, e
em dois recintos experimentais construídos naquele lago. Os três locais foram pesquisados semanalmente
de junho a dezembro de 1976. O nMDS foi preferido ao PCA porque as respostas das espécies aos
gradientes ambientais não podem ser consideradas lineares.

Para cada local, os pontos no diagrama de ordenação nMDS foram conectados em ordem cronológica
para refletir as mudanças sazonais na composição faunística. O gráfico (não reproduzido aqui) é, portanto,
do mesmo tipo da Fig. 12.24. Em um dos recintos, a assembléia oscilou em torno de um valor médio sem
nenhum ciclo claro; espécies de pequeno porte dominaram a assembléia. No outro recinto e no lago, as
mudanças foram mais direcionais; nesses locais, os predadores eram mais abundantes. Com base nas
evidências disponíveis, Sprules concluiu que as diferenças observadas entre os dois padrões de mudança
sazonal estavam relacionadas a diferenças na intensidade da predação, qualidade dos alimentos disponíveis
aos herbívoros e dinâmica dos nutrientes.

Aplicação ecológica 9.4b

Redford e outros. (2010) estudaram as bactérias que vivem nas superfícies das folhas de 56 espécies de
árvores encontradas no campus da Universidade do Colorado em Boulder, Colorado, EUA. As comunidades
bacterianas foram caracterizadas por pirosequenciamento com código de barras. Os autores analisaram o intra
Machine Translated by Google

Programas 519

e variação entre espécies de árvores na composição da comunidade bacteriana. Eles descobriram que as
comunidades bacterianas são mais semelhantes dentro de uma determinada espécie de árvore e entre
espécies intimamente relacionadas do que entre espécies hospedeiras filogeneticamente distantes. Os
resultados foram ilustrados por gráficos nMDS calculados a partir de matrizes de distâncias filogenéticas e
de ecologia de comunidades entre comunidades bacterianas. Os autores também compararam as
comunidades bacterianas encontradas em agulhas de Pinus ponderosa de diferentes locais com distâncias
geográficas variando de 10 m a mais de 10.000 km; as floras bacterianas das folhas de outras três espécies
de árvores de Boulder foram incluídas nesta análise. Os autores descobriram que as comunidades
bacterianas eram mais semelhantes entre as árvores P. ponderosa de diferentes locais do que entre
diferentes espécies hospedeiras do campus da Universidade do Colorado em Boulder.

Aplicação ecológica 9.4c

A relação entre a composição da comunidade de serpentes (46 locais de amostragem, 43 espécies) e as


variáveis ambientais foi investigada por de Fraga et al. (2011) em uma porção de 25 km2 da Reserva Ducke
perto de Manaus (Amazonas, Brasil) na floresta tropical. Os autores calcularam o primeiro eixo nMDS de
uma matriz de distância baseada na presença-ausência da espécie (índice de Chao, Subseção 7.3.4) e o
relacionaram com a distância dos riachos em um diagrama de dispersão. A parcela mostrou que a
composição da comunidade de serpentes foi bastante semelhante entre os locais próximos aos riachos,
mas variou muito mais para distâncias superiores a 100 m dos riachos. A ordenação direta dos dados de
presença e ausência de 26 espécies de serpentes comuns em todas as parcelas indicou uma substituição
gradual de espécies com a distância dos riachos.

Muitas aplicações ecológicas de escala multidimensional não métrica são encontradas na literatura
ecológica. Dois artigos são especialmente interessantes: Whittington & Hughes (1972; biogeografia
ordoviciana a partir da análise da fauna trilobita) e Fasham (1977; comparação de escala
multidimensional não métrica, análise de coordenadas principais e análise de correspondência para a
ordenação de cenóclinos e cenóplanos simulados). O aplicativo ecológico 12.6b (Subseção 12.6.5)
apresenta um gráfico nMDS.

9.5 Software

Todos os pacotes estatísticos de uso geral oferecem análise de componentes principais, mas não com
opções para escalas usadas por ecologistas. Entre os pacotes especializados recomendados para
análise ecológica estão CANOCO* (ter Braak & Smilauer, 1998 e edições posteriores), PC-ORD e SYN-
TAX 2000. Para distribuição desses programas, consulte
Seção 11.7.

* CANOCO foi muitas vezes referido neste capítulo. Foi o primeiro programa a oferecer aos ecologistas
toda uma gama de métodos de ordenação simples e canônicos e ainda é a referência para desenvolvedores
de programas de ordenação.
Machine Translated by Google

520 Ordenação em espaço reduzido

Vários pacotes da linguagem R oferecem funções para ordenação de dados multivariados.

1. Análise de componentes principais (PCA). — Funções dudi.pca() em ADE4, PCA() em


FACTOMINER, pca() em LABDSV, prcomp() em STATS e rda() em VEGAN compute PCA.
Compare os autovalores do PCA com o modelo do palito quebrado (eq. 9.16): PCAsignificance()
em BIODIVERSIDADER e bstick() em VEGAN. Um biplot PCA com um círculo de contribuição
de equilíbrio é desenhado por ordiequilibriumcircle() de BIODIVERSITYR. Fuzzy PCA e CA
estão disponíveis em dudi.fca() do ADE4.

2. Análise de correspondência (CA). — Funções dudi.coa() de ADE4, ca() de CA, CA() de


FACTOMINER, corresp() de MASS e cca() de VEGAN compute CA. Análise de correspondência
múltipla (MCA): funções dudi.acm() de ADE4, mjca() de CA, MCA() de FACTOMINER e mca()
de MASS.

3. Análise de coordenadas principais (PCoA). — Funções dudi.pco() de ADE4, pcoa() de APE,


pco() de ECODIST, pco() de LABDSV, pcoa() e pcoa.all() de PCNM, cmdscale() de STATS e
wcmdscale() de PCoA de computação VEGAN . A função pcoa.all() do pacote PCNM permite o
cálculo de coordenadas principais a partir de matrizes de distância com diagonais diferentes de
zero, o que será útil na Seção 14.2. Ele também contém uma opção para exibir os autovetores
correspondentes aos autovalores negativos; nesse caso, os autovetores não são dimensionados
para comprimentos de &k , pois isso produziria vetores complexos, mas são mantidos normalizados
para comprimentos 1. A função is.euclid() do ADE4 verifica a natureza euclidiana das matrizes
de distância; ver Tabelas 7.2 e 7.3.

4. Escalonamento multidimensional não métrico (nMDS). — Funções nmds() de ECODIST,


nmds() de LABDSV, isoMDS() de MASS e metaMDS() de VEGAN computam nMDS.

Funções R para PCA e CA que seguem e ilustram a álgebra descrita em


As seções 9.1 e 9.2 estão disponíveis na página http://numericalecology.com/rcode/.

Você também pode gostar