Escolar Documentos
Profissional Documentos
Cultura Documentos
Capítulo
9 Ordenação em
espaço reduzido
Ordenação (do latim ordinatio, a ação de colocar em ordem) é o arranjo de unidades em alguma ordem.
Ordenação Gower (1984) aponta que o termo ordenação, amplamente utilizado em estatística multivariada, na verdade
vem da ecologia onde se refere à representação de objetos (locais, estações, relevés, etc.) como pontos
ao longo de um ou vários eixos de referência. Em 1954, o ecologista de vegetação David Goodall foi o
primeiro a aplicar a análise fatorial na ecologia de comunidades. Goodall propôs o termo “ordenação” para
designar esse tipo de análise, termo hoje amplamente utilizado em livros e publicações de ecologia
comunitária. A ordenação consiste em plotar pontos-objetos ao longo de um eixo que representa uma
relação ordenada ou formar um diagrama de dispersão com dois ou mais eixos. As relações ordenadas
costumam ser quantitativas, mas bastaria que fossem do tipo “maior que”, “igual a” ou “menor que” (relações
semiquantitativas) para servir de base para ordenações, como é o caso em nMDS (Seção 9.4).
Em ecologia, vários descritores são geralmente observados para cada objeto em estudo. Na maioria
dos casos, os ecologistas estão interessados em caracterizar as principais tendências de variação dos
objetos em relação a todos os descritores, não apenas a alguns deles. Observar gráficos de dispersão dos
objetos em relação a todos os pares possíveis de descritores é uma abordagem tediosa, que geralmente
não lança muita luz sobre o problema em questão. Em contraste, a abordagem multivariada consiste em
representar a dispersão de objetos em um diagrama multidimensional, com tantos eixos quantos forem os
descritores no estudo. No entanto, não é possível desenhar tal diagrama no papel com mais de duas ou
eventualmente três dimensões, embora seja uma construção matemática perfeitamente válida. Para fins
de análise, os ecologistas, portanto, projetam o diagrama de dispersão multidimensional em gráficos
bivariados cujos eixos são conhecidos por serem de particular interesse. Os eixos desses gráficos são
escolhidos para representar uma grande fração da variabilidade da matriz de dados multidimensional, em
um espaço com dimensionalidade reduzida (ou seja, menor) em relação ao conjunto de dados original.
Métodos de ordenação em espaço reduzido também permitem
Machine Translated by Google
Tabela 9.1 Domínios de aplicação dos métodos de ordenação apresentados neste capítulo.
A ordenação em espaço reduzido é muitas vezes referida como análise de fator (ou
inércia) , uma vez que se baseia na extração dos autovetores ou fatores da matriz de associação.
A análise fatorial sensu stricto é usada principalmente nas ciências sociais; visa representar
a estrutura de covariância dos descritores em termos de um modelo causal hipotético. Não é
discutido mais adiante neste livro.
Muitas vezes acontece que a estrutura dos objetos em estudo não é contínua. Nesse caso, uma ordenação em
espaço reduzido, ou um diagrama de dispersão produzido a partir de duas variáveis importantes, pode ser suficiente
para evidenciar a estrutura de grupo dos objetos.
Os métodos de ordenação podem, portanto, às vezes ser usados para delinear grupos de objetos (Fig. 8.1,
Subseção 8.7.3). As ordenações também podem ser usadas como complementos para análises de cluster. A razão
é que o agrupamento investiga distâncias par a par entre objetos, procurando relações finas, enquanto a ordenação
em espaço reduzido considera a variabilidade de toda a matriz de associação e, assim, revela gradientes gerais.
Diferentes métodos para sobrepor os resultados do agrupamento em ordenações dos mesmos objetos são descritos
na Seção 10.1.
Os ecologistas geralmente usam métodos de ordenação para estudar as posições relativas dos objetos no
Reduzido espaço reduzido. Um aspecto importante a considerar é a representatividade da representação em espaço reduzido,
espaço que costuma ter d = 2 ou 3 dimensões. Até que ponto o espaço reduzido preserva as relações de distância entre os
objetos? Para responder a isso, pode-se calcular as distâncias entre todos os pares de objetos, tanto no espaço
multidimensional dos descritores p originais quanto no espaço d-dimensional reduzido. Os valores resultantes são
plotados em um diagrama de dispersão como na Fig. 9.1. Quando a projeção no espaço reduzido responde por
uma alta fração da variância, as distâncias entre as projeções dos objetos no espaço reduzido são bastante
semelhantes às distâncias originais no espaço multidimensional (caso a). Quando a projeção é menos eficiente, as
distâncias entre os objetos no espaço reduzido são muito menores do que no espaço original. Duas situações
podem então ocorrer. Quando os objetos estão em distâncias proporcionalmente semelhantes nos dois espaços
(caso b), a projeção ainda é útil mesmo que represente uma pequena fração da variância. Quando, porém, as
posições relativas dos objetos não são as mesmas nos dois espaços (caso c), a projeção é inútil. Os ecologistas
muitas vezes desconsideram a interpretação das ordenações quando o espaço reduzido não responde por uma alta
fração da variância. Isso não é totalmente justificado, pois uma projeção em espaço reduzido pode ser informativa
mesmo que esse espaço represente apenas uma pequena fração da variância (caso b).
Diagrama O diagrama de dispersão da Fig. 9.1, frequentemente referido como diagrama de Shepard (Shepard, 1962;
de Shepard diagramas no artigo de Shepard tiveram seus eixos transpostos em relação à Fig. 9.1), pode ser usado para estimar
a representatividade das ordenações obtidas usando qualquer redução -método de ordenação espacial. Na análise
de componentes principais (Seção 9.1), as distâncias entre os objetos, tanto no espaço multidimensional dos
descritores originais quanto no espaço reduzido, são calculadas usando distâncias euclidianas ( D1, eq. 7.32). A
matriz F de componentes principais (eq. 9.4 abaixo) dá as coordenadas dos objetos no espaço reduzido. Na análise
de coordenadas principais (Seção 9.3) e escalonamento multidimensional não métrico (Seção 9.4), as distâncias
euclidianas entre os objetos no espaço reduzido são comparadas com as distâncias Dhi encontradas na matriz D
usada como base para calcular a ordenação. Na análise de correspondência (Seção 9.2), é a distância !2 (D16, eq.
7.55) entre os objetos que é usada na abcissa do diagrama de Shepard. Diagramas do tipo Shepard também podem
ser construídos para análise de cluster (Fig. 8.24).
Machine Translated by Google
dhi)
(a)
(b)
Distância
reduzido
espaço
em
(
45° (c)
Figura 9.1 Diagrama de Shepard. Três situações encontradas na comparação de distâncias entre objetos, no espaço
p-dimensional dos p descritores originais (abcissas) versus o espaço d-dimensional reduzido (ordenadas).
A figura mostra apenas os contornos da dispersão de pontos. (a) A projeção em espaço reduzido responde
por uma alta fração da variância; as posições relativas dos objetos no espaço reduzido d-dimensional são
semelhantes às do espaço p-dimensional. (b) A projeção responde por uma pequena fração da variância,
mas as posições relativas dos objetos são semelhantes nos dois espaços. (c) O mesmo que (b), mas as
posições relativas dos objetos diferem nos dois espaços. Adaptado de Rohlf (1972). Compare com a Fig.
8.24.
(S – "kI) uk = 0 (9.1)
#S – "kI# = 0 (9.2)
Autovalor é usado para calcular os autovalores "k. Os autovetores uk associados aos autovalores "k são
Autovetor encontrados colocando os diferentes valores "k por sua vez na eq. 9.1. Esses autovetores são os
eixos principais da matriz de dispersão S (Seção 4.4). os autovetores são normalizados (ou seja,
dimensionados para comprimento unitário, Seção 2.4) antes de calcular os componentes principais,
que fornecem as coordenadas dos objetos nos eixos principais sucessivos. A análise de
Componentes principais
componentes principais (PCA) foi originalmente descrita por Pearson (1901), embora seja mais
frequentemente atribuído a Hotelling (1933), que o propôs de forma independente. O método e
várias de suas implicações para a análise de dados são apresentados no artigo seminal de Rao
(1964). O PCA possui as seguintes propriedades, que o tornam uma ferramenta poderosa para a
análise de dados ecológicos:
1) Como qualquer matriz de dispersão S é simétrica, seus eixos principais uk são ortogonais
entre si. Em outras palavras, eles correspondem a direções linearmente independentes no elipsóide
de concentração da distribuição de objetos (Seção 2.9).
2) Os autovalores "k de uma matriz de dispersão S são todos positivos ou nulos porque S é
positivo semidefinido (Seção 4.1, Tabela 2.2). PCA não produz autovalores negativos. Os autovalores
representam as quantidades de variância dos dados ao longo do principal sucessivo eixos (Seção
4.4).
3) Por causa das duas primeiras propriedades, a análise de componentes principais pode
muitas vezes resumir, em poucas dimensões, a maior parte da variabilidade de uma matriz de
dispersão de um grande número de descritores. Ele também fornece uma medida da quantidade de
variância explicada por esses poucos eixos principais independentes.
A presente seção mostra como calcular as relações entre objetos e entre descritores, bem como
as relações entre os eixos principais e os descritores originais. Um exemplo numérico simples é
desenvolvido, envolvendo cinco objetos e dois descritores quantitativos:
21 3.2– 1.6–
34 2.2– 1.4
S= 50 Depois de centralizar na coluna significa, Yc = [ ] yy – = 0,2– 2,6–
76 1,8 3,4
92 3,8 0,6–
y2 y2
(y2 - y2)
6
(a) 6
(b)
4 4
2 2
(a1 – a1)
0 0
y1 y1
0 2 4 6 8 10 0 2 4 6 8 10
y2
(y2 - y2)
II (c) (d)
6 II
2 EU
4 2
1
4
1
EU 2
–4 –2 2 4 2 (a1 – a1)
–1
–2
–1
–2
26° 34' –2
0 –4
0 2 4 6 8 10 y1
Figura 9.2 Exemplo numérico de análise de componentes principais. (a) Cinco objetos são plotados em
relação aos descritores y1 e y2. (b) Após centralizar os dados, os objetos agora são plotados
em relação ey1
referência a ( y1
) –y2
( ) y2
– , representado por eixos tracejados. (c) Os objetos são traçados com
aos
eixos principais I e II, que são centrados em relação à dispersão de pontos. (d) Os dois sistemas
de eixos (b e c) podem ser sobrepostos após uma rotação de 26°34'.
1 8,2 1,6
S = =
-----------
Yc n 1– Yc' 1,6 5,8
Machine Translated by Google
Tem dois autovalores, "1 = 9 e "2 = 5. A variância total (soma dos valores diagonais) na matriz de
autovalores é a mesma que em S, mas é particionada de forma diferente: a soma das variâncias em
S, (8,2 + 5,8 = 14), é igual à soma dos autovalores, (9 + 5 = 14). "1 = 9 representa 64,3% da variância
e "2 compensa a diferença (35,7%). Existem tantos autovalores quanto descritores. Os autovalores
sucessivos respondem por frações progressivamente menores da variância.
(S – "kI) uk = 0
fornece os autovetores associados aos autovalores. Uma vez que esses vetores tenham sido
normalizados (ou seja, dimensionados para comprimento unitário, u'u = 1), eles se tornam as colunas
da matriz U:
0,8944 0,4472–
U=
0,4472 0,8944
Se um sinal diferente tivesse sido atribuído arbitrariamente a um dos termos da matriz U durante o
cálculo dos autovetores, uma imagem espelhada teria sido produzida para as Figs. 9.2c. Essa
imagem teria sido tão boa para representar os dados quanto a Fig. 9.2c.
É fácil verificar a ortogonalidade dos dois autovetores: seu produto vetorial u' 1u2 = (0,8944 × (–
Ortogonalidade 0,4472)) + (0,4472 × 0,8944) = 0. Além disso, a Seção 4.4 mostrou que os elementos de U são de
direção cossenos dos ângulos entre os descritores originais e os eixos principais. Usando esta
propriedade, descobre-se que o sistema de eixos principais especifica uma rotação de (arco cos
0,8944) = 26°34' do sistema de referência definido pelos descritores originais. Portanto, a Figura 9.2
mostra que a análise de componentes principais realizou uma rotação do sistema de eixos
(descritores) sem alterar as posições dos objetos uns em relação aos outros.
f = ++ = [ ] aa – i u1 (9.3)
i1 ( yi1( y1
) – u11 … sim ) – up1
p
Machine Translated by Google
Os valores ( cargas
) – são
uj1 são as coordenadas do objeto xi nos vários descritores centrados yij yj j e os valores
as
dos descritores no primeiro autovetor. As posições de todos os objetos em relação ao sistema de eixos
principais são dadas pela matriz F das variáveis transformadas. Também é chamada de matriz de
componentes principais:
Matriz de
FY = c
você (9.4)
componentes principais
onde U é a matriz de autovetores e Yc é a matriz de observações centradas. O sistema de eixos
principais é centrado em relação à dispersão dos objetos pontuais. Este não seria o caso se U tivesse
sido multiplicado por Y em vez da matriz centrada Yc, como em algumas formas especiais de análise
de componentes principais (PCA não centrada). Para o exemplo numérico, os componentes principais
são calculados da seguinte forma:
A variação das duas colunas de F são "1 = 9 e "2 = 5, respectivamente. Como as duas colunas da
matriz de pontuações dos componentes são as coordenadas dos cinco objetos em relação aos eixos
principais, elas podem ser usadas para plotar os objetos em relação aos eixos principais I e II (Fig.
9.2c). É fácil verificar (Fig. 9.2d) que, neste exemplo de dois descritores, os objetos são posicionados
pelos componentes principais da mesma forma que no sistema original de eixos-descritores. A análise
de componentes principais simplesmente girou os eixos em 26° 34' de forma que os novos eixos
correspondam aos dois componentes principais da variabilidade. Quando há mais de dois descritores,
como costuma acontecer em ecologia, a análise de componentes principais ainda realiza apenas uma
rotação do sistema de eixos-descritores, mas agora no espaço multidimensional. Nesse caso, os
componentes principais I e II definem o plano permitindo a representação da maior quantidade de
variância. Os objetos são projetados nesse plano de forma a preservar, tanto quanto possível, as
distâncias euclidianas relativas que possuem no espaço multidimensional dos descritores originais.
As posições relativas dos objetos no espaço p-dimensional girado dos componentes principais são
as mesmas do espaço p-dimensional dos descritores originais (Fig. 9.2d). Isso significa que as
Distância distâncias euclidianas entre os objetos (D1, eq. 7.32) foram preservadas pela rotação dos eixos. Essa
euclidiana importante propriedade da análise de componentes principais é observada na Tabela 9.1. A qualidade
da representação em um espaço euclidiano reduzido com apenas m dimensões (m $ p) pode ser
avaliada usando a seguinte razão:
m p
tipo R2 * + * +
Essa razão é equivalente a um coeficiente de determinação (R2, eq. 10.20) na análise de regressão. O
denominador da eq. 9,5 é realmente igual ao traço da matriz S (soma dos elementos diagonais). Assim,
com o exemplo numérico atual, uma representação dos objetos, apenas ao longo do primeiro
componente principal, daria conta de uma proporção 9/(9+5) = 0,643 da variância total na matriz de
dados. Este valor é idêntico ao dado na Subseção 9.1.1 para a fração da variância de Y que é
contabilizada por "1.
A análise de componentes principais fornece as informações necessárias para entender o papel dos
descritores originais na formação dos componentes principais. Também pode ser usado para mostrar
as relações entre os descritores originais. O papel dos descritores na análise de componentes principais
é agora examinado sob vários aspectos.
Os termos diagonais de U'U resultam do produto escalar dos autovetores consigo mesmos. Esses
valores são o (comprimento)2 dos autovetores, aqui igual à unidade porque os autovetores foram
escalados para 1. Os termos não diagonais, resultantes da multiplicação de dois autovetores diferentes,
são iguais a zero porque os autovetores são ortogonais. Este resultado seria o mesmo para qualquer
matriz U de autovetores normalizados calculados a partir de uma matriz simétrica. A matriz U é uma
matriz matriz quadrada ortonormal (Seção 4.4); várias propriedades de tais matrizes são descritas na Seção
ortonormal 2.8.
Da mesma forma, as relações entre descritores, que correspondem às linhas da matriz U, podem
ser estudadas através do produto UU'. Os termos diagonais e não diagonais de UU' têm o mesmo
significado que em U'U, exceto que agora dizem respeito às relações entre descritores. Este é o
Escala 1 escalonamento 1 do PCA, explicado com mais detalhes na Subseção 9.1.4. As relações entre as linhas
de uma matriz ortonormal quadrada são as mesmas que entre as colunas (Seção 2.8, propriedade 7),
de modo que:
UU' = eu (9.6)
Machine Translated by Google
2
u11 . . . u1 p -u1k = 1
. . .
você = . . . (9.7)
. . .
. 2
up1 . . para cima
-upk = 1
2 2
-uj1 = 1 . . =1
. -ujp
Existe uma segunda abordagem para o estudo das relações entre descritores.
Consiste em dimensionar os autovetores de tal forma que os cossenos dos ângulos entre
os eixos-descritores sejam proporcionais às suas covariâncias. Nesta abordagem, os
ângulos entre os eixos-descritores estão entre 0° (máxima covariância positiva) e 180°
(máxima covariância negativa); um ângulo de 90° indica uma covariância nula
(ortogonalidade). Esse resultado é obtido dimensionando cada autovetor k para um
Escala 2 explicado na Subseção 9.1.4. comprimento igual a *. Este é o escalonamento 2 do PCA,
ao seu desvio padrão "k Com esta escala para os autovetores, as distâncias euclidianas
entre os objetos não são preservadas.
* Em alguns pacotes de computador, o PCA apenas dimensiona os autovetores para comprimento e apenas"
fornece um gráfico dos eixos do descritor; nenhum gráfico dos objetos em espaço reduzido está disponível.
Machine Translated by Google
2
u11 "1 . . . u1 p "p ( -u1k "k ) = s1
. . .
Usc2 = U,1/2 = . . . (9.10)
. . .
2
up1 "1 . . . upp "p - =s
( upk "k ") p
2 2
"1( ) - uj1 = .. =
"1 . "p( ) - ujp "p
Os valores dos ângulos na inserção da Fig. 9.3a são assim: . = 26°34', / = 63°26', 0 =
26°34'. As correlações entre os descritores j e os eixos principais k são as mesmas da
escala 2 (abaixo) porque as duas escalas diferem apenas pelo alongamento dos eixos.
Na escala 1, as correlações entre os descritores são iguais a 0 porque os descritores são
ortogonais (isto é, em ângulos retos) nesta representação.
II II
1 y2 II
6 0
(a) 2 y2
/
(b)
0 EU
4 y2
. 1 0
y1
1 = 76° 35'
/
–1
2
–1 0 1 0 EU
0 EU
–1 y1
–2 y1
–2
–2 –1 0 1 2 3
–6 –4 –2 0 2 4
Figura 9.3 Exemplo numérico da Fig. 9.2. Os biplots de distância e correlação são discutidos na Subseção 9.1.4.
(a) Biplot de distância (escala 1). Os autovetores são dimensionados para comprimentos 1. Inserção:
descritores (matriz U). Gráfico principal: descritores (matriz U; setas) e objetos (matriz F; pontos). A
interpretação das relações objeto-descritor não se baseia em sua proximidade, mas em projeções
ortogonais (linhas tracejadas) dos objetos nos eixos-descritores ou suas extensões.
Os comprimentos das setas foram multiplicados por 4 para maior clareza do diagrama. (b) Biplot de
correlação (escala 2). Descritores (matriz U,1/2; setas) com um ângulo de covariância de 76°35'.
Objetos (matriz G; pontos). Projetar os objetos ortogonalmente em um descritor (linhas tracejadas)
reconstrói os valores dos objetos ao longo desses descritores, dentro de uma constante multiplicativa.
círculo de Um círculo de descritores em equilíbrio, com raio d pÿ , pode ser traçado como referência para
equilíbrio avaliar a contribuição de cada descritor para a formação do espaço reduzido (Fig. 9.4). O círculo
também é desenhado na inserção da Fig. 9.3a; seu raio é 2 2ÿ = 1 porque, no exemplo numérico, tanto
o espaço reduzido quanto o espaço total são bidimensionais. Se alguém estivesse interessado
apenas na contribuição de equilíbrio dos descritores para o primeiro eixo principal, o “círculo”
unidimensional teria então um “raio” de 1 2ÿ = 0,7071. Por exemplo, a projeção do primeiro descritor no
primeiro eixo principal é igual a 0,8944 (examine a matriz U e a Fig. 9.3a), de modo que este descritor
contribui de maneira importante para a formação do eixo I. Este não é o caso do segundo descritor, cuja
projeção no primeiro eixo é de apenas 0,4472.
3. Projeção de descritores em espaço reduzido, escala 2: matriz Usc2. — Os ecologistas que usam
a análise de componentes principais não estão interessados em todo o espaço multidimensional, mas
apenas em uma projeção simplificada dos objetos em um espaço reduzido (geralmente um plano
são
bidimensional). Os elementos ujk "k dos autovetores escalados para as coordenadas das "k
projeções dos descritores j nos diferentes eixos principais k.
Machine Translated by Google
comprimento = 1
projeção = 2/3
Figura 9.4 Projeção de equilíbrio, no plano, de três vetores ortogonais com comprimentos unitários, e círculo
de equilíbrio dos três descritores.
Eles são dimensionados de forma que as projeções dos eixos-descritores possam ser
desenhadas no espaço reduzido formado pelos eixos principais (Fig. 9.3b). Assim como na
escala 1, os descritores são representados por setas por serem eixos. Em um plano de
dimensão reduzida, as projeções dos eixos descritores são menores ou iguais aos seus
comprimentos no espaço multidimensional. No caso da Fig. 9.3b, os comprimentos são os
mesmos no plano de projeção e no espaço original porque este último tem apenas duas dimensões.
O comprimento real de um descritor no espaço reduzido pode ser comparado a essa medida, para
ajudar a julgar se a contribuição do descritor para o espaço reduzido é maior ou menor do que seria
sob a hipótese de uma contribuição igual para todos os eixos principais. Para o exemplo numérico, os
comprimentos das linhas da matriz Usc2 (eq. 9.8), no espaço bidimensional, são:
2
comprimento do primeiro descritor (linha) = 2,68332 ( +
) 1,0000– = 2,8636 = s1
Como esse exemplo numérico simples tem apenas duas dimensões, esses comprimentos são iguais
às suas contribuições de equilíbrio no espaço bidimensional. Isso é facilmente verificado, usando as
variâncias dos descritores, que são conhecidas (Subseção 9.1.1):
Em estudos reais, onde os conjuntos de dados ecológicos são multidimensionais, os comprimentos dos
descritores no espaço reduzido não são iguais às suas contribuições de equilíbrio.
Na escala 1 acima, a interpretação angular do produto de dois eixos descritores era simples: os
eixos descritores estavam em ângulos retos no espaço multidimensional. Na escala 2, o ângulo entre
dois descritores pode ser encontrado aplicando a eq. 2.9 às linhas da matriz de autovetores: o produto
escalar de duas linhas da matriz Usc2 (eq. 9.10) dividido pelo produto dos comprimentos das linhas
(que são os desvios padrão sj), dá o cosseno desse ângulo.
O produto escalar de duas linhas da matriz Usc2 está relacionado ao coeficiente de correlação dos
descritores correspondentes. Os ângulos entre todos os descritores são obtidos reduzindo à unidade
(ou seja = 1) os comprimentos dos vetores linha da matriz Usc2 = U,1/2, depois calculando a matriz de
produtos escalares entre as linhas:
[D(s) –1U,1/2] [D(s) –1U,1/2]' = D(s) –1 U,U'D (s) –1 = D(s) –1 S D(s) –1 = R (9,11)
}
S
O resultado desta equação é a matriz de correlação entre os descritores. No último passo da equação,
a matriz de correlação R é ligada à matriz de dispersão S pela matriz diagonal dos desvios padrão
D(s), seguindo a eq. 4.10.
em multidimensional
O cosseno do ângulo 1jl entre dois descritores yj e yl , espaço, está
portanto relacionado com a sua correlação (rjl); na verdade, pode-se mostrar que cos (1jl) = rjl. Este
ângulo é o mesmo da covariância porque a padronização das linhas para comprimentos unitários
mudou apenas os comprimentos dos eixos-descritores e não suas posições no espaço multidimensional.
Para o exemplo numérico, a correlação entre os dois descritores é igual a ÿ 1,6 8,2 5,8 × 0,232= (eq.
4,7). O ângulo
Machine Translated by Google
correspondente a esta correlação é (arco cos 0,232) = 76°35', que é o mesmo que o ângulo da
covariância na Fig. 9.3b.
Em outras palavras, a correlação é calculada ponderando o elemento do autovetor pela razão entre o
desvio padrão do componente principal e o do descritor. Para o exemplo numérico, essas correlações
e ângulos correspondentes são calculados usando a matriz U,1/2 (calculada acima) e os desvios
padrão dos dois descritores (s1 = 2,8636, s2 = 2,4083):
Os valores dos ângulos na Fig. 9.3b são assim: . = 20°26', / = 56°09', 0 = 33°51'. Essas correlações
podem ser usadas para estudar as contribuições dos descritores para os vários componentes, sendo
removidos os fatores de escala dos descritores. As maiores correlações (valores absolutos), na matriz
de correlação entre descritores e componentes, identificam os descritores que mais contribuem para
cada autovetor. A significância das correlações entre descritores e componentes não pode ser testada
usando um teste padrão para coeficientes de correlação de Pearson, entretanto, porque os
componentes principais são combinações lineares dos próprios descritores.
Quando os eixos descritores da matriz U,1/2 são dimensionados para comprimentos unitários, o
que é feito calculando [D(s) –1U,1/2] como na eq. 9.11, não é recomendado desenhar suas projeções
no espaço dos eixos principais. Isso ocorre porque os autovetores redimensionados não são
necessariamente ortogonais e podem ter qualquer comprimento:
As projeções dos eixos-descritores da matriz U,1/2 podem ser examinadas, em particular, com
relação aos seguintes pontos:
é respeitado; na verdade, são ápices de eixos-descritores, de modo que as relações entre eles são
definidas em termos de ângulos que representam suas correlações, não em termos de proximidades
(Fig. 9.5).
A projeção de um eixoujk
descritor
"k • j em um eixo principal k mostra sua covariância com o eixo principal
e, consequentemente, sua contribuição positiva ou negativa para a posição dos objetos ao longo do
eixo. Segue-se que um eixo principal pode frequentemente ser qualificado pelos nomes dos descritores
que mais contribuem, e de forma preferencial, para a sua formação.Assim, na Fig. 9.5, o eixo principal
I é formado principalmente pelos descritores 6 a 10 e o eixo II pelos descritores 1 a 4 .
• Os descritores que mais contribuem para a formação do espaço reduzido são aqueles cujos
comprimentos projetados atingem ou superam os valores de suas contribuições de equilíbrio.
Eixos-descritores claramente mais curtos que esses valores contribuem pouco para a formação do
espaço reduzido em estudo e, portanto, pouco contribuem para a estrutura que pode ser encontrada
na projeção dos objetos nesse espaço reduzido.
• As correlações entre os descritores são expressas pelos ângulos entre os eixos dos descritores,
não pelas proximidades entre seus ápices. No espaço reduzido, muitas vezes podem ser identificados
grupos de eixos-descritores que formam pequenos ângulos entre si, ou possuem ângulos próximos a
180° (cos 180° = –1, o que refletiria uma correlação negativa perfeita). Deve-se lembrar, entretanto,
que as projeções dos ângulos de correlação em um espaço reduzido não traduzem as correlações
completas entre as variáveis. Assim, pode ser informativo para descritores de agrupamento por
análise de agrupamento (Capítulo 8) de uma matriz de distância calculada como o complemento único
das correlações (D = 1 – cor(Y)) ou o complemento único dos valores absolutos do correlações.
• Objetos em biplots de escala 2 (ou correlação) podem ser projetados em ângulos retos nos eixos do
descritor para aproximar seus valores ao longo dos descritores (Fig. 9.3b). As distâncias entre os
objetos em um biplot de escala 2 não são aproximações de suas distâncias euclidianas; eles
aproximam suas distâncias de Mahalanobis (Subseção 9.1.4).
Tabela 9.2 Análise do componente principal. Propriedades principais para descritores centrados j.
Escala 1 Escala 2
(biplot de distância) (biplot de correlação)
a presente seção, que produz uma solução PCA em duas dimensões, a tabela possui apenas
duas colunas:
Os valores de R2 na última coluna são sempre 1 no PCA. Resultados idênticos podem ser
computados diretamente da matriz Usc2: os coeficientes encontrados naquela matriz (eq. 9.8)
são elevados ao quadrado e somados cumulativamente da esquerda para a direita; então a
soma acumulada para a linha j é dividida pela variância total do descritor j. Essa tabela se
mostra muito útil para a interpretação de análises envolvendo muitas variáveis, em particular no
caso de assembleias ricas em espécies em estudos de comunidades: permite decidir quais
espécies estão bem ajustadas e devem ser representadas, por exemplo, em uma escala
bidimensional PCA biplot (Subseção 9.1.4). Esta tabela de saída está disponível no programa
CANOCO , onde é chamada de “Ajuste cumulativo por espécie como fração de variância de espécie”.
Os objetos são vetores no espaço A multivariado (Fig. 7.2) e os vetores têm comprimentos
(Seção 2.4). O comprimento ao quadrado de cada objeto, calculado como a soma dos valores
ao quadrado na matriz Yc submetida ao PCA, é o valor de referência. Um comprimento quadrado
total idêntico pode ser calculado usando a matriz F em vez de Yc. Use a matriz F para calcular o
Machine Translated by Google
Este tipo de tabela de saída é útil para decidir quais objetos são bem representados em um gráfico PCA:
as distâncias entre objetos bem representados podem ser confiáveis e interpretadas.
Uma tabela relacionada chamada “Comprimento residual quadrado por amostra” está disponível na
saída do programa CANOCO; ele fornece valores residuais quadrados em vez de valores relativos ou
ajuste percentual.
4 — Biplots PCA
As duas subseções anteriores mostraram que, na análise de componentes principais, tanto os eixos-
descritores quanto os vetores-objetos podem ser plotados no espaço reduzido. Isso levou Jolicoeur &
Mosimann (1960) a plotar essas projeções juntas no mesmo diagrama.
Gabriel (1971) propôs o nome biplot para esses diagramas e desenvolveu a teoria dos biplots em Gabriel
(1971, 1982). Outros contribuidores importantes para a teoria dos biplots são ter Braak (1983 e outros
artigos) e Gower (1990 e outros artigos).
Detalhes matemáticos sobre a teoria dos biplots PCA são encontrados em Greenacre (2010) e Gower et
al. (2011); esses livros oferecem funções R para produzir vários tipos de biplots.
Dois tipos de biplots podem ser usados para representar os resultados do PCA (Gabriel, 1982; ter
Braak, 1994). Os biplots de distância representam graficamente as matrizes U (autovetores escalados
para comprimentos 1) e F (eq. 9.4); em F, a variância do componente principal (coluna) k é "k Biplots .
de correlação usam a matriz Usc2 para descritores, onde o autovetor k é dimensionado para comprimento
, objetos, onde
"kpara
e a matriz G
G = F,–1/2 (9.14)
As matrizes F e U, ou G e Usc2, podem ser usadas juntas em biplots porque os produtos dos
autovetores com as matrizes de pontuação do objeto reconstroem a matriz original (centrada) Y
perfeitamente:
FU' = Y e G(U,1/2)' = Y.
Na verdade, os autovetores e vetores de pontuação de objeto podem ser multiplicados por qualquer
constante sem alterar a interpretação de um biplot PCA.
Biplot de • Biplot de distância, escala 1 (Fig. 9.3a). — As principais características de um biplot de distância
são as seguintes: (1) Distâncias entre objetos no biplot são aproximações de suas distâncias
distância (escalaeuclidianas
1) no espaço multidimensional. (2) Projetar um objeto em ângulo reto em um descritor
aproxima a posição do objeto ao longo desse descritor. (3) Como os descritores têm comprimento 1
no espaço full-dimensional (eq. 9.7), o comprimento da projeção de um descritor no espaço reduzido
indica o quanto ele contribui para a formação desse espaço. (4) Os ângulos entre os eixos descritores
não têm sentido.
Biplot de • Biplot de correlação, escala 2 (Fig. 9.3b). — As principais características de um biplot de correlação
são as seguintes: (1) As distâncias entre objetos no biplot são aproximações de suas distâncias de
correlação (escala 2)
Mahalanobis no espaço multidimensional; eles não são aproximações de suas distâncias euclidianas.
(2) Projetar um objeto em ângulo reto em um descritor aproxima a posição do objeto ao longo desse
descritor. (3) Como os descritores têm comprimentos sj no espaço full-dimensional (eq. 9.10), o
comprimento da projeção de um descritor no espaço reduzido é uma aproximação de seu desvio
padrão. (4) Os ângulos entre os descritores no biplot refletem suas correlações. (5) Quando as
relações de distância entre os objetos são importantes para a interpretação, esse tipo de biplot é
inadequado; um biplot de distância deve ser usado.
Para o exemplo numérico, a matriz G é calculada a partir da eq. 9.14 da seguinte forma:
Pode-se verificar que as colunas de G possuem variâncias unitárias. Neste exemplo particular, as
relações entre objetos e descritores são totalmente representadas em um espaço bidimensional.
Os leitores são convidados a repetir o PCA usando descritores padronizados e verificar o fato de
que as distâncias euclidianas entre objetos na matriz G
Machine Translated by Google
são as mesmas para descritores não padronizados e padronizados: em ambos os casos, são
as distâncias de Mahalanobis entre os objetos na matriz Y.
As coordenadas do descritor geralmente devem ser multiplicadas por uma constante para
produzir uma exibição visual clara. Na Fig. 9.3a, por exemplo, os comprimentos das setas
descritoras seriam muito curtos para uma avaliação visual se fossem plotados no mesmo
sistema de coordenadas dos objetos. No software de computador, o redimensionamento dos
descritores é feito pela função PCA ou pela função de plotagem. Alguns pesquisadores foram
tentados a interpretar as relações entre objetos e descritores em termos de sua proximidade
no espaço reduzido, enquanto uma interpretação correta requer a projeção dos objetos nos
eixos-descritores (centrados em relação à dispersão dos pontos) ou em suas extensões (Fig.
9.3a). Na Fig. 9.2a, por exemplo, não passaria pela cabeça interpretar a relação entre os
objetos e o descritor y1 em termos da distância entre os pontos-objetos e o ápice (cabeça da
seta) do eixo y1. Na Fig. 9.3a, a posição do ápice de y1 é arbitrária e depende da constante
multiplicativa usada.
As projeções de objetos em um eixo especificam as coordenadas dos objetos em relação a
esse eixo descritor, levando em consideração a constante multiplicativa.
Em uma matriz R , todos os elementos diagonais são iguais a 1. Segue-se que a soma dos
autovalores, que corresponde à variância total da matriz de dispersão, é igual à ordem de R,
dada pelo número de descritores p. Antes de calcular os componentes principais, pode ser
uma boa prática verificar que R 2 I (eq. 4.14).
Os componentes principais extraídos das matrizes de correlação não são iguais aos
calculados das matrizes de dispersão. [Cuidado: alguns pacotes de computador permitem
apenas o cálculo de componentes principais a partir de matrizes de correlação; isso é
inadequado para muitos estudos.] Considere a equação básica para os autovalores e
autovetores, (S – "k I) uk = 0. A soma dos autovalores de S é igual à soma das variâncias s 2,
enquanto a soma de autovalores de R é igual a p, de modo que os autovalores das duas
matrizes, e portanto também seus autovetores, são necessariamente diferentes, devido ao
fato de que as distâncias entre os objetos não são as mesmas nas duas análises.
o espaço dos descritores originais varia de acordo com as escalas de medida. Quando os
descritores são todos do mesmo tipo e ordem de grandeza, e possuem as mesmas unidades, fica
claro que a matriz S deve ser usada para calcular o PCA. Nesse caso, os autovetores, por um lado,
e os coeficientes de correlação entre descritores e componentes, por outro lado, fornecem
informações complementares. Os primeiros fornecem as cargas dos descritores e os segundos
quantificam sua importância relativa. Quando os descritores são de diferentes tipos ou ordens de
grandeza, ou possuem unidades diferentes, deve-se conduzir o PCA na matriz R ao invés da matriz
S.
• Caso se queira agrupar os objetos no espaço reduzido, o agrupamento deve ser feito em relação
aos descritores originais (ou qualquer transformação destes descritores; Seção 1.5), preservando
assim suas diferenças de magnitude? Ou todos os descritores devem contribuir igualmente para o
agrupamento de objetos, independentemente da variância exibida por cada um? Na segunda
instância, deve-se partir da matriz de correlação. Uma alternativa neste caso é transformar os
descritores por variação, usando a eq. 1.10 para descritores de escala relativa e eq. 1.11 para
descritores de escala intervalar e realizar a análise na matriz S dos descritores transformados.
Outra maneira de olhar para o mesmo problema foi sugerida por Gower (1966):
• A distância euclidiana (eq. 7.32) é a distância preservada entre os objetos por meio da análise de
componentes principais. É com os dados brutos (covariâncias) ou com os dados padronizados
(correlações) que a configuração espacial dos objetos, em termos de distâncias euclidianas, é mais
interessante para interpretação? No primeiro caso, conduza o PCA na matriz S; no segundo caso,
use a matriz R.
aa- _
F = ----------- (9.15)
Você
A análise de componentes principais ainda é apenas uma rotação do sistema de eixos (Subseção
9.1.2). No entanto, uma vez que os descritores agora estão padronizados, os objetos não são
posicionados da mesma forma como se os descritores tivessem sido simplesmente centralizados
(isto é, componentes principais calculados a partir da matriz S nas subseções anteriores).
No que diz respeito à representação dos descritores no espaço reduzido calculado a partir da
matriz R , podem ser usadas as conclusões da Subseção 9.1.3, que dizia respeito à matriz S, após
substituir a covariância pela correlação, sjl por rjl e a matriz de dispersão S pela matriz de correlação
R.
Machine Translated by Google
II
4
0,4
2
3
0,3
11
0,2
5
6
8
0,1
7
10
EU
4
2
3
11
5
8 6
10 7
12
9
15 14 13
1
Figura 9.5 Quinze descritores plotados no plano determinado pelos dois primeiros eixos principais. As coordenadas de cada
descritor são os dois primeiros elementos da linha correspondente da matriz U,1/2 (ou seja, os autovetores de R
escalados para " ). O círculo do descritor de equilíbrio = 0,365. A
contribuição é sacada em 2 15 ÿ figura inserida mostra os mesmos eixos-descritores usando apenas os
ápices dos vetores. Essa representação, que às vezes é encontrada na literatura ecológica, deve ser evitada por
causa da possível confusão com objetos pontuais.
As variâncias e, portanto, também os desvios padrão dos descritores padronizados são iguais
à unidade (ou seja, = 1), o que leva a algumas propriedades especiais para a matriz U,1/2 .
Primeiro, D(s) = I, de modo que U,1/2 = D(s) –1U,1/2, ou seja, os coeficientes ujk "k são os
coeficientes de correlação entre os descritores j e os componentes k. Além disso, o equilíbrio
contribuição correspondente a cada descritor, no espaço reduzido de U,1/2, é sj d pÿ = d pÿ (uma
vez que si = 1). Portanto, é possível julgar se a contribuição de cada descritor para o espaço
reduzido é maior ou menor do que o esperado sob a hipótese de uma contribuição igual para
todos os eixos principais, comparando os comprimentos de suas projeções a um círculo de
equilíbrio com raio d pÿ (Fig. 9.5).
As principais propriedades para descritores padronizados estão resumidas na Tabela 9.3, que
é paralela à Tabela 9.2 para descritores centralizados.
Machine Translated by Google
Tabela 9.3 Análise do componente principal. Principais propriedades dos descritores padronizados j.
Escala 1 Escala 2
(biplot de distância) (biplot de correlação) "k
Raio do círculo de d pÿ d pÿ
contribuição de equilíbrio
6 — Os componentes significativos
não é possível interpretar os autovetores que seguem aquele em que esta variável de número
aleatório tem o carregamento mais alto. Pode-se mostrar que esta variável de número aleatório, que
tem covariâncias próximas de zero com todos os outros descritores, introduz na análise um autovalor
de 1 se os descritores forem padronizados. Para descritores não padronizados, este autovalor é a
média dos "'s se a variância da variável de número aleatório for igualada à variância média dos
outros descritores.
p
1
---
1
--
( j
E peça ) (9.16)
= %p x xj =
Os valores esperados são iguais aos comprimentos que seriam obtidos quebrando o bastão
aleatoriamente um grande número de vezes e calculando o comprimento médio dos pedaços mais
longos, dos segundos pedaços mais longos, etc. Um bastão de comprimento unitário pode ser
quebrado aleatoriamente em p pedaços colocando no bastão (p – 1) pontos de quebra aleatórios
selecionados usando um gerador de número aleatório uniforme [0, 1]. Uma função R está disponível
para calcular os valores esperados da distribuição do palito quebrado para qualquer número de peças (Seção 9.5).
Voltando aos autovalores, não faria sentido interpretar os eixos principais que explicam uma
fração da variância tão pequena quanto ou menor do que a prevista pelo modelo nulo do palito
quebrado. O teste pode ser realizado de duas maneiras. Pode-se comparar autovalores individuais
com previsões individuais do modelo de vara quebrada e selecionar para interpretação apenas os
autovalores que são maiores do que os valores previstos pelo modelo. Ou, para decidir se o
autovalor "k deve ser interpretado, pode-se comparar a soma dos autovalores, de 1 a k, com a soma
dos valores de 1 a k previstos pelo modelo. Este teste geralmente reconhece os primeiros dois ou
três principais componentes como significativos, o que corresponde à experiência dos ecologistas.
Depois de um estudo empírico usando uma variedade de tipos de matrizes, usando dados
ecológicos simulados e reais, Jackson (1993) concluiu que dois métodos apontavam consistentemente
para o número correto de componentes ecologicamente significativos em conjuntos de dados: o
modelo de palito quebrado e um autovalor-eigenvetor inicializado método proposto em seu artigo.
Dado o poder da análise de componentes principais, alguns aplicativos a utilizam de maneiras que
excedem os limites do modelo. Alguns desses limites podem ser transgredidos sem grandes
consequências, enquanto outros são mais críticos. Os erros mais comuns são: o uso de descritores
para os quais uma medida de covariância não é adequada e a interpretação das relações entre os
descritores, em espaço reduzido, com base nas posições relativas dos ápices dos eixos ao invés
dos ângulos entre eles.
A análise de componentes principais foi originalmente definida para dados com distribuições
multinormais (Seção 4.4), de modo que seu uso ideal (Cassie & Michael, 1968) exige a normalização
dos dados (Subseção 1.5.6). Entretanto, desvios da normalidade não necessariamente distorcem a
análise (Ibanez, 1971). É importante apenas certificar-se de que as distribuições dos descritores
sejam razoavelmente não distorcidas. Normalmente, em análises conduzidas com distribuições
fortemente assimétricas, os primeiros componentes principais separam apenas alguns objetos com
valores extremos dos objetos restantes, em vez de exibir os principais eixos de variação de todos
os objetos do estudo.
Uma matriz de dispersão de posto completo S não pode ser estimada usando um número de
observações n menor ou igual ao número de descritores p. Quando n $ p, uma vez que existem n –
1 graus de liberdade no total, o posto da matriz de dispersão resultante de ordem p é (n – 1). Nesse
caso, a autodecomposição de S produz (n – 1) valores próprios reais e [p – (n – 1)] nulos. De fato,
posicionar n objetos respeitando suas distâncias requer apenas (n – 1) dimensões. O PCA de uma
matriz de dados onde n $ p produz (n – 1) autovalores maiores que 0 e os (n – 1) correspondentes
autovetores e componentes principais. Para obter uma matriz de dispersão de postos completos S
e p componentes principais, o número de objetos n deve ser maior que p.
Os componentes principais são calculados a partir dos autovetores de uma matriz de dispersão.
Isso significa que o método deve ser usado em uma matriz de covariâncias (ou possivelmente
correlações) com as seguintes propriedades: a matriz S (ou R) foi calculada entre descritores que
são quantitativos e para os quais estimativas válidas das covariâncias (ou correlações ) pode ser
obtido. Estas condições são violadas nos seguintes casos:
em espaço reduzido. Os significados de “modo Q” e “modo R” são variáveis na literatura científica; seus
significados em ecologia numérica são definidos na Seção 7.1.
Rao (1964), Gower (1966) e Orlóci (1967a) mostraram que, como uma técnica computacional, os
componentes principais podem ser obtidos pelo cálculo dos autovalores e autovetores de uma matriz Q-
mode. As etapas são as seguintes:
n 1– .
• Começando com a matriz Y centralizada por colunas, Yc, calcule a matriz Cnp = Yc/ Esta
matriz é tal que C'C = Spp, que é a matriz usual de variância-covariância de Y.
• Escale cada autovetor k para o comprimento "k , depois multiplique cada valor por n 1– .
2) Covariâncias e correlações são definidas apenas para descritores quantitativos (Seção 7.5). Isso
implica, em particular, que não se deve usar descritores qualitativos multiestado em análises baseadas
em matrizes de covariância, porque médias e variâncias calculadas a partir de estados não ordenados
não têm sentido.
Precisão A análise de componentes principais é muito robusta, no entanto, para variações na precisão dos
De dados dados. As variáveis podem ser recodificadas em algumas classes sem alteração perceptível nos
resultados (Frontier & Ibanez, 1974; Dévaux & Millerioux, 1976a). Os coeficientes de correlação de
Correlação Pearson calculados usando dados semiquantitativos são equivalentes aos coeficientes de correlação de
de Spearman Spearman (eq. 5.3). Em uma discussão sobre a análise de componentes principais calculada usando
dados semiquantitativos, Lebart et al. (1979) fornecem, para vários números de objetos e descritores,
valores acima dos quais os "'s dos dois primeiros componentes principais podem ser considerados
significativos. Gower (1966) também mostrou que, com descritores binários, a análise de componentes
principais posiciona os objetos , no espaço multidimensional, a distâncias proporcionais às raízes
quadradas dos complementos de coeficientes de emparelhamento simples, ou seja, D = 1 S1 – (S1: eq.
7.1).
3) Quando calculados sobre conjuntos de dados com muitos zeros duplos, coeficientes como
covariância e correlação levam a ordenações PCA com estimativas inadequadas das distâncias entre
os locais de amostragem. O problema surge do fato de que a rotação da componente principal preserva
a distância euclidiana entre os objetos (Tabela 9.1, Fig. 9.2d). O problema do duplo zero foi discutido na
Subseção 7.2.2 e o paradoxo associado à distância euclidiana foi apresentado após a eq. 7.32. Com
dados de abundância de espécies não transformados, a análise de componentes principais só deve ser
usada quando os locais de amostragem cobrirem gradientes curtos (consulte a Subseção 9.1.10). Para
gradientes ecológicos mais longos, os dados das espécies devem ser transformados usando um dos
Machine Translated by Google
transformações da Seção 7.7. Além disso, as ordenações podem ser obtidas usando análise
de correspondência (CA, Seção 9.2) quando a distância qui-quadrado é apropriada, ou por
análise de coordenadas principais (PCoA, Seção 9.3) ou escalonamento multidimensional não
métrico (nMDS, Seção 9.4) usando outras distâncias adequadas.
Esta última observação explica por que, na literatura ecológica, a análise de componentes
principais às vezes não forneceu resultados interessantes, por exemplo, em estudos de
associações de espécies (por exemplo, Margalef & Gonzalez Bernaldez, 1969; Ibanez, 1972;
Reyssac & Roux, 1972). Este problema também foi observado por Whittaker & Gauch (1973).
A busca por associação de espécies é discutida na Seção 8.9.
A Tabela 9.4 resume, com referência ao texto, as várias questões que podem ser abordadas
no curso de uma análise de componentes principais.
8 — Aplicações ecológicas
De 1953 a 1960, armadilhas de queda foram instaladas em 100 locais em quatro vales na área de dunas de Meijendel, ao norte
de Haia, na Holanda. Eles foram visitados semanalmente durante 365 semanas. Nos 36.500 relevés, foram identificadas
aproximadamente 425 espécies animais, sendo cerca de 90% delas artrópodes. Aart (1973) estudou as aranhas-lobo (Lycosidea
e Pisauridae: 45.030 espécimes) para avaliar como as espécies de licosídeos compartilhavam o espaço multidimensional de
recursos (ver Seção 1.0 para o conceito de nicho). O artigo de Aart (1973) relata um PCA baseado em uma tabela de dados de
100 locais × 12 espécies obtidas pela adição dos valores das diferentes capturas semanais para cada armadilha; duas das 14
espécies foram eliminadas por terem sido encontradas apenas duas vezes e uma vez, respectivamente.
O PCA foi aplicado aos dados de espécies padronizados, que continham cerca de 30% de valores zero.
As edições anteriores do presente livro reproduziram as parcelas PCA separadas de espécies e locais encontrados no artigo de
Aart (1973).
Outro conjunto de armadilhas de queda foi colocado em 100 locais durante 60 semanas, em 1969-1970, em Bierlap, um
dos vales de dunas do levantamento anterior. Onze das 12 espécies de aranhas eram as mesmas do artigo de Aart (1973).
Descritores ambientais foram obtidos para 28 desses locais. Os dados de aranhas (28 locais × 12 espécies, dados acumulados
ao longo das semanas) foram analisados por Aart & Smeenk Enserink (1975) e relacionados às variáveis ambientais usando
análise de correlação canônica (CCorA, Seção 11.4); esses dados são reanalisados no aplicativo ecológico 11.1b usando
análise de redundância (RDA, Seção 11.1) em vez de CCorA.
Os dados do spider dos 28 sites* são analisados aqui pelo PCA para ilustrar o interesse das transformações de dados. A
Figura 9.6a mostra os resultados da análise dos dados brutos de abundância das espécies e a Fig. 9.6b o biplot resultante da
análise dos mesmos dados após uma transformação log(y + 1), a mesma transformação que havia sido usada por Aart &
Smeenk-Enserink (1975).
* O arquivo de dados das espécies está disponível eletronicamente. Consulte a nota de rodapé na aplicação ecológica 11.1b.
Machine Translated by Google
Tabela 9.4 Questões que podem ser abordadas no decorrer de uma análise de componentes principais e as respostas
encontradas na Seção 9.1.
Figura 9.6 Biplots de correlação PCA de (a) os dados brutos (não transformados) e (b) os dados de aranha
transformados em log (28 locais, 12 espécies). O escalonamento tipo 2 foi usado em ambos os
biplots para enfatizar as covariâncias entre as espécies. As espécies são: Alopecosacentuata
(abreviação: Alop.acce), Alopecosa cuneata (Alop.cune), Alopecosa fabrilis (Alop.fabr), Arctosa
lutetiana (Arct.lute), Arctosa perita (Arct.peri), Aulonia albimana (Aulo .albi), Pardosa lugubris
(Pard.lugu), Pardosa monticola (Pard.mont), Pardosa nigriceps (Pard.nigr), Pardosa pullata
(Pard.pull), Trochosa terricola (Troc.terr) e Zora spinimana (Zora.spin ).
Machine Translated by Google
BL
banco de dados
B
primeiro
eixo primeiro
eixo
primeiro
eixo
DG
Figura 9.7 Análise de componentes principais calculada a partir da presença-ausência de 51 microfungos do solo.
(a) Informações pedológicas desenhadas na ordenação dos 26 locais de amostragem, plotadas no
espaço reduzido dos dois primeiros componentes principais. De norte a sul, os tipos de solo são: G =
cinza, DG = cinza escuro, BL = preto, DB = marrom escuro, B = marrom. (b) e (c) Distribuições dos locais
(envelopes) onde duas espécies da microflora estiveram presentes. Modificado de Morrall (1974).
Está claro que a Fig. 9.6b é mais fácil de interpretar do que a Fig. 9.6a. A razão é encontrada examinando
a tabela “Ajuste cumulativo por descritor” descrita na Subseção 9.1.3: na análise de dados brutos, os
componentes principais I e II explicaram mais de 60% da variação para apenas quatro das 12 espécies,
enquanto em na análise dos dados log-transformados, os dois primeiros componentes principais
explicaram mais de 60% da variação para 10 das 12 espécies.
Os leitores são convidados a comparar a Fig. 9.6b com os resultados da análise canônica (RDA) na
Fig. 11.7; a última figura fornece uma interpretação do local e dos agrupamentos de espécies usando as
variáveis ambientais. Compare também os agrupamentos de espécies (espécies com pequenos ângulos)
na Fig. 9.6b com as associações de espécies descritas na Aplicação ecológica 11.1b.
Um estudo dos microfungos do solo que vivem em associação com o álamo Populus tremuloides Michx.
fornece outro tipo de utilização da análise de componentes principais. Este estudo de Morrall (1974)
cobriu 26 estações com 6 locais cada, espalhadas pela Província de Saskatchewan (Canadá). Evidenciou
relações entre as distribuições de algumas espécies e os tipos de solo.
solos arborizados cinza da floresta boreal do norte, seguidos ao sul pelos solos de transição cinza
escuro (DG) e os solos pretos (BL). Mais ao sul estão os solos marrons escuros (DB), que dão
lugar aos solos marrons (B) das pastagens. Como os componentes principais foram calculados a
partir de dados de presença-ausência, espera-se que a distribuição dos sítios no espaço reduzido
reflita a das espécies de fungos. O autor testou isso para as espécies mais abundantes no estudo,
traçando, no espaço reduzido, as distribuições dos locais onde algumas espécies de fungos
estavam presentes; dois exemplos são dados nas Figs. 9.7b e c. O autor poderia então comparar
essas distribuições com as dos tipos de solo.
9 — Algoritmos
Três métodos diferentes estão disponíveis para calcular os autovalores e autovetores de uma matriz
simétrica real, como uma matriz de covariância S.
2. Clint & Jennings (1970) publicaram um artigo pioneiro descrevendo como calcular um subconjunto
apenas dos autovalores e autovetores correspondentes de uma matriz simétrica real, usando um método
iterativo. Hill (1973b) usou essa ideia para desenvolver um algoritmo de “média recíproca” para análise de
correspondência; O trabalho de Hill será discutido mais adiante na Seção 9.2 sobre análise de
correspondência. Com base nessas bases, ter Braak (1987c) propôs um algoritmo de soma ponderada de
TWW duas vias (TWWS) para análise de componentes principais. Este algoritmo é descrito em detalhes aqui por
algoritmo três razões: (1) está intimamente ligado às equações básicas do método PCA, de modo que pode ajudar
os leitores a entendê-las; (2) é fácil de programar; (3) usando-o, pode-se calcular apenas os primeiros
componentes, quando estes são os de interesse. O algoritmo é resumido na Tabela 9.5.
O exemplo numérico elaborado na Tabela 9.6 deve ajudar a entender como o algoritmo calcula os
componentes principais, os autovetores e os autovalores.
Os dados são os do exemplo numérico apresentado no início da Seção 9.1 e utilizado nas Subseções
9.1.1 a 9.1.4. O procedimento começa com a matriz de dados centralizados, Yc, mostrada em uma caixa
no canto superior esquerdo da Tabela 9.6.
Para estimar o componente principal I, pontuações arbitrárias são primeiro atribuídas às linhas da
matriz de dados centralizada (Tabela 9.6, coluna R0); valores [fi1] = [1 2 3 4 5]' são usados aqui.
Qualquer outra escolha inicial levaria à mesma estimativa para o primeiro componente principal [fi1] ,
embora o número de iterações necessárias para alcançá-lo possa diferir. A única escolha a evitar é igualar
todos os valores fi1 iniciais . A partir delas, as pontuações das colunas são encontradas multiplicando a
transposição da matriz de dados pelas pontuações das linhas (Tabela 9.6, linha C1):
'
[coluna pontuações1j ] = [] aa – [fi1] (9.17)
Machine Translated by Google
Tabela 9.5 Algoritmo de soma ponderada de duas vias (TWWS) para PCA. Modificado de ter Braak (1987c).
Decida quantos autovetores são necessários e, para cada um. FAÇA o seguinte:
Passo 2: Considere a ordem das linhas conforme as pontuações iniciais arbitrárias do objeto (1, 2, …).
Defina a estimativa de autovalor inicial como 0.
Passo 5: Para os eixos de segunda ordem e de ordem superior, torne as pontuações do objeto não correlacionadas com todos os eixos
anteriores (procedimento de ortogonalização de Gram-Schmidt: consulte b abaixo).
Passo 6: Escale o vetor de pontuações de objeto para comprimento 1 (procedimento de normalização c, abaixo); obter S.
Passo 7: Na convergência, o autovalor é S/(n – 1) onde n é o número de objetos. Assim, ao final de cada iteração, S/(n – 1) fornece uma estimativa
do autovalor. Se esta estimativa não diferir da iteração anterior em mais do que uma pequena quantidade (“tolerância”, definida
pelo usuário), vá para a etapa 8. Se a diferença for maior que o valor da tolerância, vá para a etapa 3.
Passo 8: Normalize o autovetor (cargas variáveis), ou seja, dimensione-o para o comprimento 1 (procedimento c, abaixo).
Redimensione o componente principal (pontuações do objeto) para variância = autovalor.
Passo 9: Se mais autovetores devem ser calculados, vá para a etapa 2. Se não, continue com a etapa 10.
Passo 10: Retorne o autovalor, % de variância, % de variância cumulativa, autovetor (carregamentos de variáveis) e componente principal
(pontuações do objeto).
FAÇA o seguinte, por sua vez, para todos os componentes principais k calculados anteriormente :
Passo 5.1: Calcule o produto escalar SP = - [rowscore(i) × v(i,k)] da estimativa do vetor de pontuação do objeto atual com o componente
anterior k, onde o vetor v(i,k) contém as pontuações do objeto do componente k, escalado para comprimento 1. Este produto varia
entre 0 (se os vetores forem ortogonais) e 1.
Passo 5.2: Calcule novos valores de rowscore(i) de modo que o vetor rowscore se torne ortogonal ao vetor v(i,k): rowscore(i) = rowscore(i) –
(SP × v(i,k)).
c) Procedimento de normalização
2 2
Passo 6.1: Calcule a soma dos quadrados das pontuações do objeto: S2 = - rowscore(i) , e o comprimento S = S .
Subscrito 1 designa a primeira iteração. Ao final do processo de iteração, os escores das colunas fornecerão
estimativas da primeira coluna da matriz U. A justificativa para essa operação vem da equação básica de
autoanálise (eq. 2.27) aplicada à matriz S:
SU = U ,
Substituindo S pelo seu valor na definição da matriz de covariância (eq. 4.6), S = (n – 1)–1 [ ] yy – ' [ ] yy –
obtém-se: ,
[ ] aa – ' [ ] aa – U = (n - 1) U ,
'
[ ] aa – F = (n – 1) U ,
Portanto, as pontuações da coluna obtidas da eq. 9.17 são os valores do primeiro autovetor (primeira
coluna da matriz U) multiplicados pelo autovalor "1 (que é o primeiro elemento diagonal da matriz ,) e por
(n – 1).
A partir da primeira estimativa das pontuações das colunas, uma nova estimativa das pontuações das linhas é
calculada usando a eq. 9.4, F = [ ] aa – U:
O algoritmo alterna entre estimar pontuações de linha e pontuações de coluna até a convergência. Em
cada etapa, as pontuações das linhas (colunas denominadas R na Tabela 9.6) são dimensionadas para
comprimento 1 a fim de evitar que as pontuações se tornem muito grandes para o computador manipular,
o que eles podem fazer facilmente. Antes dessa normalização, o comprimento do vetor de pontuação da
linha, dividido por (n – 1), fornece a estimativa atual do autovalor. Na verdade, esse comprimento mede a
quantidade de “alongamento” que o vetor de pontuação de linha incorreu durante uma iteração.
Esta descrição sugere um dos vários critérios de parada possíveis (Tabela 9.5, passo 7): se a
estimativa do autovalor não mudou, durante a iteração anterior, em mais do que um valor de tolerância pré-
selecionado, o processo de iteração é interrompido. Valores de tolerância entre 10–10 e 10–12 produzem
estimativas satisfatórias ao computar todos os autovetores de grandes matrizes, enquanto valores entre
10–6 e 10–8 computam apenas os primeiros dois ou três autovetores. Outro possível são suficientes para
critério de parada seria um percentual mínimo de mudança na estimativa do autovalor.
• o autovetor (Tabela 9.6, linha C13) é normalizado (ou seja, dimensionado para comprimento unitário) e
• o componente principal é dimensionado para ( ) n 1– "1 . Isso faz com que sua variação
comprimento igual ao seu autovalor.
Estimativas
de
"2
#
2.000
4
–
18.000
4.000
C1
C2
comprimento=1
0,447
0.000
– ,894 x1
x2
x3
x4
x5 ! Objetos x1
x2
x3
x4
x5 ! Objetos Tabela
9.6
Var.
1var.
2
R0 Estimativas
de
"1
#
5.642
1.905
5.544
2.257
5.473
2.449
5.428
2.554
5.401
2.612
5.386
2.644
5.377
2.661
5.373
2.671
5.370
2.677
5.368
2
0,680
5,368
2,681
5,367
2,682
18,000
4,000
C1
C2
C3
C4
C5
C6
C7
C8
C9
C10
C11
C12
C13
comprimento=1
0,895
0,447 Var.
1var.
2
R0 Estimativa
dos
eixos
I(superior)
e
II(inferior)
para
os
dados
centralizados
do
exemplo
numérico
(valores
em
caixas),
utilizando
o
algoritmo
“two-
way
Weighted
Summation”
Tabela
9.5).
Iterações
1a
13:
estimativas
das
pontuações
de
linha
(R1
a
R13)
e
pontuações
de
coluna
(C1
a
C13). (TWWS,
1,4
3,4
1,8
3,8
0
–
3
1–
2
0,6
,2
,2
,6 1,4
3,4
1,8
3,8
0
–
3
1–
2
0,6
,2
,2
,6
(arbitrário) (arbitrário)
46.000
66.000
1–
6
2
3–
14
54.000
4.000 3,130
3,131
0,521
18,780
0,523
18,786
0,492
18,752
0,550
18,813
0,421
16,633
0,605
20,297
1–
6
0
2
–352
0
20
–3
–
20
94,000
–,586
0
–
1,103
,593
8
1.
–
,595
0
1,466
1
,596
3
,578
1
–
4,000
,311
0
–
,745
6
,274
,037
–
,252
0
,080
8
,224
–
,053
0
,342
14
–4,000
5,128
,082
,171
,977
,195
,019
,223
,047
,224
,341
*orto:
as
pontuações
são
ortogonais
ao
R13
encontrado
na
parte
superior
da
tabela.
46.000
66.000
R1 R1
R1
comprimento
=
1
27.295
R1
orto*
comprimento=1
0,001
9,996
9,994
9,995
– ,996
R2
4.998
R1
R2
comprimento
=
1
8.895 0,467
17,653
0,570
19,713
R2
R3
R2
orto*
0,001
9,999
10,000
0,002
9,998
10,001
9
–
10,000
0,500
01–
– 1,999
0,000
,500
0,002
0,001
…
R9
R3
comprimento=1
8.967
R2
comprimento
escalado
=
1(var=")
5.000 0,000
0,500
0,500
–
R9
…
comprimento
=
1
0,000
2,236
2,236
–
9.000
R13
comprimento=1
(var=")
9.000 0,522 R13
escalado
459 Análise de componentes principais (PCA)
Machine Translated by Google
Machine Translated by Google
Objeto Objetos ou variáveis suplementares podem ser facilmente incorporados nos cálculos usando
suplementar este algoritmo. Estes são objetos ou variáveis que não foram usados para calcular os autovalores
e variável e autovetores do espaço de ordenação, mas cujas posições são buscadas em relação ao conjunto
original de objetos e variáveis que foram usados para calcular os autovalores e autovetores. No
aplicativo Ecológico 9.1a, por exemplo, onde a análise de componentes principais foi calculada
usando os dados de abundância das espécies, os descritores ambientais usados no aplicativo
Ecológico 11.1b poderiam ter sido adicionados à análise como variáveis suplementares. Além
disso, como havia 100 armadilhas de queda de observações de aranhas, as armadilhas que foram
excluídas da análise poderiam ter sido adicionadas ao gráfico de ordenação como objetos
suplementares. São necessárias transformações preliminares: (1) as variáveis suplementares
devem ser centradas em suas respectivas médias; (2) para cada variável usada no PCA original
(por exemplo, as 12 espécies de aranhas), os objetos suplementares devem ser centralizados
usando o valor médio dessa variável calculado para o conjunto original de objetos. Quando o
algoritmo atinge a convergência para um eixo usando o conjunto original de objetos, é simples
calcular as pontuações das colunas das variáveis suplementares usando a eq. 9.17 e as
pontuações de linha dos objetos suplementares usando a eq. 9.18. A etapa final consiste em
aplicar ao
Machine Translated by Google
variável suplementar pontua o escalonamento que foi aplicado aos termos do autovetor
correspondente ao conjunto original de variáveis e, para os escores de objetos suplementares, o
escalonamento que foi aplicado ao conjunto original de objetos.
1
-----------
1
-----------
S= Yc'Yc = (UsvdW' V') (VW Usvd')
n 1– n 1–
1
-----------
1
-----------
S= Yc'Yc = Usvd W'W Usvd' (9.19)
n 1– n 1–
S = Ueigen !Ueigen'
1
-----------
2
por isso: Ueigen = Usvd W'W = ----------- wj n 1– n 1– 1[]e!= (9.20)
Essas correspondências podem ser prontamente verificadas, para os dados de exemplo numérico,
pela decomposição de valor singular da matriz de dados centrados Yc:
Yc = V C Usvd'
(Quanto à decomposição de valores próprios, diferentes funções SVD podem reverter os sinais
de algumas colunas de V e U.) Pode-se verificar que os valores singulares ao quadrado divididos
por (n – 1) são os valores próprios, &1 = 9 e &2 = 5, e que Usvd = Ueigen calculado em
Subseção 9.1.1.
G= n 1– V (9.21)
A matriz F, que dá as posições do objeto no biplot de distância (escala 1), pode ser calculada a
partir de V de duas maneiras diferentes:
F = VW ou F= n 1– V!1/2 (9.22)
Quando há tantas ou mais variáveis do que objetos (ou seja, p ' n, por exemplo em
comunidades ricas em espécies), autovalores e autovetores ainda podem ser calculados usando
qualquer um dos três métodos descritos acima: Redução de Householder, o algoritmo TWWS ,
ou decomposição de valor singular. A matriz de covariância é semidefinida positiva nesses casos,
de modo que autovalores nulos são produzidos (Tabela 2.2). Quando p é muito maior que n e
todos os autovalores e autovetores devem ser calculados, economias importantes no tempo do
computador podem ser feitas aplicando redução de Householder ou decomposição de valor
singular à matriz de produtos cruzados [ YY'], que é de tamanho (n × n), em vez de [Y'Y] que é
de tamanho (p × p)*e, portanto, muito maior; Y é centralizado por colunas. Os autovalores de
[YY'] são iguais aos autovalores diferentes de zero de [Y'Y].
A matriz U dos autovetores de [Y'Y] pode ser encontrada a partir da matriz V dos autovetores de
[YY'] usando a transformação U = Y'V!–1/2. A matriz F dos componentes principais é encontrada
a partir da equação F = V!1/2.
* A matriz S difere da matriz de produtos cruzados [Y'Y] pela divisão dos produtos cruzados
por (n – 1) em S. Os autovalores de [Y'Y] são maiores que os de S por este fator (n – 1), mas
os autovetores são idênticos.
Machine Translated by Google
biplot de ordenação
Y = dados brutos Gradientes curtos: CA ou PCA
(locais × espécies) Gradientes longos: CA
Y=Dados
Dados não tratados PCA
Ordenação de sites
Representação de elementos:
Sites = símbolos
Figura 9.8 Diferentes abordagens estão disponíveis para a ordenação métrica dos dados de composição da
comunidade: (a) PCA e CA clássicos, (b) abordagem baseada em transformação e (c) abordagem baseada
em distância (PCoA). Os métodos de ordenação métrica produzem ordenações que preservam totalmente
as distâncias entre os sítios, conforme especificado na Tabela 9.1. Modificado de Legendre & Gallagher (2001).
método baseado em distância de análise de coordenadas principais (PCoA, Seção 9.3). Esses
métodos de ordenação métrica produzem ordenações que preservam totalmente as distâncias
entre os sites. Eles são discutidos aqui sucessivamente. A distância preservada por cada
método é especificada na Tabela 9.1. O método não métrico do nMDS (Seção 9.4) não é
mencionado na Fig. 9.8 porque as ordenações que ele produz distorcem as distâncias entre os sítios.
Na abordagem clássica (Fig. 9.8a), a relação espécie-ambiente é analisada por PCA (esta
Seção) ou por CA (Seção 9.2). Nas primeiras aplicações do PCA à ecologia de comunidades,
o CA foi considerado preferível ao PCA para tabelas de dados de espécies amostradas em
regiões altamente diversificadas (“gradientes longos”) porque essas tabelas contêm muitos
zeros. Este é o caso, por exemplo, da amostragem de comunidades ao longo
Machine Translated by Google
extensos gradientes espaciais ou temporais, onde a composição de espécies pode mudar muito
ao longo do gradiente. Para grupos de sítios bastante homogêneos na composição de espécies
(“gradientes curtos”), o PCA foi considerado apropriado. Uma gama mais ampla de opções está
agora disponível.
O PCA pode ser feito para preservar alguma distância que seja apropriada para o estudo
de dados de composição em regiões altamente diversificadas, por exemplo, ao longo de
gradientes, em vez da distância euclidiana D1 (Fig. 9.8b ) . Os dados de composição podem
ser transformados usando as transformações descritas na Seção 7.7, levando à abordagem
tb-PCA PCA baseada em transformação, ou tb-PCA. O PCA calculado em dados transformados usando
essas equações realmente preservará a corda, perfil, distância de Hellinger ou qui-quadrado,
ou a métrica qui-quadrado entre sites, dependendo da transformação usada. Observe que as
distâncias correspondentes (D3 e D15 a D18 na Tabela 7.3) têm a propriedade de serem euclidianas.
Pode-se também (Fig. 9.8c) calcular diretamente uma das funções de distância apropriadas
para os dados de composição da comunidade (Tabela 7.4) e realizar uma análise de
coordenadas principais (PCoA, Seção 9.3) da matriz de distância para obter uma ordenação.
Esta é a abordagem baseada na distância. O PCoA obtém ordenações métricas de matrizes
D , enquanto o escalonamento multidimensional não métrico (nMDS, Seção 9.4) produz
ordenações não métricas que distorcem as distâncias entre os locais. Esses métodos devem
ser usados em análises envolvendo funções de distância que não podem ser obtidas por uma
transformação de dados seguida de PCA (abordagem tb-PCA, Fig. 9.8b). Entre as distâncias
desenvolvidas especificamente para dados de espécies (Tabela 7.4) estão a maioria dos
binário), bem como dados quantitativos, por exemplo, Jaccard ( 1 coeficientes projetados para
S7 – ) e Sørensen (D13 ou 1 S8 – medidas de distância como o coeficiente assimétrico de
Gower ( 1 S19 – ), a métrica geodésica (D4), Whittaker (D9), Canberra (D10), Clark (D11),
diferença percentual (D14) e diferença de caráter média modificada para dados de espécies D19.
1980) e análise de homogeneidade (Meulman, 1982), embora seja conhecido em francês como
analise fatorial das correspondências (Cordier, 1965; Escofier-Cordier, 1969).
A análise de correspondência de contingência foi proposta pela primeira vez para analisar tabelas de tabelas
de contingência bidirecionais (Seção 6.2). Nessas tabelas, os estados de um primeiro descritor (linhas) são
comparados aos estados de um segundo descritor (colunas). Os dados em cada célula da
Frequências tabela são frequências, ou seja, números de objetos codificados com uma combinação de
estados dos dois descritores. Essas frequências são inteiros positivos ou zeros. A aplicação
mais comum da CA em ecologia é a análise da composição da comunidade (presença-ausência
de espécies ou valores de abundância) em locais de amostragem (Subseção 9.2.4). As linhas
e colunas da tabela de dados correspondem a locais e espécies, respectivamente. Tal tabela é
análoga a uma tabela de contingência porque os dados são frequências.
Em geral, a análise de correspondência pode ser aplicada a qualquer tabela de dados que
seja dimensionalmente homogênea, o que significa que as dimensões físicas de todas as
variáveis são as mesmas (Capítulo 3) e que não contém valores negativos (ou seja, apenas
números inteiros ou zeros positivos são permitidos) . Os valores devem ser aditivos em linhas
e colunas (aditividade: consulte a Subseção 1.4.2) para permitir o cálculo das somas de linhas
colunas e a transformação Q da tabela de dados eme matriz
(eq. 9.24). Os dados de frequência têm
essas características. A distância ( D16, eq. 7.55), que é um coeficiente que exclui zeros
duplos, é usada para quantificar as relações entre linhas e colunas no CA (Tabela 9.1).
1 — Computação
Esta descrição da análise de correspondência prosseguirá em três etapas. (1) A tabela de contingência
(ou composição da comunidade) será transformada em uma tabela de contribuições para a estatística
qui-quadrado de Pearson após o ajuste de um modelo nulo aos dados de frequência. (2) A tabela de
dados transformada será decomposta para obtenção dos autovalores e autovetores, como no PCA. (3)
Outras operações com matrizes levarão às várias tabelas necessárias para traçar diagramas úteis. Além
de seu papel como método de ordenação, o CA pode ser usado para estudar as proximidades entre as
linhas (ou as colunas) de uma tabela de contingência, bem como a correspondência entre linhas e
colunas como na Seção 6.4.
Considere uma tabela de contingência com r linhas ec colunas, como na Seção 6.2. Suponha que a
tabela seja escrita de forma que r ' c; a tabela pode ser transposta para atender a essa condição, pois
as linhas e colunas de uma tabela de contingência desempenham papéis idênticos.
O simbolismo é o seguinte:
• pij é a frequência fij na célula ij dividida pela soma f++ dos fij's ao longo do todo
mesa. A tabela contendo as frequências relativas pij é denominada Q; seu tamanho é (r×c).
• O peso atribuído à linha i é pi+ = fi+/f++, onde fi+ é a soma dos valores da linha i. O vetor [pi+] tem
tamanho r = número de linhas.
• Da mesma forma, o peso atribuído à coluna j é p+j = f+j /f++, onde f+j é a soma dos valores da coluna
j. O vetor [p+j] é de tamanho c = número de colunas.
–
Componente Oij Eij - =
= ------------------- pij pi+p+ j
--------------------------
(eu j f++ (9.23)
do qui-quadrado
Eij pi+p+ j
Q neste livro:
A análise de correspondência é baseada em uma matriz chamada (r×c)
–
= pij pi+p+ j
= --------------------------
Q qij [ ] (9.24)
pi+p+ j
Machine Translated by Google
–
fijf++ fi+f+ j
= --------------------------------
qij (9.25)
f++ fi+f+ j
2
Inércia total ,a)inércia
soma dos quadrados de todos os valores na matriz Q qij ,A
mede total em Q É também igual à
Q . soma de todos os autovalores a serem extraídos pela autoanálise de .
SVD 2. Decomposição de . Q — Decomposição de valor singular (SVD, eq. 2.31) pode ser com o
aplicado à matriz Q em , seguinte resultado (o simbolismo é ligeiramente modificado
comparação com a Seção 2.11):
Uˆ onde ambos U e são matrizes ortonormais (ou seja, matrizes contendo vetores coluna que são
normalizados e ortogonais entre si; Seção 4.4) e W é uma matriz diagonal D(wi ). Os valores diagonais
wi em W, que são todos não negativos, são Q os valores singulares de .
Porque Q UˆWU'
= (eq. 9.26), a multiplicação Q'Q dá o seguinte
resultado:
A Equação 2.28 mostra que os autovalores (formando a matriz diagonal !) e os autovetores (matriz U)
de uma matriz quadrada A obedecem à relação:
A = U!U–1
Se os vetores em U forem normalizados, como aqui, U é uma matriz ortonormal com a propriedade
U–1 = U'. Como consequência, a eq. 2.28 pode ser reescrita como
A = U!U' (9.29)
Segue-se que a matriz diagonal [W'W], que contém valores singulares quadrados em sua diagonal, é
a matriz diagonal !(c×c) dos autovalores de Q'Q . Da mesma forma, a matriz ortonormal U das eqs.
9.27 e 9.28 é igual à matriz U da eq. 9.29; é a matriz de autovetores de Q'Q (c×c), contendo as cargas
das colunas da tabela de contingência.Um raciocínio semelhante aplicado à matriz QQ' (r×r) mostra
que o
Machine Translated by Google
A relação entre a eq. 9.26 e a decomposição de autovalores (eq. 2.22) é a mesma que na
análise de componentes principais (Subseção 9.1.9). Antes da decomposição de valores próprios,
uma cruzados é calculada. Isso é semelhante
matriz quadrada Q'Q de somas de quadrados e produtos
ao uso da matriz de somas de quadrados e produtos cruzados Y'Y para decomposição de autovalor
em PCA; Y'Y é a matriz de covariância S multiplicada pela constante (n – 1). No PCA, a matriz Y foi
centrada nas médias das colunas antes de calcular Y'Y enquanto, noQCA, a matriz é centrada pela
operação (Oij – Eij) (eqs. 9.23 e 9.24). Apesar desta operação de centralização, as somas das linhas
Q colunas deenão são iguais a zero.
análise Resultados idênticos aos de SVD seriam obtidos aplicando autovalores que decomporiam
própria 9.1) ou a matriz de covariância produziria as matrizes de autovalores ! e Q'Q , (eqs. 2.22 e
autovetores U, ou à matriz QQ' , qual
Uˆ forneceria as matrizes de autovalores ! e autovetores. Na verdade, Uˆ não é necessário
repetir a autoanálise para obter U e , porque:
Considere agora a matriz não centrada (r×c)Q˜na qual (pi+p+j ) não é subtraído
de cada termo pij no numerador:
= = pij
-------------------- fij
= -------------------
Q˜ q˜ij [] (9.32)
pi+p+ j fi+f+ j
Machine Translated by Google
3. Calcular matrizes para biplots. — Matrizes U e podem ser usadas para plotar as posições
VOCÊ
Biplot dos vetores linha e coluna em dois diagramas de dispersão separados. Para biplots, que são
gráficos conjuntos dos vetores de linhas e colunas, várias escalas foram propostas. Primeiro, as
matrizes U e podem ser ponderadas pelo inverso das raízes quadradas dos pesos das colunas
VOCÊ
–1/2
V(c×c) = D(p+j ) você (9.33)
–1/2
Vˆ (r×c) = D(pi+) VOCÊ
(9.34)
Fˆ ,
Da mesma forma, a matriz que dá as posições das colunas da tabela de contingência no espaço de análise de
correspondência, é obtida a partir da matriz de autovetores transformada Vˆ , que dá as posições das linhas nesse
espaço. A equação é a mesma acima, exceto que a divisão aqui é pelos pesos da coluna:
ou –1 Q'Vˆ (9.36b)
Fˆ (c×c) = D(p+j )
Descartando o autovalor nulo, a parte da matriz F a considerar para interpretação é de tamanho r × (c – 1) e a parte
da matriz a considerar é de tamanho c × (c – 1). ComFˆeste escalonamento, as matrizes F e V formam um par tal
que as linhas (dadas pela matriz F) estão no centróide (também chamado de centro de massa, ou “baricentro”, do
grego *+,-., Fˆ pronuncia-se “barus ”, pesada) das colunas da matriz V. Da mesma forma, as matrizes Vˆ Fˆ e
formam um par tal que as colunas (dadas pela matriz ) estão nos centróides de Vˆ as linhas da matriz
Biplots das linhas (por exemplo, sites) e colunas (por exemplo, espécies) podem ser desenhados usando
diferentes combinações de escalas de matriz descritas acima. Os tipos de escalonamento 1 e 2, descritos abaixo,
são os mais comumente usados por ecologistas ao analisar dados de composição da comunidade (ter Braak, 1990).
Escalas • Escala tipo 1. — Desenhe uma plotagem conjunta com os sítios (matriz F) nos centróides das espécies (matriz
em CA V). Para tabelas de dados sítios × espécies, este escalonamento é o mais apropriado se estiver interessado
principalmente em representar as relações de distância entre os sítios porque, na matriz F, as distâncias entre os
sítios são projeções de suas (2 distâncias (D16) (ter Braak, 1987c; ver Exemplo numérico, Subseção 9.2.2).
Fˆ • Escala tipo 2. — Desenhe uma plotagem conjunta com as espécies (matriz ) nos centróides dos sítios (matriz ).
Para tabelas de dadosVˆ
de sítios × espécies, este escalonamento é o mais apropriado se estiver interessado
principalmente em representar as relações de distância entre as distâncias entre as espécies são projeções de
numérico, Subseção 9.2.2 ). Fˆ , suas (2 espécies porque , em distâncias matriciais (consulte Exemplo
• Escalonamento tipo 4. — Este escalonamento é útil na análise de correspondência de uma tabela de contingência
que cruza dois descritores qualitativos ou dois fatores. Desenhe um gráfico conjunto usando F, que preserva as
distâncias qui-quadrado entre as linhas e que preserva as distâncias qui-quadrado entre as colunas da Fˆ
tabela de
contingência. Essa escala híbrida representa corretamente as relações de distância qui-quadrado entre os estados
dos dois descritores qualitativos. Nesta escala, as posições relativas da linha
Machine Translated by Google
e os símbolos de coluna ao longo de cada eixo do gráfico são os mesmos que na escala 3. O intervalo &k do eixo
1 4ÿ
na escala 3 multiplicado por fornece o intervalo desse
k eixo no tipo de escala 4.
Os eixos na escala 4 são assim comprimidos em comparação com os eixos correspondentes na escala 3 porque
os autovalores são sempre menores que 1 em CA. A compressão não é isotrópica, entretanto, porque os
autovalores diferem entre os eixos.
Outros métodos de escalonamento possíveis, mas menos usados, são discutidos por ter Braak (1987c, 1990).
4. Tabelas de ajuste cumulativo. — Tabelas de ajuste cumulativo para colunas e linhas podem ser calculadas
em CA, como acontecia no PCA (Subseção 9.1.3.4). A soma dos quadrados dos valores na linha j da matriz dá a
variância total da coluna (descritor) j noFˆ
espaço de ordenação multidimensional. O ajuste cumulativo relativo do
descritor j é encontrado calculando a soma dos valores quadrados para o eixo 1, eixos 1 e 2, eixos 1, 2 e 3, e
assim por diante, e dividindo-o pela variância total de j . Essa estatística representa o ajuste do descritor j em 1, 2
ou mais dimensões; pode ser interpretado como um coeficiente de determinação múltipla (R2).
A soma dos valores ao quadrado da linha i da matriz F dá o comprimento ao quadrado do vetor que representa
o objeto i no espaço de ordenação multidimensional. Use a matriz F para calcular o comprimento ao quadrado de
cada vetor de objeto i nas dimensões 1, 2, 3 … CA e divida esses comprimentos pelo comprimento quadrado total
do vetor de objeto i. Veja o exemplo na próxima subseção. Os comprimentos residuais quadrados podem ser
calculados subtraindo do comprimento de i a soma dos valores quadrados para o eixo 1, eixos 1 e 2, eixos 1, 2 e
3, etc.
2 — Exemplo numérico
O exemplo numérico a seguir ilustra os cálculos envolvidos na análise de correspondência. Este exemplo
assume que três espécies foram observadas em três lagos (Tabela 9.6)* . A justificativa para analisar os
dados de composição da comunidade por CA é fornecida na Subseção 9.2.4. A tabela de dados é de
tamanho pequeno (3 × 3) para permitir que os leitores acompanhem ou repitam os cálculos facilmente.
A matriz Q contém as proporções pij, a partir das quais as distribuições marginais das linhas e
colunas, pi+ e p+j, são computadas. Os identificadores de linha e coluna são os da Tabela 9.6:
* A Tabela 9.6 também pode representar uma tabela de contingência cruzando os estados de dois
descritores qualitativos, para ilustrar a CA de uma tabela de contingência. Um biplot dos resultados usaria
o tipo de escala 4 (Subseção 9.2.1.3).
Machine Translated by Google
Tabela 9.6 Exemplo numérico: uma tabela de dados local por espécie.
Lago 1 (L1) 10 10 20 40
Lago 2 (L2) 10 15 10 35
Lago 3 (L3) 15 5 5 25
Os autovalores de Q'Q são &l = 0,09613 (70,1%), &2 = 0,04094 (29,9%) e &3 = 0 (por causa da centralização).
Os dois primeiros autovalores também são autovalores de seu terceiro autovalor sendo 1 porque não
˜ Q˜é ,
Q'centrado
(&l ) (&2)
2.0 2.0
0,5 0,5
L2 Sp2
0 0
eixo
CA
II eixo
CA
II
L1 L3 Sp3 Sp1
–0,5 Sp1 –0,5
L3
–1,0 Sp3 –1,0 L1
–1,5 –1,5
–2,0 –2,0
–2,0 –1,5 –1,0 –0,5 0 0,5 1,0 1,5 2,0 –2,0 –1,5 –1,0 –0,5 0 0,5 1,0 1,5 2,0
CA eixo I CA eixo I
Figura 9.9 Biplots de análise de correspondência. (a) Escalonamento tipo 1: as linhas da tabela de dados (lagos L1 a L3
representados por círculos, matriz F) estão nos centróides (baricentros) das colunas (espécies Sp1 a Sp3
Fˆ Vˆ
representadas por quadrados, matriz V). (b) Escalonamento tipo 2: as espécies (quadrados, matriz ) são
nos centróides (baricentros) dos lagos (círculos, matriz ).
(&l ) (&2)
L1 0,53693– 0,55831–
Uˆ = L2 0,13043– 0,79561
L3 0,83349 0,23516–
O terceiro autovetor não tem utilidade e, portanto, não é fornecido. A maioria dos programas não o calcula.
No escalonamento tipo 1 (Fig. 9.9a), as linhas da matriz de dados (L1, L2 e L3 no exemplo), cujas
coordenadas serão armazenadas na matriz F, devem ser plotadas nos centróides das colunas (Sp1, Sp2 e
Sp3 no exemplo). A escala para as colunas é obtida usando a eq. 9.33:
(&l ) (&2)
Para colocar as linhas (matriz F) nos centróides das colunas (matriz V), a posição de cada linha ao longo de
um eixo de ordenação é calculada como a média das posições das colunas, ponderadas pelas frequências
relativas das observações nas várias colunas dessa linha. Considere a primeira linha da tabela de dados
(Tabela 9.6), por exemplo. As frequências relativas das três colunas em
Machine Translated by Google
nessa linha são 0,25, 0,25 e 0,50. A multiplicação da matriz V por esse vetor fornece as coordenadas da
primeira linha no diagrama de ordenação:
1,31871 0,34374–
[0,25 0,25 0,50] 0,37215– 1,48150 = [–0,26322 –0,17862]
0,99972– 0,92612–
Essas coordenadas colocam a primeira linha no centróide das colunas da Fig. 9.9a; eles são armazenados na
primeira linha da matriz F. As probabilidades condicionais de linha para toda a tabela de dados são encontradas
usando a operação de matriz D(pi+) –1Q, de modo que a matriz F é calculada usando a eq. 9.35b:
(&l ) (&2)
L1 0,26322– 0,17862–
F = D(pi+) –1QV = L2 0,06835– 0,27211
L3 0,51685 0,09517–
Utilizando as fórmulas das distâncias Euclidianas (D1, eq. 7.32) e (2 (D16, eq. 7.55), pode-se verificar que as
distâncias Euclidianas entre as linhas da matriz F são iguais às (2 distâncias entre as linhas da tabela de dados
original (Tabela 9.6):
L1 L2 L3
L1 0
D= L2 0,49105 0
L3 0,78452 0,69091 0
A matriz F fornece assim uma ordenação adequada das linhas da matriz de dados original (temperaturas no
exemplo numérico).
Fˆ Na escala tipo 2 (Fig. 9.9b), as colunas, cujas coordenadas serão armazenadas na matriz , são
Vˆ a eq. 9.34:
Vˆ a ser plotado nos centróides das linhas (matriz ). A escala para a matriz é obtida usando
(&l ) (&2)
L1 0,84896– 0,88276–
–1/2
Vˆ = D(pi+) VOCÊ
= L2 0,22046– 1,34482
L3 1,66697 0,47032–
Vˆ Para colocar as colunas (matrizFˆ) nos centróides das linhas (matriz ), a posição de cada coluna ao longo de
um eixo de ordenação é calculada como a média das posições das linhas, ponderada pelas frequências relativas
das observações nas várias linhas de aquela coluna. Considere a primeira coluna da tabela de dados (Tabela
9.6), por exemplo. As frequências relativas das três linhas nessa coluna são (10/35 = 0,28571), (10/35 =
0,28571) e (15/35 = 0,42857). A multiplicação da matriz por esse vetor fornece as coordenadas da primeira
coluna noVˆdiagrama de ordenação:
Machine Translated by Google
0,84896– 0,88276–
[0,28571 0,28571 0,42857] 0,22046– 1,34482 = [0,40887 –0,06955]
1,66697 0,47032–
Essas coordenadas colocam a primeira coluna no centróide das linhas da Fig. 9.9a; eles são armazenados em Fˆ a
primeira linha da matriz. As probabilidades condicionais de coluna para toda a tabela de dados são Q' é calculada
–1 matriz Fˆ
encontrado através da operação matricial D(p+j ) usando , então aquela
a eq. 9.36a
ou 9.36b:
(&l ) (&2)
Utilizando as fórmulas das distâncias Euclidianas (D1, eq. 7.32) e (2 (D16, eq. 7.55), pode-se verificar que as
Fˆ as colunas da matriz original tabela
distâncias Euclidianas entre as linhas da matriz são iguais às (2 distâncias entre
de dados (Tabela 9.6):
Sp1 0
D= Sp2 0,64128 0
Fˆ
Matrix, portanto, fornece uma ordenação adequada das colunas da matriz de dados original (classes de abundância
de espécies no exemplo numérico).
Para o exemplo numérico, a tabela de ajuste cumulativo por espécie (3 espécies) é de tamanho
(3 × 2) porque a solução CA tem apenas duas dimensões (ou seja, dois autovalores positivos):
Na coluna que corresponde ao último autovalor, os valores são sempre 1 em CA. A tabela de ajuste cumulativo dos
objetos (3 lagos) também é de tamanho (3 × 2) neste exemplo numérico:
L1 0,6847 1,0000
L2 0,0594 1,0000
L3 0,9672 1,0000
As duas tabelas indicam que a espécie 2 e a lagoa 2 estão mal ajustadas ao longo do eixo 1, como pode ser
observado na Fig. 9.9, e que todas as espécies e lagoas estão perfeitamente representadas em 2 dimensões.
Machine Translated by Google
3 — Interpretação
Vˆ , das colunas e linhas da tabela de dados de
A relação entre as matrizes V e que fornecem as ordenações
espécies (ou contingência), respectivamente, é encontrada combinando as eqs. 9.30, 9.33 e 9.34 na seguinte
expressão:
–1/2 Q (9.37)
Vˆ !1/2 = D(pi+) D(p+j ) 1/2V
Vˆ Esta equação significa que a ordenação das linhas (matriz ) está relacionada com a ordenação das
colunas (matriz V), ao longo do eixo principal h, pelo valor &h que é uma medida da “correlação” entre essas
duas ordenações. O valor (1 – &h) na verdade mede a dificuldade de ordenar, ao longo do eixo principal h,
as linhas da tabela de contingência a partir de uma ordenação das colunas, ou vice-versa (Orlóci, 1978).
O autovalor mais alto (0,096 no exemplo numérico acima), ou sua raiz quadrada ( &1 0,31= ), é, portanto,
uma medida de dependência entre dois descritores não ordenados, a ser adicionada às medidas descritas
no Capítulo 6. Williams (1952) discute diferentes métodos para testar a significância de R2 = &h.
Parcelas conjuntas (por exemplo, Fig. 9.9) podem ser usadas para tirar conclusões sobre a ecologia
relacionamentos exibidos pelos dados.
• Com o tipo de escalonamento 1, (a) as distâncias entre linhas (ou sítios no caso de uma tabela de dados
de espécies × sítios) em espaço reduzido aproximam-se de (2 distâncias, e (b) as fileiras (sítios) estão nos
centróides de as colunas (espécies). As posições dos centróides são calculadas usando pesos iguais às
frequências relativas das colunas (espécies); colunas (espécies) que estão ausentes de uma linha (site) têm
pesos nulos e não contribuem para a posição de aquela linha (sítio). Assim, a ordenação das linhas (sítios) é
significativa. Além disso, qualquer linha (sítio) encontrada perto do ponto que representa uma coluna
(espécie) provavelmente terá uma alta contribuição dessa coluna (espécie); para dados binários (ou presença-
ausência de espécies), é mais provável que a linha (site) possua o estado daquela coluna (ou contenha
aquela espécie).
• No escalonamento tipo 2, são as distâncias entre as colunas (espécies) em espaço reduzido que aproximam
suas (2 distâncias, enquanto as colunas (espécies) estão nos centróides das fileiras (sítios). Conseqüentemente,
(a) a ordenação das colunas (espécie) é significativo e (b) qualquer coluna (espécie) que se encontra próxima
ao ponto que representa uma linha (local) tem maior probabilidade de ser encontrada no estado dessa linha
(local) ou com maior frequência (abundância) do que em linhas (locais) que estão mais distantes na parcela
conjunta.
Para dados de presença-ausência ou abundância de espécies, na medida em que uma espécie tem uma
curva de resposta unimodal (ou seja, em forma de sino) ao longo dos eixos de variação ecológica
correspondentes aos eixos de ordenação, o ótimo para essa espécie deve estar próximo ao ponto que a
representa em o diagrama de ordenação e sua frequência de ocorrência ou abundância devem diminuir com
a distância daquele ponto. As espécies que estão ausentes na maioria dos locais geralmente aparecem na
borda do gráfico de dispersão, perto do ponto que representa um local onde elas estão presentes - por acaso
ou porque são favorecidas por alguns
Machine Translated by Google
condição rara ocorrendo naquele local. Essas espécies têm pouca influência na análise porque suas
contribuições numéricas são pequenas (somas de colunas na Tabela 9.6). Finalmente, as espécies que
estão próximas ao centro do diagrama de ordenação podem ter seu ótimo naquela área da parcela, ou ter
dois ou vários ótimos (espécies bi ou multimodais), ou então não estar relacionadas ao par de eixos de
ordenação sob consideração. Espécies do último grupo podem se expressar ao longo de algum outro eixo
ou eixos; um exame minucioso da tabela de dados brutos pode ser necessário nesse caso. São as
espécies afastadas do centro do diagrama, mas não próximas das bordas, que têm maior probabilidade
de apresentar relações claras com os eixos de ordenação (ter Braak, 1987c).
A análise de correspondência foi aplicada a tabelas de dados que não sejam tabelas de contingência.
A justificação é fornecida por Benzécri e col. (1973). Observe, porém, que os elementos de uma tabela a
serem analisados por análise de correspondência devem ser dimensionalmente homogêneos (isto é,
mesmas unidades físicas, para que possam ser somados), não negativos (' 0, para que possam ser
transformados em probabilidades ou proporções), e aditivo para que as somas de linhas e colunas, fi+ ef
+j, façam sentido (aditividade: ver Subseção 1.4.2). Vários tipos de dados possuem essas características,
como valores de (bio)massa, concentrações, dados financeiros (em $, € , ¥, etc.) e abundâncias de
espécies.
Outros tipos de dados podem ser recodificados para tornar os descritores dimensionalmente
homogêneos e positivos; as transformações de dados mais usadas são discutidas na Seção 1.5. Para
descritores com unidades físicas diferentes, os dados podem, por exemplo, ser padronizados (o que os
torna adimensionais; eq. 1.12) e tornados positivos por tradução, ou seja, subtraindo o valor mais negativo;
ou podem ser divididos pelo máximo ou pela faixa de valores (eqs. 1.10 e 1.11). Os dados também podem
ser recodificados em classes ordenadas. Independentemente do método, a recodificação é uma etapa
crítica da análise de correspondência. Consultar Benzécri e col. (1973) sobre este assunto.
Vários autores, mencionados no início desta seção, aplicaram a análise de correspondência para a
análise de matrizes sítio x espécie contendo dados de presença/ausência ou abundância de espécies.
Esta generalização do método é baseada no seguinte modelo de amostragem. Se a amostragem tivesse
sido projetada de forma a coletar organismos individuais (o que geralmente não é o caso, sendo os
elementos amostrados, na maioria das vezes, locais de amostragem), cada organismo poderia ser descrito
por dois descritores: o local onde foi coletado e o táxon ao qual pertence. Esses dois descritores podem
ser registrados em uma matriz de dados inflada, que possui tantas linhas quantos forem os organismos
Matriz de individuais, e duas colunas identificando o sítio e o táxon do indivíduo (descritores qualitativos). A tabela
dados inflada de dados de sítios familiares × espécies é a tabela de contingência resultante do cruzamento dos dois
descritores da matriz de dados inflada, ou seja, os sítios e táxons. Essa tabela pode ser analisada usando
qualquer um dos métodos aplicáveis às tabelas de contingência. A maioria dos métodos que envolvem
testes de significância estatística não podem ser usados, no entanto, porque a hipótese de independência
dos organismos individuais, seguindo o modelo de amostragem descrito acima, não é atendida pela
presença-ausência de espécies
Machine Translated by Google
ou dados de abundância coletados em locais de amostragem. Uma matriz de dados inflada será
usada novamente na descrição da análise de correspondência canônica, Subseção 11.2.1.
A teoria do nicho nos diz que as espécies têm preferências ecológicas, o que significa que
são encontradas em locais onde encontram condições favoráveis. Esta afirmação está enraizada
na ideia de que as espécies têm distribuições unimodais ao longo das variáveis ambientais (Fig.
9.10), mais indivíduos sendo encontrados perto de algum valor ambiental que é “ótimo” para a
espécie em questão. Isso foi formalizado por Hutchinson (1957) em seu modelo de nicho
Nicho fundamental . Além disso, o princípio de exclusão competitiva de Gause (1935) sugere que, em
sua microevolução, as espécies deveriam ter desenvolvido nichos não sobrepostos. Esses dois
princípios indicam juntos que as espécies devem ser aproximadamente igualmente espaçadas
no espaço n-dimensional de recursos. Este modelo foi usado por ter Braak (1985) para justificar
o uso de análise de correspondência em tabelas de dados de presença ou ausência; ele mostrou
que a (2 distância preservada através da análise de correspondência (Tabela 9.1) é um modelo
apropriado para espécies com distribuições unimodais ao longo de gradientes ambientais.
Sigamos o caminho percorrido por Hill (1973b), que redescobriu a análise de correspondência
ao explorar a análise da variação da vegetação ao longo de gradientes ambientais; ele chamou
Média seu método de “média recíproca” antes de perceber que isso era análise de correspondência
recíproca (Hill, 1974). Hill partiu do método mais simples de análise de gradiente, proposto por Whittaker
(1960, 1967) para analisar tabelas de dados de sítio x espécie.
A análise de gradiente utiliza uma matriz Y (sítio × espécie) e um vetor inicial v de valores vj que
são atribuídos às diversas espécies j como indicadores do gradiente físico a ser evidenciado. Por
exemplo, uma pontuação (escala de 1 a 10) pode ser atribuída a cada espécie por sua preferência
com relação à umidade do solo. Esses coeficientes são usados para calcular as posições dos
sites ao longo do gradiente. A pontuação de um sítio i é calculada como o vˆi … p) presente
média da espécie (j = 1 naquele sítio, usando a fórmula: pontuação
) yijv j
j 1=
-------------------= (9.38)
vˆi
sim+
onde yij é a abundância de espécies j no sítio i e yi+ é a soma dos organismos neste sítio (ou
seja, a soma dos valores na linha i da matriz Y).
A análise de gradiente vˆ produz um vetor das posições dos locais ao longo do gradiente em
estudo. Hill (1973b, 1974) sugeriu continuar a análise, usando agora o vetor de ordenação dos
vˆ calcular uma nova ordenação (v) das espécies:
sítios para
)
eu 1=
yijvˆi
------------------= (9.39)
vj
y+ j
Machine Translated by Google
vˆ
em que y+j é a soma dos valores na coluna j da matriz Y. A alternância entre v e
(dimensionando os vetores em cada etapa conforme mostrado na etapa 6 da Tabela 9.8)
define um procedimento iterativo que Hill (1973b) chamou de “média recíproca ”. Este
procedimento converge para uma única ordenação unidimensional das espécies e sítios,
independente dos valores inicialmente atribuídos aos vj 's; diferentes suposições iniciais
quanto aos valores vj podem, no entanto, alterar o número de etapas necessárias para alcançar a convergência.
Estando ciente do trabalho de Clint & Jennings (1970), Hill percebeu que havia descoberto
um método de autovetor para análise de gradiente, daí o título de seu artigo de 1973b. Ocorre
que o método de Hill produz os vetores baricêntricos v e para espécies e sítios, que vˆ
No Capítulo 7, foi mostrado que espécies raras contribuem fortemente para a distância qui-
quadrada (D16, eq. 7.55), que é a distância preservada na análise de correspondência.
A presente discussão enfoca as espécies com pequenos valores de ocorrência; eles ocorrem
apenas em uma pequena fração dos locais de estudo. Essas espécies geram um grande
número de zeros na matriz de dados. Como os zeros têm alta alavancagem, eles Q
contribuem fortemente para a inércia total da matriz (eq. 9.24). Essas espécies contribuem
muito pouco para os primeiros eixos de ordenação CA, mas são altamente visíveis em
biplots porque são encontradas na periferia do gráfico. Devemos manter espécies raras na
CA? Se não, quais devem ser eliminados?
Por um lado, os ecologistas que veem o que estão coletando (por exemplo, vegetação) podem considerar
espécies raras como potenciais indicadores de condições ambientais especiais, mas não é papel da AC mostrar
essas condições. O objetivo principal do CA é exibir os principais eixos de variação dos dados, não lidar com
exceções. Por outro lado, os ecologistas que fazem amostragem às cegas muitas vezes consideram a
ocorrência de espécies raras um evento fortuito que não deve ser fortemente ponderado na análise. No caso
de animais móveis, a presença de um animal em um local não indica que o local oferece condições favoráveis
para aquela espécie.
Métodos empíricos para reduzir o peso de espécies raras foram propostos e estão disponíveis em alguns
programas de computador, mas esses métodos carecem de fortes fundamentos ecológicos.
É melhor simplesmente eliminar as espécies mais raras da CA. O seguinte método passo a passo foi
desenvolvido por Daniel Borcard (comunicação pessoal):
• Efetuar uma primeira CA. Observe a inércia total, bem como os primeiros autovalores (por exemplo, 4).
• Repita esse passo após remover a espécie com ocorrência 1; as espécies com ocorrência 1 e 2; as espécies
com ocorrência 1 a 3; e assim por diante. Após cada análise, observe a inércia total, bem como os primeiros
autovalores.
• Plote esses resultados. Um salto deve ser observado na inércia total e em alguns dos autovalores.
O salto indica que alguém foi longe demais na remoção de espécies raras. [Continua na próxima página.]
eixos-descritores, são projetados em um espaço de baixa dimensão tanto pelo PCA quanto
pelo CA. Isso explica a tendência das espécies de formar uma dispersão mais ou menos
uniformemente densa centrada na origem, exceto em situações simples. No entanto, pode ser
interessante sobrepor um agrupamento de espécies, determinado pelos métodos da Seção 8.9,
em uma ordenação em espaço reduzido obtida por análise de correspondência.
Machine Translated by Google
O exemplo a seguir diz respeito a dados de biomassa de peixes (47 transectos subaquáticos,
156 espécies de peixes) coletados pelos pesquisadores Pierre Labrosse e Eric Clua (Secretariado
da Comunidade do Pacífico) perto da vila de Manuka nas Ilhas Tonga, no âmbito do projeto
DemEcoFish financiado pela Fundação MacArthur (dados aqui utilizados com autorização dos autores).
6.0 0,60
0,50
5.0
0,45 Autovalor 1
4.5 Autovalor 2
0,40
4.0 Autovalor 3
0,35
Autovalor 4
3.5 0,30
3.0 0,25
01234567 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Ocorrências de espécies removidas Ocorrências de espécies removidas
As curvas mostram que as 61 espécies com ocorrências de 1 a 4 podem ser removidas da análise
com poucos efeitos nos quatro primeiros autovalores (gráfico à direita). Estas espécies Q geram
24% da inércia na matriz (gráfico da esquerda) submetida à decomposição de autovalores em CA.
5
Abundância Espécie 1 Espécie 2 Espécie 3
3
0 2 4 68 10 12 14 16 18 20
Locais de amostragem
Figura 9.10 Distribuições de três espécies em 19 locais de amostragem ao longo de um gradiente ambiental hipotético
Esses dados artificiais são encontrados na Tabela 9.7.
ambiental
Exemplo numérico 1. Um conjunto de dados foi criado (Fig. 9.10; Tabela 9.7) para representar as
abundâncias de três espécies hipotéticas em 19 locais ao longo de um gradiente ambiental ao longo
do qual se supõe que as espécies tenham distribuições unimodais (Whittaker, 1967).
As três espécies na Fig. 9.10 têm distribuições unimodais; cada um mostra um modo bem
definido ao longo do gradiente representado pelos sítios 1 a 19. Os métodos de ordenação
visam tornar este fenômeno não linear em um espaço euclidiano, em particular em plotagens
bidimensionais. Em tais plotagens, as não linearidades acabam sendo representadas por curvas,
Locais de amostragem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Espécie 1 1247874210000000000
Espécie 2 0000012478742100000
Espécie 3 0000000000124787421
Machine Translated by Google
chamados arcos ou ferraduras, descritos no próximo parágrafo. Enquanto a maioria dos ecologistas
se contenta em interpretar os gráficos de ordenação pelas informações que exibem sobre as
distâncias entre os locais, alguns acham que deveriam tentar reconstruir o gradiente original
Fora de tendência subjacente aos dados observados. Daí a preocupação com o destrending, que é uma operação
realizada sobre os eixos de ordenação da análise de correspondência. Nessa operação, o arco é
dobrado para exibir o gradiente como um arranjo linear dos locais.
As distâncias euclidianas calculadas nos dados de espécies da Fig. 9.10, entre o sítio 1 e os
sítios 2, 3, etc., não aumentam monotonicamente de uma extremidade do gradiente para a outra.
Essas distâncias formam a primeira linha da matriz de distância euclidiana entre os sítios; eles
são relatados na primeira linha da Tabela 9.11 na Subseção 9.3.5. As distâncias do ponto 1
aumentam até o ponto 5, após o que diminuem; eles aumentam novamente até o local 10, depois
diminuem; eles aumentam até o local 15 e diminuem novamente. As outras linhas da matriz de
distância euclidiana exibem padrões igualmente complexos; eles não são mostrados na Tabela
9.11 para economizar espaço. Um algoritmo PCA enfrenta a tarefa de representar esses padrões
complexos em no máximo três dimensões porque as ordenações PCA não podem ter mais eixos
do que o número de variáveis originais (ou seja, três espécies na Fig. 9.10). O resultado é ilustrado
na Fig. 9.11, painéis a e b. O efeito mais dramático é encontrado nas extremidades do transecto,
que são dobradas para dentro ao longo do eixo I. Isso ocorre porque a fórmula de distância
euclidiana considera os locais extremos muito próximos uns dos outros (pequenas distâncias
Ferradura devido a zeros duplos para a espécie 2) . Esta forma é chamada de ferradura.
A Figura 9.11b mostra que os sites finais também “descem” ao longo do terceiro eixo. Na análise
de correspondência, ao contrário, as extremidades do gradiente não são, na maioria dos casos,
dobradas para dentro do gráfico (mas ver Wartenberg et al., 1987, Fig. 3, para um caso em que
isso ocorre); um gráfico de ordenação dobrado com extremidades não dobradas para dentro é
Arco chamado de arco, por exemplo, Fig. 9.11c.
A Figura 9.11c ajuda a entender o significado dos gráficos de juntas CA. Este gráfico conjunto
foi produzido usando o tipo de escala 1 para preservar as (2 distâncias (D16) entre os sites; nesse
aspecto, esse gráfico é comparável à ordenação PCA mostrada na Fig. 9.11a. A ordenação é
bidimensional, pois os dados conjunto contém apenas três espécies. As espécies (quadrados
pretos) ocupam as bordas de um triângulo; linhas grossas são desenhadas para materializar suas
distâncias ao centro da parcela. Sítios 1-5, 10 e 15-19, que possuem apenas um espécies
presentes, ocupam a mesma posição que o ponto que representa aquela espécie porque os sítios
estão nos baricentros (centróides) das espécies; CA não espalha sítios que possuem uma única e
mesma espécie, mesmo que em quantidades diferentes.
Os sítios 6-9 e 11-14, que possuem duas espécies em várias combinações, situam-se em uma
linha entre as duas espécies; suas posições ao longo dessa linha dependem da relativa
Machine Translated by Google
8,0 6.0
PCA ou PCoA 10 PCA ou PCoA
(distância = D1)
(a) (distância = D1)
(b)
6.0 4.0
9 11
5 15
4.0 2.0 6 14
10
9 11
4 7 13 16
PCA
eixo
II
8 12
2.0 0,0
PCA
eixo
III
8 12
3 17
7 13
0,0 -2,0
2 18
1 19 1 19
6 2 18 14
-2,0 -4,0
3 17
4 16
5 15
-4,0 -6,0
-6,0 -4,0 -2,0 0,0 2,0 PCA 4.0 6.0 -6,0 -4,0 -2,0 0,0 2,0 PCA eixo I 4.0 6.0
eixo I
2.0 2.0
CA ou PCoA DCA, sem tendência por
(distância = D16) 10
(c) polinômio quadrático
(d)
1,5 1,5
Esp. 2 Esp. 2
9 11
1,0 1,0
8 12
eixo
CA
II
0,5 DCA
eixo
II
0,5
10
1a5 15 a 19
7 13 9 11
0,0 0,0
6 8 12 14
7 13
-0,5 6 14 -0,5
Figura 9.11 Ordenações dos dados da Fig. 9.10 e Tabela 9.7. Os círculos são locais e os quadrados nos painéis c e d
são espécies. Análise de componentes principais, escala 1: (a) PCA eixos I e II (&1 = 50,1%, &2 =
40,6%), (b) eixos I e III (&1 = 50,1%, &3 = 9,3%). (c) Análise de correspondência, escala 1, CA eixos I
e II (&1 = 58,1%, &2 = 41,9%). Uma função polinomial quadrática do eixo I também é mostrada (curva
convexa): (eixo II) = 1,056 – 1,204 (eixo I)2 . (d) Análise de correspondência sem tendência
(escalonamento tipo 1, desalinhamento por polinômio quadrático), eixos DCA I e II (&1 = 58,1%, &2 =
1,6%). (c) e (d) Linhas em negrito desenhadas a partir dos centros das parcelas representam os eixos das espécies.
abundância das duas espécies em cada local. Nenhum site tem três espécies neste exemplo, de
modo que nenhum ponto está dentro da forma triangular da dispersão de sites. Considerando o local
1 (canto inferior esquerdo na Fig. 9.11c), examine suas distâncias (D16) para todos os outros locais
na última linha da Tabela 9.11: elas aumentam do local 6 para 10, após o que permanecem constantes.
Isso corresponde às posições relativas dos sites na figura. Se o exemplo contivesse mais espécies,
os pontos do site teriam exibido uma forma arredondada.
Machine Translated by Google
2.0 2.0
(a) (b)
1,5 10 1,5
9 11
1,0 1,0
8 12
7 13
eixo
CA
II
0,5
/ eixo
CA
II
0,5 10
6 9 11 14
7 13
0,0 0,0
1a5 15 a 19
-0,5 6 14 -0,5 8 12
1a5 15 a 19
-1,0 -1,0
-1,5 -1,0 -0,5 0,0 0,5 CA 1,0 1,5 -1,5 -1,0 -0,5 0,0 0,5 CA 1,0 1,5
eixo I eixo I
Figura 9.12 Desencadeando tendências por segmentos. (a) Três segmentos definidos arbitrariamente são delimitados por
linhas verticais na ordenação CA (da Fig. 9.11c). (b) Após a retirada da tendência, a média dos pontos em
cada segmento é zero.
1. Na destendência por segmentos (Hill & Gauch, 1980), o eixo I é dividido em uma série de segmentos
e, dentro de cada um, a média das pontuações ao longo do eixo II é igualada a zero; em outras palavras, os
pontos de dados em cada segmento são movidos ao longo do eixo II para fazer sua média coincidir com a
abcissa. A Figura 9.12b mostra o resultado do desvio da ordenação da Fig. 9.11c usando os três segmentos
definidos na Fig. 9.12a.
O ponto principal é que as pontuações ao longo do eixo II sem tendência não têm sentido. Proximidades entre
pontos não devem, em nenhum caso, ser interpretadas ecologicamente, porque a segmentação gera grandes
diferenças nas pontuações para pontos que estão próximos uns dos outros na ordenação original, mas que
estão em ambos os lados das divisões do segmento (Fig. 9.12). O número de segmentos é arbitrário; diferentes
segmentações levam a diferentes ordenações ao longo do eixo II.
Para lidar com a contração das extremidades do gradiente quando os locais são projetados no primeiro
eixo, o redimensionamento não linear dos eixos é frequentemente realizado após a eliminação de tendência.
Um caso extremo é representado pela Fig. 9.11c, onde os sítios 1 a 5 e 15 a 19 ocupam cada um um único
ponto ao longo do eixo I. Para equalizar as larguras das curvas de resposta das espécies, o eixo é dividido
em pequenos segmentos e segmentos com pequenos dentro As variações de grupo são expandidas,
enquanto os segmentos com grandes variações dentro do grupo são contraídos (Hill, 1979b). A Figura 5.5
de ter Braak (1987c) fornece uma boa ilustração do processo; ter Braak (1987c) desaconselha o uso
rotineiro de redimensionamento não linear.
Machine Translated by Google
Após a destendência por segmentos e reescalonamento não linear dos eixos, a ordenação DCA tem a
propriedade interessante de que os eixos são redimensionados em unidades do desvio padrão médio (DP) da
rotatividade das espécies (Gauch, 1982). Ao longo de um gradiente regular, uma espécie aparece, atinge seu
valor modal e desaparece em uma distância de cerca de 4 DP; da mesma forma, ocorre uma mudança completa
na composição das espécies, ao longo dos sítios, em cerca de 4 unidades SD. Uma meia mudança na
composição de espécies ocorre dentro de cerca de 1 a 1,4 unidades SD. Assim, o comprimento do primeiro eixo
Comprimento DCA é uma medida aproximada do comprimento do gradiente ecológico, medido em unidades de renovação de
do gradiente espécies. A este respeito, DCA com redimensionamento não linear dos eixos é um método útil para estimar os
comprimentos de gradientes ecológicos. O comprimento de um gradiente revelado por um estudo piloto pode
ajudar a determinar a extensão (Seção 13.0) a ser dada a um estudo subseqüente em grande escala.
2. Detendência por polinômios (Hill & Gauch, 1980; ter Braak, 1987c) decorre diretamente
do fato de que um arco é produzido quando um gradiente de comprimento suficiente está
presente nos dados. Quando um número suficiente de espécies está presente e se substitui
ao longo do gradiente, o segundo eixo CA se aproxima de uma função quadrática do primeiro
(ou seja, um polinômio de segundo grau), e assim por diante para os eixos subsequentes.
Este claramente não é o caso dos dados da Tabela 9.7, que consistem em apenas três espécies.
A Figura 9.11c mostra que o 'arco' é reduzido a uma forma triangular nesse caso.
O efeito de arco é removido impondo, no algoritmo CA, a restrição de que o eixo II não seja correlacionado
apenas com o eixo I (procedimento de ortogonalização na Tabela 9.8), mas também com seu quadrado, seu
cubo e assim por diante; o grau da função polinomial é escolhido pelo usuário. Da mesma forma, o eixo III é
desassociado do 1º, 2º, 3º … k-ésimo polinômio de grau dos eixos I e II. E assim por diante. Quando se busca a
eliminação de tendências, a eliminação de tendências por polinômio é um método atraente. O resultado é uma
função contínua dos eixos anteriores, sem as descontinuidades geradas pela desalinhamento por segmentos.
No entanto, a detendência por polinômios impõe um modelo específico aos dados, de modo que o sucesso da
operação depende de quão próximo o modelo polinomial corresponde aos dados. Detendência por polinômio
não resolve o problema de compressão dos sítios nas extremidades dos eixos de ordenação.
Detendência por polinômio quadrático foi aplicada aos dados de teste. A Figura 9.11c mostra o polinômio
quadrático (curva convexa; entre os termos do polinômio quadrático, apenas o termo (eixo I)2 foi significativo)
que foi ajustado à ordenação CA, que tem forma triangular no presente exemplo. Detendência envolve calcular
e plotar as distâncias verticais (residuais) entre os pontos de dados e o polinômio ajustado. A ordenação sem
tendência é mostrada na Fig. 9.11d. Os resíduos da regressão exibem uma forma elegante, mas sem sentido,
ao longo do eixo II.
As evidências atuais indicam que a despromoção deve ser evitada, exceto para o propósito
específico de estimar os comprimentos dos gradientes; tais estimativas permanecem sujeitas à
condição de que as premissas do modelo sejam verdadeiras. Em particular, DCA deve ser
evitado ao analisar dados que representam gradientes ecológicos complexos. A maioria das
técnicas de ordenação é capaz de recuperar gradientes ambientais simples e unidimensionais.
Quando há um único gradiente nos dados, a retirada de tendência é inútil, pois o gradiente é
bem representado pelo eixo CA I.
6 — Aplicações ecológicas
Os dados de aranhas (28 locais × 12 espécies) de Aart & Smeenk-Enserink (1975) que foram analisados pela
análise de componentes principais (PCA) no aplicativo ecológico 9.1a são reanalisados aqui pela análise de
correspondência (CA). A Figura 9.13 apresenta dois biplots CA (tipos de escala 1 e 2) obtidos para esses
dados. Compare os grupos de espécies e as ordenações dos locais com o biplot PCA apresentado na Fig. 9.6b
(dados log-transformados).
A análise de correspondência (Fig. 9.14) mostrou que as assembleias de peixes responderam aos principais
gradientes ambientais que caracterizaram os locais de amostragem. Para as áreas c e d (transectos através do
recife), o eixo I correspondeu a um gradiente da linha de costa para o oceano; da esquerda para a direita, em
Machine Translated by Google
Figura 9.13 Biplots de análise de correspondência dos dados do spider. (a) Escalonamento tipo 1: os sítios (círculos sólidos)
estão nos centróides das espécies (quadrados abertos). (b) Escalonamento tipo 2: as espécies (quadrados
abertos) estão nos centróides dos sítios (círculos sólidos). Abreviações de espécies: ver Fig. 9.6.
Machine Translated by Google
a11 Áreas
4 a12 a
b
3 c
a13
d
2
b43
eixo
CA
II
c8
b22 d10
1
a23 a43
a42 a22, b33 d9
c5
b23 b41
0 c4, d4
a21 d2 b32
d3 b31 c6 d8
a33
d5,b42
–1 a31
b11 b12c3 c7d7
b21
c1,c2,d1 a32 b13 a41 d6
–2
–2 –1,5 –1 –0,5 0 0,5 1 1,5 2 2.5
CA eixo I
Figura 9.14 Análise de correspondência (CA): ordenação dos locais de amostragem em relação aos eixos I e II a partir de
observações de presença/ausência de peixes-borboleta (21 espécies) em quatro áreas (símbolos diferentes)
ao redor da Ilha de Moorea. Os eixos I e II explicam juntos 29% da variação entre os sites. As espécies não
são desenhadas; eles teriam sobrecarregado o enredo. Modificado de Cadoret et al. (1995).
o lote, são os locais do recife em franja, os baixios (encontrados apenas no setor c), o recife de barreira e o
talude externo. Os sites das baias (áreas aeb) também são encontrados na parte esquerda do gráfico. O Eixo
II separa os sítios localizados na parte superior da Baía de Opunohu (a11, a12 e a13, no canto superior
esquerdo do lote) de todos os outros. Esta aplicação será desenvolvida, na Subseção 11.2.2, para identificar
assembleias de espécies e evidenciar as relações entre espécies e variáveis ambientais, usando análise de
correspondência canônica.
Em um estudo sobre a dinâmica da vegetação do sul de Wisconsin, Sharpe et al. (1987) realizaram um
levantamento de campo sistemático de todas as áreas florestais em dois municípios. A análise de
correspondência de tendência foi usada para exibir as relações entre os povoamentos com relação à
composição de espécies. As pontuações dos primeiros eixos de ordenação foram utilizadas para construir
mapas tridimensionais. No mapa do primeiro eixo (Fig. 9.15), os escores foram geralmente baixos nas
porções sul e central da área, e aumentaram em direção ao oeste e norte. Uma vez que o primeiro eixo
mostrou uma tendência de áreas florestais dominadas por Acer saccharum para florestas dominadas por
carvalhos (não mostradas), a Fig. 9.15 indica que povoamentos dominados por A. saccharum estavam
localizados na porção centro-sul da área, enquanto carvalhos as arquibancadas dominadas estavam a oeste,
norte e, em menor grau, leste. Esse mapeamento, usando uma representação tridimensional ou bidimensional,
costuma ser uma maneira útil de exibir informações sintéticas fornecidas pelas pontuações de objetos ao longo dos primeiros eixos
Machine Translated by Google
0
E1
N
Figura 9.15 Mapa tridimensional dos escores do primeiro eixo de ordenação (análise de correspondência de tendência),
baseado em árvores observadas em 92 trechos florestais do sul de Wisconsin, EUA (área de
levantamento: 11 × 17 km). Modificado de Sharpe et al. (1987).
Mapas como o exibido na Fig. 9.15 podem ser produzidos para as pontuações de ordenação
calculado por qualquer um dos métodos descritos no presente capítulo; consulte a Seção 13.2.
7 — Algoritmos
Existem vários programas de computador e funções R disponíveis para análise de correspondência;
consulte a Seção 9.5.
CANOCO (ter Braak, 1988b, 1988c, 1990; ter Braak & Smilauer, 1998) usa o algoritmo de
TWWA média ponderada bidirecional de Hill (TWWA), conforme resumido por ter Braak (1987c).
algoritmo Esse algoritmo é descrito na Tabela 9.8. Existem três diferenças principais com o algoritmo TWWS
para PCA apresentado na Tabela 9.5: (1) as variáveis são centralizadas no PCA, não no CA; (2)
em CA, o centróide das pontuações do site não é zero e deve, portanto, ser estimado (passo 6.1);
(3) no CA, os somatórios são padronizados pela soma da linha, coluna
Machine Translated by Google
Tabela 9.8 Algoritmo de média ponderada de duas vias (TWWA) para análise de correspondência. De Hill (1973b) e ter Braak (1987c).
Determine quantos autovetores são necessários. Para cada um, FAÇA o seguinte:
Passo 2: Considere a ordem das linhas conforme as pontuações iniciais arbitrárias do local. (1, 2, …)
Defina a estimativa de autovalor inicial como 0. A seguir, yi+ = soma de linhas para o local i, y+j = soma de colunas para
espécies j e y++ = total geral para a tabela de dados Y.
Passo 3: Calcular novos carregamentos de espécies: colscore(j) = 2 y(i,j) × rowscore(i)/ y+j rowscore(i)
Passo 5: Para os eixos de segunda e ordem superior, torne as pontuações do local não correlacionadas com todos os eixos
anteriores (procedimento de ortogonalização de Gram-Schmidt: veja b abaixo).
Passo 6: Normalize o vetor de pontuações do local (procedimento c, abaixo) e obtenha uma estimativa do autovalor. Se esta
estimativa não diferir da anterior em mais que a tolerância definida pelo usuário, vá para o passo 7. Se a diferença for maior
que a tolerância, vá para o passo 3.
Etapa 7: Se mais autovetores devem ser calculados, vá para a etapa 2. Caso contrário, continue com a etapa 8.
Passo 8: Vˆ As pontuações da linha (local) correspondem à matriz . As pontuações das colunas (carregamentos de espécies)
correspondem
matriz . Matrizes e fornecemaescalonamento
Fˆ Fˆ Vˆ à tipo 2 (Subseção 9.2.1). As escalas 1 ou 3 podem ser calculadas, se
necessário. Retorne os autovalores, % de variância, cargas de espécies e pontuações do local.
FAÇA o seguinte, por sua vez, para todos os componentes k calculados anteriormente :
Passo 5.1: Calcule o produto escalar SP = 2 (yi+ × rowscore(i) × v(i,k)/y++) da estimativa atual do vetor de pontuação do site com o
componente anterior k. O vetor v(i,k) contém as pontuações do local do componente k escalado para comprimento 1. Este
produto está entre 0 (se os vetores forem ortogonais) e 1.
Passo 5.2: Calcule novos valores de rowscore(i) de modo que o vetor rowscore se torne ortogonal ao vetor v(i,k): rowscore(i) =
rowscore(i) – (SP × v(i,k)).
c) Procedimento de normalização†
Passo 6.4: Ao final de cada iteração, S, que mede a quantidade de encolhimento durante a iteração, fornece uma estimativa do
autovalor. Após a convergência, o autovalor é S.
† A normalização no CA é tal que a soma ponderada dos quadrados dos elementos do vetor é igual a 1.
Machine Translated by Google
soma, ou total geral, conforme apropriado, que produz o encolhimento das pontuações de ordenação no
final de cada iteração no CA (etapa 6.4), em vez de aumentar como no PCA.
SVD As funções R para CA usam decomposição de valor singular (SVD, função svd() de R) ou redução de
chefe de família Householder (função eigen() de R). SVD e autodecomposição foram usados para descrever o algoritmo
CA na Subseção 9.2.1; eles fornecem os autovalores de Uˆ, bem como as matrizes U e . As várias matrizes
para as pontuações de linha e coluna usadas em escalas são então obtidas usando as eqs. 9.33 a 9.36.
A análise de componentes principais (PCA) é aplicável apenas a dados para os quais a distância euclidiana
(D1) é apropriada, enquanto a análise de correspondência (CA) é aplicável apenas a dados do tipo
frequência para os quais a distância ( D16) é apropriada. Para outros tipos de dados, as relações entre os
objetos são calculadas com um dos coeficientes de semelhança descritos no Capítulo 7. A lista inclui
coeficientes que podem lidar com dados binários (S1 a S14, S24 a S27) e misturas de descritores
quantitativos e qualitativos (S15, S16 ). O PCA não pode ser aplicado a esses dados. O CA pode ser usado
com dados de presença-ausência para os quais zeros duplos devem ser excluídos das comparações de
objetos, mas não com misturas de descritores quantitativos e qualitativos.
euclidiano Gower (1966) descreveu um método para obter uma representação euclidiana (ou seja, uma
representação em um sistema de coordenadas cartesianas) de um conjunto de objetos cujas relações são
representação medidas por qualquer coeficiente de distância escolhido pelos usuários. Este método, conhecido como
análise de coordenadas principais (abreviado PCoA), escalonamento métrico multidimensional (em
contraste com o método não métrico descrito na Seção 9.4), ou escalonamento clássico por referência ao
trabalho pioneiro de Torgerson (1958), permite posicionar objetos em um espaço de dimensionalidade
reduzida, preservando ao máximo suas relações de distância; ver também Rao (1964).
O interesse do método PCoA reside no fato de que ele pode ser usado com todos os tipos de
Misturado descritores - até mesmo conjuntos de dados com descritores de níveis mistos de precisão, desde que um
precisão coeficiente apropriado aos dados tenha sido usado para calcular a matriz de semelhança (por exemplo
S15 ou S16, Capítulo 7). Será mostrado que, se a matriz de distância for métrica, ou seja, se não contém
violação da desigualdade triangular, as relações entre os objetos podem, na maioria dos casos, ser
totalmente representadas no espaço euclidiano. No caso de violações da desigualdade triangular, ou
quando ocorrem problemas de “não-euclideanaridade” com distâncias métricas (Gower, 1982; Fig. 9.16),
autovalores negativos são produzidos. Na maioria dos casos, isso não prejudica a qualidade da
representação euclidiana obtida para as primeiras coordenadas principais. Também é possível transformar
a matriz de distância, ou usar uma medida de semelhança alternativa, para eliminar o problema. Esses
tópicos são discutidos na Subseção 9.3.4.
Machine Translated by Google
Pode-se olhar para as coordenadas principais como o equivalente dos componentes principais.
Os componentes principais, por um lado, são combinações lineares dos descritores originais (ou
padronizados); linear é o conceito-chave. As coordenadas principais, por outro lado, também são
funções das variáveis originais, mas mediadas pela função de distância que foi calculada entre os
objetos. Em qualquer caso, PCoA só pode incorporar (ou seja, representar totalmente), no espaço
euclidiano, a parte euclidiana de uma matriz de distância. Isso não é uma propriedade dos dados,
modelo mas um resultado do modelo euclidiano, que é imposto aos dados porque o objetivo é desenhar
euclidiano diagramas de dispersão em folhas de papel. Ao fazer isso, deve-se aceitar que tudo o que não é
euclidiano não pode ser desenhado no papel. Isso pode ser visto como o problema de desenhar
pontos separados por distâncias não euclidianas em um espaço euclidiano.
Assim como o PCoA, o método de escalonamento multidimensional não métrico (nMDS, Seção
9.4) produz ordenações de objetos a partir de qualquer matriz de semelhança. Ele comprime as
relações de distância entre os objetos em, digamos, duas ou três dimensões de uma forma mais
eficiente do que o PCoA. nMDS sempre obtém uma representação euclidiana, mesmo a partir de
distâncias incorporáveis não euclidianas. No entanto, o nMDS comprime as distâncias de forma não
linear e seu algoritmo é intensivo em computação, exigindo mais tempo de computação do que o
PCoA. O último é mais rápido para matrizes de grandes distâncias.
1 — Computação
• O cálculo começa com uma matriz de distância D = [Dhi]. Também é possível realizar os cálculos
a partir de uma matriz de similaridade S = [Shi]; o método é detalhado na Subseção 9.3.3.
1 2
= (9.40)
ai – --Dhi
2
onde e são
ah as médias
ai da linha e da coluna correspondentes ao elemento ahi da matriz A,
a
respectivamente, e é a média de todos os ahi's da matriz. A seguinte equação matricial produz a
centralização descrita na eq. 9.41:
11' 11' $ % $ %
AI
31 = ------- " # -------
EU
(9.42)
n "# n
Machine Translated by Google
euclidiano No caso particular das distâncias calculadas pelo coeficiente de distância euclidiana (D1,
distância eq. 7.32), é possível obter a matriz 31 centrada em Gower diretamente, ou seja, sem calcular
uma matriz D de distâncias euclidianas e passando pelas eqs. 9.40 e 9.41, porque 31 = YcYc',
onde Yc é Y centrado por colunas. Isso pode ser verificado por meio de exemplos numéricos.
Nesse caso particular, 31 é sempre uma matriz semidefinida positiva (Tabela 2.2).
u'kuk & k =
Devido ao centramento, a matriz 31 sempre tem pelo menos um autovalor nulo. A razão
é que no máximo (n – 1) eixos reais são necessários para representar n pontos no espaço
euclidiano. Pode haver mais de um autovalor nulo se a matriz de distância for degenerada,
Degenerar ou seja, se os objetos puderem ser representados em menos de (n – 1) dimensões. Na
matriz D prática, existem c autovalores positivos e c eixos reais formando a representação euclidiana
dos dados, sendo a regra que c 5 n – 1.
Com a distância euclidiana (D1), quando há mais objetos do que descritores (n > p), o
valor máximo de c é p; quando n 5 p, então c 5 n – 1. Tome como exemplo um conjunto de
três objetos ou mais e dois descritores (n > p). Os objetos, tantos quantos forem, podem ser
representados em um espaço bidimensional — por exemplo, o diagrama de dispersão dos
dois descritores. Considere agora o caso em que existem dois objetos e dois descritores (n 5
p); os dois objetos requerem apenas uma dimensão para representação.
• Após o escalonamento, se os autovetores forem escritos como colunas (eg Tabela 9.9), as
linhas da tabela resultante serão as coordenadas dos objetos no espaço das coordenadas
principais, sem nenhuma transformação posterior; eles formam a matriz PC das coordenadas
principais. Traçar os pontos, digamos, nas duas primeiras coordenadas principais produz um
diagrama de ordenação de espaço reduzido dos objetos em duas dimensões.
2 — Exemplo numérico
Os leitores podem ter uma ideia melhor do que a análise de coordenadas principais faz
comparando-a com a análise de componentes principais. Considere uma matriz de dados Y
na qual uma análise de componentes principais (PCA) foi calculada, com autovalores
resultantes, autovetores (matriz U) e componentes principais (matriz F). Se alguém também
calculasse uma matriz de distância euclidiana D = [Dhi] para os mesmos n objetos, os
autovetores obtidos pela análise de coordenadas principais seriam exatamente os mesmos
que os componentes principais. Os autovalores do PCoA são iguais aos autovalores que alguém teria
Machine Translated by Google
Tabela 9.9 As coordenadas principais dos objetos (linhas) são obtidas dimensionando os autovetores para &.
Autovalores
Objetos Autovetores
. . .
. . .
. . .
xh uh1 uh2 ... uhc
. . .
. . .
. . .
XI ui1 ui2 ... uic
. . .
. . .
. . .
xn un1 un2 ... unc
2
= ...
Comprimentos:
) uik &1 &2 &c
eu
Centróide: = 0 0 ... 0
reino unido [ ]
obter de um PCA realizado na matriz de produtos cruzados [ ] yy – ' [ ] yy – ; estes são maiores que
os autovalores de um PCA conduzido na matriz de covariância S pelo fator (n – 1) porque S = (1/(n
– 1)) [ ] yy – ' [ ] yy – . Como o PCA foi definido, neste livro, como a autoanálise da matriz de
covariância S, os mesmos autovalores do PCA podem ser obtidos a partir de uma análise de
coordenadas principais calculada na matriz de distância Euclidiana entre os objetos e dividindo os
autovalores PCoA resultantes por (n – 1). Se alguém estiver interessado apenas na magnitude
relativa dos autovalores, esse passo de escalonamento não é necessário e pode ser ignorado.
O parágrafo anterior não significa que a análise de coordenadas principais esteja limitada a
matrizes de distâncias euclidianas. Na verdade, pode ser calculado para qualquer matriz de
distância. Se as distâncias não puderem ser prontamente incorporadas no espaço euclidiano,
autovalores negativos podem ser obtidos, com as consequências descritas na Subseção 9.3.4.
Machine Translated by Google
Exemplo numérico 2. O exemplo numérico para análise de componentes principais (Seção 9.1) é
usado aqui para ilustrar as principais etapas no cálculo das coordenadas principais.
O exemplo também mostra que calcular as coordenadas principais de uma matriz de distâncias euclidianas
D = [Dhi] fornece exatamente os mesmos resultados que uma análise de componente principal dos dados
brutos, com a exceção de que as cargas do descritor não são obtidas em PCoA. De fato, informações
sobre os descritores originais não são passadas para o algoritmo PCoA. De fato, como o PCoA é calculado
a partir de uma matriz de distância entre os objetos, ele não pode retornar os carregamentos dos descritores.
Um método para calculá-los a posteriori é descrito na Subseção 9.3.3 (eq. 9.45).
1) A matriz de distâncias euclidianas entre os 5 objetos da matriz de dados Y usada para ilustrar a
Seção 9.1 é:
O traço (soma dos elementos diagonais) desta matriz é 56. Isso é (n – 1) = 4 vezes o traço da matriz de
covariância calculada no PCA, que foi 14. Os elementos diagonais são as distâncias ao quadrado dos
pontos a o centróide multivariado. Observe que a matriz 31 poderia ter sido obtida diretamente da matriz
de dados Y centrada por colunas (Yc), conforme mencionado na Subseção 9.3.1 para o caso particular em
que D é calculado usando o coeficiente de distância euclidiana (D1, eq. 7.32): 31 = YcYc'. Os leitores
podem verificar essa propriedade numericamente para o exemplo.
3) Os autovalores e autovetores da matriz 31, escalados para & , são mostrados na Tabela 9.10.
Existem apenas c = 2 autovalores diferentes de zero; isso era esperado, pois as distâncias foram calculadas
a partir de p = 2 variáveis apenas (c = p = 2). As coordenadas principais, que são os autovetores
redimensionados do PCoA, são idênticas aos componentes principais (Subseção 9.1.2 e Tabela 9.6) neste
exemplo. Medidas de semelhança diferentes da distância euclidiana podem produzir um número diferente
de autovalores e coordenadas principais e, é claro, posicionariam os objetos de maneira diferente.
Tabela 9.10 Coordenadas principais calculadas para o exemplo numérico para PCA desenvolvido na Seção 9.1.
Compare com os resultados do PCA na Subseção 9.1.2 e na Tabela 9.6.
Autovalores
&1 &2
Objetos Autovetores
x1 –3,578 0,000
x2 –1,342 –2,236
x3 –1,342 2,236
x4 3,130 –2,236
x5 3,130 2,236
Autovalores de PCoA/(n – 1)
= autovalores do PCA correspondente 9.000 5.000
Comprimentos: ) 2=
você ik
6.000 = 36 4,472 = 20
eu
3 — Fundamentação do método
Gower (1966) mostrou que as relações de distância entre os objetos são preservadas no espaço
de coordenadas principal full-dimensional. Sua prova é resumida como segue.
• No espaço total das coordenadas principais (ou seja, todos os autovetores), a distância entre
os objetos h e i pode ser encontrada calculando a distância euclidiana entre as linhas h e i da
Tabela 9.9:
c 1 2ÿ c c c 1 2ÿ
2 2 2
D' oi =
) ( ) – uhk uik
=
) uik+)–2)uhkuik
uhk
(9.43)
k 1= k 1= k 1= k 1=
Machine Translated by Google
• Como os autovetores são dimensionados de forma que seus comprimentos sejam &k (em outro
palavras, U é dimensionado aqui para !1/2), os autovetores têm a propriedade de que 31 = UU'. Um
pode assim escrever:
+ +2+… ucu' c
31 = [4hi] = u1u' 1 u2u'
1 2ÿ
D' oi = [ 4hh 4ii 24hi ] –+
• A transformação da matriz de distâncias originais Dhi em A é tal que as distâncias são preservadas
no decorrer dos cálculos. Na verdade, pode-se substituir
2 os termos ahi na equação anterior por –0,5
Dhi (eq. 9.40), o que produz a equação
1 2ÿ
1 2 1 2 2
D' oi = – --Dhh +–--Dii
2 Dhi
2
1 2ÿ
2
D' oi = []Dhi
Gower (1966) também mostrou que as coordenadas principais podem ser calculadas diretamente a partir
de uma matriz de similaridade S em vez de uma matriz de distância D, como segue: (1) certifique-se de que a
diagonal da matriz S contém 1's e não 0's antes da centralização; (2) centro da matriz S usando a eq. 9.41 ou 9.42
Machine Translated by Google
sem aplicar a eq. 9,40 primeiro; (3) calcular os autovalores e autovetores; (4) multiplique os elementos de
D' oi reconstruídos no espaço de
cada autovetor k por &k 0,5. As distâncias entre os objetos pontuais
coordenadas principais de dimensão total não são as mesmas que as distâncias Dhi = (1 – Shi); eles são
=
distorcidos, sendo tais que D' 2 Dhi . Olhando de outro ponto de
D' 0,5
vista, as distâncias reconstruídas por um sem oi
mais
sãodistorção.
maiores Essas
que asrelações são
distâncias válidas
Dhi = (1 –apenas
Shi) se a
matriz centrada S for fator 2
semidefinida positiva, ou seja, se sua autodecomposição não produzir autovalores negativos.
1
Esp. ------------------Yc'Ust = (9.44)
( ) n 1–
0,5–
= (9.45)
Uproj n – 1 Spc!
x1
D D
1 1
x4
D D
D D
x2 1 x3
Figura 9.16 Esta figura, de Gower (1982), ilustra um caso em que a desigualdade triangular não é violada, mas nenhuma representação
euclidiana dos quatro pontos (x1 a x4) é possível porque as distâncias D, que são todas iguais, são muito pequenas
para que as três representações do ponto interno (x4) se unam em um único ponto. Assumindo que as arestas
externas são todas de comprimento 1, a desigualdade triangular será violada se D for menor que 0,5. Pelo contrário,
uma representação euclidiana bidimensional dos quatro pontos será possível com D = porque então as três
1 Com
representações de x4 se encontrarão no centróide. 3 ÿ D > a representação euclidiana dos quatro pontos, x1 a
13ÿ
x4, formará uma pirâmide tridimensional. ,
4 — Autovalores negativos
Existem matrizes de distância que não permitem uma representação completa das relações de distância entre
os objetos no espaço euclidiano (ou seja, um conjunto de coordenadas cartesianas reais).
• Problemas de representação euclidiana podem resultar do uso de uma medida de distância que viole a
desigualdade triangular. Tais distâncias são chamadas semimétricas e não métricas nas Tabelas 7.2 e 7.3.
anaridade não • Algumas matrizes de distância métrica apresentam problemas de “não-euclideanaridade”, conforme descrito
euclidiana por Gower (1982, 1985). A Figura 9.16 ilustra tal caso; o fechamento de todos os triângulos individuais
(condição de desigualdade triangular, Seção 7.4) é uma condição necessária, mas não suficiente para garantir
uma representação euclidiana completa de um conjunto de objetos.
Esta “não-Euclideanaridade”, quando presente, traduz-se em autovalores negativos.
Machine Translated by Google
Quando não se deseja aplicar uma transformação de raiz quadrada às distâncias, ou quando
problemas de autovalores negativos persistem apesar de uma transformação de raiz quadrada,
Gower & Legendre (1986) mostraram que o problema da “não-Euclideanaridade” e da autovalores
negativos que vêm com ela, podem ser resolvidos adicionando uma constante (grande o
suficiente) a todos os valores de uma matriz de distância que não se presta à representação
euclidiana completa. Nenhuma correção é feita ao longo da diagonal, porque a distância entre
um objeto e ele mesmo é sempre zero. Na verdade, adicionar alguma constante grande faria os
autovalores negativos desaparecerem e produziria uma representação totalmente euclidiana,
mas também criaria uma dimensão extra (e autovalor) para expressar a variância adicional assim
gerada. Na Fig. 9.17c, por exemplo, adicionar um valor grande, como 0,4, a todas as seis
distâncias entre os quatro pontos no gráfico criaria uma pirâmide, exigindo três dimensões para
uma representação euclidiana completa em vez de duas.
* A presente subseção corrige dois erros de impressão no teorema 7 de Gower & Legendre (1986).
Machine Translated by Google
x3
x3
x4
(a) (b) (c)
D = 0,777 x3
x4 x4
D = 0,377
x1
D = 0,577
D=
1,2
x1 D = 0,8 x2
x1 D = 1,0 x2 x2
Figura 9.17 (a) Distâncias entre quatro pontos construídos de tal forma que o sistema não pode ser representado no
espaço euclidiano porque as três retas indo em direção ao ponto x4 não se encontram. (b)
Adicionando uma constante a todas as distâncias (c2 = 0,2 no caso presente), o método de correção
2 torna o sistema euclidiano; neste exemplo, as distâncias podem ser associadas a uma
representação dos pontos no espaço bidimensional. (c) Ao aumentar ainda mais as distâncias
(adicionando novamente 0,2 a cada distância no presente caso), o sistema permanece euclidiano,
mas requer mais dimensões para representação (três dimensões neste exemplo).
2
Dˆoi 2c1 += Dhi para h 6 eu
(9.46)
Como obter c1 é descrito algumas linhas abaixo. Em seguida, prossiga para a transformação de Dˆ em
matriz usando a eq.A 9.40. As duas operações podem ser combinadas em uma única transformação Aˆ =
[ produzindo a nova matriz aˆ diretamente das distâncias hi originais] Dhi:
1 2 1 2
= 1 2
= – --Dˆ oi = – – c1 para h 6 eu
aˆ oi
2 ( 2c1
– -- Dhi 2 )+ --Dhi
2
Em seguida, prossiga com a eq. 9.41 e recalcule o PCoA. A constante a ser adicionada, c1, é o valor
absoluto do maior autovalor negativo obtido pela análise da matriz original 31. A constante c1 também é
usada na eq. 9,48 abaixo. Após a correção, todos os autovalores diferentes de zero são aumentados por
um valor igual a c1, de modo que o maior autovalor negativo é agora deslocado para o valor 0. Como
consequência, a solução corrigida tem dois autovalores nulos (portanto, um máximo de n - 2 dimensões ),
ou mais se a matriz for degenerada. A constante c1 é o menor valor que produzirá o efeito desejado.
Qualquer valor maior que c1 também eliminaria todos os autovalores negativos e tornaria o sistema
totalmente euclidiano, mas também criaria uma solução que requeria mais dimensões.
Machine Translated by Google
• Método de correção 2 (proposto por Cailliez, 1983). — Adicione uma constante c2 a todos
Dˆ
os elementos Dhi da matriz D, exceto os da diagonal, criando uma nova matriz de distâncias
Dˆ através da transformação:
oi
Dˆ hi Dhi c2 += para h 6 eu
(9.47)
2
–= 1 Dhi
( ) +c2See para h 6 eu
aˆ oi --
More 2
Em seguida, prossiga com a eq. 9.41 e recalcule o PCoA. A constante a ser adicionada, c2,
é igual ao maior autovalor positivo obtido pela análise da seguinte matriz especial, que é de
ordem 2n:
0 231
– EU
4 32 –
onde 0 é uma matriz nula, I é uma matriz identidade, 31 é a matriz centrada definida pelas
eqs. 9.40 e 9.41, e 32 é uma matriz contendo valores (–0.5Dhi) centrados usando a eq.
9.41. A ordem de cada uma dessas matrizes é n. Cuidado: a matriz especial é assimétrica.
Pressione e outros. (2007) descrevem um algoritmo para calcular os autovalores de tal
matriz. A função eigen() do R também pode computá-los. A solução tem dois autovalores
nulos (daí um máximo de n – 2 dimensões), ou mais se a matriz for degenerada. A constante
c2 é o menor valor que produzirá o efeito desejado; qualquer valor maior que c2 também
eliminaria todos os autovalores negativos e tornaria o sistema totalmente euclidiano, mas a
solução exigiria mais dimensões. A Figura 9.17ab mostra o efeito de adicionar a constante
c2 a um grupo não euclidiano de quatro pontos, e a Fig. 9.17c mostra o efeito de adicionar
um valor maior que c2.
2 2 2
= –
= – (Dhi
0,52c2Dhi c2 ) ++ para h 6 eu
aˆ oi ( 0,5 Dhi c2
+ )
O efeito em aˆ não depende apenas do valor de c2 , mas também varia com cada valor hi
Dhi. Isso claramente não é o mesmo que subtrair uma constante de todos os valores de ahi
(ou seja, método de correção 1). Os autovetores resultantes de uma ou outra correção
também diferem daqueles resultantes de um PCoA sem correção para autovalores negativos.
Os dois métodos de correção, e PCoA sem correção, correspondem assim a diferentes
partições da variação porque a variância total, dada pelo traço da matriz centrada 31, difere
entre os métodos.
Machine Translated by Google
Quão grandes devem ser as constantes c1 e c2 para o coeficiente D14 = 1 – S17, o que é importante
para a análise de dados de abundância de espécies? Para responder a esta questão, Legendre &
Anderson (1999) simularam matrizes de dados de abundância de espécies. Depois de calcular a distância
D14, as constantes de correção (c1 para o método 1, c2 para o método 2) aumentaram quase linearmente
com a razão (número de locais: número de espécies). Em ecossistemas extremamente pobres em
espécies, as correções foram as maiores; por exemplo, com uma proporção de 20:1 (por exemplo, 200
locais, 10 espécies), c1 estava próximo de 0,4 e c2 estava próximo de 0,8. Quando a proporção era
próxima de 1:1 (ou seja, número de locais 7 número de espécies), c1 era de cerca de 0,06 e c2 era de
cerca de 0,2. Em ecossistemas ricos em espécies, as correções foram pequenas, tornando-se menores
à medida que a riqueza de espécies aumentava para um número constante de sítios; com uma proporção
de 1:2, por exemplo (por exemplo, 100 locais, 200 espécies), c1 foi próximo a 0,02 e c2 foi cerca de 0,1.
Os resultados também dependeram, até certo ponto, dos parâmetros de geração de dados.
Para resumir, todos os métodos para eliminar autovalores negativos operam tornando as pequenas
distâncias maiores, em comparação com as grandes distâncias, a fim de permitir que todos os triângulos
se fechem (Figs. 9.16, 9.17a e b). Conforme explicado acima, a primeira abordagem consiste em tirar a
raiz quadrada de todas as distâncias; isso reduz as maiores distâncias mais do que as pequenas. As
outras duas abordagens (descritas acima como métodos de correção 1 e 2) envolvem a adição de uma
constante a todas as distâncias não diagonais; pequenas distâncias são proporcionalmente mais
aumentadas do que grandes distâncias. No método de correção 1, uma constante (2c1) é adicionada ao
2
quadrado das distâncias Dhi , enquanto no próprio método 2.* uma constante (c2) é adicionada às
distâncias Dhi
Exemplo numérico 3. Considere o exemplo numérico usado na Subseção 7.4.2 para demonstrar a
natureza semimétrica da diferença percentual (D14). A matriz de dados continha 3 objetos e 5 espécies.
– 2
Matriz D, matriz A = [ e matriz 31 são: 0,5 Dhi ] ,
O traço de 31 é 0,21597. Os autovalores são: &1 = 0,21645, &2 = 0,00000 e &3 = –0,00049. A soma dos
autovalores é igual ao traço.
Para o método de correção 1, o valor c1 = 0,00049 é subtraído de todos os valores não diagonais de A
Aˆ para fornecer , que é então centralizado (eq. 9,41) para fornecer a matriz corrigida 31:
O traço da matriz corrigida 31 é 0,21694. Os autovalores corrigidos são: &1 = 0,21694, &2 = 0,00000 e &3 =
0,00000. Esta solução euclidiana é unidimensional.
*
Na linguagem R, a função pcoa() no APE oferece essas duas correções.
Machine Translated by Google
Para o método de correção 2, valor c2 = 0,00784, que é o maior autovalor do especial que é então
matriz, é adicionado a todos os elementos não diagonais da matriz D para obter Aˆ Dˆ ,
transformado em (eq. 9.40) e centrado (eq. 9.41) para dar a matriz corrigida 31:
O traço da matriz corrigida 31 é 0,22226. Os autovalores corrigidos são: &1 = 0,22226, &2 = 0,00000 e &3
= 0,00000. Esta solução euclidiana é unidimensional, como foi o caso do método de correção 1.
O traço de 31 é 0,39739. Os autovalores são: &1 = 0,36906, &2 = 0,02832 e &3 = 0,00000.
Nenhum autovalor negativo é produzido usando este coeficiente. Esta solução euclidiana é bidimensional.
m c
R2-like $ %$
9 )" 8 &k ÿ
# % 9 ) &k (9.5)
ratio 8" #
k 1= k 1=
Machine Translated by Google
% &k mc1 + #
9)
corrigido 8"
k 1=
-------------------------------------------------- --
n (9.48)
R2-like ratio
$
%
+ ( c1
) n 1–
8"
9) &k #
k 1=
5 — Aplicações ecológicas
Exemplo numérico 1 (continuação da Subseção 9.2.5). A partir dos dados mostrados na Fig. 9.10 e
na Tabela 9.7, quatro medidas de distância em modo Q foram calculadas entre os locais (Tabela 9.11) para
ilustrar algumas propriedades da análise de coordenadas principais.
• Linha 1 da Tabela 9.11 — A distância euclidiana D1 é um coeficiente simétrico. Não é ideal para dados de
abundância de espécies e é usado aqui apenas para comparação. Uma análise de coordenadas principais
dessa matriz levou a 19 autovalores: três positivos (representando 50, 41 e 9% da variação, respectivamente)
e 16 nulos. Isso era esperado, pois a matriz de dados original continha três variáveis.
• Linha 2 — A distância D14 é frequentemente aplicada a dados de abundância de espécies. Como seu
S17 de um complemento, ele exclui zeros duplos. A análise de coordenadas principais desta matriz de
distância levou a 19 autovalores: 11 positivos, um nulo e 7 negativos. A matriz de distância foi corrigida
usando o método 1 da Subseção 9.3.4, que faz uso do maior autovalor negativo. O PCoA produziu 17
autovalores positivos e dois nulos, sendo o maior responsável por 31% da variação. A matriz de distância
também foi corrigida usando o método 2 da Subseção 9.3.4, que
Machine Translated by Google
Tabela 9.11 Matrizes de distância calculadas a partir dos dados artificiais da Fig. 9.10 e da Tabela 9.7. Cada linha desta tabela
corresponde à primeira linha de uma matriz de distância, comparando o site 1 consigo mesmo e com os outros 18
sites. As linhas restantes das matrizes de distância não são mostradas para economizar espaço; os leitores podem
calcular essas matrizes a partir dos dados da Tabela 9.7. Os valores são arredondados para uma única casa decimal.
Locais de amostragem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
D1 (euclidiano) 0,0 1,0 3,0 6,0 7,0 6,1 3,6 4,1 7,0 8,1 7,1 4,6 4,6 7,1 8,1 7,1 4,1 2,2 1,4
D14 = (1 – S17) 0,0 0,3 0,6 0,8 0,8 0,8 0,7 0,7 0,8 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0
D14 0,0 0,6 0,8 0,9 0,9 0,9 0,8 0,8 0,9 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0
D16 ((2 distâncias) 0,0 0,0 0,0 0,0 0,0 0,3 0,8 1,6 2,1 2,4 2,3 2,2 2,2 2,3 2,4 2,4 2,4 2,4 2,4
faz uso do maior autovalor da matriz especial. O PCoA também produziu 17 autovalores positivos e dois
nulos, sendo o maior responsável por 34% da variação.
• Linha 3 — A análise de coordenadas principais também foi realizada usando a raiz quadrada do
coeficiente D14. A análise resultou em 18 autovalores positivos, um nulo e nenhum negativo, sendo o
maior responsável por 35% da variação.
• Linha 4 — Uma quarta matriz de distância foi calculada usando a (2 distância D16, que exclui zeros
duplos. A análise de coordenadas principais produziu 19 autovalores: dois positivos (representando 4 e
36% da variação, respectivamente) e 17 nulos. A (2 distância (D16) é o coeficiente preservado na análise
de correspondência (CA, Seção 9.2), que também produziria dois autovalores positivos com esses dados.
De fato, CA sempre produz uma dimensão a menos que o número original de espécies, ou menos no
caso de matrizes degeneradas.
Este exemplo mostra que diferentes medidas de distância podem levar a números muito diferentes
de dimensões das representações euclidianas. Nas análises aqui relatadas, os números de dimensões
obtidos foram 3 para distância D1, 11 para D14 não corrigido (sem contar os eixos complexos
correspondentes a autovalores negativos), 17 para D14 após correção pelo maior autovalor negativo, 18
para a raiz quadrada de D14 e 2 para D16.
Para os dados de exemplo, a ordenação PCA (Fig. 9.11a, b) é idêntica à ordenação que teria sido
obtida do PCoA de uma matriz de distâncias euclidianas entre sítios, conforme mostrado no Exemplo
numérico 2 (Subseção 9.3.2). Da mesma forma, a ordenação dos sítios no gráfico CA (Fig. 9.11c), que
utilizou o escalonamento tipo 1, é semelhante a uma ordenação PCoA que seria obtida a partir de uma
matriz de (2 distâncias (D16) entre os sítios ) . As ordenações (Fig. 9.18) obtidas dos coeficientes de
distância D14 e os coeficientes são frequentemente D14 também são interessantes porque
usados para analisar dados de composição da comunidade, eles são ilustrados na Fig. 9.18ad. As
ordenações produzidas por esses coeficientes são bastante semelhantes entre si e apresentam ferraduras,
que não são tão pronunciado quanto no PCA porque os coeficientes D14 e D14 excluem zeros duplos
dos cálculos. Na Fig. 9.18a (coeficiente D14), os locais 6 a 14 formam um arco representando o
gradiente de três espécies, com braços estendendo-se em uma perpendicular
Machine Translated by Google
0,8 0,5
10 (a) (b)
0,6 0,3
9 11 6 14
5 15
7 13
0,4 0,1 4 16
8 12 10
PCoA
eixo
II
PCoA
eixo
III
3 8 12 17
0,2 -0,1 9 11
7 13
0,0 -0,3 2 18
6 14
1 19
-0,2 -0,5 1 19
PCoA, distância = D14 PCoA, distância = D14
Análise corrigida para autovalores negativos Análise corrigida para autovalores negativos
-0,4 -0,7
-0,6 -0,4 -0,2 0,0 0,2 PCoA eixo 0,4 0,6 -0,6 -0,4 -0,2 0,0 0,2 PCoA eixo I 0,4 0,6
I
0,6 0,5
10
0,5 9 11
(c) 0,4 (d)
0,4 0,3
6 14
8 12
0,3 0,2 4 16
5 7 13 15
0,2 0,1 10
PCoA
eixo
II
PCoA
eixo
III
0,1 0,0
89 11 12
7 13 3 17
0,0 -0,1
-0,1 1 19 -0,2
6 14
-0,2 -0,3 2 18
-0,3 -0,4 1 19
Figura 9.18 Ordenações de coordenadas principais dos dados da Fig. 9.10 e Tabela 9.7. Distância D14,
análise corrigida para autovalores negativos: (a) eixos PCoA I e II (&1 = 30,8%, &2 = 18,6%),
(b) eixos I e III (&1 = 30,8%, &3 = 8,3%). Distância D14 : (c) PCoA eixos I e II (&1 = 34,5%,
&2 = 22,9%), (d) eixos I e III (&1 = 34,5%, &3 = 10,5%).
direção (eixo III, Fig. 9.18b) para dar conta da dispersão dos sítios 1 a 5 e 15 a 19, cada
grupo contendo apenas uma espécie, conforme Tabela 9.7. A ordenação produzida pelo
coeficiente D14 é muito semelhante à anterior (Fig. 9.18cd). Porém, há duas vantagens em
D14 relação a D14 : nuncaD14produz autovalores negativos e, pelo menos no presente caso,
a ordenação explica mais variação do que D14 em duas ou três dimensões.
Field & Robb (1970) estudaram os moluscos e cracas de uma costa rochosa (21 quadrats) em False Bay,
África do Sul, a fim de determinar a influência dos fatores emergência (altura da costa em relação ao nível
médio do mar ) e onda nessas comunidades. Os quadrantes 1 a 10, em um transecto paralelo à linha de costa,
diferiram em sua exposição à ação das ondas; quadras 11 a 21, localizadas em um transecto em ângulo reto
com a linha de costa, cobriam o espectro entre as marés altas médias e baixas médias das marés vivas.
Foram enumeradas 79 espécies, uma atingindo 10864 indivíduos em um único quadrante. Ao subir a costa,
os quadrats apresentavam números progressivamente maiores de indivíduos e números menores de espécies.
Isso ilustra o princípio de que o aumento do estresse ambiental (aqui, o fator de emergência ) é acompanhado
pela diminuição da diversidade. Também mostra que as poucas espécies que podem suportar um alto grau
de estresse não encontram muita competição interespecífica e podem, portanto, tornar-se muito abundantes.
A mesma ordenação das coordenadas principais poderia ter sido obtida estimando-se as abundâncias
das espécies com menor grau de precisão, por exemplo, usando classes de abundância. A Tabela 7.4 fornece
as medidas de associação que seriam apropriadas para tais dados. ( ) foram
Abundância de espécies primeiro normalizados por transformação logarítmica y' ij ), para formar a
= ( ) 1+ ,
loge y' ij matriz
analisados. Produtos escalares entre Y =foram
vetores[yij] contendo
usados o y''ij e centrado ( y''ij yij yi –= dados a serem
quadrat
como medidas de similaridade:
= Y Y'
Sn n × np × pn ×
As coordenadas principais foram calculadas usando um procedimento variante proposto por Orlóci (1966).
A Figura 9.19 mostra a ordenação dos quadrantes 1 a 19 no espaço das duas primeiras coordenadas
principais. A ordenação também foi calculada incluindo os quadrantes 20 e 21 mas, como estes vieram da
parte mais alta da costa, introduziram tanta variação na análise que o fator emergência dominou as duas
primeiras coordenadas principais. Para a presente aplicação ecológica, apenas a ordenação dos quadrantes
1 a 19 é mostrada. Os autores procuraram uma relação entre esta ordenação e os dois fatores ambientais,
calculando os coeficientes de correlação de postos de Spearman (eq. 5.3) entre os postos dos quadrantes em
cada eixo principal e seus postos nos dois fatores ambientais. Isso mostrou que o primeiro eixo principal teve
uma correlação significativa com a elevação em relação à linha de costa (emergência), e o segundo eixo foi
significativamente relacionado à ação das ondas. Os autores concluíram que o PCoA é bem adaptado ao
estudo de gradientes ecológicos, desde que o conjunto de dados seja bastante homogêneo. (A análise de
correspondência, descrita na Seção 9.2, teria sido outra forma apropriada de obter uma ordenação desses
quadrantes.)
Machine Translated by Google
1
8 2
3
4
10
2 9
PCoA
eixo
II
15
11 13
0
6
12
4
8
–2 7 16
5 14
17
–4
18
19
–6
–6 –4 –2 0 2 4 6 8 10 12
PCoA eixo I
Figura 9.19 Ordenação dos quadrantes 1 a 19 no espaço das duas primeiras coordenadas principais (eixos I e II do
PCoA). Modificado de Field & Robb (1970).
Cada ano foi representado por uma tabela de dados de 161 locais (bóias) × 5 espécies
dominantes (biomassa seca). Uma matriz de similaridade entre os locais foi calculada para cada
ano separadamente, usando a forma assimétrica do coeficiente de similaridade de Gower (S19). As
lareira oito matrizes anuais foram comparadas entre si usando estatísticas de Mantel (Subseção 10.5.1).
estatística Uma análise de coordenada principal (Fig. 9.20) foi realizada na matriz resultante das estatísticas (1
– Mantel) para determinar se as diferenças ano a ano eram aleatórias ou organizadas. O padrão de
dispersão entre os anos sugeriu a existência de um ciclo de variação cuja duração era
aproximadamente igual à duração do estudo. Este ciclo pode representar a resposta do sistema
Estuário-Golfo, como uma unidade integrada, a entradas externas de energia auxiliar, embora o
processo causal específico, físico ou biótico, permaneça desconhecido.
O mesmo tipo de análise desta aplicação ecológica, ou seja, comparando várias matrizes de
dados sobre os mesmos objetos, pode ser baseado em coeficientes RV (equação 11.66) calculados
entre todos os pares de matrizes de dados. Os correspondentes coeficientes do tipo distância (1 –
RV) seriam montados em uma matriz de distância quadrada e PCoA seria calculado nessa matriz
para obter uma ordenação do tipo ilustrado na Fig. 9.20.
Machine Translated by Google
0,4
1975
0,3
0,2
1984
1976
0,1
coordenada
Segunda
principal
1981
0
–0,1
1977
–0,2 1983 1982
1980
–0,3
–0,4
–0,5 –0,4 –0,3 –0,2 –0,1 0 0,1 0,2 0,3 0,4 0,5
Figura 9.20 Variabilidade interanual ilustrada no espaço das duas primeiras coordenadas principais, obtida a partir da
análise de uma matriz de estatísticas de Mantel comparando matrizes de similaridade anual. Recalculados
a partir dos valores estatísticos de Mantel fornecidos na Fig. 8 de Ardisson et al. (1990).
6 — Algoritmo
Transforme e centralize a matriz de distância seguindo o método de Gower (eqs. 9.40 e 9.41).
c) Escala final
Escale cada autovetor k para o comprimento &k para obter as coordenadas principais.
† Para uma matriz de distâncias euclidianas D1, os autovalores obtidos de PCoA são maiores que os de PCA por um fator (n
– 1).
Os métodos de ordenação de espaço reduzido das seções anteriores produziram uma ordenação
(dimensionamento) dos objetos no espaço full-dimensional. Os usuários poderiam então selecionar
as primeiras dimensões e verificar como as relações de distância entre os objetos foram
preservadas naquele espaço reduzido. Há casos, no entanto, em que a preservação exata das
distâncias entre os objetos não é de importância primordial, sendo a prioridade, em vez disso, a
representação dos objetos em um número pequeno e especificado de dimensões, geralmente
duas ou três. Nesses casos, o objetivo é plotar objetos dissimilares distantes no espaço de
ordenação e objetos semelhantes próximos uns dos outros. Isso é chamado de preservação de
relacionamentos de ordenação entre objetos. O método para fazer isso é chamado de
escalonamento multidimensional não métrico (nMDS, ou simplesmente MDS). Foi desenvolvido
pelos psicometristas Shepard (1962, 1966) e Kruskal (1964a, b). Os programas para nMDS foram
originalmente distribuídos pelos Bell Laboratories em Nova Jersey, onde o método se originou;
ver Carroll (1987) para uma revisão. O método está agora disponível em vários pacotes de
computador principais (SPSS, SAS, SYSTAT, etc.) e especializados, bem como em R*. Uma
referência útil é o livro de Kruskal & Wish (1978). As relações entre nMDS e outras formas de
ordenação foram descritas por Gower (1987).
Extensões de nMDS para várias matrizes, modelos ponderados, análise de dados de preferência,
etc. são discutidos por Young (1985) e Carroll (1987). Uma forma de escalonamento híbrido,
combinando critérios de escalonamento métricos e não-métricos, foi proposta por Faith et al.
(1987); foi explicado em Belbin (1991) e está disponível nos pacotes DECODA (escrito por Peter
R. Minchin) e PATN.
Machine Translated by Google
Como a análise de coordenadas principais (PCoA), o nMDS não está limitado a matrizes de distância
euclidianas; ele pode produzir ordenações de objetos de qualquer matriz de distância. O método também
pode prosseguir com distâncias ausentes - na verdade, quanto mais distâncias ausentes houver, mais
fáceis serão os cálculos - desde que haja medidas suficientes para posicionar cada objeto em relação a
alguns dos outros. Esse recurso o torna um método de escolha para a análise de matrizes obtidas por
observação direta (por exemplo, estudos de comportamento) ou ensaios de laboratório, onde frequentemente
ocorrem distâncias pareadas ausentes. Alguns programas podem lidar com matrizes de distância não
simétricas, para as quais fornecem uma solução de compromisso entre as distâncias nas partes triangulares
superior e inferior da matriz. Ao contrário de PCA, PCoA ou CA, que são métodos baseados em autovetores,
os cálculos nMDS não maximizam a variabilidade associada a eixos individuais da ordenação; Os eixos
nMDS são arbitrários, de modo que os gráficos podem ser rotacionados, centralizados ou invertidos
arbitrariamente. As razões para isso ficarão claras a partir da apresentação do método.
Considere uma matriz de distância Dn× = [Dhi] calculado usando uma medida apropriada para os
n
dados disponíveis (Capítulo 7). A Matriz D também pode resultar de observações diretas, por exemplo,
afinidades entre indivíduos ou espécies encontradas em estudos sorológicos, de pareamento de DNA ou
comportamentais; essas matrizes podem ser não simétricas. O dimensionamento multidimensional não
métrico da matriz D pode ser resumido nas etapas a seguir.
2) Construa uma configuração inicial dos objetos em m dimensões, para ser usada como ponto de
partida para o processo de ajuste iterativo dos passos 3 a 7. A forma como essa configuração inicial é
escolhida é crítica porque a solução para a qual o algoritmo eventualmente converge depende até certo
ponto nas posições iniciais dos objetos. O mesmo problema foi encontrado com o particionamento K-means
(Seção 8.8); o “espaço de
* O nMDS está disponível nas funções R listadas na Seção 9.5. Também é encontrado nos seguintes pacotes
disponíveis comercialmente (lista não exaustiva):
• NTSYSPC. Distribuição: ver nota de rodapé na Seção 7.8.
• PATN. Distribuição: ver nota de rodapé na Seção 7.8.
• PRIMÁRIO. Esse pacote foi desenvolvido por MR Carr e KR Clarke no Plymouth Marine Laboratory, Prospect Place,
West Hoe, Plymouth PL1 3DH, Grã-Bretanha. • PC-ORD. Distribuição: ver nota de rodapé
na Seção 11.7. Além do nMDS, o PC-ORD contém muitos outros métodos de análise multivariada de dados ecológicos.
Machine Translated by Google
Local soluções” podem conter vários mínimos locais além do mínimo geral (Fig. 8.17).
mínimo As soluções usuais para este problema são as seguintes:
• Execute o programa várias vezes, começando com diferentes posicionamentos iniciais aleatórios dos
objetos. A solução que minimiza a função objetivo (etapa 5) é mantida.
• Iniciar a execução a partir de uma ordenação obtida por outro método, por exemplo, PCoA.
• Trabalhe passo a passo da dimensionalidade superior para a inferior. Calcule, por exemplo, uma
primeira solução nMDS em 5 dimensões a partir de um posicionamento inicial aleatório dos objetos.
Observe o valor da tensão (eqs. 9,49 a 9,51), que deve ser baixo porque o alto número de dimensões
impõe pouca restrição às distâncias. Utilizar 4 das 5 dimensões assim obtidas como configuração inicial
para um percurso em 4 dimensões, e assim sucessivamente até atingir o número desejado (m) de
dimensões de ordenação.
3) Calcule uma matriz de distâncias ajustadas dhi no espaço de ordenação, usando uma das
métricas de Minkowski (D6, eq. 7.43). Na maioria das vezes, escolhe-se o segundo grau da métrica de
Minkowski, que é a distância euclidiana. (a) Na primeira iteração, as distâncias dhi são calculadas a
partir da configuração inicial (muitas vezes aleatória). (b) Nas iterações subsequentes, a configuração é
a obtida no passo 6.
Diagrama 4) Considere o diagrama de Shepard (Figs. 9.1 e 9.21b) comparando as distâncias ajustadas dhi
de Shepard com as distâncias empíricas (isto é, originais) Dhi. Regredir dhi em dhi. Os valores dˆ previstos pela
linha de regressão são chamados . A escolha do tipo de
oi regressão fica a cargo do usuário, dadas as
opções implementadas no programa de computador. As escolhas usuais são as regressões lineares,
polinomiais ou monótonas (também chamadas de “não paramétricas”, embora existam outros tipos de
métodos de regressão não paramétrica).
A regressão monótona é uma função degrau restrita para sempre aumentar da esquerda para a
direita (Fig. 9.21b); esta é uma escolha comum em nMDS. Uma regressão monótona é equivalente a
uma regressão linear realizada após a transformação monotônica das distâncias originais Dhi, de modo
a maximizar a relação linear entre Dhi e dhi.
A regressão é ajustada por mínimos quadrados.
valores empatados Se houver valores empatados entre as distâncias empíricas, Kruskal (1964a, b) propôs duas
abordagens que podem ser seguidas na regressão monótona. É provável que ocorram empates quando
as distâncias empíricas Dhi são calculadas a partir de uma tabela de dados brutos usando um dos
coeficientes descritos no Capítulo 7; eles são menos prováveis de ocorrer quando as distâncias resultam
de observações diretas. Na Fig. 9.21b, por exemplo, existem empates para vários dos valores da
abcissa; o maior número de empates é encontrado em D = Dmax = 1.
• Na abordagem primária de Kruskal , aceita-se o fato de que, se uma distância empírica Dhi corresponde
a diferentes valores ajustados dhi, ela também corresponde a diferentes previsões
Machine Translated by Google
valores dˆoi . Portanto, a linha de regressão monótona pode subir em uma coluna de valores empatados,
sujeita à restrição de que a linha de regressão não pode diminuir em comparação com os valores anteriores D. A
linha de regressão monótona não é uma função matemática nesse caso , no entanto. Para garantir a
monotonicidade, a única restrição dˆ nos valores é:
oi
dˆ = oi
dˆ quando Dgi = Dhi, então kimono
Os programas de computador podem diferir na maneira como lidam com gravatas. Isso pode causar grandes
diferenças entre os valores de tensão relatados correspondentes às soluções finais, embora as configurações
finais dos pontos sejam geralmente muito semelhantes de programa para programa, exceto quando dois
programas identificam soluções finais diferentes com valores de tensão muito semelhantes.
Uma escala de espaço reduzido seria perfeita se todos os pontos no diagrama de Shepard caíssem
exatamente na linha de regressão (linha reta, curva suave ou função degrau); a ordenação das distâncias
ajustadas dhi seria exatamente a mesma das distâncias originais Dhi e o valor da função objetivo (etapa 5) seria
zero.
Função 5) Meça a qualidade do ajuste da regressão usando uma função objetiva. Todas as funções objetivas usadas
objetiva no nMDS são baseadas na soma das diferenças quadradas dˆ entre os valores ajustados e os valores
correspondentes previstos pela função de regressão; esta é a soma usual dos resíduos
oi quadrados da análise de
dhi
regressão (critério dos mínimos quadrados, Subseção 10.3.1). Várias variantes foram propostas e são usadas em
programas nMDS:
2 2
Estresse (fórmula 1) = )oi,
( dhi
) dˆ – oi ÿ)
oi ,eu
dhi (9.49)
2 2
Estresse (fórmula 2) = )oi,
( dhi
) dˆ – oi ÿ)
oi ,eu
dhi ( ) – d (9,50)
Machine Translated by Google
2 2
2
Estresse =
)
oi ,eu
( ) – dhidˆoi (9.51)
Os denominadores nas duas fórmulas de Estresse (eqs. 9.49 e 9.50) são termos escalonados que
tornam as funções objetivo adimensionais e produzem valores de Estresse entre 0 e 1. Essas funções
objetivo podem aplicar a raiz quadrada, ou não, sem alterar a questão; uma configuração que minimiza
essas funções objetivas também minimizaria as formas sem raiz quadrada. Outros critérios objetivos,
como Strain, foram propostos. Todas as funções objetivas medem o quão longe a configuração de
espaço reduzido está de ser monotônica para as distâncias originais Dhi. Seus valores são apenas
relativos, medindo a diminuição da falta de ajuste entre as iterações do procedimento de cálculo.
6) Melhore a configuração movendo-a levemente no sentido de diminuir a tensão. Isso é feito por
um algoritmo de otimização numérica chamado método de descida mais íngreme; o método é explicado,
Descida por exemplo, em Numerical Recipes (Press et al., 2007) e em Kruskal (1964b). A direção da descida
mais íngreme mais íngreme é a direção no espaço de soluções ao longo da qual a tensão diminui mais rapidamente.
Essa direção é encontrada analisando as derivadas parciais da função de tensão (Carroll, 1987). A
ideia é mover os pontos no gráfico de ordenação para novas posições que provavelmente diminuirão
o estresse mais rapidamente.
7) Repita os passos 3 a 6 até que a função objetivo atinja um valor pequeno e pré-determinado
(falta de ajuste tolerado), ou até que a convergência seja alcançada, ou seja, até que atinja um mínimo
e nenhum progresso adicional possa ser feito. As coordenadas calculadas na última passagem pelo
passo 6 tornam-se as coordenadas dos n objetos nas m dimensões da ordenação de escala
multidimensional.
8) A maioria dos programas nMDS gira a solução final usando a análise de componentes principais,
para facilitar a interpretação.
Na maioria das situações, os usuários do nMDS decidem que desejam uma representação dos
objetos em duas ou três dimensões, para ilustração ou outro propósito. Em alguns casos, porém,
questiona-se qual seria o “melhor” número de dimensões para um conjunto de dados, ou seja, qual
seria o melhor compromisso entre um resumo dos dados e uma representação precisa das distâncias.
Conforme apontado por Kruskal & Wish (1978), determinar a dimensionalidade de uma ordenação
nMDS é tanto uma questão substantiva quanto uma questão estatística. Os aspectos substantivos
dizem respeito à interpretabilidade dos eixos, facilidade de uso e estabilidade da solução. O aspecto
estatístico é mais fácil de abordar, pois o estresse pode ser usado como um guia para a
dimensionalidade. Trace os valores de tensão em função da dimensionalidade das soluções, usando
uma das fórmulas de tensão acima (eqs. 9.49 a 9.51). Como a tensão diminui à medida que a
dimensionalidade aumenta, escolha para a solução final a dimensionalidade onde a mudança na
tensão se torna pequena.
Para dados de contagem de espécies, Faith et al. (1987) mostraram, por meio de simulações, que
a seguinte estratégia produz resultados de ordenação informativos: (1) padronizar os dados por
Machine Translated by Google
dividindo cada valor pela abundância máxima para aquela espécie no conjunto de dados; (2)
usar a medida de similaridade Steinhaus (S17) ou Kulczynski (S18) ; (3) calcular a ordenação
por nMDS.
Além das vantagens mencionadas acima para o tratamento de distâncias não métricas ou
matrizes não simétricas (consulte também as Seções 2.3 e 8.10 sobre este tópico), Gower (1966)
apontou que o nMDS pode resumir distâncias em menos dimensões do que a análise de
coordenadas principais (ou seja, menor tensão em, digamos, duas dimensões). Os resultados
dos dois métodos podem ser comparados examinando os diagramas de Shepard dos resultados
obtidos por PCoA e nMDS, respectivamente. Se a dispersão de pontos no diagrama de Shepard
para PCoA for estreita, como na Fig. 9.1a ou b, a ordenação de espaço reduzido é útil porque
reflete corretamente as posições relativas dos objetos. Se a dispersão for ampla ou quase
circular (Fig. 9.1c), o diagrama de ordenação é de pouca utilidade e pode-se tentar o nMDS para
encontrar uma solução mais satisfatória em algumas dimensões. Uma solução de PCoA
permanece mais fácil de calcular na maioria dos casos, no entanto, porque não requer várias
execuções e é obtida usando um algoritmo de autoanálise direta em vez de um procedimento iterativo.
Exemplo numérico 1 (continuação das Subseções 9.2.5 e 9.3.5). A matriz de distância de diferença percentual (D14)
calculada na Tabela 9.11 foi submetida à análise nMDS usando o pacote DECODA escrito por Peter R. Minchin. Este
programa nMDS usa a fórmula Stress 1 (eq. 9.49). Corridas repetidas, usando m = 2 dimensões, mas diferentes
configurações iniciais aleatórias, produziram resultados muito semelhantes; o melhor tinha um valor de tensão de 0,0181
(Fig. 9.21a).
A abordagem secundária de Kruskal, explicada com a etapa de cálculo 4 acima, foi usada na Fig. 9.21b para todos
os valores empatados encontrados quando Dhi < Dmax, enquanto a abordagem primária foi usada quando Dhi = Dmax =
1. A justificativa para isso decorre do fato de que as distâncias empíricas Dhi são bloqueadas por um teto artificial Dmax
da função de distância, sobre a qual não podem aumentar. Assim, não se espera que pares de sítios empatados na
distância Dmax = 1, para os quais dhi seja maior que o valor anterior, tenham a mesma distância na ordenação. daí esses
valores dˆ ,
Usando D14 como medida de distância, ao invés de D14, produziu uma ordenação idêntica, pois nMDS é invariante
a transformações monotônicas das distâncias. O valor do estresse não
também muda, porque a transformação de raiz quadrada de D14 afeta apenas a abcissa da Fig. 9.21b, enquanto a tensão
é calculada ao longo da ordenada. O efeito de arco encontrado na Fig. 9.18a não aparece na Fig. 9.21a. O eixo horizontal
da ordenação nMDS reproduz o gradiente original quase perfeitamente neste exemplo.
Os pontos em um gráfico nMDS podem ser girados, transladados, invertidos ou dimensionados a posteriori de
qualquer maneira considerada apropriada para alcançar a máxima interpretabilidade ou para ilustrar os resultados. Isso
pode ser feito manualmente ou, por exemplo, por meio da análise canônica dos eixos nMDS em relação a um conjunto de
variáveis explicativas (Capítulo 11).
Com os dados presentes, uma ordenação unidimensional (stress = 0,1089) reconstruiu perfeitamente o gradiente dos
sites 1 a 19; a mesma ordenação sempre foi obtida ao repetir a execução de diferentes configurações iniciais aleatórias e
cascateando de 3 para 2 para 1 dimensões. Essa configuração e o baixo valor de tensão dificilmente foram obtidos ao
realizar a ordenação nMDS diretamente em uma dimensão, sem o procedimento em cascata.
Machine Translated by Google
3.0
(b)
(a) 2.5
1,0
5 4 15 16 14 2.0
0,5 6
3 17 1,5
7 13
Distâncias
ajustadas
MDS
ddhi)
(em
2-
0,0
2 18
8 12 1,0
-0,5
1 19
9 11
0,5
10
-1,0
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
0,0
0,0 0,2 0,4 0,6 0,8 1,0
Figura 9.21 (a) Ordenação nMDS (2-dimensional) da matriz de distância D14 na Tabela 9.11. Os locais de amostragem são
numerados como na Fig. 9.10 e na Tabela 9.7. (b) Diagrama de Shepard da solução final (2-dimensional)
mostrando a linha de regressão monótona ajustada por regressão não paramétrica. A dispersão sobre a
linha é medida por uma função de tensão (eq. 9.49 a 9.51).
Sprules (1980) usou escalonamento multidimensional não métrico para analisar mudanças sazonais em
conjuntos de zooplâncton em um local localizado no Lago Blelham, no Lake District do norte da Inglaterra, e
em dois recintos experimentais construídos naquele lago. Os três locais foram pesquisados semanalmente
de junho a dezembro de 1976. O nMDS foi preferido ao PCA porque as respostas das espécies aos
gradientes ambientais não podem ser consideradas lineares.
Para cada local, os pontos no diagrama de ordenação nMDS foram conectados em ordem cronológica
para refletir as mudanças sazonais na composição faunística. O gráfico (não reproduzido aqui) é, portanto,
do mesmo tipo da Fig. 12.24. Em um dos recintos, a assembléia oscilou em torno de um valor médio sem
nenhum ciclo claro; espécies de pequeno porte dominaram a assembléia. No outro recinto e no lago, as
mudanças foram mais direcionais; nesses locais, os predadores eram mais abundantes. Com base nas
evidências disponíveis, Sprules concluiu que as diferenças observadas entre os dois padrões de mudança
sazonal estavam relacionadas a diferenças na intensidade da predação, qualidade dos alimentos disponíveis
aos herbívoros e dinâmica dos nutrientes.
Redford e outros. (2010) estudaram as bactérias que vivem nas superfícies das folhas de 56 espécies de
árvores encontradas no campus da Universidade do Colorado em Boulder, Colorado, EUA. As comunidades
bacterianas foram caracterizadas por pirosequenciamento com código de barras. Os autores analisaram o intra
Machine Translated by Google
Programas 519
e variação entre espécies de árvores na composição da comunidade bacteriana. Eles descobriram que as
comunidades bacterianas são mais semelhantes dentro de uma determinada espécie de árvore e entre
espécies intimamente relacionadas do que entre espécies hospedeiras filogeneticamente distantes. Os
resultados foram ilustrados por gráficos nMDS calculados a partir de matrizes de distâncias filogenéticas e
de ecologia de comunidades entre comunidades bacterianas. Os autores também compararam as
comunidades bacterianas encontradas em agulhas de Pinus ponderosa de diferentes locais com distâncias
geográficas variando de 10 m a mais de 10.000 km; as floras bacterianas das folhas de outras três espécies
de árvores de Boulder foram incluídas nesta análise. Os autores descobriram que as comunidades
bacterianas eram mais semelhantes entre as árvores P. ponderosa de diferentes locais do que entre
diferentes espécies hospedeiras do campus da Universidade do Colorado em Boulder.
Muitas aplicações ecológicas de escala multidimensional não métrica são encontradas na literatura
ecológica. Dois artigos são especialmente interessantes: Whittington & Hughes (1972; biogeografia
ordoviciana a partir da análise da fauna trilobita) e Fasham (1977; comparação de escala
multidimensional não métrica, análise de coordenadas principais e análise de correspondência para a
ordenação de cenóclinos e cenóplanos simulados). O aplicativo ecológico 12.6b (Subseção 12.6.5)
apresenta um gráfico nMDS.
9.5 Software
Todos os pacotes estatísticos de uso geral oferecem análise de componentes principais, mas não com
opções para escalas usadas por ecologistas. Entre os pacotes especializados recomendados para
análise ecológica estão CANOCO* (ter Braak & Smilauer, 1998 e edições posteriores), PC-ORD e SYN-
TAX 2000. Para distribuição desses programas, consulte
Seção 11.7.
* CANOCO foi muitas vezes referido neste capítulo. Foi o primeiro programa a oferecer aos ecologistas
toda uma gama de métodos de ordenação simples e canônicos e ainda é a referência para desenvolvedores
de programas de ordenação.
Machine Translated by Google