Você está na página 1de 44

MANEJO FLORESTAL – DEF/UFV Prof.

Agostinho Lopes de Souza

ANÁLISE FATORIAL
Uma Introdução

ÍNDICE

Página

1. INTRODUÇÃO .......................................................................................................... 1
2. MODELO TEÓRICO ................................................................................................. 2
3. PROCEDIMENTOS GERAIS PARA A ANÁLISE FATORIAL ("FACTOR
ANALYSIS") ............................................................................................................. 5
3.1. Considerações Iniciais ......................................................................................... 5
3.2. Estágios ................................................................................................................ 5
4. MÉTODOS DE ESTIMAÇÃO DAS CARGAS DOS FATORES ............................ 6
4.1. Método do Componente Principal ....................................................................... 6
4.2. Método do Fator Principal ................................................................................... 10
4.2.1. O Problema da Comunalidade ....................................................................... 11
4.3. Método da Máxima Verossimilhança .................................................................. 12
5. ROTAÇÃO DOS FATORES ..................................................................................... 15
5.1 Método Varimax ................................................................................................... 15
6. ESTIMAÇÃO DOS VALORES DOS FATORES ..................................................... 20
6.1. Método da Regressão (Método de Thomson)...................................................... 20
6.2. Método dos Mínimos Quadrados Ponderados (Método de Bartlett) ................... 21
7. EXEMPLOS DE APLICAÇÃO ................................................................................. 22
7.1. Exemplo 1 ............................................................................................................ 23
7.2. Exemplo 2 ............................................................................................................ 27
8. POSSÍVEIS FONTES DE ERROS EM ANÁLISE FATORIAL .............................. 38
9. NÚMERO E SIGNIFICADO DOS FATORES ......................................................... 39
10. PERSPECTIVAS E ESTRATÉGIAS PARA ANÁLISE FATORIAL .................... 41
11. REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................... 42

0
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

1. INTRODUÇÃO

A análise fatorial ("Factor Analysis") é a principal e a mais antiga técnica de análise


multivariada. A idéia fundamental foi proposta por Sperman e por Pearson, no início do
século, para entender problemas relacionados à psicologia educacional, na tentativa de definir
inteligência (MARRIOTT, 1974).
Seu desenvolvimento e principalmente, a sua utilização, foram limitados durante
muitos anos, devido à complexidade dos cálculos envolvidos. Com o advento do
processamento de dados computadorizado, o uso e interesse pela análise fatorial foi renovado
e retomado (MENEZES et al., 1978). A análise fatorial tem sido usada nas mais diversas
áreas do conhecimento, como por exemplo, Agronomia (FACHEL, 1978), Biologia
(FOWLER, 1993), Floresta (QUEIROZ, 1984), Ciências Sociais (MENEZES et al., 1978),
em que o pesquisador se depara com observações de várias variáveis para cada elemento de
uma amostra de plantas, animais, ou de outros tipos de unidades experimentais.
MENEZES et al., 1978 comentam que a análise fatorial pode ser usada no agrupa-
mento de variáveis ou no agrupamento de unidades de observações. No primeiro caso a matriz
de dados iniciais tem as variáveis nas colunas e as unidades de amostra nas linhas. No
segundo caso, transpõe-se a matriz anterior, obtendo-se as unidades nas colunas e as variáveis
nas linhas.
Se o número de variáveis estudadas é grande, uma estratégia de análise seria a de
tentar simplificar ou melhor estruturar o conjunto de dados, a partir das inter-relações entre
tais variáveis. Tais inter-relações podem ser medidas pelas covariâncias ou pelos coeficientes
de correlação entre as variáveis. Duas técnicas estatísticas de análise multivariada são
comumente utilizadas para tratar este problema: Análise de Componentes Principais e Análise
Fatorial (JOHNSON & WICHERN, 1988).
A Análise Fatorial é um conjunto de métodos estatísticos que, em certas situações,
permite "explicar" o comportamento de um número relativamente grande de variáveis obser-
vadas, em termos de um número relativamente pequeno de variáveis latentes ou fatores. Os
fatores podem ser não correlacionados (fatores ortogonais) ou correlacionados (fatores
oblíquos). As variáveis são agrupadas por meio de suas correlações, ou seja, aquelas perten-
centes a um mesmo grupo serão fortemente correlacionadas entre si, mas pouco correlacio-
nadas com as variáveis de outro grupo. Cada grupo de variáveis representará um fator
(JOHNSON & WICHERN, 1988).
Como uma técnica de análise multivariada, é relevante mostrar como se situa a
Análise Fatorial em relação às outras técnicas. Segundo Kendal (1950), citado por FACHEL
(1976), as técnicas de análise multivariada podem ser distinguidas em:
a) Análise de dependência: quando queremos estudar a dependência de uma ou mais
variáveis em relação às outras. Consideramos, então, dois subconjuntos: um no qual as
variáveis são denominadas independentes e outro em que tratamos das variáveis dependentes.
b) Análise de interdependência: quando estamos interessados nas relações de um
conjunto de variáveis entre si, sem selecionarmos nenhuma delas em especial, como variável
dependente.
No primeiro tipo de análise enquadram-se, por exemplo, Análise de Regressão e Aná-
lise de Variância Multivariada, enquanto que é no segundo tipo de classificação, salientando-
se apenas o caráter de interdependência das variáveis que se enquadram as técnicas de Análise
Fatorial e de Componentes Principais.

1
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

2. MODELO TEÓRICO

Considerando um conjunto de p variáveis, com n observações para cada variável,


obtém-se o arranjo de valores
[ x ij ], i = 1, 2,..., n , j = 1, 2,..., p

à partir do seguinte conjunto de dados

Variáveis
indivíduos X1 X2 ... Xp
1 x 11 x12 ... x 1p
2 x 21 x 22 ... x 2p
... ... ... ...
n x n1 x n2 ... x np

O modelo da análise de fatores supõe que cada variável X j é linearmente dependente de


poucas variáveis aleatórias não observadas F1 , F2 , ..., Fm (m < p) chamadas fatores comuns, e
p fontes adicionais de variação e1 , e2 , ..., e p , chamadas erros ou, algumas vezes, fatores
específicos (JOHNSON & WICHERN, 1988).

Em particular, o modelo da análise de fatores pode ser escrito como* :

X1 = a11F1 + a12 F2 + ⋅⋅⋅ + a1m Fm + e1


X2 = a 21F1 + a 22 F2 + ⋅⋅⋅ + a 2 m Fm + e2
⋅⋅⋅
X p = a p1F1 + a p2 F2 + ⋅⋅⋅ + a pm Fm + e p
ou seja,
X j = a j1F1 + a j2 F2 + ⋅⋅⋅ + a jm Fm + e j , (eq.2.1)

onde X j é a j-ésima variável, a j1 , a j2 , ⋅⋅⋅, a jm são as cargas dos fatores para a j-ésima
variável e F1 , F2 , ⋅⋅⋅, Fm são m fatores comuns não correlacionados, com m menor que p.
Os p valores observados X p são expressos em termos de p + m variáveis aleatórias
não observáveis ( F1 , F2 ,! , Fm ; ε 1 , ε 2 ,! , ε p ). Isso distingue o modelo fatorial do modelo de

* Observe que, no presente modelo, foi desconsiderado o vetor de médias de cada variável simplesmente para simplificar a
exposição teórica, mas sem perda de generalidade. Seria como se estivéssemos trabalhando com as observações centradas, o
que consiste em subtrair, de cada observação, o valor da média das observações. O modelo, considerando-se o vetor de
médias, seria: X j = µ + a j1F1 + a j2 F2 + ⋅⋅⋅ + a jm Fm + e j o que corresponde a
X j − µ = a j1F1 + a j2 F2 + ⋅⋅⋅ + a jm Fm + e j

2
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

regressão múltipla, no qual as variáveis independentes podem ser observadas, e cujas posições
são ocupadas por F no modelo fatorial.
Matricialmente teríamos

X = ( pxm
( px1)
Λ ) ( mxF1) + ( pxε1) (eq.2.2)

Uma verificação direta do modelo fatorial, à partir das observações X1, X2,..., Xp, é
impossibilitada por tantas quantidades não observáveis. Entretanto, com algumas pressupo-
sições impostas aos vetores aleatórios, F e ε, o modelo fatorial implica em certas relações de
covariância, que podem ser verificadas (JOHNSON & WICHERN, 1988). Assim os vetores F
e ε devem satisfazer as seguintes condições:

E(F) =
( mx1)
I)
0 ,Cov(F) = E(FF`) = ( mxm
E(ε) = 0 , Cov(ε) = E[εε`] = ( pxp
( px1)
ψ ) onde ψ é uma matriz diagonal

e que F e ε são independentes. Assim,

Cov(ε,F) = E(εF`) = 0
( pxm)
(eq.2.3)

Essas pressuposições e a relação em (eq.2.2) constituem o chamado modelo de fatores


ortogonal.
Se admitirmos os fatores F serem correlacionados, de modo que Cov(F) é não
diagonal, teremos o chamado modelo de fatores obliquo. Este modelo não será discutido neste
trabalho.
Das pressuposições acima, obtemos a estrutura da matriz de covariâncias de X, que
será representada por Σ.
Temos que XX`= (ΛF + ε) (ΛF + ε)`
= (ΛF + ε) [(ΛF)` + ε`]
= ΛF(ΛF)` + ε(ΛF)` + ΛFε` + εε`

de modo que, de acordo com (eq.2.3) teríamos:


Σ = Cov(X) = E(XX`)
= ΛE(FF`)Λ` + E(εF`)Λ` + ΛE(Fε`) + E(εε`)
=ΛIΛ` + 0 + 0 + Ψ
=ΛΛ` + Ψ (eq.2.4)

De uma maneira mais fácil de entender e usando apenas propriedades da variância,


poderíamos, à partir da relação (eq.2.1), chegar ao mesmo resultado:
temos:
X j = a j1F1 + a j2 F2 +... + a jm Fm + e j

aplicando as propriedades da variância, e com base nas pressuposições em (eq.2.3), teremos:


V( X j ) = a 2j1V( F1 ) + a 2j2 V( F2 ) +... +a 2jmV( Fm ) + V(e j )

3
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

= a 2ji + a 2j2 + ... + a 2jm + V(e j )


onde a 2j1 + a 2j2 +... +a 2jm, ou seja ΛΛ`, é chamada de comunalidade da variável Xj (a parte da
sua variância que está relacionada com os fatores comuns) enquanto que V(e j ) é chamada
especificidade de X j (a parte da sua variância que não está relacionada com os fatores
comuns).
Temos, portanto, a estrutura de covariância:
a. Cov( X) = ΛΛ' + Ψ ou
Var ( X i ) = a 2i1 +! + a 2im + ψ i
Cov( X i , X k ) = a i1a k1 +! + a ima km
b. Cov( X, F) = Λ
Cov( X i Fj ) = a ij

Pode também ser estabelecido que a correlação entre Xj e Xj' é


rj j' = a j1a j'1 + a j2 a j' 2 +... + a jma j' m
Conseqüentemente, duas variáveis somente serão altamente correlacionadas se elas
tiverem altas cargas no mesmo fator.
O modelo fatorial pressupõe efeitos aditivos; fatores, variáveis e resíduos
normalmente distribuídos, resíduos independentes e relações lineares entre as variáveis
(JOHNSON & WICHERN, 1988)
Pelo teorema do limite central, generalizando da estatística univariada para a
multivariada, temos: se X1 , X2 , ..., Xp variáveis têm variâncias s12 , s 22 , …, s p2 e correlações
ri j, com i e j = 1, 2, ..., p, então as médias X 1 , X 2 , …, X p, de uma amostra de tamanho n,
possui uma distribuição que, com o aumento de n, se aproxima de uma distribuição normal
multivariada, com variâncias σ 12 , σ 22 , …, σ p2 e correlações ρi j estabilizadas e constantes para
os valores de X. Esse teorema assegura que muitas das técnicas e testes estatísticos baseados
na distribuição normal multivariada são consistentes e não conduzem a resultados duvidosos,
mesmo quando os dados originais não são derivados de uma distribuição normal multivariada
(MARRIOT, 1974).
Na estatística multivariada, assume-se que as matrizes de dispersão são homogêneas,
ou seja, que as variâncias e covariâncias são independentes das médias e são as mesmas entre
os grupos. Se essa homogeneidade não ocorre, é necessário transformar os dados para
estabilizar as variâncias, seguindo os mesmos procedimentos adotados na estatística
univariada. Problema mais raro e irremediável consiste na dependência entre as correlações e
as médias (MARRIOT, 1974).
O modelo fatorial assume que as p+p(p-1)/2=p(p+1)/2 variâncias e covariâncias para
X podem ser reproduzidas a partir de pm cargas fatoriais (aij) e p variâncias específicas (ψi).
Quando m = p, qualquer matriz de covariância (Σ) pode ser reproduzida exatamente como
ΛΛ ' , e ψ pode ser nula. Contudo, a análise fatorial será mais eficiente e útil quando m for
pequeno em relação a p, proporcionando uma explicação mais simples da covariação das
variáveis em X, com base num número de parâmetros menor do que os p(p+1)/2 parâmetros
de Σ (JOHNSON & WICHERN, 1988).
Em resumo o modelo fatorial implica na imposição de condições que permitem obter
estimativas únicas de Λ e ψ. Posteriormente, a matriz de cargas fatoriais (Λ) é submetida à
rotação (multiplicação por uma matriz ortogonal), a qual é determinada por critérios de

4
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

facilidade de interpretação. Obtidas as cargas e as variâncias específicas, os fatores são


identificados e comumente calcula-se os valores dos escores fatoriais.
De alguma forma, pode-se dizer que a matriz de correlações ou de covariâncias das
variáveis constitui o genótipo responsável pela variação das unidades de observação,
enquanto a matriz de escores das unidades nos fatores constitui o fenótipo, isso é, o
posicionamento das mesmas no genótipo. O genótipo pode ser constituído por um (genótipo
parcial) ou mais fatores (genótipo complexo ou geral) (MENEZES et al., 1978).

3. PROCEDIMENTOS GERAIS PARA A ANÁLISE FATORIAL ("FACTOR


ANALYSIS")

3.1. Considerações Iniciais

Dado n observações de p variáveis, geralmente, correlacionadas queremos saber se o


modelo de fatores (eq.2.2), com um pequeno número de fatores m (m < p), representa
adequadamente os dados. Essencialmente, poderíamos solucionar este problema tentando
verificar a relação das covariâncias de X.
A matriz de covariância amostral S é um estimador da matriz de covariâncias popula-
cionais desconhecidas Σ. Se os elementos fora da diagonal principal de S forem pequenos ou
ainda se os correspondentes elementos da matriz de correlação amostral R, forem essencial-
mente iguais a zero, então as variáveis não são relacionadas (ou muito pouco relacionadas), e
a análise de fatores não terá utilidade. Nessas circunstâncias, os fatores específicos desempe-
nham papel dominante e, portanto, a análise fatorial será pouco eficiente, pois busca a deter-
minação de um pequeno número de fatores comuns importantes. Entretanto, se S aparenta
desviar significativamente da matriz diagonal, então o modelo de fatores pode ser ajustado
(JOHNSON & WICHERN, 1988).

3.2. Estágios

Existem três estágios na análise de fatores. O problema inicial é a determinação das


cargas dos fatores (aj k) com j = 1 a p, e k = 1 a m (sendo m < p). Há vários métodos para a
estimação de parâmetros na análise fatorial, dos quais os mais comuns são o Método do
Componente Principal e o Método da Máxima Verossimilhança.
Não importando qual método seja usado para a determinação das cargas dos fatores, é
possível mostrar que tais cargas não são únicas. Se F1, F2, ..., Fm são os fatores provisórios,
então, combinações lineares desses fatores na forma
F1* = d11F1 + d12 F2 +... +d1m Fm
F2* = d 21F1 + d 22 F2 +... +d 2m Fm
⋅⋅⋅
Fm* = d m1F1 + d m2 F2 +... +d mmFm
podem ser construidas, e "explicarão" os dados tão bem quanto os anteriores. Existe um
número infinito de soluções alternativas para os modelos de análise fatorial, e isto nos conduz
ao segundo estágio da análise, o qual é chamado rotação dos fatores. Dessa forma, os fatores
provisórios são transformados, com o objetivo de se encontrar novos fatores, mais fáceis de

5
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

serem interpretados. A "rotação", neste contexto, significa essencialmente a escolha dos d i j


nas equações acima.
A rotação dos fatores pode ser ortogonal ou oblíqua. Com a rotação ortogonal, os
novos fatores serão não-correlacionados, enquanto que com a rotação oblíqua os novos fatores
serão correlacionados. Para qualquer tipo de rotação usada, é desejável que as cargas para os
novos fatores sejam ou próximas de zero ou muito diferentes de zero. Uma carga aj k próxima
de zero indica que a variável Xj não é muito relacionada com o fator Fk. Um grande (positivo
ou negativo) valor de aj k (carga dos fatores) indica que Xj (a variável j) é determinada por Fk
(fator k) em grande extensão. Se cada variável for fortemente relacionada com alguns fatores,
mas não de todo relacionada com outros, então isto faz com que os fatores sejam mais
facilmente identificados.
Um método de rotação dos fatores ortogonal, que é freqüentemente usado, é chamado
Rotação Varimax (KARSON, 1982). Este método será explicado em seção posterior.
O último estágio da análise corresponde à estimação dos valores dos fatores comuns
F1, F2, ..., Fm para cada indivíduo, como função das variáveis observadas.

4. MÉTODOS DE ESTIMAÇÃO DAS CARGAS DOS FATORES

Na literatura existem três terminologias referentes à análise fatorial, ou seja, compo-


nentes principais, eixos principais e fatores principais. Elas diferem somente na composição
das variáveis. O eixo principal é usualmente padronizado para ter uma média zero e uma
variância igual à variância total considerada. O componente principal é o mesmo eixo
principal, exceto que sua média não é padronizada para zero. O fator principal é normalizado
para ter uma média zero e variância unitária (KIM, 1975).
Segundo HARMAN (1968), a solução da fatoração com valores unitários nas diago-
nais da matriz de correlação pode ser chamada de solução de componente principal, e a
solução com comunalidades nas diagonais da matriz de correlação é denominada de solução
do fator principal.
JOHNSON & WICHERN (1988) consideram os Métodos do Componente Principal e
o da Máxima Verossimilhança como os mais recomendados para análise fatorial.

4.1. Método do Componente Principal

A análise fatorial e a análise de componentes principais são usadas para a mesma


finalidade, ou seja, expressar a informação contida numa série de observações em um menor
número de dimensões, e o relacionamento entre ambas é grande. Os primeiros componentes
podem ser tomados como uma aproximação para os fatores correspondentes. Se um modelo
ligeiramente diferente for adotado, os componentes principais oferecem estimativas ótimas
dos fatores, dentro de um senso perfeitamente válido. Bartlett (1938), citado por MARRIOTT
(1974), discute o problema do ponto de vista matemático, buscando estimar as cargas fatoriais
à partir da análise de componentes principais da matriz de correlações. Trata-se de um
procedimento mais simples do que os métodos do Fator Principal e da Máxima
Verossimilhança.
A análise fatorial não se ocupa diretamente com a magnitude dos resíduos, mas sim
com as correlações entre eles. Neste sentido, a análise de componentes principais pode ser
vista como uma aproximação da análise fatorial, na medida que ao remover-se os primeiros
componentes principais da matriz de correlações, as correlações entre os resíduos usualmente

6
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

são reduzidas. Entretanto, ao extrair os componentes mais importantes, a análise de compo-


nentes principais não assume, necessariamente, que os resíduos não serão correlacionados ou
que serão normalmente distribuídos. Portanto, a distinção entre a análise fatorial clássica e a
análise de componentes principais reside no fato de que a primeira assume um modelo
matemático definido, no qual o relacionamento entre as variáveis é explicado precisamente
por m fatores, que os fatores e resíduos são normalmente distribuídos e as relações são
lineares (MARRIOTT, 1974).
Segundo MENEZES et al (1978), a diferença básica entre o modelo de análise de
componentes principais e o modelo clássico de análise fatorial é que, no primeiro caso,
considera-se a variável como tal, sem tentar extrair dela o fator único (soma do termo erro e
variância única). Na análise fatorial, faz-se uma estimativa através da comunalidade, que é
inserida na diagonal da matriz, obviamente com valores menores que um. Como a variância
explicada pelo modelo é a relação entre a soma dos valores na diagonal e a soma dos valores
fora da diagonal, quanto mais o valor diagonal exceder a comunalidade correta (aproximar-se
de um), tanto maior será a parcela da variância não comum sendo tomada como se fosse
variância comum. Essa distorção será tanto maior quanto mais inflada estiver a diagonal da
matriz, cujo resultado será a obtenção de fatores que não sejam comuns, construídos com
parcelas da variância comum das variáveis que o compõem. Ao contrário, eles estariam
misturados com a variância única, de tal forma que poderia obscurecer (ao invés de
simplificar) as relações entre as variáveis, gerando falsas interpretações e resultados.
A matriz de covariância Σ pode ser fatorada pelo processo de expansão de matrizes
simétricas, denominado decomposição espectral. Dessa forma, Σ será formada por pares de
autovalores (λ j) e correspondentes autovetores normalizados ( v j ), com
λ1 ≥ λ 2 ≥ ⋅⋅⋅ ≥ λ p ≥ 0 (JOHNSON & WICHERN, 1988). Ou seja:
Σ = λ1v1v1, + λ 2 v2 v,2 + ⋅⋅⋅ + λ p v p v,p =

⎡ λ1 v1, ⎤
⎢ ⎥
⎢ λ 2 v 2, ⎥
[ ]
λ1 v1 " λ 2 v 2 "!" λ p v p ⎢ ⎥ (eq.4.1)
⎢! ⎥
⎢ λ v , ⎥
⎣ p p ⎦
Um exemplo numérico poderia ilustrar essa igualdade:
Consideremos a matriz simétrica
⎡ 13 − 4 2 ⎤
B = ⎢⎢− 4 13 − 2⎥⎥
⎣⎢ 2 − 2 10 ⎥⎦
Os autovalores, obtidos à partir da equação característica |B-λI| = 0, são λ 1 = 18, λ 2 =
9 e λ 3 = 9. Os correspondentes autovetores v1 , v2 e v3 , obtidos após substituição de cada
autovetor na equação (B- λ j I) v j = 0, com posterior processo de normalização, são:

⎡ 2 3 ⎤ ⎡ 1 18
⎤ ⎡ 1 2 ⎤
⎢ ⎥
v1 = ⎢⎢−2 3 ⎥⎥,v2 = ⎢ −1 ev = ⎢⎢ 1 2 ⎥⎥
18 ⎥ 3
⎢⎣ 13 ⎥⎦ ⎢−4
⎣
⎥
18 ⎦
⎢⎣ 0 ⎥⎦

7
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

A decomposição espectral de B é, então:


B = λ1v1v1, + λ 2 v 2 v ,2 + λ 3 v 3 v ,3 ou

⎡ 13 − 4 2 ⎤ ⎡ 2 3 ⎤ ⎡ 1 18
⎤
⎢− 4 13 − 2⎥ = 18⎢−2 ⎥[2 ⎢ ⎥
⎢ ⎥ ⎢ 3 ⎥ 3
−2
3
1 ] +9 −1
3 ⎢ 18 ⎥
[ 1
18
−1
18
−4
18
]+
⎢⎣ 2 − 2 10 ⎥⎦ ⎢⎣ 13 ⎥⎦ ⎢−4
⎣
⎥
18 ⎦

⎡ 1 2 ⎤
+9⎢⎢ 1 2 ⎥⎥[ 1 2
1
2
0]=
⎢⎣ 0 ⎥⎦

⎡ 4 9 −4 9 2 9 ⎤ ⎡ 118 −118 −418⎤ ⎡ 1 2 1 2 0⎤


=18 ⎢⎢−4 9 4 9 −2 9 ⎥⎥+9⎢⎢ −118 118 418 ⎥⎥+9⎢⎢ 1 2 1 2 0⎥⎥
⎢⎣ 2 9 −2 9 19 ⎥⎦ ⎢⎣−418 418 1618 ⎥⎦ ⎢⎣ 0 0 0⎥⎦
como pode ser rapidamente verificado.
Os autovalores (λ) e os autovetores (v) da matriz de covariâncias ou correlações são a
essência da análise de componentes principais. Os autovetores determinam as direções de
variabilidade máxima e os autovalores especificam as variâncias. Quando os primeiros
autovalores são muito maiores do que os restantes, a maior parte da variância total pode ser
explicada em um número menor do que p dimensões.
Se tomarmos o modelo da análise fatorial tendo tantos fatores quanto variáveis (ou
seja, m=p) e as variâncias específicas ej = 0 para todo j, então a matriz de cargas dos fatores
(Λ) teria m=p colunas e seria dada por λ j v j. Ou seja, nós poderíamos escrever:

Σ
( pxp)
= Λ Λ' + 0 = Λ Λ'
( pxp) ( pxp) ( pxp)
(eq.4.2)

Apesar da representação da análise de fatores em (eq.4.2) ser exata, isto não é


particularmente útil. Ela usa tantos fatores comuns quantos são o número de variáveis, além
de não permitir nenhuma variação nos fatores específicos ej como em (eq.2.2). Portanto, são
preferíveis modelos que expliquem a estrutura de covariância levando em conta apenas alguns
fatores comuns. Uma aproximação, quando os últimos p-m autovalores são pequenos, é omitir
a contribuição dos termos λ m+1v m+1v,m+1 + ! + λ p v p v,p para a matriz Σ em (eq.4.1)
(JOHNSON & WICHERN, 1988). Omitindo esta contribuição, podemos obter a aproximação
⎡ λ1 v1, ⎤
⎢ ⎥
⎢ λ 2 v 2, ⎥
[
Σ = λ1 v1 | λ 2 v 2 | ⋅ ⋅ ⋅ | λ m v m ⎢ ] ⎥ = Λ Λ '
⎢! ⎥ ( pxm ) ( mxp )
⎢ λ v , ⎥
⎣ m m ⎦
(eq.4.3)
o que corresponde à (eq.2.4), porém omitindo-se Ψ
A representação aproximada em (eq.4.3) assume que os fatores específicos ej da
matriz ε em (eq.2.2) são de menor importância e podem também ser ignorados na fatoração de
Σ. Se os fatores específicos forem incluídos no modelo, suas variâncias poderiam ser tomadas
como sendo os elementos diagonais de Σ - ΛΛ`, onde ΛΛ` é definido em (eq.4.3).

8
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Para aplicar esta aproximação para um conjunto de dados x1j, x2j, ..., xnj, normal-
mente, as observações são centradas pela subtração da média amostral x j. As observações
centradas
⎡ xi1 ⎤ ⎡ x1 ⎤ ⎡ xi1 − x1 ⎤
⎢ x ⎥ ⎢ x ⎥ ⎢ x − x ⎥
( x ij − x j ) = ⎢ i 2 ⎥ − ⎢ 2 ⎥ = ⎢ i 2 2 ⎥
'
, i = 1, 2, ..., n
⎢ ! ⎥ ⎢!⎥ ⎢ ! ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣ xip ⎥⎦ ⎢⎣ x p ⎥⎦ ⎢⎣ xip − x p ⎥⎦

terão a mesma matriz de covariância amostral S, que os dados originais.


Nos casos em que as unidades das variáveis em estudo não são comensuráveis, é
preferível trabalhar com as variáveis padronizadas
x ij − x j x ij − x j
zij = =
n
s2j
∑ (x
i =1
ij − xj)
n −1
ou, matricialmente falando,
⎡ ( xi1 − x1 ) ⎤
⎢ ⎥
⎢ s12 ⎥
⎢ ( xi 2 − x2 ) ⎥
z i = ⎢
' ⎥
s 22 ⎥ , i = 1, 2, ..., n
⎢
⎢ ! ⎥
⎢ ( xip − x p ) ⎥
⎢ ⎥
⎢⎣ s 2p ⎥⎦

Com esta transformação, a matriz de covariância corresponde à matriz de correlação


das observações x1j, x2j, ..., xnj.
A padronização evita o problema de ter uma variável, com uma variância
relativamente grande, influenciando, inapropriadamente, a determinação das cargas dos
fatores.
A representação em (eq.4.3), levando-se em consideração os fatores específicos, ou
seja, Σ=ΛΛ' + ε, quando aplicada à matriz de covariância amostral S, ou à matriz de
correlação amotral R, é conhecida como solução por componentes principais. O nome deriva
do fato de que as cargas dos fatores são os coeficientes escalares da primeira amostra de
componentes principais (JOHNSON & WICHERN, 1988).
Notemos que, por esta solucão, as estimativas das cargas dos fatores para um dado
fator não mudam à medida que o número de fatores é aumentado. Por exemplo, se m=1, Λ
será dado por [ λ1 v1 ] e se m=2, Λ será dado por [ λ 1 v1 ! λ 2 v 2 ] , onde (λ1, v1) e (λ2,
v2) são os primeiros dois pares de autovalores e autovetores normalizados para a matriz de
covariância amostral S, ou para a matriz de correlação amostral R.
Um problema que surge agora é com relação ao número de fatores m que deveremos
considerar. Esse problema será tratado posteriormente (seção 9). Vale ressaltar, entretanto,
que o aumento do número de fatores considerados promove o aumento da comunalidade das
variáveis.
Voltando ao modelo de análise fatorial dado por:

9
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

X = ( pxm
( px1)
Λ ) ( mxF1) + ( pxε1)

poderíamos, então, escrever da seguinte maneira:


x1 = a11F1 + a12 F2 +... +a1m Fm + e1
x2 = a 21F1 + a 22 F2 +... +a 2 m Fm + e2
...
x p = a p1F1 + a p2 F2 +... +a pm Fm + e p

onde a ij = λ j v ji
Após a rotação, caso tenha sido necessária, a nova solução terá a forma:
X = GF* + ε ou seja
x1 = g11 F1* + g12 F2* +... + g1m Fm* + e1
x 2 = g 21 F1* + g 22 F2* +... + g 2 m Fm* + e 2
...
x p = g p1 F1* + g p2 F2* +... + g pm Fm* + e p
onde Fk representa o novo k-ésimo fator, e x representa os valores padronizados da variável
*

em apreço (ou seja, poderiam ser representados por z), e gpm representa as novas cargas dos
fatores após a rotação. É importante salientar que após a rotação a comunalidade não é
alterada.

4.2. Método do Fator Principal

Conforme comentado por JOHNSON & WICHERN (1988) este método se comporta
como uma modificação do método do componente principal, citado anteriormente.
Serão descritas as idéias do método, baseado na análise de fatores da matriz de
correlação amostral R, apesar do procedimento também ser apropriado para o caso de
trabalharmos com a matriz de covariância amostral S.
Se a matriz de correlação for adequadamente descrita pelo modelo fatorial
ρ = ΛΛ ' + Ψ , então os m fatores comuns podem ser usados para determinar os elementos fora
da diagonal principal de ρ e as comunalidades da diagonal, ou seja, ρ ii = 1 = h 2i + ψ i . Se a
contribuição do fator específico ψi for removida da diagonal, ou seja, se o valor um for
substituído por h 2i , a matriz resultante será ρ − Ψ = ΛΛ ' .
Do ponto de vista algébrico, o método tem por base obter um conjunto de fatores, de
modo que o mais importante fator comum (fator principal) seria o fator comum, com o
máximo de contribuição para a comunalidade total, o segundo mais importante (segundo fator
principal) seria o fator comum com a segunda maior contribuição para a comunalidade total, e
assim por diante, até que toda comunalidade tenha sido analisada (FACHEL, 1976).
A solução pelo método do fator principal requer que as comunalidades sejam
especificadas antes do primeiro fator ser extraído. A escolha das comunalidades a serem
substituídas na matriz de correlações é conhecida como "o problema da comunalidade"
(KARSON, 1982) e cinco propostas de escolha são dadas na seção 4.2.1.

10
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Após optar-se por um dos estimadores das comunalidades de cada variável,


substituímos a diagonal principal da matriz de correlação amostral pelas comunalidades
estimadas. A matriz assim obtida é denominada matriz de correlação amostral reduzida, e será
denotada por R*, ou seja,
⎡ hˆ12 r12 ! r1 p ⎤
⎢ ⎥
* ⎢ r12 hˆ22 ! r2 p ⎥
R =
⎢ " " " ⎥
⎢ ⎥
⎢⎣r1 p r2 p ! hˆ p ⎥⎦
2

em que h! 2j são obtidos a priori, por um dos processos descritos na seção 4.2.1.
Dessa maneira, todos os elementos da matriz de correlação reduzida R* poderiam ser
determinados pelos m fatores comuns.
À partir da matriz de correlação reduzida R*, aplica-se o método dos componentes
principais conforme comentado na seção 4.1. Escolhe-se então os m primeiros maiores
autovalores dessa matriz e os m autovetores normalizados correspondentes, obtendo-se, então,
a matriz das cargas fatoriais estimadas pela solução dos fatores principais e que é dada por:

!= λv
Λ j j

Dessa forma, as comunalidades poderiam, então, ser reestimadas por


m
h! 2j = ∑a 2
kj .
k =1

JOHNSON & WICHERN (1988) comentam também que tal procedimento pode ser
usado iterativamente, com as comunalidades reestimadas pela expressão anterior como sendo
as estimativas iniciais para o estágio seguinte.
Embora o método do componente principal de R possa ser visto como método do fator
principal, com as comunalidades iniciais estimadas iguais a unidade, ou variâncias específicas
iguais a zero, os dois métodos são filosófica e geometricamente diferentes (HARMAN, 1967).
Na prática, no entanto, os dois freqüentemente geram carregamentos fatoriais comparáveis, se
o número de variáveis for grande e o número de fatores comuns pequeno (JOHNSON &
WICHERN, 1988).

4.2.1. O Problema da Comunalidade

Foi observado acima, que a solução pelo método do fator principal requer um
conhecimento a priori das p comunalidades h12 , h 22 , !, h 2p , para formar a matriz de
correlação reduzida R*.
Existem vários métodos para estimar as comunalidades. Os mais comuns, conforme
citado por KARSON (1982), são:
a) h! 2j = 1 (j = 1, 2, ..., p), ou seja, tomar cada comunalidade como sendo igual a 1. Dessa
forma R* = R e a solução pelo método do fator principal seria idêntica à solução pelo
método do componente principal.
b) h! 2j = R 2j.1 , 2,..., j−1 , j+1 ,..., p , onde R 2 é o quadrado do coeficiente de correlação múltipla entre
a variável X j e todas as outras. Tipicamente esse valor é calculado por

11
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

1
1−
rjj

onde r j j é o j-ésimo elemento da diagonal principal de R −1 .


c) h! 2j = max j' | rj j' | (j ≠ j'), o que significa que h! 2j é tomado como o maior valor absoluto da
correlação simples entre X j e as outras variáveis.
p
r
d) h! 2j = ∑ j j' , assumindo que a média resultante das (p - 1) correlações simples de X j
j ' =1 p −1
j'≠ j
com as outras variáveis seja positiva.
e) h! 2j é tomado inicialmente por qualquer um dos quatro métodos acima e uma solução
m
2
pelo método do fator principal é obtida. A partir dessa solução, ∑a kj é computado para
k =1
!h2
cada j. Esses valores são tomados como novas comunalidades , e uma nova solução é
j

obtida. Esse processo iterativo é mantido até que tenhamos pequenas diferenças nas
comunalidades de uma etapa para a outra.
Para um número de variáveis (p) maior que 10, Gnanadesikan (1977), citado por
KARSON (1982), diz parecer haver pequenas diferenças nas soluções baseadas nos cinco
métodos

4.3. Método da Máxima Verossimilhança

O método da Máxima Verossimilhança para Análise Fatorial foi introduzido por


Lawley, em 1940, e não era muito usado anteriormente, por suas dificuldades computacionais.
Atualmente, no entanto, devido aos trabalhos de Jöreskog, já se encontram procedimentos
rápidos e eficientes para a obtenção dos estimadores por este método (FACHEL, 1976). Mas a
principal vantagem de utilizar o Método da Máxima Verossimilhança para Análise Fatorial é,
talvez, a possibilidade de se desenvolverem testes de hipóteses, com o objetivo de testar a
adequacidade do modelo, o que não é possível através dos outros dois métodos apresentados
anteriormente, devido às suas características não estatísticas.
Além das suposições habituais do modelo fatorial, suporemos que os vetores aleatórios
F (fatores comuns) e ε (fatores específicos) têm distribuição normal multivariada com vetores
de média zero e com matrizes de covariância I (pois estamos considerando os fatores não
correlacionados) e Ψ, respectivamente. Das suposições habituais (eq.2.3) e da suposição de
normalidade, segue que F e ε são mutuamente independentes. Como X é expresso em termos
de F e ε, conforme a equação (eq.2.2), temos que o vetor das variáveis observáveis é também
normal, com média zero e matriz de covariância Σ. Portanto, as condições para a aplicação do
Método da Máxima Verossimilhança na Análise Fatorial são:
a) X tem uma distribuição normal multivariada, com vetor de médias zero e matriz de
covariância Σ;
b) X = ΛF + ε, onde E(F) = E(ε) = 0, Var(F) = I, Var(ε) = Ψ = diag( ψ 2i ), Cov(F,ε) = 0;
c) Σ = ΛΛ' + Ψ ;

12
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

d) As colunas de X são amostras aleatórias de tamanho n das variáveis em questão e,


portanto, a matriz de covariância amostral S tem distribuição de Wishart*

O caminho a ser tomado será o de maximizar a função de verossimilhança de X, com


respeito aos pm elementos de Λ e os p elementos de Ψ.
De acordo com o modelo fatorial, toda a informação da amostra está contida em S.
Portanto, segundo KARSON (1982), ignorando os termos que não envolvem parâmetros e
usando a distribuição de Wishart, a qual nos dá a distribuição de probabilidade multivariada
para os elementos de S e tem a matriz de parâmetros Σ na função de verossimilhança para os
elementos de S, a função de verossimilhança pode ser escrita como

− ( n −1)/ 2 t r ( S Σ −1 )
L =| Σ|−( n −1)/ 2 e

Conforme feito usualmente, é melhor maximizar L maximizando

ln L = − ( n − 1) / 2 ln| Σ| + tr (SΣ −1 ) (eq.4.4)

Quando Σ em (eq.4.4) é substituído por ΛΛ' + Ψ , temos,

{ [
ln L = −[(n − 1) / 2] ln | ΛΛ'+Ψ | +tr S (ΛΛ'+Ψ) −1 ]} (eq.4.5)

O método da máxima verossimilhança envolve determinar os pm elementos de Λ e os


p elementos de Ψ que maximizem (eq.4.5). A indeterminação de Λ, devido às eventuais
rotações (que serão discutidas na seção 5) será aqui removida pela imposição da condição de
que Λ' Ψ −1 Λ deverá ser diagonal. Se Λ ! denotar a matriz dos estimadores de máxima
!
verossimilhança de Λ e Ψ denotar o estimador de máxima verossimilhança de Ψ, então Λ ! e
Ψ! serão obtidos diferenciando (eq.4.5) em relação a Λ e Ψ; fazendo as p(m + 1) derivadas
iguais a zero; e resolvendo o sistema das p(m + 1) equações. Detalhes dessa solução aparecem
em Jöreskog (1967) e Lawley e Maxwell (1971), citados por KARSON (1982). As equações
que requerem uma solução numérica são:

Λ (
ˆ I +Λˆ 'Ψ
ˆ −1 Λ )
ˆ = SΨ ˆ −1 Λ
ˆ (eq.4.6)
! = diag(S − ΛΛ
Ψ ! !' ) (eq.4.7)

onde Ψ! em (eq.4.7) é uma matriz diagonal, cujos elementos são os elementos diagonais da
matriz (pxp) S − ΛΛ! ! ' . Segundo KARSON (1982), numerosos métodos iterativos têm sido
propostos para resolver as equações (eq.4.6) e (eq.4.7) com o objetivo de obter a solução de
máxima verossimilhança, para um determinado conjunto de dados. O referido autor afirma
ainda que, independentemente do método utilizado, uma grande quantidade de recursos com-
putacionais é exigida.
A solução pelo método da máxima verossimilhança usa a matriz de covariância
amostral S, não a matriz de correlação amostral R, e portanto não assume implicitamente, que
os valores das variáveis estão padronizados. Se os valores Xi na população são supostos
padronizados, então Σ = Γ; e usando R nas expressões (eq.4.6) e (eq.4.7) no lugar da S,

* Temos que a matriz S é dada por A/(n-1), sendo A a matriz formada pelas somas de quadrados e somas de
produtos das variáveis em questão. Para maiores detalhes sobre essa distribuição, ver KARSON (1982) páginas
75-77 e JOHNSON & WICHERN (1988).

13
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

resultará em cargas dos fatores diferindo daquelas baseadas em S pelo fator 1/ s i i , o termo
constante na padronização (KARSON, 1982).
Uma vantagem do método da máxima verossimilhança é que ele permite ao analista
verificar se o modelo proposto é adequado, a partir de um teste de hipótese formal.
Independente de qual método seja usado, o analista deveria observar as magnitudes dos
elementos da matriz residual Σ − ( ΛΛ' + Ψ ) para um dado número de fatores m. Quanto me-
nores estes elementos, melhor a solução obtida reproduz Σ, sendo também melhor a estrutura
proposta para X j .
Quando o método da máxima verossimilhança é usado, o teste pode ser feito da
seguinte maneira:
H 0 : Σ = ΛΛ' + Ψ

pode ser testado contra

H 1 :Σ = qualquer outra matriz positiva definida.

pelo teste devido a Lawley (1940) e Bartlett (1951), citado por KARSON (1982), tomando-se
n > p e onde o número de graus de liberdade v = 21 [( p − m) 2 − ( p + m)] , em que a
estatística do teste é:

ˆΛ
2 p + 4m + 5 ⎧⎪ ⎛ | Λ ˆ '+ Ψˆ | ⎞ ⎫⎪
2
χ calc . = (n − 1 −
6
)⎨ln⎜⎜
| S | ⎟ (
⎢
⎣
ˆΛ
⎟ + tr ⎡ Λ ˆ '+ Ψ
ˆ )
−1
S ⎤ − p ⎬
⎥⎦
⎪⎩ ⎝ ⎠ ⎪⎭

JOHNSON & WICHERN (1988) mostram que, sob determinadas condições,


(
tr ⎡ Λ
⎢⎣
ˆΛ )
ˆ '+Ψ
ˆ −1 S ⎤ − p é igual a zero, de modo que, de uma maneira mais simplificada, teríamos
⎥⎦
a seguinte estatística do teste,

2
ˆΛ
2 p + 4m + 5 ⎧⎪ ⎛ | Λ ˆ '+ Ψ
ˆ | ⎞⎫⎪
. = (n − 1 − )⎨ln⎜⎜
χ calc ⎟⎬
6 ⎪⎩ ⎝ | S | ⎟⎠⎪⎭

A hipótese H0 será rejeitada se χ 2calc. ≥ χ 2( v) , para um determinado nível de


significância α.
Se a hipótese é rejeitada, então o modelo de fatores escolhido é inadequado. O número
de fatores m deve, então, ser aumentado de 1 e o modelo testado novamente, sendo o processo
repetido até que um valor χ 2calc. não-significativo seja obtido (SRIVASTAVA & CARTER,
1983).
JOHNSON & WICHERN (1988) comentam que se n é grande e m é pequeno
(relativamente a p), a hipótese H0 será, geralmente, rejeitada, ocasionando a retenção de mais
fatores comuns. No entanto, Σ ! ! ' +Ψ
! = ΛΛ ! pode estar suficientemente próxima de S, de modo
que mais fatores não acrescentariam muita informação, apesar deles serem "significativos".
Portanto, um julgamento pessoal por parte do analista deve ser levado em consideração na
escolha do número de fatores m.
É importante salientarmos que, se considerássemos a análise a partir dos dados
padronizados, teríamos a seguinte hipótese a ser testada:

14
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

H 0 : Γ = Λ* Λ* ' + Ψ*

contra

H1: Γ ≠ Λ* Λ* ' + Ψ*

em que a estatística do teste seria

2
ˆ *Λ
2 p + 4m + 5 ⎧⎪ ⎛ | Λ ˆ * '+ Ψ
ˆ * | ⎞⎫⎪
χ calc. = (n − 1 − )⎨ln⎜
⎜ ⎟⎬
⎟⎪
6 ⎪⎩ ⎝ |R| ⎠⎭

sendo R a matriz de correlação amostral, e Λ* e Ψ * as matrizes das cargas dos fatores e das
variâncias específicas, respectivamente, obtidas à partir dos dados padronizados. Pode-se
provar (JOHNSON & WICHERN, 1988) que os valores dos qui-quadrados calculados,
considerando a padronização das variáveis ou não , seriam exatamente os mesmos.

5. ROTAÇÃO DOS FATORES

Para procurar uma melhor interpretação dos fatores, é prática comum fazer uma
rotação ou uma transformação dos fatores.
Pode ser mostrado que o conjunto de cargas fatoriais, obtidas por qualquer método de
solução fatorial, quando o número de fatores comuns é maior do que um, não é único, pois
outros conjuntos equivalentes podem ser encontrados, por transformações ortogonais de
cargas. Em outras palavras, se nós multiplicarmos a matriz de cargas fatoriais pΛm, por uma
matriz ortogonal mMmN, a decomposição da matriz de covariância ∑ não é única, pois se M
é ortogonal, então:

(ΛM )(ΛM )'+ε = ΛMM ' Λ'+ε = ΛIΛ'+ε = ΛΛ'+ε = ∑

Assim, mesmo que os elementos de ΛM sejam diferentes das cargas originais, sua habilidade
em gerar as covariâncias observadas é inalterada.
Na expressão X = ΛF + ε , se nós trocarmos F por M ' F , além de Λ por ΛM,
observamos que a expressão não se altera, pois M é ortogonal. Na terminologia da análise
fatorial, temos o que se chama rotação dos fatores.
Apesar de estarmos livres para escolher qual rotação fazer, de modo a termos uma
melhor interpretação dos fatores, não é aconselhável fazermos isto subjetivamente, porque
poderíamos estar forçando o ajuste das cargas dos fatores com um padrão preconcebido.
Partindo, portanto, para métodos analíticos de rotação dos fatores, uma escolha conve-
niente e mais utilizada é o chamado método Varimax, que será descrito de maneira resumida.

5.1 Método Varimax

Este método de rotação ortogonal foi proposto por Kaiser (1958), citado por COOLEY
& LOHNES, 1971. A idéia do método consiste no seguinte: Para cada rotação dos fatores que

15
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

ocorre, há o aparecimento de altas cargas para poucas variáveis, enquanto que as demais
cargas ficarão próximas de zero. No início Kaiser definiu a simplicidade de um fator k como a
variância do quadrado de suas cargas, isto é:
2
1 p 2 2 1 ⎛ p 2 ⎞
2
s = ∑ a jk
k
p j =1
( ) − 2 ⎜⎜ ∑ a jk ⎟⎟
p ⎝ j =1 ⎠

onde ajk é a nova carga para a variável j no fator k, j = 1, 2, ..., p e k = 1, 2, ..., m.


Quando a variância atinge o máximo, o fator tem maior interpretabilidade ou
simplicidade, no sentido de que as cargas deste fator tendem ou à unidade, ou à zero. O
critério de máxima simplicidade de uma matriz fatorial completa é definido como a
maximização da soma destas simplicidades.
Como este critério dá igual peso às variáveis com comunalidades grandes ou
pequenas, Kaiser sugeriu que antes de iniciar o processo de maximização, as cargas fossem
divididas pela raiz quadrada da comunalidade correspondente, o que é equivalente a
normalizar os vetores aj'. Após a matriz M ter sido obtida, as cargas finais deveriam ser
multiplicadas novamente pela raiz quadrada da comunalidade. A este critério varimax
modificado, Kaiser denominou critério varimax normal, e é o mais utilizado.
Portanto, este método requer que as cargas dos fatores finais sejam tais que
maximizem a função:
2 2 2
m
1 m p ⎛ a jk ⎞ m ⎛ p a 2jk ⎞
2
V = ∑ s = ∑∑ ⎜ 2
k
⎟ − 1 ∑ ⎜ ∑ ⎟
k =1 p k =1 j =1 ⎜⎝ h j ⎟
⎠ p2 ⎜ 2
k =1 ⎝ j =1 h j
⎟
⎠
onde h j é a comunalidade da variável j.
2

Ou, de uma maneira mais simples, após a multiplicação da expressão anterior por p ,
2

já que a multiplicação por uma constante não afeta o processo de maximização:

4 2
m p m ⎛ p
⎛ a jk ⎞ ⎞
V = p∑ ∑ ⎜ ⎟ − ∑ ⎜⎜ ∑ a 2jk h 2j ⎟⎟ (eq.5.1)
k =1 j =1 ⎝
h j ⎠ k =1 j =1
⎝ ⎠

Esta expressão foi chamada por Kaiser como critério varimax normal ou simplesmente
critério varimax.
O procedimento de cálculo para a solução varimax é a que se segue. Os fatores são
rotacionados dois por vez de acordo com o esquema abaixo:

B = ΛM 12 M 13 ...M kq ...M (m−1),m`


onde k=1,2, ... , (m-1), e o correspondente q = p+1, p+2, ... , m.

Esta expressão indica que a matriz dos fatores finais, B, corresponde ao produto das
transformações de todas as combinações de pares de fatores.
O conjunto completo de m(m-1)/2 pares de p e q (o que corresponde à combinação de
m fatores 2 a 2) é chamado "ciclo". Este ciclo será repetido até que o valor de V (eq.5.1)
mantenha-se relativamente estável.
As rotações varimax de cargas fatoriais, obtidas a partir de diferentes métodos de
estimação (componentes principais, máxima verossimilhança, etc.), em geral, não são coinci-
dentes. Da mesma forma, se fatores comuns adicionais são incluídos no modelo, o padrão de

16
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

carregamento rotacionado pode mudar consideravelmente. Se existe um único (geral) fator


dominante (no qual todas as variáveis apresentam cargas altas), geralmente, ele é obscurecido
por qualquer rotação ortogonal. Entretanto, este fator pode ser mantido fixo e os demais
rotacionados (MENEZES et al., 1978).
A rotação de fatores comuns é particularmente recomendada para carregamentos
obtidos pelo método da máxima verossimilhança, porque as cargas iniciais são constrangidas
a satisfazer a condição de unicidade Λ ' Ψ −1Λ = Δ (matriz diagonal). Esta condição,
geralmente, facilita a maximização da função de verossimilhança, mas pode gerar fatores não
facilmente interpretáveis (JOHNSON & WICHERN, 1988).
Neste ponto, seria conveniente introduzirmos algumas notações adicionais, com o
objetivo de fazer as expressões seguintes mais compactas. Primeiro, as cargas dos fatores
normalizados de cada variável padronizada, para um particular par de fatores k e q, será
designado por:
a
x j = jk h
j

a jq
yj = hj
e as cargas rotadas por Xj, Yj. A transformação de x j e y j em Xj e Yj se faz da seguinte
maneira:
⎡cosθ − senθ ⎤
( X j Y j ) = ( x j y j ) ⎢ ⎥
⎣senθ cosθ ⎦

onde θ é o ângulo de rotação no plano dos fatores k e q. Desde que quadrados e produtos
cruzados das cargas normalizadas serão requeridas no cálculo, as seguintes notações serão
necessárias:
u j = x2j − y2j
v j = 2 x jy j
A = ∑ uj
B = ∑ vj
C = ∑ ( u2j − v2j )
D = 2∑ u j v j
onde todas as somas são em j de 1 a p.
Kaiser (1959), citado por HARMAN (1968), mostrou que o ângulo de rotação seria
dado por:
D − 2 AB / n
tg 4θ = (eq.5.2)
C − ( A 2 − B2 ) / n
________________________
Obs.: Para cada rotação Tkq , o ângulo θ que faz com que (eq.5.1) seja máxima pode ser
determinado do seguinte modo:
a) substituímos na expressão (eq.5.1) os valores das novas cargas normalizados, obtidos do
produto
⎡ cosθ − sen θ ⎤
( x j y j ) ⎢
⎣sen θ cos θ ⎥⎦

b) Diferenciamos a expressão obtida com relação a θ;

17
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

c) Fazemos a derivada igual a zero e


d) resolvemos a equação para θ.

Obtido o valor crítico θ, precisaríamos ainda verificar se um valor negativo da


derivada segunda da função V (eq.5.1) seria obtido, caso lhe fosse feita a substituição do valor
crítico.
Atualmente, o trabalho formal do cálculo da derivada segunda pode ser abreviado, já
que o ângulo que nos daria o máximo pode ser determinado à partir dos sinais algébricos do
numerador e denominador.
Foi mostrado (HARMAN, 1968) que a solução (eq.5.2) que faz com que (eq.5.1) seja
máxima, precisa ser considerada somente para valores de θ entre -45o e +45o e que a
condição suficiente para máximo conduz à escolha do ângulo de rotação de acordo com os
sinais algébricos do numerador e denominador da expressão (eq.5.2), podendo ser sumarizado
no Quadro 1.

Quadro 1 – Ângulo de rotação

Sinais algébricos em (eq.5.2) Quadrante Limites de θ


Numerador Denominador tg 4θ resultante de 4θ
+ + + I:0<4θ<90o 0o a 22,5o
+ - - II:90o<4θ<180o 22,5o a 45o
- - + III:-180o<4θ<-90o -45o a -22,5o
- + - IV:-90o<4θ<0o -22,5o a 0o

Para facilitar o entendimento do procedimento de rotação varimax de fatores, será


apresentado um exemplo simples, a seguir.
Consideremos o seguinte quadro auxiliar (Quadro 2) encontrado no HARMAN
(1968), pág. 308, e que vem reproduzido abaixo1.

Quadro 2 – Quadro auxiliar

variável solução inicial cargas normalizadas variáveis auxiliares


a j1 a j2 h 1/j xj yj uj vj
j u2j − v2j
1 0,830 -0,396 0,9196 0,9026 -0,4306 0,6293 -0,7773 -0,2082
2 0,818 -0,469 0,9429 0,8675 -0,4974 0,5051 -0,8630 -0,4896

1A solução inicial apresentada no Quadro 2, segundo HARMAN (1968), foi obtida pelo Método Centróide, a
partir de um conjunto de 8 variáveis físicas de 305 garotas (ver HARMAN, 1968, página 80. O mesmo autor
comenta ainda (pág. 171) que tal método tem apenas interesse histórico, por ter sido de grande importância antes
da farta disponibilidade de computadores.

18
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

3 0,777 -0,470 0,9081 0,8556 -0,5176 0,4641 -0,8857 -0,5691


4 0,798 -0,401 0,8931 0,8935 -0,4490 0,5967 -0,8024 -0,2878
5 0,786 0,500 0,9316 0,8437 0,5367 0,4238 0,9056 -0,6405
6 0,672 0,458 0,8132 0,8264 0,5632 0,3657 0,9309 -0,7328
7 0,594 0,444 0,7416 0,8010 0,5987 0,2832 0,9591 -0,8397
8 0,647 0,333 0,7277 0,8891 0,4576 0,5811 0,8137 -0,3244
soma 3,8490 0,2809 -4,0921
1/ Raiz quadrada da comunalidade.

Este modelo de tabela é indicada como apropriada para todos os dados que porventura
possam ser utilizados no processo de rotação de um par de fatores. Logicamente, para a
rotação de 3 ou mais fatores, tal processo manual seria deveras trabalhoso e, portanto, não se
justificaria. A idéia principal deste exemplo é apenas compreender melhor como seria
realizada a rotação de fatores pelo método varimax.
Os valores de 2ujvj para cada variável não foram apresentados no Quadro 2, já que
apenas seu somatório D é requerido, sendo, portanto, facilmente obtido e igual ao valor -
0,6930. Por outro lado, desde que as diferenças u2j − v2j não são facilmente acumuladas numa
calculadora simples, elas são apresentadas para cada variável. Somente os somatórios (A, B e
C), requeridos no cálculo do ângulo de rotação, são apresentados na última linha do quadro.
Substituindo-se os valores na fórmula (eq.5.2) teremos:

−0 , 6930 − 2( 3 , 8490)( 0 , 2809) / 8 −0 , 9633


tg 4 θ = = = 0 ,1623
−4 , 0921− ( 3 , 8490 2 − 0 , 2809 2 ) / 8 −5 , 9341

Para o cálculo da tangente, o numerador e o denominador devem ser determinados,


separadamente, de modo que os sinais algébricos possam ser observados. Então, baseado no
Quadro 1, para o caso de ambos serem negativos, o ângulo 4θ deve estar no terceiro
quadrante. De uma tabela de funções trigonométricas, 4θ = -170o47', de modo que θ = -
42o42'. Para este ângulo de rotação, sen θ = -0,6782 e cos θ = 0,7349, e a matriz de
transformação será
⎡ 0,7349 0,6782⎤
T = ⎢ ⎥
⎣− 0,6782 0,7349⎦
Então, as novas cargas seriam obtidas, pós-multiplicando-se as cargas normalizadas
originais por essa matriz. Os resultados (Xj, Yj) aparecem nas duas primeiras colunas do
Quadro 3. Finalmente, a normalização é removida, multiplicando-se cada valor pelo hj
apropriado na linha. As novas cargas, após a rotação varimax, aparecem nas duas últimas
colunas. O critério varimax (eq.5.1) para esta solução é

V = 8 [ 3, 5331 + 3, 5049 ] − [ 4 , 0142 2 + 3, 98602 ] = 24 , 3012


que é bem melhor que o critério varimax (0,4078), obtido com a cargas iniciais.
Quadro 3 – Rotação varimax para as oito variáveis físicas

Cargas Normalizadas
Variável Quadrados Solução Final
Rotacionadas
j
Xj Yj X2j Yj2 b j1 b j2
1 0,9554 0,2957 0,9128 0,0874 0,879 0,272

19
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

2 0,9749 0,2228 0,9504 0,0496 0,919 0,210


3 0,9798 0,1999 0,9600 0,0400 0,890 0,182
4 0,9611 0,2760 0,9237 0,0762 0,858 0,246
5 0,2560 0,9666 0,0655 0,9343 0,238 0,900
6 0,2254 0,9744 0,0508 0,9495 0,183 0,792
7 0,1826 0,9832 0,0333 0,9667 0,135 0,729
8 0,3431 0,9393 0,1177 0,8823 0,250 0,684
soma 4.0142 3,9860
soma dos
3,5331 3,5049 3,316 2,648
quadrados

6. ESTIMAÇÃO DOS VALORES DOS FATORES

Em muitas aplicações, principalmente quando a Análise Fatorial é preliminar a algum


outro tipo de análise multivariada, ou quando o seu uso principal é para construção de índices,
é conveniente, além de estimar os parâmetros do modelo fatorial, procurar descrever os
fatores em termos das variáveis observadas. Para isto, estimam-se os valores de cada fator
para cada indivíduo. Estes valores são denominados escores fatoriais.
Serão considerados dois métodos de estimação dos escores dos fatores, o método dos
mínimos quadrados ponderados e o método da regressão. Estes métodos serão descritos
conforme apresentado por FACHEL (1976), ou seja, supondo-se que os fatores sejam
correlacionados, por ser mais geral. No caso de fatores não correlacionados e padronizados,
os resultados são obtidos do mesmo modo, considerando-se Cov(F) = Φ = I.
Ambos os métodos apresentam os seguintes pressupostos (JOHNSON & WICHERN,
1988):
a) As estimativas das cargas fatoriais (ajk) e das variâncias específicas (εj) são
tomadas como valores paramétricos;
b) Os métodos envolvem transformações lineares dos dados originais padronizados, e
geralmente, utilizam as cargas estimadas nos cálculos dos escores.
Em análise de Componentes Principais, as componentes são definidas como funções
lineares das variáveis observadas e então, os valores de cada componente, para cada
indivíduo, podem ser facilmente encontrados. Em Análise Fatorial, os fatores não são funções
lineares das variáveis observadas apenas e os escores de um indivíduo sobre eles não podem
ser encontrados da mesma maneira. É necessário, então, introduzir um princípio de mínimos
quadrados, para se obter razoáveis estimadores dos escores fatoriais (FACHEL, 1976).

6.1. Método da Regressão (Método de Thomson)

Seja X = (X1, X2, ...,Xp)' o vetor das observações. Seja F = (F1, F2, ...,Fm)' o vetor
dos escores fatoriais e seja ε = (e1, e2, ..., ep)' o vetor dos resíduos. As pressuposições do
modelo fatorial, discutidas anteriormente, porém com uma modificação, seriam:
E(FF') = Φ
E(XF') = E[(ΛF+e)F'] = ΛE(FF') = ΛΦ
E(XX') = Σ = ΛΦΛ'+Ψ
onde Λ, Ψ, Φ são constantes, por terem sido estimados para um conjunto particular de dados.

20
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

O método de Thomson, baseado na regressão de F sobre X é equivalente, segundo


Lawley e Maxwell (1971), citado por Fachel (1976), a encontrar para cada k, k = 1, 2, ..., m,
uma função linear das observações, que dará um bom preditor de Fk, dado por

F! k = aj'X = X'aj
! k - Fk) é
onde aj é um vetor de ordem p, escolhido de tal maneira que a variância de ( F
mínima. Temos

! k - Fk) = E(X'aj - Fk)2


Var ( F

Derivando esta expressão em relação a aj e igualando a zero, obteremos a seguinte


!:
expressão para F

F! = Λ'Σ-1X (eq.6.1)

Para evitar a inversão de uma matriz pxp, podemos escrever esta expressão de forma
alternativa. Para isto fazemos uso da seguinte identidade:

Λ'Σ-1 = (Λ'Ψ-1ΛΦ+I)-1Λ'Ψ-1 (eq.6.2)

Substituindo-se (eq.6.2) na (eq.6.1), teremos

F! = Φ(I+Λ'Ψ-1ΛΦ)-1Λ'Ψ-1X
que é a expressão para se obter os estimadores dos escores fatoriais, para o caso de fatores
correlacionados (oblíquos). Para Φ = I, isto é, quando os fatores são não correlacionados
(ortogonais), temos

F! = (I+Λ'Ψ-1Λ)-1Λ'Ψ-1X

6.2. Método dos Mínimos Quadrados Ponderados (Método de Bartlett)

Este método, desenvolvido por Bartlett (1938), citado por FACHEL (1976) adota o
princípio de mínimos quadrados. Os escores são obtidos de tal forma que a soma de
quadrados dos resíduos padronizados seja mínima, em relação aos elementos de F. Assim

p e 2j
∑ψ = e' ψ −1e = ( X − ΛF)' ψ −1 ( X − ΛF)
j=1 j

é derivado em relação ao vetor F e obtém-se:

F! * = (Λ'Ψ-1Λ)-1Λ'Ψ-1X
que é a expressão para se obter os estimadores dos escores fatoriais, tanto no caso de fatores
correlacionados, como no caso de fatores não correlacionados.

21
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Para o caso de fatores não correlacionados e quando a matriz Λ'Ψ-1Λ é diagonal,


observa-se que os estimadores de Fk , pelos dois métodos descritos, diferem apenas por um
fator escala.
Lawley & Maxwell (1971), citado por FACHEL (1976), mostram que os estimadores
obtidos pelo método de regressão são viesados, enquanto que os obtidos pelo método de
Bartlett são não viesados. No entanto, os estimadores do método de regressão têm menor
variância do que os de Bartlett.

__________________________
Obs.: De uma maneira mais simples, conforme apresentado por MANLY (1986), os novos
fatores poderiam ser estimados pela seguinte expressão:

F* = (G!G) −1 G!X (eq.6.3)

`
( ) ( ) ( )
onde F * = F1* , F2* ,..., Fm* , X ` = X 1 , X 2 ,..., X p , e G é a matriz ( pxm) das novas cargas
dos fatores.

7. EXEMPLOS DE APLICAÇÃO

Nesse capítulo serão dados dois exemplos. O primeiro, mais simples, não ligado à área
florestal, apenas para o leitor ter uma noção inicial de como proceder aos cálculos. O
segundo, mais complexo, ligado à área florestal, será dado logo a seguir, e conterá as
principais saídas do programa computacional utilizado, acrescido de alguns comentários.

22
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

7.1. Exemplo 11/

Quadro 4 – Porcentagem de pessoas empregadas em nove diferentes setores industriais na


Europa (AGR = agricultura, MIN = mineração, MAN = manufatura, PS =
suprimento de energia, CON = construção, SER = indústrias de serviços, FIN =
finanças, SPS = serviço pessoal e social, TC = transporte e comunicação)

PAÍSES AGR MIN MAN PS CON SER FIN SPS TC


Bélgica 3,3 0,9 27,6 0,9 8,2 19,1 6,2 26,6 7,2
Dinamarca 9,2 0,1 21,8 0,6 8,3 14,6 6,5 32,2 7,1
França 10,8 0,8 27,5 0,9 8,9 16,8 6,0 22,6 5,7
Alemanha Oc. 6,7 1,3 35,8 0,9 7,3 14,4 5,0 22,3 6,1
Irlanda 23,2 1,0 20,7 1,3 7,5 16,8 2,8 20,8 6,1
Itália 15,9 0,6 27,6 0,5 10,0 18,1 1,6 20,1 5,7
Luxemburgo 7,7 3,1 30,8 0,8 9,2 18,5 4,6 19,2 6,2
Países Baixos 6,3 0,1 22,5 1,0 9,9 18,0 6,8 28,5 6,8
UK 2,7 1,4 30,2 1,4 6,9 16,9 5,7 28,3 6,4
Austria 12,7 1,1 30,2 1,4 9,0 16,8 4,9 16,8 7,0
Finlândia 13,0 0,4 25,9 1,3 7,4 14,7 5,5 24,3 7,6
Grécia 41,4 0,6 17,6 0,6 8,1 11,5 2,4 11,0 6,7
Noruega 9,0 0,5 22,4 0,8 8,6 16,9 4,7 27,6 9,4
Portugal 27,8 0,3 24,5 0,6 8,4 13,3 2,7 16,7 5,7
Espanha 22,9 0,8 28,5 0,7 11,5 9,7 8,5 11,8 5,5
Suécia 6,1 0,4 25,9 0,8 7,2 14,4 6,0 32,4 6,8
Suiça 7,7 0,2 37,8 0,8 9,5 17,5 5,3 15,4 5,7
Turquia 66,8 0,7 7,9 0,1 2,8 5,2 1,1 11,9 3,2
Bulgária 23,6 1,9 32,3 0,6 7,9 8,0 0,7 18,2 6,7
Checoslováquia 16,5 2,9 35,5 1,2 8,7 9,2 0,9 17,9 7,0
Alemanha Or. 4,2 2,9 41,2 1,3 7,6 11,2 1,2 22,1 8,4
Hungria 21,7 3,1 29,6 1,9 8,2 9,4 0,9 17,2 8,0
Polônia 31,1 2,5 25,7 0,9 8,4 7,5 0,9 16,1 6,9
Romênia 34,7 2,1 30,1 0,6 8,7 5,9 1,3 11,7 5,0
URSS 23,7 1,4 25,8 0,6 9,2 6,1 0,5 23,6 9,3
Iugoslávia 48,7 1,5 16,8 1,1 4,9 6,4 11,3 5,3 4,0
A matriz de correlação das 9 variáveis é dada no Quadro 5.

1/ Extraído do livro do MANLY (1986), página 78.

23
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 5 - Matriz de correlação para as percentagens de empregados em nove grupos


industriais em 26 países da Europa, na forma diagonal inferior, calculadas à
partir dos dados do Quadro 4

AGR MIN MAN PS CON SER FIN SPS TC


Agricultura 1,000
Mineração 0,036 1,000
Manufatura -0,671 0,445 1,000
Suprimento de energia -0,400 0,406 0,385 1,000
Construção -0,538 -0,026 0,495 0,060 1,000
Indústrias de serviços -0,737 -0,397 0,204 0,202 0,356 1,000
Finanças -0,220 -0,443 -0,156 0,110 0,016 0,366 1,000
Serv. Pessoal e Social -0,747 -0,281 0,154 0,132 0,158 0,572 0,108 1,000
Transp. e Comunic. -0,565 0,157 0,351 0,375 0,388 0,188 -0,246 0,568 1,000

Os autovalores e os autovetores normalizados são mostrados no Quadro 6.

Quadro 6 – Autovalores e autovetores normalizados para os dados relativos ao emprego na


Europa

autovetores normalizados
autovalores X1 X2 X3 X4 X5 X6 X7 X8 X9
1 3,487 0,524 0,001 -0,348 -0,256 -0,325 -0,379 -0,074 -0,387 -0,367
2 2,130 0,054 0,618 0,355 0,261 0,051 -0,350 -0,454 -0,222 0,203
3 1,099 -0,049 0,201 0,151 0,561 -0,153 0,115 0,587 -0,312 -0,378
4 0,995 0,029 0,064 -0,346 0,393 -0,668 -0,050 -0,052 0,412 0,314
5 0,543 0,213 -0,164 -0,385 0,295 0,472 -0,283 0,280 -0,220 0,513
6 0,383 -0,153 0,101 0,289 -0,357 -0,130 -0,615 0,526 0,263 0,124
7 0,226 0,021 -0,726 0,479 0,256 -0,211 0,229 -0,188 -0,191 0,068
8 0,137 0,008 0,088 0,126 -0,341 0,356 0,388 0,174 -0,506 0,545
9 0,000 -0,806 -0,049 -0,366 -0,019 -0,083 -0,238 -0,145 -0,351 -0,072

Existem 3 autovalores maiores que 1. Seguindo o método prático, conforme apresen-


tado na seção 9, consideraríamos, portanto, apenas 3 fatores. No entanto, o quarto autovalor é
quase igual ao terceiro, de modo que poderíamos, então, optar por escolher 2 ou 4 fatores.
Consideremos, a princípio, 4 fatores.
Os autovetores normalizados juntamente com os autovalores do Quadro 6 nos dão as ij
cargas associadas aos 4 fatores, segundo o modelo X = Λ F + ε com i = 1 a 9 e j = 1 a
( px1) ( pxm) ( mx1) ( px1)

4. Lembremos que as cargas dos fatores são dadas por a ij = λ j v ji , sendo λj o autovalor j
considerado e vji o autovetor normalizado correspondente ao autovalor j e à variável i.

24
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

O modelo da análise de fatores portanto seria:

X1 = 0,98 F1 + 0,08 F2 - 0,05 F3 + 0,03 F4 (0,97)


X2 = 0,00 F1 + 0,90 F2 + 0,21 F3 + 0,06 F4 (0,86)
X3 = - 0,65 F1 + 0,52 F2 + 0,16 F3 - 0,35 F4 (0,83)
X4 = - 0,48 F1 + 0,38 F2 + 0,59 F3 + 0,39 F4 (0,87)
X5 = - 0,61 F1 + 0,08 F2 - 0,16 F3 - 0,67 F4 (0,84)
X6 = - 0,71 F1 - 0,51 F2 + 0,12 F3 - 0,05 F4 (0,78)
X7 = - 0,14 F1 - 0,66 F2 + 0,62 F3 - 0,05 F4 (0,84)
X8 = - 0,72 F1 - 0,32 F2 - 0,33 F3 + 0,41 F4 (0,90)
X9 = - 0,69 F1 + 0,30 F2 - 0,39 F3 + 0,31 F4 (0,81)

Por exemplo: a12 = 0.08 = λ 2 v21 = 2,130.0, 054

Os valores entre parênteses são as comunalidades. Por exemplo, a comunalidade para


a variável X1 é ( 0. 98) 2 + ( 0. 08) 2 + ( −0. 05) 2 + ( 0. 03) 2 = 0. 97, desconsiderando-se erros de
aproximação. Pode ser observado que as comunalidades são razoavelmente altas. Isto quer
dizer que a maior parte da variância para as variáveis X1 a X9 é devido aos 4 fatores comuns.
As cargas dos fatores que são maiores do que 0.50 (desconsiderando o sinal) estão
sublinhadas nas equações acima. Estas cargas grandes e moderadas indicam como as variáveis
estão relacionadas com os fatores. Pode ser observado que X1 é quase completamente
responsabilizada pelo fator 1 sozinho, X2 é responsabilizada principalmente pelo fator 2, X3 é
responsabilizada pelos fatores 1 e 2, etc. Uma propriedade indesejável da escolha dos fatores
é que 4 das 9 variáveis X (X3, X5, X6 e X7) estão fortemente relacionadas com 2 dos fatores.
Isto sugere que a rotação dos fatores pode trazer simplificações.
Após a rotação, usando-se o critério varimax normal, obtemos o seguinte conjunto de
equações:

X1 = 0,68 F1 - 0,27 F2 - 0,31 F3 + 0,57 F4


X2 = 0,22 F1 + 0,70 F2 - 0,55 F3 - 0,13 F4
X3 = 0,13 F1 + 0,49 F2 - 0,12 F3 - 0,75 F4
X4 = -0,23 F1 + 0,89 F2 - 0,16 F3 - 0,02 F4
X5 = -0,16 F1 - 0,11 F2 + 0,03 F3 - 0,90 F4
X6 = -0,53 F1 - 0,03 F2 + 0,62 F3 - 0,33 F4
X7 = 0,07 F1 + 0,03 F2 + 0,91 F3 + 0,05 F4
X8 = -0,93 F1 - 0,05 F2 + 0,17 F3 - 0,04 F4
X9 = -0,77 F1 + 0,23 F2 - 0,33 F3 - 0,23 F4

Pode-se verificar que as comunalidades não foram alteradas (desconsiderando-se


possíveis erros de aproximação), e que os fatores ainda estão não correlacionados. No entanto,
esta solução é melhor que a primeira já que somente X1, X2 e X6 são ainda dependentes de
mais do que um fator.
Nesta fase seguinte é usual tentar dar nomes aos fatores. Em muitos casos isto requer
um certo grau de imaginação. Porém, no presente exercício, não será tão difícil1/

1/ Muitas vezes esta técnica de análise multivariada é desprezada pela dificuldade em se nomear cada um dos
fatores obtidos e de se fazer as interpretações e discussões corretas.

25
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

O fator 1 tem uma alta carga positiva para X1 (agricultura) e altas cargas negativas
para X6 (indústrias de serviços), X8 (serviços pessoais e sociais) e X9 (transporte e
comunicação). Portanto, o fator 1 mostra o grau com o qual as pessoas estão empregadas na
agricultura ao invés de serviços e comunicação. Este primeiro fator poderia então ser
chamado "ênfase na agricultura e carência de indústrias de serviços".
O fator 2 tem altas cargas positivas para X2 (mineração) e X4 ((suprimento de
energia). Ele pode então ser chamado "ênfase em mineração e suprimento de energia.
O fator 3 tem altas cargas positivas em X6 (serviços industriais) e X7 (finanças) e altas
cargas negativas em X2 (mineração). Ele pode, então, ser chamado "ênfase em finanças e
indústrias de serviços e carência de mineração.
Finalmente, o fator 4 tem altas cargas negativas em X3 (manufatura) e X5
(construção) e altas cargas positivas em X1 (agricultura). "Carência de industrialização"
parece ser uma boa denominação neste caso.
O passo seguinte seria a obtenção dos valores dos fatores à partir da expressão (eq.6.3)
em que a matriz G seria dada pelas novas cargas dos fatores acima. Por exemplo, g11 = 0.68 e
g12 = -0.27 , para duas casas decimais, etc.
Efetuando-se a multiplicação e inversão constantes na equação, obteríamos as
equações:
F1* = 0 , 176 X 1 + 0 , 127 X 2 + 0 , 147 X 3 +! − 0 , 430 X 9
F2* = − 0 , 082 X 1 + 0 , 402 X 2 + 0 , 176 X 3 +! + 0 , 014 X 9
F3* = − 0 , 122 X 1 − 0 , 203 X 2 − 0 , 025 X 3 + … − 0 , 304 X 9
F4* = 0 , 175 X 1 − 0 , 031X 2 − 0 , 426 X 3 +! + 0 , 088 X 9

Os valores dos fatores obtidos para os 26 países europeus estão apresentados no


Quadro 7.
Interpretando os valores dos fatores apresentados no Quadro 6, pode ser notado que o
FATOR 1 enfatiza a importância da agricultura ao invés de serviços e comunicações na
Iugoslávia, Espanha e Romênia. Os valores do FATOR 2 indicam que países como Hungria e
Alemanha Oriental têm grande número de pessoas empregadas em mineração e suprimento de
energia, com a situação sendo revertida em países como Turquia e Itália. O FATOR 3, por
outro lado, está indicando, principalmente, a diferença entre o bloco comunista e os outros
países em termos do número de pessoas empregadas em finanças e indústrias de serviço.
Finalmente os valores para o FATOR 4 indicam, principalmente, o quão diferente é a Turquia
dos outros países por causa da sua carência de trabalhadores em manufatura e construção e
relativamente grande número de trabalhadores na agricultura.
A maioria dos analistas de fatores provavelmente continuaria suas análises desse
conjunto de dados, tentando modelos com menos fatores e diferentes métodos de extração dos
fatores. No entanto, para o objetivo ao qual foi proposto, que era o de dar uma noção dos
procedimentos e interpretações da Análise Fatorial, o exemplo até este ponto pode ser
considerado suficiente.

26
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 7 – Valores dos fatores para os 26 países europeus

FATORES
1 2 3 4
Finanças e
Agricultura e
Mineração e indústrias de
carência de Carência de
suprimento de serviços e
indústrias de industrialização
energia carência de
serviços
mineração
Bélgica -0,93 -0,04 0,86 -0,08
Dinamarca -1,30 -1,09 0,59 0,44
Franca 0,02 -0,20 0,98 -0,43
Alemanha Oc. -0,04 0,45 0,45 -0,32
Irlanda -0,32 0,37 0,35 0,82
Itália 0,08 -1,40 -0,07 -1,19
Luxemburgo 0,37 0,59 0,18 -1,05
Países Baixos -0,90 -0,59 1,17 -0,24
UK -0,85 1,23 0,95 0,59
Austria 0,06 0,83 0,68 -0,45
Finlândia -0,92 0,47 0,62 0,73
Grécia 0,56 -1,12 -0,56 0,42
Noruega -1,77 -0,67 -0,09 0,31
Portugal 0,40 -1,11 -0,07 -0,17
Espanha 1,67 -0,64 0,93 -1,67
Suécia -1,29 -0,38 0,61 0,67
Suiça 0,68 -0,39 0,98 -1,62
Turquia 1,29 -1,57 -0,85 3,00
Bulgária 0,26 -0,25 -1,39 -0,34
Checoslováquia 0,30 1,18 -1,19 -0,63
Alemanha Or. -0,61 1,70 -1,19 -0,44
Hungria -0,12 2,37 -1,07 0,42
Polônia 0,42 0,26 -1,41 0,06
Romênia 1,55 -0,30 -1,11 -0,67
URSS -0,99 -0,87 -2,06 -0,06
Iugoslávia 2,35 1,17 1,70 1,91

7.2. Exemplo 2

A título de ilustração do uso da análise fatorial no campo florestal, selecionou-se parte


dos dados publicados no trabalho de HOOGH & DIETRICH (1979). O trabalho envolve a
avaliação de sítios para Araucaria angustifolia em povoamentos artificiais, localizados em
diversos municípios dos Estados do Rio Grande do Sul, Santa Catarina, Paraná, São Paulo e
Minas Gerais.
Tomaremos como objetivo verificar a relação entre a produtividade dos sítios,
expressa pelo Índice de Sítio, e as características do solo. Para tanto, foram selecionados 21
sítios (Quadro 8) e 10 variáveis (Quadro 9), dentre as apresentadas por HOOGH &
DIETRICH (1979), cujas correlações lineares com o índice de Sítio foram maiores do que 0,3.

27
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 8 – Relação dos 21 pontos de amostragem estudados (extraído de HOOGH &


DIETRICH, 1979)

Parc. Perfil solo Localidade IS*


1 SC-28 Três Barras - SC 15,7
2 SC-30 Três Barras - SC 10,2
3 PR-32 Teixeira Soares - PR 13,6
4 PR-37 Teixeira Soares - PR 19,5
5 PR-44 Ponta Grossa - PR 8,8
6 PR-68 Telêmaco Borba - PR 16,6
7 PR-73 Telêmaco Borba - PR 18,9
8 PR-83 Jussara - PR 19,8
9 RS-85 São Francisco de Paula - RS 16,3
10 RS-87 São Francisco de Paula - RS 17,9
11 RS-107 Passo Fundo - RS 16,6
12 RS-113 Passo Fundo - RS 14,5
13 PR-123 Cascavel - PR 18,7
14 SC-142 Caçador - SC 15,8
15 SC-146 Chapecó - SC 19,1
16 SP-152 Capão Bonito - SP 10,7
17 SP-153 Capão Bonito - SP 9,3
18 MG-187 Passa Quatro - MG 13,5
19 SP-216 Caieiras - SP 21,9
20 PR-240 Renascença - PR 20,8
21 SC-246 Rio Negrinho - SC 11,2
* Índice de Sítio = altura dominante aos 25 anos.

Quadro 9 – Relação das 10 variáveis utilizados no estudo (extraído de HOOGH &


DIETRICH, 1979)

Variáveis*
Parc.
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1 4,3 4,1 20,1 9,80 11,60 2,00 6 6 5,5 5,5
2 3,9 4,0 17,5 11,20 19,40 1,33 9 9 4,3 3,2
3 3,8 3,9 19,8 6,80 6,80 10,00 7 13 2,7 3,3
4 4,0 5,2 21,6 9,00 9,80 25,00 9 12 6,2 6,2
5 3,8 4,0 10,7 3,80 5,40 4,44 5 15 1,4 1,4
6 3,8 4,2 6,6 2,80 4,80 10,00 16 12 1,0 1,5
7 4,0 4,2 18,6 9,40 10,40 15,00 7 9 3,8 5,2
8 3,8 4,0 6,1 3,80 4,40 15,00 9 18 2,8 25,0
9 4,0 4,0 11,4 9,80 9,80 6,67 27 8 2,3 2,2
10 4,5 4,0 16,3 18,00 18,00 2,00 77 20 2,6 2,6
11 3,7 3,9 17,0 10,40 11,40 0,01 6 8 4,1 10,2
12 4,0 3,9 16,3 13,00 13,00 17,50 30 18 3,8 7,8

Continua...

28
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 9, Cont.

Variáveis*
Parc.
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
13 4,2 4,0 24,2 28,20 27,80 6,67 9 5 7,4 5,2
14 3,8 3,9 19,8 21,00 20,20 2,50 21 9 4,9 4,7
15 4,0 4,2 18,6 17,50 10,10 3,33 6 9 5,4 5,7
16 4,0 4,2 6,6 2,60 3,30 5,00 10 12 2,7 1,8
17 3,8 4,0 12,0 6,40 7,90 5,00 16 5 3,2 4,8
18 4,0 4,3 13,7 4,00 5,20 10,00 8 8 11,0 7,0
19 6,7 6,0 14,7 6,60 9,80 60,00 88 67 4,2 9,3
20 3,7 3,9 19,1 21,60 22,70 3,33 4 18 19,0 8,2
21 3,7 3,8 11,8 4,90 4,10 2,50 7 9 2,4 1,6
* V1 = pH KCl horiz.A; V2 = pH KCl horiz.B; V3 = Al2O3 total horiz.A; V4 = Fe2O3 total horiz.A; V5 =
Fe2O3 total horiz.B; V6 = Mg/K trocáveis horiz.B; V7 = saturação de bases horiz. A; V8 = saturação de bases
horiz.B; V9 = argila/silte horiz.A; V10 = argila/silte horiz.B.

O Quadro 10 apresenta a matriz de correlações (R) entre as 10 variáveis estudadas. Os


fatores foram extraídos utilizando-se os três métodos expostos anteriormente, ou seja,
Componente Principal, Máxima Verossimilhança e Fator Principal, tendo em vista verificar
qual deles apresenta o melhor ajuste do modelo fatorial. Os cálculos foram desenvolvidos
utilizando-se o software estatístico SPSS/PC + Statistics 4.0 (1990).

Quadro 10 – Matriz de correlações entre as 10 variáveis estudadas

V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
V1 1,00000
V2 0,82020 1,00000
V3 0,06980 0,06033 1,00000
V4 -0,01637 -0,20272 0,72569 1,00000
V5 0,05063 -0,14588 0,70816 0,92705 1,00000
V6 0,83291 0,89914 -0,01912 -0,22396 -0,16482 1,00000
V7 0,80509 0,53532 -0,04946 0,08025 0,12672 0,59442 1,00000
V8 0,89243 0,76280 -0,10896 -0,12760 -0,05588 0,86571 0,77032 1,00000
V9 -0,05391 0,01495 0,42672 0,47071 0,48363 -0,05085 -0,19875 -0,00891 1,00000
V10 0,09076 0,12015 -0,13210 -0,04682 -0,05767 0,28618 -0,00715 0,24326 0,17153 1,00000

Os resultados iniciais de comunalidades, autovalores e percentuais de variância expli-


cada por cada fator são mostrados no Quadro 11. Nesse caso, o Método do Componente
Principal foi usado, devido a maior facilidade de obtenção dos resultados.

29
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 11 – Comunalidades e fatores iniciais, extraídos pelo Método do Componente


Principal, com os seus respectivos autovalores e percentuais de variância
explicada

Variáveis Comunal.* Fator Autovalor Var. Expl. (%) Var. Acum. (%)
V1 0,90357 1 4,21030 42,1 42,1
V2 0,87504 2 2,89058 28,9 71,0
V3 0,70916 3 1,19116 11,9 82,9
V4 0,88693 4 0,74910 7,5 90,4
V5 0,87344 5 0,49495 4,9 95,4
V6 0,91351 6 0,14695 1,5 96,8
V7 0,79563 7 0,11797 1,2 98,0
V8 0,90775 8 0,08866 0,9 98,9
V9 0,50310 9 0,06701 0,7 99,6
V10 0,32338 10 0,04333 0,4 100,0
* Comunalidades iniciais estimadas por R2 e usadas nos Métodos da Máxima Verossimilhança e do Fator
Principal.

No modelo inicial completo com 10 fatores (Quadro 11), somente os três primeiros
fatores apresentaram autovalores maiores do que um. Esses três fatores explicaram,
individualmente, 42,1; 28,9 e 11,9% da variância, acumulando 82,9% da variação total.
Diante disso, optou-se por prosseguir a análise considerando apenas os três primeiros fatores
comuns. As estruturas fatoriais iniciais ficaram compostas pelas matrizes apresentadas no
Quadro 12, considerando os três métodos de estimação.
As comunalidades iniciais foram consideradas iguais a um, quando do uso do Método
do Componente Principal, ou foram estimadas pelos quadrados dos coeficientes de correlação
múltipla (R2) de equações de regressão entre a variável considerada e todas as demais
variáveis (Quadro 11).
Com apenas três fatores, o Método do Componente Principal mostrou o melhor ajuste,
explicando 82,9% da variância e apresentando comunalidades finais que oscilaram entre 0,68
e 0,94 (Quadro 13).
Os Métodos da Máxima Verossimilhança e do Fator Principal explicaram 75% da
variância total. As comunalidades foram baixas para algumas variáveis, ou seja, pelo Método
da Máxima Verossimilhança elas variaram entre 0,08 e 0,95 e pelo Método do Fator Principal,
entre 0,11 e 0,96. Nesse caso, para ambos os métodos, as variáveis V9 e V10 (argila/silte
horiz. A e B, respectivamente) apresentaram pouca contribuição no modelo fatorial ajustado,
principalmente V10 (Quadro 13).7-10 (13)
A estatística Qui-Quadrado ( χ 2 ), calculada para o modelo com três fatores ajustado
pelo Método da Máxima Verossimilhança, com 18 graus de liberdade, atingiu o valor de
12,85 (P=0,8006), indicando uma boa estimativa da matriz R.
As matrizes de correlação estimadas por cada um dos três métodos, com os respectivos
resíduos em relação à matriz de correlações original R (Quadro 10), são apresentadas no
Quadro 14. Nesse caso, as melhores estimativas de R foram obtidas pelos Métodos da
Máxima Verossimilhança e do Fator Principal. Para o Método da Máxima Verossimilhança,
obteve-se 1,16732 de soma de resíduos absolutos (média = 0,02594), sendo que 20% deles
foram maiores do que 0,05. Pelo Método do Fator Principal, obteve-se 1,3764 de soma de
resíduos absolutos (média = 0,03058), sendo 17% deles maiores do que 0,05.

30
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 12 – Cargas iniciais dos três primeiros fatores extraídos pelos três métodos de
estimação

Variáveis Fator 1 Fator 2 Fator 3


Método do Componente Principal
V1 0,92992 0,23728 -0,13261
V2 0,88350 0,09561 0,06094
V3 -0,14197 0,83565 -0,07549
V4 -0,25661 0,91073 -0,08451
V5 -0,19138 0,92349 -0,09395
V6 0,93733 0,05297 0,15171
V7 0,77744 0,20603 -0,35831
V8 0,94301 0,11726 0,05190
V9 -0,15080 0,62078 0,52063
V10 0,21760 -0,01300 0,85031
Método da Máxima Verossimilhança
V1 0,93223 0,18797 0,02913
V2 0,85514 -0,04189 0,36392
V3 -0,10684 0,71718 0,37997
V4 -0,20624 0,94985 0,04710
V5 -0,13962 0,94355 0,05464
V6 0,91043 -0,05701 0,31597
V7 0,82132 0,28273 -0,43674
V8 0,93133 0,06768 0,02461
V9 -0,14827 0,44386 0,42670
V10 0,15831 -0,05260 0,24914
Método do Fator Principal
V1 0,92710 0,22627 -0,08641
V2 0,85219 0,06824 0,24398
V3 -0,12136 0,74242 0,13428
V4 -0,24697 0,93703 -0,10111
V5 -0,18049 0,94226 -0,09822
V6 0,94104 0,03191 0,28123
V7 0,78498 0,21523 -0,54895
V8 0,92666 0,10161 0,01653
V9 -0,12961 0,51149 0,39712
V10 0,17314 -0,01838 0,27849

31
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 13 – Comunalidades finais, autovalores e percentuais de variância explicada pelos


três primeiros fatores, extraídos pelos três métodos

Variáveis Comunalid. Fator Autovalor % da Var. % Acum.


Método do Componente Principal
V1 0,93864 1 4,21030 42,1 42,1
V2 0,79342 2 2,89058 28,9 71,0
V3 0,72417 3 1,19116 11,9 82,9
V4 0,90243
V5 0,89829
V6 0,90440
V7 0,77525
V8 0,90571
V9 0,67917
V10 0,77055
Método da Máxima Verossimilhança
V1 0,90524 1 4,09163 40,9 40,9
V2 0,86546 2 2,63149 26,3 67,2
V3 0,67014 3 0,81820 8,2 75,4
V4 0,94697
V5 0,91277
V6 0,93197
V7 0,94525
V8 0,87257
V9 0,40107
V10 0,08990
Método do Fator Principal
V1 0,91818 1 4,10126 41,0 41,0
V2 0,79041 2 2,69256 26,9 67,9
V3 0,58395 3 0,72087 7,2 75,1
V4 0,94925
V5 0,93008
V6 0,96566
V7 0,96387
V8 0,86929
V9 0,43613
V10 0,10787

32
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Já o Método do Componente Principal apresentou 2,54337 de soma de resíduos abso-


lutos (média = 0,05652), com 51% deles acima de 0,05 (Quadro 14). Em termos percentuais,
considerando o valor de soma dos resíduos pelo Componente Principal como 100%, o Método
da Máxima Verossimilhança atingiu 46% e o Método do Fator Principal alcançou 54%.
Esse resultado já era esperado, pois os Métodos da Máxima Verossimilhança e do
Fator Principal envolvem iterações e cálculos mais elaborados do que o Componente
Principal, e por isso, oferecem melhor estimativa da estrutura de correlações original.
Buscando obter-se uma estrutura fatorial mais simples para cada modelo, procedeu-se
a rotação ortogonal Varimax dos três fatores. Os resultados são mostrados no Quadro 15. As
estruturas fatoriais obtidas, após a rotação dos eixos, pouco se alteraram em relação às
estruturas originais (Quadro 12).

Quadro 14 – Matrizes de correlação estimadas e resíduos obtidos por cada um dos três
métodos de estimação*

Método do Componente Principal


V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
V1 0,93864 -0,01599 -0,00648 -0,00504 -0,00299 -0,03117 -0,01426 -0,00543 0,00807 0,00425
V2 0,83619 0,79342 0,11046 -0,05793 -0,05937 0,05671 -0,14941 -0,08472 0,05710 -0,12267
V3 0,07627 -0,05013 0,72417 -0,07817 -0,09782 0,08114 -0,13831 -0,06915 -0,07414 -0,02616
V4 -0,01133 -0,14479 0,80387 0,90243 0,02894 -0,01885 0,06183 0,01198 -0,08935 0,09272
V5 0,05361 -0,08651 0,80598 0,89811 0,89829 -0,02010 0,05158 0,02118 -0,06961 0,07586
V6 0,86409 0,84243 -0,10026 -0,20511 -0,14472 0,90440 -0,09084 -0,03228 -0,02137 -0,04610
V7 0,81936 0,68473 0,08885 0,01842 0,07515 0,68526 0,77525 0,03163 -0,02286 0,13103
V8 0,89786 0,84752 -0,03981 -0,13958 -0,07706 0,89799 0,73869 0,90571 0,03348 -0,00455
V9 -0,06198 -0,04215 0,50086 0,56007 0,55324 -0,02948 -0,17589 -0,04239 0,67917 -0,23029
V10 0,08651 0,24282 -0,10595 -0,13953 -0,13353 0,33228 -0,13819 0,24781 0,40182 0,77055
Método da Máxima Verossimilhança
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
V1 0,90523 0,02029 0,02352 -0,00401 0,00184 -0,01430 -0,00099 0,01078 -0,01155 -0,05419
V2 0,79991 0,86545 0,04345 -0,00370 -0,00684 0,00322 0,00376 -0,03973 0,00505 -0,10810
V3 0,04628 0,01687 0,67014 0,00455 -0,00422 -0,00102 0,00147 -0,06735 -0,06958 -0,17214
V4 -0,01236 -0,19902 0,72115 0,94697 -0,00055 0,00308 0,00166 -0,00097 -0,00157 0,02406
V5 0,04879 -0,13904 0,71237 0,92760 0,91277 -0,00118 -0,00151 0,00895 0,02081 0,00045
V6 0,84722 0,89592 -0,01810 -0,22704 -0,16365 0,93197 0,00078 0,01388 -0,02537 0,06033
V7 0,80608 0,53156 -0,05093 0,07859 0,12824 0,59364 0,94525 -0,00299 -0,01610 -0,01350
V8 0,88165 0,80254 -0,04161 -0,12664 -0,06483 0,85183 0,77331 0,87256 0,08864 0,09325
V9 -0,04236 0,00990 0,49630 0,47228 0,46282 -0,02547 -0,18265 -0,09755 0,40107 0,11204
V10 0,14495 0,22825 0,04003 -0,07087 -0,05812 0,22585 0,00634 0,15001 0,05949 0,08990
Método do Fator Principal
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
V1 0,91818 0,03578 0,02593 -0,00816 -0,00374 -0,02244 -0,01880 0,01177 -0,01517 -0,04154
V2 0,78442 0,79041 0,08033 -0,03154 -0,03241 0,02641 -0,01439 -0,03785 -0,00639 -0,09409
V3 0,04387 -0,02000 0,58395 0,01362 -0,00011 0,03364 -0,04027 -0,07415 -0,02207 -0,13484
V4 -0,00821 -0,17119 0,71207 0,94925 -0,01039 0,00699 0,01693 0,00771 -0,00042 0,04133
V5 0,05436 -0,11347 0,70827 0,93744 0,93008 0,00258 0,01168 0,01725 0,01729 0,01826
V6 0,85535 0,87273 -0,05276 -0,23095 -0,16741 0,96566 0,00323 -0,01421 -0,05688 0,04551
V7 0,82389 0,54971 -0,00919 0,06332 0,11505 0,59119 0,96387 0,03012 0,01091 0,01376
V8 0,88067 0,80066 -0,03480 -0,13532 -0,07313 0,87991 0,74020 0,86929 0,05265 0,08008
V9 -0,03874 0,02134 0,44880 0,47114 0,46634 0,00603 -0,20965 -0,06157 0,43613 0,09278
V10 0,13230 0,21424 0,00274 -0,08814 -0,07592 0,24067 -0,02092 0,16318 0,07875 0,10787
* O triângulo inferior esquerdo de cada matriz contém a matriz estimada de R; a diagonal, as comunalidades
finais, conforme o Quadro 13; e o triângulo superior direito, os resíduos entre as correlações observadas e as
estimadas.

33
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 15 – Estruturas fatoriais após a rotação ortogonal Varimax dos eixos coordenados

Variáveis Fator 1 Fator 2 Fator 3


Método do Componente Principal
V1 0,96586 0,06335 -0,04170
V2 0,87671 -0,07674 0,13750
V3 0,02191 0,85017 -0,02983
V4 -0,07563 0,94598 -0,04285
V5 -0,00857 0,94662 -0,04617
V6 0,91328 -0,13343 0,22919
V7 0,83141 0,07324 -0,28043
V8 0,93977 -0,06632 0,13473
V9 -0,08056 0,61042 0,54778
V10 0,13320 -0,09780 0,86212
Método da Máxima Verossimilhança
V1 0,90949 0,04093 0,27639
V2 0,69515 -0,05898 0,61542
V3 -0,02630 0,80707 0,13448
V4 0,02313 0,93756 -0,25967
V5 0,08197 0,92366 -0,23000
V6 0,75569 -0,09659 0,59293
V7 0,94959 0,00261 -0,20864
V8 0,88091 -0,07317 0,30199
V9 -0,14288 0,57159 0,23226
V10 0,07068 0,00336 0,29136
Método do Fator Principal
V1 0,95291 0,04812 0,08843
V2 0,78860 -0,06108 0,40595
V3 0,00184 0,76166 0,06176
V4 -0,03760 0,95164 -0,20548
V5 0,02691 0,94521 -0,18959
V6 0,86020 -0,10884 0,46246
V7 0,90007 0,01752 -0,39171
V8 0,90917 -0,06383 0,19656
V9 -0,09979 0,56263 0,33109
V10 0,11133 -0,02167 0,30824

34
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Considerando-se o conhecimento teórico da matéria em pauta, a racionalidade dos


resultados e a proporção da variância amostral total explicada por cada um dos três modelos
fatoriais finais, pode-se, seguramente, optar pelo modelo gerado a partir do Método do
Componente Principal.
Nesse caso, o Fator 1 envolve as variáveis relacionadas com a parte química do solo
(fertilidade, acidez, disponibilidade de nutrientes etc.), ou seja, V1 e V2 (pH KCl horiz. A e
B), V6 (Mg/K trocáveis horiz. B), V7 e V8 (saturação de bases horiz. A e B) (Quadro 15). O
Fator 2 abriga as variáveis relacionadas com a mineralogia do solo (V3 = Al2O3 total horiz.
A; V4 e V5 = Fe2O3 total horiz. A e B). Já o Fator 3 traz a contribuição da física do solo
(textura e indiretamente, estrutura, densidade, porosidade, aeração, drenagem, etc.) através
das variáveis V9 e V10 (argila/silte horiz. A e B). A variável V9 também apresentou parcela
de contribuição significativa no Fator 2, o que não deixa de ser lógico, pois sempre há relação
entre a mineralogia e as frações texturais do solo, notadamente as mais finas.
Os modelos finais, gerados pelos Métodos da Máxima Verossimilhança e do Fator
Principal (Quadro 15), apresentaram estruturas similares à do Método do Componente
Principal, para os Fatores 1 e 2. Porém, no Fator 3, voltaram a incluir as variáveis V2 e V6,
enquanto a variável V10 não foi "carregada" em nenhum dos três fatores extraídos. Nesse
caso, os modelos iniciais, antes da rotação (Quadro 12), mostraram uma estrutura teórica mais
lógica do que após a rotação (Quadro 15).
Foi eleito o modelo fatorial ajustado pelo Método do Componente Principal como o
melhor.
No presente caso, gerou-se, então, a matriz de coeficientes dos escores dos fatores
(Quadro 16) e finalmente, calculou-se os escores de cada um dos três fatores, pelo método da
regressão que, no caso do Método do Componente Principal, dá resultados coincidentes aos
obtidos pelo Método de Bartley. Isso foi feito para cada uma das 21 unidades de amostra
(Quadro 17). Assim, cada unidade de amostra passou a ser caracterizada não mais por 10
variáveis, mas, agora, por apenas três.

Quadro 16 – Matriz de coeficientes dos escores dos fatores rotacionados, extraídos pelo
Método do Componente Principal

Variáveis Fator 1 Fator 2 Fator 3


V1 0,24141 0,04439 -0,08756
V2 0,20680 -0,00995 0,06984
V3 0,02604 0,29312 -0,04615
V4 0,00486 0,32414 -0,05409
V5 0,02156 0,32594 -0,06043
V6 0,20966 -0,03077 0,14565
V7 0,22121 0,05042 -0,27962
V8 0,22271 -0,00490 0,06393
V9 -0,03525 0,19483 0,44637
V10 -0,01520 -0,05101 0,71375

35
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 17 – Matriz de escores dos fatores, extraídos pelo Método do Componente Principal

Unid. Amostra Fator 1 Fator 2 Fator 3


1 -0,30147 0,30655 -0,02706
2 -0,39386 0,54345 -0,52960
3 -0,30241 -0,24660 -0,43030
4 0,52647 0,20411 0,59964
5 -0,37114 -1,01120 -0,73891
6 -0,16489 -1,33242 -0,78151
7 -0,10108 0,01128 -0,03215
8 -0,22096 -1,50556 2,84876
9 -0,15365 -0,38631 -0,92570
10 0,70846 0,82952 -1,69472
11 -0,62582 -0,00270 0,53879
12 0,18691 0,19270 0,04780
13 -0,22436 2,25605 -0,16686
14 -0,32563 1,19761 -0,49028
15 -0,30860 0,46846 0,04205
16 -0,24847 -1,32062 -0,54128
17 -0,43633 -0,61489 -0,29308
18 -0,26252 -0,41754 1,10724
19 4,12529 -0,18436 0,31015
20 -0,49336 1,91736 1,85108
21 -0,61257 -0,90488 -0,69407

De posse dos escores dos fatores, e a título de ilustrar como poderia ser feito um
posterior estudo baseado nos novos fatores, procedeu-se o ajuste de uma regressão linear
múltipla, considerando os três fatores como as variáveis independentes (Quadro 17) e o índice
de Sítio (Quadro 8) como a variável dependente do modelo (Quadro 18). Nesse caso, tem-se
a certeza absoluta de que o modelo linear ajustado não apresenta problemas de
multicolinearidade, o que certamente não ocorreria, caso fossem utilizadas as variáveis
originais, devido às altas correlações entre algumas delas (Quadro 10).
A equação final ajustada, considerando o nível de 5% de significância, foi a seguinte:

IS! = 15,671429 + 1,769236 (Fator 1) + 1,735753 (Fator 3) + 1,603322 (Fator 2)

R2 = 56,62%

36
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Quadro 18 - Ajuste de modelo linear múltiplo pelo método Stepwise conforme saída das
análises do SPSS
Equação Número 1 - Variável Incluída no Passo Número 1. FATOR 1 REGR FATOR ESCORE 1
R Múltiplo .45099
R2 .20339
R2 Ajustado .16146
Erro Padrão (SE) 3.59238
F = 4.85106 Signif. F = .0402
---------------------- Variável na Equação ---------------------- -------------- Variáveis não incluídas na Equação --------------
Variável B SE B Beta F Sig F Variável Beta In Parcial Min F Sig F
Toler
FATOR 1 1.769236 .803281 .45098 4.851 .0402 FATOR 2 .408695 .457906 1.000000 4.776 .0423
7
(Constante) 15.67142 .783922 399.642 .0000 FATOR 3 .442452 .495728 1.000000 5.865 .0262
9
*****************************
Equação número 2 - Variáveis Incluídas no Passo Número 2. FATOR 3 REGR FATOR ESCORE 3
R Múltiplo .63179
R2 .39915
R2 Ajustado .33239
Erro Padrão (SE) 3.20540
F = 5.97887 Signif. F = .0102
------------------ Variáveis na Equação ------------------------ ------------- Variável não incluída na Equação -------------
Variável B SE B Beta F Sig F Variável Beta In Parcial Min F Sig F
Toler
FATOR 1 1.769236 .716748 .450987 6.093 .0238 FATOR 2 .408695 .527251 1.000000 6.546 .0204
FATOR 3 1.735753 .716748 .442452 5.865 .0262
(Constante) 15.67142 .699475 501.964 .0000
9
*****************************
Equação número 3 - Variável Incluída no Passo Número 3. FATOR 2 REGR FATOR ESCORE 2
R Múltiplo .75245
R2 .56619
2
R Ajustado .48963
Erro Padrão (SE) 2.80262
F = 7.39575 Signif.F = .0022
------------------ Variáveis na Equação -----------------------
Variável B SE B Beta F Sig F
FATOR 1.769236 .626685 .450987 7.970 .0117
1
FATOR 1.735753 .626685 .442452 7.671 .0131
3
FATOR 1.603322 .626685 .408695 6.546 .0204
2
(Constan 15.671429 .611581 656.612 .0000
te)

37
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

O modelo linear obtido explicou 56.62% da variação do índice de Sítio, apresentando


ainda um R2 ajustado de 48,96%. As contribuições individuais dos fatores foram: 20,34%
para o Fator 1 (fertilidade); 19,57% para o Fator 3 (textura); e 16,71 para o Fator 2
(mineralogia), sendo todos significativos ao nível de 5%, pelo teste F (Quadro 18).
Esse resultado, aparentemente, indica um modelo com baixo poder preditivo. Entre-
tanto, a maioria dos trabalhos de relação solo-sítio apresenta níveis de explicação comumente
não superiores a 70%. As grandes diferenças de localização das parcelas (Quadro 8), certa-
mente, implicam em grandes variações climáticas e fisiográficas, que não foram contempladas
no presente estudo.
Por outro lado, os dados de solo foram coletados após o crescimento da floresta e em
diferentes idades (de 7 a 48 anos). Isso compromete a fidedignidade dos dados,
principalmente com relação à fertilidade do solo, pois as árvores absorvem nutrientes e
conseqüentemente, alteram as características químicas do solo. Numa condição ideal, dever-
se-ia trabalhar com dados de análise de solo, coletados antes do plantio da floresta.
Diante disso, pode-se concluir que o modelo fatorial apresentou bons resultados e
ofereceu subsídios para a melhor compreensão dos fatores de solo que determinam a produ-
tividade de plantios de Araucaria angustifolia, bem como permitiu o ajuste de um modelo
linear relativamente simples para explicar, quantitativamente, a contribuição relativa de cada
um dos fatores extraídos.

8. POSSÍVEIS FONTES DE ERROS EM ANÁLISE FATORIAL1/

Certos erros têm sido cometidos em estudos de Análise Fatorial, principalmente da


não observância de certos pressupostos metodológicos. Numerosos erros poderiam ser
mencionados, começando pelo que talvez se possa considerar o fundamental: fazer a coleta de
dados antes de planejar a análise fatorial. Na realidade, este é um problema fundamental, pois
parte do pressuposto de que não há nenhuma idéia a priori sobre a natureza dos dados que
vamos coletar. O objetivo da pesquisa seria, então, procurar alguma ordem escondida no
conjunto de dados. Ao lado disso, outro problema fundamental é que a análise fatorial é um
modelo de relações lineares, do tipo regressão, na qual a variável independente não é especi-
ficada a priori, e é formada por um conjunto de variáveis. O escore dos fatores (ou valores
dos fatores) é, em última instância, o valor estimado na regressão. Se usarmos um conjunto de
dados cuja distribuição seja inapropriada ao modelo linear, estamos, previamente, falseando
os resultados. Algumas poderiam ser mencionadas:
a) distribuições truncadas;
b) distribuições bimodais;
c) distribuições com muito poucos casos extremos;
d) separação muito forte em variáveis dicotomizadas;
e) regressão não linear, quer dizer, variáveis cujo melhor ajuste seria por via de uma
regressão não linear.
É claro que é preciso realizar um compromisso entre uma ortodoxia metodológica e a
significação teórica da variável; afinal é preciso não esquecer que o objetivo da pesquisa não é
simplesmente aplicar um método, mas utilizar um método em busca de uma descrição ou
explicação de um fenômeno. Se uma variável é de tal modo significativa, segundo nossos
pressupostos teóricos, pode ser o caso, muitas vezes, de usar um método diferente e não,
simplesmente, eliminar a variável. O uso de valores transformados, para aumentar a aproxi-

1/ Essa seção será baseado na exposição apresentada por MENEZES et al, (1978).

38
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

mação a uma distribuição normal, pode ser a solução adequada (logaritmo, raiz quadrada,
etc.).
Comrey (1973), citado por MENEZES et al (1978) chama a atenção para numerosas
outras fontes de erros na análise fatorial, como o uso de variáveis não independentes; por
exemplo:
a) utilizar uma variável que represente uma resposta em um item e outra alternativa em
outro item, quer dizer, duas variáveis dizendo a mesma coisa, diferente apenas pela
natureza da resposta (por exemplo, porcentagem da população rural e urbana, se
uma das duas não estiver relacionada a outro conjunto de variáveis );
b) utilizar uma variável que seja uma combinação linear de outras duas, tais como,
crescimento demográfico entre 1950/70 e 1960/70 e 1950/60, já que pode ter uma
correlação forçada da primeira com qualquer das duas outras ou com as duas.
Outra fonte de erros pode ser o de ter fatores pouco representativos, no sentido de ter
um número de variáveis pouco superior ao número de fatores hipotetizados. O número de
variáveis deve ser de quatro a cinco vezes superior ao número de fatores hipotetizados, pois
do contrário, ele pode estar sendo apenas uma construção matemática.
Comrey (1973), citado por MENEZES et al (1978), assinala ainda que o uso de
variáveis complexas, embora possa ajudar a interpretação, se utilizado em excesso, torna
impossível a interpretação dos resultados. Se variáveis complexas são usadas, pode-se correr
o risco de interpretação de um fator com significação múltipla. Se, por exemplo, utilizamos
uma variável que descreva um fator A e B, ao mesmo tempo, é indispensável que no conjunto
da análise haja variáveis que descrevem A sem descrever B, ao mesmo tempo que outras
descrevem B sem descrever A, de maneira que se tenham os dois fatores A e B puros,
descritos por um número adequado de variáveis, e assim, com a possível interseção de um
com outro, por via de variáveis complexas
A não indicação do que se poderia chamar variável pura (em contraposição a uma
variável complexa), que descreva bem um fator, pode fazê-lo surgir de qualquer maneira (a
variância existente será forçada a aparecer em algum fator) sem explicação adequada e
produzir falsas interpretações
Um outro ponto importante, que afeta os resultados, é a representatividade da amostra.
O primeiro cuidado é ter-se uma amostra (de alguma forma um número de observações)
suficientemente grande para que as correlações sejam estáveis. Uma fonte de perturbação
pode ser a combinação de dois grupos de lugares (ou unidades experimentais) de natureza
essencialmente diferentes, que tenham estruturas fatoriais diferentes, em uma só análise.
Nesse caso, deve-se proceder análises separadas de cada grupo, para se obter a estrutura
parcial, e posteriormente, obter a análise global e uma estrutura global (Comrey, 1973, citado
por MENEZES et al, 1978).

9. NÚMERO E SIGNIFICADO DOS FATORES

O princípio fundamental da análise fatorial é reduzir um número grande de variáveis a


um número pequeno de fatores, de natureza abstrata, porém definidores do processo. Fica
implícito, portanto, que o conjunto de p variáveis descreve a diferenciação existente entre as n
unidades de observação e que cada variável descreve (1/p) desta diferenciação.
Esse raciocínio implica que um fator, cujo autovalor seja menor ou próximo à unidade,
representa o mesmo que uma variável isolada, o que o torna dispensável, pela própria
natureza do método fatorial e de seu objetivo essencial (MENEZES et al., 1978).

39
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

Segundo MENEZES et al (1978) um fator com autovalor próximo da unidade, implica


em duas possibilidades:

a) Este fator, provavelmente, só tem uma variável altamente correlacionada e por isto
só representa a variável, e parte dela, apenas. A soma de quadrados de correlação
de numerosas variáveis não relacionadas com fator (correlações entre 0,2 e 0,3),
podem fazer o autovalor atingir valores relativamente altos. Nesse caso, o fator,
será constituído, talvez, pela soma de termos únicos e de erros (cuja distribuição
pelos vários fatores é, por definição, aleatória) e portanto, não possível de ser
interpretada.

b) Se a variável única relacionada a este fator, apresenta elevado significado teórico,


ao invés de abandonar o fator, ou a variável, deve-se procurar um conjunto de
novas variáveis que descrevam o mesmo processo e promover uma nova análise
para a correção do problema.

Mensurações ao nível de significado estatístico do valor obtido, podem ser tentadas na


determinação do número de fatores. Entretanto, uma decisão desta natureza sofre influência
do tamanho da amostra, a qual é uma decisão do pesquisador, e portanto, estarão embutidos,
também, componentes de caráter subjetivo. Assim, o nível de significância estatística pode
dar uma falsa idéia do significado de um fator, que em última instância, apresenta relação
direta com a estrutura do processo e com a natureza das variáveis envolvidas.
O número de fatores comuns (m) pode ser definido a priori, a partir de considerações
teóricas e/ou, com base em resultados experimentais anteriores, ou ainda por meio dos
autovalores estimados. JOHNSON & WICHERN (1988) apresentam alguns critérios para
verificação do ajuste e determinação do número ideal de fatores comuns:

a) A matriz residual, resultante da diferença entre as matrizes de covariâncias ou


correlações amostrais (S ou R) e as suas respectivas estimativas, a partir dos
diferentes métodos de estimação, fornece uma maneira de verificação do ajuste de
modelo fatorial com m fatores comuns, ou seja:
! ! "− Ψ
R − ΛΛ ! (Método do Componente Principal)
! ! "− Ψ
R − ΛΛ ! (Método da Máxima Verossimilhança)
Os elementos da diagonal principal da matriz residual são iguais a zero. Se os demais
elementos forem pequenos (próximo de zero), pode-se inferir, subjetivamente, que o
modelo fatorial, com m fatores comuns, é apropriado.

b) A adequação do modelo fatorial também pode ser verificada analiticamente, a partir


das contribuições dos fatores para as variâncias amostrais consideradas. Os fatores
comuns devem ser responsáveis pela maior porção das variâncias das variáveis
analisadas, ou seja:
Soma de quadrados de [ R − ΛΛ ! ] ≤ λ! 2 +" + λ! 2 pelo método do componente
! ! "− Ψ
m+1 p
principal. Conseqüentemente, um baixo valor para a soma de quadrados dos
autovalores negligenciados implica num baixo valor para a soma de quadrados dos
erros de aproximação.
c) As contribuições dos primeiros poucos fatores para a variância amostral das
variáveis consideradas deve ser grande. De maneira generalizada, temos:

40
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

λ! j (análise fatorial de S pelo método do


componente principal);
s11 + s22 +" + s pp
Proporção do total da variância amostral
λ! j (análise fatorial de R pelo método do
devido ao j-ésimo fator comum componente principal);
p
a! 12j + a! 22 j +" + a! 2pj (análise fatorial de S pelo método da
máxima verossimilhança);
s11 + s22 +" + s pp
a! 12j + a! 22 j +" + a! 2pj (análise fatorial de R pelo método da
máxima verossimilhança).
p

Pelo critério anterior, o número de fatores comuns retidos no modelo pode ser
incrementado, até que uma proporção adequada da variância amostral total tenha sido
obtida.

d) Outra maneira usual á determinar m igual ao número de autovalores de R maiores


do que um, ou igual ao número de autovalores positivos de S.

Entretanto, JOHNSON & WICHERN (1988) consideram que o melhor procedimento


consiste em reter o menor número de fatores possível, mas que proporcione uma explicação
satisfatória dos dados e um ajuste adequado de S ou de R.
Segundo MENEZES et al, (1978), cinco a seis fatores e quatro a seis variáveis por
fator são, supostamente, adequados, subordinados ao princípio de que estes fatores expliquem
uma fração de 60 a 70% da variação total.

10. PERSPECTIVAS E ESTRATÉGIAS PARA ANÁLISE FATORIAL

A decisão crucial e mais importante da análise fatorial envolve a escolha do número de


fatores comuns (m). Amostras grandes e/ou dados com distribuição aproximadamente normal
são adequadas para uso do modelo fatorial. Entretanto, o modelo fatorial poderá não ajustar-
se, corretamente, para um pequeno número de fatores comuns, se o número de variáveis e de
observações for grande. Freqüentemente, a decisão final acerca do número de fatores comuns
baseia-se nos seguintes pontos (JOHNSON & WICHERN, 1988):
a) A proporção da variância amostral total explicada;
b) O conhecimento teórico da matéria em pauta;
c) A racionalidade dos resultados.
A decisão acerca do método de estimação e do tipo de rotação são menos cruciais.
Normalmente, a solução mais satisfatória é aquela obtida pela confirmação substancial de
uma mesma estrutura de fatores, gerada após a rotação dos resultados, e alcançada por mais
de um método de estimação.
Uma opção de estratégia de trabalho pode ser a seguinte (JOHNSON & WICHERN,
1988):
a) Executar uma análise fatorial pelo Método do Componente Principal;
Este método é apropriado para uma primeira inspeção dos dados. Nessa etapa,
observações duvidosas poderiam ser encontradas, plotando-se os escores fatoriais, ou
calculando-se os escores padronizados de cada observação. Poderia ser tentado uma
rotação varimax dos eixos coordenados.

41
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

b) Executar um análise fatorial pelo Método da Máxima Verossimilhança, incluindo


rotação varimax;
c) Comparar as soluções obtidas em cada método, verificando se os grupos de
carregamento de fatores são semelhantes e plotando os escores fatoriais obtidos
pelo método do componente principal contra aqueles do método da máxima
verossimilhança;
d) Repetir as três operações anteriores para outros números de fatores comuns,
verificando a necessidade da contribuição de fatores adicionais para o entendimento
e interpretação dos dados;
e) Para séries grandes de dados, dividi-las ao meio e executar a análise fatorial de cada
parte, comparando as duas soluções entre si e também com aquela obtida à partir da
análise de todos os dados, checando a estabilidade das soluções. Os dados podem
ser divididos ao acaso, ou pela separação dos casos de números ímpares e de
números pares, em dois grupos distintos.

Em certas situações, a análise fatorial promove razoável explicação das observações


em termos de uns poucos fatores comuns interpretáveis. Na prática, uma grande maioria de
tentativas de análise fatorial não produz resultados claros e bem definidos. Infelizmente, o
critério de julgamento da qualidade de qualquer modalidade de análise fatorial não tem sido
bem quantificado. Ou melhor, ele costuma ser um critério de sucesso se, ao examinar os
resultados da análise fatorial o investigador puder afirmar: "sucesso, eu compreendo esses
fatores"; então a aplicação do método é tida como bem sucedida (JOHNSON & WICHERN,
1988).

11. REFERÊNCIAS BIBLIOGRÁFICAS

COOLEY, W. W. & LOHNES, P. R. Multivariate data analysis. New York, John Wiley &
Sons, Inc. 1971. 364 p.

FACHEL, J. M. G. Análise fatorial. São Paulo, USP, 1976. 81 p. (Tese MS)

FOWLER, H. G. A novel application of factor analysis to examine interactions of the


fossorial predators Sirthenia striata (Hemiptera: Reduviidae) and Megacephala fulgida
(Coleoptera: Cicindelidae). Rev. Mat. Estat. 11:93-103, 1993.

HARMAN, H. H. Modern factor analysis. Chicago, Tha University of Chicago Press, 1968.
474 p.

HOOGH, R.J. & DIETRICH, A.B. Avaliação de sítio para Araucaria angustifolia (Bert) o.
ktze em povoamentos artificiais. Brasil Florestal, 10 (37):19-71, 1979.

JOHNSON, R. A. & WICHERN, D. W. Applied multivariate statistical analysis.


Englewood Cliffs, N. J., Prentice-Hall, Inc., 1988. 607 p.

KARSON, M.J. Multivariate statistical methods. Ames, Iowa, The Iowa State University
Press, 1982. 307 p.

KIM, J.O. Factor analysis. In: NIEH, H.; HULL, C.H. ; JENKINS, J.C.; STENBRENNER,
K.; BENJ, D.H. (eds.). Statistical package for social sciences. New York. Megal Hill,
1975. v 5. p 468-514.

42
MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

MANLY, B. F. J. Multivariate statistical methods. New York, Chapman and Hall, 1986.
159 p.

MARRIOT, F.H.C. The interpretation of multiple observations. New York, Academic


Press, 1974. 117 p.

MENEZES, A.C.F.; FAISSOL, S.; FERREIRA, M.L. Análise da matriz geográfica:


estruturas e inter-relações. In: IBGE. Tendências atuais na geografia urbano-regional:
teorização e quantificação. Rio de Janeiro, 1978. p. 67-109.

QUEIROZ, W.T. Análise de fatores ("Factor Analysis") pelo método da máxima


verossimilhança: aplicação no estudo da estrutura de florestas tropicais. Piracicaba,
ESALQ, 1984. 112p. (Tese D.S.)

SRIVASTAVA, M. S. & CARTER, E. M. An introduction to applied multivarite


statistics. North-Holland, Elsevier Science Publishing Co., 1983. 394 p.

43

Você também pode gostar