Escolar Documentos
Profissional Documentos
Cultura Documentos
PRINCIPAIS
EM
COMPONENTES
PRINCIPAIS
OBJECTIVOS
AS COMPONENTES PRINCIPAIS
UM FIM EM SI MESMO E UM MEIO PARA UM FIM
REQUISITOS
OBJECTIVOS
A Análise em Componentes Principais (ACP) é um método multivariado de análise
fatorial que permite identificar subconjuntos de variáveis que estão muito
correlacionadas entre si e pouco associadas a variáveis de outros subconjuntos.
• Cada componente é uma composição (ou combinação) linear de todas as variáveis iniciais.
• Inicialmente são calculadas tantas componentes quantas as variáveis iniciais.
• As componentes principais são calculadas por ordem decrescente de importância
relativamente à sua contribuição para a explicação da variância total dos dados. Isto é, a
primeira componente é a combinação linear que mais explica da variância total dos dados
originais, a segunda componente é a que explica mais do que ficou por explicar com a
primeira e assim sucessivamente. A última componente é a que menos contribui para a
explicação da variância total.
UM FIM EM SI MESMO & UM MEIO PARA UM FIM
• A ACP é um meio para um fim porque o resumo que a ACP providencia pode e
deve ser usado para a criação de novas, e em menor número, variáveis que,
assim sendo, podem ser usadas muito mais eficazmente noutras fases da
investigação, porventura em Regressões, em Anovas, Cruzamentos, T-tests, etc..
REQUISITOS PARA A REALIZAÇÃO DA ACP
1. As variáveis devem ser métricas (ou admitir serem tratadas como tal);
2. Todas as variáveis têm o mesmo estatuto (não há VD, nem VIs, são todas variáveis de
input)
3. Todas as variáveis têm que apresentar variabilidade.
4. Dimensão da amostra adequada: Podemos encontrar diversas recomendações na
literatura que remetem para a existência de um número mínimo de observações por
referência ao número de variáveis. Algumas referem que devem existir pelo menos cinco
vezes mais casos válidos do que o número de variáveis (variáveis de input x 5 < número de
casos válidos).
5. Existência de multicolinearidade (correlações) entre as variáveis de input. A avaliação
deste requisito pode ser feita através da análise da matriz de correlações, da estatística de
Kaiser-Meyer-Olkin (KMO) e do teste de Bartlett.
REQUISITOS PARA A REALIZAÇÃO DA ACP
TESTE DE ESF ERIC IDADE DE BARTLET T
Permite testar a hipótese da matriz de correlações entre as variáveis ser uma matriz identidade
(matriz que tem a diagonal principal igual à unidade e os restantes elementos nulos), ou seja,
não existir correlação entre nenhum par de variáveis. Interessa rejeitar a hipótese nula.
UM
EXEMPLO
A S O C I O LO G I A
CO NC RETO
APRESENTAÇÃO DO EXEMPLO
RESULTADOS DESCRITIVOS
REQUISITOS
Porque se pretende:
[frequências]
RESULTADOS DESCRITIVOS
O QUE NOS DIZEM
Tabela 2: importância atribuída às funções da sociologia (Medidas descritivas)
Qual é o número de
casos válidos?
[Medidas descritivas]
RESULTADOS DESCRITIVOS
O QUE NOS DIZEM
Gráfico 1: Importância atribuída às funções da sociologia (médias)
Se quiséssemos agrupar as variáveis apenas E entre cada uma delas e as respostas dos
tematicamente, em quantos grupos e com que Há inquiridos? Não.
composição o faríamos? correspondência
entre estas duas
interpretações? Continuamos sem saber como se
correlacionam as respostas de quem
Se quiséssemos analisar as variáveis apenas Não. respondeu sobre a importância atribuída
com base nas suas médias, que variabilidade às diferentes funções da sociologia.
encontraríamos?
POSSO, ENTÃO, FAZER A ACP?
5. Existência de multicolinearidade.
A
MECÂNICA
ACP
MATRIZ DE CORRELAÇÕES
VALOR PRÓPRIO E VARIÂNCIA EXPLICADA
COMUNALIDADES
LOAGINGS
FASES
INICIAL
EXTRAÇÃO
ROTAÇÃO
MATRIZ DE CORRELAÇÕES
ESTATÍSTICAS DESCRITIVAS
variáveis = 15
casos válidos = 746
amostra adequada: 15x5 <746
ADEQUABILIDADE DA MATRIZ DE INPUT
( EXISTÊNC IA DE MU LTICO LINEARIDADE)
Como p < 0,05, rejeita-se H0 e aceita-se que a matriz de correlações não é uma
matriz identidade.
VARIÂNCIA TOTAL
No caso em análise, temos 15 combinações lineares das variáveis originais que explicam na
totalidade a variância dos dados, por ordem decrescente de importância quanto ao seu
contributo.
Sendo um dos objetivos da análise sumariar a informação, pretende-se trabalhar não com as 15
componentes, mas com um número relativamente reduzido.
Assim, na fase da extração são retidas apenas algumas componentes, de acordo com o(s)
critério(s) escolhido(s) pelo investigador e que se consideram em número suficiente e adequado
para representar os dados iniciais.
Critério da percentagem de
variância explicada: alguns
autores falam em reter (ou extrair)
as componentes necessárias para
explicar mais de 70% da variância
total, no entanto é vulgar Neste exemplo, a variância total explicada
considerar-se satisfatória uma atinge, com 3 componentes, 53%. Não estamos
solução que explique 60% da a aplicar o critério da percentagem explicada.
variância total;
å = 7,973
A percentagem da variância
total explicada por cada
componente (% of Variance)
obtém-se dividindo o valor
próprio da componente pela
variância total e multiplicando O mesmo se pode fazer com a
por 100. Veja-se para a % de variância explicada
componente 1: acumulada:
4,940 7,973
×100 = 32,93 ×100 = 53,151
15 15
å = 15
EXTRAÇÃO DAS COMPONENTES
å = 7,973
å = 7,973 å = 7,973
Sem rotação
rodadas permanecem
independentes entre si, ou seja, não Rotação oblíqua
correlacionadas.
CP1 após a rotação
Apenas Extraída
Loadinds (correlações) Componentes x (numa tabela)
Matrizes dos variáveis
loadings Rodada
(noutra tabela)
ALGUNS
CÁLCULOS
S O M A D O S Q UA D R A D O S
CÁLCULO DA COMUNALIDADE A partir de que tabela?
A única que também tem
informação sobre
variáveis: matriz dos
loadings (antes ou depois
da rotação)
De que variável?
Neste caso, construir
indicadores de justiça
social.
Antes ou depois da
rotação?
Neste caso, antes, mas é
indiferente.
(0,561) 2 + (0,286) 2 + (-0,095)2 = 0,405
Que cálculo?
Soma dos quadrados
CÁLCULO DA COMUNALIDADE A partir de que tabela?
A única que também tem
informação sobre
variáveis: matriz dos
loadings (antes ou depois
da rotação)
De que variável?
Neste caso, construir
indicadores de justiça
social.
Antes ou depois da
rotação?
Neste caso, depois, mas
tanto faz.
(0,228) 2 + (0,548) 2 + (0,230) 2 = 0,405
Que cálculo?
Soma dos quadrados
CÁLCULO DO VALOR PRÓPRIO
De que componente?
Neste caso, da primeira.
Antes ou depois da
rotação?
Neste caso, antes.
Que cálculo?
(0,742) 2 + (0,717) 2 + (0,673) 2 + (0,671) 2 + (0,643) 2 + (0,626) 2 + (0,561) 2 + (0,536) 2 +
+ (0,498) 2 + (0,495) 2 + (0,470) 2 + (0,419) 2 + (0,473) 2 + (0,390) 2 + (0,548) 2 = 4,940
Soma dos quadrados
CÁLCULO DO VALOR PRÓPRIO
De que componente?
Neste caso, da primeira
Antes ou depois da
rotação?
Neste caso, antes.
Que cálculo?
(0,845) 2 + (0,819) 2 + (0,780) 2 + (0,625) 2 + (0,596) 2 + (0,008) 2 + (0,129) 2 + (0,171) 2 + Soma dos quadrados
+ (0,079) 2 + (0,385) 2 + (0,228) 2 + (0,134) 2 + (-0,001)2 + (0,378) 2 + (0,365) 2 = 3,287
AS
U M A N O VA V I A G E M
NOVAS
VARIÁVEIS
DUAS VIAS
COMPARAÇÃO
COMO USAR E ANALISAR
VIA CÁLCULO DOS SCORES FACTORIAIS
Há analistas que optam por, em vez de guardar os scores factoriais, criar novas variáveis (summated scales)
através do cálculo da média das variáveis que mais pesam em cada uma das componentes (aquelas que têm
os loadings mais elevados).
Ao fazer isto, para as novas variáveis contribuem apenas as variáveis que mais se destacam nas
componentes, ao invés do que acontece quando se trabalha com os scores fatoriais, onde as novas variáveis
têm o contributo de todas as iniciais.
Alpha de Cronbach
Componente 1:
Componente 2:
Componente 3:
COMPARAÇÃO DAS DUAS VIAS
Componente 1:
COMPARAÇÃO DAS DUAS VIAS
Componente 2:
COMPARAÇÃO DAS DUAS VIAS
Componente 3:
COMPARAÇÃO DAS DUAS VIAS
APRESENTAÇÃO
DE
RESULTADOS
APRESENTAÇÃO DEVE INCLUIR
A apresentação dos resultados da ACP deve incluir:
§ Apresentação e análise descritiva das variáveis originais (o que foi medido, como foi medido, como foram
as respostas obtidas);
§ Referência à adequabilidade da ACP (KMO ou teste de Bartlett) (Pode ser feito em nota de rodapé);
§ Quadro síntese onde constam as componentes retidas (com a respetiva designação), a percentagem de
variância explicada por cada uma delas e as contribuições de cada variável para cada componente
(loadings) (ver slide seguinte);
§ A interpretação de cada componente retida;
§ Sugere-se ainda a comparação das componentes, tentando perceber a sua importância relativa para os
indivíduos (por exemplo através das médias, quando tal for possível) bem como a realização de
cruzamentos com outras variáveis que pareçam pertinentes (opção, satisfação, ano lectivo) no sentido de
apurar a existência de eventuais diferenças de posicionamento.
DAR NOME, DAR SENTIDO, DAR SIGNIFICADO ÀS COMPONENTES