Você está na página 1de 13

Análise de componentes

principais
Análise multivariada
Exploratória de sintetização (simplificação )

• Análise de componentes principais (ACP)

Análise multivariada • Análise fatorial

refere-se a todas as • Análise de correlação canônica


• Análise de agrupamento
técnicas estatísticas
• Análise discriminante
que simultaneamente
• Análise de correspondência
analisam múltiplas Inferência estatística
medidas sobre sujeitos
• Estimativa de parâmetros
ou objetos
• Testes de hipóteses
pesquisados. • Análise de variância
• Análise de covariância
• Regressão multivariada
2
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

Por quê?

• Reduzir a dimensionalidade das variáveis


PCA Encontrar variáveis
hipotéticas (componentes)
que capturem a maior parte
da variação em dados
• Obtenção de v.a’s não correlacionadas
multidimensionais, sendo
PCA
que estas novas variáveis
são combinações lineares
• Analisar quais as variáveis ou, quais os conjuntos
das variáveis originais.
de variáveis explicam a maior parte da variabilidade
total, revelando que tipo de relacionamento existe
PCA
entre eles
3
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

O que?

É um método que tem por finalidade básica a análise dos dados usados visando sua redução,

eliminação de sobreposições e a escolha das formas mais representativas de dados a partir de

combinações lineares das variáveis originais.

4
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

Como?

A partir de uma matriz de dados de objetos (amostras) X descritores (variáveis), o


PCA resulta em novas variáveis (componentes) que explicam a maior variabilidade
possível existente no conjunto de dados.

Procedimento matemático que realiza, então, transformações lineares


de “m” variáveis originais em “m” novas variáveis, chamadas de
componentes.
Unidades diferentes

Correlação
Covariância
5
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

Como?

6
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

Como?

O PCA representa os objetos em um ambiente multi-dimensional de maneira que o primeiro eixo


(componente) explica a maior parte da variação dos dados.

O segundo eixo, perpendicular ao primeiro, explica um parte menor da variação.


Normalmente usa-se 2 CP.

7
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

Como?

Biplots são vetores super-impostos sobre um diagrama de


dispersao. Esses vetores saem do centro do diagrama e
representam as variáveis no PCA.

Cada amostra se localiza próxima do vetor que o caracteriza, que


se apresenta em maior intensidade na amostra.

Quando as amostras estão próximas, significa que elas são semelhantes em relação aos atributos
julgados. Quando as amostras estão distantes é porque diferem em relação aos atributos julgados.
8
ANÁLISE DE COMPONENTES PRINCIPAIS (acp)

Como?

Quando os vetores estão próximos, significa que eles possuem uma


alta correlação entre si.

Quando forma um ângulo de 90º entre os vetores, significa que estes atributos não têm correlação entre si.
Quando forma um ângulo de 180º existe uma correlação negativa

9
ANÁLISE DE COMPONENTES PRINCIPAIS
(acp)
1 ° passo

Cor Aroma Aroma Aroma sabor sabor


Amostra doçura corpo
marrom chocolate leite caramelo chocolate caramelo

A 4,49 2,03 2,06 7,55 2,33 7,66 7,64 2,28


B 7,17 3,52 1,68 3,12 4,8 3,84 5,5 6,83
C 1,55 6,75 6,4 2,16 5,81 2 2,02 1,43

2 ° passo 3 ° passo
Correlação PCA

10
Resumindo o Past 3.21...
1°- Inserir dados
Marcar “row attributes “ e “column attributes”
colar planilha
Desmarcar “row attributes “ e “column attributes”

2°- Análise de correlação variáveis


Selecionar área de análise Área abaixo diagonal-valores de R
Univariate Área acima da diagonal- valor de p
Correlation (Linear r (Pearson)) Cuidar significância

3°- Análise de componentes principais


Selecionar área de análise
Multivariate
Ordination
Principal Components (PCA)

11
Resumindo o Past 3.21...
3°- Análise de componentes principais

• Matrix- covariance (unidades iguais)


Summary • Matrix- correlation (unidades distintas)
• Valores dos PCs

• Seleção X e Y (PC1 e PC2)


• Row labels (nome amostras)
Scatter plot • Biplot (variáveis)
• Graph settings (cores, reguas, fonte)

Scores • Posição amostras em relação PCs

Loadings plots • Selecionar correlations

Loadings • Correlação entre variáveis e PCs


12
Como discutir...

Explicação da variabilidade (PC1 e PC2)

Correlação variáveis e PCs (loadings)- OPCIONALLLL

Seleção de grupos de amostras

Correlação das amostras com as variáveis de cada grupo


(proximidade)

Correlação das variáveis (tabela de correlação de Pearson)

13

Você também pode gostar