Escolar Documentos
Profissional Documentos
Cultura Documentos
Tutorial de Análises Pesquisar o site
Estatísticas
Introdução Tópicos > Estatística Multivariada > Análise de Componentes Principais
Tópicos (PCA) >
Análise Bayesiana
de Decisão
Tutorial 1
Download do TinnR
Download no R
Estatística Para exemplificar a construção de uma PCA irei usar os dados
Experimental
Estatística de variáveis químicas de sedimento amostradas em 24 locais. O
Multivariada
conjunto de dados1 se encontra no arquivo sedimento.txt
Material sobre o R
Modelos Aditivos (sedimento).
Generalizados
Modelos Lineares
Generalizados 1Os dados aqui apresentados foram simulados.
Probabilidade e
Estatística
1 Os dados acima encontramse no arquivo sedimento.txt
Responsável (sedimento), assim a entrada dos dados no R pode ocorrer da
seguinte maneira:
Paul G. Kinas
dados<read.table("sedimento.txt",header=T)
(IMEFFURG)
dados
2 Para construir a PCA será utilizado o pacote vegan
library(vegan)
3 Em geral, dois tipos de PCA são feitas: a PCA de
covariância e a PCA de correlação. Primeiramente, será
demonstrado a PCA de covariância.
resultado<prcomp(dados) # prcomp é a função para
construir a PCA
4 Para mostrar os desvios dos componentes principais e os
loadings
resultado
https://sites.google.com/site/tutorialdeanalisesestatisticas/topicos/estatistica-multivariada/analise-de-componentes-principais-pca/tutorial-1-1 1/6
14/03/2018 Tutorial 1 - Tutorial de Análises Estatísticas
5 Para mostrar a porcentagem de variância capturada por cada
eixo
summary(resultado)
https://sites.google.com/site/tutorialdeanalisesestatisticas/topicos/estatistica-multivariada/analise-de-componentes-principais-pca/tutorial-1-1 2/6
14/03/2018 Tutorial 1 - Tutorial de Análises Estatísticas
6 Para salvar os scores da PCA (eixos)
resultado$x
7 Para salvar os loadings
resultado$loadings
8 Para plotar
biplot(resultado)
https://sites.google.com/site/tutorialdeanalisesestatisticas/topicos/estatistica-multivariada/analise-de-componentes-principais-pca/tutorial-1-1 3/6
14/03/2018 Tutorial 1 - Tutorial de Análises Estatísticas
screeplot(resultado)
https://sites.google.com/site/tutorialdeanalisesestatisticas/topicos/estatistica-multivariada/analise-de-componentes-principais-pca/tutorial-1-1 4/6
14/03/2018 Tutorial 1 - Tutorial de Análises Estatísticas
9 Agora, PCA de correlação. A PCA de correlação é construida
usando os dados que foram padronizados para ter média 0 e
desvio padrão 1. A PCA de correlação é adequada quando para
quando as variáveis foram medidas em unidades diferentes ou
quando a variância de cada variável é muito diferente umas das
outras. Para ver os dados de variáveis químicas do arquivo
sedimento.
round(apply(sedimento,2,var),4)
# veja que a variância de cada variável é muito diferente. Então,
temos que usar uma PCA de correlação para que a variável com
maior variância não "domine" a análise.
10 A PCA de correlação pode ser realizada de duas
maneiras: i) padronizando as variáveis ou ii) mudando o
argumento scale da função prcomp para scale=TRUE.
10.1 Para padronizar os dados
https://sites.google.com/site/tutorialdeanalisesestatisticas/topicos/estatistica-multivariada/analise-de-componentes-principais-pca/tutorial-1-1 5/6
14/03/2018 Tutorial 1 - Tutorial de Análises Estatísticas
sedimentopadronizado<scale(sedimento)
10.1.1 Agora basta refazer a PCA usando os dados
padronizados
prcomp(sedimentopadronizado)
10.2 Ou apenas mudar o argumento scale=T
prcomp(sedimento, scale=T)
Subpáginas (1): sedimento
Comentários
Você não tem permissão para adicionar comentários.
https://sites.google.com/site/tutorialdeanalisesestatisticas/topicos/estatistica-multivariada/analise-de-componentes-principais-pca/tutorial-1-1 6/6