Você está na página 1de 10

Análisis de Componentes

Principales
Aplicación en los datos de Contaminación del Aire
Análisis de Componentes Principales
 Estas técnicas fueron inicialmente desarrolladas por Pearson a finales del
siglo XIX y posteriormente fueron estudiadas por Hotelling en los años 30 del
siglo XX. Para estudiar las relaciones que se presentan entre p variables
correlacionadas (que miden información común) se puede transformar el
conjunto original de variables en otro conjunto de nuevas variables
incorrelacionadas entre sí (que no tenga repetición o redundancia en la
información) .
 Las nuevas variables son combinaciones lineales de las anteriores y se van
construyendo según el orden de importancia en cuanto a la variabilidad
total que recogen de la muestra. De modo ideal, se buscan m<p variables
sean combinaciones lineales de las p originales y que estén
incorrelacionadas, recogiendo la mayor parte de la información o
variabilidad de los datos.
Data- Contaminación del Aire
Inspección de la variabilidad
TM R 2, 05E+ 10
SM IN 9, 24E+ 08
SM EAN 2, 55E+ 09
SM AX 1, 45E+ 10
PM IN 3, 42E+ 08
PM EAN 1, 51E+ 09
PM AX 2, 53E+ 10
PM 2 2, 42E+ 10
PERWH 1, 09E+ 08
NONPOOR 4, 58E+ 07
GE65 4, 71E+ 08
LPOP 1, 47E+ 15
Aplicación de la función en R -
Dispersión
Interpretación
PC1 PC2 PC3
TMR -0.2070804 0.48883994 -0.09984709
SMIN -0.2752876 0.15138042 -0.44291627
SMEAN -0.4429133 -0.05668566 -0.18442775
SMAX -0.3774925 -0.17782594 0.01546239
PMIN -0.2895922 -0.22806964 -0.11961453
PMEAN -0.3459077 -0.36593980 0.12389788
PMAX -0.2131400 -0.34995368 0.29562416
PM2 -0.2477647 0.10353542 -0.45487630
PERWH -0.2349044 0.27509202 0.52063823
NONPOOR -0.2882896 0.15132134 0.37906218
GE65 -0.1733924 0.53301427 0.14389480
LPOP -0.2529308 -0.03861767 0.01343967
Importancia de los componentes

De aquí
PC1 PC2 PC3 PC4 concluim
os que
Standard_deviation 19.886 15.357 11.878 105.437 será
suficiente
Proportion_of_Variance 0.3296 0.1965 0.1176 0.09264 usar las
primero
Cumulative_Proportion 0.3296 0.5261 0.6437 0.73629 cuatro
compone
ntes pues
nos
Interacción de componentes
Asociando a los datos

Perderemos
información sin
embargo
podremos
explicar casi lo
mismo con esas
4 componentes.
Peso de variables : Analizando las dos
primeras componentes
I. PC1:
 SMEAN
 SMAX
 PMEAN
I. PC2
 TMR
 GE65
 PMEAN
 PMAX