Escolar Documentos
Profissional Documentos
Cultura Documentos
>data<-read.csv("C:/dataset_exploratoryFactorAnalysis.csv")
>data
>cordata<-cor(data) Se calculeaza matricea coeficientilor de corelatie.
> covdata<-cov(data) Se calculeaza matricea de covarianta.
> fa_1<-factanal(data,2,covmat=NULL,rotation="varimax")
Functia factanal(x,factors,data=NULL,covmat=NULL,nobs=NA,rotation=varimax,
) realizeaza analiza factoriala.
x=matrice numerica
factors=nr. de factori care vor fi obtinuti
covmat=matricea de covarianta. Desigur matricea de corelatie poate inlocui in
analiza matricea de covarianta.
nobs=numarul observatiilor, folosit daca covmat este o matrice de covarianta
covmat=NULL nu folosim matricea de covarianta, ci pe cea de corelatie.
Obs. 90% din analizele factoriale folosesc matricea de corelatie.
1
Call:
factanal(x = data, factors = 2, covmat = NULL, rotation = "varimax")
Uniquenesses:
BIO GEO CHEM ALG CALC STAT
0.252 0.375 0.249 0.374 0.048 0.715
Loadings:
Factor1 Factor2
BIO 0.855 0.133
GEO 0.779 0.135
CHEM 0.865
ALG
CALC
0.791
0.971
Factor1 Factor2
SS loadings
2.124 1.863
Unicitatea (=uniqueness) este proportia din varianta unei variabile care nu este
explicata de toti factorii impreuna. O unicitate foarte mare indica faptul ca o
variabila nu este conectata cu nici un factor.
Din analiza factoriala de mai sus rezulta:
Variabila1 =BIO= 0.855* Factor1+ 0.133*Factor2
Variabila 2=GEO= 0.779* Factor 1 + 0.135* Factor 2, etc.
SS Loadings=suma patratelor incarcaturilor factorilor
2.124= 0.855 2 0.775 2 0.865 2 0.170 2 , etc.
Proportion Var 0.354 0.311
35,4% din varianta este explicata de factorul 1, iar 31,1% de factorul al 2-lea.
> plot(fa_1$loadings) Se grupeaza variabilele pe baza factorilor care le afecteaza.
1.0
0.8
0.6
0.2
0.4
Factor2
0.0
0.2
0.4
0.6
0.8
Factor1
1.0
0.8
0.6
ALG
STAT
0.2
0.4
Factor2
CALC
GEO
BIO
CHEM
0.0
0.2
0.4
0.6
0.8
Factor1
Din figura se observa ca materiile Calc(=Calculus, analiza matematica),
Alg(=algebra), Stat(=statistica) , deci stiintele exacte, determina factorul 2,
reprezentativ pentru interesul studentului in aceste discipline.
Materiile Geo(=geografie), Bio(=biologie), Chem(=chimie) determina factorul 1.
Factorul 1 exprima varianta raspunsurilor in proportie de 35,4%, iar factorul 2 in
proportie de 31,1%.
Determinarea numarului de factori extrasi
Se instaleaza pachetul psy.
Dupa instalarea lui:
> library(psy)
> scree.plot(fa_1$correlation)
5
Screeplotul are aceeasi interpretare ca in cazul PCA. Conform lui, alegem doar
primul factor.
3
2
1
0
Eigenvalue
Scree Plot
Dimension