Você está na página 1de 97

Universidad Inca Garcilaso de la Vega

Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

UNIVERSIDAD INCA GARCILASO DE LA VEGA


Nuevos tiempos. Nuevas Ideas
FACULTAD DE PSICOLOGIA Y TRABAJO SOCIAL
CARRERA PROFESIONAL DE PSICOLOGIA A DISTANCIA

TCNICAS MULTIVARIADAS DE ANLISIS

LIMA PER
2011

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

INTRODUCCION

Actualmente las distintas Tcnicas para el anlisis de Datos aplicando modelos Estadsticos son
instrumentos
empleados por
los investigadores en las diferentes
reas cientficas.
Especialmente en las Ciencias de la Conducta que en los ltimos aos han ido aumentando y, ms
concretamente, en la Carrera de Psicologa y Trabajo Social.
Las reas de la Psicologa y Trabajo Social ms utilizadas son: Psicologa experimental, Psicologa
del aprendizaje, Psicologa educacional, Psicologa social, Psicologa Organizacional etc. Hasta en
la Psicologa clnica que exige un dominio profundo de las tcnicas estadsticas.
Al terminar el curso, el alumno aprender el manejo y la aplicacin de las diversas tcnicas de
anlisis mas utilizadas que puede aplicar al realizar estudios de casos, as como tambin
desarrollara un espritu critico ya que el mismo deducir y decidir cual es la tcnica de anlisis
ideal en una determinada situacin.
Cabe sealar, para llevar a cabo el Curso de Tcnicas Multivariadas de Anlisis, es necesario
contar con una calculadora cientfica y mas que todo con los programas de Microsoft Excel y el
SPSS, para trabajar con las tcnicas y realizar el anlisis de resultados.

Los Autores

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

UNIDAD I
ANLISIS E INTERPRETACIN DE
DATOS
1.
2.
3.
4.
5.
6.

Definicin de de las tcnicas multivariadas de anlisis.


Tipos de tcnicas multivariadas.
Procedimiento previo al anlisis
Diseo y clculos de una tabla de frecuencia
Excel como herramienta para el diseo y clculos de tabla de frecuencias.
Anlisis e interpretacin de representaciones grficas: Histograma de
Frecuencias, Polgono de Frecuencias.
7. Anlisis Porcentual de una muestra a travs de grficos circulares en MS
Excel.

8. Desarrollo de casos y ejercicios aplicativos prcticos.

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

TCNICAS MULTIVARIADAS DE ANLISIS


El anlisis constituye una fase decisiva en cualquier proceso de investigacin. De
lo exhaustivo que seamos en su desarrollo depende la cantidad y la calidad de la
informacin que se extraiga de los datos recogidos en el estudio. Dada la complejidad de
la realidad social, es preciso que el anlisis pase por la exploracin univariable,
bivariable, hasta llegar al conocimiento de las interrelaciones existentes entre los
grupos de variables.
La posibilidad de analizar una, dos o ms variables, al mismo tiempo, se ha
facilitado bastante en los ltimos aos por la mayor accesibilidad de los programas
estadsticos. Pero aunque su manejo es cada vez ms sencillo, se precisa de unos
conocimientos mnimos que garanticen su correcta realizacin e interpretacin.
OBJETIVO:
Facilitar el conocimiento de algunas de las tcnicas de anlisis de uso ms comn
en la investigacin social.
Aplicar, desarrollar e interpretar los resultados del anlisis.
TIPOS DE TCNICAS MULTIVARIANTES:
Entre las tcnicas ms conocidas podemos mencionar:
1. Regresin mltiple.
2. Anlisis discriminante mltiple.
3. Anlisis factorial.
4. Anlisis multivariante de varianza y covarianza.
5. Correlacin cannica.
6. Anlisis cluster.
7. Anlisis multidimensional.
8. Anlisis conjunto.
9. Anlisis de correspondencias.
10. Modelos de probabilidad lineal como logit.
11. Modelos de ecuaciones simultaneas estructurales.
PROCEDIMIENTO PREVIO AL ANLISIS:
El anlisis multivariante es un conjunto de tcnicas de anlisis de datos, en
expansin, sea cual fuera el modelo o la tcnica a usar, siempre debemos realizar los
procedimientos previos al anlisis multivariante, es decir preparar los datos para poder
decidir cual es el modelo que mejor se ajusta a lo que buscamos obtener. Ello implica:
Conocer la muestra y el tamao de la muestra.
Identificar las variables.
Hacer algunos clculos estadsticos descriptivos, como:
1. Frecuencias
2. Representaciones grficas (histogramas y polgonos de frecuencia curva
normal)
3. Medidas de tendencia central (media aritmtica promedio, mediana, moda)
4. Medidas de dispersin (desviacin estndar, varianza)

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

5. Asimetra y Curtosis.
6. Correlacin (relaciones lineales entre variables, diagrama de dispersin,
correlacin entre dos conjuntos de datos agrupados en clases).
7. Regresin lineal simple (correlacin por rangos, coeficiente de correlacin por
rangos, caso de rangos empatados o repetidos).

1. Frecuencia
Ejemplo 1:
Resiliencia:

Es la capacidad que tenemos los seres humanos para


reponernos de las adversidades y lograr una
transformacin positiva, entre los factores que
permiten que se produzca el proceso de resiliencia
encontramos que la mayora de los nios encuentran en
su entorno familiar y en los contextos en los que viven,
las condiciones de proteccin y los modelos que
necesitan para desarrollarse.
En el colegio de nivel primaria Mi mundo mgico se ha
tomado un test a 50 nios (tamao de la muestra n), para determinar la capacidad de
resiliencia, en la tabla se muestran los puntajes obtenidos. Se necesita construir una
tabla de distribucin de frecuencias:
73
10
0
10
4
91
96

10
2
87
11
2
84
10
0

90

9
7
8
5
9
8
8
8
9
6

10
4
90
93
10
4

98
90
10
1
97

10
6
95

10
8
80

93

87

88

98

82

98

94

10
5
84

98

93

82

10
5
82

92

11
4
95

10
3
75

10
1

93

10
0

El siguiente paso es ordenar los datos


7
3
7
5
8
0
8
2
8
2

8
2
8
4
8
4
8
5
8
7

8
7
8
8
8
8
9
0
9
0

9
0
91
9
2
9
3
9
3

9
3
9
3
9
4
9
5
9
5

9
6
9
6
9
7
9
7
9
8

98

98

10
0
10
0
101

98

101

10
0

10
2

98

10
3
10
4
10
4
10
4
10
5

10
5
10
6
10
8
112
114

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Al ordenar los datos podemos distinguir que hay un valor menor o valor mnimo Vmin, que
en nuestro caso es 73, y un valor mayor o valor mximo Vmax, que en nuestro caso es
114, adems vemos que hay datos que se repiten.
Solucin:
1 paso: Cuntas clases o intervalos necesitamos?

k = 1 + 3.3 log n

k = 1 + 3.3 log 50
k = 1 + 3.3 (1.69)
k = 6.58

Luego redondeamos el resultado siempre al entero inmediato superior: k = 7

Con lo que, para este caso entonces, obtenemos 7 intervalos.

2 paso: Verificar si existe algn exceso en la distribucin de datos a realizar y


calcular la amplitud del intervalo.

a) Calculamos el I con la siguiente frmula: I = Valor mximo Valor mnimo + 1


I = 114 73 + 1
I = 42

b) Calculamos la amplitud del intervalo con la formula:


Reemplazando:
C = 42/7

C = I/k

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

C=6

NOTA: si no sale exacto se redondea al entero inmediato superior

c) Calculamos el I con la siguiente frmula: I = C * k


reemplazando:
I = 6 * 7
I = 42

d) Verificamos el exceso con la siguiente frmula: exceso = I I


reemplazando:
exceso = 42 42
exceso = 0
NOTA: de haber un exceso, la mitad entera mayor del exceso, se le suma al valor
mximo de los datos (Vmax), y la mitad entera menor del exceso, se le resta al valor
mnimo de los datos (Vmin).
3 paso: Construir los intervalos.

Vmin + C

73 + 6 = 79
Intervalos
73 79
79 85
85 91
91 97
97 103

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

103 109
109 115

4 paso: Marca de clase.


La marca de clase se obtiene promediando los extremos de cada intervalo.
Para el primer intervalo ser: (73 + 79) / 2 = 76
Para el segundo intervalo ser: (79 + 85) / 2 = 82
Para el tercer intervalo ser: (85 + 91) / 2 = 88

5 paso: Conteo y Frecuencia de los datos.


Intervalos

Marca de clase (xi)

Conteo

Frecuencia (fi)

73 79

76

II

79 85

82

IIIII I

85 91

88

IIIII III

91 97

94

IIIII IIIII I

11

97 103

100

IIIII IIIII III

13

103 109

106

IIIII III

109 115

112

II

2
n = 50

NOTA: la parte del conteo es referencial, a esta tabla se le conoce como tabla de
distribucin de frecuencias absolutas.

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Ejemplo 2:
Inteligencias Mltiples
Luego de una investigacin cognitiva, da fe de la
medida en que los estudiantes poseen diferentes
mentalidades y por ello aprenden, memorizan,
realizan y comprenden de modos diferentes.
Existen suficientes pruebas positivas de que
algunas personas adoptan una aproximacin
lingstica al aprendizaje, mientras que otras
prefieren un rumbo espacial o cuantitativo.
Igualmente algunos estudiantes obtienen mejores
resultados cuando se les pide que manejen smbolos
de clases diversas, mientras que otros estn mejor
capacitados para desplegar su comprensin mediante demostraciones prcticas o a
travs de interacciones con otros individuos.
Todos los seres humanos son capaces de conocer el mundo de siete modos diferentes
.Segn el anlisis de las siete inteligencias todos somos capaces de conocer el mundo de
a travs del lenguaje, del anlisis lgico-matemtico, de la representacin espacial, del
pensamiento musical, del uso del cuerpo para resolver problemas o hacer cosas, de una
comprensin de los dems individuos y de una comprensin de nosotros mismos. Donde
los individuos se diferencian es en la intensidad de estas inteligencias y en las formas en
que recurre a esas mismas inteligencias y se las combina para llevar a cabo diferentes
labores, para solucionar problemas diversos y progresar en distintos mbitos.
La facultad de Psicologa de la universidad Inca Garcilaso de la Vega ha evaluado
mediante un test de inteligencias mltiples a 40 alumnos del tercer ciclo del turno noche
para medir el nivel de desarrollo de la inteligencia intrapersonal, en la tabla se muestran
los puntajes obtenidos:
13
14
16
14
16

16
15
12
17
14

22
14
13
14
13

13
14
17
14
14

14
13
16
13
15

12
14
11
15
15

14
15
15
14
14

15
14
16
13
12

El siguiente paso es ordenar los datos, ya sea en sentido creciente o decreciente:


11
12
12
12
13

13
13
13
13
13

13
14
14
14
14

14
14
14
14
14

14
14
14
14
14

15
15
15
15
15

15
15
16
16
16

16
16
17
17
22

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Al ordenar los datos podemos distinguir que hay un valor menor o valor mnimo Vmin, que
en nuestro caso es 11, y un valor mayor o valor mximo Vmax, que en nuestro caso es 22,
adems vemos que hay datos que se repiten.
Existen tambin relaciones que no se aprecian y para poderlas percibir se clasifican
todos los datos, que en nuestro caso son 40, en grupos o conjuntos llamados intervalos o
clases, para ello realizamos lo siguiente:
1 paso: Cuntas clases o intervalos necesitamos?
Usamos la frmula de sturges
k = 1 + 3.3 log n
Donde: k = nmero de intervalos o clases.
n = nmero de datos (tamao de la muestra)
Reemplazando:
k = 1 + 3.3 log
k = 1 + 3.3 ( )
k =_______
Luego redondeamos el resultado siempre al entero inmediato superior.
k = _______
Con lo que, para este caso entonces, obtenemos 7 intervalos.
2 paso: Verificar si existe algn exceso en la distribucin de datos a realizar y

calcular la amplitud del intervalo.


a) Calculamos el I con la siguiente formula:
I = Valor mximo Valor mnimo + 1
NOTA: se debe sumar el nmero 1 cuando los datos se expresan en nmeros enteros.
Si los datos son decimales, no se suma 1. I = Valor mximo Valor mnimo
Reemplazando:
I = ___________
b) Calculamos la amplitud del intervalo con la formula:
C = I/k
Donde:

C = amplitud del intervalo


Reemplazando:
C = ______

10

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

NOTA: si no sale exacto se redondea al entero inmediato superior.


c) Calculamos el I con la siguiente formula:
I = C * k
Reemplazando:
I = ______

d) Verificamos el exceso con la siguiente formula:


exceso = I I
Reemplazando:
exceso = _______

Para este caso distribuiremos el exceso con + 1 para el Vmax y -1 para el Vmin, y
luego comenzamos a elaborar la matriz de la distribucin de frecuencias.
NOTA: de haber un exceso, la mitad entera mayor del exceso, se le suma al valor
mximo de los datos (Vmax), obteniendo as un nuevo Vmax, el cual se usara en la
construccin del intervalo y la mitad entera menor del exceso, se le resta al valor mnimo
de los datos (Vmin), obteniendo un nuevo Vmin, el cual se usara en la construccin de los
intervalos.
3 paso: Construir los intervalos.
Tomamos el valor mnimo de los datos (Vmin) que para nuestro caso es ___ y le sumamos
la amplitud del intervalo que hallamos anteriormente (C), es decir:
Vmin + C __ + ___ = ___
De este modo obtenemos el primer intervalo: ___ ___
Y as sucesivamente complete la siguiente tabla:
Intervalos
__ __
__ __
__ __
__ __
__ __
__ __
__ __
4 paso: Marca de clase.
Consiste en hacer que cada uno de los datos que se hallan dentro de un mismo intervalo,
estn representados por un mismo valor, esto se denomina marca de clase, las cuales se
obtienen promediando los extremos de cada intervalo.

11

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Para el primer intervalo ser: (___ + ___) / 2 = ___


Para el segundo intervalo ser: (__ + ___) / 2 = ___
Para el tercer intervalo ser: (___+ ___) / 2 = ____
Y as sucesivamente.
5 paso: Conteo y Frecuencia de los datos.
Intervalos

Marca de clase

Conteo

Frecuencia

(xi)

(fi)

n = 40
NOTA: la parte del conteo es referencial, a esta tabla se le conoce como tabla de
distribucin de frecuencias absolutas.

1.1 Frecuencias relativas:


Se obtiene dividiendo la frecuencia absoluta entre el nmero de elementos de la
distribucin.
Se representa
Donde:

f/n

f = frecuencia absoluta.
n = nmero total de elementos (tamao de la muestra).

La suma de todas las frecuencias relativas debe ser igual a 1.


1.2 Frecuencia porcentual:
Es la que se obtiene multiplicando cada frecuencia relativa de la distribucin de
frecuencias por 100, el smbolo que utilizamos para representar este tipo de
frecuencia es: f%.

f% = (f / n) * 100

1.3 Frecuencia acumulada:

12

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Se obtienen sumando sucesivamente las frecuencias absolutas de cada clase, se le


representa con el smbolo F.

1.4 Frecuencias porcentuales acumuladas:


Se obtienen sumando sucesivamente las frecuencias porcentuales de cada clase, se
le representa con el smbolo F%.

Expuesto en el ejemplo anterior, sobre el test tomado a 40 alumnos del tercer ciclo,
se obtuvo la siguiente tabla de distribucin de frecuencias:
Intervalos
10
12
14
16
18
20
22

Frecuencia (fi)
1
10
21
7
0
0
1

12
14
16
18
20
22
24
n = 40

Se pide hallar:
a. Frecuencia relativa.
b. Frecuencia porcentual.
c. Frecuencia acumulada.
d. Frecuencia porcentual acumulada.
Intervalos
10 12
12 14
14 16
16 18
18 20
20 22
22 24

f(i)
1
10
21
7
0
0
1
n = 40

f/n
0,025
0,250
0,525
0,175
0
0
0,025
f/n = 1

f%
2,5
25,0
52,5
17,5
0
0
2,5
f% = 100

F
1
11
32
39
39
39
40

F%
2,5

27,5
80
97,5
97,5
97,5
100

Interpretacin:

Hay 11 alumnos con inteligencia intrapersonal menor a 14 puntos.

13

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Hay 8 alumnos con inteligencia intrapersonal mayor a 16 puntos.

El 27,5% de los alumnos tienen una inteligencia intrapersonal menor a 14


puntos.

El intervalo de 14 a 16 representa el 52,5% de los alumnos.

Ejercicio 1:
Estrs laboral
El estrs laboral se conceptualiza como el conjunto de
fenmenos que se suceden en el organismo del
trabajador con la participacin de los agentes
estresantes lesivos derivados directamente del trabajo
o que con motivo de este, pueden afectar la salud del
trabajador.
La empresa INKA TEXT dedicada al rubro textil ha
evaluado a su personal de la planta ubicada en la ciudad
de Arequipa, donde se midi el nivel de stress a 50
obreros del rea de produccin que est expresado en
porcentajes:
Se necesita construir una tabla de distribucin de
frecuencias
51

61

50

60

45

69

62

54

61

51

54

79

63

43

80

97

64

62

59

54

60

73

70

77

72

54

49

81

52

60

59

65

61

80

64

58

52

43

67

59

60

50

64

90

40

60

65

57

60

60

14

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

MICROSOFT EXCEL - COMO HERRAMIENTA


Barra de ttulo
Barra de mens
Barra de Herramientas

INGRESO DE DATOS
El ingreso de datos por medio del teclado es muy similar al uso de una mquina de
escribir, pero se deben tener en cuenta:
Los datos slo se ingresan en la celda activa.
Excel guardar en la celda el ltimo dato digitado.
FORMULAS
Es la secuencia de valores, referencias de celdas, nombres, funciones u operaciones que
producen un nuevo valor a partir de valores existentes.
Toda formula debe empezar con el signo igual (=), no se digitan espacios en blancos en
las operaciones.

15

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

OPERACIONES ENTRE CELDAS


Permite relacionar contenidos numricos de dos o ms celdas, de tal manera que al
cambiar las cifras que estas contienen, tambin cambian los resultados.
Las operaciones que pueden realizarse son:
Suma
+
Resta
Multiplicacin
*
Divisin
/
Ejemplo: Ingrese el nmero 5 en la celda A1 y el
nmero 3 en la celda B1, a continuacin realice las
operaciones antes mencionadas del siguiente modo:

A
Suma
Resta
Multiplicacin
Divisin

= B1
= B1
= B1
= B1

B
+ C1
- C1
* C1
/ C1

Recuerde que, si tiene que realizar ms de una operacin matemtica en la misma


formula, debe usar parntesis para agrupar las operaciones.
Por ejemplo:
Por ejemplo:
Por ejemplo:

= (B1 + C1) / 2
= (3 * (B1 + C1) / 2) - 10
= (B1 + C1) / 2

REFERENCIA O FIJACIN DE CELDAS


Una referencia identifica una celda o un grupo de celdas en una hoja de trabajo. Las
referencias le dicen a Excel que celdas debe tomar en cuenta para encontrar los valores
que usted us en la frmula. Se da cuando la columna y la fila han sido fijadas.

Fija la celda

Ejm: $E$7
FUNCIONES BSICAS

FUNCION

FORMATO

SUMA

=SUMA(rango de celdas)

MAXIMO

=MAX(rango de celdas)

MINIMO

=MIN(rango de celdas)

DEFINICION
Suma el contenido de las celdas
comprendidas dentro del rango.
Halla el nmero mximo entre el
contenido de las celdas comprendidas
dentro del rango.
Halla el nmero mnimo entre el
contenido de las celdas comprendidas
dentro del rango.

16

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

PRODUCTO

=PRODUCTO(rango de celdas)

LOG

=LOG (celda)

POTENCIA

=POTENCIA(celda, potencia)

CONTAR

=CONTAR(rango de celdas)

SI

=SI(condicin, valor V, valor F)

Multiplica los contenidos de las celdas


comprendidas dentro del rango.
Obtiene el logaritmo de la celda
sealada.
Eleva el contenido de una celda a una
potencia determinada.
Contabiliza slo las celdas que
contienen informacin.
Ejecuta resultados de acuerdo a la
condicin, si se cumple ejecuta el valor
verdadero, de lo contrario ejecuta el
valor falso.

2. Representaciones Grficas
Las representaciones grficas cumplen un rol muy importante, puesto que basta mirar
una grfica para entender con facilidad los cambios en las variables involucradas.
HISTOGRAMAS DE FRECUENCIAS.Para realizar este grfico utilizamos un sistema de coordenadas bidimensionales; se
acostumbra colocar los valores de los intervalos en el eje horizontal y en el eje vertical
se colocan las frecuencias absolutas.
El histograma de frecuencias se representa mediante rectngulos cuyas bases son cada
uno de los intervalos de una distribucin de frecuencias que se encuentran localizadas en
el eje horizontal y cuyas alturas son las respectivas frecuencias absolutas de la tabla de
distribucin.
Ejemplo: con la siguiente tabla de frecuencias:
Intervalos
73 79
79 85
85 91
91 97
97 103
103 109
109 115

Frecuencia (fi)
2
6
8
11
13
8
2

Marca de clase (xi)


76
82
88
94
100
106
112

Realizando el grfico de histograma de frecuencias tenemos:

17

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Histograma de frecuencias
14
12
10

(fi)

8
6
4
2
0
73-79

79-85

85-91

91-97

97-103

103-109

109-115

Intervalos
POLIGONO DE FRECUENCIAS.Procedemos de manera semejante a la realizada por el histograma de frecuencias en lo
que se refiere a la determinacin de la escala vertical y horizontal.
Para este grfico las bases son cada uno de las marcas de clase de la distribucin de
frecuencias, es decir las localizadas en el eje horizontal y las alturas son las respectivas
frecuencias absolutas de la tabla de distribucin.
EJEMPLO: con los datos que realizamos el grafico del histograma, realizamos ahora el
polgono de frecuencias, este grfico suavizado, lo llamamos curva normal.

Polgono de frecuencias
14
12
10

(fi)

8
6
4
2
0
76

82

88

94

Marca de clase

18

100

106

112

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Si suavizamos las lneas del grfico, obtenemos:

Curva normal
14
12
10
8
6
4
2
0
76

82

88

94

100

106

112

GRAFICOS CIRCULARES.Por medio de sectores circulares, tambin se representan las categoras de las variables
cualitativas, que nos muestran el rea, cantidad y/o porcentaje que este representa.
EJEMPLO: con los siguientes resultados:
coeficiente
alto
medio
bajo

personas
10
32
8

Realizamos un grfico circular para apreciar el porcentaje que representa cada uno.

Personas

16%
alto

20%
m edio

64%

GRAFICANDO CON MICROSOFT EXCEL

19

bajo

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

A)

Curso: Tcnicas Multivariadas de Anlisis

Si desea realizar el histograma de frecuencias:

1.-

Crear

la

tabla,

la

distribucin

de

frecuencias con los datos que se desean


graficar.
Por ejemplo:
2.- Seleccione la tabla.
3.- Elegir la pestaa Insertar y el grfico

Intervalos
20
30
30
40
40
50
50
60
60
70
70
80

Frecuencia
(f)
2
4
7
5
3
1

columnas.

4.- En seguida se mostrar el siguiente grfico, el cual debe ser modificado para dar la
forma de un histograma de frecuencias.
90
80
70
60

Intervalos

50
40

30
20
10
0
1

20

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

a) En el primer paso se debe dar un clic derecho sobre el grfico y elegir la opcin:
Seleccionar datos
b) En la ventana emergente se debe quitar todos los elementos del lado izquierdo
excepto la frecuencia que es fi.

c) Y en el lado derecho de la ventana se debe presionar el botn Editar y


seleccionar nuevamente los valores numricos de los intervalos de la tabla. De tal
manera que quede de esta forma:

d)
Visualizar

el

grfico.
e)
Finalmente

si

desea puede mover el grfico a una hoja independiente, dando clic derecho sobre
el grfico seleccionar la opcin Mover grfico.
B)

Si desea realizar el Polgono de frecuencias:

21

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

1.- Crear la tabla, o la distribucin de frecuencias con los datos

Xi
25
35
45
55
65
75

que se desean graficar.


Por ejemplo:

2.- Seleccione la tabla.

f
2
4
7
5
3
1

3.- Elegir la pestaa Insertar y el grfico Lnea.

80
70
60
50

Xi

40

30
20
10
0
1

4.-

En

seguida

se

mostrar el siguiente grfico, el cual debe ser modificado para dar la forma de un
polgono de frecuencias.

a) En el primer paso se debe dar un clic derecho sobre el grfico y elegir la opcin:
Seleccionar datos

22

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

b) En la ventana emergente se debe quitar todos los elementos del lado izquierdo
excepto la frecuencia que es fi.

c) Y en el lado derecho de la ventana se debe presionar el botn Editar y


seleccionar nuevamente los valores numricos de la marca de clase Xi. De tal
manera que quede de esta forma:

23

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Polgono de Frecuencias
8
7
6
5
4
3
2
1
0

d)

25

35

45

55

65

75

Visualizar

el

grfico.

e) Finalmente si desea puede mover el grfico a una hoja independiente, dando clic
derecho sobre el grfico seleccionar la opcin Mover grfico.

UNIDAD II
MEDIDAS DE INVESTIGACIN
1. Clculos de las medidas de tendencia central media aritmtica,
mediana y moda con Excel como herramienta.
2. Medidas de posicin: cuartiles, deciles y percentiles.
24

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3. Mediadas de dispersin: desviacin estndar y varianza.


4. Coeficiente de variabilidad.
5. Desarrollo de casos y ejercicios aplicativos prcticos.

25

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3. Medidas de Tendencia Central


MEDIA ARITMTICA (promedio): es la ms usual de las medidas de concentracin y la
ms conocida. En la prctica se omite la palabra aritmtica y slo se dice: La media.
Para calcular la media de una serie de datos agrupados en clases o intervalos se usa la
siguiente frmula de Excel:

FUNCION
PROMEDIO

FORMATO

DEFINICION

=PROMEDIO(rango de celdas)

Halla el promedio o media aritmtica


de las celdas comprendidas dentro
del rango.

Usos de la Media Aritmtica:


1. La media, se usa cuando se necesita una medida de tendencia central, que no vare
mucho entre una y otra muestra extrada de la misma poblacin, esta es la razn para
preferirla cuando se desea la mxima confiabilidad en la estimacin de la media
poblacional.
2. Tambin se usa la media cuando la distribucin de frecuencias de los datos es
simtrica o tiene poca asimetra, igualmente cuando se aproxima a la distribucin
normal de probabilidades porque esta distribucin es simtrica.
3. Se calcula la media cuando en un estudio tambin se debe calcular la varianza o la
desviacin estndar.
LA MEDIANA: es el punto que divide la distribucin de los datos en dos partes iguales,
por debajo de la mediana estar la mitad del nmero de casos y por encima de ella
estar la otra mitad. La mediana se designa como Md. Utiliza la siguiente frmula en
Excel:

FUNCION
MEDIANA

FORMATO

DEFINICION

=MEDIANA(rango de celdas)

Halla la mediana
dentro del rango.

comprendidas

Usos de la Mediana:
1.- Se prefiere a la mediana como medida de concentracin, cuando en los datos existen
valores extremos muy grandes o muy pequeos, es decir valores muy altos o muy bajos
que obligan a la media aritmtica a desplazarse a la derecha o a la izquierda del punto
medio de la distribucin.
En cambio la mediana seala siempre el punto que divide los datos en dos partes
iguales: 50% a un lado y 50% al otro lado, sin importar donde se halla ese punto.

2.- Cuando simplemente necesitamos conocer si los datos que nos interesan estn dentro
de la mitad superior o inferior de la distribucin de los datos y no tiene importancia
saber particularmente su alejamiento al centro de la distribucin.

26

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

LA MODA: en un conjunto de datos, la moda es el valor ms repetido y se representa


por: Mo. Utiliza la siguiente frmula en Excel:

FUNCION
MODA

FORMATO

DEFINICION
Halla la moda comprendida dentro
del rango.

=MODA(rango de celdas)

Usos de la Moda:
1.- Cuando se necesita una estimacin rpida de la tendencia central.
2.- Cuando se desea conocer el punto de mxima frecuencia en una distribucin
asimtrica de datos, esto es el valor ms repetido de un conjunto de datos.

Medidas de Posicin o Cuantiles


CUANTILES: como una consecuencia del estudio de la mediana, es fcil ampliar este
concepto a otros estadgrafos que dividen a los datos en otras proporciones y no slo en
mitades como lo hace la mediana. Estas medidas se llaman cuantiles. Los cuantiles ms
usados son los cuartiles, deciles y percentiles. Se usan frecuentemente para describir el
comportamiento de una poblacin. Es objetivo de ellas es determinar las medidas de
posicin que no se haya en el centro de la muestra.

Cuartiles.- valores que dividen a un conjunto de datos en 4 partes iguales.


25%

Q1

25%

Q2

25%

Q3

25%

50%
75%
Q1: es el valor que representa de las observaciones.
Q3: es el valor que representa de as observaciones.

FUNCION
CUARTIL

FORMATO

DEFINICION

=CUARTIL(rango de celdas;
n de cuartil)

4. Medidas de Dispersin

27

Halla el nmero de cuartil que se


desee de una muestra

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

DESVIACIN ESTANDAR: es la ms confiable de las medidas de dispersin. Tambin


se le conoce con el nombre de desviacin tpica. Utiliza la siguiente frmula en Excel:

FUNCION

FORMATO

DESVICIN
ESTANDAR

DEFINICION

=DESVEST(rango de celdas)

Halla la desviacin estndar de


una muestra.

VARIANZA: se define como el cuadrado de la desviacin estndar. Para calcular la


varianza, primero se calcula la desviacin estndar. Utiliza la siguiente frmula en Excel:

FUNCION

FORMATO

VARIANZA

DEFINICION

=VAR(rango de celdas)

Halla la varianza de una muestra

EJERCICIOS DE APLICACIN
Ejercicio N 2: La Hiperactividad infantil es un trastorno de
conducta de origen neurolgico. Su incidencia es de un 3% a un
5% de la poblacin infantil. Sucede ms en nios que en nias.
Un 25% de los nios hiperactivos incurren en actos delictivos,
abusan del alcohol, drogas. El principal trastorno de los nios
hiperactivos es el "Dficit de atencin" y no el "Exceso de
actividad motora". El "Dficit de atencin" habitualmente persiste y el "Exceso de
actividad motora" desaparece. No todos los nios hiperactivos mantienen las mismas
caractersticas pero las dificultades de atencin, impulsividad e hiperactividad son
rasgos comunes que presentan todos los nios. En el colegio Reyes Rojos se aplic una
prueba para medir el nivel de hiperactividad de los nios del 4to grado de primaria y los
resultados de las evaluaciones aplicadas, se muestran a continuacin:
64
52
63
63
1.

59
43
87
48

75
67
39
47

36
61
65
53

74
77
72
55

63
68
52
75

81
38
72
59

62
75
50
70

95
69
38
84

82
79
53
95

73
75
82
87

44
66
58
63

69
76
89
43

30
84
73
59

Elaborar la tabla de distribucin de frecuencias, absolutas (fi), relativas (f/n),


porcentuales (f%), acumuladas absolutas (Fi), acumuladas porcentuales (F%) y su
marca de clase (xi). Responder:

a)

Qu porcentaje de nios tuvo un resultado menor a


68?: ..................................
b)
Cuntos nios tuvieron resultados menores a 88?: ................................

28

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

2. Elaborar el Histograma y el Polgono de frecuencias (en otras hojas).


3. Elaborar un grfico circular (en otra hoja) que muestre el nivel de hiperactividad,
sabiendo que el nivel bajo se encuentra de 0 a 45, el nivel moderado de 46 a 70 y las
el alto nivel de 71 a 100. Responder: Qu porcentaje de nios se aprecia en cada
nivel?
..............................................................................................................................................................
..............................................................................................................................................................
..............................................................................................................................................................
4. Hallar:
a. la media (promedio (X)
..
b. la mediana (Me)
....
c. la moda (Mo).

d. la desviacin estndar (S)


e. la varianza (var)

5. Utilizando los cuartiles responda lo siguiente:


a. La cantidad de nios que pertenecen al primer cuartil es: ..
b. La cantidad de nios que pertenecen al tercer cuartil es: ..
Ejercicio N 3: En una entidad bancaria se evalu a su personal de seguridad
para medir su nivel de estrs y los resultados de las evaluaciones aplicadas se
muestran a continuacin:
18
32
39
23

1.

25
46
44
24

26
35
22
27

31
34
26
23

31
38
28
24

30
43
47
25

34
19
30
28

37
25
34
29

42
28
36
29

41
30
36
30

19
46
40
30

26
33
45
29

26
37
20
28

30
35
17
46

Elaborar la tabla de distribucin de frecuencias, absolutas (fi), relativas (f/n),


porcentuales (f%), acumuladas absolutas (Fi), acumuladas porcentuales (F%) y su
marca de clase (xi). Responder:

a) Qu porcentaje del personal de seguridad tuvo un resultado menor a 35?: ..................


b) Cuntos agentes de seguridad tuvieron resultados menores a 45?: ................................
2.

Elaborar el Histograma y el Polgono de frecuencias (en otras hojas).

3.

Elaborar un grfico circular (en otra hoja) que muestre el nivel de estrs, sabiendo
el bajo nivel se encuentra de 0 a 25, el nivel moderado de 26 a 40 y el alto nivel de
41 a 60. Responder: Qu porcentaje del personal de seguridad se aprecia en cada
nivel?

29

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

..............................................................................................................................................................
..............................................................................................................................................................
..............................................................................................................................................................
4.

Hallar:
a. la media (promedio (X)
b. la mediana (Me)
c. la moda (Mo).
d. la desviacin estndar (S)
e. la varianza (var)

..
....

6. Utilizando los cuartiles responda lo siguiente:


a. La cantidad del personal que pertenecen al primer cuartil es: ..
b. La cantidad del personal que pertenecen al tercer cuartil es: ..

VARIABILIDAD RELATIVA O COEFICIENTE DE VARIABILIDAD : este ndice de


dispersin es muy til cuando se quiere comparar la variabilidad entre 2 o ms
distribuciones de datos que sirve para comparar la homogeneidad o heterogeneidad de
diversas muestras que deben tener el mismo tamao. Se calcula con la formula:

Ejemplo 1: Se aplica una misma prueba de evaluacin en un colegio, a 3 secciones: A, B y


C. Con las puntuaciones se calculan los rendimientos medios (promedio) que son:
Seccin A X = 48
Seccin B X = 36.5
Seccin C X = 29.8
Se calculan las dispersiones de los puntajes, obteniendo una desviacin estndar
promedio de 10 puntos, igual para los 3 grupos.
Queremos saber cul de los 3 grupos tiene un rendimiento ms homogneo, es decir con
menos dispersin.

Grupo A:
CV = (10/48) * 100
Grupo B:
CV = (10/36.5) * 100
Grupo C:
CV = (10/29.8) * 100

= 20.83%
= 27.40%
= 33.56%

Respuesta: Concluimos el anlisis, verificando que, el que tiene menor porcentaje de


coeficiente de variabilidad es la seccin A, por lo tanto podemos afirmar que esta
seccin es la ms homognea, ya que su dispersin es menor. Y la seccin C es la ms
heterognea ya que presenta el mayor porcentaje de coeficiente de variabilidad.

30

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Vamos a describir otro ejemplo para el mejor entendimiento de la aplicacin del


coeficiente de variabilidad.
Ejemplo 2: Se aplica una prueba de tolerancia al estrs a los empleados administrativos
de tres sucursales del banco Santander y estos fueron los resultados:
Sucursal
Barranco
Comas
San Isidro

Media Aritmtica
39.6
42.8
36.5

Desviacin estndar
9.23
8.99
9.21

Primero debemos obtener la desviacin estndar promedio de los 3 grupos de


comparacin.
S promedio= (9.23+8.99+9.21)/3
S promedio= 9.14
Ahora con esta desviacin estndar promedio se va a reemplazar en la frmula para cada
uno de los grupos de comparacin:
Grupo Barranco : CV= (9.14/39.6)*100

= 23.08 %

Grupo Comas

= 21.36 %

: CV= (9.14/42.8)*100

Grupo San Isidro : CV= (9.14/36.5)*100 = 25.04 %


Al final podemos concluir que el grupo ms homogneo es el de Comas debido a que su
porcentaje de dispersin de 21.36 % es menor y en contraparte el grupo ms
heterogneo es el de San Isidro ya que su dispersin de 25.04 % es la mayor.

EJERCICIOS DE APLICACIN
Ejercicio N 4: Formar con los alumnos de clase 2 muestras llamadas Grupo 1 y Grupo
2 del mismo tamao y aplicar el Test de inteligencia emocional que el profesor
proporcione. Construir la tabla de frecuencias para cada grupo. Responder a las
siguientes preguntas:
a. En qu intervalo se encuentra el mayor nmero de estudiantes en ambos grupos?
____________________________________________________________
___________________________________________________________
b. Qu porcentaje representa cada uno de ellos?
____________________________________________________________
___________________________________________________________

31

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

c. Cul es el grupo ms homogneo? Por qu?


____________________________________________________________
___________________________________________________________
d. Cul es el grupo ms heterogneo? por qu?
____________________________________________________________
___________________________________________________________

32

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

UNIDAD III
GENERACIN DE CLCULOS Y
ANLISIS DE RESULTADOS
1. Inferencia estadstica para la investigacin
2. SPSS como herramienta de anlisis e interpretacin y entorno de trabajo de
SPSS.
3. Tratamiento de los datos o valores perdidos.
4. Generacin de clculos con la calculadora de SPSS.
5. Transformacin de datos.
6. Recodificacin de variables o segmentacin de rangos.
7. Ordenar y agrupar casos.
8. Desarrollo de casos y ejercicios aplicativos prcticos.

33

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Inferencia estadstica para la investigacin


Es una parte de la estadstica que se ocupa de la estimacin y prueba de hiptesis de los
parmetros desconocidos de una poblacin, en base a la informacin proporcionada por
una muestra aleatoria extrada de dicha poblacin. Las medidas estadsticas son
calculadas con los datos recopilados para una variable proveniente de una poblacin o de
una muestra.
Poblacin (N)
X1
X2
X3
.
.
.
XN

Muestra (n)

s2
p

Parmetros

X1
X2
X3
.
.
.
Xn

Valores Estadsticos

Xi: es una variable subindicada, se utiliza para representar a la variable y sus diferentes
valores observados.
Valores Estadsticos: son medidas estadsticas que se calculan para una variable en
base de los datos provenientes de la muestra. Por ejemplo:
Promedio = 44.5
Mediana me = 60.5 Kg
Desviacin estndar S = 4.5

: La edad promedio
: La mediana del peso de los alumnos
: La variabilidad promedio del rendimiento

Parmetro: son medidas estadsticas que se calculan para una variable en base de los
datos provenientes de una poblacin. Por ejemplo:
Promedio o media
Varianza
Proporcin

: El promedio de la edad
: La varianza de una poblacin

: Proporcin de estudiantes solteros

Observaciones:
o Las medidas estadsticas asumen las mismas unidades de medida de la variable en
estudio.
o Slo pueden ser calculadas para variables cuantitativas a excepcin de la moda que
tambin se calcula para una variable cualitativa.

34

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

o Cuando los datos se muestran en una tabla de frecuencias de una variable continua
(intervalo de clases), entonces las medidas estadsticas calculadas son aproximadas.
Poblacin: es un conjunto de unidades elementales, que poseen caractersticas similares.
Generalmente se describen en trminos de espacio y tiempo. Ejemplo: Los alumnos
egresados de la universidad Inca Garcilaso de la Vega.
Muestra: es un subconjunto de la poblacin, se especfica como un tamao de la muestra.
Ejemplo: 50 alumnos egresados tomados aleatoriamente.
Unidad elemental: es un elemento de la poblacin a la cual se le va a registrar un
conjunto de variables. Ejemplo: Un alumno egresado.
Variables: son caractersticas que se registran de las unidades elementales de una
muestra o una poblacin. Las variables pueden ser definidas como:
Variables Cuantitativas que indican cantidad o nmero, por ejemplo:
o Rendimiento
: 15
o Edad
: 40 aos
o Peso
: 72 Kg.
Variables Cualitativas que indican un atributo o categora, por ejemplo:
o Sexo
: Femenino
o Estado civil
: Soltero
o Ocupacin
: Psiclogo

Poblacin

Muestra

35

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

SPSS - COMO HERRAMIENTA DE ANALISIS


VISORES
El SPSS maneja 2 visores:
Vista de datos
Vista de variables
AREA DE TRABAJO
Las celdas son repositorios de datos, NO SE HACEN FORMULAS COMO EN EXCEL.
LA caracterstica principal del entorno de trabajo es que se basa en el principio de la
rectangularidad, es decir que los datos siempre van ha tender a formar un rectngulo.
DEFINICIN DE VARIABLES
Para definir variables se usa el visor Vista de variables.
En este visor, en las filas estn las variables y las columnas representan las propiedades
de cada variable.
Propiedades de una variable:
1. Nombre: (nombre de la variable)
Restricciones:
No acepta espacios vacos, por ejemplo (apellido paterno).
No acepta como primer carcter un nmero, por ejemplo (1apellido).
No acepta palabras reservadas, por ejemplo (operadores lgicos AND, OR,
NOT, etc).
No acepta caracteres especiales, por ejemplo (%, +, -, /, *, @, etc)
2. Tipo: (tipo de dato de la variable)
Ancho (ancho o tamao total)
Decimal (cantidad de decimales)
3. Etiqueta:
Se usa para ingresar texto explicativo a la caracterstica de la variable.
Por ejemplo: Nombre: Sueldo y Etiqueta: Sueldo semanal.
4. Valores:
Se codifican las variables cualitativas.
Por ejemplo: Sexo, puede ser femenino (F) y masculino (M), pero para
anlisis es necesario manejarlos como datos tipo numero, por lo tanto se le
valores de dicho tipo, como: F0 y a M 1.
As podemos codificar variables cualitativas a un contexto numrico.
5. Perdidos: (valores perdidos)
Define los valores perdidos definidos por el usuario.
Por ejemplo: si tenemos registrado las siguientes edades:
20 27 28 200 18 300 15
Apreciamos que hay 2 edades que no tienen lgica, con los cuales se debe
haber cometido algn error, pero la solucin no es arreglarlo a lo que nos
parece pudo haber sido, sino, lo correcto es obviarlos del anlisis y
declararlo como valor perdido, para ello recurrimos al Missing, aqu
podemos definir o registrar:

36

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

b) Hasta 3 valores discretos (es decir hasta 3 valores sueltos).


200

300

c) Un intervalo continuo y un valor discreto.


Low

100

Hig 500

Discreto

52

6. Columnas: (columna)
Indica el ancho de la columna en la Vista de datos.
7. Alineacin: (alineacin)
Es la alineacin del dato dentro de la celda (Izquierda, Centro y Derecha).
8. Medida: (medida)
Indica el tipo de medida estadstica que emplear ese dato:
a). Nominal: para variables que tendrn valores cualitativos, estos para poder ser
medidos (measure) deben ser de tipo nominal. Por ejemplo: el estado civil (soltero,
casado, viudo), el sexo (masculino, femenino).

b). Ordinal: para variables cuyo valor representa algn orden o posicin en
particular. Por ejemplo: el grado de instruccin (primaria, secundaria,
superior, post grado), etapas (nio, joven, adulto).
c). Escala: para variables cuyo valor es netamente cuantitativas, representan
valores del tipo, netamente numricos. Por ejemplo: la edad (15, 28, 37),
los sueldos (1500, 2100, 845, etc).
INGRESO DE DATOS
Una vez que se definieron las variables en el visor Variable, pasamos al visor Data, en
este lugar, notamos que aparece en las columnas, las variables registradas o
declaradas

anteriormente,

comenzamos

entonces

digitar

los

valores

correspondientes a cada una de ellas.


GENERANDO TABLAS DE FRECUENCIAS
1. Men Analizar.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y psela a la columna de seleccionados.
5. Presione Aceptar.
CALCULOS DE MEDIDAS DE TENDENCIA CENTRAL
1.

Men Analizar.

2.

Estadsticos descriptivos.

3.

Frecuencias

4.

Seleccione la variable y pasarla a la siguiente columna (estas variables


aparecen listadas por etiqueta, para cambiarlas a listadas por nombre, hacer lo
siguiente:

37

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

En el men Edicin, seleccione Opciones, en la ficha General en Lista de variables


cambiar de Mostrar etiquetas a Mostrar nombres, presionar Aceptar, en la siguiente
ventana vuelva a presionar Aceptar y listo.
5.

En la parte inferior de la ventana hay 3 botones, presionar el botn


Estadsticos.

6.

Activar el check en Media si desea calcular el promedio o media


aritmtica.
Si desea calcular la mediana, active:
Si desea calcular la moda, active:

7.

Luego presione Aceptar.

8.

Vuelva a presionar Aceptar.

GENERACIN DE GRAFICOS
1.
Men Analizar.
2.

Estadsticos descriptivos.

3.

Frecuencias.

4.

Seleccione y pase la variable.

5.

Presione el botn grficos ubicado en la parte inferior de la ventana, ah puede


seleccionar:
Grficos de barras.
Grfico de sectores.
Histograma.
Con curva normal.

6.

Luego presione Aceptar.

7.

Vuelva a presionar Aceptar.

EJERCICIO A:
Se realizo una encuesta tomando una muestra aleatoria de las familias
del nivel socioeconmico B. La variable de medicin es el nmero de
personas fumadoras por familia. Los resultados fueron los siguientes:
2
2
2
3
1

1
3
2
2
3

2
2
1
3
4

2
1
2
1
3

1
1
1
2
2

2
1
1
4
2

4
3
1
2
2

2
4
3
1
1

1
2
2
4
3

1) Generar la tabla de distribucin de frecuencias.


2) Generar los siguientes grficos:
Histograma de frecuencias con curva normal.

38

1
2
2
1
3

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Grfico sectores.

Variable:
Nombre: num_fumadores.
Tipo: numrico.
Etiqueta: numero de fumadores.
Valores: ninguno.
Perdidos: ninguno.
Columnas: 12.
Alineacin: centrado.
Medida: escala.
EJERCICIO B:
En un estudio de investigacin sobre como el estado civil
influye en el rendimiento acadmico de los alumnos
universitarios, debido a que sus responsabilidades en el
hogar o problemas familiares no permiten un optimo
desempeo acadmico. Para el estudio se describe que la
muestra est compuesta por alumnos de universidades
privadas y nacionales. Se debe cuantificar para el estudio
estadstico el estado civil y el nivel educativo. Se
obtuvieron los siguientes resultados:
Cod_encuesta
A1
A2
A3
A4
A5
A6
A7
A8
A9

Estado_civil
Soltero
Casado
Soltero
Soltero
Divorciado
Casado
Soltero
Viudo
Casado

Nivel_educativo
Superior
Secundaria
Postgrado
Superior
Secundaria
Postgrado
Superior
Postgrado
Superior

Declarando variables:

1) Nombre

:
Tipo
:
Etiqueta :
Valores

39

Edad
27
32
22
28
32
37
31
42
19

Pensin
3500
400
750
1500
300
500
2000
500
1000

Universidad
Privada
Nacional
Nacional
Privada
Nacional
Nacional
Privada
Nacional
Privada

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Perdidos :
Columnas :
Alineacin :
Medida :

2) Nombre

:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :

3) Nombre

:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :

4) Nombre

:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :

5) Nombre

:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :

6) Nombre
Tipo

:
:

40

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
Realizar las siguientes actividades:

Generar la tabla de frecuencias de las variables Estado civil, Nivel educativo, Edad y
Pensin.
Generar el histograma de las mismas variables.
Mostrar la media, mediana y moda de cada una de ellas.

TRATAMIENTO DE LOS DATOS O VALORES PERDIDOS


EJERCICIO C: sean los datos:
Nro_encuesta
Estado_civil
Nivel_educativo
1
Soltero
Universidad
2
Casado
Secundaria
3
Soltero
Universidad
4
Casado
Secundaria
5
Viudo
Post grado
6
Casado
Universidad
7
Soltero
Universidad
8
No responde
Secundaria
9
Casado
Universidad
10
Soltero
Primaria
1) En las variables Estado_civil y edad, defina valores perdidos.

Edad
25
20
40
250
51
39
35
23
24
18

2) Mediante estadsticos descriptivos, obtener la edad promedio y responder Cul es el


efecto de registrar el valore perdido?
Solucin:

Parte 1)

Declarar las variables como lo realizo en los ejercicios anteriores.

En la variable Estado_civil, declare todo normalmente, pero:


En su columna Valores, registrar tambin el No responde, es decir:
1 = soltero.
2 = casado.
3 = viudo.

41

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

4 = no responde.
Y en su columna Perdidos registrar el 4 (ya que es el valor perdido).
En la variable Edad, declare todo normalmente, pero:
En su columna Perdidos registrar el 250 (ya que es el valor perdido).
Parte 2)

Calcule el promedio, o la media de las edades, como se indico en el tema Clculos


de medida de tendencia central en SPSS, analice el resultado y responde a la
pregunta planteada.

Rpta: ...................................................................................................................................................
..............................................................................................................................................................
.
OTROS ANLISIS:
a)
El promedio de las edades considerando como valor perdido el 250 es
= ....................
b)
Suponiendo que asumimos que hubo un error de digitacin y la edad 250 es
25 (es decir lo corregimos), calculamos nuevamente el promedio de las edades y
obtenemos como media = .....................
c)
Si no declaramos valores perdidos, nuestra media ser = ..................
Observacin: ...........................................................................................................................................
APLICANDO SPSS
TRANSFORMANDO DATOS (Men Transformar)
Transformar, contiene funciones y procedimientos modulares que permiten la
manipulacin y modificacin de los datos.
La opcin Calcular variable, permite realizar clculos y operaciones en las variables,
obteniendo nuevas variables.
Ejemplo: Si tenemos los siguientes datos
Peso
Talla
58,5
1,45
63,2
1,67
70,8
1,55
Y necesitamos hallar el ndice de masa corporal (Imc) de cada uno, para lo cual sabemos
que:

Imc = peso / talla

Podemos con la opcin Calcular variable, realizar dicho calculo (colocando la formula
correspondiente) y automticamente nos generara una nueva variable Imc, con los
resultados respectivos.
Peso
58,5
63,2

Talla
1,45
1,67

42

Imc
40,34
37,84

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

70,8

Curso: Tcnicas Multivariadas de Anlisis

1,55

45,67

La ventana del Calcular variable, se presenta as:

Variable destino:
Aqu, se coloca el nombre que llevara la nueva columna, es decir la nueva variable que se
generara con la formula, funcin u otros que aplique.

Tipo y etiqueta:
Aqu, se coloca el tipo de dato que tendr la nueva variable y en Etiqueta o etiqueta, se
coloca la referencia o nombre completo de la variable.
Expresiones numricas:
Aqu, se digitan las formulas, u operaciones a realizar; el resultado se mostrar en la
variable que declaro en el sector correspondiente.
Calculadora del SPSS:
A)
Operadores aritmticos (+, -, *, /, ** (potencia)).
B)
Operadores de comparacin (<, >, <=, >=, =, ~= (diferente)).
C)
Operadores lgicos (& (y), | (o), ~(negacin)).
D)
Operador de asociacin ( ).
E)
Teclado numrico.
Lista de funciones del SPSS:
SPSS tiene ms de 70 funciones, por ejemplo Mean (media), pero esta funcin calcula el
promedio de una fila, mas no el promedio de la muestra.
Si lo que desea es el promedio muestral, debe realizar los clculos como se indica en los
Clculos de medidas de tendencia central.

43

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

El botn Si la opcin:
Permite ingresar al mdulo donde se define las condiciones.

EJERCICIO D:
Registrar los siguientes datos:
Nombre
Practica_1
Practica_2
Practica_3
Ex_final
Jose
18
12
17
16
Carla
14
9
16
10
Beto
7
14
12
12
Pedro
11
8
10
12
Obtener las columnas, o nuevas variables:
a) Promedio de prcticas (pp).
b) Nota final (nf)
Donde: pp = (practica_1 + practica_2 + practica_3) / 3
nf = (pp + 2 * ex_final) / 3
Solucin a):
1. Men transformar.
2. Calcular variable.
3. En Variable destino (Target Variable), colocar pp.
4. En Tipo etiqueta, colocar en Tipo: numrico, y en Etiqueta: promedio de practicas.
5. En expresiones numricas, digitar: (practica_1 + practica_2 + practica_3) / 3
6. Presionar Aceptar.
Solucin b):
1.
Men transformar.
2.
Calcular variable.
3.
Presionar el botn Restablecer, para que se borren todos los
datos y poder registrar los nuevos valores.
4.
En Variable destino, colocar nf.
5.
En Tipo etiqueta, colocar en Tipo: numrico, y en Etiqueta: nota
final.
6.
En expresiones numricas, digitar: (pp + (2 * ex_final)) / 3
7.
Presionar Aceptar.
EJERCICIO E:
Usando la tabla del ejercicio anterior, se desea obtener la variable X cuyo valor ser la
desviacin de la variable ex_final respecto a su media, y la variable Y, cuyo valor ser el
cuadrado de dichas desviaciones obtenidas.
Solucin para hallar la variable X:
1.
Calcular la media de la variable ex_final.
Men Anlisis.
Estadsticos descriptivos.

44

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

2.
3.
4.
5.
6.
7.

8.

Curso: Tcnicas Multivariadas de Anlisis

Frecuencias.
Seleccionamos y pasamos la variable ex_final.
Presionamos el botn estadsticos.
En la ventana que aparece, marcamos Media.
Presionamos Aceptar.
Volvemos a presionar Aceptar.
En los resultamos que se muestran, apuntar, el valor que se obtuvo como
media.
Men transformar.
Calcular variable.
Presionar el botn Restablecer, para que se borren todos los
datos y poder registrar los nuevos valores.
En Variable destino colocar X.
En Tipo etiqueta colocar en Tipo: numrico, y en Etiqueta:
desviacin.
En expresiones numricas, calculamos la diferencia (resta) del
ex_final menos su media (que acabamos de hallar), esto nos indicar cuanto se
aleja la nota del ex_final de su respectiva media, es decir digitamos: ex_final
media.
Presionar Aceptar.

Solucin para hallar la variable Y:


1.
Men transformar.
2.
Calcular variable.
3.
Presionar el botn Restablecer.
4.
En Variable destino colocar Y.
5.
En Tipo etiqueta, colocar en Tipo: numrico, y en Etiqueta:
desviacin al cuadrado.
6.
En expresiones numricas, calculamos el cuadrado de la
diferencia o resta anterior que hallamos, es decir digitamos: (ex_final media)
** 2 , o tambin podemos colocar: X ** 2.
7.
Presionar Aceptar.
EJERCICIO F:
Usando la tabla del ejercicio anterior, calcular el pp1 (promedio de prcticas) pero
usando Funciones.
Solucin:
1.
Men transformar.
2.
Calcular variable.
3.
Presionar el botn Restablecer.
4.
En Variable destino, colocar pp1.
5.
En Tipo etiqueta, colocar en Tipo: numrico, y en Etiqueta: nuevo
promedio de practicas.
6.
En la lista de funciones buscamos la funcin Mean (practica_1,
practica_2, practica_3)

45

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

7.
Presionar Aceptar.
NOTA: como ya se menciono anteriormente, Mean como funcin, calcula el promedio de
las filas de datos, mas no de las columnas. En cambio el Media que se obtiene de las
frecuencias, si es el promedio de columnas.
RECODIFICACION DE VARIABLES (Segmentacin en rangos)
Permite establecer cdigos a criterios en particular del analista, con propsitos
especficos.

Por ejemplo: Se tiene la variable edad; esta variable se puede segmentar en estratos,
tomando un criterio en particular, es decir puede ser:
Edades: 8, 9, 9, 10, 12, 14, 16, 21, 21, 22, 23, 25, 27, 28, 30, 30, 32, 34

Los podemos segmentar en 3 estratos


Nuestros rangos quedaran del siguiente modo:
Edades
Desde la edad mas baja hasta 14
15 25
26 mas

Cdigo
1
2
3

Una vez definida la variable cdigo, esta pude asumir valores, si el analista lo desea, por
ejemplo, en vez que figure 1,2,3 puede colocar niveles o etapas, donde 1=nio, 2=joven,
3=adulto:
Edades
Nivel
Desde la edad mas baja hasta 14
Nio
15 25
Joven
26 mas
Adulto
EJERCICIO G:
Registrar los siguientes datos:
Nombre
Turno
Sueldo
Fernando
Maana
500
Carlos
Noche
1500
Pedro
Noche
780
Vanessa
Maana
850
Alicia
Maana
980
Dora
Noche
955
Augusto
Maana
1200
Recodificar la variable sueldo en una nueva variable llamada Rango_sueldo, del siguiente
modo:
Sueldo
Rango
Desde el sueldo mas bajo hasta 800
1
801 1000
2

46

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

1001 mas

Solucin:
1. Menu transformar.
2. Seleccione Recodificar en distintas variables.
3. En la ventana que se muestra, seleccionar la variable a segmentar, en este caso es
la variable Sueldo y agregarla al siguiente cuadro.
4. En Variable de resultado
Se coloca el nombre a la nueva variable, la cual tendr los rangos del sueldo.
Nombre
Rango_sueldo
5. Presionar el botn Cambiar.
6. Presionar el botn Valores antiguos y nuevos.
7. Marcar:
Rango, INFERIOR hasta valor:

800

8. En la opcin Valor colocar el cdigo que representara el primer rango:

9. Presionar el botn Aadir


10. Marcar:
Rango:

801

hasta

1000
2

11. En la opcin Valor colocar el cdigo que representara el segundo rango:


12. Presionar el botn Aadir
13. Marcar:
Rango, valor hasta SUPERIOR:

1001

14. En la opcin Valor colocar el cdigo que representara el tercer rango:

15. Presionar el botn Aadir


16. Presionar el botn Continuar
17. Presionar Aceptar.
NOTA: si desea establecer mas de 3 rangos, deber repetir los pasos del 11 al 13
cuantas veces sea necesario.

47

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Si ahora desea que los rangos obtenidos con cdigos (1,2 y 3) cambien a Valores por
ejemplo: 1=bajo, 2=medio, 3=alto, debe modificar en la ficha Vista de Variables, los
Valores correspondientes a la nueva variable obtenida, rango_sueldo.
EJERCICIO H:
Registrar los siguientes datos:
Cdigo
Nive_Social

Nro_Hijos

A01
A02
A03
A04
A05
A06

2
4
3
1
1
5

A
C
B
A
B
C

Ingreso_familia
r
2500
800
1200
3500
1500
600

Considerar la variable ingreso familiar, para establecer 4 segmentos en una nueva


variable llamada Rango_ingreso.
Ingresos
Rango
Desde el ingreso mas bajo hasta 1000
1
1001 2000
2
2001 3000
3
3001 mas
4
Luego asigne los siguientes Valores: 1=deficiente, 2=bajo, 3=regular, 4=bueno.

EJERCICIO I:
Registrar los siguientes datos:
Cdigo
Sexo
Talla
Peso
1
Femenino
1.59
50
2
Masculino
1.60
65
3
Masculino
1.43
45
4
Femenino
1.33
37
5
Femenino
1.70
65
6
Masculino
1.65
70
7
Femenino
1.74
68
8
Femenino
1.62
55
9
Femenino
1.55
67
Considerar la variable Talla, para establecer 2 segmentos en una nueva variable llamada
Rango_Talla (considere usted cuales son los valores que tomara cada uno de los rangos).

48

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Y considerar la variable Peso para establecer el numero de segmentos que usted


considere conveniente, junto con los valores que usted vea adecuados manejar por cada
rango, esto ser en una nueva variable llamada Rango_Peso.
Luego asigne Values correspondientes a los valores obtenidos, tanto en Talla, como en
Peso.
ORDENAR CASOS
Para ordenar los datos por alguna variable en particular, por ejemplo, si de todos los
datos registrados, desea que estos aparezcan ordenados por edad, realice lo siguiente:
1.
Men Datos.
2.
Seleccionar la opcin Ordenar casos
3.
Seleccionamos y pasamos el dato o variable a ordenar.
4.
Presionamos Aceptar.
AGRUPAR CASOS O AGREGAR DATOS
Consiste en agrupar, varios casos en uno solo y obteniendo algn resultado en particular.
Por ejemplo:
Si tenemos los siguientes datos:
Ciclo
Edad
I
21
I
19
II
29
II
20
II
22
Se desea: Por cada ciclo, mostrar el promedio de edades.
El resultado debe ser:
Ciclo
I
II

Prom_eda
d
20
24

Num_afectad
os
2
3

Solucin:
1.
Menu Datos.
2.
Seleccionar Agregar.
3.
En la ventana, seleccionar la variable a agrupar, que en este caso es Ciclo y la
pasamos a la seccin: Variables de segmentacin.
4.
Seleccionamos ahora, el dato a calcular de la primera columna, y la agregamos a la
seccin: Variables agregadas, sobre este dato se realizarn los clculos. Para
nuestro ejercicio ser la variable Edad.
5.
Presionamos el botn Funcin para seleccionar la funcin a aplicar, mrquela y
presione el botn Continuar. Nosotros seleccionaremos de la lista de funciones
Media.
6.
Marque: Nmero de casos: (Guardar el nmero de casos de la variable agrupada
en la variable:)

49

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Se coloca en el recuadro un nombre a la variable que registrara el nmero de


afectados. Num_afectados
7.
Por defecto el resultado se graba en otro archivo llamado aggr.sav, pero si desea
cambiar este nombre, presione el botn Archivo y puede indicar el lugar donde lo
guardar, adems de cambiar el nombre de dicho archivo, y presione el botn
Guardar. Nosotros lo guardaremos en el escritorio con el nombre
Grupo_ciclo_promedad.
8.
Presione el botn Aceptar.
9.
Puede abrir su archivo para ver el resultado obtenido.
EJERCICIO J:
Sea el archivo de datos:
Cdigo
Sexo
Area
A
Femenino
Logstica
B
Masculino
Sistemas
C
Femenino
Contabilidad
D
Masculino
Logstica
E
Femenino
Sistemas
F
Masculino
Contabilidad
G
Femenino
Logstica
Calcule:
a)
Sueldo total por sexo. Gurdelo
grupo_sex_totsueldo.
b)
Sueldo total por area. Gurdelo
grupo_area_totsueldo.
c)
Mximo sueldo por sexo. Gurdelo
grupo_sex_maxs.
d)
Mximo sueldo por area. Gurdelo
grupo_area_maxs.

Sueldo
2500
3500
1500
500
1200
800
600
en

el escritorio

como:

en

el

como:

escritorio

en el escritorio como:
en el escritorio como:

EJERCICIO K:
Considerando el archivo de datos del EJERCICIO I, calcule lo siguiente:
a) Talla mxima por sexo.
b) Peso mnimo por sexo.
c) Promedio de tallas por sexo.
EJERCICIO L:
En un estudio de investigacin sobre cmo el cargo influye en el elevado nivel de estrs
laboral de los trabajadores, debido a que la cantidad de tareas a realizar en las
diferentes reas no permiten un ptimo desempeo laboral. Para el estudio se describe
que la muestra est compuesta por trabajadores de diferentes sexos. Las notas

50

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

obtenidas en la evaluacin van de 0 a 20. Se debe cuantificar para el


estudio estadstico el cargo y la religin profesada.
Se obtuvieron los siguientes resultados:

Cdigo
TA1
TA2
TA3
TA4
TA5
TA6
TA7
TA8
TA9

Cargo
Administrativo
Obrero
Administrativo
Administrativo
Obrero
Obrero
Administrativo
No responde
Obrero

Religin profesada

Edad

catlica
evanglica
catlica
evanglica
catlica
evanglica
catlica
evanglica
No responde

27
32
22
38
32
37
31
142
19

Declarando variables:
1) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
2) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :

3) Nombre :
Tipo
:
Etiqueta :
Valores

51

Notas de
evaluacin
18
12
9
4
32
12
20
10
15

Sexo
Femenino
Masculino
Femenino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Perdidos :
Columnas :
Alineacin :
Medida :
4) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
5) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
6) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
Realizar las siguientes actividades:

Se debe calcular la nueva nota del trabajador sabiendo que todos han recibido un
punto adicional sobre su evaluacin.

Se desea saber cuntos aos tenan los trabajadores hace 3 aos.

Debe segmentar la variable Notas de evaluacin:


Notas de evaluacin:
Desde nota ms bajo hasta 10

52

Cdigo
1

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

11 16
17 mas
Donde 1 es Desaprobado, 2 es Regular y 3 Sobresaliente

2
3

Debe segmentar la variable Edad:


Notas de evaluacin:
Cdigo
Desde edad ms baja hasta 20
1
21 36
2
37 mas
3
Donde 1 es Sin experiencia, 2 Poca experiencia y 3 Experto

Mostar: notas totales por cargo. Gurdelo como: grupo_car_totnotas.


Mostar: edad total por religin. Gurdelo como: grupo_rel_totedad.
Mxima nota por cargo. Gurdelo como: grupo_car_maxnot.
Mnima edad por religin. Gurdelo como: grupo_rel_minedad.

53

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

UNIDAD IV
TCNICAS DE ANLISIS
MULTIVARIADAS
1.
2.
3.
4.
5.
6.

Introduccin a las tcnicas multivariadas


Anlisis de Regresin.
Anlisis de Regresin Mltiple.
Anova de un Factor.
Anlisis Factorial.
Desarrollo de casos y ejercicios aplicativos prcticos.

54

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Tcnicas Multivariadas de Anlisis


Las aplicaciones de la estadstica multivariada estn presentes en distintas reas o
ramas de la ciencias, como por ejemplo en: Investigacin de mercados (para
identificar caractersticas de los individuos con el propsito de determinar qu tipo
de personas compran determinado producto); en el sistema de educacin de cualquier
tipo de especialidad (para conocer los estudiantes que tendrn xito y concluirn
satisfactoriamente sus estudios); en la agricultura (al estudiar la resistencia de
determinado tipo de cosechas a daos por plagas y sequas); en el deporte (para
conocer a partir de medidas antropomtricas las posibilidades de obtener buenos
resultados en un deporte especfico); en la psicologa (al estudiar la relacin entre el
comportamiento de adolescentes y actitudes de los padres); en la economa (para
conocer el nivel de desarrollo de un territorio en relacin con otros y realizar
inferencias a partir de variables econmicas fundamentales, entre otros).
Los datos multivariados surgen cuando a un mismo individuo se le mide ms de una
caracterstica de inters. Un individuo puede ser un objeto o concepto que se puede
medir. Ms generalmente, los individuos son llamados unidades experimentales.
Ejemplos de objetos: personas, animales, terrenos, compaas, pases, etc. Ejemplos
de conceptos: amor, amistad, noviazgo, etc. Una variable es una caracterstica o
atributo que se le mide a un individuo.
Objetivos de las tcnicas multivariadas:
1) Simplificacin: Los mtodos multivariados son un conjunto de tcnicas que
permiten al investigador interpretar y visualizar conjuntos grandes de datos (tanto
en individuos como en variables), a partir de su simplificacin o reduccin.
2) Relacin: Encontrar relaciones entre variables, entre individuos y entre ambos.
2.1) Relacin entre variables: Existe relacin entre variables cuando las mismas
miden caractersticas comunes.
Ejemplo: Suponga que se realizan exmenes de espaol, matemtica e historia a
estudiantes de secundaria, seleccionados en las entidades educativas del pas, para el
ingreso en la carrera de licenciatura en turismo. Si cada uno de los estudiantes
obtiene calificaciones altas, regulares o bajas en los tres exmenes, entonces los
exmenes estaran relacionados entre s. En este caso, la caracterstica comn que
estos exmenes pueden estar midiendo podra ser la "inteligencia general" que les
permita comenzar esa carrera universitaria.

55

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

2.2) Relacin entre individuos: Existe relacin entre individuos si alguno de ellos son
semejantes entre s.
Ejemplo: Suponga que se evalan diferentes tipos de cervezas respecto a su nivel de
aceptacin y se miden, por ejemplo, los consumos de las mismas para diferentes
grupos de edades, se podra esperar que las cervezas claras y oscuras tengan algn
tipo de relacin, o que los tipos de cervezas sean totalmente diferentes.

En los mtodos multivariados, se supone que las variables estn correlacionadas, pero
las observaciones sobre los individuos son independientes. Generalmente se supone
tambin que el conjunto de variables que intervienen en el anlisis poseen una
distribucin normal multivariada. Esta suposicin permite que el anlisis multivariado
se desarrolle paralelamente al correspondiente anlisis univariado basado en una
distribucin normal.
Clasificacin de los mtodos multivariados:
1) Dirigidas o motivadas por las variables: se enfocan en las relaciones entre
variables. Ejemplos: matrices de correlacin, anlisis de componentes principales,
anlisis de factores y anlisis de regresin.
2) Dirigidas o motivadas por los individuos: se enfocan en las relaciones entre
individuos. Ejemplos: anlisis discriminante, anlisis de conglomerados y anlisis
multivariado de varianza.

56

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

ANLISIS DE REGRESIN
Sean 2 variables, en las cuales una depende de la otra.
x variable independiente.
y variable dependiente.
y

y = A + Bx

x
Se trata de encontrar el comportamiento de estos puntos y acomodarlo a una forma
matemtica (ecuacin), lo que llamamos modelo. Esa forma puede ser una recta, una
curva, etc. (cada una de ellas tiene su propia ecuacin matemtica).
La distancia de cada punto a la recta es el error, los puntos que caen en la misma recta
no tienen error, la idea es minimizar esos errores.
El Principio del Anlisis de Regresin es:

Si tengo observaciones y minimizo los errores, por ende me acerco a la verdad


Modelo General:

y = A + Bx
y = A + Bx + E

Modelo de Regresin Lineal Ajustado:

= a + bx

Aplicacin:
Sean las variables:
Presin
30
31
32
33
34
35
36

Millas
29,5
32,1
36,3
38,2
37,7
33,6
26,8

Donde:
Presin: esta en lb/pulg2 (libras por pulgada al cuadrado), que es la presin aplicada a los
neumticos de un auto.

57

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Millas: es el nmero de millas recorridas.


Es posible encontrar un modelo ajustado?
Pasos a seguir para la aplicacin del Anlisis de Regresin
1) Identificar cual es la variable independiente y cual es la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Nosotros, podemos aumentar o disminuir la Presin a los neumticos en el momento que
lo deseemos, es decir, la presin es una variable independiente porque no depende de
ningn factor en particular, para que este aumente o disminuya. Sin embargo, el
nmero de millas recorridas, depende de la presin aplicada a los neumticos, ya que, si
la presin aumenta mucho, el rendimiento de las millas disminuye, en cambio, cuando la
presin de los neumticos tiene una cantidad adecuada, el rendimiento en millas es
mejor. Podemos decir entonces que: la presin en los neumticos influyen en la
cantidad de millas a recorrer.
Por lo tanto, con el anlisis realizado, podemos identificar:
Presin variable independiente.
Millas variable dependiente.
2) Realizar un anlisis exploratorio: En el anlisis exploratorio, no existe una secuencia
fija; aqu, lo ideal es realizar varios grficos, como para ver el comportamiento de las
variables, y visualizar la forma.
Puede realizar lo siguiente:
1.
2.
3.
4.

Men Grficos.
Seleccionar cuadro de dilogos antiguos
Seleccionar la opcin Lneas
Seleccionar Simple, marcar la opcin Resmenes para grupo de casos y presionar
el botn Definir.
5. Seleccionar la variable independiente y pasarla a Eje de categoras.
6. Seleccionar la variable dependiente, marcar la opcin: Otro estadstico y agregar
la variable.
7. Presionar Aceptar.

58

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Tambin puede realizar un grafico tipo dispersin del siguiente modo:


1.
2.
3.
4.

Men Grficos.
Seleccionar cuadro de dilogos antiguos
Seleccionar la opcin Lneas
Seleccionar Lneas verticales, marcar la opcin: Resmenes para distintas
variables y presionar el botn Definir.
5. Seleccionar la variable independiente y pasarla a Eje de categoras.
6. Seleccionar la variable dependiente y pasarla a Los puntos representan, luego
vuelva a aadirla, es decir debe aadir la variable dependiente 2 veces. (Tambin
puede probar otro grafico aadiendo en este punto, ambas variables tanto la
dependiente como la independiente).
7. Presionar Aceptar.

Puede realizar muchos ms grficos de distintos tipos para que visualice el


comportamiento de las variables.

59

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Anlisis inicial: Ante los resultados de ambos grficos se puede especular que el
modelo podra ser aplicado porque el modelo puede tender a formar una curva, aunque
lo ideal es que forme una recta lineal hacia arriba (+) o hacia abajo (-).
3) Ya teniendo una idea del comportamiento de las variables, podemos confirmar el
anlisis exploratorio, realizando lo siguiente:
1.
2.
3.
4.

Men Analizar.
Seleccione la opcin Regresin.
Presione la opcin Lineales
Pase la variable independiente y dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Estadsticos y verifique que estn marcados: Estimaciones y
Ajuste del modelo, presione el botn Continuar.
6. Presione Aceptar.
4) De los resultados que se muestran:
1. Debemos verificar el valor de R cuadrado que se encuentra en la segunda tabla,
este valor es el coeficiente de determinacin de Pearson, que nos mide el grado
de, que tan perfecto puede ajustarse los valores de las variables a una recta. Si
este valor esta entre 0.9 y 1 (que significa 90% a 100%), podemos decir que si
cumple con el modelo, es decir que los datos si se ajustan a una recta, por lo que
usar la ecuacin ( = a + bx) para predecir, ser valido. Si el valor obtenido en el R
cuadrado es 1, se dice que el ajuste es perfecto. En nuestro caso el resultado del
anlisis se muestra en el siguiente cuadro.
Resumen del modelo

Modelo
1

R
,067a

R cuadrado

R cuadrado

Error tp. de la

corregida

estimacin

,004

-,195

4,6889

a. Variables predictoras: (Constante), Presin

Anlisis final: Finalmente se puede concluir que el modelo de anlisis de regresin no


puede ser aplicado porque el R cuadrado de 0,004 no se encuentra entre el intervalo
de 0,9 y 1 de significacin para poder predecir los hechos.
EJERCICIO M:
Se

Cantidad de
Carbohidratos
100
120
140
150
180
200
220

Peso
59,5
62,1
65,3
67,9
69,7
70,9
72,8

realiz un estudio sobre: La excesiva cantidad de


carbohidratos influye en el aumento del peso
corporal de nios sin actividad fsica.
Sean las variables:

60

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

1) Identificar la variable independiente y la variable dependiente.


Cantidad de Carbohidratos variable independiente.
Peso variable dependiente.

2) Realizar un anlisis exploratorio:


Grfico 1 Lineal

Grfico 2 Dispersin

Anlisis inicial: Ante los resultados de ambos grficos se puede especular que el
modelo podra ser aplicado porque el modelo puede tender a formar una recta lineal
hacia arriba (+).

61

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3) Ya teniendo una idea del comportamiento de las variables, podemos confirmar el


anlisis exploratorio observando el siguiente cuadro:
Resumen del modelo

Modelo

R cuadrado

,977a

R cuadrado

Error tp. de la

corregida

estimacin

,954

,945

1,1332

a. Variables predictoras: (Constante), Cantidad de carbohidratos

1. Se ha comprobado que el valor de R cuadrado que se encuentra en la tabla es de


0,954, este valor es el coeficiente de determinacin de Pearson, se encuentra
entre el rango de 0,9 y 1. Esto quiere decir que la prediccin de influencia entre
ambas variables tendr un 95,4% de certeza.
2. Si el R cuadrado obtuvo un valor aceptable, debemos ubicar los valores de a y b
que remplazaremos en la formula: ( = a + bx) y as poder hacer predicciones,
estos valores los obtendremos de los resultados obtenidos en la cuarta tabla:

Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1

B
(Constante)
Cantidad de carbohidratos

tipificados

Error tp.

Beta

49,634

1,745

,109

,011

a. Variable dependiente: Peso

,977

Sig.

28,445

,000

10,199

,000

a
b

El valor de b indica la orientacin de la pendiente de la recta, es decir si el valor


es:
positivo (+) la recta ser:
(hacia arriba)
negativo (-) la recta ser:
(hacia abajo)

4) Siendo la ecuacin:
= a + bx
De la tabla de resultados, tomar el valor de a = 49.634 y el valor de b = 0.109.
Se pide predecir:

62

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

1. El peso que tendr el nio si consume 60 carbohidratos por lo que x = 60.


Reemplazando:
= a + bx
= 49.634 + (0.109 * 60)
= 56.174
Rpta: el peso del nio que consuma 60 carbohidratos ser de 56.174 kilogramos.
2. El peso que tendr el nio si consume 30 carbohidratos por lo que x = ___.
Reemplazando:
= a + bx
=
=
Rpta: el peso del nio que consuma __ carbohidratos ser de _____ kilogramos.

3. El peso que tendr el nio si consume 290 carbohidratos por lo que x = ___.
Reemplazando:
= a + bx
=
=
Rpta: el peso del nio que consuma __ carbohidratos ser de _____ kilogramos.
EJERCICIO N:
En una empresa de artesana desea saber si la cantidad de cermica producida por un
trabajador influye en elevar su nivel de experiencia,para poder hacer las
predicciones respectivas.
Trabajador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Nivel de
experiencia
213,9
212,6
215,3
215,3
215,4
228,2
245,6
259,9
250,9
234,5
205,9
202,7
198,5
195,6
200,4
200,1
201,5

63

Cantidad de cermica
producida
3147
3160
3197
3173
3292
3561
4013
4244
4159
3776
3232
3141
2928
3063
3096
3096
3158

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

Curso: Tcnicas Multivariadas de Anlisis

213,2
219,5
243,7
262,3
252,3
224,4
215,3
202,5
200,7
201,8
202,1
200,4
209,3
213,9
227,0
246,4

3338
3492
4019
4394
4251
3844
3276
3184
3037
3142
3159
3139
3203
3307
3585
4073

Solucin:
1) Identificar la variable independiente y la dependiente.
Cantidad de cermica producida variable________________
Nivel de experiencia variable_________________________
2) Realice el anlisis exploratorio
R cuadrado = ______ aproximadamente ______%
Se puede aplicar la tcnica de anlisis de regresin. Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________________________
___________________________________________________________
4) Siendo la ecuacin:
= a + bx.
De la tabla de resultados, tomar el valor de a = _______ y el valor de b = _____.
Se pide predecir:
1. El nivel de experiencia que tendr un trabajador si produce 800 cermicas.
Reemplazando:
= a + bx
=
=
Rpta: el nivel de experiencia del trabajador que produzca 800 unidades ser
de________.

64

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

2. El nivel de experiencia que tendr un trabajador si produce 1500 cermicas.


Reemplazando:
= a + bx
=
=
Rpta: el nivel de experiencia del trabajador que produzca 1500 unidades ser
de________.
3. El nivel de experiencia que tendr un trabajador si produce 300 cermicas.
Reemplazando:
= a + bx
=
=
Rpta: el nivel de experiencia del trabajador que produzca 300 unidades ser
de________.
ANLISIS DE REGRESIN MULTIPLE
El modelo de Regresin mltiple, esta representado por la siguiente ecuacin:
Y = A0 + A1X1 + A2X2 + A3X3 + ....... + AnXn
Sean ms 2 variables, en las cuales una depende de las otras.
X1 , X2 , X3 ....... Xn

variables independientes.
Y

variable dependiente.
Modelo de Regresin Mltiple Ajustado: = a0 + a1x1 + a2x2 + a3x3 + ....... + anxn
Al igual que el modelo de regresin lineal simple, el R cuadrado debe ser mayor al 90%,
para poder asumir que si se cumple con el modelo. Y hacer las predicciones del caso.
Aplicacin:
Tenemos un estudio estadstico del resultado del Test de inteligencia aplicado a un
grupo de alumnos. Se desea cuantificar cul es el grado de influencia de los niveles
de nutricin y el nivel de concentracin en los resultados del test de los alumnos.
Alumno
Jos
Matas
Ana
Jorge
Luis
Rafaela
Leonardo
Miriam

Puntajes del
Test de inteligencia
48,8
43,2
39,4
29,8
26,2
24,8
24,0
21,5

65

Niveles de
Nutricin
831,5
1204,0
1153,5
499,6
466,6
522,3
376,6
431,3

Nivel de
Concentracin
30
18
20
25
30
12
12
20

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Lucas
Daniel
Marissa
Angel
Beatriz
Yuliana
Roberto
Fernando
Karina
Elia
Hugo

Curso: Tcnicas Multivariadas de Anlisis

18,3
15,6
14,3
12,9
12,5
8,8
6,0
5,9
3,6
1,7
1,0

282,2
311,8
284,5
399,0
462,8
205,0
162,4
45,8
113,7
237,3
170,8

10
13
7
8
3
12
3
1
4
7
5

Solucin:
1) Determine las variables independientes y la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Un colegio, puede decidir por mejorar el nivel de nutricin de sus alumnos, a travs de
comedores estudiantiles, adems de realizar talleres que estimulen la mejora de
concentracin en los alumnos con el objetivo de mejorar su rendimiento escolar
Con el anlisis realizado, podemos identificar:
Nutricin y Concentracin
variables independientes.
Test de inteligencia

variable dependiente.
2) Realizar un anlisis exploratorio:
Puede realizar grficos de distintos tipos, por ejemplo, los lineales simples, analizando
como se comporta la variable dependiente solo con una de las variables independientes,
del mismo modo, otro grafico lineal simple, con la misma variable dependiente, pero
analizando el comportamiento con otra de las variables independientes, y as
sucesivamente.
1. Tambin, puede realizar un grafico lineal mltiple
2. Seleccionar valores individuales de los casos
3. Luego Definir
4. Pasar la variable dependiente a la opcin variable y las independientes a Las lneas
representan.
5. Presiona Aceptar.

66

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3) Ya teniendo una idea del comportamiento de las variables, podemos confirmar el


anlisis exploratorio, realizando lo siguiente:
1.
2.
3.
4.

Men Analizar.
Seleccione la opcin Regresin.
Presione la opcin Lineales
Pase las variables independientes y la dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Estadsticos y verifique que estn marcados: Estimaciones y
Ajuste del modelo, presione el botn Continuar.
6. Presione Aceptar.
4) De los resultados que se muestran:
1. Debemos verificar el valor de R cuadrado que se encuentra en la segunda tabla,
este valor es el coeficiente de determinacin de Pearson, que nos mide el grado
de, que tan perfecto puede ajustarse los valores de las variables a una recta. Si
este valor esta entre 0.9 y 1 (que significa 90% a 100%), podemos decir que si
cumple con el modelo. Si el valor obtenido en el R Square es 1, se dice que el
ajuste es perfecto.
Resumen del modelo

Modelo
1

R
,949a

R cuadrado
,901

R cuadrado

Error tp. de la

corregida

estimacin

,888

4,6902

a. Variables predictoras: (Constante), concentracin, nutricin

Para nuestro caso, se obtuvo un R 2 = 0.901 aproximadamente el 90.1% lo cual es


aceptable.

67

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

2. Si el R cuadrado obtuvo un valor aceptable, debemos ubicar los valores de a 0 , a1 ,


a2 , a3 .... an , estos valores estn en los resultados obtenidos en la cuarta tabla:
Con lo que podemos predecir, usando la formula:
= a0 + a1x1 + a2x2
= -1.354 + (0.669 * x1 ) + (0.027 * x2 )

a0
a1
a2

CONCENTRACIN
NUTRICIN

Test

NOTA: a0 , es una constante general, el cual si es negativo no es un valor muy lgico, por
lo que sera bueno realizar un anlisis sin considerar dicho valor.
Para suprimir dicha constante:
Al momento de hacer la Regresin, es decir:
1. Men Analizar.
2. Seleccione la opcin Regresin.
3. Presione la opcin Lineales
4. Pase las variables independientes y la dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Estadsticos y verifique que estn marcados: Estimaciones y
Ajuste del modelo.
6. Presione el botn Opciones y quite el check en: Incluir la constante en la ecuacin
7. Presione el botn Continuar.
8. Presione Aceptar.
Con lo cual se obtiene un R2 mucho ms aceptable, siendo este de 0.965
aproximadamente de 96.5%, ya no habr un valor a 0, slo los de a1 y a2, los cuales sern:
a1 = 0.626 y a2 = 0.026
Se pide predecir:
1. Cul sera el puntaje del Test de inteligencia de un alumno que tenga un nivel de
concentracin de 15 y tenga un nivel de nutricin de 1000.

68

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Sabemos por el anlisis realizado anteriormente los valores de a 1 = 0.626 y a2 =


0.026, adems por lo que nos pide predecir asumimos que x 1 = 15 y x2 = 1000.
Reemplazamos en la ecuacin:
= a0 + a1x1 + a2x2
= (0.626 * 15) + (0.026 * 1000)
= (9.39) + (26)
= 35.39
Respuesta: El puntaje del Test, de tener una concentracin 15, teniendo una
nutricin de 1000, ser aproximadamente de 35.39 puntos.
2. Cul sera el puntaje del Test de inteligencia de un alumno que tenga un nivel de
concentracin de 28 y tenga un nivel de nutricin de 1400.
Respuesta: El puntaje del Test, de tener una concentracin ___, teniendo una
nutricin de ____, ser aproximadamente de _____ puntos.
3. Cul sera el puntaje del Test de inteligencia de un alumno que tenga un nivel de
concentracin de 41 y tenga un nivel de nutricin de 900.
Respuesta: El puntaje del Test, de tener una concentracin ___, teniendo una
nutricin de _____, ser aproximadamente de _____ puntos.
4. Cul sera el puntaje del Test de inteligencia de un alumno que tenga un nivel de
concentracin de 18 y tenga un nivel de nutricin de 750.
Respuesta: El puntaje del Test, de tener una concentracin ___, teniendo una
nutricin de _____, ser aproximadamente de _____ puntos.
EJERCICIO P:
La facultad de Psicologa de la Universidad Inca Garcilaso de la Vega design a los
alumnos del tercer ciclo del curso de Tcnicas Multivariadas de Anlisis a realizar un
estudio sobre inteligencias mltiples en los colegios nacionales de la regin Lima, para
ello deban organizarse en grupos. Dicho estudio implicar el manejo de un presupuesto
(costo de desarrollo del estudio), el cual se ver afectado por el tiempo de duracin y el
nmero de integrantes. Luego de la ejecucin del estudio sobre inteligencias mltiples se
obtuvieron los siguientes datos:
Cod_grupo
G01
G02
G03
G04
G05
G06

Tiempo_duracin_dias
19
25
24
24
31
30

Costo_desarr_estudio
350,00
300,00
280,00
300,00
250,00
260,00

69

Num_integr_grupo
6
4
5
3
4
6

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

G07
G08
G09
G10
G11
G12
G13
G14

Curso: Tcnicas Multivariadas de Anlisis

22
24
28
32
32
35
19
25

354,00
350,00
275,00
262,00
240,00
230,00
389,00
267,00

6
4
3
5
2
3
5
2

1. Identificar la variable dependiente y las independientes.


Tiempo de duracin en das variable_____________________
Nmero de integrantes variable_________________________
Costo del Proyecto variable_________________________
2. Obtener el coeficiente de determinacin (R2). Qu concluye sobre este valor?
Se puede aplicar el modelo de regresin mltiple?
____________________________________________________________
____________________________________________________________
____________________________________________________________
3. La constante de la ecuacin se debe incluir o no en el modelo de regresin
mltiple? Por qu?
____________________________________________________________
___________________________________________________________
EJERCICIO Q:
El colegio Hideyo Noguchi realiz un estudio sobre como: El dficit de concentracin y
el nivel de motivacin afectan el rendimiento escolar de los alumnos del quinto grado
de primaria. Luego de la ejecucin del estudio se obtuvieron los siguientes datos:
Alumno
Lpez
Garca
Ahumada
Valdez
Snchez
Abad
Martnez
Salcedo
Paredes
Portugal
Valencia

Dficit de concentracin
25,2
23,8
45,2
12,6
48,6
10,3
34,6
21,3
8,2
34,2
11,5

Nivel de motivacin
78,5
81,3
36,7
98,7
32,2
99,6
63,2
86,2
99,9
64,3
97,6

70

Rendimiento escolar
14
15
8
17
6
18
12
16
19
11
17

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Orosco
Brea
Vicente

Curso: Tcnicas Multivariadas de Anlisis

50,6
18,7
38,7

29,8
88,6
70,2

4
16
13

1. Identificar la variable dependiente y las independientes.


Variable dependiente ____________________________
Variable independiente ___________________________
Variable independiente ___________________________
2. Obtener el coeficiente de determinacin (R2). Qu concluye sobre este valor?
Se puede aplicar el modelo de regresin mltiple?
____________________________________________________________
____________________________________________________________
____________________________________________________________
3. La constante de la ecuacin se debe incluir o no en el modelo de regresin
mltiple? Por qu?
____________________________________________________________
___________________________________________________________
4. Cules son sus nuevos coeficientes del modelo de regresin mltiple?
a0 :_______________________
a1 :_______________________
a2 :___________________________________

5. Se pide predecir:
a. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 60,8 y tenga un nivel de motivacin de 45,6.
Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin
de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.
b. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 8,4 y tenga un nivel de motivacin de 67,8.
Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin
de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.
c. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 43,6 y tenga un nivel de motivacin de 78,9.

71

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin


de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.
d. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 23,1 y tenga un nivel de motivacin de 86,4.
Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin
de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.
e. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 83,1 y tenga un nivel de motivacin de 26,4.
Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin
de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.

72

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

ANOVA DE UN FACTOR
Estudia 2 variables:
1
2

variable cualitativa (nominal u ordinal) la cual viene siendo el Factor.


variable cuantitativa (variable dependiente) la cual es un valor escalar, una
cantidad.

Mediante la tcnica de comparacin de medias y comparacin de varianzas, permite


determinar la influencia de la variable cualitativa sobre la cuantitativa.
Los pasos a seguir son:
1)

Identificar cual es la variable cualitativa (grupo A) y cual es la variable


cuantitativa (grupo B).

2)

Establecer la hiptesis mediante Comparacin de Medias: la Media del


grupo A (MA) y Media del grupo B (MB)
H0 : MA = MB Las medias son iguales, esto implica que un grupo no afecta al otro.
Ha : MA MB Las medias son distintas, esto implica que un grupo si influye al otro.
Se aceptar H0 si el valor que se obtiene de Sig es mayor a 0.05 (Sig > 0.05)
Se aceptar Ha si el valor que se obtiene de Sig es menor a 0.05 (Sig <= 0.05)

3)

Ir al Men Analizar.

4)

Seleccionar Comparar medias.

5)

Seleccionar ANOVA de una factor

6)

Seleccionar la variable dependiente y pasarla al lugar que le corresponde,


luego seleccionar la variable factor y agregarla al lugar correspondiente al Factor.

7)

Presionar Aceptar.

8)

Verificar el valor de Sig. (Significancia.)

Ejemplo: Una consultora que se encarga de la seleccin de personal ha recogido datos


de diferentes empresas para las cuales trabaja, con el objetivo de verificar si la
categora laboral esta en funcin al salario. Para ello debe comprobar si su hiptesis es
verdadera. Tomando en cuenta que las categoras son las siguientes:
1=Administrativos
2=Vigilancia

73

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3=Mantenimiento
Los datos figuran en la siguiente tabla:
Categora Laboral
1
1
1
1
1
1
1
1
1
1
2
2
2
2
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
1
2
2

Salario
550
540
850
420
726
1320
1560
938
658
1440
826
1600
1360
758
532
844
1360
934
1420
738
840
1420
934
748
946
1260
1280
1200
726
916
1420
544
1120
416
1200
822
936
765
1148

74

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

2
1) Categora laboral
Salario

1128

variable cualitativa (Factor)


variable cuantitativa.

2) Establecemos las hiptesis:


H0 : MA = MB La categora laboral de un empleado no influye en su salario.
Ha : MA MB La categora laboral de un empleado si influye en su salario.
3) Ir al Men Analizar.
4) Seleccionar Comparar medias.
5) Seleccionar ANOVA de una factor
6) Seleccionar la variable dependiente (salario) y pasarla al lugar que le corresponde,
luego seleccionar la variable factor (categora laboral) y agregarla al lugar
correspondiente al Factor.
7) Presionar Aceptar.
8) En los resultados, verificar el valor de Sig, que es el nivel de significancia
ANOVA
Salario
Suma de
cuadrados

Media
gl

cuadrtica

Inter-grupos

259800,832

129900,416

Intra-grupos

3951114,943

37

106786,890

Total

4210915,775

39

F
1,216

Sig.
,308

Para este caso se obtuvo: Sig. = 0.308 como es mayor a 0.05, entonces aceptamos H 0.
Conclusin: H0 = La categora laboral de un empleado no influye en su salario.
EJERCICIO R:
Se tienen los siguientes datos experimentales, en el que se ha recogido informacin de 2
variables, se desea saber si el consumo telefnico depende del nivel socio econmico.
Tomando en cuenta que los niveles socioeconmicos son las siguientes:
1=Clase Alta
2=Clase Media
3=Clase Baja

75

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Consumo telefnico
155
154
148
132
126
132
156
138
158
144
80
60
65
85
32
144
136
134
142
138
140
82
72
82
78
68
76
34
26
36
29
34
32
36
28
32
136
65
78
68

Nivel socio econmico


1
1
1
1
1
1
1
1
1
1
2
2
2
2
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
1
2
2
2

76

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

1. Identificar cual es la variable cualitativa y cual es la variable cuantitativa.

77

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Variable cualitativa: _______________________


Variable cuantitativa: ______________________
2. Establecer las hiptesis:

H0 : MA = MB
Ha : MA MB

H0:__________________________________________________________
Ha:__________________________________________________________
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Por qu?
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
________________________________________________________________
EJERCICIO S:
Se convoc a todos los interesados, a realizar un estudio sobre inteligencias mltiples,
deban organizarse en grupos de personas que tengan el mismo grado acadmico, los
datos fueron:
Cod_grupo
A
B
C
D
E
F
G
H
I
J
K
L
M
N

Tpo_estudio_dias
19
25
24
24
31
30
22
24
28
32
32
35
19
25

Costo_desarr_estudio
350,00
300,00
280,00
300,00
250,00
260,00
354,00
350,00
275,00
262,00
240,00
230,00
389,00
267,00

78

Grado_academico_grupo
profesionales
profesionales
tcnicos
profesionales
tcnicos
tcnicos
profesionales
tcnicos
profesionales
profesionales
tcnicos
tcnicos
profesionales
tcnicos

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

I.

Curso: Tcnicas Multivariadas de Anlisis

Se desea verificar si el Tiempo de desarrollar el estudio, contabilizado en das, est


en funcin al Grado acadmico de los integrantes del grupo.

1. Identificar cual es la variable cualitativa y cual es la variable cuantitativa.


Variable cualitativa: _______________________
Variable cuantitativa: ______________________
2. Establecer las hiptesis:

H0 : MA = MB
Ha : MA MB

H0:__________________________________________________________
Ha:__________________________________________________________
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Por qu?
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
________________________________________________________________
II.

Se desea verificar si el Grado acadmico de los integrantes del grupo, est en


funcin al Costo de desarrollar dicho estudio.

1. Identificar cual es la variable cualitativa y cul es la variable cuantitativa.


Variable cualitativa: _______________________
Variable cuantitativa: ______________________
2. Establecer las hiptesis:

H0 : MA = MB
Ha : MA MB

H0:__________________________________________________________
Ha:__________________________________________________________

79

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3. Realizar ANOVA de un factor.


4. Qu hiptesis acepta y cual rechaza? Por qu?
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
________________________________________________________________

80

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

ANLISIS FACTORIAL
El anlisis factorial es una tcnica de reduccin de datos que sirve para encontrar
grupos homogneos de variables a partir de un conjunto numeroso de variables. Esos
grupos homogneos se forman con las variables que correlacionan mucho entre s y
procurando, inicialmente, que unos grupos sean independientes de otros.
Cuando recogemos un gran nmero de variables de forma simultnea, como por ejemplo
en un cuestionario de satisfaccin laboral, podemos estar interesados en averiguar si las
preguntas del cuestionario se agrupan de alguna forma caracterstica. Aplicando un
anlisis factorial a las respuestas de los sujetos podemos encontrar grupos de variables
con significado comn y conseguir de esta manera reducir el nmero de dimensiones
necesarias para explicar las respuestas de los sujetos.
El anlisis factorial es, por tanto, una tcnica de reduccin de la dimensionalidad de los
datos. Su propsito ltimo consiste en buscar el nmero mnimo de dimensiones capaces
de explicar el mximo de informacin contenida en los datos. A diferencia de lo que
ocurre en otras tcnicas como el anlisis de varianza o el de regresin, en el anlisis
factorial todas las variables del anlisis cumplen el mismo papel: todas ellas son
independientes en el sentido de que no existe a priori una dependencia conceptual de
unas variables sobre otras.
Modelo Matemtico del Anlisis Factorial
El modelo matemtico del AF supone que cada una de las p variables observadas es
funcin de un nmero m factores comunes (m<p) ms un factor especfico o nico. Tanto
los factores comunes como los especficos no son observables y su determinacin e
interpretacin es el resultado del AF. Analticamente, supondremos un total de p
variables observables tipificadas y la existencia de m factores comunes. El modelo se
define de la siguiente forma:

X1
=
l11
F1
+
X2
=
l21
F1
+
...
Xp = lp1 F1 + lp2 F2 + lpm Fm + ep

l12
l22

F2
F2

+
+

l1m
l2m

Fm
Fm

que podemos expresar de forma matricial como: X = Lf + e


donde:

X es el vector de las variables originales.

L es la matriz factorial. Recoge las cargas factoriales (saturaciones).

lih es la correlacin entre la variable j y el factor h.

f es el vector de factores comunes.

81

+
+

e1
e2

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

e es el vector de factores nicos.

Como tanto los factores comunes como los especficos son variables hipotticas,
supondremos, para simplificar el problema, que:
1. Los factores comunes son variables con media cero y varianza 1. Adems se
suponen incorrelacionados entre s.
2. Los factores nicos son variables con media cero. Sus varianzas pueden ser
distintas. Se supone que estn incorrelacionados entre s. De lo contrario la
informacin contenida en ellos estara en los factores comunes.
3. Los factores comunes y los factores nicos estn incorrelacionados entre si Esta
hiptesis nos permite realizar inferencias que permitan distinguir entre los
factores comunes y los especficos.
Basndonos en el modelo y en las hiptesis formuladas, podemos demostrar que la
varianza (informacin contenida en una variable) de cada variable se puede descomponer
en:

aquella parte de la variabilidad que viene explicada por una serie de factores
comunes con el resto de variables que llamaremos comunalidad de la variable

y la parte de la variabilidad que es propia a cada variable y que, por tanto, es no


comn con el resto de variables. A esta parte se le llama factor nico o
especificidad de la variable.

Var(xj ) = 1 = l 2j1 Var(F1 ) + l 2j2 Var(F2 ) + ... + l 2jm Var(Fm ) + Var(ej ) = l 2j1 + l 2j2 +
l 2jm + Var(ej )
donde:

l 2jh representa la proporcin de varianza total de la variable Xj explicada por el


factor h.

h 2j = l 2j1 + l 2j2 + ... + l 2jm es la comunalidad de la variable Xj y representa la


proporcin de varianza que los distintos factores en su conjunto explican de la
variable Xj. Es, por tanto, la parcela de esa variable que entra en contacto con el
resto de variables. Vara entre 0 (los factores no explican nada de la variable) y 1
(los factores explican el 100% de la variable).

Var(ej ) es lo que llamamos especificidad y representa la contribucin del factor


nico a la variabilidad total de Xj.

l 21h + l 22h + ... + l 2ph = gh es lo que se llama eigenvalue (autovalor) y representa


la capacidad del factor h para explicar la varianza total de las variables. Si las

82

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

variables originales estuviesen tipificadas, la varianza total sera igual a p y gh/p


representara el porcentaje de varianza total atribuible al factor h.
El objetivo del Anlisis Factorial ser, por tanto, obtener los factores comunes de modo
que expliquen una buena parte de la variabilidad total de las variables.

Cundo es adecuado realizar un AF?


Un Anlisis Factorial resultar adecuado cuando existan altas correlaciones entre las
variables, que es cuando podemos suponer que se explican por factores comunes. El
anlisis de la matriz de correlaciones ser pues el primer paso a dar. Analticamente,
podemos comprobar el grado de correlacin con las siguientes pruebas o test:

Test de esfericidad de Bartlett.


Es necesario suponer la normalidad de las variables. Contrasta la H0 de que la
matriz de correlaciones es una matriz identidad (incorrelacin lineal entre las
variables). Si, como resultado del contraste, no pudisemos rechazar esta H0, y
el tamao de la muestra fuese razonablemente grande, deberamos reconsiderar
la realizacin de un AF, ya que las variables no estn correlacionadas.
El estadstico de contraste del test de Bartlett es:

B = - ( n - 1 - (2p + 5)/6 ) ln | R* |
bajo la hiptesis nula resulta X 2(p2 - p)/2
donde:

p es el nmero de variables y

| R* | es el determinante de la matriz de correlaciones muestrales.

Indice KMO (Kaiser-Meyer-Olkin) de adecuacin de la muestra.


KMO se calcula como:

83

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

donde:
o

rji - coeficiente de correlacin observada entre las variables j y h.

aji - coeficiente de correlacin parcial entre las variables j y h.

Estos coeficientes miden la correlacin existente entre las variables j y h, una


vez eliminada la influencia que las restantes variables ejercen sobre ellas. Estos
efectos pueden interpretarse como los efectos correspondientes a los factores
comunes, y por tanto, al eliminarlos, aji - representar la correlacin entre los
factores nicos de las dos variables, que tericamente tendra que ser nula. Si
hubiese correlacin entre las variables (en cuyo caso resultara apropiado un AF),
estos coeficientes deberan estar prximos a 0, lo que arrojara un KMO prximo
a 1. Por el contrario, valores del KMO prximos a 0 desaconsejaran el AF.
Est comnmente aceptado que:

Si KMO < 0.5 no resultara aceptable para hacer un AF.

Si 0.5 < KMO < 0.6 grado de correlacin medio, y habra aceptacin media.

Si KMO > 0.7 indica alta correlacin y, por tanto, conveniencia de AF.

Medida de adecuacin de la muestra para cada variable (MSA)


Este ndice es similar al KMO, pero para cada variable. La j-sima variable de
MSA viene dada por la siguiente expresin:

Si el valor del MSA fuera pequeo, no se aconsejara el AF. Por el contrario,


valores prximos a 1 indicaran que la variable Xj es adecuada para incluirla con el
resto en un AF. En muchas ocasiones, se eliminan las variables con MSA muy bajo.
(diagonal principal de la matriz de correlacin anti-imagen).

Correlacin antiimagen AIC.


El coeficiente de correlacin antiimagen es el negativo del coeficiente de
correlacin parcial entre dos variables. Si existiesen factores comunes,

84

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

esperaramos pequeos coeficientes de correlacin parcial. Por ello, el AF es


aplicable cuando en la matriz de correlaciones antiimagen hay muchos
coeficientes pequeos.
Fases del Anlisis Factorial en SPSS
1. ndice de discriminacin o anlisis de tems.
2. Creacin de la matriz factorial
3. Anlisis de la matriz factorial
4. Creacin de componentes o factores
1. ndice de discriminacin o anlisis de items: En este anlisis determinamos la
correlacin entre los tems y la aplicacin de los mismos para la construccin de la
matriz factorial. En el ejemplo vamos a utilizar la base de datos llamada tesis de
resiliencia.
En SPSS elegir:
Men Analizar
Seleccionar la opcin Escala

Luego elegir Anlisis de Fiabilidad

En el cuadro emergente pasar al lado derecho los tems de la


prueba a evaluar (desde ItemR1 hasta ItemR25).

Luego presionar el botn Estadsticos

85

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

En el cuadro emergente, la opcin para descriptivos activar los


casilleros de Elemento, Escala y Escala si se elimina el elemento.

Luego dar clic


en
continuar,
fijarse que se haya elegido el modelo Alpha y finalmente
Aceptar.

En la ventana de resultados ubicar la tabla Fiabilidad


Estadstica, para que los tems a evaluar sean de un grado
confiables y validos, el coeficiente de Alpha de Cronbach's debe
ser mayor a 0,5, en nuestro ejemplo es confiable porque 0,886 >
0,5.
Reliability Statistics
Cronbach's
Alpha
,886

N of
Items
25

En esta etapa debemos analizar cada uno de los tems, para los cual
verificamos en la ventana de resultados, la tabla: Estadsticos total
elemento.
Luego ir a la columna Correlacin elemento-total corregida, slo se
aceptarn los tems cuyos valores de correlacin sean mayores a 0,2;
aquellos tems que no cumplan con esta condicin no se tomarn en cuenta
para la construccin de la matriz factorial. En nuestro ejemplo, basados en
la siguiente tabla 4 items deben ser descartados.

86

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Estadsticos total-elemento

Scale Mean

Scale

if Item

Variance if

Deleted

Item Deleted

Correlacin

Cronbach's Alpha if

elemento-total

Item Deleted

corregida
Cuando planeo algo lo realizo

132,58

290,740

,534

,880

132,46

289,553

,597

,878

132,88

291,041

,460

,882

132,51

289,010

,582

,878

132,47

289,923

,516

,880

131,90

289,128

,652

,877

Usualmente veo las cosas a largo plazo

133,69

303,693

,199

,889

Soy amigo(a) de mi mismo

132,24

288,590

,596

,878

133,32

297,067

,369

,884

132,94

291,714

,529

,880

134,21

303,657

,169

,891

133,22

295,028

,387

,884

132,64

290,369

,517

,880

Tengo autodisciplina

132,87

293,821

,467

,881

Me mantengo interesado(a) en las cosas.

132,49

292,135

,571

,879

Por lo general encuentro algo de que reirme

132,22

294,087

,507

,880

132,25

288,867

,577

,879

131,98

292,596

,600

,879

132,25

297,449

,519

,881

134,08

309,052

,084

,894

131,76

291,779

,623

,878

Generalmente me las arreglo de un manera u


otra
Dependo mas de mi misma que de otras
personas
Es importante para mi mantenerme
interesado(a) en las cosas
Puedo estar solo(a) si tengo que hacerlo
Me siento orgulloso(a) de haber logrado cosas
en mi vida

Siento que puedo manejar varias cosas al


mismo tiempo
Soy decidido(a)
Rara vez me pregunto cual es la finalidad de
todo
Tomo las cosas una por una
Puedo superar momentos dificiles por que he
experimentadoesta dificultad anteriormente

El creer en mi mismo me permite atravesar


momentos dificiles
En una emergencia soy una persona en quien se
puede confiar
Generalmente puedo ver una situacion de varias
maneras
Algunas veces me obligo a hacer cosas aunque
no quiera
Mi vida tiene significado

87

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

2.

Curso: Tcnicas Multivariadas de Anlisis

Creacin de la matriz factorial: en esta etapa creamos la matriz factorial para


analizar las comunalidades o componentes a crear.
En SPSS elegir:
Men Analizar
Seleccionar la opcin Reduccin de dimensiones
Luego elegir Factor
En el cuadro emergente pasar al lado derecho los tems de la
prueba que fueron aceptados como validos, eso quiere decir que
debemos excluir los item que obtuvieron un puntaje por debajo de
0,2.

Luego presionar el botn Descriptivos y hacer activar las


siguientes opciones: Coeficientes, Nivel de significacin,
Determinante, KMO y Bartletts y hacer clic en continuar.

88

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Luego presionar el botn Extraccin, activar la casilla Grfico de


sedimentacin y verificar que este seleccionado el Mtodo de
Componentes Principales y luego hacer clic en continuar.

Luego
botn
seleccionar
cantidad sin
continuar.

presionar el
Rotacin
y
varimax que indica
decimales,
y

Mtodo. En este apartado se puede seleccionar el mtodo de


rotacin de la solucin factorial. Se encuentran disponibles tres
procedimientos de rotacin ortogonal, mediante los cuales se
respeta la independencia entre factores de la solucin inicial, y dos
procedimientos de rotacin oblicua, mediante los cuales pueden
obtenerse factores relacionados entre s. Los mtodos disponibles
son:
F Ninguno. No se aplica ningn mtodo de rotacin. Es la
opcin que acta por defecto. Cuando la solucin consta de
un nico factor y no se ha se ha marcado esta opcin, el
Visor de resultados muestra un mensaje de advertencia.

89

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

F Varimax. Mtodo de rotacin ortogonal que minimiza el


nmero de variables que tienen saturaciones altas en cada
factor. Simplifica la interpretacin de los factores
optimizando la solucin por columna.
F Quartimax. Mtodo de rotacin ortogonal que minimiza el
nmero de factores necesarios para explicar cada variable.
Simplifica la interpretacin de las variables observadas
optimizando la interpretacin por filas.
F Equamax. Mtodo de rotacin que es combinacin del
mtodo Varimax, que simplifica los factores, y el mtodo
Quartimax, que simplifica las variables. Se minimiza tanto el
nmero de variables que saturan alto en un factor como el
nmero de factores necesarios para explicar una variable.
F Oblimin directo. Mtodo para la rotacin oblicua (no
ortogonal). Cuando delta es igual a cero (el valor por
defecto), las soluciones son las ms oblicuas. A medida
quedelta se va haciendo ms negativo, los factores son
menos oblicuos. Para anular elvalor por defecto de delta,
puede introducirse un nmero menor o igual que 0,8. Delta.
El valor de delta permite controlar el grado de oblicuidad
que pueden llegar a alcanzar los factores de la solucin.
F Promax. Rotacin oblicua que permite que los factores
estn correlacionados. Puede calcularse ms rpidamente
que una rotacin Oblimin directa, por lo que es til
paragrandes conjuntos de datos.
Kappa. Parmetro que controla el clculo de la rotacin
Promax. El valor por defecto es 4. Este valor es adecuado
para la mayora de los anlisis.
Y finalmente, presionar el botn opciones, hacer clic en la opcin
suprimir valores absolutos y cambiar el valor de 0,10 a 0,40.,
hacer clic en continuar y aceptar.

90

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

3. Anlisis de la matriz factorial: Para que la matriz tenga validez debe cumplir 3
criterios o condiciones bsicas:
El valor del determinante debe ser igual a 0,000 o lo ms cercano posible, y se
encuentra al pie de la tabla de la matriz, en nuestro ejemplo resulto: a
determinante=0,000.
El KMO debe ser mayor a 0,5.
Bartlett's Test of Sphericity su nivel de significacin debe ser igual a 0,00

KMO and Bartlett's Test


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Bartlett's Test of
Sphericity

Approx. Chi-Square
df

,933
2,935E3
210

Sig.

,000

En concusin nuestra matriz cumple con las 3 condiciones, por lo tanto se concluye
que es una matriz valida.
4. Creacin de componentes o factores: Una vez que la matriz fue validad se
crean los componentes o factores.
Tabla de comunalidades o factores: El valor total debe ser 1, que se
obtiene de la suma de la comunalidad o extraccin como es conocida en la
tabla y la cantidad de unicidad que corresponde al margen de error y
factores del medio ambiente que influyen en el resultado de la prueba o
test.

91

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Var(xj ) = 1 = l 2j1 Var(F1 ) + l 2j2 Var(F2 ) + ... + l 2jm Var(Fm ) + Var(ej ) = l 2j1 + l 2j2 +
l 2jm + Var(ej )
1 = Extraccin + unicidad
Communalities
Initial

Extraction

Cuando planeo algo lo realizo

1,000

,458

Generalmente me las arreglo de un manera u otra

1,000

,606

Dependo mas de mi misma que de otras personas

1,000

,419

Es importante para mi mantenerme interesado(a) en las cosas

1,000

,600

Puedo estar solo(a) si tengo que hacerlo

1,000

,429

Me siento orgulloso(a) de haber logrado cosas en mi vida

1,000

,619

Soy amigo(a) de mi mismo

1,000

,433

Siento que puedo manejar varias cosas al mismo tiempo

1,000

,630

Soy decidido(a)

1,000

,547

Tomo las cosas una por una

1,000

,245

1,000

,421

Tengo autodisciplina

1,000

,414

Me mantengo interesado(a) en las cosas.

1,000

,469

Por lo general encuentro algo de que reirme

1,000

,493

El creer en mi mismo me permite atravesar momentos dificiles

1,000

,472

En una emergencia soy una persona en quien se puede confiar

1,000

,532

Generalmente puedo ver una situacion de varias maneras

1,000

,382

Mi vida tiene significado

1,000

,552

1,000

,493

Tengo la energia suficiente para hacer lo que debo hacer

1,000

,568

Acepto que hay personas a las que yo no les agrado

1,000

,489

Puedo superar momentos dificiles por que he experimentadoesta


dificultad anteriormente

Cuando estoy en una situacion dificil generalmente encuentro una


salida

Extraction Method: Principal Component Analysis.

Por ejemplo: En la tabla inferior se observa que el item 1 tiene un mayor margen de
error en la aplicacin que nos da un 0,542 versus su confiabilidad de 0,458, en cambio el
item 2 muestra una confiabilidad de 0,606 versus un margen de error de 0,394.

92

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social
ITEM
1.

Curso: Tcnicas Multivariadas de Anlisis

TOTAL

Cuando planeo algo lo realizo

2. Generalmente me las arreglo de un


manera u otra

Unicidad o
margen de error

Extraccin

1,000

,542

,458

1,000

,394

,606

Tabla de Varianza Total Explicada: En esta tabla se muestra la cantidad


de componentes o factores que se pueden crear de esta prueba de test de
resiliencia. El valor Total o univalor de la tabla debe ser 1 o mayor, para
que se considere como factor o componente.
La opcin Rotacin permite controlar la fase de rotacin del anlisis. Con
esta opcin podemos definir el mtodo de rotacin que deseamos utilizar
para facilitar la interpretacin de la solucin factorial y solicitar la
representacin grfica de las saturaciones.

93

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Total Variance Explained


Extraction Sums of Squared
Initial Eigenvalues

Componente

Total

% of Variance

Loadings

Cumulative %

Total

Rotation Sums of Squared Loadings

% of

Acumulado

Variance

Total

% of Variance

Acumulado %

7,813

37,206

37,206

7,813

37,206

37,206

4,583

21,824

21,824

1,320

6,286

43,491

1,320

6,286

43,491

3,959

18,852

40,677

1,137

5,415

48,906

1,137

5,415

48,906

1,728

8,230

48,906

,974

4,637

53,544

,919

4,378

57,922

,851

4,051

61,973

,780

3,714

65,687

,744

3,541

69,228

,695

3,308

72,536

10

,675

3,216

75,753

11

,655

3,118

78,871

12

,615

2,930

81,801

13

,564

2,685

84,486

14

,537

2,557

87,043

15

,465

2,215

89,258

16

,431

2,052

91,310

17

,422

2,011

93,321

18

,391

1,861

95,182

19

,372

1,769

96,951

20

,360

1,716

98,667

21

,280

1,333

100,000

Extraction Method: Principal Component Analysis.

En nuestro ejemplo resultan 3 componentes que cumplen con el requisito de Total debe
ser mayor a 1. En el acumulado antes de la rotacin de los tems result un 48,906% y
despus de la rotacin se obtuvo el mismo porcentaje, en ocasiones puede existir una
diferencia mayor o menor entre ambas.
Tabla Matriz de Componentes Rotados: Esta tabla nos permite
distribuir los item a cada uno de los factores que pertenece, observando
donde se produce una mayor saturacin del mismo, tomando en cuenta que
en nuestro ejemplo del test de resiliencia se formaron tres componentes.

94

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Rotated Component Matrixa


Componente
1

Cuando planeo algo lo realizo

,593

Generalmente me las arreglo de un manera u otra

,743

Dependo mas de mi misma que de otras personas

,540

Es importante para mi mantenerme interesado(a) en las cosas

,737

Puedo estar solo(a) si tengo que hacerlo

,606

Me siento orgulloso(a) de haber logrado cosas en mi vida

,705

Soy amigo(a) de mi mismo

,489

Siento que puedo manejar varias cosas al mismo tiempo

,772

Soy decidido(a)

,586

Tomo las cosas una por una

,485

Puedo superar momentos difciles porque he experimentado esta


dificultad anteriormente

,555

Tengo autodisciplina

,588

Me mantengo interesado(a) en las cosas.

,611

Por lo general encuentro algo de que rerme

,601

El creer en mi mismo me permite atravesar momentos difciles

,597

En una emergencia soy una persona en quien se puede confiar

,673

Generalmente puedo ver una situacin de varias maneras

,532

Mi vida tiene significado

,624

Cuando estoy en una situacin difcil generalmente encuentro una


salida

,559

Tengo la energa suficiente para hacer lo que debo hacer

,650

Acepto que hay personas a las que yo no les agrado

,418

,529

Extraction Method: Principal Component Analysis.


Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 4 iterations.

Esto nos ayuda a agrupar los item en cada uno de los factores o componentes, y en caso
que se muestre un resultado numrico en varios factores como por ejemplo el item:
Acepto que hay personas a las que yo no les agrado, donde se puede observar una
saturacin en el componente 1 y 2, se toma en cuenta el mayor valor, que en este caso es
0,529 que determina que el item est ms prximo al componente 2.

95

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

Y finalmente, al agrupar los item, puedo determinar que el componente o factor 1 est
formado por 11 items, el componente o factor 2 est formado por 8 items y el
componente o factor 3 est formado por 2 items.
Componente o Factor
1
2
3
Cantidad de tems agrupados
en el componente o factor

11

Y en base a la relacin de los tems puedo dar un nombre a cada componente, como por
ejemplo especificar el rea a la que pertenece afectiva, conductual, cognitiva, entre
otras.
Factor 1: Reacciones emocionales ante situaciones cotidianas.
Factor 2: ___________________________
Factor 3: ____________________________
EJERCICIO S: Utilizando la misma base de datos Tesis de resiliencia:
1. Realizar el ndice de discriminacin o anlisis de tems utilizando los tem F1 hasta el
tem F29.
2. Los tem analizados son fiables. Por qu?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________

3. Cul es el criterio que se debe tener en cuenta para no considerar un tem en la


creacin la matriz factorial?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
4. Mencione los tems que no se tomarn en cuenta para la creacin de la matriz
factorial.
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________

96

Universidad Inca Garcilaso de la Vega


Facultad de Psicologa y Trabajo Social

Curso: Tcnicas Multivariadas de Anlisis

5. La matriz factorial obtenida es vlida. Cules son sus criterios en los que se basa?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________

6. Cules son los mrgenes de error de los tems 3, 5 y 7 de la matriz?


_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
7. Cmo se determina la cantidad de factores o componentes?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
8. Cuando un tem se encuentra con valores dispersos en varios componentes o
factores, Cmo determina a cul pertenece?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
9. Se formaron __________ factores o componentes de la matriz factorial obtenida
de la base de datos de la tesis de resiliencia.
10. Dar un nombre a cada uno de los factores obtenidos.
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________

97

Você também pode gostar