Você está na página 1de 64

UNIVERSIDAD INCA GARCILASO DE LA VEGA

Nuevos tiempos. Nuevas Ideas


FACULTAD DE PSICOLOGIA Y CIENCIAS SOCIALES
CARRERA PROFESIONAL DE PSICOLOGIA A DISTANCIA

TCNICAS MULTIVARIADAS DE ANALISIS

Autores :

ING. KARINA CHU SALAZAR

ING. JUAN MAGALLANES RODRIGUEZ

LIMA PERU
2011

INTRODUCCION

Actualmente las distintas Tcnicas para el anlisis de Datos aplicando modelos Estadsticos son
instrumentos empleados por los investigadores en las diferentes reas cientficas. Especialmente en las
Ciencias de la Conducta que en los ltimos aos han ido aumentando y, ms concretamente, en la Carrera
de Psicologa.
Las reas de la Psicologa ms utilizadas son: Psicologa experimental, Psicologa del aprendizaje,
Psicologa educacional, Psicologa social, Psicologa Organizacional etc. Hasta en la Psicologa clnica que
exige un dominio profundo de las tcnicas estadsticas.
Al terminar el curso, el alumno aprender el manejo y la aplicacin de las diversas tcnicas de anlisis mas
utilizadas que puede aplicar al realizar estudios de casos, as como tambin desarrollara un esptiru critico
ya que el mismo deducir y decidir cual es la tcnica de anlisis ideal en una determinada situacin.
Cabe sealar, para llevar a cabo el Curso de Tcnicas Multivariadas de Anlisis, es necesario contar con
una calculadora cientfica y mas que todo con los programas de Microsoft Excel y el SPSS, para trabajar
con las tcnicas y realizar el anlisis de resultados.

Los Autores

INDICE
CAPTULO I ANLISIS E INTERPRETACIN DE TABLA DE FRECUENCIAS
1. Definicin de de las tcnicas multivariadas de anlisis.
2. Tipos de tcnicas multivariadas.
3. Procedimiento previo al anlisis
4. Diseo y clculos de una tabla de frecuencia
5. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO II ANLISIS E INTERPRETACIN DE DATOS CON EXCEL
1. Excel como herramienta para el diseo y clculos de tabla de frecuencias.
2. Anlisis comparativo de los intervalos de una clase a travs del Histograma de Frecuencias.
3. Anlisis e interpretacin de representaciones Grficas: Polgono de Frecuencias.
4. Anlisis Porcentual de una muestra a travs de grficos circulares en MS Excel.
5. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO III MEDIDAS DE TENDENCIA CENTRAL
1. Aplicacin de la media aritmtica para obtener el promedio de una muestra.
2. Aplicacin de la mediana que divide la muestra en la mitad.
3. Aplicacin de la moda para obtener el dato que ms se repite en una muestra.
4. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO IV MANEJO DE VARIABLES EN UNA INVESTIGACIN
1. SPSS como herramienta de anlisis e interpretacin y entorno de trabajo de SPSS.
2. Definicin de variables independientes y dependientes e ingreso de datos.
3. Tratamiento de los datos o valores perdidos.
4. Medidas de posicin: cuartiles, deciles y percentiles.
5. Mediadas de dispersin: desviacin estndar y varianza.
6. Coeficiente de Variabilidad.
7. Asimetra y Curtosis.
8. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO V GENERACIN DE CLCULOS Y ANLISIS DE RESULTADOS
1. Generacin de clculos con la calculadora de SPSS.
2. Clculos de coeficiente de asimetra.
3. Desarrollo de casos y ejercicios prcticos
4. Transformacin de datos.
5. Recodificacin de variables o segmentacin de rangos.
6. Ordenar y agrupar casos.
AUTOEVALUACION
CAPTULO VI TCNICAS DE ANLISIS MULTIVARIADAS
1. Anlisis de Regresin Lineal Simple.
2. Anlisis de Regresin Lineal Mltiple.
3. Anova de un Factor.
4. Anlisis Factorial.
5. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION

CAPTULO I
ANLISIS E INTERPRETACIN DE TABLA DE FRECUENCIAS

CONTENIDO:
1.
2.
3.
4.
5.

Definicin de las tcnicas multivariadas de anlisis.


Tipos de tcnicas multivariadas.
Procedimiento previo al anlisis
Diseo y clculos de una tabla de frecuencia
Desarrollo de casos y ejercicios prcticos.

COMPETENCIAS:
1. Conceptuales: conocer la definicin y tipos de tcnicas de anlisis.
2. Procedimentales: aplicar los pasos previos de acomodo de datos antes del anlisis.
3. Actitudinales: identificar las tcnicas de anlisis como herramienta de investigacin.

TECNICAS MULTIVARIADAS DE ANLISIS


DEFINICIN DE LAS TCNICAS MULTIVARIADAS
El anlisis constituye una fase decisiva en cualquier proceso de investigacin. De lo exhaustivo que
seamos en su desarrollo depende la cantidad y la calidad de la informacin que se extraiga de los datos
recogidos en el estudio. Dada la complejidad de la realidad social, es preciso que el anlisis pase por la
exploracin univariable, bivariable, hasta llegar al conocimiento de las interrelaciones existentes entre los
grupos de variables.
La posibilidad de analizar una, dos o mas variables, al mismo tiempo, se ha facilitado bastante en
los ltimos aos por la mayor accesibilidad de los programas estadsticos. Pero aunque su manejo es cada
vez ms sencillo, se precisa de unos conocimientos mnimos que garanticen su correcta realizacin e
interpretacin.
OBJETIVO:
Facilitar el conocimiento de algunas de las tcnicas de anlisis de uso ms comn en la
investigacin social.
Aplicar, desarrollar e interpretar los resultados del anlisis.
TIPOS DE TCNICAS MULTIVARIANTES:
Entre las tcnicas ms conocidas podemos mencionar:
1. Regresin mltiple.
2. Anlisis discriminante mltiple.
3. Anlisis factorial.
4. Anlisis multivariante de varianza y covarianza.
5. Correlacin cannica.
6. Anlisis cluster.
7. Anlisis multidimensional.
8. Anlisis conjunto.
9. Anlisis de correspondencias.
10. Modelos de probabilidad lineal como logit.
11. Modelos de ecuaciones simultaneas estructurales.
PROCEDIMIENTO PREVIO AL ANLISIS:
El anlisis multivariante es un conjunto de tcnicas de anlisis de datos, en expansin, sea cual
fuera el modelo o la tcnica a usar, siempre debemos realizar los procedimientos previos al anlisis
multivariante, es decir preparar los datos para poder decidir cual es el modelo que mejor se ajusta a lo que
buscamos obtener. Ello implica:
Conocer la muestra y el tamao de la muestra.
Identificar las variables.
Hacer algunos clculos estadsticos descriptivos, como:
1. Frecuencias
2. Representaciones grficas (histogramas y polgonos de frecuencia curva normal)
3. Medidas de tendencia central (media aritmtica promedio, mediana, moda)
4. Medidas de dispersin (desviacin estndar, varianza)
5. Asimetra y Curtosis.
6. Correlacin (relaciones lineales entre variables, diagrama de dispersin, correlacin entre dos
conjuntos de datos agrupados en clases).
7. Regresin lineal simple (correlacin por rangos, coeficiente de correlacin por rangos, caso de
rangos empatados o repetidos).
DISEO Y CLCULOS DE UNA TABLA DE FRECUENCIA
1. Frecuencia
EJEMPLO:
Resiliencia:
Es la capacidad que tenemos los seres humanos para reponernos de las adversidades y lograr una
transformacin positiva, que nos eleve y la posible dinmica establecida entre los factores que permiten que
se produzca el proceso de resiliencia. El punto central es, cmo se forma la resiliencia del nio.
El desarrollo de cada nio viene determinado por sus propias caractersticas y por las transacciones que se
producen entre los distintos sistemas relacionales en los que se encuentra. La mayora de los nios

encuentran en su entorno familiar y en los contextos en los que viven, las condiciones de proteccin y los
modelos que necesitan para desarrollarse.
CASO 1:
En el colegio de nivel primaria Mi mundo mgico se ha tomado un test a 50 nios (tamao de la muestra n),
para determinar la capacidad de resiliencia, en la tabla se muestran los puntajes obtenidos.
Se necesita construir una tabla de distribucin de frecuencias.
73
100
104
91
96

102
87
112
84
100

90
104
90
93
104

97
85
98
88
96

98
90
101
97
101

106
95
94
103
75

108
80
105
84
93

93
98
98
105
82

87
82
93
92
100

88
98
82
114
95

El siguiente paso es ordenar los datos, ya sea en sentido creciente o decreciente:


73 82 87 90 93 96 98 100 103 105
75 84 88 91 93 96 98 100 104 106
80 84 88 92 94 97 98 101 104 108
82 85 90 93 95 97 98 101 104 112
82 87 90 93 95 98 100 102 105 114
Al ordenar los datos podemos distinguir que hay un valor menor o valor mnimo Vmin, que en nuestro caso
es 73, y un valor mayor o valor mximo Vmax, que en nuestro caso es 114, adems vemos que hay datos
que se repiten.
Existen tambin relaciones que no se aprecian y para poderlas percibir se clasifican todos los datos, que en
nuestro caso son 50, en grupos o conjuntos llamados intervalos o clases, para ello realizamos lo siguiente:
1 paso: Cuntas clases o intervalos necesitamos?
Usamos la frmula de sturges
k = 1 + 3.3 log n
Donde: k = nmero de intervalos o clases.
n = nmero de datos (tamao de la muestra)
Reemplazando:
k = 1 + 3.3 log 50
k = 1 + 3.3 (1.69)
k = 6.58
Luego redondeamos el resultado siempre al entero inmediato superior.
k=7
Con lo que, para este caso entonces, obtenemos 7 intervalos.
2 paso: Verificar si existe algn exceso en la distribucin de datos a realizar y calcular la amplitud del
intervalo.
a) Calculamos el I con la siguiente formula:
I = Valor mximo Valor mnimo + 1
NOTA: se debe sumar el numero 1 cuando los datos se expresan en nmeros enteros. Si los datos son
decimales, no se suma 1. I = Valor mximo Valor mnimo
Reemplazando:
I = 114 73 + 1
I = 42
b) Calculamos la amplitud del intervalo con la formula:
C = I/k
Donde:
C = amplitud del intervalo
Reemplazando:
C = 42/7
C=6
NOTA: si no sale exacto se redondea al entero inmediato superior.
c) Calculamos el I con la siguiente formula:
I = C * k
Reemplazando:

I = 6 * 7
I = 42
d) Verificamos el exceso con la siguiente formula:
exceso = I I
Reemplazando:
exceso = 42 42
exceso = 0
Para este caso no existe ningn exceso, por lo que comenzamos a elaborar la matriz de la
distribucin de frecuencias.
NOTA: de haber un exceso, la mitad entera mayor del exceso, se le suma al valor mximo de los datos
(Vmax), obteniendo as un nuevo Vmax, el cual se usara en la construccin del intervalo y la mitad entera
menor del exceso, se le resta al valor mnimo de los datos (Vmin), obteniendo un nuevo Vmin, el cual se
usara en la construccin de los intervalos.
3 paso: Construir los intervalos.
Tomamos el valor mnimo de los datos (Vmin) que para nuestro caso es 73 y le sumamos la amplitud del
intervalo que hallamos anteriormente (C), es decir:
Vmin + C  73 + 6 = 79
De este modo obtenemos el primer intervalo: 73  79
Para el segundo intervalo tenemos como limite inferior 79 al cual le sumamos los 6 de amplitud (79 + 6 = 85)
y obtenemos el limite superior 85. Y as sucesivamente.
Intervalos
73  79
79  85
85  91
91  97
97  103
103  109
109  115
4 paso: Marca de clase.
Consiste en hacer que cada uno de los datos que se hallan dentro de un mismo intervalo, estn
representados por un mismo valor, esto se denomina marca de clase, las cuales se obtienen promediando
los extremos de cada intervalo.
Para el primer intervalo ser: (73 + 79) / 2 = 76
Para el segundo intervalo ser: (79 + 85) / 2 = 82
Para el tercer intervalo ser: (85 + 91) / 2 = 88
Y as sucesivamente.
5 paso: Conteo y Frecuencia de los datos.
Intervalos

Marca de clase Conteo Frecuencia


(xi)
(fi)
73  79
76
II
2
79  85
82
IIIII I
6
85  91
88
IIIII III
8
91  97
94
IIIII IIIII I
11
97  103
100
IIIII IIIII III
13
103  109
106
IIIII III
8
109  115
112
II
2
n = 50
NOTA: la parte del conteo es referencial, a esta tabla se le conoce como tabla de distribucin de frecuencias
absolutas.

DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS.


EJERCICIOS DE APLICACIN
Estrs laboral
El estrs laboral se conceptualiza como el conjunto de fenmenos que se suceden en el organismo del
trabajador con la participacin de los agentes estresantes lesivos derivados directamente del trabajo o que
con motivo de este, pueden afectar la salud del trabajador.
Factores Psicosociales en el Trabajo: los factores psicosociales en el trabajo representan el conjunto de
percepciones y experiencias del trabajador, algunos son de carcter individual, otros se refieren a las
expectativas econmicas o de desarrollo personal y otros ms a las relaciones humanas y sus aspectos
emocionales.
Las actuales tendencias en la promocin de la seguridad e higiene en el trabajo incluyen no solamente los
riesgos fsicos, qumicos y biolgicos de los ambientes laborales, sino tambin los mltiples y diversos
factores psicosociales inherentes a la empresa y la manera como influyen en el bienestar fsico y mental del
trabajador.
Ejercicio N1:
La empresa INKA TEXT dedicada al rubro textil ha evaluado a su personal de la planta ubicada en la ciudad
de Arequipa, donde se midi el nivel de stress a 53 obreros del rea de produccin que est expresado en
porcentajes:
51
54
60
59
60
70

61
79
73
65
50
46

50
63
70
61
64
53

60
43
77
80
90
64

45
80
72
64
40
75

69
97
54
58
60
60

62
64
49
52
65
47

54
62
81
43
57
68

61
59
52
67
60

62
63
64
64
64
64

65
65
67
68
69
70

70
72
73
75
77
79

80
80
81
90
97

Se pide construir la tabla de distribucin de frecuencias.


Ordenamos datos:
40
43
43
45
46
47

49
50
50
51
52
52

53
54
54
54
57
58

59
59
60
60
60
60

60
60
61
61
61
62

1.- Calcular el nmero de intervalos (k):


k = 1 + 3.3 log 53
k = 1 + 5.69
k = 6.69
k=7
2.- Calcular exceso y amplitud:
I = 97 40 + 1
I = 58
C = 58/7
C = 8.29
C=9
I = 9 * 7
I = 63
exceso = 63 58
exceso = 5
El exceso lo dividimos en dos partes enteras 3 y 2 (porque 3 + 2 = 5)
Al Vmax le sumamos la parte entera mayor del exceso: 97 + 3 = 100 este ser nuestro nuevo Vmax.
Al Vmin le restamos la parte entera menor del exceso: 40 2 = 38 este ser nuestro nuevo Vmin.

3.- Construimos los intervalos:


Intervalos
38  47
47  56
56  65
65  74
74  83
83  92
92  101
4 y 5.- Marca de clase y frecuencia:

Intervalos Marca de clase Frecuencia


(xi)
(fi)
38  47
43
5
47  56
52
11
56  65
58
20
65  74
61
9
74  83
79
6
83  92
88
1
92  101
97
1
n = 53

Trastorno bipolar (trastorno manaco-depresivo)


Se trata de un trastorno caracterizado por la presencia de episodios reiterados (es decir, al menos dos) en
los que el estado de nimo y los niveles de actividad del enfermo estn profundamente alterados, de forma
que en ocasiones la alteracin consiste en una exaltacin del estado de nimo y un aumento de la vitalidad
y del nivel de actividad (mana o hipomana) y en otras, en una disminucin del estado de nimo y un
descenso de la vitalidad y de la actividad (depresin).

Lo caracterstico es que se produzca una recuperacin completa entre los episodios aislados. A diferencia
de otros trastornos del humor afectivos- la incidencia en ambos sexos es aproximadamente la misma. Los
episodios de mana comienzan normalmente de manera brusca y se prolongan durante un perodo de
tiempo que oscila entre dos semanas y cuarto a cinco meses (la duracin mediana es de cuatro meses). Las
depresiones tienden a durar ms (su duracin media es de 6 meses), aunque rara vez se prolongan ms de
un ao, excepto en personas de edad avanzada.
Ambos tipos de episodios sobrevienen a menudo a raz de acontecimientos estresantes u otros traumas
psicolgicos, aunque su presencia o ausencia no es esencial para el diagnstico. El primer episodio puede
presentarse a cualquier edad, desde la infancia hasta la senectud. La frecuencia de los episodios y la forma
de las recadas y remisiones pueden ser muy variables, aunque las remisiones tienden a ser ms cortas y
las depresiones ms frecuentes y prolongadas al sobrepasar la edad media de la vida.

Ejercicio N2:
La clnica de salud mental Hideyo Noguchi evalu a 42 de sus pacientes que sufren de trastorno bipolar y se
encuentran hospitalizados en el rea de psiquiatra, para medir el nivel de depresin que alcanza cada uno
de ellos. Construir la tabla de distribucin de frecuencias:
39
69
53
52
42

45
55
34
47
61

53
72
46
52

52
55
63
56

35
48
38
43

47
50
48
50

62
51
46
63

58
55
65
58

39
51
49
43

59
48
58
54

Inteligencias Mltiples
Luego de una investigacin cognitiva, da fe de la medida en que los estudiantes poseen diferentes
mentalidades y por ello aprenden, memorizan, realizan y comprenden de modos diferentes. Existen

suficientes pruebas positivas de que algunas personas adoptan una aproximacin lingstica al aprendizaje,
mientras que otras prefieren un rumbo espacial o cuantitativo.
Igualmente algunos estudiantes obtienen mejores resultados cuando se les pide que manejen smbolos de
clases diversas, mientras que otros estn mejor capacitados para desplegar su comprensin mediante
demostraciones prcticas o a travs de interacciones con otros individuos.
Todos los seres humanos son capaces de conocer el mundo de siete modos diferentes .Segn el anlisis
de las siete inteligencias todos somos capaces de conocer el mundo de a travs del lenguaje, del anlisis
lgico-matemtico, de la representacin espacial, del pensamiento musical, del uso del cuerpo para resolver
problemas o hacer cosas, de una comprensin de los dems individuos y de una comprensin de nosotros
mismos. Donde los individuos se diferencian es en la intensidad de estas inteligencias y en las formas en
que recurre a esas mismas inteligencias y se las combina para llevar a cabo diferentes labores, para
solucionar problemas diversos y progresar en distintos mbitos.
Las personas aprenden, representan y utilizan el saber de muchos y diferentes modos. Estas diferencias
desafan al sistema educativo que supone que todo el mundo puede aprender las mismas materias del
mismo modo y que basta con una medida uniforme y universal para poner a prueba el aprendizaje de los
alumnos.
Ejercicio N3:
El instituto superior Jos Pardo ha evaluado mediante un test de inteligencias mltiples a 40 alumnos del
rea de diseo grfico para medir el nivel de desarrollo de la inteligencia espacial, donde se encontr la
siguiente frecuencia:

13.8
14.6
16.8
14.6
16.1

16.4
15.8
12.6
17.2
14.5

45.0
14.0
13.8
14.2
13.5

13.2
14.7
17.6
14.7
14.2

14.4
13.6
16.3
13.5
15.0

12.5
14.8
11.9
15.3
15.6

14.9
15.2
15.4
14.0
14.5

15.7
14.4
16.6
13.5
12.8

1.1 Frecuencias relativas:


Se obtiene dividiendo la frecuencia absoluta entre el nmero de elementos de la distribucin.
Se representa f/n
Donde:
f = frecuencia absoluta.
n = nmero total de elementos (tamao de la muestra).
La suma de todas las frecuencias relativas deben ser igual a 1.

1.2 Frecuencia porcentual:


Es la que se obtiene multiplicando cada frecuencia relativa de la distribucin de frecuencias por 100, el
smbolo que utilizamos para representar este tipo de frecuencia es: f%.
f% = (f / n) * 100

1.3 Frecuencia acumulada:


Se obtienen sumando sucesivamente las frecuencias absolutas de cada clase, se le representa con el
smbolo F.

1.4 Frecuencias porcentuales acumuladas:


Se obtienen sumando sucesivamente las frecuencias porcentuales de cada clase, se le representa con
el smbolo F%.

CASO EJEMPLO: del caso expuesto en el ejemplo anterior, sobre el test tomado a 50 nios para
determinar la capacidad de resiliencia, se obtuvo la siguiente tabla de distribucin de frecuencias:
Intervalos
73  79
79  85
85  91

Frecuencia (fi)
2
6
8

91
97
103
109

 97
 103
 109
 115

11
13
8
2
n = 50

Se pide hallar:
a. Frecuencia relativa.
b. Frecuencia porcentual.
c. Frecuencia acumulada.
d. Frecuencia porcentual acumulada.
Intervalos
73  79
79  85
85  91
91  97
97  103
103  109
109  115

fi
2
6
8
11
13
8
2
n = 50

f/n
0.04
0.12
0.16
0.22
0.26
0.16
0.04
f/n = 1

f%
4
12
16
22
26
16
4
f% = 100

F
2
8
16
27
40
48
50

F%
4
16
32
54
80
96
100

Interpretacin:
Hay 2 nios con capacidad de resiliencia menor a 79 puntos.
Hay 40 nios con capacidad de resiliencia menor a 103 puntos.
El 4% de los nios tienen una capacidad de resiliencia menor a 79 puntos.
El 80% de los nios tienen una capacidad de resiliencia menor a 103 puntos.

AUTOEVALUACION Capitulo 1
I.- Los resultados de las evaluaciones aplicadas a nios hiperactivos, se muestran a continuacin:
64
59
75
36
74
63
81
62
95
82
73
44
69
30
52
43
67
61
77
68
38
75
69
79
75
66
76
84
63
87
39
65
72
52
72
50
38
53
82
58
89
73
63
48
47
53
55
75
59
70
84
95
87
63
43
59
Elaborar la tabla de distribucin de frecuencias, absolutas (fi), relativas (f/n), porcentuales (f%),
acumuladas absolutas (Fi), acumuladas porcentuales (F%) y su marca de clase (xi). Responder:
1. Cuantas clases o intervalos son necesarios, es decir cuanto es el valor de k:
a) 5
b) 6
c) 7
d) NA
2. De cuanto es la amplitud, es decir cuanto es el valor de C:
a) 8
b) 10
c) 12
d) NA
3. Cunto es el valor de la frecuencia acumulada (F) en el tercer intervalo:
a) 16
b) 24
c) 12
d) NA
4. La marca de clase (x) en el intervalo 5 es de:
a) 63
b) 73
c) 67
d) NA
5. Que porcentaje de nios tuvo un resultado menor a 68?
a) 54%
b) 16%
c) 70%
d) NA
6. Cuantos nios tuvieron resultados menores a 88?
a) 45 nios
b) 56 nios
c) 53 nios
d) NA
7. Que porcentaje de nios tuvo un resultado menor a 48?
a) 54%
b) 16%
c) 70%
d) NA
8. Cuantos nios tuvieron resultados menores a 78?
a) 45 nios
b) 56 nios
c) 53 nios
d) NA
II. Los resultados de las evaluaciones aplicadas a adolescentes hiperactivos, se muestran a continuacin:
18
25
26
31
31
30
34
37
42
41
19
26
26
30
32
46
35
34
38
43
19
25
28
30
46
33
37
35
39
44
22
26
28
47
30
34
36
36
40
45
20
17
23
24
27
23
24
25
28
29
29
30
30
29
28
46
Elaborar la tabla de distribucin de frecuencias, absolutas (fi), relativas (f/n), porcentuales (f%),
acumuladas absolutas (Fi), acumuladas porcentuales (F%) y su marca de clase (xi). Responder:
9. Cuantas clases o intervalos son necesarios, es decir cuanto es el valor de k:
a) 5
b) 6
c) 7
d) NA

10. De cuanto es la amplitud, es decir cuanto es el valor de C:


a) 5
b) 8
c) 10
d) NA
11. Cunto es el valor de la frecuencia acumulada (F) en el cuarto intervalo:
a) 25
b) 38
c) 46
d) NA
12. La marca de clase (x) en el intervalo 3 es de:
a) 27.5
b) 37.5
c) 47.5
d) NA
13. Que porcentaje de adolescentes tuvo un resultado menor a 35?
a) 45%
b) 68%
c) 82%
d) NA
14. Cuantos nios tuvieron resultados menores a 45?
a) 50 nios
b) 51 nios
c) 52 nios
d) NA
15. Que porcentaje de nios tuvo un resultado menor a 30?
a) 7%
b) 18%
c) 45%
d) NA
16. Cuantos nios tuvieron resultados menores a 40?
a) 25 nios
b) 38 nios
c) 46 nios
d) NA

CLAVE DE RESPUESTAS Capitulo I


ITEM
1
2
3
4
5
6
7
8

RESPUESTA
c
b
a
b
a
c
b
a

ITEM
9
10
11
12
13
14
15
16

RESPUESTA
c
a
b
a
b
b
c
c

CAPTULO II
ANLISIS E INTERPRETACIN DE DATOS CON EXCEL

CONTENIDO:
1.
2.
3.
4.
5.

Excel como herramienta para el diseo y clculos de tabla de frecuencias.


Anlisis comparativo de los intervalos de una clase a travs del Histograma de Frecuencias.
Anlisis e interpretacin de representaciones Grficas: Polgono de Frecuencias.
Anlisis Porcentual de una muestra a travs de grficos circulares en MS Excel.
Desarrollo de casos y ejercicios prctico.

COMPETENCIAS:
1. Conceptuales: aprender a interpretar distintos grficos en el anlisis de datos.
2. Procedimentales: aplicar el Excel como herramienta para el estudio y anlisis de casos.
3. Actitudinales: identificar los diversos grficos estadsticos como herramientas de anlisis e investigacin.

EXCEL COMO HERRAMIENTA PARA EL DISEO Y CLCULOS DE TABLA DE FRECUENCIAS.

MICROSOFT EXCEL - COMO HERRAMIENTA


Barra de ttulo
Barra de mens
Barra de Herramientas

INGRESO DE DATOS
El ingreso de datos por medio del teclado es muy similar al uso de una mquina de escribir, pero se deben
tener en cuenta:
Los datos slo se ingresan en la celda activa.
Excel guardar en la celda el ltimo dato digitado.
Los datos alfanumricos se alinean a la izquierda de la celda en uso.
Los datos numricos se alinean a la derecha de la celda en uso.
FORMULAS
Es la secuencia de valores, referencias de celdas, nombres, funciones u operaciones que producen un
nuevo valor a partir de valores existentes.
Toda formula debe empezar con el signo igual (=), no se digitan espacios en blancos en las operaciones.
OPERACIONES ENTRE CELDAS
Permite relacionar contenidos numricos de dos o ms celdas, de tal manera que al cambiar las cifras que
estas contienen, tambin cambian los resultados.
Las operaciones que pueden realizarse son:
Suma
+
Resta
Multiplicacin
*
Divisin
/

Ejemplo:
Ingrese el nmero 5 en la celda A1 y el nmero 3 en la celda B1, a continuacin realice las operaciones
antes mencionadas del siguiente modo:

3
4
5
6

A
Suma
Resta
Multiplicacin
Divisin

B
= B1 + C1
= B1 - C1
= B1 * C1
= B1 / C1

Recuerde que, si tiene que realizar ms de una operacin matemtica en la misma formula, debe usar
parntesis para agrupar las operaciones.
Por ejemplo:
Por ejemplo:
Por ejemplo:

= (B1 + C1) / 2
= (3 * (B1 + C1) / 2) - 10
= (B1 + C1) / 2

REFERENCIA O FIJACIN DE CELDAS


Una referencia identifica una celda o un grupo de celdas en una hoja de trabajo. Las referencias le dicen a
Excel que celdas debe tomar en cuenta para encontrar los valores que usted us en la frmula.
R. ABSOLUTA: Se da cuando la columna y la fila han sido fijadas.

Fija la celda

Ejm: $E$7

2. Representaciones Grficas
Las representaciones grficas cumplen un rol muy importante, puesto que basta mirar una grfica para
entender con facilidad los cambios en las variables involucradas.
ANLISIS COMPARATIVO DE LOS INTERVALOS DE UNA CLASE A TRAVS DEL HISTOGRAMA DE
FRECUENCIAS.

HISTOGRAMAS DE FRECUENCIAS.Para realizar este grfico utilizamos un sistema de coordenadas bidimensionales; se acostumbra colocar los
valores de los intervalos en el eje horizontal y en el eje vertical se colocan las frecuencias absolutas.
El histograma de frecuencias se representan mediante rectngulos cuyas bases son cada uno de los
intervalos de una distribucin de frecuencias que se encuentran localizadas en el eje horizontal y cuyas
alturas son las respectivas frecuencias absolutas de la tabla de distribucin.
CASO EJEMPLO: en el caso ejemplo anterior, obtuvimos la tabla de frecuencias:
Intervalos
73  79
79  85
85  91
91  97
97  103
103  109
109  115

Frecuencia (fi)
2
6
8
11
13
8
2

Marca de clase (xi)


76
82
88
94
100
106
112

Realizando el grfico de histograma de frecuencias tenemos:

(fi)

Intervalos
ANLISIS E INTERPRETACIN DE REPRESENTACIONES GRFICAS: POLGONO DE FRECUENCIAS.

POLIGONO DE FRECUENCIAS.Procedemos de manera semejante a la realizada por el histograma de frecuencias en lo que se refiere a la
determinacin de la escala vertical y horizontal.

Para este grfico las bases son cada uno de las marcas de clase de la distribucin de frecuencias, es decir
las localizadas en el eje horizontal y las alturas son las respectivas frecuencias absolutas de la tabla de
distribucin.
EJEMPLO: con los datos que realizamos el grafico del histograma, realizamos ahora el polgono de
frecuencias, este grfico suavizado, lo llamamos curva normal.

(fi)

Marca de clase
Si suavizamos las lneas del grfico, obtenemos:

ANLISIS E INTERPRETACIN DE REPRESENTACIONES GRFICAS: POLGONO DE FRECUENCIAS.

GRAFICOS CIRCULARES.Por medio de sectores circulares, tambin se representan las categoras de las variables cualitativas, que
nos muestran el rea, cantidad y/o porcentaje que este representa.
EJEMPLO: con los siguientes resultados:
coeficiente
alto
medio
bajo

personas
10
32
8

Realizamos un grfico circular para apreciar el porcentaje que representa cada uno.

GRAFICANDO CON MICROSOFT EXCEL


A) Si desea realizar el histograma de frecuencias:
1.- Crear la tabla, o la distribucin de frecuencias con los datos
desean graficar.
Por ejemplo:

que

se

2.- Seleccione la tabla.


3.- Elegir del men Insertar la opcin Grfico. O presionar el
botn
Asistente para grficos de la barra de herramientas.
4.- En seguida se muestra el asistente para grficos.
a) En el primer paso se elige el tipo de grfico que se emplear.
Seleccione el grafico de Columnas y en los Subtipos de grfico, seleccione Columnas agrupadas.

b) Presione el botn Siguiente.


c) Visualizar el grfico.
fi
8
7
6
5
4

fi

3
2
1
0
20-30

30-40

d) Presione el botn siguiente.

40-50

50-60

60-70

70-80

e) Colocar un titulo a si grfico, como: Histograma de frecuencias; colocar un nombre para los valores
del eje (X), como: intervalos o clases; y colocar un nombre para los valores del eje (Y), como:
frecuencias. En la ficha Leyenda, si gusta puede quitarla desactivando en el check Mostrar leyenda.
f) Presione el botn siguiente.
g) Presione el botn finalizar.
B) Si desea realizar el Polgono de frecuencias:
1.- Crear la tabla, o la distribucin de frecuencias con los datos que se desean graficar.
Por ejemplo:

2.- Seleccione la tabla.


3.- Elegir del men Insertar la opcin Grfico. O presionar el botn Asistente para grficos de la barra de
herramientas.
4.- En seguida se muestra el asistente para grficos.
e) En el primer paso se elige el tipo de grfico que se emplear.
Seleccione el grafico de Lneas y en los Subtipos de grfico, seleccione Lneas o Lneas con
marcadores.
f) Presione el botn Siguiente.
g) Presione nuevamente el botn Siguiente.
h) Colocar un titulo a si grfico, como: Polgono de frecuencias; colocar un nombre para los valores del
eje (X), como: intervalos o clases; y colocar un nombre para los valores del eje (Y), como:
frecuencias. En la ficha Leyenda, si gusta puede quitarla desactivando en el check Mostrar leyenda.
i) Presione el botn Siguiente.
j) Presione el botn Finalizar.
C) Si desea realizar el Histograma junto con el Polgono de frecuencias en el mismo grfico:

1.- Crear la tabla, o la distribucin de frecuencias con los datos que se desean graficar.
Por ejemplo:

2.- Seleccione la tabla.


3.- Genere el grafico de columnas as como se indico en el tema de grafico de columnas correspondiente.
Una vez listo el grfico,
4.- Vamos a aadir la lnea es decir, el Polgono de frecuencias.
a) Seleccione nuevamente las celdas que contienen los datos a graficar.
b) Pon el mouse en el borde del rango seleccionado y manteniendo presionado el botn izquierdo del
mouse arrstralo hasta superponerlo en el grafico de columnas que ya tiene listo y suelta el mouse.
c) Aparecer una nueva serie de columnas, da un clic izquierdo en cualquiera de estas nuevas
columnas que aparecieron.
d) Ahora da clic derecho sobre esa columna y:
a. Selecciona Tipo de grfico...
b. Dirgete a la ficha Tipos personalizados.
c. Selecciona el tipo de grfico Lneas y columnas 1.
d. Presiona el botn Aceptar.

DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS


1. Se tomo una muestra aleatoria a un grupo de estudiantes universitarios, para medir su nivel de
concentracin, los datos obtenidos de dicha prueba son:
13.1

16.5

15.1

15.1

14.1

19.8

22.1

20.1

22.5

17.1

16.1

14.1

15.1

20.1

12.1

12.1

12.5

8.5

11.3

9.1

21.5

17.3

20.1

12.5

14.1

16.1

9.5

16.1

13.1

19.1

14.1

15.1

a) Elaborar la tabla de distribucin de frecuencias.


En Excel en la columna A digite todos los valores que tiene en la tabla anterior, luego seleccione los
que esta en la barra de herramientas,
datos digitados y presione el botn ordenar
inmediatamente estos datos se ordenaran de menor a mayor, Luego al costado comience a trabajar
las formulas para obtener los valores necesarios y armar la tabla de frecuencias, esto mas o menos
debe lucir as:

Para obtener la tablita sombreada, las formulas que debe digitar son las siguientes, y donde no hay
formula es porque debe digitar el dato redondeado directamente:
n
k
I
C
I'
exec
Vmin

32
=1+3.3*LOG10(C1)
=A32-A1
=C3/D2
=D2*D4
=C5-C3
=A1-E6

6
3
2

Para obtener la tabla de distribucin de frecuencias trabaje las siguientes formulas:


intervalos
=C7 =C10+$D$4
=D10 =C11+$D$4
=D11 =C12+$D$4
=D12 =C13+$D$4
=D13 =C14+$D$4
=D14 =C15+$D$4

f
F
=CONTAR(A1:A2)
=E10
=CONTAR(A3:A6) =F10+E11
=CONTAR(A7:A18) =F11+E12
=CONTAR(A19:A24) =F12+E13
=CONTAR(A25:A29) =F13+E14
=CONTAR(A30:A32) =F14+E15
=SUMA(E10:E15)
=E16/2

f%
=(E10/$E$16)*100
=(E11/$E$16)*100
=(E12/$E$16)*100
=(E13/$E$16)*100
=(E14/$E$16)*100
=(E15/$E$16)*100

F%
=G10
=H10+G11
=H11+G12
=H12+G13
=H13+G14
=H14+G15

x
=(C10+D10)/2
=(C11+D11)/2
=(C12+D12)/2
=(C13+D13)/2
=(C14+D14)/2
=(C15+D15)/2

=SUMA(G10:G15)

b) Elaborar el Histograma y el Polgono de frecuencias (siga las instrucciones de la clase previa, donde
indica como realizar el histograma y polgono)
c) Elaborar un grfico circular que muestre la frecuencia absoluta e indique por cada clase el
porcentaje correspondiente (esto se indica en el grfico).

AUTOEVALUACION Capitulo 2
Se tomo una muestra aleatoria a un grupo de mujeres maltratadas, para medir su grado de autoestima, los
datos obtenidos de dicha prueba son:
14.4

22.9

38.3

19.1

13.8

14.3

11.4

11.5

24.4

14.3

20.5

17.5

26.5

10.3

28.5

30.4

31.5

16.3

22.4

17.1

15.1

15.6

22.1

36.7

13.7

22.6

19.1

25.8

19.9

32.4

24.1

10.8

Elaborar en Excel la tabla de distribucin de frecuencias, y responda:


1. Cuantas mujeres obtuvieron menos de 29.3 puntos?
a) 27
b) 29
c) 30
d) NA
2. Que porcentaje de mujeres tuvo menos de 34.3 puntos?
a) 74 %
b) 84 %
c) 94 %
d) NA
3. La minora de mujeres obtuvo un puntaje entre:
a) 24.3 29.3 puntos
b) 14.3 19.3 puntos
c) 34.3 39.3 puntos
d) NA
4. La mayora de mujeres obtuvo un puntaje entre:
a) 24.3 29.3 puntos
b) 14.3 19.3 puntos
c) 34.3 39.3 puntos
d) NA
5. Que porcentaje representa esa minora de la poblacin?.
a) 32 %
b) 16%
c) 9%
d) NA
6. Que porcentaje representa esa mayora de la poblacin?.
a) 32 %
b) 16%
c) 9%
d) NA
7. Elaborar el Histograma y el Polgono de frecuencias.
8. Elaborar un grfico circular con las frecuencias absolutas y mostrar el porcentaje que representa cada
una de las clases.
CLAVE DE RESPUESTAS Capitulo II
ITEM
1
2
3
4
5
6

RESPUESTA
a
c
c
b
a
b

CAPTULO III
MEDIDAS DE TENDENCIA CENTRAL

CONTENIDO:

1. Aplicacin de la media aritmtica para obtener el promedio de una muestra.


2. Aplicacin de la mediana que divide la muestra en la mitad.
3. Aplicacin de la moda para obtener el dato que ms se repite en una muestra.
4. Desarrollo de casos y ejercicios prcticos.

COMPETENCIAS:

1. Conceptuales: reconocer las medidas de tendencia central (media aritmtica, mediana y moda) como
factores de anlisis de casos.
2. Procedimentales: aplicar el Excel como herramienta para el desarrollo de las medidas de tendencia
central.
3. Actitudinales: identificar las medidas de tendencia central como herramientas de anlisis e investigacin.

APLICACIN DE LA MEDIA ARITMTICA PARA OBTENER EL PROMEDIO DE UNA MUESTRA.


Medidas de Tendencia Central
MEDIA ARITMTICA (promedio): es la ms usual de las medidas de concentracin y la ms conocida. En la
prctica se omite la palabra aritmtica y slo se dice: La media.
Para calcular la media de una serie de datos agrupados en clases o intervalos se usa la siguiente frmula:

Donde:
A: es la marca de clase que se toma como un origen de trabajo, se asume la marca de clase donde la
frecuencia absoluta (fi) tiene el mayor valor.
Adems, se crea una nueva columna (u) que representa la desviacin unitaria, los valores a colocar en
esta columna sern: en el intervalo donde ubicamos A, colocamos 0, a partir de ah los intervalos hacia
arriba iremos disminuyendo valores en uno, es decir 1, -2, -3, -4 as sucesivamente, y los valores de
los intervalos de abajo se irn incrementando en uno, es decir 1, 2, 3, 4 as sucesivamente.
n: es la suma de la frecuencia absoluta (fi), es decir, el tamao de la muestra.
fu: es la suma, de todas las multiplicaciones realizadas con cada frecuencia absoluta (fi) por su respectiva
desviacin unitaria (u).
C: es la amplitud de cada intervalo.
EJEMPLO: sea la distribucin de frecuencias dadas. Calcular La media.
Intervalos

40  50
50  60
60  70
70  80
80  90
A = 65

Frecuencia
(fi)
6
15
38
24
3
n = 86

Marca de clase
(xi)
45
55
65
75
85
C = 10

fu

-2
-1
0
1
2

-12
-15
0
24
6
fu = 3

Reemplazando:
X = 65 +

3
86

10

X = 65.35

Usos de la Media Aritmtica:


1. La media, se usa cuando se necesita una medida de tendencia central, que no vare mucho entre una y
otra muestra extrada de la misma poblacin, esta es la razn para preferirla cuando se desea la
mxima confiabilidad en la estimacin de la media poblacional.
2. Tambin se usa la media cuando la distribucin de frecuencias de los datos es simtrica o tiene poca
asimetra, igualmente cuando se aproxima a la distribucin normal de probabilidades porque esta
distribucin es simtrica.
3. Se calcula la media cuando en un estudio tambin se debe calcular la varianza o la desviacin estndar.

APLICACIN DE LA MEDIANA QUE DIVIDE LA MUESTRA EN LA MITAD.


LA MEDIANA: es el punto que divide la distribucin de los datos en dos partes iguales, por debajo de la
mediana estar la mitad del nmero de casos y por encima de ella estar la otra mitad. La mediana se
designa como Md.
Cuando los datos estn clasificados formando distribucin de frecuencias, debemos realizar lo siguiente:
1.- Calcular las frecuencias acumuladas (Fi).
2.- Determinamos la clase en donde se encuentra la mediana, para esto se hace la divisin: n/2.
Luego, buscamos donde cae este resultado en las frecuencias acumuladas (Fi), esa ser la clase o intervalo
donde estar ubicada la mediana.
3.- Aplicamos la siguiente frmula.

n _ Fi-1
Md = extremo inferior +

2
fi

Donde:
extremo inferior: es el valor de inicio, o el menor valor del intervalo donde cayo el numero que se obtuvo de
la divisin de n/2.
fi: es la frecuencia absoluta del intervalo donde cae la mediana.
C: es la amplitud del intervalo.
Fi-1: es la frecuencia acumulada registrada una posicin antes de la clase o intervalo donde cae la mediana.
EJEMPLO: sea la distribucin de frecuencias dadas. Calcular La mediana.
Intervalos
fi
Fi
28
38
48
58
68
78
88









38
48
58
68
78
88
98

2
7
7
14
15
8
3
n = 56

2
9
16
30
45
53
56

Md

Calculando:
n = 56 = 28
2
2
Luego buscamos en las frecuencias acumuladas (Fi), donde cae el 28
Por lo tanto el intervalo donde esta ubicado la mediana es: 58 -> 68, que es la cuarta clase.
Entonces, nuestro extremo inferior de ese intervalo es 58, y la frecuencia absoluta (fi) es 14.
Sabemos que la amplitud (C) es 10.
El Fi-1 es la frecuencia acumulada de la clase anterior a donde cayo la mediana, es decir si ahora la mediana
cayo en la cuarta clase, el Fi-1 es la frecuencia acumulada en la tercera clase, para este caso es = 16.
Reemplazando:
Md = 58 + (( 56/2) 16) * 10
14
Md = 58 + (28 16) * 10
14
Md = 58 + 8.58
Md = 66.57

Usos de la Mediana:
1.- Se prefiere a la mediana como medida de concentracin, cuando en los datos existen valores extremos
muy grandes o muy pequeos, es decir valores muy altos o muy bajos que obligan a la media aritmtica a
desplazarse a la derecha o a la izquierda del punto medio de la distribucin.
En cambio la mediana seala siempre el punto que divide los datos en dos partes iguales: 50% a un lado
y 50% al otro lado, sin importar donde se halla ese punto.
2.- Cuando simplemente necesitamos conocer si los datos que nos interesan estn dentro de la mitad
superior o inferior de la distribucin de los datos y no tiene importancia saber particularmente su
alejamiento al centro de la distribucin.

APLICACIN DE LA MODA PARA OBTENER EL DATO QUE MS SE REPITE EN UNA MUESTRA.


LA MODA: en un conjunto de datos, la moda es el valor ms repetido y se representa por: Mo.
Cuando los datos estn agrupados formando una distribucin de frecuencias, la moda se calcula por la
formula:
Mo = extremo inferior +

1
1 + 2

1.- Primero se ubica cual es la mayor frecuencia absoluta (fi), esa ser la clase o intervalo donde estar
ubicada la Moda.
Donde:
extremo inferior: es el valor de inicio, o el menor valor del intervalo donde la frecuencia absoluta (fi) tiene el
mayor valor.
1: es la diferencia (resta) de la frecuencia absoluta del intervalo donde cayo la moda menos la frecuencia
absoluta del intervalo anterior a ella.
2: es la diferencia (resta) de la frecuencia absoluta del intervalo donde cayo la moda menos la frecuencia
absoluta del intervalo posterior a ella.
C: es la amplitud del intervalo.
EJEMPLO: sea la distribucin de frecuencias dadas. Calcular La moda.
Intervalos
fi
73  79
79  85
85  91
91  97
97  103
103  109
109  115

2
6
8
11
9
8
2

Mo

Calculando:
La mayor frecuencia absoluta (fi) es el 11, por lo tanto la clase modal es la cuarta, siendo el intervalo: 91 
97.
El extremo inferior es entonces = 91
1 = 11 8 = 3
2 = 11 9 = 2
C=6
Reemplazando:
Mo = 91 +
3
6
3+2
Mo = 91 + 3.6
Mo = 94.6
Usos de la Moda:
1.- Cuando se necesita una estimacin rpida de la tendencia central.
2.- Cuando se desea conocer el punto de mxima frecuencia en una distribucin asimtrica de datos, esto
es el valor ms repetido de un conjunto de datos.

DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS


Clculos de las medidas de tendencia central con Excel como herramienta.

Ejercicio:
De un caso en anlisis, se ha obtenido el siguiente cuadro de distribucin de frecuencias:
intervalos
28
38
38
48
48
58
58
68
68
78
78
88
88
98

f
2
7
7
14
15
8
3
56

F
2
9
16
30
45
53
56

f%
4
13
13
25
27
14
5
100

F%
4
16
29
54
80
95
100

Hallar la media, la mediana y la moda.


Solucin:
Pase los datos al Excel como se vio en la unidad anterior, y calcule la marca de clase y las siguientes
columnas necesarias para que pueda aplicar las formulas de media, mediana y moda respectivamente:

intervalos
28
38
38
48
48
58
58
68
68
78
78
88
88
98

f
2
7
7
14
15
8
3
56

F
2
9
16
30
45
53
56

f%
4
13
13
25
27
14
5
100

F%
4
16
29
54
80
95
100

x
33
43
53
63
73
83
93

u
-4
-3
-2
-1
0
1
2

fu
-8
-21
-14
-14
0
8
6
-43

28
Si se tiene que la amplitud C = 10, entonces:
Media = 73 + (-43 / 56) * 10
Mediana = 58 + ((28 16) * 10) / 14
1 = 15 14 = 1
2 = 15 8 = 7
Moda = 68 + ( 1 / (1 + 7) ) * 10

Los resultados sern:


X
65.32
Me 66.57
Mo 69.25

(trabjelo en Excel con formulas es decir colocando el nombre de la


celda donde figuran dichos datos)
(trabjelo en Excel con formulas es decir colocando el nombre de la
celda donde figuran dichos datos)

(trabjelo en Excel con formulas es decir colocando el nombre de


la celda donde figuran dichos datos)

AUTOEVALUACION Capitulo 3
I. De un caso en anlisis, se ha obtenido el siguiente cuadro de distribucin de frecuencias:
intervalos

x(i)

f(i)

f/n

f%

F%

6.5

9.5

0.06

9.5

12.5

11

0.13

13

19

12.5

15.5

14

12

0.38

38

18

56

15.5

18.5

17

0.19

19

24

75

18.5

21.5

20

0.16

16

29

91

21.5

24.5

23

0.09

32

100

Halle x, u y fu para calcular la media, mediana y moda:


1. La media aritmtica sale:
a) 14.76
b) 15.59
c) 16.01
d) NA
2. La mediana sale:
a) 15
b) 15.5
c) 16
d) NA
3. La moda sale:
a) 14.87
b) 14.21
c) 14.01
d) NA
II. De un caso en anlisis, se ha obtenido el siguiente cuadro de distribucin de frecuencias:
intervalos
f
F
f%
F%
x
15
20
4
4
7
7
17.5
20
25
6
10
11
18
22.5
27.5
25
30
15
25
27
45
30
35
13
38
23
68
32.5
35
40
8
46
14
82
37.5
40
45
5
51
9
91
42.5
45
50
5
56
9
100
47.5
56
100
28
4. La media aritmtica sale:
a) 41.76
b) 38.59
c) 31.96
d) NA
5. La mediana sale:
a) 31.15
b) 35.5
c) 36
d) NA
6. La moda sale:
a) 24.87
b) 29.09
c) 24.01
d) NA

CLAVE DE RESPUESTAS Capitulo III


ITEM

RESPUESTA

CAPTULO IV
MANEJO DE VARIABLES EN UNA INVESTIGACIN

CONTENIDO:
1. SPSS como herramienta de anlisis e interpretacin y entorno de trabajo de SPSS.
2. Definicin de variables independientes y dependientes e ingreso de datos.
3. Tratamiento de los datos o valores perdidos.
4. Medidas de posicin: cuartiles, deciles y percentiles.
5. Mediadas de dispersin: desviacin estndar y varianza.
6. Coeficiente de Variabilidad.
7. Asimetra y Curtosis.
8. Desarrollo de casos y ejercicios prcticos.

COMPETENCIAS:
1. Conceptuales: reconocer al programa SPSS como una herramienta fundamental para el anlisis de
casos.
2. Procedimentales: aplicar el SPSS para el desarrollo y tratamiento de datos.
3. Actitudinales: identificar las ventajas del manejo del software SPSS en el proceso de anlisis e
investigacin.

SPSS - COMO HERRAMIENTA DE ANALISIS


VISORES
El SPSS maneja 2 visores:
Data View (visualizador de datos)
Variable View (donde se definen las variables)

AREA DE TRABAJO
Las celdas son repositorios de datos, NO SE HACEN FORMULAS COMO EN EXCEL.
LA caracterstica principal del entorno de trabajo es que se basa en el principio de la rectangularidad, es
decir que los datos siempre van ha tender a formar un rectngulo.
DEFINICIN DE VARIABLES
Para definir variables se usa el visor Variable View.
En este visor, en las filas estn las variables y las columnas representan las propiedades de cada variable.
Propiedades de una variable:
1. Name: (nombre de la variable)
Restricciones:
No acepta espacios vacos, por ejemplo (apellido paterno).
No acepta como primer carcter un nmero, por ejemplo (1apellido).
No acepta palabras reservadas, por ejemplo (operadores lgicos AND, OR, NOT, etc).
No acepta caracteres especiales, por ejemplo (%, +, -, /, *, @, etc)
2. Type: (tipo de dato de la variable)
Width (ancho o tamao total)
Decimal (cantidad de decimales)
3. Label: (etiqueta)
Se usa para ingresar texto explicativo a la caracterstica de la variable.
Por ejemplo: Name: Sueldo y Label: Sueldo semanal.
4. Values: (valores)
Se codifican las variables cualitativas.
Por ejemplo: Sexo, puede ser femenino (F) y masculino (M), pero para anlisis es necesario
manejarlos como datos tipo numero, por lo tanto se le valores de dicho tipo, como: F0 y a
M 1.
As podemos codificar variables cualitativas a un contexto numrico.
5. Missing: (valores perdidos)
Define los valores perdidos definidos por el usuario.
Por ejemplo: si tenemos registrado las siguientes edades:
20 27 28 200 18 300 15

Apreciamos que hay 2 edades que no tienen lgica, con los cuales se debe haber cometido
algn error, pero la solucin no es arreglarlo a lo que nos parece pudo haber sido, sino, lo
correcto es obviarlos del anlisis y declararlo como valor perdido, para ello recurrimos al
Missing, aqu podemos definir o registrar:
e) Hasta 3 valores discretos (es decir hasta 3 valores sueltos).

200
f)

300

Un intervalo continuo y un valor discreto.


Low

100

Hig

500

Discreto

52

6. Columns: (columna)
Indica el ancho de la columna en el Data View.
7. Align: (alineacin)
Es la alineacin del dato dentro de la celda (Left: izquierda, Center: centro y Right: derecha).
8. Measure: (medida)
Indica el tipo de medida estadstica que emplear ese dato:
a). Nominal: para variables que tendrn valores cualitativos, estos para poder ser medidos
(measure) deben ser de tipo nominal. Por ejemplo: el estado civil (soltero, casado, viudo), el
sexo (masculino, femenino).
b). Ordinal: para variables cuyo valor representa algn orden o posicin en particular. Por
ejemplo: el grado de instruccin (primaria, secundaria, superior, post grado), etapas (nio,
joven, adulto).
c). Scala: para variables cuyo valor es netamente cuantitativas, representan valores del tipo,
netamente numricos. Por ejemplo: la edad (15, 28, 37), los sueldos (1500, 2100, 845, etc).
INGRESO DE DATOS
Una vez que se definieron las variables en el visor Variable View, pasamos al visor Data View, en este
lugar, notamos que aparece en las columnas, las variables registradas o declaradas anteriormente,
comenzamos entonces a digitar los valores correspondientes a cada una de ellas.
GENERANDO TABLAS DE FRECUENCIAS
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y psela a la columna de seleccionados.
5. Presione Aceptar u ok.
CALCULOS DE MEDIDAS DE TENDENCIA CENTRAL
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y pasarla a la siguiente columna (estas variables aparecen listadas por etiqueta,
para cambiarlas a listadas por nombre, hacer lo siguiente:
En el men Edicin, seleccione Opciones, en la ficha General cambiar de Display Labels a Display
Names, presionar Aceptar, en la siguiente ventana vuelva a presionar Aceptar y listo.
5. En la parte inferior de la ventana hay 3 botones, presionar el botn Estadsticos.
6. Activar el check en Mean si desea calcular el promedio o media aritmtica.
Si desea calcular la mediana, active:
Si desea calcular la moda, active:
7. Luego presione Aceptar u ok.
8. Vuelva a presionar ok.
GENERACIN DE GRAFICOS
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias.
4. Seleccione y pase la variable.
5. Presione el botn grficos ubicado en la parte inferior de la ventana, ah puede seleccionar:
Barra.
Pie.
Histograma.
Con curva normal.
6. Luego presione ok.
7. Vuelva a presionar ok.

EJERCICIO A:
Se realizo una encuesta tomando una muestra aleatoria de las familias del nivel socioeconmico B. La
variable de medicin es el nmero de personas fumadoras por familia. Los resultados fueron los siguientes:
2 1 2 2 1 2 4
2 3 2 1 1 1 3
2 2 1 2 1 1 1
3 2 3 1 2 4 2
1 3 4 3 2 2 2
1) Generar la tabla de distribucin de frecuencias.
2) Generar los siguientes grficos:
Histograma de frecuencias con curva normal.
Grfico Pie.

2
4
3
1
1

1
2
2
4
3

1
2
2
1
3

Solucin:
En el visor de variables (Variable View) declare la siguiente variable:
Name: num_fumadores.
Type: numrico.
Label: numero de fumadores.
Values: ninguno.
Missing: ninguno.
Columns: 12.
Align: center.
Measure: scale.
Luego en el visor de datos (Data View) digite todos los datos que estn en la tabla del ejercicio (no es
importante si los datos estn ordenados o no)
Ahora siga los pasos que se indican en los temas de Generar la tabal de frecuencias y generar grficos para
obtener sus resultados.
EJERCICIO B:
Se han tomado los siguientes datos:
Cod_encuesta Estado_civil Nivel_educativo Edad Sueldo_soles Sexo
A1
Soltero
Superior
27
3500
F
A2
Casado
Secundaria
32
1200
M
A3
Soltero
Primaria
22
900
F
A4
Soltero
Superior
28
1500
M
A5
Divorciado
Secundaria
32
1100
F
A6
Casado
Postgrado
37
4500
M
A7
Soltero
Superior
31
2000
F
A8
Viudo
Postgrado
42
3500
F
A9
Casado
Primaria
19
1000
M
Calcular el sueldo promedio o media aritmtica, es decir, La media.
Declarando variables:
1) Name
: Cod_encuesta
Type
: String (Character = 2)
Label
: Codigo de la encuesta
Values
:
Missing
:
Columns : 8
Align
: Center
Measure : Nominal
2) Name
Type
Label
Values
Missing
Columns
Align
Measure
3) Name
Type
Label
Values

: Estado_civil
: Numeric (Width - Ancho = 1) (Decimal Places = 0)
: Estado civil
: 1=soltero (presione Add), 2=casado (presione Add), 3=viudo (presione Add), 4=divorciado
(presione Add).
:
:8
: Center
: Nominal
: Nivel_educativo
: Numeric (Width - Ancho = 1) (Decimal Places = 0)
: Nivel Educativo
: 1=primaria (presione Add), 2=secundaria (presione Add), 3=superior (presione Add),
4=postgrado (presione Add).

Missing
Columns
Align
Measure

:
: 10
: Center
: Nominal

4) Name
Type
Label
Values
Missing
Columns
Align
Measure

: Edad
: Numeric (Width - Ancho = 2) (Decimal Places = 0)
: Edad
:
:
:8
: Center
: Scalar

5) Name
Type
Label
Values
Missing
Columns
Align
Measure

: Sueldo_soles
: Numeric (Width - Ancho = 4) (Decimal Places = 0)
: Sueldo en soles
:
:
:8
: Center
: Scalar

6) Name
Type
Label
Values
Missing
Columns
Align
Measure

: Sexo
: Numeric (Width - Ancho = 1) (Decimal Places = 0)
: Sexo
: 1=femenino (presione Add), 2=masculino (presione Add),
:
:8
: Center
: Nominal

TRATAMIENTO DE LOS DATOS O VALORES PERDIDOS


EJERCICIO C: sean los datos:
Nro_encuesta
Estado_civil
Nivel_educativo
Edad
1
Soltero
Universidad
25
2
Casado
Secundaria
20
3
Soltero
Universidad
40
4
Casado
Secundaria
250
5
Viudo
Post grado
51
6
Casado
Universidad
39
7
Soltero
Universidad
35
8
No responde
Secundaria
23
9
Casado
Universidad
24
10
Soltero
Primaria
18
1) En las variables Estado_civil y edad, defina valores perdidos.
2) Mediante estadsticos descriptivos, obtener la edad promedio y responder Cul es el efecto de registrar
el valore perdido?
Solucin:
Parte 1)
Declarar las variables como lo realizo en los ejercicios anteriores.
En la variable Estado_civil, declare todo normalmente, pero:
En su columna Values, registrar tambin el No responde, es decir:
1 = soltero.
2 = casado.
3 = viudo.
4 = no responde.
Y en su columna Mising registrar el 4 (ya que es el valor perdido).
En la variable Edad, declare todo normalmente, pero:
En su columna Mising registrar el 250 (ya que es el valor perdido).
Parte 2)
Calcule el promedio, o la media de las edades, como se indico en el tema Clculos de medida de
tendencia central en SPSS, analice el resultado y podemos responder a la pregunta planteada.
Rpta: Al registrar valor perdido este participa dentro del conteo, pero el dato incoherente no es tomado
en cuenta en el proceso de calculo por lo que las medidas de tendencia central son mas acertadas y no
son desviadas de la realidad.

OTROS ANLISIS:
a) El promedio de las edades considerando como valor perdido el 250 es = 30.56
b) Suponiendo que asumimos que hubo un error de digitacin y la edad 250 es 25 (es decir lo corregimos),
calculamos nuevamente el promedio de las edades y obtenemos como media = 30
c) Si no declaramos valores perdidos, nuestra media ser = 52.50
Observacin: Es bueno analizar todas las situaciones posibles, como lo acabamos de hacer para poder
tomar una decisin adecuada al momento de evaluar resultados.

Medidas de Posicin o Cuantiles


CUANTILES: como una consecuencia del estudio de la mediana, es fcil ampliar este concepto a otros
estadgrafos que dividen a los datos en otras proporciones y no slo en mitades como lo hace la mediana.
Estas medidas se llaman cuantiles. Los cuantiles ms usados son los cuartiles, deciles y percentiles. Se
usan frecuentemente para describir el comportamiento de una poblacin. Es objetivo de ellas es determinar
las medidas de posicin que no se hayan en el centro de la muestra.
Cuartiles.- valores que dividen a un conjunto de datos en 4 partes iguales.

25%

Q1

25%

25%

Q2

Q3

25%

50%
75%
Q1: es el valor que representa delas observaciones.
n _ Fi-1
Q1 = extremo inferior +

4
fi

Q3: es el valor que representa delas observaciones.


3n _ Fi-1
Q3 = extremo inferior +

4
fi

Percentiles.- valores que dividen a un conjunto de datos en 100 partes iguales. Por lo tanto, el valor que en
la formula figura como r, puede variar del 1 al 100 segn el percentil que desea hallar.
rn _
Pr = extremo inferior +

Fi-1

100
fi

4. Medidas de Dispersin
DESVIACIN ESTANDAR: es la ms confiable de las medidas de dispersin. Tambin se le conoce con el
nombre de desviacin tpica.

EJEMPLO: dada la siguiente distribucin de frecuencias:


2

Intervalos

fi

fu

fu







3
5
7
4
1
n = 20

-2
-1
0
1
2

-6
-5
0
4
2
fu = -5

12
5
0
4
4
2
fu = 25

20
30
40
50
60

30
40
50
60
70

Reemplazando:
S = 10 *

25
20

S = 10 *
S = 10.9

-5
20

1.25 - 0.0625

VARIANZA: se define como el cuadrado de la desviacin estndar. Para calcular la varianza, primero se
calcula la desviacin estndar. Se representa por:
2

EJEMPLO: dada la siguiente distribucin de frecuencias:


2

Intervalos

fi

fu

fu










1
11
11
13
22
9
6
7
n = 80

-4
-3
-2
-1
0
1
2
3

-4
-33
-22
-13
0
9
12
21
fu = -30

16
99
44
13
0
9
24
63
2
fu = 268

51
57
63
69
75
81
87
93

57
63
69
75
81
87
93
99

Calcular la desviacin estndar y la varianza.


Reemplazando:
S= 6

268
80

-30
80

S = 6 *
115.53
S = 10.75
2

S = 115.56

VARIABILIDAD RELATIVA O COEFICIENTE DE VARIABILIDAD: este ndice de dispersin es muy til


cuando se quiere comparar la variabilidad entre 2 o ms distribuciones de datos. Se calcula con la formula:

EJEMPLO:
Se aplica una misma prueba de evaluacin en un colegio, a 3 secciones: A, B y C. Con las puntuaciones se
calculan los rendimientos medios (promedio) que son:
Seccin A  X = 48
Seccin B  X = 36.5
Seccin C  X = 29.8
Se calculan las dispersiones de los puntajes, obteniendo una desviacin estndar de 10 puntos, igual para
los 3 grupos.
Queremos saber cual de los 3 grupos tiene un rendimiento ms homogneo, es decir con menos dispersin.
Grupo A:
CV = (10/48) * 100
= 20.83%
Grupo B:
CV = (10/36.5) * 100 = 27.40%
Grupo C:
CV = (10/29.8) * 100 = 33.56%

Respuesta: Concluimos el anlisis, verificando que, el que tiene menor porcentaje de coeficiente de
variabilidad es la seccin A, por lo tanto podemos afirmar que esta seccin es la ms homognea, ya que su
dispersin es menor.
Ejemplo 1: Se aplica una prueba de tolerancia al estrs a los empleados administrativos de tres sucursales
del banco Santander y estos fueron los resultados:
Sucursal
Barranco
Comas
San Isidro

Media Aritmtica
39.6
42.8
36.5

Desviacin estndar
9.23
8.99
9.21

Primero debemos obtener la desviacin estndar promedio de los 3 grupos de comparacin.


S promedio= (9.23+8.99+9.21)/3
S promedio= 9.14
Ahora con esta desviacin estndar promedio se va a reemplazar en la frmula para cada uno de los grupos
de comparacin:
Grupo Barranco :

CV= (9.14/39.6)*100

= 23.08 %

Grupo Comas

CV= (9.14/42.8)*100

= 21.36 %

Grupo San Isidro :

CV= (9.14/36.5)*100

= 25.04 %

Al final podemos concluir que el grupo ms homogneo es el de Comas debido a que su porcentaje de
dispersin de 21.36 % es menor y en contraparte el grupo ms heterogneo es el de San Isidro ya que su
dispersin de 25.04 % es la mayor.

5. Asimetra y Curtosis
El objetivo es analizar las deformaciones horizontales y verticales de las curvas de frecuencia.
ASIMETRIA: es la deformacin horizontal de las curvas de frecuencia.
1) Si el coeficiente de asimetra da un valor negativo (<0), la curva tendr la siguiente forma.

2) Se llama curva simtrica si el coeficiente de asimetra es igual a 0 (=0), la curva tendr la siguiente forma.

3) Si el coeficiente de asimetra da un valor positivo (>0), la curva tendr la siguiente forma.

Se puede calcular un coeficiente de asimetra del siguiente modo:


AS =

X - Mo
S

CURTOSIS: es la deformacin vertical de una curva de frecuencia.


1) Una curva que presenta un apuntamiento muy pronunciado se llama leptocrtica.

2) Una curva achatada, que tiene muy poco apuntamiento se llama platicrtica.

3) Una curva que tiene una forma intermedia entre las 2 anteriores se llama mesocrtica.

Al calcular el coeficiente de curtosis que llamamos (K), este nos puede dar valores que oscilan dentro de
cierto rango, decimos as, que:
El valor de K nos indica lo siguiente:
a) Si K tiende a 0.5 se dice que la curva es leptocrtica.
b) Si K tiende a 0.25 la curva es mesocurtica.
c) Si K tiende a 0 se dice que la curva es platicrtica.

Platicrtica

0.125

0.25

Mesocrtica

0.375

0.5

Leptocrtica

DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS


1. Registrar en SPSS los siguientes datos:
Cdigo
Sexo
A
Masculino
B
Masculino
C
Femenino
D
Masculino
E
Femenino

Area_Laboral
Contabilidad
Logstica
Sistemas
Logstica
Contabilidad

Sueldo
1200
9
2000
1000
1500

Recuerde que por cada variable debe registrar necesariamente: el Name (nombre), Type (tipo de dato),
Label (etiqueta), Values (valores), esto, solo para las variables que necesiten, y la Measure (medida).
Para la variable Sexo, considere los siguientes Values (valores):
0 = Masculino
1 = Femenino.
Para la variable Area_Laboral, considere los siguientes Values:
1 = Contabilidad
2 = Logstica
3 = Sistemas
a) Calcular el promedio o media aritmtica (mean) de los sueldos: .........
b) Considere el sueldo de 9 como valor perdido (Mising) y calcule el nuevo promedio:.........
c) Cual de los dos asume que sera ms apropiado asumir como promedio en su anlisis:
2. Aplicando el tema de VARIABILIDAD RELATIVA O COEFICIENTE DE VARIABILIDAD, resuelva: Los
pacientes del 5to piso obtuvieron en su test una media de 29,87 y una S de 6,932, adems los pacientes del
7mo piso obtuvieron en su test una media de 31,72 y una S de 6,851. Cul de los 2 pisos presenta los
pacientes ms homogneos y los ms heterogneos? y Por qu?
Solucin:
Calculamos los respectivos coeficientes de variabilidad:
Para el 5to piso CV = 6.932 / 29.87 = 23.21 %
Para el 7mo piso CV = 6.851 / 31.72 = 21.60 %
Por lo tanto el grupo mas homogneo es el del 7mo piso ya que su porcentaje de dispersin es
menor comparado con el del 5to piso que es el mas heterogneo por su porcentaje de dispersin mayor.

AUTOEVALUACION Capitulo 4
I. Los pacientes de la sala 2 obtuvieron en su test una media de 37,61 y una S de 7,931, adems los
pacientes de la sala 3 obtuvieron en su test una media de 31,65 y una S de 6,983.
1. Cuanto es el coeficiente de variabilidad de la sala 2:
a) 20.08
b) 21.09
c) 22.10
d) NA
2. Cuanto es el coeficiente de variabilidad de la sala 3:
a) 20.08
b) 21.09
c) 22.10
d) NA
3. Cul de las 2 salas presenta los pacientes ms homogneos? y Por qu?
a) Sala 2
b) Sala 3
c) NA
II. Los pacientes del 9no piso obtuvieron en su test una media de 29,87 y una S de 6,932, adems los
pacientes del 10mo piso obtuvieron en su test una media de 31,72 y una S de 6,851. Cul de los 2 pisos
presenta los pacientes ms homogneos y los ms heterogneos? y Por qu?
4. Cuanto es el coeficiente de variabilidad del 9no piso:
a) 22.97
b) 23.09
c) 23.21
d) NA
5. Cuanto es el coeficiente de variabilidad del 10mo piso:
a) 21.57
b) 21.60
c) 21.90
d) NA

6. Cul de los 2 pisos presenta los pacientes ms heterogneos? y Por qu?


a) Piso 9
b) Piso 10
c) NA
III. Los pacientes de la sala NORTE obtuvieron en su test una media de 37,61 y una S de 7,931, adems los
pacientes de la sala ESTE obtuvieron en su test una media de 31,65 y una S de 6,983. Cul de las 2 salas
presenta los pacientes ms homogneos y los ms heterogneos? y Por qu?
7. Cuanto es el coeficiente de variabilidad de la sala NORTE:
a) 20.08
b) 21.99
c) 22.10
d) NA
8. Cuanto es el coeficiente de variabilidad de la sala ESTE:
a) 21.08
b) 22.06
c) 23.10
d) NA
9. Cul de las 2 salas presenta los pacientes ms heterogneos? y Por qu?
a) Sala NORTE
b) Sala ESTE
c) NA
IV. En SPSS:
Cod_pac Condicin Edad Monto_total
P001
Asociado
8
215
P002
Asociado
10
310
P003
Libre
14
280
P004
Interno
12
300
P005
Libre
9
250
P006
Asociado
12
290
P007
Interno
13
250
P008
Interno
10
310
P009
Interno
15
310

N_cuotas
2
3
1
400
2
1
2
2000
3

Declare o trabaje con Values (los que usted asuma o desee) en la variable Condicin:
10. Calcular el promedio o media aritmtica (mean) de las N_cuotas:
a) 268.22
b) 304.25
c) 425.04
d) NA
11. Considere valores perdidos en N_cuotas (400 y 2000) como Mising y calcule el nuevo promedio:
a) 1
b) 1.5
c) 2
d) NA

CLAVE DE RESPUESTAS Capitulo IV


ITEM

RESPUESTA

10

11

CAPTULO V
GENERACIN DE CLCULOS Y ANLISIS DE RESULTADOS

CONTENIDO:
1. Generacin de clculos con la calculadora de SPSS.
2. Clculos de coeficiente de asimetra.
3. Desarrollo de casos y ejercicios prcticos.
4. Transformacin de datos.
5. Recodificacin de variables o segmentacin de rangos.
6. Ordenar y agrupar casos.

COMPETENCIAS:
1. Conceptuales: reconocer los procesos de clculos, transformacin, recodificacin y agrupacin de
casos.
2. Procedimentales: aplicar SPSS en la transformacin, recodificacin, segmentacin y agrupacin de
casos para el anlisis respectivo.
3. Actitudinales: identificar las ventajas del manejo del software SPSS en el proceso de anlisis e
investigacin.

42

APLICANDO SPSS
CALCULOS DE COEFICIENTE DE ASIMETRIA
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y pasarla a la siguiente columna.
5. En la parte inferior de la ventana hay 3 botones, presionar el botn Estadsticos.
6. Activar el check en skewness para calcular el coeficiente de asimetra.
7. Luego presione Aceptar u ok.
8. Vuelva a presionar ok.
NOTA: En los resultados sale:
Std. Error of Skewness  eso indica el ancho de la campana (medida horizontalmente), cuanto
mayor sea el numero, la campana ser mas ancha.

TRANSFORMANDO DATOS (Men Transformar)


Transformar, contiene funciones y procedimientos modulares que permiten la manipulacin y
modificacin de los datos.
La opcin COMPUTE, permite realizar clculos y operaciones en las variables, obteniendo nuevas
variables.
Ejemplo: Si tenemos los siguientes datos
Peso
58.5
63.2
70.8

Talla
1.45
1.67
1.55

Y necesitamos hallar el ndice de masa corporal (Imc) de cada uno, para lo cual sabemos que: Imc =
peso / talla
Podemos con la opcin Compute, realizar dicho calculo (colocando la formula correspondiente) y
automticamente nos generara una nueva variable Imc, con los resultados respectivos.
Peso
58.5
63.2
70.8

Talla
1.45
1.67
1.55

La ventana del Compute, se presenta as:

43

Imc
40.34
37.84
45.67

Variable destino:
Aqu, se coloca el nombre que llevara la nueva columna, es decir la nueva variable que se generara
con la formula, funcin u otros que aplique.
Tipo y etiqueta:
Aqu, se coloca el tipo de dato que tendr la nueva variable y en label o etiqueta, se coloca la
referencia o nombre completo de la variable.
Expresiones numricas:
Aqu, se digitan las formulas, u operaciones a realizar; el resultado se mostrar en la variable que
declaro en el sector correspondiente.
Calculadora del SPSS:
B) Operadores aritmticos (+, -, *, /, ** (potencia)).
C) Operadores de comparacin (<, >, <=, >=, =, ~= (diferente)).
D) Operadores lgicos (& (y), | (o), ~(negacin)).
E) Operador de asociacin ( ).
F) Teclado numrico.
Lista de funciones del SPSS:
SPSS tiene ms de 70 funciones, por ejemplo Mean (media), pero esta funcin calcula el promedio
de una fila, mas no el promedio de la muestra.
Si lo que desea es el promedio muestral, debe realizar los clculos como se indica en los Clculos de
medidas de tendencia central.
El botn IF...:
Permite ingresar al mdulo donde se define las condiciones.
DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS
EJERCICIO 1:
Registrar los siguientes datos:
Nombre Practica_1 Practica_2 Practica_3 Ex_final
Jose
18
12
17
16
Carla
14
9
16
10
Beto
7
14
12
12
Pedro
11
8
10
12
Obtener las columnas, o nuevas variables:
e) Promedio de prcticas (pp).
f) Nota final (nf)

44

Donde: pp = (practica_1 + practica_2 + practica_3) / 3


nf = (pp + 2 * ex_final) / 3
Solucin a):
1. Men transformar.
2. Compute.
3. En Variable destino (Target Variable), colocar pp.
4. En Tipo etiqueta (Type & label), colocar en Type: numrico, y en Label: promedio de
practicas.
5. En expresiones numricas, digitar: (practica_1 + practica_2 + practica_3) / 3
6. Presionar ok.
Solucin b):
1. Men transformar.
2. Compute.
3. Presionar el botn Reset, para que se borren todos los datos y poder registrar los nuevos
valores.
4. En Variable destino (Target Variable), colocar nf.
5. En Tipo etiqueta (Type & label), colocar en Type: numrico, y en Label: nota final.
6. En expresiones numricas, digitar: (pp + (2 * ex_final)) / 3
7. Presionar ok.
EJERCICIO 2:
Usando la tabla del ejercicio anterior, se desea obtener la variable X cuyo valor ser la desviacin de
la variable ex_final respecto a su media, y la variable Y, cuyo valor ser el cuadrado de dichas
desviaciones obtenidas.
Solucin para hallar la variable X:
1. Calcular la media de la variable ex_final.
Men Anlisis.
Estadsticos descriptivos.
Frecuencias.
Seleccionamos y pasamos la variable nf.
Presionamos el botn estadsticos.
En la ventana que aparece, marcamos Mean (media).
Presionamos ok.
Volvemos a presionar ok.
En los resultamos que se muestran, apuntar, el valor que se obtuvo como media.
2. Men transformar.
3. Compute.
4. Presionar el botn Reset, para que se borren todos los datos y poder registrar los nuevos
valores.
5. En Variable destino (Target Variable), colocar X.
6. En Tipo etiqueta (Type & label), colocar en Type: numrico, y en Label: desviacin.
7. En expresiones numricas, calculamos la diferencia (resta) del ex_final menos su media (que
acabamos de hallar), esto nos indicar cuanto se aleja la nota del ex_final de su respectiva
media, es decir digitamos: ex_final media.
8. Presionar ok.
Solucin para hallar la variable Y:
1. Men transformar.
2. Compute.
3. Presionar el botn Reset.
4. En Variable destino (Target Variable), colocar Y.
5. En Tipo etiqueta (Type & label), colocar en Type: numrico, y en Label: desviacin al
cuadrado.
6. En expresiones numricas, calculamos el cuadrado de la diferencia o resta anterior que
hallamos, es decir digitamos: (ex_final media) ** 2 , o tambin podemos colocar: X ** 2.
7. Presionar ok.

45

EJERCICIO 3:
Usando la tabla del ejercicio anterior, calcular el pp1 (promedio de practicas) pero usando Funciones.
Solucin:
1. Men transformar.
2. Compute.
3. Presionar el botn Reset.
4. En Variable destino (Target Variable), colocar pp1.
5. En Tipo etiqueta (Type & label), colocar en Type: numrico, y en Label: nuevo promedio de
practicas.
6. En la lista de funciones buscamos la funcion Mean (practica_1, practica_2, practica_3)
7. Presionar ok.
NOTA: como ya se menciono anteriormente, Mean como funcin, calcula el promedio de las filas de
datos, mas no de las columnas. En cambio el Mean que se obtiene de las frecuencias, si es el
promedio de columnas.
RECODIFICACION DE VARIABLES (Segmentacin en rangos)
Permite establecer cdigos a criterios en particular del analista, con propsitos especficos.
Por ejemplo: Se tiene la variable edad; esta variable se puede segmentar en estratos, tomando un
criterio en particular, es decir puede ser:
Edades: 8, 9, 9, 10, 12, 14, 16, 21, 21, 22, 23, 25, 27, 28, 30, 30, 32, 34

Los podemos segmentar en 3 estratos


Nuestros rangos quedaran del siguiente modo:
Edades
Desde la edad mas baja hasta  15
15  25
26  mas

Cdigo
1
2
3

Una vez definida la variable cdigo, esta pude asumir valores (values) si el analista lo desea, por
ejemplo, en vez que figure 1,2,3 puede colocar niveles o etapas, donde 1=nio, 2=joven, 3=adulto:
Edades
Nivel
Desde la edad mas baja hasta  15
Nio
15  25
Joven
26  mas
Adulto
EJERCICIO 4:
Registrar los siguientes datos:
Nombre
Fernando
Carlos
Pedro
Vanessa
Alicia
Dora
Augusto

Turno
Maana
Noche
Noche
Maana
Maana
Noche
Maana

Sueldo
500
1500
780
850
980
955
1200

Recodificar la variable sueldo en una nueva variable llamada Rango_sueldo, del siguiente modo:
Sueldo
Rango
Desde el sueldo mas bajo hasta  800
1
801  1000
2
1001  mas
3

46

Solucin:
1. Menu transformar.
2. Seleccionar la opcin Recode (Recodificar).
3. Seleccione Into Different Variables... (Generar en variable diferente).
4. En la ventana que se muestra, seleccionar la variable a segmentar, en este caso es la
variable Sueldo y agregarla al siguiente cuadro.
5. En Output Variable (Variable de salida).
Se coloca el nombre a la nueva variable, la cual tendr los rangos del sueldo.
Name (Nombre)

Rango_sueldo
6. Presionar el botn Cambiar o Change.
7. Presionar el botn Old and New Values (Valores antiguos y nuevos).
8. Marcar:
Range:
1
800
Lowest Through (valor mas bajo a)
9. En la opcin Value (Valor) colocar el cdigo que representara el primer rango:
10. Presionar el botn Add (Adherir)
11. Marcar:
Range:

801
1000
Through (Hasta)
12. En la opcin Value (Valor) colocar el cdigo que representara el segundo rango:
13. Presionar el botn Add (Adherir)
14. Marcar:
Range:
15.
16.
17.
18.

1001
Through highest (Mayores a)
En la opcin Value (Valor) colocar el cdigo que representara el tercer rango:
Presionar el botn Add (Adherir)
Presionar el botn Continue (Continuar)
Presionar Ok (Aceptar).

NOTA: si desea establecer mas de 3 rangos, deber repetir los pasos del 11 al 13 cuantas veces sea
necesario.

Si ahora desea que los rangos obtenidos con cdigos (1,2 y 3) cambien a Valores (Values) por
ejemplo: 1=bajo, 2=medio, 3=alto, debe modificar en la ficha Variable View (Vista de Variables), los
Values correspondientes a la nueva variable obtenida, rango_sueldo.
EJERCICIO 5:
Registrar los siguientes datos:
Cdigo
Nive_Social
Nro_Hijos
Ingreso_familiar
A01
A
2
2500
A02
C
4
800
A03
B
3
1200
A04
A
1
3500
A05
B
1
1500
A06
C
5
600
Considerar la variable ingreso familiar, para establecer 4 segmentos en una nueva variable llamada
Rango_ingreso.
Ingresos
Rango
Desde el ingreso mas bajo hasta  1000
1
1001  2000
2
2001  3000
3
3001  mas
4
Luego asigne los siguientes Values: 1=deficiente, 2=bajo, 3=regular, 4=bueno.

47

EJERCICIO 6:
Registrar los siguientes datos:
Cdigo
Sexo
Talla
Peso
1
Femenino
1.59
50
2
Masculino
1.60
65
3
Masculino
1.43
45
4
Femenino
1.33
37
5
Femenino
1.70
65
6
Masculino
1.65
70
7
Femenino
1.74
68
8
Femenino
1.62
55
9
Femenino
1.55
67
Considerar la variable Talla, para establecer 2 segmentos en una nueva variable llamada
Rango_Talla (considere usted cuales son los valores que tomara cada uno de los rangos).
Y considerar la variable Peso para establecer el numero de segmentos que usted considere
conveniente, junto con los valores que usted vea adecuados manejar por cada rango, esto ser en
una nueva variable llamada Rango_Peso.
Luego asigne Values correspondientes a los valores obtenidos, tanto en Talla, como en Peso.
ORDENAR CASOS
Para ordenar los datos por alguna variable en particular, por ejemplo, si de todos los datos
registrados, desea que estos aparezcan ordenados por edad, realice lo siguiente:
2. Men Data (Datos).
3. Seleccionar la opcin Sort Cases... (Ordenar casos)
4. Seleccionamos y pasamos el dato o variable a ordenar.
5. Presionamos Ok (Aceptar).
AGRUPAR CASOS O AGREGAR DATOS
Consiste en agrupar, varios casos en uno solo y obteniendo algn resultado en particular.
Por ejemplo:
Si tenemos los siguientes datos:
Ciclo
Edad
I
21
I
19
II
29
II
20
II
22
Se desea: Por cada ciclo, mostrar el promedio de edades.
El resultado debe ser:
Ciclo
Prom_edad Num_afectados
I
20
2
II
24
3
Solucin:
1. Menu Data (Datos).
2. Seleccionar Aggregate... (Agregar).
3. En la ventana, seleccionar la variable a agrupar, que en este caso es Ciclo y la pasamos a la
seccin: Break Variables (Variables de segmentacin).
4. Seleccionamos ahora, el dato a calcular de la primera columna, y la agregamos a la seccin:
Aggregate Variables (Variable agregada), sobre este dato se realizarn los clculos. Para nuestro
ejercicio ser la variable Edad.
5. Presionamos el botn Function... (Funcin) para seleccionar la funcin a aplicar, mrquela y
presione el botn Continue (Continuar). Nosotros seleccionaremos de la lista de funciones Mean
(Promedio).
6. Marque:
Save number of cases in break group as variable: (Guardar el numero de casos de la
variable agrupada en la variable:)
Num_afectados
Se coloca en el recuadro un nombre a la variable que registrara el numero
de afectados.
7. Por defecto el resultado se graba en otro archivo llamado aggr.sav, pero si desea cambiar este
nombre, presione el botn File (Archivo) y puede indicar el lugar donde lo guardar, adems de

48

cambiar el nombre de dicho archivo, y presione el botn Guardar. Nosotros lo guardaremos en el


escritorio con el nombre Grupo_ciclo_promedad.
8. Presione el botn Ok (Aceptar).
9. Puede abrir su archivo para ver el resultado obtenido.

EJERCICIO 7:
Sea el archivo de datos:
Cdigo
Sexo
Area
Sueldo
A
Femenino
Logstica
2500
B
Masculino
Sistemas
3500
C
Femenino
Contabilidad
1500
D
Masculino
Logstica
500
E
Femenino
Sistemas
1200
F
Masculino
Contabilidad
800
G
Femenino
Logstica
600
Calcule:
a) Sueldo total por sexo. Gurdelo en el escritorio como: grupo_sex_totsueldo.
b) Sueldo total por area. Gurdelo en el escritorio como: grupo_area_totsueldo.
c) Mximo sueldo por sexo. Gurdelo en el escritorio como: grupo_sex_maxs.
d) Mximo sueldo por area. Gurdelo en el escritorio como: grupo_area_maxs.
EJERCICIO 8:
Considerando el archivo de datos del EJERCICIO 6, calcule lo siguiente:
a) Talla mxima por sexo.
b) Peso mnimo por sexo.
c) Promedio de tallas por sexo.

49

AUTOEVALUACION Capitulo 5
I. En SPSS registrar los siguientes datos tomados de una Clnica Psiquitrica
Cod_pac
Condicin
Edad
Pago_mensual
P01
Consultorio
8
215
P02
Consultorio
10
310
P03
Traslado
14
280
P04
Internado
12
250
P05
Traslado
9
250
P06
Traslado
12
290
P07
No sabe
13
250
P08
Internado
10
310

N_cuotas
2
3
1
4
2
1
2
2

Con el tema: Transformando datos (Compute) resolver en SPSS:


1. Calcule el nuevo pago, aplicando para todos un descuento de 20 soles al Pago mensual y
responda: Cul es el nuevo pago que realiza el paciente con cdigo P05:
a) 230
b) 260
c) 270
d) NA
2. Calcular el Gasto Hospitalario, el cual es del 8% sobre el pago mensual y slo pagan los pacientes
que tienen la Condicin de Internado. Luego responda: El gasto hospitalario que paga el paciente con
cdigo P08 es de:
a) 0
b) 20
c) 24.8
d) NA
3. De la pregunta anterior, responda: El gasto hospitalario que paga el paciente con cdigo P02 es
de:
a) 0
b) 20
c) 24.8
d) NA
4. Calcular el Pago Total que se obtiene del pago descontado ms el gasto hospitalario. Responda:
Cuanto es el pago total que realiza el paciente con cdigo P04:
a) 260.00
b) 250.00
c) 115.00
d) NA
5. Calcular el Pago por Cuota, en base al pago total entre el nmero de cuotas. El monto por cuota
que cancela el paciente P01 es de:
a) 200.00
b) 96.67
c) 97.50
d) NA
II. En SPSS registrar los siguientes datos tomados de una Clnica Psicolgica
Cod_pac
P001
P002
P003
P004
P005
P006
P007
P008
P009
P010

Condicin
Asociado
Asociado
Libre
Interno
Libre
Asociado
Interno
Interno
Interno
Libre

Edad
8
10
14
12
9
12
13
10
15
13

Monto_total
215
310
280
300
250
290
250
310
310
230

50

Tiempo_resp_testP
50
48
34
40
48
42
40
45
30
35

Punt_obt_testP
25
18
27
28
33
42
34
38
51
44

Con el tema: RECODIFICACION DE VARIABLES (Segmentacin en rangos) resuelva:


6. En base al puntaje obtenido en el test de personalidad, cuya variable es Punt_obt_testP, se
necesita obtener su respectivo Diagnstico, considerando:
<
a
25

Tmido
26
a
35

Introvertido
36
a
45

Sociable
46
a
>
 Extrovertido
Responda: Cuntos pacientes Extrovertidos hay:
a) 3
b) 1
c) 0
d) NA
Con el tema: Agrupar datos o casos resuelva:
7. Por cada diagnstico, calcular el promedio de edad, registrar el nmero de personas y gurdelo
como Grupo1. Responda: el promedio de edades y el numero de casos o personas de los
introvertidos es:
a) 11.33 y 3
b) 10.67 y 3
c) 15.00 y 1
d) NA
8. Por cada Condicin, calcular el mximo monto_total, registrar el nmero de personas y guardar
como Grupo2. Responda: Los de Condicin Libre cual es el mximo monto total y cuantos casos son:
a) 210 y 2
b) 310 y 1
c) 400 y 3
d) NA

CLAVE DE RESPUESTAS Capitulo V


ITEM

RESPUESTA

51

CAPTULO VI
TCNICAS DE ANLISIS MULTIVARIADAS

CONTENIDO:
1. Anlisis de Regresin Lineal Simple.
2. Anlisis de Regresin Lineal Mltiple.
3. Anova de un Factor.
4. Anlisis Factorial.
5. Desarrollo de casos y ejercicios prcticos.

COMPETENCIAS:
1. Conceptuales: reconocer los tipos de anlisis, caractersticas y particularidades indispensables
para decidir cual anlisis se acomoda a un determinado caso.
2. Procedimentales: aplicar los distintos tipos de anlisis de acuerdo al caso en estudio tomando
como herramienta el SPSS.
3. Actitudinales: identificar con criterio, el modelo de anlisis que se ajusta mas a un determinado
caso.

52

ANLISIS DE REGRESIN LINEAL SIMPLE


Sean 2 variables, en las cuales una depende de la otra.
x  variable independiente.
y  variable dependiente.

y = A + Bx

x
Se trata de encontrar el comportamiento de estos puntos y acomodarlo a una forma matemtica
(ecuacin), lo que llamamos modelo. Esa forma puede ser una recta, una curva, etc. (cada una de
ellas tiene su propia ecuacin matemtica).
La distancia de cada punto a la recta es el error, los puntos que caen en la misma recta no tienen
error, la idea es minimizar esos errores.
El Principio del Anlisis de Regresin es:
Si tengo observaciones y minimizo los errores, por ende me acerco a la verdad
Modelo General:

y = A + Bx
y = A + Bx + E

Modelo de Regresin Lineal Ajustado: = a + bx


Aplicacin:
Sean las variables:
Presin
30
31
32
33
34
35
36

Millas
29.5
32.1
36.3
38.2
37.7
33.6
26.8

Donde:
2
Presin: esta en lb/pulg (libras por pulgada al cuadrado), que es la presin aplicada a los neumticos
de un auto.
Millas: es el numero de millas recorridas.
Es posible encontrar un modelo ajustado?
Solucin:
1) Identificar cual es la variable independiente y cual es la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Nosotros, podemos aumentar o disminuir la Presin a los neumticos en el momento que lo
deseemos, es decir, la presin es una variable independiente porque no depende de ningn factor
en particular, para que este aumente o disminuya. Sin embargo, el numero de millas recorridas,
depende de la presin aplicada a los neumticos, ya que, si la presin aumenta mucho, el
rendimiento de las millas disminuye, en cambio, cuando la presin de los neumticos tiene una
cantidad adecuada, el rendimiento en millas es mejor.
Por lo tanto, con el anlisis realizado, podemos identificar:
Presin  variable independiente.

53

Millas  variable dependiente.

2) Realizar un anlisis exploratorio:


En el anlisis exploratorio, no existe una secuencia fija; aqu, lo ideal es realizar varios grficos,
como para ver el comportamiento de las variables, y visualizar la forma.
Puede realizar lo siguiente:
1. Men Graphs (Grficos).
2. Seleccionar la opcin Line... (Lineas)
3. Seleccionar Simple, marcar la opcin Summaries for groups of cases y presionar el botn
Define.
4. Seleccionar la variable independiente y pasarla a Category Axis.
5. Seleccionar la variable dependiente, marcar la opcin: Other summary function y agregar la
variable.
6. Presionar Ok.
Tambin puede realizar un grafico tipo dispersin del siguiente modo:
1. Men Graphs (Grficos).
2. Seleccionar la opcin Line... (Lineas)
3. Seleccionar Drop-line, marcar la opcin: Summaries of separate variables y presionar el botn
Define.
4. Seleccionar la variable independiente y pasarla a Category Axis.
5. Seleccionar la variable dependiente y pasarla a Points Represent, luego vuelva a aadirla, es
decir debe aadir la variable dependiente 2 veces. (Tambin puede probar otro grafico
aadiendo en este punto, ambas variables tanto la dependiente como la independiente).
6. Presionar Ok.
Puede realizar muchos mas grficos de distintos tipos para que visualice el comportamiento de las
variables.
3) Ya teniendo una idea del comportamiento de las variables, podemos confirmar el anlisis
exploratorio, realizando lo siguiente:
1. Men Analyze (Anlisis).
2. Selecione la opcin Regression.
3. Presione la opcin Linear... (Lineal...)
4. Pase la variable independiente y dependiente, cada una al lugar que le corresponde.
5. Presione el botn Statistics... (Estadsticos...) y verifique que estn marcados: Estimates
(Estimaciones) y Model fit (Modelo ajustado), presione el botn Continue.
6. Presione Ok.
4) De los resultados que se muestran:
1. Debemos verificar el valor de R Square (R cuadrado) que se encuentra en la segunda tabla,
este valor es el coeficiente de determinacin de Pearson, que nos mide el grado de, que tan
perfecto puede ajustarse los valores de las variables a una recta. Si este valor esta entre 0.9
y 1 (que significa 90% a 100%), podemos decir que si cumple con el modelo, es decir que los
datos si se ajustan a una recta, por lo que usar la ecuacin ( = a + bx) para predecir, ser
valido. Si el valor obtenido en el R Square es 1, se dice que el ajuste es perfecto.
2. Si el R Square obtuvo un valor aceptable, debemos ubicar los valores de a y b que
remplazaremos en la formula: ( = a + bx) y as poder hacer predicciones, estos valores los
obtendremos de los resultados obtenidos en la cuarta tabla:

a
b

El valor de b indica la orientacin de la pendiente de la recta, es decir si el valor es:


positivo (+) la recta ser:
(hacia arriba)
negativo (-) la recta ser:
(hacia abajo)

54

EJERCICIO M:
Considerar las siguientes cifras, que indican los datos mensuales del recorrido en millas por vehculo
y los costos de operacin para una empresa de transporte de pasajeros por carretera.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
1)
2)
3)
4)

Costos
213.9
212.6
215.3
215.3
215.4
228.2
245.6
259.9
250.9
234.5
205.9
202.7
198.5
195.6
200.4
200.1
201.5
213.2
219.5
243.7
262.3
252.3
224.4
215.3
202.5
200.7
201.8
202.1
200.4
209.3
213.9
227.0
246.4

Millas
3147
3160
3197
3173
3292
3561
4013
4244
4159
3776
3232
3141
2928
3063
3096
3096
3158
3338
3492
4019
4394
4251
3844
3276
3184
3037
3142
3159
3139
3203
3307
3585
4073

Identificar la variable independiente y la dependiente.


Realice el anlisis exploratorio.
Es posible ajustar a una lnea recta?
Predecir, si una unidad vehicular recorre 5000 millas, Cul es el costo de operacin que se
espera gastar?

Solucin:
1)
Millas  variable independiente.
Costos  variable dependiente.
2) Rsquare = 0.911 aproximadamente 91.1%
3) Si es posible ajustar a una lnea recta porque el Rsquare sobrepasa el 90%.
4) Siendo la ecuacin: = a + bx
De la tabla de resultados, tomo el valor de a = 64.963 y el valor de b = 0.045.
Me piden predecir los costos de recorrer 5000 millas por lo que x = 5000.
Reemplazando:
= a + bx
= 64.963 + (0.045 * 5000)
= 289.96
Rpta: el costo de operacin de recorrer 5000 millas ser de 289.96.

55

MODELO DE REGRESIN MULTIPLE


El modelo de Regresin mltiple, esta representado por la siguiente ecuacin:
Y = A0 + A1X1 + A2X2 + A3X3 + ....... + AnXn
Sean ms 2 variables, en las cuales una depende de las otras.
X1 , X2 , X3 ....... Xn 
variables independientes.
Y

variable dependiente.
Modelo de Regresin Mltiple Ajustado: = a0 + a1x1 + a2x2 + a3x3 + ....... + anxn
2

Al igual que el modelo de regresin lineal simple, el R (R cuadrado o R square) debe ser mayor al
90%, para poder asumir que si se cumple con el modelo. Y hacer las predicciones del caso.
Aplicacin:
Tenemos un estudio estadstico de los costos administrativos de distintas entidades Bancarias. Se
desea cuantificar cual es el grado de influencia de las variables independientes sobre la variable
dependiente.
Banco
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S

Gastos_admin
48.8
43.2
39.4
29.8
26.2
24.8
24.0
21.5
18.3
15.6
14.3
12.9
12.5
8.8
6.0
5.9
3.6
1.7
1.0

Activos
831.5
1204.0
1153.5
499.6
466.6
522.3
376.6
431.3
282.2
311.8
284.5
399.0
462.8
205.0
162.4
45.8
113.7
237.3
170.8

Agencias
30
18
20
25
30
12
12
20
10
13
7
8
3
12
3
1
4
7
5

Solucin:
1) Determine las variables independientes y la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Una Entidad Bancaria, puede decidir por incrementar su numero de Agencias, o disminuirla, quizs
por su ubicacin comercial, inversin que representa, entre otras, pero es totalmente independiente
en decidir el numero de agencias que manejara; en cuanto a los Activos de la compaa, este
representa el dinero que tiene la empresa materializada por ejemplo en inmuebles, equipos, Activos
que tambin la empresa ser totalmente libre en decidir si adquiere mas equipos incrementando
sus Activos, o quizs disminuirlos; sin embargo los Gastos Administrativos (ojo que no estamos
hablando de gastos en general, sino solamente e gastos administrativos), estos estarn
supeditados a la cantidad de agencias que tenga el banco tanto como a la cantidad de activos que
posee la empresa, ya que, a ms agencias, necesitara ms personal lo que representa ms gastos
administrativos, del mismo modo cuanto mas Activos tenga ya sea en maquinarias inmuebles,
equipos, necesitar invertir mas en personal que lo mantenga, lo que tambin generara mas gastos
administrativos, y en caso disminuyan las agencias y/o activos, los gastos administrativos tambin
disminuiran, por lo que estos Gastos Administrativos dependen de los Activos y las Agencias.
Con el anlisis realizado, podemos identificar:
Activos y Agencias

variables independientes.

56

Gastos Administrativos 

variable dependiente.

2) Realizar un anlisis exploratorio:


Puede realizar grficos de distintos tipos, por ejemplo, los lineales simple, analizando como se
comporta la variable dependiente solo con una de las variables independientes, del mismo modo,
otro grafico lineal simple, con la misma variable dependiente, pero analizando el comportamiento
con otra de las variables independientes, y as sucesivamente.
Tambin, puede realizar un grafico lineal mltiple, donde selecciona una de las variables
independientes y la pasa a Category Axis.
Luego selecciona la otra variable independiente y lo pasa a Define Lines by.
Selecciona luego la variable dependiente, marcar la opcin: Other summary function y agregar la
variable.
Presiona Ok.
3) Ya teniendo una idea del comportamiento de las variables, podemos confirmar el anlisis
exploratorio, realizando lo siguiente:
1. Men Analyze (Anlisis).
2. Selecione la opcin Regression.
3. Presione la opcin Linear... (Lineal...)
4. Pase las variables independientes y la variable dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Statistics... (Estadsticos...) y verifique que estn marcados: Estimates
(Estimaciones) y Model fit (Modelo ajustado), presione el botn Continue.
6. Presione Ok.
4) De los resultados que se muestran:
1. Debemos verificar el valor de R Square (R cuadrado) que se encuentra en la segunda tabla,
este valor es el coeficiente de determinacin de Pearson, que nos mide el grado de, que tan
perfecto puede ajustarse los valores de las variables a una recta. Si este valor esta entre 0.9
y 1 (que significa 90% a 100%), podemos decir que si cumple con el modelo. Si el valor
obtenido en el R Square es 1, se dice que el ajuste es perfecto.
2
Para nuestro caso, se obtuvo un R = 0.901 aproximadamente el 90.1% lo cual es aceptable.
2. Si el R Square obtuvo un valor aceptable, debemos ubicar los valores de a0 , a1 , a2 , a3 .... an ,
estos valores estn en los resultados obtenidos en la cuarta tabla:
Con lo que podemos predecir, usando la formula:

a0
a1
a2
= a0 + a1x1 + a2x2
= -1.354 + (0.669 * x1 ) + (0.027 * x2 )
NOTA: a0 , es una constante general, el cual si es negativo no es un valor muy lgico, por lo que seria
bueno realizar un anlisis sin considerar dicho valor.
Para suprimir dicha constante:
Al momento de hacer la Regresin, es decir:
1. Men Analyze (Anlisis).
2. Selecione la opcin Regression.
3. Presione la opcin Linear... (Lineal...)
4. Pase las variables independientes y la variable dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Statistics... (Estadsticos...) y verifique que estn marcados: Estimates
(Estimaciones) y Model fit (Modelo ajustado).
6. Presione el botn Options... (Opcion) y quite el check en: Include constant in equation (Incluir
constante en la ecuacin).

57

7. Presione el botn Continue (Continuar).


6. Presione Ok.
2
Con lo cual se obtiene un R mucho mas aceptable, siendo este de 0.965 aproximadamente de
96.5%, ya no habr un valor a0, slo los de a1 y a2, los cuales sern:
a1 = 0.626 y a2 = 0.026
Se pide predecir:
A cuanto ascenderan los gastos administrativos de una entidad bancaria que maneje 15
agencias y tenga unos activos de 1000.
Sabemos por el anlisis realizado anteriormente los valores de a1 = 0.626 y a2 = 0.026, adems
por lo que nos pide predecir asumimos que x1 = 15 y x2 = 1000.
Reemplazamos en la ecuacin:
= a0 + a1x1 + a2x2
= (0.626 * 15) + (0.026 * 1000)
= (9.39) + (26)
= 35.39
Respuesta: Los gastos administrativos, de manejar 15 agencias, disponiendo de unos activos de
1000, ser aproximadamente de 35.39.
DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS
EJERCICIO 1:
Se convoco a todos los interesados, a realizar un estudio sobre inteligencias mltiples, ellos, deban
organizarse en grupos, con lo que se obtuvieron los siguientes datos:
Cod_grupo Tpo_estudio_dias Costo_desarr_estudio Num_integr_grupo
A
19
350.00
6
B
25
300.00
4
C
24
280.00
5
D
24
300.00
3
E
31
250.00
4
F
30
260.00
6
G
22
354.00
6
H
24
350.00
4
I
28
275.00
3
J
32
262.00
5
K
32
240.00
2
L
35
230.00
3
M
19
389.00
5
N
25
267.00
2
1.
2.
3.
4.
5.
6.

Determine las variables independientes y la variable dependiente.


2
Obtener el coeficiente de determinacin (R ). Qu concluye sobre este valor?
Analice los coeficientes del modelo a1 , a2 , etc.
2
Suprimiendo la constante. Que valor obtuvo el coeficiente de determinacin (R )?.
Cules son sus nuevos coeficientes del modelo? a1 , a2 , etc.
Predecir, si se desea terminar el estudio de inteligencias mltiples en 20 das, con un grupo
formado por 7 integrantes, cul ser el costo por desarrollar dicho estudio?.

58

ANOVA DE UN FACTOR
Estudia 2 variables:
1 
2 

variable cualitativa (nominal u ordinal) la cual viene siendo el Factor.


variable cuantitativa (variable dependiente) la cual es un valor scalar, una cantidad.

Mediante la tcnica de comparacin de medias y comparacin de varianzas, permite determinar la


influencia de la variable cualitativa sobre la cuantitativa.
Los pasos a seguir son:
1) Identificar cual es la variable cualitativa (grupo A) y cual es la variable cuantitativa (grupo B).
2) Establecer la hiptesis mediante Comparacin de Medias: la Media del grupo A (MA) y Media del
grupo B (MB)
H0 : MA = MB Las medias son iguales, esto implica que un grupo NO afecta al otro.
Ha : MA MB Las medias son distintas, esto implica que un grupo SI influye al otro.
Se rechazar H0 si el valor que se obtiene de P es menor a 0.05 (P < 0.05) y por consiguiente se
aceptar Ha.
3) Ir al Men Analize (Anlisis).
4) Seleccionar Compare Means (Comparacin de medias).
5) Seleccionar One_Way ANOVA (ANOVA de una factor...)
6) Seleccionar la variable dependiente y pasarla al lugar que le corresponde, luego seleccionar la
variable factor y agregarla al lugar correspondiente al Factor.
7) Presionar Ok.
8) Verificar el valor de P (Sig.), si es menor a 0.05 rechazamos H0 y aceptamos Ha sino hacemos lo
contrario.
Ejemplo:
Abrir el archivo Employee data.sav (Datos de Empleados.sav) (que se encuentra en C:\Archivos de
programas\SPSS\Employee data.sav)

Deseamos verificar si la categora laboral esta en funcin al salario.


Para ello determinamos los siguiente:

1) Categora laboral (jobcat)

variable cualitativa (Factor)


(administrativos, clrigos, custodios).

variable cuantitativa.

Salario (salary)
2) Establecemos las hiptesis:
H0 : MA = MB La categora laboral de un empleado no influye en su salario.
Ha : MA MB La categora laboral de un empleado si influye en su salario.
3) Ir al Men Analize (Anlisis).
4) Seleccionar Compare Means (Comparacin de medias).
5) Seleccionar One_Way ANOVA (ANOVA de una factor...)
6) Seleccionar la variable dependiente (salario) y pasarla al lugar que le corresponde, luego
seleccionar la variable factor (categora laboral) y agregarla al lugar correspondiente al Factor.
7) Presionar Ok.
9) 8) En los resultados, verificar el valor de P, que es el nivel de significancia (Sig.), (si es menor a
0.05 rechazamos H0 y aceptamos Ha sino hacemos lo contrario).
Para este caso se obtuvo: Sig. = 0.000 como es menor a 0.05, entonces aceptamos Ha.
Conclusin: La categora laboral de empleado, si influye sobre el sueldo.
DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS
EJERCICIO 2:
Se tienen los siguientes datos experimentales, en el que se ha recogido informacin de 2 variables:
Consumo_telefonico Nivel_socio_economico
155
1
154
1
148
1
132
1

59

126
132
156
138
158
144
126
160
136
158
132
144
136
134
142
138
140
142
134
148
146
126
128
120
126
116
142
144
112
116
120
122
136
165
148
128

1
1
1
1
1
1
2
2
2
2
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
1
2
2
2

1. Identificar cual es la variable cualitativa y cual es la variable cuantitativa.


2. Establecer las hiptesis:
H0 : MA = MB
Ha : MA MB
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Porqu?
EJERCICIO 3:
Se convoco a todos los interesados, a realizar un estudio sobre inteligencias mltiples,
organizarse en grupos de personas que tengan el mismo grado acadmico, los datos fueron:
Cod_grupo Tpo_estudio_dias Costo_desarr_estudio Grado_academico_grupo
A
19
350.00
profesionales
B
25
300.00
profesionales
C
24
280.00
tcnicos
D
24
300.00
profesionales
E
31
250.00
tcnicos
F
30
260.00
tcnicos
G
22
354.00
profesionales
H
24
350.00
tcnicos
I
28
275.00
profesionales

60

deban

J
K
L
M
N

32
32
35
19
25

262.00
240.00
230.00
389.00
267.00

profesionales
tcnicos
tcnicos
profesionales
tcnicos

I. Se desea verificar si el Tiempo de desarrollar el estudio, contabilizado en das, esta en funcin al


Grado acadmico de los integrantes del grupo.
1. Identificar cual es la variable cualitativa y cual es la variable cuantitativa.
2. Establecer las hiptesis:
H0 : MA = MB
Ha : MA MB
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Porqu?
II. Se desea verificar si el Grado acadmico de los integrantes del grupo, esta en funcin al Costo de
desarrollar dicho estudio.
1. Identificar cual es la variable cualitativa y cual es la variable cuantitativa.
2. Establecer las hiptesis:
H0 : MA = MB
Ha : MA MB
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Porqu?

61

AUTOEVALUACION Capitulo 6
I. En SPSS registrar los siguientes datos tomados de un Club de Karate.
Cod_pac
P001
P002
P003
P004
P005
P006
P007
P008
P009
P010

Condicin
Asociado
Asociado
Libre
Interno
Libre
Asociado
Interno
Interno
Interno
Libre

Edad
8
10
14
12
9
12
13
10
15
13

Monto_total
215
310
280
300
250
290
250
310
310
230

Tiempo_resp_testP
50
48
34
40
48
42
40
45
30
35

Punt_obt_testP
25
18
27
28
33
42
34
38
51
44

A. Considere las variables Edad y Tiempo_resp_testP para aplicar el modelo de Regresin Lineal
Simple, guarde sus resultados e indique:
1. Variable Independiente:......................................
2. Variable Dependiente:..........................................
Aplique el modelo y luego con la ecuacin reemplace valores para que pueda hacer las siguientes
predicciones:
3. Si el socio tiene 11 aos el tiempo de respuesta que tendr ser:
a) 41
b) 42
c) 43
d) NA
4. Si el socio tiene 25 aos el tiempo de respuesta que tendr ser:
a) 3
b) 4
c) 5
d) NA
B. Aplique ANOVA para verificar si el monto total que pagan los socios est en funcin de su
condicin, guarde sus resultados e indique:
Establezca sus hiptesis:
5. Ho:........................................................................................................................
6. Ha:.......................................................................................................................
7. P o Sig. es menor que 0.05?
a) si
b) no
8. Que hiptesis acepta?
a) Ho
b) Ha
II. En SPSS registrar los siguientes datos de una investigacin de autos.
Millas_galn
Origen
Tpo_aceleracin
Ao
Costo_actual_$
14
Americano
14
2000
3200
17
Americano
16
2002
5000
16
Americano
18
2003
4500
15
Europeo
21
2004
4000
18
Japons
22
2005
3000
21
Japons
14
2000
2000
20
Americano
17
2002
4000
23
Europeo
18
2004
3500
29
Americano
22
2005
5500
22
Europeo
18
2003
3200
C. Con las variables ao y tiempo de aceleracin, aplique el modelo de Regresin Lineal Simple,
guarde sus resultados e indique:

62

9. Variable Independiente:......................................
10. Variable Dependiente:..........................................
Aplique el modelo y luego con la ecuacin reemplace valores para que pueda hacer las siguientes
predicciones:
11. Para el ao 2008 el tiempo de aceleracin tendrn los autos ser de:
a) 25
b) 26
c) 27
d) NA
12. Para el ao 2010 el tiempo de aceleracin tendrn los autos ser de:
a) 29
b) 30
c) 31
d) NA
D. Con las variables rendimiento de millas_galon, tiempo de aceleracin y costo, aplique el modelo de
Regresin Mltiple (considere la posibilidad de quitar la constante en el anlisis para que el modelo
2
se ajuste mas y obtenga un R mucho mas aceptable), guarde sus resultados e indique:
13. Primera Variable Independiente:......................................
14. Segunda Variable Independiente:......................................
15. Variable Dependiente:..........................................
Aplique el modelo y luego con la ecuacin reemplace valores para que pueda hacer las siguientes
predicciones:
16. Considerando un recorrido de 19 millas y con un tiempo de aceleracin de 19, a cuanto
ascenderan los costos?:
a) 3850
b) 3900
c) 3925
d) NA
E. Aplique ANOVA para verificar si el origen esta en funcin del Costo_actual_$, guarde sus
resultados e indique:
Establezca sus hiptesis:
17. Ho:........................................................................................................................
18. Ha:.......................................................................................................................
19. P o Sig. es menor que 0.05?
a) si
b) no
20. Que hiptesis acepta?
a) Ho
b) Ha

CLAVE DE RESPUESTAS Capitulo VI


ITEM
1
2
3
4
5
6
7
8
9
10

RESPUESTA
Edad
Tiempo_resp_testP
c
a
El monto de pago no esta en funcin a su condicin
El monto de pago si esta en funcin a su condicin
b
a
Ao
Tpo_aceleracin

63

ITEM
11
12
13
14
15
16
17
18
19
20

RESPUESTA
b
a
Millas_galn
Tpo_aceleracin
Costo_actual_$
c
origen no esta en funcin del Costo_actual_$,
origen si esta en funcin del Costo_actual_$,
a
b

BIBLIOGRAFIA
1. Fernndez Chavesta Jos
Fernndez Chavesta Juan
Estadstica Aplicada I
Editorial San Marcos, EIRL
Primera Edicin 2007
2. Perez Legoas, Luis
Estadstica Bsica
Editorial San Marcos
3. Murray Spiegel:
Estadstica.
Editorial Mc. Graw Hill.
4. Daniel Wayne W. Estadstica con aplicaciones a las Ciencias Sociales,
Ed. Limusa Mxico
5. Estadstica para Psiclogos II
Jess Amn
Ediciones Pirmide
Novena Edicin, 1993
6. Estadstica
Segunda Edicin
Murria R. Spiegel
Impreso en Espaa
Mc Graw Hill / Interamericana de Espaa SA
7. Morrison D. F
Multivariate Statistical Methods
McGraw-Hill 1990
8. Johnson R.A. y Wichern D.W. (1992)
Applied Multivariate Statistical Anlisis
Prentice-Hall International Inc.
9. Introduccin al anlisis multivariante
Amn,J. (1991)
Barcelona: PPU.
10. Diseos experimentales multivariables
Arnau i Grass, J. (1990)
Madrid: Alianza Psicologa
11. La tcnica del anlisis factorial
Yela, M.(1997)
Madrid: Biblioteca Nueva

64

Você também pode gostar