Você está na página 1de 22

CURSO DE ANÁLISIS DE DATOS

Jesús Rodríguez Mantilla 21/11/2018

https://goo.gl/LHMMr8

Descargamos la base de datos que contiene

N= 320

Las casillas son casos perdidos. Ej. El sujeto 8. Los valores perdidos pueden invalidar el sujeto a
la hora de hacer el análisis. Un análisis de regresión puede predecirnos su respuesta. Pero no
es lo adecuado. Los análisis cluster, los factoriales pueden no funcionar si hay valores perdidos.

Nombre: la que pone SPSS. Etiqueta es lo que pone en la base de datos y lo que va a salir en
los análisis. Hay que revisar para luego no encontrar errores

Creamos estado civil, le ponemos nombre abreviado y al dar intro te completa los datos. Ahora
vemos tipo de variable. Al clicar aparecen puntos suspensivos y se te abre este desplegable:

Generalmente trabajaremos en numérico. Anchura, columnas y alineación son por defecto de


SPSS. La alineación es para centrar el dato o alinearlo a derecha o izquierda. Lo que sí es
importante es determinar los decimales. En el caso del estado civil, será cero. Lo incluimos.
Ahora completamos la etiqueta y ponemos el nombre de la variable. Pinchamos en valores, los
puntos suspensivos. Tenemos que dar número a las categorías de las variables. 1= soltero, 2=
casado, etc. En medida tenemos que especificar el tipo de la variable: escala, ordinal y
nominal. En el ejemplo es nominal. Ahora en vista de datos nos aparece la variable ya creada.
Metemos los datos: 1, 2, 3, 4, 2. Si clicamos a la letra A mayúscula superior centrada aparecen
los nombres de esas etiquetas. En las variables nominales y ordinales, son las únicas en las que
se nominan los valores.

ESTADÍSTICA DESCRIPTIVA

En el botón de analizar tenemos todos los análisis que se pueden realizar. En escala por
ejemplo tenemos el análisis de fiabilidad o la validez, entre otros. Ahora vamos a hacer análisis
descriptivos. Recordar: las variables nominales solo se le puede pedir la moda. Igual ocurre
con los gráficos. Se tiene que aplicar el adecuado por el tipo de variables. Empezamos por
frecuencias.

Cogemos la variable terapia psicológica. Pinchamos en estadísticos:

Solo calculamos la moda porque es nominal. Pasamos a gráficos. No es lo mismo un diagrama


de barras que un histograma. Si la variable es nominal y ordinal se usan barras y sectores. Si la
variable es escala (razón o intervalos) entonces el histograma, polígono de frecuencias,
gráficos de dispersión, etc.

Damos al gráfico de barras, aceptar y se abre la pestaña de datos con la siguiente información:
GET
La licencia caducará en 7 días.
FILE='C:\Users\User\Downloads\Base de datos (PSIC) (Doctorado
UCJC).sav'.
DATASET NAME ConjuntoDatos1 WINDOW=FRONT.

SAVE OUTFILE='C:\Users\User\Desktop\Jesús\Base de datos (PSIC)


(Doctorado UCJC).sav'
/COMPRESSED.
FREQUENCIES VARIABLES=Terapia
/STATISTICS=MODE
/BARCHART FREQ
/ORDER=ANALYSIS.

Frecuencias
Notas
Salida creada 24-NOV-2018 11:01:00
Comentarios
Entrada Datos C:\Users\User\Desktop\Jesús\B
ase de datos (PSIC) (Doctorado
UCJC).sav
Conjunto de datos activo ConjuntoDatos1
Filtro <ninguno>
Ponderación <ninguno>
Segmentar archivo <ninguno>
N de filas en el archivo de datos 320
de trabajo
Manejo de valores perdidos Definición de perdidos Los valores perdidos definidos
por el usuario se tratan como
perdidos.
Casos utilizados Las estadísticas se basan en
todos los casos con datos
válidos.
Sintaxis FREQUENCIES
VARIABLES=Terapia
/STATISTICS=MODE
/BARCHART FREQ
/ORDER=ANALYSIS.
Recursos Tiempo de procesador 00:00:01,59
Tiempo transcurrido 00:00:00,91

[ConjuntoDatos1] C:\Users\User\Desktop\Jesús\Base de datos (PSIC)


(Doctorado UCJC).sav
Estadísticos
Terapia psicológica
N Válido 320
Perdidos 0
Moda 3

Terapia psicológica
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido Cognitivo-conductual 108 33,8 33,8 33,8
Sistémica 100 31,3 31,3 65,0
Mixta 112 35,0 35,0 100,0
Total 320 100,0 100,0

Tiene el mayor número de frecuencias= moda


Se mira el porcentaje válido. Porque si hay valores perdidos cambia porque calcula
considerando los perdidos.

Cogemos ahora motivación:


Es una variable escala. Le pedimos un histograma o polígono de frecuencias. No se
aplican otros. Si cogemos histograma te da la opción de hacer la curva normal. Lo
hacemos y luego le pedimos los estadísticos: se le pueden pedir todos.
En las ordinales, las ciencias sociales permiten calcular las medias. En este caso se
consideran variables cuasiintervalos.
La desviación típica nos muestra la concentración de los datos respecto a la media para
tener una visión más real
La varianza es el cuadrado de la desviación típica. Lo que se interpreta siempre es la
desviación típica, la varianza se usa para otros análisis. Vamos a pedir el rango, las dos
puntuaciones extremas.

Estadísticos
Motivación (0-30)
N Válido 314
Perdidos 6
Media 16,16
Mediana 15,00
Moda 14
Desv. Desviación 6,312
Varianza 39,840
Rango 25
Mínimo 5
Máximo 30
Suma 5074

5074 dividido por 314 te daría la media


Rango es la diferencia entre la puntuación más alta y la más baja.
Mediana, el valor del medio.
Moda, el que más se repite
Desviación típica. Cuanto más grande es más dispersas son las puntuaciones de la
media
Motivación (0-30)
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válido 5 10 3,1 3,2 3,2
7 8 2,5 2,5 5,7
8 20 6,3 6,4 12,1
9 14 4,4 4,5 16,6
10 20 6,3 6,4 22,9
12 30 9,4 9,6 32,5
14 54 16,9 17,2 49,7
15 4 1,3 1,3 51,0
16 10 3,1 3,2 54,1
17 16 5,0 5,1 59,2
18 44 13,8 14,0 73,2
20 6 1,9 1,9 75,2
22 8 2,5 2,5 77,7
23 8 2,5 2,5 80,3
24 32 10,0 10,2 90,4
27 18 5,6 5,7 96,2
28 6 1,9 1,9 98,1
30 6 1,9 1,9 100,0
Total 314 98,1 100,0
Perdidos Sistema 6 1,9
Total 320 100,0

El porcentaje acumulado te ayuda a agrupar. Ejemplo % de sujetos con puntuaciones


menores de 19. El dato es 16.6 (9 de la columna porcentaje acumulado)
No cumple la normalidad, no puedes usar paramétrica.
Imaginemos dos grupos de igual media. Cómo los discriminamos? Por su desviación
típica. La desviación más pequeña indica que las puntuaciones están más concentradas.
El punto de partida estará en saber el valor más pequeño que es cero. Esto indica que
todos los sujetos tienen la misma puntuación. El valor máximo de la desviación se sitúa
en la mitad de la escala con la que se trabaje. Ej. En una escala de 0 a 10, el valor
máximo sería de 5. Se interpretaría del siguiente modo:

0 1.25 2.5 3.75 5


Alta homogeneidad Media homo. Media heterog Alta heterogen.

Alta homogeniedad significa que están muy juntas


Volvamos al ejemplo de motivación:

Desv. Desviación 6,312


Máximo 30

Tomaríamos 6.312 de 15.


0 7.5 15
Tiene media homogeneidad
Si quiero comparar la media en motivación por género
Analizar/comparar medias
Resumen de procesamiento de casos
Casos
Incluido Excluido Total
N Porcentaje N Porcentaje N Porcentaje
Motivación (0-30) * Sexo 314 98,1% 6 1,9% 320 100,0%

Informe
Motivación (0-30)
Desv.
Sexo Media N Desviación
Hombre 16,14 173 6,221
Mujer 16,18 141 6,444
Total 16,16 314 6,312

La media es más alta en las mujeres. Aparentemente son iguales o similares. Pero las
medias por género son diferentes y significativas?
De los que toman medicación o no quiero saber las medias de habilidades sociales

Resumen de procesamiento de casos


Casos
Incluido Excluido Total
N Porcentaje N Porcentaje N Porcentaje
Habilidades sociales (0-40) 318 99,4% 2 0,6% 320 100,0%
* Toma medicación

Informe
Habilidades sociales (0-40)
Desv.
Toma medicación Media N Desviación
Sí 24,06 169 6,720
No 23,34 149 6,549
Total 23,72 318 6,640

Ahora quiero saber medicación* otras 5 variables

Resumen de procesamiento de casos


Casos
Incluido Excluido Total
N Porcentaje N Porcentaje N Porcentaje
Realización Profesional (0- 316 98,8% 4 1,3% 320 100,0%
20) * Toma medicación
Motivación (0-30) * Toma 314 98,1% 6 1,9% 320 100,0%
medicación
Nivel intelectual (0-50) * 312 97,5% 8 2,5% 320 100,0%
Toma medicación
Nivel de empatía (0-80) * 310 96,9% 10 3,1% 320 100,0%
Toma medicación
Habilidades sociales (0-40) 318 99,4% 2 0,6% 320 100,0%
* Toma medicación

Informe
Realización Nivel Nivel de Habilidades
Profesional Motivación intelectual (0- empatía (0- sociales (0-
Toma medicación (0-20) (0-30) 50) 80) 40)
Sí Media 10,82 17,81 21,96 45,07 24,06
N 168 167 168 165 169
Desv. 4,912 6,378 6,420 15,294 6,720
Desviación
No Media 7,91 14,29 19,77 35,41 23,34
N 148 147 144 145 149
Desv. 4,515 5,703 5,510 13,723 6,549
Desviación
Total Media 9,46 16,16 20,95 40,55 23,72
N 316 314 312 310 318
Desv. 4,942 6,312 6,106 15,337 6,640
Desviación

Ahora veremos si son significativas. Para esto necesitamos conocer el nivel de


significación o confianza. El nivel con el que aseguras que tus datos son ciertos. Lo
aceptable es entre el 95 y el 99%. Nunca se llega al 100%.
El spss te da un p valor (valor empírico), el sig. Se compara el valor empírico con el
crítico. SPSS te da el empírico. Tú eliges el crítico (alfa). Si p es mayor o igual que alfa,
las diferencias son no significativas. Si p es menor o igual que alfa entonces son
significativas. Ej. Nc= 97%, la p sale 0.021 es menor de 0.03. Otro ej. Nc del 95% nos
movemos en 0.05. Si p o sig es 0.053 sale no significativo.
Si comparas dos grupos: T Student, si es 3 o más grupos Anova de un factor (factor= VI),
si fueran más sería ANOVA factorial
Levenne te dice si están compensados o equilibrados o son homogéneos en desviaciones
típicas y número de sujetos. Si están compensados o no se mira una cosa u otra.
Si p= 0.061 a un nivel de confianza del 95%. Como no es significativo están
compensados.
Ej. Vamos a comparar medias en nivel de empatía*medicación
Variable de prueba o agrupación es lo mismo que VD y VI. Definimos grupos y luego
damos a opciones.
Se define el NC. Ponemos 99 xq la muestra es amplia.
T-TEST GROUPS=Medicam(1 2)
/MISSING=ANALYSIS
/VARIABLES=Empat
/CRITERIA=CI(.99).

Prueba T

Estadísticas de grupo
Desv. Desv. Error
Toma medicación N Media Desviación promedio
Nivel de empatía (0-80) Sí 165 45,07 15,294 1,191
No 145 35,41 13,723 1,140

Prueba de muestras independientes


Prueba de
Levene de
igualdad de
varianzas prueba t para la igualdad de medias
Diferencia Diferencia 99% de intervalo
Sig. de de error de confianza de
F Sig. t gl (bilateral) medias estándar la diferencia
Inferior Superior
Nivel de Se 4,097 ,044 5,820 308 ,000 9,659 1,660 5,357 13,961
empatía asumen
(0-80) varianzas
iguales
No se 5,860 307,862 ,000 9,659 1,648 5,387 13,931
asumen
varianzas
iguales

Levene me sirve para saber si están compensados. Me dice que es 0.044. Como hemos
elegido el 99 NC no es significativo y por tanto los grupos están compensados. Se asumen
varianzas iguales. Ahora miramos la significación de la T .000 hay diferencias
significativas a un 99%. Los que tienen medicación son los más empáticos.
Identificamos si hay diferencias entre el nivel de optimismo y las que han usado distinto
tipo de terapia.

Estadísticas de grupo
Desv. Desv. Error
Terapia psicológica N Media Desviación promedio
Nivel de Optimismo (0-18) Cognitivo-conductual 108 10,52 3,364 ,324
Sistémica 100 10,08 4,583 ,458

Prueba de muestras independientes


Prueba de
Levene de
igualdad de
varianzas prueba t para la igualdad de medias
99% de intervalo
de confianza de
Sig. Diferenci Diferenci la diferencia
(bilateral a de a de error Inferio Superio
F Sig. t gl ) medias estándar r r
Nivel de Se 27,31 ,00 ,79 206 ,430 ,439 ,555 -1,003 1,881
Optimism asumen 3 0 1
o (0-18) varianza
s iguales
No se ,78 180,79 ,436 ,439 ,561 -1,022 1,899
asumen 2 1
varianza
s iguales

No son homogéneos y no hay diferencias de medias entre 1 y 2

Estadísticas de grupo
Desv. Desv. Error
Terapia psicológica N Media Desviación promedio
Nivel de Optimismo (0-18) Sistémica 100 10,08 4,583 ,458
Mixta 112 8,39 3,615 ,342

Prueba de muestras independientes


Prueba de
Levene de
igualdad de
varianzas prueba t para la igualdad de medias
99% de intervalo
de confianza de
Sig. Diferenci Diferenci la diferencia
(bilateral a de a de error Inferio Superio
F Sig. t gl ) medias estándar r r
Nivel de Se 14,73 ,00 2,99 210 ,003 1,687 ,564 ,221 3,153
Optimism asumen 5 0 1
o (0-18) varianza
s iguales
No se 2,95 187,84 ,004 1,687 ,572 ,200 3,175
asumen 2 8
varianza
s iguales

No son homogéneos y hay diferencias a 0.01. Los que acuden a terapia sistémica tienen
una media de optimismo mayor que los de la mixta

La anova no debe usarse con 2 grupos. En este caso es más potente la prueba T. Anova
de un factor se usa cuando son más de 2 grupos.
Comparación medias/anova
Ej. Ver si hay diferencias madurez emocional y nivel socioeconómico

Post hoc marcamos el nc y luego vamos a opciones y calculamos descriptivos

Descriptivos
Madurez emocional (0-10)
95% del intervalo de
confianza para la media
Desv. Desv. Límite Límite
N Media Desviación Error inferior superior Mínimo Máximo
Bajo 108 5,17 1,716 ,165 4,84 5,49 1 8
Medio 104 4,37 2,390 ,234 3,90 4,83 1 8
Alto 108 3,54 2,115 ,204 3,13 3,94 1 9
Total 320 4,36 2,187 ,122 4,12 4,60 1 9

ANOVA
Madurez emocional (0-10)
Suma de Media
cuadrados gl cuadrática F Sig.
Entre grupos 143,420 2 71,710 16,449 ,000
Dentro de grupos 1381,967 317 4,360
Total 1525,388 319

Es significativo con un NC del 95%


Calculamos Bonferroni. Tukey se usa para ordinales
Comparaciones múltiples
Variable dependiente: Madurez emocional (0-10)
Bonferroni
Intervalo de confianza al
Diferencia 95%
(I) Nivel (J) Nivel de medias Desv. Límite Límite
socioeconómico socioeconómico (I-J) Error Sig. inferior superior
Bajo Medio ,801* ,287 ,017 ,11 1,49
Alto 1,630* ,284 ,000 ,95 2,31
Medio Bajo -,801* ,287 ,017 -1,49 -,11
*
Alto ,828 ,287 ,012 ,14 1,52
Alto Bajo -1,630* ,284 ,000 -2,31 -,95
Medio -,828* ,287 ,012 -1,52 -,14
*. La diferencia de medias es significativa en el nivel 0.05.

En todos los casos hay diferencias significativas


Otro ejemplo: Hay diferencias entre nivel intelectual y las tres terapias:

Descriptivos
Nivel intelectual (0-50)
95% del intervalo de
confianza para la media
Desv. Desv. Límite Límite
N Media Desviación Error inferior superior Mínimo Máximo
Cognitivo- 108 21,22 6,766 ,651 19,93 22,51 12 43
conductual
Sistémica 94 20,70 6,825 ,704 19,30 22,10 11 33
Mixta 110 20,89 4,644 ,443 20,01 21,77 10 28
Total 312 20,95 6,106 ,346 20,27 21,63 10 43

ANOVA
Nivel intelectual (0-50)
Suma de Media
cuadrados gl cuadrática F Sig.
Entre grupos 14,162 2 7,081 ,189 ,828
Dentro de grupos 11581,017 309 37,479
Total 11595,179 311

No hay diferencias
El anova multifactorial cuando hay 2 VI se calcula con modelos lineales
Scheffé con variable escala y cuando no hay igual número de sujetos en los grupos.
Bonferroni cuando sí hay igual número.

CORRELACIONES
Sirve para ver las relaciones entre las variables.
Ordinales--- Spearman
Escala------- Pearson
Los valores van de -1 a 1. Si se aproximan a 1 se dice que la correlación es perfecta
Si el valor es negativo, las variables van cruzadas, es decir, cuando una aumenta baja la
otra y viceversa. Si la correlación es nula las variables no guardan relación entre sí. La
tercera opción es que estén correlacionadas.
Criterios moderadamente exigentes:

1 -0.7 0 0.69 0.7 1


-0.39 nula 0.39+ moderada alta

Autores de referencia: en el documento que nos ha dado.


Tiene que cumplir dos requisitos: correlación alta y significativa. Te puede dar
significativa y ser baja, no sería correcto. Se tienen que dar las dos cosas.

Habilidades y nivel de empatía. Son escala, entonces Pearson


Correlaciones
Habilidades Nivel de
sociales (0-40) empatía (0-80)
Habilidades sociales (0-40) Correlación de Pearson 1 ,378**
Sig. (bilateral) ,000
N 318 308
Nivel de empatía (0-80) Correlación de Pearson ,378** 1
Sig. (bilateral) ,000
N 308 310
**. La correlación es significativa en el nivel 0,01 (bilateral).

Es significativo, pero es muy baja y hay que indicar el autor en el que te basas para decir
si es nula o no.
Motivación y nivel de optimismo.

Correlaciones
Nivel de
Motivación (0- Optimismo (0-
30) 18)
Motivación (0-30) Correlación de Pearson 1 ,642**
Sig. (bilateral) ,000
N 314 314
Nivel de Optimismo (0-18) Correlación de Pearson ,642** 1
Sig. (bilateral) ,000
N 314 320
**. La correlación es significativa en el nivel 0,01 (bilateral).

Es significativa positiva y moderada. Los sujetos con mayor motivación son los que
tienen niveles de optimismo más alto. Aquí no se habla de relaciones causa-efecto. Ahora
introducimos todas las variables escala.

Correlaciones
Nivel
de
Nivel Realiza Nivel superac Percepc Madur
de ción Nivel de Habilida ion ion de ez
Motivac Optimis Profesio intelect empa des person calidad emocio
ión (0- mo (0- nal (0- ual (0- tía (0- sociales al (0- de vida nal (0-
30) 18) 20) 50) 80) (0-40) 30) (0-30) 10)
Motivaci Correlac 1 ,642** ,956** ,723** ,890** ,533** ,934** ,620** ,588**
ón (0- ión de
30) Pearson
Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
(bilatera
l)
N 314 314 310 306 304 312 312 312 314
Nivel de Correlac ,642** 1 ,609** ,859** ,549** ,171** ,686** ,792** ,599**
Optimis ión de
mo (0- Pearson
18) Sig. ,000 ,000 ,000 ,000 ,002 ,000 ,000 ,000
(bilatera
l)
N 314 320 316 312 310 318 318 318 320
Realizac Correlac ,956** ,609** 1 ,716** ,935** ,477** ,924** ,623** ,506**
ión ión de
Profesio Pearson
nal (0- Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
20) (bilatera
l)
N 310 316 316 308 306 314 314 314 316
Nivel Correlac ,723** ,859** ,716** 1 ,682** ,224** ,765** ,839** ,683**
intelectu ión de
al (0-50) Pearson
Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
(bilatera
l)
N 306 312 308 312 304 310 310 310 312
Nivel de Correlac ,890** ,549** ,935** ,682** 1 ,378** ,872** ,544** ,372**
empatía ión de
(0-80) Pearson
Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
(bilatera
l)
N 304 310 306 304 310 308 308 308 310
Habilida Correlac ,533** ,171** ,477** ,224** ,378** 1 ,498** ,173** ,379**
des ión de
sociales Pearson
(0-40) Sig. ,000 ,002 ,000 ,000 ,000 ,000 ,002 ,000
(bilatera
l)
N 312 318 314 310 308 318 316 316 318
Nivel de Correlac ,934** ,686** ,924** ,765** ,872** ,498** 1 ,648** ,498**
superaci ión de
on Pearson
personal Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
(0-30) (bilatera
l)
N 312 318 314 310 308 316 318 316 318
Percepc Correlac ,620** ,792** ,623** ,839** ,544** ,173** ,648** 1 ,646**
ion de ión de
calidad Pearson
de vida Sig. ,000 ,000 ,000 ,000 ,000 ,002 ,000 ,000
(0-30) (bilatera
l)
N 312 318 314 310 308 316 316 318 318
Madure Correlac ,588** ,599** ,506** ,683** ,372** ,379** ,498** ,646** 1
z ión de
emocion Pearson
al (0-10) Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
(bilatera
l)
N 314 320 316 312 310 318 318 318 320
**. La correlación es significativa en el nivel 0,01 (bilateral).

Amarillo: correlación y significativa


Gris: significativo, no correlacionan
Interpretación:

1 -0.7 0 0.69 0.7 1


-0.39 nula 0.39+ moderada alta

Nivel de superación *habilidades sociales: es significativa, correlación moderada

Calculemos Spearman

Correlaciones
Ambiente Nivel
familiar socioeconómico
Ambiente familiar Correlación de Pearson 1 -,140*
Sig. (bilateral) ,012
N 320 320
Nivel socioeconómico Correlación de Pearson -,140* 1
Sig. (bilateral) ,012
N 320 320
*. La correlación es significativa en el nivel 0,05 (bilateral).

No hay correlación

ANÁLISIS CLUSTER

Te permite agrupar datos en grupos y establecer perfiles de esos grupos, perfiles de sujetos
en esos grupos que se parecen entre sí. Los tanteos hasta agrupar se llaman iteraciones.
ANALIZAR7CLASIFICAR/K MEDIAS

Tienes que indicar el número de grupos que quieres (esto se hace en función de la
literatura). Si definimos perfil en Tic y la unesco indica que 3 básico, avanzado y experto,
definiríamos 3.
Un ejemplo: motivación, nivel intelectual y madurez, 3 grupos

Centros de clústeres iniciales


Clúster
1 2 3
Motivación (0-30) 28 24 5
Nivel intelectual (0-50) 43 22 12
Madurez emocional (0-10) 9 6 1
Historial de iteracionesa
Cambiar en centros de clústeres
Iteración 1 2 3
1 ,000 4,607 6,665
2 ,000 1,374 1,087
3 ,000 ,476 ,404
4 ,000 ,000 ,000
a. Convergencia conseguida debido a que no hay
ningún cambio en los centros de clústeres o un
cambio pequeño. El cambio de la coordenada
máxima absoluta para cualquier centro es ,000.
La iteración actual es 4. La distancia mínimo
entre los centros iniciales es 21,587.

Centros de clústeres finales


Clúster
1 2 3
Motivación (0-30) 28 21 11
Nivel intelectual (0-50) 43 24 17
Madurez emocional (0-10) 9 5 3

Número de casos en
cada clúster
Clúster 1 6,000
2 146,000
3 154,000
Válidos 306,000
Perdidos 14,000

Solo nos interesan las dos últimas tablas. No puede salir un solo sujeto en un grupo,
deberíamos reducir.
De los 6 sujetos del claster 1 sacan una motivación media de 28, nivel intelectual de 43 y
9 de madurez. El cluster 2 tiene una motivación de 21 sobre 30, 24 de nivel intelectual y
una madurez de 5 media teniendo en cuenta el intervalo. Los del claster 3 tienen una
motivación de 11, nivel intelectual de 17 y una madurez de 3, muy baja.
Las variables nominales dan problemas a la hora de clasificar.
Mínimo 2 grupos, máximo recomendable 4 grupos. De otro modo, se complica mucho
Para poblaciones: el INE puede darnos datos globales de población.
https://www.ine.es/ss/Satellite?L=es_ES&c=Page&cid=1254735910183&p=125473591
0183&pagename=INE%2FINELayout
filtramos población universitaria
https://www.ine.es/jaxi/tabla.do?type=pcaxis&path=/t22/p133/a2014/l0/&file=06003.px

Madrid, Comunidad de
Ambos sexos
VII. Licenciados y similares, y doctores universitarios 40.326,04

Para calcular la muestra vamos a la calculadora de google


https://es.surveymonkey.com/mp/sample-size-calculator/

Você também pode gostar