Escolar Documentos
Profissional Documentos
Cultura Documentos
Luego de obtenidos los datos, el siguiente paso es realizar el anlisis de los mismos. Aunque ha sido presentado en este curso de manera secuencial es importante que antes de obtener los datos se piense que tipo de anlisis se realizar y que informacin es importante recolectar, incluyendo el formato de la misma
Depuracin de la Informacin
Ej. Si una variable contiene el sexo de los participantes en un experimento codificado como 1: Hombres 0: Mujeres y aparecen otros valores ( 3,4,etc) significa que ha ocurrido un error. Si no es posible corregir esos valores debe asumirse la prdida de los mismos.( missing values) Igual condicin puede suceder, por ejemplo si de una variable no se tienen todos los valores para cada caso.
Tipos de Anlisis
Anlisis de Datos
Suelen ser la antesala para la realizacin de otros anlisis. Se concentran en una sola variable y buscan encontrar y representar caractersticas propias de las mismas.
A.Univariables
Medidas de Tendencia Central Y Frecuencias
Medidas de Dispersin
Formas de la Distribucin
Medidas de Frecuencia
Frecuencia Absoluta Frecuencia Relativa Frecuencia Acumulada
Ejemplo tomado de: Apuntes para la Asignatura Probabilidades y Estadsticas, Prof. Jos Juan Rincn
Medidas de Dispersin
Asimetra Curtosis
Individuo 1 2 3 4 5 6 7 8 9
Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
Sueldo Frequency 1 1 1 2 1 1 7 1 8 Percent 12,5 12,5 12,5 25,0 12,5 12,5 87,5 12,5 100,0
---
Missing Total
Da 1 2 3 4 5 6 7 8 9
Temperatura 30 31 30 32 29 30 31 31 32
Temperatura N Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
Valid Missing
9 0 30,67 31,00 30a 1,000 1,000 -,107 ,717 -,643 1,400 3 29 32 276
a. Multiple modes exist. The smallest value is shown Temperatura Frequency 1 3 3 2 9 Percent 11,1 33,3 33,3 22,2 100,0 Valid Percent 11,1 33,3 33,3 22,2 100,0 Cumulative Percent 11,1 44,4 77,8 100,0
Valid
29 30 31 32 Total
Da 1 2 3 4 5 6 7 8 9
Humedad 90 91 91 92 96 96 68 50 90
Valid
Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
Histograma,Variable Humedad
Anlisis Bivariable
Luego de realizar los anlisis exploratorios corresponde realizar los anlisis bivariables con dos fines:
Fines Descriptivos: Describir al conjunto de la poblacin observada Fines Explicativos: Analizar la posible existencia de relaciones causales entre dos variables ( dependiente e independiente)
Tablas de Contingencia
Por tablas de contingencia se entiende aquellas de doble entrada, donde se realiza una clasificacin de la muestra de acuerdo a un doble criterio de clasificacin Cada valor de la tabla es el cruce de una fila y una columna.( variable dependiente vs. Independiente) Una variacin porcentual es significativa si es mayor al 5 % ( dependiendo del error)
Humedad * Lluvia Crosstabulation Count Lluvia 0 Humedad 70 80 84 85 95 1 3 0 0 0 4 1 0 0 2 1 2 5 Total 1 3 2 1 2 9
1: Llueve 0: No llueve
Total
Covariacin
Dos variables se encuentran relacionadas si sus parmetros varan conjuntamente. Para medir esta relacin se utilizan mtodos estadsticos de contingencia:
Variables Nominales: Chi Cuadrado, C Pearson,etc Variables Ordinales: Rho de Spearman, Tau-A, etc. Variables de Intervalo: Coeficiente de Correlacin producto-momento de Pearson
Anlisis Multivariables
Buscan relaciones entre ms de dos variables de manera simultnea. En las ciencias sociales el anlisis bivariable es por regla general insuficiente o simplista Las tcnicas de AMV se pueden agrupar en dos grupos:
Fin