Você está na página 1de 20

Metodologa II: Anlisis de Datos

Prof. Reinaldo Mayol Derecho

Por donde vamos?

Luego de obtenidos los datos, el siguiente paso es realizar el anlisis de los mismos. Aunque ha sido presentado en este curso de manera secuencial es importante que antes de obtener los datos se piense que tipo de anlisis se realizar y que informacin es importante recolectar, incluyendo el formato de la misma

Depuracin de la Informacin

El objetivo es encontrar anomalas en los datos recolectados.

Ej. Si una variable contiene el sexo de los participantes en un experimento codificado como 1: Hombres 0: Mujeres y aparecen otros valores ( 3,4,etc) significa que ha ocurrido un error. Si no es posible corregir esos valores debe asumirse la prdida de los mismos.( missing values) Igual condicin puede suceder, por ejemplo si de una variable no se tienen todos los valores para cada caso.

Tipos de Anlisis

Anlisis de Datos

Anlisis Estadsticos Univariables

Anlisis Estadsticos Bivariables

Anlisis Estadsticos Multivariables

Anlisis Univariables ( exploratorios)

Suelen ser la antesala para la realizacin de otros anlisis. Se concentran en una sola variable y buscan encontrar y representar caractersticas propias de las mismas.

A.Univariables
Medidas de Tendencia Central Y Frecuencias

Medidas de Dispersin

Formas de la Distribucin

Medidas de Tendencia Central


Media Mediana Moda

Medidas de Frecuencia
Frecuencia Absoluta Frecuencia Relativa Frecuencia Acumulada

Ejemplo tomado de: Apuntes para la Asignatura Probabilidades y Estadsticas, Prof. Jos Juan Rincn

Medidas de Dispersin

Rango o Recorrido Desviacin Tpica Varianza

Medidas de la forma de la distribucin


Asimetra Curtosis

Ejemplo, Variable Sueldo


Statistics Sueldo N Valid Missing 7 1 $550.00 $400.00 $400 $553.022 305833,3 1,440 ,794 1,281 1,587 $1,500 $100 $1,600 $3,850

Individuo 1 2 3 4 5 6 7 8 9

Sueldo 100 200 150 400 1000 1600 400 1000


Valid

Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
Sueldo Frequency 1 1 1 2 1 1 7 1 8 Percent 12,5 12,5 12,5 25,0 12,5 12,5 87,5 12,5 100,0

---

Missing Total

$100 $150 $200 $400 $1,000 $1,600 Total $0

Valid Percent 14,3 14,3 14,3 28,6 14,3 14,3 100,0

Cumulative Percent 14,3 28,6 42,9 71,4 85,7 100,0

Histograma Variable Sueldo

Ejemplo 2. Variable Temperatura


Statistics

Da 1 2 3 4 5 6 7 8 9

Temperatura 30 31 30 32 29 30 31 31 32

Temperatura N Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum

Valid Missing

9 0 30,67 31,00 30a 1,000 1,000 -,107 ,717 -,643 1,400 3 29 32 276

a. Multiple modes exist. The smallest value is shown Temperatura Frequency 1 3 3 2 9 Percent 11,1 33,3 33,3 22,2 100,0 Valid Percent 11,1 33,3 33,3 22,2 100,0 Cumulative Percent 11,1 44,4 77,8 100,0

Valid

29 30 31 32 Total

Histograma Variable Temperatura

Ejemplo 3 Variable humedad relativa


Statistics Humedadad N Valid Missing 9 0 84,8889 91,0000 90,00a 15,51970 240,861 -1,868 ,717 2,817 1,400 46,00 50,00 96,00 764,00

Da 1 2 3 4 5 6 7 8 9

Humedad 90 91 91 92 96 96 68 50 90
Valid

Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum

a. Multiple modes exist. The smallest value is shown


Humedadad Frequency 1 1 2 2 1 2 9 Percent 11,1 11,1 22,2 22,2 11,1 22,2 100,0 Valid Percent 11,1 11,1 22,2 22,2 11,1 22,2 100,0 Cumulative Percent 11,1 22,2 44,4 66,7 77,8 100,0

50,00 68,00 90,00 91,00 92,00 96,00 Total

Histograma,Variable Humedad

Anlisis Bivariable

Luego de realizar los anlisis exploratorios corresponde realizar los anlisis bivariables con dos fines:

Fines Descriptivos: Describir al conjunto de la poblacin observada Fines Explicativos: Analizar la posible existencia de relaciones causales entre dos variables ( dependiente e independiente)

Tablas de Contingencia

Por tablas de contingencia se entiende aquellas de doble entrada, donde se realiza una clasificacin de la muestra de acuerdo a un doble criterio de clasificacin Cada valor de la tabla es el cruce de una fila y una columna.( variable dependiente vs. Independiente) Una variacin porcentual es significativa si es mayor al 5 % ( dependiendo del error)
Humedad * Lluvia Crosstabulation Count Lluvia 0 Humedad 70 80 84 85 95 1 3 0 0 0 4 1 0 0 2 1 2 5 Total 1 3 2 1 2 9

1: Llueve 0: No llueve

Total

Si existen mayores niveles de humedad ( >84) llueve

Covariacin

Dos variables se encuentran relacionadas si sus parmetros varan conjuntamente. Para medir esta relacin se utilizan mtodos estadsticos de contingencia:

Variables Nominales: Chi Cuadrado, C Pearson,etc Variables Ordinales: Rho de Spearman, Tau-A, etc. Variables de Intervalo: Coeficiente de Correlacin producto-momento de Pearson

Anlisis Multivariables

Buscan relaciones entre ms de dos variables de manera simultnea. En las ciencias sociales el anlisis bivariable es por regla general insuficiente o simplista Las tcnicas de AMV se pueden agrupar en dos grupos:

Tcnicas de Dependencia Tcnicas de Interdependencia

Fin

Você também pode gostar