Você está na página 1de 17

Universidad de Buenos Aires Facultad de Ciencias Sociales Carrera de Sociologa

Documento de Ctedra 25: Introduccin a la estadstica descriptiva: principales conceptos

Autores: Gelfman, Julia; Martnez Mendoza, Ramiro; Rosa, Paula y Tignino, Mara Victoria (2007)

Ctedra de Metodologa y Tcnicas de la Investigacin Social, Profesora Titular: Ruth Sautu, Carrera de Sociologa, Facultad de Ciencias Sociales, Universidad de Buenos Aires (UBA)

Este Documento de Ctedra forma parte de una serie que tiene como propsito contribuir a la formacin de los alumnos de la Carrera de Sociologa de la Universidad de Buenos Aires en cuestiones vinculadas al diseo y realizacin de investigaciones cientficas en el campo de las ciencias sociales. Su contenido complementa los textos de metodologa de lectura obligatoria y optativa incluidos en cada uno de los tres cursos que se dictan en la Carrera. La Ctedra solicita a los usuarios de estos Documentos que citen a sus autores indicando las referencias completas, es decir: autores, fecha, ttulo y nmero del documento (traduccin, resumen, elaboracin propia, etc.). En los casos en que el usuario utilice slo parte del documento, haciendo referencia a algunos de los autores/obras originales all incluidos, consignar que fue tomado de nuestro Documento de Ctedra. Por ejemplo: E.O Wrigth (1985), Classes, London: Verso, citado en Documento de Ctedra II.1., Plotno, G., Lederman, F. & Krause, M. (2007) Escalas Ocupacionales.

I. Introduccin
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: Variables cualitativas: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales). A su vez cada uno de estos tipos de variables pueden distinguirse entre: Variables cualitativas: Nominales: refieren a diferencias en cualidades o denominaciones, que no implican un ordenamiento de ningn tipo entre las categoras de la misma variable. Ordinales: refieren a variables con sistemas de categoras que involucran un ordenamiento, por ejemplo de mayor a menor. Variables cuantitativas: Intervalares: poseen un sistema de categoras numrico, que permite identificar diferencias en cantidad, monto, etc. Adems, en sus puntuaciones el cero no implica la ausencia de la cualidad o atributo que se est midiendo. De cociente o razn: posee las mismas caractersticas que las variables de intervalo, sin embargo en sus puntuaciones el cero implica la ausencia de la cualidad o atributo que se est midiendo. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: Individuo: cualquier elemento que aporte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. Poblacin: conjunto de todos los individuos (personas, objetos, animales, etctera) que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas de dicha ciudad. Unidad de anlisis: Son es el qu o el quin se quiere investigar. Es decir, aquellas unidades u objetos que examinamos con el fin de crear descripciones. Generalmente en las ciencias sociales las unidades de anlisis son personas.

(Babbie; 1996). Existen distintos tipos de unidades de anlisis. Entre los ms habituales para las ciencias sociales podemos encontrar:
Individuos: Las personas son las unidades de anlisis ms tpicas. Cualquier variedad de individuos se puede considerar unidad de anlisis. Los individuos pueden ser caracterizados segn su pertenencia a grupos sociales. Grupos: Los grupos sociales pueden ser en s mismos unidades de anlisis para la investigacin en ciencias sociales. Las familias podran ser las unidades de anlisis de un estudio. Tambin los matrimonios, las ciudades o las regiones geogrficas. Cada uno de estos trminos implica algn grupo de poblacin. Organizaciones: Las organizaciones sociales formales pueden ser unidades de anlisis. Las iglesias, los supermercados o las universidades forman parte de este tipo de unidad de anlisis. Artefactos sociales: Los artefactos sociales o los productos de la vida o la conducta social tambin pueden ser unidades de anlisis. Pueden ser los libros, las pinturas, las canciones o los juegos. Cada uno de estos objetos implica una poblacin de todos ellos. Otro tipo de artefactos sociales son las interacciones sociales, como ejemplo podemos nombrar las bodas, los accidentes de trnsito, las peleas o los secuestros areos.

Muestra: subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

II. Distribucin de frecuencia


La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Veamos un ejemplo: Medimos la edad (en aos cumplidos a la fecha del relevamiento) de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 y obtenemos los siguientes resultados:

Tabla 1.1: Distribucin de frecuencias de la variable edad (en aos cumplidos a la fecha del relevamiento) de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005
Joven Investigador x-unidad de anlisis JI N 1 JI N 2 JI N 3 JI N 4 JI N 5 JI N 6 JI N 7 JI N 8 JI N 9 JI N 10 JI N 11 JI N 12 JI N 13 JI N 14 JI N 15 JI N 16 JI N 17 JI N 18 JI N 19 JI N 20 JI N 21 JI N 22 JI N 23 JI N 24 JI N 25 JI N 26 JI N 27 JI N 28 JI N 29 JI N 30 JI N 31 JI N 32 JI N 33 JI N 34 JI N 35 JI N 36 Edad x 29 25 34 28 25 26 23 31 26 24 33 33 37 26 25 37 38 27 24 36 23 36 29 26 27 27 40 35 29 29 25 27 29 31 29 30 JI N 38 JI N 39 JI N 40 JI N 41 JI N 42 JI N 43 JI N 44 JI N 45 JI N 46 JI N 47 JI N 48 JI N 49 JI N 50 JI N 51 JI N 52 JI N 53 JI N 54 JI N 55 JI N 56 JI N 57 JI N 58 JI N 59 JI N 60 JI N 61 JI N 62 JI N 63 JI N 64 JI N 65 JI N 66 JI N 67 JI N 68 JI N 69 JI N 70 JI N 71 JI N 72 JI N 73 JI N 74 JI N 75 JI N 76 JI N 77 JI N 78 25 27 26 28 24 26 28 24 32 30 28 40 31 25 27 24 29 26 30 28 29 28 32 34 31 30 30 32 32 30 24 28 29 28 28 26 30 28 25 28 31 JI N 79 JI N 80 JI N 81 JI N 82 JI N 83 JI N 84 JI N 85 JI N 86 JI N 87 JI N 88 JI N 89 JI N 90 JI N 91 JI N 92 JI N 93 JI N 94 JI N 95 JI N 96 JI N 97 JI N 98 JI N 99 JI N 100 JI N 101 JI N 102 JI N 103 JI N 104 JI N 105 JI N 106 JI N 107 JI N 108 JI N 109 JI N 110 JI N 111 JI N 112 JI N 113 JI N 114 JI N 115 JI N 116 JI N 117 JI N 118 JI N 119 27 28 33 30 28 25 29 27 26 27 25 35 23 28 24 28 25 31 29 27 25 27 32 27 26 30 40 31 26 35 29 36 28 30 27 35 27 26 29 29 31 JI N 120 JI N 121 JI N 122 JI N 123 JI N 124 JI N 125 JI N 126 JI N 127 JI N 128 JI N 129 JI N 130 JI N 131 JI N 132 JI N 133 JI N 134 JI N 135 JI N 136 JI N 137 JI N 138 JI N 139 JI N 140 JI N 141 JI N 142 JI N 143 JI N 144 JI N 145 JI N 146 JI N 147 JI N 148 JI N 149 JI N 150 JI N 151 JI N 152 JI N 153 JI N 154 28 28 34 28 33 34 38 35 36 39 36 34 39 40 31 37 29 32 32 37 30 32 32 36 35 36 37 23 30 38 32 40 35 33 33

JI N 37 30 Fuente: Elaboracin propia

Si presentamos esta informacin estructurada obtendramos la siguiente tabla de frecuencia:


Tabla 1.2: Distribucin de frecuencias de la variable edad (en aos cumplidos a la fecha del relevamiento) de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 Variable (Valor)
23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Total
Fuente: Elaboracin propia

Frecuencias absolutas Simple


4 7 11 12 14 19 15 13 9 10 6 5 7 7 5 3 2 5 154

Frecuencias porcentuales Simple


4 11 22 34 48 67 82 95 104 114 120 125 132 139 144 147 149 154 2,6% 4,5% 7,1% 7,8% 9,1% 12,3% 9,7% 8,4% 5,8% 6,5% 3,9% 3,2% 4,5% 4,5% 3,2% 1,9% 1,3% 3,2% 100,0%

Acumulada

Acumulada
2,6% 7,1% 14,3% 22,1% 31,2% 43,5% 53,2% 61,7% 67,5% 74,0% 77,9% 81,2% 85,7% 90,3% 93,5% 95,5% 96,8% 100,0%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. (Tal como se ver a continuacin).

III. Distribuciones de frecuencia agrupada


Supongamos que medimos la edad de Jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 y obtenemos los siguientes resultados (en aos cumplidos a la fecha del relevamiento):
Tabla 1.3: Distribucin de frecuencias de la variable edad (en aos cumplidos a la fecha del relevamiento) de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 Edad (en aos cumplidos a la fecha del relevamiento)
20 - 25 26 - 30 31 - 35 36 - 40 Total
Fuente: Elaboracin propia

Frecuencia
22 73 37 22 154

Porcentaje
14,3 47,4 24,0 14,3 100,0%

Porcentaje acumulado
14,3 61,7 85,7 100,0

Si al presentar esta informacin en una tabla hubisemos obtenido como resultado de frecuencias una tabla de 154 filas (una para cada valor), cada una de ellas con una frecuencia absoluta de 1, dicha tabla nos aportara escasa o nula informacin para ser analizada. En lugar de ello, se agruparon los datos por intervalos, quedando la informacin ms resumida. Los procesos de agrupamiento de datos, donde la informacin es presentada de manera agregada, implican una prdida de informacin detallada pero al mismo tiempo dicho proceso provee al investigador de informacin ms manejable posibilitando su anlisis. El nmero de tramos en los que se agrupa la informacin es una decisin que debe tomar el investigador. La regla es que mientras ms tramos se utilicen menos informacin se pierde, pero puede que menos representativa e informativa sea la tabla.

III.I Punto Medio


En el caso de los datos agrupados (especialmente en el caso del uso de intervalos) no tenemos el valor concreto de los datos para cada unidad de anlisis, por lo tanto usamos el punto medio del intervalo (que funcionara como una especie de promedio del intervalo). El punto medio es el promedio entre los lmites superior e inferior del intervalo. Clculo del punto medio: Lmite inferior + lmite superior = Punto medio 2 En nuestro ejemplo (ver tabla 1.3), el valor del punto medio para el intervalo 20 a 25 aos:

20 + 25 = 22.5 2 IV. Proporcin, Porcentaje, Razn y Tasa


Siguiendo a Holgun Quinez (1988) podemos decir que el porcentaje es la relacin que se establece entre una de las partes con respecto al todo o total multiplicado por cien. La utilidad de los porcentajes est dada porque de ellos se puede obtener comparabilidad que es posible porque los nmeros absolutos se reducen a una escala que es fcil de multiplicar y dividir. Un error comn en la utilizacin de porcentajes es manipular los porcentajes como si estos fuesen nmeros absolutos. Cuando los porcentajes fueron obtenidos de bases diferentes no se los debe sumar ni promediar ni combinar. Solo es correcto realizar estas operaciones si provienen de una misma base de datos. Los porcentajes deben ser calculados en el sentido del factor que se considera como causa (variable independiente). La comparacin debe realizarse en el sentido contrario.

Clculo del porcentaje:

n 100 = % N
En nuestro ejemplo (ver tabla 1.2), para el valor 23 aos:

4 100 = 2.6% 154


Las proporciones, son la relacin que se establece entre una parte con respecto al todo. En las proporciones no se multiplica por cien, es por esta razn que la relacin se establece con respecto a la unidad. Para Ritchey (2001), la proporcin parte de la cantidad total o nmero de observaciones, expresada en decimal.

Clculo de la proporcin:

n = proporcin N
En nuestro ejemplo (ver tabla 1.3), para el intervalo 26 - 30 aos:

73 = 0,47 154
Para Holgun Quinez (1988), las razones son una relacin que se establece entre dos subconjuntos o dos conjuntos. Si las razones se multiplican o dividen por un mismo nmero no se alteran, lo cual permite expresarlas como nmeros enteros en ocasiones. En demografa se utiliza mucho la razn de hombres sobre mujeres.
Tabla 1.4: Distribucin de frecuencias de la variable Sexo de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 Sexo
Mujer Varn Total
Fuente: Elaboracin propia

Frecuencia
69 85 154

Porcentaje
44,8 55,2 100,0%

Clculo de la razn:

A = razn B
En nuestro ejemplo (ver tabla 1.4), la razn de mujeres sobre varones es de:

69 = 0,81 85
Lo que este valor nos est indicando, es que por cada 10 varones investigadores encontramos 8 mujeres investigadoras.

En el caso de la tasa, Ritchey (2001) sostiene que es la frecuencia de ocurrencia de un fenmeno en relacin a un nmero base especificado de sujetos de una poblacin. Para Holgun Quinez (1988), en una tasa o coeficiente el numerador indica el nmero de veces que un evento especfico ocurre durante un particular perodo de tiempo y el denominador es el nmero de veces que el evento est sujeto al riesgo de que ocurra o acontezca. Por lo general las tasas se multiplican por algn nmero (mil, 10 mil, 100 mil, etc.) para expresarlas por el nmero de veces que el evento del numerador acontece en cada, por ejemplo 1000 casos. Las usualmente conocidas son las tasas de mortalidad y natalidad. Clculo de la tasa:

(A / B) * 1000 = tasa
En nuestro ejemplo calcularemos la tasa de investigadores. La tasa de investigadores es el cociente entre el nmero de investigadores en un determinado perodo de tiempo (en general un ao) y el total de la poblacin en nuestro caso expresada cada mil habitantes. Total de investigadores en el pas al 20011: 52.243 Poblacin total del pas al 20012: 36.260.130 Tasa de investigadores:

(52243 / 36260130) * 1000 = 1,4

Lo que este valor nos est indicando, es que en el ao 2001 la argentina tena una persona (1,4) dedicada a investigacin y desarrollo cada mil habitantes.

V. Medidas de tendencia central


Entre las medidas de tendencia central ms comunes podemos encontrar el modo, la media aritmtica, la mediana. Segn Ritchey (2001), un estadstico de tendencia central proporciona una estimacin de la puntuacin tpica, comn o normal encontrada en una distribucin de puntuaciones en bruto.

Modo: se aplica a variables de niveles de medicin nominal, ordinal, intervalares o de cociente o razn. El modo es el valor de la variable que se repite ms veces en una distribucin. Es decir, que es la puntuacin con mayor frecuencia. Cabe aclarar que el modo es ms eficiente cuando se la utiliza en relacin con la mediana y la media aritmtica.
Tradicionalmente se lo simboliza Mo .

Fuente: Ministerio de Educacin, Ciencia y Tecnologa. Secretara de Ciencia, Tecnologa e Innovacin Productiva. Direccin Nacional de Planificacin y Evaluacin. 2 Fuente: INDEC, Censo Nacional de Poblacin, Hogares y Viviendas 2001.

Tabla 1.5: Distribucin de frecuencias de la variable Nombre de la Carrera de Grado de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 Nombre de la Carrera de Grado
Sociologa Comunicacin Social Bioqumica Farmacia Qumica /Ciencias Qumicas Oceanografa Biologa Ciencias Polticas Fsica Matemtica Geologa / Ciencias geolgicas Nutricin Derecho Trabajo Social Composicin Coreogrfica Medicina Total
Fuente: Elaboracin propia

Frecuencia
37 2 38 9 9 1 28 6 9 5 3 1 3 1 1 1 154

Porcentaje
24,0 1,3 24,7 5,8 5,8 0,6 18,2 3,9 5,8 3,2 1,9 0,6 1,9 0,6 0,6 0,6 100,0%

El Mo de la distribucin es Bioqumica, ya que la mayor cantidad de unidades de anlisis (38) cursaron


esa carrera de grado.

Media aritmtica (o promedio): se aplica a las variables intervalares o de cociente o razn. Para obtener la media se realiza una suma de las puntuaciones y se las divide por el total de puntuaciones. De este modo se obtiene el promedio de una distribucin. La media es considerada como el punto de equilibrio de las puntuaciones. Sin embargo, se puede hallar influenciada por los valores extremos negativos como positivos de una distribucin.
Tradicionalmente se simboliza de este modo: X

Clculo de la media aritmtica:

n = X
N

Tomando como ejemplo la distribucin de frecuencias de la variable Edad descripta en la Tabla 1.1:
29 + 25 + 34 + 38 + 25 + 26 + 23 + 31 + 26 + 24 + 33 + 33 + 37 + 26 + 25 + 37 + 38 + 27 + 24 + 36 + 23 + 30 + 29 + 26 + 27 + 27 + 40 + 35 + 29 + 29 + 25 + 27 + 29 + 31 + 29 + 30 + 30 + 25 + 27 + 26 + 28 + 24 + 26 + 28 + 24 + 32 + 30 + 28 + 40 + 31 + 25 + 27 + 24 + 29 + 26 + 30 + 28 + 29 + 28 + 32 + 34 + 31 + 30 + 30 + 32 + 32 + 30 + 24 + 28 + 29 + 28 + 27 + 26 + 30 + 28 + 25 + 28 + 31 + 27 + 28 + 33 + 30 + 28 + 25 + 29 + 27 + 26 + 27 + 25 + 35 + 23 + 28 + 24 + 28 + 25 + 31 + 29 + 27 + 25 + 27 + 32 + 27 + 26 + 30 + 40 + 31 + 26 + 35 + 29 + 36 + 28 + 30 + 27 + 35 + 27 + 26 + 29 + 29 + 31 + 28 + 28 + 34 + 28 + 33 + 34 + 38 + 35 + 36 + 39 + 36 + 34 + 39 + 40 + 31 + 37 + 29 + 32 + 32 + 37 + 30 + 32 + 32 + 36 + 35 + 36 + 37 + 23 + 30 + 38 + 32 + 40 + 35 + 33 + 33 154 = 30.0

4.623 = 30.0 154


El promedio de edad de los jvenes investigadores de la UBA es de 30 aos.

Tomando como ejemplo la distribucin de frecuencias que est agrupada, como ese el caso de la variable Edad descripta en la Tabla 1.2: Clculo de la media aritmtica para dados agrupados:

(n f ) = X
N
(23 4 ) + (24 7 ) + (25 11) + (26 12) + (27 14 ) + (28 19 ) + (29 15 ) + (30 13 ) + (31 9 ) + (32 10 ) + (33 6 ) + (34 5 ) + (35 7 ) + (36 7 ) + (37 5 ) + (38 3 ) + (39 2) + (40 5 ) = 30.0 154

4.623 = 30.0 154


Si la distribucin de frecuencias est agrupada en intervalos como el caso de la tabla 1.3 debemos considerar los puntos medios de los intervalos para hacer el clculo: Clculo de la media aritmtica para datos agrupados en intervalos:

(PM f ) = X
N

[(22,5 22) + (28 73 ) + (33 37 ) + (38 22)] = 29.8


154

[(22,5 22) + (28 73 ) + (33 37 ) + (38 22)] = 29.8


154

[4.596] = 29.8
154

Podemos observar que el valor de la Media aritmtica no es igual cuando los datos estn agrupados en intervalos.

Mediana: se aplica a variables ordinales y a variables cuantitativas. La mediana es

el valor o categora de la variable que divide a la distribucin ordenada en dos partes iguales, es decir, es la puntuacin de la mitad. Para obtener la mediana es necesario ordenar la distribucin (de menor a mayor o de mayor a menor) y luego dividir el total de la distribucin (n) entre dos. Cabe aclarar que si el orden de la mediana se localiza entre dos puntuaciones es necesario sacar la media de esas dos puntuaciones para obtener la mediana.
Tradicionalmente se la simboliza Mdn o Md . Tabla 1.7: Distribucin de frecuencias de la variable Aos de Graduado de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005
Joven Investigador Ud. A. N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 formulario N JI N 2 JI N 5 JI N 7 JI N 9 JI N 10 JI N 16 JI N 18 JI N 19 JI N 21 JI N 25 JI N 30 JI N 32 JI N 38 JI N 42 JI N 43 JI N 51 JI N 53 JI N 68 JI N 70 JI N 76 JI N 83 JI N 87 JI N 91 JI N 99 JI N 107 JI N 116 JI N 118 JI N 6 JI N 15 JI N 26 JI N 31 JI N 36 JI N 40 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 Aos de Graduado x 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 JI N 41 JI N 45 JI N 55 JI N 72 JI N 79 JI N 80 JI N 84 JI N 89 JI N 92 JI N 93 JI N 95 JI N 100 JI N 119 JI N 121 JI N 123 JI N 14 JI N 24 JI N 28 JI N 33 JI N 34 JI N 39 JI N 56 JI N 59 JI N 66 JI N 71 JI N 94 JI N 96 JI N 98 JI N 102 JI N 103 JI N 3 JI N 4 JI N 8 JI N 12 JI N 23 JI N 29 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 70 71 72 73 74 75 76 JI N 35 JI N 47 JI N 48 JI N 52 JI N 57 JI N 65 JI N 73 4 4 4 4 4 4 4

77
78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

JI N 77
JI N 81 JI N 86 JI N 106 JI N 111 JI N 113 JI N 114 JI N 115 JI N 44 JI N 60 JI N 64 JI N 67 JI N 69 JI N 75 JI N 82 JI N 88 JI N 97 JI N 109 JI N 112 JI N 117 JI N 120 JI N 142 JI N 11 JI N 13 JI N 17 JI N 37 JI N 58 JI N 62 JI N 63

4
4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6

106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121

JI N 78 JI N 85 JI N 104 JI N 134 JI N 136 JI N 141 JI N 147 JI N 150 JI N 1 JI N 54 JI N 74 JI N 125 JI N 154 JI N 20 JI N 27 JI N 46

6 6 6 6 6 6 6 6 7 7 7 7 7 8 8 8

123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139

JI N 122 JI N 138 JI N 140 JI N 143 JI N 148 JI N 152 JI N 153 JI N 50 JI N 108 JI N 124 JI N 137 JI N 61 JI N 131 JI N 22 JI N 90 JI N 126 JI N 128

8 8 8 8 8 8 8 9 9 9 9 10 10 11 11 11 11

140 141 142 143 144 145 146 147 148 149 150 151 152 153 154

JI N 145 JI N 110 JI N 127 JI N 135 JI N 144 JI N 146 JI N 149 JI N 130 JI N 139 JI N 132 JI N 151 JI N 49 JI N 129 JI N 105 JI N 133

11 12 13 13 13 13 13 14 14 15 15 16 16 18 18

122 JI N 101 8 Fuente: Elaboracin propia

Una vez ordenada la distribucin debo buscar el Orden de la Mediana. Es la unidad de anlisis que divide a la distribucin en 2 partes iguales que contiene el valor que divide a la distribucin en dos partes iguales. Tradicionalmente se simboliza de este modo Md (o ) . Clculo del Orden de la Mediana:

N = Md (o ) 2
Si el Valor de N es impar utilizar:

N +1 = Md (o ) 2
En nuestro ejemplo el Orden de la Mediana es:

154 = 77 2
Si observamos la distribucin de frecuencias de la tabla 1.7, vemos que la unidad de anlisis N 77 tiene el valor 4, por lo tanto la Md es 4 aos de graduados

Tabla 1.8: Distribucin de frecuencias de la variable Aos de Graduado de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 Aos de graduado
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 Total
Fuente: Elaboracin propia

Frecuencia
27 21 15 21 14 15 5 11 4 2 5 1 5 2 2 2 2 154

Frecuencia acumulada
27 48 63 84 98 113 118 129 133 135 140 141 146 148 150 152 154

Porcentaje
17,5 13,6 9,7 13,6 9,1 9,7 3,2 7,1 2,6 1,3 3,2 0,6 3,2 1,3 1,3 1,3 1,3 100,0%

Porcentaje acumulado
17,5 31,2 40,9 54,5 63,6 73,4 76,6 83,8 86,4 87,7 90,9 91,6 94,8 96,1 97,4 98,7 100,0

Cuando una distribucin de frecuencias est agrupada, debemos buscar el Md (o ) en las frecuencias acumuladas. Tomando el ejemplo de la tabla 1.8, observamos que la unidad N 77 se encuentra en categora 4 aos de graduado, por lo tanto este es el valor Md . Bajo el supuesto que dentro de cada categora las unidades de anlisis se distribuyen homogneamente, podemos utilizar el siguiente clculo para determinar con mayor precisin el valor de Md . Clculo de la Mediana para variables agrupadas:

lm +

(Md (o ) faa ) * A = Md
f

lm = Lmite inferior del intervalo o categora de variable


faa = Frecuencia acumulada del intervalo/categora anterior

f = Frecuencia de la categora/intervalo del Md (o ) . A = Amplitud del intervalo


Siguiendo la distribucin de la Tabla 1.8:

4+

(77 63 ) * 1 = Md
84

4 + 0,17 * 1 = Md 4,17 = Md
9

Tabla 1.9: Distribucin de frecuencias de la variable Aos de Graduado de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 Aos de graduado 1-2 3-5 6 - 10 11- 15 16 - 20 Total
Fuente: Elaboracin propia

Punto Medio 1,5 4,0 8,0 13,0 23,0

Frecuencia 48 50 37 15 4 154

Porcentaje Frecuencia Porcentaje acumulado acumulada 48 98 135 150 154 31,2 32,5 24,0 9,7 2,6
100,0%

31,2 63,6 87,7 97,4 100,0

Siguiendo la distribucin de la Tabla 1.9:

3+

98 3 + 0,35 * 1 = Md 4,04 = Md

(77 48 ) * 3 = Md

VI. Medidas de posicin


Las medidas de posicin son puntuaciones que separan una fraccin de los casos de una distribucin. Entre las medidas de posicin podemos encontrar a los cuartiles, los deciles y los percentiles.
Cuartiles: dividen a una distribucin en cuatro partes iguales. Cada una de estas

partes representa el 25% de los casos en cada grupo.


Deciles: dividen a una distribucin en diez partes iguales. Cada una de estas partes

representa un 10% de los casos en cada grupo.


Percentiles: dividen a una distribucin en 100 partes iguales. Segn Ritchey (2001),

los percentiles son el porcentaje de casos que caen en o estn debajo de un valor especfico de X. El procedimiento es similar al del clculo de la mediana. Primero se debe calcular el orden del Cuartil, Decil o Percentil y luego ver el valor o categora de variable que asume dicha unidad de anlisis.
Clculo de Orden del Cuartil: Clculo de Orden del Decil: Clculo de Orden del Percentil:

N n cuartil = C (o ) 4

N n decil = D(o ) 10

N n percentil = P (o ) 100

Tomando el ejemplo de la tabla 1.7, para analizar la distribucin de frecuencias de acuerdo a sus cuartiles, deciles o percentiles observamos que los valores son:

10

Tabla 1.10: Valores que asume la variable Aos de Graduado de los jvenes investigadores de la Universidad de Buenos Aires en el ao 2005 de acuerdo a cada una de las medidas de posicin
Orden del: Cuartil N Decil N Percentil N 1 2 3 4 1 5 6 7 8 9 10 11 12 1 13 14 2 15 16 17 18 19 20 21 22 23 24 3 25 26 27 28 29 30 31 32 33 34 4 35 36 37 2 38 39 40 41 42 43 44 5 45 46 47 48 49 50 Ud. A. N: 2 4 5 7 8 10 11 13 14 16 17 19 21 22 24 25 27 28 30 31 33 34 36 37 39 41 42 44 45 47 48 50 51 53 54 56 57 59 61 62 64 65 67 68 70 71 73 74 76 77 Valor de la variable Aos del graduado 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4

11

Orden del: Cuartil N Decil N Percentil N 51 52 53 54 6 55 56 57 58 59 60 61 62 3 63 64 7 65 66 67 68 69 70 71 72 73 74 8 75 76 77 78 79 80 81 82 83 84 9 85 86 87 4 88 89 90 91 92 93 94 10 95 96 97 98 99 100 Ud. A. N: 79 81 82 84 85 87 88 90 91 93 94 96 98 99 101 102 104 105 107 108 110 111 113 114 116 118 119 121 122 124 125 127 128 130 131 133 134 136 138 139 141 142 144 145 147 148 150 151 153 154

Valor de la variable Aos del graduado 4 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 7 7 7 8 8 8 8 8 8 8 9 9 9 10 11 11 11 12 13 13 13 14 14 15 16 18 18

12

Bibliografa
Babbie, E. (1996), Manual para la prctica de la investigacin social, Bilbao, Descle De Bouwer International. Cea DAncona, M. A. (1996), Metodologa cuantitativa. Estrategias y tcnicas de investigacin social, Madrid, Sntesis. Creswell, J. W. (1994), Research Design. Qualitative and Quantitative Approaches, Thousand Oaks, Sage. Garca Ferrando, M. (1992), Socioestadstica. Introduccin a la estadstica en sociologa, Madrid, Alianza. Holgun Quiones, F. (1988), Estadstica descriptiva aplicada a las ciencias sociales, Mxico, Universidad Autnoma de Mxico. Ritchey, F. (2001), Estadstica para las ciencias sociales. El potencial de la imaginacin estadstica, Mxico D.F., McGraw-Hill/Interamericana Editores.

13

Você também pode gostar