Você está na página 1de 8

LECCION 2 Distribucin de frecuencia

La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Variable (Valor) Frecuencias absolutas Simple Acumulada Frecuencias relativas Simple Acumulada

x
X1 X2

x n1 n2 ... nn-1 nn

x n1 n1 + n2 ... n1 + n2 +..+ nn-1 n

x f1 = n1 / n f2 = n2 / n ... fn-1 = nn-1 / n fn = nn / n

x f1 f1 + f2 ... f1 + f2 +..+fn-1 f

...
Xn-1 Xn

Siendo X los distintos valores que puede tomar la variable. Siendo n el nmero de veces que se repite cada valor. Siendo f el porcentaje que la repeticin de cada valor supone sobre el total Veamos un ejemplo: Medimos la altura de los nios de una clase y obtenemos los siguientes resultados (cm): Alumno x Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Estatura x 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Alumno x Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Estatura x 1,23 1,26 1,30 1,21 1,28 1,30 1,22 1,25 1,20 1,28 Alumno x Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Estatura x 1,21 1,29 1,26 1,22 1,28 1,27 1,26 1,23 1,22 1,21

Si presentamos esta informacin estructurada obtendramos la siguiente tabla de frecuencia: Variable (Valor) x 1,20 1,21 1,22 x 1 4 4 Frecuencias absolutas Simple Acumulada x 1 5 9 x 3,3% 13,3% 13,3% Frecuencias relativas Simple Acumulada x 3,3% 16,6% 30,0%

1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30

2 1 2 3 3 4 3 3

11 12 14 17 20 24 27 30

6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0%

36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. (tal como se ver en la siguiente leccin).

LECCION 4 Medidas de posicin central

Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Las medidas de posicin son de dos tipos: a) Medidas de posicin central: informan sobre los valores medios de la serie de datos. b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de la serie. a) Medidas de posicin central Las principales medidas de posicin central son las siguientes: 1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las ms utilizadas: a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: (X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn) Xm = ---------------------------------------------------------------------------------------

n
b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raz "n" (siendo "n" el total de datos de la muestra).

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media, perdiendo sta representatividad. 2.- Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces que se ha repetido). 3.- Moda: es el valor que ms se repite en la muestra. Ejemplo: vamos a utilizar la tabla de distribucin de frecuencias con los datos de la estatura de los alumnos que vimos en la leccin 2. Variable (Valor) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 x 1 4 4 2 1 2 3 3 4 3 3 Frecuencias absolutas Simple Acumulada x 1 5 9 11 12 14 17 20 24 27 30 x 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Frecuencias relativas Simple Acumulada x 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

Vamos a calcular los valores de las distintas posiciones centrales: 1.- Media aritmtica:

(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3) Xm -------------------------------------------------------------------------------------------------= 30 Luego: Xm = 1,253

Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm. 2.- Media geomtrica: X= Luego: Xm = 1,253 ((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^ (1/30)

En este ejemplo la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por qu ser as. 3.- Mediana: La mediana de esta muestra es 1,26 cm, ya que por debajo est el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas. En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situara exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50% superior. 4.- Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas.

Distribucin de frecuencias
De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

ndice
[ocultar]

1 Caractersticas 2 Tipos de frecuencias o 2.1 Frecuencia absoluta o 2.2 Frecuencia relativa o 2.3 Frecuencia acumulada o 2.4 Frecuencia relativa acumulada o 2.5 Distribucin de frecuencias agrupadas 3 Referencias

[editar] Caractersticas
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores.

La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

[editar] Tipos de frecuencias


Vase tambin: Frecuencia estadstica.

[editar] Frecuencia absoluta


La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

[editar] Frecuencia relativa


La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1.

[editar] Frecuencia acumulada


La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa.

[editar] Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi 27 28 29 30 31 32 fa 1 2 6 7 8 3 1 3 9 16 24 27 FA Fr 0.032 0.065 0.194 0.226 0.258 0.097 FR 0.032 0.097 0.290 0.516 0.774 0.871

33 34

3 1

30 31

0.097 0.032

0.968 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.

[editar] Distribucin de frecuencias agrupadas


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Construccin de una tabla de datos agrupados: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo.
ci [0, 5) 2.5 [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total: fi 1 7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 Fi 1 1 3 3 3 6 7 10 4 2 ni 0.025 2 5 8 11 17 24 34 38 40 Ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1

0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

[editar] Referencias

Você também pode gostar