Você está na página 1de 58

Universidad Nacional Mayor de San Marcos

(Universidad del Per, DCANA DE AMRICA)

FACULTAD DE INGENIERA INDUSTRIAL


ACREDITADA NACIONAL E INTERNACIONALMETE

DISTRIUCIN DE
FRECUENCIAS
Profesor: Jorge Esponda Vliz
Profesor: Jorge Esponda Vliz
DISTRIBUCIN DE FRECUENCIAS
En un estudio estadstico una vez que se recopilan los
datos del caso, es necesario clasificarlos y ordenarlos
antes de intentar su interpretacin. Generalmente se
tienen nmeros grandes de observaciones que se anotan
simplemente en el orden en que esas observaciones se
vayan haciendo. La clasificacin adecuada de esas
observaciones es necesaria y de

gran importancia para poder llegar

a conclusiones mediante su anlisis.


ELABORACIN DE UNA DISTRIBUCIN DE
FRECUENCIAS
Una distribucin es el agrupamiento de datos en
categoras que muestren el nmero de observaciones en
cada categora mutuamente excluyente.

EJEMPLO:
Se tiene las edades de 30 obreros de
una cierta compaa

28 34 43 30 47 38 34 40 31 33
42 33 42 39 30 32 47 37 32 35
41 35 37 33 39 34 32 43 40 38
SOLUCIN:
CALCULAMOS
: EL RANGO (R):
R = Mximo - Mnimo

La edad mnima es: 28 y la edad mxima es: 47.

Entonces el rango es: R = 47 28 = 19.

CALCULAMOS EL NMERO DE CLASES O

INTERVALOS (K):
Hay varios mtodos para hallar el nmero de clases, estos son slo una

sugerencia.

Ln n
Primer mtodo: K
Ln ( 2)
Donde n es el nmero total de datos. Para nuestro
ejemplo:
Ln 30
K 4. 91 K=5
Ln(2)

Segundo mtodo: K 1 3. 322 * Log(n)

Para nuestro ejemplo por la frmula de Sturges:

K 1 3. 322 * Log(30) 5. 91 K=6

Tercer mtodo: N K
n < 50 5a7
Este es una sugerencia
50 n < 100 6a7
de los expertos: 100 n <250 7 a 12
n 250 10 a 20
Cuarto mtodo:
La experiencia profesional puede determinar el nmero de clases.

Demasiadas clases o muy pocas no podran dar a conocer la forma

bsica del conjunto de datos. Por regla general, es mejor no utilizar

menos de 5, ni ms de 15 clases en la elaboracin

de una distribucin de frecuencias.

Quinto mtodo:
Tambin se puede utilizar la regla de la potencia de 2 para

determinar el nmero de clase. Seleccionamos el nmero entero

ms pequeo tal que 2^k n, donde n es el nmero total de

observaciones. Veamos una pequea tabla con esta regla:


N total de observaciones N recomendado de clases K
9 16 4 24 = 16
17 32 5 25 = 32
33 64 6 26 = 64
65 128 7 27 = 128
129 256 8 28 = 256
257 512 9 29 = 512
513 1024 10 210 = 1024

Para nuestro ejemplo haremos caso del primer mtodo, es decir:

K=5
CALCULANDO LA AMPLITUD DE INTERVALO (A):

La amplitud de una clase, se llama intervalos de clase.


Generalmente los intervalos de clase son de igual
amplitud. En este caso la amplitud de un intervalo de
clase es la diferencia entre dos marcas de clase
sucesivas, o lmites superiores (o inferiores) de dos
clases sucesivas.
La amplitud de los intervalos de clase a tabular de un
determinado conjunto de datos, depende de la naturaleza
de esos datos y del uso que de ellos se piense hacer.
Si los intervalos son muy amplios contendrn
observaciones de magnitudes bastante variables, las
que estaremos considerando como un grupo
homogneo al hacer la distribucin de frecuencias.
La frmula para hallar la amplitud es:

R
A
Para nuestro caso: K
19
A 3.8
5

Tomaremos como nuestro intervalo como A=4


CONSTRUIR LOS LMITES DE CLASES:

Vemos que cada intervalo debe tener 4 nmeros:

Entonces 28 + 4 -1 = 31. Contiene al 28, 29, 30 y 31.

Entonces las clases sern:

Lmite Inferior Lmite Superior


28 31
32 35
36 39
40 43
44 47
CALCULANDO LOS LMITES REALES:

Sumamos o restamos la mitad de la unidad de medida:

Es decir: = 0.5.

Lmites Lmites Reales


Inferior Superior Inferior Superior
28 31 27.5 31.5
32 35 31.5 35.5
36 39 35.5 39.5
40 43 39.5 43.5
44 47 43.5 47.5
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo adems punto medio, marca de clase o valor
central.

Lmites Lmites Reales Marca de Clase


Inferior Superior Inferior Superior ( Xi )
28 31 27.5 31.5 29.5
32 35 31.5 35.5 33.5
36 39 35.5 39.5 37.5
40 43 39.5 43.5 41.5
44 47 43.5 47.5 45.5
Datos 28 34 43 30 47 38 34 40 31 33
del 42 33 42 39 30 32 47 37 32 35
ejemplo
41 35 37 33 39 34 32 43 40 38

TABLA DE FRECUENCIA
Lmites Lmites Reales Marca de Clase Frecuencia
Inferior Superior Inferior Superior (Xi) (ni)
28 31 27.5 31.5 29.5 4
32 35 31.5 35.5 33.5 11
36 39 35.5 39.5 37.5 6
40 43 39.5 43.5 41.5 7
44 47 43.5 47.5 45.5 2
Puede resultar conveniente convertir las frecuencias
de clase a frecuencia de clase relativas para mostrar
el porcentaje del nmero total de observaciones en
cada clase.

Xi Marca de clase
ni Frecuencia absoluta
Ni Frecuencia absoluta acumulada
fi Frecuencia relativa
Fi Frecuencia relativa acumulada
Hallamos las frecuencias acumuladas y las frecuencias
relativas:
Lmites Lmites Reales
Xi ni Ni fi Fi
Li Ls Lri Lrs
27 .5 31 .5 4
28 31 27.5 31.5 29.5 4 4 0.13 0.13
2 30
31 .5 35 .5 11
32 35 31.5 35.5 33.5 11 15 0.37 0.50
2 30
27 .5 31 .5 6
36 39 35.5 39.5 2
37.5 6 21 0.20 0.70
30
39 .5 43 .5 7
40 43 39.5 43.5 2
41.5 7 28 0.23 0.93
30
43 .5 47 .5 2
44 47 43.5 47.5 2
45.5 2 30 0.07 1.00
30
EJEMPLO:
Tenemos el puntaje de un concurso de matemtica en un

colegio, que participaron 170 estudiantes (la nota mxima

es 100 y la nota mnima es 0).


54.5 52.0 88.0 45.0 68.9 40.0 84.1 71.9 89.0 75.5
69.0 77.4 74.0 60.0 70.2 71.4 30.0 59.8 77.1 58.5
15.1 52.3 80.0 74.5 53.0 70.5 63.0 90.4 67.2 81.4
25.3 70.0 60.5 89.5 41.0 63.5 58.0 56.4 62.3 64.7
73.8 85.2 45.0 56.5 72.2 69.5 80.1 24.0 58.6 75.8
54.0 94.1 70.5 61.5 30.0 54.5 72.2 69.0 55.4 72.9
91.2 99.0 47.6 51.5 64.0 64.2 56.6 60.0 80.1 75.3
63.1 66.9 58.0 51.5 50.6 68.2 65.5 55.0 98.2 62.5
63.0 66.0 69.2 36.5 88.6 53.2 77.5 52.0 64.0 67.4
70.0 87.0 95.6 37.3 74.4 85.1 78.5 71.0 68.0 84.7
79.0 61.0 79.0 66.2 60.6 37.6 65.1 77.7 82.3 84.8
76.9 64.0 25.6 73.0 48.3 82.4 8.0 50.5 58.0 55.8
59.5 83.0 86.0 45.1 41.2 60.4 77.0 76.5 65.8 87.9
95.6 68.1 67.0 68.2 77.2 69.4 56.0 84.6 65.9 55.5
26.0 42.8 58.0 74.3 84.4 45.5 78.1 95.2 63.7 58.5
17.2 62.6 63.0 76.0 41.0 73.5 67.1 59.0 91.7 64.0
63.3 68.5 72.0 55.5 57.0 46.6 76.5 53.0 46.7 95.0
Vamos a organizar los datos en 3 pasos:

PASO 1: Estableceremos Intervalo de Clase


grupos ms conocidos Limite Limite
Inferior Superior
como clases. En este 0 - 10
problema la primera clase 10 - 20
puede incluir a todos las 20 - 30
30 - 40
notas que estn entre 0
40 - 50
10, es decir las notas que
50 - 60
van de 0 hasta antes del 60 - 70
10 (no incluye el 10 pero 70 - 80
80 - 90
si incluye el 9.999).
90 - 100
PASO 2: Vamos a distribuir en clases las notas de los
estudiantes, slo haremos las 7 primeras para mostrar
como se hace:

54.5 Pertenece a la clase de 50 60


52.0 Pertenece a la clase de 50 60
88.0 Pertenece a la clase de 80 90
45.0 Pertenece a la clase de 40 50
68.9 Pertenece a la clase de 60 70
40.0 Pertenece a la clase de 40 50
84.1 Pertenece a la clase de 80 90
PASO 3: Intervalo de Clase
Limite Limite Frecuencia
Contamos las Inferior Superior
notas que 0 - 10 1
pertenecen a cada 10 - 20 2

clase: 20 - 30 4
30 - 40 5
40 - 50 13
50 - 60 33
60 - 70 45
70 - 80 36
80 - 90 21
90 - 100 10
HALLANDO INTERVALO DE CLASE Y PUNTOS

MEDIOS DE CLASE:

En el ejemplo de las notas, hay 10 clases, todas con

intervalos de clases de 10 unidades y las marcas de clase

o puntos medios son sucesivamente 5, 15, 25, 35,


CALCULANDO LAS FRECUENCIAS RELATIVAS:

Intervalo de Clase Frecuencia Frecuencia


Frecuencia Frecuencia
Limite Limite Xi Absoluta Relativa
Absoluta Relativa
Inferior Superior Acumulada Acumulada

0 10 5 1 1 0.0059 0.0059
10 20 15 2 3 0.0118 0.0177
20 30 25 4 7 0.0235 0.0412
30 40 35 5 12 0.0294 0.0706
40 50 45 13 25 0.0765 0.1471
50 60 55 33 58 0.1941 0.3412
60 70 65 45 103 0.2647 0.6059
70 80 75 36 139 0.2118 0.8177
80 90 85 21 160 0.1235 0.9412
90 100 95 10 170 0.0588 1
SUPONGAMOS: 0 25
En el ejemplo de las notas en vez de las 10 25 50
clases consideradas, tomramos slo las 4 50 75
siguientes: 75 100
Vemos que no estaramos diferenciando entre
calificaciones como 50 y 74. Si los intervalos de clase son
muy pequeos (y por lo tanto el nmero de clases grande)
tambin tiene sus inconvenientes. Una distribucin hecha
en esa forma, revelara demasiado detalle para poder
obtener rpidamente una idea clara de los aspectos
importantes del estudio. Ntese, que esa es la razn por la
que el cuadro de los datos originales no se usa.
SUGERENCIAS PARA ELABORAR UNA

DISTRIBUCIN DE FRECUENCIAS

A continuacin se presenta algunas pautas o guas:

Los intervalos de clase utilizados deben ser iguales.

Los intervalos de clase desiguales ofrecen problemas al

representar en forma grfica la distribucin. Sin

embargo, en algunos casos pueden ser necesarios

intervalos de clase desiguales para evitar un gran

nmero de clases vacas, o casi vacas.


EJEMPLO:
Veamos el ejemplo
Intervalo de Clase
de las notas de Frecuencia
Limite Inferior Limite Superior
otro concurso
0 - 10 0
de matemtica en
10 - 20 2
donde participaron
1000 estudiantes: 20 - 30 3
30 - 40 15
40 - 50 90
50 - 60 220
60 - 70 350
70 - 80 200
80 - 90 100
90 - 100 20
Entonces vemos que las clases de 0-10, 10-20, 20-30, no hay

casi estudiantes. Entonces podemos juntar con la clase 30 -

40:
Intervalo de Clase
Limite Limite Frecuencia
Inferior Superior
0 - 40 20
40 - 50 90
50 - 60 220
60 - 70 350
70 - 80 200
80 - 90 100
90 - 100 20
Trate de evitar tener clases abiertas. Este
tipo de clases ocasiona problemas al hacer grficos, y al

determinar ciertas medidas de tendencia

central y de dispersin.

EJEMPLO:

Los gastos de publicidad son un componente importante

en el costo de mercancas vendidas. A continuacin se

presenta una distribucin de frecuencias que muestran

los gastos de publicidad de 60 compaas productoras.


Nmero de compaas
Gasto de publicidad (millones de $)
(f)
Menos de 35 7
35 45 10
45 55 21
55 65 16
Ms de 65 10
Total 64

Evite la superposicin de lmite de clases establecidas. No deben


utilizarse lmites de clase como 10 20 y 20 30. Las clases
establecidas de esta manera no son mutuamente excluyentes, lo que
infringe la definicin de distribucin de frecuencias. Con la
superposicin de clases no estara claro dnde clasificar un valor de
20.

Estos son slo para no complicarnos, como en el ejemplo anterior.


REPRESENTACIONES GRFICAS DE UNA
DISTRIBUCIN DE FRECUENCIAS

HISTOGRAMA:
Son barras verticales presentadas una a continuacin de otra. Permite

presentar datos cuantitativos continuos. Es un grfico muy utilizado.

Propiedades:

El ancho de cada columna es igual en todo el grfico y representa la

amplitud de clase.

La altura est en funcin a la frecuencia de la clase.


Intervalo de Clase Punto
Frecuencia
Limite Inferior Limite Superior Medio
0 10 5 1
10 20 15 2
20 30 25 4
30 40 35 5
40 50 45 13
50 60 55 33
60 70 65 45
70 80 75 36
80 90 85 21
90 100 95 10
50
40
30
20
10
0
10 20 30 40 50 60 70 80 90 100
0 10 20 30 40 50 60 70 80 90
Serie1 1 2 4 5 13 33 45 36 21 10
POLGONOS DE FRECUENCIAS:
Es otra forma de conocer la distribucin de los datos. Se
construye uniendo los puntos medios del lado superior
de las barras del histograma.

50

40
frecuencia

30

20

10

0
5 15 25 35 45 55 65 75 85 95
Notas
POLGONO DE FRECUENCIAS ACUMULADAS:

180
160
140
120
100
80
60
40
20
0
5 15 25 35 45 55 65 75 85 95
EJERCICIO 1:

Un conjunto de datos consta de 38 observaciones.

Cuntas clases recomendara para la distribucin de

frecuencias?
SOLUCIN:

Para esto tomaremos el quinto mtodo:

entonces seria 2^5 < 38 < 2^6

es decir sugeriramos 6 clases.

o tambin puede ser el segundo mtodo:

1 + 3.322 * log(38) = 6.24


EJERCICIO 2:

Un conjunto de datos consta de 230 observaciones

que oscilan desde 235 a 567. Qu intervalo de clase

recomendara?
SOLUCIN:

R 567 235 332


A 37 .53
K 1 3.322 * log( 230 ) 8.846

Entonces sugerimos un intervalo de 40.


EJERCICIO 3:
La tienda CABRERA Y ASOCIADOS estaba interesada en
efectuar un anlisis de sus cuentas por comprar. Uno de
los factores que ms interesaba a la administracin de la
tienda era el de los saldos de las cuentas de crdito. Se
escogi al azar una muestra aleatoria de 30 cuentas y se
anot el saldo de cada cuenta (en unidades de soles) como
sigue:
77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99
43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97
32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

Elaborar un reporte para la gerencia.


SOLUCION:

Efectuar el arreglo ordenado de la poblacin o muestra:


7.42, 8.15, , , , 90.99, 93.91
Encontrar el rango:
R = valor mayor valor menor = 93.91 7.42 = 86.49

Encontrar en nmero de clases "K" , segn la frmula de


Sturges:
K 1 3. 322 * Log(30) 5. 9069 6
Determinar la amplitud de la clase :
R 86 .49
A 14 .415
K 6
Clases Xi n f N F

7.420 21.835 14.628 10 0.33 10 0.33

21.835 36.250 29.043 4 0.13 14 0.46

36.250 50.665 43.458 5 0.17 19 0.63

50.665 65.080 57.873 3 0.10 22 0.73

65.080 79.495 72.288 3 0.10 25 0.83

79.495 93.910 86.703 5 0.17 30 1.00

Total 30 1.00
EJEMPLO:

La siguiente data representa al nmero de alumnos que

asisti a la clase de sociologa, se ha pasado lista por 40

das. (el 1er da asistieron 3 cachimbos, el 2do da

asistieron 15 cachimbos, el 3ro 24 cachimbos)

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34,

36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,

28, 38, 41, 48, 15, 32, 13.


CALCULEMOS EL RANGO (R):
Se localizan los valores menor y mayor de la distribucin.
En este caso son 3 y 48.
R = Mximo - Mnimo
R =48 3 = 45.
CALCULAMOS EL NMERO DE CLASES O INTERVALOS
(K):
K 1 3.322 * Log (n)
Para nuestro ejemplo:

K 1 3.322 * Log ( 40 ) 6.322


Para nuestro ejemplo, vamos a trabajar con: K = 6
Calculamos la amplitud de la distribucin: R
A
K
45
A 7.5
6

Entonces la amplitud sera 8.

Lmite Inferior Lmite Superior


3(valor mnimo) 3+8 = 11
CONSTRUIR
11 19

LOS LMITES 19 27

27 35
DE CLASES: 35 43

43 51
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo adems punto medio, marca de clase o valor
central.
Lmite Inferior Lmite Superior Xi

3 11 (3+11)/2 = 7

11 19 (3+11)/2 = 15

19 27 (19+27)/2 = 23

27 35 (27+35)/2 = 31

35 43 (35+43)/2 = 39

43 51 (43+51)/2 = 47
Hallando la frecuencia absoluta y la frecuencia absoluta
acumulada.

Linf Lsup Xi fi Fi
3 11 7 2 2=2
11 19 15 6 2+6 = 8
19 27 23 5 8+5 = 13
27 35 31 11 13+11 = 24
35 43 39 12 24+12 = 36
43 51 47 4 36+4 = 40
Hallando la frecuencia relativa:

Linf Lsup Xi fi Fi hi
3 11 7 2 2 2/40 = 0.05
11 19 15 6 8 6/40 = 0.15
19 27 23 5 13 5/40 = 0.13
27 35 31 11 24 11/40 = 0.27
35 43 39 12 36 12/40 = 0.30
43 51 47 4 40 4/40 = 0.10
Calculando la frecuencia relativa
acumulada:

Linf Lsup Xi fi Fi hi Hi
3 11 7 2 2 0.05 0.05
11 19 15 6 8 0.15 0.20
19 27 23 5 13 0.13 0.33
27 35 31 11 24 0.27 0.60
35 43 39 12 36 0.30 0.90
43 51 47 4 40 0.10 1.00
TOTAL 40 1
Ejercicio para el saln de clase: Suponga que usted es el
estadstico oficial de la lnea area TACA y que el
presidente del consejo de administracin le ha
pedido que recoja y organice datos relativos a las
operaciones de vuelo. Su inters principal a partir de los
valores diarios se centra en la variable de nmero de
pasajeros. Ha obtenido estos datos de los vuelos diarios
de los ltimos 50 das y ha reflejado esta informacin:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
CALCULEMOS EL RANGO (R):
Se localizan los valores menor y mayor de la distribucin.
En este caso son 50 y 102.
R = Mximo - Mnimo
R =102 50 = 52.
CALCULAMOS EL NMERO DE CLASES O INTERVALOS
(K):
K 1 3.322 * Log (n)
Para nuestro ejemplo:

K 1 3.322 * Log (50 ) 6.644


Para nuestro ejemplo, vamos a trabajar con: K = 7
Calculamos la amplitud de la distribucin:

R 52
A A 7.43
K 7

Entonces la amplitud sera 8.


Lmite Inferior Lmite Superior
50 (valor mnimo) 50+8 = 58
CONSTRUIR 58 64
64 72
LOS LMITES
72 80
80 88
DE CLASES:
88 96
96 104
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo adems punto medio, marca de clase o valor
central.

Lmite Inferior Lmite Superior Xi


50 58 (50+58)/2 = 54
58 66 (58+66)/2 = 62
66 74 (66+74)/2 = 70
74 82 (74+82)/2 = 78
82 90 (82+90)/2 = 86
90 98 (90+98)/2 = 94
98 106 (98+106)/2 = 102
Hallando la frecuencia absoluta y la frecuencia absoluta
acumulada.
Linf Lsup Xi fi Fi
50 58 54 2 2
58 66 62 3 5
66 74 70 12 17
74 82 78 14 31
82 90 86 9 40
90 98 94 8 48
98 106 102 2 50
TOTAL 50
Calculando la frecuencia relativa absoluta
y acumulada:

Linf Lsup Xi fi Fi hi Hi
50 58 54 2 2 0.04 0.04
58 66 62 3 5 0.06 0.10
66 74 70 12 17 0.24 0.34
74 82 78 14 31 0.28 0.62
82 90 86 9 40 0.18 0.80
90 98 94 8 48 0.16 0.96
98 106 102 2 50 0.04 1.00
TOTAL 50 1
Asistencia de pasajeros

16
14
12
10
Dias

8
6
4
2
0
50-58 58-66 66-74 74-82 82-90 90-98 98-106
# Pasajeros
POLGONOS DE FRECUENCIAS: Es otra forma de
conocer la distribucin de los datos. Se construye
uniendo los puntos medios del lado superior de las
barras del histograma.
Poligono de Frecuencias

16
14
12
10
Dias

8
6
4
2
0
54 62 70 78 86 94 102
# Pasajeros (Xi)
poligano de frecuencias acumulado

60

50

40
Dias

30

20

10

0
54 62 70 78 86 94 102
# Pajajeros (Xi)
Una visin sin
accin es un sueo.
Una accin sin
visin es perdida de
tiempo.
Una visin con
accin puede
cambiar al mundo.

Joel Baker

Muchas gracias

Você também pode gostar