Você está na página 1de 26

w

w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
8
UNIDAD I : ESTADISTICA DESCRIPTIVA

PROPSITO

Que el estudiante comprenda y aplique algunas tcnicas de recopilacin, organizacin y
representacin de un conjunto de datos, proveniente del planteamiento, la discusin y la
resolucin de problemas, para interpretar y analizar el comportamiento de variables en
dicho conjunto.


Distribucin de Frecuencia

Como recordars del captulo anterior de esta gua, la Estadstica Descriptiva se encarga de la
organizacin, presentacin y descripcin de los datos recolectados, y de obtener informacin a
partir de ellos.

El objetivo de la organizacin de datos es acomodarlos en forma til para revelar sus
caractersticas esenciales y simplificar ciertos anlisis.

Cuando el tamao de muestra es menor a 30, los datos pueden tratarse
individualmente, y en este caso se les llama Datos no agrupados. Sin embargo, cuando
la muestra es grande (n > 30), es laborioso hacerlo de esta forma, por lo que se lleva a
cabo algn tipo de agrupacin preliminar para realizar el tratamiento adecuado a los
datos. En este ltimo caso, se les llama Datos Agrupados.


Datos no agrupados

Si los datos estn en una escala por lo menos ordinal, lo primero que podemos hacer es
ordenarlos, en forma ascendente o descendente. Una vez ordenados los datos de la
muestra se organizan en una tabla de frecuencias.

Una Tabla de Frecuencias, tambin llamada de Distribucin de Frecuencias, est
formada por las categoras o valores de la variable y sus correspondientes frecuencias


Utilicemos un ejemplo para identificar cada elemento de una distribucin de
Frecuencias.

En un grupo de Estadstica I del Cch Sur, se observ la estatura de 16 alumnos y se
obtuvieron los siguientes datos (en metros):




Datos ordenados

1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.6 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79


1.58 1.64 1.79 1.58 1.64 1.53 1.64 1.66
1.53 1.52 1.76 1.57 1.70 1.74 1.66 1.52
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
9
Distribucin de Frecuencias

La frecuencia, tambin llamada frecuencia simple o absoluta, se define como el nmero de
veces que aparece un dato x
i
, y se denota por f.

















La frecuencia relativa es el nmero de veces que aparece cada valor de la variable Xi,
es decir cada dato, dividida entre el tamao de la muestra. Se representa con f
r
, y se
tiene que:
n
f
f
r
=









La frecuencia acumulada de un valor x
i
es la suma de las frecuencias absolutas de
todos los valores menores o iguales al valor x
i
, y se representa por F
a
.


La frecuencia relativa acumulada de un valor x
i
es la suma de las frecuencias relativas
de todos los valores menores o iguales al valor x
i
, (o dividiendo las frecuencias
acumuladas entre el tamao de muestra), y se representa por F
ra
..
Estatura
x
i
Frecuencia
f
1.52 2
1.53 2
1.57 1
1.58 2
1.60 1
1.64 3
1.66 2
1.74 1
1.76 1
1.79 1
Estatura
x
i
Frecuencia
f
Frecuencia
Relativa
f
r

1.52 2
2
/
16
= 0.1250
1.53 2 0.1250
1.57 1 0.0625
1.58 2 0.1250
1.60 1 0.0625
1.64 3 0.1875
1.66 2 0.1250
1.74 1 0.0625
1.76 1 0.0625
1.79 1 0.0625
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
10



















Ahora, ya que tenemos la distribucin de frecuencias, qu informacin podemos
obtener acerca de las estaturas de los alumnos?

Interpretemos algunos valores de cada columna:

f Tres estudiantes de 16 miden 1.64 m de estatura
fr El 12.50% de los estudiantes miden 1.66 m de estatura
F
a
8 de 16 estudiantes miden mximo 1.60 m de estatura
F
ar
El 87.5% de los estudiantes miden hasta 1.74 m de estatura


Ejercicios 1.1

1. La cuenta de la luz (en pesos) del mes de marzo de 30 familias escogidas
aleatoriamente se muestra a continuacin.

+
Organiza los datos en una tabla de distribucin de frecuencias, y
+ Escribe algunas frases de la informacin que proporciona la tabla de distribucin de
frecuencias:

a.- ___________________________________________________________________

b.- ___________________________________________________________________

c.- ___________________________________________________________________

d.- ___________________________________________________________________
Estatura
x
i
Frecuencia
F
Frecuencia
Relativa
f
r

Frecuencia
Acumulada
F
a

Frecuencia
Acumulada
Relativa
F
ar

1.52 2 0.1250 2
2
/
16
= 0.1250
1.53 2 0.1250 2+2 = 4
4
/
16
= 0.2500
1.57 1 0.0625 2+2+1 = 5
5
/
16
= 0.3125
1.58 2 0.1250 2+2+1+2 = 7
0.4375
1.60 1 0.0625 8
0.5000
1.64 3 0.1875 11
0.6875
1.66 2 0.1250 13
0.8125
1.74 1 0.0625 14
0.8750
1.76 1 0.0625 15
0.9375
1.79 1 0.0625 16
1.0000
250 560 340 780 890 960 470 340 540 440 120 340 340 550 440
450 450 670 860 430 330 230 810 70 970 360 560 1120 370 840
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
11
Medidas de Tendencia Central

Los parmetros ms tiles son las medidas de Tendencia Central, las cuales ubican el
valor alrededor del cual se concentra un conjunto de datos y las Medidas de Dispersin
que describen la variabilidad o dispersin de los mismos.

Las tres medidas de tendencia central o de centralizacin ms importantes son la
moda, la mediana y la media.

Consulta en dos fuentes distintas, la definicin de:

Moda
1.- ___________________________________________________________________
______________________________________________________________________
2.- ___________________________________________________________________
______________________________________________________________________

Mediana
1.- ___________________________________________________________________
______________________________________________________________________
2.- ___________________________________________________________________
______________________________________________________________________

Media
1.- ___________________________________________________________________
______________________________________________________________________
2.- ___________________________________________________________________
______________________________________________________________________


Moda

Como pudiste observar en la bibliografa, la moda se define como el dato con la
frecuencia ms alta, es decir, el que ms se repite. No siempre existe una moda y en
ocasiones puede haber ms de una. Adems, es la nica medida de tendencia central
que se puede calcular para variables nominales.

Ejemplos:
En el conjunto de datos: {2, 3, 3, 4, 4, 4, 5, 5, 8, 8, 12, 13} la moda es 4.
En la distribucin {2, 2, 3, 3, 5, 5, 8, 8, 12, 12, 13, 13} no hay moda.
Para el conjunto de datos ordinales: {pequea, pequea, mediana, mediana, mediana,
grande, grande, grande, extragrande, extragrande}, hay dos modas: mediana y
grande, porque ambos se repiten el mismo numero de veces.
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
12

Mediana
La mediana se define como el dato central de la distribucin, es decir el dato que queda
justo en el medio, cuando el conjunto de datos se encuentra ordenado. Se denota por
x
~
.
La mediana se puede utilizar con variables ordinales (adems de la moda). Si el nmero
de datos es impar, entonces la mediana corresponde al valor que se encuentra en el
medio. Pero si el nmero de observaciones es par, entonces se toman los dos valores
que se hallan en el medio de la distribucin y se dice que la mediana se encuentra entre
esos dos valores, (en el caso de variables numricas se suman esos valores y se
divide entre dos)

Ejemplos:
En el conjunto de datos: {a, b, b, c, c, c, d, d, g, g, k, m} la mediana esta entre c y d.

Para el conjunto de datos {2, 2, 3, 3, 5, 5, 8, 8, 12, 12, 13} la mediana es 5

En el conjunto de datos: {2, 3, 3, 4, 4, 4, 5, 5, 8, 8, 12, 13} la mediana es 4.5

En el siguiente conjunto de datos ordinales {pequea, pequea, mediana, mediana,
mediana, grande, grande, grande, grande, grande, grande, extragrande, extragrande},
la mediana es grande

La mediana divide al conjunto de datos justo a la mitad por lo que nos proporciona
informacin del estilo: El 50% de los datos esta por debajo de la mediana y el otro 50%
por arriba de ella


Media

Si los datos son numricos (en escala intervalar o de razn), entonces es posible
calcular una tercera medida de tendencia central: la media aritmtica, la cual consiste
en la suma de todos los valores dividida por el nmero de ellos.
Se denota con x y queda expresada como:
n
x
x
n
i
i
=
=
1
.

La media aritmtica es lo que usualmente conocemos como promedio, y se interpreta
como tal. Una caracterstica de la media es que resulta sensible a datos extremos, lo
que no sucede con la mediana ni con la moda.

Ejemplos
En el conjunto de datos: {2, 3, 3, 4, 4, 4, 5, 5, 8, 8, 12, 13}, la moda es 4, la mediana
es 4.5 y la media es 6.45.

Para el conjunto de datos {2, 3, 3, 4, 4, 4, 5, 5, 8, 8, 12, 93}, la moda es 4, la mediana
es 4.5 y la media resulta 13.72.
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
13
Un ejemplo ms:

En un grupo de Estadstica I del Cch Sur, se observ la estatura de 16 alumnos y se
obtuvieron los siguientes datos (ya ordenados):

1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.60 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79

Calculemos las Medidas de Tendencia Central

moda = 1.64 mediana =
x
~
=
2
64 . 1 60 . 1 +
= 1.62
media = x =
16
96 . 25
16
16
1
=

= i
i
x
= 1.6225

Informacin proporcionada:

moda: La estatura ms frecuente entre los estudiantes es de 1.64 m

mediana: El 50% de los estudiantes miden menos de 1.62 m y el otro 50% mide
ms de 1.62m

moda: Los estudiantes tienen una estatura promedio de 1.6225 m



Ejercicios 1.2

1. La cuenta de la luz (en pesos) del mes de marzo de 30 familias escogidas
aleatoriamente se muestra a continuacin.



Calcula las tres medidas de tendencia central y escribe la informacin que proporcionan

a.- __________________________________________________________________

b.- __________________________________________________________________

c.- __________________________________________________________________






250 560 340 780 890 960 470 340 540 440 120 340 340 550 440
450 450 670 860 430 330 230 810 70 970 360 560 1120 370 840
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
14
Medidas de Dispersin

A las Medidas de Dispersin tambin se les llama Medidas de Variacin. La variacin
es la cantidad de dispersin, o separacin, que presentan los datos.


Rango

El rango de un conjunto de nmeros es la diferencia entre el mayor y el menor de todos
ellos. Se denota por R y se tiene que R = x
n
x
1


Varianza

La varianza es la suma de los cuadrados de las diferencias de los datos con relacin a
su media aritmtica, dividida entre el tamao de la muestra menos 1.
Se denota por S
2
, y se tiene
1
) (
1
2
2

=

=
n
x x
S
n
i
i



Si se dispone de una tabla de distribucin de frecuencias el calculo vara, utilizando la
expresin :

1
* ) (
2
2

=

=
n
f x x
S
k
n i
i i
en la cual, k es el nmero de datos distintos en la muestra.


Desviacin Estndar

Un inconveniente de la varianza es que sus unidades de medicin se encuentran al
cuadrado, por lo que no se puede comparar con la media aritmtica. Debido a esto, se
define la Desviacin Estndar como la raz cuadrada de la varianza.

Se denota por S, y se tiene
1
) (
1
2

=

=
n
x x
S
n
i
i


De igual manera, existe una expresin equivalente:
1
* ) (
2

=

=
n
f x x
S
k
n i
i i





w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
15
Coeficiente de Variacin

El coeficiente de variacin es una medida relativa de la variacin. Mide la dispersin de
los datos con respecto de su media.
Se denota por CV y se expresa en porcentaje: % 100 |
.
|

\
|
=
x
S
CV
El coeficiente de variacin se utiliza principalmente cuando se desea comparar dos
distribuciones de frecuencia que tienen diferente unidad de medida.


Ejemplo:

En un grupo de Estadstica I del Cch Sur, se observ la estatura de 16 alumnos y se
obtuvieron los siguientes datos (ya ordenados):

1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.60 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79

Calculemos las Medidas de Dispersin


Rango R = 1.79 1.52 = 0.27

Para realizar los clculos de la varianza a mano, resulta conveniente construir una
tabla como la siguiente






















Varianza
15
1095 . 0
2
= S = 0.0073

Desviacin Estndar 0073 . 0 = S = 0.08544
Estatura
x
i

Frecuencia
f
x x
i

2
) ( x x
i

i i
f x x * ) (
2

1.52 2 -0.1025 0.01051 0.02101
1.53 2 -0.0925 0.00856 0.01711
1.57 1 -0.0525 0.00276 0.00276
1.58 2 -0.0425 0.00181 0.00361
1.6 1 -0.0225 0.00051 0.00051
1.64 3 0.0175 0.00031 0.00092
1.66 2 0.0375 0.00141 0.00281
1.74 1 0.1175 0.01381 0.01381
1.76 1 0.1375 0.01891 0.01891
1.79 1 0.1675 0.02806 0.02806
x = 1.6225 E = 0.1095
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
16

Coeficiente de Variacin CV =
6225 . 1
08544 . 0
100 % = 5.266%


Dmosle sentido a estos nmeros:

R La mxima diferencia de estaturas entre los estudiantes es de 27 cm.

S Las estaturas de los estudiantes se desvan en promedio 8.54 cm. de su media.
(equivalente a 0.08544 m.)

CV Las estaturas varan 5.266% con respecto a su media





Medidas de Posicin

Los cuantiles son medidas de posicin no central que se utilizan para resumir o
describir las propiedades de conjuntos grandes de datos numricos. Los cuantiles que
se calculan ms a menudo son: cuartiles, deciles y percentiles.


Cuartiles

Son tres valores numricos que dividen a la muestra ordenada en cuatro partes iguales.
Se denotan por Q
1
, Q
2
, Q
3
.

Primer cuartil, es un valor tal que 25% de las observaciones son menores y 75% son
mayores.
4
1
1
+
=
n
x Q
. Recuerda que el subndice indica la posicin del dato
en el conjunto.

Segundo cuartil, es un valor tal que 50% de las observaciones son menores y 50% son
mayores. Coincide con el valor de la mediana.
4
) 1 ( 2
2
+ = n x Q


Tercer cuartil, es un valor tal que 75% de las observaciones son menores y 25% son
mayores.
4
) 1 ( 3
3
+ = n x Q


Busca en la bibliografa recomendada, qu son y cmo se calculan los deciles y los
percentiles


A continuacin te mostramos un ejemplo sobre el clculo de los cuartiles.
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
17
Ejemplo:
En un grupo de Estadstica I del Cch Sur, se observ la estatura de 16 alumnos y se
obtuvieron los siguientes datos (ya ordenados):

1.52 1.52 1.53 1.53 1.57 1.58 1.58 1.60 1.64 1.64 1.64 1.66 1.66 1.74 1.76 1.79
Q
1
Q
2
Q
3


Calculemos algunas Medidas de Posicin

4
1 16
1
+
= x Q
= 1.55
El 25% de los estudiantes miden menos de 1.55 m y el otro 75% mide ms

4
) 1 16 ( 2
2
+ = x Q
= 1.62
El 50% de los estudiantes miden menos de 1.62 y el otro 50% mide ms

4
) 1 16 ( 3
3
+
= x Q
= 1.66
El 75% de los estudiantes miden menos de 1.66 y el otro 25% mide ms



Ejercicios 1.3

1. La cuenta de la luz (en pesos) del mes de marzo de 30 familias escogidas
aleatoriamente se muestra a continuacin.







Calcula las medidas dispersin y las de posicin y escribe la informacin que
proporciona cada una

a.- __________________________________________________________________

b.- __________________________________________________________________

c.- __________________________________________________________________

d.- __________________________________________________________________

e.- __________________________________________________________________

f.- __________________________________________________________________

250 560 340 780 890 960 470 340 540 440 120 340 340 550 440
450 450 670 860 430 330 230 810 70 970 360 560 1120 370 840
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
18

Datos Agrupados

Distribucin de frecuencia

Cuando la muestra es grande (n mayor que 30) resulta conveniente organizar los datos
en intervalos de clase para construir su distribucin de frecuencias.

Para ejemplificar esta situacin, analicemos los datos siguientes correspondientes a la
edad de 55 personas

27 23 41 38 44 29 35 26 18 22 24
25 36 22 52 31 30 22 45 28 18 20
18 28 44 25 29 28 24 36 21 23 32
26 33 25 27 25 34 32 23 54 38 23
31 23 26 48 16 27 27 33 29 29 28

El nmero de intervalos de clase depende del nmero de observaciones. Una mayor
cantidad de datos requiere un mayor nmero de clases. Por lo general la distribucin de
frecuencias debe tener como mnimo 5 intervalos, pero no ms de 15.

Aunque, no existe una regla formal para determinar el nmero de intervalos y el tamao
de los mismos, existen algunas reglas empricas que resultan tiles en esta decisin


Denotemos con K al nmero de intervalos de clase y con C su tamao; utilizaremos la
Regla de Sturges:
) ( 322 . 3 1 n Log
Rango
K
+
= ;
K
Rango
C =

Para nuestro ejemplo,
) 55 ( 322 . 3 1
16 52
Log
K
+

= = 5.30

Como K debe ser un nmero entero, se redondea y se tienen K = 5 intervalos.

Los intervalos sern de tamao, 2 . 7
5
16 52
=

= C , el cul se redondea hasta la


precisin de nuestros datos, es decir a enteros, por lo que C = 7.


Tomemos el dato menor como el lmite inferior del primer intervalo, (aunque existen
otros criterios, este es el ms sencillo), y construyamos los intervalos de modo que cada
uno sea de tamao 7, es decir, de manera en cada uno se cuenten 7 enteros.

w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
19




Por ejemplo, en el intervalo 16 22 hay 7 enteros:

{16,17,18,19,10,21,22}





Observa que, como se llevan a cabo redondeos, resultaron 6 intervalos en lugar de 5,
pero recuerda que la Regla no es una Ley, slo es un gua para el clculo. Lo
importante es que el ltimo intervalo de clase cubra al dato mayor de la muestra.



Frecuencia Simple o Absoluta de los Intervalos de clase.

En la seccin anterior se defini la frecuencia como el nmero de veces que aparece un
dato, en el caso de datos agrupados, la definicin varia ligeramente:

La Frecuencia (simple o absoluta) de un intervalo es el nmero de datos que caen en el
mismo.














Qu informacin proporciona esta primera tabla?

De 55 personas 4 tienen entre 44 y 50 aos

9 de cada 55 personas tienen 22 aos o menos

Slo 2 de 55 personas tienen 51 aos o ms




Intervalo de
Clase
16 22
23 29
30 36
37 43
44 50
51 57
Intervalo de
Clase
Frecuencia
16 22 9
23 29 26
30 36 11
37 43 3
44 50 4
51 57 2
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
20
Frecuencia Relativa de los Intervalos de clase.

Se define, igual que en la seccin anterior, como la Frecuencia Simple dividida por el
tamao de muestra.











Qu nueva informacin proporciona esta segunda tabla?

La frecuencia relativa es una medida proporcional de la frecuencia para cada intervalo:
El 20.00% de las personas tienen entre 30 y 36 aos
Slo el 3.64% de las personas tienen 51 aos o ms


Frecuencia Acumulada de los Intervalos de clase.

Se construye sumando la frecuencia simple de cada intervalo con las frecuencias de los
intervalos que le preceden.













Observa que la frecuencia acumulada del ltimo intervalo es igual al tamao de la
muestra, porqu debe suceder esto? ______________________________________


Qu tipo de informacin proporciona esta tercera tabla?

De 55 personas 35 tienen menos de 30 aos
9 de cada 55 personas tienen mximo de 22 aos
53 de 55 personas tienen de hasta 50 aos
Intervalo de
Clase
Frecuencia
Frecuencia
Relativa
16 22 9
9
/
55
= 0.1636
23 29 26 0.4727
30 36 11 0.2000
37 43 3 0.0545
44 50 4 0.0727
51 57 2 0.0364
Intervalo de
Clase
Frecuencia
Frecuencia
Relativa
Frecuencia
Acumulada
16 22 9 0.1636 9
23 29 26 0.4727 9 + 26 = 35
30 36 11 0.2000 9+26+11 = 46
37 43 3 0.0545 49
44 50 4 0.0727 53
51 57 2 0.0364 55
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
21
Frecuencia Acumulada Relativa de los Intervalos de clase.

La frecuencia acumulada relativa se construye, sumando la frecuencia relativa de cada
intervalo con las frecuencias relativas de los intervalos que le preceden, o dividiendo la
frecuencia acumulada entre el tamao de muestra.


Intervalo de
Clase
Frecuencia
Frecuencia
Relativa
Frecuencia
Acumulada
Frecuencia
Acumulada Relativa
16 22 9 0.1636 9 0.1636
23 29 26 0.4727 35 0.1636 + 0.4727 = 0.6364
30 36 11 0.2000 46 0.8364
37 43 3 0.0545 49 0.8909
44 50 4 0.0727 53 0.9636
51 57 2 0.0364 55 0.9999


Observa que la frecuencia acumulada relativa del ltimo intervalo es aproximadamente
igual a 1, porqu sucede esto? __________________________________________


Cmo obtener informacin de esta cuarta tabla?

La frecuencia acumulada relativa es una medida proporcional de la frecuencia
acumulada hasta el limite superior de cada intervalo:

Slo el 16.36% de las personas tienen de hasta 22 aos
El 63.64% de las personas tienen mximo de 29 aos
El 89.09% de las personas tienen menos de 44 aos


Ejercicios 1.4

1.- Los siguientes datos muestran el nmero de vuelos internacionales recibidos en el
aeropuerto de la ciudad de Mxico durante los dos meses anteriores, construye una
tabla de distribucin de frecuencias.

71 47 66 67 73 38 63 67 29 54 62 70

63 37 68 50 59 60 45 48 52 49 48 56

70 62 61 65 62 45 62 56 63 39 36 43

49 50 39 41 57 49 73 47 38 61 48 31

55 57 72 53 42 70 56 58 39 60 53 36
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
22

Intervalo de
Clase
Frecuencia
Simple
Frecuencia
Relativa
Frecuencia
Acumulada
Frecuencia
Acumulada.
Relativa



2.- Escribe algunos ejemplos de la informacin que se obtiene a partir de cada tipo de
Frecuencia del ejercicio anterior

a.- ___________________________________________________________________

b.- ___________________________________________________________________

c.- ___________________________________________________________________

d.- ___________________________________________________________________


3.- Los datos siguientes corresponden a un estudio realizado con 40 personas para
conocer la reaccin sistmica a la picadura de abeja. Se toma el tiempo, en minutos, en
el que aparecen las primeras reacciones a la picadura. Construye una tabla de
distribucin de frecuencias. (Observa que la precisin de estos datos es de dcimas)

10.5 11.2 9.9 11.4 12.7 16.5 15.0 10.1
12.7 11.4 11.6 7.9 8.3 10.9 6.2 8.1
3.8 10.5 11.7 12.5 11.2 9.1 8.4 10.4
9.1 13.4 12.3 11.4 8.8 7.4 5.9 8.6
13.6 14.7 11.5 10.9 9.8 12.9 11.5 9.9

Intervalo de
Clase
Frecuencia
Simple
Frecuencia
Relativa
Frecuencia
Acumulada
Frecuencia Acumulada
Relativa


w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
23
4.- Escribe algunos ejemplos de la informacin que se obtiene a partir de cada columna
del ejercicio 3.

a.- ___________________________________________________________________

b.- ___________________________________________________________________

c.- ___________________________________________________________________

d.- ___________________________________________________________________



5.- La siguiente tabla muestra la distribucin de frecuencias de los resultados obtenidos
al entrevistar a 300 estudiantes de bachillerato que trabajan mientras estudian.
















Completa la tabla anterior, y con base en ella proporciona la informacin que falta:


a.- La frecuencia simple del primer intervalo nos dice que: _______________________
_____________________________________________________________________.

b.- El 30% de los estudiantes ganan entre ______________ y ______________.

c.- La frecuencia acumulada de la cuarta clase quiere decir que: __________________
_____________________________________________________________________.

d.- El porcentaje de estudiantes que ganan mximo $699.5 es _______________.





Intervalo de Clase

(Ganancia semanal)
Frecuencia

-----------
Frecuencia

Relativa

-------------

-------------

-------------

-------------
300 - 499 105
500 - 599 90
600 - 699 45
700 - 799 60 1
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
24
Medidas de Tendencia Central para datos agrupados

Cuando la muestra es grande y los datos se agrupan en intervalos de clase, el clculo
de las medidas de tendencia central vara significativamente. Se hace necesario,
adems, definir algunos conceptos nuevos, identifica cules.


Moda

La moda se defini como el dato con la mayor frecuencia, de manera similar definimos
ahora la Clase Modal, como aquel intervalo de clase con la mayor frecuencia.

Una vez que identificamos la clase modal, se utiliza la siguiente frmula para calcular la
moda:
C LR
|
|
.
|

\
|
A + A
A
+
2 1
1
inf


A continuacin describimos cada elemento utilizado en esta frmula:

LR
inf
= lmite real inferior de la clase modal.
A
1
= diferencia entre la frecuencia de la clase modal y la clase que le precede.
A
2
= diferencia entre la frecuencia de la clase modal y la clase que le sigue.
C = Tamao de clase de la clase modal.

Para aclarar lo que son los lmites reales observa y analiza el siguiente esquema

Lmites Reales de Clase

15.5 22.5 29.5 36.5
| | | | | | | | | | | |
16 22 23 29 30 36 37

Lmites de Clase


Veamos el clculo de la moda con el ejemplo de la edad de 55 personas:


moda = 7
15 17
17
5 . 22
|
.
|

\
|
+
+ ~ 26.2


La edad ms frecuente es de 26.2 aos



Intervalo de
Clase
Frecuencia
16 22 9
23 29 26
30 36 11
37 43 3
44 50 4
51 57 2
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
25

Mediana

La mediana se defini como el dato central cuando el conjunto se encuentra ordenado,
ahora definimos la Clase Mediana, como aquel intervalo de clase que cubre el 50% de
los datos. Para identificarla busquemos el intervalo cuya frecuencia acumulada relativa
sea igual o mayor a 0.5

Una vez que identificamos la clase mediana, se utiliza la siguiente frmula para calcular
la mediana: C
f
Fa
n
LR x
med

|
|
|
|
.
|

\
|

+ =
1
inf
2
~


Cada elemento utilizado en esta frmula se describe a continuacin:

LR
inf
= lmite real inferior de la clase mediana.
Fa
1
= frecuencia acumulada de la clase que precede a la clase mediana.
f
med
= frecuencia simple de la clase mediana.
C = tamao de clase de la clase modal.
n = tamao de muestra

Veamos el clculo de la mediana con el ejemplo de la edad de 55 personas:














mediana = 7
26
9
2
55
5 . 22
|
|
|
|
.
|

\
|

+ ~ 27.5

El 50% tales personas tienen una edad menor o igual a 27.5 aos y el otro 50% tiene
una edad mayor a 27.5 aos

Intervalo de
Clase
Frecuencia
Frecuencia
Acumulada
Frecuencia
Acumulada
Relativa
16 22 9 9 0.1636
23 29 26 35 0.6364
30 36 11 46 0.8364
37 43 3 49 0.8909
44 50 4 53 0.9636
51 57 2 55 0.9999
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
26
Media
La media igual que antes, se define como el promedio de los datos. Vamos a necesitar
el concepto de marca de clase, el cul es el punto medio de cada intervalo.

No es necesario identificar ninguna clase en particular, y la frmula para calcular la
media es:
n
f x
x
n
i
i i
=
=
1
*
) )( (


Los elementos en esta frmula son:
*
i
x = marca de clase de cada clase
f
i
= frecuencia simple de cada clase.

Veamos el clculo de la media con nuestro conocido ejemplo de la edad de 55
personas:

Como en otros clculos, resulta conveniente utilizar una tabla como la siguiente:




n
f x
x
n
i
i i
=
=
1
*
) )( (
=
55
1626
~ 29.6


La edad promedio de tales personas es de 29.6 aos
Intervalo de
Clase
Marca de clase
*
i
x
Frecuencia
f
i

) )( (
*
f x
i

16 22 19 9 19 * 9 = 171
23 29 26 26 676
30 36 33 11 363
37 43 40 3 120
44 50 47 4 188
51 57 54 2 108


= 1626
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
27

Medidas de Dispersin para datos agrupados

Rango

Si slo disponemos de una tabla de frecuencias, el Rango se define como la diferencia
entre el lmite real superior de la ltima clase y el lmite real inferior de la primera.

Varianza

La varianza para datos agrupados se calcula de manera similar, con algunas
modificaciones: las marcas de clase de cada intervalo toman el lugar de los datos y es
necesario multiplicar por cada frecuencia simple.
1
) (
1
*
2

=

=
n
f x x
S
n
i
i i


Desviacin estndar
Sigue siendo la raz cuadrada de la varianza:
1
) (
1
*

=

=
n
f x x
S
n
i
i i



Coeficiente de Variacin
Se define de la misma forma, como : % 100 |
.
|

\
|
=
x
S
CV


Utilicemos nuestro conocido ejemplo de la edad de 55 personas y calculemos las
medidas de dispersin para tales datos, es til una tabla como la siguiente.


















Intervalo
de Clase
Marca de
clase
*
i
x
Frecuencia
f
i

x x
i

*

2 *
) ( x x
i

i i
f x x * ) (
2 *

16 22 19 9 -10.6 112.3600 1011.2400
23 29 26 26 -3.6 12.9600 336.9600
30 36 33 11 3.4 11.5600 127.1600
37 43 40 3 10.4 108.1600 324.4800
44 50 47 4 17.4 302.7600 1211.0400
51 57 54 2 24.4 595.3600 1190.7200

x = 29.6 E = 4201.60
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
28

Rango 57.5 15.5 = 42

Varianza
54
60 . 4201
2
= S = 77.8074

Desviacin Estndar 0073 . 0 = S = 8.8208

Coeficiente de Variacin CV =
6 . 29
8208 . 8
100 % = 29.80%


Qu dicen estos nmeros?

R La mxima diferencia de edades entre estas personas es de 42 aos

S La edades de tales personas se desvan en promedio 8.82 aos de su media.

CV Las estaturas varan 29.80% con respecto a su media




Consulta la bibliografa recomendada para saber cmo calcular las medidas de posicin
para datos agrupados.




Ejercicios 1.5

1.- Calcula e interpreta las medidas de tendencia central y las medidas de dispersin
para los datos agrupados, correspondientes a

a) el nmero de vuelos internacionales recibidos en el aeropuerto de la ciudad de
Mxico durante los dos meses anteriores (del ejercicio 1.4 - 1)

b) un estudio realizado con 40 personas para conocer la reaccin sistmica a la
picadura de abeja (del ejercicio1.4 - 3)

c) los resultados obtenidos al entrevistar a 300 estudiantes de bachillerato que trabajan
mientras estudian (del ejercicio1.4 - 5)






w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
29



Representacin Grfica

Adems de la distribucin de frecuencias y de las medidas de tendencia central y de
dispersin, resulta conveniente construir alguna representacin grfica de los datos. De
esta manera, se tiene una imagen que describe visualmente el comportamiento de los
datos.
Cuando los datos son de tipo cualitativo es adecuado utilizar grficas de barras o
circulares. Si los datos son de tipo cuantitativo, el polgono de frecuencias o los
histogramas de frecuencias, son los ms tiles.

Toda grfica debe tener: Un ttulo descriptivo, el nombre de la variable que representa,
las unidades de la variable, y en su caso la escala utilizada.

Grafica Circular
Se conoce tambin como Diagrama de pastel, de sectores y otros. Se divide un crculo
de manera proporcional a la distribucin de los valores de la variable. Ayuda a percibir
la importancia relativa de cada categora respecto al total. Se utiliza tambin para
representar datos discretos.



















Grfica de barras

En este tipo de grfica se muestran en un sistema de ejes cartesianos los valores de la
variable, y los valores de la frecuencias, absolutas o relativas.

Los valores de la variable se localizan sobre un eje horizontal y las frecuencias sobre
uno vertical. Las barras son rectngulos cuyo ancho es arbitrario, pero debe ser el
mismo para todas las barras, y cuya longitud es la frecuencia o el porcentaje de
observaciones dentro de la categora.
Porcentaje de pacientes atendidos por
cada tipo de enfermedad
9%
30%
5%
17%
11%
8%
20%
Tos
Gripa
Fractura
Diabetes
Males cardiacos
Alta presin
Dolores estomacales
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
30
La separacin de las barras es arbitraria pero debe ser la misma. Las bases de los
rectngulos deben estar centrados sobre los valores de la variable


















Para una distribucin de frecuencias se tienen diferentes representaciones grficas,
tales como:



Histograma

Consiste en un grfico de barras o rectngulos cuya altura corresponde a la frecuencia
de cada valor o de cada intervalo localizada sobre el eje vertical.

Para datos no agrupados, cada frecuencia se representa por una barra cuya rea sea
proporcional a ella. Tpicamente, el ancho de cada barra se escoge como 1 y as, la
altura y el rea de la barra son iguales a la frecuencia del valor.

Para datos agrupados, el ancho de los rectngulos corresponde al tamao de los
intervalos de clase. Las barras, por lo tanto, son contiguas, y se encuentran centrados
en las marcas de clase.















0
5
10
15
20
25
30
F
r
e
c
u
e
n
c
i
a
16 22 23 29 30 36 37 43 44 50 51 57
Edad (aos)
Edad de personas
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
31

Polgono de Frecuencias

Consiste en una grfico de lneas trazado sobre un sistema de ejes cartesianos.

Para datos no agrupados, se trazan los puntos que corresponden a los valores de la
variable cuantitativa y la frecuencia (absoluta o relativa), a continuacin se unen los
puntos mediante segmentos de recta, los extremos se unen con el eje horizontal con el
primer valor menos una unidad y el extremo derecho mas una unidad.

Para datos agrupados los vrtices tienen como coordenadas las marcas de clase y las
frecuencias correspondientes. Se debe cerrar sobre el eje horizontal en dos puntos que
corresponden a las marcas de clase de dos intervalos, uno anterior y el otro posterior al
primero y al ltimo intervalo, cuya frecuencia es cero.

















Ojiva

Consiste en un poligono de frecuencias acumuladas, por lo tanto es una grfica de
lneas generalmente ascendente.
Para datos no agrupados se trazan los puntos que corresponden a los valores de la
variable cuantitativa y la frecuencia (acumulada o relativa acumulada), a continuacin
se unen los puntos mediante segmentos de recta, el extremo derecho no se une con el
eje horizontal.

Para datos agrupados los vrtices tienen como abscisa los valores de la variable
representados por los lmites reales superiores y como ordenada la frecuencia
acumulada o frecuencia relativa acumulada (ojiva porcentual).








Edad de personas
0
5
10
15
20
25
30
16 22 23 29 30 36 37 43 44 50 51 57
Edad (aos)
F
r
e
c
u
e
n
c
i
a
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
32





















Ejercicios 1.6

Construye una representacin grfica para:

a) la cuenta de la luz (en pesos) del mes de marzo de 30 familias escogidas
aleatoriamente (del ejercicio 1.1 - 1)

b) el nmero de vuelos internacionales recibidos en el aeropuerto de la ciudad de
Mxico durante los dos meses anteriores (del ejercicio 1.4 - 1)

c) un estudio realizado con 40 personas para conocer la reaccin sistmica a la
picadura de abeja (del ejercicio 1.4 - 3)

d) los resultados obtenidos al entrevistar a 300 estudiantes de bachillerato que trabajan
mientras estudian (del ejercicio 1.4 - 5)















Edad de personas
0
10
20
30
40
50
60
10 15 20 25 30 35 40 45 50 55 60
Edad (aos)
F
r
e
c
u
e
n
c
i
a

a
c
u
m
u
l
a
d
a
w
w
w
.
.
c
o
m
M
a
t
e
m
a
t
i
c
a
1
33
Ejercicios adicionales


La siguiente tabla contiene los datos obtenidos al entrevistar a estudiantes, elegidos al
azar, de 5. semestre de CCH.

Nombre
Gnero
( M o F)
Edad
(aos
cumplidos)
Tipo
sanguneo
Color
favorito
Nmero de
Hermanos
**
Peso
(kg)
Vernica F 17 O
+
Azul 2 63
Guillermo M 16 O
+
Morado 1 67
Viviana F 17 O
+
Azul 3 60
Nuria F 17 A
+
Azul 2 62
Alfredo M 17 O
+
Rojo 3 75
Gerson M 17 O
+
Negro 6 74
Nohem F 18 A
+
Azul 3 54
Alejandra F 16 O
+
Blanco 2 61
Viridiana F 16 O
+
Violeta 2 50
Elizabeth F 16 O
+
Blanco 3 45
Rogelio M 17 O
+
Azul 3 74
Amaranta F 17 A
+
Blanco 1 54
Fabiola F 16 O
+
Morado 2 54
Zicar F 18 O
+
Rosa 3 51
Karla F 18 A
+
Turquesa 2 55
Andrea F 17 O
+
Negro 3 60
Alfonso M 17 O
+
Azul 3 64
Rub F 15 B
+
Morado 2 62
Claudia F 17 O
+
Violeta 3 60
Wendi F 17 O
+
Negro 3 58

**incluyndose a s mismo(a)


1.- Identifica el tipo de variable representada en cada columna

2.- Realiza un anlisis descriptivo (distribucin de frecuencias, medidas de tendencia
central y de dispersin, representacin grfica, etc.) de cada variable (por separado).

Você também pode gostar