Você está na página 1de 26

Estadstica - Pagina 64

4.4 Ejercicios
1. Construya un grfico para representar los datos de los ejercicios 2, 3, 4, 5 y 6 del captulo 3.
2. Se realiz un estudio en el municipio de Bello con el fin de evaluar el riesgo nutricional
de los jvenes que se encuentran estudiando, para ello se realiz un estudio comparativo
de todos los estudiantes de las instituciones escolares de carcter pblico. Los resultados
se muestran a continuacin (interprete la grfica):

Clasificacin nutricional del riesgo nutricional de los escolares segn el indicador peso/edad en el
municipio de Bello en el ao 2002.
3. La siguiente grfica muestra los montos asignados en los ltimos aos, para subsidio de vivienda
por parte del gobierno nacional, con el fin de colaborarle a las clases menos favorecidas. Interprete
el grfico.

5.458
3.338
1.254
0
1.000
2.000
3.000
4.000
5.000
6.000
LEVE MODERADO SEVERO
Estadstica - Pagina 65
4. Los aceros inoxidables se utilizan con frecuencia en las plantas qumicas para manejar fluidos
corrosivos. Sin embargo, en ciertos entornos estos aceros son especialmente susceptibles al
agrietamiento debido a la corrosin por esfuerzos. Un estudio identific este tipo de agrietamiento
como la principal causa individual de la falla de aleaciones de acero en plantas qumicas japonesas.
La tabla siguiente enumera los diversos tipos de fallas y sus correspondientes porcentajes del total
para 295 casos de fallas de aleaciones que ocurrieron en refineras de petrleo y plantas
petroqumicas en Japn durante los ltimos 10 aos.
Causa de la falla Porcentaje
Entorno hmedo
Corrosin general 12.5
Corrosin localizada 15.9
Agrietamiento debido a la corrosin por esfuerzos 39.9
Diversas 3.8
Entorno seco
Corrosin 8.2
Agrietamiento 10.9
Menoscabo de propiedades mecnicas 1.7
Diversas 1.7
Defectos de materiales 2.0
Defectos de soldadura 3.4
a. Elabore un diagrama de Pareto para las causas de fallas en aleaciones de acero en plantas
qumicas japonesas.
b. La grfica anterior apoya lo afirmado por los investigadores?
5. La siguiente distribucin corresponde a la poblacin mayor a 5 aos en Antioquia. Estos
porcentajes fueron calculados teniendo como base la informacin del ltimo censo. (1993)
Intervalos %fri
5 7 5.8
7 - 11 12.3
11 18 15.2
18 24 18.4
24 34 19.0
34 44 11.8
44 60 10.8
60 y ms aos 6.7
a. Construya el histograma y sobre ste el polgono de frecuencias relativas.
b. Realice como mnimo 5 interpretaciones de la grfica.
c. Entre qu grupo de edades se encuentra el mayor porcentaje de la poblacin?
d. Cul cree usted que sera la tendencia si graficramos sobre los mismos ejes los datos de
un censo que se realizara el ao entrante en Antioquia?
Estadstica - Pagina 66
6. Una muestra de 400 bateras tomadas al azar de una lnea de produccin fue sometida a un test
de laboratorio para determinar su duracin. Con los resultados de dicho test se obtuvo la siguiente
distribucin de frecuencias.
Duracin en das Nmero de bateras
300 400 14
400 500 46
500 600 58
600 700 76
700 800 68
800 900 60
900 1000 48
1000 1100 22
1100 1200 8
a. Realice la ficha tcnica del estudio.
b. Construya el polgono de frecuencias absolutas acumuladas.
c. Qu probabilidad hay de que una batera dura 620 das cuando menos?
d. Qu riesgo correra el fabricante si estableciera una garanta de que la duracin mnima de
cualquiera de las bateras es de 450 das de servicio?
e. Si el fabricante otorgara una garanta de devolucin del precio pagado por la batera vlida
por 90 das. Cul sera el riesgo de tener que hacer efectiva dicha garanta?
7. Se registraron los gastos diarios de un grupo de familias del barrio Laureles, los datos obtenidos
se muestran a continuacin:
Xi fai
10000 12000 100
12000 14000 150
14000 16000 200
16000 18000 200
18000 20000 150
20000 22000 80
22000 24000 50
24000 26000 30
26000 28000 20
28000 - 30000 20
a. Realice la ficha tcnica de dicho estudio.
b. Construya el polgono de frecuencias absolutas acumuladas.
c. Cuntas familias y qu porcentaje gastan ms de 25000 diariamente?
d. Cuntas familias y qu porcentaje gastan menos de 18000 diariamente?
e. Cuntas familias y qu porcentaje gastan entre 11000 y 23000 diariamente?
f. El 80% de las familias gastan ms de qu cantidad de dinero?
g. El 30% de las familias gastan menos de qu cantidad de dinero?
Estadstica - Pagina 67
Captulo 5
Objetivos:
- Conocer las diversas medidas descriptivas de una muestra, con el fin de mejorar la
interpretacin de los datos, superando as las limitaciones que pueden traer los anlisis
grficos por parte de cada investigador.
- Diferenciar cada una de las medidas descriptivas de una muestra, observando su
complementariedad.
- Profundizar en el manejo de informacin de carcter cuantitativo, llegando a comparar
diversos sistemas de datos en donde se referencia la misma variable.
- Aplicar el conocimiento adquirido al entorno especfico del estudiante.
Reflexin:
En una isla habitaban la felicidad, la tristeza,
la sabidura, y el amor, entre otros elementos
de la existencia humana.

Un da se supo que la isla se hundira. Todos
prepararon sus barcos para partir, con excepcin
del amor, que quera permanecer en su hogar hasta
el ltimo instante.

Cuando la mayor parte de la isla estaba ya bajo el
agua, el amor decidi pedir ayuda. En ese momento pas
la riqueza en una imponente galera, y el amor le
pregunt:

- Riqueza, puedes ayudarme?

La riqueza le respondi:

- No, lo lamento. Llevo mucho oro y mucha plata en
mi barco. No hay forma de que quepas.

El amor se apresur entonces a pedirle ayuda a la
vanidad, que navegaba en un yate muy fino y
elegantemente adornado:

- Vanidad, podras ayudarme?

Y la vanidad contest:

- Perdname, Amor, pero ests mojado y lleno de
barro. No quisiera ensuciar mi lindo bote.
Estadstica - Pagina 68

El amor vio a la tristeza:

- Tristeza, puedo ir contigo?

- Oh... Amor, -replic,- estoy tan triste que
prefiero estar sola.

La felicidad tambin rechaz la peticin, porque
estaba tan feliz que no quiso ocuparse de nada
que interrumpiera la dicha que senta.

De repente, el amor escuch una voz que lo
llamaba:

- Amor, ven, acrcate. Yo te llevo.

El amor estaba tan agitado, contento, y aliviado,
que no se le ocurri preguntar quin lo haba
salvado.

Al llegar a tierra firme, el amor cay en cuenta de
su olvido y queriendo saber a quin agradecer, le
pregunt a un anciano que contemplaba el ocano.

- Quin me ayud?

- Fue el tiempo.- afirm la sabidura.

- El tiempo? -cuestion incrdulo el amor- Por qu?

Y la sabidura aclar:

- Porque el tiempo es capaz de entender la grandeza
del amor.
Algunas veces dejamos de lado al amor.
Qu nos quedar cuando todo lo dems haya pasado?
Valoras, agradeces y disfrutas a quienes te aman?
Cul es el barco que ms navegas?

5. Medidas Descriptivas de una Muestra
Estadstica - Pagina 69
Los grficos pueden presentar limitaciones para la descripcin y anlisis de un conjunto de datos y
las conclusiones que se derivan de ellos pueden variar segn el juicio del investigador. Las
limitaciones de los grficos pueden obviarse con el uso de medidas descriptivas. stas son valores
nicos, representativos de un conjunto de datos y pueden ser de cuatro clases:
- Medidas de tendencia central
- Medidas de dispersin o variabilidad
- Medidas de asimetra
- Medidas de curtosis
5.1. Medidas de Tendencia Central
En esta seccin definiremos una serie de medidas o valores que tratan de representar o resumir a
una distribucin de frecuencias dada, sirviendo adems para realizar comparaciones entre distintas
distribuciones de frecuencias. Las medidas de tendencia central son promedios, es decir, valores
tpicos representativos de todo un conjunto de datos que tienden a estar localizados en aquella parte
de la distribucin, donde los datos tienden a aglomerarse o a agruparse.

Las medidas de tendencia central ms usuales son:
- Media aritmtica o promedio
- Mediana
- Moda

5.1.1 Media aritmtica (promedio) (x)
5.1.1.1 Media aritmtica para datos sin agrupar (x)
Se utiliza cuando los datos no estn agrupados en una tabla de frecuencias simples o en intervalos.
La media aritmtica se define como la suma de todos los datos, dividida por el nmero total de ellos.
Si los datos fueran x1, x2, x3, ..., xn, su expresin sera:

En donde n es el nmero total de datos.
Ejemplo 1:
Se pregunt acerca de las edades de un grupo de estudiantes de Derecho Laboral, pertenecientes a
la universidad, los resultados fueron:
21 23 19 25 27 36 21 24 22 20 19 20 23
El promedio de las edades de los estudiantes sera:

=
=
n
i
i
n
x
x
1
Estadstica - Pagina 70

= 23.1 aos = 23 aos
Diramos entonces que se tiene una edad promedio de 23 aos aproximadamente
5.1.1.2 Media aritmtica ponderada ( )
En primer lugar debemos saber que ponderar significa agrupar; cuando los datos estn agrupados
en una tabla de frecuencias simples o en una tabla de frecuencias en intervalos y si llamamos xl, ...,
xk a las categoras que toma la variable en estudio, o a las marcas de clase de los intervalos en los
que se han agrupado dichos datos, y fai,..., fak a las correspondientes frecuencias absolutas de
dichas categoras o marcas de clase, la media aritmtica ponderada de la distribucin de
frecuencias estar dada por:

en donde n es el tamao de la muestra y k es el nmero total de categoras que toma la variable o el
nmero total de marcas de clase.
Ejemplo 2:
La media aritmtica ponderada para el nmero de hijos por familia en el barrio Beln Rosales de la
ciudad de Medelln (p 25) sera:

= 4.7 5 hijos
es decir, las familias encuestadas tienen un nmero medio de hijos de aproximadamente 5.
Ejemplo 3:
Se midieron los niveles de hemoglobina a un grupo de 34 pacientes que posean un extrao tipo de
anemia (los valores estn en g/dl), siendo valores normales los encontrados en el rango 14.0 18.0.
La tabla de distribucin de frecuencias en intervalos est dada por:
13
23 20 19 20 22 24 21 36 27 25 19 23 21
1
+ + + + + + + + + + + +
= =

=
n
i
i
n
x
x

=
=
n
i
i
n
x
x
1
X

=
=
k
i
i i
n
fa x
x
1

= =
+ + + + + + + + + +
= =
11
1 1
40
2 * 11 4 * 9 2 * 8 4 * 7 4 * 6 2 * 5 7 * 4 3 * 3 4 * 2 5 * 1 3 * 0
i
k
i
i i
n
fa x
x

=
=
k
i
i i
n
fa x
x
1
Estadstica - Pagina 71
Li Ls xi fai %fri Faan %Fran
7.5 9.0 8.25 3 8.8 3 8.8
9.0 10.5 9.75 8 23.6 11 32.4
10.5 12.0 11.25 10 29.4 21 61.8
12.0 13.5 12.75 10 29.4 31 91.2
13.5 15.0 14.25 1 2.9 32 94.1
15.0 16.5 15.75 2 5.9 34 100.0


fai = 34 %fri = 100.0
la media aritmtica ponderada, estara dada por:

= 11.4 g/dl
5.1.2 Mediana (Me)
La mediana es una medida de posicin, ocupa un lugar central en la serie cuando los datos estn
ordenados de menor a mayor o viceversa. Se define como aquel valor de la variable tal que, al
menos el 50% de los datos son menores o iguales a l y al menos el 50% de los datos son mayores
o iguales a l.
Si la cantidad de datos (n) es impar, la mediana es igual al dato que ocupa la posicin central. Si el
nmero de datos es par, la mediana ser el promedio de los dos datos centrales.
As, si en la siguiente distribucin de frecuencias,
xi fai Faan
0 3 3
1 2 5
2 2 7
7
ordenamos los valores en orden creciente: 0 0 0 1 1 2 2
34
5 . 388
34
2 * 75 . 15 1 * 25 . 14 10 * 75 . 12 10 * 25 . 11 8 * 75 . 9 3 * 25 . 8
1
=
+ + + + +
= =

=
k
i
i i
n
fa x
x

=
=
k
i
i i
n
fa x
x
1
Estadstica - Pagina 72
el 1 ser el valor que cumple la definicin de mediana.
Lgicamente, cuando el tamao de la muestra (n) sea mayor, este procedimiento resultara inviable.
Por esta razn, daremos a continuacin una frmula que permita calcularla. No obstante, ser
necesario distinguir los casos en los que los datos vengan agrupados en fila de datos (tabla de
frecuencias simples) de aquellos en los que vengan en intervalos.

5.1.2.1 Mediana para datos agrupados en tablas de frecuencias simples:
Las grficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas,
recogen las dos situaciones que se pueden presentar:

Si la situacin es como la de la figura de la derecha, es decir, si n/2 aparece en la distribucin,
tendr entonces un valor correspondiente en las variables, as diremos que sta ser la mediana.
Si la situacin que se presenta es como la de la figura de la izquierda, entonces la mediana queda
indeterminada, aunque en este caso se toma como mediana la media aritmtica de los dos valores
entre los que se produce la indeterminacin; as pues, si
Faaj-1 < n/2 < Faaj
entonces la mediana es


Ejemplo 1:
Estadstica - Pagina 73
La distribucin de frecuencias absolutas acumuladas en el ejemplo sobre el nmero de hijos en el
barrio Beln Rosales era:
Nmero de hijos (xi) 0 1 2 3 4 5 6 7 8 9 11
Frecuencias Acumuladas( Faan) 3 8 12 15 22 24 28 32 34 38 40
Como es n/2=20
15 < 20 < 22
la mediana ser Me=(3+4)/2.
Me = 3.5 = 4 hijos. Concluimos que el 50% de las familias tiene 4 hijos o menos.

5.1.2.2 Mediana para datos agrupados en intervalos:
Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas, nos
plantean de nuevo dos situaciones diferentes a considerar:

El ms sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Faaj tal que
n/2 = Faaj, la mediana es Me = xj.
Si la situacin es como la que se representa en la figura de la izquierda, en la que Faaj-l < n/2 < Faaj
entonces, la mediana, est en el intervalo (xj-1, xj], es decir entre xj-1 y xj, tomndose en ese caso, por
razonamientos de proporcionalidad, como mediana el valor:

A
fa
Faa
n
Li Me
j
j
*
2
1

+ =
Estadstica - Pagina 74
En donde:
Li corresponde al lmite inferior del intervalo que contiene la mediana.
n es el tamao de la muestra.
Faaj-1 es la frecuencia absoluta acumulada anterior a la que contiene a la mediana.
fai es la frecuencia absoluta correspondiente a la mediana.
A es la amplitud del intervalo

Ejemplo 2:
La distribucin de frecuencias del ejemplo de los niveles de Hemoglobina (p 38) es:
Intervalo Li - Ls 7.5-9.0 9.0-10.5 10.5-12.0 12.0-13.5 13.5-15.0 15.0-16.5
Frecuencia Absoluta fai 3 8 10 10 1 2
Frecuencia Acumulada Faan 3 11 21 31 32 34
Como n/2 = 17 y estar comprendido entre los datos dados
11 < 17 < 21
la mediana estar en el intervalo (10.5 , 12.0|, y aplicando la frmula anterior, ser

El 50% de los pacientes tendrn niveles de hemoglobina menores o iguales a 11.4 g/dl
5.1.3 Moda (Mo)
La moda se define como aquel valor de la variable al que corresponde la mxima frecuencia
(absoluta o relativa). Para calcularla, tambin ser necesario distinguir si los datos estn agrupados
en una tabla de frecuencias simples o en intervalos.
5.1.3.1 Moda para datos agrupados en tablas de frecuencias simples:
Para datos agrupados en tablas de frecuencias simples, la determinacin del valor o valores (ya que
puede haber ms de uno) modales es muy sencilla. Basta observar a qu valor le corresponde una
mayor fai o %fri. Esa ser la moda.
As en el ejemplo del nmero de hijos, la simple inspeccin de la tabla siguiente proporciona como
valor para la moda el Mo = 4.
Nmero de hijos (xi) 0 1 2 3 4 5 6 7 8 9 11
4 . 11 5 . 1 *
10
11
2
34
5 . 10 =

+ = Me
Estadstica - Pagina 75
Frecuencias Absolutas( fai) 3 5 4 3 7 2 4 4 2 4 2
El nmero de hijos ms frecuente por familia en la muestra del barrio Beln Rosales es de 4 hijos,
pues le corresponde la mayor frecuencia, la cual en este caso es de 7.

5.1.3.2 Moda para datos agrupados en intervalos:
Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si stos tienen o
no igual amplitud. Si tienen amplitud constante A, una vez identificado el intervalo modal (xj-1, xj|, es
decir el intervalo al que corresponde mayor frecuencia absoluta fai; la moda se define, tambin por
razones geomtricas, como:


En donde:
Li es el lmite inferior que contiene la moda.
fai+a es la frecuencia absoluta correspondiente al intervalo posterior del que contiene la moda.
fai-a es la frecuencia absoluta correspondiente al intervalo anterior del que contiene la moda.
A es la amplitud del intervalo que contiene la moda.


Ejemplo 1:
En el caso de los niveles de hemoglobina, vemos que presenta un caso de distribucin bimodal, ya
que tanto el intervalo (10'5 - 12| como el (12 - 13'5| tienen frecuencia absoluta mxima. Deberamos
aplicar, por tanto, para cada uno de los dos intervalos la frmula anterior, determinando as las dos
modas de la distribucin. No obstante, este ejemplo presenta adems la peculiaridad adicional de
ser ambos intervalos modales contiguos. En esta situacin se considera la distribucin unimodal,
eligiendo como moda el extremo comn, Mo = 12.
Por lo tanto el nivel ms comn de hemoglobina en la sangre de estos pacientes es de 12 g/dl.

Ejemplo 2:
Si los intervalos tuvieran distinta amplitud Ai, primero debemos normalizar las frecuencias absolutas
fai, determinando los cocientes siguientes:
A
fa fa
fa
Li Mo
i i
i
1 1
1
+
+
+
+ =
Estadstica - Pagina 76

y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los cj. Es decir,
primero calcular el cj = max{c1,...., ck} para determinar el intervalo modal [xj-1, xj) y luego aplicar la
frmula

siendo Aj la amplitud del intervalo modal [xj-1, xj).


Las frecuencias normalizadas correspondientes al ejemplo sobre el test psicolgico de la pgina 39,
que posee intervalos con distinta amplitud seran,
Li - Ls fai cj
0-20 8 0.4
20-30 9 0.9
30-40 12 1.2
40-45 10 2.0
45-50 9 1.8
50-60 10 1.0
60-80 8 0.4
80-100 4 0.2
con lo que el intervalo modal es el [40 - 45) y la moda, pues posee la mayor frecuencia normalizada
2.0


Con lo cual podramos decir que la puntuacin ms frecuente en un test psicolgico es de 43 puntos.
k i
A
fa
c
i
i
j
,..., 2 , 1 , = =
j
j j
j
A
c c
c
Li Mo *
1 1
1
+
+
+
+ =
j
j j
j
A
c c
c
Li Mo *
1 1
1
+
+
+
+ =
43 5 *
8 . 1 2 . 1
8 . 1
40 =
+
+ = Mo
Estadstica - Pagina 77

Ejemplo 3:
A diferencia de lo que ocurre con la media o con la mediana, s es posible determinar la moda en el
caso de datos cualitativos. As, en el ejemplo del tratamiento de radiacin seguido de ciruga (p 32)
puede afirmarse que la causa modal por la que no fue completado el tratamiento es Mo = rehusaron
ciruga.

5.2 Medidas de dispersin o variabilidad
Una medida de tendencia central por s sola no proporciona una descripcin satisfactoria de un
conjunto de datos. Es necesario el uso de una medida de la variacin de los datos con respecto a los
valores centrales, como los calculados en la seccin anterior. Por lo general, las medidas de
dispersin o variabilidad se calculan comparando los datos de la distribucin con el dato ms
importante de las medidas de tendencia central: la media aritmtica.
Observemos la dificultad que puede ser el caracterizar los datos slo con una medida de tendencia
central.
La edad promedio de 3 jvenes de 18,19 y 20 aos es:

Y la edad promedio de 3 integrantes de una familia con 5, 10 y 42 aos es:

Aunque ambos grupos de datos presentan el mismo promedio, vemos como el primer grupo de
datos presenta una pequea dispersin, mientras que en el segundo grupo es muy grande. La
dispersin es una caracterstica muy importante de un conjunto de datos. Por ejemplo una mquina
productora de tornillos milimtricos debe presentar una dispersin pequea en el dimetro de los
mismos, pues de lo contrario una alta proporcin de ellos resultara defectuosos.
Las medidas de dispersin o variabilidad, a las cuales dedicaremos esta seccin, tienen como
propsito estudiar lo concentrada que est la distribucin en torno a algn promedio. Las cuatro
medidas de dispersin ms utilizadas son:
- Rango
- Varianza
- Desviacin estndar
aos 19
3
20 19 18
1
=
+ +
= =

=
n
i
i
n
x
x
aos 19
3
42 10 5
1
=
+ +
= =

=
n
i
i
n
x
x
Estadstica - Pagina 78
- Coeficiente de variacin
5.2.1 Rango
Nos indica la diferencia que existe entre el dato mayor y el dato menor de la distribucin. Si xmax es el
dato mayor o la ltima marca de clase, si es que los datos vienen agrupados en intervalos, y xmin el
dato menor o primera marca de clase, llamaremos rango a
R = x max - x min

Ejemplos
En el ejemplo sobre el nmero de hijos por familia en el barrio Beln Rosales:
Nmero de hijos (xi) 0 1 2 3 4 5 6 7 8 9 11
Frecuencias Absolutas( fai) 3 5 4 3 7 2 4 4 2 4 2
R = 11 0 = 11 hijos
Vemos aqu que el nmero de hijos vara en 11, siendo 0 el menor nmero de hijos presentes y 11 el
mayor nmero de hijos que tiene una familia, mostrando una variabilidad relativamente alta.
Para los niveles de hemoglobina en la sangre para pacientes que padecen un extrao tipo de
anemia:
Intervalo Li Ls 7.5-9.0 9.0-10.5 10.5-12.0 12.0-13.5 13.5-15.0 15.0-16.5
Marca de clase xi 8.25 9.75 11.25 12.75 14.25 15.75
R = 15.75 8.25 = 7.5 g/dl
Observamos como el nivel de hemoglobina en la sangre para estos pacientes vara en 7.5 g/dl, del
mayor valor respecto al menor valor, lo que muestra una variabilidad relativamente moderada.
La principal ventaja del rango es la de proporcionar una medida de la dispersin de los datos entre el
menor y el mayor valor. Nos permite observar qu tanto varan los datos, o sea que tan amplia es la
distribucin de ellos.
5.2.2 Varianza para datos sin agrupar
Estadstica - Pagina 79
La varianza mide el grado de dispersin de los datos respecto a la media aritmtica. Si denotamos
por x1,...,xn los datos, llamaremos varianza a la comparacin de cada dato con su media aritmtica,
as:

Ejemplo 1:
Para las edades de los jvenes la varianza sera:
ao
2

Ejemplo 2:
En las edades de los integrantes de una familia:

aos
2

Se observa entonces la gran diferencia en cuanto a la dispersin o variabilidad que presentan las
edades de los integrantes de una familia, comparativamente con las edades de los jvenes, aunque
sus promedios sean los mismos.
5.2.2 Varianza para datos agrupados en tablas de frecuencias simples o en intervalos de clase
Si los datos se encuentran agrupados en una tabla de frecuencias simples (fila de datos) o en
intervalos, la frmula para calcular la varianza debe incluir a la frecuencia absoluta (fai) respectiva a
cada una de las categoras que toma la variable o a sus marcas de clase, segn sea el
agrupamiento:

En donde k = al nmero de categoras que toma la variable o a las marcas de clase.
Ejemplo 1:

=
n
i
i
x x
n
1
2 2
) (
1
1
o
| | | | | | 1 2
2
1
) 1 ( ) 0 ( ) 1 (
2
1
) 19 20 ( ) 19 19 ( ) 19 18 (
1 3
1
2 2 2 2 2 2 2
= = + + = + +

= o
| | | |= + + = + +

=
2 2 2 2 2 2 2
) 23 ( ) 9 ( ) 14 (
2
1
) 19 42 ( ) 19 10 ( ) 19 5 (
1 3
1
o
| | | | | | 403 806
2
1
529 81 196
2
1
) 23 ( ) 9 ( ) 14 (
2
1
2 2 2
= = + + = + +
) 1 (
1
2
1
2
2

|
.
|

\
|

=

= =
n n
f a x f a x n
k
i
k
i
i x i i
o
Estadstica - Pagina 80
En el ejemplo sobre el nmero de hijos por familia en el barrio Beln Rosales:
xi fai %fri Faan %Fran xi
2
fai xifai
0 3 7.5 3 7.5 0 0
1 5 12.5 8 20 5 5
2 4 10 12 30 16 8
3 3 7.5 15 37.5 27 9
4 7 17.5 22 55 112 28
5 2 5 24 60 50 10
6 4 10 28 70 144 24
7 4 10 32 80 196 28
8 2 5 34 85 128 16
9 4 10 38 95 324 36
11 2 5 40 100 242 22
fai =40 %fri = 100% xi
2
fai =
1244
xifai = 186
Reemplazando en la frmula de la varianza, tendramos:
hijos
2

Ejemplo 2:
Para los niveles de hemoglobina en la sangre de un grupo de pacientes con un extrao tipo de
anemia
Li - Ls xi fai %fri Faan %Fran xi
2
fai xifai
7.5 9.0 8.25 3 8.8 3 8.8 204.2 24.75
9.0 10.5 9.75 8 23.6 11 32.4 760.5 78.0
10.5 12.0 11.25 10 29.4 21 61.8 1265.6 112.5
12.0 13.5 12.75 10 29.4 31 91.2 1625.6 127.5
13.5 15.0 14.25 1 2.9 32 94.1 203.1 14.25
15.0 16.5 15.75 2 5.9 34 100.0 496.1 31.5
fai = 34 %fri = 100.0
xi
2
fai = 4555.1 xifai = 388.5
(g/dl)
2
7 . 9
1560
15164
) 39 ( 40
34596 49760
) 1 40 ( 40
) 186 ( ) 1244 ( 40
2
2
= =

= o
5 . 3
1122
1 . 3941
) 33 ( 34
3 . 150932 4 . 154873
) 1 34 ( 34
) 5 . 388 ( ) 1 . 4555 ( 34
2
2
= =

= o
Estadstica - Pagina 81
Existe ms dispersin en el primer grupo de datos (# de hijos por familia) que en segundo grupo de
datos (niveles de hemoglobina en la sangre)
La dificultad de la varianza radica en que sus unidades se encuentran al cuadrado, dificultando su
interpretacin y produciendo una falsa imagen de la dispersin de la distribucin. Lo anterior se
resuelve haciendo uso de la desviacin estndar.

5.2.3 Desviacin Estndar
La desviacin estndar no es mas que la raz cuadrada positiva de la varianza. As:


Ejemplos:
En el ejemplo sobre el nmero de hijos por familia en el barrio Beln Rosales:
hijos
Para los niveles de hemoglobina en la sangre de un grupo de pacientes con un extrao tipo de
anemia
g/dl
5.2.4 Coeficiente de Variacin
La desviacin estndar sirve para medir de forma eficaz la dispersin de un conjunto de datos
entorno a su media. Desgraciadamente esta medida puede resultar engaosa cuando tratamos de
comparar la dispersin de dos conjuntos de datos. As, si por ejemplo tenemos dos grupos de
mujeres de 11 y 25 aos con medias y desviaciones tpicas dadas por la tabla siguiente:
Peso Medio Desviacin Estndar
11 aos 40 Kg 2 Kg
25 aos 50 Kg 2 Kg
puede parecernos, al observar en ambos grupos una desviacin tpica igual, que ambos grupos de
datos tienen la misma dispersin. No obstante, como parece lgico, no es lo mismo una variacin de
dos kilos en un grupo de elefantes que en uno de conejos. El Coeficiente de Variacin elimina esa
2
o o =
1 . 3 7 . 9 = = o
9 . 1 5 . 3 = = o
Estadstica - Pagina 82
posible confusin al ser una medida de la variacin de los datos pero en relacin con su media. Se
define como:

siendo o y x respectivamente la desviacin estndar y la media de la distribucin en estudio y en
donde el factor 100 tiene como nico objetivo el evitar operar con valores decimales.
De la definicin de C.V. se deduce fcilmente que aquella distribucin a la que corresponda mayor
coeficiente tendr mayor dispersin.
Ejemplos:
En el ejemplo anterior, al grupo de nias de 11 aos le corresponde un coeficiente de variacin de
igual a:

y al grupo de las mujeres de 25 aos

lo que indica que existe una mayor dispersin en los datos del grupo de nias de 11 aos.
5.2.5. Regla emprica y Teorema de Tchebysheff
Aunque la desviacin estndar como la varianza no se pueden interpretar en forma aislada, la
desviacin estndar conjuntamente con la media si tiene un significado prctico:
Si la distribucin de los datos es simtrica, con forma de campana (distribucin normal), como se
muestra a continuacin, podremos decir que:
- El 68% de los datos se encuentran en una regin correspondiente a una desviacin
estndar alrededor de la media (xo).
- El 95% de los datos se encuentran en una regin correspondiente a dos desviaciones
estndar alrededor de la media (x2o).
- El 99% de los datos se encuentran en una regin correspondiente a tres desviaciones
estndar alrededor de la media (x3o).
- Datos por fuera de tres desviaciones estndar pueden eliminarse, sin afectar la distribucin
de los datos.
100 . . =
x
V C
o
% 5 100
40
2
. . = = V C
% 4 100
50
2
. . = = V C
Estadstica - Pagina 83

68%
95%
99%
Todos los intervalos anteriores son validos nicamente para los datos muestrales y no
necesariamente para toda la poblacin. Sin embargo si los intervalos se calculan con la media
(promedio) y desviacin estndar de la poblacin entonces sern validos para toda la poblacin: De
otro modo, si la media y la desviacin estndar se han calculado a partir de muestreo probabilsticos
aleatorios, entonces los intervalos anteriores podrn dar una idea aproximada de lo que pasa en
toda la poblacin, sea sta un lote o un proceso.
Lo anteriormente propuesto est basado en lo que se conoce como la Regla Emprica; como su
nombre lo dice estos resultados obtenidos han sido deducidos de la experimentacin y no a travs
de ninguna teora matemtica.
Si la distribucin no tiene forma acampanada se tiene que recurrir a lo desarrollado por Tchebysheff
quien propone que:
- El 75% de las observaciones deben estar contenidas dentro de distancias que se
encuentran a dos desviaciones estndar alrededor de la media (x 2o).
- El 89% de las observaciones deben estar contenidas dentro de distancias que se
encuentran a tres desviaciones estndar alrededor de la media (x 3o).
- El 94% de las observaciones deben estar contenidas dentro de distancias que se
encuentran a cuatro desviaciones estndar alrededor de la media (x 4o).

Estadstica - Pagina 84
5.3 Medidas de Asimetra
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica
coincidan. Claramente la distribucin del ejemplo de los niveles de hemoglobina es simtrica,
mientras que para el nmero de hijos del barrio Beln Rosales es asimtrica.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas)
descienden ms lentamente por la derecha que por la izquierda. Si las frecuencias descienden ms
lentamente por la izquierda que por la derecha diremos que la distribucin es asimtrica a la
izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Aqu estudiaremos dos de
ellas.
5.3.1 Coeficiente de Asimetra de Pearson
Se define como:

siendo cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y
negativo cuando existe asimetra a la izquierda.
Ejemplo:
- En el ejemplo del nmero de hijos Ap es igual a

indicando una ligera asimetra a la derecha en la distribucin de frecuencias correspondiente.
5.3.2 Coeficiente de Asimetra de Fisher
Cuando los datos estn agrupados en una tabla de frecuencias simples o en intervalos, sera ms
fcil calcular el coeficiente de asimetra utilizando la siguiente frmula:

siendo xi las categoras que toma la variable o las marcas de clase.
o
Me x
A
p

=
39 . 0
1 . 3
5 . 3 7 . 4
=

=
p
A
3
1
3
) (
o n
fa x x
A
k
i
i i
f

=

=
Estadstica - Pagina 85
La interpretacin del coeficiente de Fisher es la misma que la del coeficiente de Pearson: si la
distribucin es simtrica vale cero, siendo positivo o negativo cuando exista asimetra a la derecha o
izquierda respectivamente.
Nota: Excel calcula la asimetra utilizando la siguiente frmula, en donde cada dato es comparado
con su promedio, as:

Esta funcin caracteriza el grado de asimetra de una distribucin con respecto a su media. La
asimetra positiva indica una distribucin unilateral que se extiende hacia valores ms positivos. La
asimetra negativa indica una distribucin unilateral que se extiende hacia valores ms negativos.


5.4 Medidas de Curtosis

La curtosis tambin es una medida relacionada con la forma de la distribucin de los datos. La
curtosis representa la elevacin o achatamiento de una distribucin, comparada con la distribucin
normal. Una curtosis positiva indica una distribucin relativamente elevada, mientras que una
curtosis negativa indica una distribucin relativamente plana.

Si la distribucin de los datos es ms elevada que la distribucin normal diremos que es leptocrtica,
si es ms aplanada, diremos que es platicrtica.
Para calcular la curtosis Excel utiliza la siguiente frmula:



En donde n ser el nmero total de datos, xi es cada dato de la distribucin, x es el promedio de
todos los datos y o es la desviacin estndar.




=
|
|
.
|

\
|


=
n
i
i
x x
n n
n
1
3
) 2 )( 1 (
Asimetra de e Coeficient
o
) 3 )( 2 (
) 1 ( 3
) 3 )( 2 )( 1 (
) 1 (
2
1
4

|
|
.
|

\
|


+
=

=
n n
n x x
n n n
n n
Curtosis
n
i
i
o
Estadstica - Pagina 86







5.5 Ejercicios sobre medidas de tendencia central y medidas de variabilidad
1. Cul de las siguientes aseveraciones relacionadas con el promedio de un conjunto de datos es
cierta?
a. La mediana es aquel que se obtiene sumando todos los datos y dividiendo entre el nmero total
de datos.
b. La media se obtiene sumando el valor mayor y el valor menor de los datos y luego dividiendo
entre 2.
c. La moda es aquel dato que ms se repite.
d. La media es el doble de la mediana.
2. Determina la media del conjunto de cinco datos: { 1.5 , 4.2 , 9 , 25 , 16.17 }.
3. Encuentre la mediana del siguiente conjunto de ocho datos {3, 6, 8, 7, 9, 4, 1, 3}
4. Un experimento sobre el tiempo que toma una medicina para hacer efecto resulta en los
siguientes datos (en minutos): { 4, 7, 8, 5, 4, 6, 8, 9, 8, 7, 3 } Cul es el tiempo promedio segn la
mediana?
5. La compaa Acme tiene 8 empleados. La siguiente tabla desglosa los salarios anuales de cada
empleado de la empresa. $16,000 $70,000 $14,000 $10,000 $12,000 $18,000 $12,000 $20,000 (En
miles de pesos) Cul es el salario promedio segn la media aritmtica?
6. La tabla en la figura resume las puntuaciones obtenidas en cinco exmenes. Cul es la
mediana?

Estadstica - Pagina 87
7. El siguiente cuadro muestra la distribucin del ingreso anual (en millones de pesos) que tuvieron
50 empresas:



a. Halle e interprete segn el enunciado
i. Media, mediana y moda.
ii. Desviacin estndar y coeficiente de variabilidad.
b. Estime el porcentaje de empresas con ingresos superiores o iguales a 26 millones de pesos pero
menores que 32 millones.
c. Si los ingresos son menores que $28.300.000 se incrementaron en $2.500.000 y los ingresos
mayores o iguales que $28.300.000 se redujeron en un 30%. Calcule la nueva renta promedio.

8. Una compaa requiere los servicios de un tcnico especializado. De los expedientes
presentados, se han seleccionado 2 candidatos: A y B, los cuales renen los requisitos mnimos
requeridos. Para decidir cual de los 2 se va a contratar, los miembros del Jurado deciden tomar 7
pruebas a cada uno de ellos.
Los resultados se dan a continuacin:

Prueba
1 2 3 4 5 6 7
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40

a. Halle e interprete la media, mediana y moda de los dos candidatos.
b. Estadsticamente Cul de los candidatos debe ser contratado? Fundamente su respuesta.

9. Se toman las medidas de 80 personas las que tienen estatura media de 1.70 m y desviacin
estndar de 3.4 cm. Posteriormente se verific que la media usada tenia 4 cm de menos.
Rectifique los estadgrafos mencionados.

10. Una asistencia social desea saber cul es el ndice de natalidad en 2 barrios de Pereira
para lo que encuest a 10 familias de cada barrio con los siguientes resultados

Marca
de
Clase
18.85 21.55 24.25 26.95 29.65 32.35 35.05
N de Viviendas 3 2 7 7 11 11 9
Estadstica - Pagina 88
A
0 6 1 2 3 1 4 3 6 4
B 3 4 1 4 2 3 1 5 4 3

a. Calcule la media, mediana y moda para cada barrio e interprtelos.
b. Considera Ud. que en el barrio B, el nmero de hijos por familia es ms homogneo que en el
barrio A.

11.El salario promedio en una ciudad es de $ 550.000 con una variancia de $ 360.000. Cuales
sern la nueva media y la nueva variancia si se efectan los siguientes cambios:

a. Se aumenta $100.000 a todos
b. Se aumenta el 15 % de su salario a cada trabajador
c. Si se duplican los sueldos

12. En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desviacin estndar
de 20 puntos
En el curso B los alumnos obtienen una media de 80 y desviacin estndar de 16. Ante un reclamo
se decide subir en 5% ms 5 puntos adicionales a todos los alumnos del curso A, en cambio como
hubo muchas copias en el curso B se decidi disminuir la quinta parte de la calificacin.
Despus de los mencionados ajustes Cul es el puntaje medio de los 50 alumnos?

13. Los ingenieros industriales realizan peridicamente anlisis de medicin de trabajo con el fin de
determinar el tiempo requerido para generar una sola unidad de produccin. En una planta de
procesamiento grande se registr durante 50 das el nmero de horas-obrero totales requeridas por
da para realizar cierta tarea. Los datos son:

128 119 95 97 124 128 142 98 108 120
113 109 124 132 97 138 133 136 120 112
146 128 103 135 114 109 100 111 131 113
124 131 133 131 88 118 116 98 112 138
100 112 111 150 117 122 97 116 92 122

a. Calcule la media, la mediana y la moda del conjunto de datos.
b. Determine el rango, la varianza y la desviacin estndar del conjunto de datos.
c. Construya los intervalos a una, dos y tres desviaciones estndar alrededor de la media y cuente el
nmero de observaciones que caen dentro de cada intervalo. Determine las proporciones
correspondientes. Compare los resultados de la regla emprica. Detecta Usted valores fuera del
intervalo?

14. Un cientfico midi lospesos de varios elefantes en la india y encontr un peso promedio por
elefante de 10800 kg con una varianza igual a 338724 kg2 . Tambin midi el peso de las ratas y
encontr una media de 476 g y una varianza de 7569 g2 . Compare la variabilidad de los pesos de
estos animales. cul peso es ms homogneo? Explique.

Estadstica - Pagina 89
15. Los precios promedios mensuales por kilogramo de tomate de alio en el ao 2001 y 2002
fueron los siguientes:

ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
2001 950 1100 1080 990 1100 1000 995 1060 1040 1150 1000 1000
2002 1010 1250 900 1450 1300 1200 980 960 920 880 960 1200

Compare los conjuntos de datos e interprete:
a. Usando las medias y las medianas.
b. Usando las varianzas y las desviaciones estndar.
c. Usando los coeficientes de variacin.

Você também pode gostar