Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTADISTICA DESCRIPTIVA
GUÍA DE PRÁCTICA Nº 3: MEDIDAS DE TENDENCIA CENTRAL, MEDIDAS DE DISPERSION
Y MEDIDAS DE POSICIÓN
Profesora: Luisa Urure Tejada
1. Medidas de tendencia Central: Promedios
1.1. Moda
Datos no agrupados: Mo= valor que más veces se repite.
Datos agrupados:
Es el valor que más se repite o aquel que tiene la mayor frecuencia.
d1 donde
M o LMo A f i f i 1
d1 hi hi 1 M o LMo A
d1 d 2
f i f i 1 f i f i 1
d 2 hi hi 1
1.2. Mediana
Datos no agrupados:
1. Se ordenan los datos en forma creciente.
2. Luego, se ubica el valor central Me.
Si n es impar, Me = valor central de los datos.
Si n es par, Me = semisuma de los dos valores centrales.
Datos agrupados
Es el valor central de un conjunto de datos ordenados, de tal manera que por debajo de éste número se encuentra
el 50% de las menores observaciones y por encima de él está el 50% de las observaciones mayores.
Datos agrupados
n 0.5 H i 1
Fi 1 M ed Li A
M ed Li 2 A
h
fi i
1.3. Media
La media o promedio, es el cociente de la suma de los valores observados de la variable en estudio y el número
de observaciones.
f i fx i i x hi xi
x i 1
x i 1 i 1
n n
1
INGENIERIA INDUSTRIAL
Ejemplo: Uno de los grandes almacenes dispone de un estacionamiento para sus clientes. La siguiente tabla
muestra el número de horas que permanecen en el estacionamiento una serie de carros
[0.2[ 7
[2.4[ 8
[4,6[ 14
[6.8[ 10
[8,10] 11
Total 50
2. Medidas de posición
2.1. Cuantiles
Si una serie de datos se coloca en orden de magnitud, los cuantiles serán los valores de la variable que dividen a
la distribución de los datos en 2, 4, 10 y 100 partes iguales.
Cuantiles para datos no agrupados
2
INGENIERIA INDUSTRIAL
i (n 1)
k
100
- Si k es un número entero, el percentil Pi es el valor en la posición k.
- Si k no es un número entero, el percentil Pi se calcula con la siguiente formula.
Pi Li parte decimal ( Ld Li )
donde:
Li : Valor del dato ubicado en la posición k (parte entera)
Ld : Valor del dato inmediato superior a Li
Para el cálculo de los decirles y cuartiles se puede encontrar el valor de los percentiles
equivalentes.
2.2. Cuartiles
Dividen a la serie de datos en cuatro partes iguales. Se les identifica con Q1, Q2, Q3.
j
a. Se calcula la posición del cuartil Qi mediante ( n)
4
b. Observando las frecuencias acumuladas Fi se encuentra el intervalo que contiene al cuartil.
c. Se aplica la siguiente fórmula:
j
(n) Fi 1
Qj/4 Li 4 A
fi
Donde:
Li: Límite inferior del intervalo que contiene al cuartil.
A: Amplitud del intervalo que contiene al cuartil.
Fi 1 : Frecuencia absoluta acumulada del intervalo inmediatamente anterior al intervalo
que contiene al cuartil.
3
INGENIERIA INDUSTRIAL
j
a. Se calcula la posición del decil Di mediante ( n)
10
b. Observando las frecuencias acumuladas Fi se encuentra el intervalo que contiene al decil.
c. Se aplica la siguiente fórmula:
j
(n) Fi 1
D j / 10 Li 10 A
fi
2.4. Percentiles
Son aquellos valores que dividen a la muestra en 100 partes iguales.
4
INGENIERIA INDUSTRIAL
2 2
n _
k
_
i 1
xi x
fi X i x
s s i 1
n 1 n
Ejemplo: Una empresa cuyo funcionamiento se da en dos edificios, desea informarse acerca del consumo mensual de
electricidad de cada uno de los edificios para tomar algunas medidas para reducir gastos. Se tienen los siguientes datos
respecto del consumo de electricidad de cada uno de los edificios.
Edificio 1:
Consumo en soles Departamentos
[60,70[ 2
[70,80[ 4
[80,90[ 6
[90,100[ 8
[100,110[ 2
88, 92, 106, 110, 93, 104, 95, 97, 98, 120
5
INGENIERIA INDUSTRIAL
4.2. Curtosis
Es la medida de deformación vertical de una distribución de frecuencias, es decir, la medida de apuntamiento o
achatamiento de una distribución. Mide la mayor o menor concentración de datos alrededor de la media, pero se
aplica sólo si la distribución es simétrica
Interpretación de laCurtosis
P P
K 75 25 0.5 Si K = 0: mesocúrtica.
P90 P10 Si K tiende a 0.5: leptocúrtica.
Si K tiende a –0.5: platicúrtica
EJERCICIOS
1. En el siguiente conjunto de números, se proporcionan los pesos (redondeados a la libra más próxima) de
los bebes nacidos durante un cierto intervalo de tiempo en un hospital: 4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7,
6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
a. Calcular las medidas de tendencia central y cuál es la más representativa.
b. Calcular las medidas de dispersión.
c. ¿Es esta una distribución sesgada? ¿De ser así en qué dirección?
d. Encontrar el percentil 34, el decil 7 y hacer el diagrama de cajas e interpretar los resultados.
2. En un examen tomado a tres secciones de un curso de estadística de 91 alumnos, el puntaje medio general
fue de 69,3. Los puntajes medios de las secciones 1 y 2 fueron 70,4 y 64,2 respectivamente. Se perdieron
los archivos con las notas de la sección 3 pero los ayudantes recuerdan que las secciones 1 y 2 tenían
exactamente el mismo número de alumnos, mientras que el ayudante de la sección 3 menciona que se
sección tenía 5 estudiantes menos que la uno ¿Cuál es el promedio de las notas de la sección 3?
3. A partir del siguiente cuadro, calcule la media aritmética si, f3 2 f1 2 y 3h3 2h2 6h5
I fi xifi
[4 - [ 70
[ - 22[
450
6
INGENIERIA INDUSTRIAL
4. La varianza de los sueldos de los trabajadores de una empresa es de S/20. La empresa decide incrementar
en 10% el sueldo de cada trabajador, luego descontarles S/50 a cada uno. Halle la media y la varianza de
los nuevos sueldos.
5. Las autoridades sanitarias de un municipio están interesadas en evaluar la calidad del agua para consumo
en términos de colonias de bacterias tróficas, en un acuífero próximo a la ciudad. Se consideran dos zonas
diferentes del acuífero y se obtienen los siguientes resultados (número de colonias por 1000 mm de agua):
Zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209
Zona 2: 158 161 143 174 220 156 156 198 161 188 139 147 116
Se pide determinar ¿en qué zona los datos de colonias de bacterias tróficas son más homogéneos?
Justifique su respuesta utilizando un coeficiente estadístico adecuado.
6. El tiempo X, en minutos de 40 operaciones en una agencia bancaria tiene una media igual a 10 y una
desviación estándar igual a 4. El precio, en soles, depende del tiempo de duración de la operación. La
relación entre el precio y el tiempo está dada por la ecuación: P(x) = 2.1+5.8x+50x2. Encontrar el precio
promedio de las 40 operaciones
7. El coeficiente de variación del ingreso en una empresa es igual a 0.1. La empresa da un aumento general
del 100% y adicionalmente una bonificación de 150 nuevos soles a cada trabajador. Si el coeficiente de
variación del ingreso después de los aumentos era igual a 0.08.
a. Calcular el valor de la media y de la desviación estándar de los ingresos, antes.
b. Calcular el valor de la media y de la desviación estándar de los ingresos, después de los aumentos.
8. La siguiente tabla se refiere a los tiempos (en minutos) que permanecieron en la cafetería 80 alumnos.
Tiempo (min.) x̂ i fi hi pi Fi Hi Pi
10 , 4
, 0.15
, 30
40 , 0.75
, 90
,
Totales
9. Los sueldos en dólares de los empleados de dos empresas A y B se dan en la siguiente tabla de
distribución:
Sueldos [50,90[ [90,130[ [130,170[ [170,210[ [210,250]
Empresa A 10 14 16 60 22
7
INGENIERIA INDUSTRIAL
Empresa B 28 82 16 13 13
a. Calcular las medidas de tendencia central de las dos empresas, ¿en promedio cual de las dos tienen
mayor ingreso?
b. Calcule la asimetría de las distribuciones A y B.
c. ¿En qué empresa los sueldos son más homogéneos?
d. Si un empleado de A y otro de B ganan cada uno $130, ¿Quién de ellos está mejor ubicado en su
centro de trabajo?.
10. Una muestra de 20 obreros de producción de una pequeña compañía, ganaron los siguientes salarios en
una semana determinada, redondeados al dólar más próximo y dispuesto en forma ascendente: $140, $
140, $ 140, $ 140, $ 140, $ 140, $ 140, $ 140, $155, $155, $165, $165, $180, $180, $190, $200, $205,
$225, $230, $240.
a. Calcular las medidas de tendencia central de este grupo de salarios.
b. Calcular las medidas de dispersión de este grupo de salarios.
c. Calcula e interpreta la asimetría y la curtosis de la distribución.
d. Elaborar un diagrama de cajas de este grupo de salarios e interpretar los resultados.
11. Un complejo industrial está formado por 3 fábricas. Se tiene los siguientes datos respecto al consumo
mensual de electricidad en cada una de las tres fábricas.
Fábrica 1: Tiene 9 talleres cuyos consumos en soles son: 88, 92, 106, 110, 93, 102, 91, 94, 80.
Fábrica 2: Tiene 12 talleres y los consumos se distribuyen en una distribución de frecuencias simétrica,
cuyo consumo más frecuente representa un costo de 100 soles y una varianza de 64 soles
Fábrica 3: Los consumos en soles se dan en la siguiente tabla.
Consumos en soles Talleres
1
62, 72
2
72, 82
4
82, 92
3
92, 102
a. ¿Cuál de las tres fábricas tiene menor consumo de electricidad?
b. ¿Cuál es el consumo promedio de todo el complejo industrial?
c. ¿En cuál de las fábricas los consumos de electricidad están más dispersos?
d. Si un taller de la fábrica 1 consume 91 soles en electricidad en un mes, otro taller de la fábrica 2
consume 96 soles y un taller de fábrica 3, 70 soles ¿Cuál de los tres talleres tiene mayor consumo de
electricidad en soles?
e. Hallar el diagrama de cajas de la fábrica 1 y la fábrica 3.
f. Analizar la asimetría de las tres fábricas e interpretar los resultados.
12. Se tomaron medidas del contenido en cobre de 20 modelajes de bronce, obteniéndose: 790,4 800,6
804,6 774,7 801,3 794,7 824,5 798,1 796,7 805,4 799,3 784,4 802,9 801,9 797,1 788,1
812,9 810,2 802,4 815,3
a. Hallar la media aritmética, la desviación típica, la mediana y los cuartiles.
8
INGENIERIA INDUSTRIAL
A B C
20 5 40-50 7 20-30 9
25 12 50-60 15 30-40 17
30 25 60-70 12 40-50 12
35 30 70-80 16 50-60 6
¿Cuál de los grupos es más homogéneo con respecto a sus pesos? ¿por qué?
15. Una empresa A ha cotizado en bolsa a una media anual de 750 euros, con una desviación típica de valor
80. Otra empresa B durante el mismo periodo lo ha hecho con una media anual de 1025 y una desviación
típica de 125.
a) ¿En qué empresa se presenta mayor variabilidad en la cotización?
b) Un inversor compró ese año acciones de la empresa A a una cotización de 758 euros y de la empresa
B a 1035. ¿En cuál de las dos empresas fue más interesante invertir?
16. El costo de producción X de una muestra de n datos, (n>4), de cierto tipo de objeto tiene una varianza de
$40. Se sabe que la suma de los datos es 40 y la suma de los cuadrados es 560. Si su venta en dólares Y es
el costo de producción X más el 20% de este, y con un cargo fijo de $9 .
a. Calcular el valor de la media del costo de producción.
b. Calcular el valor de la media y la varianza de la venta de la muestra.
17. Una empresa cuyo funcionamiento se da en dos edificios, desea informarse acerca del consumo mensual
de electricidad de cada uno de los edificios para tomar algunas medidas para reducir gastos. Se tienen los
siguientes datos respecto del consumo de electricidad de cada uno de los edificios.
Edificio 1:
Consumo en soles Departamentos
9
INGENIERIA INDUSTRIAL
[60,70[ 2
[70,80[ 4
[80,90[ 6
[90,100[ 8
[100,110[ 2
Edificio 2: tiene 10 departamentos cuyos consumos en soles son:
88, 92, 106, 110, 93, 104, 95, 97, 98, 120
c. ¿Cuál es el consumo promedio total de los dos edificios?
d. Usando medidas estadísticas compare la variabilidad en el consumo de electricidad de los edificios.
e. Determine el coeficiente de asimetría el edificio 1 e intérprete su resultado.
f. Diga qué tipo de distribución de frecuencias conforma el consumo de electricidad en el edificio 1
según la deformación vertical.
g. Realice un diagrama de cajas para la distribución de frecuencias de consumo en el edificio 1 e
interprete.
18. En la bodega de los hermanos Zúñiga se tomaron muestras de la producción de pisco (litros) de 50 días,
estos arrojaron valores representados en el siguiente Histograma. En el eje X se tiene la marca de clase y
en el eje Y las frecuencias absolutas. A partir de la información, proporcione la tabla que dio origen al
presente grafico. Calcule las medidas de tendencia central. Calcules las medidas de variabilidad. Calcule
las siguientes medidas de posición: Q1, P90; D7. Interprete los resultados. ¿Qué porcentaje de
trabajadores faltan más de dos veces la media?
12
10
8
6
4
2
0
97,3 99,3 101,3 103,3 105,3 107,3 109,3
19. La siguiente informaciónEn muestra las puntuaciones de 80 estudiantes en una prueba de estadística.
Observe cuidadosamente y luego conteste a las preguntas que se formulan.
10-20
20-30
30-40
40-50
50-60
60-70
0-10
10
INGENIERIA INDUSTRIAL
Puntuaciones
a. Calcule la media, moda y mediana de la muestra.
b. Calcule la varianza y desviación estándar de la muestra. Interprete a la variable
20. A partir de la gráfica estadística responda lo siguiente.
22. En una empresa de productos intermedios se realizan evaluaciones periódicas de la calidad de las
aleaciones que producen, en este caso se esta evaluando la resistencia a la tensión (en psi) de muestras de
aleaciones de aluminio-litio. El siguiente gráfico muestra lo encontrado:
Las marcas de clase son 90, 110, 130, 150, 170, 190, 210. Ubique los límites y comente la tabla. Calcules
las medidas de variabilidad. Calcule las siguientes medidas de posición: C3, P68; D3. Desarrolle un
grafico escalonado.
7 5
6 2
5 8
4 18
3 7
11
2 3
1 5
0 5 10 15 20
INGENIERIA INDUSTRIAL
Sueldos fi
[ 900 , 1000 [ 1
[ 1000 , 1100 [ 5
[ 1100 , 1200 [ 10
[ 1200 , 1300 [ 6
[ 1300 , 1400 ] 3
Total 25
Empresa B: 800, 900, 1000, 800, 1200, 1200, 1500, 1450, 1300, 1750, 1050, 1400, 1600, 1800, 1700.
12