Você está na página 1de 26

UNIVERSIDAD NACIONAL DE CAJAMARCA SEDE – JAÉN

FACULTAD DE INGENIERIA

ESCUELA ACADÉMICO PROFESIONAL DE INGENIERIA CIVIL

TEMA : Solucion de Ejercicios.

ASIGNATURA : Estadística General.

INTEGRANTE : Jhazmine Paz Benites

DOCENTE : Ing. Indira Marín Valderrama

JAÉN - PERÚ
2017
RESOLUCIÓN DE ESTADÍSTICA GENERAL

1. El salario medio por semana en miles de pesetas de 160 obreros se distribuye de la siguiente forma.

Intervalos fi
4 - 8 3
8 - 12 12
12- 16 40
16- 20 47
20- 24 32
24- 28 13
28- 32 9
32- 36 4
TOTAL 160

Se pide:
a. Calcular la media aritmética.
b. Realizar una redistribución en la que los intervalos tengan una amplitud de 8, y con los nuevos
intervalos, calcular la media aritmética. Comparar los resultados obtenidos con los del apartado a.

Solución

a. Calcular la media aritmética.

Intervalos 𝑓𝑖 𝑥𝑖 𝑥𝑖 ∗ 𝑓𝑖
4 - 8 3 6 18
8 - 12 12 10 120
12- 16 40 14 560
16- 20 47 18 846
20- 24 32 22 704
24- 28 13 26 338
28- 32 9 30 270
32- 36 4 34 136
TOTAL 160 -

Entonces la media aritmética para este caso, que son datos agrupados seria:

∑𝑛𝑖=0 𝑥𝑖 ∗ 𝑓𝑖 18 + 120 + 560 + 846 + 704 + 338 + 270 + 136 2992


𝑥̅ = = = = 18.7
𝑛 160 160

∴ El promedio por semana en miles de pesetas de 160 obreros es de 18.7.


b. Realizar una redistribución en la que los intervalos tengan una amplitud de 8, y con los nuevos intervalos,
calcular la media aritmética. Comparar los resultados obtenidos con los del apartado a.

Intervalos 𝑓𝑖 𝑥𝑖 𝑥𝑖 ∗ 𝑓𝑖
4 - 12 15 8 120
12 - 20 87 16 1392
20- 28 45 24 1080
28 – 36 13 32 416
TOTAL 160 - -

La media aritmética:

∑ni=0 xi ∗ fi 120 + 1392 + 1080 + 416 3008


x̅ = = = = 18.8
n 160 160

∴ El promedio por semana en miles de pesetas de 160 obreros es de 18.8.

Entonces al comparar, observamos que hay una variación de 0.1, algo que no es muy notable para
cambiar de una manera drástica los resultados.
2. Dada la siguiente tabla estadística:

Número de horas de estudio 𝑥𝑖 1 2 3 4 5


Número de alumnos 𝑓𝑖 5 15 20 8 2

a. Hallar las medidas de tendencia central.

Solución

Calculando la media o promedio.

𝑛 = 50
Como son datos sin agrupar procederemos a usar la siguiente formula:

∑𝑛𝑖=1 𝑥𝑖 1 + 2 + 3 + 4 + 5 15
𝑥̅ = = = = 0.3
𝑛 50 50

∴ El promedio de horas que un estudiante emplea a estudiar es 0.3.

- Calculando la mediana.

Como son datos sin agrupar y “n” es impar, se ordena y se localiza en dato de en medio.

1–2–3–4–5

ME

- Calculando la moda.

Como ya sabemos son datos sin agrupar, entonces dirigimos nuestra atención a la tabla principal del
problema, observando cuál es la mayor cantidad de personas que estudia cierto determinado número
de horas.

∴ La moda es de tres horas, es decir que la mayor cantidad de personas (que viene hacer veinte)
estudia 3 horas.

3. La distribución de las acciones de una determinada sociedad viene dada de la siguiente forma:

Número de acciones Número de accionistas


0-20 10
20-28 32
28-32 50
32-48 8

Se pide calcular los estadísticos descriptivos conocidos. Interprete

Solución

N° de acciones N° de accionistas 𝑋𝑖 𝑓𝑖 × 𝑋𝑖 𝐹
0-20 10 10 100 10
20-28 32 24 768 42
28-32 50 30 1500 92
32-48 8 40 320 100
TOTAL 100 - - -

- Media o promedio aritmético.


∑𝑘𝑖=1 𝑥𝑖 × 𝑓𝑖 100 + 768 + 1500 + 320 2688
𝑥̅ = = = = 26.88
𝑛 100 100
∴ El promedio de acciones de determinada sociedad es de 26.88.

- Mediana.

Como son para datos agrupados; entonces:

𝑛
−𝑓𝑖−1 𝑛 100
𝑀𝑒 = 𝐿𝑖 + [ 2 ] × 𝐴; Como → = = 50
𝑓𝑖 2 2

100⁄ − 32 50 − 32 18
𝑀𝑒 = 28 + [ 2 ] × 𝐴 = 28 + [ ] × 4 = 28 + ( ) 4 = 29.44
50 50 50

∴ La mitad de la muestra tiene acciones desde 0 a 29.44.

- Moda.

Como es para datos agrupados; entonces:

𝑑1
𝑀𝑜 = 𝐿𝑖 + [ ]×𝐴
𝑑1 + 𝑑2

(50 − 32) 18
𝑀𝑜 = 28 + [ ] × 12 = 28 + [ ] × 12 =
(50 − 32) + (50 − 8) 18 + 42

18 18
= 28 + [ ] × 12 = 28 + = 31.6
60 5

∴ La mayoría de los accionistas tienen un número de acciones de 31.6.

- Cuartiles.

Se usa la siguiente fórmula para encontrar los 𝑄1 , 𝑄2 𝑦 𝑄3 :

𝑗𝑛⁄
𝑄𝑗 = 𝐿𝑖 + [ 4 − 𝐹𝑖−1 ] × 𝐴
𝑓𝑖

𝑗𝑛
Entonces, se procede a calcular los “ ” para cuando 𝑗 = 1,2 𝑦 3
4

𝑗𝑛 100×1
 = = 25
4 4

𝑗𝑛 100×2
 = = 50
4 4

𝑗𝑛 100×3
 = = 75
4 4

Ya encontrando estos datos procedemos:

 Para 𝑸𝟏 :

25 − 10 15
𝑄1 = 20 + [ ] × 8 = 20 + ( ) × 8 = 23.75
32 32

∴ El 25% de los accionistas tienes acciones comprendidas entre 0 a 23.73.

 Para 𝑸𝟐 :
50 − 42 8
𝑄2 = 28 + [ ] × 4 = 28 + ( ) × 4 = 28.64
50 50

∴ El 50% de los accionistas tienes acciones comprendidas entre 0 a 28.64.

 Para 𝑄3 :

75 − 42 33
𝑄3 = 28 + [ ] × 4 = 28 + ( ) × 4 = 30.64
50 50

∴ El 75% de los accionistas tienes acciones comprendidas entre 0 a 30.64.

- Deciles.

Se usa la siguiente fórmula para encontrar los 𝑑1 , 𝑑2 , 𝑑3 … , 𝑑9 :

𝑗𝑛⁄
𝑑𝑗 = 𝐿𝑖 + [ 10 − 𝐹𝑖−1 ] × 𝐴
𝑓𝑖

𝑗𝑛
Entonces, se procede a calcular los “ ” para cuando 𝑗 = 1,2,3, … ,9.
10

𝑗𝑛 100×1 𝑗𝑛 100×6
 = = 10  = = 60
10 10 10 10
𝑗𝑛 100×2 𝑗𝑛 100×7
 = = 20  = = 70
10 10 10 10
𝑗𝑛 100×3 𝑗𝑛 100×8
 = = 30  = = 80
10 10 10 10
𝑗𝑛 100×4 𝑗𝑛 100×9
 = = 40  = = 90
10 10 10 10
𝑗𝑛 100×5
 = = 50
10 10

Ya encontrando estos datos procedemos:

 Para 𝒅𝟏 :

10 − 0
𝑑1 = 0 + [ ] × 20 = 20
10

∴ El 10% de los accionistas tienes acciones comprendidas entre 0 a 20.

 Para 𝒅𝟐 :

20 − 10
𝑑2 = 20 + [ ] × 8 = 22.5
32

∴ El 20% de los accionistas tienes acciones comprendidas entre 0 a 22.5.

 Para 𝒅𝟑 :

30 − 10
𝑑3 = 20 + [ ] × 8 = 25
32

∴ El 30% de los accionistas tienes acciones comprendidas entre 0 a 25.

 Para 𝒅𝟒 :

40 − 10
𝑑4 = 20 + [ ] × 8 = 27.5
32

∴ El 40% de los accionistas tienes acciones comprendidas entre 0 a 27.5.


 Para 𝒅𝟓 :

50 − 42
𝑑5 = 28 + [ ] × 4 = 28.64
50

∴ El 50% de los accionistas tienes acciones comprendidas entre 0 a 28.64.

 Para 𝒅𝟔 :

60 − 42
𝑑6 = 28 + [ ] × 4 = 29.44
50

∴ El 60% de los accionistas tienes acciones comprendidas entre 0 a 29.44.

 Para 𝒅𝟕 :

70 − 42
𝑑7 = 28 + [ ] × 4 = 30.24
50

∴ El 70% de los accionistas tienes acciones comprendidas entre 0 a 30.24.

 Para 𝒅𝟖 :

80 − 42
𝑑8 = 28 + [ ] × 4 = 31.04
50

∴ El 80% de los accionistas tienes acciones comprendidas entre 0 a 31.04.

 Para 𝒅𝟗 :

09 − 42
𝑑9 = 28 + [ ] × 4 = 31.84
50

∴ El 90% de los accionistas tienes acciones comprendidas entre 0 a 31.84.

𝑛𝑗
DATO: Los percentiles se calculan similarmente con la formula, solamente que cambia en “ ”.
100

- Desviación estándar.

Como n=100; entonces 𝑛 ≥ 30 se procede a calcular por la siguiente fórmula:

∑𝑘 (𝑥𝑖 − 𝑥̿ )2 × 𝑓𝑖
𝑠 = √ 𝑖=1
𝑛

Entonces al reemplazar valores tendremos:

2849.344 + 265.4208 + 486.72 + 1377.0752


𝑠=√
100

4978.56
𝑠=√ = √49.7856 = 7.056
100

∴ INTERPRETACIÓN: La desviación estándar de 7.056 con respecto a la media.


- Coeficiente de variación.

Se aplicará la siguiente fórmula:

𝑠
𝑐𝑣 = × 100
𝑥̅

Entonces procedemos a reemplazar valores:

7.056
𝑐𝑣 = × 100 = 26.25%
26.88

INTERPRETACIÓN: la media tiene baja representatividad.

- Asimetría.

a) Asimetría por cuartiles (As).

(𝑄3 − 𝑄2 ) − (𝑄2 − 𝑄1 )
𝐴𝑠 =
(𝑄3 − 𝑄1 )

(30.64 − 28.64) − (28.64 − 23.75)


𝐴𝑠 =
(30.64 − 23.75)

(2) − (4.89) −2.89


𝐴𝑠 = = = −0.419
(6.89) 6.89

INTERPRETACIÓN: Asimétrica a la izquierda.

b) Asimetría por deciles (As).

(𝑑9 − 𝑑5 ) − (𝑑5 − 𝑑1 )
𝐴𝑠 =
(𝑑9 − 𝑑1 )

(31.84 − 28.64) − (28.64 − 20)


𝐴𝑠 =
(31.84 − 20)

(3.2) − (8.64) −5.44


𝐴𝑠 = = = −0.459
(11.84) 11.84

INTERPRETACIÓN: asimétrica a la izquierda.

c) Primer coeficiente de Pearson (As).

𝑥̅ − 𝑀𝑜
𝐴𝑠 =
𝑠

26.88 − 31.6 −4.72


𝐴𝑠 = = = −669
7.056 7.056

INTERPRETACIÓN: asimetría a la izquierda.

d) Segundo coeficiente de Pearson (As).

3(𝑥̅ − 𝑀𝑒)
𝐴𝑠 =
𝑠

3(26.88 − 29.44) 3(−2.56)


𝐴𝑠 = = = −1.088
7.056 7.056
INTERPRETACIÓN: asimetría a la izquierda.

e) Tercer momento (As).

∑(𝑥𝑖 − 𝑥̅ )3 ∗ 𝑓𝑖
𝐴𝑠 =
𝑛 ∙ 𝑠3

−48096.92672 − 764.411904 + 1518.5664 + 18067.22662


𝐴𝑠 =
100 ∙ 7.0563

−29275.54564
𝐴𝑠 = = −0.833
100 ∙ 7.0563

INTERPRETACIÓN: asimetría de la izquierda

- Kurtosis.

∑(𝑥𝑖 − 𝑥̅ )4 ∗ 𝑓𝑖
𝑘= −3
𝑛 ∙ 𝑠4

811876.123 + 2201.506284 + 4737.927168 + 237042.0133


𝑘= −3
100 ∙ 7.0564

1055857.57
𝑘= − 3 = 1.259621883
100 ∙ 7.0564

INTERPRETACIÓN: leprocurtica.

4. En una zona de Jaén, la superficie de las viviendas sigue la siguiente distribución:

Superficie Frecuencia relativa


(𝑚2 ) (%)
50-60 20
60-70 25
70-80 15
80-100 25
100-120 15

Calcular:

a) La superficie media por vivienda.


b) Los tipos de vivienda que dividen la distribución en cuatro partes iguales.
c) El tipo de vivienda más frecuente.
d) La superficie de vivienda que no es superada por el 36% de las viviendas.

Solución

Superficie (𝑚2 ) ℎ𝑖 % 𝑥𝑖 𝐻𝑖 % 𝑓𝑖 𝐹𝑖
50 -60 20 55 20 0.20 n 0.20 n
60 -70 25 65 45 0.25 n 0.45 n
70 -80 15 75 60 0.15 n 0.60 n
80 -100 25 90 85 0.25 n 0.85 n
100-120 15 110 100 0.15 n 1n
TOTAL - - - n

a) La superficie media por vivienda.

∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖 11𝑛 + 16.25𝑛 + 11.25𝑛 + 22.5𝑛 + 16.5𝑛 77.5𝑛


𝑥̅ = = = = 77.5 𝑚2
𝑛 𝑛 𝑛
∴ La superficie promedio por vivienda es de 77.5 𝑚2 .
b) Los tipos de vivienda que dividen la distribución en cuatro partes iguales.

𝑛𝑗
Para esto se usaran cuartiles, entonces encontramos “ ”, para j=1, 2,3 y 4.
4

𝑛𝑗 1×𝑛 𝑛𝑗 3×𝑛
 = = 0.25𝑛  = = 0.75𝑛
4 4 4 4
𝑛𝑗 2×𝑛 𝑛𝑗 4×𝑛
 = = 0.50𝑛  = = 1𝑛
4 4 4 4

Entonces:

 Para 𝑄1 :

0.25𝑛 − 0.20𝑛 0.05𝑛


𝑄1 = 60 + [ ] × 10 = 60 + ( ) × 10 = 62 𝑚2
0.25𝑛 0.25

∴ El 25% de viviendas tienen una superficie de 50 0 62 𝑚2 .

 Para 𝑄2 :

0.50𝑛 − 0.45𝑛 0.05𝑛


𝑄2 = 70 + [ ] × 10 = 70 + ( ) × 10 = 73.33 𝑚2
0.15𝑛 0.15

∴ El 50% de viviendas tienen una superficie de 50 0 73.33 𝑚2 .

 Para 𝑄3 :

0.75𝑛 − 0.60𝑛 0.15𝑛


𝑄3 = 80 + [ ] × 20 = 80 + ( ) × 20 = 92 𝑚2
0.25𝑛 0.25

∴ El 75% de viviendas tienen una superficie de 50 0 92 𝑚2

 Para 𝑄4 :

𝑄4 = 120 𝑚2

∴ El 100% de viviendas tienen una superficie de 50 0 120 𝑚2 .


c) El tipo de vivienda más frecuente.

Esto significa calcular la moda 𝑀𝑜 , notamos que es bimodal para los intervalos de 60-70 y 80-100 𝑚2 . Para
ello se aplicará la siguiente fórmula:

𝑑1
𝑀𝑜 = 𝐿𝑖 + [ ]×𝐴
𝑑1 + 𝑑2

𝑑1
 𝑀𝑜 = 𝐿𝑖 + [ ]×𝐴
𝑑1 +𝑑2

0.05𝑛
𝑀𝑜 = 60 + [ ] × 10 = 63.33 𝑚2
0.15𝑛

∴ La mayoría de las viviendas tienen una superficie de 63.33 𝑚2 .

𝑑1
 𝑀𝑜 = 𝐿𝑖 + [ ]×𝐴
𝑑1 +𝑑2

0.10𝑛
𝑀𝑜 = 80 + [ ] × 20 = 90 𝑚2
0.20𝑛

∴ La mayoría de las viviendas tienen una superficie de 90 𝑚2 .

d) La superficie de vivienda que no es superada por el 36% de las viviendas.

𝑗𝑛 𝑛×36
Lo calculamos los percentiles: = = 0.36, entonces:
100 100

𝑛𝑗⁄
− 𝐹𝑖=1
𝑝36 = 𝐿𝑖 + [ 100 ]∗𝐴
𝑓𝑖

0.36𝑛 − 0.20𝑛
𝑝36 = 60 + [ ] ∗ 10
0.25𝑛

𝑝36 = 66.4 𝑚2

∴ La superficie que no supera el 36% de viviendas es de 66.4 𝑚2 .

5. El tiempo de espera de 322 pacientes, para ser atendidos en cierto ambulatorio médico, es el que se
muestra en la siguiente tabla:

Tiempo de espera Número de pacientes


(en minutos)
0-5 3
5-10 35
10-15 98
15-20 63
20-25 55
25-30 44
30-35 12
35-40 6
40-45 5
45-50 1

a) Calcula los deciles y los cuartiles 2 y 7.


b) Si consideremos a los pacientes que esperan media hora o más. ¿Qué porcentaje representan del
total?
c) ¿cuántos pacientes esperan entre 7 y 23 minutos? ¿qué porcentaje representa el total?

Solución:
El tiempo de espera de 332 pacientes, para ser atendidos en un cierto ambulatorio médico, es el que se
muestra en la siguiente tabla:

Tiempo de Número de
espera pacientes Fi Xi Xi.fi (Xi-𝑋̅)2 (Xi-𝑋̅)2.fi
(en minutos) (fi)
[0 - 5> 3 3 2.5 7.5 252.4921 757.4763
[5 - 10> 35 38 7.5 262.5 118.5921 1214.2235

[10 - 15> 98 136 12.5 1225 34.6921 3399.8258

[15 - 20> 63 199 17.5 1102.5 0.7921 49.9023


[20 - 25> 55 254 22.5 1237.5 16.8921 929.0655

[25 - 30> 44 298 27.5 1210 82.9921 3651.6524

[30 - 35> 12 310 32.5 390 199.0921 2389.1052


[35 - 40> 6 316 37.5 225 365.1921 2191.1526

[40 – 45> 5 321 42.5 212.5 581.2921 2906.4605

[45 - 50] 1 322 47.5 47.5 847.3921 847.3921


TOTAL 322 - 5920

Primero encontramos el promedio:

𝑋̅=5920/322

𝑋̅=18.39

El promedio es 18.39.

a. Para determinar los cuartiles utilizamos la siguiente formula:

𝑗𝑛
− 𝐹𝑖−1
𝑄𝑗 = 𝐿𝑖 + [ 4 ] 𝑥𝐴
𝑓𝑖
Donde:

𝑄𝑗 : Cuartil j, j=1; 2; 3
𝐿𝑖 : Límite inferior de la clase del cuartil.
𝑛: numero de datos de la muestra
𝐹𝑖−1 : Frecuencia absoluta acumulada anterior a la clase de cuartil.
𝑓𝑖: Frecuencia absoluta simple de la clase del cuartil.
𝐴: Amplitud de la clase del cuartil.

 Entonces para el cuartil 1 tenemos lo siguiente:

𝑗𝑛 1𝑥322
= = 80.5
4 4

80.5 − 38
𝑄1 = 10 + [ ] 𝑥5
98

Q1 = 12.17

Interpretación:
El 25% de los pacientes esperan 12.17 minutos

 Entonces para el cuartil 2 tenemos lo siguiente:


𝑗𝑛 2𝑥322
= = 161
4 4

161 − 136
𝑄2 = 15 + [ ] 𝑥5
63

Q 2 = 16.98

Interpretación:
El 50% de los pacientes esperan 16.98 minutos.

 Entonces para el cuartil 3 tenemos lo siguiente:

𝑗𝑛 3𝑥322
= = 241.5
4 4

241.5 − 199
𝑄3 = 20 + [ ] 𝑥5
55

Q 3 = 23.86

Interpretación:
El 75% de los pacientes esperan 23.86 minutos

Ahora para los deciles 2 y 7 usamos la siguiente formula:


𝑗𝑛
− 𝐹𝑖−1
𝑃𝑗 = 𝐿𝑖 + [ 10 ] 𝑥𝐴
𝑓𝑖

 Entonces para el decil 2 tenemos lo siguiente:


𝑗𝑛 2𝑥322
= = 64.4
10 10

64.4 − 38
𝐷2 = 10 + [ ] 𝑥5
98

D2 = 11.35

 Entonces para el decil 7 tenemos lo siguiente:

𝑗𝑛 7𝑥322
= = 225.4
10 10

225.4 − 199
𝐷7 = 20 + [ ] 𝑥5
55

D7 = 22.4
b. Los pacientes que esperan media hora o más y el porcentaje que representan:

 Entonces para esto solo sumamos la cantidad de personas que esperan desde 30 minutos a más:

12+6+5+1=24

24
𝑥100 = 7.45 %
322

Interpretación:
El número de personas que esperan 30 minutos a más son 24, que representan el 7.45 % del total.
c. ¿Cuántos pacientes esperan entre 7 y 23 minutos? ¿Qué porcentaje representan del total?

Para poder saber la cantidad de pacientes que esperan entre 7 y 23 minutos usamos lo siguiente:
Pacientes que esperan de 7 a 10 minutos:

 10−5
35
=
10−7
𝑋

 5𝑋 = 35(3)

 𝑋 = 21

Pacientes que esperan más de 24 minutos

25−20 25−24
=
55 𝑋

 5𝑋 = 55(1)

 𝑋 = 11

Ahora sumamos la cantidad de pacientes que esperan entre 7 y 10 minutos, más los que esperan entre 10
y 15 minutos, más los que esperan entre 15 y 20 minutos, más los que esperan entre 20 y 25 minutos y a
éstos le restamos la cantidad de pacientes que esperan entre 24 y 25 minutos.

ES DECIR:

𝑋 = 21 + 98 + 63 + 55 − 11
𝑋 = 226

Ahora para saber el porcentaje que representan:

226
𝑋100% = 70.186%
322
Interpretación:
Los pacientes que esperan entre 7 y 23 minutos son 226, lo cual representan el 70.19% del total de
pacientes.

6. Los salarios por hora de los obreros de dos empresas A y B, son los que se dan en la siguiente
tabla:

Salarios Empresa A Empresa B


[550, 750⟩ 10 7
[750, 1050⟩ 32 20
[1050, 1550⟩ 57 37
[1550, 2550] 54 78

Determinar:
a. El salario medio de las dos empresas.
b. El salario más frecuente de las dos empresas.
c. ¿cuál es el salario que no es superado por el 50% en las dos empresas?
d. ¿cuál de las dos empresas tiene mayor homogeneidad salarial? ¿por qué?

Solución:

a. Para encontrar el salario de cada una de las empresas:

Para la empresa “A”

Salarios Empresa A Fi Xi Xi.fi


fi
550 – 750 10 10 650 6500
750 – 1050 32 42 900 28800
1050 – 1550 57 99 1300 74100
1550 – 2550 54 153 2050 110700
TOTAL 153 4900 220100

𝟐𝟐𝟎𝟏𝟎𝟎
̅=
𝑿
𝟏𝟓𝟑

̅ = 𝟏𝟒𝟑𝟖. 𝟓𝟔
𝑿

Para la empresa “B”


Salarios Empresa B Fi Xi Xi.fi
fi
550 – 750 7 7 650 4550
750 – 1050 20 27 900 18000
1050 – 1550 37 64 1300 4800
1550 – 2550 78 142 2050 159900
TOTAL 142 - 4900 187250

𝟏𝟖𝟕𝟐𝟓𝟎
̅=
𝑿 ̅ = 𝟏𝟑𝟏𝟎. 𝟔𝟔
𝑿
𝟏𝟒𝟐
b. Los salarios más frecuentes de las dos empresas son:

De la empresa “A”:
1300

De la empresa “B”:
2050

Interpretación:
Los salarios más frecuentes de las empresas “A” y “B” son s/ 1300 y 2050 respectivamente.

c. El salario que no es superado por el 50 % en las dos empresas.

Para esto usamos el percentil 50:

𝑗𝑛
− 𝐹𝑖−1
𝑃𝑗 = 𝐿𝑖 + [ 100 ] 𝑥𝐴
𝑓𝑖

 Para la empresa “A”

𝑗𝑛 50𝑥153
= = 76.5
100 100

76.5 − 42
𝑃50 = 1050 + [ ] 𝑥300
54

𝑃50 = 1241.67

Interpretación:
El salario que no es superado por la empresa “A” es de s/ 1241.67

 Para la empresa “B”

𝑗𝑛 50𝑥142
= = 56.8
100 100

56.8 − 27
𝑃50 = 1050 + [ ] 𝑥300
37

𝑃50 = 1291.62
Interpretación:
El salario que no es superado por la empresa “B” es de s/ 1291.62.

d. ¿Cuál de las dos empresas tiene mayor homogeneidad salarial? ¿por qué?

La empresa que tiene mayor homogeneidad salarial es la empresa “A”. Porque tiene un mayor
equilibrio en sus salarios, lo que no sucede lo mismo con la empresa “B”.

7. Un experto de estándares de trabajo observa el tiempo que se requiere para preparar una muestra
de 10 cartas de negocios en una oficina y obtiene los siguientes resultados: 42, 5, 5, 9, 7, 5, 12, 13,
12 y 10 minutos.

Se pide:

a. Determinar la media, la mediana y la moda de esos 10 tiempos.


b. ¿cuál de las tres medidas de posición central calculadas te parece más representativa en este caso?

Solución:

a) La media para datos sin agrupar se usa la siguiente formula


𝑛
∑ (𝑥𝑖)
𝑖=1 42+5+5+9+7+5+12+13+12+10 120
𝑀. 𝐴 = =𝑥= = = 12
𝑛 10 10

Por lo tanto la media aritmética del tiempo que se requiere para preparar una muestra de 10 cartas de
negocio en una oficina es 12

La mediana para datos sin agrupar

5+5+5+7+9+10+12+12+12+13+42
10+9
M.E = = 9.5
2

Por lo tanto la media del tiempo que se requiere para preparar una muestra de 10 cartas de negocio en una
oficina es 9.5

La moda:

Es la variable que tiene mayor frecuencia, como observamos en los datos la variable con mayor
frecuencia es el 5

Por lo tanto la moda del tiempo que se requiere para preparar una muestra de 10 cartas de negocio en una
oficina es 5.

b) ¿Cuál de las 3 medidas de posición central calculadas te parece más representativa en este caso?

La media aritmética porque tiene un valor aproximado y coherente a los demás datos.

8. Los siguientes datos corresponden al número de días de trabajo perdidos por enfermedad durante
el cuarto trimestre del año por los 35 empleados de una empresa:

2 1 0 1 1 3 0
0 2 7 5 0 1 3
0 0 4 1 2 4 0
5 3 0 6 0 4 0
2 6 2 3 0 1 1
Estudiar la forma y la concentración
(asimetría y kurtosis) de la variable.

Solución:

Ordenando los datos para estudiar la forma de asimétrica


# de días fi Fi xi.fi
de trabajo
perdido

0 11 11 O
1 7 18 7
2 5 23 10
3 4 27 12
4 3 30 12
5 2 32 10
6 2 34 12
7 1 35 7
Total 35 - 70
Estudiando la forma asimétrica

Asimetría por cuartiles


(Q3−Q2)−(Q2−Q1)
𝐴𝑠 =
Q3−Q1

Para el empleo de esta fórmula se debe de hallar primero los cuartiles correspondientes usando loa siguiente
formula:
jn
−F(i−1)
Qj = Li + [ 4 ]𝑥 𝐴
fi

Para el primer cuartil:


35 (1)
Jn/4 = = 8.75
4

8.75−0
Q1 = 0 + [ ]𝑥 1 Q(1) = 0.7954
11

Para el segundo cuartil:


35 (2)
Jn/4 = = 17.5
4

17.5−11
Q2 = 1 + [ ]𝑥 1 Q2 = 1.9285
7

Para el tercer cuartil:

Jn/4 = 35(3)/4=26.25
26.25−23
Q(3) = 3 + [ ]𝑋 1 Q(3) = 3 + 0.8125 = 3.8125
4

Remplazando datos:
(Q3−Q2)−(Q2−Q1) (3.8125−1.9185)−(1.9285 −0.7954)
𝐴𝑠 = =
Q3−Q1 3.8125−0.7954

(1.894)−(1.1331) 0.7609
𝐴𝑠 = = = 0.2521
3.0171 3.0171

Interpretación: asimetría por la derecha

Asimetría por deciles


(d9−d5)−(d5−d1)
𝐴𝑠 =
d9−d1

Primeramente hallamos los deciles indicados


jn
−F(i−1)
dj = Li + [10 ]𝑥 𝐴
fi

Para el 1er decil:


j1 35(1)
= =3.5
10 10
3.5 −0
d(1) = 0 + [ ] 𝑥 1 = 0.3181
11

Para el 5to decil:


j5 35 (5)
= = 17.5
10 10

17.5−11
d(5) = 1 + [ ] 𝑥 1 = 1 + 0.9285 = 1.9285
7

Para el 9no decil:


j9 35(9)
= = 31.5
10 10

31.5−30
d(9) = 5 + [ ] 𝑥 1 = 5.75
2

Reemplazando datos:
(5.75−1.9285)−(1.9285−0.3181) (3.8215)−(1.6004)
𝐴𝑠 = = = 0.4088
5.75−0.3181 5.4319

Interpretación: asimetría por la derecha

Estudiando la concentración kurtosis:


∑(xi−M.A)4 (𝑓𝑖)
As = −3
n x 𝑆4

# de días fi Fi xi.fi (xi − M. A)4 (𝑓𝑖) ∑(xi − M. A)2 (𝑓𝑖)


de trabajo
perdido

0 11 11 0 176 44
1 7 18 7 7 7
2 5 23 10 0 0
3 4 27 12 4 4
4 3 30 12 48 12
5 2 32 10 162 18
6 2 34 12 512 32
7 1 35 7 625 25
Total 35 - 70 1531 142

∑(xi)(𝑓𝑖) 70
M. A = = =2
n 35

∑(xi−M.A)2 (𝑓𝑖)
Desviación estándar = 𝑆2 =
n

∑(xi−M.A)2 (𝑓𝑖) 142


𝑆2 = = = 4.0571
n 35

S = 2.0142

Reemplazando los datos en la fórmula de kurtosis


∑(xi−M.A)4 (𝑓𝑖) 142
As = −3 = − 3 = 0.2464-3 = -2.7536
n x 𝑆4 (35)(16.46)

Interpretación: concentración es platicurtica.

9. Un informe de 40 páginas presenta la siguiente distribución de errores mecanografiado.

Errores por página 0 1 2 3 4 5 6


N° de páginas 3 8 9 10 7 2 1

Estudiar la forma y la kurtosis de la variable.

Solución:
Errores de N° de (xi)(𝑓𝑖) (xi − M. A)2 (𝑓𝑖) (xi − M. A)4 (fi)
página xi páginas fi
0 3 0 18.75 117.1875
1 8 8 18 40.5
2 9 18 2.25 o.5625
3 10 30 2.5 0.5625
4 7 28 15.75 40.5
5 2 10 12.5 117.1875
6 1 6 12.25 150.0625
total 40 82 466.56

Estudiando por el método de kurtosis


∑(xi)(𝑓𝑖)
M. A = = 2.5
n

∑(xi−M.A)2 (𝑓𝑖)
𝑆2 =
n

𝑆 2 = 2.05 S = 1.4317

Reemplazando
∑(xi−M.A)4 (𝑓𝑖) 466.56 466.56
As = −3 = −3 = −3
n x 𝑆4 40 x 4.2025 168.1

As = 2.77 − 3 = −0.23

Interpretación: la concentración es platicurtica

10. En una empresa trabajan 20 000 productores, cuyos salarios, según categorías, son:

Salarios (miles de soles) fi


10 - 20 12 000
20 - 40 6 000
40 - 50 1 000
50 - 100 800
100- 200 200

a. ¿Qué parte de la nómina recibe el 60% de los productores peor pagados?


b. ¿Qué parte de la nómina recibe el 5% de los productores mejores pagados?
c. ¿Qué porcentaje de productores reciben el 81.8% de los salarios?
d. ¿Qué porcentaje de productores reciben el 50% de los salarios?

Solución:

Salarios (miles de 𝑓𝑖 𝐹𝑖
soles
10-20 12000 12000
20-40 6000 18000
40-50 1000 19000
50-100 800 19800
100-200 200 20000
20000

a)
𝑗𝑛
− 𝐹𝑖−1 ]
𝑃𝑗 = 𝐿𝑖 + [100 ∗𝐴
𝑓𝑖
12000 − 0]
𝑃60 = 10 + [ ∗ 10
12000
𝑃60 = 20
b)
𝑗𝑛
− 𝐹𝑖−1 ]
𝑃𝑗 = 𝐿𝑖 + [100 ∗𝐴
𝑓𝑖
1000 − 19800]
𝑃5 = 100 + [ ∗ 100
200
𝑃5 = 6
c)
𝑗𝑛
− 𝐹𝑖−1 ]
𝑃𝑗 = 𝐿𝑖 + [100 ∗𝐴
𝑓𝑖
16360 − 12000]
𝑃81.8 = 20 + [ ∗ 20
6000
4360]
𝑃81.8 = 20 + [ ∗ 20
6000
𝑃𝑗 = 5.046
d)
𝑗𝑛
− 𝐹𝑖−1 ]
𝑃𝑗 = 𝐿𝑖 + [100 ∗𝐴
𝑓𝑖
10000 − 0]
𝑃50 = 10 + [ ∗ 10
12000
𝑃𝑗 = 18.34

11. Una compañía de seguros ofrece determinadas coberturas, previa suscripción de la


correspondiente póliza cuya prima anual está estipulada según la edad del beneficiario. En cierta
ciudad, el número de pólizas suscritas para cada tramo de edad es el que se da a continuación:

Edad (años) [15, 25⟩ [25, 35⟩ [35, 45⟩ [45, 55⟩ [55, 65]
Número de pólizas 34 211 332 422 194

a. Calcula la diferencia entre los percentiles 7 y 93 de la distribución de las edades de los beneficiarios
de las pólizas.
b. Calcula la dispersión con respecto a la media de las edades.
c. Calcula el coeficiente de asimetría de Pearson.

Solución:
𝑗𝑛
− 𝐹𝑖−1 ]
𝑃𝑗 = 𝐿𝑖 + [100 ∗𝐴
𝑓𝑖
a) Aplicando la fórmula de percentil en 7 y 93

𝑗𝑛
−𝐹𝑖−1 ] 𝑗𝑛 7∗1193
𝑃7 = 𝐿𝑖 + [100 ∗𝐴 , = = 83.51
𝑓𝑖 100 100

83.51 − 34]
𝑃7 = 25 + [ ∗ 10
211
𝑃7 = 27.34

𝑗𝑛
−𝐹𝑖−1 ] 𝑗𝑛 93∗1193
𝑃93 = 𝐿𝑖 + [100 ∗𝐴 ; = = 110.49
𝑓𝑖 100 100

110.49 − 999]
𝑃93 = 55 + [ ∗ 10
194

𝑃93 = 9.20
Diferencia
𝑃7 = 27.34 −𝑃93 = 9.20 =18.14
∑(𝑥𝑖 −𝑥)2 𝑓𝑖
b) Utilizando la fórmula de dispersión para datos agrupados 𝑠 = √ pero antes de ello
𝑛
∑(𝑥𝑖 ∗𝑓𝑖 )
hallamos la media 𝑥 = =53030/1193= 44.45
𝑛

∑(𝑥𝑖 − 𝑥)2 𝑓𝑖 130868.25


𝑠=√ =𝑠=√ = 10.47
𝑛 1193

𝑑1
c) Primero hallamos la moda 𝑚𝑜 = 𝐿𝑖 + [ ]∗𝐴
𝑑1 +𝑑2

𝑑1 = 𝑓𝑖 − 𝑓𝑖−1 =34-0=34
𝑑2 = 𝑓𝑖 − 𝑓𝑖+2 =34-211=-177

34
𝑚𝑜 = 15 + [ ] ∗ 10 = 12.62
34−177

𝑥−𝑚𝑜 44.45−12.62
La fórmula de Pearson 𝐴𝑆 = = =3.04
𝑠 10.47

12. Los datos que se muestran a continuación representan el costo de energía eléctrica durante el mes
de julio dl 2011, para una muestra aleatoria de 50 departamentos con dos habitaciones en una
ciudad grande.

Costo de energía eléctrica en dólares:

96 171 202 178 147 102 153 197 127 82


157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
96 163 206 175 130 143 187 166 139 149
108 119 150 154 114 135 191 137 129 158

a. Determine una tabla de frecuencias.


b. Q1, Q2, Q3.
c. Calcule el percentil correspondiente a: 191, 70 y 175.
d. Realice un diagrama de caja.

Solución

a) Determinando tabla de frecuencias:

1.-Max = 213 Min = 82

2.- Amplitud: Max – Min = 213-82 =131

3.-Numero de intervalo (K), Usando la FORMULA DE STURGES

K  1  3.32 Ln(n) = K  1  3.32 Ln(50)  k  6.640580414

4.-Ancho de la Clase o Intervalo. (  )

Rango 131
     21.83
k 6

Ii fi FI hi Hi
82-103.83 5 5 0.1 0.1
103.83-125.66 7 12 0.14 0.24
125.66-147.49 12 24 0.24 0.48
147.49-169.32 13 37 0.26 0.74
169.32-191.15 7 44 0.14 0.88
191.15-213 6 50 0.12 1
total 50 - 1 -
 jn 
 4  Fi 1 
b) Calcule los cuartiles: ( Q j ) = Q j  Li    xA
 fi 
 
jn 50
Q1 =?? .   12.5
4 4

12.5  12 
Q1  125.66   x 21.83  Q1  126.5695833
 12 
jn 2 x50
Q2 =?? .   25
4 4

 25  24 
Q2  147.49   x 21.83  Q2  149.1692308
 13 
jn 3 x50
Q3 =?? .   37.5
4 4

 37.5  37 
Q3  169.32    x 21.83  Q3  170.8792857
 7

 jn 
 100  Fi 1 
c) Calculando los percentiles: ( Pj ) = Pj  Li    xA
 fi 
 
jn 91x50
P91  ?? .   95.5
100 100

 45.5  44 
P91  191.15    x 21.83  Pj  196.6075
 6

jn 70 x50
P70  ?? .   35
100 100

 35  24 
P70  147.49   x 21.83  P70  164.2823077
 13 
jn 75 x50
P75  ?? .   37.5
100 100

 37.5  37 
P75  169.32    x 21.83  P75  170.8792857
 7
d) Diagrama de Caja:
13. Los siguientes son los números de los minutos durante los cuales una persona debió esperar el
autobús hacia su trabajo en 15 días laborales: 10 – 1 – 13 – 9 – 5 – 2 – 10 – 3 – 8 – 6 – 17 – 2 – 10 –
15. Determine:

a. La media.
b. La mediana.
c. Trace un diagrama de caja.

Solución:

a.- Determine la media:


n

X i
111
Usando los datos sin agrupar: X i 1
= X   7.4
n 15
n Fi 15
b.- Determinando la mediana:    7.5
2 2 2
1 – 2 – 2 – 3 – 5 – 6 – 8 – 9 – 10 – 10 – 13 – 15 – 17

1 – 2 – 2 – 3 – 5 – 6 – 8 – 9 – 10 – 10 – 13 – 15 – 17

14. De esta distribución de edades, calcula:

Edad fi
[0, 5⟩ 11
[5, 10⟩ 18
[10, 15⟩ 13
[15, 20] 8

a. Media, moda y varianza.


b. Entre que valores se encuentra las 30 edades centrales.
c. Los cuartiles.

Solución

EDAD fi Fi Xi X i  fi ( X i  X )2 ( X i  X )2  fi a.
0-5 11 11 2.5 27.5 12939.0625 142329.6875
5-10 18 29 7.5 135 11826.5625 212878.1250
10-15 13 42 12.5 163,5 10764.0625 139932.8125
15-20 8 50 17.5 140 9751.5625 78012.5
total 50 - 40.0 465 573153.125
n

X i  fi
465
X i 1
X  X  116.25
n 4

 di 
 la moda: M o  Li   A
 di  d 2 

 18  11 
Mo  5     5  M o  7.92
 18  11  (18  13) 
La mayoría de las edades son de 7.92 años.

Varianza: es igual a la desviación estándar al cuadrado: V  S


2

Hallamos la desviación estándar para datos agrupados


n n

 ( X i  X )2  fi (X i  X )2  fi
S i 1
, n  30 y S i 1
, n  30
n 1 n

573153.125
S  S  107.0656925
50
V  (107.0656925) 2  V  11463.0625

b.- Se encuentra entre los valores de 0 hasta 15

c.- Hallando los cuartiles:

 jn 
 4  Fi 1 
( Q j ) = Q j  Li    xA
 f i 
 
jn 50
Q1 =?? .   12.5
4 4

12.5  11 
Q1  5   x5  Q1  5.42
 18 
jn 2 x50
Q2 =?? .   25
4 4

 25  11 
Q2  5   x5  Q2  8.9
 18 
jn 3 x50
Q3 =?? .   37.5
4 4

 37.5  29 
Q3  10   x5  Q3  13.27
 13 
15. Se mide la estatura de 67 estudiantes elegidos al azar y resulta la siguiente distribución de
frecuencias:

Estaturas [155, 160⟩ [160, 165⟩ [165, 170⟩ [170, 175]


N° de estudiantes 4 26 24 13

Calcule todos los descriptivos estudiados. Interprete.

Solución

estatura Nº de Xi Fi hi Hi X i  fi ( X i  X )2  fi
estudiante
155-160 4 157.5 4 0.06 0.06 630 284.2596
160-165 26 162.5 30 0.39 0.45 4225 305.8874
165-170 24 167.5 54 0.36 0.81 4020 59.1576
170-175 13 172.5 67 0.19 1 2242.5 561.1437
total 67 660 - 1 - 11117.5 1210.4483

Calcule todos los datos descriptivos:


1117.5
 La media: X   165.93
67
El promedio de estatura es de 165.93

n 
 2  Fi 1  n 67
 La mediana: Me  Li    xA .   33.5
 f i  2 2
 

 33.5  30 
Me  165    x5  165.73
 24i 
El 50% de los estudiantes tienen una estatura de 165.73

 di 
 La moda: M o  Li   A
 di  d 2 

 26  4 
M o  160     5  164.58
  26  4   (26  24) 
La mayoría de los estudiantes tienen una estatura promedio de 164.58

 jn 
 4  Fi 1 
Cuartiles: Q j  Li    xA
 f i 
 
jn 67
Q1 =?? .   16.75
4 4

16.75  4 
Q1  160   x5  Q1  162.45
 26 
jn 2 x67
Q2 =?? .   33.5
4 4

 33.5  30 
Q2  165   x5  Q2  165.73
 24 
jn 3x67
Q3 =?? .   50.25
4 4

 50.25  30 
Q3  165    x5  Q3  169.22
 24

(X i  X )2  fi
 Desviación estándar (S): S  i 1
, n  30
n

1210.4483
S  S  4.25
67

La varianza (V): V  S  V   4.25   V  18.0625


2 2

 Coeficiente de variación:

S 4.25
CV  100  CV  100  CV  2.56%
X 165.93

La X es altamente representativa.

16. La tabla siguiente representa la distribución de las calificaciones finales obtenidas de 150
estudiantes de un curso:

Calificaciones N° de estudiantes
[0, 2⟩ 10
[2, 4⟩ 50
[4, 6⟩ 55
[6, 8⟩ 25
[8, 10] 10

Determinar:

a. Halle la media y la desviación típica de la variable.


b. Calcule la mediana y el primer cuartil.
c. Calcule los percentiles 33 y 66.

Solución:

notas Nº DE Xi Fi hi Hi X i  fi ( X i  X )2  fi
ESTUDIANT
ES
0-2 10 1 10 0.06 0.06 10 134.689
2-4 50 3 60 0.33 0.39 150 139.445
4-6 55 5 115 0.36 0.75 275 5.9895
6-8 25 7 135 0.16 0.91 175 135.7225
8-10 10 9 150 0.06 1 90 187.489
total 150 25 - 1 - 700 603.335

1117.5
La media: X  165.93
67
n

(X i  X )2  fi
La desviación estándar: S i 1
, n  30
n

603.335
S  S  2.006
150

n 
 2  Fi 1  n 150
 Mediana: Me  Li    xA .   75
 fi  2 2
 

 75  60 
Me  4   x 2  4.55
 55 
 jn 
 4  Fi 1 
 Primer cuartil: Q j  Li    xA
 fi 
 
jn 150
Q1 = ?? .   37.5
4 4

 37.5  10 
Q1  2   x 2  Q1  3.1
 50 

 jn 
 100  Fi 1 
 Calculando los percentiles 33 y 66: Pj  Li    xA
 fi 
 
jn 33x150
P33  ?? .   49.5
100 100

 49.5  10 
P33  2   x 2  P33  3.58
 50 
jn 66 x150
P66  ?? .   99
100 100

 99  60 
P66  4   x 2  P66  5.42
 55 