Escolar Documentos
Profissional Documentos
Cultura Documentos
Angel F. Arvelo L
Grficos Estadsticos
Angel F. Arvelo L.
Al observar una
Frecuencia
Derecho
34
Medicina
56
Ingeniera
47
Economa
26
Sociologa
17
Administracin
20
TOTAL
200
Tabla 1
fi
Se tiene: n =
i 1
De no cumplirse esta exigencia , tendr que definirse algn criterio que permita definir la categora nica
Grficos Estadsticos
Angel F. Arvelo L.
fi
n
i
j k
fj
j 1
fi
100%
j k
fj
fi
100%
n
j 1
i k
hi = 1
i k
hi =
Demostracin:
i 1
fi
i n
fi
1 n
i 1
n
n
hi % = 100 %
verifica:
i 1
fi = 200
n=
i 1
Grficos Estadsticos
Angel F. Arvelo L.
Frecuencia Relativa
Carrera
Frecuencia Absoluta
Frecuencia Relativa
Porcentual
Derecho
34
0,170
17,00%
Medicina
56
0,280
28,00%
Ingeniera
47
0,235
23,50%
Economa
26
0,130
13,00%
Sociologa
17
0,085
8,50%
Administracin
20
0,100
10,00%
TOTAL
200
1,000
100,00%
Grficos Estadsticos
Angel F. Arvelo L.
Grficos Estadsticos
Angel F. Arvelo L.
Por ejemplo, los mismos datos de la tabla 1, representados con una escala vertical
hasta 100%, tendran la siguiente apariencia:
El lector puede fcilmente apreciar que a pesar de ser los mismos datos, las dos
grficas son significativamente diferentes, con distintos mensajes.
Para evitar que las escalas elegidas den lugar a grficos que resulten
desproporcionados, se da esta regla conocida como regla de los tres cuartos de
altura:
En la construccin de un histograma de frecuencias (absolutas, relativas o
porcentuales), la escala vertical correspondiente a las frecuencias, debe ser tal
que la altura correspondiente al rectngulo de mayor frecuencia (el ms alto), debe
ser aproximadamente igual a tres cuartos del ancho total del eje horizontal.
e) Ubicacin del origen: La escala vertical del histograma debe ser aritmtica, y
partir del origen cero.
Lo anterior significa que debe ser una escala de razn, y que iguales proporciones
entre las alturas de los rectngulos deben reflejar iguales proporciones entre las
frecuencias de las categoras..
Una de las maneras ms fciles de sorprender al lector de una grfica en su
buena fe, es utilizar un origen diferente del cero, o utilizar una escala no aritmtica.
As por ejemplo, si la tabla de frecuencias relativas porcentuales correspondiente a
los datos de la Tabla 1, los representamos tomando como origen el 5%,
encontraremos la siguiente grfica:
Grficos Estadsticos
Angel F. Arvelo L.
Grficos Estadsticos
Angel F. Arvelo L.
Administracin
0.10
36.00
Derecho
0.17
61.20
Economa
0.13
46.80
Ingeniera
0.24
84.60
Medicina
0.28
100.80
Sociologa
0.09
30.60
Total
1.00
360.00
Grficos Estadsticos
Angel F. Arvelo L.
Es importante destacar que estos grficos tambin son conocidos bajo el nombre
de "Grficos de Pastel o de Torta" por la gran similitud que presentan con un
pastel picado en pedazos, sealando cul pedazo le corresponde a cada
categora.
3) Grficos de Figuras geomtricas proporcionales: El principio bsico en que
se fundamenta la construccin de grficas estadsticas para representar
frecuencias, es el de proporcionalidad de reas, segn el cual las reas de los
sectores deben guardar la misma relacin que sus frecuencias.
Es decir, en todo grfico estadstico de frecuencias debe cumplirse la siguiente
Area del sec tor " i" Frecuencia de la categoria" i"
relacin:
Area del sec tor " j" Frecuencia de la categoria" j"
El lector puede fcilmente demostrar que tanto el histograma, como el grfico
circular respetan este principio.
El grfico de figuras geomtricas proporcionales se utiliza fundamentalmente para
comparar las frecuencias o tamaos de las diferentes categoras, y para ello
selecciona un figura geomtrica, generalmente un crculo o un cuadrado, y cada
figura representa a una categora; no como en el caso del grfico circular , donde
el sector representa a la categora , y el crculo al total de datos.
El procedimiento para construir este tipo de grficas es el siguiente:
Paso N 1: Se selecciona el tipo de figura a utilizar
Paso N 2: Las diferentes categoras se ordenan de menor a mayor frecuencia.
Paso N 3: A la categora de menor frecuencia se le asigna una figura de
dimensiones arbitrarias.
Paso N 4: Se calculan las dimensiones que deben tener las figuras
correspondientes a las dems categoras, segn el principio de
proporcionalidad de reas.
Paso N 5: Se representan las diferentes figuras, sobre un mismo eje, y dispuestas
de menor a mayor frecuencia.
Ejemplo 3: Representar los datos de la tabla 1, en un grfico de cuadrados
proporcionales.
Solucin: Segn el procedimiento descrito anteriormente, tenemos:
Paso1:La
figura
a
utilizar
es
el
cuadrado
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia Absoluta
Sociologa
17
Administracin
20
Economa
26
Derecho
34
Ingeniera
47
Medicina
56
TOTAL
200
L2i
L2j
fi
fj
Lj
Li
fj
fi
El lado del
L1
47
= 49.88 .
17
Medicina : L 6
L1
56
= 54.45
17
Paso N 5: Por ltimo se procede a dibujar los seis cuadrados , con centro sobre
un mismo eje, y en forma ascendente .
11
Grficos Estadsticos
Angel F. Arvelo L
Precio
2500
3700
4100
5000
6000
r4
r1
5000
= 56.57
2500
r5
r1
6000
= 61.97
2500
Grficos Estadsticos
Angel F. Arvelo L
12
El economista italiano Vilfredo Pareto ( 1848 - 1923) estableci que las causas
que ocasionan un determinado problema pueden ser clasificadas como las pocas
vitales y las muchas triviales. Las primeras son aquellas pocas causas que
ocasionan el problema la mayor parte de las veces; mientras que las segundas
son aquellas muchas causas que ocasionan el problema raras veces.
Este principio de Pareto dio origen a una regla conocida como bajo el nombre del
80-20 , segn la cual , el 80% de las veces el problema es ocasionado por el 20%
de las causas.
El objetivo del diagrama de Pareto, es identificar los pocos vitales, es decir ese
20% de causas importantes, a fin de centrar la accin correctiva en ellas.
En un diagrama de Pareto, la variable cualitativa en estudio, es la causa que
ocasion un determinado problema, y para construirlo se procede como sigue:
Paso N1: Se elabora una tabla de frecuencias para las causas que han
ocasionado un determinado problema. Se supone que cada vez que se ha
presentado el problema ha sido por una y sola una de las causas.
Paso N 2: Se ordenan estas causas de mayor a menor frecuencia.
Paso N 3 : Se calcula la frecuencia relativa porcentual de cada causa.
Paso N4 : Las frecuencias relativas porcentuales se acumulan, sumando la
frecuencia relativa porcentual de cada causa con todas las anteriores.
Paso N 5: El eje horizontal se divide en segmentos de igual amplitud, tantos como
causas se tengan . Cada segmento representa a una causa, y estas quedan
ordenadas de mayor a menor frecuencia.
Paso N 6 : Para cada causa se construye un rectngulo de altura igual a su
frecuencia relativa porcentual .
Paso N 7: Para cada causa , sobre la recta vertical que pasa por el punto medio
de su segmento , se ubica un punto a una altura igual a su frecuencia relativa
porcentual acumulada.
Paso N 8 : Los diferentes puntos obtenidos en el paso anterior se unen mediante
segmentos rectos .
Ejemplo 5 : Supongamos que en una industria se hizo un seguimiento, acerca de
las causas que ocasionaron la interrupcin del trabajo en una cierta mquina.
Los resultados obtenidos fueron:
13
Grficos Estadsticos
Angel F. Arvelo L
Causa de la interrupcin
Frecuencia
32
Manejo incorrecto
17
Falta de suministro
30
Falta de lubricacin
Falta de calibracin
11
Falla mecnica
Operador ausente
Otros
Frecuencia
Frecuencia Relativa
porcentual
acumulada
32
27.59 %
27.59 %
Falta de suministro
30
25.86 %
53.45 %
Manejo incorrecto
17
14.66 %
68.10 %
Falta de calibracin
11
9.48 %
77.59 %
Falta de lubricacin
6.03 %
83.62 %
Falla mecnica
5.17 %
88.79 %
Otras
5.17 %
93.97 %
3.45 %
97.41 %
Operador ausente
2.59 %
100.00 %
TOTAL
116
100.00 %
De la tabla se deduce que las causas ms importantes son las cuatro primeras,
pues entre ellas acumulan el 77.59 % de las interrupciones, de manera que a la
hora de tomar las medidas correctivas necesarias para combatir estas
interrupciones , se tendrn identificadas las causas ms importantes.
El diagrama de Pareto correspondiente es el siguiente:
14
Grficos Estadsticos
Angel F. Arvelo L
Enero
Precio 100
Feb.
Marzo Abril
Mayo
Junio
Julio
Agosto Sept.
Oct.
Nov.
Dic.
105
108
110
114
115
120
150
170
184
108
133
Grficos Estadsticos
Angel F. Arvelo L
15
Construir un grfico polar para mostrar la evolucin de los precios de este artculo
durante el ao.
Solucin : En este caso , como se tienen doce categoras , cada radio va a ser
360
trazado con centro en el origen , y con una separacin de
30 .
12
Sobre cada uno de ellos, y en forma consecutiva se va a representar un segmento
de longitud igual al precio del artculo en ese mes, y siguiendo los pasos antes
sealados se obtendr la siguiente grfica polar:
Es de hacer notar que en este caso, como hubo un continuo aumento en el precio
del artculo a lo largo de todo el ao, el radio correspondiente a cada mes fue cada
vez mayor, dando lugar a una curva en forma de espiral, que es la llamada espiral
inflacionaria, tan conocida en nuestro pas .
7) Pictogramas: Son grficos en donde se utiliza un smbolo, que generalmente
guarda cierta relacin con la variable que se quiere representar, para expresar su
frecuencia o valor.
As por ejemplo, si se quisiera representar la poblacin de diversos pases,
podramos hacerlo dibujando una silueta humana, y diciendo que cada una de
ellas representa una poblacin de digamos 1.000.000 habitantes; de esa forma en
lugar de indicar la cifra numrica que corresponde a la poblacin de cada pas, lo
16
Grficos Estadsticos
Angel F. Arvelo L
f11
f12
.......
f1h
f1.
A2
f21
f22
.......
f2h
f2.
.......
.......
.......
fij
.......
.......
categoras de A , y se llama
Ak
fk1
fk2
.......
fkh
fk.
Frecuencia marginal de A.
Total
f.1
f.2
.......
f.h
17
Grficos Estadsticos
Angel F. Arvelo L
fi. =
j 1
i k
f.j =
fij =
i 1
i k j h
n=
i 1 j 1
j h
i k
fij =
fi. =
i 1
Letras
16
31
47
Medicina
53
78
131
Total
287
313
600
18
Grficos Estadsticos
Angel F. Arvelo L
100
90
80
70
60
Frecuencias50
40
Hombre
30
Mujer
20
10
0
Derecho
Economa
Ingeniera
Mujer
SEXO
Hombre
Letras
Medicina
CARRERA
Mujer
80
Hombre
60
40
20
0
Derecho
Economa
Ingeniera
Letras
Medicina
CARRERA
19
Grficos Estadsticos
Angel F. Arvelo L
frecuencia
350
300
Medicina
250
Letras
200
Ingeniera
150
Economa
100
50
Derecho
0
Hombre
Mujer
SEXO
frecuencia
Hombre
Mujer
Derecho
Economa
Ingeniera
Letras
Medicina
frecuencia
CARRERAS
100
90
80
70
60
50
40
30
20
10
0
Derecho
Economa
Ingeniera
Letras
Medicina
Hombres
Mujeres
SEXO
20
Grficos Estadsticos
Angel F. Arvelo L
Poblacin Masculina
Derecho
Derecho
18%
6%
25%
Economa
25%
30%
Ingeniera
Ingeniera
29%
22%
Economa
10%
Letras
Medicina
18%
17%
Letras
Medicina
Otra posibilidad es sealar la distribucin por sexo en cada carrera, dando lugar
a los siguientes grficos circulares:
Derecho
43%
57%
Economa
Hombres
Mujeres
45%
Hombres
55%
Mujeres
21
Grficos Estadsticos
Angel F. Arvelo L
Distribucin de estudiantes por carreras
22%
Derecho
28%
Economa
48%
Ingeniera
8%
23%
19%
Letras
52%
Hombres
Mujeres
Medicina
22
Grficos Estadsticos
Angel F. Arvelo L
250
200
150
Fre cue ncia
100
50
0
Ning una
Prima ria
Po st-g ra d o
Gra do d e Instrucci n
Grficos Estadsticos
Angel F. Arvelo L
23
24
Grficos Estadsticos
Angel F. Arvelo L
30
= 48.99 mm .
5
40
= 56.57 mm.
5
Frecuencia
Pintura defectuosa
Ruidos
86
11
Cables defectuosos
No funciona el radio
36
Batera defectuosa
15
Falla de bujas
19
25
Grficos Estadsticos
Angel F. Arvelo L
Amortiguadores defectuosos
45
10
Frenos defectuosos
Otros
12
Frecuencia
Porcentaje
Acumulado
Ruidos
86
33.33 %
33.33 %
45
17.44 %
50.78%
No funciona el radio
36
13.95 %
64.73 %
Falla de Bujas
19
7.36 %
72.09 %
Batera defectuosa
15
5.81 %
77.91 %
Otros
12
4.65 %
82.56 %
11
4.26 %
86.82 %
10
3.88 %
90.70 %
Pintura defectuosa
3.10 %
93.80 %
Amortiguadores defectuosos
2.33 %
96.12 %
Cables defectuosos
2.33 %
98.45%
Frenos defectuosos
1.55 %
100.00 %
TOTAL
258
100.00 %
En la tabla puede apreciarse que las cuatro primeras causas ocasionan el 72.09%
de los defectos, y el diagrama de Pareto es el siguiente
Grficos Estadsticos
Angel F. Arvelo L
26
27
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia
A
B
C
D
Total
?
57
?
?
200
19.0%
?
32.0%
?
?
Frecuencia
A
B
C
x
2x
3x
?
16%
?
D
E
100
30
?
?
28
Grficos Estadsticos
Angel F. Arvelo L
Total
29
Grficos Estadsticos
Angel F. Arvelo L
Candidato A
Candidato B
Candidato C
Candidato D
Baja
95
32
235
58
Media
143
12
94
21
Alta
72
15
9
14
a) Construya un diagrama circular que seale las preferencias hacia a cada
candidato , en base a toda la muestra .
b) Construya un grfico circular , que seale las preferencias hacia cada
candidato, entre las personas de condicin econmica baja.
c) Construya un histograma de frecuencias relativas que seale la composicin
por niveles socio econmicos, para los simpatizantes del candidato D.
Solucin: a) La distribucin marginal de frecuencias para cada candidato se
obtiene sumando sobre las filas, y se obtiene:
Candidato A
Frecuencia
310
Candidato B
59
Candidato C
Candidato D
338
93
800
D
11,63%
A
38,75%
C
42,25%
B
7,38%
Total
30
Grficos Estadsticos
Angel F. Arvelo L
D
13,81%
A
22,62%
C
55,95%
B
7,62%
Porcentaje
70
60
50
40
30
20
10
0
62,37
22,58
15,05
Baja
Media
Alta
Condicin Economica
Preguntas de Revisin
1) Por qu es importante que en un histograma de frecuencias, la escala
vertical sea lineal , y su origen sea el cero ? . De ejemplos .
2) Si se construye un histograma de frecuencias dndole diferente ancho a las
categoras, se cumple el principio de proporcionalidad de reas ? .
3) Cual es la diferencia entre un grfico circular , y uno de crculos
proporcionales ? .
4) Cual es el objetivo de un Diagrama de Pareto ? .
5) Porqu es recomendable colocar en orden alfabtico a las diferentes
categoras de una variable nominal ? .
Grficos Estadsticos
Angel F. Arvelo L
31
32
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia
63
25
96
11
83
8
13
6
14
Frecuencia absoluta
A
B
C
D
E
Total
?
48
36
?
39
?
8.00 %
32.00 %
?
?
?
?
33
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia Absoluta
x
2x
40
?
5x
Respuesta: x= 32 , fD= 24
10 En un estudio de mercado , se consideraron cuatro marcas de jabn
detergente A, B , C y D . Las amas de casa entrevistadas fueron clasificadas en
tres categoras segn su condicin econmica, en : Baja, Media y Alta .
El resultado de la encuesta se muestra en la siguiente grfica:
Suponiendo que las clases baja , media y alta estn en razn de 4:5:1
respectivamente, calcule el porcentaje de mercado que le corresponde a cada
una de estas cuatro marcas de jabn detergente, y utilcelas para construir:
a) Un grfico circular.
b) Un grfico de cuadrados proporcionales.
Respuesta: A :17.50% , B: 31.10% , C: 33.10 % , D: 18.30% .
34
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia Absoluta
x
y
3y
5
2x
?
Respuesta: x = 125 ; y = 30
35
Grficos Estadsticos
Angel F. Arvelo L
i k
Frecuencia
Frecuencia Relativa
Frecuencia Relativa
Porcentual
0
1
2
3
Total
19
19
8
4
50
0.38
0.38
0.16
0.08
1.00
38.00 %
38.00 %
16.00 %
8.00 %
100.00 %
36
Grficos Estadsticos
Angel F. Arvelo L
1 + 3.32 log n
37
Grficos Estadsticos
Angel F. Arvelo L
X max
X min
R
k
k
c = Amplitud de los intervalos .
El resultado obtenido se aproxima al nmero cmodo ms cercano;
entendiendo por nmero cmodo a un nmero entero mltiplo de 5 de 10, o
de una potencia de 10 , segn el orden de magnitud de los datos , y que sea
fcil de recordar.
En caso de que se aproxime a un nmero menor, es posible que resulten ms
intervalos de lo previsto, y en caso de que se aproxime a uno mayor , menos de
lo previsto.
Se acostumbra que la amplitud de cada uno de los intervalos sea la misma,
aunque es posible construir tablas de frecuencias con intervalos de amplitud
diferente. Este caso ser considerado ms adelante.
c.3 Lmites de clase. Se entiende por lmites de clase a los extremos de los
intervalos donde quedan clasificados los datos.
Como no es necesario que el lmite inferior del primer intervalo coincida
exactamente con menor valor de los datos , ni que el lmite superior del ltimo
intervalo con el mayor , es usual arrancar el primer intervalo desde un nmero
exacto mltiplo de 5 , de 10 o de una de sus potencias , que sea ligeramente
inferior al menor valor de los datos, , y a partir de all definir los siguientes lmites
de clase , segn sea la amplitud .
Para definir los lmites de clase , existen dos criterios:
c.3.1 Definir los intervalos como cerrados en su extremo inferior y abiertos en el
superior , sin interrumpir la continuidad entre un intervalo y el siguiente.
Bajo este criterio una variable como por ejemplo la estatura de un grupo de
personas, quedara clasificada en intervalos que van desde 1.40 m a 1.50 m el
primero, desde 1.50 m a 1.60 m el segundo , desde 1.60 m a 1.70 m , el tercero
y as sucesivamente ; y de darse una medicin igual a la frontera por decir 1.60
m, sta quedara clasificada en el intervalo que la tenga como lmite inferior, es
decir el intervalo 1.60 a 1.70 , por ser cerrado en el lmite inferior.
Este criterio tiene la ventaja de que no interrumpe la continuidad de los datos, y
equivale a definir los datos dentro de un intervalo como mayor o igual que el
lmite inferior y estrictamente menor que el lmite superior .
c.3.2 Definir los intervalos como cerrados en sus dos extremos .
Bajo este criterio, en un caso como el anterior , los lmites de clase quedaran
definidos como desde 1.40 hasta 1.49 el primero , desde 1.50 hasta 1.59 el
segundo, etc. .
Este segundo criterio es ms claro desde el punto de vista que no presenta la
ambigedad que pudiera presentar el anterior , cuando una observacin es igual
a la frontera y no se seale claramente sobre la tabla que el intervalo es cerrado
en el extremo inferior y abierto en el superior.
Grficos Estadsticos
Angel F. Arvelo L
38
39
Grficos Estadsticos
Angel F. Arvelo L
0.47
= 0.0588
8
La amplitud 0.0588 se aproxima a un valor que resulte ms cmodo para
trabajar, como por ejemplo 0.05 , con lo que posiblemente resulten ms
intervalos de lo previsto.
El tercer paso es definir los lmites de clase.
Supongamos que decidimos seguir el primer criterio .
A continuacin hay que decidir donde arrancar el primer intervalo. Como el
menor valor es 1.46 , podramos arrancar el primer intervalo desde 1.45 que
resulta ms cmodo, y de esta manera quedaran los siguientes lmites de clase:
desde 1.45 hasta 1.50 el primero , desde 1.50 hasta 1.55 el segundo , y as
sucesivamente .
El paso siguiente es contar cuantas observaciones caen en cada uno de estos
intervalos, teniendo en cuenta que es cerrado en el extremo inferior y abierto en
el superior.
La tabla de frecuencias resulta:
Estatura
1.45 a 1.50
1.50 a 1.55
1.55 a 1.60
1.60 a 1.65
1.65 a 1.70
1.70 a 1.75
1.75 a 1.80
1.80 a 1.85
1.85 a 1.90
1.90 a 1.95
TOTAL
Frecuencia
3
5
4
12
13
9
6
5
1
2
60
De haber definido los lmites de clase por el segundo criterio, la tabla hubiese
quedado:
Estatura
1.45 a 1.49
1.50 a 1.54
1.55 a 1.59
1.60 a 1.64
1.65 a 1.69
1.70 a 1.74
1.75 a 1.79
1.80 a 1.84
1.85 a 1.89
1.90 a 1.94
TOTAL
Lmites Reales
1.445 a 1.495
1.495 a 1.545
1.545 a 1.595
1.595 a 1.645
1.645 a 1.695
1.695 a 1.745
1.745 a 1.795
1.795 a 1.845
1.845 a 1.895
1.895 a 1.945
Frecuencia
3
5
4
12
13
9
6
5
1
2
60
Frecuencia Relativa
Porcentual
5.00 %
8.33 %
6.67 %
20.00 %
21.67 %
15.00 %
10.00%
8.33 %
1.67 %
3.33 %
100.00 %
40
Grficos Estadsticos
Angel F. Arvelo L
Fj
f1 f2
fj
fi .
i 1
Hj
h1 h 2
hj
i j
hi
Hj % h1 % h2 %
hj %
i 1
hi %
i 1
Fj
n
Fj
100%
n
Ejemplo 3 : Completar la tabla del Ejemplo 2 , incluyendo la frecuencias
absolutas acumulada , y la frecuencia relativas porcentuales acumuladas .
Solucin: La frecuencia acumulada del primer intervalo es:
F1 = f1 = 3 , y significa que 3 personas miden 1.49 menos , que es el lmite
superior del primer intervalo .
La frecuencia acumulada del segundo intervalo es :
F2 = f1 + f2 = 3 + 5 = 8 ; y su interpretacin es que 8 personas en la muestra ,
tienen una estatura igual o menor que el lmite superior del intervalo 1.54 .
La frecuencia relativa porcentual acumulada del primer intervalo es :
H1 % = h1 % = 5 % , y significa que el 5% de las observaciones son iguales o
menores que el lmite superior del primer intervalo, que es 1.49 ; es decir , que el
5% de las personas en la muestra miden 1.49 menos .
La frecuencia relativa porcentual acumulada del segundo intervalo es :
H2 % = h1 % + h2 % = 5 % + 8.33 % = 13.33 %, y significa que el 13.33 % de las
personas en la muestra , miden 1.54 menos .
Procediendo de manera anloga con los dems intervalos , se completa la tabla
obteniendo:
Estatura
Lmites Reales
Frecuencia
Frecuencia
acumulada
1.45 a 1.49
1.50 a 1.54
1.55 a 1.59
1.60 a 1.64
1.445 a 1.495
1.495 a 1.545
1.545 a 1.595
1.595 a 1.645
3
5
4
12
3
8
12
24
Frecuencia
Relativa
Porcentual
5.00 %
8.33 %
6.67 %
20.00 %
Frecuencia
Relativa
Porcentual
Acumulada
5.00 %
13.33 %
20.00 %
40.00 %
41
Grficos Estadsticos
Angel F. Arvelo L
1.65 a 1.69
1.70 a 1.74
1.75 a 1.79
1.80 a 1.84
1.85 a 1.89
1.90 a 1.94
TOTAL
1.645 a 1.695
1.695 a 1.745
1.745 a 1.795
1.795 a 1.845
1.845 a 1.895
1.895 a 1.945
13
9
6
5
1
2
60
37
46
52
57
58
60
21.67 %
15.00 %
10.00%
8.33 %
1.67 %
3.33 %
100.00 %
61.67%
76.67 %
86.67 %
95.00 %
96.67 %
100.00 %
Tabla 4.4
Ejercicios Propuestos:
4) Los siguientes datos representan el nmero de hijos que tienen cada uno de
los 100 empleados de una organizacin industrial:
2 1 2 2 2 0 1 1 1 1 1 0 3 0 2 3 1 2 4 1 1 1 1 1 2
3 1 2 0 2 2 4 2 1 0 1 2 2 3 2 1 0 0 0 3 1 2 2 1 0
1 0 3 2 1 0 3 1 2 1 2 0 2 2 2 1 1 3 0 2 2 2 1 0 0
1 1 2 1 3 2 1 1 4 1 0 1 1 0 1 1 2 2 1 2 2 2 2 1 2
a) Construya la tabla de frecuencias , indicando frecuencias absolutas , relativas
porcentuales , absolutas acumuladas y relativas porcentuales acumuladas .
b) Construya un grfico circular .
5) Los siguientes datos representan el peso de un grupo de personas,
expresados en Kilogramos, y redondeados al entero ms cercano:
53 76 85 59 82 75 66 61 59 63 79 68 63 71 87
67 71 79 60 53 57 62 69 52 59 70 61 66 63 75
65 60 72 88 70 53 77 86 51 67 78 89 50 76 64
71 78 57 53 69 94 68 75 70 81 67 55 57 60 52
68 64 80 77 67 93 77 55 72 64 63 70 72 46 51
53 87 71 69 60 55 73 59 52 55 62 91 60 50 86
74 73 83 55 67 70 59 62 90 65 78 77 66 57 50
61 67 70 63 72 88 78 54 77 58 48 56 58 63 90
66 68 57 55 68 70 61 84 76 59 75 50 56 73 79
98 60 57 69 73 78 51 68 70 80 65 59 48 67 72
Agrupar estos datos en una tabla de frecuencias, indicando frecuencias
absolutas , relativas y acumuladas .
Existen varias
alternativas para representar grficamente datos cuantitativos, entre las cuales
pueden ser citadas:
1) El Histograma : Esta es la representacin grfica de la tabla de frecuencias
absolutas o de las relativas segn se quiera , sus normas de construccin son
las mismas que fueron analizadas en el captulo anterior para datos cualitativos ;
y que el caso de datos cuantitativos presenta dos casos:
1.a ) Tabla puntual o discreta de frecuencias . Este es el caso en donde toda la
frecuencia le corresponde exclusivamente a un valor puntual y no a un intervalo.
Grficos Estadsticos
Angel F. Arvelo L
42
Grficos Estadsticos
Angel F. Arvelo L
43
Grficos Estadsticos
Angel F. Arvelo L
44
El grfico de reas tiene la propiedad de que su rea es igual al rea total del
histograma, es decir igual a la suma de las reas de todos los rectngulos que lo
integran.
Es importante destacar que las tcnicas de Estadstica Matemtica , han
desarrollado una serie de curvas conocidas bajo el nombre de Distribuciones
tericas de Probabilidad , que vienen a constituir una especie de modelo terico
para el Polgono de Frecuencia , pues a medida que la amplitud de los
intervalos se reduce , el polgono tiene cada vez mas lados , y la curva de
probabilidad viene a ser una aproximacin terica para la posicin lmite del
polgono cuando la amplitud del intervalo tienda a cero.
3) Grficos de tallo y hoja : Cuando se agrupa un conjunto de datos en una
tabla de frecuencias , se pierde la informacin de su verdadero valor , y lo que
queda registrado es una observacin dentro del intervalo de clase donde cae.
El diagrama de tallo y hoja , es una tcnica de representacin , cuyo nombre
original en idioma ingls es stem and leaf , y que fu propuesta por el
estadstico John Tukey en 1977 en su clsico trabajo titulado Exploratory Data
Analysis, en donde se analizan una serie de novedosas maneras para el
anlisis de datos .
En el diagrama de tallo y hoja , cada dato tiene dos partes : el tallo y la hoja.
La hoja esta definida por su ltimo dgito , y existen dos hojas , la inferior que
corresponde a los dgitos 0 , 1 , 2 , 3 y 4 y que se representa en el diagrama por
l smbolo , y la superior que corresponde a los dgitos 5 , 6 , 7 ,8 y 9 , y se
representa por el smbolo .
El tallo representa todos los dems dgitos , y se colocan en el grfico en forma
de filas ordenadas , desde el valor ms bajo hasta el ms alto .
Ejemplo 8 : Representar los datos del Ejemplo 2, en un diagrama tallo y hoja.
Solucin : Para cada dato , se define su tallo y su hoja . as por ejemplo , el dato
1.54 pertenece al tallo 1.5 y a la hoja inferior , mientras que el dato 1.79 al
45
Grficos Estadsticos
Angel F. Arvelo L
tallo 1.7 y a la hoja superior o . En cada hoja se conserva el valor exacto del
ltimo dgito ; y se anota a la izquierda , la frecuencia absoluta de cada tallo y
hoja , tal como se muestra en la tabla a continuacin :
Frecuencia
3.00
5.00
4.00
12.00
13.00
9.00
6.00
5.00
1.00
2.00
Tallo
1.4
1.5
1.5
1.6
1.6
1.7
1.7
1.8
1.8
1.9
Hoja
*
*
*
*
*
678
03334
7799
000111112333
55666666788899
001233344
567889
00012
9
33
Tallo
1.4
1.5
1.6
1.7
1.8
1.9
Hoja
678
033347799
0001111123335566666788899
001233344567889
000129
03
La construccin con cinco hojas para cada tallo , distingue las siguientes hojas:
La hoja donde caen las observaciones cuyo ltimo dgito es 0 1 .
La hoja T ,del ingls Two y Three correspondiente al 2 y al 3 .
La hoja F, del ingls Four y Five , correspondiente al 4 y 5 .
La hoja S, del ingls Six y Seven correspondiente al 6 y 7 .
La hoja que corresponde a las observaciones terminadas en 8 y 9.
Este estilo de diagrama con cinco hojas para cada tallo , conviene slo en caso
de disponer de un nmero grande de datos , pues puede dar lugar a un excesivo
nmero de filas .
4) La Ojiva : Esta grfica es la representacin de la tabla de frecuencias
acumuladas , y expresa el nmero de observaciones que son iguales o menores
46
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia
Frecuencia
Relativa
Porcentual
0
1
2
3
Total
19
19
8
4
50
38.00 %
38.00 %
16.00 %
8.00 %
100.00 %
Frecuencia
acumulada
19
38
46
50
Frecuencia
Relativa
Porcentual
Acumulada
38.00 %
76.00 %
92.00 %
100.00 %
Grficos Estadsticos
Angel F. Arvelo L
47
Ojivas como la anterior , se suelen llamar menor o igual que , para distinguirlas
de otras llamadas mayor o igual que , en donde lo que se representa es el
porcentaje de observaciones que son mayores o iguales que un lmite de clase.
Para construir una Ojiva mayor o igual que , el procedimiento es idntico, slo
que hay que restar del 100% la frecuencia acumulada de cada intervalo, y
representarla para el lmite real superior del intervalo.
Ejemplo 11 Construir una Ojiva del tipo mayor o igual que , para los datos del
ejercicio anterior.
Solucin: Siguiendo el procedimiento anterior, se obtiene:
Grficos Estadsticos
Angel F. Arvelo L
48
49
Grficos Estadsticos
Angel F. Arvelo L
fi
( Area)i ci di
ci fi
y por lo tanto :
fj
( Area) j c j dj
fj
cj
cj
Ejemplo 12 : La siguiente tabla de frecuencias muestra la distribucin de sueldos
mensuales en una empresa:
ci
Sueldo
Mensual
Frecuencia
300 a 500
400
500 a 1.000
1000 a
2000
2000 a
3000
3.000 a
5.000
5.000 a
10.000
10.000 a
20.000
900
700
300
180
75
45
Frecuencia
400
900
700
300
180
20
2500
Amplitud
200
500
1.000
1.000
2.000
5.000
Densidad de frecuencia
2.00
1.80
0.70
0.30
0.09
0.004
Resulta obvio que en el caso de intervalos con igual amplitud, las densidades de
frecuencia de los diferentes intervalos resultan directamente proporcionales a
sus respectivas frecuencias, y por ello no se altera la razn entre las alturas , si
Grficos Estadsticos
Angel F. Arvelo L
50
IV.5
Grficos Estadsticos
Angel F. Arvelo L
51
52
Grficos Estadsticos
Angel F. Arvelo L
Ventas
1.36
1007.61
85.40
105.40
453.98
10.53
Logaritmo de Ventas
0.13
3.00
1.93
2.02
2.66
1.02
Ntese que en el eje vertical se coloca el valor real de las ventas , pero las
alturas de los rectngulos no guardan proporcin con los valores reales , sino
con sus logaritmos; y as por ejemplo , en el grfico , puede apreciarse que la
altura de la empresa B es aproximadamente el triple de la F , lo que se
interpreta en un grfico logartmico como que las ventas reales de las empresa
B estn con las de la empresa F en la proporcin 103:101 ; es decir de 100 a 1
, o lo que es lo mismo, que son 100 veces ms .
Ejemplo 14 : Suponga que al leer un grfico , en donde los valores de las clases
estn en escala logartmica , Ud. encuentra que una clase tiene una altura
negativa de -1 , y otra clase una altura positiva de +2 . Cual es la razn entre
el valor de la segunda y la primera clase ? .
Solucin : Si la primera clase A , tiene una altura negativa -1 , esto significa
que su verdadero valor es 10-1 = 0.1 ; mientras que si la segunda clase B tiene
una altura de +2 , entonces su verdadero valor es 102 = 100 .
53
Grficos Estadsticos
Angel F. Arvelo L
Ventas
1.36
1007.61
85.40
105.40
453.98
Grficos Estadsticos
Angel F. Arvelo L
54
Sobre el eje vertical se sealan las ventas reales , pero los rectngulos que
representan a las ventas de cada una de las empresas se construyen con
alturas proporcionales a sus races cuadradas .
d) Escalas funcionales : Las escalas anteriores son casos particulares de una
situacin ms general , conocida como escala funcional , en donde los valores
reales de una variable x se representan en proporcin a los valores de una
funcin : y = f(x) .
Los nicos requisitos que debe cumplir esta funcin f(x) es ser continua,
montona, y por consiguiente tener inversa.
As por ejemplo el caso de la escala aritmtica es cuando f(x) = x , el de la
escala logartmica cuando f(x) = log x , y el de escala raz , cuando f(x) = x .
Por este procedimiento ,es posible definir otras escalas como por ejemplo la
1
2
escala recproca cuando : f(x) = , o la escala cuadrtica cuando f(x)=x .
x
Una aplicacin muy importante de esta escala funcional es la llamada escala
gaussiana , que permite transformar la ojiva de un conjunto de datos en una
recta; y que se utiliza para identificar cuando una muestra proviene de una
Distribucin Normal mediante el uso de un papel especial conocido como
papel probabilstico .
Ejemplo 15 : Suponga que en un histograma de frecuencias construidos con
escala de raz cuadrada , existen tres clases , y que la altura de la primera clase
es la mitad de la altura de la segunda ; y que la altura de la tercera clase es una
vez y media la de la segunda . Calcule la frecuencia relativa porcentual de cada
una de las tres clases.
Solucin : Al ser un histograma con escala de raz cuadrada , las alturas estn
en proporcin a la raz cuadrada de las frecuencias ; por lo tanto:
f1 1
f3 3
9
9
f2 =
4f = 9 f1
y
f2 = 4 f1 y f3
4
4 1
f2 2
f2 2
Lo anterior significa entonces , que por cada unidad en la primera clase , hay
cuatro en la segunda y nueve en la tercera ; lo que nos lleva a la conclusin de
que por cada 14 unidades en la poblacin , 1 pertenece a la primera clase , 4 a
la segunda y 9 a la tercera.
La frecuencia relativa porcentual de cada clase es por consiguiente:
1
4
h1
100% = 7.14 % ;h2
100% = 28.57 %
;
14
14
9
h3
100% = 64.29 %
14
Grficos Estadsticos
Angel F. Arvelo L
55
Preguntas de Revisin
1) Cual es la diferencia entre el valor real y el valor aparente de una
medicin?.
2) Comente la veracidad o falsedad de la siguiente afirmacin : A pesar de
que las variables cuantitativas se clasifican en discretas y continuas , las
observaciones provenientes de ellas siempre son discretas.
3) Explique el procedimiento para pasar de un conjunto de datos puntuales a
una tabla agrupada de frecuencias . Es posible el proceso inverso ? .
4)Cual es la diferencia entre una tabla discreta de frecuencias y una
agrupada?.
Grficos Estadsticos
Angel F. Arvelo L
56
57
Grficos Estadsticos
Angel F. Arvelo L
49.5 - 99.5
12%
99.5-149.5
38%
Si se sabe que la muestra est formada por 500 datos , obtenga la tabla de
frecuencias absolutas , y dibuje el histograma .
4) Los siguientes datos representan las edades de un grupo de personas,
expresadas por aos cumplidos :
23 29 41 35 26 18 46 53 30 29 46 20 66 42 20
17 21 48 33 28 25 39 50 22 27 40 25 19 26 55
28 15 37 60 34 25 21 35 31 25 29 18 36 31 24
33 48 29 56 32 19 23 58 36 21 29 16 24 60 27
35 16 45 22 24 38 30 31 24 19 53 38 17 33 68
37 44 16 25 18 36 47 28 59 23 24 22 35 31 24
58 25 47 39 17 27 32 45 31 16 40 28 42 63 27
34 49 21 23 26 33 37 22 36 20 43 19 21 25 30
29 31 37 32 59 17 34 26 38 46 35 64 20 41 28
37 49 21 38 24 19 44 23 50 19 47 28 36 61 29
a) Agrupe convenientemente estos datos en una tabla de frecuencias.
58
Grficos Estadsticos
Angel F. Arvelo L
575
671
980
426
700
6.540
930
650
643
875
745
1.245
690
1.000
439
860
2.785
760
1.458
695
437
567
490
920
549
465
905
1.500
700
903
786
3.050
834
670
755
700
520
2.150
906
475
512
967
4.800
973
783
3.000
712
500
705
870
829
500
425
610
1.900
865
605
650
620
760
930
805
610
790
829
606
904
685
990
520
640
985
712
730
990
2.000
853
958
655
697
555
491
1.900
850
900
704
690
675
917
3.250
1.300
915
455
503
712
419
995
5.000
2.000
830
473
754
2.700
700
550
1.850
763
475
450
5.800
610
715
614
678
450
679
571
1.070
820
437
761
910
700
530
859
900
810
438
635
413
976
600
873
925
940
6.100
916
950
510
545
750
2.050
658
1.000
721
614
1.150
900
906
860
604
408
603
560
904
942
920
780
940
590
830
750
1.400
853
602
1.450
604
436
3.600
400
1.625
828
745
5.300
625
650
600
715
690
895
685
764
929
908
2.100
945
1.040
945
870
893
796
1.310
439
700
706
1.970
500
420
1.056
Tallo
49
49
50
50
51
51
52
52
53
53
54
Hoja
*
*
*
*
*
*
0001134
6888888899
00011112222234444
555677777788889999999
00011111233333334444444
5555666666677788899
0011111233344
567889
00012
589
3
59
Grficos Estadsticos
Angel F. Arvelo L
6.540 930
650
1056
439
860 2.785 760
437 950
942 5.300
761
510
920
625
910
545
780
650
700
750
940
600
530 2.050
590
715
859
658
830
690
900 1000
750
895
810
721
1.400
685
438
614
853
753
635 1.150 602
929
413
900 1.450
908
976
906
604
2.100
600 860
436
945
873 604
3.600
1.040
925 408
400
945
940 603
1.630
870
6.100 560
828
893
916
904
745
795
60
Grficos Estadsticos
Angel F. Arvelo L
Frecuencia
?
?
?
?
?
?
Frecuencia
Acumulada
?
?
122
180
200
Respuesta : Frecuencias : 12 , 39 , 71 , 58 y
Frecuencia Relativa
Porcentual
?
?
?
?
?
100.00 %
Frecuencia Relativa
Porcentual
Acumulada
6.00 %
25.50%
?
?
?
20 .
14) Suponga que en un histograma que considera cuatro clases construido con
escala de raz cuadrada, olvidaron colocar sobre el eje vertical la frecuencia de
cada clase , y que Ud. para averiguarlas mide con un escalmetro la altura de los
rectngulos que las representan .
61
Grficos Estadsticos
Angel F. Arvelo L
Si al medir las alturas , Ud. encuentra 3.40 , 5.00 , 7.80 y 1.70 centmetros .
Cual es la frecuencia relativa porcentual de cada una de las cuatro clases ?.
Respuesta : 11.53% , 24.93 % , 60.66 % y 2.88 % respectivamente .
15) Complete la siguiente tabla de frecuencias , para intervalos de igual
amplitud:
Lmites Reales
49.5 - 69.5
?
?
?
?
?
Total
Respuesta : x = 50
Frecuencia
x
?
3x
?
?
11
400
Frecuencia
Acumulada
Frecuencia Relativa
Porcentual
?
?
?
357
?
?
?
?
?
?
?
?
100.00 %
Frecuencia Relativa
Porcentual
Acumulada
?
32.50 %
70.00 %
?
?
?
Frecuencia
Densidad de Frecuencias
9.95- 12.5
12
?
?
15
3.00
? - 20.5
?
7.00
20.5 - ?
32
8.00
? - 29.5
?
2.00
29.5 - ?
?
1.00
Total
100
Respuesta : Frecuencias : 21 , 10 y 10
Lmites de clase : 12.5 a 17.5 , 17.5 a 20.5 , 20.5 a 24.5 , 24.5 a
29.5 y 29.5 a 39.5
III. Nivel Avanzado
17) En un histograma de frecuencias construido en escala logartmica en base
10, y que considera cuatro clases , las alturas de los rectngulos que las
representan son de 1.0000 cms , 1.7993 cms , 2.1614 cms y 2.7634 cms .
Calcule la frecuencia relativa porcentual de cada una de las cuatro clases .
Respuesta : 1.25 % , 7.89 % , 18.17 % y 72.69 % respectivamente
18) Demuestre que si un conjunto de valores est representado por respectivos
segmentos en escala logartmica de base cualquiera, al cambiar la base de los
logaritmos, la longitud de estos segmentos queda multiplicada por una
constante, y por lo tanto se mantiene la proporcin entre ellos .
Grficos Estadsticos
Angel F. Arvelo L
62