Você está na página 1de 62

Gráficos Estadísticos

Angel F. Arvelo L

ANGEL FRANCISCO ARVELO LUJAN


Angel Francisco Arvelo Luján es un Profesor Universitario Venezolano en el
área de Probabilidad y Estadística, con más de 40 años de experiencia en las
más reconocidas universidades del área metropolitana de Caracas.
Universidad Católica “Andrés Bello” : Profesor Titular Jubilado 1970 a 2003
Universidad Central de Venezuela: Profesor por Concurso de Oposición desde
1993 al presente
Universidad Simón Bolívar: Profesor desde 2005 al presente
Universidad Metropolitana: Profesor desde 1973 a 1987
Universidad Nacional Abierta: Revisor de contenidos, desde 1979 hasta 2004

Sus datos personales son :


Lugar y Fecha de Nacimiento: Caracas, 16-02-1947
Correo electrónico: angelf.arvelo@gmail.com
Teléfono: 58 416 6357636

Estudios realizados:
Ingeniero Industrial. UCAB Caracas 1968
Máster en Estadística Matemática CIENES , Universidad de Chile 1972
Cursos de Especialización en Estadística No Paramétrica Universidad de
Michigan 1982
Doctorado en Gestión Tecnológica: Universidad Politécnica de Madrid 2006 al
Presente

El Profesor Arvelo fue Director de la Escuela de Ingeniería Industrial de la


Universidad Católica “Andrés Bello” (1974-1979) , Coordinador de los
Laboratorios de esa misma Universidad especializados en ensayos de Calidad,
Auditor de Calidad, y autor del libro “Capacidad de Procesos Industriales” UCAB
1998.

En numerosas oportunidades, el Profesor Arvelo ha dictado cursos


empresariales en el área de “Estadística General” y “Control Estadístico de
Procesos”.

Una mayor información sobre otras publicaciones del Prof. Arvelo, pueden ser
obtenida en la siguiente página web: www.arvelo.com.ve
Gráficos Estadísticos 2
Angel F. Arvelo L.

CONSTRUCCION DE GRAFICOS ESTADISTICOS

1 Tablas de Frecuencias para datos cualitativos Al observar una


variable cualitativa, no obtenemos como resultado un valor numérico, sino un dato
perteneciente a una determinada clase o categoría; en virtud de lo cual, al
clasificar los datos muestrales , o poblacionales , de una variable cualitativa, lo que
se obtiene es una tabla que señala el número de veces que se ha encontrado
cada clase o categoría dentro de la muestra o dentro de la población , según sea
el caso.
El número de veces que se observa una determinada clase o categoría se llama
“frecuencia” , y la tabla que señala la frecuencia de cada clase o categoría “tabla
de frecuencias”.
Por ejemplo, supongamos que hemos tomado una muestra de estudiantes
universitarios, y le hemos preguntado a cada uno de ellos la carrera que cursan.
Al finalizar nuestra encuesta, encontraremos una tabla, como la siguiente:
Carrera Frecuencia

Derecho 34 Para construir la tabla es necesario contar el

Medicina 56 número de estudiantes pertenecientes a cada

Ingeniería 47 carrera, y transcribir en ella el resultado del conteo.

Economía 26 La frecuencia de cada carrera representa el total de

Sociología 17 estudiantes encontrados en ella.

Administración 20
TOTAL 200
Tabla 1
Puesto que la ubicación de cada elemento dentro de cada categoría se supone
que es una y solo una*1, es decir, que un mismo elemento no puede pertenecer
simultáneamente a dos categorías diferentes, resulta obvio que la suma de las
frecuencias da por resultado el total de observaciones realizadas.
Designando por: n = Número total de observaciones realizadas
k= Número de categorías
fi = Frecuencia de la categoría “i” .
i k
Se tiene: n = fi
i 1

1
De no cumplirse esta exigencia , tendrá que definirse algún criterio que permita definir la categoría única
a la cual pertenece cada elemento.
Gráficos Estadísticos 3
Angel F. Arvelo L.

Se define como frecuencia relativa de una determinada categoría, a la razón


entre su frecuencia, y el total de observaciones ; es decir :

fi fi
Frecuencia Relativa =hi= j k
n
fj
j 1

Generalmente esta frecuencia relativa se expresa en forma porcentual, y


representa cuantas partes por cada 100 del total , le corresponden a la categoría
en cuestión .

fi fi
Frecuencia Relativa Porcentual = hi% = j k 100% 100%
n
fj
j 1

i k
Para las frecuencias relativas se cumple: hi = 1
i 1
i n

i k i n fi
fi i 1 n
Demostración: hi = 1
i 1 i 1 n n n
Para las frecuencias relativas porcentuales, por una demostración análoga, se
i k
verifica: hi % = 100 %
i 1

Ejemplo 1: Calcular las frecuencias relativas, y la frecuencias relativas


porcentuales, para las categorías de la Tabla 1 .
i k
n= fi = 200
i 1

La frecuencia relativa , y la relativa porcentual de la categoría “Derecho” es:


34
hi = = 0,17 , hi% = 17%.
200
56
Para Medicina: hi = 0.28, hi %= 28.00%
200
Al hacer los cálculos para las demás categorías se encuentra:
Gráficos Estadísticos 4
Angel F. Arvelo L.

Frecuencia Relativa

Carrera Frecuencia Absoluta Frecuencia Relativa Porcentual

Derecho 34 0,170 17,00%

Medicina 56 0,280 28,00%

Ingeniería 47 0,235 23,50%

Economía 26 0,130 13,00%

Sociología 17 0,085 8,50%

Administración 20 0,100 10,00%

TOTAL 200 1,000 100,00%

2 Representación Gráfica de Datos Cualitativos. Uno de los objetivos


primordiales de la “Estadística Descriptiva”, es la elaboración de gráficas que de
una manera clara y precisa describan el comportamiento de los datos.
Para representar el comportamiento de datos cualitativos, los principales gráficos
son:
1º) El Histograma : Este gráfico conocido también como “gráfico de barras”
constituye la representación de la tabla de frecuencias, y según utilice frecuencias,
frecuencias relativas, o relativas porcentuales puede ser de tres tipos:
De frecuencias absolutas
De frecuencias relativas.
De frecuencias relativas porcentuales.
Lo más frecuente es que sea de frecuencias relativas porcentuales, por la gran
aceptación que tiene el uso de porcentajes.
Para construirlo, se trazan dos ejes cartesianos.
En eje horizontal se representan las categorías, y para ello se divide en tantos
segmentos de igual amplitud como categorías se tengan. Cada segmento
representa a una categoría.
En el eje vertical se representan las frecuencias.
A cada categoría se le asigna un rectángulo, de igual ancho (menor que la
amplitud del segmento ), centrado , y de altura igual a su frecuencia.
Así por ejemplo, para los datos de la Tabla 1, el histograma de frecuencias
relativas porcentuales, es el siguiente:
Gráficos Estadísticos 5
Angel F. Arvelo L.

Normas para construir un Histograma


a) Ancho de las clases : El ancho de las barras es arbitrario , pero debe ser igual
para todas las categorías, por dos razones fundamentales:
a.1 Para no establecer diferencias entre categorías.
a.2 Para que las áreas de los rectángulos resulten proporcionales a sus
A i fi
frecuencias. Al tener todos los rectángulos igual ancho, se verifica: ,
A j fj
siendo “A” el área y “f” la frecuencia de las categorías “i” y “j” .
b) Separación entre las barras o rectángulos: Para variables cualitativas, las barras
o rectángulos deben quedar separadas para no dar una sensación de continuidad.
Esta separación debe ser la misma para todas las barras.
c) Orden de colocación de las clases: El orden de colocación de las clases dentro
del histograma puede ser usado para manipular el mensaje de la gráfica, y así por
ejemplo , si se quiere disimular que una clase tiene baja frecuencia basta con
colocarla entre dos que tengan menos , o si se quiere resaltar que una clase tiene
mucha frecuencia se coloca entre las dos que tengan poca .
Por la razón anterior, al colocar las diferentes clases hay que respetar la siguiente
regla:
Si se trata de una variable nominal hay que ordenar en orden alfabético las
distintas categorías de la variable.
Si se trata de una variable ordinal, hay que colocar las diferentes categorías en
su orden natural, por lo general de menor a mayor.
d) Escala vertical: “Regla de los tres cuartos”: La selección de la escala vertical
tiene una gran influencia en la apariencia de la gráfica, pues si se elige una
escala demasiado grande, todos los rectángulos van a resultar con una altura
insignificante, y las diferencias de frecuencia entre ellos no será perceptible.
Gráficos Estadísticos 6
Angel F. Arvelo L.

Por ejemplo, los mismos datos de la tabla 1, representados con una escala vertical
hasta 100%, tendrían la siguiente apariencia:

El lector puede fácilmente apreciar que a pesar de ser los mismos datos, las dos
gráficas son significativamente diferentes, con distintos mensajes.
Para evitar que las escalas elegidas den lugar a gráficos que resulten
desproporcionados, se da esta regla conocida como “regla de los tres cuartos de
altura”:
En la construcción de un histograma de frecuencias (absolutas, relativas o
porcentuales), la escala vertical correspondiente a las frecuencias, debe ser tal
que la altura correspondiente al rectángulo de mayor frecuencia (el más alto), debe
ser aproximadamente igual a tres cuartos del ancho total del eje horizontal.

e) Ubicación del origen: La escala vertical del histograma debe ser aritmética, y
partir del origen “cero”.
Lo anterior significa que debe ser una escala de razón, y que iguales proporciones
entre las alturas de los rectángulos deben reflejar iguales proporciones entre las
frecuencias de las categorías..
Una de las maneras más fáciles de sorprender al lector de una gráfica en su
buena fe, es utilizar un origen diferente del cero, o utilizar una escala no aritmética.
Así por ejemplo, si la tabla de frecuencias relativas porcentuales correspondiente a
los datos de la Tabla 1, los representamos tomando como origen el 5%,
encontraremos la siguiente gráfica:
Gráficos Estadísticos 7
Angel F. Arvelo L.

Esta gráfica no se corresponde con la realidad de los datos, pues da la sensación


de que por ejemplo, hay el triple de estudiantes en “Derecho” que en “Sociología”,
que no es lo realmente encontrado en la muestra.

2°) Gráficos Circulares: Los gráficos circulares conjuntamente con los


histogramas constituyen la forma más frecuente de representar datos cualitativos.
Su construcción se fundamenta en que el área de un sector circular guarda con el
área de todo el círculo, la misma relación que su arco con toda la circunferencia:

En un gráfico circular , el círculo completo representa al conjunto total de datos,


mientras que el sector representa a una de las categorías , y se construye de
manera que el área del sector guarde con el área del círculo la misma proporción
que la frecuencia de la categoría guarda con el número total de datos; es decir:
Area del Sector "i" i fi fi
i = 2 .
Area del Circulo 2 n n
Como lo más frecuente es trabajar con el ángulo expresado en “grados” y no en
“radianes”, se concluye que para calcular el ángulo central “ i” correspondiente a
cada categoría “i”, se aplica a 2 = 360° , la frecuencia relativa de la categoría “i”:
fi
i = 360 = hi 360
n
Lo anterior puede ser resumido en los siguientes pasos para construir un gráfico
circular:
Paso 1: Se dibuja un círculo de radio arbitrario “R” .
Paso 2: Se calcula la frecuencia relativa de cada categoría .
Paso 3 : Se multiplica cada frecuencia relativa por 360° , obteniéndose así el
ángulo central correspondiente a cada categoría .
Gráficos Estadísticos 8
Angel F. Arvelo L.

Paso 4: Con un transportador se miden sobre el circulo, uno a continuación del


otro, los ángulos centrales correspondientes . Por lo general, los
ángulos se miden en el mismo sentido de las manecillas del reloj, y
comenzando desde el punto más alto de la circunferencia. Jamás se
señala sobre el gráfico, el valor del ángulo central.
Paso 5: Se trazan los radios correspondientes a cada sector, y se rellenan sus
áreas con colores que guarden cierta relación con la categoría
representada. Si se quiere, se puede indicar sobre el área de cada
categoría, su frecuencia relativa porcentual.
Ejemplo 2: Construir un gráfico circular para los datos de la Tabla 1 .
Una vez calculadas las frecuencias relativas de cada categoría, es necesario
calcular su ángulo central correspondiente: i = hi . 360° .
Los resultados después de ordenar a las categorías por orden alfabético, son los
siguientes:
CARRERA Frecuencia Relativa Angulo Central (°)
Administración 0.10 36.00
Derecho 0.17 61.20
Economía 0.13 46.80
Ingeniería 0.24 84.60
Medicina 0.28 100.80
Sociología 0.09 30.60
Total 1.00 360.00

Seguidamente, se dibuja un círculo de un radio cualquiera, dependiendo del


tamaño con que quiera hacer la gráfica, y comenzando por el punto más alto de la
circunferencia, y en sentido del reloj, se van midiendo uno a continuación del otro,
los diferentes ángulos centrales ,hasta cubrir la circunferencia completa.
Gráficos Estadísticos 9
Angel F. Arvelo L.

Es importante destacar que estos gráficos también son conocidos bajo el nombre
de "Gráficos de Pastel o de Torta" por la gran similitud que presentan con un
pastel picado en pedazos, señalando cuál pedazo le corresponde a cada
categoría.

3º) Gráficos de Figuras geométricas proporcionales: El principio básico en que


se fundamenta la construcción de gráficas estadísticas para representar
frecuencias, es el de proporcionalidad de áreas, según el cual las áreas de los
sectores deben guardar la misma relación que sus frecuencias.
Es decir, en todo gráfico estadístico de frecuencias debe cumplirse la siguiente
Area del sec tor " i" Frecuencia de la categoria" i"
relación:
Area del sec tor " j" Frecuencia de la categoria" j"
El lector puede fácilmente demostrar que tanto el histograma, como el gráfico
circular respetan este principio.
El gráfico de figuras geométricas proporcionales se utiliza fundamentalmente para
comparar las frecuencias o tamaños de las diferentes categorías, y para ello
selecciona un figura geométrica, generalmente un círculo o un cuadrado, y cada
figura representa a una categoría; no como en el caso del gráfico circular , donde
el sector representa a la categoría , y el círculo al total de datos.
El procedimiento para construir este tipo de gráficas es el siguiente:
Paso N° 1: Se selecciona el tipo de figura a utilizar
Paso N° 2: Las diferentes categorías se ordenan de menor a mayor frecuencia.
Paso N° 3: A la categoría de menor frecuencia se le asigna una figura de
dimensiones arbitrarias.
Paso N° 4: Se calculan las dimensiones que deben tener las figuras
correspondientes a las demás categorías, según el principio de
proporcionalidad de áreas.
Paso N° 5: Se representan las diferentes figuras, sobre un mismo eje, y dispuestas
de menor a mayor frecuencia.

Ejemplo 3: Representar los datos de la tabla 1, en un gráfico de cuadrados


proporcionales.
Solución: Según el procedimiento descrito anteriormente, tenemos:
Paso1:La figura a utilizar es el cuadrado .
Gráficos Estadísticos
Angel F. Arvelo L

Paso 2 : Se ordenan las categorías de menor a mayor frecuencia .

Carrera Frecuencia Absoluta

Sociología 17

Administración 20

Economía 26

Derecho 34

Ingeniería 47

Medicina 56

TOTAL 200

Paso N° 3: A la categoría de menor frecuencia, en este caso “Sociología” le


asignamos arbitrariamente un cuadrado de lado 30 mm.
Paso N° 4: Para calcular las dimensiones de los demás cuadrados, hay que tener
en cuenta de que el área de un cuadrado de lado "L" es L2 y por lo tanto, según el
L2i fi fj
principio de proporcionalidad de áreas, debe verificarse: Lj Li
L2j fj fi
El lado del cuadrado correspondiente a la segunda categoría, en este caso
20
Administración será: L 2 L1 = 32.54, pues L1= 30 mm.
17
Procediendo en forma análoga para las demás categorías se tiene:
26 34
Economía : L 3 L1 = 37.10 . Derecho: L 4 L1 = 42.43
17 17
47 56
Ingeniería: L 5 L1 = 49.88 . Medicina : L 6 L1 = 54.45
17 17
Paso N° 5: Por último se procede a dibujar los seis cuadrados , con centro sobre
un mismo eje, y en forma ascendente .
Gráficos Estadísticos 11
Angel F. Arvelo L

Otra situación en donde los gráficos de figuras geométricas proporcionales son


particularmente útiles, es cuando se quiere representar la evolución que ha
experimentado una cierta variable a lo largo del tiempo.

Ejemplo 4 : Supongamos que una canasta familiar está formada por un conjunto
de artículos de primera necesidad, y que el precio de esta canasta se ha ido
incrementando con el tiempo.
Supongamos que el precio de esta canasta en los últimos cinco años ha sido:
Año 1 2 3 4 5
Precio 2500 3700 4100 5000 6000
Representar en un gráfico de círculos proporcionales la evolución en el precio de
esta canasta familiar.
Solución: En este caso, el procedimiento a seguir es idéntico al descrito con
anterioridad, con la única diferencia que el área en lugar de representar
frecuencia, va a representar precio.
Al círculo correspondiente al año 1, se le asigna un radio arbitrario, y el radio de
los demás círculos se determina por proporcionalidad de áreas.
(Pr ecio)i ri2 (Pr ecio)i
Como el área de un círculo es A= r2 2 ri r1
(Pr ecio)1 r1 (Pr ecio)1
Haciendo los cálculos, se obtiene: r1 = 40 mm ( arbitrario)
3700 4100
r2 r1 = 48.66 ; r3 r1 = 51.22 ;
2500 2500
5000 6000
r4 r1 = 56.57 ; r5 r1 = 61.97
2500 2500
El gráfico de círculos proporcionales resulta:

4°) Diagramas de Pareto: Cuando se investigan las posibles causas que pueden
generar un determinado problema, es frecuente que el investigador desee
identificar cuáles son las causas más importantes , a fin de centrar su atención en
ellas, y no diluir su esfuerzo en la corrección de causas de poca importancia.
Gráficos Estadísticos 12
Angel F. Arvelo L

El economista italiano Vilfredo Pareto ( 1848 - 1923) estableció que las causas
que ocasionan un determinado problema pueden ser clasificadas como las “pocas
vitales” y las “muchas triviales”. Las primeras son aquellas pocas causas que
ocasionan el problema la mayor parte de las veces; mientras que las segundas
son aquellas muchas causas que ocasionan el problema raras veces.
Este principio de Pareto dio origen a una regla conocida como bajo el nombre del
80-20 , según la cual , el 80% de las veces el problema es ocasionado por el 20%
de las causas.
El objetivo del diagrama de Pareto, es identificar los “pocos vitales”, es decir ese
20% de causas importantes, a fin de centrar la acción correctiva en ellas.
En un diagrama de Pareto, la variable cualitativa en estudio, es la causa que
ocasionó un determinado problema, y para construirlo se procede como sigue:
Paso N°1: Se elabora una tabla de frecuencias para las causas que han
ocasionado un determinado problema. Se supone que cada vez que se ha
presentado el problema ha sido por una y sola una de las causas.
Paso N° 2: Se ordenan estas causas de mayor a menor frecuencia.
Paso N° 3 : Se calcula la frecuencia relativa porcentual de cada causa.
Paso N°4 : Las frecuencias relativas porcentuales se acumulan, sumando la
frecuencia relativa porcentual de cada causa con todas las anteriores.
Paso N° 5: El eje horizontal se divide en segmentos de igual amplitud, tantos como
causas se tengan . Cada segmento representa a una causa, y estas quedan
ordenadas de mayor a menor frecuencia.
Paso N° 6 : Para cada causa se construye un rectángulo de altura igual a su
frecuencia relativa porcentual .
Paso N° 7: Para cada causa , sobre la recta vertical que pasa por el punto medio
de su segmento , se ubica un punto a una altura igual a su frecuencia relativa
porcentual acumulada.
Paso N° 8 : Los diferentes puntos obtenidos en el paso anterior se unen mediante
segmentos rectos .

Ejemplo 5 : Supongamos que en una industria se hizo un seguimiento, acerca de


las causas que ocasionaron la interrupción del trabajo en una cierta máquina.
Los resultados obtenidos fueron:
Gráficos Estadísticos 13
Angel F. Arvelo L

Causa de la interrupción Frecuencia

Falta de energía eléctrica 4

Fatiga del operario 32

Manejo incorrecto 17

Falta de suministro 30

Falta de lubricación 7

Falta de calibración 11

Falla mecánica 6

Operador ausente 3

Otros 6

Hacer el Diagrama de Pareto correspondiente, e interpretarlo.


Solución: Hay que ordenar las causas por orden de frecuencia, de mayor a menor,
calcular la frecuencia relativa porcentual de cada una, y luego acumularlas, tal
como se muestra en la tabla a continuación.
Causa de la interrupción Frecuencia Frecuencia Relativa Frecuencia relativa porcentual

porcentual acumulada

Fatiga del Operario 32 27.59 % 27.59 %

Falta de suministro 30 25.86 % 53.45 %

Manejo incorrecto 17 14.66 % 68.10 %

Falta de calibración 11 9.48 % 77.59 %

Falta de lubricación 7 6.03 % 83.62 %

Falla mecánica 6 5.17 % 88.79 %

Otras 6 5.17 % 93.97 %

Falta de energía eléctrica 4 3.45 % 97.41 %

Operador ausente 3 2.59 % 100.00 %

TOTAL 116 100.00 %

De la tabla se deduce que las causas más importantes son las cuatro primeras,
pues entre ellas acumulan el 77.59 % de las interrupciones, de manera que a la
hora de tomar las medidas correctivas necesarias para combatir estas
interrupciones , se tendrán identificadas las causas más importantes.
El diagrama de Pareto correspondiente es el siguiente:
Gráficos Estadísticos 14
Angel F. Arvelo L

5°) Gráficos polares : Este tipo de gráficas se utiliza principalmente para


representar la evolución de una cierta variable en el tiempo.
Para construirlo los pasos son los siguientes:
Paso N° 1: Se traza una circunferencia cualquiera.
Paso N° 2: Comenzando desde el punto más alto de la circunferencia, y en el
sentido de giro de las manecillas del reloj , se divide la circunferencia en tantos
arcos como clases se tengan , para lo cual se divide 360 ° en tantas partes como
clases se tengan .
Paso N° 3 : Se trazan los radios correspondientes a cada uno de los puntos que
dividen a la circunferencia en partes iguales . Estos radios representan a las
diferentes clases de la variable en estudio.
Paso N° 4: Sobre cada uno de esos radios, y tomando como origen el centro de la
circunferencia, se construyen segmentos de longitud igual a la frecuencia, o al
valor de la variable, para cada categoría.
Paso N° 5: Se borra la circunferencia inicial, y los puntos extremos de los
diferentes segmentos consecutivos se unen mediante trazos rectos.
Ejemplo 6 : Supongamos que el precio de un artículo a lo largo del año ha venido
experimentando sucesivos aumentos, y que la siguiente tabla expresa cual ha sido
su precio al cierre de cada uno de los meses del año:
Mes Enero Feb. Marzo Abril Mayo Junio Julio Agosto Sept. Oct. Nov. Dic.
Precio 100 105 108 108 110 114 115 120 133 150 170 184
Gráficos Estadísticos 15
Angel F. Arvelo L

Construir un gráfico polar para mostrar la evolución de los precios de este artículo
durante el año.
Solución : En este caso , como se tienen doce categorías , cada radio va a ser
360
trazado con centro en el origen , y con una separación de 30° .
12
Sobre cada uno de ellos, y en forma consecutiva se va a representar un segmento
de longitud igual al precio del artículo en ese mes, y siguiendo los pasos antes
señalados se obtendrá la siguiente gráfica polar:

Es de hacer notar que en este caso, como hubo un continuo aumento en el precio
del artículo a lo largo de todo el año, el radio correspondiente a cada mes fue cada
vez mayor, dando lugar a una curva en forma de espiral, que es la llamada “espiral
inflacionaria”, tan conocida en nuestro país .

7º) Pictogramas: Son gráficos en donde se utiliza un símbolo, que generalmente


guarda cierta relación con la variable que se quiere representar, para expresar su
frecuencia o valor.
Así por ejemplo, si se quisiera representar la población de diversos países,
podríamos hacerlo dibujando una silueta humana, y diciendo que cada una de
ellas representa una población de digamos 1.000.000 habitantes; de esa forma en
lugar de indicar la cifra numérica que corresponde a la población de cada país, lo
Gráficos Estadísticos 16
Angel F. Arvelo L

haríamos colocando tantas siluetas humanas como millones de habitantes tenga


ese país.

8º) Cartogramas: Este tipo de gráfica se utiliza cuando la variable cualitativa que
se quiere representar es la ubicación geográfica .
Para construirlo, se dibuja el mapa de la región y se van colocando sobre las
diferentes localidades señales que indiquen el valor de la variable en esa
localidad.
También es posible, en lugar de indicar el valor numérico o frecuencia de la
variable para cada localidad , colocar un símbolo que guarde relación con la
variable, y sobre el mapa colocar tantas veces el símbolo como frecuencia o valor
tenga la variable en esa localidad , dando, lugar así a un pictograma dibujado
sobre un mapa.
Así por ejemplo, si quisiéramos representar como se distribuye la producción
petrolera de Venezuela en las diferentes regiones del país, podríamos seleccionar
un símbolo, como por ejemplo el barril “”, hacer una equivalencia y decir que
cada barril dibujado representa una producción de por ejemplo “ = 50.000
barriles diarios “ en esa región, y luego dibujar sobre cada región en el mapa de
Venezuela , tantos barriles como sea su producción .

9º) Dos variables Cualitativas: En este caso, los datos se organizan en una
tabla llamada “tabla de contingencia”, la cual tiene una forma matricial con filas
y columnas, que corresponden a cada categoría de las variables cualitativas en
consideración.
En cada cruce de fila de con columna, se coloca la frecuencia absoluta que le
corresponde a esa combinación.
Por ejemplo, supongamos que las dos variables cualitativas en consideración
son “A” y “B”, y que “A” tiene “k” categorías, mientras que “B” tiene “h”. La tabla
de contingencia tiene por consiguiente “k” filas y “h” columnas , y en cada casilla
se coloca la frecuencia que le corresponde a la fila y columna correspondiente.
.......
B1 B2 Bh Total El total de la fila representa el
.......
A1 f11 f12 f1h f1. número de observaciones que se
.......
A2 f21 f22 f2h f2. encontraron en cada una de las
....... ....... ....... ....... .......
fij categorías de “A” , y se llama
.......
Ak fk1 fk2 fkh fk. “Frecuencia marginal” de “A”.
.......
Total f.1 f.2 f.h n
Gráficos Estadísticos 17
Angel F. Arvelo L

Análogamente, el total de la columna, representa la frecuencia de cada una de


las categorías de la variable “B”, y recibe el nombre de “Frecuencia marginal de
B”.
La notación a seguir es la siguiente:
fij = Frecuencia de casilla ubicada en la fila “i”, y la columna “j”.
j h
fi. = fij = Frecuencia marginal de la fila “i” .
j 1
i k
f.j = fij = Frecuencia marginal de la columna “j” .
i 1
i k j h i k j h
n= fij = fi. = f.j = Número total de observaciones.
i 1 j 1 i 1 j 1
Una tabla de contingencia, puede ser representada gráficamente de varias
maneras, como en el siguiente ejemplo.

Ejemplo 7 A un grupo de estudiantes universitarios, se le preguntó la carrera


que cursan y su sexo. Los resultados se dan en la siguiente tabla:
CARRERA
SEXO Derecho Economía Ingeniería Letras Medicina Total
Hombre 71 63 84 16 53 287
Mujer 95 52 57 31 78 313
Total 166 115 141 47 131 600
Hacer la representación gráfica de estos datos.

Solución: Los totales de fila y de columna representan las frecuencias


marginales de cada variable.
Para hacer la representación gráfica, existen las siguientes alternativas:

a) El histograma tridimensional : En este gráfico, se selecciona a uno de los ejes,


por ejemplo el “X” para una de las variables, al eje “Y” para la otra variable, y al
eje “Z” para las frecuencias.
Los ejes “X” y “Y” se dividen en tantos segmentos de igual longitud como
categorías tengan cada una de las variables, quedando así el plano “XY”
cuadriculado.
Sobre cada cuadro, se construye un prisma rectangular con altura igual a la
frecuencia, obteniendo el siguiente gráfico:
Gráficos Estadísticos 18
Angel F. Arvelo L

100
90
80
70
60
Frecuencias50
40
Hombre
30
Mujer
20
10
0
Mujer
SEXO
Derecho
Economía Hombre
Ingeniería
Letras
Medicina
CARRERA

b) El Histograma Doble. Con las frecuencias marginales de una de las variables


se construye un histograma convencional, y luego el rectángulo que corresponda
a cada categoría de esta variable se divide en partes proporcionales según la
otra variable.
Así por ejemplo, si se construye el histograma para las carreras, y luego el
rectángulo que señala que señala la frecuencia de cada carrera se divide según
el sexo de los estudiantes que la cursan, se obtiene el siguiente gráfico:
Frecuencias
180
160
140
120
100 Mujer
80
60 Hombre
40
20
0
Derecho Economía Ingeniería Letras Medicina CARRERA

Si en lugar de construir el histograma para las carreras, se construye el del sexo,


se obtiene este otro gráfico:
Gráficos Estadísticos 19
Angel F. Arvelo L

350
Medicina
300
frecuencia

250 Letras
200
Ingeniería
150
100 Economía
50 Derecho
0
Hombre Mujer

SEXO

También es posible construir el histograma doble, colocando en el eje horizontal


a una de las variables y luego, en lugar de representar su frecuencia marginal,
construir tantos rectángulos como categorías tenga la otra variable, colocándolos
uno al lado del otro sin suponerlos, dando lugar a los siguientes gráficos:

100
90
80
frecuencia

70
60 Hombre
50
40 Mujer
30
20
10
0
Derecho Economía Ingeniería Letras Medicina

CARRERAS

100
90
Derecho
80
70 Economía
frecuencia

60
50 Ingeniería
40
30 Letras
20
Medicina
10
0
Hombres Mujeres

SEXO
Gráficos Estadísticos 20
Angel F. Arvelo L

c) Gráficos Circulares. Estos consisten en utilizar un gráfico circular, para


representar la forma como se distribuye cada categoría de una de las variables
según la otra.
Así por ejemplo, para representar la distribución de la población masculina y
femenina, según las diferentes carreras, tendríamos:
Población Masculina Población Femenina

Derecho Derecho
18% Economía 25% 30% Economía
25%
6%
Ingeniería Ingeniería
10%
29% 22% Letras Letras
17%
18% Medicina
Medicina

Otra posibilidad es señalar la distribución por sexo en cada carrera, dando lugar
a los siguientes gráficos circulares:
Derecho Economía

Hombres 45% Hombres


43%
57% Mujeres 55% Mujeres

y así sucesivamente, con las demás carreras.


También es posible construir gráficos con las frecuencias marginales de cada
variable, en donde no se tome en consideración a la otra.
Gráficos Estadísticos 21
Angel F. Arvelo L

Distribución de estudiantes por carreras Distribución de estudiantes por sexo

Derecho
22%
28% Economía
Hombres
8% Ingeniería 48%
Letras
52% Mujeres
19%
23% Medicina

Obviamente, la decisión acerca de cuál es el gráfico más conveniente, depende


del mensaje que se quiera trasmitir con él, y de los aspectos que más se quieran
resaltar. No hay que olvidar el objetivo de la Estadística Descriptiva, cual es el
de proporcionar técnicas que permitan de una manera fácil y precisa, resumir el
comportamiento de los datos.

Ejemplos Resueltos

Ejemplo 7: Los siguientes datos representan el grado de instrucción de una


muestra de personas adultas:

Grado de Instrucción Frecuencia


Secundaria 237
Post-grado 31
Ninguna 2
Primaria 43
Universitaria 187
Total 500
Construir un Histograma de Frecuencias Absolutas, y otro de Frecuencias
Relativas porcentuales para estos datos.
Solución: En este caso, estamos en presencia de una variable cualitativa, pero
ordinal, y por tanto hay que ordenar las diferentes clases en orden creciente en
lugar de orden alfabético.
El Histograma de Frecuencias absolutas es como sigue:
Gráficos Estadísticos 22
Angel F. Arvelo L

Va ria ble Ord ina l

250

200

150
Fre cue ncia
100

50

0
Ning una Prima ria Se cund aria Unive rsit. Po st-g ra d o

Gra do d e Instrucció n

En lo que se refiere al histograma de frecuencias relativas porcentuales, es


necesario calcular el porcentaje de cada clase con relación al total de adultos
observados, en este caso 500,y se encuentra :

Ejemplo 8 : En una encuesta, se le preguntó a un grupo de familias acerca de su


nivel de ingresos.
Una vez procesada la encuesta, se encontró que el 5 % de las familias eran de
muy altos ingresos, el 25 % eran de altos ingresos, el 40 % eran de ingresos
medios y el 30% restante eran de bajos ingresos.
Gráficos Estadísticos 23
Angel F. Arvelo L

Graficar estos resultados en:


a) Un histograma de frecuencias relativas porcentuales .
b) Un gráfico circular .
c) En un gráfico de cuadrado proporcionales.
d) En un gráfico de círculos proporcionales.

Solución: a) Para construir el histograma es necesario tomar de nuevo en


consideración que se trata de una variable ordinal , y que por lo tanto las
diferentes clases deben ser representadas en orden creciente , y no en orden
alfabético.

b) Para construir el gráfico circular se le aplica la frecuencia relativa porcentual


correspondiente de cada categoría a 360° , obteniendo sus respectivos ángulos
centrales , que resultan ser 108° , 144° , 90° y 18° respectivamente .
Gráficos Estadísticos 24
Angel F. Arvelo L

c) Para construir tanto el gráfico de cuadrados como el de círculos proporcionales,


se toma como base la clase de menor frecuencia en este caso “muy altos
ingresos” .
A esta categoría se le da un lado , o un radio arbitrario de por ejemplo 20 mm , y
las demás se calculan en proporción obteniendo:
25
Altos Ingresos : Lado ó Radio = 20 = 44.72
5
30
Bajos ingresos : Lado ó Radio = 20 = 48.99 mm .
5
40
Ingresos medios : Lado ó Radio = 20 = 56.57 mm.
5
Las respectivas gráficas resultan :

Ejemplo 9 : En un estudio de calidad se hizo un seguimiento acerca de los


defectos presentados por los automóviles ensamblados en una cierta fábrica. Los
resultados fueron
Tipo de defecto Frecuencia

Pintura defectuosa 8

Ruidos 86

No cierran bien las puertas 11

Cables defectuosos 6

No funciona el radio 36

Batería defectuosa 15

Falla de bujías 19
Gráficos Estadísticos 25
Angel F. Arvelo L

Amortiguadores defectuosos 6

Aire acondicionado defectuoso 45

No encienden las luces 10

Frenos defectuosos 4

Otros 12

Construir un diagrama de Pareto, para identificar aquellos defectos que mas


afectan la calidad de los automóviles ensamblados en esta fábrica .
Solución : Según lo ya explicado , se ordenan los defectos de mayor a menor
frecuencia , se calculan las frecuencias relativas porcentuales , y las porcentuales
acumuladas, tal como en la tabla a continuación :
Tipo de defecto Frecuencia Porcentaje Acumulado

Ruidos 86 33.33 % 33.33 %

Aire Acondicionado defectuoso 45 17.44 % 50.78%

No funciona el radio 36 13.95 % 64.73 %

Falla de Bujías 19 7.36 % 72.09 %

Batería defectuosa 15 5.81 % 77.91 %

Otros 12 4.65 % 82.56 %

No cierran bien las puertas 11 4.26 % 86.82 %

No encienden las luces 10 3.88 % 90.70 %

Pintura defectuosa 8 3.10 % 93.80 %

Amortiguadores defectuosos 6 2.33 % 96.12 %

Cables defectuosos 6 2.33 % 98.45%

Frenos defectuosos 4 1.55 % 100.00 %

TOTAL 258 100.00 %

En la tabla puede apreciarse que las cuatro primeras causas ocasionan el 72.09%
de los defectos, y el diagrama de Pareto es el siguiente
Gráficos Estadísticos 26
Angel F. Arvelo L

Ejemplo 10 : Los siguientes datos representan las ventas de una empresa


distribuidas en los cuatro trimestres del año:
Trimestre Primero Segundo Tercero Cuarto
Ventas 600.000 750.000 800.000 1.000.000
Representar el crecimiento de las ventas en esta empresa, mediante :
a) Un gráfico de círculos proporcionales.
b) Un gráfico polar.
Solución : a) Para construir el gráfico de círculos proporcionales , tomamos como
base el primer trimestre, le damos un radio arbitrario de 30 mm, y los demás
resultan ser de:
750 800 1000
r2 = 30 = 33.54 ; r3 = 30 = 34.64 ; r4 = 30 = 38.73
600 600 600

El gráfico polar estará formado por cuatro radios polares separados a 90° , y de
longitud igual a las ventas de cada trimestre .
Gráficos Estadísticos 27
Angel F. Arvelo L

Ejemplo 11 : Complete la siguiente tabla de frecuencias:


Categoría Frecuencia Frecuencia relativa porcentual
A ? 19.0%
B 57 ?
C ? 32.0%
D ? ?
Total 200 ?
Solución : La suma de las frecuencia relativas porcentuales debe ser 100% .
57
hB% = 100% = 28.50 % hD % = 100% - 19.0% -28.5%- 32.0% = 20.50%
200
fi hi %
Para cada categoría debe verificarse : hi % 100% fi n
n 100%
19% 32%
En nuestro caso: n = 200 fA 200 = 38 ; fC 200 = 64 ;
100% 100%
20.5%
fD 200 = 41 , lo que completa la tabla.
100%

Ejemplo 12 : Complete la siguiente tabla de frecuencia:


Categoría Frecuencia Frecuencia relativa porcentual
A x ?
B 2x 16%
C 3x ?
D 100 ?
E 30 ?
Gráficos Estadísticos 28
Angel F. Arvelo L

Total ? ?
Solución : El total de datos n= x + 2 x + 3 x + 100 + 30 = 6 x + 130
fB 2x
Para la categoría B se tiene : hB % 100% 100% 16%
n 6 x 130
Despejando “x” se obtiene: 2 x = 0.16 (6 x + 130) = 0.96 x + 20.80
De donde : 1,04 x = 20.80 x = 20
Por lo tanto los valores que faltan en la tabla son:
fA = 20 ; fB = 40 ; fC = 60 ; n = 250 ; hA % = 8% ; hc % = 24% ; hD % = 40%
hE % = 12% . Total = 100% .

Ejemplo 13 En una encuesta electoral , se le preguntó a personas de ambos


sexos , su preferencia entre tres candidatos A, B y C encontrándose:

Suponiendo que en esta población existen 45% de hombres y 55% de mujeres ,


calcule el porcentaje de votos a favor de cada candidato .
Solución : No se dice cuantos habitantes hay en esta población , pero en realidad
no hace falta , pues basta con tomar un número cualquiera “N” , de por ejemplo
100.000 .
Sobre esta base , tenemos que 55.000 son mujeres y 45.000 hombres .
La preferencia de las 55.000 mujeres entre los tres candidatos es como sigue:
Para A : 39% de 55.000 = 21.450 ; para “B” : 28% de 55.000 = 15.400 , mientras
que para el candidato “C” : 33% de 55.000 = 18.150 .
Para los 45.000 hombres se tiene : Para “A” : 52% de 45.000 = 23.400 , para el
candidato “B”: 29% de 45.000 = 13.050 ; y para “C” : 19% de 45.000 = 8550 .
Gráficos Estadísticos 29
Angel F. Arvelo L

En consecuencia , por cada 100.000 habitantes , el número total de simpatizantes


para cada candidato es :
Para A : 23.400 hombres + 21.450 mujeres = 44.850 simpatizantes .
Para B : 13.050 hombres + 15.400 mujeres = 28.450 simpatizantes .
Para C: 8.550 hombres + 18.150 mujeres = 26.700 simpatizantes .
En consecuencia , sobre la población total, el porcentaje de simpatizantes para
cada candidato es : 48.85 % para “A” , 28.45 % para “B” y 26.70 % para “C” .

Ejemplo 14 En un estudio electoral, se clasificó a un grupo de personas


seleccionadas al azar , según su condición económica, y según el candidato de su
preferencia. Los resultados fueron :
Condición
Económica Candidato “A” Candidato “B” Candidato “C” Candidato “D”
Baja 95 32 235 58
Media 143 12 94 21
Alta 72 15 9 14
a) Construya un diagrama circular que señale las preferencias hacia a cada
candidato , en base a toda la muestra .
b) Construya un gráfico circular , que señale las preferencias hacia cada
candidato, entre las personas de condición económica baja.
c) Construya un histograma de frecuencias relativas que señale la composición
por niveles socio económicos, para los simpatizantes del candidato “D.

Solución: a) La distribución marginal de frecuencias para cada candidato se


obtiene sumando sobre las filas, y se obtiene:

Candidato “A” Candidato “B” Candidato “C” Candidato “D” Total


Frecuencia 310 59 338 93 800

D
11,63%

Con las frecuencias marginales A


correspondientes a cada candidato, se 38,75%
C
procede a construir el gráfico circular. 42,25%
B
7,38%
Gráficos Estadísticos 30
Angel F. Arvelo L

b) La preferencia de las personas de


condición socio económica baja, D
aparecen señaladas en la primera fila 13,81%
de la tabla bidimensional de A
frecuencias, y con ella se elabora el 22,62%
B
correspondiente gráfico circular, C 7,62%
tomando en consideración que la 55,95%
frecuencia marginal es 420, lo que
arroja para el candidato
“A” por ejemplo, una frecuencia relativa
95
de: 100% = 22,62 % .
420

Simpatizantes Candidato "D"


c) La distribución de los simpatizantes
del candidato “D” por niveles socio 70 62,37
económicos viene dada en la última 60
columna de la tabla, con una frecuencia 50
Porcentaje

40
marginal de 93, lo que da para el nivel
30 22,58
“Bajo”, por ejemplo, una frecuencia 20 15,05
58 10
relativa de : 100% = 62,37 % 0
93
Baja Media Alta
Condición Economica

Preguntas de Revisión
1°) ¿ Por qué es importante que en un histograma de frecuencias, la escala
vertical sea lineal , y su origen sea el cero ? . De ejemplos .
2°) Si se construye un histograma de frecuencias dándole diferente ancho a las
categorías, ¿ se cumple el principio de proporcionalidad de áreas ? .
3°) ¿ Cual es la diferencia entre un gráfico circular , y uno de círculos
proporcionales ? .
4°) ¿ Cual es el objetivo de un Diagrama de Pareto ? .
5°) ¿ Porqué es recomendable colocar en orden alfabético a las diferentes
categorías de una variable nominal ? .
Gráficos Estadísticos 31
Angel F. Arvelo L

6°) En gráfico polar , ¿ como se representan las frecuencias correspondientes a


cada categoría ? .
7°) Si un gráfico polar resulta ser un polígono regular que puede ser inscrito en
una circunferencia , ¿ como lo interpreta Ud. ? .
8°) ¿ Cuando conviene utilizar un cartograma ? .
9°) Si se decide utilizar triángulos isósceles de igual base , para representar a las
diferentes categorías de una variable cualitativa en un gráfico de figuras
proporcionales, ¿que relación deben guardar sus alturas ? .

10°) Al clasificar a los elementos de una población en una tabla de frecuencias


según categorías de una variable cualitativa , ¿ qué debe hacerse y por qué , si
existe la posibilidad de que un mismo elemento pertenezca simultáneamente a dos
ó mas categorías a la vez ? . De ejemplos.

PROBLEMAS PROPUESTOS

I - Nivel Elemental

1 Una empresa de artículos del hogar vendió durante el año pasado, los
siguientes montos, en cada una de sus líneas:
Neveras…………………............. 1.200.000
Cocinas...................................... 500.000
Lavadoras................................. 200.000
Secadoras................................. 350.000
Televisores............................. 800.000

a) Construya un gráfico circular, que exprese la forma como se distribuyen las


ventas de esta empresa entre los diferentes artículos que vende.
b) Construya un gráfico de cuadrados proporcionales, para expresar como son,
en proporción, las ventas de los diferentes artículos.

2 Suponga que al leer un gráfico circular, en donde intervienen cuatro


categorías, Ud. encuentra que por error no aparecen señalados sobre él, las
frecuencias relativas porcentuales correspondientes a cada categoría ,y que Ud.
para averiguarlas, toma un transportador y mide los ángulos centrales,
encontrando 130º ,75º , 60º y 95º respectivamente. ¿Cuáles son las frecuencias
relativas porcentuales correspondientes ?.
Respuesta : 36.11 % , 20.83 % , 16.67 % y 26.39%
Gráficos Estadísticos 32
Angel F. Arvelo L

3 En la sala de emergencias de un hospital, se hizo un seguimiento sobre las


causas que motivaron el ingreso de los pacientes. Los resultados fueron :

Motivo del ingreso Frecuencia


Herida por arma de fuego 63
Herida por arma blanca 25
Accidente de transito 96
Coma diabético 11
Problemas cardíacos 83
Convulsiones 8
Intoxicación 13
Fiebre alta 6
Otros 14

Haga un diagrama de Pareto para esta situación , e interprete el resultado.

4 En un estudio económico se analizó el precio de la canasta básica durante los


últimos ocho años, encontrándose :
Año 1 2 3 4 5 6 7 8
Precio 520 610 650 700 830 850 1000 1240
Represente la evolución en el precio de la canasta básica en:
a) Un gráfico de círculos proporcionales.
b) Un gráfico polar.

I I- Nivel Intermedio

5 Demuestre que en un gráfico circular, las áreas de los sectores que


corresponden a cada categoría, están en la misma proporción que sus
respectivas frecuencias.

6 En una encuesta electoral donde intervienen tres candidatos, se encontró que


los electores a favor de ellos, están en proporción 2:3:5 .Represente este
resultado en:
a) Un histograma de frecuencias relativas porcentuales
b) Un diagrama circular.
c) Un gráfico de círculos proporcionales.

7 Complete la siguiente tabla de frecuencias :


Categoría Frecuencia absoluta Frecuencia relativa porcentual
A ? 8.00 %
B 48 32.00 %
C 36 ?
D ? ?
E 39 ?
Total ? ?
Gráficos Estadísticos 33
Angel F. Arvelo L

Respuesta: fA = 12 , hC%= 24.00% , fD= 15 ,hD%= 10.00% , hE%= 26.00% ,


n=150

I I I- Nivel Avanzado

8 Suponga que al interpretar un gráfico de cuadrados proporcionales en donde


intervienen tres categorías, Ud. encuentra que el cuadrado correspondiente a la
primera categoría tiene 4 cms. de lado, el correspondiente a la segunda
categoría 7 cms. de lado, y el correspondiente a la tercera categoría 10 cms. de
lado. ¿Que porcentaje de la población corresponde a cada categoría? .
Respuesta: 9.70 % , 29.69 % y 60.61 %

9 Complete la siguiente tabla de frecuencias:


Categoría Frecuencia Absoluta Frecuencia relativa porcentual (%)
A x ?
B 2x ?
C 40 ?
D ? 15%
Total 5x ?

Respuesta: x= 32 , fD= 24

10 En un estudio de mercado , se consideraron cuatro marcas de jabón


detergente A, B , C y D . Las amas de casa entrevistadas fueron clasificadas en
tres categorías según su condición económica, en : Baja, Media y Alta .
El resultado de la encuesta se muestra en la siguiente gráfica:

Suponiendo que las clases baja , media y alta están en razón de 4:5:1
respectivamente, calcule el porcentaje de mercado que le corresponde a cada
una de estas cuatro marcas de jabón detergente, y utilícelas para construir:
a) Un gráfico circular.
b) Un gráfico de cuadrados proporcionales.
Respuesta: A :17.50% , B: 31.10% , C: 33.10 % , D: 18.30% .
Gráficos Estadísticos 34
Angel F. Arvelo L

11 Complete la siguiente tabla de frecuencias:


Categoría Frecuencia Absoluta Frecuencia Relativa Porcentual
A x 25%
B y ?
C 3y 18%
D 5 ?
E 2x ?
Total ? ?

Respuesta: x = 125 ; y = 30

3 . Tablas de Frecuencias para datos cuantitativos


Un dato cuantitativo es el resultado de medir una variable cuantitativa , como por
ejemplo , una estatura , un peso , etc., y será siempre un valor numérico , dentro
de una escala de intervalos , o dentro de una escala de razón.
Hay que recordar sin embargo, que la distinción entre datos provenientes de una
variable discreta y datos provenientes de una variable continua, tiene más un
valor teórico que práctico, ya que en la práctica todos los datos son discretos,
debido que al medir una variable continua, los instrumentos de medida no
permiten pasar más allá de un cierto límite de precisión, y por lo tanto el resultado
de nuestra observación no podrá tener más cifras decimales que las que el
instrumento de medición nos permita apreciar.
Cuando se tiene una colección de datos cuantitativos, existen tres posibilidades
para realizar el tratamiento:
a) Tratamiento puntual o sin agrupar : Esta forma de tratamiento consiste en
conservar todas las mediciones , sin efectuar ningún tipo de clasificación ni
agrupamiento .
El tratamiento puntual , o sin agrupar tiene la ventaja de que es más preciso
pues conserva cada dato en su valor exacto ( con las limitaciones de medición
ya mencionadas anteriormente para el caso continuo) , pero tiene la gran
desventaja de que resulta incómodo el tratamiento .
Solo es recomendable en el caso de muestras muy pequeñas, en donde
cualquier otro tipo de tratamiento provocaría una pérdida casi total de la
información .
b) Tabla puntual o discreta de frecuencias : Esta segunda alternativa consiste en
elaborar una tabla de frecuencias del mismo estilo ya explicado anteriormente
para el caso de “Variables Cualitativas” .
Este tipo de tabla de frecuencias expresa el número de veces que se repite cada
valor de la variable cuantitativa, y sólo es recomendable para variables discretas
que toman un número muy reducido de valores diferentes, y que al tener un
rango de variación pequeño no permite efectuar un agrupamiento.
Gráficos Estadísticos 35
Angel F. Arvelo L

En una tabla puntual de frecuencias , el dato conserva su valor exacto, y la


frecuencia le corresponde exclusivamente a él.
Al igual que en el caso cualitativo, la frecuencia relativa expresa la fracción de
observaciones que le corresponden a un determinado valor , y la frecuencia
f f
relativa porcentual su porcentaje: hi i ; hi % i 100%
n n
Donde : fi = Frecuencia absoluta del valor “i”
i k
n = f1+f2+…..+fk = fi = Número total de observaciones .
i 1
k = Número de valores diferentes que puede tomar la variable.
hi = Frecuencia relativa del valor “i”
hi % = Frecuencia relativa porcentual del valor “i”

Ejemplo 1: Supongamos que se administra una encuesta en 50 hogares , y se


pregunta el número de automóviles que posee, y que las respuestas obtenidas
fueron:
1 2 1 0 1 3 1 0 0 0 1 2 1 0 0 1 2 0 1 3 0 1 2 0 0
0 0 1 3 1 2 1 0 1 0 2 2 3 0 1 0 0 0 2 1 1 1 1 0 1
Construir la tabla de frecuencias correspondiente.
Solución : La variable “número de automóviles que posee la vivienda” es
discreta, y presenta un rango de variación muy reducido : 0 , 1 , 2 y 3 , por lo
que conviene construir una tabla puntual de frecuencias .
Para construir la tabla basta con contar el número de veces que se ha
encontrado cada valor, y proceder de la misma manera como ya se explicó en el
caso de tablas de frecuencias para “Variables Cualitativas” :
Frecuencia Relativa
N° de automóviles Frecuencia Frecuencia Relativa Porcentual
0 19 0.38 38.00 %
1 19 0.38 38.00 %
2 8 0.16 16.00 %
3 4 0.08 8.00 %
Total 50 1.00 100.00 %

c) Tratamiento agrupado : Esta tercera forma de tratamiento consiste en


clasificar los datos en intervalos , lo que trae como consecuencia que se pierde
la información acerca de su verdadero valor, pero se hace más cómodo el
tratamiento .
El tratamiento agrupado permite obtener una mejor visión de conjunto acerca del
comportamiento de los datos, y conviene cuando se tiene una colección grande
de datos ( 30 ó mas ) ; especialmente en el caso de variables continuas que
tengan un rango amplio de variación, y no sea necesario distinguir entre valores
parecidos de la variable.
Para agrupar los datos hay que responder las siguientes preguntas:
¿ Cuantos intervalos tomar ? .
Gráficos Estadísticos 36
Angel F. Arvelo L

¿ Qué amplitud deben tener estos intervalos ? .


¿ Cuales deben ser los límites de los intervalos ? .

La respuesta a cada una de estas preguntas es la siguiente:

c.1 Número de intervalos : No existe una fórmula matemática que permita


calcular de manera exacta y precisa el número de intervalos que deben ser
definidos al hacer un agrupamiento de datos cuantitativos, pero es posible definir
algunos criterios que de una manera aproximada permitan establecer el número
de intervalos a considerar.
De una manera general , puede decirse que el número de intervalos no debe ser
tan excesivamente grande que se pierdan las ventajas del agrupamiento , ni tan
pequeño que se pierda la información, y para definirlo se dan las siguientes
alternativas:
c.1.1 Fórmula empírica de Sturges . Según el autor Herbert A. Sturges (1926) , si
se designa por :
n= Número total de datos.
k= Número de intervalos a considerar.

Entonces : k 1 + 3.32 log n

Esta fórmula es completamente arbitraria, se recomienda para n 500, y


proporciona una buena orientación inicial acerca del número de intervalos a
considerar .
Así por ejemplo , según ella , para una muestra de 1000 datos , es necesario
definir : k 1 + 3.32 log 1000 = 10.96 11 intervalos.

c.1.2 Fórmula de la raíz. Otro criterio que proporciona una buena aproximación
inicial acerca del número de intervalos a tomar , especialmente en el caso de
muestras pequeñas , es el que establece que el número de intervalos necesarios
para hacer el agrupamiento debe ser aproximadamente igual a la raíz cuadrada
del número de datos : k n .
Según este criterio , una muestra de por ejemplo 100 datos debe agruparse en
10 intervalos .

c.1.3 Agrupamiento a criterio. En el agrupamiento a criterio , el número de


intervalos se define a juicio de la persona que lo esta haciendo .
Se recomienda tomar entre 5 y 15 intervalos , siendo lo más frecuente ocho ; y
en ningún caso es recomendable tomar más de 20 intervalos .

c.2 Amplitud de los intervalos . Una vez definido el número de intervalos a


tomar, su amplitud puede ser calculada de manera aproximada , de la siguiente
manera:
Se calcula el rango de los datos , haciendo la diferencia entre el mayor y el
menor valor . R = Xmax. - Xmin .
Gráficos Estadísticos 37
Angel F. Arvelo L

X max X min R
El rango se divide entre el número de intervalos a tomar. c
k k
c = Amplitud de los intervalos .
El resultado obtenido se aproxima al número cómodo más cercano;
entendiendo por número cómodo a un número entero múltiplo de 5 ó de 10, o
de una potencia de 10 , según el orden de magnitud de los datos , y que sea
fácil de recordar.
En caso de que se aproxime a un número menor, es posible que resulten más
intervalos de lo previsto, y en caso de que se aproxime a uno mayor , menos de
lo previsto.
Se acostumbra que la amplitud de cada uno de los intervalos sea la misma,
aunque es posible construir tablas de frecuencias con intervalos de amplitud
diferente. Este caso será considerado más adelante.

c.3 Límites de clase. Se entiende por límites de clase a los extremos de los
intervalos donde quedan clasificados los datos.
Como no es necesario que el límite inferior del primer intervalo coincida
exactamente con menor valor de los datos , ni que el límite superior del último
intervalo con el mayor , es usual arrancar el primer intervalo desde un número
exacto múltiplo de 5 , de 10 o de una de sus potencias , que sea ligeramente
inferior al menor valor de los datos, , y a partir de allí definir los siguientes límites
de clase , según sea la amplitud .
Para definir los límites de clase , existen dos criterios:
c.3.1 Definir los intervalos como cerrados en su extremo inferior y abiertos en el
superior , sin interrumpir la continuidad entre un intervalo y el siguiente.
Bajo este criterio una variable como por ejemplo la estatura de un grupo de
personas, quedaría clasificada en intervalos que van desde 1.40 m a 1.50 m el
primero, desde 1.50 m a 1.60 m el segundo , desde 1.60 m a 1.70 m , el tercero
y así sucesivamente ; y de darse una medición igual a la frontera por decir 1.60
m, ésta quedaría clasificada en el intervalo que la tenga como límite inferior, es
decir el intervalo 1.60 a 1.70 , por ser cerrado en el límite inferior.
Este criterio tiene la ventaja de que no interrumpe la continuidad de los datos, y
equivale a definir los datos dentro de un intervalo como “mayor o igual que el
límite inferior y estrictamente menor que el límite superior” .

c.3.2 Definir los intervalos como cerrados en sus dos extremos .


Bajo este criterio, en un caso como el anterior , los límites de clase quedarían
definidos como desde 1.40 hasta 1.49 el primero , desde 1.50 hasta 1.59 el
segundo, etc. .
Este segundo criterio es más claro desde el punto de vista que no presenta la
ambigüedad que pudiera presentar el anterior , cuando una observación es igual
a la frontera y no se señale claramente sobre la tabla que el intervalo es cerrado
en el extremo inferior y abierto en el superior.
Gráficos Estadísticos 38
Angel F. Arvelo L

La desventaja de este criterio es que interrumpe la continuidad de los datos , al


dejar un vacío entre el extremo superior de un intervalo y el inferior del siguiente,
lo que distorsiona los gráficos , como el histograma.
Quienes utilicen este criterio para definir los límites de clase deberán distinguir
entre límites reales y límites aparentes de un intervalo, para no interrumpir la
continuidad de los datos.
En las gráficas, las fronteras entre un intervalo y el siguiente vendrán dadas por
los límites reales.
Por esta razón , un intervalo definido por sus extremos aparentes como podrían
ser desde 1.40 hasta 1.49 , cubre en realidad mediciones reales en el intervalo
[1.395 ; 1.495) que son sus límites reales , mientras que el intervalo aparente de
1.50 a 1.59 cubre valores reales en [1.495 ; 1.595) .
De lo anterior se deduce entonces que para hallar los límites reales de un
intervalo:
1
Límite Real Inferior = L.r.i = Límite Aparente Inferior - Sensibilidad
2
1
Límite Real Superior = L.r.s= Límite Aparente Superior + Sensibilidad
2
Es importante destacar que cuando se utiliza este criterio , la amplitud del
intervalo viene dada por la diferencia entre sus límites reales , y no por la de sus
límites aparentes , en consecuencia : c = L.r.s - L.r.i .
Lo anterior significa que si un intervalo está definido por los límites 1.50 a 1.59 ,
su amplitud aparente es 1.59 - 1.50 = 0.09 ; pero su amplitud real es
1.595 - 1.495 = 0.10 ..
Para distinguir si los datos están agrupados por el primer o segundo criterio,
basta con observar la tabla de frecuencias.
Si los límites de clase están definidos sin interrupción de continuidad , están
agrupados según el primer criterio, y si los límites de clase presentan una
interrupción en la continuidad , están agrupados según el segundo criterio.

Ejemplo 2 : Los siguientes 60 datos , representan la estatura de los estudiantes


en un curso de Estadística , medidas con una sensibilidad de 0.01 metro , es
decir 1 centímetro .
1.66 1.69 1.76 1.82 1.54 1.63 1.80 1.60 1.71 1.63 1.75 1.74
1.70 1.66 1.68 1.80 1.57 1.53 1.61 1.93 1.72 1.61 1.69 1.68
1.73 1.60 1.66 1.59 1.47 1.50 1.67 1.48 1.61 1.73 1.80 1.66
1.60 1.63 1.78 1.79 1.46 1.89 1.73 1.78 1.65 1.90 1.57 1.74
1.61 1.62 1.61 1.81 1.53 1.59 1.66 1.77 1.70 1.65 1.68 1.53
Agrupar estos datos en una tabla de frecuencias .

Solución : El primer paso es definir cuantos intervalos se van a tomar .


Para una muestra de 60 datos , según la fórmula de la raíz , habría que tomar:
k 60 8 intervalos .
El paso siguiente es definir su amplitud . El mayor valor es 1.93 , el menor valor
1.46 , y por tanto el rango : R = 1.93 - 1.46 = 0.47 .
Gráficos Estadísticos 39
Angel F. Arvelo L

0.47
Para 8 intervalos , la amplitud debería ser entonces : c = 0.0588
8
La amplitud 0.0588 se aproxima a un valor que resulte más cómodo para
trabajar, como por ejemplo 0.05 , con lo que posiblemente resulten más
intervalos de lo previsto.
El tercer paso es definir los límites de clase.
Supongamos que decidimos seguir el primer criterio .
A continuación hay que decidir donde arrancar el primer intervalo. Como el
menor valor es 1.46 , podríamos arrancar el primer intervalo desde 1.45 que
resulta más cómodo, y de esta manera quedarían los siguientes límites de clase:
desde 1.45 hasta 1.50 el primero , desde 1.50 hasta 1.55 el segundo , y así
sucesivamente .
El paso siguiente es contar cuantas observaciones caen en cada uno de estos
intervalos, teniendo en cuenta que es cerrado en el extremo inferior y abierto en
el superior.
La tabla de frecuencias resulta:
Estatura Frecuencia Frecuencia Relativa Porcentual
1.45 a 1.50 3 5.00 %
1.50 a 1.55 5 8.33 %
1.55 a 1.60 4 6.67 %
1.60 a 1.65 12 20.00 %
1.65 a 1.70 13 21.67 %
1.70 a 1.75 9 15.00 %
1.75 a 1.80 6 10.00%
1.80 a 1.85 5 8.33 %
1.85 a 1.90 1 1.67 %
1.90 a 1.95 2 3.33 %
TOTAL 60 100.00

De haber definido los límites de clase por el segundo criterio, la tabla hubiese
quedado:
Frecuencia Relativa
Estatura Límites Reales Frecuencia Porcentual
1.45 a 1.49 1.445 a 1.495 3 5.00 %
1.50 a 1.54 1.495 a 1.545 5 8.33 %
1.55 a 1.59 1.545 a 1.595 4 6.67 %
1.60 a 1.64 1.595 a 1.645 12 20.00 %
1.65 a 1.69 1.645 a 1.695 13 21.67 %
1.70 a 1.74 1.695 a 1.745 9 15.00 %
1.75 a 1.79 1.745 a 1.795 6 10.00%
1.80 a 1.84 1.795 a 1.845 5 8.33 %
1.85 a 1.89 1.845 a 1.895 1 1.67 %
1.90 a 1.94 1.895 a 1.945 2 3.33 %
TOTAL 60 100.00 %

Tabla de frecuencias acumuladas: Una vez que se ha construido la tabla de


frecuencias, bien sea puntual o agrupada por cualquiera de los dos criterios , es
Gráficos Estadísticos 40
Angel F. Arvelo L

posible complementar la información contenida en ella , mediante las


frecuencias acumuladas .
La frecuencia absoluta acumulada de un intervalo expresa el número total de
observaciones que son iguales o menores que su límite superior.
Para obtenerla basta con sumar todas las frecuencias absolutas
correspondientes a los intervalos anteriores , con la frecuencia propia :
i j
Fj f1 f2 fj fi .
i 1
Donde : Fj = Frecuencia absoluta acumulada hasta el intervalo “j” .
fi= Frecuencia absoluta del intervalo “i” .
De manera análoga , la frecuencia relativa acumulada de un intervalo expresa la
fracción de observaciones que son iguales o menores que el límite superior del
intervalo ; y la frecuencia relativa porcentual acumulada , el porcentaje de
observaciones que son iguales o menores que el límite superior del intervalo .
i j i j
Hj h1 h 2 hj hi ; Hj % h1 % h2 % hj % hi %
i 1 i 1
Fj
Hj = Frecuencia relativa acumulada hasta el intervalo “j” =
n
Fj
Hj %= Frecuencia relativa porcentual acumulada hasta el intervalo “j” = 100%
n
Ejemplo 3 : Completar la tabla del Ejemplo 2 , incluyendo la frecuencias
absolutas acumulada , y la frecuencia relativas porcentuales acumuladas .
Solución: La frecuencia acumulada del primer intervalo es:
F1 = f1 = 3 , y significa que 3 personas miden 1.49 ó menos , que es el límite
superior del primer intervalo .
La frecuencia acumulada del segundo intervalo es :
F2 = f1 + f2 = 3 + 5 = 8 ; y su interpretación es que 8 personas en la muestra ,
tienen una estatura igual o menor que el límite superior del intervalo 1.54 .
La frecuencia relativa porcentual acumulada del primer intervalo es :
H1 % = h1 % = 5 % , y significa que el 5% de las observaciones son iguales o
menores que el límite superior del primer intervalo, que es 1.49 ; es decir , que el
5% de las personas en la muestra miden 1.49 ó menos .
La frecuencia relativa porcentual acumulada del segundo intervalo es :
H2 % = h1 % + h2 % = 5 % + 8.33 % = 13.33 %, y significa que el 13.33 % de las
personas en la muestra , miden 1.54 ó menos .
Procediendo de manera análoga con los demás intervalos , se completa la tabla
obteniendo:
Frecuencia Frecuencia
Frecuencia Relativa Relativa
Estatura Límites Reales Frecuencia acumulada Porcentual Porcentual
Acumulada
1.45 a 1.49 1.445 a 1.495 3 3 5.00 % 5.00 %
1.50 a 1.54 1.495 a 1.545 5 8 8.33 % 13.33 %
1.55 a 1.59 1.545 a 1.595 4 12 6.67 % 20.00 %
1.60 a 1.64 1.595 a 1.645 12 24 20.00 % 40.00 %
Gráficos Estadísticos 41
Angel F. Arvelo L

1.65 a 1.69 1.645 a 1.695 13 37 21.67 % 61.67%


1.70 a 1.74 1.695 a 1.745 9 46 15.00 % 76.67 %
1.75 a 1.79 1.745 a 1.795 6 52 10.00% 86.67 %
1.80 a 1.84 1.795 a 1.845 5 57 8.33 % 95.00 %
1.85 a 1.89 1.845 a 1.895 1 58 1.67 % 96.67 %
1.90 a 1.94 1.895 a 1.945 2 60 3.33 % 100.00 %
TOTAL 60 100.00 %

Tabla 4.4

Ejercicios Propuestos:
4) Los siguientes datos representan el número de hijos que tienen cada uno de
los 100 empleados de una organización industrial:
2 1 2 2 2 0 1 1 1 1 1 0 3 0 2 3 1 2 4 1 1 1 1 1 2
3 1 2 0 2 2 4 2 1 0 1 2 2 3 2 1 0 0 0 3 1 2 2 1 0
1 0 3 2 1 0 3 1 2 1 2 0 2 2 2 1 1 3 0 2 2 2 1 0 0
1 1 2 1 3 2 1 1 4 1 0 1 1 0 1 1 2 2 1 2 2 2 2 1 2
a) Construya la tabla de frecuencias , indicando frecuencias absolutas , relativas
porcentuales , absolutas acumuladas y relativas porcentuales acumuladas .
b) Construya un gráfico circular .

5) Los siguientes datos representan el peso de un grupo de personas,


expresados en Kilogramos, y redondeados al entero más cercano:
53 76 85 59 82 75 66 61 59 63 79 68 63 71 87
67 71 79 60 53 57 62 69 52 59 70 61 66 63 75
65 60 72 88 70 53 77 86 51 67 78 89 50 76 64
71 78 57 53 69 94 68 75 70 81 67 55 57 60 52
68 64 80 77 67 93 77 55 72 64 63 70 72 46 51
53 87 71 69 60 55 73 59 52 55 62 91 60 50 86
74 73 83 55 67 70 59 62 90 65 78 77 66 57 50
61 67 70 63 72 88 78 54 77 58 48 56 58 63 90
66 68 57 55 68 70 61 84 76 59 75 50 56 73 79
98 60 57 69 73 78 51 68 70 80 65 59 48 67 72
Agrupar estos datos en una tabla de frecuencias, indicando frecuencias
absolutas , relativas y acumuladas .

4 Representación Gráfica de Datos Cuantitativos: Existen varias


alternativas para representar gráficamente datos cuantitativos, entre las cuales
pueden ser citadas:
1°) El Histograma : Esta es la representación gráfica de la tabla de frecuencias
absolutas o de las relativas según se quiera , sus normas de construcción son
las mismas que fueron analizadas en el capítulo anterior para datos cualitativos ;
y que el caso de datos cuantitativos presenta dos casos:
1.a ) Tabla puntual o discreta de frecuencias . Este es el caso en donde toda la
frecuencia le corresponde exclusivamente a un valor puntual y no a un intervalo.
Gráficos Estadísticos 42
Angel F. Arvelo L

Aunque toda la frecuencia debería concentrarse en el valor puntual,


generalmente se dibuja una barra de espesor grueso , a fin de resaltar la
frecuencia , y por ello este histograma también se suele llamar “Gráfico de
barras”.
Ejemplo 6. Representar las frecuencias relativas del Ejemplo 1 , en un
Histograma.
Solución :

1.b ) Tabla agrupada de frecuencias . En este caso, a diferencia del anterior, la


frecuencia le corresponde a todo el intervalo , y no al valor puntual.
Por este motivo , la frecuencia debe ser representada como un rectángulo cuya
base debe ser todo el intervalo , y cuya altura igual a la frecuencia .
Las normas de construcción son las ya conocidas , y el único detalle que hay
que cuidar es el que se refiere al caso en que los límites de clase hayan sido
definidos por el segundo criterio, en donde los límites que representan a cada
intervalo son los límites reales , a fin de mantener la continuidad en el gráfico.
Representar los intervalos por sus límites aparentes, no sería correcto, pues
quedaría un vacío entre un intervalo y el siguiente , que alteraría la continuidad .

Ejemplo 7 : Representar los datos del Ejemplo 2 en un Histograma de


Frecuencias Relativas Porcentuales .
Gráficos Estadísticos 43
Angel F. Arvelo L

2°) Polígonos de frecuencia , y gráficos de área : El polígono de frecuencias


es una gráfica obtenida a partir del histograma , cuando se unen los puntos
medios de los lados superiores consecutivos , tal como se muestra en la figura :

El polígono de frecuencias se utiliza principalmente para destacar las


fluctuaciones de frecuencias que existen entre los intervalos consecutivos, y
también puede ser construido aisladamente sin el histograma , en cuyo caso se
suele llamar “gráfico de área” , tal como el siguiente:
Gráficos Estadísticos 44
Angel F. Arvelo L

El gráfico de áreas tiene la propiedad de que su área es igual al área total del
histograma, es decir igual a la suma de las áreas de todos los rectángulos que lo
integran.
Es importante destacar que las técnicas de “Estadística Matemática” , han
desarrollado una serie de curvas conocidas bajo el nombre de “Distribuciones
teóricas de Probabilidad” , que vienen a constituir una especie de modelo teórico
para el “Polígono de Frecuencia” , pues a medida que la amplitud de los
intervalos se reduce , el polígono tiene cada vez mas lados , y la curva de
probabilidad viene a ser una aproximación teórica para la posición límite del
polígono cuando la amplitud del intervalo tienda a cero.

3°) Gráficos de tallo y hoja : Cuando se agrupa un conjunto de datos en una


tabla de frecuencias , se pierde la información de su verdadero valor , y lo que
queda registrado es una observación dentro del intervalo de clase donde cae.
El diagrama de tallo y hoja , es una técnica de representación , cuyo nombre
original en idioma inglés es “ stem and leaf” , y que fué propuesta por el
estadístico John Tukey en 1977 en su clásico trabajo titulado “ Exploratory Data
Analysis”, en donde se analizan una serie de novedosas maneras para el
análisis de datos .
En el diagrama de tallo y hoja , cada dato tiene dos partes : el tallo y la hoja.
La hoja esta definida por su último dígito , y existen dos hojas , la inferior que
corresponde a los dígitos 0 , 1 , 2 , 3 y 4 y que se representa en el diagrama por
él símbolo “ ” , y la superior que corresponde a los dígitos 5 , 6 , 7 ,8 y 9 , y se
representa por el símbolo “ ” .
El tallo representa todos los demás dígitos , y se colocan en el gráfico en forma
de filas ordenadas , desde el valor más bajo hasta el más alto .

Ejemplo 8 : Representar los datos del Ejemplo 2, en un diagrama tallo y hoja.


Solución : Para cada dato , se define su tallo y su hoja . así por ejemplo , el dato
1.54 pertenece al tallo 1.5 y a la hoja inferior “ ” , mientras que el dato 1.79 al
Gráficos Estadísticos 45
Angel F. Arvelo L

tallo 1.7 y a la hoja superior “o” . En cada hoja se conserva el valor exacto del
último dígito ; y se anota a la izquierda , la frecuencia absoluta de cada tallo y
hoja , tal como se muestra en la tabla a continuación :

Frecuencia Tallo Hoja

3.00 1.4 678


5.00 1.5 * 03334
4.00 1.5 7799
12.00 1.6 * 000111112333
13.00 1.6 55666666788899
9.00 1.7 * 001233344
6.00 1.7 567889
5.00 1.8 * 00012
1.00 1.8 9
2.00 1.9 * 33

Nótese que la información contenida en este diagrama es más detallada que la


dada en la tabla de frecuencias, pues informa cual es el valor exacto de las
observaciones que caen en cada intervalo ; y así por ejemplo, se sabe que las
cinco observaciones que caen en la hoja inferior del tallo 1.50 , que cubre el
intervalo aparente 1.50 a 1.54 son : 1.50 , 1.53 , 1.53 , 1.53 y 1.54 .

También es posible construir el diagrama con una sola hoja para cada tallo, o
con cinco hojas para cada tallo.
La construcción con una sola hoja para cada tallo , no discrimina entre hoja
inferior y hoja superior , y en un caso como el del ejemplo anterior quedaría de la
siguiente forma :

Frecuencia Tallo Hoja

3.00 1.4 678


9.00 1.5 033347799
25.00 1.6 0001111123335566666788899
15.00 1.7 001233344567889
6.00 1.8 000129
2.00 1.9 03

La construcción con cinco hojas para cada tallo , distingue las siguientes hojas:
La hoja “ ” donde caen las observaciones cuyo último dígito es 0 ó 1 .
La hoja “T” ,del inglés “Two y Three” correspondiente al 2 y al 3 .
La hoja “F”, del inglés “Four y Five” , correspondiente al 4 y 5 .
La hoja “S”, del inglés “Six y Seven” correspondiente al 6 y 7 .
La hoja “ ” que corresponde a las observaciones terminadas en 8 y 9.
Este estilo de diagrama con cinco hojas para cada tallo , conviene sólo en caso
de disponer de un número grande de datos , pues puede dar lugar a un excesivo
número de filas .

4°) La Ojiva : Esta gráfica es la representación de la tabla de frecuencias


acumuladas , y expresa el número de observaciones que son iguales o menores
Gráficos Estadísticos 46
Angel F. Arvelo L

que un cierto límite en caso de representar las frecuencias absolutas


acumuladas, o el porcentaje de observaciones que son iguales o menores que
un límite en caso de representar las frecuencias relativas porcentuales
acumuladas.
En la construcción de la ojiva, deben distinguirse dos casos:
4.1 Tabla discreta de frecuencias : En este caso , la frecuencia corresponde
exclusivamente a un valor puntual , y la ojiva adopta un aspecto de escalera .

Ejemplo 9 : Construir la Ojiva para los datos del Ejemplo 1


Solución: La tabla de frecuencias acumuladas para estos datos es la siguiente:

Frecuencia Frecuencia
N° de Relativa Frecuencia Relativa
automóviles Frecuencia Porcentual acumulada Porcentual
Acumulada
0 19 38.00 % 19 38.00 %
1 19 38.00 % 38 76.00 %
2 8 16.00 % 46 92.00 %
3 4 8.00 % 50 100.00 %
Total 50 100.00 %

De la tabla se desprende , que por ejemplo , de las 50 viviendas observadas 46


de ellas tienen 2 vehículos o menos , lo que equivale al 92.00 % .
Como entre 0 y 1 , ó entre 1 y 2 , etc., no existen observaciones , la frecuencia
acumulada permanece constante entre los valores consecutivos , pues por
ejemplo , el porcentaje de viviendas que poseen 1,5 vehículos o menos , es el
mismo que posee 1 vehículo o menos, es decir 76.00 % ; y por ello, la ojiva
queda de la siguiente forma :

Para 3 vehículos o más , la ojiva permanece constante en 100% , pues


evidentemente, el porcentaje de viviendas que poseen por ejemplo, 5 vehículos
o menos es el 100% .

4.2 Tabla agrupada de frecuencias : En este caso , la frecuencia corresponde a


todo un intervalo , y por lo tanto se produce un crecimiento de la frecuencia
Gráficos Estadísticos 47
Angel F. Arvelo L

acumulada dentro de él . Como al agrupar , se perdió la información acerca del


valor exacto de los datos , se supone que este crecimiento es lineal.
Es importante destacar que en caso de haber utilizado el segundo criterio de
definición de los límites de clase , la Ojiva debe ser construida con los límites
reales, pues si se construyera con los límites aparentes , entre el límite superior
de un intervalo y el inferior del siguiente , quedaría un zona de crecimiento nulo
en la frecuencia acumulada.

Ejemplo 10 : Construir la Ojiva , para los datos del Ejemplo 2


Solución : La tabla de frecuencias relativas acumuladas , al representarla
gráficamente da lugar a la siguiente Ojiva:

Ojivas como la anterior , se suelen llamar “menor o igual que” , para distinguirlas
de otras llamadas “mayor o igual que” , en donde lo que se representa es el
porcentaje de observaciones que son mayores o iguales que un límite de clase.
Para construir una Ojiva “mayor o igual que” , el procedimiento es idéntico, sólo
que hay que restar del 100% la frecuencia acumulada de cada intervalo, y
representarla para el límite real superior del intervalo.

Ejemplo 11 Construir una Ojiva del tipo “mayor o igual que” , para los datos del
ejercicio anterior.
Solución: Siguiendo el procedimiento anterior, se obtiene:
Gráficos Estadísticos 48
Angel F. Arvelo L

En lo sucesivo , cuando se haga referencia a la Ojiva , salvo indicación en


contrario , se sobreentenderá que es del tipo “ menor o igual que” .

4. Tablas de Frecuencia con intervalos de diferente amplitud Aunque lo


común es construir las tablas de frecuencias con intervalos de igual amplitud , a
veces se dan circunstancias en donde se hace necesario construir la tabla con
intervalos de diferente amplitud, lo que ocasionas ciertas modificaciones en las
técnicas de representación gráfica, y muy especialmente en el histograma.
Cuando los intervalos tienen diferente amplitud, hay que mantener el principio de
proporcionalidad de áreas , ya enunciado en el capítulo anterior, y según el cual
, las áreas de los rectángulos que representan a cada una de las clases deben
estar en la misma proporción que sus frecuencias.
Según este principio, si el intervalo “i” tiene una frecuencia “fi” con una amplitud
“ci” , y otro intervalo “j” una frecuencia “f j” con una amplitud “cj” , no sería correcto
construir el histograma con rectángulos de altura igual a su frecuencia, pues no
se cumpliría la proporcionalidad de áreas.
Para resolver el problema, y poder construir correctamente el histograma, es
necesario introducir el concepto de densidad de frecuencia “d i” para un intervalo,
y el cual se define como el cociente entre la frecuencia del intervalo y su
amplitud.
fi
di
ci
Calculada la densidad de frecuencias para cada intervalo , el histograma se
construye dibujando para cada clase un rectángulo de altura igual a su densidad
de frecuencias.
Al construir el histograma de esta manera se respeta la proporcionalidad de
áreas, pues el área de cada rectángulo será:
Area = Base x Altura = Amplitud x Densidad de frecuencias = ci x di
Gráficos Estadísticos 49
Angel F. Arvelo L

fi
ci
( Area)i ci di ci fi
y por lo tanto :
( Area) j c j dj fj fj
cj
cj
Ejemplo 12 : La siguiente tabla de frecuencias muestra la distribución de sueldos
mensuales en una empresa:
Sueldo 1000 a 2000 a 3.000 a 5.000 a 10.000 a
Mensual 300 a 500 500 a 1.000 2000 3000 5.000 10.000 20.000
Frecuencia 400 900 700 300 180 75 45
Construir el Histograma correspondiente .

Solución : Se comienza calculando la densidad de frecuencia correspondiente a


cada intervalo:
Sueldo Mensual Frecuencia Amplitud Densidad de frecuencia
300 a 500 400 200 2.00
500 a 1.000 900 500 1.80
1.000 a 2.000 700 1.000 0.70
2.000 a 3.000 300 1.000 0.30
3.000 a 5.000 180 2.000 0.09
5.000 a 10.000 20 5.000 0.004
TOTAL 2500
El histograma se construye dibujando rectángulos de ancho igual a la amplitud
de cada intervalo, y de altura igual a su densidad de frecuencias , como en el
gráfico a continuación:

Resulta obvio que en el caso de intervalos con igual amplitud, las densidades de
frecuencia de los diferentes intervalos resultan directamente proporcionales a
sus respectivas frecuencias, y por ello no se altera la razón entre las alturas , si
Gráficos Estadísticos 50
Angel F. Arvelo L

en lugar de representar la densidad de frecuencias como altura del rectángulo,


se representa directamente la frecuencia.
Otra alternativa que se presenta cuando el rango de variación de los datos es
muy amplia como en el ejemplo anterior, en donde tomar intervalos de igual
amplitud , daría lugar a un excesivo número de intervalos , o a una pérdida
considerable de la información porque la gran mayoría de las observaciones
caen dentro de un mismo intervalo, es definir alguno de los intervalos extremos
como abierto, es decir “menor que” el izquierdo , o “mayor que” el derecho.
Así por ejemplo, el último intervalo del ejemplo anterior , se hubiese podido
definir como “5.000 ó más” .
Esta alternativa sin embargo, no es recomendable pues no permite la
representación gráfica, al tener este último intervalo una amplitud infinita y una
densidad de frecuencias igual a cero; y además tampoco permite calcular ciertos
indicadores muestrales , tales como promedios, etc., que serán analizados en el
capítulo siguiente.

IV.5 Transformaciones y cambios de escala: Cuando un dato


cuantitativo va ser representado sobre un eje de números reales , existen varias
alternativas en lo que a la escala se refiere.
Se llama escala, a la razón entre la longitud del segmento que representa al dato
y su verdadero valor.
Existen varios tipos , tales como :
a) La escala aritmética : Se dice que una escala es aritmética cuando la relación
entre la longitud del segmento que representa al dato y su verdadero valor es
constante.
Así por ejemplo, una escala aritmética de 1:200 significa que cada unidad de
longitud para el segmento representa 200 unidades del dato.
Este tipo de escala conserva la proporcionalidad entre los valores que
representa; y así por ejemplo, si la magnitud de un valor es el doble de la
magnitud de otro , entonces la longitud del segmento que lo representa es el
Longitud de " a" a
doble de la longitud del otro. =
Longitud de "b" b
El Histograma por ejemplo, utiliza este tipo de escala para representar la
densidad de frecuencias, pues si un intervalo tiene doble densidad de
frecuencias que otro, entonces la altura del rectángulo que lo representa es
doble de la del otro .
El uso de la escala aritmética es la más frecuente y común , pero puede resultar
inconveniente en algunos casos , especialmente cuando la magnitud de los
datos presenta un alto grado de variación.
La situación anterior puede presentarse tanto en datos cualitativos , como
cuantitativos, como se muestra en el ejemplo siguiente:
Gráficos Estadísticos 51
Angel F. Arvelo L

Ejemplo 13 : Los siguientes datos representan las ventas anuales de un grupo


de empresas , expresadas en millones de unidades monetarias:
Empresa A B C D E F
Ventas 1.36 1007.61 85.40 105.40 453.98 10.53
Representar estos datos en un histograma con escala aritmética .
Solución : Como estos datos presentan un alto grado de variación , el
histograma con escala aritmética , va a quedar distorsionado , y no será posible
apreciar los valores pequeños.

b) La escala logarítmica : Se dice que una escala es logarítmica cuando al


representar las magnitudes en el eje de números reales , las longitudes de los
segmentos que las representan, están en la misma proporción que sus
logaritmos.

Longitud de " a" log a


En consecuencia: =
Longitud de "b" log b
En una escala logarítmica solo se pueden representar valores positivos, y el cero
corresponde a la unidad, pues log 1 = 0 .
Generalmente se utilizan logaritmos decimales, y por lo tanto cuando un
segmento es doble que otro , esto debe interpretarse como que la magnitud es
10 veces más que la otra.

La escala logarítmica en base diez se utiliza principalmente para representar


cuantas veces más grande, en potencias de diez, es una clase con relación a
otra.
Como los logaritmos en bases diferentes son múltiplos unos de otros, un cambio
de base , equivale a un cambio en la unidad de longitud en la escala logarítmica.
Gráficos Estadísticos 52
Angel F. Arvelo L

Ejemplo 13 : Representar los datos del Ejemplo 12 utilizando una escala


logarítmica .
Solución : Para construir la gráfica , es necesario previamente transformar los
datos , y calcular sus respectivos logaritmos.
Empresa Ventas Logaritmo de Ventas
A 1.36 0.13
B 1007.61 3.00
C 85.40 1.93
D 105.40 2.02
E 453.98 2.66
F 10.53 1.02

y al representar gráficamente resulta:

Nótese que en el eje vertical se coloca el valor real de las ventas , pero las
alturas de los rectángulos no guardan proporción con los valores reales , sino
con sus logaritmos; y así por ejemplo , en el gráfico , puede apreciarse que la
altura de la empresa “B” es aproximadamente el triple de la “F” , lo que se
interpreta en un gráfico logarítmico como que las ventas reales de las empresa
“B” están con las de la empresa “F” en la proporción 103:101 ; es decir de 100 a 1
, o lo que es lo mismo, que son 100 veces más .

Ejemplo 14 : Suponga que al leer un gráfico , en donde los valores de las clases
están en escala logarítmica , Ud. encuentra que una clase tiene una altura
negativa de -1 , y otra clase una altura positiva de +2 . ¿ Cual es la razón entre
el valor de la segunda y la primera clase ? .
Solución : Si la primera clase “A” , tiene una altura negativa -1 , esto significa
que su verdadero valor es 10-1 = 0.1 ; mientras que si la segunda clase “B” tiene
una altura de +2 , entonces su verdadero valor es 102 = 100 .
Gráficos Estadísticos 53
Angel F. Arvelo L

Por lo tanto, la razón entre el valor de la segunda y el de la primera clase es de


100
.
1000 ; lo que significa que el tamaño de la segunda clase es mil veces el
.
01
de la primera.

c) Escala de raíz cuadrada : Aquí , en lugar de representar el verdadero valor ,


se representa su raíz cuadrada , y por lo tanto la longitud de los segmentos que
representan a los diferentes valores quedan en proporción a sus raíces
Longitud de " a" a
cuadradas : =
Longitud de "b" b

Este tipo de escala se utiliza principalmente cuando existen diferencias


acentuadas entre los diferentes valores , y se quiere suavizarlas o amortiguarlas.

Ejemplo 14 : Representar los datos del Ejemplo 12 , en una escala de raíz


cuadrada.
Solución : Para construir la gráfica , es necesario calcularle la raíz cuadrada a
las ventas , y luego graficar:
Empresa Ventas Raíz Cuadrada de Ventas
A 1.36 1.17
B 1007.61 31.74
C 85.40 9.24
D 105.40 10.27
E 453.98 21.31
Gráficos Estadísticos 54
Angel F. Arvelo L

Sobre el eje vertical se señalan las ventas reales , pero los rectángulos que
representan a las ventas de cada una de las empresas se construyen con
alturas proporcionales a sus raíces cuadradas .

d) Escalas funcionales : Las escalas anteriores son casos particulares de una


situación más general , conocida como escala funcional , en donde los valores
reales de una variable “x” se representan en proporción a los valores de una
función : y = f(x) .
Los únicos requisitos que debe cumplir esta función f(x) es ser continua,
monótona, y por consiguiente tener inversa.
Así por ejemplo el caso de la escala aritmética es cuando f(x) = x , el de la
escala logarítmica cuando f(x) = log x , y el de escala raíz , cuando f(x) = x .
Por este procedimiento ,es posible definir otras escalas como por ejemplo la
1 2
escala recíproca cuando : f(x) = , o la escala cuadrática cuando f(x)=x .
x
Una aplicación muy importante de esta escala funcional es la llamada “escala
gaussiana” , que permite transformar la ojiva de un conjunto de datos en una
recta; y que se utiliza para identificar cuando una muestra proviene de una
“Distribución Normal” mediante el uso de un papel especial conocido como
“papel probabilístico” .

Ejemplo 15 : Suponga que en un histograma de frecuencias construidos con


escala de raíz cuadrada , existen tres clases , y que la altura de la primera clase
es la mitad de la altura de la segunda ; y que la altura de la tercera clase es una
vez y media la de la segunda . Calcule la frecuencia relativa porcentual de cada
una de las tres clases.
Solución : Al ser un histograma con escala de raíz cuadrada , las alturas están
en proporción a la raíz cuadrada de las frecuencias ; por lo tanto:
f1 1 f3 3 9 9
y f2 = 4 f1 y f3 f2 = 4f = 9 f1
f2 2 f2 2 4 4 1

Lo anterior significa entonces , que por cada unidad en la primera clase , hay
cuatro en la segunda y nueve en la tercera ; lo que nos lleva a la conclusión de
que por cada 14 unidades en la población , 1 pertenece a la primera clase , 4 a
la segunda y 9 a la tercera.
La frecuencia relativa porcentual de cada clase es por consiguiente:
1 4
h1 100% = 7.14 % ;h2 100% = 28.57 % ;
14 14
9
h3 100% = 64.29 %
14
Gráficos Estadísticos 55
Angel F. Arvelo L

Transformaciones: Se dice que un conjunto de datos ha sido sometido a una


transformación , cuando por efecto de la aplicación de alguna función
matemática, el valor original de los datos ha sido convertido en otro conjunto
distinto de datos.
Generalmente la transformación de un conjunto de datos se hace con el objetivo
de facilitar su tratamiento, o de suavizar las fluctuaciones existentes en los datos
originales, y es un artificio muy frecuente en Estadística, debido a que a veces
resulta más fácil describir los datos transformados que los datos originales.
Las transformaciones más importantes son :
a) La transformación lineal : Esta es una transformación según la cual , un dato
“X” se transforma en otro “Y” , mediante una función lineal del tipo: Y = a + b X .
Ejemplos de transformaciones lineales son todos aquellos que consisten en un
cambio de unidades al multiplicar por un factor de conversión.
Si un conjunto de mediciones han sido tomadas originalmente en “pulgadas” , y
se decide pasarlas a “centímetros” , esto equivale a multiplicar cada dato original
“X” por el factor 2.54 que convierte pulgadas en centímetros, y obtener otro
nuevo dato Y = 2.54 X .
Igual situación se presenta si un conjunto de datos relacionados con
temperatura, se encuentra expresado en °F , y por algún motivo se decide
convertirlos en °C, lo que equivale a transformar los datos mediante la función
5
lineal: Y (X - 32) .
9
b) La transformación logarítmica: Esta consiste en someter a los datos
originales a una función del tipo Y = log X , o del tipo Y = ln X .

c) La transformación de potencias : Esta consiste en someter a los datos


p
originales a una función del tipo : Y = a X + b . (p 0) .

Preguntas de Revisión
1°) ¿Cual es la diferencia entre el valor real y el valor aparente de una
medición?.

2°) Comente la veracidad o falsedad de la siguiente afirmación : “ A pesar de


que las variables cuantitativas se clasifican en discretas y continuas , las
observaciones provenientes de ellas siempre son discretas.”

3°) Explique el procedimiento para pasar de un conjunto de datos puntuales a


una tabla agrupada de frecuencias . ¿ Es posible el proceso inverso ? .

4°)¿Cual es la diferencia entre una tabla discreta de frecuencias y una


agrupada?.
Gráficos Estadísticos 56
Angel F. Arvelo L

5°) ¿ Es posible obtener la tabla de frecuencias a partir de la tabla de


frecuencias acumuladas ? . Explique el procedimiento.

6°)¿Qué ventaja presenta el diagrama de tallo hoja con relación al histograma ? .

7°) ¿ Qué comentarios haría Ud. sobre una distribución de frecuencias que
arroje un polígono en forma de : a) U b) J c) ?.

8°) ¿ Qué comentarios haría Ud. sobre una distribución de frecuencias que
arroje como polígono de frecuencias un trapecio isósceles:

9°) ¿ Porque la Ojiva correspondiente a una tabla discreta de frecuencias resulta


en forma de escalera, y la correspondiente a una tabla agrupada, no ? .

10°) Comente la veracidad o falsedad de la siguiente afirmación : “ Si dos clases


tienen igual frecuencia , pero la segunda tiene doble amplitud que la primera ,
entonces al construir el histograma , la primera debe tener doble altura que la
segunda.”

11°) ¿ Por qué no es posible dibujar el histograma , cuando algunas clases han
sido definidas como intervalos abiertos del tipo “mayor que” o “menor que” ? .

12°) ¿ Es posible construir la Ojiva a partir de un diagrama de tallo y hoja ? .


Explique el procedimiento. ¿ Es posible el procedimiento inverso ? .

13°) Si unos datos estaban originalmente en “libras” , y Ud. decide convertirlos


en “Kilogramos” . ¿ Qué tipo de transformación se ha efectuado sobre ellos ? . ¿
Se mantiene la razón entre ellos ? .

14°) ¿ Es lineal la conversión de frecuencias absolutas en relativas ? . ¿ Se


mantiene la razón entre las frecuencias absolutas y las relativas de las clases ? .

15°) Si un conjunto de datos varía entre 20 y 90 . ¿ Conviene hacer una


transformación logarítmica ? . Justifique .

16°) ¿ Cuales son las ventajas y desventajas de una escala logarítmica frente a
una escala aritmética ? . ¿ En qué casos conviene utilizar una u otra ? .

17°) Explique cómo se construye una escala cuadrática .

Temas complementarios para investigar

18°) Investigue acerca de las “ Curvas de Concentración de Lorenz” . ¿ Para qué


se utilizan ? . ¿Cómo se construyen? . ¿ Qué representan? .¿ Qué representa el
llamado “índice de Gini” ? .
Gráficos Estadísticos 57
Angel F. Arvelo L

19°) ¿ Para qué se utiliza el papel semilogarítmico ? . ¿ Cómo se construye ? .

20°) ¿ Para qué se utiliza el papel logarítmico ? . ¿ Cómo se construye ? .

Problemas Propuestos

I. Nivel Elemental

1) En una encuesta entre hogares , se preguntó el número de aparatos de


televisión existentes . Las respuestas fueron :
3 1 4 2 2 3 1 4 2 1 2 2 3 1 4 5 3 3 2 1 2 2 2 1 2
2 1 1 3 3 2 2 2 1 2 2 2 2 4 1 3 2 2 2 4 1 0 1 1 2
2 2 2 2 2 1 5 1 1 2 2 3 2 1 2 2 4 3 1 1 3 2 2 1 3
1 4 3 3 1 2 2 0 1 4 3 3 5 2 2 1 1 2 2 3 2 1 2 3 2
3 3 2 1 2 2 2 1 2 2 1 1 4 1 3 3 3 3 2 1 3 2 2 2 1
0 1 1 3 3 2 2 2 4 4 3 3 3 0 3 1 1 5 1 1 2 2 3 1 4
a) Construir la tabla de frecuencias absolutas y relativas .
b) Construir la tabla de frecuencias acumuladas absolutas y relativas .
c) Dibujar la gráfica de barras y la Ojiva .
d) Dibujar una Ojiva “mayor o igual que” e interpretarla .

2) Construya un diagrama de tallo y hoja para los pesos del Ejercicio 5 de la Pag
41.

3 ) Considere la siguiente tabla de frecuencias porcentuales acumuladas:


Límites
Reales 49.5 - 99.5 99.5-149.5 149.5-199.5 199.5-249.5 249.5-299.5 299.5-349.5 349.5-399.5
Hi % 12% 38% 45% 63% 80% 96% 100%
Si se sabe que la muestra está formada por 500 datos , obtenga la tabla de
frecuencias absolutas , y dibuje el histograma .

4) Los siguientes datos representan las edades de un grupo de personas,


expresadas por “años cumplidos” :
23 29 41 35 26 18 46 53 30 29 46 20 66 42 20
17 21 48 33 28 25 39 50 22 27 40 25 19 26 55
28 15 37 60 34 25 21 35 31 25 29 18 36 31 24
33 48 29 56 32 19 23 58 36 21 29 16 24 60 27
35 16 45 22 24 38 30 31 24 19 53 38 17 33 68
37 44 16 25 18 36 47 28 59 23 24 22 35 31 24
58 25 47 39 17 27 32 45 31 16 40 28 42 63 27
34 49 21 23 26 33 37 22 36 20 43 19 21 25 30
29 31 37 32 59 17 34 26 38 46 35 64 20 41 28
37 49 21 38 24 19 44 23 50 19 47 28 36 61 29
a) Agrupe convenientemente estos datos en una tabla de frecuencias.
Gráficos Estadísticos 58
Angel F. Arvelo L

b) Construya el Polígono de frecuencias, la Ojiva , y un “diagrama de tallos y


hojas” , con dos hojas para cada tallo .

5) Los siguientes datos representan el ingreso mensual en unidades monetarias


de una muestra de 200 personas , seleccionadas al azar.
508 575 671 980 426 700 6.540 930 650 1.056
643 875 745 1.245 690 1.000 439 860 2.785 760
1.458 903 500 606 850 754 437 950 942 5.300
695 786 705 904 900 2.700 761 510 920 625
437 3.050 870 685 704 700 910 545 780 650
567 834 829 990 690 550 700 750 940 600
490 670 500 520 675 1.850 530 2.050 590 715
920 755 425 640 917 763 859 658 830 690
549 700 610 985 3.250 475 900 1.000 750 895
465 520 1.900 712 1.300 450 810 721 1.400 685
905 2.150 865 730 915 5.800 438 614 853 764
1.500 906 605 990 455 610 635 1.150 602 929
700 475 650 2.000 503 715 413 900 1.450 908
1.310 512 620 853 712 614 976 906 604 2.100’
439 967 760 958 419 678 600 860 436 945
700 4.800 930 655 995 450 873 604 3.600 1.040
706 973 805 697 5.000 679 925 408 400 945
1.970 783 610 555 2.000 571 940 603 1.625 870
500 3.000 790 491 830 1.070 6.100 560 828 893
420 712 829 1.900 473 820 916 904 745 796

a)¿ Qué tipo de agrupamiento recomendaría Ud. para estos datos ? . Justifique.
b) Elabore una tabla de frecuencia, según el criterio de agrupamiento sugerido
por Ud.
c) Dibuje un histograma , una ojiva y un polígono de frecuencias para la tabla
construida por Ud. .

6) A continuación se da un diagrama de tallo y hoja, para el contenido en gramos


de unas cajas de jabón detergente :
Frecuencia Tallo Hoja

7.00 49 * 0001134
10.00 49 6888888899
17.00 50 * 00011112222234444
21.00 50 555677777788889999999
23.00 51 * 00011111233333334444444
19.00 51 5555666666677788899
13.00 52 * 0011111233344
6.00 52 567889
5.00 53 * 00012
3.00 53 589
1.00 54 * 3
a) Construya la tabla agrupada de frecuencias relativas y de frecuencias
relativas porcentuales acumuladas.
b) Dibuje el Polígono de Frecuencias y la Ojiva
Gráficos Estadísticos 59
Angel F. Arvelo L

7) Los siguientes datos representan el ingreso mensual en unidades monetarias


de una muestra de 200 personas, seleccionadas al azar.
508 575 671 980 426 700 6.540 930 650 1056
643 875 745 1.245 690 1.000 439 860 2.785 760
1.458 903 500 606 850 754 437 950 942 5.300
695 786 705 904 900 2.700 761 510 920 625
437 3.050 870 685 704 700 910 545 780 650
567 834 829 990 690 550 700 750 940 600
490 670 500 520 675 1.850 530 2.050 590 715
920 755 425 640 917 763 859 658 830 690
549 700 610 985 3.250 475 900 1000 750 895
465 520 1.900 712 1.300 450 810 721 1.400 685
905 2.150 865 730 915 5.800 438 614 853 753
1.500 906 605 990 455 610 635 1.150 602 929
700 475 650 2.000 503 715 413 900 1.450 908
1.310 512 620 853 712 614 976 906 604 2.100
439 987 760 958 410 670 600 860 436 945
700 4.800 930 655 995 450 873 604 3.600 1.040
706 973 805 697 5.000 679 925 408 400 945
1.970 783 610 555 2.000 571 940 603 1.630 870
500 3.000 790 491 830 1.070 6.100 560 828 893
420 712 829 1.900 473 820 916 904 745 795
a)¿ Qué tipo de agrupamiento recomendaría Ud. para estos datos ? . Justifique.
b) Elabore una tabla de frecuencia , según el criterio de agrupamiento sugerido
por Ud.
c) Dibuje un histograma , una ojiva y un polígono de frecuencias para la tabla
construida por Ud.

8) La siguiente tabla expresa la antigüedad, en años cumplidos, de los


empleados de una organización bancaria:
Antigüedad (años) Frecuencia
0-1 1200
1-3 1400
3-5 1000
5 -10 700
10 -15 500
15- 25 200
TOTAL 5000
( Los intervalos se suponen cerrados en el extremo inferior y abiertos en el superior )
Construya el histograma , y la Ojiva .

9) Si al leer un histograma de frecuencias construido en escala logarítmíca , Ud.


encuentra que una clase tiene doble altura que otra . ¿ Cual es la relación entre
sus frecuencias reales ? . Respuesta : 10 : 1

10) Suponga que en un histograma de frecuencias construido con escala de


raíz cuadrada, Ud. encuentra que la altura de la primera clase es una vez y
Gráficos Estadísticos 60
Angel F. Arvelo L

media la altura de la segunda clase . ¿ Cual es la razón porcentual entre la


frecuencia real de la segunda clase y la primera ? . Respuesta : 44.44 %

II. Nivel Intermedio


11)Dada la siguiente Ojiva de frecuencias relativas porcentuales:

Obtenga la tabla de frecuencias relativas , y dibuje el polígono de frecuencias


relativas.

12) Demuestre que el área bajo el polígono de frecuencias es igual a la suma de


las áreas de los rectángulos del histograma .

13) Complete la siguiente tabla para datos agrupados con intervalos de igual
amplitud:
Frecuencia Relativa
Frecuencia Frecuencia Relativa Porcentual
Límites Reales Frecuencia Acumulada Porcentual Acumulada
? ? ? ? 6.00 %
? ? ? ? 25.50%
19.5 - 24.5 ? 122 ? ?
? ? 180 ? ?
? ? 200 ? ?
TOTAL ? 100.00 %
Respuesta : Frecuencias : 12 , 39 , 71 , 58 y 20 .

14) Suponga que en un histograma que considera cuatro clases construido con
escala de raíz cuadrada, olvidaron colocar sobre el eje vertical la frecuencia de
cada clase , y que Ud. para averiguarlas mide con un escalímetro la altura de los
rectángulos que las representan .
Gráficos Estadísticos 61
Angel F. Arvelo L

Si al medir las alturas , Ud. encuentra 3.40 , 5.00 , 7.80 y 1.70 centímetros .
¿Cual es la frecuencia relativa porcentual de cada una de las cuatro clases ?.
Respuesta : 11.53% , 24.93 % , 60.66 % y 2.88 % respectivamente .

15) Complete la siguiente tabla de frecuencias , para intervalos de igual


amplitud:
Frecuencia Relativa
Frecuencia Frecuencia Relativa Porcentual
Límites Reales Frecuencia Acumulada Porcentual Acumulada
49.5 - 69.5 x ? ? ?
? ? ? ? 32.50 %
? 3x ? ? 70.00 %
? ? 357 ? ?
? ? ? ? ?
? 11 ? ? ?
Total 400 100.00 %
Respuesta : x = 50

16) Complete la siguiente tabla de frecuencias para intervalos de diferente


amplitud, y dibuje el histograma :
Límites Reales Frecuencia Densidad de Frecuencias
9.95- 12.5 12 ?
? 15 3.00
? - 20.5 ? 7.00
20.5 - ? 32 8.00
? - 29.5 ? 2.00
29.5 - ? ? 1.00
Total 100
Respuesta : Frecuencias : 21 , 10 y 10
Límites de clase : 12.5 a 17.5 , 17.5 a 20.5 , 20.5 a 24.5 , 24.5 a
29.5 y 29.5 a 39.5

III. Nivel Avanzado

17) En un histograma de frecuencias construido en escala logarítmica en base


10, y que considera cuatro clases , las alturas de los rectángulos que las
representan son de 1.0000 cms , 1.7993 cms , 2.1614 cms y 2.7634 cms .
Calcule la frecuencia relativa porcentual de cada una de las cuatro clases .
Respuesta : 1.25 % , 7.89 % , 18.17 % y 72.69 % respectivamente

18) Demuestre que si un conjunto de valores está representado por respectivos


segmentos en escala logarítmica de base cualquiera, al cambiar la base de los
logaritmos, la longitud de estos segmentos queda multiplicada por una
constante, y por lo tanto se mantiene la proporción entre ellos .
Gráficos Estadísticos 62
Angel F. Arvelo L

19) Se define como densidad de frecuencias relativas para un intervalo a la


densidad de frecuencias dividida entre el número total de datos , es decir :
di fi
gi ; donde: gi = Densidad de frecuencias relativas del intervalo.
n n ci
Demuestre que el área total bajo el polígono de densidad de frecuencias
relativas es siempre igual a 1 , y que el área bajo este polígono para un intervalo
cualquiera es siempre igual a la frecuencia relativa del intervalo.

Nota del autor : Las curvas de probabilidad continuas son una aproximación al polígono de densidad de
frecuencias relativas , y por esta propiedad , a ellas se les exige que el área bajo la curva sea igual a 1 ; y
por esta misma razón la probabilidad de un intervalo que es una aproximación teórica a la frecuencia
relativa, viene dada por el área bajo la curva en el intervalo .