Você está na página 1de 9

UNIDAD II: Distribución de Frecuencias y herramientas gráficas.

OBJETIVO TERMINAL: Aplicar las técnicas de organización y resumen de datos con la


finalidad de preparar y obtener información significativa.

DISTRIBUCIÓN DE FRECUENCIA.
En el caso de ordenación de datos cualitativos, la agrupación es muy sencilla y se realiza
de acuerdo a las modalidades que presenta la variable de estudio.
En este caso organizaremos datos en una tabla de distribución de frecuencia agrupándolas
en clases de igual amplitud, mediante un conteo para determinar el número de datos
correspondientes a las diferentes categorías de la variable.
Para organizar y agrupar datos del tipo cuantitativo, bien sea del tipo discreto o continuo se
utiliza un procedimiento muy similar, pero más laborioso a los datos cualitativos. Al
resumir grandes colecciones de datos, es útil distribuirlas en clases y categorías,
determinando el número de individuos que pertenecen a la clase es llamado "frecuencia de
clase". Aquí observamos una sola característica.
Tipos de Datos.
Datos no Agrupados: (cuando la cantidad de datos es menor o igual a 15)
- Se observa los valores de las características.
- Si la variable admite ordenación, se ordenan de menor a mayor.
- Observar los valores repetidos.
Datos Agrupados: (cuando la cantidad de datos es mayor a 15)
- Se observa los valores de las características.
- Si los valores de la característica es muy elevado se agrupan por categorías.
Elementos de una distribución de frecuencia.
_ f: frecuencia absoluta (cantidad de elementos que se repiten).
_ f/n: frecuencia relativa (Proporción de elementos)
_ F: frecuencia Acumulada(es lo que podemos ir acumulando)
_ F/n: frecuencia relativa acumulada (Proporción de lo que acumulamos)
INTERVALO DE CLASE: Lo podemos definir como el conjunto de datos que se
encuentran ubicados entre dos límites establecidos.
LIMITES: se define como los valores inferiores o superiores de cierta categoría.
_ Xi: Limite inferior
_ Xs: Limite superior.

Prof. Rosmery Rodríguez Página 1


Limites reales de la clase
Li = Xi -0.5: Límite inferior real.
Ls = Xs + 0.5: Límite superior real.

Punto medio de cada clase:

Amplitud o Rango: R = Xmax- Xmin


Intervalo de Clase: Ni = 1 + 3.32l log(n); se trabaja con la aproximación al entero
Amplitud del Intervalo:

EJEMPLO:
Los siguientes datos representan las estaturas de los estudiantes de Análisis de Sistema
cursantes de la asignatura Elementos Estadísticos

1,56 1,7 1,83 1,8 1,75 1,77 1,73 1,7 1,6 1,9
1,63 1,8 1,6 1,62 1,68 1,6 1,83 1,64 1,72 1,7
1,6 1,77 1,75 1,57 1,7 1,61 1,8 1,75 1,55

Solución:
Definamos la variable
X: Estatura de los estudiantes de Análisis de Sistema
Variable Cuantitativa Continua
n=29 > 15 trabajamos con datos Agrupados
Busquemos los elementos
N° de clases: Ni=5,85516135 ≈ 6
Rango de los datos: R= 1,9 - 1,55=0,35

Amplitud de las clases:

Comencemos a formar la tabla de frecuencia


Primero al valor mínimo le sumamos i, y esta será la primera clase, luego
comenzamos con ese valor y volvemos a sumar i, así hasta encontrar las seis clases.
[Xi-Xs) fi Fi hi Hi hi*100 Hi*100 Xmi
[1,55-1,61) 7 7 0,24 0,24 24 24 1,58
[1,61-1,67) 4 11 0,14 0,38 14 38 1,64
[1,67-1,73) 6 17 0,21 0,59 21 59 1,7
[1,73-1,79) 6 23 0,21 0,79 21 79 1,76
[1,79-1,85) 5 28 0,17 0,97 17 97 1,82
[1,85-1,91) 1 29 0,03 1 3 100 1,88
∑ 29 1 100

Prof. Rosmery Rodríguez Página 2


Con la tabla anterior responda:
a. ¿Que cantidad de estudiante mide entre 1,61 y 1,66?
Como podemos ver en la segunda clase cae eso intervalo por lo tanto hay 4 estudiantes
b. ¿Qué proporción de estudiantes tienen miden entre mas de 1,79?
Como podemos apreciar los mayores de 1,79 es a partir de la quinta clase es decir que la
proporción es 0,17+0,03=0,21
c. ¿Qué porcentaje de estudiantes tiene estatura menor a 1,73?
Como podemos apreciar los menores de 1,73 utilizando el porcentaje de la acumulada
ya esta la suma por lo tanto hay 59%

Ejercicios:
1. Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los
siguientes resultados:

PLAZAS Nº DE
HOTELES
0-10 25
10-30 50
30-60 55
60-100 20

Con la tabla responda:


a) ¿Cuál es la proporción de hoteles que disponen de entre 11 y 60 plazas?
b) ¿Cuántos hoteles tienen treinta o menos plazas?
c) Calcule las marcas de clase de cada intervalo.
d) ¿Cual es la proporción de hoteles esta entre 10 y 60?
e) ¿Cual de las marcas tiene más porcentaje?

2. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha


observado el número de empleados que hay en cada una de ellas para un estudio
posterior. Las observaciones obtenidas han sido:
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12,
16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14,
16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.

a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias


absolutas, relativas y sus correspondientes acumuladas.

b) ¿Qué proporción de sucursales tiene más de 15 empleados?

a) ahora realice la tabla de frecuencia Agrupando en intervalos de amplitud 3 los


valores de la variable, calcule su distribución de frecuencias

Prof. Rosmery Rodríguez Página 3


3. Se dispone del beneficio anual obtenido el pasado año por 38 empresas madrileñas:

Beneficio (miles €) Nº
empresas
230-280 5
280-330 7
330-580 14
580-630 9
630-780 3
Se pide:

a) Calcular el beneficio medio de estas 38 empresas madrileñas.

b) ¿Cuál es el beneficio mayor de la mitad de las empresas más modestas?

c) Determinar el beneficio más frecuente.

d) El 25% de las empresas mas rentables ¿qué nivel de beneficios tienen?

4. Las calificaciones finales obtenidas por los 80 alumnos de un primer curso de


Estadística figuran en la tabla adjunta:
68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72 66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77
Se pide:
• Preparar una tabla de frecuencias.
• El número de estudiantes con calificaciones de 75 ó más.
• El porcentaje de las calificaciones mayores a 75
• La proporción de los de 60 y 80 puntos

5. El primer día de clases del semestre pasado se les preguntó a 50 estudiantes, acerca del
tiempo (en minutos) que tardan para ir de su casa a la universidad y las repuesta fueron:

20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10
20 25 45 20 5 25 40 25 25 20 30 25 35 20 30 15 30 25 20 10
10 5 10 15 25 40 25 10 20 15

• Ordenar los datos en una tabla de frecuencias agrupándolos en clases de igual amplitud.

Prof. Rosmery Rodríguez Página 4


REPRESENTACIONES GRÁFICAS
Constituye uno de los métodos más utilizados y posiblemente el más útil de los principales
métodos de representaciones de datos estadísticos, ya que transmite en forma inmediata una
idea general sobre los principales aspectos de los datos, pero no proporcionan detalles. Un
gráfico debe ser sencillo y de fácil interpretación.

Gráfico de puntos: se construye trazando primero una escala horizontal que abarca el
intervalo de los datos. Los valores numéricos de las observaciones se localizan en la escala
horizontal colocando un punto sobre el valor apropiado. Si se repiten valores de los datos,
los puntos se colocan encimados, formando una pila en la posición numérica
correspondiente.

EJEMPLO: Los siguientes datos representan las calificaciones del Examen Final de Bases
de Datos I. Construya un diagrama de puntos.
88 77 49 38 100 95 60 75 100 80
63 69 50 90 82 65 75 100 95 50
80 70 60 100 75 80 100 90 85 75

___________________________________________________________________
38 49 50 60 63 65 69 70 75 77 80 82 85 88 90 95 100

Diagrama de tallo y Hojas: divide las observaciones de los datos en dígitos primarios y
dígitos derivados. Por ejemplo, si las observaciones del conjunto de datos tuvieran a lo
sumo dos dígitos, entonces la columna de las decenas seria el digito primario y la columna
restante sería el digito derivado.

Dígito Dígito
Primario Derivado

EJEMPLO: un fabricante de pilas para linterna tomó una muestra de 24 piezas de la


producción de un día y las utilizó en forma continua hasta que comenzaron a fallar. El
resultado en días de funcionamiento fue:
8 9 10 10 11 12 12 13 13 14 14 15
17 17 20 20 23 25 28 33 38 48 50 61
Ilustre la duración de las pilas de linterna en un diagrama de tallo y hojas

Como tenemos números de dos dígitos el primero se convertirán en talla y el segundo


digito en las hojas es decir el diagrama viene dado por:

0 8, 9
1 0, 0, 1, 2, 2, 3, 3, 4, 4, 5, 7, 7
2 0, 0, 3, 5, 8
3 3, 8
4 8
5 0
6 1

Prof. Rosmery Rodríguez Página 5


Diagrama de barra: indican la frecuencia (o frecuencia relativa) que corresponde a cada
categoría siendo la altura de la barra (eje de las ordenadas Y) proporcional ala frecuencia
(o frecuencia relativa) de la categoría el cual se encuentra en el eje X.
Es utilizada cuando trabajamos con datos cualitativos o cuantitativos Discreto.

EJEMPLOS:
1. En una empresa se desea conocer el color de ojos de sus empleados, se observa a los 50
empleados y se obtienen los siguientes resultados:
El diagrama de barras asociado es:

Color ojos Empleados


Negros 14
Marrones 24
Verdes 4
Azules 8

2. Clasificadas 12 familias por su número de hijos se obtuvo:


Número de hijos 1 2 3 4
Frecuencias f 1 3 5 3
Si definimos la variable X: número de hijos por familia
Es una variable cuantitativa discreta
Gráficamente,
Números de hijos

6
4
2
0
1 2 3 4

Se hace una descripción de los gráficos.

Diagrama de Pareto: es una gráfica de barras de frecuencia en la que las barras, se


presentan en orden de altura, comenzando con la más alta a la izquierda. (Diagrama de
Pareto es llamado en honor del economista italiano Vilfredo Pareto).

EJEMPLO:

Un problema de interés para la División de Economia Comercial (DEC) del Departamento


de Trabajo de Estados Unidos. Cada año, la DEC monitorea la empresas que fracasan y
clasifica cada fracaso en una de las seis siguientes categorías: (1) falta de experiencia en la
línea de producción, (2) falta de experiencia gerencial, (3) experiencia desequilibrada, (4)
incompetencia, (5) otras causas (como negligencia, fraude y desastres naturales) y (6)
Prof. Rosmery Rodríguez Página 6
causas desconocidas. Estas informaciones se basan en las opiniones de acreedores
informados y los informes de la DEC. En fechas recientes, la DEC determinó la causa de
1463 fracasos de empresas constructoras. Los fracasos se muestran en la siguiente tabla.

Causas subyacentes Frecuencia Frecuencia


relativa
Incompetencia 698 0.477
Experiencia desequilibrada 314 0.215
Falta de experiencia gerencial 236 0.161
Falta de experiencia de línea 111 0.076
Causa desconocida 83 0.057
Otras causas 21 0.014
TOTALES 1463 1.000

El método gráfico más popular y tradicional para describir datos cuantitativos es el


histograma.
Histograma: Es un diagrama de barra el cual se describe datos cuantitativos para datos
grandes.
Señala la frecuencia correspondiente a cada intervalo de clase por medio de rectángulos
cuya altura es la frecuencia del intervalo (f) y la base (ancho) es el espacio representado
por la amplitud del intervalo.
Este gráfico se construye colocando en el eje X los límites reales y en el eje Y la
frecuencia.

EJEMPLO: Los siguientes datos representan el peso de 65 personas adultas que acuden a
un examen físico en Ascardio y está representado mediante una tabla. Realice un
histograma con los pesos de los adultos
Pesos fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65

Prof. Rosmery Rodríguez Página 7


Polígono de frecuencia:
Para el caso Discreto es un gráfico en donde se localizan los puntos en un sistema de
coordenadas y luego se conectan los puntos sucesivos con trazos rectos.
Para el caso continuo, es la unión de las marcas de las clases, con la frecuencia.

EJEMPLO: La siguiente información corresponde a una muestra de triglicéridos en


personas adultas menores de 30 años. (caso Discreto)

Del ejemplo anterior de los pesos de los adultos tenemos


Pesos fi Xmi
[50, 60) 8 55
[60, 70) 10 65
[70, 80) 16 75
[80, 90) 14 85
[90, 100) 10 95
[100, 110) 5 105
[110, 120) 2 115
65

Otro método gráfico para describir datos cuantitativos es el diagrama de tallo y hojas que
se utiliza ampliamente en el análisis exploratorio de datos cuando el conjunto de datos es
pequeño.

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y


sobresaliente) obtenidas por un grupo de 50 alumnos.

Diagrama de cajas: Básicamente se utiliza para determinar visualmente, si existen


patrones de simetría (o asimetría) de un conjunto de datos de tipo cuantitativo.
Se representan los 3 cuartiles y los valores mínimo y máximo de los datos, sobre un
rectángulo alineados horizontalmente o verticalmente.

Xmin Q1 Q2 Q3 Xmax

Prof. Rosmery Rodríguez Página 8


Diagrama circular o de pastel: divide un círculo completo (un pastel) en tajadas, cada una
de las categorías. El ángulo central de cada rebanada es proporcional a la frecuencia
relativa de esa categoría. Para ello a cada proporción se multiplica por 360 que son los
grados del círculo.

Ejemplo: Se pidió a cada miembro de una muestra de 20 personas, dueños de


motocicletas, que dieran el nombre del fabricante de su máquina. Los datos son los
siguientes: Honda, Otra, Harley-Davidson, Yamaha, Yamaha, Harley-Davidson, Yamaha,
Yamaha, Harley-Davidson, Suzuki, Suzuki, Suzuki, Suzuki, Yamaha, Suzuki, Yamaha,
Yamaha, Kawasaki, Suzuki, Kawasaki. La tabla de distribución de frecuencias se presenta
a continuación.

Tipo de Número de
h h*360
Motocicleta personas Motocicletas
Harley-
3 0,15 54
Davinson Harley-Davinson
Honda 1 0,05 18 Honda
Kawasaki 2 0,1 36 Kawasaki

Otra 1 0,05 18 Otra

Suzuki 6 0,3 108 Suzuki


Yamaha
Yamaha 7 0,35 126
Total 20 1 360
Se hace una interpretación de la gráfica.

ACTIVIDAD:

A los ejercicios de Distribución de frecuencia realizar su respectivo diagrama

Prof. Rosmery Rodríguez Página 9

Você também pode gostar