Você está na página 1de 44

2-1

Descripción de los datos:


distribuciones de frecuencias y
representaciones gráficas
OBJETIVOS
Al terminar este capítulo conocerá:

Distribución de frecuencias
Cuadros
Gráficas
Tablas de contingencia
Diagramas de dispersión y línea de tendencia
Diagrama de tallo y hoja
Diagramas de pareja
2-2

Distribución de frecuencias

• Distribución de frecuencias:
agrupamiento de datos en categorías o
clases que muestran el número de
observaciones en cada categoría
mutuamente excluyente.
2-3

Elaboración de una distribución de frecuencias

pregunta que recolección organización presentación obtención


se desea de datos de datos de datos de
responder (datos originales) (gráfica) conclusiones

distribución
de frecuencias
2-4

Elaboración de una distribución de frecuencias


Formular tablas estadísticas de acuerdo a las variables tabuladas.

TABLAS DE VARIABLES:

1.-M 11.-M 21.-F


2.-F 12.-M 22.-M
3.-F 13.-F 23.-F Pregunta:
24.-M
¿cuál es el sexo de los
4.-M 14.-F Trabajadores en una empresa.?
5.-F 15.-M 25.-F
6.-F 16.-M 26.-M Sexo: Variable cualitativa.
7.-F 17.-M 27.-M
8.-M 18.-F 28.-F
9.-M 19.-F 29.-F
10.-F 20.-F 30.-F
2-5

Elaboración de una distribución de frecuencias :

TABLA N°1:
TABLA DE DISTRIBUCION DE FRECUENCIAS PARA EL GENERO DE LA EMPRESA
Genero Conteo Fre. Absoluta Fre. Relativa Fre. AcumuladaFrec. % AcumuladaGrados
Clases f fr% fa fra Gr
Mas. lllll lllll lll 13 43.33% 13 43% 156
Fe. lllll lllll lllll ll 17 56.67% 30 100% 204
Total 30 100.00% 360

Genero Conteo Fre. Absoluta Fre. Relativa Fre. Acumulada Frec. % Acumulada Grados
Clases f fr% fa fra Gr
Mas. lllll lllll lll 13 43.33% 13 43% 156
Fe. lllll lllll lllll ll 17 56.67% 30 100% 204
Total 30 100.00% 360

Fuente : Empresa
Elaboración propia
2-6

Elaboración de una distribución de frecuencias :

C : Clases. CONTEO: Es la Tabulación.


f : frecuencia o frecuencia absoluta, sirve para determinar el numero total de casos que
se repite en cada intervalo.
fa : frecuencia acumulada, sirve para comprobar el numero total de casos estudiados.
fr %: frecuencia relativa.

fr % = f
 100
n
Sirve para interpretar la tabla.
fra %: frecuencia relativa acumulada.
43.33

Grados: 360°---- 100% mas.

x ---- 43.33% fem.

56.66
2-7

Elaboración de una distribución de frecuencias

• Cuando tienen Rango corto o Pequeño:


Los intervalos de clase son números correlativos del valor
mínimo al valor máximo. ( 0 a 6 )
Tabla N°2
Numero de hijos de los 40 trabajadores de una constructora.
2 1 3 4 3 2 2 3
4 3 1 2 3 4 4 1
2 3 3 4 1 2 2 5
0 1 1 6 4 3 3 1
4 4 2 3 3 2 5 2
2-8
Elaboración de una distribución de frecuencias
Número de hijos de los 40 trabajadores de una constructora.
Numero de hijos
Clases Conteo f fr% fa fr a%
15
0 l 1 2.50% 1 2.50%

frecuencias
1 llll ll 7 17.50% 8 20.00% 10

2 lllll lllll 10 25.00% 18 45.00% 5


Series1, 1
3 lllll lllll l 11 27.50% 29 72.50% 0
4 0 1 2 3 4 5 6
lllll lll 8 20.00% 37 92.50% 2.5% 2.5%
5.0% 2.5%
5 ll 2 5.00% 39 97.50%
17.5%
6 l 1 2.50% 40 100.00% 17.5% 25.0%
40 100.00% 20.0%
27.5%
Fuente : Empresa 25.0%
20.0%
27.5%
Elaboración propia 5.0%
2.5%

•INTERPRETACION: En la presente tabla que se refiere al numero de


hijos de los trabajadores de una empresa constructora observamos que el
27,5% tiene 3 hijos, el 25% tiene 2 hijos, el 20% tiene 4 hijos, el 17,5% tiene 1
hijo.
Siendo los demás porcentajes de menor incidencia , por lo tanto mas
del 50% de los trabajadores tienen de 1 a 4 hijos.
2-9

Distribución de frecuencias Cuando el Rango es


Grande

• Se asume que se han recolectado los datos y


nuestra tarea es organizarlos y presenta estos
en forma descriptiva para analizar e interpretar
los datos
• Como estadístico le han pedido recolectar y
agrupar los dato sobre el numero de pasajeros
que han decidido viajar en nuestra empresa
para poder analizarlos . Los datos de los
últimos 50 días son los siguientes
2-10

Distribución de frecuencias
Datos brutos sobre el número de pasajeros de
la empresa
• 68 71 77 83 79
Es preciso agrupar y
• 72 74 57 67 69
presentar los datos
• 50 60 70 66 76
de manera concisa y
• 70 84 59 75 94
reveladora en una
• 65 72 85 79 71
distribución de
• 83 84 74 82 97
frecuencia o tabla
• 77 73 78 93 95
• 78 81 79 90 83
• 80 84 91 101 86
• 93 92 102 80 69
2-11

Distribución de frecuencias

Proceso
1 .- Calcular el Rango R = X max - X min = 102 - 50 = 52
2 .- Número de Clase Puede ser arbitrario dentro de los limites de
5 a 20
Criterio de STURGES k = 1+ 3.3 *Log 10 n
= 1 + 3.3 Log 50 = 6.6066
Sugiere que sean 6 clases en nuestro cuadro Por razones de
conveniencia pueden ser mayor o menor el numero de clases.
Los intervalos de clase usados en la distribución de frecuencias
deben ser iguales.
2-12

Sugerencias para elaborar


una distribución de frecuencias

3 .- Determine un intervalo de clase sugerido con la


fórmula: IC = R / K IC = 52 / 6 = 8.7
• Por razones de conveniencia se eligio 10 como intervalo
de clase
• Para la elaboración del intervalo dentro de cada clase, el
intervalo elegido menos el valor minimo ( 10 ) - 1
50 a 59
2-13

Distribución de frecuencias
4.- Marca de clase (punto medio): Es el promedio
entre los límites superior e inferior de la clase.
M = L inf + Lsup / 2
M = 50 + 59 / 2 = 54.5
• Cada clase tiene un límite inferior y un límite superior
2-14

Cuadro de Distribución de frecuencias

Numero de pasajeros de la empresa


Clases Frecuencias Punto Medio Frecuencia A. Frecuencia Frecuancia
Conteo
(pasajeros) (días) M (días) Relativa (%) R. Acumulada (%)
50 - 59 /// 3 54,5 3 3/50 = 06% 06%
60 - 69 ///// // 7 64,5 10 7/50 = 14% 20%
70 - 79 ///// ///// ///// /// 18 74,5 28 , = 36% 56%
80 - 89 ///// ///// // 12 84,5 40 , = 24% 80%
90 - 99 ///// /// 8 94,5 48 , = 16% 96%
100 - 109 // 2 104,5 50 , = 04% 100%
50

Fuente : Empresa
Elaboración propia
2-15

• Si quisiéramos saber que % de pasajeros viajaron en


nuestra empresa cuando viajan entre 74 y 86 pasajeros
tendríamos que interpolar los datos

Clases Frecuencia
Fr % 36% 24% (pasajeros) Relativa (%)
50 - 59 3/50 = 06%
60 - 69 7/50 = 14%
Intervalo x y 70 - 79 , = 36%
80 - 89 , = 24%
90 - 99 , = 16%
100 - 109 , = 04%
74 86 89
70 79 80

X 79  74 Y 86  80
 x  20  y  16
36 79  70 24 89  80

Por lo tanto el % será 36% cuando viajan entre 74 y 86 pasajeros


2-16

• Si quisiéramos saber que % de pasajeros viajaron en


nuestra empresa cuando viajan entre 68 y 84 pasajeros
tendríamos que interpolar los datos
Fr % 14 36 24 Clases Frecuencia
(pasajeros) Relativa (%)
50 - 59 3/50 = 06%
60 - 69 7/50 = 14%
x y 70 - 79 , = 36%
Intervalo 80 - 89 , = 24%
90 - 99 , = 16%
70 79 100 - 109 , = 04%
60 67 69- 80 84 89

X 69  67 Y 84  80
 x  3.111  y  10.666
14 69  60 24 89  80

Por lo tanto el % será 49.77% cuando viajan entre 68 y 84 pasajeros


2-17

Distribución de frecuencias continuas

Para el caso de los datos continuos, los valores


exactos son muy importantes. En este caso es
necesario permitir valores fraccionarios, de tal
forma que los límites de clase sería:
50 y menos de 60
60 y menos de 70
y así sucesivamente
2-18

Con los siguientes datos ,forma los intervalos


usando la regla de Sturges .
8.02 6.92 8.39 7.30 9.78 9.44 8.78 7.59
8.03 7.00 8.41 7.36 9.90 9.52 8.80 7.66
8.04 7.00 8.44 7.38 9.91 9.53 8.98 7.67
8.06 7.01 8.56 7.45 9.93 9.54 9.05 7.71
8.13 7.01 8.59 7.45 10.00 9.58 9.07 7.80
7.82 6.60 8.28 7.05 9.59 9.17 8.62 7.47
7.84 6.63 8.29 7.12 9.62 9.18 8.66 7.48
7.85 6.66 8.33 7.25 9.71 9.20 8.66 7.48
7.89 6.81 8.35 7.26 9.71 9.25 8.67 7.56
7.94 6.83 8.39 7.28 9.75 9.27 8.68 7.58
2-19

Con los siguientes datos ,forma los intervalos usando la regla de Sturges .

6.60 7.05 7.47 7.82 8.28 8.62 9.17 9.59

6.63 7.12 7.48 7.84 8.29 8.66 9.18 9.62

6.66 7.25 7.48 7.85 8.33 8.66 9.20 9.71

6.81 7.26 7.56 7.89 8.35 8.67 9.25 9.71

6.83 7.28 7.58 7.94 8.39 8.68 9.27 9.75

6.92 7.30 7.59 8.02 8.39 8.78 9.44 9.78

7.00 7.36 7.66 8.03 8.41 8.80 9.52 9.90

7.00 7.38 7.67 8.04 8.44 8.98 9.53 9.91

7.01 7.45 7.71 8.06 8.56 9.05 9.54 9.93


7.01 7.45 7.80 8.13 8.59 9.07 9.58 10.00
2-20
Valor menor :
Valor mayor :
Rango :
Total Datos :
Núm Clases :
Amplitud de clase :
Cambio mínimo :
I.C.Vertical :
I.C.Horizontal :

Estatura
Frec. (Trab.) Punto Medio Frec. % Frec. Acumulada + Frec. Acum. + %
LimInf LimSup
f M f% fa+ fa%
2-21
Valor menor : 6.60
Valor mayor : 10.00
Rango : 3.40
Total Datos : 80.00
Núm Clases : 7.28
Amplitud de clase : 0.47
Cambio mínimo : 0.01
I.C.Vertical : 0.50
I.C.Horizontal : 0.50

Estatura
Frec. (Trab.) Punto Medio Frec. % Frec. Acumulada + Frec. Acum. + %
LimInf LimSup
f M f% fa+ fa%
6.60 7.10 11 6.85 14% 11 14%
7.10 7.60 15 7.35 19% 26 33%
7.60 8.10 13 7.85 16% 39 49%
8.10 8.60 11 8.35 14% 50 63%
8.60 9.10 10 8.85 13% 60 75%
9.10 9.60 9 9.35 11% 69 86%
9.60 10.10 11 9.85 14% 80 100%
80 100%
2-23
La tabla siguiente muestra la composición por edad, sexo y trabajo de un grupo
de personas con tuberculosis pulmonar en la provincia de Puno en el año 2010:

Edad Trabajadores No trabajadores Totales


Varón Mujer Total Varón Mujer Total Varón Mujer Total
14-19 2 1 3 25 40 65 27 41 68
19-24 10 4 14 20 36 56 30 40 70
24-29 32 10 42 15 50 65 47 60 107
29-34 47 12 59 13 34 47 60 46 106
34-39 38 8 46 10 25 35 48 33 81
39-44 22 4 26 7 18 25 29 22 51
Personas
Varones notrabajadoras
trabajadores con
conmujeres
tuberculosis
Total de que padecen de tuberculosis
tuberculosis
25 60
25 60
60 20
Fuente : Minsa 50 12
41
46
50 20 40
15
Elaboración propia 40 10 40 13 8 33
15
30 30 10 22
47 4 7
20 10 32 20 38
4 22
10
15 10 10
2
0
0
14-190 19-24 24-29 29-34 34-39 39-44
14-19 19-24 24-29 29-34 34-39 39-44
14-19 19-24 24-29
Edad 29-34 34-39 39-44
Edad
Edad
Varón Mujer
2-25

Diagramas de dispersión y línea de tendencia

• Un diagrama de dispersión es una representación entre


dos variables cuantitativas y una línea de tendencia es
aquella que proporciona una aproximación de la relación.

• Diagramas de dispersión
• Los diagramas de dispersión ayudan a ilustrar lo que
muestran los datos sin procesar.
• Muestran la apariencia de una relación entre X y Y
2-26

Relación lineal negativa perfecta

10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
2-27

Relación positiva perfecta


10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
2-28

Relación positiva fuerte


10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
2-29

Relación negativa fuerte


10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
2-30

Relación Curvilínea
10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
2-31

10
9
8
7
6
Y
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
2-32

Ejemplo

• En 10 ocasiones la tienda Franco usó los comerciales


de televisión para promover las ventas . Los gerentes
quieren investigar si existe una relación entre el
numero de comerciales trasmitidos y las ventas en la
semana siguiente

• Los datos muéstrales de las 10 semanas y las ventas


en miles de soles son
2-33

Datos Muestrales para la tienda FRANCO


Nº Comerciales Ventas en miles
Semanas x y Datos Muestrales para la
1 2 50 tienda FRANCO
2 5 57 70
3 1 41 60
4 3 54 50
5 4 54 40
6 1 38 30
7 5 63 20
8 3 48 10
9 4 59 0
10 2 46 0 1 2 3 4 5 6

El diagrama de dispersión sugiere que se podría usar una


línea recta como una aproximación de la relación
2-34

Representación de tallo y hoja


Clases Frecuencias
(pasajeros) (días)
50 - 59 3
•68 71 77 83 79 60 - 69 7
70 - 79 18
•72 74 57 67 69 80 - 89 12
•50 60 70 66 76 90 - 99 8
100 - 109 2
•70 84 59 75 94 50

•65 72 85 79 71 En la segunda clase de esta distribución


•83 84 74 82 97 no se puede identificar como están
distribuidos los valores, es decir si están
•77 73 78 93 95 próximos a 60 o 69
•78 81 79 90 83 El valor del tallo es el del digito o dígitos
•80 84 91 101 86 principales En este caso el 6 . Las Hojas
son los dígitos siguientes
•93 92 102 80 69
6 0567899
2-37

Presentación gráfica de una


distribución de frecuencias

• Las tres formas de gráficas más usadas son


histogramas, polígonos de frecuencia y
distribuciones de frecuencias acumuladas
(ogiva).
2-38

Histograma para el número de pasajeros


•Histograma: gráfica donde las clases se marcan en el
eje horizontal y las frecuencias de clase en el eje
vertical. Las frecuencias de clase se representan por las
alturas de las barras y éstas se trazan adyacentes entre sí.
20
Frecuencia

15

10

0
50 60 70 80 90 100 110
Pasajeros
2-39

Polígono de frecuencias de pasajeros


• Un polígono de frecuencias consiste en segmentos
de línea que conectan los puntos formados por el
punto medio de la clase y la frecuencia de clase.

20
Frecuencia

15

10

0
50 60 70 80 90 100 110
Pasajeros
2-40

Polígono de frecuencias de pasajeros

f (días)
20 18

15 12

10 8
7
5 3
2
0
0
50 60 70 80 90 100 110
Pasajeros
54.5 64.5 74.5 84.5 94.5 104.5

Marca de clase
2-41

Distribución de frecuencias acumuladas “menor que”


para el número de pasajeros de la empresa

Una distribución de frecuencias


DISTRIBUCIÓN DE FRECUENCIA ACUMULADA
acumulada (ojiva) se usa para
"MENOR QUE" PARA EL NÚMERO DE PASAJEROS
determinar cuántos o qué
CLASES
(pasajeros)
f (días) fa (días) proporción de los valores de
menos de 50
menos de 60
0
3
0
3
los datos es menor o mayor
menos de 70 7 10 que cierto valor.
menos de 80 18 28
menos de 90 12 40
menos de 100 8 48
menos de 110 2 50

OGIVA (Frec. Acumulada)


f a (días)
60 48 50
40
40 28
20 3 10
0
0
50 60 70 80 90 100 110
Pasajeros
2-42
Distribución de frecuencias acumuladas “mas de ” para el
número de pasajeros de la empresa

Esta distribución “más de ”se forma restando


la frecuencia de las clases anteriores .
DISTRIBUCIÓN DE FRECUENCIA ACUMULADA "MAS
DE " PARA EL NÚMERO DE PASAJEROS
En los 50 días se compran por lo menos 50
pasajes por lo tanto la primera clase es 50 .
CLASES
f (días) fa (días) En tres de estos días menos de 60 pasajeros
(pasajeros)
compraron pasajes . Por lo tanto la fre.
50 o ma´s 3 50
60 o más 7 47 Acumulada de la segunda clase es 47
70 o más 18 40
80 o más 12 22
90 o más 8 10
Fecuencia Acum ulada "m ás de"
100 o más 2 2 del núm ero de pasajeros
110 o más 0 0
60
50
Frecuencia

40
30
20
10
0
50 60 70 80 Pasajeros
90 100
2-44

Gráfica de barras

• Una gráfica de barras se puede usar para


describir cualquier nivel de medición
(nominal, ordinal, de intervalo o de
razón).
• EJEMPLO 3: construya una gráfica de
barras para el número de personas
desempleadas por cada 100 000
habitantes de ciertas ciudades en 1995.
2-45

EJEMPLO 3 continuación

Ciudad Número de desempleados


por 100 000 habitantes
Atlanta, GA 7300
Boston, MA 5400
Chicago, IL 6700
Los Angeles, CA 8900
New York, NY 8200
Washington, D.C. 8900
2-46

Gráfica de barras para los datos de desempleados

10000
# desempleados/100 000

8900 8900
8200
8000 7300
6700
5400 Atlanta
6000
Boston
4000 Chicago
Los Angeles
2000 New York
0 Washington
1 2 3 4 5 6
Ciudades
2-47

Gráfica circular

• Una gráfica circular es en especial útil para


desplegar una distribución de frecuencias
relativas. Se divide un círculo de manera
proporcional a la frecuencia relativa y las
rebanadas representan los diferentes
grupos.
• EJEMPLO 4: se pidió a una muestra de 200
corredores que indicaran su tipo favorito
de zapatos para correr.
2-48

EJEMPLO 4 continuación

• Dibuje una gráfica circular basada en la siguiente


información.
Tipo de zapato # de corredores Grados: 360°---- 100%
x ---- 46%
Nike 92 46 %
Adidas 49 24.5%
Reebok 37
Asics 13
Otros 9
Total 200
2-49

Gráfica cicular para tipos de zapatos

Asics
Reebok
Otros
Nike
Adidas
Reebok
Adidas Asics
Otros
Nike