Você está na página 1de 65

UNIVERSIDAD NACIONAL DE INGENIERÍA

Facultad de Ingeniería Química y Textil

MA-612
ESTADÍSTICA DESCRIPTIVA

CLASIFICACIÓN Y PRESENTACIÓN DE LOS DATOS


TABLAS Y GRÁFICAS
USO DE SOFTWARE ESTADÍSTICO MINITAB

MA-612
CICLO METODOLÓGICO DEL QUEHACER ESTADÍSTICO

Cuando no se puede obtener una información completa de la población


se extraen muestras representativas de dicha población mediante las
técnicas de muestreo, se estiman los parámetros poblacionales a partir
de las estadísticas, mediante el uso de la ESTADÍSTICA INFERENCIAL.

García Oré
MA-612
VARIABLES

García Oré
MA-612
¿Qué es la recolección?

 Es el registro de características (medición,


observación, conteo a una unidad elemental o de
análisis)

 Elección de la muestra
 Determinación del tipo de encuesta
 Diseño del cuestionario
 Conducción del experimento

MA-612
¿Qué es la Organización?

Es el ordenamiento para una mejor comprensión y facilitar sus


análisis. (tablas, gráficos y figuras)

 Confección de tablas de frecuencias


 Selección del tipo de gráfico
 Confección de gráficos

Los datos sin organizar se llaman datos brutos y son de poca


utilidad.

MA-612
Organización

MA-612
¿Qué es el análisis de datos?

Es el cálculo de MEDIDAS REPRESENTATIVAS (o de


resumen) tales como promedios, medidas de variabilidad y
medidas de la forma de la distribución.

También se analizan datos cuando se establecen relaciones


entre ellos (regresión y correlación)

MA-612
¿Qué es la interpretación de datos?

Es darle un sentido práctico


o útil a los resultados
obtenidos en el análisis

 Establecimiento de predicciones
 Test de causa - efecto

MA-612
Tablas de
Distribución de
Frecuencias

MA-612
Tabulación (Ejemplos) :

Tabla 1. Arreglo de 30 datos en forma desordenada. Tabla 2. Arreglo 30 de datos en forma ordenada.

Tabla 4. Tabla frecuencial con doce clases. Tabla 5 Tabla frecuencial con ocho clases.

Tabla 3. Distribución frecuencial de 30 datos.


MA-612
Tabla de frecuencias para variable cualitativa
Si la variable es cualitativa nominal:
Estudiantes según carrera de estudio en la UNMSM, período 2016

Fuente: datos recolectados por muestreo a través de un inventario de actitudes.


MA-612
Tabla de frecuencias para variable cualitativa
Si la variable es cualitativa podríamos haber obtenido
datos sobre el nivel de satisfacción de 96 clientes para un
producto como sigue: regular, regular, muy bueno, malo,
bueno, bueno, bueno, excelente, etc. (así, hasta 96
respuestas) y clasificar los datos de la siguiente forma:

MA-612
Tabla de frecuencias para variable continua

Cuando el tamaño de la muestra y el recorrido de la


variable son grandes, es necesario agrupar en intervalos
los valores de la variable. Por ejemplo si a un grupo de
30 agentes de venta les preguntamos el total de ventas
realizados en ese momento, nos encontramos con los
siguientes datos:

MA-612
La clasificación de los datos en intervalos de clase puede
realizar considerando un número apropiado de intervalos.
Normalmente se suele trabajar con intervalos (m) entre 5 y
15 o la fórmula de STURGES:
m = 1 + 3.32 log n n = total de datos
log : logaritmo decimal
Por conveniencia se adopta el valor cero

R = 5000 – 5 = 4995
Si m = 10, la amplitud de
clase = 4995/10 = 499,5.
Por lo que tomaremos
intervalos de amplitud 500.
Se requiere un intervalo más para incluir
al valor máximo

MA-612
En otro caso, si se considera como valor de inicio el valor mínimo hallado
y una amplitud de 500 tenemos (en consecuencia el número de clases
queda determinado m = 10).

ventas (agrupada)

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos <= 5 1 3.3 3.3 3.3
6 - 505 16 53.3 53.3 56.7
506 - 1005 5 16.7 16.7 73.3
1006 - 1505 4 13.3 13.3 86.7
1506 - 2005 1 3.3 3.3 90.0
2006 - 2505 1 3.3 3.3 93.3
2506 - 3005 1 3.3 3.3 96.7
4506+ 1 3.3 3.3 100.0
Total 30 100.0 100.0

Nota: Algunos programas estadísticos, eliminan las clases vacías o con


frecuencia cero.
MA-612
Frecuencias

Frecuencia absoluta simple (fi o ni): es el número de veces que


aparece un valor de la variable.

Frecuencia relativa simple (hi): La frecuencia absoluta, es una


medida que está influida por el tamaño de la muestra, al
aumentar el tamaño de la muestra aumentará también el
tamaño de la frecuencia absoluta. Esto hace que no sea una
medida útil para poder comparar. Para esto es necesario
introducir el concepto de frecuencia relativa, que es el cociente
entre la frecuencia absoluta y el tamaño de la muestra.

fi
hi 
n
MA-612
Frecuencias

Porcentaje: frecuencia en tanto por ciento o porcentajes, por lo que esta


medida resulta de multiplicar la frecuencia relativa por 100 (pi .)

pi  hi x100%

Frecuencia Absoluta Acumulada (Fi o Ni): es el número de veces que ha


aparecido en la muestra un valor menor o igual que el de la variable.

Fi = f1 + f2 + … + fi

MA-612
Frecuencias

Frecuencia Relativa Acumulada (Hi): es la frecuencia absoluta


acumulada dividido por el tamaño de la muestra.

Fi
Hi 
n
Porcentaje Acumulado: Análogamente se define el Porcentaje
Acumulado denotado por Pi como la frecuencia relativa
acumulada por 100.

Pi  H i x100%
MA-612
Observación

MA-612
Formato de cuadros

MA-612
Aplicación

Distribución de 50 familias del distrito de Puente Piedra


en el 2017 según número de miembros familiares que
trabajan.

Fuente: Datos obtenidos por encuesta por muestreo

MA-612
Aplicación

Distribución de estaturas de 100 estudiantes


UNI - 2017

Fuente: Datos hipotéticos

MA-612
REGLA EMPÍRICA PARA LA CONSTRUCCIÓN DE
INTERVALOS

1. Hallar el rango o recorrido de la variable:


2. Decidir o calcular el número de clases (m):
3. Determinar la amplitud de clase constante (c):
4. Encontrar el exceso (e):
5. Obtener los límites de clase

MA-612
Tipos de límites de clase
Ejemplo

cerrados abiertos semicerrados

MA-612
Ejemplo:
Se desea estudiar el tiempo de respuesta a la recuperación de un pequeño
archivo (en milisegundos). Los datos son:

a) Clasifique la información en una tabla de frecuencias relativas apropiado.


b) A partir de la tabla anterior, determine el porcentaje aproximado de veces
que el tiempo de respuesta este entre 645 y 672 milisegundos.

MA-612
Solución
a) Construcción de la tabla de frecuencias:
1. R = 716.72 - 535.4 = 181.32
2. m = 1+3.3log(30) = 5.87  6
3. C = 181.32/6 = 30.22  30.23  R’= 30.23(6) = 181.38
4. e = 181.38 – 181.32 = 0.06  e1= 0.03 y e2= 0.03
y’o = 535.4 – 0.03 = 535.37
y’6 = 716.72 + 0.03 = 716.75
5. Límites de clase

MA-612
Distribución de tiempo de respuesta a la recuperación de un
pequeño archivo en 30 intentos de búsqueda

Tiempo de Marca de clase Nro. de veces Proporción de


respuesta veces
(milisegundos)
[535.37 – 565.60> 550.485 6 0.20
[565.60 – 595.83> 580.75 5 0.17
[595.83 – 626.06> 610.945 9 0.30
[626.06 – 656.29> 641.175 7 0.23
[656.29 – 686.52> 671.405 2 0.07
[686.52 – 716.75> 701.635 1 0.03
Total 30 1.00

MA-612
Distribución de tiempo de respuesta a la recuperación de un
pequeño archivo en 30 intentos de búsqueda

Tiempo de Marca de clase Nro. de veces Porcentaje de


respuesta veces
(milisegundos)
535.37 – 565.59 550.485 6 20
565.60 – 595.82 580.75 5 17
595.83 – 626.05 610.945 9 30
626.06 – 656.28 641.175 7 23
656.29 – 686.51 671.405 2 7
686.52 – 716.74 701.635 1 3
Total 30 100

Límites cerrados

MA-612
b) Interpolación

MA-612
REPRESENTACIÓN
GRÁFICA

MA-612
Ventajas:
Este método de presentación de la información es el más simple, se puede captar el
panorama general, o la tendencia de los datos, de un solo vistazo.

Es mucho más fácil de comprender que una tabla o un texto. La sencillez de líneas,
una atractiva manera de presentación, la posibilidad de usar las tres dimensiones
(3D), junto con colores, hacen de los gráficos una de las herramientas más
poderosas para transmitir ideas en forma rápida y simple.

Desventajas:
Pérdida de precisión y exactitud, si se lo compara con una tabla. Pero siempre se
puede sacrificar algo en aras de la sencillez.

MA-612
MA-612
Componentes de un gráfico

1. Número: para identificarlo si hay más de uno


2. Título: debe indicar el qué, dónde, cómo y cuándo de la información.
3. Fuente: indica el origen de la información utilizada, puede servir para informar
al usuario el lugar donde puede obtener mayor información al respecto.
4. Leyenda: cuando en un gráfico se incluyen varias series de datos, es necesario
identificar cada una de ellas mediante símbolos o leyendas.
5. Escala: identifica la unidad de medida correspondiente a los valores en ambos
ejes, por ejemplo, 1 cm = 1000 nacimientos.
7. Nota al pie: Es una frase que explica o aclara cierta cifra o clasificación, su
función es más específica que la de la nota introductoria. Para indicar la nota al
pie se utilizan llamadas de atención (números, símbolos como / ó *).
8. Título de los ejes: se utiliza para identificar cada uno de los ejes

MA-612
Recomendaciones

- Debe tener un título claro, conciso y completo.

- Debe indicar la fuente de donde se extrajo la información.

- La disposición del gráfico debe hacerse de izquierda a derecha.

- Colocar siempre el cero de la escala cuando alguna es usada en el mismo.

- En los gráficos de porcentaje acumulativo además del nivel cero se debe indicar el 100%.

- La línea más gruesa de todas debe ser la del gráfico o curva que se muestre, para subordinar
las demás a la principal.

- Deben colocarse siempre la escala empleada y las unidades de las magnitudes mostradas.

MA-612
Gráficos para v. cualitativas

Diagramas de barras
 Alturas proporcionales a las frecuencias
(abs. o rel.)
 Se pueden aplicar también a variables
discretas

Diagramas de sectores (tortas, polares)


 No usarlo con variables ordinales.
 El área de cada sector es proporcional a su
frecuencia (abs. o rel.)

Pictogramas
 Fáciles de entender.
 El área de cada modalidad debe ser
proporcional a la frecuencia. ¿De los dos,
cuál es incorrecto?.

MA-612
TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta)

Distribución de las unidades de


análisis de acuerdo a variable 1
Distribución de las unidades de análisis de
acuerdo a variable 1 D
10% A
20%

C
D A 40% B
10% 20% 30%

Distribución de las unidades de


análisis de acuerdo a variable 1
C B
40% 30%
D A
10% 20%

C
B
40%
30%

MA-612
TIPOS DE GRÁFICOS 2. Gráfico de Barras

Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a


variable 1
de acuerdo a variable 1
D
500

variable 1
C
400

300 B

200 A

100
0 0,2 0,4 0,6 0,8 1
0 Proporción de unidad de análisis
A B C D

variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1

C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis grupos.

MA-612
Pregunta

• En su opinión, con qué


gráfica, diagrama de pastel o
gráfica de barras, se obtiene
una mejor representación de
la información?

Respuesta
• La gráfica de círculo facilita la comparación visual de los
tamaños relativos de las partes entre sí y el tamaño de cada parte
con respecto al todo. En el caso de las barras solo compara
tamaños relativos.

MA-612
Diagrama de Pareto
Es como un diagrama de barras en el que se ordenan las clases de
mayor a menor frecuencia (absoluta o relativa). En la parte superior
de la figura suele trazarse una línea que representa la suma de la
frecuencia de cada clase y las que la preceden, esto se usa para
identificar la minoría de las características que representan la mayoría
de casos.

El diagrama de Pareto permite ver que, en muchos casos, pocos factores


pueden producir la mayoría de las consecuencias, lo que se podría resumir
como “pocos factores son vitales y muchos son triviales”. Por ejemplo, en
control de calidad, se puede mostrar que la mayoría de los defectos surgen
de un número pequeño de causas.

El nombre de gráfico de Pareto lo propuso el Dr. Joseph Juran, pionero del movimiento de calidad total,
como un homenaje al economista italiano Vilfredo Pareto (1848-1923). A PRINCIPIOS DEL SIGLO XX, EL
ECONOMISTA ITALIANO, REALIZÓ UN ESTUDIO SOBRE LA RIQUEZA Y LA POBREZA. DESCUBRIÓ QUE EL 20% DE LAS PERSONAS
CONTROLABA EL 80% DE LA RIQUEZA EN ITALIA.

MA-612
Ejemplo
El gerente de control de calidad de una fábrica que produce asientos especiales de
fibra de vidrio, quiere identificar los problemas más importantes que se presentan
en la elaboración de estos, y poder planear soluciones a dichos problemas de
acuerdo a una estrategia basada en la prioridad del problema. Se extrae una
muestra aleatoria de los problemas de calidad obteniendo los siguientes resultados:

Elabore el diagrama de Pareto.

MA-612
Solución
Lo primero es ordenar las categorías en orden descendente a la frecuencia fi. No
olvidar que la categoría otros va al final. Luego se calcula las frecuencias relativas y
las frecuencias relativas acumuladas.

Se realiza el gráfico usando las frecuencias absolutas fi y las frecuencias relativas


acumuladas Hi.

MA-612
MA-612
Gráficos diferenciales para variables numéricas
Son diferentes en función de que las variables sean 419

discretas o continuas. Valen con frec. absolutas o 400 375

relativas. 300

255

Recuento
215
200

Diagramas de bastones o barras para v. discretas 127

Se deja un hueco entre barras para indicar los valores 100

54

que no son posibles 24 23 17

0 1 2 3 4 5 6 7 Ocho o más

Número de hijos

Histogramas para v. continuas


250

El área que hay bajo el histograma entre dos puntos


cualesquiera indica la cantidad (porcentaje o 200

frecuencia) de individuos en el intervalo.

Recuento
150

100

50

MA-612 20 40 60 80

Edad del encuestado


TIPOS DE GRÁFICOS 3. Histograma
Histograma
Histograma
Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad - Permite la representación de
15
la frecuencia de una variable
Cuantitativa.
Frecuencia

10

- El eje x se refiere a la
5
variable.
- El eje y se refiere a la
0
frecuencia (Nº , %).
7 8 9 10 11 12 13 14

edad - Cada barra representa la


frecuencia de la variable en la
Ejemplo
población en estudio (o la
En el gráfico se puede observar el número de muestra).
hijos de menor edad (7-8 años), las de mayor
edad (13-14 años); y además que la mayoría de -El histograma se puede
hijos de los trabajadores están entre los 10 y 12 construir desde los datos de la
años. tabla de frecuencia de la
variable en estudio.

MA-612
Las características geométricas del histograma nos permiten descubrir
información útil sobre los datos, por ejemplo:

- La localización del “centro” de los datos.


- El grado de dispersión.
- La sección a la cual se sesga, es decir, cuando no cae simétricamente en ambos
lados del pico.
- El grado de agudeza del pico. Cómo se levanta y baja la pendiente.

Cómo interpretar un histograma

Al examinarlos hay que intentar contestar a las siguientes preguntas:

1. ¿ Es el histograma simétrico?
2. ¿Posee la distribución colas largas?
3. ¿Posee el histograma un máximo claro único?
4. ¿Aparecen datos atípicos?
5. ¿Donde localizamos el centro aproximado de los datos?
6. ¿Presentan los datos mucha dispersión?

MA-612
MA-612
TIPOS DE GRÁFICOS 4. Polígono de Frecuencia
TIPOS DE GRÁFICOS

Distribución de los hijos de trabajadores


de la empresa de acuerdo a edad -Esta representación se basa en
15
el Histograma.
-Sólo es útil para variables
Frecuencia

10
cuantitativas.
5 -El eje x se refiere a la
variable.
0
- El eje y se refiere a la
7 8 9 10 11 12 13 14

edad
frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).

MA-612
TIPOS DE GRÁFICOS 5. Diagrama de Caja

Edad de las personas que se realizaron


100
angioplastía entre 1980 y 2000
90

80

70

60 - Permite identificar gráficamente la


media, los percentiles 25 y 75,
Edad

50
mínimo y máximo de una variable.
40
- Sólo es útil para variables
30 cuantitativas.
20 -El eje x permite identificar la
10 poblacion en estudio.
0 - El eje y representa los valores de la
N= 584 1473
variable en estudio.
Mujeres Hombres

MA-612
Cajas de Dispersión

MA-612
TIPOS DE GRÁFICOS 6. Otros
TIPOS DE GRÁFICOS 6. Otros
Número de alumnos matriculados en la Número de alumnos matriculados en la
Carrera
de A según año de ingreso Carrera
Número alumnos matriculados en la Número de B según año
alumnos de ingreso
matriculados en la
Carrera A según año de ingreso Carrera B según año de ingreso
100 100
de alumnos

de alumnos
80
100 80
100
Nºalumnos

Nºalumnos
60
80 60
80
40
60 40
60
20
40 20
40
Nº de

Nº de
0
20 0
20
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
0 0
1998 1999 año de ingreso
2000 2001 2002 2003 1998 1999 año de ingreso
2000 2001 2002 2003
año de ingreso año de ingreso
Número de alumnos matriculados en las Carreras
según año de ingreso
Número de alumnos matriculados en las Carreras
Nº de alumnos según año de ingreso
año de ingreso Carrera A Carrera B de alumnos 200
Nº de alumnos
1998 60 80 150
200
año de ingreso Carrera A Carrera B
Nºalumnos

1999 55 70
1998 60 80 100
150
2000 80 50
1999 55 70
2001 40 60 50
100
2000 80 50
2002 68 50
Nº de

2001
2003 40
70 60
75 0
50
2002 68 50 1998 1999 2000 2001 2002 2003
2003 70 75 0
Carrera B
1998 1999 año
2000 ingreso
2001 2002 2003

Carrera B
Carrera A año ingreso
Carrera A

MA-612
Diagrama de Tallos
• Mantiene todos los datos originales pero en una forma
compacta.
• Una vez construido el diagrama además de haber resumido
los datos, tenemos algo parecido a un histograma.
• No se pierde información.
• Divide el dato (número) en dos partes: tallo y hoja.
• Puede haber 1, 2 o 5 líneas por tallo (i.e., el tallo se puede
dividir en dos partes iguales o en 5 partes iguales).

MA-612
Ejemplo:

Suponga que los siguientes datos representan el salario anual de los obreros de
la compañía X:

MA-612
En este caso
podemos dividir
cada tallo en dos:

Un diagrama de tallo y hojas transmite información acerca


de los siguientes aspectos de los datos:

• Identificación de un valor característico o representativo.


• Grado de dispersión respecto al valor característico.
• Presencia de algún hueco en los datos.
• Grado de simetría en la distribución de los valores.
• Cantidad y ubicación de picos.
• Presencia de cualquier valor atípico.
MA-612
Tallo: dígitos de unidades de millar y centenas
Hoja: dígitos de decenas y unidades

MA-612
Grafico lineal: Simple
Nivel educacional de 400 empleados del sector público

Gráficos cronológicos

MA-612
Grafico lineal: Compuestos

Gráficos cronológicos

MA-612
Diagrama de Dispersión

MA-612
Cartas de Control

MA-612
Pictogramas

MA-612
CARTOGRAMAS

Muerte por SIDA en distritos en el Perú en los años 2015 – 2016 y


Densidad Poblacional (INEI).

MA-612
Barras 3D

MA-612
Gráfico tridimensional

MA-612
MA-612

Você também pode gostar