Escolar Documentos
Profissional Documentos
Cultura Documentos
MA-612
ESTADÍSTICA DESCRIPTIVA
MA-612
CICLO METODOLÓGICO DEL QUEHACER ESTADÍSTICO
García Oré
MA-612
VARIABLES
García Oré
MA-612
¿Qué es la recolección?
Elección de la muestra
Determinación del tipo de encuesta
Diseño del cuestionario
Conducción del experimento
MA-612
¿Qué es la Organización?
MA-612
Organización
MA-612
¿Qué es el análisis de datos?
MA-612
¿Qué es la interpretación de datos?
Establecimiento de predicciones
Test de causa - efecto
MA-612
Tablas de
Distribución de
Frecuencias
MA-612
Tabulación (Ejemplos) :
Tabla 1. Arreglo de 30 datos en forma desordenada. Tabla 2. Arreglo 30 de datos en forma ordenada.
Tabla 4. Tabla frecuencial con doce clases. Tabla 5 Tabla frecuencial con ocho clases.
MA-612
Tabla de frecuencias para variable continua
MA-612
La clasificación de los datos en intervalos de clase puede
realizar considerando un número apropiado de intervalos.
Normalmente se suele trabajar con intervalos (m) entre 5 y
15 o la fórmula de STURGES:
m = 1 + 3.32 log n n = total de datos
log : logaritmo decimal
Por conveniencia se adopta el valor cero
R = 5000 – 5 = 4995
Si m = 10, la amplitud de
clase = 4995/10 = 499,5.
Por lo que tomaremos
intervalos de amplitud 500.
Se requiere un intervalo más para incluir
al valor máximo
MA-612
En otro caso, si se considera como valor de inicio el valor mínimo hallado
y una amplitud de 500 tenemos (en consecuencia el número de clases
queda determinado m = 10).
ventas (agrupada)
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos <= 5 1 3.3 3.3 3.3
6 - 505 16 53.3 53.3 56.7
506 - 1005 5 16.7 16.7 73.3
1006 - 1505 4 13.3 13.3 86.7
1506 - 2005 1 3.3 3.3 90.0
2006 - 2505 1 3.3 3.3 93.3
2506 - 3005 1 3.3 3.3 96.7
4506+ 1 3.3 3.3 100.0
Total 30 100.0 100.0
fi
hi
n
MA-612
Frecuencias
pi hi x100%
Fi = f1 + f2 + … + fi
MA-612
Frecuencias
Fi
Hi
n
Porcentaje Acumulado: Análogamente se define el Porcentaje
Acumulado denotado por Pi como la frecuencia relativa
acumulada por 100.
Pi H i x100%
MA-612
Observación
MA-612
Formato de cuadros
MA-612
Aplicación
MA-612
Aplicación
MA-612
REGLA EMPÍRICA PARA LA CONSTRUCCIÓN DE
INTERVALOS
MA-612
Tipos de límites de clase
Ejemplo
MA-612
Ejemplo:
Se desea estudiar el tiempo de respuesta a la recuperación de un pequeño
archivo (en milisegundos). Los datos son:
MA-612
Solución
a) Construcción de la tabla de frecuencias:
1. R = 716.72 - 535.4 = 181.32
2. m = 1+3.3log(30) = 5.87 6
3. C = 181.32/6 = 30.22 30.23 R’= 30.23(6) = 181.38
4. e = 181.38 – 181.32 = 0.06 e1= 0.03 y e2= 0.03
y’o = 535.4 – 0.03 = 535.37
y’6 = 716.72 + 0.03 = 716.75
5. Límites de clase
MA-612
Distribución de tiempo de respuesta a la recuperación de un
pequeño archivo en 30 intentos de búsqueda
MA-612
Distribución de tiempo de respuesta a la recuperación de un
pequeño archivo en 30 intentos de búsqueda
Límites cerrados
MA-612
b) Interpolación
MA-612
REPRESENTACIÓN
GRÁFICA
MA-612
Ventajas:
Este método de presentación de la información es el más simple, se puede captar el
panorama general, o la tendencia de los datos, de un solo vistazo.
Es mucho más fácil de comprender que una tabla o un texto. La sencillez de líneas,
una atractiva manera de presentación, la posibilidad de usar las tres dimensiones
(3D), junto con colores, hacen de los gráficos una de las herramientas más
poderosas para transmitir ideas en forma rápida y simple.
Desventajas:
Pérdida de precisión y exactitud, si se lo compara con una tabla. Pero siempre se
puede sacrificar algo en aras de la sencillez.
MA-612
MA-612
Componentes de un gráfico
MA-612
Recomendaciones
- En los gráficos de porcentaje acumulativo además del nivel cero se debe indicar el 100%.
- La línea más gruesa de todas debe ser la del gráfico o curva que se muestre, para subordinar
las demás a la principal.
- Deben colocarse siempre la escala empleada y las unidades de las magnitudes mostradas.
MA-612
Gráficos para v. cualitativas
Diagramas de barras
Alturas proporcionales a las frecuencias
(abs. o rel.)
Se pueden aplicar también a variables
discretas
Pictogramas
Fáciles de entender.
El área de cada modalidad debe ser
proporcional a la frecuencia. ¿De los dos,
cuál es incorrecto?.
MA-612
TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta)
C
D A 40% B
10% 20% 30%
C
B
40%
30%
MA-612
TIPOS DE GRÁFICOS 2. Gráfico de Barras
variable 1
C
400
300 B
Nº
200 A
100
0 0,2 0,4 0,6 0,8 1
0 Proporción de unidad de análisis
A B C D
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1
C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis grupos.
MA-612
Pregunta
Respuesta
• La gráfica de círculo facilita la comparación visual de los
tamaños relativos de las partes entre sí y el tamaño de cada parte
con respecto al todo. En el caso de las barras solo compara
tamaños relativos.
MA-612
Diagrama de Pareto
Es como un diagrama de barras en el que se ordenan las clases de
mayor a menor frecuencia (absoluta o relativa). En la parte superior
de la figura suele trazarse una línea que representa la suma de la
frecuencia de cada clase y las que la preceden, esto se usa para
identificar la minoría de las características que representan la mayoría
de casos.
El nombre de gráfico de Pareto lo propuso el Dr. Joseph Juran, pionero del movimiento de calidad total,
como un homenaje al economista italiano Vilfredo Pareto (1848-1923). A PRINCIPIOS DEL SIGLO XX, EL
ECONOMISTA ITALIANO, REALIZÓ UN ESTUDIO SOBRE LA RIQUEZA Y LA POBREZA. DESCUBRIÓ QUE EL 20% DE LAS PERSONAS
CONTROLABA EL 80% DE LA RIQUEZA EN ITALIA.
MA-612
Ejemplo
El gerente de control de calidad de una fábrica que produce asientos especiales de
fibra de vidrio, quiere identificar los problemas más importantes que se presentan
en la elaboración de estos, y poder planear soluciones a dichos problemas de
acuerdo a una estrategia basada en la prioridad del problema. Se extrae una
muestra aleatoria de los problemas de calidad obteniendo los siguientes resultados:
MA-612
Solución
Lo primero es ordenar las categorías en orden descendente a la frecuencia fi. No
olvidar que la categoría otros va al final. Luego se calcula las frecuencias relativas y
las frecuencias relativas acumuladas.
MA-612
MA-612
Gráficos diferenciales para variables numéricas
Son diferentes en función de que las variables sean 419
relativas. 300
255
Recuento
215
200
54
0 1 2 3 4 5 6 7 Ocho o más
Número de hijos
Recuento
150
100
50
MA-612 20 40 60 80
10
- El eje x se refiere a la
5
variable.
- El eje y se refiere a la
0
frecuencia (Nº , %).
7 8 9 10 11 12 13 14
MA-612
Las características geométricas del histograma nos permiten descubrir
información útil sobre los datos, por ejemplo:
1. ¿ Es el histograma simétrico?
2. ¿Posee la distribución colas largas?
3. ¿Posee el histograma un máximo claro único?
4. ¿Aparecen datos atípicos?
5. ¿Donde localizamos el centro aproximado de los datos?
6. ¿Presentan los datos mucha dispersión?
MA-612
MA-612
TIPOS DE GRÁFICOS 4. Polígono de Frecuencia
TIPOS DE GRÁFICOS
10
cuantitativas.
5 -El eje x se refiere a la
variable.
0
- El eje y se refiere a la
7 8 9 10 11 12 13 14
edad
frecuencia (Nº , %).
-Los puntos que permiten la
unión de las líneas representa
el centro de clase (o marca de
clase).
MA-612
TIPOS DE GRÁFICOS 5. Diagrama de Caja
80
70
50
mínimo y máximo de una variable.
40
- Sólo es útil para variables
30 cuantitativas.
20 -El eje x permite identificar la
10 poblacion en estudio.
0 - El eje y representa los valores de la
N= 584 1473
variable en estudio.
Mujeres Hombres
MA-612
Cajas de Dispersión
MA-612
TIPOS DE GRÁFICOS 6. Otros
TIPOS DE GRÁFICOS 6. Otros
Número de alumnos matriculados en la Número de alumnos matriculados en la
Carrera
de A según año de ingreso Carrera
Número alumnos matriculados en la Número de B según año
alumnos de ingreso
matriculados en la
Carrera A según año de ingreso Carrera B según año de ingreso
100 100
de alumnos
de alumnos
80
100 80
100
Nºalumnos
Nºalumnos
60
80 60
80
40
60 40
60
20
40 20
40
Nº de
Nº de
0
20 0
20
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
0 0
1998 1999 año de ingreso
2000 2001 2002 2003 1998 1999 año de ingreso
2000 2001 2002 2003
año de ingreso año de ingreso
Número de alumnos matriculados en las Carreras
según año de ingreso
Número de alumnos matriculados en las Carreras
Nº de alumnos según año de ingreso
año de ingreso Carrera A Carrera B de alumnos 200
Nº de alumnos
1998 60 80 150
200
año de ingreso Carrera A Carrera B
Nºalumnos
1999 55 70
1998 60 80 100
150
2000 80 50
1999 55 70
2001 40 60 50
100
2000 80 50
2002 68 50
Nº de
2001
2003 40
70 60
75 0
50
2002 68 50 1998 1999 2000 2001 2002 2003
2003 70 75 0
Carrera B
1998 1999 año
2000 ingreso
2001 2002 2003
Carrera B
Carrera A año ingreso
Carrera A
MA-612
Diagrama de Tallos
• Mantiene todos los datos originales pero en una forma
compacta.
• Una vez construido el diagrama además de haber resumido
los datos, tenemos algo parecido a un histograma.
• No se pierde información.
• Divide el dato (número) en dos partes: tallo y hoja.
• Puede haber 1, 2 o 5 líneas por tallo (i.e., el tallo se puede
dividir en dos partes iguales o en 5 partes iguales).
MA-612
Ejemplo:
Suponga que los siguientes datos representan el salario anual de los obreros de
la compañía X:
MA-612
En este caso
podemos dividir
cada tallo en dos:
MA-612
Grafico lineal: Simple
Nivel educacional de 400 empleados del sector público
Gráficos cronológicos
MA-612
Grafico lineal: Compuestos
Gráficos cronológicos
MA-612
Diagrama de Dispersión
MA-612
Cartas de Control
MA-612
Pictogramas
MA-612
CARTOGRAMAS
MA-612
Barras 3D
MA-612
Gráfico tridimensional
MA-612
MA-612