Escolar Documentos
Profissional Documentos
Cultura Documentos
DE DATOS
MDULO 1
JUAN NARRO LAVI
PROFESOR DE ESTADSTICA PARA LA ADMINISTRACIN
REPETIDOS Y MINUCIOSOS
CLCULOS, A LAS
APRECIACIONES Y
PLANIFICACIONES QUE SE
HACEN EN EL TEMPLO
Sun Tzu
Figura 1.1
Figura 1.1. Imagen tomada de Sun Tzu, por akifrases. Recuperado http://akifrases.com/autor/sun-tzu
NOSOTROS
CONFIAMOS EN DIOS.
TODOS LOS DEMS
Estadstica Definicin
Diferentes significados segn la persona que la analice.
Ideas comunes :
Observacin y Estudio de determinadas caractersticas de
los DATOS recolectados.
Definicin formal :
Teoremas, mtodos, tcnicas y herramientas que nos
permiten:
1) Recolectar, seleccionar y clasificar datos.
2) Analizar e interpretar los datos.
3) Deducir y evaluar conclusiones en base a datos muestrales.
Porqu este Anlisis ?
TOMA DE DECISIONES
(Lind et al., 2012, p.4)
Estadstica Definicin
DEFINIR
RECOLECTAR
ES UNA CIENCIA
QUE
ABARCA
TCNICAS QUE
NOS PERMITEN:
ORGANIZAR
PRESENTAR
ANALIZAR
INTERPRETAR
TOMA
DE
DECISIONES
Toma de Decisiones
1.- Datos: Observaciones especficas a travs de mediciones o
conteos.
2.- Informacin: Datos procesados y resumidos para producir
hechos y generar ideas.
3.- Conocimiento: Informacin seleccionada y organizada que
proporciona entendimiento, recomendaciones y el sustento
para las decisiones.
Estadstica
Resumir
Numricas
Distribuc. Frecuencias
Med. Tend. Central
Dispersin
Descriptiva
Presentar
Estadstica
Inferencial
Grficas
Histogramas
Polgonos
Curvas
Barras
Pastel
Estadstica Descriptiva
Tabla de Distribucin
Edad
NTrabajadores
30
35
40
45
34
39
44
49
6
12
8
2
Diagrama de Barras
Media Aritmtica
12
10
8
6
4
2
0
30-34
Diagrama Circular
35-39
40-44
45-49
Estadstica
Resumir
Numricas
Distribuc. Frecuencias
Med. Tend. Central
Dispersin
Descriptiva
Presentar
Estadstica
Grficas
Plantear
Inferencial
Supuestos
Probar
Histogramas
Polgonos
Curvas
Barras
Pastel
Probabilidad
Dist. Normal
Dist. Normal Std.
T Student
Poisson
Chi Cuadrado
Estadstica Inferencial
Estimacin
- Ej. Estimar el peso promedio de
la poblacin usando el peso
promedio de la muestra.
Prueba de Hiptesis :
- Ej. Probar que el peso promedio
de la poblacin es 65 kg.
Extraer conclusiones y/o tomar decisiones concernientes a
una poblacin basndose en los resultados de una muestra.
Muestra
Poblacin Estadstica
Registro de una caracterstica EN TODOS los elementos del
marco poblacional.
Tiene tantos datos como elementos el marco poblacional.
Habrn tantas poblaciones como caractersticas que se
deseen registrar en un marco poblacional.
MARCO POBLACIONAL
Caracterstica
Registro
de la
Caract.
Edad
Peso
Poblacin
Poblacin
Poblacin
P1
P2
P3
(1200 datos)
(1200 datos)
(1200 datos)
Poblacin
...
Pn
(1200 datos)
Marco Muestral
Subconjunto del marco poblacional.
Comprende los elementos o estratos del marco poblacional
(es representativo).
En contraste con el marco poblacional es ms conveniente
porque se obtienen los datos en menor tiempo y reduciendo los
costos.
Ejemplo :
75 trabajadores de una empresa.
Figura 1.6.
Figura 1.6. Imagen tomada de Liderazgo, comunicacin y participacin, por Urrego Pedro. Recuperado
http://pedrodavidurregoamezquita.blogspot.pe/2009_06_01_archive.html
por Sinteria. Recuperado http://www.sintetia.com/la-verdadera-diferencia-en-pensamiento-de-william-deming/
MARCO POBLACIONAL
MARCO MUESTRAL
Caracterstica Edad
Peso
Registro
de la
Caract.
Poblacin
Poblacin
Poblacin
P1
P2
P3
...
Poblacin
Pn
Muestra
Registro de una caracterstica EN TODOS los
elementos del marco muestral.
Tiene tantos datos como elementos el marco muestral.
Habrn tantas muestras como caractersticas se deseen registrar
en un marco muestral.
MARCO POBLACIONAL
Tcnicas
de muestreo
Edad
Peso
Muestra
Muestra
Muestra
Muestra
m1
m2
m3
mn
75 datos
Caracterstica
Registro
de la
Caract.
Edad
Peso
Poblacin
Poblacin
P1
P2
Poblacin
P3
...
MARCO MUESTRAL
Poblacin
Pn
Parmetro y Estimador
Parmetro:
Valor representativo de una poblacin (N).
Se simboliza con letras griegas.
Slo hay un parmetro en cada poblacin.
Media poblacional
Varianza poblacional
Desviacin estndar poblacional
Proporcin poblacional
Parmetro y Estimador
Estimador
Valor representativo de una muestra (n).
Se simboliza por letras latinas.
Existen tantos estimadores como muestras se
extraigan de una poblacin.
x
Media muestral.
2
s Varianza muestra.
s Desviacin estndar muestral.
p Proporcin muestral.
Figura 1.6.
Figura 1.6. Imagen tomada de Liderazgo, comunicacin y participacin, por Urrego Pedro. Recuperado
http://pedrodavidurregoamezquita.blogspot.pe/2009_06_01_archive.html
por Sinteria. Recuperado http://www.sintetia.com/la-verdadera-diferencia-en-pensamiento-de-william-deming/
Parmetro y Estimador
n1
n2
POBLACIN
n3
nm
PARMETRO
DIFERENTES MUESTRAS OCASIONAN DIFERENTES
VALORES DEL ESTIMADOR
x1
x2
x3
xm
Parmetro y Estimador
Tcnicas de
Muestreo
MUESTRA
(n)
Estimador:
POBLACIN
(N)
Estadstica Inferencial
Parmetro:
-x
= Error de muestreo
Numrico
Discreto
Continuo
Ejemplos:
Nmero de Nios
Defectos por hora
(Items Contados)
Ejemplos:
Peso
Voltaje
(Caractersticas
Medidas)
Tipos de Variables
Variable cualitativa o de atributos: la
caracterstica o variable que se estudia no
es numrica.
EJEMPLOS: Gnero, afiliacin religiosa, tipo
de automvil que se posee, lugar de
nacimiento, color de los ojos.
Tipos de Variables
Variable cuantitativa: la variable se
puede registrar numricamente.
EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, nmero de nios en una
familia.
Tipos de Variables
Variables discretas: slo pueden adquirir
ciertos valores y casi siempre hay
brechas entre esos valores.
EJEMPLO: el nmero de habitaciones en
una casa (1,2,3,..., etc.).
Tipos de Variables
Variables continuas: pueden tomar
cualquier valor dentro de un
intervalo especfico.
EJEMPLO: el tiempo que toma volar
de Lima a Tacna.
Niveles de Medicin
Niveles
Nominal
Datos solo se
clasifican
Nmero de
Camiseta en un
equipo
Marca de auto
Ordinal
Datos se
ordenan
Nmero en la lista
de la clase.
Posicin dentro de
los 10 primeros
Intervalo
Razn
Diferencia
significativa
entre valores
Punto cero
significativo y
razn entre valores
Temperatura
Talla
Nmero de pacientes
atendidos
Nmero de llamadas
de ventas realizadas
Distancia a casa
Figura 1.7
Figura 1.7. Tomado de GRFICA 1-3 Resumen de las caractersticas de los niveles de medicin, por Levin &
Rubin., 2004, Estadstica para administracin y economa (7a ed.), p. 13. Copyright 1998 por Mc Graw Hill.
Recoleccin de datos
Mejorar la
Calidad Decisional
Mtodo
Secundaria
Tcnica
Fichas
Directo
Observacin
Experimentacin
Primaria
Indirecto
Encuesta
Entrevista
Variables
Cuantitativas
- Distribucin de Frecuencias
- Tabla Cruzada
- Barras
- Circular
- Pareto
- Distribucin de Frecuencias
- Lineal
- Histograma y Ojiva
- Tallo y Hoja
- Dispersin
Tabulacin de Datos
Distribucin de Frecuencias
Grfica de Datos
Barras
Circular
Pareto
Distribucin de Frecuencias
Resumen de datos por categora
EJEMPLO: Pacientes de Hospital por Unidad
Unidad
Nmero de Pacientes
Porcentaje
Cuidado Cardiaco
1,052.00
11.93%
Emergencia
2,245.00
25.46%
UCI
340.00
3.86%
Maternidad
552.00
6.26%
Ciruga
4,630.00
52.50%
Total
8,819.00
100.00%
Distribucin de Frecuencias
Grfico de Barras de pacientes por Unidad
Nmero de Pacientes
10,000.00
8,819.00
9,000.00
8,000.00
7,000.00
6,000.00
4,630.00
5,000.00
4,000.00
3,000.00
2,000.00
1,000.00
2,245.00
1,052.00
Cuidado
Cardiaco
Emergencia
340.00
552.00
UCI
Maternidad
Ciruga
Total
Tabla Cruzada
Tabla Cruzada (o de Contingencia), es el listado del
nmero de observaciones para cada combinacin de
valores de dos variables (cuantitativa o cualitativa).
Si hay r categoras para la primera variables (filas) y c
categoras para la segunda variable (columnas), la
tabla es llamada Tabla cruzada de r x c.
Tabla Cruzada
Tabla Cruzada 3 x 3 para las Alternativas de
Inversin de un Inversionista (en $1000s)
Inversin
Inversionista A
Inversionista B
Inversionista C
Total
Acciones
46
55
27
128
Bonos
32
44
19
95
Efectivo
15
20
33
68
Total
93
119
79
291
Inversionista C
Inversionista B
Inversionista A
10
20
Efectivo
30
Bonos
40
Acciones
50
60
Inversionista A
Efectivo
Inversionista B
Bonos
Acciones
Inversionista C
1er Trim
20.4
30.6
2do Trim
3er Trim
4to Trim
27.4
38.6
59
34.6
20.4
31.6
45.9
46.9
45
43.9
3er Trim
4to Trim
70
60
50
40
30
20
10
0
1er Trim
2do Trim
Norte
Centro
Sur
Nmero de Pacientes
Cuidado Cardiaco
1,052.00
Emergencia
2,245.00
UCI
340.00
Maternidad
552.00
Ciruga
4,630.00
Total
8,819.00
Nmero de Pacientes
10,000.00
8,819.00
9,000.00
8,000.00
7,000.00
6,000.00
4,630.00
5,000.00
4,000.00
3,000.00
2,000.00
1,000.00
2,245.00
1,052.00
Cuidado
Cardiaco
Emergencia
340.00
552.00
UCI
Maternidad
Ciruga
Total
Nmero de Pacientes
Porcentaje
Cuidado Cardiaco
1,052.00
11.93%
Emergencia
2,245.00
25.46%
UCI
340.00
3.86%
Maternidad
552.00
6.26%
Ciruga
4,630.00
52.50%
Total
8,819.00
100.00%
Cuidado Cardiaco
Emergencia
25%
53%
(Porcentajes son
redondeados)
UCI
Maternidad
6%
4%
Ciruga
Diagrama de Pareto
Pasos
1- Decidir qu elementos se
estudiarn y colectar datos.
2- Tabular datos y calcular los
nmeros acumulados.
3- Dibujar los ejes X e Y.
4- Mostrar los datos como barras.
5- Dibujar una curva acumulativa.
6- Crear una escala % en eje
vertical adicional.
7- Rotular el diagrama.
8- Analizar el diagrama.
Empleo
1- Enfocar el aspecto principal de un
problema.
2- Decidir el objetivo y elementos de
mejoras.
3- Predecir la efectividad de la mejora.
4- Confeccionar diagramas ordenados
por causas.
5- Comprender la efectividad de la
mejora.
6- Emplear prdidas unitarias en lugar de
casos o unid. fsicas.
Diagrama de Pareto
En la planta de una empresa metal-mecnica se levant
la siguiente informacin referida a las lesiones sufridas
por el personal entre el 1ro. de Enero y 31 de Mayo.
Analizar y Concluir
Lesiones
Esguince de espalda
Enero
6
Marzo
Abril
Mayo
10
10
Cortadura de mano
Esguince de tobillo
Febrero
1
1
1
1
2
1
2
1
1
Diagrama de Pareto
Lesiones
Enero Mayo
1.00
60
0.90
0.80
50
Cant. de Lesiones
0.70
40
0.60
0.50
30
0.40
20
0.30
0.20
10
0
TOTAL
F.R.ACM.
0.10
Esguince de
espalda
Cortadura de
mano
Cortadura de
pierna
38
11
0.58
0.75
0.85
0.91
0.97
1.00
0.00
Distribucion de Frecuencias y
Distribuciones Acumulativas
Histograma
Ojiva
Distribucin de frecuencias
Qu es una Distribucin de Frecuencias?
Una distribucin de frecuencias es una lista o una
tabla
Conteniendo agrupaciones de clases (categoras o
rangos dentro de los cuales se encuetran los datos) ...
Y la correspondiente frecuencia con la cual los datos
se encuentran en cada clase o categora.
Distribucin de frecuencias
- Definiciones
Intervalo de clase
- Nmero reducido de datos.
Frontera/Lmite de clase
- Punto medio entre dos extremos de clase consecutivas.
Amplitud de clase
- Diferencia entre la frontera superior e inferior de una clase.
Marca de clase
- Punto medio entre los extremos/fronteras de una clase.
Frecuencia de clase
- Nmero de variables incluidas en un intervalo de clase.
Distribucin de Frecuencias
Pasos
1) Determinar el tipo y nmero de clases (intervalos).
Regla general : 5 - 20
Sturges : # clases = 1 + 3.3 log N
2) Determinar la amplitud de la clase (i)
i = (Val. Mx. - Val. Min.) / # clases
3) Establecer el extremo inferior.
4) Determinar las fronteras (lmites)
5) Calcular la marca de clase (m)
6) Contar el nmero de observaciones en cada clase (f).
Ejercicio
Tienda BETA
Cuentas Pendientes por Cobrar (en Miles de Dlares)
38
33
77
54
78
60
92
70
73
76
69
83
38
68
39
71
67
51
34
61
31
34
68
49
63
37
95
42
66
95
83
49
76
51
60
58
50
57
48
65
41
92
84
60
46
43
81
88
75
69
78
34
99
87
35
83
86
54
64
64
52
74
41
62
74
51
38
94
64
50
74
78
38
53
79
94
70
46
71
98
59
68
40
59
69
61
60
85
56
55
77
48
94
69
80
66
80
46
65
55
Distribucin de Frecuencias
Pasos
1) Determinar el tipo y nmero de clases (intervalos).
Sturges : # clases = 1 + 3.3 log N
# de clases= 1 + 3.3 log (100) = 1 + 3.3 * 2 = 7.6
# de clases= 7
2) Determinar la amplitud de la clase (i)
i = (Val. Mx. - Val. Min.) / # clases
i = (99-31) / 7 = 9.7
i = 10
3) Establecer el extremo inferior.
Puede ser 31 o menos.
Por facilidad 30
Distribucin de Frecuencias
Pasos
4) Determinar las fronteras (lmites)
Fronteras se expresan con un decimal adicional.
Frontera inferior de primera clase pto. Medio entre 29 y
30, es decir 29.5.
Frontera superior = 29.5 + 10 = 39.5
Extremo superior de la primera clase sera 39.
5) Calcular la marca de clase (m).
Pto.medio entre extremos o fronteras.
(30 + 39) / 2 = 34.5 (29.5 + 39.5) / 2 = 34.5
6) Contar el nmero de observaciones en cada clase (f).
Distribucin de Frecuencias
Intervalo
Clase
30
40
50
60
70
80
90
39
49
59
69
79
89
99
Amplitud
(i)
Frontera
Inferior
(li)
Frontera
Superior
(ls)
Marca
Clase
(m)
Frecuencia
Absoluta
(f)
10
10
10
10
10
10
10
29.5
39.5
49.5
59.5
69.5
79.5
89.5
39.5
49.5
59.5
69.5
79.5
89.5
99.5
34.5
44.5
54.5
64.5
74.5
84.5
94.5
12
12
16
23
17
11
9
Distribucin de Frecuencias
Tabla de Frecuencias de la distribucin de Cuentas por Cobrar
Tienda BETA
Intervalo
Clase
30
40
50
60
70
80
90
39
49
59
69
79
89
99
Marca
Clase
Frecuencia
Frecuencia Frecuencia Frecuencia Relativa
Absoluta Acumulada Relativa Acumulada
34.5
44.5
54.5
64.5
74.5
84.5
94.5
12
12
16
23
17
11
10
12
24
40
63
80
91
100
0.12
0.12
0.16
0.23
0.17
0.11
0.09
0.12
0.24
0.40
0.63
0.80
0.91
1.00
Histograma
Un grfico de los datos arreglados en una distribucin de
frecuencias es llamado histograma.
Los criterios de valoracin de intervalo se muestran en el eje
horizontal.
En el eje vertical se presentan: frecuencia, frecuencia relativa, o
porcentaje.
Barra de altura apropiada son empleadas para representar el
nmero de observaciones que hay dentro de cada clase.
Ejemplo
Histograma
Grfico 4: Peso de 100 Personas (en Kg.)
Nmero de 25
Personas
20
15
10
5
0
29.5
39.5
49.5
59.5
69.5
79.5
89.5
99.5
Peso
(Kgs)
Ejemplo
Histograma
Grfico 5: Marca de bebida gaseosa preferida
por universitarios (en %)
% 20
15
10
5
0
Fanta
Otros
Empleo de histogramas
Est el centro de la distribucin exactamente en el medio de las
especificaciones?
Es la dispersin demasiado grande o pequea?
Aparece algn dato ms all de las especificaciones?
Hay un espacio amplio para la distribucin dentro de las
especificaciones?
Anlisis Grfico
Histograma
- Grfica de barras de una distribucin de frecuencias.
Polgono de frecuencias
- Grfica lineal de una distribucin de frecuencias (marca).
Curvas
- Polgono de frecuencias suavizado (asimetra, curtosis)
Ojiva
- Grfica de una distribucin de frecuencias acumulada.
Barras
- Grfica de frecuencias para diferentes categorias de datos.
Pastel
- Para ilustrar divisiones de una cantidad total (%).
Anlisis Grfico
Tabla de Frecuencias de la distribucin de
Cuentas por Cobrar Tienda BETA
Intervalo
Clase
Marca
Clase
30 39
40 49
50 59
60 69
70 79
80 89
90 99
34.5
44.5
54.5
64.5
74.5
84.5
94.5
Frecuencia
Frecuencia Frecuencia Frecuencia Relativa
Absoluta Acumulada Relativa Acumulada
12
12
16
23
17
11
9
12
24
40
63
80
91
100
0.12
0.12
0.16
0.23
0.17
0.11
0.09
0.12
0.24
0.40
0.63
0.80
0.91
1.00
Tienda BETA
Histograma
Frecuencia 25
20
15
10
5
0
30-39
40-49
50-59
60-69
Frecuencia
70-79
80-89
90-99
Clases
Tienda BETA
Histograma
Frecuencia 25
20
15
10
5
0
34.5
44.5
54.5
Frecuencia
64.5
74.5
Frecuencia
84.5
94.5
Clases
Tienda BETA
Frecuencia Acumulada
Frecuencia 120
100
80
60
40
20
0
30-39
40-49
50-59
60-69
Frec. Acum.
70-79
80-89
90-99
Clases
Tienda "BETA"
Frecuencia Relativa
80-89
11%
90-99
9%
30-39
12%
40-49
12%
70-70
17%
50-59
16%
60-99
23%
8lfJcENTRUM
CIE
TRUM
TRIIPLE CORONA
_E
EQUIS
RSIDAD CATLICA DE
PER
TRIPLE ISO
R.ECONOCIMIENTO MUNDIAL
ASOCIATlON
""'M B..A:
ACCEOITED
A.CREDIITACIONES INTERNACIONAILES
&BETA
lif' GGl\l
p M TI
IS09001
Ve l'M!d by
ulA
Mern::in ISO 26000
CER:TIIF .CACIIONES 11
TERNACIONAILIES
Bibliografa
Levin, R., & Rubin, D. (2004). Estadstica para administracin y
economa (7a ed.). Mxico: Pearson Prentice Hall.
Lind, D., Marchal, W., & Wathen, S. (2012). Estadstica aplicada a
los negocios y la economa (15a ed.). Mxico: McGraw-Hill.