Escolar Documentos
Profissional Documentos
Cultura Documentos
1
II. PROCESAMIENTO ESTADSTIC0
BSICO DE DATOS.
2
Conceptos Bsicos.
3
Poblacin.
4
Muestra.
Datos.
5
Experimento.
Parmetro.
6
Estadstico.
Variable.
7
CLASIFICACION DE
VARIABLES
CUALITATIVAS CUANTITATIVAS
ATRIBUTOS NUMERICO
8
De acuerdo a la escala de medicin usada se
clasifica en:
Contina
Discreta
9
VARIABLE CUALITATIVA
EJEMPLOS:
10
Ejemplo cualitativa nominal
Religin: Religion:
Catlica Ateo
Protestante Mormon
Ateo Catlica
Musulmana Protestante
Mormon Musulmana
11
Ejemplo cualitativa ordinal
12
VARIABLE CUANTITATIVA
13
VARIABLE DISCRETA:
Ejemplos
14
VARIABLE CONTNUA :
Ejemplos
Persona:
Estatura, peso, etc.
Ingreso, gastos, etc.
Hogar:
Ingresos por hogar.
Gastos por hogar en alimentacin.
Monto de alquiler por hogar.
Establecimiento comercial:
Valor de las ventas por establecimiento.
Valor de las compras por establecimiento.
Gastos (electricidad, agua, telfono)
15
REPRESENTACIN DE DATOS ESTADSTICOS
16
Textual.
Tabular.
17
Grfico. Es el mtodo de presentacin de informacin ms simple para el lector,
porque se puede captar la tendencia de los datos de un solo vistazo. Su desventaja ms
notoria es la prdida de precisin y exactitud en comparacin con la tabla.
18
ESTADSTICA DESCRIPTIVA
DATOS CUALITATIVOS
Se miden en escala
Nominal Ordinal
Se representan en
Grficos Tablas
DATOS CUANTITATIVOS
Se dividen en
Discretos Continuos
Se miden en escalas
Razn Intervalos
20
REPRESENTACIN TABULAR
21
DIAGRAMA DE BARRAS
45
40
35
30
25
20
15
10
0
Bachiller Tcnico Tecnlogo Profesional Posgrado
22
Grfico circular
FRECUENCIAS RELATIVAS
0.05
0.17
0.33 Bachiller
Tcnico
Tecnlogo
Profesional
0.23 Posgrado
0.23
23
TABLAS DE CONTINGENCIA
24
Diagrama de Barras:
18
16
14
12 Bachiller
Tcnico
10
Tecnlogo
8
Profesional
6 Posgrado
4
2
0
Planta A Planta B Planta C
25
Diagrama de Barras:
45
40
35
Posgrado
30 Profesional
25 Tecnlogo
20 Tcnico
15 Bachiller
10
5
0
Planta A Planta B Planta C
26
27
Grficos cronolgicos:
28
29
Abusos que se pueden cometer con la Estadstica
30
Organizacin de los datos
31
Formas de organizar los datos:
Un arreglo: es la forma ms sencilla de organizar
los datos en bruto, consiste en colocar las
observaciones en orden segn su magnitud:
ascendente o descendente.
Poco prctica cuando se tiene una gran cantidad
de datos.
32
Una distribucin de frecuencias: es un
arreglo de los datos que permite expresar la
frecuencia de ocurrencias de las
observaciones en cada una de las clases,
mostrando el patrn de la distribucin de
manera ms significativa.
33
La Distribucin de Frecuencias:
Se recomienda su uso cuando se tienen grandes
cantidades de datos (n).
Su construccin requiere, en primer lugar, la
seleccin de los lmites de los intervalos de
clase.
Para definir la cantidad de intervalos de clase
(k), se puede usar:
La regla de Sturges: k = 1 + 3.3log(n)
k = n
34
La cantidad de clases no puede ser tan pequeo
(menos de 5) o tan grande (ms de 20), que la
verdadera naturaleza de la distribucin sea imposible
de visualizar.
35
Determinar:
36
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
37
Los grficos permiten visualizar en forma global y
rpida el comportamiento de los datos.
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas.
38
Los grficos permiten visualizar en forma global y
rpida el comportamiento de los datos.
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas.
39
Histograma
40
Tema 2. Estadstica Descriptiva
Histograma y Polgono de Frecuencias
41
Ojiva
42
Medidas de tendencia central o posicin
Mediana.
Moda.
43
Media Aritmtica
44
Clculo de la media aritmtica
x i
X i 1
n
Para datos agrupados:
k
m f i i
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
45
Mediana
Clculo de la mediana
46
Datos agrupados: clase mediana es la que
contiene a la observacin que ocupa la posicin
n/2.
n 1
F ( xm1 )
Md Lm 2 Cm
f ( xm )
47
Moda
48
Clculo de la moda
1
Mo Lim Cm
1 2
Donde: Lim: lmite inferior de la clase modal.
1: diferencia entre fi de la clase modal y la
anterior.
2: diferencia entre fi de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
49
Relacin entre la media,
la mediana y la moda
Propiedades:
51
Si se somete a una variable estadstica X a un
cambio de origen y escala, Y = a + bX, la media
aritmtica de dicha variable X vara en la misma
proporcin.
52
Ventajas:
Es un valor nico.
53
Se trata de un concepto familiar para la mayora de
las personas.
54
Desventajas:
55
Ventajas y desventajas de la mediana
Ventajas:
Fcil de entender.
56
Se puede calcular para cualquier tipos de datos
cuantitativos, incluso los datos con clase de
extremo abierto.
57
Desventajas:
58
Ventajas y desventajas de la moda
Ventajas:
No requiere clculos.
Fcil de interpretar.
59
Desventajas:
60
En ocasiones, el azar hace que una sola observacin
no representativa sea el valor ms frecuente del
conjunto de datos.
61
Medidas de dispersin, variacin o
variabilidad.
62
Las medidas de dispersin ms comunes son:
Rango.
Varianza.
Desviacin Tpica o estndar.
Coeficiente de variacin.
63
Rango (amplitud o recorrido):
R=Xmax-Xmin
64
Casi no se emplea debido a que depende
nicamente de dos valores.
Notacin: R
65
Varianza
66
Si la varianza de un conjunto de observaciones es
grande se dice que los datos tiene una mayor
variabilidad que un conjunto de datos que tenga un
varianza menor.
x x
n
2
i
Para datos NO
s2 i 1
agrupados:
n
n
i
x 2
2
s
2 i 1
x
n
67
Para datos agrupados en una distribucin de
frecuencias:
k
i
m x 2
fi
s2 i 1
n
k
i fi
m 2
s2 i 1
x
2
68
Desviacin Tpica
s s 2
69
Coeficiente de Variacin
s
CV 100%
x
70
Ventajas y Desventajas del Rango
Ventajas:
Fcil de calcular.
71
Desventajas:
72
Propiedades, Ventajas y Desventajas de la Varianza
Propiedades:
73
Ventajas:
Desventajas:
74
Ventajas y Desventajas de la Desviacin Tpica
Ventajas:
Desventajas:
No tiene.
75
Ventajas y Desventajas del Coeficiente de Variacin
Ventajas:
Fcil de calcular.
76
Desventaja:
77
Medidas de Forma
Coeficiente de Pearson
-Asimetra
Medidas Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
78
Asimetra
79
Coeficiente de Asimetra de Pearson:
Clculo:
3 X Md
ASP
s
o Interpretacin:
= 0, X=Md Simtrica
80
Coeficiente de Asimetra de Fisher:
x X
n
3
i
ASF i 1
3
Datos NO agrupados
ns
M
k
3
i x fi
ASF i 1 Datos Agrupados
ns 3
81
o Interpretacin:
= 0, Simtrica
82
Kurtosis
83
Mesocrtica: grado de concentracin medio alrededor
de los valores centrales de la variable.
84
x X
n
4
i
CK i 1
4
3 Datos No Agrupados
ns
M
k
4
i X fi
CK i 1
4
3 Datos Agrupados
ns
Interpretacin:
=0 Mesocrtica
CK >0 Leptocrtica
<0 Platicrtica
85
Ejercicio 1
30 55 44 60 43 72 47 65 67 40
59 58 14 32 58 46 41 35 68 50
59 21 42 45 41 48 28 47 77 60
30 57 45 49 33 48 47 52 38 61
54 42 54 42 49 51 39 60 61 63
86
a) Construya una tabla de distribucin de frecuencias.
87
Ejercicio 2.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
88