Escolar Documentos
Profissional Documentos
Cultura Documentos
Qu es la Estadstica?
es la Ciencia de la
Sistematizacin, recopilacin, ordenacin y
presentacin de los datos referentes a un fenmeno
que presenta variabilidad o incertidumbre para su
estudio metdico,
con el objeto de
deducir las leyes que rigen esos fenmenos,
y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Plantear
Disear
hiptesis
experimento
Obtener
conclusiones
Recoger
datos
y analizarlos
Poblacin
Inferencias
Qu error tiene?
Estadstica Descriptiva
Estadstica Inferencial
Estadstica Descriptiva:
Se ocupa de la organizacin y presentacin de los datos
en forma convenientemente til y de fcil comunicacin
adems de hacer mediciones con esta informacin.
Inferencia Estadstica:
Se orienta a lograr generalizaciones, es decir, a partir de
los datos de la muestra obtener informacin sobre una
poblacin.
Nominal
Segn nivel de
medicin
Ordinal
Cuantitativa
Clasificacin de
Variables
Discreta
Segn tamao
del recorrido
Continua
Para el Ejemplo:
* *
16.0
** *
16.5
**
* *
17.0
+ + +
17.5
+ + ++
18.0
+ + +
18.5
Variable: N de das
laborables perdidos
Frecuencia
absoluta fi
Frecuencia
relativa fri
Frecuencia
acumulada Fi
1/30
4/30
5/30
10
6/30
16
8/30
24
6/30
30
9
8
7
6
5
4
3
2
1
0
0
Qu porcentaje de
individuos tiene 6 hijos o
menos?
97,3%
Nmero de hijos
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.
419
255
375
215
127
54
24
23
17
1509
Porcent.
(vlido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0
Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0
50%
100
80
60
40
20
0
65
MOTIVOS
15
O
tra
n
M
an
te
nc
a
ic
n
M
ec
t ri
ca
35
El
c
N
DETENCIONES
Es el diagrama de barras
simples en donde se han
ordenado las categoras en
orden descendente de
frecuencias.
100
80
60
40
20
0
65
MOTIVOS
15
O
tra
n
M
an
te
nc
a
ic
n
M
ec
t ri
ca
35
El
c
N
DETENCIONES
No interesa si las
categoras hacen
referencia a datos
nominales u ordinales.
Este diagrama se utiliza
esencialmente para
identificar causas que
producen alta frecuencia
de efectos observados.
N FAMILIAS
200
150
100
50
0
157
119
81
43
I
II
SI
NO
CONTAMINACION
Distribucin de la contaminacin
segn comunidad
N FAMILIAS
Distribucin de la comunidad (I o
II) segn contaminacin
200
157
119
150
100
81
43
SI
NO
50
0
I
II
COMUNIDAD
Un histograma permite
analizar el centro, el
alcance (o rango) y la
forma de la distribucin de
los datos.
Notemos que si las alturas
de los rectngulos fuesen
las frecuencias relativas, la
suma de las reas de los
rectngulos sera 1.
20
15
10
5
0
3,63 -3,72 3,72 - 3,81 3,81 - 3,9 3,9 - 3,99 3,99 - 4,08 4,08 - 4,17 4,17 - 4,26 4,26 - 4,35
DIAMETROS
Polgono de frecuencias
N de Tubos
Un histograma permite
analizar el centro, el
alcance (o rango) y la
forma de la distribucin de
los datos.
Notemos que si las alturas
de los rectngulos fuesen
las frecuencias relativas, la
suma de las reas de los
rectngulos sera 1.
Dimetros
54 32 78
41 45 46
68 80 81
55 100 39
68 77 53 11 23 83 78 25 66 67 45
66 65 16 13 50 78 19 16 20 95 73
75 21 54 43 52 99 62 79 17 26 72
71
Clase
[10, 23)
16.5
8/50
[23, 36)
29.5
5/50
13
[36,49)
42.5
6/50
19
[49, 62)
55.5
8/50
27
[62,75)
68.5
10
10/50
37
[75, 88)
81.5
9/50
46
[88, 101)
94.5
4/50
50
12
10
8
6
4
2
0
[10,23) [23, 36) [36, 49) [49, 62) [62, 75) [75, 88) [88, 101)
60
50
40
30
20
10
0
[10,23) [23, 36) [36, 49) [49, 62) [62, 75) [75, 88)[88, 101)
T AS A D E F AL L A D E AR T C U L O S
E L C T R IC O S . E M P R E S A
E L E C T R IC . A O S 1 9 8 0 -1 9 9 5
25
20
TAS A(%)
Representa datos de
variable que se registran
secuencialmente en el
tiempo, por lo que deben
incluir un eje asociado al
tiempo y otro eje
asociado a los valores de
la otra variable.
15
10
5
0
80
85
90
AOS
95
100
Diagrama Circular
Motivos para la compra de telfono mvil
3,00%
2,00%
11,00%
12,00%
25,00%
47,00%
Localizado
Familia
Clientes
Emergencias
Amigos
Mensajes
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Centralizacin
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
Forma
Asimetra, Apuntamiento o curtosis
... x
n
i 1
i 1
k
i 1
Caracterstica de la Media
Es intuitiva y fcil de calcular.
Su valor puede que no coincida con ninguno de los valores
de la muestra
La suma de las diferencias de cada valor de la muestra con la
media su resultado es cero, es decir,
n
(x x) 0
i
i 1
x n 1 2
Mna x x
n 2
( n 2)1
si n es impar
si n es par
Altura mediana
Peso
M.
Clase
frec
Fr.
acum.
40 50
45
50 60
55
10
15
60 70
65
21
36
70 - 80
75
11
47
80 - 90
85
52
90 - 100
95
55
100 130
115
58
Moda
Mediana
Media
25
20
15
10
5
0
1
10
11
12
13
Moda
Mediana
Media
25
20
15
10
5
0
1
10
11
12
13
Distribucin Simtrica
90
Moda
Mediana
Media
80
70
60
50
40
30
20
10
0
1
10
11
12
13
r xmax xmin
x x
x x
Poblacional :
i 1
Muestral :
i 1
n 1
x x
x
i
Poblacional :
i 1
Muestral :
i 1
n 1
CV
15
10
5
0
frecuencia
20
25
3
Peso al nacer (Kg) de 100 nios
20
15
10
5
0
frecuencia
25
30
50
55
60
65
70
75
80
85
10
5
0
frecuencia
15
20
Percentiles 5 y 95
180
200
220
Colesterol en 100 personas
240
260
15
10
5
0
frecuencia
20
Percentiles 25 y 75
150
160
170
Altura (cm) en 100 varones
180
190
Estadsticos
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
Frecuencia Porcentaje
5
,3
5
,3
6
,4
12
,8
25
1,7
68
4,5
56
3,7
73
4,8
85
5,6
461
30,6
130
8,6
175
11,6
73
4,8
194
12,9
43
2,9
45
3,0
22
1,5
30
2,0
1508
100,0
Porcentaje
acumulado
,3
,7
1,1
1,9
3,5
8,0
11,7
16,6
22,2
52,8
61,4
73,0
77,9
90,7
93,6
96,6
98,0
100,0
20%?
90%?
Min
Max
Q1
mediana
Q3
Resumen con 5 nmeros:
Mnimo, cuartiles y mximo.
Suelen dar una buena idea de la distribucin.
0.04
0.02
densidad
0.06
0.08
P25
P50
P75
Mx.
0.00
Mn.
40
45
50
55
60
65
0.03
0.02
0.01
P25
Mn.
P50
P75
Mx
0.00
densidad
0.04
80
90
100
110
120
130
140
Tabla de
frecuencias
observadas
Tratamiento
Bajo
Medio
Alto
Total
40
34
82
84
22
12
118
Total
92
62
46
200