Escolar Documentos
Profissional Documentos
Cultura Documentos
Introduccin
Hace ms de cien aos, H.G. Wells, escritor e historiador ingls, dijo que algn da
el razonamiento cuantitativo sera tan importante para la gran mayora de los
ciudadanos como la capacidad de leer. No menciono el rea de los negocios, ya
que la revolucin industrial apenas iniciaba. No obstante, Wells tena razn. Si
bien la experiencia en los negocios, cierta habilidad para hacer pronsticos
razonados y la intuicin constituyen atributos fundamentales en los gerentes con
xito, los problemas que en la actualidad se presentan en los negocios tienden a
ser demasiado complejos como para tomar decisiones solo con estos criterios.
Una de las herramientas utilizadas para la toma de decisiones es la estadstica,
pero la estadstica no solo sirve a la gente dedicada a los negocios, su aplicacin
en la llamada medicina cientfica que nace por la necesidad de analizar el
resultado de los tratamientos mdicos sobre el efecto positivo que tenan en la
recuperacin de un paciente. Tras el descubrimiento de los procedimientos para
invertir las deficiencias bioqumicas que causan algunas afecciones y la
elaboracin de los antibiticos fue posible una curacin de las personas a travs
de prueba y error, ms tarde a esto se le llamara Diseo Experimental.
Si se desea analizar el impacto que tiene una dieta en los trabajadores de las
zonas francas, nos podremos percatar que no tiene el mismo impacto en los
trabajadores del campo, con frecuencia queremos analizar el efecto que tiene una
actividad laboral en las enfermedades musculo esquelticas desarrolladas por los
trabajadores en su puesto.
En el campo ingenieril nos interesa conocer la resistencia a la tencin de un
armado de acero o la compactacin de una carretera, y de esta manera podemos
pronosticar su esperanza de vida. En los procesos productivos de una empresa
manufacturera debe tomarse en cuenta la calidad del producto. Dentro de la
evolucin de la calidad, se pueden distinguir cinco etapas que estn ntimamente
ligadas al desarrollo de la propia administracin.
Pgina 1
DIVICIONES DE LA ESTADISTICA
Estadstica Descriptiva: Procedimientos estadsticos que sirven para organizar y
resumir conjunto de datos numricos, trata de la presentacin de datos en graficas
o en distribucin de frecuencia y se aplican diversos promedios y medidas de
dispersin.
Estadstica Inferencial: Procedimientos estadsticos que sirven para deducir o
inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionados
de un grupo menor de ellos (muestra).
Funciona tomando una muestra de una poblacin y efectuando estimaciones
acerca de una caracterstica de esa poblacin con base en los resultados del
muestreo.
Poblacin: Conjunto de todos los posibles individuos, personas, objetos o
mediciones de inters cientfico.
Muestra: Una porcin o parte de la poblacin de inters.
Pgina 2
Pgina 3
pacientes que se ven en una clnica dental. Estos son ejemplos de variables
cuantitativas.
Variables Cualitativas: Algunas caractersticas pueden no ser medidas en el
sentido en que se miden la estatura, el peso, la edad. Muchas caractersticas solo
pueden catalogarse, como por ejemplo, cuando a una persona enferma se le da
un diagnostico medico, Cuando a una persona se le designa dentro de un grupo
socioeconmico cuando se dice que una persona, lugar u objeto posee o no
posee alguna caracterstica de inters. Estas variables se conocen como variables
cualitativas.
Niveles de medicin
Existen
Cuatro
niveles
de
medicin: el nominal, ordinal, por
intervalo y de razn; la medicin
mas baja o ms primaria
corresponde al nivel de medicin
nominal. La ms alta o el nivel que
proporciona la mayor informacin
relacionada con la observacin es
la medicin de razn.
Pgina 6
DISTRIBUCION DE FRECUENCIA
Una distribucin de frecuencia es un conjunto de puntuaciones ordenadas en sus
respectivas categoras. Una distribucin de frecuencias ordenara los datos si estos
se dividen en clases y se registrara el nmero el nmero de observaciones en
cada clase.
Ejemplo: Variable: cooperacin de personal para el proyecto de calidad de la
empresa
Categoras
Cdigos
Frecuencia
s
Si se ha obtenido la cooperacin
1
91
No se ha obtenido la cooperacin
2
5
No responden
3
26
Total
122
A veces las categoras de las frecuencias, son tantas que es necesario resumirlas
en clases
Ejemplo
Ingreso Familiar ($)
Frecuencias
10,000.00 - 11,999.00
12
12,000.00 - 13.999.00
14
14,000.00 - 15,999.00
24
16,000.00 - 17,999.00
15
18,000.00 - 19,999.00
13
20,000.00 - 21,999.00
7
22,000.00 - 23,999.00
6
24,000.00 - 25,999.00
4
26,000.00 - 27,999.00
3
28,000.00 - 29,999.00
2
Total
100
Las distribuciones de frecuencias pueden completarse agregando las frecuencias
relativas y las frecuencias acumuladas, las frecuencias relativas son los
porcentajes de casos en cada categora, y las frecuencias acumuladas son las que
se van acumulando en cada categora, desde la ms baja hasta la ms alta.
Ejemplo.
Categoras
Se ha dado la cooperado
No ha dado la cooperado
No responde
Total
Cdigo
fi
1
2
3
91
5
26
122
f%
74.6
4.1
22.3
100
fa
91
96
122
fa%
74.6
78.7
100
Pgina 8
105
97
245
163
207
134
218
199
160
196
221
154
228
131
180
178
157
151
175
201
183
153
174
154
190
76
101
142
149
200
186
174
199
115
193
167
171
163
87
176
121
120
181
160
194
184
165
145
160
150
181
168
158
208
133
135
172
171
237
170
180
167
176
158
156
229
158
148
150
118
143
141
110
133
123
146
169
158
135
149
L.R.
wi
75.5 100.5
100.5 125.5
125.5 150.5
150.5 175.5
175.5 200.5
200.5 225.5
225.5 250.5
88
113
138
163
188
213
238
fi
3
8
16
27
17
5
4
80
f%
3,75
10
20
33,75
21,25
6,25
5
100
fa .
3
11
27
54
71
76
80
fa%
3,75
13,75
33,75
67,5
88,75
95
100
Pgina 10
Hojas
Frecuencia
6
7
7
5, 1
5, 8, 0
1, 0, 3
4, 1, 3, 5, 3, 5
2, 9, 5, 8, 3, 1, 6, 9
4, 7, 1, 3, 4, 0, 8, 8, 6, 8, 0, 8
3, 0, 7, 3, 0, 5, 0, 8, 7, 9
8, 5, 4, 4, 1, 6, 2, 1, 0, 6
0, 3, 6, 1, 4, 1, 0
9, 6, 0, 9, 3, 4
7, 1, 0, 8
8
1, 8, 9
7
5
Total
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
80
Histograma
Pgina 11
Ojiva
(Polgono
de
Frecuencias
acumuladas)
Se utiliza para determinar cuntas
observaciones se encuentran por debajo
de ciertos valores
Diagrama de Pastel
Como su nombre lo indica este diagrama
tiene
la forma de un pastel y las
frecuencias se van formando en
porciones.
Poblacin
En el ejemplo el promedio es:
Muestra
=
Mediana
Es el valor cntrico en un conjunto de valores ordenados de menor a mayor o de
mayor a menor, una forma fcil de localizar la posicin del elemento medio para
los datos agrupados es por medio de (n+1)/2.
Es una medida de tendencia central propia de los niveles de medicin
ordinal, por intervalo y de razn.
No es influenciada por valores externos.
El 50% de las observaciones son mayores que la mediana.
No necesita ser uno de los valores del conjunto de datos.
Es nica para un conjunto de observaciones.
76
87
97
101
105
110
115
118
120
121
123
131
133
133
134
135
135
141
142
143
145
146
148
149
149
150
150
151
153
154
154
156
157
158
158
158
158
160
160
160
163
163
165
167
167
168
169
170
171
171
172
174
174
175
176
176
178
180
180
181
181
183
184
186
190
193
194
196
199
199
200
201
207
208
218
221
228
229
237
245
Pgina 13
o bien
Pgina 14
Donde
2 : Es el smbolo para la varianza de una poblacin.
: Es el valor de la observacin en la poblacin.
: Es la media Poblacional
: Es el nmero total de observaciones en la poblacin
En general es difcil interpretar el significado del valor de una varianza, por las
unidades en las que se expresa son valores elevados al cuadrado; es mas
frecuente el uso de la raiz cuadrada
Desviacin Estndar. Es la raz cuadrada de la varianza
bien
Varianza Muestral. La formula para la varianza muestral utilizada como estimador
de la varianza poblacional es
o bien
Desviacin Estndar muestral. La desviacin estndar de una muestra se
denota como
o bien
La desviacin estndar se interpreta como cuanto se desva en promedio de la
media un conjunto de puntuaciones.
La desviacin estndar solo se utiliza en variables medidas por intervalo o de
razn.
Pgina 15
en donde
f
n
sumadas
Pgina 16
Clase (C)
76 100
101 - 125
126 - 150
151 - 175
176 - 200
201 - 225
226 - 250
Total
Wi
88
113
138
163
188
213
238
Fi
3
8
16
27
17
5
4
80
Facum. .
3
11
27
54
71
76
80
wifi
Wi2fi
264
23232
904
102152
2208
304704
4401
717363
3196
600848
1065
226845
952
226576
12990 2201720
Mediana
Si se han registrado datos en una tabla de frecuencias, no pueden colocarse en un
arreglo ordenado para calcular la mediana. Primero se debe hallar la clase de la
mediana de la distribucin de frecuencias. La clase mediana es la clase cuya
frecuencia acumulada es mayor que o igual a n/2.
Debido a que n es 80, se necesita localizar la primera clase con una frecuencia
acumulada de 40 o ms. La cuarta clase tiene una frecuencia acumulada de 54 ,
la mediana puede determinarse entonces como:
En donde:
Lmd Es el lmite inferior de la clase de la mediana (151)
F
Es la frecuencia acum. de la clase que antecede a la clase de la
mediana (27)
fmd
es la frecuencia de la clase de la mediana (27)
C
Es el intervalo de clase de la clase de la mediana.
Pgina 17
Moda.
Ya que por definicin la moda es la observacin que ocurre con mayor frecuencia,
se hallara en la clase que tenga la frecuencia ms alta , llamada la clase modal.
para estimar la moda en el caso de datos agrupados se utiliza la siguiente frmula:
En donde
Lmo
Da
antecede.
Db
C
MEDIDAS DE DISPERSION
Varianza y Desviacin Estndar
Si los datos estn agrupados en una tabla de distribucin de frecuencia, la
varianza y la desviacin estndar pueden calcularse como
Coeficiente de variacin.
El coeficiente de variacin es una medida muy til cuando:
1. Los datos estn en unidades diferentes (como salario y das de asistencia).
2. Los datos estn en la misma unidad, pero las medidas muy distantes
(ingreso de un ministro, ingeniero, o un maestro de primaria).
3. Cuando se desea comparar la variabilidad de dos conjunto de datos.
El coeficiente de variacin indica la magnitud relativa de la desviacin estndar en
comparacin con la media de la distribucin, expresada como porcentaje.
Poblacin
Pgina 18
Muestra
Pgina 19
De igual manera, sabiendo que Q 3 debe tener al menos el 75% de los datos por
debajo de l, es decir 15 observaciones y al menos 25% de los datos, es decir 5
observaciones por encima de l, entonces Q 3 se encuentra entre las
observaciones 15 y 16.
.
Percentiles
Cuando un conjunto ordenado se divide en cien partes iguales, los puntos de
divisin reciben el nombre de percentiles. En trminos ms generales, el 100kesimo percentil pk se define de la siguiente manera:
El 100k-esimo percentil pk es un valor tal, que al menos el 100k% de las
observaciones estn en el valor o por debajo de l y al menos el 100(1-k)% estn
en el valor o por encima de l.
El procedimiento para encontrar el valor de cualquier percentil a travs de los
datos clasificados es el siguiente:
Encontrar el nmero de la posicin i del percentil, mediante del clculo de nk. Si
nk no es entero entonces i es el siguiente entero ms grande; si nk es entero,
entonces i es igual a nk+0.5.
Si i es entero, encuentre desde la observacin ms pequea hasta llegar a la iesima observacin. Si i no es entero, entonces contiene una fraccin igual a con
lo que el valor pk es el promedio de la observacin nk y nk+1.
Ejemplo. Encontrar los percentiles 10 y 88
a) k = 0.10
pk=p0.10
nk=20*0.10= 2 : nk es entero por tanto
i=nk+0.5=2.5
Por tanto el percentil 10 se encuentra entre las observaciones 2 y 3.
p0.10= (x2+x3)/2 =(228 + 252)/2 = 240.
b) k= 0.88
pk = p0.88
nk=20*0.88= 17.6 no es entero, por tanto
i es el siguiente entero ms grande i = 18.
Por tanto el percentil 88 se encuentra en la observacin 18
p0.88=3192.
Pgina 20
EJERCICIOS
1) Los siguientes datos son los niveles de glucosa en la sangre
nios en ayunas:
56
61
57
77
62
75
63
55
60
57
61
57
67
62
69
67
65
72
65
61
68
73
65
62
66
61
69
76
72
57
75
68
69
64
66
65
65
76
65
58
68
71
72
58
73
55
73
79
65
60
65
80
66
80
68
55
72
73
73
75
75
74
66
68
73
74
68
59
69
55
67
65
67
56
67
62
65
75
62
63
extrada a 100
64
68
75
81
65
81
66
73
67
63
60
59
80
64
64
56
71
65
63
59
$23372
$20454
18021
20047
19873
20004
20203
24052
20356
20962
21740
24220
21556
28683
24285
25251
17357
23765
25799
21442
22845
22374
30655
21639
30872
24324
25277
20155
25783
15794
21722
26285
24571
22442
24296
$2359
1
19587
24609
28034
19688
26661
18263
19331
27896
25449
17891
$26651
$27453
$17266
23169
28670
24533
23657
32277
35925
22817
29076
28337
20818
35851
15546
27443
26613
20642
17399
19766
32492
20642
26237
19251
15935
19889
20895
21981
17968
20633
18890
23613
20445
3
3
1
4
4
5
6
4
2
6
6
6
7
1
14 1
2
4
4
4
5
6
3
5
3
4
5
6
4
7
6
5
9
11 3
12 4
7
6
5
15 1
10 8
9
2
12
a) Comience a partir de 0 como lmite inferior de la primera clase, utilice un
intervalo de clase de 3 y organice los datos en una distribucin de
frecuencia.
b) Describa la distribucin. Dnde tienden a acumularse los datos?
c) Convierta la distribucin en una distribucin de frecuencias relativas.
5)
77
41
60
18 63 84 38 54 50 59 54 56 36 26 50 34 44
58 58 53 51 62 43 52 53 63 62 62 65 61 52
60 45 66 83 71 63 58 61 71
a) Organice los datos como distribucin de frecuencias utilizando siete clases
y el 15 como lmite inferior de la primera clase. Qu intervalo de clases
eligi?
b) Dnde tienden a acumularse los datos?
c) Describa la distribucin.
d) Determine la distribucin de frecuencia relativa.
6) Los tiempos de vida (en ao) de 30baterias de la marca A y 30 de la marca B se
dan en las tablas siguientes.
Marca A
6.9
8.4
5.6
7.6
4.8
7.1
4.2
3.2
6.3
4.9
6.5
4.5
6.8
9.3
5.1
4.4
6.3
5.9
5.8
5.0
3.2
5.4
5.7
6.6
5.0
6.2
4.2
6.1
5.4
4.6
Marca B
4.7
4.9
6.2
6.4
5.8
5.4
5.4
4.3
5.3
5.8
6.9
5.9
5.5
5.7
6.4
4.9
6.5
5.5
6.2
6.9
5.8
4.9
6.6
5.5
6.5
5.3
5.4
4.9
4.7
6.7
Pgina 23
Pgina 24
CT
HDL
TG
QUET
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
78
37
43
46
20
35
36
61
75
24
53
37
57
24
22
28
28
21
36
34
35
26
21
71
35
29
50
39
39
47
39
69
41
34
20
63
39
33
21
29
30
33
59
65
47
29
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
142
156
158
158
155
173
159
155
150
165
169
160
152
174
159
161
164
164
160
151
158
167
157
154
173
169
167
174
167
164
180
168
166
164
174
173
168
169
175
167
168
165
158
177
164
167
67.00
97.50
60.00
81.00
55.50
77.50
60.50
80.00
43.50
66.20
66.80
65.20
85.50
64.00
54.90
57.80
75.50
64.00
55.00
57.00
66.00
47.70
57.40
61.60
97.50
81.00
67.50
88.00
82.00
70.00
81.00
71.40
82.00
74.00
51.50
87.00
84.00
59.00
85.00
81.60
59.20
70.00
77.00
63.50
69.50
78.00
106
90
98
101
80
89
110
117
85
84
96
100
137
73
78
86
85
87
88
105
93
82
72
96
138
101
103
102
97
240
87
109
125
112
100
142
92
91
108
90
93
111
135
125
109
105
188
212
202
275
358
207
219
196
196
182
218
193
260
196
154
239
283
193
217
163
242
179
232
233
211
229
221
214
273
264
238
235
255
198
123
177
262
266
286
195
266
246
247
318
338
371
35
37
40
43
43
56
57
58
59
60
64
69
69
70
70
75
80
39
42
52
54
61
77
34
36
40
41
42
45
49
67
77
30
35
36
37
37
40
41
42
45
48
49
50
51
52
209
183
110
164
160
84
59
153
85
110
65
43
164
62
41
112
191
85
82
47
66
75
131
362
620
66
207
78
239
140
59
43
1288
70
100
128
343
1076
330
95
114
81
144
185
387
146
33
40
24
32
23
26
24
33
19
24
23
25
37
21
22
22
28
24
21
25
26
17
23
26
33
28
24
29
29
26
25
25
30
28
17
29
30
21
28
29
21
26
31
20
26
28