Escolar Documentos
Profissional Documentos
Cultura Documentos
INTRODUCCIN A LA ESTADSTICA
DESCRIPTIVA
INDICE
CAPTULO 1: ESTADSTICA
INTRODUCCIN
FUNCIONES
GRFICO DE BARRAS
18
33
47
54
CAPTULO 6: PROBABILIDADES
59
71
CAPITULO 8: MUESTREO
78
82
CAPTULO 1: ESTADSTICA
INTRODUCCIN
Los inicios de la estadstica se remontan desde siglos pasados, tal es el caso del censo que
realizo Moiss despus de la salida de Egipto, esto segn la biblia, tambin existieron otros
censo como los realizados por el emperador TAO hacia el ao 2200 AC. En la edad media
realizado por Carlomagno en el ao 762.
La estadstica es bien aplicada desde los aos
La estadstica es una rama de las matemticas que se encarga de la recoleccin y estudio
de datos de una poblacin, objetos, animales, etc.
La estadstica es muy necesaria dentro de todos los campos, ya que permite a travs de sus
|datos darnos valores para interpretar nuestros datos recogidos, pudiendo estos ser de
estudio o no.
Cuando se habla de estadstica surge muchas preguntas:
Porque es importante la estadstica?
Se vuelve importante en nuestra vida diaria, como por ejemplo en lo ms simple cuando se
necesita saber cul ser el pronstico de un equipo de futbol durante un partido, la suerte
que se tendr a jugar a la ruleta dentro de un casino o tan simple como jugar a los volados,
y en otras mucho ms complejas como saber la necesidad de evaluar la tasa de
crecimiento de una poblacin, las notas de un grupo de estudiantes, el nmero de botellas
plsticas defectuosas, predecir el estado del clima en base a su comportamiento climtico,
predecir el comportamiento de una banda de aves, se puede calcular el comportamiento
de un delincuente, en fin un montn de usos prcticos.
FUNCIONES
Si a cada valor posible de una variable x le corresponden uno o ms valores de otra variable
y, entonces decimos que y es funcin de x, y escribimos:
y = f (x)
A la variable x se le llama variable independiente y a la variable y se le llama variable
dependiente.
Ejemplo 1. La poblacin total P de Ambato est en funcin del tiempo t, y lo expresamos:
P (Ambato) = f (t)
Ejemplo 2. La longitud L de un eje de trasmisin est en funcin de su peso, expresndose:
L = f (P)
Ejemplo 3. Los profesores de la UTI (C), estn en funcin del Rector (D) en cada una de las
Facultades.
C = f (D)
5
La dependencia funcional o correspondencia entre variables se anota en algunas
ocasiones en una tabla. Sin embargo, puede tambin indicarse con una ecuacin que
conecta ambas variables, por ejemplo:
y = 6x + 12
Si x = 2, y la funcin de x puede escribirse como:
Entonces:
y = f (x)
f(x) = 6x + 12
6
Para realizar cualquier tipo de grafica primero se debe tener los datos representados y
debidamente ordenado en una tabla
AREAS (Km2)
AZUAY
8639
BOLIVAR
3254
CAAR
3908
CARCHI
3699
CHIMBORAZO
5287
ESMERALDAS
6569
GUAYAS
17139
PICHINCHA
9612
TUNGURAHUA
3334
Paso 1 Con los datos e informacin de la tabla 1 Calcular los porcentajes para cada
provincia.
a) Para calcular el porcentaje de cada rea primero se debe sumar todos los valores
correspondientes a cada provincia.
PROVINCIAS
AREAS (Km2)
AZUAY
8639
BOLIVAR
3254
CAAR
3908
CARCHI
3699
CHIMBORAZO
5287
ESMERALDAS
6569
GUAYAS
17139
PICHINCHA
9612
TUNGURAHUA
=
3334
61441
7
b) Luego de sumadas se debe realizar la regla de tres simple para calcular el rea
correspondiente. El porcentaje total ser igual a 100 una vez sumado cada uno de
sus valores.
8639
100 = 14.061
61441
3254
100 = 5.3
61441
3908
100 = 6.36
61441
3699
100 = 6.02
61441
8639
=
100 = 8.61
61441
6569
=
100 = 10.69
61441
17139
=
100 = 27.9
61441
9612
=
100 = 15.64
61441
3334
=
100 = 5.43
61441
=
PROVINCIAS
AREAS (Km2)
PORCENTAJE
AZUAY
8639
14,06
BOLIVAR
3254
5,30
CAAR
3908
6,36
CARCHI
3699
6,02
CHIMBORAZO
5287
8,61
ESMERALDAS
6569
10,69
GUAYAS
17139
27,90
PICHINCHA
9612
15,64
TUNGURAHUA
3334
61441
5,43
100,00
14.06
360 = 50.62
100
5.3
=
360 = 19.07
100
6.36
=
360 = 22.9
100
6.02
=
360 = 21.67
100
8.61
=
360 = 30.98
100
10.69
=
360 = 38.49
100
27.9
=
360 = 100.42
100
15.64
=
360 = 56.32
100
5.43
=
360 = 149.53
100
=
Para graficar cada uno de los ngulos calculados se deber utilizar un graduador
y representarlo sobre su grfica.
9
TUNGURAHU
A
5%
REAS (Km2)
PICHINCHA
16%
AZUAY
14%
GUAYAS
28%
ESMERALDAS
11%
BOLIVAR
5%
CAAR
6%
CARCHI
6%
CHIMBORAZ
O
9%
GRFICO DE BARRAS
Dentro de la representacin grafica de barras se tiene:
Segn a orientacin.- Vertical u Horizontal
Segn su tipo.- Pueden ser Sencillo, agrupados y apilados
HISTOGRAMA
Un histograma permite comparar valores con respecto a una variable cualitativa y
una cuantitativa. Esta no se ve limitada por el nmero de variables, ya que su
comparacin la una de la otra no depende del espacio utilizada por otra variable
en comparacin al grafico de pastel. La orientacin de estos grficos se puede
mostrar de manera vertical u horizontal segn convenga ver figura 1 y 2
respectivamente.
Grfico de barras Sencillos.- Para este tipo de grfico el orden de la distribucin de
variables se muestra como la figura 1 con una nica serie de datos.
10
AREAS (Km2)
18000
16000
14000
12000
10000
8000
6000
4000
2000
0
AREAS (Km2)
Figura. 1 Grfico de barras sencillo con una nica serie de datos con la variable cuantitativa en
sentido vertical
AREAS (Km2)
TUNGURAHUA
PICHINCHA
GUAYAS
ESMERALDAS
CHIMBORAZO
CARCHI
CAAR
BOLIVAR
AZUAY
0
2000
4000
6000
Figura. 2 Grafico de barras sencillo con una nica serie de datos con a variable cuantitativa en
sentido vertical
Grfico de barras agrupado.- Este tipo de grfico es utilizado para comparar los
valores de ciertas variables conforme al tiempo y las dems variables.
En la tabla 4 se tiene los datos de poblacin de la provincia de Tungurahua segn
el censo del 2010 y se la compara con la del censo del 2001
11
Rango de
edad
95 a mas
90 a 94
85 a 89
80 a 84
75 a 79
70 a 74
65 a 69
60 a 64
55 a 59
50 a 54
45 a 49
40 a 44
35 a 39
30 a 34
25 a 29
20 a 24
15 a 19
10 a 14
5a9
0a4
Ao
2001
1098
1275
2764
4550
6850
8606
10372
12470
13602
17837
19456
23705
27678
30367
33298
41475
45287
47913
48158
44273
Ao 2010
0,2
0,3
0,6
1,0
1,6
2,0
2,4
2,8
3,1
4,0
4,4
5,4
6,3
6,9
7,5
9,4
10,3
10,9
10,9
10,0
398
1207
3163
5612
7867
10581
13675
15761
18951
21629
26371
28966
32874
37189
42233
45622
49701
49194
48391
45198
0,1
0,2
0,6
1,1
1,6
2,1
2,7
3,1
3,8
4,3
5,2
5,7
6,5
7,4
8,4
9,0
9,8
9,7
9,6
9,0
441034
100,0
504583
100,0
Poblacin de la pronvincia de
Tungurahua
50000
40000
30000
20000
10000
Ao 2001
0a4
5a9
10 a 14
15 a 19
20 a 24
25 a 29
30 a 34
35 a 39
40 a 44
45 a 49
50 a 54
55 a 59
60 a 64
65 a 69
70 a 74
75 a 79
80 a 84
85 a 89
90 a 94
95 a mas
Ao 2010
12
Poblacin de la pronvincia de
Tungurahua
5a9
15 a 19
25 a 29
35 a 39
45 a 49
55 a 59
65 a 69
75 a 79
85 a 89
95 a mas
0
10000
20000
Ao 2010
30000
40000
50000
60000
Ao 2001
NMERO
POR LITRO
DE VIAJES
4.50
13
5.50
6.50
7.50
11
8.50
9.50
10.50
4
Tabla 5
2. En las elecciones de 2014 para Alcaldes, se obtuvieron los siguientes resultados en el cantn
Ambato, correspondiente a la provincia de Tungurahua. Elaborar un grfico de pastel.
PARTIDO
PORCENTAJE (%)
PRIAN
33.59%
PAIS
53.31%
MPD
7.15%
SUMA
0.62%
PACHACUTIK 1.01%
PSC
0.00%
PRE
0.01%
PPBC
1.26%
OTROS
0.00%
NULOS
2.85%
Tabla 6
PARTIDO
VOTOS
PORCENTAJE
Luis Amoroso
Avanza
151,739
36.66%
Alexis Snchez
24.38%
Javier Altamirano
CCJM
153,949
37.18%
7,314
1.78%
VOTOS
Otros
Tabla 7
14
TURNO VESPERTINO
GRUPO
GRUPO
ALUMNOS
ALUMNOS
1 AP
44
1 CP
42
1 BP
44
1 DP
43
1 AM
44
1 EP
42
1 BM
44
1 FP
44
1 AT
44
1 CM
41
3 AP
38
1 DM
37
3 BP
40
1 BT
40
3 CP
38
1 SFT
52
3 AM
39
3 DP
40
3 BM
38
3 EP
40
5 AP
36
3 CM
35
5 BP
31
3 SFT
18
5 CP
32
5 DP
26
5 AM
52
5 CM
47
Tabla 8
MAXIMA(C)
MINIMA(C)
Ambato
20
10
Quito
19
12
Atacames
19
13
Salinas
19
Puyo
26
10
Ing. Leonardo Snchez/ Ing. Carlos Burgos
15
Cuenca
23
12
Huaquillas
27
13
Esmeraldas
34
15
Babahoyo
33
15
Manta
32
14
Guayaquil
35
16
Portoviejo
29
15
Tabla 9
Construir un Histograma y un polgono de frecuencias, tanto para las temperaturas mximas como
para las mnimas.
6.- La nmina de los estudiantes de un curso de dibujo de la tabla 10 arroja las siguientes
calificaciones.
NOMBRES
LEONEL FERNANDO
DANNY ISRAEL
FRANCIS ANDRES
ADRIANA ELIZABETH
CYNTHIA ALEJANDRA
JHONATAN LUIGGY
PABLO MARCELO
WILSON ALEXANDER
MARLON ALEXIS
JORGE FERNANDO
DARWIN ISRAEL
JAIME OMAR
CHRISTIAN FERNANDO
FERNANDO ISRAEL
FERNANDA ELIZABETH
OLVER FELIPE
MERCEDES ELIZABETH
EDISON LENIN
HENRY VINICIO
FRANKLIN JAVIER
FERNANDO JOEL
DARWIN ALCIDES
JUANA GABRIELA
DEBERES TRABAJOS
8.3
9.3
7.7
7.7
5.4
8.2
9.4
9.5
8.7
9.4
9.0
7.7
2.0
6.5
8.4
8.5
9.5
4.7
9.8
9.2
7.6
8.0
2.5
6.0
3.0
5.7
8.4
8.7
7.5
8.3
6.0
8.0
8.9
8.7
7.9
7.8
9.4
8.8
9.0
8.8
8.5
8.0
2.8
4.0
9.6
9.8
Tabla 10
16
Realice un histograma de frecuencias acumuladas con cada una de los alumnos.
7.- La tabla 11 muestra un historial de repeticiones con su Throughput TH (Cantidad promedio de
productos no defectuosos producidos por unidad de tiempo)
Repeticiones
TH Sistema
Actual
18
32
26
15
33
27
17
27
35
10
24
11
31
12
34
13
22
14
27
15
22
Tabla 11
Tiempo
(min)
Empleado
Tiempo
(min)
Empleado
Tiempo
(min)
Empleado
Tiempo
(min)
Empleado
Empleado
el siguiente resultado:
Tiempo
(min)
0.01
11
0.26
21
0.53
31
1.03
41
2.03
0.02
12
0.34
22
0.54
32
1.1
42
2.03
0.04
13
0.35
23
0.63
33
1.28
43
2.16
0.05
14
0.36
24
0.66
34
1.42
44
2.62
0.1
15
0.36
25
0.79
35
1.49
45
2.67
17
6
0.15
16
0.38
26
0.8
36
1.5
46
2.81
0.17
17
0.39
27
0.8
37
1.73
47
3.53
0.21
18
0.45
28
0.82
38
1.8
48
4.29
0.24
19
0.48
29
0.9
39
1.88
49
4.91
10
0.26
20
0.53
30
40
1.9
50
5.5
18
Frecuencia
4
5
10
8
14
26
20
17
15
21
30
24
21
22
21
25
35
10
12
16
8
16
25
22
18
30
27
30
Tabla 12
Datos agrupados.-Estos datos se obtienen producto de un orden establecido por la persona que
someter a estudio dichos datos. Ejemplo. Las edades de 30 personas del ejemplo anterior estn
representadas en la siguiente tabla.
Edades (aos) Frecuencia (f)
8
3
10
3
12
1
14
1
Ing. Leonardo Snchez/ Ing. Carlos Burgos
19
1
3
2
1
1
3
2
1
2
1
1
3
1
15
16
17
18
20
21
22
24
25
26
27
30
35
Tabla 13
20
Dnde:
Vmax = valor mximo de los datos obtenidos en campo.
Vmin = valor mnimo.
no = nmero de clases.
El resultado final de la amplitud de clase debe estrictamente obtenerse en nmero entero; en caso
contrario deber redondearse, si el decimal es mayor a 0.5 se aumentara una unidad al resultado
obtenido.
Intervalos de clase Indica el rango de los valores incluidos dentro de una clase y puede ser
determinado restando el lmite exacto inferior de clase de su lmite exacto superior.
Marca de dase.-La marca de clase es un punto medio del intervalo de clase y se obtiene promediando
los lmites inferior y superior de clase. La marca de clase se denomina tambin punto medio de la
base. Generalmente se representa por x. ver tabla 15
Frecuencia.- Se define como el nmero de veces en que se repite un suceso y se representa por la
letra f.
Histograma.-Un Histograma o Histograma de frecuencias, consiste en un conjunto de rectngulos,
que pueden ser:
(a) Con bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales a los tamaos
de los intervalos de clase.
(b) reas proporcionales a las frecuencias de clase.
Polgono de Frecuencias. Es un grfico de trozos de la frecuencia de clase con relacin a la marca de
clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectngulos del
Comentado [WU1]: Este prrafo de cambiar de orden
Histograma.
Distribuciones de Frecuencias Relativas.- La frecuencia relativa de una clase es su frecuencia
dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje, por
lo tanto la suma de las frecuencias relativas de todas las clases es 100%. Si se acumulan las frecuencias
relativas de varias clases, a la tabla obtenida, se le llama "tabla de frecuencia relativas".
21
Donde:
Fr.-frecuencia relativa
.-Sumatoria total de frecuencias relativas
Distribuciones de Frecuencias Acumuladas.- La frecuencia total de todos los valores menores que
la frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese
intervalo de clase. Una tabla que presenta varias frecuencias acumuladas se llama "tabla de
frecuencias acumuladas". A las distribuciones de frecuencias acumuladas tambin se les conoce como
"ojivas". Esta tabla nos sirve para ver el comportamiento que tiene una variable respecto de otra,
debido a que su valor es la suma de acumulada de las variables anteriores.
Curvas de Frecuencia.- Los datos obtenidos pueden considerarse usualmente como pertenecientes
a una muestra de una poblacin grande. Ya que son posibles muchas observaciones sobre esa
poblacin, siendo posible escoger intervalos de clase muy pequeas y tener todava nmeros
Comentado [WU2]: CAMBIAR DE ORDEN
71
68
67
72
70
69
78
64
71
74
72
66
69
73
76
68
70
70
73
62
67
65
72
74
75
65
77
66
71
67
82
79
78
78
64
64
63
68
69
64
80
80
81
82
66
65
69
67
62
71
70
77
74
71
74
75
75
76
77
Tabla 14
Solucin.
Ing. Leonardo Snchez/ Ing. Carlos Burgos
22
Primeramente se localizan los nmeros mayor y menor.
Valor mximo=82
Valor mnimo=62
82 62
6.9035
A = 2.90
Hay que recordar que por definicin el valor de la amplitud de clase debe representarse en nmeros
enteros, por lo tanto:
A = 3.0
Tabla de Registro de Datos: Distribucin de Frecuencias Relativas y Acumuladas
Marca de
Intervalos
clase
de clase
Frecuencia Frecuencia
Relativa
Acumulada
fr
Fa
62 - 65
63.5
10
10
66 - 69
67.5
14
24
70 - 73
71.5
14
38
74 - 77
75.5
13
51
78 - 81
79.5
58
82 - 85
83.5
60
Tabla 15
Ejemplo 2.Segun las estadsticas del INEC (instituto ecuatoriano de estadsticas y censos) del ao
2010, los porcentajes de analfabetismo por provincia fueron:
23
#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Provincia
Tasa de
Analfabetismo
por Provincias
Galpagos
Pichicha
El oro
Guayas
Santa Elena
Zamora Chinchipe
Loja
Carchi
Napo
Santo Domingo
Orellana
Morona Santiago
Azuay
Sucumbos
Pastaza
Tungurahua
Los Ros
Esmeraldas
Manab
Imbabura
Zonas no
delimitadas
Caar
Chimborazo
Cotopaxi
Bolvar
1,3%
3,5%
4,1%
5,0%
5,2%
5,5%
5,8%
6,2%
6,3%
6,3%
6,5%
6,6%
6,7%
6,8%
6,9%
7,5%
9,3%
9,8%
10,2%
10,6%
12,0%
12,2%
13,5%
13,6%
13,9%
Tabla 16
Valor mnimo=1.3
Nmero de clases:
24
no = 5.64=6
La Amplitud de clase: A
=
13.9 1.3
6
A = 2.196
INTERVALOS
#
Clases
1
2
3
4
5
6
Li
1.3
3.4
5.5
7.6
9.7
11.8
frecuencia
Relativa Fr
3.4
1
5.5
5
7.6
14
9.7
14
11.8
16
13.9
19
Ls
25
a) Las curvas de frecuencias simtricas o en forma de campana (1), se caracterizan porque las
observaciones equidistantes del mximo central tienen la misma frecuencia. Un ejemplo importante
es la curva normal.
b) En las curvas de frecuencias poco asimtricas o sesgadas (2 y 3), la cola de
la curva a un lado
del mximo central es ms larga que al otro lado. El sesgo de la cola puede
ser a la derecha o
hacia la izquierda.
c) En una curva en forma de 'J' o de 'J invertida' (4 y 5), hay un mximo en un
extremo.
mximos.
26
GRFICOS DE PASTEL
Los grficos de pastel son especialmente apropiados para ilustrar las divisiones de una cantidad total,
tal como la distribucin de los egresos o los ingresos de una empresa. Un grfico de pastel en
porcentajes es aquella en la que los valores se convierten en porcentajes para que resulte ms fcil
compararlos.
GRADUADOS
Contador Fiscal
73
PORCETAJE
EGRESADOS
(%)
28.85
Finanzas
52
20.55
74
Gerencia
Mercadotecnia
Otros
36
64
28
14.23
25.30
11.07
51
91
40
253
100 %
360
TOTAL
ANGULO
Grados ()
104
28.85
360 = 103.86
100
20.55
360 = 73.98
100
14.23
360 = 51.23
100
25.03
360 = 91.08
100
11.07
360 = 39.85
100
27
GRADUADOS
Otros
11%
Mercadotec
nia
25%
Contador
Fiscal
29%
Finanzas
21%
Gerencia
14%
PORCETAJE
AUDIENCIA
(%)
ANGULO
Grados ()
CBS
23.00
83
ABC
NBC
20.00
18.00
72
65
FOX
Otros
11.00
28.00
40
100
100.00
360
TOTAL
23.00
360 = 103.86
100
20.00
360 = 73.98
100
18.00
360 = 51.23
100
28
11.00
360 = 91.08
100
28.00
360 = 39.85
100
Otros
28%
ABC
20%
FOX
11%
NBC
18%
PROBLEMAS PROPUESTOS
1. Con el siguiente grupo de nmeros 13, 57,43, 22, 6, 19, 11, 9, 62, 35, 66, 24:
(a) Ordenar de menor a mayor.
(b) Hallar el intervalo de clase.
2. Los siguientes datos representan el nmero de clientes en el Restaurante "El lince" en los dos
primeros meses de 2006
140
130
125
90
60
140
160
125
180
140
125
90
130
75
62
70
80
45
62
72
95
64
80
92
115
80
30
84
40
75
110
115
130
90
70
125
95
64
72
130
70
95
50
115
120
60
180
130
70
60
130
60
30
140
40
80
110
115
120
130
29
Encontrar:
(a) El valor mximo
(b) El valor mnimo
(c) El rango
(d) Los siete mayores
(e) Los siete menores
(f) El treceavo en forma ascendente (de menor a mayor)
(g) Los das en que el nmero de clientes supera los tres dgitos
(h) Los das en que el nmero de clientes solo llego a los dos dgitos
(i) Construir una tabla de registros de datos (Distribucin de Frecuencias)
(j) Construir un Histograma y el polgono de frecuencias
(k) Construir un polgono de frecuencias acumuladas
3. De acuerdo a la Secretara de Turismo de Ecuador los siguientes son los principales hoteles con
mayor nmero de cuartos, en la "Ciudad de Baos". Construir un grfico de pastel con el porcentaje
de cuartos que cobre cada uno de los hoteles de la ciudad de Baos
HOTEL
Samari Spa Resort
Napolitano Apart & Hotel
Miramelindo Spa Hotel
La Floresta Hotel
Hotel Puerta del Sol
Hotel el Belen
# CUARTOS
HOTEL
# CUARTOS
1426
2700
1350
2891
5034
3003
2024
3991
3479
2700
1720
1878
30
Casa Amarilla
4400
12
14
18
20
17
13
17
15
16
11
12
13
16
12
13
13
12
14
17
17
13
11
18
20
15
12
14
20
31
EQUIPO
GANADOS
PERDIDOS
21
19
19
15
14
23
21
17
15
10
18
17
13
13
15
20
21
10
13
18
19
22
17
17
Liga de quito
Nacional
Bacerlona
Emelec
Deportivo Quito
Independiente
Macara
Tcino
Cuenca
Manta
Espoli
Liga de loja
EMPRESA
Titanic
Queen Elizabeth 2
Queen Mary 2
Freedom of the seas
TONELADAS MODELO
White Star
Cunard
Cunard
Royal Caribbean
46,329
70,327
151,400
160,000
1912
1969
2004
2006
8. Los siguientes datos indican el nmero de trabajadores que faltan a una fbrica en 50 das de
trabajo:
13
13
37
10
16
11
12
21
12
11
16
49
18
32
3
11
19
15
10
14
10
24
11
10
32
12
29
12
19
20
15
17
10
CANTIDAD
(millones de dlares)
560.10
143.00
49.90
951.10
33
=1
1 + 2 + 3 + +
Dnde:
) = media aritmtica.
(
xi= suma total de datos que componen la poblacin o muestra.
n = nmero de datos de la poblacin o tamao de la muestra.
Ejemplo1. Calcular la media aritmtica de los nmeros: 9, 4, 6, 13 y 11
Ing. Leonardo Snchez/ Ing. Carlos Burgos
34
1 + 2 + 3 + 4 + 5 + 6
9 + 4 + 6 + 13 + 11
=
5
=
)=8.6
(
Notacin de Suma.
El smbolo =1 representar la suma de todos los xi desde i= 1 a i= n, por definicin:
= 1 + 2 + 3 + +
=1
= 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8
=1
=1
=1
Donde:
= media aritmtica
fi = frecuencia
xi = marca de clase
n = nmero de datos de la poblacin o tamao de la muestra
Frecuencia
Relativa
9
7
3
3
5
2
35
Frecuencia
Relativa
Frecuencia
Acumulada
fa
62 - 65
63.50
10
10
66 - 69
70 - 73
74-77
78 - 81
82 - 85
67.50
71.50
75.50
79.50
83.50
14
14
13
7
2
24
38
51
58
60
= 71.43
. 1 1 + 2 2 + 3 3 + +
=
1 + 2 + 3 + +
Ejemplo 5. Si el examen final de Tpicos de Actualizacin cuenta tres veces ms que una evaluacin
parcial y un estudiante tienen calificacin 85 en el examen final y, 70 y 90 en los dos parciales, la
calificacin media es:
=
1+1+3
5
LA MEDIANA ()
La mediana de un grupo de datos es el valor central o la media de los dos valores centrales que ocupa
un lugar de cuando se les agrupa a todos en ascendente o descendente. La mediana puede presentarse
de dos formas:
36
a) Cuando el total de datos son un nmero impar.- En este caso, la mediana ser el dato que
queda exactamente en el centro, una vez ordenados los datos de menor a mayor.
Ejemplo 6. Hallar la mediana de: 6, 4, 8, 8, 3, 4, 8
Ordenando se tiene: 3, 4, 4, 6, 8, 8, 8
=6
Luego entonces ()
Cuando el total de datos son un nmero par. Aqu debemos aplicar la siguiente frmula:
() +(+1)
2
Dnde:
N=nmero total de datos
Hallar la mediana del conjunto de nmeros:
3, 6, 10, 11, 10, 11, 3, 13, 19, 10, 12, 8,
n = 12 , luego se acomodan de forma que se encuentren ordenados de menor a mayor
3, 3, 6, 8, 10, 10, 10, 11, 11, 12, 13, 19
12 + 12
(2)
( 2 +1)
6 +7
2
10 + 10
2
= 10
)
LA MODA (
La Moda de un conjunto de nmeros es el valor que sucede con mayor frecuencia, es decir, el valor
ms frecuente. La moda puede no existir, o incluso no ser nica en caso de existir; si existe dos veces,
se llama bimodal.
37
Ejemplo 8. Hallar la moda del siguiente grupo de datos:
2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18
Una vez ordenados de menor a mayor, el nmero que ms veces se repite es el 9. La moda es 9.
En el caso de datos agrupados donde se haya construido una curva de frecuencias para ajustar los
datos, la moda ser el valor o valores de x correspondiente al mximo o mximos de la curva.
La moda puede deducirse de una distribucin de frecuencias o de un histograma a partir de la frmula:
= + (
)
+
L1 = Frontera inferior de la clase modal (clase que contiene la moda)
1 = Exceso de frecuencia modal sobre la de la clase inferior inmediata
2 = Exceso de la frecuencia modal sobre la clase superior inmediata
c = Ancho de intervalo de clase modal
CUARTILES DECILES Y PERCENTILES
CUARTILES.-Los cuartiles dividen un conjunto de datos (n) ordenados en cuatro partes iguales,
cada uno de los cuales toman un valor, Q1 para el primer cuartil toma el 25% de la muestra por debajo
de este y el 75% por encima de la muestra, Q2 para el segundo cuartil toma el 50% de la muestra por
debajo este y el 50% por encima de la muestra, el cuartil Q2 es igual a la mediana, Q3 para el segundo
cuartil toma el 75% de la muestra por debajo de la misma y el 25% por encima de la muestra; el
clculo del cuarto cuartil no se lleva a cabo debido a que este toma el valor total de la muestra es decir
el 100%.
.
4
Ing. Leonardo Snchez/ Ing. Carlos Burgos
38
Dnde:
= Es la posicin para el cuartil i=1,2, 3 4
n= es el nmero total de datos
Li=Lmite Inferior
Ls.-Lmite superior
Las posiciones relativas que se tomaran para dicho conjunto cuando n es par sern:
Ejemplo:
De un termmetro se registraron las siguientes temperaturas 240 260 280 300 320 340 sus unidades
estn en Grados celcius
Solucin:
n= 6 par
1ro.- Se calcula la posicin o ubicacin para cada cuartil
1 =
1. (6)
= 1.5
4
2 =
3 =
2. (6)
=3
4
3. (6)
= 4.5
4
39
Para calcular el valor de dicho cuartil cuando n es par o impar se debe utilizar la frmula de la
interpolacin lineal
= +
( )
4
Donde:
Li=Lmite inferior de la clase del cuartil
Ls.- Lmite superior de la clase del cuartil
i-Toma los valores de 1,2,3 o 4 dependiendo de la ubicacin del cuartil que se requiera hallar
1 = 240 + 1
(260 240)
= 245
4
2 = 280 + 2
(300 280)
= 290
4
Como el cuartil 2 es igual a la mediana se puede comprobar dicho valor de cuartil calculando el valor
de la mediana, bajo el concepto de que le media es el valor central o la media de los dos valores
centrales
=
(300 + 280)
= 290
2
3 = 300 + 3
(320 300)
= 315
4
4 = 240 + 4
(340 0)
= 245
4
Cuartiles cuando (n) es impar.-Cuando se tiene un conjunto de datos en la cual su nmero de datos
es impar, la frmula a aplicarse para encontrarse la posicin es:
=
. ( + 1)
4
Dnde:
= Es la posicin para el cuartil i=1,2, 3 4
n= es el nmero total de datos
Ing. Leonardo Snchez/ Ing. Carlos Burgos
40
Las posiciones relativas que se tomaran para dicho conjunto cuando n es impar sern:
Para calcular el valor de dicho cuartil cuando n es par o impar se debe utilizar la frmula de la
interpolacin lineal
= +
( )
4
Ejemplo:
De la muestra anterior de temperaturas 240 260 280 300 320 340 se ha recogido una muestra adicional
ms la cual marco 360, sus unidades estn en Grados Celsius.
1ro calculamos la posicin
=
1. (7 + 1)
=2
4
2 =
2. (7 + 1)
=4
4
3 =
3. (7 + 1)
=6
4
Para obtener el valor de cada cuartil basta con ubicar la posicin y tomar el valor asignado a la
posicin, por ejemplo
Para la posicin P1=2 tenemos el valor de Q1= 260
Para la posicin P2=4 tenemos el valor de Q2= 260
Para la posicin P3=6 tenemos el valor de Q3= 260
CUARTILES PARA DATOS AGRUPADOS
Para calcular los valores de cuartiles en datos agrupados se utiliza la siguiente formula
Ing. Leonardo Snchez/ Ing. Carlos Burgos
41
= + (
)
Donde:
Qi=Valor del cuartil para i=1,2 3
Li=Lmite inferior de la clase que contiene al cuartil
=Indica la posicin de la medida
Fc=Frecuencia de clase que contiene a la medida solicitada
c=anchura de la clase
fai=Frecuencia acumulada anterior que contiene a la medida solicitada.
n=Nmero de datos
DIAGRAMA DE CAJA PARA CUARTILES
Para hacer ms representativo la lectura e interpretacin de los cuartiles se suele utilizar los diagramas
de caja conocidos tambin como boxplots o box and whiskers y describe varias caractersticas
importantes, al mismo tiempo, tales como la dispersin y simetra, consta de dos cajas y dos bigotes,
adems de los siguientes elementos:
42
Donde:
Ls.-Lmite superior
Li.-Lmite inferior
Lmin.-Lmite mnimo
Lmax.-lmite mximo
RIC.-Rango Inter Cuartlico (RECORRIDO INTERCURTILICO)
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre
un rectngulo, alineado horizontal o verticalmente.
Un Diagrama de caja es un grfico, basado en cuartiles, mediante el cual se visualiza un conjunto de
datos. Est compuesto por un rectngulo, la "caja", y dos brazos, los "bigotes".
Ejemplo
Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles Q1, Q2
o mediana y Q3, y sobre la existencia de valores atpicos y la simetra de la distribucin. Primero es
necesario encontrar la mediana para luego encontrar los 2 cuartiles restantes
Ing. Leonardo Snchez/ Ing. Carlos Burgos
43
DECILES (Di)
Los decles dividen un conjunto de datos ordenados n en diez partes iguales. Los decles
generalmente son utilizados para efectos de ingresos de un pas ya que dividen a una poblacin en
diez partes iguales y se analiza cada decl para la toma de decisiones del estado, esta muestra puede
ser el ingreso anual de la canasta bsica, la cantidad de emigrantes por ao, la tasa de natalidad del
pas, o fijar el aprovechamiento acadmico etc.
10
Donde:
n=Nmero total de datos
i=Tomara los valores de 1,2, 3, 4, 5, 6, 7, 8 y 9 correspondiente para cada decl.
2do.-Para determinar el valor de cada decl se emplea la frmula de la interpolacin lineal.
= +
( )
10
Cuando n es impar:
1ro.-Determinamos la posicin de cada decl mediante la frmula
=
. ( + 1)
10
2do.-Si es un nmero entero tomamos el valor directamente indicado por la posicin, en caso de ser
un nmero decimal calculamos el valor de decl mediante la frmula de la interpolacin lineal.
44
= +
( )
10
= + (
)
10
Donde:
Di=Valor del decil 1,2, 3, 4, 5, 6, 7, 8 9
Li=Lmite inferior de la clase que contiene al Decl solicitado.
=Indica la posicin de la medida del Decl.
Fc=Frecuencia de clase que contiene a la medida solicitada.
c=anchura de la clase.
fai=Frecuencia acumulada anterior que contiene a la medida solicitada.
n=Nmero de datos
PERCENTILES Pi
Los percentiles dividen un conjunto de datos ordenados n en 100 partes iguales, es una medida muy
til para describir a una poblacin. Es una medida de posicin no central que nos dice cmo est
posicionado un valor respecto al total de una muestra.
45
Para entender el concepto de percentil tomamos una muestra con muchos valores y la dividimos en
100 partes, cada una de ellas es un percentil. Y cada valor de la muestra estar en alguna de esas
cajitas percentiles. El percentil est referenciado de 0 a 100. El Percentil 0 es el menor valor de la
muestra y el Percentil 100 el mayor valor. Tcnicamente P K es el percentil i-simo, donde la i toma
valores del 1 al 100. El i% de los valores de muestra son menores que ese Pi y el (100-i)% restante
son mayores.
Los percentiles sirven para relacionar un valor concreto de la variable (el peso de un nio, un salario,
una calificacin, el tamao de una empresa) con los restantes valores de esa variable en la misma
poblacin. Se calculan en general se estiman- con las frecuencias obtenidas de una muestra
suficientemente grande, representativa de la poblacin de inters.
El percentil 50 es la mediana (la mitad de la poblacin est por encima de la mediana, y la otra mitad
no). Los percentiles 25 y 75 son los cuartiles 1 y 3, que junto con la mediana dividen a la poblacin
en cuatro partes con igual nmero o igual proporcin de elementos.
46
c) Para una distribucin asimtrica negativa, la media es el menor valor de los tres y la mediana es
inferior a la moda, pero mayor que la media
d) El coeficiente de asimetra de Pearson, es una medida conocida de asimetra que utiliza la
diferencia observada entre la media y la mediana de un grupo de valores.
Los cuartiles, decles y percentiles se parecen mucho a la media porque tambin subdividen una
distribucin de mediciones de acuerdo con la proporcin de frecuencias observadas. Mientras que la
mediana divide a la distribucin en dos mitades, los cuartiles la dividen en cuatro cuartos, los decles
en diez dcimos y los puntos percentiles la dividen en cien partes. Matemticamente, a manera de
ejemplo, se pueden expresar:
47
Donde:
x =media aritmtica de los nmeros
| xi x |=valor absoluto de la desviacin de xi respecto de x
xmin =2
R = xmax xmin = 12 2 = 10
Ing. Leonardo Snchez/ Ing. Carlos Burgos
48
Ejemplo11. Hallar la desviacin media del siguiente conjunto de nmeros. 2, 3, 6, 8, 11
2 + 3 + 6 + 8 + 11
=6
5
|2 6| + |3 6| + |6 6| + |8 6| + |11 6|
=
= 2.8
5
=
VARIANZA ( 2 S 2)
La varianza es similar a la desviacin media porque se basa en la diferencia entre cada uno de los
valores del conjunto de datos y la media del grupo. La diferencia consiste en que antes de sumarlas,
se eleva al cuadrado cada una de las diferencias. Matemticamente se expresa:
2= Varianza Poblacional
S2= Varianza Muestral
x = media aritmtica.
i x = suma total de datos que componen la poblacin
n = nmero de datos de la poblacin o tamao de la muestra
Ejemplo 12. En el mes de mayo, 8 vendedores de artculos electrnicos, vendieron los siguientes
nmeros de aparatos: 8, 11, 5, 14, 8, 11, 16, 11, las cuales se realizaron en INTELCOMP en
Ambato. Encontrar la varianza.
=
8 + 11 + 5 + 14 + 8 + 11 + 16 + 11
= 10.5
8
49
DESVIACIN ESTANDAR ( S )
En Estadstica frecuentemente se aplica ms la raz cuadrada de la varianza a la cual se le llama
Desviacin Estndar, representndose por para la poblacin y S para una muestra. Las formulas
son:
Dnde:
50
( + 1) = . + = . +
( + 1)2 = . (2 + 2 + 1) = 2 + 2 . + = . 2 + 2 . +
EJERCICIOS DE APLICACIN
1.-Anotar el trmino de la suma indicada
7
2
=1
( + 6)
=1
(X1 + 5)4 + (X2 + 5)4 + (X3 + 5)4 + (X4 + 5)4 + (X5 + 5)4
(b)
de
cuarto
semestre de Psicologa de la UTI de Ensenada: 65, 66, 67, 68, 71,73,74,77, 77, 77.Hallar la media,
mediana, y moda (M).
7. En la siguiente tabla se muestra las edades de las motociclistas que han cometido faltas al
reglamento de trnsito del estado de Ecuador en el 2013:
51
17,38, 27, 14, 18, 34, 16, 42,28, 24, 40, 20,23, 31,37, 21, 30, 25, 17, 28, 33, 25,23,19, 51,18,29
(a) construir una tabla de registro de datos
(b) construir un histograma y polgono de frecuencia
(c) calcular la media, mediana, y moda.
(d) Calcular la varianza y la desviacin tpica
8. En la tabla se muestran 30 resultados del examen SES para estudiantes de bachillerato, los cuales
mostraron:
500, 510, 514, 514, 516, 519, 521, 522, 522, 527
528, 535, 540, 542, 545, 553, 555, 558, 561, 571
572, 574, 577, 578, 580, 583,
36.3
36.4
36.6
36.7
36.8
36.9
37.0
37.0
37
.1
37.3
36.0
36.3
36.4
36.6
36.7
36.8
36.9
37.0
37.0
37
37.3
36.1
36.3
36.4
36.7
36.7
36.9
36.9
37.0
37.0
37
37.4
36.1
36.3
36.5
36.7
36.7
36.9
36.9
37.0
37.0
37
37.4
52
36.1
36.3
36.6
36.7
36.7
36.9
36.9
37.0
37.0
37.1
37.5
36.2
36.4
36.6
36.7
36.8
36.9
36.9
37.0
37.0
37.1
37.5
36.2
36.4
36.6
36.7
36.8
36.9
36.9
37.0
37.0
37.2
36.2
36.4
36.6
36.7
36.8
36.9
36.9
37.0
37.0
37.2
36.2
36.4
36.6
36.7
36.8
36.9
37.0
37.0
37.0
37.2
36.3
36.4
36.6
36.7
36.8
36.9
37.0
37.0
37.1
37.2
Hallar:
(a) la media aritmtica
(b) la varianza (2)
53
(c) la desviacin estndar()
13. para el conjunto de nmeros 8, 10, 9, 12, 4, 8, 2. Hallar la desviacin media respecto de:
(a) La media aritmtica (X)
(b) La mediana (X)
(c) Verificar que la desviacin media de la mediana no es mayor que la media
14.
El nmero de automviles que vendi cada uno de los 10 ejecutivos de cuenta de "auto
productos del pacifico" en el mes de diciembre es: 2, 4, 7, 10, 10, 10, 12, 12, 14, y 15; determinar:
(a)
(b)
El primer cuartil
(c)
El segundo decil
54
= 1 +2 ++ =
=1
(ec 1)
Dnde:
n= Nmero total de datos.
A la ecuacin anterior se la conoce como el r-simo momento.
El primero momento, con r=1, es la media aritmtica .
El r-simo momento respecto de la media se define como:
=
=1( )
()
(ec 2)
55
Dnde:
n= Nmero total de datos
-Para la ecuacin anterior, cuando r=1 para el clculo del primer momento obtendremos que 1 = 0
, esto se refiere a que las desviaciones de un conjunto de nmeros respecto de su media aritmtica es
cero (esta es la primera regla de las propiedades de la media aritmtica).
-Para la misma ecuacin cuando r=2, para el clculo del segundo momento, se obtendr que 2 = 2
, el cual es la varianza.
-Para el clculo del r-simo momento respecto de cualquier origen A, se define como:
=
=1( )
()
(ec 3)
Dnde:
d=X-A.- son las desviaciones de X respecto de A. si A=0, la ecuacin anterior se reduce a la (ec 1),
es por esta razn que a la ecuacin (ec 1) se suele llamar el r-simo momento respecto de cero
MOMENTOS PARA DATOS AGRUPADOS
Para una distribucin de datos X1,X2,Xn que ocurren con una frecuencia f1,f2,fn, respectivamente,
las frmula para este tipo de caso se define como:
= 1 1 +2 2 ++ =
1 +2 ++
=1
=1
=1 ( )
( )
=1 ( )
( )
56
Dnde:
= =
=1
SESGO:
Al grado de asimetra que presenta una distribucin de datos se la conoce como Sesgo. Si la curva
de un polgono de frecuencias suavizado presenta una cola ms larga a la izquierda, se dice que es
sesgada a la izquierda o sesgo negativo, si esta sesgada a la derecha se dice sesgada a la derecha o de
sesgo positivo tal y como se muestra en las siguientes figuras.
57
Para distribuciones sesgadas, la media suele situarse del mismo lado de la moda
CURTOSIS
El clculo de Curtosis nos permite saber que tan puntiaguda es una distribucin de datos. Una
distribucin Leptocrtica presenta un pico muy alto, si presenta una punta un poco ms suavizada se
dice que es mesocrtica y si la curva presenta una distribucin normal ms achatada se dice que es
Platicrtica
Para considerar si una curva es Leptocrtica, mesocrtica y Platicrtica se debe saber que:
Si Curtosis = 3.- Esta curva es normal o mesocrtica
Si Curtosis > 3. La curva es apuntada o Leptocrtica
Si Curtosis < 3.- La distribucin es achatada o Platicrtica.
Una de las maneras para el clculo de Curtosis es utilizando el cuarto momento respecto de la media
() = 4 =
4 4
=
4 22
EJERCICIOS
1.-Hallar los cuatro primeros momentos del siguiente conjunto de nmeros: 1, 4, 7, 10,15
Solucin:
a) El primer momento, o media aritmtica es:
58
1
1
1
1
1
1 = = 1 + 4 + 7 + 10 + 15 = 7.4
5
b) El segundo momento es:
2 =
12 + 42 + 72 + 102 + 152
=
= 78.2
3 =
13 + 43 + 73 + 103 + 153
=
= 956.6
4 =
14 + 44 + 74 + 104 + 154
=
= 12656.6
2.-hallar los cuatro primeros momentos respecto de la media para el conjunto de nmeros del
problema anterior: 1, 4, 7, 10,15.
Solucin
a) El primer momento respecto de la media es:
1 =
5
5
5
5
5
5
5
5
59
CAPTULO 6: PROBABILIDADES
de
todas
las
ramas
de
las
matemticas
Amir Aczel
El estudio de las probabilidades abarca casi todas los sucesos de nuestras vidas, tales como la Ciencia,
la Filosofa, las matemticas, los juegos de azar, etc., ya que nos permite estudiar los sucesos o eventos
que de cada una de ellas se deriven.
Mediante el uso de las probabilidades se puede obtener la frecuencia con la que un acontecimiento u
evento puede darse como resultado de haber realizado un experimento o prueba del que se conocern
todos los resultados posibles, bajo condiciones suficientemente estables.
Evento (E).- Hecho o suceso que ocurre, especialmente si es de cierta importancia
Posibilidad (n).- Circunstancia u ocasin de que una cosa ocurra o suceda.
PROBABILIDAD DE OCURRENCIA (p).
Supongamos que un suceso (E) tiene (h) posibilidades de salir de un total de (n) posibilidades.
= {}
=
Dnde:
h.- Son todas las formas en las que se pueda o se requiera obtener un resultado.
n.- Total de formas en las que se da el resultado.
Si la probabilidad de que un evento ocurra es decir un xito ser igual a 1
Si la probabilidad de que un evento no ocurra es decir sea un fracaso ser igual a 0
Ing. Leonardo Snchez/ Ing. Carlos Burgos
60
PROBABILIDAD DE NO OCURRENCIA (q)
La probabilidad de que un evento no ocurra { } y definido por (q) viene determinado por:
=1
Esto quiere decir que:
1 = Pr{} + { }
Ejemplo. Ahora supongamos un ejemplo clsico, que al lazar un dado una sola vez nos salga 2.
Solucin:
Datos
h=1 (Forma de salir nmero de veces que saldr el 2)
n=6 (Todas las opciones posibles de un dado)
=
1
= 0.167
6
Anlisis.
La probabilidad de que al lanzar un dado nos salga 2 en un solo lanzamiento es de 0.167 es decir un
16.7%. Esto es muy importante ya que no importa las veces que lancemos un dado, la probabilidad
de que nos salga el 2 en un lanzamiento siempre ser de 16.7%.
La paradoja del cumpleaos
Para explicar la paradoja formulamos la pregunta Cmo explicar la probabilidad de que en un grupo
de 23 personas dos de ellas cumpla aos el mismo da? Coincide tu intuicin con lo que dicen las
matemticas?
El enunciado de la paradoja cita lo siguiente:
La paradoja del cumpleaos establece que si hay 23 personas reunidas hay una probabilidad del
50,7% de que al menos dos personas de ellas cumplan aos el mismo da. Para 60 o ms personas la
61
probabilidad es mayor del 99%. Obviamente es casi del 100% para 366 personas (teniendo en cuenta
los aos bisiestos).
En sentido estricto esto no es una paradoja ya que no es una contradiccin lgica; es una paradoja en
el sentido que es una verdad matemtica que contradice la comn intuicin. Cuando se propone este
problema por primera vez y se pide una estimacin sobre el tamao mnimo que debera tener un
grupo para que sea ms probable que improbable que dos personas compartan el da del cumpleaos,
la mayora de las personas se equivoca por completo.
La respuesta intuitiva que se da a menudo es 183, es decir 365 dividido entre dos. La cantidad correcta
no es algo a lo que la gente pueda llegar fcilmente y, ciertamente, no por intuicin. Es bastante
extrao que las primeras estimaciones sean inferiores a 40. Y sin embargo la respuesta es 23.
La clave para entender estas "sorprendentes" recurrencias es pensar que hay muchas posibilidades de
encontrar parejas que cumplan aos el mismo da.
Un anlisis superficial asume que 23 das (cumpleaos de las 23 personas) es una fraccin demasiado
pequea del posible nmero de das distintos (365) para esperar repeticiones. Y as sera si
esperramos la repeticin de un da dado. Pero las repeticiones, en el caso supuesto, pueden darse
entre dos das cualesquiera, con lo que stas pueden combinarse entre s de un nmero de formas que
aumenta rpidamente con el nmero de elementos a considerar. As:
Entre dos personas P1 y P2 slo cabe una posibilidad de repeticin de cumpleaos: Pl=P2.
Con tres ya hay tres posibilidades (Pl=P2; Pl=P3; P2=P3)
Con cuatro ya habra seis, (4x3)/2=6 .
Con un grupo de 10 personas, (10x9)/2=45 posibilidades
Con 23 personas, hay (2322)/2 = 253 parejas distintas, cada uno de ellas es una candidata
potencial para cumplir la paradoja
Y as sucesivamente, en uno de 40, ya son 780 las parejas, y 1770 si juntamos 60 personas.
No hay que malinterpretar lo que nos dice esta paradoja: Si entramos en una habitacin con 22
personas, la probabilidad de que cualquiera cumpla aos el mismo da que usted, no es del 50%, es
mucho ms baja, slo hay un 6% de probabilidades. Esto es debido a que ahora slo hay 22 parejas
Ing. Leonardo Snchez/ Ing. Carlos Burgos
62
posible y se necesitan 253 personas para que haya ms de un 50% de probabilidades de que esto
ocurra.
El problema real de la paradoja del cumpleaos consiste en preguntar si el cumpleaos de cualquiera
de las 23 personas coincide con el cumpleaos de alguna de las otras personas.
Ejemplo.
Determinar la probabilidad de que en 10 lanzamientos de una moneda 7 de ellas salga caras, por tanto:
=
7
= 0.7
10
(7 + 6)
= 0.625
(10 + 10)
Para obtener una cifra significativa dentro de la cual se pueda tomar una decisin basta con realizar
ms lanzamientos.
PROBABILIDAD CONDICIONAL
Se conoce como probabilidad condicional aquel en la que dos eventos E1 y E2 y que el evento E2
ocurra dado que ya haya sucedido el evento E1 y se denota por: {2|1} Pr {2 1}
Sucesos Independientes
Son sucesos independientes cuando dos eventos E2 y E1 ocurren de manera independiente es decir
el evento E1 ocurra sin que afecte la probabilidad que suceda el evento E2. Ejm El lanzamiento de
una moneda tres veces es un evento independiente, ya que el resultado de un lanzamiento no afecta
el otro.
{1 2} = {1}. {Pr 2}
Para tres sucesos E1, E2 y E3 se tiene:
63
{1 2 3} = {1}. {2}. {3}.
Para los tres eventos citados la probabilidad de ocurrencia es la misma
Ejemplo
Al lanzar una moneda en su 7mo lanzamiento sale cara y en el 8vo lanzamiento sale cara, entonces
el evento E1 Cara en el 7mo lanzamiento y el evento E2 Cara en el 8vo lanzamiento, son sucesos
independientes ya que cada lanzamiento no depende que salga cara en el siguiente lanzamiento.
Sucesos Dependientes
Son sucesos dependientes cuando en dos eventos E1 y E2 ocurren de manera tal que el evento E1
afecta la probabilidad que suceda el evento E2.
{1 2 3} = {1}. Pr{2|1} . Pr{3|1. 2}.
Suceso compuesto
Se conoce como suceso compuestos cuando dos eventos E1 y E2 tienen la misma probabilidad de
ocurrencia.
{1 2} = {1} Pr{2|1}
64
DISTRIBUCIONES DE PROBABILIDAD
Variables discretas
Una variable discreta es una variable cuantitativa que toma valores aislados, es decir no admite
valores intermedios entre dos valores especficos.
Si una variable X toma un conjunto discreto de valores X1, X2, . . . , XK con probabilidades respectivas
p1, p2, . . . , pK, donde p1 + p2 +. . .+ pK = 1, esto se define como una distribucin de probabilidad
discreta de X. La funcin p(X ), que tiene los valores p1, p2, . . . , pK para X = X1, X2, . . . , XK ,
respectivamente, se llama funcin de probabilidad o funcin de frecuencia de X. Como X puede tomar
ciertos valores con determinadas probabilidades, suele llamrsele variable aleatoria discreta. A las
variables aleatorias tambin se les conoce como variables estocsticas.
Ejm
Si al lanzar un par de dados nos de la suma 8, la probabilidad es de 5/36 y se marca en la siguiente
tabla. As que de 500 veces se lancen los dados se espera que en 100 la suma en sea 8
Suma de los
dados
Probabilidad
(p)
10
11
12
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
La manera adecuada de agrupar o parear los dados se presenta a continuacin y se aprecia las 3
maneras posibles de combinar.
65
66
juego es 2 (1/2) = 1. Entonces, consecuentemente con la teora de juegos, podra pagar el dolar para
jugar o para rechazar jugar, porque de cualquier manera su expectativa total sera 0.
Si la esperanza matemtica es menor que 1, el juego es desfavorable para el jugador. Un sorteo
que pague 500 a 1 pero en el que la probabilidad de acertar sea de 1 entre 1.000, la esperanza
matemtica es 500 (1/1.000) = 0,5.
Si la esperanza matemtica es mayor que 1, el juego es favorable para el jugador, todo una
Fortuna para el jugador. Un ejemplo sera un juego en el que se paga 10 a 1 por acertar el nmero
que va a salir en un dado, en donde hay una probabilidad de acertar es de 1 entre 6. En este ejemplo
el valor de la esperanza matemtica es 10 (1/6)=1,67 y por tanto en esas condiciones es juego
beneficioso para el jugador.
ANALISIS COMBINATORIO
El origen del anlisis combinatorio se le atribuye a los trabajos de Pascal (1596 1650) y Fermat
(1601 - 1665) que fundamentan el clculo de probabilidades.
Leibiniz (1646 1716) public en 1666 Disertatio de Arte Combinatoria. El mayor impulsor de
esta rama fue Bernoulli quien en sus trabajos incluye una teora general de permutaciones y
combinaciones.
El anlisis combinatorio estudia las distintas formas de agrupar y ordenar los elementos de un
conjunto, sin tener en cuenta la naturaleza de estos elementos.
Los problemas de arreglos y combinaciones pueden parecer aburridos y quiz se piense que no tienen
utilidad pero los teoremas del anlisis combinatorio son la base del clculo de la probabilidad.
La probabilidad se encarga de los arreglos y las combinaciones que determinan el nmero de formas
diferentes en que un acontecimiento puede suceder.
El anlisis combinatorio tiene aplicaciones en el diseo y funcionamiento de la tecnologa
computacional as como tambin en las ciencias. La teora combinatoria se aplica en las reas en
donde tengan relevancia las distintas formas de agrupar elementos.
Principio
67
Dado que un evento puede ocurrir en su primera salida n1, y dado que el primer evento a ocurrido,
luego se produce un siguiente evento n2, entonces el nmero de combinaciones que se pueda dar ser
n1*n2
Ejemplo:
Una persona tiene 2 formas de ir de una ciudad A una ciudad B; y una vez llegada a la ciudad B, tiene
3 formas de llegar a una ciudad C, De cuantas maneras podr realizar el viaje de A a C Pasando por
B?
Solucin
De manera general si aplicamos la formula
Combinacin= n1*n2
Combinacin= 2(3)
Combinacin= 6
Factorial de un nmero
El Factorial de un nmero est definido por:
! = ( 1)( 2) 1
Ejemplo
Hallar el factorial de 6!
! = ( 1)( 2) 1
6! = 6(6 1)(6 2)(6 3)(6 4)(6 5)
6! = 6(5)(4)(3)(2)(1)
6! = 720
Ing. Leonardo Snchez/ Ing. Carlos Burgos
68
Permutaciones:
Una permutacin de objetos es un arreglo de stos en el que orden s importa. Para encontrar el
nmero de permutaciones de n objetos diferentes en grupos de r, se usan las siguientes frmulas:
Cuando se permite Repeticin
=
Ejemplo
1.- Cuntas cantidades de cuatro cifras se pueden formar con los dgitos 0, 1, 2, 3 y 4 si se permite
la repeticin?
Solucin:
=
4
5P4=5
5P4=625
!
( )!
Ejemplos:
1.- Cuntas cantidades de tres cifras se pueden formar con los dgitos 0, 1, 2, 3 y 4 si no se permite
la repeticin?
Solucin
5P3=
!
()!
5P3=
5!
(53)!
5P3=
5!
2!
69
Combinacin.- Una combinacin de objetos es un arreglo en el cual el orden no importa. Para
encontrar el nmero de combinaciones de n objetos en grupos de r, se usa la siguiente frmula:
!
( )=nCr !()!
Ejemplo
De entre 8 personas debemos formar un comit de cinco miembros. Cuntas diferentes posibilidades
existen para formar el comit? Solucin: Esta es una combinacin porque el orden no importa.
Solucin
8C5
8!
5!(85)!
8C5
8!
5!(3)!
8C5 =56
Ejercicios de resolucin
1) Cuntas cantidades de cuatro cifras se pueden formar con los dgitos 4, 5, 6, 7, 8 y 9 si no se
permite la repeticin?
resp[360]
2) Cuntas cantidades de tres cifras se pueden formar con los dgitos 3, 4, 5 y 6 si se permite la
repeticin?
resp[64]
3) Un entrenador de baloncesto dispone de 12 jugadores. Cuntos diferentes equipos de cinco
jugadores puede formar?
resp[792]
4) De una clase de 20 nias se escogern 6 para ir a un paseo. Cuntos posibles grupos de 6 se
pueden formar?
Resp [38760]
70
APROXIMACIN DE STIRLING
Al evaluar las funciones de distribucin en estadsticas, a menudo es necesario evaluar considerables
factoriales de nmeros, como en la distribucin binomial:
() =
! (1 )
! ( )!
Una relacin aproximada til y de uso comn en la evaluacin de factoriales de grandes nmeros es
la aproximacin de Stirling
! 2
Donde:
e=Es la base natural de logaritmos, con un valor 2.71828
71
() = ( ) =
! ( )!
Donde:
X=0,1,2,N; N posibilidades de ocurrir
N!=N(N-1)(N-2)1; y 0!=1
q=1-p
CARACTERISTICAS DE LA DISTRIBUCIN BINOMIAL
Si al analizar un determinado experimento donde su variable sea aleatoria X y esta se repita n nmero
de veces de forma independiente, y que en ese experimento haya un suceso que denominamos xito,
que ocurre con una probabilidad p. Viene definido por:
72
Ejercicio
En un grupo de amigos se decide jugar a los volados, el jugador A necesita obtener la probabilidad
de que al lanzar una moneda no trucada 6 veces le d exactamente dos caras para ganar al jugador
B
Solucin
Datos
N=6: Posibilidades de ocurrir
X=2: Posibilidades que ofrece la moneda
p= : probabilidad de que ocurra el evento
q= : probabilidad de que no curra el evento
!
() = ( ) =
! ( )!
6!
1 2 1 62
() = (
)( ) ( )
2! (6 2)! 2
2
() = (
720 1 2 1 4
)( ) ( )
48 2
2
720
() = (
)
1536
15
() = ( )
48
() = 0.234
73
DISTRIBUCIN NORMAL
La distribucin normal, tambin conocida como a distribucin de gauss o gaussiana y es considerada
una distribucin de probabilidad individual.
Ejercicios resueltos
La compaa COLD fabricante de frigorficos, obtuvo, mediante mediciones valores promedios de
temperatura de -3.5C, con una desviacin Tpica o estndar de 1.12C con nivel de confiabiida del
95%
a) Adems desea saber cul es la probabilidad de que uno de sus frigorficos se fabrique con
una temperatura menor a 4.5C.
b) El dueo de la compaa necesita saber cul es la probabilidad de que uno de sus frigorficos
de una temperatura superior a 2.5C.
Solucin
Datos
=-4
=1.12
Pr(a<x<b)
mediante
Pr(X< 4.5)
X=-3.5
=
4.5 3.5
1.12
= 0.89
Pr=(1-0.5)-Pr(LA calculada por tablas Apndice)
Pr=0.5-0.3238
Pr=0.1762
Pr=17.62%
b) El dueo de la compaa necesita saber cul es la probabilidad de que uno de sus
frigorficos de una temperatura superior a -2.5C.
Ing. Leonardo Snchez/ Ing. Carlos Burgos
74
Pr(X> 2.5)
X=-3.5
=
3.5 2.5
1.12
= 0.89
Pr=(1-0.5)-Pr(LA calculada por tablas Apndice)
Pr=0.5-0.3212
Pr=0.1788
Pr=17.88%
DISTRIBUCIN DE POISSON
La distribucin de Poisson nos ayuda a obtener la probabilidad de ocurrencia de ciertos eventos que
ocurren con muy poca frecuencia es decir impredecibles y de forma aleatoria, en otras palabras
pertenece al grupo de las funciones de distribucin de variables aleatorias discretas , por tanto no se
conoce el total de resultados posibles. Esta distribucin es utilizada para terminar la probabilidad de
volumen, rea, distancia o tiempo establecido y viene definido por:
(; ) =
()
!
Donde:
Pr(X=y).-Probabilidad de ocurrencia cuando la variable discreta X toma un valor finito (y).
=Parametro de ocurrencias de un intervalo (>0, y=1, 2,3,)
e=Logaritmo natural o neperiano y es igual a 2.71828
y=Nmero de sucesos ocurridos.
Ejemplo
En una heladera se atienden cada 20 min a 6 personas. El dueo del local necesita saber cul es la
probabilidad de que:
a) En un da no soleado se atiendan 5 personas en 20min
Ing. Leonardo Snchez/ Ing. Carlos Burgos
75
b) En un da soleado se atiendan 10 personas en 20min
c) Y que en un feriado con da soleado se atiendan 5 personas o menos, en menos de 20min
Solucin
Parte a)
(; ) =
()
!
Datos
Pr(x=5)=(5,6)
(5,6) =
2.7186 (6)5
5!
(5,6) = 0.16
(5,6) = 16%
Parte b)
(; ) =
()
!
Datos
Pr(x=10)=(10,6)
(5,6) =
2.7186 (6)10
10!
(5,6) = 0.0413
(5,6) = 4.13%
Parte c)
(; ) =
()
!
76
Datos
Pr(x5)=Pr(x=0)+ Pr(x=1)+ Pr(x=2)+ Pr(x=3)+ Pr(x=4)+ Pr(x=5)
( 5) =
2.7186 (6)0 2.7186 (6)1 2.7186 (6)2 2.7186 (6)3 2.7186 (6)4
+
+
+
+
0!
1!
2!
3!
4!
+
2.7186 (6)5
5!
( 5) = 0.448
(5,6) = 44.83%
Interpretacin:
a) Indica que existe una probabilidad de que en un da no soleado se atiendan a 5 personas en
20 min
b) Sin embargo en este literal existe la probabilidad de que el 4.13% se atiendan a 10 personas
en 20min
c) Para este literal existe el 44.8% de probabilidad de que se atienda 5 personas o menos en 20
min.
Ejemplo
Lo alumnos en la cafetera de una universidad consumen en un determinado da como media 5 tazas
de caf, la misma tiene una distribucin de Poisson, Hallar la probabilidad de que cuando mucho
lleguen a consumirse 7 tazas de caf por da.
Datos:
=5
Pr (x7)
Solucin
(; ) =
()
!
77
( 7) =
2.7185 (5)0 2.7185 (5)1 2.7185 (5)2 2.7185 (5)3 2.7185 (5)4
+
+
+
+
0!
1!
2!
3!
4!
+
78
CAPITULO 8: MUESTREO
Introduccin
Dentro de la estadstica existe la teora del muestreo, esta nos permite tomar de un
conjunto de datos una muestra que nos servir como objeto de estudio.
El muestreo nos ayuda a tomar de un conjunto universal de datos una muestra
especfica que nos servir como objeto de estudio.
Cuando se toma las caractersticas de una poblacin, es importante saber que
1.-La muestra debe ser seleccionada de acuerdo a su naturaleza.
2.-Resulta imposible verificar todos los elementos fsicos de una poblacin.
3.-El costo por estudiar toda l poblacin seria elevado y no es recomendable.
3.-Los resultados de la muestra son adecuados.
4.-Si se deseara estudiar todo el universo de la muestra, esto conllevara a tomar
ms tiempo de lo normal para el estudio
Muestra aleatoria simple.- Este tipo de muestra toma a cada elemento o individuo
de una poblacin y asigna las mismas posibilidades de que le incluya en la
seleccin.
Un ejemplo de muestra aleatoria simple es que si de un grupo de 145 botellas para
envasar agua, se debe elegir una muestra de 60 botellas. Para asegurarnos de que
todas las botellas tengan las mismas posibilidades de ser tomadas, estas deben ser
tomadas al azar mientras pasan el control de calidad hasta recoger la muestra de
60 botellas.
Muestra aleatoria sistemtica.-Para tomar una muestra sistemtica lo que se debe
hacer es primero tomar un punto de inicio aleatorio y luego cada k-simo objeto
de la muestra.
Muestra aleatoria estratificada.-Para realizar este tipo de pruebas se debe tener en
cuenta que esta se debe aplicar cuando una poblacin est dividida en grupos a
partir de ciertas condiciones propias de la muestra. Para esto se debe dividir una
poblacin en subgrupos conocido estos como estratos, como de los cuales se
seleccionar uno por cada estrato.
Muestra aleatoria por conglomerados.-Este tipo de muestreo cosiste dividir una
poblacin en conglomerados a partir de los lmites geogrficos o naturales o de
Ing. Leonardo Snchez/ Ing. Carlos Burgos
79
cualquier otro tipo de poblacin, y de este grupo de conglomerados se selecciona
al azar una muestra aleatoria .El muestreo por conglomerados es utilizado a
menudo para reducir costos de mostrar una poblacin dispersa en cierta rea.
EJERCICIOS DE DEMOSTRACIN CAPITULO 8
80
MUESTREO CON REPOSSIION Y SIN REPOSICIN
Muestreo con reposicin.-Se conoce as cuando de un grupo de muestras se toma
una al azar y luego es devuelta al mismo grupo. Por tanto se llama muestreo con
reposicin si cada objeto de una poblacin tiene la misma probabilidad de ser
elegido ms de una vez
Ejemplo:
En una bolsa donde existen 10 canicas, 4 de color azul, 3 de color rojo y 3 de color
amarillo, se desea tomar una muestra y devolverla a la bolsa.
Muestreo Sin reposicin.-Se le conoce al proceso de recoleccin en el cual se toma
una muestra y no se devuelve l grupo de muestras del cual fue tomado. Por tanto
se conoce como muestreo sin reposicin cuando el objeto extrado de una
poblacin ya no tiene ninguna probabilidad de que vuelva a salir.
Ejemplo:
Para el mismo caso de la bolsa donde existen 10 canicas, 4 de color azul, 3 de color
rojo y 3 de color amarillo, se desea tomar una muestra y sin devolverla a la bolsa.
DISTRIBUCIONES MUESTRALES
Se conoce como distribucin muestral a la seleccin de muestras de un tamao
desconocido N y que puedan ser estas con y sin reposicin se pueda hallar su
estadstico, tales como media o desviacin estndar.
Una distribucin muestral puede tomar diferentes formas segn las caractersticas
de la poblacin estudiada y es la que nos permite hacer inferencia adems posee
un patrn de compartimento predecible.
Ejemplo.
La ciudad de Ambato se ve en la necesidad de saber cul es la proporcin de
mujeres en funcin de la poblacin para poder determinar mediante un estudio
seguido la tasa de embarazos en mujeres menores de 18 aos.
Debido a que la poblacin de la ciudad es muy grande no se realizara un censo
ya que esto resultara costoso. Por tanto se decide estimar a partir de la muestra Pm
(Proporcin muestral).
=
#
()
Ing. Leonardo Snchez/ Ing. Carlos Burgos
81
DISTRIBUCIN MUESTRAL DE LA MEDIA
Una distribucin muestral poblacional considerando que no hay reposicin viene
definido por:
=
=
ERROR DE MUESTREO
Dentro de la seleccin de datos o informacin recolectada por muestras
muestreo es de vital importancia saber que es poco probable que la desviacin
estndar de la muestra sea exactamente igual a la desviacin estndar de la
poblacin.
CARACTERISTICAS DEL ERROR ESTANDAR EN DISTRIBUCIONES MUESTRALES
ERROR ESTANDAR DE LA MEDIA
Para distribuciones donde las muestras son grandes o pequeas su ecuacin est
definida por:
=
82
Donde:
N30=Cuando la distribucin muestral se asemeja a una distribucin normal.
=Desviacin estndar
=Distribucin muestral de las medias estndar muestral
N=Poblacin