Você está na página 1de 94

APUNTES DE

ESTADISTICA Y PROBABILIDAD

Julia Munoz

UNIVERSIDAD AUTONOMA DE LA CIUDAD DE MEXICO


Indice general

1. Estadstica Descriptiva 1
1.1. Representacon de datos agrupados y no agrupados . . . . . . . . . . . . . . . . 1
1.1.1. Agrupamiento de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2. Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.3. Diagrama de tallo y hoja . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1. Datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2. Datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3. Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1. Datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2. Varianza y desviacion estandar . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.3. Datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Probabilidad 15
2.1. Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2. Elementos de calculo combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.1. Principio de multiplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2.2. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1. Operaciones con eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4. Funcion de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.6. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3. Variables Aleatorias 35
3.1. Definicion y propiedades de las variables aleatorias discretas . . . . . . . . . . . 35
3.2. Distribucion de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3. Esperanza, varianza y desviacion estandar . . . . . . . . . . . . . . . . . . . . . 40
3.4. Distribuciones discretas especiales . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.1. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.2. Distribucion Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.3. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.4. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.4.5. Distribucion Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

iii
INDICE GENERAL

3.5. Otras distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52


3.5.1. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . 52

4. Variable aleatoria continua 57


4.1. Variables aleatorias continuas y sus propiedades . . . . . . . . . . . . . . . . . . 57
4.2. Distribuciones continuas especiales . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.1. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.2. Distribucion Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2.3. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2.4. Otras distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5. Estimaciones 71
5.1. Teorema del Lmite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2. Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2.1. Intervalos de confianza para con conocida . . . . . . . . . . . . . . . 75
5.2.2. Intervalo de confianza para con desconocida . . . . . . . . . . . . . . 77
5.3. Intervalos de confianza para 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6. Pruebas de hipotesis 81
6.1. Pruebas de hipotesis para . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.1.1. Prueba de hipotesis para de dos colas . . . . . . . . . . . . . . . . . . . 82
6.1.2. Prueba de hipotesis para cola derecha . . . . . . . . . . . . . . . . . . 83
6.1.3. Prueba de hipotesis para de cola izquierda . . . . . . . . . . . . . . . . 83
6.2. Pruebas de hipotesis para y 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Indice de Materias 88

iv
1
Estadstica Descriptiva

1.1. Representacon de datos agrupados y no agrupados


Los datos estadsticos se obtienen de observaciones numericas de conjuntos que se caracterizan
por la variacion que muestrean sus componentes.
La estadstica descriptiva permite resumir y representar los datos mas destacados de los
elementos que componen un conjunto de observaciones.
La estadstica inferencial tiene por objeto describir las caractersticas de un conjunto, pero
sin que se registren los datos correspondientes a todos los elementos del conjunto, sino solo de
una parte de los elementos, por esta razon esta inferencia tiene probabilidad de error.
Los datos con los que se trabajan pueden ser nominativos como, partido poltico, sexo, co-
lor favorito, carrera etcetera. Tambien pueden ser numericos como son edad, estatura, watts,
longitud etcetera.
En este curso trabajaremos con datos numericos. Estos datos tienen un orden sabemos que
5 > 3 y que 30 < 100. Tambien trabajaremos con los datos nominativos que tambien tienen la
caracterstica de orden, esto es, por ejemplo caliad alta, media, baja, sabemos que alta > baja
y que media < alta.

1.1.1. Agrupamiento de datos


En el analisis estadstico de los datos es necesario realizar un proceso de condensacion de los
mismos antes de obtener las medidas estadsticas que resuman aun mas la informacion.
La agrupacion mas sencilla es ordenar los datos.

Ejemplo 1.1.1

Calificaciones del curso de estadstica: 7.5, 6, 8.3, 9 y 10.


Ordenamos y obtenemos:

1
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS

6, 7.5, 8.3, 9, 10.


La informacion que obtenemos es limitada podemos decir que el valor mnimo es 6 y el maximo es
10.
Consideremos un conjunto mas grande.

Ejemplo 1.1.2

Los datos que siguen corresponden a las observaciones hechas a las 10:00 de la manana del numero
de pasajeros en el RTP durante 50 das.

48 51 57 63 59
52 54 37 47 49
30 40 50 46 56
50 64 39 55 74
45 52 65 59 51
63 64 54 62 77
57 53 58 73 75
58 61 59 70 63
60 64 71 81 66
73 72 82 60 49

Procedemos a ordenarlos y obtenemos la siguiente lista

30 37 39 40 45
46 47 48 49 49
50 50 51 51 52
52 53 54 54 55
56 57 57 58 58
59 59 59 60 60
61 62 63 63 63
64 64 64 65 66
70 71 72 73 73
74 75 77 81 82

Cuando hacemos este ordenamiento obtenemos como mnimo 30 pasajeros y el maximo fue 82.
Ademas por ejemplo el 49 aparece 2 veces, al 2 le llamamos frecuencia f o frecuencia absoluta, esto
es numero de veces que aparece repetido el elemento. Obtenemos la siguiente lista de frecuencias:

2
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS

xi f xi f xi f xi f xi f xi f xi f
30 1 37 1 39 1 40 1 45 1 46 1 47 1
48 1 49 2 50 2 51 2 52 2 53 1 54 2
55 1 56 1 57 2 58 2 59 3 60 2 61 1
62 1 63 3 64 3 65 1 66 1 70 1 71 1
72 1 73 2 74 1 75 1 77 1 81 1 82 1

Ademas de la frecuencia, podemos calcular otras frecuencias llamadas frecuencia relativa y


frecuencia acumulada.

Definicion 1.1. La frecuencia relativa es el porcentaje que corresponde la fraccion de la fre-


cuencia del elemento entre el numero total de observaciones.

Definicion 1.2. La frecuencia acumulada es la suma de frecuencia del elemento y las frecuen-
cias de los elementos anteriores.
2
Por ejemplo la frecuencia relativa del 49 es pues aparece 2 veces y son 50 datos, el porcentaje
50
correspondiente es 4 %.
Y la frecuencia acumulada es 10 si sumamos todas las frecuencias anteriores incluida la del 49
y traduciendolo a porcentaje es 20 %
Como podemos observar tenemos muchos datos, lo cual no es agradable a la vista. Los datos
que mas se repiten son el 59, 63 y el 64, muchos datos solo aparecen una vez, lo cual nos aporta
poca informacion. Para obtener mas informacion hacemos agrupamiento de datos en clases.
El numero de clases es arbitrario. En general se forman entre 5 y 20 clases aunque algunos
autores proponen maximo 12 clases.
Una regla simple para determinar el numero de clases c de n observaciones puede ser:

2c n

Definicion 1.3. El intervalo de clase es el rango de valores encontrado dentro de una clase.

Por ejemplo cuando se hace una encuesta a mujeres jovenes, la edad se divide en clases:
21 a 25, 26 a 30, 31 a 35 etcetera.
Cada clase tiene 5 valores esto es 21,22,23,24,25 lo mismo que las otras y por lo tanto el IC = 5.
Una forma de aproximar un valor conveniente para el IC es:

Valor mas grande Valor mas pequeno


IC =
Numero deseado de clases

Aplicamos las formulas anteriores al ejemplo 1.1.2 del RTP. Despejamos de la desigualdad y
obtenemos

3
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS

ln50
ln2c ln50, cln2 ln50 c 5.64
ln2
entonces c = 6. Redondeando obtenemos 6 clases.
82 30 52
Aproximamos IC = = 8.7. Redondeando 9 el cual no es tan comodo, en su lugar
6 6
nos conviene utilizar un IC = 10 para trabajar con decenas esto es digamos la clase de 20 a 29
que tiene 10 valores posibles. El valor mas pequenoo se llama lmite inferior de la clase en
este caso 20 y el 29 es el lmite superior de la clase.
Otra caracterstica de la clase ademas del IC es el punto medio. El punto medio de la clase
y se calcula como la suma de los lmites superior e inferior entre 2.
Regresamos al ejemplo y obtenemos las siguientes 6 clases junto con su frecuencia y punto
medio.

lmite inferior lmite superior frecuencia punto medio


30 39 3 34.5
40 49 7 44.5
50 59 18 54.5
60 69 12 64.5
70 79 8 74.5
80 89 2 84.5

Ademas de la frecuencia podemos calcular la frecuencia relativa y frecuencia acumulada de cada


clase:

clase frecuencia frecuencia relativa frecuencia acumulada


30-39 3 6% 6%
40-49 7 14 % 20 %
50-59 18 36 % 56 %
60-69 12 24 % 80 %
70-79 8 16 % 96 %
80-89 2 4% 100 %

Ejercicio 1.1.1. 1. Un conjunto de datos contiene 100 observaciones la mas grande es 315
y la mas pequena es 56.

a) Cuantas clases debera tener la tabla de frecuencia?


b) Cual es el intervalo de clase conveniente?
c) Cuales son los lmites y puntos medios de cada clase?

2. Los siguientes datos son los ingresos semestrales de 60 ingenieros. Los datos estan expre-
sados en miles de pesos.

4
1.1. REPRESENTACION DE DATOS AGRUPADOS Y NO AGRUPADOS

58 76 89 45 67 34
64 76 34 65 45 39
79 74 56 71 85 87
74 38 69 79 61 71
69 62 56 38 69 79
71 54 31 69 62 39
65 79 47 46 77 66
55 75 62 57 77 36
73 72 64 69 51 50
40 50 74 61 69 73

a) Construye las clases


b) Determina la frecuencia absoluta, frecuencia relativa y frecuencia acumulada.
c) Escribe tus conclusiones sobre los datos de la tabla.

1.1.2. Graficos
Los graficos tambien son metodos utiles para describir conjuntos de datos.
Un histograma coloca las clases o elementos de una distribucion de frecuencias en el eje
horizontal. Lo que haces es simplemente escribir rectangulos en su base la clase y la altura es
la frecuencia correspondiente.

Podemos decir que este grafico corresponde a la frecuencia absoluta. El grafico correspondiente a
la frecuencia relativa es el conocido como diagrama circular o diagrama pastel. Esto es cada
pedazo representa el porcentaje correspondiente a la frecuencia relativa. Lo mas conveniente es
que sean pocas clases para obtener para poder leer facilmente la informacion.

5
1.2. MEDIDAS DE TENDENCIA CENTRAL

1.1.3. Diagrama de tallo y hoja


John Tukey, un estadista notable, creo el diagrama de tallo y hoja como una alternativa al
grafico histograma pues proporciona tambien una informacion visual rapida. Cada observacion
se divide en dos partes tallo y hojas, el tallo es la informacion comun a los datos por ejemplo las
decenas y las hojas seran las unidades. Tomando nuevamente como ejemplo 1.1.2 del numero
de pasajeros del autobus obtenemos la siguiente tabla:

Tallo Hoja
3 079
4 0567899
5 001122344567788999
6 001233344456
7 01233457
8 12

En este caso podemos observar que se trata graficamente de un histograma horizontal y a la


vez tenemos todos los datos correspondientes de las observaciones.

Ejercicio 1.1.2. Haz el histograma, diagrama circular y diagrama de tallo y hoja del problema
2 del ejercicio 1.1.1 .

1.2. Medidas de tendencia central


Una medida de tendencia ubica e identifica el punto alrededor el cual se centran los datos. La
idea es describir un conjunto de datos con un solo numero. El ejemplo que usamos comunmente
para representar al conjunto de calificaciones de un semestre es el promedio. Vamos a empezar
a calcular las medidas de tendencia central a partir de datos no agrupados.

6
1.2. MEDIDAS DE TENDENCIA CENTRAL

1.2.1. Datos no agrupados


Existen tres metodos comunes para identificar el centro de un conjunto de datos: la media, la
mediana y la moda. Su calculo e interpretacion se definen a continuacion.

Definicion 1.4. La media, o media aritmetica, es la medida de tendencia central que usual-
mente se le llama promedio. Se calcula haciendo la suma de todas las observaciones y dividir
esta suma entre el numero de operaciones.

La notacion de la media de una poblacion es el parametro . Si hay N observaciones en el


conjunto de datos de la poblacion. La media se calcula:

N
X
Xi
X1 + X2 + X3 + + XN i=1
= =
N N

Definicion 1.5. La poblacion es la coleccion de todos los datos de interes.

Es posible que no tengamos todas las observaciones, esto es, tenemos la llamada muestra.

Definicion 1.6. Una muestra es un subconjunto de observaciones representativo de la pobla-


cion.

La formula de la media muestral es:


n
X
Xi
X1 + X2 + + Xn i=1
X = =
n n

Para determinar si se trata de una poblacion o de una muestra se debe leer cuidadosamente el
problema.

Definicion 1.7. La mediana conocida como media posicional porque queda exactamente en
la mitad del conjunto de datos despues de ordenarlos.

La mitad de las observaciones estara por encima de la mediana, la otra mitad estara por debajo
de ella. Si el conjunto de datos tiene un numero impar de observaciones, la posicion de la
mediana se calcula con la formula:

n+1
posicion = .
2

En el caso de que el numero de observaciones sea par se toma el promedio de los valores que se
n+1
encuentran en las posiciones justo en medio esto es el entero mayor y menor a .
2
7
1.2. MEDIDAS DE TENDENCIA CENTRAL

Definicion 1.8. La moda es la observacion o dato que ocurre con mayor frecuencia.

En caso de que sean 2 datos los que mas se repiten se dice que el conjunto de datos es bimodal,
si son 3 trimodal etcetera.
La media es la medida de tendencia central mas usada, pues se presta para mayor manipulacion
e interpretacion algebraica. Desafortunadamente, la media se ve afectada por valores extremos,
o valores atpicos, y a diferencia de las otras dos, la media puede ser sesgada por estos valores.
Esto no significa que sean mejores que la media, simplemente cada medida de tendencia central
da distinta informacion.

Ejemplo 1.2.1

Tu empresa esta introduciendo un nuevo chip de computadora que hace calculos estadsticos rapi-
damente. Se hacen 20 calculos diferentes que se muestran a continuacion. Determina la media, la
mediana y la moda. Comenta los beneficios de usar cada estadstico.

3.2 4.1 6.3 1.9 0.6


5.4 5.2 3.2 4.9 6.2
1.8 1.7 3.6 1.5 2.6
4.3 6.1 2.4 2.2 3.3

SOLUCION: Al leer que se toman 20 calculos diferentes quiere decir que no tomamos todos.
Por lo tanto se trata de una muestra con n = 20. Ordenamos los valores podemos aprovechar y
escribir el diagrama de tallo y hoja obteniendo.

tallo hoja
0 6
1 5789
2 246
3 2236
4 139
5 24
6 123

Calculamos
70.5
X = = 3.525.
20
20 + 1
Como el numero de datos es par obtenemos la posicion= = 10.5.
2
8
1.2. MEDIDAS DE TENDENCIA CENTRAL

Entonces tomamos los datos en las posiciones 10 y 11. Esto es, 3.2 y 3.3 al hacer el promedio
obtenemos que la mediana es 3.25. Del diagrama de tallo y hojas notamos que el valor que mas se
repite es 3.2.
Podemos observar que en este caso la media, la moda y la mediana no estan tan alejadas. Entonces
el dato mas representativo sera la mediana pues el el valor que se encuentra entre la media y la
moda.

Ejercicio 1.2.1. Como gerente de ventas de Acme, deseas calcular las medidas de tendencia
central de los niveles de utlidad del ultimo ano. Se tienen los siguientes datos mensuales en
miles de dolares. Comenta tus resultados

12.3 14.3 25.7


21.6 21.6 -12.8
22.3 18.0 23.2
-3.4 17.9 22.3

1.2.2. Datos agrupados


Cuando trabajamos con datos que han sido agrupados en c clases con una ditribucion de fre-
cuencia, ya no conocemos los datos individuales pero si conocemos las frecuencias f y podemos
calcular de cada clase el punto medio M y el numero de observaciones n pues este sera igual a
Xc
la suma de las frecuencias n = fi .
i
c
X
fi Mi
i=1
Media con datos agrupados: Xg = .
n

Ejemplo 1.2.2

Usamos el ejemplo 1.1.2 del RTP. Usando la tabla

clase f M fM
30-39 3 34.5 103.5
40-49 7 44.5 311.5
50-59 18 54.5 981
60-69 12 64.5 774
70-79 8 74.5 596
80-89 2 84.5 169
50 2935

9
1.2. MEDIDAS DE TENDENCIA CENTRAL

X = 58.7 que es muy buena aproximacion de el valor verdadero que da 58.36.

Para calcular la mediana con datos agrupados utilizamos las frecuencias para determinar
en que clase se encontara la mediana si no estuvieran agrupados. Como no conocemos las
observaciones generales hacemos una aproximacion utilizando la siguiente formula:
n
F

2
Mediana Lmd + (IC)
fmd
Donde Lmd es el lmite inferior de la clase donde se encontrara la mediana, F es la frecuencia
acumulada de la clase anterior, fmd es la frcuencia de la clase de la mediana, IC es el intervalo
de la clase de la mediana.

Usamos nuevamente el ejemplo del RTP. Buscamos la clase donde se encuentran incluidos los
elementos 25 y 26, esto es la clase 50-59. Notamos que su frecuencia acumulada de la clase
anterior es 10.

Sustituimos los datos en la formula



25 10

Mediana 50 + (10) = 58.333
18
Este resultado tambien esta muy cerca de la mediana verdadera 58.5.

En el caso de la moda, lo que hacemos es localizar la clase modal, que es la que tiene el mayor
numero de elementos. Y para estimar la moda para datos agrupados usamos la siguiente
formula:
 
Da
Moda = Lmo + (IC)
Db + Da
Donde Lmo es el lmite inferior de la calse modal, Da es la diferencia entre la frecuencia de la
clase modal y la clase que la antecede, Db es la diferencia entre la frecuencia de la clase modal
y la clase que le sigue y IC es el intervalo de clase. Usando la tabla del RTP. Estimamos la
moda:

18 7

Moda = 50 + (10) = 56.47
(18 12) + (18 7)
revisando la tabla de datos originales tenemos que tena tres modas: 59, 63 y 64, pero en este
caso solo podemos estimar una y esta ya no es tan buena aproximacion.

Ejercicio 1.2.2. El ausentismo diario en una oficina parece ir en aumento. El ano pasado un
promedio de 47.8 empleados estuvo ausente algunos das. Se recolecto una muestra de datos
para el ano en curso y se ubicaron en la tabla de frecuencias que se muestra a continuacion.
Estima la media, la mediana y la moda para estos datos y compara con el promedio del ano
anterior.

10
1.3. MEDIDAS DE DISPERSION

Numero de empleados ausentes Das en los que ese numero estuvo ausente
20-29 5
30-39 9
40-49 8
50-59 10
60-69 12
70-79 11
80-89 8
90-99 3

1.3. Medidas de dispersion


1.3.1. Datos no agrupados
Las medidas de tendencia central no son suficientes siempre. Una descripcion mas completa
puede obtenerse determinando que tan separados estan las observaciones de la media.
La opcion mas sencilla es calcular el rango esto es obtener el valor mas pequeno y el maximo
el rango es la resta de estos valores, podemos calcular que tan separados estan de la media.
Como podemos calcular el rango no nos proporciona mucha informacion.

1.3.2. Varianza y desviacion estandar


La varianza es el promedio de las diferencias de las observaciones y la media elevadas al cua-
drado.
La formula de la varianza poblacional:

N
X
(Xi )2
2 2 2
(X1 ) + (X2 ) + + (XN ) i=1
2 = =
N N

Desviacion estandar poblacional: = 2 .

Ejemplo 1.3.1

Marcos Reyes es gerente de una empresa. Recientemente Marcos estaba interesado en las tasas de
endimiento de los ultimos cinco anos 12,10,13,9 y 11 %.
Calcula, media, varianza y desviacion estandar.
SOLUCION: Se trata de una poblacion pues solo interesan los ultimos cinco anos:

11
1.3. MEDIDAS DE DISPERSION

12 + 10 + 13 + 9 + 11
= = 11 para calcular la varianza
5
(12 11)2 + (10 11)2 + (13 11)2 + (9 11)2 + (11 11)2
2 = =2
5
y finalmente la desviacion estandar = 2 1.4142.
Cuando se trata de una muestra la media muestral se denota con x y la desviacon estandar
muestral se denota con s.
La formula para x es la misma que para como ya vimos, pero la varianza muestral cambia a
XN
(Xi X)2
2 2 2
(X1 X) + (X2 X) + + (XN X)
s2 = = i=1
n1 n1
donde n es el numero de elementos de la muestra. Una formula mas sencilla de calcular estas
sumas de cuadrados es: !
n n 2
X X
2
n xi xi
i=1 i=1
s2 =
n(n 1)

Ejemplo 1.3.2

El senor Reyes desea determinar la estabilidad de la desviacion estandar del precio de cierre diario de
dicha accion. Al revisar las paginas financieras Reyes sabe que la accion ha cotizado en la bolsa duran-
te muchos meses. Reyes ocupa una muestra aleatoria de 7 das dada en dolares: 87,120,54,92,73,80
y 63.
SOLUCION: Claramente se trata de una muestra.
87 + 120 + 54 + 92 + 73 + 80 + 63
X = = 81.29
7
la varianza muestral es:
X 7
(Xi X)2
i=1
s2 = = 465.9 y finalmente la desviacion estandar muestral s = 21.58.
71
Ejercicio 1.3.1. Se utilizan dos procesos para producir discos de computadora. Han surgido
problemas con respecto a las varaciones en los tamanos de dichos discos. Con base en los datos
de muestra aqui observados, de ocho tamanos de disco. Determina cual proceso tienen una
menor desviacion estandar.
Proceso 1 Proceso 2
3.41 3.22 3.81 3.26
3.74 3.06 3.26 3.79
3.89 3.65 3.07 3.14
3.65 3.33 3.35 3.51

12
1.3. MEDIDAS DE DISPERSION

1.3.3. Datos agrupados


Si los datos estan agrupados en una tabla de frecuencia, la varianza y la desviacion estandar
pueden calcularse como:
Varianza de datos agrupados

f M 2 nX 2
s2 =
n1

y la desviacion estandar s = s2 .
Usamos nuevamente la tabla del RTP y escribimos la informacion que nos falta para calcular
la desviacion estandar.
clase f M fM M2 fM2
30-39 3 34.5 103.5 1190.25 3570.75
40-49 7 44.5 311.5 1980.25 13861.75
50-59 18 54.5 981 2970.25 53464.5
60-69 12 64.5 774 4160.25 49923
70-79 8 74.5 596 5550.25 44402
80-89 2 84.5 169 7140.25 14280.5
50 2935 179502.5

Ya habamos calculado:
f M 2935
Xg = = = 58.7
n 50
Ahora sustituimos las sumas correspondientes en la formula de la varianza:
179502.5 50(58.7)2
s2 = = 147.31
50 1
y la desviacion estandar
s = 12.14.

Ejercicio 1.3.2. Usamos ahora el ejercicio 1.2.2 de ausentismo. Si el ano pasado la desviacion
estandar fue de 14.7. Calcula la varianza y la desviacion estandar del ano en curso y comparala
con la del ano anterior.

Existen otras medidas de dispersion llamadas cuartiles y percentiles. Los cuartiles dividen el
conjunto en 4 partes, esto es el primer cuartil se trata del dato que tiene por debajo el 25 % de
las observaciones, el segundo cuartil corresponde a la mediana que es el 50 %, y el tercer cuartil
corresponde al 75 %.
Cuando hablamos de percentiles se escoge un porcentaje, digamos 85 % y lo que se hace es
encontrar el dato cuya posicion indica que el 85 % de los datos estan por debajo de dicho dato.

13
1.3. MEDIDAS DE DISPERSION

14
2
Probabilidad

2.1. Espacio muestral


Definicion 2.1. Un experimento es cualquier operacion cuyo resultado no puede predecirse con
exactitud.

Ejemplo 2.1.1

Lanzar una moneda

Lanzar un dado

Partido de futbol

Numero ganador de la Lotera Nacional

Definicion 2.2. El espacio muestral (denotado por S) de un experimento es el conjunto de


todos los resultados posibles del experimento. El espacio se dice discreto cuando podemos contar
sus elementos no importa si es finito o infinito, en cambio el espacio muestral es continuo
cuando se trata de un intervalo de los numeros reales.

Ejemplo 2.1.2

15
2.1. ESPACIO MUESTRAL

Experimento Espacio muestral Tipo


Lanzar una moneda S = {aguila, sol} discreto
Lanzar un dado S = {1, 2, 3, 4, 5, 6} discreto
Resultado de un partido de futbol S = {perdido, ganado, empatado} discreto
Total de goles en un partido S = {0, 1, 2, 3, 4, 5, 6, . . . } discreto
Medida del grosor de un conector
de forma T hecho de plastico S = {x : x R+ } = (0, ) continuo
Chip cumple con las especificaciones S = {s,no} discreto
Medida del grosor de un tubo
se sabe que la maquina los
produce entre 10 y 11 mm S = {x R : 10 < x < 11} continuo
Dos conectores cumplen con
las especificaciones S = {ss,sn,ns,nn} discreto
Resultados de especificaciones
de conectores hasta que uno falla S = {n,sn,ssn,sssn,...} discreto

Ejercicio 2.1.1. Determina en cada experimento el espacio muestral S y el tipo de espacio.

1. Escoger una carta de un mazo de baraja americana.

2. Escoger el numero ganador de un sorteo con 1000 boletos numerados.

3. Estatura exacta de los estudiantes de la UACM.

4. Resultado de calidad de un producto

5. Resultados de un examen de 3 preguntas con dos incisos.

Se puede tener un experimento donde se escogen objetos donde se puede tener la caracterstica
de escoger con reemplazo esto es se regresa el objeto elegido para participar en la siguiente
eleccion o sin reemplazo, un objeto ya elegido no participa en la siguiente eleccion.

Ejemplo 2.1.3

1. Experimento: Formar palabras de 2 letras el conjunto {a, b, c}

Caso 1. Sin reemplazo S = {ab, ac, ba, bc, ca, cb}


Caso 2. con reemplazo S = {aa, ab, ac, ba, bb, bc, ca, cb, cc}

16
2.2. ELEMENTOS DE CALCULO COMBINATORIO

Sin importar el caso se tiene que es discreto.

2. Se tienen 3 mensajes de correo electronico, tenemos que llegan puntuales (p) o tarde (t).
S = {ppp, ptt, ppt, ttt, tpp, ttp, ptp, tpt}

Ejercicio 2.1.2. Una consecionaria vende vehculos con equipo al gusto del cliente las opciones
son:

Automatico o estandar

Con aire acondicionado o sin aire acondicionado

Radio, Radio CD, Radio CD y MP3

Rojo infierno, verde metalico, azul acero y blanco mate.

Determina el espacio muestral de todos los vehculos posibles. Cuantos son?

2.2. Elementos de calculo combinatorio


Muchas veces no estamos interesados precisamente en la lista del espacio muestral discreto y
finito, sino en la cantidad de elementos de este espacio muestral tiene.

2.2.1. Principio de multiplicacion


Teorema 2.1. Principio de multiplicacion Si puede realizarse una primera operacion o se-
leccion de n maneras, y luego puede realizarse una segunda operacion o seleccion en m maneras.
Entonces pueden realizarse ambas operaciones de n m maneras.

Ejemplo 2.2.1

1. Para saber la cantidad de vehculos posibles notamos lo siguiente, Transmision=2 maneras,


Aire acondicionado=2 maneras, Radio=3 maneras, Colores=4 maneras.
Por el principio de la multiplicacion tenemos que son: 2 2 3 4 = 48. Es decir, son 48
autos posibles.

2. Cuantos atuendos diferentes son posibles? Si se tienen 3 pantalones, 4 camisas y 2 corbatas.


Nuevamente por el principio de multiplicacion tenemos 3 4 2 = 24 24 atuendos distintos.

17
2.2. ELEMENTOS DE CALCULO COMBINATORIO

3. Cuantas placas de automovil para el Distrito Federal pueden armarse?


Sabemos que tienen 3 letras y 3 numeros para cada una de las letras tenemos 27 maneras, para
cada uno de los numeros tenemos 10 dgitos posibles, aplicando el principio de multiplicacion
tenemos 27 27 27 10 10 10 = 19683000 placas posibles.

4. Cuantos numeros hay de la lotera nacional que no repiten dgitos? Sabemos que la lotera
nacional imprime boletos de 5 dgitos, entonces para el primer dgito tenemos 10 maneras,
para el segundo ya no tenemos 10 maneras pues no queremos que se repita el primero as que
son 9, para el tercero son 8 finalmente tenemos 10 9 8 7 6 = 30240.
Ejercicio 2.2.1.

1. Cuantos numeros telefonicos de 8 cifras hay que empiecen con 1?

2. Cuantas placas del distrito federal tienen vocales?

3. Cuantos numeros de la loteria nacional tienen solo dgitos pares que no se repiten?

Definicion 2.3. El factorial de n denotado por n!. Es el resultado del producto de n y todos
los enteros menores a n.

n! = n(n 1)(n 2) 5 4 3 2 1

Propiedades
i. n(n 1)! = n!
n!
ii. (n 1)! =
n
iii. 0! = 1

Ejemplo 2.2.2

a) 5! = 120
88! 88 87 86 85!
b) = = 88 87 86 = 658416
85! 85!
1!
c) 0! = =1
1
d) 18! = 6.402D + 15

18
2.2. ELEMENTOS DE CALCULO COMBINATORIO

2.2.2. Permutaciones
Definicion 2.4. Una permutacion es un arreglo de n smbolos en un orden definido.

Ejemplo 2.2.3

a) Cuantas permutaciones de 3 letras se obtienen del conjunto A = {a, b, c}? {abc, acb, bac, bca, cab, cba}
En total son 6.

b) Cuantas permutaciones de 2 letras? {ab, ac, ba, bc, ca, cb} En total son 6.

P (n, r) denota el numero de permutaciones de n smbolos en arreglos de r posiciones. Y la formula


es:

n!
P (n, r) =
(n r)!
As en el primer caso tenemos que son tres smbolos en palabras de tres letras. Entonces
n=r=3y
3! 3!
P (3, 3) = = = 3! = 6.
(3 3)! 0!
En el segundo problema se trata de tres smbolos en palabras de dos letras. Entonces n = 3 y
r = 2 sustituyendo en la formula tenemos
3! 3!
P (3, 2) = = = 6.
(3 2)! 1!
Si se quiere hacer una permutacion con de n simbolos donde k estan repetidos la formula
correspondiente es:
n!
P =
n1 ! n2 ! nk !
donde ni es el numero de veces que se repite el smbolo i.

Ejemplo 2.2.4

Cuantas palabras distintas se obtienen con aabb? Notamos n = 4 y son dos simbolos los que
4!
se repiten n1 = 2 y n2 = 2 sustituyendon en la formula P = = 6. Podemos verificar esto
2!2!
{aabb, abab, abba, baab, baba, bbaa}.

19
2.2. ELEMENTOS DE CALCULO COMBINATORIO

2.2.3. Combinaciones
Ahora que pasa cuando no nos interesa la posicion, esto es cuantas selecciones de dos letras pue-
do hacer de {a, b, c}, notemos que {a, b} es la misma eleccion que {b, a} porque aqu el orden no
importa, pues notamos que se eligieron las mismas letras. As tenemos que {{a, b}, {a, c}, {b, c}},
esto es son solo tres posibles selecciones de tres letras.

Definicion 2.5. Una combinacion es una seleccion de r objetos de un conjunto de n elementos


sin importar el orden.

El numero de combinaciones se obtiene a partir de el numero de permutaciones entre el factorial


del numero de objetos de la seleccion.
!
P (n, r) n! n
C(n, r) = = =
r! (n r)!r! r
Verificamos esto con el ejemplo anterior, para el cual ya habiamos calculado que P (3, 2) = 6
como se trata de r = 2 obtenemos que
6
C(3, 2) = = 3.
2!

Propiedades
! !
n n
i. =1 iii. =n
n n1
! ! !
n n n
ii. =1 iv. =
0 nr r

Ejemplo 2.2.5
! !
10 10! 10! 75 75!
= = = 45 = = 5.607D + 14
8 8!(10 8)! 8!2! 14 14!61!

Ejemplo 2.2.6

Cuantas manos distintas de pokar hay?


SOLUCION: Sabemos que una mano de pokar tiene 5 cartas y para una mano no importa la
posicion pues se trata de una seleccion de 5 cartas. Y como el mazo tiene 52 cartas, se trata de

20
2.3. EVENTOS

52!
una combinacion de 5 de 52 objetos. Sustituimos en la formula y obtenemos: C(52, 5) = =
5!47!
2598960.
Cuando resolvemos problemas debemos determinar si se trata de una permutacion (importa
el orden y se trata de un arreglo), una combinacion (no importa el orden se trata de una
seleccion) o simplemente se debe utilizar el principio de la multiplicacion (importa el orden
pero hay elementos repetidos).

Ejercicio 2.2.2.

1. Cuantas palabras de 9 letras se pueden hacer de aabbbcccc?

2. Cuantas combinaciones hay del melate si se trata de escoger 6 numeros del 1 al 56?

3. Cuantas placas de transportistas se pueden hacer si se componen de 4 numeros sin repetir


y 2 letras sin repetir?

4. Cuantos numeros telefonicos de 8 cifras de numeros pares hay?

5. En una unidad habitacional se requiere formar una comision de 5 para ir a la delegacion


y solicitar el cambio de el alumbrado publico. Cuantas comisiones se puden formar si se
trata de 100 departamentos?

2.3. Eventos
Definicion 2.6. Un evento o suceso es un subconjunto del espacio muestral.

Ejemplo 2.3.1

a) El espacio muestral de lanzar una moneda es S = {A, S} digamos aguila o sol. Los eventos
pueden ser: E1 = {A} esto es cae aguila y otro puede ser E2 = {S} que es cae sol.

b) En el ejemplo de tirar un dado un evento puede ser caiga un numero par Ep = {2, 4, 6}.

2.3.1. Operaciones con eventos


Como los eventos son conjuntos haremos un repaso de conjuntos.

21
2.3. EVENTOS

Definicion 2.7. La cardinalidad de un conjunto o evento es el numero de elementos de dicho


evento. La notacion es #(A).

Del ejemplo anterior tenemos

#(E1 ) = 1 #(Ep ) = 3

#(E2 ) = 1 Tambien tenemos que #() = 0

Definicion 2.8. La union de dos eventos es un evento que consiste de todos los reultados que
estan en E1 o en E2 .
E1 E2 = {x : x E1 o x E2 }

E1 E2 =
S
E1 E2

Figura 2.1: Union de eventos

Definicion 2.9. La interseccion de dos eventos es un evento que consiste de todos los resultados
que estan en los dos eventos E1 y E2 .

E1 E2 = {x : x E1 y x E2 }

E1 E2 =
S

E1 E2

Figura 2.2: Interseccion de Eventos

22
2.3. EVENTOS

Definicion 2.10. Dos eventos se llaman ajenos si

E1 E2 = .

E1 E2

Figura 2.3: Eventos ajenos

Si los eventos E1 , E2 y E3 son ajenos entre s y ademas S = E1 E2 E3 . Esto significa que


cubren completamente a S la representacion grafica cambia a:

Definicion 2.11. El complemento de E1 es un evento que consiste de todos los resultados del
espacio muestral S que no estan en el evento E1 .

E1c = {x S : x 6 E1 }

23
2.3. EVENTOS

Ejemplo 2.3.2

Consideremos el espacio muestral donde se aceptan o se rechazan 2 artculos. S = {ss, sn, ns, nn}
son eventos de este espacio muestral
El evento se acepta al menos uno. E1 = {ss, sn, ns}

El evento se rechazan los dos. E2 = {nn}

El evento se acepta solamente uno de los dos E3 = {sn, ns}

E1 E2 = {ss, sn, ns, nn} = S La union de estos dos eventos da el espacio muestral completo.

E1 E2 =

E1c = {nn} = E2

E3c = {ss, nn}


El diagrama correspondiente a este espacio muestral y eventos es:

Ejercicio 2.3.1.
1. Haz el diagrama de Venn correspondiente a espacio muestral de la concesionaria consi-
derando los siguientes eventos:

E1 = {x : x es un auto de color rojo infierno}


E2 = {x : x es un auto de color verde metalico}
E3 = {x : x es un auto de color blanco mate}
E4 = {x : x es un auto de color azul acero}
E5 = {x : x es un auto con transmision automatica}.

2. Se mide el tiempo necesario para que se realice una reaccion qumica. Este experimento
puede ser modelado con el espacio muestral S = + . Sean los eventos E1 = {x : 1 x <
10} y E2 = x : 3 < x < 118. Calcula

24
2.4. FUNCION DE PROBABILIDAD

a) E1 E2 b) E1 E2 c) E1c d) E1c E2

Propiedades de cardinalidad

Sea S discreto y finito y E1 , E2 y E3 eventos del espacio muestral.

i. Como Ei S tenemos #(Ei ) #(S)

ii. Si E1 y E2 son ajenos #(E1 E2 ) = #(E1 ) + #(E2 ).

iii. #(E1 E2 ) = #(E1 ) + #(E2 ) #(E1 E2 )

iv. #(E1 E2 E3 ) = #(E1 ) + #(E2 ) + #(E3 ) #(E1 E2 ) #(E1 E3 ) #(E2 E3 ) +


#(E1 E2 E3 ).

Propiedades de conjuntos

Como hemos observado los eventos son conjuntos por lo cual nos conviene repasar algunas
propiedades las cuales puedes verificar utilizando diagramas de Venn.

i. (Ac )c = A iv. (A B) C = (A C) (B C)

v. (A B) C = (A C) (B C)
Propiedades conmutativas

ii. A B = B A Leyes de DMorgan

iii. A B = B A vi. (A B)c = Ac B c

Propiedades distributivas vii. (A B)c = Ac B c

2.4. Funcion de probabilidad


Definicion 2.12. Sea S cualquier espacio muestral y E cualquier evento de este. Se lla-
mara funcion de probabilidad sobre el espacio muestral S a P (E) si satisface los siguientes
axiomas.

i. P (E) 0

ii. P (S) = 1

iii. Si para eventos ajenos E1 y E2 entonces P (E1 E2 ) = P (E1 ) + P (E2 ).

25
2.4. FUNCION DE PROBABILIDAD

Si podemos contarlos notamos que estas propiedades corresponden a cardinalidad de la siguiente


forma:

#(E)
P (E) = .
#(S)
Claramente cumple los axiomas utilizando las propiedades de cardinalidad.

Ejemplo 2.4.1

50 muestras de plastico son analizados. Se analizan tanto resistencia a golpes y la resistencia a


rayones. Los resultados se resumen en la siguiente tabla.

Resistencia a golpes
Resistencia
a rayo-

alta baja
nes

alta 40 4
baja 1 5

Sea A el evento que denota a los elementos con alta resistencia a golpes y sea B el evento que
denota alta resistencia a rayones.

a) Que es Ac ? Son los elementos con baja resistencia a golpes

b) Que es B c ? Son los elementos con baja resistencia a rayaduras

c) Que es A B? son los elementos que tienen alta resistencia a golpes y rayaduras

d) Que es A B? son los elementos que tienen una alta resistencia en cualquiera de los dos
golpes o rayaduras

e) Hacer un diagrama de Venn con A y B. En este caso como no son ajenos.

41
f) P (A). En este caso sabemos que #(S) = 50 y que #(A) = 41 entonces P (A) = = 0.82
50
26
2.4. FUNCION DE PROBABILIDAD

#(B) 44
g) P (B) P (B) = = = 0.88
#(S) 50
h) P (A B c ) Nos preguntan por los que tienen alta resistencia a golpes y baja resistencia a
1
rayaduras leyendo de la tabla tenemos que es solo uno P (A B c ) = = 0.02
50
i) P (A B) Son los que tienen alta en cualquiera de los dos golpes o rayaduras P (A B) =
45
= 0.9
50
9
j) P (Ac ) P (Ac ) = = 0.18
50

Propiedades de la probabilidad

a) 0 P (E) 1

b) P () = 0

c) Si E1 E2 entonces P (E1 ) < P (E2 )

d) P (E c ) = 1 P (E)

e) P ((E c )c ) = P (E)

Teorema 2.2. Sea S un espacio muestral que contiene a dos eventos cualquiera A y B, enton-
ces:
P (A B) = P (A) + P (B) P (A B).

Verificamos esto usando el ejemplo anterior donde ya tenemos calculados todos los valores
40
excepto P (A B), #(A B) = 40 entonces P (A B) = = 0.8, ahora que tenemos todos los
50
valores sustituimos en P (A B) = P (A) + P (B) P (A B) P (A B) = 0.82 + 0.88 .8 = 0.9
valor que habiamos obtenido directamente.

Ejercicio 2.4.1.

1. Cual es la probabilidad de sacarse el melate?

2. Tabla de sellos en semiconductores clasificados por contaminacion y localizacion. A denota


el evento que el sello tiene altos niveles de contaminacion, C denota el evento de que la
contaminacion se localiza en el centro.

Localizacion
Contaminacion

centro orilla
baja 514 68
alta 112 246

27
2.5. PROBABILIDAD CONDICIONAL

a) P (A)
b) P (C)
c) P (A C)
d) P (A C)

3. Un sistema contiene dos componentes: A y B y se conecta de manera que este funciona si


cualquiera de los dos componentes funciona. Se sabe que la probabilidad de que A funcione
es 0.9 y la de B es 0.8 y la probabilidad de que ambos funcionen es 0.72. Determinar:

a) La probabilidad de que el sistema funcione.


b) La probabilidad de que el componente A falle.
c) La probabilidad de que los dos fallen.
d) La probabilidad de que A falle y B funcione.

2.5. Probabilidad Condicional


Un evento puede estar condicionado a otro, imaginemos que tenemos en una bolsa 4 pelotas
una de color blanco, una de color verde, una roja y una azul. En principio sabemos que la
probabilidad de sacar la azul es de 0.25 ahora si ya se saco digamos la blanca como primera
pelota, cual es la probabilidad de sacar la azul dado que ya salio la blanca?, la probabilidad
1
es , pues cambio el evento y ahora el espacio muestral solo tiene 3 pelotas.
3
Definicion 2.13. La probabilidad condicional de un evento B dado un evento A, denotado
por P (B|A), se calcula con

P (A B)
P (B|A) = con P (A) 6= 0
P (A)
Tambien tenemos que si trabajamos con complementos

P (Ac |B) = 1 P (A|B).

Ejemplo 2.5.1

Consideremos nuevamente el ejemplo de las piezas de plastico. Recordamos que los eventos son A
alta resistencia a golpes y B alta resistencia a rayones.

28
2.5. PROBABILIDAD CONDICIONAL

Resistencia a golpes

Resistencia
a raya-
duras
alta baja
alta 40 4
baja 1 5

P (B|A) se traduce a cual es la probabilidad de dado que es una pieza de plastico tiene alta resistencia
a golpes se escoja con alta resistencia a rayones. Como A ya ocurrio vemos la tabla y estamos
trabajando con 41 piezas, de las cuales 40 tienen alta resiencia a rayones. Entonces P (B|A) =
40
= 0.97. Gracias a la definicion no es necesario que hagamos este razonamiento, simplemente
41
utilizamos la formula.

P (A B) 0.8
P (B|A) = = = 0.98
P (A) 0.82
Por lo regular P (A|B) 6= P (B|A) podemos verificarlo con el ejemplo:

P (A B) 0.8
P (A|B) = = = 0.91
P (B) 0.88

Regla de multiplicacion

i. P (A|B) P (B) = P (B|A) P (A)

ii. P (A B) = P (A|B) P (B) = P (B|A) P (A)

Ejercicio 2.5.1. A los habitantes de la Ciudad de Mexico se les hizo una encuesta con el
proposito de determinar el numero de lectores de La Jornada y el Universal. Los resultdos
fueron: 20 % leen el Universal, 16 % leen la Jornada, mientras que el 1 % lee ambos periodicos.
Si selecciona al azar a un lector del Universal cual es la probabilidad de que tambien lea la
Jornada?

Definicion 2.14. Sean A y B dos eventos cualesquiera de un espacio muestral S. Se dice que
el evento A es independiente del evento B si P (A|B) = P (A).

Teorema 2.3. Si el evento A es independiente del evento B entonces se verifica una de las 3
relaciones siguientes:

1. P (A|B) = P (A)

2. P (B|A) = P (B)

3. P (A B) = P (A) P (B)

29
2.5. PROBABILIDAD CONDICIONAL

Definicion 2.15. Si los eventos A, B y C son independientes si la probabilidad de todas


las intersecciones posibles es igual al producto de las probabilidades involucradas en dichas
intersecciones. Esto es: P (A B) = P (A) P (B), P (A C) = P (A) P (C), P (B C) =
P (B) P (C) y P (A B C) = P (A) P (B) P (C). Esta situacion se puede generalizar a n
eventos con las respectivas intersecciones de 2, 3, 4, , n 1, n eventos.

Ejemplo 2.5.2

El circuito ilustrado a continuacion solo opera si hay una trayectoria de dispositivos funcionales de
izquierda a derecha. La probabilidad de que cada dispositivo funcione se indica en la ilustracion.
Supon que los dispositivos fallan independientemente. Cual es la probabilidad de que el circuito
opere?

Cuando trabajamos con circuitos en serie se trata de de una interseccion pues para que funcione
deben funcionar todos, y cuando estan conectados en paralelo se trata de uniones pues para que
funcionen puede funcionar cualquiera.
Nombramos dispositivo A al de arriba y B al de abajo.
Para que funcione nos preguntamos P (A B) pues estan conectados en paralelo. P (A B) =
P (A)+P (B)P (AB) como son independientes podemos cambiar la interseccion por el producto.
P (A B) = P (A) + P (B) P (A)P (B) = 0.95 + 0.95 (0.95)(0.95) = 0.998

Ejercicio 2.5.2. Haz lo mismo en el siguiente circuito.

30
2.5. PROBABILIDAD CONDICIONAL

Regla de la probabilidad Total

Podemos involucrar a dos eventos A y B en la siguiente relacion de intersecciones:

A = (A B) A B c

No solo eso tenemos que P (A) = P (A B) + P (A B c ) as la regla de la probabilidad total es:

P (A) = P (A|B) P (B) + P (A|B c )P (B c )

Podemos generalizar a digamos n eventos ajenos Ei tales que S = ni=1 Ei :

P (A) = P (A|E1 )P (E1) + P (A|E2)P (E2 ) + + P (A|En )P (En )

Ejemplo 2.5.3

En la fabricacion de semiconductores, suponga que la probabilidad de que un chip sujeto a niveles de


contaminacion altos durante la fabricacion ocasione la falla de un producto es 0.1; la probabilidad
de que un chip sujeto a niveles de contaminacion medios durante la fabricacion ocasione la falla de
un producto es 0.01 y la probabiliad de que un chip sujeto a niveles de contaminacion bajos durante

31
2.6. TEOREMA DE BAYES

la fabricacion ocasione la falla de un producto es 0.001. En una corrida particular de produccion:


20 % de los chips estan sujetos a niveles altos, 30 % a niveles de contaminacion medios y 50 % a
niveles de contaminacion bajos. Cual es la probabilidad de que un producto que use uno de estos
chips falle?
SOLUCION: Para resolver este problema debemos identificar que nos estan preguntando, esto
es la probabilidad de que falle el producto, lo que nos da el primer evento y con la primera lectura
identificamos los demas:

F : el producto falla.

A: el producto estuvo sometido a niveles altos de contaminacion.

M: el producto estuvo sometido a niveles medios de contaminacion.

B: el producto estuvo sometido a niveles bajos de contaminacion.

Podemos ademas hacer el diagrama de Venn correspondiente:

Despues obtenemos los datos correspondientes: P (F |A) = 0.10, P (F |M) = 0.01, P (F |B) = 0.001,
P (A) = 0.2, P (M) = 0.3 y P (B) = 0.5.

P (F ) = P (F |A)P (A) + P (F |M)P (M) + P (F |B)P (B) =

(0.10)(0.2) + (0.01)(0.3) + (0.001)(0.5) = 0.024

2.6. Teorema de Bayes


Teorema 2.4. Sean n eventos ajenos Ei y el evento A entonces usando la regla de probabilidad
total y la de la multiplicacion.

P (E1 |B) =
P (E1 B) P (B|E1 )P (E1 )
=
P (B) P (B|E1 )P (E1 ) + P (B|E2 )P (E2) + + P (B|En )P (En )

32
2.6. TEOREMA DE BAYES

Ejemplo 2.6.1

Dado que un nuevo procedimiento medico ha demostrado ser efectivo para la deteccion temprana
de una enfermedad, se propone un estudio medico exhaustivo de la poblacion. La probabilidad de
que la prueba identifique correctamente a alguien que no padece la enfermedad como negativo es
0.95 y la probabilidad de que la prueba identifique correctamente a alguien con la enfermedad como
positivo es 0.99. La incidencia de la enfermedad en la poblacion general es 0.0001. Si te sometes a
la prueba y el resultado es positivo. Cual es la probabilidad de que padezcas la enfermedad?
SOLUCION: Nuevamente empezando por la pregunta debemos tener cuidado pues se trata de
probabilidad condicional pues ya sucedio que el resultado es positivo y se pide la probabilidad de
padecer la enfermedad.
Eventos:
E: esta enfermo as E c : no esta enfermo
N: resultado negativo y N c : resultado positivo
Lo que nos piden calcular es P (E|N c ).
La informacion que nos dan es: P (N|E c ) = 0.95, P (N c |E) = 0.99 y P (E) = 0.0001. Utilizamos
el Teorema de Bayes
P (N c |E)P (E)
P (E|N c ) =
P (N c |E)P (E) + P (N c |E c )P (E c )
Como podemos ver nos faltan los datos P (E c ) y P (N c |E c ) podemos calcularlos pues son comple-
mentos de P (E) y P (N|E c ) podemos modificar la formula a

c P (N c |E)P (E)
P (E|N ) = .
P (N c |E)P (E) + (1 P (N|E c ))(1 P (E))

Sustituimos los datos y obtenemos:

(0.99)(0.0001)
P (E|N c ) = = 0.002
(0.99)(0.0001) + (1 0.95)(1 0.0001)
La probablidad de que estes enfermo es del 0.2 %.

Ejercicio 2.6.1.

a) Supon que la probabilidad de que una oblea contenga una partcula de contaminacion grande
es 0.01 y que las obleas son independientes; es decir, la probabilidad de que una oblea contenga
una partcula grande no depende de las caractersticas de las obleas restantes. Si se analizan
15 obleas, cual es la probabilidad ninguna tenga particulas grandes?

33
2.6. TEOREMA DE BAYES

b) La probabilidad de que la batera de un automovil sometida a alta temperatura en el compar-


timiento del motor tenga una corriente de carga baja es 0.7. La probabilidad de que la batera
este sometida a alta temperatura en el compartimiento del motor es 0.05. Sea que A denota
el evento de que una batera tiene una corriente de carga baja y sea que B denote el evento
de que la batera esta sometida a alta temperatura en el compartimiento del motor. Cual es
la probabilidad de que una batera tenga una corriente de carga baja y este sometida a alta
temperatura en el compartimiento del motor?

c) Durante los ultimos anos se ha escrito mucho sobre la posible relacion entre fumar y el
cancer pulmonar. Supon que en un centro medico, de todos los fumadores de quienes se
sospechaba tenan cancer pulmonar, el 90 % lo tena, mientras que unicamente el 5 % de los
no fumadores lo padeca. Si la proporcion de fumadores es de 0.45, cual es la probabilidad
de que un paciente con cancer pulmonar seleccionado al azar sea fumador?

34
3
Variables Aleatorias

3.1. Definicion y propiedades de las variables aleatorias


discretas
Definicion 3.1. Una variable aleatoria es una funcion que asigna un numero real a cada
resultado del espacio muestral de un experimento aleatorio. La variable aleatoria se denota por
la letra X.

Por ejemplo el experimento resultado de un partido de futbol


S = {ganado, perdido, empatado}
la variable aleatoria que se usa es asignar 3 puntos si gana, 1 punto si empata y 0 si pierde y
de esta forma acumula puntos cada equipo. En este caso la variable aleatoria es X = {3, 0, 1}
Al igual que con los espacios muestrales, hay dos tipos de variables aleatorias: discretas y
continuas. Una variable aleatoria discreta tiene un rango finito o infinito de numeros que
podemos contar, en cambio una variable aleatoria continua tiene como rango un intervalo
de los numeros reales.

Ejemplo 3.1.1

1. Un sistema de comunicacion de voz de un negocio tiene 45 lneas externas. En un tiempo


particular se observa el sistema y algunas lneas estan en uso. Sea X la variable aleatoria que
denota el numero de lneas en uso. Cual es el rango de X y de que tipo es?

2. En un proceso de fabricacion de semiconductores, se prueban dos obleas de un lote. Cada


oblea se clasifica como pasa o falla. La probabilidad de que una oblea pase la prueba es de
0.8 y las obleas son independientes. Considera la variable aleatoria como el numero de obleas
que pasan. Determina:

35
3.2. DISTRIBUCION DE PROBABILIDAD

a) Espacio muestral

b) Rango de X

c) Probabilidad de cada elemento de la variable aleatoria

SOLUCION:

1. X = {0, 1, 2, 3, 4, . . . , 45} y es discreta.

2. El espacio muestral es S = {pp, pf, f p, f f }

X = {2, 1, 0}

Tenemos el evento A: oblea pasa la prueba.

P (Ac Ac ) esto es las dos fallan es interseccion y son independientes podemos calcularlo con
P (Ac ) P (Ac ) = (0.2)(0.2) = 0.04

P (A A) = P (A)P (A) = (0.8)(0.8) = 0.64

P (A Ac ) = P (Ac A) = P (Ac ) P (A) = (0.2)(0.2) = 0.16

Entonces la probabilidad de la variable aleatoria hereda la probabilidad de los resultados del


espacio muestral.

P (X = 0) = 0.04 corresponde a las dos fallan P (Ac Ac )

P (X = 1) = 0.16 + 0.16 = 0.32 corresponde tanto a P (Ac A) como a P (A Ac ).

P (X = 2) = 0.64 relacionada con P (A A)

Ademas de preguntarnos por la probabilidad de cada uno de los elementos del rango de X
tenemos que es posible P (X 1) esto es cual es la probabilidad de que la variable aleatoria
sea mayor o igual que uno. Para esto tenemos dos opciones o es 1 o es 2. Entonces P (X 1) =
P (X = 1) + P (X = 2) = 0.32 + 0.64 = 0.96.

3.2. Distribucion de probabilidad


Definicion 3.2. La distribucion de probabilidad de una variable aleatoria X es la descrip-
cion de las probabilidades asociadas con los valores posibles de X.

En el ejemplo anterior graficamente la distribucion de probabilidad que se obtiene es:

36
3.2. DISTRIBUCION DE PROBABILIDAD

Ejemplo 3.2.1

Se lanzan dos dados, la variable aleatoria X es la suma de los dados.

a) Determina el Rango de X

b) Determina la distribucion de probabilidad de la variable aleatoria X

c) Haz la grafica de distribucion correspondiente

SOLUCION: Sabemos que la suma de los dados va de 2 a 12 por lo cual X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
Notemos que P (X = 1) = 0 pues no es posible que al lanzar 2 dados la suma de 1.
Para calcular P (X = 2) notamos que esto solo es posible cuando cae 1 en los dos dados, sabemos
que el espacio muestral tiene 36 posibles resultados pues para cada dado son 6 maneras, y de estas
1
la pareja (1, 1) aparece solo una vez, por lo tanto P (X = 2) = = 0.028.
36
Hacemos una tabla para ver como se obtienen cada una de las posibles sumas y la probabilidad
correspondiente:

37
3.2. DISTRIBUCION DE PROBABILIDAD

i parejas Probabilidad
1
2 (1,1) 36
2
3 (1,2),(2,1) 36
3
4 (1,3),(2,2),(3,1) 36
4
5 (1,4),(2,3),(3,2),(4,1) 36
5
6 (1,5),(2,4),(3,3),(4,2),(5,1) 36
6
7 (1,6),(2,5),(3,4),(4,3),(5,2),(6,1) 36
5
8 (2,6),(3,5),(4,4),(5,3),(6,2) 36
4
9 (3,6),(4,5),(5,4) 36
3
10 (4,6),(5,5) 36
2
11 (5,6),(6,5) 36
1
12 (6,6) 36
La grafica correspondiente a esta distribucion de probabilidad es la siguiente

Definicion 3.3. Para una variable aleatoria X con valores posibles o rango x1 , x2 , x3 , . . . , xn
la funcion masa de probabilidad se define como

f (xi ) = P (X = xi ).

38
3.2. DISTRIBUCION DE PROBABILIDAD

Por ejemplo, usando las parejas de los resultados de tirar dos dados.

1 2
f (1) = 0 f (2) = f (3) =
36 36
3 4 5
f (4) = f (5) = f (6) =
36 36 36
6 5 4
f (7) = f (8) = f (9) =
36 36 36
3 2 1
f (10) = f (11) = f (12) =
36 36 36

Definicion 3.4. La funcion de distribucion acumulada de una variable aleatoria X denotada


por F (x), se define como
X
F (x) = P (X x) = f (xi ).
xi <x

Nuevamente usando el ejemplo de los dados dan 2, 3, 4, 5 y 6


1
F (2) = f (2) =
36
3
F (3) = f (2) + f (3) =
36
6
F (4) = f (2) + f (3) + f (4) =
36
10
F (5) = f (2) + f (3) + f (4) + f (5) =
36
15
F (6) = f (2) + f (3) + f (4) + f (5) + f (6) =
36
Podemos ahorrarnos trabajo para calcular digamos F (11) usando la definicion tenemos que
F (11) = P (X 11)
en lugar de calcular todas estas sumas ahorramos trabajo usando el complemento esto es:

1 35
F (11) = P (X 11) = 1 P (X > 11) = 1 f (12) = 1 = .
36 36

Propiedades de la funcion de distribucion acumulada

Para una variable aleatoria discreta X, F (x) satisface las siguientes propiedades:
X
i. F (x) = P (X x) = f (xi )
xi <x

ii. 0 F (x) 1

iii. Si x y entonces F (x) F (y).

39
3.3. ESPERANZA, VARIANZA Y DESVIACION ESTANDAR

3.3. Esperanza, varianza y desviacion estandar


Definicion 3.5. La media, tambien conocida como valor esperado o esperanza de la variable
aleatoria discreta X denotada por o E(X) es:
X
= E(X) = xf (x)
xX

Ejemplo 3.3.1

Seguimos con el ejemplo de los dados, si jugamos turista el valor esperado sera el resultado de:
12              
X 1 2 3 4 5 6 5
= xf (x) = 2 +3 +4 +5 +6 +7 +8 +
36 36 36 36 36 36 36
 x=2
      
4 3 2 1
9 + 10 + 11 + 12 =7
36 36 36 36
Definicion 3.6. La varianza de una variable aleatoria discreta X denotada por 2 o V (X) se
define como
X X
2 = V (X) = (x )2 f (x) = x2 f (x) 2 .
xX xX

Definicion 3.7. La desviacion estandar de la variable aleatoria discreta X es


1
= (V (X)) 2

Por ultimo
 calculamos
 la varianza y la desviacion estandar del ejemplo de los dados.
1
V (X) = (4(1) + 9(2) + 16(3) + 25(4)
36
+36(5) + 49(6) + 64(5) + 81(4) + 100(3) + 121(2) + 144(1)) 72 = 5.83
p
= V (X) = 5.83 = 2.42.

Ejemplo 3.3.2

Sea que la variable aleatoria X denote el numero de obleas de semiconductores que es necesario
analizar a fin de detectar una partcula grande de contaminacion. Supongase que la probabilidad de
que una oblea contenga una partcula grande es 0.01 y que las obleas son independientes. Determina:

a) La funcion de masa de probabilidad

b) La grafica de la funcion de masa

40
3.3. ESPERANZA, VARIANZA Y DESVIACION ESTANDAR

c) La funcion acumulada de probabilidad

d) Valor esperado

e) Varianza y desviacion estandar.

SOLUCION: En este caso tenemos que se trata de una variable aleatoria discreta pero infinita,
pues la oblea con la partcula grande de contaminacion puede aparecer en la primera muestra o en
la segunda etcetera. Por lo tanto la variable aleatoria X = {1, 2, 3, 4, 5, 6, 7, . . . }.
En este caso no podemos hacer una tabla para determinar que pasa con la probabilidad.
Empezamos con f (1) esto es cuando la partcula grande se detecta en la primera oblea. Como se
trata solo de una podemos decirlo directamente del enunciado. Esto es: f (1) = 0.01. En el caso
de f (2) no se detecta en la primera pero si en la segunda, como son independientes es el producto
f (2) = (0.99)(0.01), para f (3) = (0.99)2 (0.01). Con esto podemos decir que la funcion de masa
es f (x) = (0.99)x1(0.01).
La grafica que se obtiene:

0.014

0.012

0.010

0.008

0.006

0.004

0.002

0.000
0 5 10 15 20 25

Para calcular la funcion acumulada F , seguimos el mismo procedimiento F (1) = 0.01, F (2) =
f (1) + f (2) = 0.01 + 0.99(0.01) y F (3) = f (1) + f (2) + f (3) = 0.01 + 0.01(0.99) + 0.01(0.99)2.
Notemos que 0.01 es comun a todos y por lo tanto lo podemos factorizar, y ademas podemos

41
3.3. ESPERANZA, VARIANZA Y DESVIACION ESTANDAR

reescribirlo como 0.01 = (1 0.99). As F (1) = 1 0.99, F (2) = (1 0.99)(1 + 0.99) = 1 0.992
y F (3) = (1 0.99)(1 + 0.99 + 0.992 ) = 1 + 0.99 + 0.992 0.99 0.992 0.993 = 1 0.993 .
Entonces F (x) = 1 0.99x .
X
Ahora para calcular el valor esperado utilizamos la formula = xf (x) y tambien recordaremos
xX

X1
la serie geometrica pi =
si p < 1.
i=1
1p

X X
x1
E(X) = x(0.99) (0.01) = (0.01) x(0.99)x1.
x=1 1

X
En este momento nos preocuparemos solo por la suma notamos que tenemos que x(0.99)x1 =
x=1
1 + 2 0.99 + 3 0.992 +
La cual a si vez podemos reescribir como:

X
x(0.99)x1 =
x=1
1 +0.99 +0.992 +0.993 +
+0.99 +0.992 +0.993 +
+0.992 +0.993 +
+0.993 +

Notamos que la primera lnea se trata de la serie geometrica con p = 0.99 y la segunda tambien si
factorizamos 0.99, la tercera tambien si factorizamos 0.992 .
As obtenemos:

X
x(0.99)x1 = 1
10.99
1
+ 0.99 10.99 1
+ 0.992 10.99 +
x=1
1
= 10.99
(1 + 0.99 + 0.992 + 0.993 + )
1 1 1
 
= 10.99 10.99
= (0.01)2

Entonces:

X 1 1
(0.01) x(0.99)x1 = (0.1) 2
= = 100.
1
(0.01) 0.01

As el valor esperado es 100.


El calculo de la varianza y la desviacion estandar lo veremos mas adelante.

Ejercicio 3.3.1. Estudios de mercado estiman que un nuevo instrumento para el analisis de
muestras de suelo sera de gran exito, con un exito moderado, o sin exito, con probabilidades
0.3, 0.6 y 0.1, respectivamente. Los ingresos anuales asociados con un producto de gran exito,

42
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

con un exito moderado o sin exito son de 10 millones, 5 millones y 1 millon, respectivamente.
Sea que la variable aleatoria X denote los ingresos anuales del producto.

1. La grafica de la distribucion de probabilidad de X.

2. Determinar la funcion de masa de probabilidad de X.

3. Determinar la funcion acumulada de probabilidad.

4. Valor esperado

5. Varianza.

3.4. Distribuciones discretas especiales

Ahora la idea es identificar distribuciones y obtener para cada una: funcion de masa, grafica,
valor esperado, varianza y desviacion estandar.

3.4.1. Distribucion Uniforme

Cuando tenemos que todos los elementos de una variable aleatoria discreta X tienen la misma
probabilidad, se trata de la distribucion uniforme. Sea X = {x1 , x2 , . . . , xn } la cual tiene n
elementos.
1
f (x) = p =
n
Xn
xi
i=1
E(X) = Esto es el promedio.
n
n n
!2
X X
2
n xi xi
V (X) = i=1 i=1

p n2
= V (X)
La grafica de esta distribucion con X = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} es:

43
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

1.0

0.8

0.6

0.4

0.2

0.0
0 2 4 6 8 10

Ejemplo 3.4.1

Sea la variable aleatoria discreta X = {0.1, 0.5, 0.7, 0.8, 0.9, 1.1}. Si todos sus elementos tienen la
misma probabilidad. Determina funcion de masa, la media y la desviacion estandar.
1
SOLUCION: Como tiene 6 elementos la funcion de masa es f (x) = .
6
Hacemos la tabla y obtenemos

xi x2i
0.1 0.01
0.5 0.25
0.7 0.49
0.8 0.64
0.9 0.81
1.1 1.21
suma 4.1 3.41

44
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

n
X
xi
i=1 4.1
= == 0.683
vn 6
!2
u n n
u X X
un x2i xi r
6(3.41) (4.1)2
u
t i=1 i=1
= = = 0.3184
n 36

Ejercicio 3.4.1. Sea que la variable aleatoria discreta X tiene una distribucion uniforme y se
compone de los enteros 0 x 15. Determina funcion de masa, media y varianza.

3.4.2. Distribucion Bernoulli

Considera la inspeccion de un artculo unico salido de la lnea de esamble, tirar una moneda,
acreditar estadstica y probabilidad, tirar un penal, etcetera. En cada uno de estos casos tenemos
2 resultados posibles, en el artculo pasa o no pasa, sol o aguila, acreditar o reprobar, anotar o
fallar el penal.
A estos experimentos se les llama ensayo tipo Bernoulli, cuyo resultado es exito o fracaso. La
variable aleatoria discreta se compone de dos numeros digamos X = {0, 1} con f (1) = p y
f (0) = q pero como p + q = 1 podemos reescribir a q como q = 1 p.
As f (1) = p y f (0) = 1 p as obtnemos una formula mas general como f (x) = px (1 p)x1 .
Para calcular = 0(1 p) + 1(p) = p y la varianza se obtiene V (X) = 02 (1 p) + 12 (p) p2 =
p(1 p).
La distribucion de Bernoulli es un caso particular de la distribucion binomial que es el tema a
continuacion.

3.4.3. Distribucion Binomial

Ahora en lugar de ser solo un intento son varios digamos n, entonces cuantos artculos pasaran
la inspeccion?, cuantas veces caera sol si tiro la moneda 3 veces?
En este caso tenemos que la variable aleatoria es X = {0, 1, 2, 3, 4, 5, . . . n} para el primer caso
que no nos dicen cuantos artculos son.
En el caso de las monedas pueden caer cero soles hasta 3: X = {0, 1, 2, 3}.
Para obtener la funcion de masa de esta distribucion hagamos el ejemplo de los volados, pero
en lugar de usar una moneda honesta, usamos una cargada, la probabilidad de sacar Sol es
p = 0.6. En la siguiente tabla dejamos expresada la probabilidad para

45
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

xi Elementos probabilidad
x=0 AAA (1 0.6)3
x=1 SAA, ASA, AAS 3(0.6)(1 0.6)2
x=2 SSA, SAS, ASS 3(0.6)2 (1 0.6)
x=3 SSS (0.6)3

La formula que cumple estos valores es:


!
n
f (x) = (p)x (1 p)nx
x

!
n n!
donde = son los llamados coeficientes binomiales.
x x!(n x)!

Definicion 3.8. Un experimento aleatorio que consta de n ensayos repetidos tales que los
ensayos son independientes, la probabilidad p del resultado de interes en cada ensayo permanece
constante. Se llama experimento binomial. Con:

Variable aleatoria X = {0, 1, 2, 3, 4, 5, . . . , n}


!
n
Funcon de masa f (x) = (p)x (1 p)nx
x

Valor esperado E(X) = np

Varianza V (X) = np(1 p)

La grafica que sigue corresponde a la distribucion binomial con p = 0.6 y n = 10.

46
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

0.5

0.4

0.3

0.2

0.1

0.0
0 2 4 6 8 10

-0.1

Ejemplo 3.4.2

La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Supon ademas que los ensayos de transmision son independientes. Sea X el numero de
bits con error de cuatro bits transmitidos. Determina:

a) Variable aleatoria

b) funcion de masa

c) La probabilidad de que se reciban 2 bits con error, es decir, P (X = 2).

d) La probabilidad de que haya 3 errores o mas, es decir, P (X 3)

e) Valor esperado, Varianza, desviacion estandar.

SOLUCION: a) La variable aleatoria es X = {0, 1, 2, 3, 4}. Y como nos interesa con error
p = 0.1 y n = 4.

47
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

! !
4 4
b) f (x) = (0.1)x (1 0.1)4x = (0.1)x (0.9)4x
x x
!
4 4!
c) f (2) = P (X = 2) = (0.1)2 (0.9)42 = (0.1)2 (0.9)2 = 0.0486
2 2!2!
! !
4 4 4!
d) P (X 3) = f (3) + f (4) = (0.1)3 (0.9)43 + (0.1)4 (0.9)44 = (0.1)3 (0.9)1 +
3 4 3!1!
4!
(0.1)4 (0.9)0 = 4(0.1)3(0.9) + (0.1)4 = 0.0037
4!0!

e) E(X) = np = 4(0.1) = 0.4



f) V (X) = np(1 p) = 4(0.1)(1 0.1) = 0.36 y = 0.36 = 0.6.

Ejercicio 3.4.2. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:

a) La probabilidad de que de 18 muestras, exactamente 2 contengan la molecula rara.

b) La probabilidad de que de 18 muestras, mas de 10 contengan la molecula rara.

c) Valor esperado, Varianza y desviacion estandar.

3.4.4. Distribucion Geometrica


Ahora nos interesa el numero de ensayos necesarios hasta obtener el resultado deseado.

Definicion 3.9. Sea que la variable aleatoria X denote el numero de ensayos independien-
tes tipo Bernoulli necesarios hasta obtener el resultado deseado con probabilidad constante p.
Entonces X tiene una distribucion geometrica.

Variable aleatoria X = {1, 2, 3, 4, 5, . . . }

Funcon de masa f (x) = (p)(1 p)x1


1
Valor esperado =
p
1p
Varianza 2 =
p2

48
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

0.6

0.5

0.4

0.3

0.2

0.1

0.0
0 2 4 6 8 10

-0.1

Ejemplo 3.4.3

La probabilidad de que un bit transmitido a traves de un canal de transmision digital se reciba con
error es 0.1. Suponga ademas que los ensayos de transmision son independientes. Sea X el numero
de bits necesarios hasta que ocurra el primer error. Determina:

a) Rango de la variable aleatoria.

b) La probabilidad de que se requieran transmitir 5 bits para obtener un bit con error.

c) Numero de bits que se espera que se deben transmitir para encontrar el primer error.

d) Varianza.

SOLUCION: a) X = {1, 2, 3, 4, . . . }

b) Notamos que p = 0.1 sustituimos en la formula P (X = 5) = f (5) = 0.1(1 0.1)51 =


0.1(0.9)4 = 0.066

49
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

1
c) Sustituimos en la formula = = 10
0.1
1p 1 0.1
d) V (X) = = = 90
p2 (0.1)2
Ejercicio 3.4.3. Cada muestra de aire tiene 10 % de probabilidad de contener una molecula
rara particular. Supon que las muestras son independientes con respecto a la presencia de la
molecula rara. Determina:

a) La probabilidad de que se necesiten analizar exactamente 5 muestras de aire para encontrar


la partcula rara.

b) La probabilidad de que se necesiten analizar menos de 4 muestras de aire.

c) La probabilidad de que se necesiten analizar al menos 2 pero no mas de 5.

d) La probabilidad de que se necesiten analizar mas de 3.

e) Valor esperado

f ) Varianza

3.4.5. Distribucion Poisson


Esta distribucion tiene que ver con conteo sobre un intervalo de los numeros reales, esto es por
ejemplo: se tiene que pasan en promedio 5 coches por minuto frente a la UACM. En este caso
el conteo fue 5 y el intervalo de los numeros reales es el minuto. Cual es la probabilidad de
que pasen 7 en 2 minutos? la descripcion de este caso lo hace la distribucion de Poisson pues
ahora en lugar de ser 1 minuto son 2 entonces lo que se esperara seran 10 coches.
La distribucion de Poisson lo primero que podemos describir es el valor esperado o media que
sera precisamente el promedio de conteos en dicho intervalo, para un minuto el valor esperado
es 5, para 2 minutos es 10, para 3 minutos es 15 etcetera, este valor esperado sera denotado
por . Ahora veamos la definicion formal de la distribucion de Poisson.

Definicion 3.10. Un experimento aleatorio que consta de conteos del resultado deseado en un
intervalo, donde los conteos en subintervalos son independientes. Con promedio en un intervalo
dado tiene una distribucion llamada de Poisson:
Variable aleatoria X = {0, 1, 2, 3, 4, 5, . . . }
e x
Funcon de masa f (x) =
x!
Valor esperado E(X) =

Varianza V (X) =

50
3.4. DISTRIBUCIONES DISCRETAS ESPECIALES

La siguiente grafica corresponde a la distribucion de Poisson con = 2.3

Ejemplo 3.4.4

Se presentan imperfecciones aleatoriamente a lo largo de un alambre delgado de cobre. Sea que


X denote el numero de imperfecciones y sigue una distribucion de Poisson con una media de 2.3
imperfecciones por milmetro.

a) Determina la probabilidad de exactamente 2 imperfecciones en 1 milmetro de alambre.

b) Determina la probabilidad de exactamente 3 imperfecciones en 2 milmetros de alambre.

c) Determina la probabilidad de al menos una imperfeccion en 2 milmetros de alambre.

d) Determina la probabilidad de a lo mas 3 imperfecciones en 1 milmetro de alambre.

e) Valor esperado

f) Varianza

51
3.5. OTRAS DISTRIBUCIONES DISCRETAS

SOLUCION: a) Como vamos a trabajar solo sobre un milmetro entonces = 2.3 y utilizamos
e2.3 2.32
la funcion de masa f (2) = = 0.265
2!
e4.6 4.63
b) Ahora trabajamos con 2 milmetros entonces duplicamos y obtenemos = 4.6 f (3) = =
3!
0.163

c) En este caso el calculo no es exacto usamos la desigualdad P (X 1). Como X tiene un numero
infinito de elementos utilizamos la propiedad de complemento:

P (X 1) = 1 P (X < 1) = 1 f (0)
e4.6 4.60
=1
0!
= 0.999

d) Nuevamente se trata de trabajar solo en un milmetro entonces = 2.3. Y nos preguntan

P (X 3) = f (0) + f (1) + f (2) + f (3)


e2.3 2.30 e2.3 2.31 e2.3 2.32 e2.3 2.33
= + + +
0! 1! 2! 3!
= 0.799

e) = 2.3

f) 2 = 2.3

Ejercicio 3.4.4. La contaminacion constituye un problema en la fabricacion de discos de al-


macenamiento optico. El numero de partculas de contaminacion que ocurre en un disco optico
tiene una distribucion de Poisson y el numero promedio de partculas por centmetro cuadrado
de superficie del disco es 0.1.

a) Encuentra la probabilidad de que ocurran 12 partculas en 100 cm cuadrados del disco.

b) Encuentra la probabilidad de que ocurran cero partculas en 50 cm cuadrados del disco.

c) Determina la probabilidad de que 3 o menos partculas ocurran en 100 cm cuadrados.

3.5. Otras distribuciones discretas


3.5.1. Distribucion Binomial Negativa
Esta distribucion corresponde a la pregunta cuantos ensayos se necesitan para obtener r re-
sultados deseados?

52
3.5. OTRAS DISTRIBUCIONES DISCRETAS

Definicion 3.11. En una serie de ensayos tipo Bernoulli independientes, la probabilidad p del
resultado deseado, sea la variable aleatoria X denote el numero de ensayos hasta que ocurran
r de estos resultados deseados. Entonces X tiene una distribucion binomial negativa.
Variable aleatoria X = {r, r + 1, r + 2, r + 3, r + 4, r + 5, . . . }
!
x1
Funcon de masa f (x) = pr (1 p)xr
r1
r
Valor esperado =
p
r(1 p)
Varianza 2 =
p2

Ejemplo 3.5.1

Una empresa de reclutamiento encuentra que el 30 % de los aspirantes para determinado puesto
en la industria tienen conocimientos avanzados de programacion de computadoras. Supongase que
se tienen tres puestos en los que se necesitan conocimientos avanzados de programacion. Si se
seleccionan los solicitantes uno a uno en forma independiente y al azar, calcular:
a) La variable aleatoria X

b) La probabilidad de que se encuentre al tercer aspirante calificado en la quinta entrevista.

c) La probabilidad de que se necesiten a lo mas 6 entrevistas.

d) Cuantas entrevistas se esperan hacer?


SOLUCION: a) Son r = 3 plazas entonces X = {3, 4, 5, . . . }

b) Notamos que p = 0.3 es la probabilidad de que tengan conocimientos avanzados de programacion.


! !
51 4
P (X = 5) = f (5) = 0.33 (1 0.3)53 = 0.33 (0.7)2 = 0.0794
31 2

c)
P (X 6) = f (3) +
! f (4) + f (5) + f (6)
!
2 3
= 0.33 (0.7)0 + 0.33 (0.7)1 +
2
! 2
!
4 5
0.33 (0.7)2 + 0.33 (0.7)3
2 2
= 0.256

53
3.5. OTRAS DISTRIBUCIONES DISCRETAS

r 3
d) = = = 10.
p 0.3
Esto es se espera hacer 10 entrevistas.

Ejercicio 3.5.1. Supon que la probabilidad de que Shaquille ONeal anote una canasta es 0.6.
Supon que los tiros son eventos independientes, y sea que la variable aleatoria X denote el
numero de tiros hasta que anota 4 canastas. Calcula:

a) La probabilidad de que necesite exactamente 10 tiros.

b) La probabilidad de que necesite mas de 5 tiros.

c) El numero de tiros que se espera hasta obtener las 4 canastas.

Cada uno de los ensayos, cuestan tiempo o dinero. Podemos calcular ademas tiempos y costos
las funciones correspondientes. Las cuales podemos incorporar a las distribuciones pues estan
en funcion del numero de ensayos, para hacer estos calculos usamos el siguiente teorema.

Teorema 3.1. Para cualquier variable aleatoria X y constantes a y b cualesquiera tenemos


que:
E(aX + b) = aE(X) + b y V (aX + b) = a2 V (X)

Ejemplo 3.5.2

Un gran lote de bombas usadas contiene un 20 % de ellas que no sirven y necesitan reparacion. Se
manda a un mecanico con tres juegos de refacciones. Selecciona bombas al azar y las prueba una
tras otra. Si trabaja una bomba, prosigue con la siguiente. Si no trabaja, le instala uno de sus juegos
de refacciones. Supongase que tarda 10 minutos en probar si una bomba trabaja o no, y 30 minutos
en probar y reparar una bomba que no trabaja. Calcular el valor esperado y la varianza del tiempo
total que le llevara terminar con sus tres juegos.
SOLUCION: Como va a seguir intentando hasta que se acaben sus 3 juegos de refacciones, se
trata de una distribucion binomial negativa con p = 0.2, r = 3 y X = {3, 4, 5, 6, . . . }. Pero si
encuentra una que no sirve le tomara otro rato repararla.
Si le toma x intentos en encontrar las tres bombas descompuestas. x 3 ocuparan solo su tiempo
de revision y 3 el tiempo de reparacion.
Esto es la funcion tiempo es: t(x) = 10(x 3) + 30(3) = 10x 30 + 90 = 10x + 60. Usamos el
teorema y metemos esta funcion en el valor esperado esto es:
 
3
E(t(x)) = E(10x + 60) = 10(E(x)) + 60 = 10 + 60 = 210
0.2

54
3.5. OTRAS DISTRIBUCIONES DISCRETAS

(3)(0.8)
V (10x + 60) = 102 V (x) = 102 = 6000
0.22
Se espera que le tome 210 minutos y la varianza es de 6000 minutos cuadrados.

Ejercicio 3.5.2. Se examina a los empleados de un negocio de fabricacion de aislantes para ver
si hay asbesto en sus pulmones. Se pide a la empresa que mande a tres empleados cuyos resul-
tados fueron positivos a un centro medico para mayores examenes. Si el 40 % de los empleados
tuvieron resultados positivos en la detencion asbesto en sus pulmones:

a) Calcular la probabilidad de que se deba analizar a diez empleados para encontrar a tres con
asbesto en sus pulmones.

b) Si cada analisis cuesta $200, calcular el valor esperado y la varianza del costo total de llevar
a cabo las pruebas para encontrar tres empleados con resultados positivos.

Otra distribucion discreta es la llamada hipergeometrica la cual ya no usa ensayos tipo Bernoulli
independientes. Si te interesa puedes consultar en la bibliografa.

55
3.5. OTRAS DISTRIBUCIONES DISCRETAS

56
4
Variable aleatoria continua

4.1. Variables aleatorias continuas y sus propiedades

Definicion 4.1. Se dice que una variable aleatoria X es continua si puede tomar un numero
infinito de valores posibles asociados con intervalos de numeros reales.

Definicion 4.2. La funcion f (x) es llamada funcion de densidad de probabilidad y cumple:

i. f (x) 0 para toda x X

Z
ii. f (x)dx = 1

Z b
iii. P (a X b) = f (x)dx1
a

Consideremos la funcion f (x) = 0.3x2 + 0.1 cumple con las especificacines para ser una funcion
de masa en el intervalo [0, 2] y el area bajo la curva, es decir, la integral es igual con 1. Como
podemos apreciar en la siguiente figura:

1
Notemos que P (a < X b) = P (a X < b) = P (a < X < b)

57
4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES

Definicion 4.3. La funcion de distribucion de una variable aleatoria X se define como:


Z b
F (b) = f (x)dx = P (X b)

Definicion 4.4. Suponga que X es una variable alatoria continua con funcion de densidad de
probabilidad f (x) entonces:
La media o el valor esperado de X es:
Z
= E(X) = xf (x)dx

La varianza:
Z
2
= V (X) = x2 f (x)dx 2

Ejemplo 4.1.1

La funcion de densidad de la variable aleatoria X de la vida util de una batera dado en cientos de
horas: (
1 x2
2
e Si x > 0
f (x) =
0 Si x 0

a) Determina si se trata de una funcion de densidad de probabilidad.

58
4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES

b) Obten una formula para la funcion de distribucion F (x).

c) Cual es la probabilidad de que dure menos de 200 horas?

d) Calcular la probabilidad que dure mas de 400 horas.

e) Determina la probabilidad de que la batera dure mas de 250 horas pero menos de 500.

f) Determina media.

g) Determina varianza.

SOLUCION: a) Primero tenemos que calcular la integral y verificar que da 1. En este caso
tenemos una integral impropia:
Z Z b
1 x 1 x x
 b
 b
e 2 dx = lm e 2 dx = lm e 2 |b0 = lm e 2 + e0 = 1 lm e 2 = 1
0 2 b 0 2 b b b
Z x
1 x x x x
e 2 dx = e 2 |x0 = e 2 + e0 = 1 e 2

b) F (x) = P (X x) =
0 2
2
c) 200 horas corresponde a 2 cientos de horas por lo tanto P (X < 2) = F (2) = 1 e 2 = 0.63
4
d) 400 horas corresponde a 4 cientos de horas P (X > 4) = 1 P (X 4) = 1 (1 e 2 ) = 0.14

e) Esta probabilidad la podemos calcular de dos formas:


Z 5
1 x x 5 2.5
i. P (2.5 < X < 5) = = e 2 dx = e 2 |52.5 = e 2 + e 2 = 0.20
2.5 2
5
 2.5

ii. P (2.5 < X < 5) = F (5) F (2.5) = 1 e 2 1 e 2 = 0.20

   Z b 
1 x
Z 
x2 x2 x2 x b b b

f) = x e 2 dx = lm xe + e = lm xe 2e |0 = lm be 2 2e 2 (0
2

0 2 b 0 b b
2
Z
x
g) Al igual que el ejercicio anterior se usa integracion por partes y se obtiene V (X) = x2 e 2 dx
0
2 = 4

Ejercicio 4.1.1. Sea que la variable aleatoria continua X denote el diametro de un agujero
taladrado en un componente metalico. El diametro especificado es 12.5 mm la mayora de las
perturbaciones aleatorias del proceso resultan en diametros mayores. Datos historicos indican
que la distribucion de X puede modelarse con la funcion de densidad de probabilidad f (x) =
20e20(x12.5) para x 12.5.

1. Verifica que se trata de una funcion de densidad.

59
4.1. VARIABLES ALEATORIAS CONTINUAS Y SUS PROPIEDADES

2. Determina F (x)

3. Un componente se desecha si tiene mas de 12.6 milmetros Cual es la probabilidad de


desechar un componente?

4. Que proporcion de componentes tiene entre 12.5 y 12.6 milmetros?

5. Determina

6. Determina V (X)

Como F (x) resulta de integrar la funcion de densidad f (x). f (x) se pude obtener derivando
F (x).
d
As f (x) = dx
(F (x))

Ejemplo 4.1.2

El tiempo para que una reaccion qumica se complete (en milisegundos), se aproxima con la funcion
de distribucion
( acumulada siguiente:
0 si x < 0
F (x) =
1e 0.01x
si x 0

a) Cual es la funcion de densidad?

b) Que proporcion de las reacciones se completa en menos de 200 milisegundos?

c) Que proporcion entre 100 y 300 milisegundos?

d) Cual es el tiempo esperado de la reaccion qumica?

SOLUCION: a) La funcion de densidad f la obtenemos derivando la funcion de distribucion


acumulada F .
( (
d0
dF (x) dx
si x < 0 0 si x < 0
f (x) = = d1e
=
dx
0.01x
dx
si x 0 0.01e0.01x si x 0
Z 200
b) P (X < 200) = f (x)dx = F (200) = 1 e0.01(200) = 0.864
0

c) P (100 < X < 300) = F (300) F (100) = 1 e0.01(300) (1 e0.01(100) = 0.318


Z Z
b
d) = xf (x)dx = x(0.01e0.01xdx = lm xe0.01x 100e0.01x 0 = 100.
0 b

Esto es el tiempo esperado es de 100 milisegundos.

60
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

4.2. Distribuciones continuas especiales


4.2.1. Distribucion Uniforme
Definicion 4.5. Una variable aleatoria continua X con funcion de densidad de probabilidad
1
f (x) = si a x b tiene una distribucion uniforme.
ba

b
1 1 1
Z
dx = x |ba = (b a) = 1
a ba ba ba

b+a
E(X) =
2

(b a)2
V (X) =
12

Ejemplo 4.2.1

Sea que la variable aleatoria continua X denote la corriente medida en un alambre delgado de cobre
en miliamperes. Supon que el rango de X es [0, 10 mA] y que tiene distribucion uniforme.

a) Determina: funcion de densidad, funcion acumulada, valor esperado, varianza y desviacion estandar.

b) Cual es la probabilidad de que una medicion de la corriente este entre 5 y 10?

SOLUCION: a = 0 y b = 10
1 1
f (x) = =
Z x 0
10 10
1 x x x
F (x) = dx = | =
0 10 10 0 10
10 + 0
E(X) = =5
2
(10 0)2
V (X) = = 8.33
12
= 2.887
10 5
Para el inciso b P (5 < X < 10) = F (10) F (5) = = 0.5
10 10
Ejercicio 4.2.1. Supon que X tiene una distribucion continua uniforme en el intervalo [1.5, 5.5].

a) Determina: funcion de densidad, funcion acumulada, valor esperado, varianza y desviacion


estandar.

b) P (X < 2.5)

61
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

c) P (2 < X < 4)

d) P (X 3)

4.2.2. Distribucion Exponencial


El equivalente discreto a esta distribucion es la distribucion geometrica, ya que la distribu-
cion exponencial es la distribucion de probabilidad del tiempo transcurrido hasta la primera
ocurrencia de un suceso de Poisson.

Definicion 4.6. La variable aleatoria X que es igual a la distancia entre conteos sucesivos de
un proceso de Poisson tiene una distribucion exponencial con parametro > 0.
La funcion
Z de densidad de probabilidad de X es f (x) = ex para x 0
 1
E(X) = x ex dx =
0
1
V (X) = 2

Por otro lado si se trata de la exponencial con media E(X) = entonces estoy partiendo de la
1
media la cual por la definicion tenemos que E(X) = = haciendo el despeje tenemos que

1
= y sustituyo adecuadamente en la integral.

Ejemplo 4.2.2

En una red de computadoras de una gran corporacion, el acceso de usuarios al sistema puede
modelarse como un proceso de Poisson con una media de 25 accesos por hora. Sea X denote el
tiempo en horas desde el principio del intervalo hasta el primer acceso.

a) Cual es la probabilidad de que no haya accesos en un intervalo de 6 minutos?

b) Cual es la probabilidad de tener el siguiente acceso este entre 2 y 3 minutos.

c) Determina el intervalo de tiempo tal que la probabilidad que no haya accesos en el intervalo sea
0.9.

d) Determina, el tiempo promedio hasta el siguiente acceso

e) La desviacion estandar

SOLUCION: Notamos que = 25 por hora y pero notamos que las preguntas estan en minutos
25 5
entonces hacemos el cambio = =
60 12
62
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

6
5 5x
Z  
5
12 x 6 30 30
a) P (X > 6) = 1 P (X 6) = 1 e 12 dx = 1 e |0 = 1 e 12 + 1 = e 12 =
0 12
0.082
3
5 5x
Z
5 15 10
b) P (2 < X < 3) = e 12 dx = e 12 x |32 = e 12 + e 12 = 0.148
2 12
Z t
5 5x 5 5
c) P (X > t) = 0.9 esto es P (X t) = 0.1 0.1 = e 12 dx = e 12 x |t0 = 1 e 12 t y ahora
0 12
despejamos t
5
1 e 12 t = 0.1
5
e 12 t = 0.9
5
t = ln 0.9
12  
12
t= ln 0.9
5
t = 0.253 minutos

1 12
d) E(x) = = = = 2.5
5 5
12
1
e) = = 2.5

Ejercicio 4.2.2. Sea que X denote el tiempo entre la deteccion de una partcula rara en un
contador Geiger y suponga que sigue un proceso de Poisson con media de 75 por minuto.

a) Cual es la probabilidad de que se detecte una partcula en un lapso de 30 segundos despues


de activar el contador?

b) Determina la probabilidad de que detecte una partcula entre los 15 y los 45 segundos.

c) Determina x tal que P (X < x) = 0.9

d) media y desviacion estandar.

Ejemplo 4.2.3

Una refinadora de azucar recibe azucar morena a granel. La cantidad de azucar que puede procesar
la refinadora en un da se puede representar mediante una funcion exponencial con una media de 4
(mediciones en toneladas) por da.

a) Calcular la probabilidad de que se procesen mas de 2 toneladas en un da determinado.

63
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

b) Calcular la probabilidad de que se procesen entre 1 y 3 toneladas de azucar.

c) Calcular la probabilidad de que se procesen menos de tres toneladas.


1
SOLUCION: En este caso nos dicen que = 4 entonces =
4
2
1 1x
Z h i2
1 2
a) P (X > 2) = 1 P (X 2) = 1 e 4 dx = 1 e 4 x = 1 + e 4 1 = 0.607
0 4 0

3
1 x
Z
 x 3 3 1
b) P (1 < X < 3) = e 4 dx = e 4 1 = e 4 + e 4 = 0.306
1 4
3
1 x
Z
 x 3 3
c) P (X < 3) = e 4 dx = e 4 0 = e 4 + 1 = 0.528
0 4
Ejercicio 4.2.3. En una zona de Estados Unidos se pueden modelar las magnitudes de los
terremotos mediante una distribucion exponencial cuyo promedio es 2.4 en la escala de Richter.
Calcular la probabilidad de que el siguiente temblor que se presente en esa zona sea:

a) mayor que 3.0 grados de la escala de Richter

b) entre 2.0 y 3.0 grados en la escala de Richter.

4.2.3. Distribucion Normal


Muchas encuestas o estadsticas tienen una distribucion normal, esto es en el centro se acumulan
la mayora de los datos, esta distribucion de datos tambien es conocida como la campana de
Gauss, un ejemplo de esto son las calificaciones, la gran mayora de los estudiantes de secundaria
sacan entre 7,8,9, pocos sacan 6 y pocos sacan 10.

Definicion 4.7. Una variable aleatoria X con funcion de densidad de probabilidad


1 (x)2
f (x) = e 22 para < x < )
2
E(X) = y V (X) = 2 tiene una distribucion normal con parametros y donde < <
y > 0.

Esta variable aleatoria tambien es denotada con X = N(, )

Ejemplo 4.2.4

Si la corriente en una tira de alambre sigue una distribucion normal, con una media de 10 mA y
una varianza de 4 mA2 esto es = 2.
1 (x10)2
La funcion de masa es f (x) = e 222 la grafica correspondiente es:
22

64
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

0.20

0.18

0.16

0.14

0.12

0.10

0.08

0.06

0.04

0.02

0.00
-5 0 5 10 15 20

Definicion 4.8. A una variable aleatoria normal con = 0 y 2 = 1 esto es = 1 se le llama


variable aleatoria normal estandar se denota como Z = N(0, 1).

La grafica correspondiente es:

0.40

0.35

0.30

0.25

0.20

0.15

0.10

0.05

0.00
-4 -3 -2 -1 0 1 2 3 4

Como veremos no es necesario que calculemos la integral para esta funcion, pues toda la infor-
macion se da en la tabla que se anexa. Para usarla entendemos que se tratan de los valores de

65
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

la funcion de distribucion acumulada de una variable aleatoria estandar que se denota como
z
1
Z
1 2
(z) = P (Z z) = e 2 u du
2

Observamos que la tabla tiene como columnas z y valores que van desde 0.09 hasta 0.00 del
lado negativo, del lado positivo tiene z y los valores desde 0.00 hasta 0.9.
Como renglones en la primer columna tenemos desde 3.9 hasta 0.0 del lado negativo y desde
0.0 hasta 3.9 del lado positivo. Lo demas son los valores que buscamos.
Ejemplo 4.2
P (Z < 1.32) Para encontrar el valor correspondiente buscamos 1.3 del lado positivo en el renglon,
despues nos movemos hasta la columna 0.02 esto es 1.32 = 1.3 + 0.02 y justo en la interseccion
del renglon 1.3 y la columna 0.02 encontramos el valor de la distribucion acumulada de la normal:
P (Z < 1.32) = 0.906582)
La grafica correspondiente es:

b) P (Z 1.53) = 0.936992

c) P (Z > 0.86) = 1 P (Z 0.86) = 0.194894

d) P (1.25 < Z < 0.37) = P (Z < 0.37) P (Z < 1.25) = 0.644309 0.105650 = 0.538659

e) P (Z 4.6) = 0 esto es practicamente cero


De estos ejemplos podemos desprender las siguientes propiedades:

66
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

Propiedades de la distribucion Normal Estandar

I. P (Z > a) = 1 P (Z a) = P (Z < a)

II. P (a < Z < b) = P (Z < b) P (Z < a)

III. P (z < Z < z) = 1 2P (Z < z)


Ejemplo 4.2
Ahora queremos determinar z tal que P (Z < z) = 0.78 para esto buscamos en la tabla el valor
mas cercano a 0.78 esto es z = 0.77

b) P (z Z z) = 0.99 usando las propiedades tenemos que 1 2P (Z < z) = 0.99


1 0.99
despejando tenemos que P (Z < z) = = 0.005 esto es z = 2.58 por lo que
2
concluimos que z = 2.58
Ejercicio 4.2.4. Usa la tabla para determinar las siguientes probabilidades
a) P (Z < 1.32)

b) P (Z < 3)

c) P (Z < 4.5)

d) P (Z 1.45)

e) P (Z < 6.1)

f ) P (Z > 2.15)

g) P (Z > 5)

h) P (2.34 < Z < 1.76)

i) P (Z 1.53)

j) P (Z 1.26)

Determinar z tal que

k) P (Z < z) = 0.9

l) P (z < Z < z) = 0.5

m) P (Z z) = 0.2

n) P (1.24 Z z) = 0.8

n) P (z Z z) = 0.68

67
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

Proceso de estandarizacion

La tabla corresponde a la normal estandar esto es cuando = 0y 2 = 1. Pero si tenemos


que X es una variable aleatoria normal con E(X) = y V (X) = 2 . Al restar la media y
dividir esta resta entre la desviacion estandar obtenemos la variable aleatoria continua normal
estandar:
X X E(X)
Z= podemos verificar que es normal estandar pues E(Z) = E( )= =

X V (X) 2
= 0 y V (Z) = V ( )= = =1
2 2

Ejemplo 4.2.7

Suponga que las mediciones de corriente de una tira de alambre siguen una distribucion normal con
una media de 10mA y una varianza de 4(mA)2

a) Cual es la probabilidad de que una medicion exceda 13 mA?

b) Cual es la probabilidad de que una medicion de corriente este entre 9 y 11mA?

c) Que medicion exceden el 90 % de los casos?



X 10 13 10

SOLUCION: a) P (X > 13) = 1 P (X 13) estandarizamos 1 P =
  2 2
3
1P Z = 1 0.933193 = 0.066807
2

9 10 X 10 11 10

P (9 < X < 11) = P < <
 2 2 2
1 1
b) =P <Z<
2 2
= P (Z < 0.5) P (Z < 0.5) = 0.691462 0.308538
= 0.382924

X 10 x 10
 
x 10

c) P (X > x) = 0.9 primero estandarizamos, P > = 0.9 P Z > =
 2 2 2
x 10
 
x 10
1P Z entonces P Z = 0.1 buscando en la tabla obtenemos que
2 2
x 10
= 1.28 despejando tenemos que x = 2(1.28) + 10 = 7.44 por lo tanto el 90 % de las
2
mediciones exceden los 7.44mA

Ejercicio 4.2.5. El diametro de un eje propulsor de almacenamiento optico tiene una distri-
bucion normal con una media de 0.2508 pulgadas y una desviacion estandar de 0.005 pulgadas.
Las especificaciones de los ejers son 0.2500 0.0015

68
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

a) Que proporcion de los ejes cumple con las especificaciones?

b) Cual es la probabilidad de que el diametro mida mas de 0.2512?

c) Que diametro exceden el 80 % de los casos?

4.2.4. Otras distribuciones


En estas notas no nos ocuparemos de otras distribuciones continuas solo las mencionaremos:

La distribucion Gamma estas funciones modelan situaciones no simetricas como la dura-


cion de bacterias, precipitaciones etcetera.

Distribucion ji-cuadrada 2 con grados de libertad. En estadstica, se usa el termino


grados de libertad que es el numero de observaciones menos el numero de parametros
desconocidos que se desean estimar con base a estas observaciones. Usaremos esta distri-
bucion mas adelante para estimar la varianza 2 cuando tenemos n observaciones por lo
cual usaremos n 1 grados de libertad.

La distribucion Beta esta definida en el intervalo 0 < x < 1, esta distribucion se usa para
trabajar con 2 probabilidades llamadas y .

La distribucion de Weibull, esta se usa par tiempos de vida util de componentes o sistemas.

La distribucion t de Student con grados de libertad. Podemos decir que la distribucion


t de Student es una especie de version generalizada de la distribucion normal estandar,
la cual sera precisamente una distribucion t con grados de libertad. Esta distribucion
la ocuparemos para hacer estimaciones de la media .

69
4.2. DISTRIBUCIONES CONTINUAS ESPECIALES

70
5
Estimaciones
La media muestral x es el promedio de los datos de la muestra. Pero es igual a ? Es mas
grande o mas pequena que ? Que tanto estan alejadas? Esto es lo que vamos a trabajar en
este captulo.
Nuestro objetivo es estimar y 2 , media y varianza poblacionales, conociendo los valores
muestrales x y s2 . Hay diversos trabajos con otras distribuciones pero en esta unidad nos
enfocaremos unicamente a la distribucion normal.

5.1. Teorema del Lmite Central


Teorema 5.1. Si se toma una variable aleatoria de tamano n de una poblacion cuya media es
y su varianza es 2 entonces el promedio X tiene una distribucion aproximadamente normal,
2
con media y varianza .
n
X
Por el teorema anterior tenemos que es aproximadamente normal estandar.

n
Esta aproximacion mejora a medida que aumenta el tamano de la muestra.
Hagamos primero experimentos en el hipotetico caso de qeu conocemos y pero no x.

Ejemplo 5.1.1

Las resistencias a la fractura de determinado tipo de vidrio son en promedio 14 (miles de libras por
pulgada cuadrada) y tienen una desviacion estandar igual a dos.

a) Cual es la probabilidad de que la resitencia promedio de fractura de 100 piezas de este vidio sea
mayor que 14.5?

b) Determinar un intervalo que abarque la resistencia promedio de la fractura de 100 muestras de


este vidrio, con unaprobabilidad de 0.95.

71
5.1. TEOREMA DEL LIMITE CENTRAL


SOLUCION: a) Notamos que nos estan preguntando P X > 14.5 y que nos dan como datos
que = 14 y que = 2. Entonces podemos estandarizar, pues de acuerdo con el Teorema de
Lmite Central X tiene una distribucion aproximadamente normal.
!
 X 14.5 14
P X > 14.5 = P > 2 = P (Z > 2.5) = 1P (Z 2.5) = 10.993790 =

n 100
0.00621
0.95 + 1
b) P (z < Z < z) = 0.95 esto es 2P (Z z) 1 = 0.95 P (Z z) = = 0.975
2
|z| = 1.96
 
x
Ahora resolvemos para x z =
. Despejando x = z n
+ .
n

El intervalo se obtiene pues tenemos dos soluciones para z. Esto es:


       
2 2
( z
n
,+ z
n
) = (14 1.96 100 , 14 1.96 100 ) = (13.608, 14.392).

Ejemplo 5.1.2

Se ha observado durante mucho tiempo que una maquina determinada para llenar botellas, tiene una
varianza en las cantidades de llenado aproximadamente de 2 = 1 onzas cuadradas. Sin embargo,
el promedio de las onzas de llenado depende de un ajuste que puede cambiar de da a da, o de
operador a operador. Si en un da se llevan a cabo n = 25 observaciones de la cantidad (onzas) de
lquido servido, todas con el mismo ajuste de maquina.
a) Calcular la probabilidad de que el promedio muestral quede dentro de 0.3 onzas de diferencia
con respecto al promedio verdadero de la poblacion , para ese ajuste.

b) Cuantas observaciones se deben efectuar en la muestra para que x quede a menos de 0.3 onzas
de con una probabilidad de 0.95?
SOLUCION: a) Tenemos que = 1, n = 25 y lo que nos estan preguntando es:
!
0.3 x + 0.3

0.3

0.3
P ( 0.3 < x < + 0.3) = P < < =P 1 <Z< 1 =

n n n 5 5
P (1.5 < Z < 1.5) =0.933193 0.066807 = 0.866386

b) En este caso me estan preguntando un valor simetrico que da dicha probabilidad esto es:
P (z < Z < z) = 0.95 Ahora le hacemos al reves y buscamos en la tabla que valores correspon-
0.3
den obteniendo z = 1.96 utilizando el inciso anterior tenemos que z = 1.96 = 1 despejamos

n
 2
1.96
de la ecuacion anterior tenemos n = = 42.42.684444.
0.3
Redondeado necesitamos hacer 43 observaciones para que x quede a menos de 0.3 onzas de .

72
5.1. TEOREMA DEL LIMITE CENTRAL

Con el inciso b del ejemplo anterior podemos obtener una formula para encontrar el numero de
observaciones necesario haciendo el despeje conveniente:
 2
z
n=
x
Ejercicio 5.1.1. 1. Se ha encontrado que las mediciones de resistencia al cortante de las
soldaduras de punto tienen una desviacion estandar aproximada de 10 lb/pulg 2 . Si se
miden 100 soldaduras de prueba:

a) calcular la probabilidad aproximada de que la media muestral x quede a + 1 lb/pulg 2


del promedio verdadero de la poblacion.
b) cuantas soldaduras de prueba se deben tomar para que la probabilidad sea aproxima-
damente de 95 %?

2. Los resistores de cierto tipo tienen resistencias que en promedio son de 200 Ohms, con
desviacion estandar de 10 ohms. Se utilizan 25 de ellos en un circuito. Calcular la pro-
babilidad de que la resistencia promedio de los 25 resistores este entre 199 y 202 ohms.

Definicion 5.1. Un estimador es una medida estadstica que especfica como utilizar los datos
de la muestra para estimar un parametro desconocido de la poblacion.

Un estimador es una variable aleatoria a la cual le podemos calcular valor esperado y varianza.

Definicion 5.2. Un estimador es insesgado para estimar si E() = .

Definicion 5.3. El sesgo se obtiene cuando el estimador no es insesgado y se calcula con


|E() |.

Definicion 5.4. Si se consideran todos los estimadores de al que tiene la menor varianza se
le llama estimador insesgado de varianza mnima.

Teorema 5.2. Si x1 , x2 , x3 , ..., xn es una muestra aleatoria de tamano n de una distribucion


normal con media y varianza 2 , entonces la media muestral x es un estimador insesgado de
varianza mnima de .

El estimador insesgado de varianza mnima de 2 es la varianza muestral s2 .


Cuando se reporta el valor numerico o estimacion puntual de un parametro, es conveniente
saber el error correspondiente.

Definicion 5.5. El error estandar del estimador x es la desviacion estandar por el teorema del

lmite central tenemos = .
n

73
5.1. TEOREMA DEL LIMITE CENTRAL

s
En caso de que no conozcamos usamos s podemos obtener un error estimado estandar = .
n

Ejemplo 5.1.3

Un artculo del Journal of Heat Transfer (Trans. ASME, Secc. C, 96, p. 59) describa un nue-
vo metodo para medir la conductividad termica del hierro Armco. Utilizando una temperatura de
100 F y una alimentacion de energa de 550 W , se obtuvieron las siguientes 10 mediciones de la
conductividad termica (en Btu/hr pie F ):
41.60, 41.48, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04

a) Calcular x y su error.

b) Comparar el error con x calculando que porcentaje representa el error con respecto a la media
obtenida. Es un buen estimador?

x x2
41.60 1730.56
41.48 1720.5904
42.34 1792.6756
41.95 1759.8025
41.86 1752.2596
SOLUCION: a)
42.18 1779.1524
41.72 1740.5584
42.26 1785.9076
41.81 1748.0761
42.04 1767.3616
2
x = 419.24 x = 17576.9442
x nx2 ()2
n = 10; x = = 41.924; s2 = = 0.0807 y por lo tanto s = 0.284.
n n(n 1)
s 0.284
Como no tenemos entonces podemos calcular el error estimado estandar = = =
n 10
0.0898
(0.0898)(100)
b) Tenemos que 100 = = 0.214 %
x 41.924
Como el error es el 0.214 % del valor estimado podemos concluir que es un buen estimador.

Ejercicio 5.1.2. Cinco temperaturas maximas de la ciudad de Florida en grados celsius fueron:
22, 20, 24,21 y 26.

74
5.2. INTERVALOS DE CONFIANZA

a) Calcular x y su error.

b) Comparar el error con x calculando que porcentaje representa el error con respecto a la
media obtenida. Es un buen estimador?

5.2. Intervalos de Confianza


Los metodos de los intervalos de confianza deben dar valores entre los que puede estar el
parametro que se esta estimando con un indicador de confianza.

Definicion 5.6. Suponga que X es una variable aleatoria cuya probabilidad depende de un
parametro desconocido . Dada una muestra aleatoria x1 , x2 , x3 , ...xn dos estadsticas L1 y L2
forman un intervalo de confianza del 100(1 ) % para si P (L1 L2 ) 1 . Sin
importar el valor desconocido de .

5.2.1. Intervalos de confianza para con conocida


Sabemos que x tiene una distribucion aproximadamente normal con media y desviacion

estandar . El intervalo de confianza es:
n

x z 2 , x z 2 con (1 )100 % de confianza.

Como se obtiene esto, recordemos que lo que queremos es encontrar B tal que P ( B X)
+ B) = 1 . La grafica correspondiente es la siguiente:


2 1 2

B +B

Esto es queremos encontrar un valor z 2 que corresponda a + B pero estandarizado lo llama-


remos valor crtico.

75
5.2. INTERVALOS DE CONFIANZA


2 1 2
z z
2 2

!
X
 

As estandarizado 1 = P z 2 z 2 = P z 2 X z 2 =
n n
  n

P X z 2 X + z 2
n n

Ejemplo 5.2.1

Se estudiaron 50 observaciones de la vida util de bateras de cierto tipo, se obtuvo un promedio


x = 2.266 y se sabe que la desviacion estandar es 1.935. Construye el intevalo de confianza con un
coeficiente de confianza igual a 0.95.
SOLUCION: n = 50, x = 2.266, = 1.935. Como se quiere el 0.95 de confianza tenemos que

1 = 0.95, = 1 0.95 = 0.05 Entonces = 0.025 y buscando en la tabla tenemos que
2
z 2 = 1.96.
Entonces el intervalo de  confianza
 es:    

1.935 1.935
x z 2 n , x + z 2 n = 2.266 1.96 , 2.266 + 1.96 = (1.730, 2.802)
50 50

Ejercicio 5.2.1. Para una muestra aleatoria de 50 mediciones de resistencia a la ruptura de


hebras de algodon, se encontro que la resistencia promedio era 210 gramos y la desviacion
estandar 18 gramos. Obtener un intervalo de confianza para la verdadera resistencia de ruptura
promedio de las hebras de algodon de este tipo, con una confianza igual a 0.90.

Ahora supongamos que queremos estimar el numero de observaciones para que x quede a B
de con un nivel de confianza 1 .
z
Esto es el intervalo que queremos es que el intervalo de confianza x 2 = x B. Esto es
n
z 2  z 2
B = x entonces n = 2

n B

76
5.2. INTERVALOS DE CONFIANZA

Ejemplo 5.2.2

Se desea estimar la distancia promedio que recorren los empleados de una empresa muy grande
camino a su trabajo. Los estudios anteriores de este tipo indican que la desviacion estandar de esas
distancias debe estar cercana a las 2 millas. Cuantos empleados deben muestrearse si la estimacion
debe quedar a menos de 0.1 millas del promedio verdadero, con un coeficiente de confianza de 0.95?

SOLUCION: = 2, B = 0.1, 1 = 0.95, = 0.05 y 2
= 0.025 entonces z/2 = 1.96.
 z 2  1.96(2) 2
2
n= = = 1536.64.
B 0.1
Se deben muestrear 1537 empleados.

Ejercicio 5.2.2. La resistencia a la ruptura de los hilos tiene una desviacion estandar de 18
gramos. Cuantas mediciones de resistencia a la ruptura deben hacerse en el siguiente experi-
mento, si la estimacion de la resistencia promedio de ruptura debe estar a menos de 4 gramos
de la resistencia verdadera a la ruptura, con un coeficiente de confianza igual a 0.90?

5.2.2. Intervalo de confianza para con desconocida


En este caso tenemos una muestra de tamano n y podemos calcular s si no nos dan . Ya no
usamos la distribucion normal cambiamos a la distribucion t de Student con n 1 grados de
libertad.
x
Ahora ocupamos la tabla t de Student T = s con n 1 grados de libertad.

n
Esta distribucion es aproximadamente igual a Z cuando n 30.
El intervalo de confianza en este caso es analogo a la normal.
Si x1 , x2 , ..., xn es una muestra aleatoria de una distribucion normal entonces el intervalo de
confianza es x t 2 sn con n 1 grados de libertad con una confianza de (1 ) %.

Ejemplo 5.2.3

El alambre pretensado para reforzar tubos de concreto se fabrica en rollos grandes. En una inspeccion
de control de calidad se prueban 5 muestras de un rollo y se mide su resistencia maxima a la tension,
RMT . Los resultados de las mediciones, en un rollo de lb/pulg 2 , fueron 253, 261, 258, 255 y 256.
Con estos datos, determinar una estimacion de intervalo de confianza del 95 % del RMT promedio
verdadero para el rollo que se muestreo.

77
5.3. INTERVALOS DE CONFIANZA PARA 2

x x2
253 64009
261 68121
SOLUCION: 258 66564
255 65025
256 65536
x = 1283 x2 = 329255
5(329255) (1283)2
n = 5, x = 256.6, s2 = = 9.3 y s = 3.049.
5(4)
= 0.05 entonces /2 = 0.025.
t/2 con 4 grados de libertad es: t0.025 = 2.776
s 9.3
x t 2 = 256.6 2.776 = 256.6 3.7859 = (252.814, 260.3859)
n 5
Ejercicio 5.2.3. La resistencia a la ruptura en el sentido de la urdimbre de 5 especmenes de
determinada tela, fue en promedio 180lb/pulg 2 con desviacion estandar muestral de 5lb/pulg 2.
Estimar resistencia de ruptura verdadera en el sentido de la urdimbre para telas de este tipo
con un intervalo de confianza de 95 %.

5.3. Intervalos de confianza para 2


Ahora toca el turno a varianza 2 cuyo estimador es s2 si seguimos teniendo una distribucion
aproximadamente normal.

Teorema 5.3. Suponga que x1 , x2 , ..., xn es una muestra aleatoria X con media y varianza
n
2
X (xi )2
Entonces Y = 2
tiene una distribucion 2 con n 1 grados de libertad.
i=1

Teorema 5.4. Suponga que X1 , X2 , X3 , ..., Xn es una variable aleatoria de una variable alea-
toria normal. Entonces:
(xi x)2 s2 (n 1)
=
2 2
es una variable aleatoria 2 con n 1 grados de libertad y s2 y x son variables aleatorias
independientes.

Con el teorema anterior podemos definir el intervalo de confianza para 2 con una confianza
del100(1 ) %.
(n 1)s2

2 2
P 1/2 /2 = 1
2
Trabajando la desigualdad para!dejar sola a 2 obtenemos:
(n 1)s2 2 (n 1)s2
P =1
2/2 21/2
Por lo tanto el intervalo de confianza para 2 con (1 )100 % de confianza es:

78
5.3. INTERVALOS DE CONFIANZA PARA 2

!
(n 1)s2 2 (n 1)s2

2/2 21/2

Ejemplo 5.3.1

En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de


los resultados que producen muestras estandar. En un estudio de la cantidad de calcio en el agua
potable, el cual se efectua como parte del control de calidad de una agua, se analizo seis veces
la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes de millon
fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar 2 usando un intervalo de confianza de 90 %.
x x2
9.54 91.0116
9.61 92.3251
9.32 86.8624
SOLUCION:
9.48 89.8704
9.70 94.09
9.26 85.7476
x = 56.91 x2 = 539.9341
59.41 6(539.9341) (56.41)2
x = = 9.485, s2 = = 0.02855.
6 6(5)
2 2

 = 0.1 entonces /2 = 0.05 con 5 grados de libertad 0.05 = 11.07 0.95 = 1.15.
(6 1)0.02855 (6 1)(0.02855)
, = (0.1241, 0.128)
11.07 1.15
Ejercicio 5.3.1. Estimar la varianza verdadera de las mediciones de resistencia, en un in-
tervalo de confianza de 90 %, si una muestra de 15 resistores presento resistencias con una
desviacion estandar muestral igual a 0.5 ohms.

79
5.3. INTERVALOS DE CONFIANZA PARA 2

80
6
Pruebas de hipotesis
Definicion 6.1. A un proceso que lleva a una decision acerca de una hipotesis particular se
llama prueba de hipotesis.

Las posibles decisiones son Rechazar, No rechazar. Como trabajaremos con una muestra en-
tonces asegurar algo sobre la poblacion sera muy descuidado.
Los procedimientos de prueba se basan en el uso de la informacion contenida en una muestra
aleatoria de la poblacion de interes.
En este caso la hipotsis nula es la hipotesis que quiere probarse. El rechazo de la hipotesis nula
lleva a No rechazarla hipotesis alterna.
Los errores en los que podemos caer al trabajar pruebas de hipotesis son 2.

Definicion 6.2. El error de tipo I se define como el rechazo de la hipotesis nula H0 cuando
esta es verdadera.

Definicion 6.3. El error de tipo II se define como el no rechazo de la hipotesis nula H0


cuando esta es falsa.

Rechazar H0 No rechazar H0
H0 es cierta Error de tipo I Decision correcta
H0 es falsa Desicion correcta Error de tipo II
Debido a que la decision que se toma esta basada en variables aleatorias puede asociarse pro-
babilidades a los errores de tipo I y tipo II.
La probabilidad de incurrir en un error de tipo I se denota por la letra griega . Tambien se le
llama nivel de significacion o amplitud de la prueba.

6.1. Pruebas de hipotesis para


En este caso tenemos tres casos para la hipotesis nula.

81
6.1. PRUEBAS DE HIPOTESIS PARA

6.1.1. Prueba de hipotesis para de dos colas


H0 : = 0 esto quiere decir que la hipotesis afirma que la 0 dada es igual a la de la poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : 6= 0 .

Intervalo
de
confianza
2 1 2

punto crtico punto crtico

Region
Region de Region
de aceptacion de
rechazo rechazo
punto crtico punto crtico

El estadstico de prueba que usamos cuando conocemos es:

x 0
z0 =

n

H0 no se rechaza si |z0 | < z/2


H0 se rechaza si |z0 | > z/2
El estadstico en caso de que no conozcamos es:

x 0
t0 =
s
n

H0 no se rechaza si |t0 | < t/2


H0 se rechaza si |t0 | > t/2

82
6.1. PRUEBAS DE HIPOTESIS PARA

6.1.2. Prueba de hipotesis para cola derecha

H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es mayor que la de la
poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : < 0 .

1
Region
Region de
de aceptacion
rechazo
punto crtico

El estadstico de prueba que usamos cuando conocemos es:

x 0
z0 =

n

H0 no se rechaza si z0 > z
H0 se rechaza si z0 < z
El estadstico en caso de que no conozcamos es:

x 0
t0 =
s
n

H0 no se rechaza si t0 > t
H0 se rechaza si t0 < t

6.1.3. Prueba de hipotesis para de cola izquierda

H0 : 0 esto quiere decir que la hipotesis afirma que la 0 dada es menor que la de la
poblacion.
La hipotesis alterna es el complemento de la hipotesis nula H1 : > 0 .

83
6.1. PRUEBAS DE HIPOTESIS PARA

1
Region
de Region
aceptacion de
rechazo
punto crtico punto crtico

El estadstico de prueba que usamos cuando conocemos es:

x 0
z0 =

n

H0 no se rechaza si z0 < z
H0 se rechaza si z0 > z
El estadstico en caso de que no conozcamos es:

x 0
t0 =
s
n

H0 no se rechaza si t0 < t
H0 se rechaza si t0 > t

Ejemplo 6.1.1

Los sistemas de expulsion de la tripulacion de un avion son impulsados por una carga propulsora
solida. La rapidez de combustion de esta carga propulsora es una caracterstica importante del
producto. Las especificaciones requieren que la rapidez de combustion media debe ser 50cm/s. Se
sabe que la desviacion estandar de la rapidez de combustion es = 2cm/s. El analista decide
especificar una probabilidad del error tipo I o nivel de significacion de = 0.05. Selecciona una
muestra aleatoria de n = 25 y obtiene un promedio muestral de la rapidez de combustion de
x = 51.3cm/s. Considera como H0 : = 50. Cual es tu conclusion?

SOLUCION: Tenemos que se trata de una hipotesis de dos colas:

84
6.1. PRUEBAS DE HIPOTESIS PARA

=2
H0 : = 50 /2 = 0.025 x 0 51.3 50
z0 = = = 3.25
H1 : 6= 50 n = 25 2
n 25
x = 51.3
Por otro lado z0.025 = 1.96. Ahora como tenemos que z/2 < z0 entonces la hipotesis se rechaza.
Conclusion: Rechazamos la hipotesis de que = 50 con un nivel de significacion de 0.05.

Ejemplo 6.1.2

El ajuste de profundidad de determinado taladro de columna es dos pulgadas. Entonces, se podra


suponer que la profundidad promedio de todos los agujeros barrenados por esta maquina es = 2
pulgadas. Para comprobar esta hipotesis, as como la exactitud del calibre de profundidades, se
midio una muestra aleatoria de n = 100 agujeros barrenados por esa maquina y se encontro un
promedio de muestra x = 2.005 pulgadas con una desviacion estandar de = 0.03 pulgadas. Si Se
puede rechazar la hipotesis con base en los datos de la muestra?
SOLUCION: Tenemos que otra vez se trata de una hipotesis de dos colas:
= 0.03
H0 : = 2 /2 = 0.025 x 0 2.005 2
z0 = = 0.03 = 1.6667
H1 : 6= 2 n = 100
n

100
x = 2.005
Otra vez ocupamos z/2 = 1.96. Como z/2 > z0 no podemos rechazar la hipotesis de que = 2.
Conclusion: no se puede rechazar la hipotesis de que la media = 2 pulgadas con un nivel de
significacion de 0.05.

Ejercicio 6.1.1. Un vicepresidente de una gran empresa afirma que el numero de llamadas
solicitando servicio al equipo que vende su empresa no es mas de 15 por semana, en promedio.
Para comprobar su afirmacion, se revisaron los registros de servicio para 36 semanas seleccio-
nadas al azar, y el resultado fue que x = 17 y la varianza muestral de 19 para los datos de las
muestras. Contradice la evidencia de la muestra la afirmacion del vicepresidente al nivel de
significacion de 5

Ejercicio 6.1.2. La tension de salida de determinado circuito electrico debe ser 130, de acuerdo
con las especificaciones. Una muestra de 40 mediciones independientes de la tension de este
circuito dio un promedio de x = 128.6 y una desviacion estandar muestral de 2.1. Se quieren
hacer las dos pruebas siguientes con un nivel de significacion

a) Probar la hipotesis de que la tension promedio de salida es 130.

b) Probar la hiportesis de que la tension promedio de salida es no es mayor a 130.

85
6.2. PRUEBAS DE HIPOTESIS PARA Y 2

Ejemplo 6.1.3

Un artculo de la revista Materials Engineering (Vol. II, No. 4, pp. 275-281) describe los resultados
de las pruebas por traccion para la adhesion en 22 muestras de la aleacion U-700. Las cargas en
que fallaron las muestras (en MPa) son las siguientes: 19.8 18.5 17.6 16.7 15.8 15.4 14.1 13.6 11.9
11.4 11.4 8.8 7.5 15.4 15.4 19.5 14.9 12.7 11.9 11.4 10.1 7.9
La media muestral 13.71 es y la desviacion estandar resulta 3.55 Los datos sugieren que la carga
para la falla media excede 10? Supon que la carga para la falla tiene una distribucion normal, y usa
= 0.05.
n = 22
H0 : > 10 x = 13.71 x 13.71 10
SOLUCION: t0 = = = 4.901
H1 : 10 s = 3.55 s 3.55
n 12
= 0.05
Tenemos que t0.05 = 1.721 con 21 grados de libertad.
Como t0 > t no se rechaza.
Conclusion: No se rechaza la hipotesis de que la media exceda 10.

Ejercicio 6.1.3. Los anchos de las ventanas de contacto de determinados chips para circuito
integrado tienen especificacion de diseno de 3.5m. (Vease los detalles en M. S. Phadke et.
al., The Bell System Technical Journal, 62, No. 5. 1983, paginas 1273 a 1309.) Los anchos de
ventana despues del ataque qumico en los especmenes de prueba fueron como sigue: 3.21, 2.49,
2.94, 4.38, 4.02, 3.82, 3.30, 2.85, 3.34, 3.91. Se podra rechazar la hipotesis de que se cumple
con la especificacion en el nivel de significacion del 5 %?

6.2. Pruebas de hipotesis para y 2


Si se desea probar una hipotesis acerca de la varianza o la desviacion estandar se pude ha-
cer utilizando el intervalo de confianza que construimos en el captulo anterior usando como
estadstico
(n 1)s2
20 = .
02
Al igual que la media vamos a tener pruebas de una y dos colas. Las cuales podemos resumir en
(n 1)s2
la siguiente tabla usando como estadstico en todos los casos 20 = y tenemos n 1
02
gracos de libertad.

86
6.2. PRUEBAS DE HIPOTESIS PARA Y 2

Hipotesis No se rechaza Se rechaza Colas


H0 : 2 = 02
21/2 < 20 < 2/2 Si 21/2 > 20 o 2/2 < 20 2
H1 : 2 6= 02

H0 : 2 02
2 > 20 Si 2/2 < 20 1
H1 : 2 > 02

H0 : 2 02
21 < 20 Si 21 > 20 1
H1 : 2 < 02

Ejemplo 6.2.1

Una determinada compana que produce una parte maquinada para un motor, afirma que tiene una
varianza de diametro no mayor que 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes
dio una varianza muestral s2 = 0.0003. Hay evidencia para refutar lo que afirma el proveedor
usando = 0.05 ?
n = 10
H0 : 2 0.0002 (n 1)s2 9(0.0003)
SOLUCION: s2 = 0.0003 20 = 2
= = 13.5
H1 : 2 > 0.0002 0.0002
= 0.05
Como 20.05 = 16.92 y 2 > 20 . No se rechaza la hipotesis de que 2 0.0002

Ejercicio 6.2.1. La variacion en la anchura de la ventana de los chips para circuito integrado
se deben controlar estrechamente si se desea que los circuitos funcionen en forma correcta.
Suponer que las especificaciones establecen que 2 = 0.30 para los anchos de ventana. Se
podra rechazar la afirmacion de que se cumple con dicha especificacion si se usan los datos del
ejercicio anterior n = 10 y s2 = 0.3166? Utilizar

Ejemplo 6.2.2

Para una muestra aleatoria simple de adultos, las puntuaciones de CI se distribuyen normalmente, con
una media de 100 y una desviacion estandar de 15. Una muestra aleatoria simple de 13 profesores de
estadstica produce una desviacion estandar s = 7.5. Un psicologo afirma que la desviacion estandar
de los profesores es menor o igual a la de los adultos. Tienes elementos para rechazar esta hipotesis
usando un nivel de significacion de = 0.05. ?

87
6.2. PRUEBAS DE HIPOTESIS PARA Y 2

n = 13
H0 : 2 225 2 2 (n 1)s2 12(51.84)
SOLUCION: 2
s = 51.84 0 = 2
= = 2.7648.
H1 : > 225 225
= 0.05
2 2 2
Como 0.05 = 21.03 y > 0 . No se rechaza la hipotesis de que < 15.

Ejercicio 6.2.2. Utilice un nivel de significancia de 0.05 para probar la aseveracion de que las
estaturas de mujeres supermodelos varan menos que las estaturas de las mujeres en general.
La desviacion estandar de las estaturas de la poblacion de mujeres es de 2.5 pulgadas. A con-
tinuacion se listan las estaturas (en pulgadas) de supermodelos seleccionadas al azar (Taylor,
Evangelista, Auermann, Schiffer, MacPherson, Turlington, Hall, Crawford, Herzigova, Banks,
Moss, Hume). 71 69.5 70.5 71 72 70 70 69 69.5 69 70 66.5

88
Indice alfabetico
Bayes Distribucion continua
Teorema de, 33 uniforme, 60
Bernoulli Distribucion de probabilidad, 36
Distribucion, 45
Error de tipo I, 78
Binomial
Error de tipo II, 78
distribucion, 45
Espacio muestral, 14
experimento, 46
Esperanza, 40
Cardinalidad Estadstica
propiedades, 25 descriptiva, 1
cardinalidad, 21 inferencial, 1
clases, 3 Estandarizacion, 67
Combinacion, 19 Estimaciones, 69
conjuntos Estimador, 71
propiedades, 25 error, 72
insesgado, 71
Datos
Evento
agrupados, 1
interseccion de, 22
agrupamiento de, 1
Eventos
no agrupados, 1
ajenos, 22
Datos agrupados, 9
complemento, 23
Desviacion estandar
definicion, 20
datos agrupados, 13
independientes, 30
poblacional, 11
union, 21
variable aleatoria discreta, 40
experimento, 14
Diagrama de tallo y hoja, 6
Exponencial
Distribucion
distribucion, 61
Bernoulli, 45
Binomial, 45 Factorial, 17
exponencial, 61 Frecuencia, 3
Geometrica, 48 acumulada, 3
normal, 63 relativa, 3
Poisson, 50 Funcion de distribucion, 57
uniforme, 43 Funcion de distribucion acumulada

89
INDICE ALFABETICO

propiedades, 39 Poblacion, 7
funcion de distribucion acumulada, 39 Poisson
funcion de masa de probabilidad, 39 distribucion, 50
Principio de multiplicacion, 16
Geometrica
Probabilidad
distribucion, 48
condicional, 28
Grafica
funcion, 25
pastel, 5
propiedades, 27
Graficos, 5
total, 31
histograma, 5 Pruebas de hipotesis, 78
para cola derecha, 80
Intervalo de clase, 3 para de cola izquierda, 80
Intervalos de confianza, 73 para de dos colas, 79
con desconocida, 75 Punto medio, 4
2
para , 76
Regla de multiplicacion, 29
Lmite Central
Teorema
teorema de, 69
del Lmite Central, 69
Media aritmetica Teorema de Bayes, 33
datos no agrupados, 7
Uniforme
Media muestral
distribucion, 43
datos no agrupados, 7
distribucion continua, 60
Mediana
datos agrupados, 10 Variable aleatoria
Datos no agrupados, 7 continua, 35
Medidas de dispersion, 11 definicion, 35
Medidas de tendencia central, 6 discreta, 35
Medua Variable aleatoria continua
datos agrupados, 9 definicion, 56
Moda propiedades, 56
datos agrupados, 10 Varianza, 11
datos no agrupados, 8 datos agrupados, 13
Muestra, 7 poblacional, 11
variable aleatoria discreta, 40
Normal
distribucion, 63

Permutacion, 18

90