Você está na página 1de 46

qwertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfgh
jklzxcvbnmqwertyuiopasdfghjklzxcvb
nmqwertyuiopasdfghjklzxcvbnmqwer
tyuiopasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyuio
pasdfghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmrty
uiopasdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmqw



TRABAJO FINAL

ESTADISTICA

12/12/2011

JULIO CESAR ALATORRE MENDEZ &
FELIX JIMENEZ JUNCO



Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

Unidad 2: Distribuciones Muestrales

2.1 Introduccin
Muestrear es una forma de evaluar la calidad de un producto, la opinin de los consumidores, la
eficacia de un medicamento o de un tratamiento. Muestra es una parte de la poblacin. Poblacin
es el total de resultados de un experimento. Hacer una conclusin sobre el grupo entero
(poblacin) basados en informacin estadstica obtenida de un pequeo grupo (muestra) es hacer
una inferencia estadstica.
A menudo no es factible estudiar la poblacin entera. Algunas de las razones por lo que es
necesario muestrear son:
1. La naturaleza destructiva de algunas pruebas
2. La imposibilidad fsica de checar todos los elementos de la poblacin.
3. El costo de estudiar a toda la poblacin es muy alto.
4. El resultado de la muestra es muy similar al resultado de la poblacin.
5. El tiempo para contactar a toda la poblacin es inviable.

Distribucin Muestral de las Medias

Es una distribucin de probabilidad de todas las posibles medias muestrales, de un tamao de
muestra dado, seleccionadas de una poblacin.

2.2 Teorema de combinacin lineal de variables aleatorias y teorema del lmite central
1. ____ La distribucin normal posee la propiedad reproductiva, por lo tanto, la suma de varias
variables
aleatorias independientes distribuidas normalmente, es una variable aleatoria normal.
2. ____ Si X X X 1 , 2 , 3 , , , , X i X n , son variables aleatorias mutuamente
independientes que tienen,
respectivamente, distribuciones ji cuadrada con , , , , , , , grados de libertad, entonces n n n
1 2 3 n i n n
la variable aleatoria suma de las variables independientes W = X 1 + X 2 + X 3 + + + +
X i X n ,
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
tiene una distribucin normal con media igual a la suma de las medias de las variables y varianza
igual a la suma de las varianzas de las variables . X i
3. ____ La suma del cuadrado de variables aleatorias normales estndar independientes tiene
una
distribucin ji cuadrada, con parmetro igual al nmero de variables normales estndar cuyos
cuadrados se suman.
4. ____ Dadas la variable aleatoria distribuida normalmente con media igual a 50 y desviacin
estndar X
igual a 2, y la variable aleatoria distribuida normalmente con media igual a 20 y desviacin Y
estndar igual a 4, siendo e variables aleatorias independientes, entonces la variable X Y W = X
Y
tendr una distribucin normal con media igual a 30 y desviacin estndar igual a 6.
5. ____ Dadas la variable aleatoria que tiene una distribucin ji cuadrada con 3 grados de
libertad y la X
variable aleatoria que tiene una distribucin ji cuadrada con 5 grados de libertad, siendo e Y X
Y
variables aleatorias independientes, entonces la variable W = X + Y tendr una distribucin ji
cuadrada con media igual a 8 y varianza igual a 16.

TEOREMA DEL LIMITE CENTRAL

Si se obtiene una muestra de una poblacin normal, entonces la media muestral tiene
una distribucin normal sin importar el tamao de la muestra. Sin embargo, se puede
demostrar que de hecho no importa el modelo de probabilidad del cual se obtenga la
muestra; mientras la media y la varianza existan, la distribucin de muestreo de X se
aproximar a una distribucin normal conforme n aumente. Lo anterior constituye
uno de los ms importantes teoremas en inferencia estadstica y se conoce como
TEOREMA DEL LIMITE CENTRAL.
En muchos casos, puede concluirse en forma segura que la aproximacin ser buena
mientras n > 30.

Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Ejemplo:Suponga que de una poblacin consistente en los valores 0, 2, 4, 6 y 8, se toman muestras
de tamao 2 con remplazo.





X Frecuencia Frecuencia Relativa
0 1 1/5 = .2
2 1 1/5 = .2
4 1 1/5 = .2
6 1 1/5 = .2
8 1 1/5 = .2

Solucin:

1. Paso
Se calcula la media poblacional, la varianza y desviacin estndar poblacional.


=




N
X
n
i

4
5
20
5
8 6 4 2 0
= =
+ + + +


=
n
i N
X
2
2
) (
o
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco


1. Paso

Grfica de la distribucin de frecuencia para la poblacin







Esta grfica no puede considerarse acampanada o normal.

2. Paso
Se toman muestras de tamao dos con remplazo.

83 . 2 8
8
5
40
5
) 4 8 ( ) 4 6 ( ) 4 4 ( ) 4 2 ( ) 4 0 (
2 2 2 2 2
2
= =
= =
+ + + +
=
o
o
0 1 2 3 4 5 6 7 8
0.195
0.200
0.205
Grfica de la Poblacin
X
Frecuencia
Relativa
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Muestra

Muestra

Muestra

0, 0 0 4, 0 2 8, 0 4
0, 2 1 4, 2 3 8, 2 5
0, 4 2 4, 4 4 8, 4 6
0, 6 3 4, 6 5 8, 6 7
0, 8 4 4, 8 6 8, 8 8
2, 0 1 6, 0 3
2, 2 2 6, 2 4
2. 4 3 6, 4 5
2, 6 4 6, 6 6
2, 8 5 6, 8 7














X X X
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
3. Paso
Se agrupa a las medias mustrales en la tabla de frecuencia siguiente:


F
0 1
1 2
2 3
3 4
4 5
5 4
6 3
7 2
8 1

4. Paso
Se calcula la media poblacional de medias , la varianza de la medias y desviacin
estndar de las medias error estndar de las medias.







X
=
N
i
x
N
X f ) (

4
25
100
25
) 8 ( 1 ) 7 ( 2 ) 6 ( 3 ) 5 ( 4 ) 4 ( 5 ) 3 ( 4 ) 2 ( 3 ) 1 ( 2 ) 0 ( 1
= =
+ + + + + + + +
=
x


=
N
i
x
x
N
X f
2
2
) (
o
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco





2.3. Muestreo: Introduccin al Muestreo y tipos de muestreo
tipos de muestreo

Un muestreo es la seleccin de una muestra a partir de una poblacin , entendida
como muestra un subconjunto, elegido de un conjunto mayor usualmente de
manera aleatoria, para realizar un estudio estadstico.
Al elegir una muestra, se espera que los datos estadsticos sean proporcionales a la
poblacin, y por lo tanto, que las propiedades sean extrapolables a la poblacin .
Este proceso permite ahorrar recursos, obteniendo resultados parecidos si se
realizasen a toda la poblacin.
Cabe mencionar para que el muestreo sea vlido y se pueda realizar un estudio
fiable (que represente a la poblacin), debe cumplir ciertos requisitos, lo que lo
convertira en una muestra representativa .

a). Aleatorio simple.
Este mtodo o esquema de muestreo, se caracteriza porque todos los elementos de
la poblacin tienen la misma probabilidad de ser incluidos en la muestra, o en
otros trminos, porque todas las posibles muestras de un tamao fijo son
2 4
4
25
100
25
) 4 8 ( 1 .. .......... ) 4 1 ( 2 ) 4 0 ( 1
2 2 2
2
= =
= =
+ +
=
x
x
o
o
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
igualmente probables.

Es la extraccin de una muestra de una poblacin finita, en el que el proceso de
extraccin es tal que garantiza a cada uno de los elementos de la poblacin la
misma oportunidad de ser incluidos en dicha muestra. El muestreo aleatorio puede
ser de dos tipos:
? Sin reposicin de los elementos :
? Con reposicin de los elementos:

b). Sistemtico.
En este procedimiento, se selecciona una muestra, tomando cada -sima unidad k
de la poblacin una vez que las unidades de muestreo estn numeradas o
arregladas en alguna forma.

Es la eleccin de una muestra a partir de los elementos de una lista segn un orden
determinado, o recorriendo la lista a partir de un nmero aletario . determinado.


c). Estratificado

Este se usa cuando la poblacin no es homognea, sino que pueden en ella
identificarse clases definidas por algn atributo o caracterstica relacionada con la
variable que se estudia. Este procedimiento implica dividir la poblacin en clases o
grupos homogneos relativos a las caractersticas que van a estudiarse, llamados
estratos . Despus se toma una submuestra de cada estrato.

Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Es la eleccin de una muestra compuesta por diferentes submuestras obtenidas
cada una por muestreo aleatorio de las subpoblaciones o estratos en los que se ha
dividido la poblacin segn los criterios que puedan ser importantes en el estudio.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de
los estratos, existen dos tcnicas de muestreo aleatorio estratificado:
Asignacin proporcional
Asignacin ptima

d). Por conglomerados o mtodos.
Es el tipo de muestreo en el que a partir de una poblacion, se le divide en grupos, y
de esos grupos se escoje uno y todo el grupo sera parte de la muestra.

e). En dos etapas.
Este se lleva acabo seleccionando una muetra aleatoria simple de conglomerados y
posteriormente seleccionando una muetra aleatoria de elementos de cada uno de
los conglomerados. Por lo tanto, cuando el tamao de los conglomerados es muy
grande o cuando los elementos de un conglomerados son muy similares, el
muestreo de dos etapas constituye una alternativa eficiente para el muestreo por
conglomerados.

Ejemplo: 1-Tipo de producto: arroz blanco entero

2-Origen: Nacional (40%)
Importado (60%) 30% del total corresponde a Argentina.

3-Nutrientes a analizar
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

3.1-Proximal: humedad, protenas, grasas, cenizas, fibra dietaria (Oficiales AOAC)
hidratos de carbono (Mt. de Antrona)

Vitaminas (B1 y B2) (AOAC)

4-Antecedentes de produccin

La produccin se concentra en 2 grandes marcas nacionales (Tucapel y Zaror) y otras de origen
argentino.

5-Formas de preparacin
Cocido, graneado

6-Lugar de consumo
A nivel nacional (las 15 regiones)

7-Tipo de Muestreo
Localizado


8-Marco de muestreo
Se seleccion aquellas en las que tradicionalmente se desarrollan los estudios de mercado
a nivel nacional (Santiago, Valparaso, Concepcin).


Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
9-Determinacin del nmero de muestras a testear
Criterio usado: Ecuacin de Cochran, considerando el nutriente de mayor variabilidad
(Hidratos de Carbono)

Datos analticos para Hidratos de Carbono
= 78,4% (promedio)
DS = 0,8 (desviacin estndar)
P = 0,05 (error relativo para un porcentaje de confianza de 95%)


Aplicando la frmula:






N = 0,16 1 (nmero de muestra)


10- Tamao de muestra
Envase de 1 Kg.

11- Estratos donde se muestrear (2)
Supermercados (Lder y Jumbo)
Vegas
N = (Z
2
* DS
2
) / (P * )2
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco



Marcas Santiago Valparaso Concepcin
Tucapel L, Ju, Vega L, Ju, Vega L, Ju, Vega
Zaror L, Ju, Vega L, Ju, Vega L, Ju, Vega
Argentino L, Ju, Vega L, Ju, Vega L, Ju, Vega


N total de muestras = 27

















2.4 Teorema del lmite central
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
El Teorema del Lmite Central dice que si tenemos un grupo numeroso de
variables independientes y todas ellas siguen el mismo modelo de
distribucin (cualquiera que ste sea), la suma de ellas se distribuye segn
una distribucin normal.
Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de
Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50
variables (cada una independiente entre si) se distribuye segn una
distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de
variables continuas.
Los parmetros de la distribucin normal son:
Media: (media de la variable individual multiplicada por el nmero de
variables independientes)
Varianza:
nmero de variables individuales)
Veamos un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si
sale cruz el valor 0. Cada lanzamiento es una variable independiente que se
distribuye segn el modelo de Bernouilli, con media 0,5 y varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de
60 caras.
La variable suma de estas 100 variables independientes se distribuye, por
tanto, segn una distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la
variable normal tipificada equivalente:

Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta
distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de
60 caras es tan slo del 2,28%

Ejemplo: La renta media de los habitantes de un pas se distribuye
uniformemente entre 4,0 mil pesos. y 10,0 mil pesos. Calcular la
probabilidad de que al seleccionar al azar a 100 personas la suma de sus
rentas supere los 725 mil pesos.
Cada renta personal es una variable independiente que se distribuye segn
una funcin uniforme. Por ello, a la suma de las rentas de 100 personas se
le puede aplicar el Teorema del Lmite Central.
La media y varianza de cada variable individual es:
= (4 + 10 ) / 2 = 7
= (10 - 4)^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya
media y varianza son:
Media: = 100 * 7 = 700
Varianza:
Para calcular la probabilidad de que la suma de las rentas sea superior a
725 mil pesos, comenzamos por calcular el valor equivalente de la variable
normal tipificada:

Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Es decir, la probabilidad de que la suma de las rentas de 100 personas
seleccionadas al azar supere los 725 mil pesos es tan slo del 7,49%


2.5 Distribucin Muestral de la media
Teorema del lmite central)
que la fdp
2
/n. Esto es exacto
para poblaciones normales y aproximado (buena aproximacin con n>30) para poblaciones
cualesquiera. Es decir es el error tpico, o error estndar de la media.
Cmo usamos esto en nuestro problema de estimacin?
z);
pero haciendo la transformacin (llamada tipificacin)

z.

Llamando z al valor de una variable
normal tipificada que deja a su derecha
que la probabilidad que la variable sea
valores que ofrece la tabla de la
normal)
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
podremos construir intervalos de la
forma

para los que la probabilidad es 1 -

Teniendo en cuenta la simetra de la normal y manipulando algebracamente

que tambin se puede escribir

o, haciendo nfasis en que es el error estndar de la media,

-
se le denomina intervalo de confianza con un nivel de confianza del 100(1 - nivel de
significacin z
/2
=1,96.
Al valor se le denomina estimacin puntual y se dice que
Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria de tamao 20
en la que se calcula
comprendida en el intervalo


Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
En general esto es poco til, en l
2
; en el
2
desconocida los intervalos de confianza se construyen con la t de Student
(otra fdp continua para la que hay tablas) en lugar de la z.

o, haciendo nfasis en que es el error estndar estimado de la media,

Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando
n es grande (>30) se puede sustituir t por z sin mucho error.
Ejemplo: Una empresa elctrica fabrica focos que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas.
Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de
menos de 775 horas.
Solucin:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a
775 horas es de 0.0062.




Julio Cesar Alatorre Mendez &
Felix Jimenez Junco












2.6. Distribucin Muestral de la Diferencia de Medias
Suponga que se tienen dos poblaciones distintas, la primera con media
1
y desviacin estndar
1
, y la segunda con media
2
y desviacin estndar
2.
Ms an, se elige una muestra
aleatoria de tamao n
1
de la primera poblacin y una muestra independiente aleatoria de tamao
n
2
de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia entre
dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las
diferencias entre medias o la distribucin muestral del estadstico

Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
La distribucin es aproximadamente normal para n
1
30 y n
2
30. Si las poblaciones son
normales, entonces la distribucin muestral de medias es normal sin importar los tamaos de las
muestras.
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de medias
es:

Ejemplo:
En un estudio para comparar los pesos promedio de nios y nias de sexto grado en una escuela
primaria se usar una muestra aleatoria de 20 nios y otra de 25 nias. Se sabe que tanto para
nios como para nias los pesos siguen una distribucin normal. El promedio de los pesos de
todos los nios de sexto grado de esa escuela es de 100 libras y su desviacin estndar es de
14.142, mientras que el promedio de los pesos de todas las nias del sexto grado de esa escuela es
de 85 libras y su desviacin estndar es de 12.247 libras. Si representa el promedio de los pesos
de 20 nios y es el promedio de los pesos de una muestra de 25 nias, encuentre la
probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms grande
que el de las 25 nias.
Solucin:
Datos:
1
= 100 libras
2
= 85 libras
1
= 14.142 libras
2
= 12.247 libras
n
1
= 20 nios
n
2
= 25 nias
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
= ?

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al menos
20 libras ms grande que el de la muestra de las nias es 0.1056.




2.7 Distribucin Muestral de la proporcin
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin de alumnos
reprobados en la muestra. La distribucin muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin
muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el
estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y
"n" el tamao de la muestra) en lugar del estadsitico media.
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de
proporciones; una poblacin binomial es una coleccin de xitos y fracasos, mientras que una
distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los
nmeros posibles de xitos en un experimento binomial, y como consecuencia de esta relacin, las
afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse usando la
aproximacin normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el nmero
obtenido entre el nmero de intentos.
Generacin de la Distribucin Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos defectuosos. Se van a
seleccionar 5 artculos al azar de ese lote sin reemplazo. Genere la distribucin muestral de
proporciones para el nmero de piezas defectuosas.
Como se puede observar en este ejercicio la Proporcin de artculos defectuosos de esta poblacin
es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote estn defectuosas.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es
12
C
5
=792, las cuales se pueden desglosar de la siguiente manera:
Artculos
Buenos
Artculos Malos
Proporcin de
artculos
defectuoso
Nmero de
maneras en las que
se puede obtener la
muestra
1 4 4/5=0.8
8
C
1
*
4
C
4
=8
2 3 3/5=0.6
8
C
2
*
4
C
3
=112
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
3 2 2/5=0.4
8
C
3
*
4
C
2
=336
4 1 1/5=0.2
8
C
4
*
4
C
1
=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribucin muestral de proporciones se tendra que hacer la
sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero total
de muestras. Esto es:

Como podemos observar la media de la distribucin muestral de proporciones es igual a la
Proporcin de la poblacin.
p
= P
Tambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones:
La varianza de la distribucin binomial es
2
= npq, por lo que la varianza de la distribucin
muestral de proporciones es
2
p
=(Pq)/n. Si se sustituten los valores en esta frmula tenemos
que:
, este valor no coincide con el de 0.1681, ya que nos falta agregar el
factor de correccin para una poblacin finita y un muestreo sin reemplazo:


Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de
proporciones est basada en la aproximacin de la distribucin normal a la binomial . Esta frmula
nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.

A esta frmula se le puede agregar el factor de correccin de si se cumple con las
condiciones necesarias.
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se
toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporcin de la
muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solucin:
Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la aproximacin de la
distribucin normal a la binomial y el segundo utilizando la frmula de la distribucin muestral de
proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
x= (.55)(800) = 440 estudiantes
= ?
Media= np= (800)(0.60)= 480

muestra de 800 estudiantes, menos de 440 fuman cigarrillos.


Distribucin Muestral de Proporciones
Datos:
n=800 estudiantes
P=0.60
p= 0.55

Julio Cesar Alatorre Mendez &
Felix Jimenez Junco





2.8. Distribucin Muestral de la Diferencia de Proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
- Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que las
de los que aprueban ingls?
- Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una
reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin
de ese tipo?
- Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
- Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la
mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal
para tamaos de muestra grande (n
1
p
1
5, n
1
q
1
5,n
2
p
2
5 y n
2
q
2
5). Entonces p
1
y p
2
tienen
distribuciones muestrales aproximadamente normales, as que su diferencia p
1
-p
2
tambin tiene
una distribucin muestral aproximadamente normal.
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

Cuando se estudi a la distribucin muestral de proporciones se comprob que y que
, por lo que no es difcil deducir que y que
.
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de
proporciones es:

Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones
sobre la promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el
12% de los hombres adultos estn a favor de la pena de muerte, mientras que slo 10% de las
mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres
su opinin sobre la promulgacin de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Solucin:
Datos:
P
H
= 0.12
P
M
= 0.10
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
n
H
= 100
n
M
= 100
p(p
H
-p
M
0.03) = ?

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin binomial
y se est utilizando la distribucin normal.


Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al
menos 3% mayor que el de mujeres es de 0.4562.



2.9. Distribucin Muestral de la Varianza
A veces lo que nos interesa es estudiar la variabilidad de las medidas. La variabilidad se suele
medir con la varianza o con la desviacin tpica y el estadstico empleado es la varianza muestral:

=
n
i
i
n
x x
S
1
2
2
1
) (


Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Para poder trabajar con ella necesitamos conocer la funcin de distribucin asociada, para esto
estudiaremos la distribucin chi cuadrado.

Se dice que una variable aleatoria X sigue una distribucin ji cuadrado con k grados de libertad,
cuando su funcin de densidad est dada por la frmula:






Dado lo complicado de la expresin utilizaremos una tabla para conocer los valores que nos
interesen.

Propiedades de esta distribucin:
1. Si X es una variable con distribucin ji cuadrado con k grados de libertad, su media es k y
su varianza 2k.
2. Una variable ji cuadrado no toma valores negativos.
3. Su grfica es de las de tipo de curvas sesgadas a la derecha.
4. A medida que aumentan los grados de libertad la curva se va haciendo ms simtrica y su
cola derecha se va extendiendo.
5. Por cada valor de k hay una distribucin distinta.
6. k es el nico parmetro asociado a la distribucin.


ejercicio: - El gerente de una empresa industrial estaba preocupado por los continuos accidentes
de trabajo que se presentaban; por lo que estableci nuevos lineamientos de seguridad. Antes de
estos nuevos lineamientos, el gerente esperaba que no hubiera ningn accidente en 40% de los
meses, un accidente en 30% de los meses, dos accidentes en 20% de los meses y tres accidentes
en 10% de los meses
En los ltimos 10 aos, 120 meses, hubo 46 meses en los que no se tuvo ningn accidente, 40
meses en los que hubo un accidente, 22 meses en los que hubo dos accidentes y 12 meses en los
que hubo tres accidentes. Al nivel de significancia 0.05. Puede concluir, el gerente de la empresa,
que ha habido una variacin en la distribucin mensual de los accidentes?

>
I
=

caso otro cualquier en
six e x
k
x f
x k
x
0
0 ) 2 / 1 (
) 2 / (
1
) (
) 2 / 1 ( 1 2 /
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

Solucin:

Ho : No ha habido una variacin en la distribucin mensual de los accidentes.
H1 : Si ha habido una variacin en la distribucin mensual de los accidentes


|Fo |Fe |
|46 |40%120 = 48 |
|40 |30%120 = 36 |
|22 |20%120 = 24 |
|12 |10%120 = 12 |

gl = (n-1) ( gl = (4 - 1) = 3

Estadstico de prueba:

X 2 = [pic]

Como el valor de X 2 = 0.694443 es menor que el valor critico = 7.81473 no se rechaza la Ho.
Concluimos que no ha habido una variacin en la distribucin mensual de los accidentes.
2.10 Distribucin Muestral de la relacin de varianzas
La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos poblaciones
es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea comparar la
precisin de un instrumento de medicin con la de otro, la estabilidad de un proceso de
manufactura con la de otro o hasta la forma en que vara el procedimiento para calificar de un
profesor universitario con la de otro.
Intuitivamente, podramos comparar las varianzas de dos poblaciones, y , utilizando la
razn de las varianzas muestrales s
2
1
/s
2
2
. Si s
2
1
/s
2
2
es casi igual a 1, se tendr poca evidencia para
indicar que y no son iguales. Por otra parte, un valor muy grande o muy pequeo para
s
2
1
/s
2
2
, proporcionar evidencia de una diferencia en las varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada
independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad
1
y
2

respectivamente.
Sean U y V dos variables aleatorias independientes que tienen distribucin ji cuadradas con
grados de libertad, respectivamente. Entonces la distribucin de la variable aleatoria
est dada por:


y se dice que sigue la distribucin F con grados de libertad en el numerador y grados de
libertad en el denominador.
La media y la varianza de la distribucin F son:
para
para

La variable aleatoria F es no negativa, y la distribucin tiene un sesgo hacia la derecha. La
distribucin F tiene una apariencia muy similar a la distribucin ji-cuadrada; sin embargo, se
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
encuentra centrada respecto a 1, y los dos parmetros proporcionan una flexibilidad
adicional con respecto a la forma de la distribucin.
Si s
1
2
y s
2
2
son las varianzas muestrales independientes de tamao n
1
y n
2
tomadas de poblaciones
normales con varianzas
1
2
y
2
2
, respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia Estadstica del autor
Genther, se tendr que buscar primero los grados de libertad dos para luego localizar el rea
correspondiente, relacionndola con los grados de libertad uno, para calcular el valor de F.
l valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de
libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos graficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos
variables que son los grados de libertad.


Ejemplo :
1. Encontrar el valor de F, en cada uno de los siguientes casos:
a. El rea a la derecha de F, es de 0.25 con
=4 y =9.
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
a. El rea a la izquierda de F, es de 0.95 con
=15 y =10.
b. El rea a la derecha de F es de 0.95 con con
=6 y =8.
c. El rea a la izquierda de F, es de 0.10 con con
=24 y
=24
Solucin:
a. Como el rea que da la tabla es de cero a Fisher, se tiene que localizar primero los grados
de libertad dos que son 9, luego un rea de 0.75 con 4 grados de libertad uno.

b. En este caso se puede buscar el rea de 0.95 directamente en la tabla con sus respectivos
grados de libertad.

c. Se tiene que buscar en la tabla un rea de 0.05, puesto que nos piden un rea a la derecha
de F de 0.95.
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

d. Se busca directamente el rea de 0.10, con sus respectivos grados de libertad.





















Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

Unidad 3.- Estimacin de parmetros
En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos
estimar dicho parmetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona
informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la
media poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la
poblacin.
Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los estimadores
ms probables en este caso son los estadsticos obtenidos en la muestra, aunque es necesario
cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribucin
muestral indica la distribucin de los valores que tomar el estimador al seleccionar distintas
muestras de la poblacin. Las dos medidas fundamentales de esta distribucin son la media que
indica el valor promedio del estimador y la desviacin tpica, tambin denominada error tpico de
estimacin, que indica la desviacin promedio que podemos esperar entre el estimador y el valor
del parmetro.
Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que se
encontrar el parmetro, con un nivel de confianza fijado de antemano.
- Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza,
contiene al parmetro que se est estimando.
- Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al
verdadero valor del parmetro. Se indica por 1-a y habitualmente se da en porcentaje (1-
a)100%. Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la
muestra, el intervalo de confianza contendr al verdadero valor del parmetro o no, lo
que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar
que el (1-a)% de los intervalos as construidos contendra al verdadero valor del
parmetro.







Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

- Ejemplo:
- En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo,
para varios procesos de fundicin. En consecuencia, es importante contar con mtodos
prcticos para determinar varias propiedades mecnicas de esas aleaciones. Examine la
siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de
fundicin a presin:
- 44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
- Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea
estimar la varianza poblacional . Un estimador natural es la varianza muestral:
-
- En el mejor de los casos, se encontrar un estimador para el cual siempre. Sin
embargo, es una funcin de las X
i
muestrales, por lo que en s misma una variable
aleatoria.
- + error de estimacin
- entonces el estimador preciso sera uno que produzca slo pequeas diferencias de
estimacin, de modo que los valores estimados se acerquen al valor verdadero.
3.2 Caractersticas de un buen estimador
Insesgado.- Se dice que un estimador puntual es un estimador insesgado de si ,
para todo valor posible de . En otras palabras, un estimador insesgado es aquel para el cual la
media de la distribucin muestral es el parmetro estimado. Si se usa la media muestral para
estimar la media poblacional , se sabe que la , por lo tanto la media es un estimador
insesgado.
Eficiente o con varianza mnima.- Suponga que
1
y
2
son dos estimadores insesgados de .
Entonces, aun cuando la distribucin de cada estimador est centrada en el valor verdadero de ,
las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza mnima.
El resultante recibe el nombre de estimador insesgado con varianza mnima (MVUE, minimum
variance unbiased estimator) de .
En otras palabras, la eficiencia se refiere al tamao de error estndar de la estadstica. Si
comparamos dos estaisticas de una muestra del mismo tamao y tratamos de decidir cual de ellas
es un estimador mas eficiente, escogeramos la estadstica que tuviera el menor error estndar, o
la menor desviacin estndar de la distribucin de muestreo.
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor
oportunidad de producir una estimacin mas cercana al parmetro de poblacin que se esta
considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que la
distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en un
estimador eficiente e insesgado.
Coherencia.- Una estadstica es un estimador coherente de un parmetro de poblacin, si al
aumentar el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se
aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se vuelve
mas confiable si tenemos tamaos de muestras mas grandes.
Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la informacin contenida de la
muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el
parmetro de la poblacin que se esta estimando.
Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la
informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan
todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza a un dato o a dos.
Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con esto se
deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la
varianza, desviacin estndar, etc; se tendr un estimador suficiente.






Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
3.3 Estimacin puntual
Esencialmente son tres los parmetros de inters:
- En el caso de que investiguemos una variable cuantitativa:
a) Para la media de la poblacin tomaremos como aproximacin la media de la
muestra.
=
b) Para la varianza de la poblacin
2
tomaremos la cuasivarianza de la muestra.
=
- Si el estudio se centra en el estudio de un carcter cualitativo el parmetro de inters
ser la proporcin de elementos de la poblacin que pertenecen a cierta categora
C que lo aproximaremos con la correspondiente proporcin en la muestra.



1.3.1 Mtodos
Mtodo de momentos: La idea bsica consiste en igualar ciertas caractersticas
muestrales con las correspondientes caractersticas poblacionales. Recordemos la
siguiente definicin.

Mtodo de mxima verosimilitud: Este mtodo fue introducido por Fisher en la dcada
de 1920. Se basa en la idea de hallar los valores de los parmetros que hacen que la
probabilidad de obtener una muestra dada sea mxima.







Julio Cesar Alatorre Mendez &
Felix Jimenez Junco


1.3.1.1 Mxima verosimilitud

Mtodo de mxima verosimilitud: Este mtodo fue introducido por Fisher en la dcada
de 1920. Se basa en la idea de hallar los valores de los parmetros que hacen que la
probabilidad de obtener una muestra dada sea mxima.

Supngase que se lanza una moneda sesgada al aire 80 veces. La muestra resultante puede ser
algo as como x
1
= H, x
2
= T, ..., x
80
= T, y se cuenta el nmero de caras, "H". La probabilidad de
que salga cara es p y la de que salga cruz, 1 p (de modo que p es el parmetro ). Supngase
que se obtienen 49 caras y 31 cruces. Imagnese que la moneda se extrajo de una caja que
contena tres de ellas y que stas tienen probabilidades p iguales a 1/3, 1/2 y 2/3 aunque no se
sabe cul de ellas es cul.
A partir de los datos obtenidos del experimento se puede obtener saber cul es la moneda con la
mxima verosimilitud. Usando la funcin de probabilidad de la distribucin binomial con una
muestra de tamao 80, nmero de xitos igual a 49 y distintos valores de p, la funcin de
verosimilitud toma tres valores siguientes:

La verosimilitud es mxima cuando p = 2/3 y ste es, por lo tanto, el EMV de p.


1.3.1.2 Momentos
Mtodo de momentos: La idea bsica consiste en igualar ciertas caractersticas
muestrales con las correspondientes caractersticas poblacionales. Recordemos la
siguiente definicin.

Supongamos que hemos obtenido la siguiente muestra de diecisis observaciones procedente de
nuestra poblacin uniforme:
1,12 1,79 0,77 4,21 3,47 4,94 0,56 0,05
2,35 4,86 1,46 3,71 2,21 0,09 1,72 2,96
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Segn acabamos de ver, el estimador por el mtodo de los momentos de b es la media aritmtica
multiplicada por dos. En este ejemplo, la media aritmtica vale 2,27 y, por tanto, la estimacin
de b sera: 2,27 x 2 = 4,53. Sin embargo, esta estimacin es incompatible con las observaciones en
que se basa, podis decir por qu? Serais capaces de proponer otro estimador lgico para el
parmetro b?
1) Segn el mtodo de los momentos hemos obtenido como estimacin de b el valor 4,53. Sin
embargo, en la muestra existen dos valores (4,94 y 4,86) que superan dicho valor (recordemos que
en una distribucin uniforme b representa el extremo superior de los posibles valores de la
variable).
1,12 1,79 0,77 4,21 3,47 4,94 0,56 0,05
2,35 4,86 1,46 3,71 2,21 0,09 1,72 2,96

2) Un estimador ms lgico para el parmetro b sera el mximo de los valores observados. En
nuestro caso dicho estimador valdra 4,94. Fijmonos que con esta estimacin desaparece la
contradiccin comentada en el anterior apartado. De hecho, el mximo de los valores
observados es el estimador que se obtendra por el mtodo de la mxima verosimilitud.


3.4. Intervalo de confianza para la media
En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales se estima que
estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos
nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor
desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa
con 1 - y se denomina nivel de confianza. En estas circunstancias, es el llamado error
aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.
1

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo
ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza), mientras que para un
intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de
error.
Para la construccin de un determinado intervalo de confianza es necesario conocer
la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro presente
una distribucin normal. Tambin pueden construirse intervalos de confianza con la desigualdad
de Chebyshov.
En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro
poblacional que sigue una determinada distribucin de probabilidad, es una expresin del tipo
[
1
,
2
] tal que P[
1

2
] = 1 - , donde P es la funcin de distribucin de probabilidad de .
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco

De una poblacin de media y desviacin tpica se pueden tomar muestras de n elementos.
Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de
todas las medias muestrales coincide con la media poblacional:
2

Pero adems, si el tamao de las muestras es lo suficientemente grande,
3
la distribucin de
medias muestrales es, prcticamente, una distribucin normal (o gaussiana) con media y una
desviacin tpica dada por la siguiente expresin: . Esto se representa como
sigue: . Si estandarizamos, se sigue que:
En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un
determinado porcentaje de las observaciones, esto es, es sencillo hallar z
1
y z
2
tales que P[z
1
z
z
2
] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el uso de las tablas en una
distribucin normal).
Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se
encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza
determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este
valor se le llamar 1 (debido a que es el error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto X
/ 2
o, mejor dicho, su versin estandarizada Z
/ 2
o valor
crtico junto con su "opuesto en la distribucin" X
/ 2
. Estos puntos delimitan la probabilidad para
el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el nmero tal que:

Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Y en la versin estandarizada se cumple que:
z
/ 2
= z
/ 2

As:

Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral el producto
del valor crtico Z
/ 2
por el error estndar .
Si no se conoce y n es grande (habitualmente se toma n 30):
4

, donde s es la desviacin tpica de una muestra.
Aproximaciones para el valor z
/ 2
para los niveles de confianza estndar son 1,96 para 1 =
95% y 2,576 para 1 = 99%.

3.5. Intervalo de confianza para la diferencia de medias.
Sean X11, X12, X1n1, una muestra aleatoria de n1 observaciones tomadas de
una primera poblacin con valor esperado 1 y varianza s
1, y X21, X22, X2n2 una muestra aleatoria de n2 observaciones tomada de la
segunda poblacin con valor esperado 2 y varianza s
2. Si son las medias muestrales, la estadstica es un estimador puntual de 1 - 2,
y tiene una distribucin normal si las dos poblaciones son normales, o
aproximadamente normal si cumple con las condiciones del teorema del limite
central (tamaos de muestras relativamente grandes). Es decir, . Por lo tanto,
Para calcular el intervalo de confianza para la diferencia de dos medias se debe
saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
que sean desconocidas, se debe probar si son iguales o diferentes. Cada uno de
estos tres casos se analizarn por separado
Varianzas conocidas
Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el
intervalo de confianza son los siguientes:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2
ser T = , que es un estimador suficiente b) La variable aleatoria asociada con el
estimador ser la variable normal estndar dada por:
c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente
probabilidad:
Manipulando la expresin anterior en forma similar a como se hizo en los casos de
una sola muestra se llega al siguiente teorema que nos define el intervalo de
confianza para la diferencia entre dos medias 1 - 2 con varianzas conocidas s
1 y s
2.
Teorema. Si son las medias de dos muestras aleatorias independientes de tamao
n1 y n2 tomadas de poblaciones que tienen varianzas conocidas s
1 y s
2, respectivamente, entonces un intervalo de confianza del 100(1-a)% para 1 -
2 es:
Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre
las duraciones de dos marcas de bombillos, si una muestra de 40 bombillos
tomada al azar de la primera marca dio una duracin media de 418 horas, y una
muestra de 50 bombillos de otra marca dieron una duracin media de 402 horas.
Las desviaciones estndares de las dos poblaciones son 26 horas y 22 horas,
respectivamente.
Solucin. Tenemos que:, , s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88. El
intervalo de confianza es, entonces:
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
El hecho de que ambos lmites sean positivos, y por lo tanto no contengan el valor
cero indican que ambas marcas no tienen la misma duracin media, y sugiere que
pueda pensarse que la primera marca de bombillos tenga una duracin media
superior a la segunda.
Varianzas desconocidas e iguales ( = = )
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadstica para verificar si stas son iguales o diferentes. Para realizarlo debemos
hacer uso de la distribucin F, bien sea mediante el clculo de la probabilidad de
que la muestra tomada provenga de dos poblaciones con varianzas iguales, o
mediante el uso de un intervalo de confianza para la relacin de dos varianzas,
segn se estudiar ms adelante.
Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas
son iguales, el procedimiento a seguir para el clculo del intervalo de confianza
para la diferencia de dos medias ser el siguiente:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2
ser T = , que es un estimador suficiente.
b) La variable aleatoria asociada con el estimador ser la variable T definida como:
donde es un estimador combinado de s
, mejor que por separado, y
c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente
probabilidad:
De nuevo, manipulando la expresin anterior en forma similar a los casos se llega
al siguiente teorema que nos define el intervalo de confianza para la diferencia
entre dos medias 1 - 2 con varianzas desconocidas s
1 y s
2, pero iguales:
Teorema. Si son las medias y las varianzas de dos muestras aleatorias de tamaos
n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas pero iguales, entonces un intervalo de confianza del
100(1-a)% para la diferencia entre medias 1 - 2 es:
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias
para comparar el contenido de nicotina de dos marcas de cigarrillos.
Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas desconocidas, construya un intervalo de
confianza del 95% para la diferencia real de nicotina de las dos marcas.
Solucin. Inicialmente mediante la distribucin F debemos verificar si las varianzas
son iguales
( = = )
Buscando en la tabla de la distribucin F para 7 grados de libertad en el
numerador y 9 en el denominador, vemos que el valor de la probabilidad est
entre 0.10 y 0.25 (aproximadamente 0.19, mediante interpolacin lineal). Como
esta probabilidad es muy alta, concluimos que no hay evidencia para rechazar la
hiptesis de que las varianzas sean iguales.
Como las varianzas son iguales, calculamos que est dado por:
El intervalo de confianza del 95% est dado por (t0.025,16 = 2.12):
Debido a que la diferencia real puede ser cero, no se puede concluir que existe una
diferencia en el contenido de nicotina de las dos marcas de cigarrillos.
Ejemplo. El gerente de una refinera piensa modificar el proceso para producir
gasolina a partir de petrleo crudo. El gerente har la modificacin slo si la
gasolina promedio que se obtiene por este nuevo proceso (expresada como un
porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base
en experimentos de laboratorio y mediante el empleo de dos muestras aleatorias
de tamao 12, una para cada proceso, la cantidad de gasolina promedio del
proceso en uso es de 24.6 con una desviacin estndar de 2.3, y para el proceso
propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que
los resultados proporcionados por los dos procesos son variables aleatorias
independientes normalmente distribuidas con varianzas iguales. Con base en esta
evidencia, debe adoptarse el nuevo proceso?
Varianzas desconocidas y desiguales s
1 s
2
Julio Cesar Alatorre Mendez &
Felix Jimenez Junco
Si mediante el uso de la distribucin F se llega a la conclusin de que las varianzas
son diferentes, el procedimiento a seguir para el clculo del intervalo de confianza
para la diferencia de dos medias ser el siguiente:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 - 2
ser T = , que es un estimador suficiente
b) La variable aleatoria asociada con el estimador ser la variable T definida como:
donde
c) El intervalo de confianza esta dado por el siguiente teorema, basado en la
distribucin t con n grados de libertad.
Teorema. Si son las medias y las varianzas de dos muestras aleatorias de tamaos
n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes
con varianzas desconocidas y desiguales, entonces un intervalo de confianza
aproximado del 100(1-a)% para la diferencia entre medias 1 - 2 es:
Problema. Cierto metal se produce, por lo comn, mediante un proceso estndar.
Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin
del metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de stos se
somete a una tensin hasta que se rompe. La siguiente tabla muestra las
tensiones de ruptura de los ejemplares, en kilogramos por centmetro cuadrado:
Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e
independientes, obtener los intervalos de confianza estimados del 95 y 99% para
la diferencia entre los dos procesos. Interprete los resultados.

Você também pode gostar