Você está na página 1de 30

Estadstica ICM 00166

PRUEBA DE HIPTESIS

Esta tcnica de inferencia estadstica es muy utilizada como apoyo a la


investigacin cientfica. Consiste en suponer algn valor para el parmetro de
inters y usar los datos de la muestra para aceptar o rechazar esta afirmacin.

Es importante entender las diferentes situaciones que pueden ocurrir al probar


estadsticamente una hiptesis

Sea Ho: hiptesis que se propone para el parmetro de inters

El Error tipo I se produce al rechazar una hiptesis sin saber que era verdadera
El Error tipo II se produce al aceptar una hiptesis sin saber que era falsa

Ambos errores pueden tener consecuencias negativas en una situacin real.


Por lo tanto es importante cuantificar su probabilidad.

Medida del Error tipo I:


= P(Rechazar Ho dado que Ho es verdadera)

Medida del Error tipo II:


= P(Aceptar Ho dado que otra hiptesis es verdadera)

El valor se denomina nivel de significancia de la prueba y generalmente es


un dato dado para realizar la prueba.

Algunos valores tpicos para son 10%, 5%, 2%, 1%

Terminologa
Ho: Hiptesis nula. Es la hiptesis que se plantea para el parmetro
Ha: Hiptesis alterna. Es la hiptesis que se plantea en oposicin a Ho
y que es aceptada en caso de que Ho sea rechazada

Generalmente, es de inters probar Ha, por lo que se plantea Ho con la


esperanza de que sea rechazada utilizando la informacin de la muestra.

Ejemplo
Suponer que se desea probar que la media poblacional no es igual a 5
Entonces se puede plantear:
Ho: = 5

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Ha: 5
Si con los datos de la muestra se puede rechazar Ho, entonces
habremos probado Ha

Tipos de pruebas
Sea : parmetro de inters para la prueba
0: algn valor supuesto para el parmetro
Pruebas de una cola
1) Ho: = 0: (hiptesis nula)
Ha: < 0: (hiptesis alterna)

2) Ho: = 0: (hiptesis nula)


Ha: > 0: (hiptesis alterna)

Prueba de dos colas


3) Ho: = 0: (hiptesis nula)
Ha: < 0 > 0: (hiptesis alterna)

PROCEDIMIENTO BSICO PARA REALIZAR UNA PRUEBA DE HIPTESIS

Para entender este procedimiento usamos un caso particular, pero luego


podremos extenderlo a otros casos

Parmetro de inters: (media poblacional)


Estimador: X (media muestral)
n 30: (muestra grande)
Suponer que proponemos 0 un valor especfico para el parmetro

1) Formular la hiptesis nula:


Ho: = 0
2) Formular una hiptesis alterna que interesa probar, elegir una entre:
Ha: < 0
Ha: > 0
Ha: < 0 > 0
3) Especificar el nivel de significancia de la prueba

4) Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho

Por el teorema del lmite central el estadstico


X o
Z , tiene distribucin normal estndar aproximadamente
/ n

La regin de rechazo depende de la hiptesis alterna Ha y est definida por :

Ho: = 0
Ha: < 0

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

La media muestral X es un estimador insesgado y su valor esperado es igual


al valor propuesto 0 para el parmetro. Por lo tanto, el valor obtenido para la
media muestral debera estar cercano a este valor 0.

Si el valor de Z correspondiente a la media muestral cae en la regin de


rechazo, debe entenderse que es una evidencia de que la media propuesta
para el parmetro, = 0, no es verdad y que debera ser algn valor ms
pequeo: < 0

Con esta interpretacin rechazamos Ho en favor de Ha

Sin embargo, siendo X una variable aleatoria, es posible que an siendo


verdad que el valor supuesto 0 es verdadero, el valor de la media muestral
puede caer en la regin de rechazo.

Esto constituye el Error tipo I, y la probabilidad que esto ocurra es .

Esta interpretacin debe ayudar a entender los siguientes casos:

Ho: = 0
Ha: > 0

Ho: = 0
Ha: < 0 > 0 .

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

5) Con los datos de la muestra calcule el valor del estadstico

6) Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin


es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta regin crtica,
se dice que no hay evidencia suficiente para rechazar Ho. En este caso
es preferible abstenerse de aceptar Ho como verdadera pues esto
puede introducir el Error tipo II

Ejemplo
Una muestra aleatoria de 100 paquetes mostr un peso promedio de 71.8 gr.
con una desviacin estndar de 8.9 gr.

Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los
paquetes (poblacin) es mayor a 70 gr.

Solucin
Seguimos los pasos indicados en el procedimiento bsico dado:

1) Hiptesis nula
Ho: = 70

2) Hiptesis alterna
Ha: > 70

3) Nivel de significancia
= 0.05

4) Estadstico de prueba
X o
Z por el Teorema del Lmite Central, adems 2 s2
/ n

Regin de rechazo
z = z0.05 = 1.645

Rechazar Ho en favor de Ha, si z > 1.645

5) Valor del estadstico

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

X o 71.8 70
Z = = 2.02
/ n 8.9 / 100
6) Decisin
Debido a que 2.02 > 1.645, se rechaza Ho y se concluye, con una
significancia de 5%, que el peso promedio de la poblacin es mayor
a 70 gr,

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

PRUEBA DE HIPTESIS

DEFINICIN

PROBABILIDAD DE COLA
Es el nivel de significancia obtenido con los datos de la muestra .

Ejemplo
Calcule la probabilidad de cola con los datos del ejemplo de la leccin
anterior:

Una muestra aleatoria de 100 paquetes mostr un peso promedio de 71.8


gr. con una desviacin estndar de 8.9 gr.
Pruebe, con un nivel de significancia de 5%, que el peso promedio de
todos los paquetes (poblacin) es mayor a 70 gr.

Solucin
Tomamos los resultados obtenidos anteriormente:

Regin de rechazo
z = z0.05 = 1.645

Valor del estadstico de prueba


X o 71.8 70
Z = = 2.02
/ n 8.9 / 100

Probabilidad de cola
P = P(Z2.02) = 1 F(2.02) = 1 0.9783 = 0.0217 (Tabla Z)

Se puede afirmar que la prueba tiene una significancia real de


2.17%

CLCULO DEL ERROR TIPO I Y ERROR TIPO II

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Suponga que se define la siguiente hiptesis relacionada con la media:

Ho: = 0
Ha: > 0

Error Tipo I

P( X c) c 0
= P(Z>z) = 0= P(Z> )
/ n

El Error de tipo I es el nivel de significancia de la prueba , y representa el


error en que se incurrir al rechazar Ho con la evidencia de la muestra, sin
saber que Ho es verdadera. El valor crtico de la regin de rechazo c
puede ser un dato especificado para la prueba o puede obtenerse a partir
del nivel de significancia especificado con la relacin:
c 0
z =
/ n

Error tipo II

c 1
= P( X c) 1 = P(Z< )
/ n

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

El Error de tipo II es , y representa el error en que se incurrir al aceptar


Ho si la evidencia de la muestra no es suficiente para rechazar Ho.

Para calcular un valor de es necesario suponer que hay otro valor


verdadero para el parmetro: 1 entonces es la probabilidad (rea) a la
izquierda del valor crtico c debajo de la curva con media 1

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

POTENCIA DE UNA PRUEBA

Suponga que se define la siguiente hiptesis relacionada con la media:


Ho: = 0
Ha: > 0

Se describi anteriormente la manera de calcular el error tipo II

= P(Aceptar Ho: = 0 dado que otra hiptesis es verdadera: = 1 )

Si la muestra es grande, el clculo de se hace con la frmula:


c 1
= P ( X c) 1 = P(Z< )
/ n
En donde c es el valor crtico de X con el que se acepta o rechaza Ho:

Est claro que puede calcularse para otros valores de =1, por lo tanto,
es una funcin de .

El complemento de es otra funcin: K = 1 - , y se denomina Potencia


de la Prueba.

Definicin
Potencia de la prueba: K=1- .

Si mide la probabilidad de aceptar una hiptesis falsa, entonces K, la


potencia de la prueba, mide la probabilidad de rechazar una hiptesis falsa.

Ejemplo
De una poblacin XN(, 2), (esto significa que la variable X tiene
distribucin normal con media y varianza 2), con varianza 2=49. Se ha
tomado una muestra aleatoria de tamao n para realizar la prueba de
hiptesis:

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Ho: = 15
Ha: > 15
Siendo la regin crtica X >c
Se requiere que la potencia de la prueba tome el valor 0.8 cuando =17, y
que tome el valor 0.95 cuando =18.

a) Determine los valores de n, c

Solucin
Primero obtenemos los valores respectivos de
K =1-K
17 0.8 0.2
18 0.95 0.05
Ahora usamos la frmula para
c 17
= P ( X c) 17 = P(Z< )
7/ n
c 17 c 17
0.2 = F( ) = -0.84 (tabla Z)
7/ n 7/ n
Igualmente,
c 18
= P ( X c) 18 = P(Z< )
7/ n
c 18 c 18
0.05 = F( ) = --1.65 (tabla Z)
7/ n 7/ n

Resolviendo estas dos ecuaciones por sustitucin o igualacin:


c 17 c 18
(1) = -0.84 (2) = --1.65
7/ n 7/ n
Se obtiene n=32, c=15.96

b) Calcule el nivel de significancia de la prueba:

Solucin
c 0 15.96 15
= P ( X c) 0 = P(Z> )= P(Z> )= 0.22 (Tabla Z)
7/ n 7 / 32

c) Calcule y grafique la potencia de la prueba con 1 = 12, 13, ..., 19

Solucin
15.96 1
K = 1 - = 1 - P ( X c) 1 = 1 - P(Z< 7 / 32 )
Valores calculados con la distribucin normal estndar
1 K
12 1 0
13 0.991 0.009
14 0.943 0.057
15 0.781 0.219
16 0.487 0.513
17 0.200 0.800

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

18 0.049 0.951
19 0.007 0.993

Grfico de la potencia de la prueba K():

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

PRUEBA DE HIPTESIS RELACIONADA CON

Caso n<30 (muestras pequeas)

Parmetro de inters: (media poblacional)


Suposiciones: poblacin normal, varianza desconocida
Estimador: X (media muestral)

PROCEDIMIENTO BSICO

1) Formular la hiptesis nula: Ho: = 0

2) Formular una hiptesis alterna, elegir una entre:


Ha: < 0
Ha: > 0
Ha: 0

3) Especificar el nivel de significancia de la prueba

4) Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho

X o
t , tiene distribucin t con = n-1 grados de libertad
s/ n

Ha Regin de rechazo de Ho en favor de Ha


< 0 t < -t
> 0 t > t
< 0 t<-t/2 t > t/2

5) Con los datos de la muestra calcule el valor del estadstico

6) Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin


es rechazar Ho en favor de Ha. Pero, si el valor no cae en esta regin crtica,
se dice que no hay evidencia suficiente para rechazar Ho. En este caso
es preferible abstenerse de aceptar Ho como verdadera pues esto
puede introducir el Error tipo II

Ejemplo
De una poblacin normal se tom una muestra aleatoria y se obtuvieron los
siguientes resultados: 15, 17, 23, 18, 20. Probar con una significancia de 10%
que la media de la poblacin es mayor a 18

Solucin
1) Ho: = 18

2) Ha: >18

3) Nivel de significancia de la prueba = 0.10

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

4) Estadstico de prueba
X o
t , tiene distribucin t con = n-1 grados de libertad
s/ n

1
x (15+17+23+18+20)=18.6
5
1
S2 = ((15-18.6)2 + ... ) = 9.3 s = 3.05
4
Re regin de rechazo de Ho
= 0.1 , = 5 1 = 4 t0.1 = 1.53 (tabla T)

Regin de rechazo de Ho: t > 1.53

5) t = (18.6 18)/(3.05/5) = 0.44 no es mayor que 1.53

6) No hay evidencia suficiente para rechazar la hiptesis nula

PRUEBA DE HIPTESIS

Caso n 30
Parmetro de inters: p (proporcin poblacional)
Estimador: p =x/n (proporcin muestral)

PROCEDIMIENTO BSICO

1) Formular la hiptesis nula: Ho: p = p0 (algn valor especfico para p)

2) Formular una hiptesis alterna, elegir una entre:


Ha: p < p0
Ha: p > p0
Ha: p p0

3) Especificar el nivel de significancia para la prueba

4) Seleccionar el estadstico de prueba y definir la regin de rechazo de Ho

p - p0
z = p 0 q0 tiene distribucin normal estndar aproximadamente
n
Ha Regin de rechazo de Ho en favor de Ha
p < p0 z < -z
p > p0 z > z
p p0 z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadstico

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

6) Si el valor del estadstico de prueba cae en la regin de rechazo, la decisin


es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay evidencia
suficiente para rechazar Ho.

Ejemplo
El estndar de artculos aceptables producidos por una fbrica es 90%. Se ha
tomado una muestra aleatoria de 175 artculos y se encontraron 150 artculos
aceptables. Pruebe con una significancia de 5% que no se est cumpliendo con
el estndar

Solucin

Sea p: proporcin de artculos aceptables que produce la fbrica


p = x/n = 150/175 = 0.857 = 85.7%
Es esto una evidencia que p < 90% o se puede atribuir nicamente a la
aleatoriedad de los datos, con 5% de probabilidad de equivocarnos?

1) Ho: p = 0.9

2) Ha: p < 0.9

3) Nivel de significancia de la prueba = 0.05

4) Estadstico de prueba
p - p0
z = p 0 q0
n
Regin de rechazo de Ho
= 0.5 , z = z0.05 = 1.645 (tabla Z)

Regin de rechazo de Ho: z < -1.645

p - p0 0.857 - 0.9
5) z = p 0 q0 = (0.9)(0.1) = -1.869 < -1.645
n 175

6) Hay evidencia suficiente para afirmar que el estndar no se cumple.

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

PRUEBA DE HIPTESIS PARA DIFERENCIAS DE MEDIAS

PROCEDIMIENTO BSICO

1) Formular la hiptesis nula: Ho: 1 - 2 = d0 (usualmente d0=0)

2) Formular una hiptesis alterna, elegir una entre:


Ha: 1 - 2 < d0
Ha: 1 - 2 > d0
Ha: 1 - 2 d0

3) Especificar el nivel de significancia para la prueba

4) Seleccionar el estadstico de prueba y definir la regin de rechazo de


Ho

( x1 x 2 ) d0
Z= 12 22 tiene distribucin normal estndar

n1 n2
aproximadamente
2
Adicionalmente: 1 S12 , 22 S 22

Ha Regin de rechazo de Ho en favor de Ha


1 - 2 < d0 z < -z
1 - 2 > d0 z > z
1 - 2 d0 z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadstico

6) Si el valor del estadstico de prueba cae en la regin de rechazo, la


decisin
es rechazar Ho en favor de Ha. Caso contrario, se dice que no hay
evidencia
suficiente para rechazar Ho.

Ejemplo
Suponga los siguientes los siguientes datos correspondientes a dos
muestras aleatorias independientes tomadas de dos poblaciones cuyas
medias se desea estudiar

muestra n x S2
1 75 82 64
2 50 76 36

Pruebe la hiptesis 1 > 2 con un nivel de significancia de 10%

Solucin

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

1) Ho: 1 - 2 = 0
2) Ha: 1 - 2 >0
3) = 0.1
( x1 x 2 ) d0
4) Z= 12 22

n1 n2
z = 1.28: Rechazar Ho si z > 1.28
(82 76) 0
5) Z= 64 36 = 4.78

75 50
6) Con una significancia de 5% se acepta que 1 > 2

Caso: Muestras pequeas

Este estudio estadstico permite comparar las medias de dos poblaciones


mediante muestras aleatorias independientes cuando las muestras son
pequeas.

Supongamos dos poblaciones: 1 y 2, con medias 1, 2,


varianzas desconocidas 12 , 22 y distribucin normal.

De estas poblaciones se toman muestras aleatorias independientes de


tamao n1 y n2 y se obtienen las medias muestrales X1 , X 2 .

Parmetro de inters: 1 - 2
Tamao de las muestras: n1, n2 < 30 (muestras pequeas)
Estimador: X 1 - X 2

X X = E[ X 1 - X 2 ] = E[ X 1 ] E[ X 2 ] = 1 - 2 (estimador
1 2

insesgado)

Note que si las varianzas poblacionales 12 , 22 fuesen conocidas


teniendo las poblaciones distribucin normal, el estadstico sera
Z, sin importar el tamao de las muestras

2
Se consideran dos suposiciones acerca de las varianzas: 1 2
2 y
12 2
2.

La teora estadstica provee adicionalmente una prueba para verificar


estas suposiciones mediante la prueba de hiptesis para dos varianzas
(Leccin E61)

CASO: 12 22 (SUPOSICIN)

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Estadstico
( X 1 X 2 ) ( 1 2 )
t= , distribucin t con = n1 + n2 2 gr. de
S X1 X 2
libertad
1 1 (n1 1)S 12 (n 2 1)S 22
S X 1 X 2 = Sp , S p2
n1 n 2 n1 n 2 2

Ho: 1 - 2 = d0 (usualmente d0 = 0)
: nivel de significancia

Estadstico de prueba
(X 1 X 2 ) d0
t= , distribucin t con = n1 + n2 2 gr. de libertad
S X1 X 2
Ha Regin de rechazo de Ho
1 - 2 < d0 t < -t
1 - 2 > d0 t > t
1 - 2 d0 t < -t/2 t > t/2

CASO: 12 22 (SUPOSICIN)

Estadstico
( X 1 X 2 ) ( 1 2 )
t= , distribucin t
S X1 X 2
2
S2 S2
1 2
n1 n2

con = S2 2 S2 2 grados de libertad
1 2
n1 n
2
n1 1 n2 1

S12S2
S X1 X2 = 2 ,
n1 n2

Ho: 1 - 2 = d0 (usualmente d0 = 0)
: nivel de significancia

Estadstico de prueba
(X 1 X 2 ) d0
t= , distribucin t
S X1 X 2

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

2
S2 S2
1 2
n1 n2

con = S2 2 S2 2 grados de libertad
1 2
n1 n
2
n1 1 n2 1
Ha Regin de rechazo de Ho
1 - 2 < d0 t < -t
1 - 2 > d0 t > t
1 - 2 d0 t < -t/2 t > t/2

Ejemplo (caso 12 22 )
Se realiz un experimento para comparar la resistencia de dos materiales,
obtenindose los siguientes resultados:
Material n X S
1 12 85 4
2 10 81 5

Suponga que son muestras aleatorias independientes y que provienen de


poblaciones normales con varianzas desconocidas, suponer iguales.

Pruebe con 5% de significancia que la resistencia del material 1 excede a


la resistencia del material 2 en dos unidades.

Solucin
1) Ho: 1 - 2 = 2
2) Ha: 1 - 2 > 2
3) = 0.05

4) Estadstico de prueba
(X 1 X 2 ) d0
t= , distribucin t con = n1 + n2 2 gr. de libertad
S X1 X 2
Regin de rechazo de Ho
= 0.05, = n1 + n2 2 = 12 + 10 2 = 20 t0.05 = 1.725 (tabla T)
t > 1.725
5) Clculo del valor del estadstico de prueba
(n1 1)S 12 (n 2 1)S 22 (12 1)4 2 (10 1)5 2
Sp
2
= = 20.05
n1 n 2 2 12 10 2
1 1 1 1
S X 1 X 2 = Sp = 20.05 = 1.917
n1 n 2 12 10
(X 1 X 2 ) d0 (85 81) 2
t= = = 1.043
S X1 X 2 1.917
6) t no cae en la regin de rechazo de Ho, por lo tanto, no hay
evidencia suficiente para rechazarla.

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Ejemplo (caso 12 22 )
Se realiz un experimento para comparar la resistencia de dos materiales,
obtenindose los siguientes resultados:
Material n X S2
1 15 3.84 3.07
2 12 1.49 0.80

Suponga que son muestras aleatorias independientes y que provienen de


poblaciones normales con varianzas desconocidas, suponer diferentes.

Encuentre un intervalo de confianza de 95% para la diferencia de las


medias poblacionales 1 - 2

Solucin
2
S2 S2 2
1 2 3.07 0.80
n1 n2
15 12
= S 2 2 S 2 2 = 3.07 2 0.80
2 21
1 2
n1 n 15 12
2
15 1 12 1
n1 1 n2 1

1 - = 0.95 /2 = 0.025, = 21, t/2 = t0.025 = 2.08 (Tabla T)

S12S2 3.07 0.80


S X1 X2 = 2 = = 0.521
n1 n2 15 12

Sustituimos en la frmula respectiva :

( x 1 - x 2 ) - t/2 S X X 1 - 2 ( x 1 - x 2 ) + t/2 S X X
1 2 1 2

(3.84 1.49) 2.08(0.521) 1 - 2 (3.84 1.49) + 2.08(0.521)

1.266 1 - 2 3.434

Por lo tanto, se puede afirmar con una confianza de 95% que la


diferencia de las medias de la resistencia de los dos materiales est
entre 1.266 y 3.434

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

PRUEBA DE HIPTESIS PARA DIFERENCIAS DE


PROPORCIONES

PROCEDIMIENTO BSICO

1) Formular la hiptesis nula:Ho: p1 - p2 = d0 (Algn valor especificado, ej.


d0=0)
2) Formular una hiptesis alterna. Elegir una entre:
Ha: p1 - p2 < d0
Ha: p1 - p2 > d0
Ha: p1 - p2 d0

3) Especificar el nivel de significancia para la prueba

4) Seleccionar el estadstico de prueba y definir la regin de rechazo de


Ho

(p 1 p 2 ) d 0
Z= p 1q1 p 2 q 2 , con distribucin normal estndar

n1 n2
aproximadamente
p 1q1 p 2 q2 p 1 q1 p 2 q 2
Adicionalmente:
n1 n2 n1 n2

Ha Regin de rechazo de Ho en favor de Ha


p1 - p2 < d0 z < -z
p1 - p2 > d0 z > z
p1 - p2 d0 z<-z/2 z > z/2

5) Con los datos de la muestra calcule el valor del estadstico

6) Si el valor del estadstico de prueba cae en la regin de rechazo, la


decisin es rechazar Ho en favor de Ha. Caso contrario, se dice que no
hay evidencia suficiente para rechazar Ho.

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

UNA PRUEBA PARA LA DIFERENCIA DE MEDIAS MEDIANTE


MUESTRAS PAREADAS

Este estudio estadstico permite comparar las medias de dos poblaciones


mediante muestras aleatorias que no son independientes. Esto significa que
las observaciones de una muestra influyen en los resultados de la otra.

Suponga que se quiere comparar la duracin de dos marcas de llantas. Si


se eligiera una muestra aleatoria de llantas de una marca y se las probara
en vehculos y se eligiera una muestra aleatoria de llantas de la otra
marca y se las probara con otros vehculos, entonces las muestras seran
independientes.

Pero, si se las muestras aleatorias de llantas se las probase


simultneamente en los mismos vehculos, entonces los resultados
obtenidos ya no son independientes pues recibieron las mismas
condiciones de uso. Estas seran muestras pareadas.

Supongamos dos poblaciones: 1 y 2, con medias 1, 2,

De estas poblaciones se toma una muestra aleatoria pareada de tamao n.


Es de inters estimar el valor de 1 - 2. Las muestras no son
independientes, por lo tanto no se pueden usar como estimador sus
medias muestrales.

Ahora se debe seguir otro procedimiento.

Sean: n: tamao de la muestra


X1: observaciones obtenidas en la muestra de la poblacin 1
X2: observaciones obtenidas en la muestra de la poblacin 2
Di = X1,i X2,i , i=1, 2, ..., n: Diferencias entre observaciones

Se supondr que Di son variables aleatorias independientes tales que


D = E[Di] = 1 - 2

Definicin
Estadstico para la prueba con muestras pareadas
1 n
D= Di
n i1
con varianza
1 n
S2 (Di D)2 .
D n 1i 1

Prueba de Hiptesis
1) Ho: 1 - 2 = d0 (algn valor especificado, por ejemplo 0)
2) Ha: 1 - 2 < d0
o 1 - 2 > d0
o 1 - 2 d0

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

3) : nivel de significancia
4) Estadstico de prueba

Caso: n 30
D d0
Z
SD
n
con distribucin aproximadamente normal estndar por el Teorema
del Lmite Central

Caso: n < 30. Suponer distribucin normal


D d0
T
SD
n
Distribucin T con = n 1 grados de libertad

Ejemplo
Los siguientes datos corresponden a un estudio de las horas perdidas
mensualmente por accidentes de trabajo en 6 fbricas antes y despus de
implantar un programa de seguridad industrial.

Antes Despus
Fbrica
(horas perdidas) (horas perdidas)
1 45 36
2 73 60
3 46 44
4 39 29
5 17 11
6 30 32

Suponer que la poblacin es normal. Probar con 5% de significancia que


el programa es eficaz

Solucin
Sean 1 media de la horas perdidas antes del programa
2 media de la horas perdidas despus del programa

Se desea probar que 1 > 2

1) Ho: 1 = 2
2) Ha: 1 > 2
3) = 0.05
4) Estadstico de prueba, n < 30
D d0
T
SD
n

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Distribucin T con = n 1 grados de libertad

t = t0.05 = 2.015, con = n 1 = 5 grados de libertad


Regin de rechazo para Ho: t > 2.015
1 n 1
5) d= di [(45-36) + (73-60) + ... ] = 5.5
n i1 6
1 n 1
s2 (di d)2 = [(9-5.5)2 + (13-5.5)2 + ... ] =27.5
D n 1i 1 5
sD = 5.244
5 .5 0
t
5.244 =2.56
6
6) Decisin:
Se rechaza Ho en favor de Ha, es decir, con una significancia
de 5% se puede afirmar que el programa si es eficaz

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

INFERENCIAS RELACIONADAS CON LA VARIANZA 2

Para algunas pruebas y aplicaciones es de inters estimar el valor de la


varianza poblacional 2.

Suponer que una poblacin tiene distribucin aproximadamente normal y


se toma una muestra aleatoria de tamao n de la cual se obtiene la
varianza muestra S2:
1 n 1 n
S2 (X i X ) 2 , X Xi
n 1i 1 n i1
El estadstico S2 es un estimador insesgado del parmetro 2: E[S2] = 2

La teora estadstica demuestra que la variable aleatoria: (n-1)S2/2 tiene


distribucin Ji-Cuadrado (2), con = n -1 grados de libertad. La
distribucin
Ji-Cuadrado es una funcin cuya forma es tipo campana con sesgo
positivo.

Para cada valor de se tiene una campana diferente:

S2
Figura: Distribucin Ji-Cuadrado 2 = (n-1) , con = n-1 grados de
2
libertad
Algunos valores de la distribucin Ji-Cuadrado estn tabulados para
ciertos valores de y para valores tpicos de con la siguiente definicin

P(2 2 ) =

Ejemplo
Encuentre el valor de 2 para n = 11, = 0.05

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Solucin
Consulte el documento E50 -Tabla de la distribucin Ji-Cuadrado
= n 1 = 10, 20.05 = 18.31

INTERVALO DE CONFIANZA PARA 2

En la distribucin 2 se define un rea central correspondiente a la


probabilidad
1 - , y a los lados se divide la diferencia en dos reas iguales /2.

Debido a que la distribucin es asimtrica, los valores de la variable 2 no


tienen la misma distancia desde el centro y se los representa con 12 / 2 y
2 / 2 de acuerdo a la definicin anterior

Se obtiene entonces el intervalo para 2 con probabilidad 1 - :


2 2
/ 2 / 2
2
1
S2
Si se sustituye la definicin del estadstico 2 = (n-1) y se despeja el
2
parmetro de inters 2 se obtiene

Definicin
Intervalo de confianza para 2 con nivel 1 -
S2 S2
(n 1) 2 (n 1) .
2 / 2 12 / 2

Ejemplo
En una muestra aleatoria se registr el peso de 10 paquetes y se
obtuvieron los siguientes resultados en gramos:
46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 41.9, 45.2, 46.0

Encuentre un intervalo de confianza para la varianza en el peso de toda la


produccin, con un nivel de 95%, suponiendo distribucin normal

Solucin

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

n=10
1 n 1
X Xi = [46.4 + 46.1 + ... ] = 45.62
n i1 10
1 n 1
S2 (X i X )2 = [(46.4 45.62)2 + (46.1 45.62)2 + ... ] = 1.919
n 1i 1 9

1 - = 0.95, = n 1 = 9 2 2
/ 2 = 0.025 = 19.02 (Tabla
)
2

2 2
1 / 2 = 0.975 = 2.7 (Tabla 2)

Sustituya en la definicin del intervalo de confianza:

9 (1.919/19.02) 2 9 (1.919/2.7)

0.908 2 6.398

Se puede afirmar con una confianza de 95% que la varianza


poblacional se encuentra en el intervalo de 0,908 a 6.398

PRUEBA DE HIPTESIS RELACIONADA CON LA VARIANZA 2

Seguimos el procedimiento bsico establecido

1) Definir la hiptesis nula Ho: 2 = 2o (algn valor


especificado)
2) Elegir una Hiptesis alterna: Ha: 2 < 2o
Ha: 2 > 2o
Ha: 2 2o
3) Seleccionar el nivel de significancia
4) Estadstico de prueba
S2
2 = (n-1) , distribucin ji-cuadrado con =n-1 grados de libertad
2
o
Regin crtica
Ha Regin de rechazo de Ho en favor de Ha
< o
2 2
2 < 12
2 > 2o 2 > 2
2 2o 2< 12 / 2 2 > 2 / 2
5) Calcular el valor del estadstico de prueba con los datos de la
muestra
6) Decidir

Ejemplo
Un fabricante afirma que la duracin de su producto tiene distribucin
aproximadamente normal con una desviacin estndar de 0.9 aos.

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Una muestra aleatoria de 10 productos tuvo una desviacin estndar de


1.2 aos. Pruebe, con una significancia de 5%, si esta evidencia es
suficiente para afirmar que la desviacin estndar poblacional es mayor a
la especificada

Solucin
La prueba se aplica a la varianza 2 por lo tanto 2 = (1.2)2 = 1.44

1) Ho: 2 = 0.81
2) Ha: 2 > 0.81
3) = 0.05
4) Estadstico de prueba
S2
2 = (n-1) , distribucin ji-cuadrado con =n-1 grados de libertad
2
o
Regin de rechazo
=0.05, = n-1 = 9, 20.05 = 16.91
Rechazar Ho si 2 > 16.91
S2 1.44
5) 2 = (n-1) =9 =16.0
2
o 0.81
6) Con una significancia de 5%, no hay evidencia suficiente para
rechazar la
afirmacin del fabricante

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

PRUEBA DE HIPTESIS PARA DOS VARIANZAS

Esta prueba permite comparar las varianzas de dos poblaciones.

Suponer dos poblaciones con distribucin aproximadamente normal con


varianzas desconocidas pero supuestamente iguales.

Se toman muestras aleatorias independientes de tamao n1 y n2


obtenindose las varianzas muestrales S 12 y S 22 respectivamente.

La teora estadstica demuestra que el estadstico

S 12
F = 2 , tiene distribucin F con 1 = n1 1, 2 = n2 1 grados de libertad
S2

El estadstico F tiene distribucin con forma tipo campana con sesgo


positivo.
Para cada combinacin 1 , 2 se tiene una campana diferente.

Algunos valores de esta distribucin estn tabulados para valores


especficos de
, 1, 2 de acuerdo a la siguiente definicin:
F ,1 , 2 = P(F> F ,1 , 2 ).

Tambin se puede usar una relacin til para conocer otros valores de la
distribucin F:

1
F1 , 1 , 2 .
F , 2 , 1

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Siguiendo el procedimiento bsico establecido para prueba de hiptesis:

1) Definir la hiptesis nula Ho: 12 22


2) Elegir una Hiptesis alterna: Ha: 12 22
Ha: 12 22
Ha: 12 22
3) Seleccionar el nivel de significancia
4) Estadstico de prueba
S 12
F = 2 , distribucin F con 1 = n1 1, 2 = n2 1 grados de
S2
libertad

Regin crtica
Ha Regin de rechazo de Ho en favor de Ha
1 2
2 2
F < F1-
1 2
2 2
F > F
1 2
2 2
F < F1-/2 F > F/2

5) Calcular el valor del estadstico de prueba con los datos de la


muestra
6) Decidir

Ejemplo
De dos poblaciones con distribucin aproximadamente normal se han
tomado dos muestras aleatorias independientes y se obtuveron:
Muestra n X S2
1 10 5.9 4
2 8 7.1 5
Pruebe con 10% de significancia que las poblaciones tienen varianzas
diferentes

Solucin
1) Ho: 12 22
2) Ha: 12 22
3) = 0.1
4) Estadstico de prueba
S 12
F = 2 , distribucin F con 1 = n1 1, 2 = n2 1 grados de
S2
libertad
Regin crtica
= 0.1, /2 = 0.05, 1 = 10 1 = 9, 2 = 8 1 = 7
F / 2 ,1 , 2 = F0.05, 9, 7 = 3.68 (Tabla F)
F1 / 2 , , = F0.95, 9, 7 = 1/ F / 2 , , = 1/F0.05, 7, 9 = 1/3.29 = 0.304
1 2 2 1

Ing. Luis Rodrguez Ojeda Derechos reservados


Estadstica ICM 00166

Regin de rechazo de Ho en favor de Ha


F < 0.304 F > 3.68

5) Estadstico de prueba
S 12
F = 2 = 4/5 = 0.8
S2
6) Decisin: No hay evidencia suficiente en la muestra para rechazar
la hiptesis que las varianzas poblacionales son iguales

Ing. Luis Rodrguez Ojeda Derechos reservados

Você também pode gostar