Você está na página 1de 14

Universidad de San Carlos

Facultad de Ingeniera
rea de Estadstica
Anlisis Probabilstico, seccin A

Mdul Cmprbacin de hiptesis


Introduccin
Una hiptesis es un supuesto que se hace respecto a alguna caracterstica de una poblacin.
La contrastacin de hiptesis es un procedimiento estadstico cuyo objetivo es determinar
cuando es razonable concluir, a partir del anlisis de una muestra, que la poblacin posee
determinada propiedad o parmetro supuesto y cuando no es razonable llegar a esa
conclusin.
En este mdulo se presentan los conceptos fundamentales y los procedimientos estadsticos
para probar hiptesis relacionados con los parmetros: media, varianza y proporcin de
xitos referidos a una poblacin.

Objetivos
Al finalizar el mdulo el lector estar en capacidad de:

Formular la hiptesis nula y alternativa de un problema dado.


Identificar la aplicacin de cada uno de los procedimientos de prueba de hiptesis
expuestos.
Interpretar el trmino significancia.
Definir el error tipo 1 y el error tipo 2.
En situaciones particulares, evaluar la importancia de los riesgos de hacer falsas
decisiones.
Comprobar con el procedimiento adecuado la hiptesis nula a determinado nivel de
significancia.
Considerando los errores tipo 1 y tipo 2 calcular el tamao de muestra para efectuar
una prueba de hiptesis.

Hiptesis
Es una teora tentativa o suposicin adoptada previamente para explicar ciertos hechos y
guiar una investigacin. Es una aseveracin o conjetura relacionada con el comportamiento
de una o ms poblaciones.
Profesora Martha Guisela Gaitn Garavito
2015

Es un enunciado que se hace acerca de una caracterstica de la poblacin.


Por ejemplo:
Suponga que un investigador lleva a cabo un estudio para identificar diferencias entre dos
tipos de sellantes para tuberas, un enunciado preliminar lo planteara de la siguiente
forma: hay diferencia entre los dos tipos de sellantes. Para sealar que caracterstica hace
la diferencia seleccionar una variable X, el tiempo de secado del sellante, formulando la
hiptesis: un sellante A ofrece mayor tiempo de secado que un sellante B.
As la hiptesis hace un supuesto sobre una caracterstica de las poblaciones, el tiempo de
secado de los sellantes.
Hiptesis nula y alternativa
La hiptesis nula Ho est fundamentada en la teora o principio supuesto y establece que la
diferencia entre el resultado de la muestra y la teora no es significativa sino debida al azar.
En el ejemplo, el investigador tiene como antecedente que el tiempo de secado para un
sellante es considerada aceptable si es a lo ms 4 minutos, y desea comprobar que el
sellante A tiene un tiempo de secado superior al aceptable. A pesar que planea que el
sellante A tiene un mayor tiempo de secado, la hiptesis nula la planteara como: el tiempo
de secado del sellante A es el aceptable y la diferencia que pueda aparecer al estudiar una
muestra de este sellante se debe al azar ya que el tiempo de secado es una variable
aleatoria.
Hiptesis alternativa H1 es una suposicin que contradice la hiptesis nula, implica que las
variaciones entre el resultado de la muestra y la teora son significativas es decir que no se
debe al azar sino a algn o algunos factores determinantes. En el ejemplo se planteara que
el tiempo de secado es mayor que el aceptable.
Cualquiera que sea el planteamiento conceptual de las hiptesis es requisito, para
contratarlas estadsticamente, que stas se establezcan como supuestos sobre los
parmetros de una variable.
En los planteamientos anteriores, las hiptesis estn dadas en funcin del tiempo de secado
de un sellante, sin embargo para comprobar que una de ellas es cierta se deben representar
en funcin de un parmetro que describa la variable tiempo de secado, este puede ser el
promedio del tiempo de secado de los sellantes que es una medida que representa a toda la
poblacin.
Las hiptesis que se refieren a parmetros puede clasificarse en:

Profesora Martha Guisela Gaitn Garavito


2015

Hiptesis simples cuando se asigna un valor al parmetro por ejemplo, el tiempo promedio
de secado del sellante A es de 5.5 aos, el tiempo promedio de secado del sellante B es 4.2
aos.
Hiptesis compuesta, cuando se asigna un conjunto de valores posibles al parmetro, el
tiempo promedio de secado del sellante A es menor que 5 aos, el tiempo promedio de
secado del sellante B es mayor o igual a 5 aos.
Para el contraste es necesario que hiptesis la nula se plantee como una hiptesis simple y
la alternativa como una hiptesis compuesta. En el ejemplo Ho: = 3.5 y H1: >3.5

Comprobacin de hiptesis
Es un procedimiento formal que utiliza los investigadores para probar las teoras
propuestas, en ste se supone que los resultados del experimento, o muestreo, estn de
acuerdo a cierto modelo o teora y que las variaciones que se presenten entre el parmetro
hipottico y el estadstico resultante son debidas al azar. Para llevar a cabo la comprobacin
de la hiptesis se toma una muestra de los elemento de la poblacin, calculando un
estadstico y se determina a partir de l si los resultados son consistentes o imposibles con
la hiptesis nula planteada lo que implica la aceptacin o el rechazo de la hiptesis.
Tomando en cuenta que el resultado de la muestra, valor del estadstico, puede variar por
causa al azar o significativa, la prueba consiste en establecer, si Ho es cierta, el conjunto de
posibles valores del estadstico y hacer en este conjunto una particin de dos regiones
Regin Crtica y Regin de Aceptacin, es decir se identifica una particin de resultados
de forma que marque los lmites ente lo probable ( variaciones al azar ) y lo imposible
(variaciones significativas del comportamiento muestral) del conjunto de resultados del
estadstico. Estos lmites quedan determinados por el nivel de significancia , que es la
probabilidad suficientemente pequea de que, si la hiptesis nula es verdadera, el
estadstico tenga un valor dentro de cierto intervalo marcado como regin de rechazo.

Prueba de hiptesis para la media de una poblacin normal con varianza


conocida
Las pruebas de hiptesis para muestras de poblaciones normales, se basan en el anlisis del
comportamiento del estadstico media aritmtica de la muestra y su distribucin muestral.
A continuacin se presenta el razonamiento de la prueba.
Se lleva a cabo una investigacin para identificar el precio medio cargado a cierto servicio,
se considera que el precio justo es de $10.

Profesora Martha Guisela Gaitn Garavito


2015

Planteamiento de la hiptesis
Ya que el problema se refiere al precio promedio del servicio, las hiptesis deben
relacionarse con ese parmetro, el precio medio de todos los servicios de ese tipo
prestados a los clientes.
La hiptesis nula debe planearse congruente con cierta teora. El precio justo promedio
es $10
Ho: = 10
La hiptesis alternativa debe contradecir la hiptesis nula y puede seleccionarse entre:
H1 10
H1: < 10
H1: >10
Las dos ltimas conducen a una prueba unilateral y la primera a una prueba bilateral
1. Seleccin del estadstico de prueba: al ser una prueba relacionada con el parmetro
promedio, el estadstico ser el promedio aritmtico de la muestra. Hay que
recordar que al trabajar con la distribucin normal es prctico usar la transformacin
Z. como la distribucin muestral de medias, con varianza conocida puede
representarse por la distribucin normal, el estadstico de prueba se transformar a Z
Z= ( ) / ( )
2. Delimitar las reas de aceptacin y rechazo
Suponga que se selecciona la hiptesis alternativa H1: >10 con un nivel de
significancia de = 5%. Se delimitan las reas de aceptacin y rechazo de acuerdo a
un ensayo unilateral a la derecha
Observe que si la hiptesis nula es cierta existe una probabilidad de 5% que la media
de la muestra sea superior a c y existe una probabilidad del 95% de que el valor de la
media sea menor que c. El valor c que separa las dos regiones se llama valor crtico del
estadstico

5%
Aceptacin de Ho

Rechazo de Ho

c
En normal estndar

Profesora Martha Guisela Gaitn Garavito


2015

5%
Rechazo de Ho

Aceptacin de Ho

Zc= 1.645
El valor de Zc se denomina valor de z crtico y limita tambin las reas de
aceptacin y rechazo en la distribucin normal estndar.
El criterio de decisin puede establecerse en esta distribucin as: si la
transformacin Z del estadstico es menor que Zc se acepta la hiptesis nula porque
los resultados son consistentes con la teora que sustenta la Ho, si el valor de Z es
mayor que Zc se rechaza la hiptesis nula porque existe diferencia significativa
ente el resultado del estadstico y la teora presentada, la muestra presenta resultados
poco probable si la variaciones fueran debidas al azar.
3. Si en el problema se sabe que la desviacin estndar poblacional es $6, al tomar una
muestra de 64 servicios de ese tipo que revela un precio promedio de $12 la prueba
se efecta de la siguiente forma:
Z= (12-10) / 6 64 = 2.66
4. Con el 5% de nivel de significancia Zc es 1.645, el valor del estadstico de prueba,
2.66, es mayor que Zc por lo que est situado en el rea de rechazo y se concluye
que no hay evidencia para aceptar la hiptesis nula, si sta fuera cierta, la
probabilidad de que el estadstico tenga un valor mayor o igual a 2.66 es 0.003 que
es menor que el nivel de significancia fijado. El valor p de la prueba es 0.003.
5. Despus de efectuada la prueba se puede concluir que la muestra evidencia que el
pecio promedio del servicio es superior al justo de $10
Observaciones. Si al plantear la prueba se hubiera seleccionado cualquiera de las
otras opciones de H1 la delimitacin de rea sera; si H1: < 10

5%

zc
Si H1: 10

Profesora Martha Guisela Gaitn Garavito


2015

2.5%

2.5%

zc

-zc

El razonamiento expuesto anteriormente para probar una hiptesis de medias se


puede resumir de la forma siguiente:
a. Aclarar qu es lo que se pretende probar con el contraste de la hiptesis.
b. Aceptando que se ha hecho un enunciado claro del problema y del objetivo de
la prueba expresar la hiptesis nula y alternativa en trminos cuantitativos en
funcin de algn parmetro dela poblacin involucrada en el estudio.
c. Elegir un nivel de significancia
d. Seleccionar el mtodo de prueba tomando en consideracin las condiciones en
las que se realiza la investigacin y los supuestos tericos que las sustentan.
e. Planificar la realizacin del experimento o procedimiento para la recoleccin de
la informacin, seleccionando el tamao de muestra adecuado para el mtodo de
prueba seleccionado.
f. Realizar el experimento y calcular los estadsticos.
g. Efectuar el contraste de la hiptesis.
h. Concluir con la informacin dada por la prueba y de acuerdo al problema
planteado.

Otros procedimientos de prueba de hiptesis


Existen situaciones donde las condiciones de la poblacin expuestas en la prueba de
medias con varianza conocida no son pertinentes, tambin hay problemas que se relacionan
a parmetros diferentes a la media, por lo que es necesario plantear nuevos estadsticos de
prueba.
La tabla siguiente presenta lo diferentes estadsticos y las condiciones en las que se pueden
utilizar para efectuar una prueba de hiptesis.
Ho

Estadstico

Condicin

Estadstico de prueba

Distribucin

H1

,= o

Poblaciones con varianza


conocida y aplicable en el
caso de desconocer y
estimarla a partir de S y a
poblaciones no normales,
siempre que le muestra sea al
menos 30

Z= (- )/ (/)

Normal
estndar

, > o
,< o
. o

Profesora Martha Guisela Gaitn Garavito


2015

rea de
rechazo
Z>Zc
Z >Zc
Z Zc

,= o

Poblacin normal con


varianza desconocida y
estimada por S

, t=( -) /(s/)

2 = 2

S2

Poblaciones normales

2 = (n-1) s2/2

,p = po

Poblaciones binomiales con


n>30

Z=(P-po)/(

(1)

T de student
con n-1
grados de
libertad
Chi
cuadrado
con n-1
grados de
libertad
Normal
estndar

, > o
,< o
. o

,t>tc
.t<tc
,t tc

<o
>o
p

,2 <2c
,2 >2c
,2 2c

,p < po
,p>po
,ppo

Z < Zc
Z >Zc
ZZc

EJEMPLOS PRUEBAS DE HIPOTESIS


Una empresa est interesada en lanzar un nuevo producto al mercado. Tras realizar una
campaa publicitaria, se toma la muestra de 1 000 habitantes, de los cuales, 25 no conocan
el producto. A un nivel de significacin del 1% apoya el estudio las siguientes hiptesis?
a. Ms del 3% de la poblacin no conoce el nuevo producto.
b. Menos del 2% de la poblacin no conoce el nuevo producto
Datos:
n = 1000
x = 25

Donde:
x = ocurrencias
n = observaciones
= proporcin de la muestra
= proporcin propuesta
Solucin:
a)

Profesora Martha Guisela Gaitn Garavito


2015

= 0,01

H0 es aceptada, ya que z de prueba (-0,93) es menor que z del nivel de significancia ( de


tabla 2,326), por lo que no es cierto que ms del 3% de la poblacin no conoce el nuevo
producto.
b)

= 0,01

Ho es aceptada, ya que z prueba (1,13) es mayor que z tabla -(2,326), por lo que no se
puede concluir que menos del 2% de la poblacin no conoce el nuevo producto.
Cuando las ventas medias, por establecimiento autorizado, de una marca de relojes caen por
debajo de las 170,000 unidades mensuales, se considera razn suficiente para lanzar
una campaa publicitaria que active las ventas de esta marca. Para conocer la evolucin de
las ventas, el departamento de marketing realiza una encuesta a 51 establecimientos
autorizados, seleccionados aleatoriamente, que facilitan la cifra de ventas del ltimo mes en
relojes de esta marca. A partir de estas cifras se obtienen los siguientes resultados: media =
169.411,8 unidades., desviacin estndar = 32.827,5 unidades; con un nivel de
significacin del 5 % y en vista a la situacin reflejada en los datos. Se considerar
oportuno lanzar una nueva campaa publicitaria?
Datos:
n = 51

Profesora Martha Guisela Gaitn Garavito


2015

S= 32827.5
Por ser la muestra grande se utiliza la prueba Z con la desviacin estndar estimada por la S, esto es se
sustituye por S

Solucin:
H0: = 170000
H1: < 170000
= 0,05 z de talba -1.645

No es posible rechazar Ho, porque z prueba (-0,12) es mayor que z tabla -(1,645).
Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de
ventas realizan 40 visitas a profesores por semana. Varios de estos representantes piensan
que realizan un nmero de visitas promedio superior a 40. Una muestra tomada al azar
durante 8 semanas revel un promedio de 42 visitas semanales y una desviacin estndar de
2 visitas. Suponiendo que las visitas semanales se distribuyen normalmente, utilice un nivel
de significancia de 0.5% para aclarar esta cuestin.
Datos:
= 40
n=8
Nivel de confianza del 99%
Nivel de significacin 0,5% = 0,005

Solucin:
H0: = 40
H1: > 40
Grados de libertad: n-1 = 8-1 =7
= 0,005

Profesora Martha Guisela Gaitn Garavito


2015

Ho es aceptada, ya que t prueba (2,83) es menor que t tabla (3,499), por lo que no es
acertado pensar que estn realizando un nmero de visitas promedio superior a 40.

Riesgos de hacer falsas decisiones


Cuando se toma la decisin de rechazar o no rechazar una hiptesis nula se corre el riesgo
de cometer uno de los siguientes errores
Error tipo 1: rechazar la hiptesis nula cuando es verdadera, est ligado al planteamiento
de la Ho y al nivel de significancia el que representa una probabilidad lo suficientemente
pequea que si la hiptesis nula es verdadera, la muestra presente un estadstico con un
valor significativamente diferente de al parmetro planteado en ella, por ocurrir este hecho
poco probable, pero posible, la Ho debe ser rechazada, sin embargo la decisin est
equivocada.
Por ejemplo en la hiptesis para la media de una poblacin normal con varianza conocida,
si Ho es = o y la alternativa > o
Ho se rechaza si el estadstico es mayor que c, esto es, se rechaza porque un valor de
mayor que c, est en una rango de valores que es poco probable (% probable) que
ocurra si Ho es verdadera, pero no imposible, por lo tanto al rechazarla se puede estar
cometiendo el error tipo 1.
es la probabilidad de rechazar una hiptesis nula cuando es verdadera, es la probabilidad
de cometer el error tipo 1 que se fija previo a la realizacin del experimento.
Error tipo 2 aceptar la hiptesis nula cuando es falsa.
El error tipo 2 est ligado con el planteamiento de la hiptesis alternativa, pues cuando Ho
es falso, el verdadero valor del parmetro se encuentra contenido en el intervalo que H1
representa. La magnitud del error tipo 2 se representa por y es la probabilidad de que el
estadstico muestre un valor consistente con Ho a pesar que es falsa.
En el ejemplo, suponiendo que Ho es falsa, que la verdadera media es 1 (1 >o)
entonces si el estadstico tiene un valor menor que c, Ho no se rechaza, por la regla de
decisin de la prueba, sin embargo el estadstico es el resultado de la observacin
Profesora Martha Guisela Gaitn Garavito
2015

10

aleatoria de la distribucin de la poblacin centrada en 1. La probabilidad de que de una


poblacin con media 1 presente un valor menor que c es % y representa la probabilidad
de cometer el error tipo 2 cuando la media verdadera es 1.
Por presentar un valor menor que c no se rechaza Ho pero es falsa, entonces se est
cometiendo el error tipo 2
es la probabilidad, conforme a la regla de decisin de la prueba, de aceptar la hiptesis
nula cuando en realidad es falsa, es la probabilidad de cometer el error tipo 2. Como
complemento de se encuentra la potencia de la prueba, que es la probabilidad de
rechazar la hiptesis nula cuando es falsa, esto es 1-
vara dependiendo del verdadero valor del parmetro, si H1 es una hiptesis compuesta
va a existir para cada posible valor que est conforme a ese criterio
Se acepta Ho
Se rechaza Ho

Ho verdadera
Decisin correcta
Error tipo 1

Ho falsa
Error tipo 2
Decisin correcta

Fuente: M. Mrques (2005) Clculo de la probabilidad del error tipo 2 (b) y de la potencia de la prueba
http://colposfesz.galeon.com/inferencia/teoria/cap3-13.htm

Por ejemplo
Los salarios por hora que se pagan en un sector de la industria tiene una distribucin normal
con media 13.2 $ y una desviacin estndar de 2.5$
Una compaa perteneciente a ese sector empela a 40 trabajadores, si se desea probar la
hiptesis de que la compaa paga salarios inferiores a sus empleados, plantee el
procedimiento de prueba.
Datos n = 40 = 13.2$

= 2.5$

Hiptesis Ho: = 13.2$

H: < 13.2$

Profesora Martha Guisela Gaitn Garavito


2015

nivel de significancia = 1%

Z= -2,33

11

Distribucin muestral () = 13.2 $

() = 2.5 / 40 = 0.3950$

Delimitacin del rea crtica C = 13.2 2.33 (0.3953) = 12.279$


Si Ho es verdadera existe una probabilidad de 99% de que la media de la muestra sea
superior a 12.179 y el 1% de probabilidad de que sea inferior a 12.279.
Segn la regla de decisin, si la media de la muestra es inferir a 12.279 se concluye que hay
evidencia para suponer que la compaa paga salarios inferiores, que la (media de la
poblacin a la que pertenece la muestra) es menor que 13.2, pero no se tiene la certeza al
tomar esta decisin, se puede cometer un error al llegar a esta conclusin por el hecho de
que la muestra presenta un resultado poco probable para ser congruente con la teora
planteada en Ho. Se puede cometer el error tipo 1. La probabilidad de cometer ese error es
= 1%.
Por otra parte si la verdadera media fuera 12.95$ existe la posibilidad de no advertirlo y se
acepte que la media es 13.20, la probabilidad de este hecho es la probabilidad de que la
media de la muestra sea superior a 12.279 dado que la verdadera media de la poblacin a la
que pertenece la muestra es 12.95, es la probabilidad de cometer el error tipo 2 cuando la
media es 12.95, el que se identifica momo
P ( > 12.279/ = 12.95) = P (Z>

12.27912.95
0.3953

)=P (z > - 1.697) = 1- 0.044= 0.9554

12.95
12.279
13.2

Ahora suponga que la verdadera media es 12$, tambin existe la posibilidad de no


advertirlo porque la media de la muestra es mayor que 12.279, en este caso P( > 12.279/
= 12 ) es P(Z >

12.27912.
0.3953

) = P( Z > 0.706) = 1- 0.7598 = 0.2401, que es la probabilidad de

cometer el error tipo 2 cuando la media verdadera es 12$


El clculo de la probabilidad del error tipo 2 puede efectuarse para todos los posibles
valores de m que se incluyen en el rango que establece la H1: < 13.2$
Algunas observaciones sobre los errores
Los errores tipo 1 y tipo 2 estn relacionados, un decremento en la probabilidad de
ocurrencia de uno de ellos conduce a un incremento en la probabilidad del otro.

Profesora Martha Guisela Gaitn Garavito


2015

12

Un incremento en el tamao de la muestra del experimento reduce simultneamente la


probabilidad de ocurrencia de los dos errores
Si la hiptesis nula es falsa, entonces se hace mxima a medida que el valor verdadero del
parmetro se aproxima al valor hipottico. Mientras ms grande es la distancia entre los
valores: hipottico, planteado en la Ho y el verdadero, es ms pequea.
El investigador es el responsable de fijar y dndole la importancia que merece cada uno
de los errores de acuerdo a la naturaleza del experimento.

Eleccin del tamao de la muestra


Para controlar la magnitud de los errores tipo 1 y tipo 2 es necesario utilizar en el
experimento el tamao de muestra apropiado.
Los procedimientos de clculo de tamao de muestra apropiados para realizar pruebas de
medias y proporciones se presentan a continuacin.
a. Hiptesis relacionadas con la media de una poblacin
Ho: = o

H1 : > o

Nivel de significancia y una potencia de la prueba, cuando el verdadero valor de


difiere del hipottico o en , de (1-)
2

(() + ()) 2
, =
2
Z(a) y Z(b) son los valores de la variable normal estndar con y (1-) rea
acumuladas
Por ejemplo
Suponga que se desea probar la hiptesis que el peso de un producto es 68 kg con la
alternativa de que es mayor a 68 kg; utilizando un nivel de significancia de 5% y
conociendo que la desviacin estndar de los peso es 5Kg.
Entonces el tamao de muestra requerido para que la prueba tenga una potencia del
90% cuando la verdadera media del peso sea 69 kg es
= (68-69)2 = 1
Z(a) = 1.645
Z(b) = 1.28
Profesora Martha Guisela Gaitn Garavito
2015

13

,n = (1.645+1.28)2*25/1 = 213.16
El tamao de muestra adecuado es de 214 productos
b. Hiptesis relacionadas con la proporcin de xitos de una poblacin
Ho: p = po

H1 : p> po

Nivel de significancia y una potencia de la prueba, cuando el verdadero valor de p


difiere del hipottico po en , de (1-), asi p = po+= p1
, =

(()(1 ) + ()1(1 1))^2


(1 )^2

EJERCICIOS:
1. Pruebe la hiptesis de que el contenido promedio de los envases de un lubricante
especifico es de 10 litros si los contenidos de una muestra aleatoria de 10 envases
son:
10.2
9.7

10.1
10.3

10.1
9.8

9.9
10.4

10.3
9.8

2. Se desarrolla una nueva cura para cierto tipo de cemento que tiene como resultado
un coeficiente de compresin de 5000 kg/cm2 y una desviacin de 120 kg/cm2,
pruebe la hiptesis que el coeficiente de compresin es menor a 5000 kg/cm2 y
encuentre la probabilidad de esta. Con una muestra de n=50 piezas de cemento y un
coeficiente de compresin de 4970 kg/cm2. Utilice un nivel de significancia del 2%.
3. Suponga que en el pasado 40% de todos los adultos favorecan la pena capital.
Tenemos razn para creer que la proporcin de adultos que actualmente favorecen
la pena capital ha aumento si en una muestra de 15 adultos 8 estn a favor de la
pena capital utilice un nivel de significancia de 5%.

Profesora Martha Guisela Gaitn Garavito


2015

14

Você também pode gostar