Você está na página 1de 33

Estadstica II 17

Introduccin

ctualmente la estadstica aplicada ha tomado un papel fundamental


como herramienta para la toma de decisiones. El anlisis de los
sucesos econmicos, polticos y sociales en cualquier lugar del
mundo tienen relevancia en nuestro entorno, por lo tanto, toda herramienta que
sirva para inferir, pronosticar, analizar y resumir informacin, es considerada
como una ventaja competitiva, que es precisamente la labor de la estadstica
aplicada.
Con la evolucin de las computadoras y su fcil manejo, la estadstica ha
evolucionado gigantescamente, sin embargo, es necesario que el profesionista
tenga los conocimientos suficientes para poder interpretar correctamente los
resultados de un anlisis estadstico, ste es uno de los principales objetivos del
presente libro.
Como mencionamos, uno de los propsitos ms relevantes de la estadstica
es describir la informacin, ya sea proveniente de una muestra o de la poblacin
(censo); por razones de costos y tiempo no es comn realizar censos para
conocer a la poblacin de inters, que puede ser la calidad de un lote de
producto, la aceptabilidad de un nuevo anticido en el mercado mexicano, la
intencin de voto a favor de un candidato presidencial, etc. Para conocer a
la poblacin se recurre al muestreo; ste consiste en seleccionar una muestra
representativa, evaluarla y, a partir de los resultados obtenidos de la muestra,
inferir el comportamiento de la poblacin.
En el curso de estadstica I adquiriste conocimientos bsicos de estadstica
descriptiva, tcnicas de muestreo, distribuciones de probabilidad (normal
estndar), as como procedimientos para realizar estimaciones, los cuales se
retoman en la presente unidad con la finalidad de estudiar el proceso de
prueba de hiptesis. Con la aplicacin de pruebas de hiptesis se obtendr
informacin confiable para tomar decisiones acerca del comportamiento de la
poblacin de inters.
En esta unidad se describir el procedimiento para realizar pruebas de
hiptesis, describir a una poblacin y comparar dos poblaciones; tambin se
discutir la importancia de conocer el lenguaje utilizado en pruebas de hiptesis,
ya que es utilizado en Normas Oficiales Mexicanas, se citarn algunos ejemplos.

18

Unidad 1

1.1. Definicin de prueba de hiptesis


Una prueba de hiptesis es el procedimiento de la estadstica inferencial donde
se establece una conjetura acerca de la(s) caracterstica(s) de una poblacin y que
permite verificar, si esta(s) caracterstica(s) preestablecida(s) se cumple(n).
El objetivo de este procedimiento es rechazar o aceptar la conjetura inicial,
que recibe el nombre de hiptesis; ejemplo: un jefe de gobierno considera que
en las prximas elecciones su partido volver a ganar la jefatura, para lo cual
establece (crea una hiptesis) que ms de 50% de los ciudadanos votarn a
favor de su partido. Para probar si la hiptesis del actual jefe de gobierno es
correcta, se tomar una muestra representativa de los ciudadanos y a partir de
los resultados obtenidos se concluir si el jefe de gobierno tiene o no razn.

1.1.1. Tipos de errores en el planteamiento de prueba


de hiptesis
Al tomar una decisin o conclusin acerca de cualquier tipo de fenmeno
existe la posibilidad de cometer error; por ejemplo, en el noticiero de la maana
se pronostica que el da ser caluroso y sin lluvia, por lo tanto, decidimos, con
base en el pronstico, vestirnos con ropa ligera; pero sucede que el da es fro
y con lluvia intensa, esto quiere decir que a pesar de tener elementos de juicio,
existe la posibilidad de cometer error en la toma de decisiones, por lo tanto,
resulta necesario reducir lo ms posible este error.
Con el propsito de describir los tipos de errores en el planteamiento de
pruebas de hiptesis analizaremos el siguiente ejemplo:
Se trata de un juicio para demostrar si una persona es inocente o culpable de
un delito, de tal forma se plantea como hiptesis que la persona es inocente, a
esta hiptesis se le conoce como hiptesis nula y se representa por H0, el trmino
nula se refiere a que hay nulidad de efecto, es decir, se da por hecho que la
persona es inocente hasta que se demuestre lo contrario; la hiptesis alternativa
(representada por H1) corresponde a ser culpable.
Juicio
Hiptesis nula
Hiptesis alterna

H0: La persona es inocente


H1: La persona es culpable

Estadstica II 19

Despus de analizar todas la pruebas y testimonios correspondientes al


anlisis de la muestra, el jurado indica su veredicto; a continuacin se presentan
las posibilidades de error de este veredicto, cuando se contrasta con la situacin
real.

Tabla 1.1. Errores en el planteamiento de prueba de hiptesis.


Al analizar la tabla anterior se identifican dos tipos de errores y  a estos
errores se les conoce como errores tipo I y tipo II, respectivamente. Una de
las caractersticas de estos errores es que se encuentran relacionados de manera
inversamente proporcional, lo que quiere decir que conforme disminuye uno el otro
aumenta, de tal forma que es fundamental establecer cul de estos errores es ms
importante y reducirlo. En la estadstica inferencial, al igual que en el ejemplo
del juicio a una persona, el error ms importante es el error de tipo I; es decir,
concluir que la persona es culpable dado que es inocente. Imaginemos que la pena
sea cadena perpetua, si se analiza el error de tipo II, ste indica que el veredicto
es inocente cuando realmente es culpable; las consecuencias de esto son inciertas
debido a que la persona se puede regenerar y convertirse en hombre de bien.
A continuacin se define de manera formal (ortodoxa) estos errores con
base en la tabla 1.1.
Error de tipo I es la probabilidad de rechazar la hiptesis nula dado que la
hiptesis nula es verdadera.
Error de tipo II es la probabilidad de aceptar la hiptesis nula dado que la
hiptesis nula es falsa.*

*En el lenguaje estadstico para prueba de hiptesis, la palabra aceptar generalmente no se


utiliza, en su lugar se prefiere decir no rechazar; la razn es que decir aceptar implica
certeza (total certidumbre).

20

Unidad 1

1.2. Prueba de hiptesis para la media de una


poblacin cuando se conoce la desviacin
estndar poblacional
Para describir una poblacin en estadstica se utilizan medidas llamadas
parmetros; uno de los parmetros ms utilizados para describir una poblacin se
le conoce como promedio aritmtico o media y se representa por la letra griega
(ver Estadstica I, unidad 3), para conocer este valor sera necesario evaluar
cada elemento de la poblacin, lo cual resulta muy costoso y requiere mucho
tiempo, de tal forma que se prefiere utilizar la informacin de una muestra que sea
representativa y, a partir del promedio muestral , inferir el valor de .
Para este caso se da por conocido el valor de la dispersin de la poblacin
medido en trminos de desviacin estndar poblacional S (ver Estadstica I,
unidad 4), este valor se determina con base en estudios estadsticos anteriores
(informacin retrospectiva). Un ejemplo corresponde a la variabilidad en el
volumen dosificado en frascos de jarabe para la tos; el jefe de produccin conoce
la variabilidad de la mquina, ya que se han fabricado muchos lotes anteriores
y se tiene esta informacin, o bien, este valor de desviacin estndar puede ser
obtenida por medio del proveedor del equipo, artculos cientficos o por medio
del conocimiento a priori del especialista.
A continuacin describimos la metodologa para la prueba de hiptesis de
con desviacin estndar poblacional S conocida, por medio de un ejemplo:

Ejemplo 1
El gerente de control de calidad desea saber si el ltimo lote fabricado
cumple la especificacin que dice que el peso promedio () de las cajas de cereal
es de 300g; se sabe por experiencia que la desviacin estndar poblacional es
de 15g. Para esto se toma una muestra aleatoria de 9 cajas de cereal, con los
siguientes pesos: 295, 299, 301, 305, 298, 300, 301, 305 y 300g.

Estadstica II 21

Procedimiento
Paso 1
Identificar el modelo probabilstico
El modelo probabilstico se refiere a la distribucin de probabilidad a utilizar,
esto se define con base en las caractersticas del problema, en atencin al teorema
central del lmite (ver Estadstica I, unidad 8, tema 8.3) que en sntesis dice la
distribucin muestral de la media X se aproxima a una distribucin normal con
media y desviacin estndar X =
, a medida de que se incremente el
N
nmero de elementos n que conforman el tamao de las muestras posibles que se
obtienen de la poblacin, no importando el tipo de distribucin de la poblacin,
por lo tanto, para este caso de prueba de hiptesis se emplear la distribucin
normal estndar Z (ver Estadstica I, unidad 7, tema 7.2).
Paso 2
Establecer la hiptesis nula y la alternativa
La hiptesis nula en trminos estadsticos, para este ejemplo, es que el
promedio del peso de las cajas de cereal del lote (poblacin) sea igual a 300g.
H0: = 300g
Donde es el promedio del peso de todas las cajas de cereales del lote a evaluar.
La hiptesis alternativa tambin debe estar en trminos estadsticos y
corresponde al complemento de la hiptesis nula; sta se representa como H1
(algunos autores la identifican como Ha).
En este ejemplo la hiptesis alternativa es la siguiente:
H1: x300g
Paso 3
Definir el nivel del error de tipo I y determinar el estadstico de prueba
Definir el nivel de error de tipo I es un paso crtico ya que en funcin de
ste se establecern los criterios para rechazar la hiptesis nula. Debido a lo
anterior, en algunas pruebas importantes para establecer la calidad de productos
de consumo humano, la Secretara de Salud (por medio de documentos que

22

Unidad 1

son considerados leyes para el gobierno mexicano, tal como la Norma Oficial
Mexicana NOM 177-SSA1-1998) establece la magnitud del error de tipo I como
0.05. Al error de tipo I en pruebas de hiptesis tambin se le conoce como nivel
de significancia.*
En general se considera como un nivel de significancia adecuado el valor de
0.05; es decir, cometer un error de 5%. Este valor fue utilizado inicialmente por
R. A. Fisher**; dependiendo del rea de estudio, este valor puede ser modificado
ya sea por criterio del investigador o por documentos normativos.
Estadstico de prueba
Como estadstico de prueba se le conoce al valor que es calculado a partir de
los datos muestrales considerando la distribucin de probabilidad seleccionada;
este valor se utilizar para tomar la decisin de rechazar o no la hiptesis nula.
De acuerdo con el paso 1, la distribucin a utilizar es la normal estndar, por
lo tanto el estadstico de prueba es el siguiente:
:C =

A partir de los datos de la muestra se determina el promedio muestral X


y se calcula el estadstico de prueba Zc (Z calculada).
De acuerdo con los datos del problema, el tamao de la muestra es n = 9, los
resultados del peso de cada caja de cereal fueron 295, 299, 301, 305, 298, 300,
301, 305, y 300g. La desviacin estndar poblacional es de 15g.
Con base en lo anterior:
 +  +  +  +  +  +  +  +   
=
= 


X   
:C =
=
=
= 




N
X=

*Aunque la Real Academia de la Lengua Espaola adopta el trmino significacin, aqu


utilizaremos el trmino significancia, del ingls significance.
** Fisher es considerado padre de la estadstica aplicada.

Estadstica II 23

Paso 4
Establecer las regiones de rechazo para la hiptesis nula
La distribucin del estadstico de prueba, en este caso la distribucin normal
estndar, se divide en 2 regiones, una regin de rechazo de H0 y otra de no rechazo.
(Vease la figura 1.1)
Esto significa que con base en el valor de Zc, se tomar la decisin de rechazar o
aceptar la hiptesis nula; esta decisin estar en funcin del nivel de significancia .
La hiptesis nula para este caso indica que es igual a 300g (H0: = 300g), esto
quiere decir que se va a rechazar cuando sea diferente de 300g, pero ...

qu significa que sea diferente de 300g?


... diferente de 300g implica dos alternativas, una que sea mayor que 300g y
la otra que sea menor que 300g, por lo tanto se tendrn dos regiones de rechazo
(algunos autores llaman a este tipo de prueba de dos colas o de dos extremos).
Las regiones de rechazo indican a partir de qu valor se va a considerar
mayor o menor que 300g.
Para construir las regiones de rechazo se utiliza la distribucin normal
estndar (se llama normal estndar porque siempre tendr como valor de cero y
desviacin estndar 1), esto quiere decir que en el ejemplo la media bajo H0 toma
el valor de 300g, en la distribucin normal estndar, Z, este valor equivale a cero.
El rea de las regiones de rechazo corresponden al valor del error de tipo I o
nivel de significacin ; dado que en este ejemplo se tienen dos regiones de rechazo,
cada regin tendr /2 de rea, para que la suma de las dos regiones de rechazo sea
igual a , tal como se muestra en la siguiente figura:

Figura 1.1. Distribucin del peso de las cajas de cereal.

24

Unidad 1

Al utilizar la distribucin normal estndar, la media de las cajas de cereal


se transforma en cero, con desviacin estndar 1, tal como se muestra a
continuacin.

Figura 1.2. Distribucin normal estndar.


Los valores de Z que definen el rea de rechazo son conocidos como Ztablas
(tambin llamados Zcrticos); estos valores son definidos a partir del nivel de
significancia y su valor se determina con ayuda de la tabla de la distribucin
normal estndar. (Ver anexo 1.)
Si tiene un valor de 0.05, los valores de Ztablas que definen las regiones de
rechazo son los siguientes:
: = :  = :  = 


=:




Lo anterior se observa en la siguiente figura:

Figura 1.3.

= :  = :  = 

Estadstica II 25

Paso 5
Tomar la decisin de rechazar o aceptar la hiptesis nula con base en Zc
y Ztablas y concluir
Al retomar las regiones de rechazo observamos que si Zc mayor que 1.96 o
menor que 1.96, la hiptesis nula H0 se rechazar. En este caso el valor de Zc
es de 0.08, como este valor cae en la regin de aceptacin de H0, entonces, se
acepta la hiptesis nula.

Figura 1.4.

Conclusin
No existe evidencia que indique que el promedio del peso de las cajas de
cereal sea diferente de 300 g.

1.3. Prueba de hiptesis para la media de


una poblacin cuando se desconoce la
desviacin estndar poblacional
El caso ms comn se presenta cuando no se tiene conocimiento previo de la
variabilidad del fenmeno; por ejemplo, la aceptacin de un nuevo producto en el
mercado, el rendimiento de una mquina nueva, resultado de investigaciones, de
tal forma que se desconoce la variabilidad expresada como desviacin estndar
poblacional por lo tanto, para realizar pruebas de hiptesis en lugar de , se
utiliza su estimador, es decir, la desviacin estndar muestral representada por S.

26

Unidad 1

La desviacin estndar muestral se calcula por medio de la siguiente frmula


(ver Estadstica I, unidad 4, tema 4.3):
3=

X

X 

N 

La consecuencia de desconocer y utilizar S como su estimador es que en lugar


de utilizar la distribucin normal estndar Z, se utilizar la distribucin t-student (ver
Estadstica I, unidad 9, tema 9.2.2) como una aproximacin a la normal.
Por lo tanto, el estadstico de prueba t (tambin llamada t calculada tc):
TC =

X
S
N

donde tc sigue la distribucin t-student con n1 grados de libertad (gl)


Los grados de libertad (gl) se definen numricamente para este caso como el
tamao de la muestra (n) menos 1.
gl = n1.
Para describir el uso de este procedimiento se emplear el siguiente ejemplo:

Ejemplo 3
El gerente de desarrollo de nuevos productos est interesado en saber si el
contenido de shampoo en una nueva presentacin individual, es menor o igual a
lo indicado en el marbete (5ml), ya que si el contenido es menor que lo indicado,
se considera como fraude al consumidor y la empresa puede ser demandada.
Al realizar un muestreo de 9 sobres de shampoo, se observan los siguientes
resultados:
4.5, 5.0, 6.0, 5.5, 4.7, 5.8, 5.3, 5.9 y 5.2 ml

El procedimiento seguir los pasos para prueba de hiptesis:

Estadstica II 27

Paso 1
Identificar el modelo probabilstico
Dado que se desconoce la desviacin estndar poblacional y se desea
inferir sobre el promedio, la distribucin utilizada ser la t-student.
Paso 2
Establecer la hiptesis nula y la alternativa
H0: < 5 ml
H1: > 5 ml
Donde es el promedio del volumen del nuevo producto.
Paso 3
Definir el nivel de error de tipo I y el estadstico de prueba

Se define = 0.05
El estadstico de prueba es:
TC =

X
3
N

A partir de los datos de la muestra determinar el promedio muestral


desviacin estndar muestral S; calcular el estadstico de prueba tc.
X=

3=

X

3=

X

 +  +  +  +  +  +  +  +  
=
= 


X 

N 
I

y la

X 

N 

   +    +    +  +   


 

 +  +  +  + 



=
= 



28

Unidad 1

TC =


X  
=
=
= 

3


N

Paso 4
Establecer las regiones de rechazo para la hiptesis nula
En este caso existe una regin de rechazo que corresponde a los valores
de t, que sean significativamente mayores a la media, tal como se muestra a
continuacin:

Figura 1.5.
Como tiene un valor de 0.05, el valor de ttablas que define la regin de
rechazo es:
t n1= t 0.05, 91= t 0.05, 8 = 1.85951.86 (tabla de la distribucin t-student)
Ejemplo para determinar el valor de ttablas.

Tabla 1.2. Tabla de la distribucin t-student (ver anexo 2).

Estadstica II 29

De manera que la regin de rechazo es: tc > 1.8595

Figura 1.6
Paso 5
Tomar la decisin de rechazar o aceptar la hiptesis nula, con base en tc y ttablas
y concluir.
Como tc =1.8161 est en la regin de aceptacin, se acepta la hiptesis nula.
Conclusin
Se determina que el promedio poblacional (de todo el proceso) es menor
o igual que 5 ml, por lo tanto, la empresa puede ser demandada por el
consumidor ya que el contenido promedio puede ser menor que 5 ml.

Ejercicio 1
En una empresa el servicio al cliente se califica en una escala de 0 a 10.
El jefe de este servicio considera que, en promedio, los clientes califican el
servicio con 9. Para demostrar lo anterior decide seleccionar aleatoriamente 10
clientes y preguntarles la calificacin que daran a la empresa, los resultados
son los siguientes:
8, 9, 10, 7, 10, 8, 9, 9, 7 y 7.
Con base en esta muestra, se puede concluir que la conjetura del jefe de
servicio al cliente es correcta?

30

Unidad 1

1.4. Prueba de hiptesis para comparar dos


poblaciones independientes
Un problema comn en la industria es comparar la eficiencia de dos
proveedores, el rendimiento de dos mtodos de fabricacin, la velocidad entre
dos mquinas, la calidad de egresados en dos instituciones, la aceptacin de
un producto en dos nichos de mercado, etc. En estos ejemplos se identifica que
las poblaciones son independientes, esto quiere decir que los resultados de un
consumidor o la eficacia del proveedor A no influyen en los resultados del otro
consumidor o proveedor B.
A continuacin se describir el procedimiento para comparar dos poblaciones
independientes.
Para comparar dos poblaciones generalmente se considera que ambas tienen
la misma variabilidad; es decir, la amplitud de las distribuciones normales son
semejantes; a esta propiedad se le conoce como homoscedasticidad.

Figura 1.7.
En la figura anterior se observa que la amplitud de las distribuciones, que
representa la variabilidad, es semejante, ste es un supuesto que se puede
verificar por medio de una prueba de hiptesis con distribucin F de Fisher .
El objetivo de comparar dos poblaciones por medio de una prueba de
hiptesis consiste en determinar si las medias 1 y 2 son estadsticamente
diferentes; esto se puede evaluar por medio de la diferencia entre stas, es
decir, 12 = , si es diferente de cero, querr decir que las poblaciones son
diferentes.
La metodologa de prueba de hiptesis es la misma que se emple
anteriormente.

Estadstica II 31

Cuando se conoce la desviacin estndar poblacional en ambas poblaciones


y bajo el supuesto de homoscedasticidad, se utilizar como estadstico de prueba
Zc, que se define como:
:C =

 X X   

 
+
N N

donde:
X = media de la muestra tomada de la poblacin 1.
X = media de la muestra tomada de la poblacin 2.
1 =media de la poblacin 1.
2 = media de la poblacin 2.
12 = varianza de la poblacin 1.
22 = varianza de la poblacin 2.
n1= tamao de la muestra tomada de la poblacin 1.
n 2 = tamao de la muestra tomada de la poblacin 2.
Sin embargo, en la mayora de los casos donde se desea comparar dos
poblaciones, se desconoce el valor de la varianza, por esta razn se utiliza bajo
el supuesto de homoscedasticidad un valor que representa la variabilidad de
ambas poblaciones a partir de datos muestrales (n1 < 30, n 2 < 30); a esta varianza
se le conoce como varianza mancomunada o Sp2 (p proviene del ingls pooled).
La hiptesis que se plantea para determinar si dos poblaciones son iguales
se describe a continuacin:
H0: 1 = 2

1 2 = 0

Contra la hiptesis alternativa:


H1: 1 x 2

1 2 x 0

Para evaluar la hiptesis anterior se utiliza el estadstico de prueba tc


para varianza mancomunada S2p:

32

Unidad 1

TC =

 X X   
3 P 

 
+
N N

y
3 P =

N  S + N  S


N + N 

donde:
X = media de la muestra tomada de la poblacin 1.
X = media de la muestra tomada de la poblacin 2.
1 = media de la poblacin 1.
2 = media de la poblacin 2.
s12 = varianza de la muestra tomada de la poblacin 1.
s22 = varianza de la muestra tomada de la poblacin 2.
n1 = tamao de la muestra tomada de la poblacin 1. (n1 < 30)
n 2 = tamao de la muestra tomada de la poblacin 2. (n 2 < 30)
El valor de ttablas se calcula con el nivel de significancia y con los grados
de libertad
gl = n1+ n 2 2
El procedimiento se describir por medio del siguiente ejemplo:

Ejemplo 4
A una muestra aleatoria de vendedores de seguros de dos compaas se
les aplica un examen para demostrar sus conocimientos sobre seguros, los
resultados son:

Estadstica II 33

Se puede concluir que los vendedores de ambas compaas tienen en


promedio los mismos conocimientos en seguros?
Paso 1
Identificar el modelo probabilstico
Distribucin t con varianza mancomunada (ya que no se conocen 1 y 2)
Paso 2
Establecer la hiptesis nula y la alternativa
H0: 1 2 = 0
H1: 1 2 x 0
Donde es el promedio de conocimientos en seguros para cada poblacin.
Paso 3
Definir el nivel del error de tipo I y el estadstico de prueba

Se define = 0.05
El estadstico de prueba es:
TC =

 X X   
 
3 P +
N N

Con base en la informacin muestral se calcula el estadstico de prueba.

34

Unidad 1

A partir de las desviaciones estndares S se obtienen las varianzas, para


esto se eleva al cuadrado cada valor de la desviacin estndar.
S12 =10.22 =104.04
S22 =14.142 = 199.94
Una vez calculadas las varianzas muestrales se obtiene el valor de la varianza
mancomunada y finalmente el estadstico de prueba tc, tal como se muestra a
continuacin:
3 P =
TC =

N  S + N  S    +     


=
= 
=

 +  
N + N 
 X X   
3 P 

 
+
N N



  
=
=
= 
 
 
 +
 

Paso 4
Establecer las regiones de rechazo para la hiptesis nula
En este caso existen dos regiones de rechazo, como se observa en la siguiente
grfica:

Figura 1.8.
Como es de 0.05, los valores de ttablas que definen las regiones de
rechazo son:
t n +n 2= t 202= t 18 = 2.1009 (Valor obtenido de la tabla de la distribucin t-student)
1

Estadstica II 35

Para determinar el valor de ttablas.

Tabla 1.3. Tabla de la distribucin t-student (ver anexo 2).


Por lo anterior, las regin de rechazo queda de la siguiente forma:

Figura 1.9.
Paso 5
Tomar la decisin de rechazar o aceptar la hiptesis nula con base en tc
y t tablas y concluir
Como tc = 1.65 est en la regin de aceptacin, se acepta H0.

36

Unidad 1

Figura 1.10.
Conclusin
Existe evidencia que demuestra que en promedio, los conocimientos de los
vendedores de seguros de las compaas evaluadas son los mismos.

Ejercicio 2
1. Dada una muestra de tamao n1=40 que proviene de una poblacin con
desviacin estndar conocida 1=20, y otra muestra independiente n2 =50 que
proviene de otra poblacin con desviacin estndar conocida 2 =10, los promedios
de cada muestra fueron los siguientes: X =72, X = 66, determinar el estadstico
de prueba Zc.
2. Se desea determinar si existe diferencia entre el tiempo en que los clientes
de dos tiendas de ropa casual reciben el catlogo con los nuevos modelos y
tendencia en la moda. Los resultados son los siguientes:

Asumiendo que las varianzas poblacionales de ambas tiendas son iguales


(homoscedsticas) y =0.05, se puede concluir que el tiempo en que los
clientes reciben el catlogo en ambas tiendas es el mismo?

Estadstica II 37

Ejercicios resueltos
1. Se realiz un estudio de mercado para saber el nivel de ingreso familiar
promedio en una zona especfica de la ciudad de Mxico; si el nivel de ingreso
familiar es mayor o igual que 15 000 pesos, entonces se considerar esta zona
como viable para ser un nicho de mercado. Se decide tomar una muestra de
10 familias, con base en estudios anteriores se considera que la desviacin
estndar del nivel de ingreso poblacional para esta zona es de 5 000 pesos,
los resultados son los siguientes:
$12 000, $17 000, $12 000, $15 000, $16 000, $10 000, $14 000, $16 000, $18 000
y $11 000
Se puede concluir con base en esta muestra que el promedio de ingreso
familiar es mayor o igual que 15 000 pesos?
Paso 1
Identificar el modelo probabilstico
Dado que se conoce la desviacin estndar poblacional y se desea inferir
sobre el promedio, la distribucin apropiada es la normal estndar Z.
Paso 2
Establecer la hiptesis nula y la alternativa
H0: > $15 000
Donde es el promedio del ingreso de todas las familias de la zona de
inters.
En este ejemplo la hiptesis alternativa es la siguiente:
H1: < $15 000

38

Unidad 1

Paso 3
Definir el nivel del error de tipo I y determinar el estadstico de prueba

Se define = 0.05
El estadstico de prueba es:
:C =

A partir de los datos de la muestra, determinar el promedio muestral X y


calcular el estadstico de prueba Zc.
  +   +   +   +   +   +   +   +   +  
=

 
=  

X=

:C =

X    

=
=
= 

 
 

N

Paso 4
Establecer las regiones de rechazo para la hiptesis nula
En este caso existe una nica regin de rechazo (prueba de una cola),
que corresponde a los valores de Z que sean significativamente menores que la
media, tal como se muestra a continuacin:

Figura 1.11.

Estadstica II 39

Como es de 0.05, el valor de Z tablas que define la regin de rechazo es:


: = :  = 
Lo anterior se observa en la siguiente figura:

Figura 1.12.
Paso 5
Tomar la decisin de rechazar o aceptar la H0 con base en Zc y Ztablas y
concluir
Como Zc = 0.57 est dentro de la regin de aceptacin, se acepta la
hiptesis nula.

Figura 1.13.
Conclusin
El promedio familiar en la zona (poblacin) de inters es mayor o igual
que $15 000, por lo tanto, esta zona puede ser considerada como nicho de
mercado.

40

Unidad 1

2. Dada una muestra de tamao n1 = 8 con media muestral X = 42 y desviacin


estndar muestral s1 = 4, y otra muestra independiente de tamao n2 =15 con media
muestral X = 34 y desviacin estndar muestral s2 =5. Es posible concluir que
las dos poblaciones representadas por las muestras son iguales? Considera que las
varianzas poblacionales son semejantes y utiliza = 0.05
Paso 1
Identificar el modelo probabilstico
Distribucin t con varianza mancomunada.
Paso 2
Establecer la hiptesis nula y la alternativa
H0: 1 2 = 0
H1: 1 2 x 0
Donde es el promedio en cada poblacin.
Paso 3
Definir el nivel del error de tipo I y el estadstico de prueba

Se define = 0.05
El estadstico de prueba es:
TC =

 X X   
3 P 

 
+
N N

Con base en la informacin muestral se calcula el estadstico de prueba.


3 P =

N  S + N  S   +  


= 
=
 +  
N + N 

Estadstica II 41

 X X   

TC =

3 P 

 
+
N N



  
=
= 
=
 
 
 +
 

Paso 4
Establecer las regiones de rechazo para la hiptesis nula
En este caso existen dos regiones de rechazo, como se observa en la siguiente
grfica:

Figura 1.14.
Como es de 0.05, los valores de ttablas que definen las regiones de
rechazo son:
t  n +n 2 = t  8+152 = t  21 = 2.5177 (tabla de la distribucin t-student)
1

Para determinar el valor de ttablas.

Tabla 1.4. Tabla de la distribucin t-student (ver anexo 2).

42

Unidad 1

Por lo anterior, la regin de rechazo queda de la siguiente forma:

Figura 1.14.
Paso 5
Tomar la decisin de rechazar o aceptar la hiptesis nula con base en tc
y t tablas y concluir.
Como tc = 3.896 est en la regin de rechazo, se rechaza H0.
Conclusin
Existe evidencia que demuestra que las medias de las poblaciones son
diferentes.

Ejercicios propuestos
1. El gerente de recursos humanos quiere demostrar que el rendimiento
promedio del personal es de 90%, para esto considera que la desviacin estndar
poblacional es de 10%; decide tomar una muestra de 18 empleado y evaluar su
rendimiento, los resultados son los siguientes:
90, 78, 40, 34, 20, 36, 61, 60, 80, 89, 41, 32, 69, 68, 50, 95, 78 y 89%.
Con base en estos resultados, se puede concluir que la hiptesis del gerente
es correcta?
Usar de 0.05

Estadstica II 43

2. Los siguientes datos representan el nmero de platos lavados antes de que


desaparezca la espuma en una prueba de detergente para trastos: 27, 28, 30, 31,
29, 25, 25, 30, 21, 34, 31, 33, 35, 24, 25, 28, 32, 34, 30 y 34. Si la fbrica no puede
demostrar que el promedio de platos lavados (antes de que desapareciera la
espuma) es de por lo menos 34, sta tendr que mejorar su detergente. Basados
en esta prueba con = 0.05, qu tiene que hacer la fbrica?
3. Se quiere evaluar dos proveedores. Las calificaciones en los ltimos meses
fueron:

Se puede concluir que hay diferencia entre los proveedores con = 0.05?
Considera que las varianzas de las calificaciones en ambos proveedores es la
misma.

Autoevaluacin
1. Cul de los siguientes incisos corresponde a la definicin del error de
tipo I ?
a) Probabilidad
verdadera.
b) Probabilidad
falsa.
c) Probabilidad
verdadera.
d) Probabilidad
falsa.

de rechazar la hiptesis nula dado que la hiptesis nula es


de aceptar la hiptesis nula dado que la hiptesis nula es
de aceptar la hiptesis nula dado que la hiptesis nula es
de rechazar la hiptesis nula dado que la hiptesis nula es

44

Unidad 1

2. Cul de las siguientes opciones corresponde al planteamiento de una


prueba de hiptesis?
a) = 20
b) = 0.05
c) X = 83.3
d) Z = 1.96
3. El estadstico de prueba tc se usa para verificar que H0: = 280, cuando
se desconoce:
a)
b) s
c) n
d)
4. El gerente de control de calidad desea verificar que el contenido promedio
de shampoo en el ltimo lote producido es de 250 ml, para esto toma una muestra
aleatoria de 25 botellas, con promedio muestral de 245 ml y desviacin estndar
s=16 ml. Cul es la prueba de hiptesis que corresponde a este planteamiento?
a)
b)
c)
d)

H0: > 250 ml


H0: 250 ml
H0: = 250 ml
H0: = 250 ml

vs
vs
vs
vs

H1: b 250 ml
H1: 250 ml
H1: b 250 ml
H1: x 250 ml

5. Del inciso anterior, qu valor corresponde al estadstico de prueba tc?


a) 1.56
b) 2.33
c) 1.4
d) 2.56
6. Indica el valor de los grados de libertad (gl) para el enunciado del
problema 4.
a) 14
b) 16
c) 24
d) 20

Estadstica II 45

7. Indica el valor de ttablas considerando =0.05 en el enunciado del problema 4.


a) 2.064
b) 1.7531
c) 1.3406
d) 0.6912
e) 2.9467
8. Con base en los incisos anteriores, cul sera la conclusin?
a) Rechazar H0.
b) Aceptar H0.
c) Ni aceptar ni rechazar H0.
d) Rechazar H1.
9. Se tienen dos poblaciones independientes y es de inters conocer si las
poblaciones son similares; para esto se considera que las varianzas poblacionales
son iguales y = 0.05. Despus de realizar un muestreo aleatorio en cada
poblacin se presentan los resultados.

Indica cul es la hiptesis nula y alternativa?


a)
b)
c)
d)

H0:  = 0
H0:  > 0
H0:  < 0
H0:  x 0

vs
vs
vs
vs

H1:
H1:
H1:
H1:

 x 0
 < 0
 > 0
 = 0

10. Cul sera la conclusin, considerando los datos del problema 9?


a) Rechazar H0.
b) Aceptar H0.
c) Ni aceptar ni rechazar H0.
d) Rechazar H1.

46

Unidad 1

Respuestas a los ejercicios


Ejercicio 1
H0: = 9 vs H1: 9
tc = 1.61647
gl = 9, Prueba de dos colas /2 = 0.025, ttablas = 2.2622
Zonas de rechazo:

Conclusin: se acepta H0, por lo tanto, la conjetura realizada por el jefe de


servicio al cliente es correcta.

Ejercicio 2
1. : C =

 X X   

+
N N






  
 
+
 

= 

2. H0:  = 0
vs
H1:  x 0
tc = 13.9438
gl = 68, Prueba de dos colas /2 = 0.025, ttablas = 1.995
Zonas de rechazo:

Estadstica II 47

Conclusin: dado que tc est en la regin de rechazo, se rechaza H0; esto


quiere decir que hay diferencia entre el tiempo en que los clientes de cada
tienda reciben el catlogo.

Respuestas a los ejercicios propuestos


1. H0: = 90% vs H1: x 90%
Zc = 12.3693
Ztablas = 1.96
Zonas de rechazo para Ho.

Conclusin: dado que el valor de Zc se encuentra en la zona de rechazo, se


rechaza H0, por lo tanto, la hiptesis del gerente es incorrecta.
2. H0: 34 platos vs H1: < 34 platos
tc = 5.3968
gl = 19
ttablas = t 0.05, 19 = 1.7291, dado que la zona de rechazo es la izquierda, el valor
se considera negativo.
Zona de rechazo para H0.

48

Unidad 1

Conclusin: dado que el valor de tc se encuentra en las zona de rechazo, se


rechaza H0, por lo tanto, la compaa tendr que mejorar su detergente ya que
la espuma no dura lo suficiente para lavar ms de 34 platos.
3. H0:  = 0
vs
H1:  x 0
tc = 0.422739
gl = 8, Prueba de dos colas A /2 = 0.025
ttablas = t 0.025,8 = 2.3060
Zonas de rechazo para Ho.

Conclusin: dado que el valor de tc se encuentra en la zona de aceptacin,


se acepta H0, por lo tanto, no hay evidencia que demuestre diferencia entre los
proveedores.

Estadstica II 49

Respuestas a la autoevaluacin
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

a)
a)
a)
d)
a)
c)
a)
b)
a)
a)

Você também pode gostar