Escolar Documentos
Profissional Documentos
Cultura Documentos
Los tests de hiptesis estadsticas se emplean para muchos problemas, en particular para
comparar las medias de dos o ms poblaciones. Por ejemplo cuando se desea comparar los
resultados de dos (o ms) mtodos de medicin. En estos ejemplos hay que considerar dos o
ms muestras. Los problemas de comparar dos o ms muestras los veremos en la clase
siguiente. Por ahora consideremos un problema ms simple, que es el de considerar una sola
muestra y querer estudiar si es cierta o no una hiptesis sobre la media de la poblacin.
4.32 4.31 4.50 4.12 4.43 4.36 4.48 4.28 4.18 4.42
DESCRIPTIVE STATISTICS
La media de las 10 determinaciones es menor que el valor verdadero, pero esto puede deberse al
azar. Aunque el mtodo de medicin no tuviese error sistemtico ( fuese igual al verdadero
valor), sabemos que la media muestral ( X ) no va a coincidir con el verdadero valor,
simplemente porque X es una variable aleatoria.
La pregunta que nos formulamos es: con estos 10 datos podemos afirmar que el mtodo de
medicin tiene error sistemtico?
Para poder hacer afirmaciones de este tipo, vamos a tener que aceptar una probabilidad de error.
La teora de tests de hiptesis forma parte de la teora de INFERENCIA ESTADSTICA. Al
querer extrapolar de una muestra a una poblacin siempre hay una probabilidad de cometer
error.
Una forma intuitiva de responder a la pregunta formulada, sera calcular un intervalo de
confianza para la media de la poblacin.
Pero como la muestra es pequea (n=10) necesitamos suponer que los datos son
aproximadamente normales para calcular el IC que vimos la clase pasada. Tenemos que mirar
los datos para ver si esta suposicin es razonable. Un grfico que ayuda a visualizar esto, es el
normal probability plot, que mostramos a continuacin. Cuando los datos tienen distribucin
aproximadamente normal, los puntos de este grfico estn cerca de una recta.
78
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
Vemos que los puntos estn cerca de una recta. Calculemos entonces un IC al 95%, usando la
expresin:
[ X t n-1; /2 * s / n X + t n-1; /2 * s / n]
DESCRIPTIVE STATISTICS
VARIABLE N LO 95% CI MEAN UP 95% CI SD
NIQUEL 10 4.2511 4.3400 4.4289 0.1243
Vemos que el IC al 95% para es [4.25, 4.43] que no incluye al valor verdadero (4.44%).
Basndonos en este IC podramos decir que es menor que el verdadero valor y que el mtodo
de medicin tiene un error sistemtico negativo. Existe la posibilidad de que nos
equivoquemos con este procedimiento? S, porque el IC no es seguro pero tiene una
confianza del 95%, o sea una probabilidad de error del 5%.
El procedimiento que hemos usado recin es calcular un IC para y observar si el valor
propuesto en la hiptesis est o no includo en el IC. Generalmente se usa otro procedimiento de
clculo, pero la conclusin a la que se llega es la misma.
Los problemas que trata esta teora son los que pueden plantearse del siguiente modo: observo
una muestra y tengo una hiptesis sobre la poblacin (por ejemplo acerca de la media o de la
diferencia de dos medias poblacionales) y quiero saber si esa hiptesis es cierta o no. Para ello,
como en cualquier problema de inferencia estadstica, vamos a plantear primero un modelo
probabilstico:
79
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
Modelo: X1, X2, ..., Xn vs. as. con una distribucin de la forma F(x,,,...) donde los
parmetros , , etc. son desconocidos,
e interpretar la hiptesis como una hiptesis sobre uno de los parmetros (o sobre varios
parmetros, o sobre una funcin de los parmetros). Luego, en funcin de la muestra
observada, se decide si aceptamos o no la hiptesis..
En la teora de tests de hiptesis estadsticas no se plantea una sla hiptesis sino dos hiptesis:
una se llama hiptesis nula y la otra alternativa.
donde n=10 y Xi es la i-sima determinacin de nquel . Con este modelo las dos hiptesis se
escriben
= 4.44
4.44
DEFINICIN: Un test es una regla de decisin que, en funcin de los datos de una
muestra X1, X2, ..., Xn , permite rechazar o aceptar la hiptesis nula.
Derivemos un test para el ejemplo que estamos considerando. Es intuitivamente razonable que
si X "se parece" a 4.44 vamos a aceptar H0 y que si X "est lejos del valor 4.44 vamos a
rechazarla.
Sabemos que , bajo el modelo (14)
X
T = t n-1
s2 / n
Esta variable T no se puede calcular, porque no conozco . Si H0 fuese cierta = 4.44, por lo
tanto:
X 4.44
si H0 es cierta T = t n-1
s2 / n
80
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
4.34 - 4.44
T = __________________ = -2.54
0.1243 / 10
La idea ahora es la siguiente: si H0 fuese cierta se espera que X se parezca a 4.44 y que por lo
tanto el valor de T recin calculado est cerca del valor cero. Por lo tanto, si X est lejos
de 4.44 o, lo que es lo mismo, si el valor calculado de T "est lejos de cero, pensaramos que
es difcil que H0 sea cierta, y estaramos dispuestos a RECHAZAR H0.
Tenemos que definir que queremos decir con est cerca o est lejos de cero.
Esta rea puede calcularse usando el StatistiX (Statistics, Probability Functions, T2-tail, x=-
2.54, DF=9). Resulta ser 0.03171. Esta probabilidad se llama "valor P" del test.
Entonces, si H0 fuese cierta, la probabilidad de que ocurra una media muestral X como la
observada o ms alejada del valor propuesto en H0 es BAJA (p=0.032), cual seria la
conclusin entonces? : SE RECHAZA H0
Se rechaza H0 cuando el valor de P es pequeo. El valor de corte es arbitrario, pero casi siempre
se usa 0.05, o sea se rechaza H0 cuando P<0.05.
Puedo equivocarme? S, si H0 fuese cierta podra darme un valor de T en las colas y rechazar,
pero cual es esta probabilidad? Es precisamente 0.05.
Comentario:
Todas las cuentas que hicimos pueden hacerse automticamente con el StatistiX. Para ello
vamos a Statistics, One, Two and Multiple Sample Tests, One sample T test , ponemos
en el casillero sample variables el nombre de la variable que estamos estudiando (en este
ejemplo Niquel) y en el casillero null hypothesis el valor propuesto en H0 (en este caso 4.44)
y obtenemos
81
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
MEAN 4.3400
STD ERROR 0.0393
MEAN - H0 -0.1000
LO 95% CI -0.1889
UP 95% CI -0.0111
T -2.54
DF 9
P 0.0315
CASES INCLUDED 10
Comentario: Aunque generalmente se usa 0.05 como punto de corte para P, tambin podra
usarse otro (0.01 o 0.10). Llamemos a ese punto de corte.
En todo problema de test de hiptesis se plantean dos hiptesis y, una vez observada la muestra
se RECHAZA H0 o NO. Entonces puede ocurrir alguna de estas cuatro situaciones:
Realidad
Se aplica el test y H0 es cierta H1 es cierta
Se acepta H0 Bien! Error tipo II
Se rechaza H0 Error tipo I Bien!
Como se aprecia en la tabla anterior, pueden cometerse dos tipos de errores, que se los distingue
con los nombre de error tipo I y tipo II.
En el ejemplo 1, dijimos que si H0 fuese cierta podra dar un valor de T en las colas y rechazar,
pero que este evento tiene probabilidad 0.05. Si hubisemos usado otro punto de corte () para
el valor P ese sera la probabilidad de error tipo I.
Para cualquier test: la probabilidad de error tipo I es (donde es el valor de corte que
se elija para el valor de P). Este valor se suele llamar "nivel de significacin" del test.
Entonces al elegir el punto de corte para el valor P (generalmente 0.05) estamos eligiendo la
probabilidad de error tipo I. La probabilidad de error tipo II es ms difcil de calcular y puede
ser grande si el tamao de muestra (n) es pequeo.
82
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
La idea del test que aplicamos para el ejemplo de las mediciones de nquel es vlida para
cualquier hiptesis sobre la media de una poblacin, basado en una muestra normal.
Generalicemos entonces.
Tests acerca de la media basado en una muestra normal con varianza desconocida.
Hiptesis bilaterales:
Elijo un valor de corte para P que llamaremos (generalmente =0.05). Observo una muestra,
calculo X y s y aplico el siguiente test:
Test:
s/n
2do. paso. Calculo el valor P que es el rea bajo las dos colas de la funcin de densidad t n-1
a partir del valor de T calculado en el paso anterior.
Comentario: el valor de T que se calcula en el primer paso se llama "el estadstico del test".
Hiptesis unilaterales:
H0 : = o
H1 : < o
H0 : = o
H1 : > o
Si la hiptesis alternativa es unilateral, todos los clculos son similares, salvo que el valor P es
el rea bajo una cola (la cola de la izquierda si la hiptesis alternativa es < o, la de la
derecha si la hiptesis alternativa es > o).
83
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
Advertencia: La eleccin de aplicar un test a 1 o 2 colas tienen que ser hecha antes de observar
los datos. Los tests a dos colas son ms usados y tienen la ventaja de que se puede informar que
existe diferencia significativa, tanto cuando la media muestral observada es menor que la
propuesta en la hiptesis nula, como cuando es mayor.
Hemos presentado hasta ahora solamente el test sobre la media basado en una muestra de una
distribucin normal. Hay muchos otros tests. El estadstico del test y la distribucin que se usa
para calcular el valor P son diferentes para cada caso. La eleccin del test depende del modelo
probabilstico que propondremos segn el tipo de datos que estamos analizando y de las
hiptesis H0 y H1.
Pero todos los tests tienen muchas caractersticas en comn. Siempre se plantean dos hiptesis.
Se pueden cometer dos tipos de errores. Se fija (generalmente en 5%) la probabilidad de error
tipo I, la probabilidad de error tipo II suele ser difcil de calcular y puede ser muy grande para
muestras pequeas. Si el tamao de muestra aumenta, la probabilidad de error tipo II disminuye
y tiende a cero cuando n El valor de P siempre puede interpretarse como la probabilidad de
observar nuestra muestra o una muestra an mas alejada de H0, si H0 fuese cierta.
Como la probabilidad de error tipo I esta controlada (5%) mientras que la de tipo II no es tan
fcil de controlar y puede ser grande para muestras pequeas, rechazar H0 (y por lo tanto
elegir H1) es una afirmacin ms fuerte que aceptar H0. Por lo tanto lo que se quiere
demostrar conviene (si se puede) ponerlo en H1. No siempre se puede hacer esta eleccin;
ste es el problema que hace que el test de normalidad de Shapiro-Wilk (es un test donde se
pone como H0 que la distribucin es gaussiana, ver Statistix, Statistics, Normality Tests) no sea
muy satisfactorio: para muestras pequeas puede tener mucha probabilidad de error tipo II y
por lo tanto ser poco "potente" para detectar falta de normalidad.
Tests acerca de la media basado en una muestra normal con varianza conocida.
El modelo normal con varianza conocida es ms simple que el anterior (hay un slo parmetro
desconocido que es ) pero menos usado en la prctica. Podra usarse en el ejemplo de las
mediciones de nquel si, por la experiencia previa, suponemos conocida la precisin del mtodo
de medicin: (la desviacin estndar ). Lo nico que no sabemos es si el mtodo es exacto o
tiene error sistemtico.
Modelo: X1, X2, ..., Xn vs. as. i.i.d N(,2) con conocido
Hiptesis:
Bilateral:
H0 : = o H1 : o
Unilaterales:
H0 : = o H1 : < o
H0 : = o H1 : > o
84
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
X o
Z = ____________
/ n
2do. paso. Calculo el valor P que es el rea de las dos colas de la funcin de densidad N(0,1)
a partir del valor de Z calculado en el paso anterior.
Ejemplo 2: (ejemplo de test para la media de una muestra normal con varianza conocida):
Supongamos ahora que por alguna medicin previa ya sospechbamos que el mtodo de
medicin de nquel tena error sistemtico negativo (estaba subestimando la cantidad de nquel).
Adems sabamos por haber hecho muchas determinaciones del mismo material (aunque no
supisemos el verdadero contenido de niquel) que la DS del mtodo es = 0.12.
Es con este conocimiento previo que realizamos las 10 mediciones de un material que sabemos
que tiene 4.44% de nquel.
Planteamos las siguientes hiptesis:
que se interpretan como el mtodo de medicin no tiene error sistemtico y el mtodo tiene
error sistemtico negativo respectivamente.
1er. paso.
X o 4.34 - 4.44
Z = ____________ = ______________ = -2.63
/ n 0.12 / 10
2do. paso. Calculo el valor P que es el rea de la cola a izquierda bajo la curva N(0,1). Esto
lo podemos hacer con la tabla normal o con Statistix, Statistics, Probability
functions, Z1-Tail, X=-2.63. El resultado es 0.00427
85
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
Veremos una forma equivalente de aplicar los tests. Pensemos por ejemplo en el test sobre
para una muestra normal con conocido, a dos colas .
Hemos rechazado cuando P<. Como
P < 0.05 Z est en alguna de las dos "colas" de la curva N(0,1) que tienen rea 0.05
|Z| > 1.96
o en general
P< Z est en alguna de las dos "colas" de la curva N(0,1) que tienen rea
|Z| > z /2
Test:
1er. paso. Calculo el estadstico del test:
X o
Z = ____________
/ n
Se llama as al conjunto de valores tal que si el estadstico del test pertenece a ese conjunto, se
rechaza Ho.
Por ejemplo en el test anterior, para el caso de de la hiptesis unilateral H1 : < o, la regin
de rechazo es la semirrecta (-, -z ). Para la hiptesis bilateral H1 : o la regin de
rechazo son las dos semirrectas (las dos "colas"): (-, -z /2 ) ( z /2 , )
86
FCEyN - Estadstica para Qumica 2do. cuat. 2006 - Marta Garca Ben
Cunto vale la probabilidad de error tipo II? Es la probabilidad de aceptar H0 cuando es falsa,
pero que quiere decir que H0 sea falsa? Quiere decir que < 4.44. Esta no es una hiptesis
"puntual" y la probabilidad de error tipo II depende de cul sea el verdadero valor de .
Intuitivamente vale ms si est cerca o lejos de 4.44?
Calcular lo siguiente:
b) una expresin que permita calcular la probabilidad de error tipo II para cualquier valor de
< 4.44 (esta funcin del verdadero valor de se suele notar ()).
Saber calcular la probabilidad de error tipo II de un test permite tambin determinar el tamao
de la muestra en la etapa del diseo del experimento. Por ejemplo:
d) Cuanto debe valer n para que la probabilidad de error tipo II, si el verdadero valor de es
4.40, sea menor o igual que 0.10?
Respuestas:
a) 0.16
b) () = 1 z + o
/ n
c) 0.72
d) n=77
() = z + o
/ n
() = z / 2 + o z / 2 + o
/ n / n
87