El contraste de hiptesis (tambin denominado test de hiptesis o prueba de
significacin) es una tcnica de inferencia estadstica para juzgar si una propiedad que se supone cumple una poblacin estadstica es compatible con lo observado en una muestra de dicha poblacin. Introduccin Si sospechamos que una moneda ha sido trucada para que se produzcan ms caras que cruces al lanzarla al aire, podramos realizar 30 lanzamientos, tomando nota del nmero de caras obtenidas. Si obtenemos un valor demasiado alto, por ejemplo 25 o ms, consideraramos que el resultado es poco compatible con la hiptesis de que la moneda no est trucada, y concluiramos que las observaciones contradicen dicha hiptesis. La aplicacin de clculos probabilsticos permite determinar a partir de qu valor debemos rechazar la hiptesis garantizando que la probabilidad de cometer un error es un valor conocido a priori. Las hiptesis pueden clasificarse en dos grupos, segn: 1. Especifiquen un valor concreto o un intervalo para los parmetros del modelo. 2. Determinen el tipo de distribucin de probabilidad que ha generado los datos. Un ejemplo del primer grupo es la hiptesis de que la media de una variable es 10, y del segundo que la distribucin de probabilidad es la distribucin normal. Aunque la metodologa para realizar el contraste de hiptesis es anloga en ambos casos, distinguir ambos tipos de hiptesis es importante puesto que muchos problemas de contraste de hiptesis respecto a un parmetro son, en realidad, problemas de estimacin, que tienen una respuesta complementaria dando un intervalo de confianza (o conjunto de intervalos de confianza) para dicho parmetro. Sin embargo, las hiptesis respecto a la forma de la distribucin se suelen utilizar para validar un modelo estadstico para un fenmeno aleatorio que se est estudiando. Planteamiento clsico del contraste de hiptesis Se denomina hiptesis nula a la hiptesis que se desea contrastar. El nombre de nula indica que representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad, y puede entenderse, por tanto, en el sentido de neutra. La hiptesis nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la hiptesis de que dos poblaciones tienen la misma media puede ser rechazada fcilmente cuando ambas difieren mucho, analizando muestras suficientemente grandes de ambas poblaciones, pero no puede ser demostrada mediante muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad lo suficientemente pequea para que no pueda ser detectada, aunque la muestra sea muy grande. A partir de una muestra de la poblacin en estudio, se extrae un estadstico (esto es, una valor que es funcin de la muestra) cuya distribucin de probabilidad est relacionada con la hiptesis en estudio y sea conocida. Se toma entonces el conjunto de valores que es ms improbable bajo la hiptesis como regin de rechazo, esto es, el conjunto de valores para el que consideraremos que, si el valor del estadstico obtenido entra dentro de l, rechazaremos la hiptesis. La probabilidad de que se obtenga un valor del estadstico que entre en la regin de rechazo an siendo cierta la hiptesis puede calcularse. De esta manera, se puede escoger dicha regin de tal forma que la probabilidad de cometer este error sea suficientemente pequea. Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la poblacin es el conjunto de los treinta lanzamientos a realizar, el estadstico escogido es el nmero total de caras obtenidas, y la regin de rechazo est constituida por los nmeros totales de caras iguales o superiores a 25. La probabilidad de cometer el error de admitir que la moneda est trucada a pesar de que no lo est es entonces: 5/30 Enfoque actual de los contrastes de hiptesis El enfoque actual considera siempre una hiptesis alternativa a la hiptesis nula. De manera explcita o implcita, la hiptesis nula, a la que se denota habitualmente por , se enfrenta a otra hiptesis que denominaremos hiptesis alternativa y que se denota . En los casos en los que no se especifica de manera explcita, podemos considerar que ha quedado definida implcitamente como es falsa. Si por ejemplo deseamos comprobar la hiptesis de que dos distribuciones tienen la misma media, estamos implcitamente considerando como hiptesis alternativa ambas poblaciones tienen distinta media. Podemos, sin embargo considerar casos en los que no es la simple negacin de . Supongamos por ejemplo que sospechamos que en un juego de azar con un dado, este est trucado para obtener 6. Nuestra hiptesis nula podra ser el dado no est trucado que intentaremos contrastar, a partir de una muestra de lanzamientos realizados, contra la hiptesis alternativa el dado ha sido trucado a favor del 6. Cabra realizar otras hiptesis, pero, a los efectos del estudio que se pretende realizar, no se consideran relevantes. Un test de hiptesis se entiende, en el enfoque moderno, como una funcin de la muestra, corrientemente basada en un estadstico. Supongamos que se tiene una muestra de una poblacin en estudio y que se han formulado hiptesis sobre un parmetro relacionado con la distribucin estadstica de la poblacin. Supongamos que se dispone de un estadstico T(X) cuya distribucin con respecto a , se conoce. Supongamos, tambin, que las hiptesis nula y alternativa tienen la siguiente formulacin:
Un contraste, prueba o test para dichas hiptesis sera una funcin de la muestra de la siguiente forma:
Donde significa que debemos rechazar la hiptesis nula, (aceptar ) y , que debemos aceptar (o que no hay evidencia estadstica contra ). A se la denomina regin de rechazo. En esencia, para construir el test deseado, basta con escoger el estadstico del contraste T(X) y la regin de rechazo . Se escoge de tal manera que la probabilidad de que T(X) caiga en su interior sea baja cuando se da .