Você está na página 1de 42

MUESTREO

MUESTREO (TEMA 1)
o CONCEPTOS FUNDAMENTALES: MUESTREO: Cmo obtener muestras para, a travs de ellas, estudiar una poblacin. Se debe intentar que sean muestras representativas de la poblacin que queremos estudiar. INFERENCIA: En base a los resultados obtenidos de una muestra, hacer una afirmacin sobre la poblacin de la que la muestra ha sido extrada. CENSO: Si la muestra es tan grande que coincide con la poblacin no tenemos peligro de equivocarnos, pero eso ya no es inferencia. Lo que realmente le interesa al investigador es trabajar con muestras reducidas pero que sean representativas y, para obtener el tamao ideal no existe un nmero mgico.. Es funcin, entre otras cosas, de la variabilidad de la poblacin en la variable estudiada. Cuanto mayor sea la variabilidad mayor ser el nmero de elementos que debamos entresacar de la poblacin al formar la muestra para poder asegurarnos que representan a aquella. Si no hay variabilidad cualquier elemento de la poblacin que elijamos, representar a toda la poblacin. Uno de los problemas mayores con los que nos encontramos, suponiendo que el tamao de la muestra sea el adecuado, es el de cmo han sido obtenidas esas muestras, es decir qu mtodo de muestreo hemos utilizado. La inferencia estadstica, es decir, las afirmaciones que hacemos sobre la poblacin sobre la base del estudio de una muestra, se hace siempre, en trminos probabilsticos. Para que podamos hacer una inferencia con una probabilidad conocida de xito, es necesario que nuestra muestra haya sido obtenida aleatoriamente. Una de las implicaciones del muestreo probabilstico (y slo de l) es que se puede estimar el error muestral. ERROR MUESTRAL: Es la diferencia entre el resultado obtenido en la muestra y el que se habra obtenido si hubisemos hecho un censo con la poblacin siguiendo los mismos procedimientos que en la muestra. POBLACIN: Es el conjunto de elementos, finito o infinito, definido por una o ms caractersticas, de las que gozan todos los elementos que lo componen, y slo ellos. En muestreo se entiende por poblacin la totalidad del universo que interesa considerar, y que es necesario que est bien definido para que se sepa en todo momento que elementos lo componen. La poblacin es el conjunto de los elementos que en cada momento interesa estudiar, pero eso no quiere decir que los elementos que lo componen pertenezcan slo a ese conjunto, sino que depende de la definicin que hagamos de la poblacin para cada estudio particular. CENSO: En ocasiones resulta posible estudiar cada uno de los elementos que componen la poblacin, realizndose lo que se denomina un censo, es decir, el estudio de todos los elementos que componen la poblacin. La realizacin de un censo no siempre es posible por: - Economa, si la poblacin es muy grande es muy costoso. - Si las pruebas a las que se someten a los individuos son destructivas. - Si la poblacin es infinita. MUESTRA: Es el subconjunto de elementos de una poblacin. La caracterstica ms importante que debe cumplir una muestra es la
1

representatividad, esto es que sus elementos representen al conjunto de los elementos que componen la poblacin. INFERENCIA: Afirmacin hecha sobre una poblacin a partir de los resultados de una muestra obtenida de ella. MUESTREO: Es el procedimiento por medio del cual es elegida la muestra. o

TIPOS DE MUESTREO. MUESTREO PROBABILSTICO: Es aquel en el que se puede calcular de antemano la probabilidad de obtener cada una de las muestras que sea posible seleccionar, para lo cual es necesario que la seleccin de la muestra pueda considerarse como un experimento aleatorio. Es el nico tipo de muestreo que es capaz de darnos el riesgo (error muestral) que cometemos en la inferencia. Este tipo de muestreo, por el hecho de basarse en la Teora de la Probabilidad, nos puede dar, al tiempo que la muestra, la probabilidad de error que con ella cometemos, es decir, su grado de representatividad. MUESTREO INTENCIONAL U OPINATICO: En el cual la persona que selecciona la muestra procura que esta sea representativa segn su criterio, dependiendo, por lo tanto, de su intencin u opinin sobre qu es representativo en cada caso. MUESTRO SIN NORMAS, CIRCUNSTANCIAL O ERRATICO: Es aquel en el que se toma la muestra de cualquier manera, por razones de comodidad o capricho. TABLAS DE NUMEROS ALEATORIOS. Se utilizan en la seleccin de la muestra. Consisten en una serie de dgitos (en ms o menos cantidad segn de qu tabla se trate) dispuestos en pginas y presentados por grupos de filas y columnas, de modo que puedan leerse, cmodamente los nmeros.

o DISTRIBUCIONES EN MUESTREO. Distribucin poblacional. Si tomamos todos los elementos de la poblacin que interesa estudiar y medimos en ellos una caracterstica, podemos realizar una distribucin de frecuencias de esos resultados, que ser la distribucin de frecuencias de esa caracterstica en la poblacin, definida por su media y su varianza. PARMETROS: Son las medidas realizadas en la poblacin y se designan con letras griegas. = media de la poblacin. 2 = varianza poblacional. Distribucin de la muestra. Si en la muestra elegida medimos la caracterstica que interesa obtenemos unos resultados, cuya distribucin de frecuencias constituye la distribucin de la caracterstica en la muestra, definida por su media y su varianza. ESTADSTICOS: Son las medidas realizadas en la muestra y se designan por letras latinas maysculas. X = media de la muestra. S2 = varianza de la muestra. Distribucin muestral o distribucin del estadstico <<1>> en el muestreo. o A partir de una poblacin que tengamos definida, podemos obtener todas las muestras posibles, de un determinado tamao, de esa poblacin y medir en ellas una determinada caracterstica, pudiendo obtener un resultado numrico o funcin para cada muestra; la distribucin de frecuencias de estos valores constituye la distribucin muestral de esa caracterstica llamada tambin distribucin del estadstico <<1>> a partir de los
2

o o o o

resultados de las muestras. ERROR TIPICO: La desviacin tpica de la distribucin muestral de un estadstico (es decir; la raz cuadrada de su varianza), suele ser conocida como error tpico de ese estadstico. ESTIMACIN: Es el resultado numrico de cada uno de los valores de la funcin estimadora, es decir, los valores numricos parciales de cada muestra posible. ESTIMADOR INSESGADO: Cuando tengamos un estadstico tal que su media coincide con el parmetro poblacional que queremos estimar. ACURACIDAD: Se da cuando los estimadores sean insesgados, y adems, en lo posible, tengan una varianza pequea para que estn muy centrados en torno al valor central.

ESTIMACIN Y CONTRASTE DE HIPOTESIS


TCNICAS DE MUESTREO ALEATORIO (TEMA 2)
o DISTRIBUCIONES EN MUESTREO. Una caracterstica esencial del muestreo aleatorio es que todas las muestras posibles son equiprobables, es decir, tienen la misma probabilidad de ser elegidas, pero la probabilidad de cada una de ellas y la probabilidad de pertenencia de los sujetos, ser distinta en funcin de que realicemos el muestreo con o sin reposicin. MUESTREO ALEATORIO CON REPOSICIN o muestreo aleatorio simple: El tamao de la poblacin es exactamente el mismo para cada extraccin. Lo cual supone que un elemento seleccionado puede volver a formar parte de la muestra. Dado que las extracciones se realizan al azar, la probabilidad de cada elemento de la poblacin (N) de pertenecer a la muestra (n), en cualquiera de las extracciones ser siempre la misma: 1/N. MUESTREO ALEATORIO SIN REPOSICIN o irrestrictamente aleatorio: El tamao de la poblacin cambia con cada extraccin, dado que cada vez que realicemos una extraccin, el elemento seleccionado ya no puede volver a formar parte de la poblacin para la siguiente extraccin. No puede volver a formar parte de la muestra. En este tipo de muestreo, el resultado de una extraccin no es independiente del resultado obtenido en las dems, por lo que ahora la funcin de probabilidad conjunta de las variables es diferente del producto de sus funciones individuales. o MUESTREO ALEATORIO SISTEMATICO. Se necesita un listado de los elementos de la poblacin. No hay que tomar n nmeros aleatorios, tan slo hay que tomar uno (k). Siendo k un nmero entero resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. Si el resultado fuese un decimal, habra que redondear al entero inmediatamente inferior. En este tipo de muestreo hay que tener mucho cuidado con la presentacin de periodicidades en la poblacin, ya que entonces la muestra puede no ser representativa. o MUESTREO ALEATORIO ESTRATIFICADO. Si se sabe que una poblacin puede dividirse en partes o estratos de forma que en cada uno de ellos, los elementos posean una gran homogeneidad con respecto al carcter que se estudia, entonces se aumenta la precisin de las estimaciones tomando una muestra en cada estrato, es decir actuando separadamente en cada estrato. Tambin es necesario un listado de todos los elementos de la poblacin. Todas las partes en que sta puede ser dividida estarn representadas adecuadamente. Dentro de cada estrato se puede aplicar el muestreo aleatorio simple o el sistemtico. En ambos casos la seleccin es aleatoria y se tiene el muestreo aleatorio sistemtico. MUESTREO ESTRATIFICADO CON AFIJACION PROPORCIONAL: Cuando las variables en los estratos no difieren mucho entre s, el tamao de la muestra se toma proporcional al tamao del estrato. MUESTREO ESTRATIFICADO CON AFIJACION NO PROPORCIONAL: Suele utilizarse cuando las varianzas de los estratos difieren mucho entre s. En tal caso puede tomarse en consideracin tal varianza, y as en los estratos en que sta es grande, se tomar una muestra mayor, para aumentar la precisin.

o MUESTREO POR CONGLOMERADOS. La unidad muestral es un grupo de elementos de la poblacin a la que llamamos conglomerado. Normalmente, estos grupos o conglomerados tienen existencia real. El muestreo por conglomerados consiste en seleccionar aleatoriamente cierto nmero de conglomerados y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos. Se tiene la ventaja de que no es necesario tener un listado de todos los elementos de la poblacin, sino que consiste en dividir a la poblacin en grupos o conglomerados, muestrear aleatoriamente un nmero de ellos, y una vez que un determinado nmero ha sido seleccionado estudiar a todos los elementos que lo componen, no tenemos ms que conocer a los sujetos que forman los conglomerados seleccionados, sin importar el resto. MUESTREO POR AREAS: Cuando los conglomerados son reas geogrficas.

o MUESTREO POR ETAPAS. Es una generalizacin del muestreo por conglomerados. En la primera etapa se selecciona una serie de conglomerados o unidades muestrales primarias. En una segunda etapa se seleccionan conglomerados ms pequeos, pertenecientes a los anteriores, o unidades muestrales secundarias. Y as sucesivamente tantas etapas como sea necesario. Slo se necesita el listado de los elementos de la poblacin que integran los conglomerados de la ltima etapa, que son los que se van a investigar. El muestreo por etapas, tambin llamado polietpico, tiene la ventaja de que en cada etapa se puede aplicar el muestreo aleatorio (simple, estratificado, sistemtico) que se considere ms adecuado al tipo de conglomerados de que se trate. o ALGUNAS DISTRIBUCIONES MUESTRALES. A partir de una poblacin que tengamos definida, podemos obtener todas las muestras posibles, de un determinado tamao, de esa poblacin y medir en ellas una determinada caracterstica, pudiendo obtener un resultado numrico o funcin para cada muestra; la distribucin de frecuencias de estos valores constituye la distribucin muestral de esa caracterstica llamada tambin distribucin del estadstico <<1>> en el muestreo, dado que, lo que hacemos, es obtener o calcular el estadstico <<1>> a partir de los resultados de las muestras. Distribucin muestral de la media. LA MEDIA: La media de la distribucin muestral de la media (la media de todas las medias posibles). La esperanza de una constante es ella misma. La esperanza de una suma es igual a la suma de las esperanzas. La media de la distribucin muestral de la media es la media de la poblacin. LA VARIANZA: De la distribucin muestral de la media. La esperanza de una suma es igual a la suma de las esperanzas.

Si la variable estudiada (Y), se distribuye normal con parmetros poblacionales, entonces, la distribucin muestral de la media es tambin normal con los parmetros que acabamos de ver. Distribucin muestral de la proporcin. Cuando trabajamos con proporciones, lo que tenemos no son variables a las que podamos atribuir nmero en un continuo sino la presentacin o no de un determinado atributo. Se trata de variables dicotmicas o dicotomizadas. La esperanza de la proporcin de la muestra coincide con la proporcin de la poblacin. Si el tamao de la muestra no es muy grande, para poder utilizar la distribucin normal como una forma de aproximacin de la distribucin binomial requiere la utilizacin de una correccin por continuidad. Distribucin muestral de la varianza. Al igual que hemos obtenido el estadstico media y hemos visto sus distribucin en todas las muestras posibles de tamao n que se pueden obtener de una poblacin de tamao N, podemos obtener en todas esas muestras posibles el estadstico varianza y ver cual es su distribucin, es decir, la distribucin muestral de la varianza. El cociente entre dos formas cuadrticas se distribuye segn una distribucin Chi cuadrado, con tantos grados de libertad como sumandos menos los parmetros que haya que estimar. A medida que aumenta el tamao de la muestra, la distribucin Chi cuadrado se aproxima a la distribucin normal, aunque la aproximacin no es lo suficientemente buena hasta tamaos muy grandes (n>100).

ESTIMACIN DE PARMETROS (TEMA 3)


o DISTRIBUCIONES EN MUESTREO. HIPTESIS ESTADSTICAS: Son la hiptesis cientficas formuladas en trminos estadsticos. La hiptesis estadsticas son propuestas que se hacen sobre determinadas caractersticas (parmetro, forma, etc.) de una distribucin. ESTIMADOR: De un parmetro, a cualquier funcin de dichas variables aleatorias que, en general, supondremos independientes. Es un estadstico que utilizamos para estimar parmetros. La distribucin normal tiene dos parmetros, la media y la varianza. Para contrastar la hiptesis, debemos estimar la media de la poblacin y la varianza muestral. El problema fundamental de la estimacin puntual es estimar parmetros desconocidos de la poblacin, a partir de una muestra A los valores que toman las variables aleatorias en una muestra se les llama medidas, observaciones, puntuaciones, datos o valores muestrales. Como un estimador es una funcin de variables aleatorias tambin es una variable aleatoria y el valor que toma en una muestra dada es el llamado valor muestral de dicho estimador. Se usan letras griegas como referencia a los parmetros de la poblacin. Se usan letras latinas maysculas para las variables de una poblacin y los estimadores, estos ltimos considerados como funcin de variables aleatorias, no sus valores concretos que se simbolizarn con letras latinas minsculas. Tambin su utilizaran letras latinas minsculas como referencia a las observaciones de una muestra concreta. Un determinada caracterstica de una poblacin se distribuye siguiendo una distribucin dada por una funcin f(y), que depende de uno o ms parmetros, de forma que la distribucin queda totalmente determinada dado el valor del o los parmetros. Al estadstico utilizado para estimar el parmetro correspondiente se le llama estimador, y se reserva el trmino estimacin puntual o sencillamente estimacin, para el valor que toma ese estimador en una muestra particular. El valor del estimador se toma como la mejor estimacin del parmetro de la distribucin de la variable en la poblacin. Por ello uno de los problemas que se plantea en la estimacin de parmetros es elegir buenos estimadores, lo cual se hace por sus propiedades. o PROPIEDADES DE LOS ESTIMADORES. Uno de los objetivos fundamentales de la estimacin puntual, es estimar los parmetros desconocidos de la distribucin de una variable en la poblacin mediante valores concretos obtenidos en una muestra. Interesa que el estimador de un parmetro represente correctamente a ese parmetro, o sea, que sea un buen estimador del parmetro que se quiere estimar. Propiedades bsicas de un buen estimador: CARENCIA DE SESGO: La media de un nmero infinito de valores de un estimador sea igual al parmetro.
7

Insesgado (o centrado): Un estimador es insesgado cuando la media (esperanza matemtica) de los valores tomados por el estimador en las infinitas muestras de tamao n extradas de una poblacin, coincida con el valor del parmetro que queremos estimar. La media aritmtica muestral es un estimador insesgado de la media poblacional. Tambin la proporcin muestral es un estimador insesgado. La proporcin muestral es la media aritmtica de la muestra cuando los elementos de la misma slo toman valores 0 y 1. Otros estadsticos muy utilizados como la ordenada en el origen y la pendiente de una recta de regresin, son tambin estimadores insesgados de los parmetros correspondientes. La mediana y la moda son tambin estimadores insesgados de la media poblacional, cuando la distribucin de la poblacin es simtrica. La varianza muestral es un estimador sesgado de la varianza poblacional, pues la esperanza de la varianza de la muestra no es igual al parmetro correspondiente. Desviacin tpica insesgada es la raz cuadrada de la varianza insesgada. Comprobamos que la media y la proporcin de una muestra son estimadores insesgados de los parmetros correspondientes, mientras que la varianza muestral es un estimador sesgado de la varianza poblacional. Un estimador insesgado de la varianza poblacional es la varianza insesgada. La varianza insesgada se distingue de la sesgada (varianza muestral) en que el clculo de la primera, el sumatorio de las diferencias entre cada puntuacin y la media, al cuadrado, se divide por n1, mientras que en el clculo de la segunda, es por n. EFICIENCIA: Se denomina precisin o eficiencia de un estimador a la inversa de la varianza de su distribucin muestral. Cuanto mayor es el cociente, mayor es la eficiencia. Cuanto menor es la varianza de la distribucin muestral del estimador, mayor es la eficiencia, lo cual es razonable pues menos vara el valor del estimador de una muestra a otra. La media aritmtica es ms eficiente que la mediana, pues su distribucin es menos variable que la de la mediana. Eficiencia relativa: Un estimador de un parmetro es mas eficaz que otro, para un mismo tamao muestral, cuando la varianza del primer parmetro es menor que la varianza del segundo parmetro. Cuando el cociente es igual a 1, la eficiencia de las dos varianzas es la misma, porque en este caso las dos varianzas son iguales. SUFICIENCIA: Un estimador suficiente es aquel que utiliza la informacin de la muestra para estimar el parmetro, dndose esta propiedad slo cuando la distribucin de probabilidad propuesta es correcta. CONSISTENCIA: Un estimador es consistente si al incrementar n, es decir, a medida que se dispone de ms informacin, aumenta la probabilidad de que la estimacin coincida con el parmetro. Puesto que la consistencia est definida para n tendiendo al infinito, se dice que es una propiedad asinttica. La varianza muestral sabemos que es un estimador sesgado de la varianza, pues el sesgo disminuye cuando se incrementa el tamao de la muestra. La media, la proporcin y la varianza insesgada son consistentes porque adems de ser estimadores insesgados de los parmetros correspondientes, en el lmite de la varianzas respectivas valen cero. La decisin de utilizar uno u otro estimador, no viene dictado tanto por la propiedades de los estimadores como por las caractersticas de la variables (nivel de medida, distribucin, etc.).

Cuando tengamos dos o ms estimadores apropiados para un mismo caso, debemos elegir el que tenga mejores propiedades. o ESTIMACIN POR INTERVALOS. Se elabora un intervalo en el que se espera se encuentre el parmetro desconocido, con una cierta probabilidad. La estimacin por intervalos va ms all al establecer un rango de valores dentro del cual estara el valor del parmetro. El trmino probablemente nos indica que una estimacin por intervalos viene acompaada de una probabilidad. Una estimacin por intervalos expresa, de alguna manera, el grado de confianza con el que se espera est el valor del parmetro en el intervalo, por lo que se suele llamar intervalo confidencial. Una estimacin por intervalos o un intervalo confidencial depende de cuatro parmetros: Una estimacin puntual del parmetro. Una medida de variabilidad. Una probabilidad (nivel de confianza). Un supuesto distribucional de la poblacin. Para la construccin de un intervalo confidencial en torno a la media de una poblacin normal con varianza conocida, se seguiran los siguientes pasos: 1. Determinar o el nivel de confianza (1-). 2. Buscar en la tabla de la curva normal (Tabla A.1) el valor z correspondiente a /2. Es decir z/2. 3. Calcular la desviacin tpica de la distribucin muestral del estimador, en este caso, la media, Y, llamado tambin error tpico de la media. 4. Se obtiene el error mximo , Emx = | z/2 | Y. 5. Se hallan los lmites inferior y superior del intervalo , li y ls. Cuando se desconoce la varianza poblacional, hay que estimarla mediante su estimador insesgado. En este caso el estadstico no sigue el modelo de probabilidad normal sino de la T de Student con n-1 grados de libertad. No obstante para grados de libertad mayores de 30, la distribucin T de Student se aproxima a la normal por lo que, en esos casos, acudiremos a esta ltima. Si bajamos el porcentaje del nivel de confianza, ganaramos en precisin manteniendo constantes los dems factores, porque el intervalo que esperamos est el parmetro, sera ms pequeo, pero disminuira la probabilidad asociada a dicho intervalo.

o TAMAO DE LA MUESTRA. El intervalo para la media poblacional depende de la desviacin tpica de la distribucin muestral de la media, cuanto ms pequea sea la desviacin tpica, menor ser el intervalo de confianza, y por lo tanto ms preciso. Una forma de reducir la desviacin tpica es aumentando el tamao muestral, cuanto mayor es el tamao de la muestra, mayor es la precisin del intervalo y mayor es la precisin de nuestra estimacin. Conociendo la varianza poblacional y habiendo establecido un nivel de confianza y el error mximo, se puede determinar el tamao muestral necesario para alcanzar una determinada precisin en la estimacin de la media.

Si se desconoce la varianza poblacional, se debe estimar esta mediante su estimador insesgado. En este caso el estadstico no sigue el modelo de probabilidad normal sino de la T de Student con n-1 grados de libertad. A mayor tamao muestral, menor es el intervalo que esperamos est el parmetro manteniendo constantes los dems factores, por lo que mayor ser la precisin del mismo. o APNDICE: METODOS DE ESTIMACION. Mtodo de mxima verosimilitud. Es elegir como estimador de un parmetro aquel que maximice la probabilidad de lo que de hecho se ha observado en la muestra. La estimacin y, por tanto, el estimador es aquel que hace ms verosmil los datos obtenidos en la muestra. Mediante este mtodo lo que se pretende es elegir como estimacin la que haga mxima la probabilidad de obtener los datos muestrales El mtodo de mxima verosimilitud nos dice que debemos estimar el valor de P mediante el valor que haga mxima la probabilidad conjunta de la muestra, la cual es la proporcin de la muestra. Los estimadores de mxima verosimilitud de la media y la varianza de una poblacin normal son precisamente la media y la varianza de la muestra. El mtodo de mxima verosimilitud proporciona estimadores que son asintticamente insesgados, eficientes y normales, suficientes e invariantes. Este mtodo si bien es el que tiene mayores aplicaciones cuando trabajamos con muestras grandes, presenta graves inconvenientes en muestras pequeas por las propiedades asintticas de la mayora de sus estimadores. Mtodo de los mnimos cuadrados. Explicado el ao pasado. Tanto por el mtodo de mxima verosimilitud como por el de los mnimos cuadrados, se estiman los parmetros y a partir de una muestra aleatoria extrada de la poblacin de la variable que se est estudiando. Segn el primer mtodo lo que se hace es elegir como estimacin la que maximice la probabilidad de los datos muestrales, mientras que segn el segundo se trata de estimar los estimadores que hagan mnima la suma de los errores al cuadrado.

10

CONTRASTE DE HIPOTESIS (TEMA 4)


o INTRODUCCIN AL CONTRASTE DE HIPTESIS. Se parte de la idea de que la informacin procedente de la muestra es suficiente para sacar conclusiones sobre la poblacin. Hiptesis estadsticas. La hiptesis cientficas deben formularse en trminos estadsticos, convirtindose as en hiptesis estadsticas. HIPTESIS ESTADSTICA: Es la hiptesis referida a algn aspecto de la distribucin de una poblacin. En el contraste de hiptesis estadsticas se formulan dos hiptesis exhaustivas y mutuamente exclusivas. HIPTESIS NULA (H0): Es la hiptesis que se acepta provisionalmente y se somete a contrastacin emprica. HIPTESIS ALTERNATIVA (H1): Es la sustitutiva de la H0. HIPTESIS BILATERAL O BIDIRECCIONAL: Se da cuando la media es algn valor no especificado y diferente del valor dado a la hiptesis nula. HIPTESIS UNIDIRECCIONALES O UNILATERALES: Pueden ser contraste unilateral izquierdo, cuando la hiptesis alternativa es menor que la hiptesis nula o bien contraste unilateral derecho, cuando la hiptesis alternativa es mayor que la hiptesis nula. Se aplicarn contrastes bilaterales cuando no tengamos informacin y/o idea sobre la direccin del efecto que se est estudiando, o cuando se considera relevante el efecto tanto en una direccin como en otra. Se aplicarn contrastes unilaterales cuando se tenga informacin y/o idea sobre la direccin del efecto o cuando consideremos relevante el efecto slo en una direccin. La idea general del contraste de hiptesis es hallar la probabilidad asociada al valor muestral del estadstico. Si dicha probabilidad es muy pequea se rechaza la H 0. y en caso contrario no se rechaza (se acepta). Distribucin muestral y nivel critico p. Los estimadores o estadsticos no proporcionan valores fijos, sino que varan de una muestra a otra. DISTRIBUCIN MUESTRAL DEL ESTADSTICO: Se llama as a la distribucin de probabilidad (o distribucin de probabilidad acumulada) de los valores del estadstico obtenidos en todas las muestras posibles del mismo tamao que pueden extraerse de la poblacin. El conocimiento de la distribucin muestral de un estadstico nos permite dar el salto de la muestra a la poblacin. Nos permite inferir determinadas caractersticas de la poblacin a

11

partir de esas mismas caractersticas en la muestra, con cierta probabilidad. Siempre que queramos hacer inferencias sobre una caracterstica de la poblacin necesitaremos conocer la distribucin muestral del estadstico correspondiente. El parmetro que se quiere contrastar es la media de una distribucin normal, as debemos conocer la distribucin muestral de la media para realizar inferencias sobre la media poblacional. Cuando la variable se distribuye normalmente en la poblacin, la distribucin muestral de la media de esa variable tambin es normal. No todas la variables psicolgicas se distribuyen normalmente, pero siempre es posible obtener una distribucin muestral de un determinado estadstico mediante el procedimiento del contraste de hiptesis. Antes de adoptar un determinado modelo de probabilidad para una variable es conveniente comprobar si la distribucin se ajusta a la distribucin terica propuesta. Como la media muestral es una variable continua que se distribuye normalmente y que toma un valor de las infinitas muestras, que puede elaborarse de tamao n, tendr una funcin de densidad de probabilidad y una de distribucin. No obstante si operamos con puntuaciones tpicas todas las posibles distribuciones normales (de la media) se convierten en una nica, que se denomina normal (0,1) o simplificando N (0,1). Para hallar la probabilidad de inters en la tabla de la distribucin normal, se transforma la media hallada de modo que pueda compararse con los valores que nos ofrece dicha tabla, es decir se convierte en una puntuacin z. Lo que se ha hecho ha sido convertir nuestra estimacin muestral en una puntuacin tpica. La probabilidad buscada p, llamada nivel crtico representa la probabilidad de obtener un valor del estadstico al menos tan extremo como el hallado, dada la hiptesis nula. En contrastes bilaterales y distribuciones simtricas, el nivel crtico p se obtiene, generalmente, multiplicando por dos la probabilidad asociada a los valores iguales o menores (si el valor muestral cae en la parte izquierda de la distribucin) o iguales o mayores (si cae en la parte derecha) que el valor muestral del estadstico de contraste.

Estadstico de contraste. Un estadstico de contraste es un instrumento estadstico creado para tomar decisiones sobre la hiptesis nula con cierta probabilidad. Un estadstico de contraste se caracteriza por tener una distribucin muestral e informacin sobre lo propuesto en la hiptesis nula. Son numerosos los estadsticos de contraste que pueden aplicarse para contrastar las hiptesis, o sea, comprobar la significacin estadstica de los datos procedentes de las investigaciones psicolgica. La eleccin del ms adecuado depender fundamentalmente de la hiptesis del investigador, de las caractersticas de la variable en la poblacin (forma de la distribucin, varianza conocida o no, nivel de medida, etc., de los datos muestrales (como se han obtenido, que tipo de datos son, etc.)). En definitiva, la eleccin de un estadstico, o ms generalmente de un contraste estadstico, debe basarse en propiedades de los datos, de la hiptesis y de la variable en la poblacin. Algunas de estas propiedades reciben el nombre de supuesto. Es importante que se verifiquen los supuestos y siempre que tengamos dudas sobre su

12

1. 2. 3.

4.

incumplimiento los comprobaremos, pues en ellos se basa la eleccin del estadstico de contraste y su distribucin muestral. Nivel de significacin y rechazo de la hiptesis nula. Nivel de significacin o probabilidad de error tipo I se simboliza por y representa la probabilidad de rechazar errneamente la hiptesis nula, que el investigador est dispuesto a asumir y que fija en la planificacin de su investigacin. El nivel de significacin suele ser muy pequeo porque cuanto mayor es mayor es la probabilidad de rechazar errneamente la hiptesis nula. En un contraste bilateral, si el nivel crtico p es diferente o distinto que , rechazamos la hiptesis nula. En caso contrario no la rechazamos. En un contraste unilateral izquierdo, si el nivel crtico p es menor que , rechazamos la hiptesis nula. En caso contrario no la rechazamos. En un contraste unilateral derecho, si el nivel crtico p es mayor que , rechazamos la hiptesis nula. En caso contrario no la rechazamos. El criterio divide la distribucin de probabilidad en dos zonas que llamaremos zona de rechazo de la hiptesis nula (regin crtica) y zona de aceptacin de la hiptesis nula. La zona de rechazo est formada por todos los valores cuya probabilidad es muy pequea dada la hiptesis nula. As si el valor muestral del estadstico de contraste cae en la zona de rechazo, rechazamos la hiptesis nula y si cae en la zona de aceptacin, no la rechazamos. La determinacin de la zona de rechazo de la distribucin de probabilidad depende de que el contraste sea unilateral o bilateral. En un contraste bilateral, la zona de rechazo se reparte en los dos extremos de la distribucin, delimitados ambos por /2. Cuando el contraste es unilateral la zona de rechazo queda representada en un solo extremo de la distribucin, izquierdo o derecho, delimitado por . Se puede tomar decisiones sobre la hiptesis nula mediante el nivel crtico p o el valor crtico. No obstante, el nivel crtico p es ms informativo porque indica la probabilidad de obtener un valor al menos tan extremo como el valor del estadstico hallado. El tipo de contraste (unilateral o bilateral) influye en la significacin de la decisin. En un contraste bilateral, la zona de rechazo de la hiptesis nula, considerando uno de los extremos, es ms pequea que en el contraste unilateral, lo que implica que es ms difcil rechazar la hiptesis nula. El contraste bilateral es ms conservador que el contraste unilateral. , el nivel de significacin, se fija de antemano mientras que p, el nivel crtico, no, sino que es consecuencia del resultado muestral. Segn el planteamiento terico presentado aqu, la distribucin muestral de un estadstico de contraste es la que corresponde al caso de que la hiptesis nula sea cierta. En los tres contrastes (bilateral, unilateral izquierdo y unilateral derecho), la hiptesis nula incluye, respectivamente los signos, igual, mayor o igual y menor o igual. La hiptesis alternativas correspondientes a la hiptesis nulas anteriores incluyen los signos distinto, menor y mayor, respectivamente. No obstante, siempre contrastaremos un valor del estadstico bajo H0. Este valor es el que corresponde al signo igual de H0. Cuando el nivel crtico, p, asociado al valor muestral del estadstico de contraste es igual o menor que , rechazamos la H0 pues es muy probable que no sea cierta ya que el valor obtenido tiene una probabilidad muy pequea bajo H0. No obstante, ello no significa que se descarte totalmente que H0 sea cierta. Puede suceder que el valor observado en la muestra, a pesar de que su probabilidad conforma a H0 es muy baja, realmente pertenezca a la distribucin muestral bajo la hiptesis nula. Por ello es importante establecer un adecuado, basndose en suficiente informacin, teora y/o investigaciones realizadas en el rea.

13

5. Cuando un investigador obtiene un resultado opuesto al que haba supuesto en un contraste unilateral, en un principio, puede deberse a dos cosas: o bien el investigador predijo un efecto unilateral derecho (izquierdo) sin la informacin suficiente sobre la direccin del efecto en la poblacin, o bien la muestra elegida no es representativa de la poblacin y el valor muestral obtenido se debe a errores del muestreo. En esos casos, habra que repetir el experimento. 6. Es esencial el sentido comn para los casos lmite. En un contraste de hiptesis seguiremos los siguientes pasos: 1. Describiremos las caractersticas de la variable en la poblacin y de los datos muestrales. 2. En funcin de la hiptesis cientfica y las caractersticas anteriores, formularemos las hiptesis estadsticas. 3. Elegiremos el estadstico de contraste, en funcin de las hiptesis estadsticas y caractersticas anteriores. Estas caractersticas se convierten en los supuestos que guan la eleccin del estadstico de contraste y del contraste en general. 4. Fijaremos . Para el dado, la zona de rechazo de H0 estar formada por todos los valores del estadstico cuya probabilidad de obtenerlos es muy pequea bajo el supuesto de que la hiptesis nula sea cierta. 5. Calcularemos el estadstico de contraste con los datos obtenidos en la muestra. 6. Tomaremos la decisin sobre H0. Si el valor del estadstico cae dentro de la zona de rechazo, rechazaremos H0 en caso contrario no la rechazaremos. Dicho de otra manera, si p es igual o menor que rechazaremos H0, en caso contrario no la rechazaremos. 7. Interpretaremos los resultados en el contexto de la investigacin. o CONTRASTE DE HIPTESIS E INTERVALOS DE CONFIANZA. En la estimacin por intervalos podemos tomar decisiones sobre el rechazo o no de H0. Esto es, si el valor del parmetro propuesto en H0 cae fuera del intervalo confidencial, rechazaremos H0 y si cae dentro no la rechazaremos. No es necesario formular las hiptesis estadsticas para construir un intervalo confidencial pero si las formulamos, podremos tomar decisiones sobre H0. o POTENCIA ESTADSTICA. Otro error que se puede cometer en la decisin estadstica, es el llamado error tipo II. Su probabilidad es . Se va estudiar este con la magnitud del efecto y el tamao muestral. Probabilidad del error tipo II y potencia. Error tipo II (su probabilidad se denomina ) es aquel que se comete al aceptar errneamente la hiptesis nula. La potencia es funcin de , concretamente es igual a 1-, y es la probabilidad de rechazar la H0 siendo <<falsa>>. En otras palabras, la potencia de un contraste estadstico es la probabilidad de obtener un resultado estadsticamente significativo. Determinantes de la potencia: Nivel de significacin, magnitud del efecto y tamao de la muestra. La potencia (tambin la probabilidad del error tipo II) de un contraste estadstico depende de tres parmetros: 1. El nivel de significacin. 2. El tamao muestral. 3. La magnitud del efecto.

14

El nivel de significacin es que a menor , manteniendo constante los dems factores (tamao muestral y magnitud del efecto), ms difcil resultar rechazar la hiptesis nula, y como consecuencia ms baja ser la potencia y mayor ser , y viceversa. La relacin de con n es tal que cuando menor sea , manteniendo constantes los dems factores incluida la potencia, mayor deber ser n para obtener un resultado significativo. Al influir la magnitud de en la potencia, influye la direccin del contraste. Para un mismo y manteniendo constantes los dems factores, la potencia ser menor para un contraste bilateral que para un contraste unilateral. El tamao muestral simplemente se refiere al nmero de sujetos (o unidades experimentales) del estudio. La relacin con la potencia es tal que, manteniendo constantes los dems factores (magnitud del efecto y nivel de significacin), a medida que n aumenta crece la potencia (decrece ) y viceversa. La magnitud del efecto () puede contemplarse como un ndice del grado de <<falsedad>> de H0, o sea, de la magnitud del efecto que se espera encontrar en la poblacin. Manteniendo constantes los dems factores (nivel de significacin y tamao de la muestra), cuanto mayor es la magnitud del efecto, mayor es la potencia (menor es ) y viceversa. En la relacin con n, cuanto menor es la magnitud del efecto mayor debe ser n para alcanzar la significacin estadstica (y viceversa), manteniendo constantes la potencia y . Cada uno de los parmetros , , , y n interactan con cada uno de los otros. El conocimiento de tres cualquiera determina el valor del cuarto. La relacin de , y n con es inversa. 1- N XXXXXX INVERSA DIRECTA INVERSA INVERSA INVERSA XXXXXX INVERSA INVERSA INVERSA 1- DIRECTA INVERSA XXXXXX DIRECTA DIRECTA INVERSA INVERSA DIRECTA XXXXXX INVERSA n INVERSA INVERSA DIRECTA INVERSA XXXXXX

Los parmetros , (o 1-), n y estn matemticamente relacionados. De hecho cualquiera de ellos es funcin exacta de los otros tres, por lo que podemos determinar uno cualquiera en funcin de los restantes. No obstante en la mayora de la investigaciones lo que generalmente interesa es determinar n habiendo fijado , y (o 1-), o determinar (o 1-) con , y n fijos. Clculo de la potencia. El estudio de la potencia debe hacerse antes de la recogida de los datos para determinar la potencia del contraste para unos valores , n y predeterminados. Para realizar un anlisis de la potencia debemos establecer valores especficos en la hiptesis estadsticas. La potencia es un valor entre 0 y 1. Cohen establece como deseable una potencia no inferior a 0,80. Obtencin del tamao de la muestra. Un n demasiado pequeo puede dar lugar a una potencia demasiado baja. Un n grande o muy grande, aunque aumenta la potencia estadstica, tambin incrementa los costes humanos y econmicos, adems de retrasar la investigacin. Otra consecuencia de utilizar tamaos muestrales muy grandes es que puede dar lugar a resultados estadsticamente significativos cuya significacin prctica sea cuestionable. A mayor n, manteniendo constantes y , mayor es la potencia y viceversa.

15

Para obtener una misma potencia, manteniendo constantes los dems factores, debemos utilizar una muestra mayor si el contraste es bilateral. Estos resultados se deben a que en el contraste bilateral interviene medio alfa y en el unilateral el alfa entero. A > < y por lo tanto, mayor potencia y a > < n para obtener una misma potencia. 1. Es razonable pensar que los investigadores deseamos que los contrastes estadsticos que aplicamos en nuestros trabajos de investigacin tengan una probabilidad alta de rechazar la hiptesis nula siendo <<falsa>>. Es decir, esperamos que la potencia estadstica sea alta. No obstante, hay una cierta resistencia al estudio de la potencia en los trabajos de investigacin. O no se tiene en cuenta o se utilizan muestras grandes para asegurarse una potencia alta, lo que supone, en este ltimo caso, un mayor coste econmico y humano, retrasos en la investigacin y, algunas veces, indica un cierta insensibilidad a la significacin prctica de los resultados que puede tener una gran importancia en ciertos tipos de investigacin. No obstante, tan grave es la situacin en la que la potencia es baja sin que lo sepa el investigador. 2. Para un mismo y manteniendo constantes los dems factores, la potencia ser menor para un contraste bilateral que para un contraste unilateral. Ello es as cuando en un contraste unilateral el resultado muestral est en la diferencia predicha. Por ello, no debe aplicarse contrastes unidireccionales slo con el fin de obtener una mayor potencia, pues corremos el riesgo de encontrar un resultado opuesto al que habamos anticipado. 3. La eleccin de 0, 1, , , y n no es arbitraria, sino que debe basarse siempre en suficiente informacin, teora y/o investigaciones realizadas en el rea. 4. Vimos dos tipos de errores y sus probabilidades y . indica la probabilidad de rechazar errneamente la hiptesis nula, por lo tanto 1- ser la probabilidad de no rechazar correctamente la hiptesis nula. , es la probabilidad de aceptar errneamente la hiptesis nula y 1- , la probabilidad de rechazar correctamente la hiptesis nula.

SUPUESTOS (TEMA 5)
La eleccin de un contraste (y de un estadstico de contraste) u otro, depende de la hiptesis que se quiere contrastar, de las caractersticas de la variable en la poblacin y de los datos muestrales. Es importante que elijamos el contraste (y estadstico) ms apropiado a cada caso. Si es correcta la eleccin, la interpretacin de los resultados de la investigacin ser mucho ms acertada, de lo contrario, el valor numrico obtenido como resultado de la aplicacin del estadstico de contraste puede carecer de sentido prctico. Algunas de las caractersticas, como las mencionadas, reciben el nombre de supuesto. As se habla del supuesto de independencia, supuesto de normalidad, supuesto de homogeneidad de varianzas, supuesto de medida, etc. o INTRODUCCIN. La eleccin de un contraste estadstico (y del estadstico de contraste) debe basarse, adems de la hiptesis que se quiera contrastar, en propiedades o caractersticas de la variable en la poblacin y de los datos muestrales. Estas caractersticas son lo que comnmente conocemos como supuestos.

16

o INDEPENDENCIA DE LAS OBSERVACIONES. El supuesto de independencia de las observaciones o ms generalmente de las variables aleatorias es importante porque tal independencia va a ser exigida, por lo general, por los estadsticos de contraste. MUESTRA ALEATORIA SIMPLE: Es el conjunto de muestras aleatorias. Este tiene dos condiciones: 1. Deben tener la misma funcin de probabilidad o funcin de densidad de probabilidad, indican que las probabilidades marginales de las variables aleatorias deben coincidir con las probabilidades de la variable. 2. Que las probabilidades conjuntas deben ser iguales al producto de sus correspondientes probabilidades marginales. Esto es, independientes. o NIVEL DE MEDIDA. Nivel de medida nominal. Es cuando a cada categora se le asigna un nmero o medida. No obstante el nmero asignado es irrelevante, en sentido numrico. Estos nmeros son nicamente indicadores de cada categora. Una forma de resumir los datos cuando la variable es nominal, es calculando las frecuencias de observaciones de cada categora de la variable. La reduccin de los datos a frecuencias por categoras, nos aporta, a nivel descriptivo, informacin sobre la extensin de las diferentes categoras. Nivel de medida ordinal. Es cuando a cada categora se le asigna un nmero, contrariamente al ejemplo anterior, significan que 1<2<3<4<5. Lo que importa y tiene sentido es el orden de los nmeros. El mximo nivel de medida que se puede alcanzar con variables cuasi cuantitativas es el ordinal. La diferencia entre una variable cualitativa y una cuasi cuantitativa estriba en que, con esta ltima podemos establecer un orden de mayor a menor (o menor a mayor) con los nmeros asignados a cada categora, mientras que con las primeras no tiene sentido ordenar los nmeros. Con variables medidas a nivel ordinal, tiene sentido obtener frecuencias de datos, pero si lo deseamos con estas ltimas tambin podramos calcular percentiles. Tambin podramos saber mediante al clculo de los percentiles el nmero de sujetos que est por debajo de una determinada categora. Nivel de medida de intervalo vs de razn. Cuando la variable es cuasi cuantitativa podemos utilizar cualquier nmero para las categoras siempre que se preserve el orden, no importando la distancia o diferencia entre dos nmeros cualesquiera porque esta diferencia no es relevante en este tipo de medida. Pues bien cuando la variable est medida a nivel de intervalo las diferencias son significativas. Existe una diferencia cuantitativa entre dos sujetos, no slo valoran de forma distinta el parmetro a estudiar, sino que uno valora una cantidad y el otro otra. Variables como el tiempo de reaccin, los aos de una persona y la longitud de una lnea, entre otras, son variables medidas a nivel de razn porque para todas ellas, el valor 0 significa carencia total de los que se est midiendo. Con ambos tipos de variables, es decir, de intervalo y de razn, tiene sentido las operaciones de suma, resta, multiplicacin y divisin. A los resultados as obtenidos se les denominan datos de intervalo y de razn. VARIABLES CUALITATIVAS: Son aquellas que slo pueden ser consideradas a nivel

17

nominal. VARIABLES CUASI CUANTITATIVAS: Como mucho pueden ser consideradas a nivel ordinal. VARIABLES CUANTITATIVAS: Pueden ser consideradas a nivel de razn o intervalo segn el cero de la escala signifique carencia total o no de lo que se est midiendo. Pueden ser discretas o continuas: VARIABLES CUANTITATIVAS DISCRETAS: Es aquella que no admite valores intermedios entre dos valores dados. VARIABLES CUANTITATIVAS CONTINUAS: Admite infinitos valores intermedios. Tanto las variables cualitativas como las cuasi cuantitativas no admiten operaciones de resta, suma, divisin y multiplicacin entre los valores asignados a sus categoras, aunque las ltimas admiten la ordenacin de dichos valores. Por su parte, las variables cuantitativas, continuas o discretas, admiten todas las operaciones mencionadas entre los distintos valores que pueden tomar esta variables. Todos los contrastes estadsticos hacen supuestos sobre el nivel de medida de la variable estudiada. Los contrastes sobre media, varianza, coeficiente de correlacin de Pearson (y otros estadsticos que se derivan de ellos), muy utilizados para inferir las caractersticas de la poblacin a partir de una muestra, requieren que los datos sean, al menos, de intervalo, porque los estadsticos que se contrastan requieren que la diferencia entre los distintos pares de valores tenga sentido, propiedad que cumplen tanto los datos de intervalo como los de razn. Es posible pasar de una escala superior a otra inferior. o ASPECTOS DE LA DISTRIBUCIN. La aplicacin de ciertos contrastes estadsticos (y estadsticos de contraste) requiere hacer supuestos sobre determinados aspectos de la distribucin. La distribucin muestral del estadstico Z es normal y, por lo tanto, la aplicacin de este estadstico requiere que la poblacin de la que procede la muestra en la que se ha estimado la media sea normal (al menos que n sea = o > 30). La aplicacin de ciertos contrastes estadsticos (y estadsticos de contraste) requiere que los parmetros de la distribucin tengan determinadas propiedades. Cuando desconocemos la varianza poblacional por lo que debemos estimarla, la distribucin muestral del estadstico resultante ya no es la normal sino otra que llamamos distribucin T de Student. Al ser distinta la distribucin muestral tambin, por lo general, lo son las probabilidades asociadas a los valores que puede tomar el estadstico. o CONTRASTES PARAMETRICO Y NO PARAMETRICOS. CONTRASTE PARAMTRICO: 1. La hiptesis recaen sobre los parmetros de la distribucin de la variable. 2. El nivel de medida es, al menos, de intervalo. 3. Se establecen supuestos restrictivos sobre la forma de la distribucin y/o sobre sus parmetros. CONTRASTE NO PARAMETRICO: 1. El nivel de medida es inferior al nivel de intervalo <<nos bastar con conocer el orden de las observaciones (sin hacer intervenir explcitamente sus valores numricos) y a veces, slo necesitaremos conocer cuantas de ellas se encuentran en cada
18

una de ciertas categoras no ordenadas (sin hacer intervenir explcitamente ni las puntuaciones asignadas a las observaciones ni el orden de las mismas). 2. Los supuestos sobre la distribucin son menos restrictivos que los especificados en los contrastes paramtricos. Lehman: Un contraste es paramtrico si la determinacin de la distribucin muestral del estadstico de contraste requiere que la variable en la poblacin se distribuya normalmente. Y no paramtrico en el caso contrario. Se suele utilizar indistintamente los trminos no paramtrico y distribucin libre. En general, si la distribucin de la variable en la poblacin es continua el contraste es exacto. o CONCLUSIONES. Los contrastes estadsticos (y estadstico de contraste) establecen determinados supuestos. Si se verifican estos supuestos, la interpretacin de nuestros resultados, en sentido psicolgico, ser mucho ms razonable. Respecto al nivel de medida, se ha visto que los estadsticos requieren, para su clculo, que los datos se hayan obtenido en una determinada escala de medida lo que influye en la eleccin del estadstico de contraste al ser esta una funcin de aquellos. En cuanto a los supuestos sobre la distribucin, vimos que unos contrastes postulan supuestos muy restrictivos, generalmente normalidad y homocedasticidad, mientras que otros establecen slo supuestos distribucionales generales como, por ejemplo, simetra o continuidad. Muchas veces, basta con que se verifique un nico supuesto para que tengamos que aplicar un estadstico en vez de otro. Casi nunca conocemos las caractersticas de la poblacin. As, no es posible saber, por lo general, si la poblacin de la que procede la muestra es normal o conocer el valor concreto de la varianza poblacional, ni siquiera podemos saber con certeza si la distribucin es continua. Esto es as porque, lo habitual, es que no podemos acceder a toda la poblacin. En algunos casos, asumiremos estos supuestos y en otros los comprobaremos aplicando contrastes apropiados. En cualquier caso, siempre que se asuma algn supuesto ello debe hacerse basndose en una teora y/o en los datos procedentes de trabajos anteriores, y no por comodidad. Siempre que se den las condiciones apropiadas aplicaremos el contraste cuyos supuestos son los ms restrictivos pues, como ya hemos comentado en este tema, as se aprovecha ms la informacin.

19

CONTRASTES DE HIPTESIS PARA UNA MUESTRA


CONTRASTES PARAMETRICOS PARA UNA MUESTRA I (TEMA 6)
o INTRODUCCIN. PRUEBA DE SIGNIFICACION: Va dirigida a valorar la credibilidad de una hiptesis concreta a travs del grado de significacin P, de dicha hiptesis. PRUEBA DE LA HIPTESIS: Parte de la teora de la probabilidad para tomar una decisin entre dos hiptesis complementarias: la hiptesis nula (H0) y la hiptesis alternativa (H1). INTERVALOS DE CONFIANZA: Aunque formalmente son un mtodo de estimacin de parmetros, pueden ser aprovechados para contraste de hiptesis dado que construimos un intervalo que constituye la regin de aceptacin, con cierta probabilidad. ESQUEMA GENERAL, PROPUESTO PARA TODOS LOS CONTRASTES: 1. Se formulan las hiptesis estadsticas en base a la hiptesis cientfica. El establecimiento de una hiptesis nula (H0) frente a una hiptesis alternativa (H1), referidas ambas a algn parmetro de la poblacin. 2. Se establecen las propiedades y supuestos que cumplen los datos, la muestra y la poblacin: nivel de medida de la variable, tipo de muestreo, tamao de la muestra, si las muestras son independientes o estn relacionadas, si se conocen los parmetros poblacionales, etc. 3. En funcin de la informacin anterior elegiremos el estadstico de contraste (especificando su funcin de probabilidad o de densidad de probabilidad). Dicho estadstico, calculado a partir de los resultados de la muestra, nos ayudar en el proceso de decisin. 4. Se establece la regin crtica de la distribucin muestral del estadstico de contraste bajo el supuesto de que la hiptesis nula sea cierta, para un nivel de confianza dado. 5. Se calcula el estadstico de contraste con los datos obtenidos en nuestra muestra. 6. Se toma la decisin sobre H0 en funcin del siguiente criterio: si el valor del

20

estadstico cae dentro de la regin de rechazo no es posible aceptar la H0, de lo contrario se acepta. 7. Se interpretan los resultados. o CONTRASTE DE HIPTESIS PARA LA MEDIA. Conocida la varianza de la poblacin. 1. Se formulan las hiptesis estadsticas. Un caso particular de hiptesis nula, es cuando se hace el supuesto de que la media de la poblacin es cero. En los otros tipos de hiptesis estadsticas, lo que se est probando es si la media poblacional es menor, o mayor, que un valor determinado. Se trata de hiptesis estadsticas unilaterales. Lo que se intenta contrastar o probar, es si nuestros datos concretos han podido ser obtenidos de una poblacin con esa media. La alternativa, si eso no es cierto, es que procedan de una poblacin con una media distinta, mayor o menor. 2. La muestra est formada por n observaciones independientes, obtenidas por muestreo aleatorio. La variable aleatoria cuyo parmetro pretendemos contrastar, sigue una funcin de densidad de probabilidad normal (aunque tambin es aplicable este contraste a cualquier tipo de distribucin, con varianza conocida, cuando n es igual o mayor de 30, por el teorema central del lmite). 3. Estadstico de contraste. Tiene una distribucin muestral normal. 4. Regin crtica: rechazo de la H0. 5. Se calcula el estadstico de contraste con los datos obtenidos en la muestra: z. 6. Se toma la decisin sobre la H0: si nuestro valor obtenido (z) cae dentro de la regin de rechazo no es posible aceptar la H0, es decir, si nuestro valor concreto, es mayor/igual o menor/igual que el valor sealado en las tablas para el contraste bilateral, no podemos aceptar la hiptesis nula. Otro tanto podemos decir si es menor/igual en un contraste unilateral izquierdo; o si es mayor/igual en un contraste unilateral derecho. De lo contrario la aceptaremos. 7. Se interpretan los resultados. Desconocida la varianza de la poblacin. El razonamiento y los pasos a realizar son los mismos que se han visto en el apartado anterior pero, dado que no conocemos la varianza de la poblacin, se debe estimar mediante su estimador muestral insesgado. El estadstico sigue una distribucin T de Student con n-1 grados de libertad.

o CONTRASTE DE HIPTESIS PARA LA VARIANZA. El esquema a seguir es el mismo que para el parmetro media. Lo que se intenta averiguar es si es posible que, de una poblacin con una varianza como la que se establezca en la hiptesis nula, es posible, a un nivel de confianza dado (o con una probabilidad de acierto dada), que hayamos obtenido una muestra con la variabilidad que tiene la nuestra. 1. Se formulan las hiptesis estadsticas. Como se ve, la H0 que tratamos de contrastar, en este caso, es la de que la varianza poblacional toma un valor determinado, mientras que la H1 es que la varianza poblacional es distinta de ese valor. Estas hiptesis se establecen en base a la hiptesis cientfica que tratamos de probar.

21

2. 3. 4. 5. 6. 7.

Lo que se intenta contrastar o probar, es si nuestros datos concretos han podido ser obtenidos de una poblacin con esa varianza, al igual que antes hacamos con la media. La alternativa, si eso no es cierto, es que procedan de una poblacin con una varianza distinta. La muestra est formada por n observaciones independientes, obtenidas por muestreo aleatorio simple. La variable aleatoria cuyo parmetro pretendemos contrastar, sigue una funcin de densidad de probabilidad normal. Estadstico de contraste. Se distribuye segn una Chi cuadrado con n-1 grados de libertad. Regin crtica: rechazo de la H0 (supuestamente bilateral). Se calcula el estadstico de contraste con los datos obtenidos en la muestra. Se toma la decisin sobre la H0: si nuestro valor obtenido cae dentro de la regin de rechazo o de rechazo no es posible aceptar la H0. De lo contrario la aceptaremos. Se interpretan los resultados.

o CONTRASTE DE HIPTESIS PARA LA PROPORCION. Se trata de contrastar hiptesis acerca de un parmetro mediante el estadstico P, que es la proporcin de la muestra. El estadstico P se calcula con datos dicotmicos que slo admiten dos resultados, generalmente relativos a la aparicin o no de una determinada caracterstica. Si la frecuencia la dividimos por n (nmero total de sujetos de la muestra), tenemos la proporcin (P) de sujetos que, en la muestra, presenta la caracterstica medida. Lo mismo se puede decir a nivel de poblacin. El estadstico P es un estimador insesgado de tomado en una muestra de n observaciones. La distribucin muestral del estadstico P es, por el teorema central del lmite, asintticamente normal. Se considera la aproximacin normal, en los casos en que no se cumpla esto, habr que acudir a la distribucin binomial. 1. Se formulan las hiptesis estadsticas. 2. La muestra aleatoria de n observaciones. Poblacin dicotmica. 3. Estadstico de contraste. 4. Regin de confianza. 5. Se calcula el estadstico de contraste con los datos obtenidos en la muestra: z. 6. Se toma la decisin sobre la H0. 7. Se interpretan los resultados. o CONTRASTE DE HIPTESIS E INTERVALOS DE CONFIANZA. Aunque los intervalos de confianza se desarrollaron como un mtodo de estimacin de parmetros, pueden ser utilizados como mtodo de contraste de hiptesis, dado que nos permite construir un intervalo que constituye la regin de aceptacin de hiptesis, con un nivel de confianza.

CONTRASTES NO PARAMETRICOS PARA UNA MUESTRA II (TEMA 7)

22

o INTRODUCCIN. Tiene que darse tres condiciones: 1. Un nivel de medida de la variable inferior al nivel de intervalo. 2. Aspectos menos restrictivos referidos a la forma y/o los parmetros de la distribucin. 3. No se intentan probar supuestos sobre parmetros poblacionales. En los contrastes de hiptesis para la mediana aunque se intentan probar supuestos sobre parmetros poblacionales, el nivel de medida de la variable es inferior al nivel de intervalo. En las pruebas de bondad de ajuste, no se intenta contrastar ningn parmetro poblacional sino la forma de la distribucin. o CONTRASTES DE HIPTESIS PARA MEDIDAS DE POSICIN. En la metodologa no paramtrica, la mediana es, a menudo, la medida de tendencia central que representa mejores propiedades y es, normalmente, el parmetro que se utiliza para hacer inferencia acerca de la posicin de los datos en la poblacin. Prueba de los signos. Se basa en el recuento de signos ms (+) y signos menos (-). Lo que se quiere con esta prueba es probar si nuestros datos son compatibles con un valor que proponemos para la mediana en la hiptesis nula (0). 1. Se formulan las hiptesis estadsticas. 2. La muestra aleatoria de n observaciones. Cualquier tipo de distribucin de la variable. 3. Estadstico de contraste. Se calculan los signos de las n observaciones que no son ms que el signo de las diferencias entre cada valor y la mediana propuesta bajo la hiptesis nula. Si el valor propuesto para la mediana en la hiptesis nula es el verdadero, en la poblacin existirn tantos valores por encima de l como por debajo y, al tomar una muestra aleatoria de esa poblacin suceder lo mismo, existiendo, por tanto, aproximadamente el mismo nmero de signos positivos que negativos cuando calculemos las diferencias entre cada valor y la mediana propuesta bajo la hiptesis nula. Si por el contrario, el valor propuesto para la mediana en la hiptesis nula no es el adecuado, habr ms signos de un tipo que de otro. Pueden presentarse ceros, es decir, ausencia de diferencias. Cuando esto sucede, y son pocos, se eliminan reduciendo el tamao de la muestra en tantas unidades como ceros aparezcan. Si son muchos la prueba no es adecuada. Este estadstico se distribuye segn el modelo binomial con parmetros n = S + + S- y =0,50. Se puede realizar la aproximacin a la normal a partir de n igual o mayor de 20. Si el tamao de la muestra no es muy grande, habr que realizar una correccin (correccin por continuidad), consistente en sumar o restar 0,5 puntos a S + para que el contraste sea ms conservador. Se suma 0,5 cuando S+ es menor que n/2 y se resta cuando es mayor de n/2. 4. Regin de confianza. 5. Se calcula el estadstico de contraste con los datos obtenidos en la muestra: S+ o S- o Z 6. Se toma la decisin sobre la H0. Si el estadstico elegido cae dentro de la regin crtica, rechazaremos la hiptesis nula, si cae en la regin de confianza la aceptaremos. 7. Se interpretan los resultados. Prueba de Wilcoxon. Tambin se la conoce como prueba de rangos (rdenes) y signos. La prueba de Wilcoxon gana en precisin ya que aprovecha mejor la informacin

23

disponible. Tiene en cuenta, a la vez que el signo de las diferencias, si las hay ms grandes o ms pequeas, ordenndolas. De ah que se la conozca como prueba de rangos y signos. La distribucin de la variable en la poblacin ha de ser simtrica y el nivel de medida de los datos ha de ser al menos de intervalo. 1. Se formulan las hiptesis estadsticas. 2. La muestra aleatoria de n observaciones. La distribucin de la variable en la poblacin ha de ser simtrica y continua. Nivel de medida de los datos, al menos de intervalo. 3. Estadstico de contraste. a) Como en el test de signos, se calculan las diferencias entre cada valor y la mediana propuesta bajo la hiptesis nula. Y se quitan las diferencias que sean iguales a cero. b) Estas diferencia tomadas en valor absoluto, se ordenan de menor a mayor y se les atribuye un nmero que indica su orden. En el caso en que se presenten empates, se atribuye a cada diferencia el promedio de los rangos que habran correspondido caso de no estar empatadas. c) A continuacin sumamos los rangos u rdenes de las diferencias que inicialmente tenan signo + y, a esta suma la llamaremos T+. d) Haremos lo mismo con los rangos de las diferencias que tenan signo - y, a esta suma la llamaremos T-. Si la hiptesis nula es cierta, ambas sumas debern ser aproximadamente iguales, dado que habr aproximadamente el mismo nmero de puntuaciones por encima que por debajo de la mediana. Si una de las sumas es mucho mayor que la otra, se estarn confirmando las hiptesis alternativas. Si el tamao de la muestra es grande (n igual o mayor que 20) la distribucin de T se va aproximando a la normal y podemos aprovechar esta distribucin para hacer los contrastes. 4. Regin de confianza. 5. Se calcula el estadstico de contraste: T o Z. 6. Se toma la decisin sobre la H0. 7. Se interpretan los resultados. En la prueba de los Signos se usa nicamente la informacin proporcionada por la direccin o signo de la diferencia entre cada observacin y la mediana, mientras que la prueba de Wilcoxon, adems, el valor absoluto de esa diferencia, por lo que aumenta en precisin.

o PRUEBAS DE BONDAD DE AJUSTE. Los contrastes de hiptesis sobre bondad de ajuste, o las pruebas de bondad de ajuste, nos permiten comprobar si la forma de la distribucin de la probabilidad de una variable, se ajusta a una determinada distribucin de probabilidad terica. Partiendo de los datos de nuestra muestra, podemos probar, mediante una prueba de bondad de ajuste, si la forma de distribucin supuesta en la poblacin es compatible con los resultados muestrales. Puede suceder, al establecer la hiptesis nula sobre la distribucin poblacional a la que queramos ver si se ajustan nuestros datos muestrales que: conozcamos los parmetros de la poblacin o, que no los conozcamos. Prueba Chi cuadrado de Pearson.. Es una de las pruebas de bondad ms utilizadas y aplicable tambin para dos muestras, para contrastar otro tipo de hiptesis. Conocida la forma de la distribucin poblacional y sus parmetros. 1. Se formulan las hiptesis estadsticas. Donde F(y) es la funcin de distribucin de la variable que estamos estudiando y F 0(y) es una funcin de distribucin completamente especificada (con sus parmetros), que suponemos, o queremos probar, es funcin de distribucin de nuestra variable

24

aleatoria. 2. Supuestos Una muestra aleatoria. El nivel de medida de los datos es, al menos, nominal. Parmetros poblacionales conocidos. 3. Estadstico de contraste. Los datos a analizar los expresamos en frecuencias, agrupndolos en categoras o en intervalos, segn el nivel de medida de los mismos La determinacin de las frecuencias tericas se realizar en funcin de la hiptesis nula que queramos probar. Si los datos muestrales se ajustan a la distribucin terica propuesta en la hiptesis nula, habr semejanza entre las frecuencias empricas u observadas y las frecuencias esperadas o tericas. Si esto es as, para cada categora la diferencia entre ambas frecuencias ser cero, salvo por azar. La decisin de este estadstico se basa, precisamente, en la magnitud de esas diferencias. Un valor pequeo apoyar la hiptesis nula, mientras que un valor elevado reflejar una incompatibilidad entre las frecuencias observadas y las esperadas de ser cierta la hiptesis nula. La distribucin de este estadstico, a medida que (n) el tamao de la muestra aumenta, se aproxima a la distribucin Chi cuadrado con k-1 grados de libertad, siendo k el nmero de categoras o intervalos (mutuamente exclusivas y exhaustivas) en que agrupamos los datos. 4. Regin crtica 5. Se calcula el estadstico de contraste con los datos obtenidos en la muestra. 6. Se toma la decisin sobre la H0. 7. Se interpretan los resultados.

Desconocidos los parmetros de la poblacin. Suele ser el caso ms comn en la investigacin. El procedimiento y el estadstico de contraste es el mismo que hemos visto en el apartado anterior, ahora bien, dado que no conocemos los parmetros poblacionales, han de ser estimados a partir de los datos de la muestra. Esto hace que sea preciso restar un grado de libertad por cada parmetro estimado (normalmente 2, la media y la varianza). Si quitamos grados de libertad la regin crtica se ampla (la puntuacin con la que tenemos que comparar nuestro resultado es ms pequea) esto se hace para evitar que la prueba sea excesivamente conservadora, ya que, al estimar los parmetros con nuestros datos aumenta la probabilidad de que los datos se ajusten a la distribucin propuesta en la hiptesis nula. Prueba de Kolmogorov - Smirnov (Conocidos los parmetros poblacionales). La prueba de Kolmogorov -Smirnov trata las observaciones individualmente, con lo que no se pierde informacin al agrupar los datos. En las muestras muy pequeas, la prueba Chi cuadrado no podra aplicarse, mientras que esta s. 1. Se formulan las hiptesis estadsticas. Donde F(y) es la funcin de distribucin de la variable que estamos estudiando y F 0(y) es una funcin de distribucin completamente especificada (con sus parmetros), que suponemos, o queremos probar, es funcin de distribucin de nuestra variable aleatoria.

25

2. Supuestos Muestra aleatoria de n observaciones El nivel de medida de los datos es, al menos, nominal. Parmetros poblacionales conocidos. 3. Estadstico de contraste. Se trata de restar, en valores absolutos, las frecuencias acumuladas que ocurriran bajo la distribucin terica especificada en la hiptesis nula y la distribucin de frecuencias acumuladas de las puntuaciones observadas y tomar el mayor de esos valores. 4. Regin crtica La regin crtica de este estadstico la formaremos consultando la Tabla A.15 del formulario. 5. Se calcula el estadstico de contraste con los datos obtenidos en la muestra: D. 6. Se toma la decisin sobre la H0. En funcin de nuestro resultado y, comparndolo con el valor crtico de las tablas, aceptaremos o no la hiptesis nula. 7. Se interpretan los resultados. Prueba de Lilliefors (Desconocidos los parmetros poblacionales). El procedimiento es el mismo que hemos descrito para la prueba de Kolmogorov - Smirnov, salvo que, al desconocer los parmetros poblacionales, hemos de estimarlos a partir de los estadsticos muestrales. Los valores crticos se encuentran en la Tabla A.16.

CONTRASTES DE HIPTESIS PARA DOS MUESTRAS


CONTRASTES PARA DOS MUESTRAS INDEPENDIENTES I (TEMA 8)
Dos muestras de observaciones son independientes cuando las observaciones o medidas son independientes dentro y entre las muestras. Se extraen aleatoria e independientemente n sujetos y las asignamos tambin aleatoriamente a las condiciones experimentales, obteniendo as dos muestras aleatorias. La asignacin aleatoria a ambas condiciones se hace para evitar en lo posible, diferencias sistemticas entre las dos muestras antes de aplicar la variable independiente. Al ser todas la variables extraas controladas mediante la aleatorizacin, si se observa una diferencia entre la variable dependiente de cada condicin, podremos pensar que esta diferencia se debe al efecto de la variacin de la variable independiente. Segn este diseo, obtenemos dos muestras de observaciones que, en principio, podemos suponer independientes. Segn la hiptesis de investigacin, contrastaremos un aspecto u otro de la distribucin de la variable dependiente. En ciertos casos, la medida de la tendencia central de la distribucin ser la que mejor represente a la hiptesis cientfica. En otros casos, puede que interese estudiar la variabilidad de la distribucin. o CONTRASTE DE MEDIAS. Nos limitaremos al caso de que la hiptesis nula se establece en torno a cero, que es la ms

26

usual. ESTADSTICO T (Varianzas poblacionales desconocidas). Se distribuye con una T de Student con n1 + n2 - 2 grados de libertad. Supuestos. 1. Variable dependiente medida, al menos, a nivel de intervalo. 2. Dos poblaciones normales o de cualquier tipo con n y n2 igual o mayor de 30. 3. Varianzas poblacionales desconocidas supuestas iguales, o desconocidas sin supuesto de igualdad con n1 = n2. 4. n1 + n2 observaciones aleatorias e independientes. Hiptesis. Contraste bilateral: H0 La diferencia entre las dos medias poblacionales es = 0. H1 La diferencia entre las dos medias poblacionales no es = 0. Contraste unilateral izquierdo: H0 La diferencia entre las dos medias poblacionales es = > 0. H1 La diferencia entre las dos medias poblacionales no es < 0. Contraste unilateral derecho: H0 La diferencia entre las dos medias poblacionales es = < 0. H1 La diferencia entre las dos medias poblacionales no es > 0. Aplicacin. Se tienen dos poblaciones, una para cada una de las dos condiciones del experimento. Obtenemos una muestra aleatoria en cada una de las dos poblaciones, o sea, dos muestras de tamao n1 y n2... Calculamos la media de las observaciones de cada muestra. Cada media representa una estimacin puntual de la media de la poblacin correspondiente. Si inferimos que las poblaciones no difieren en sus medias, podramos concluir que no hay efecto de mtodo sobre el aprendizaje de la estadstica, utilizando la media. Por otra parte, si inferimos una diferencia entre las medias poblacionales, concluiremos que el mtodo influye sobre las notas medias obtenidas. No se est interesado en las medias en s mismas sino en la diferencia existente entre ellas. La hiptesis nula es de la forma de que la diferencia entre medias es igual a cero, que es lo mismo que decir que las dos medias poblacionales son iguales. La distribucin muestral de la diferencia de medias es normal si son normales las dos distribuciones originales. La media de la distribucin de las diferencias de medias es igual a cero bajo la hiptesis nula. La varianza de la distribucin muestral de la diferencia de medias, es una funcin de los dos tamaos muestrales y de las varianzas de las dos poblaciones originales (supuesto de homocedasticidad). Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin.
1

ESTADISTICO Z (Se conocen las varianzas poblacionales).

27

Se aplica el estadstico Z, cuya distribucin es normal N(0,1). SUPUESTOS: 1. Variable dependiente media, al menos, a nivel de intervalo. 2. Dos poblaciones normales o de cualquier tipo con n1 y n2 igual o mayor de 30. 3. Varianzas poblacionales conocidas. 4. n1 + n2 observaciones aleatorias e independientes. La zona de rechazo se obtiene de una forma similar a la presentada para el estadstico de contraste T anterior, sustituyendo los valores crticos de la distribucin T de Student con n1 + n2 - 2 grados de libertad por los valores crticos de la distribucin normal N (0,1). Tambin es similar la forma de hallar el nivel crtico p, sustituyendo T por Z y t por z. o CONTRASTE DE VARIANZAS. En algunos casos, el problema de la investigacin versa sobre la variabilidad de la distribucin en vez de su centro. ESTADSTICO F. Para el caso de dos muestras independientes, la igualdad de las varianzas de dos poblaciones puede contrastares mediante el cociente de las dos varianzas. La lgica de la inferencia es la misma que para el caso de la media. Si la hiptesis nula es cierta, el cociente de las varianzas es igual a 1 y distinto de 1, si no lo es. Si las distribuciones de las dos poblaciones son normales, el cociente entre las dos varianzas se distribuye como una F de Snedecor que se distribuye con k1 = n1 - 1 y k2 = n2 -1 grados de libertad. Se distribuye con una T de Student con n1 + n2 - 2 grados de libertad. Supuestos. 1. Variable dependiente medida, al menos, a nivel de intervalo. 2. Dos poblaciones normales o de cualquier tipo con n1 y n2 igual o mayor de 30. 3. n1 + n2 observaciones aleatorias e independientes. Hiptesis. Contraste bilateral: H0 La varianza de la distribucin es la misma en las dos poblaciones. H1 La varianza de la distribucin no es la misma en las dos poblaciones. Contraste unilateral derecho: H0 La varianza de la distribucin de la poblacin 1 es igual o mayor que la de la poblacin 2. H1 La varianza de la distribucin de la poblacin 1 es menor que la de la poblacin 2. Contraste unilateral derecho: H0 La varianza de la distribucin de la poblacin 1 es igual o menor que la de la poblacin 2. H1 La varianza de la distribucin de la poblacin 1 es mayor que la de la poblacin 2. Aplicacin. Lo que se quiere contrastar es la igualdad de la varianzas (supuesto de homocedasticidad o de homogeneidad de varianzas). Zona de rechazo de la H0. Nivel crtico p.

28

En contraste bilaterales, es ms difcil de calcular cuando la distribucin de probabilidad es asimtrica. Toma de decisin. Interpretacin. o CONTRASTE DE PROPORCIONES. Se quiere comparar la proporcin de veces que aparece una determinada caracterstica en dos poblaciones. La variable dependiente slo puede tomar dos valores (variable dicotmica o dicotomizada). ESTADISTICO Z. El estadstico Z (1 - 2 = 0) se aplicar cuando la hiptesis nula se establece en trono a cero, lo cual implica el supuesto de igualdad de las dos proporciones poblacionales. El estadstico Z ( = 1 - 2 es no nula) se aplicar cuando la hiptesis nula se establece a una diferencia no nula, lo cual implica el supuesto de desigualdad de las dos proporciones poblacionales. En el primer caso, la hiptesis nula que se contrasta es que no hay diferencia entre los dos parmetros. Mientras que en el segundo la hiptesis nula es que hay diferencia y esta diferencia es igual a ( desigual a 0). Si la H0 se establece en torno a cero: Supuestos. 1. Variable dependiente dicotmica o dicotomizada. 2. n1P1 se distribuye segn una binomial en la poblacin 1, con parmetros n1 y 1. Tambin n2P2 se distribuye segn una binomial en la poblacin 2, con parmetros n 2 y 2. Donde 1 - 2 = 3. n1 + n2 observaciones aleatorias e independientes. 4. n1 y n2 iguales o mayores de 30 para realizar la aproximacin de la binomial a la normal. Si la H0 se establece en torno a una diferencia donde es no nula: Supuestos. 1. Variable dependiente dicotmica o dicotomizada. 2. n1P1 se distribuye segn una binomial en la poblacin 1, con parmetros n1 y 1. Tambin n2P2 se distribuye segn una binomial en la poblacin 2, con parmetros n 2 y 2. Donde 1 no es igual 2 3. n1 + n2 observaciones aleatorias e independientes. 4. n1 y n2 iguales o mayores de 30 para realizar la aproximacin de la binomial a la normal. Hiptesis. Si la H0 se establece en torno a cero: Contraste bilateral: H0 La proporcin de la poblacin 1 menos la proporcin de la poblacin 2 es igual a 0. H1 La proporcin de la poblacin 1 menos la proporcin de la poblacin 2 es distinta de 0. Contraste unilateral derecho: H0 La proporcin de la poblacin 1 menos la proporcin de la poblacin 2 es igual o mayor que 0. H1 La proporcin de la poblacin 1 menos a proporcin de la poblacin 2 es menor que 0. Contraste unilateral derecho: H0 La proporcin de la poblacin 1 menos a proporcin de la poblacin 2

29

es igual o menor que 0. H1 La proporcin de la poblacin 1 menos a proporcin de la poblacin 2 es mayor que 0. Si la H0 se establece en torno a una diferencia donde es no nula: Contraste bilateral: H0 La proporcin de la poblacin 1 menos la proporcin de la poblacin 2 es igual a . H1 La proporcin de la poblacin 1 menos la proporcin de la poblacin 2 es distinta de . Contraste unilateral derecho: H0 La proporcin de la poblacin 1 menos la proporcin de la poblacin 2 es igual o mayor que . H1 La proporcin de la poblacin 1 menos a proporcin de la poblacin 2 es menor que . Contraste unilateral derecho: H0 La proporcin de la poblacin 1 menos a proporcin de la poblacin 2 es igual o menor que . H1 La proporcin de la poblacin 1 menos a proporcin de la poblacin 2 es mayor que . Aplicacin. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin.

o CONTRASTE DE HIPTESIS E INTERVALOS DE CONFIANZA. Intervalo de confianza para una diferencia de medias. La distribucin muestral es la diferencia de medias en vez de la media. El intervalo de confianza, adems de proporcionarnos la informacin anterior, nos permite decidir, al igual que un contraste de hiptesis, sobre el rechazo o no de la H0. Como 0 (no hay diferencias), es decir, lo estipulado en la H0, no est dentro del intervalo, se rechaza la hiptesis nula de la diferencia entre las medias de ambas poblaciones es igual a cero. Intervalo de confianza para un cociente de varianzas. Como 1 (las varianzas son iguales), el valor estipulado en H0, est dentro del intervalo, no rechazamos H0. Intervalo de confianza para una diferencia de proporciones. Como 0 (no hay diferencias), lo estipulado en la hiptesis nula, no est dentro del intervalo, rechazamos H0. o RESUMEN DEL TEMA. CONTRASTE DE MEDIAS: Para su aplicacin, utilizando el estadstico de contraste T que se distribuye segn una T de Student con n1 + n2 - 2 grados de libertad. Adems el supuesto de independencia de las observaciones, el nivel de medida de la variable dependiente debe ser, al menos, de intervalo y las distribuciones poblacionales deben ser normales con varianzas desconocidas y supuestas iguales (o desconocidas sin supuesto de igualdad con n1 = n2). Si en la situacin anterior conocisemos las varianzas poblacionales utilizaramos el

30

estadstico Z que se distribuye segn una normal, N(0,1). Por otra parte, la distribucin T de Student se aproxima a la normal para grados de libertad mayores que 30, por lo que, en esos casos, acudiremos a la distribucin normal (0,1). CONTRASTE DE VARIANZAS: Utilizando el estadstico F, que se distribuye como una F de Snedecor con n1 - 1 y n2 -1 grados de libertad. Adems el supuesto de independencia de las observaciones, el nivel de medida de la variable dependiente debe ser, al menos, de intervalo y las distribuciones poblacionales deben ser normales (o con cualquier tipo siempre que los tamaos muestrales sean iguales o mayores que 30). CONTRASTE DE LA DIFERENCIA DE PROPORCIONALES: En el que aplicamos los estadsticos Z que se distribuyen de forma aproximadamente normal. Adems del supuesto de independencia de las observaciones, la variable debe ser dicotmica, n1P1 y n2P2 deben distribuirse como una binomial y n1 igual o mayor que 30 y n2 igual o mayor que 30 para realizar la aproximacin de la binomial a la normal. Adems en el caso del estadstico Z (frmula 8.5) las proporciones poblacionales se suponen iguales bajo H0 y en el estadstico Z (frmula 8.6) distintas. Pese a su similitud en los supuestos (excepto respecto a los parmetros 1 y 2 , lo que afecta al error tpico de la diferencia), la hiptesis nula que se contrasta con cada estadstico y ambos estadsticos son muy diferentes. CLASIFICACION PARAMETRICO Y NO PARAMETRICO: Los contrastes sobre la diferencia de medias y el cociente de varianza seran paramtricos. Los contrastes sobre la diferencia de proporciones, entrara en la clasificacin de los contrastes no paramtricos, pues no se cumple el nivel de medida de los paramtricos.

CONTRASTES PARA DOS MUESTRAS INDEPENDIENTES II (TEMA 9)


o INTRODUCCIN. Se intenta comparar por un lado las categoras de una variable categrica o categorizada (estadstico de X2 Pearson). Por otro las proporciones acumuladas de una variable medida, al menos, a nivel ordinal (estadstico D de Kolmogorov - Smirnov). Tambin bajo determinados supuestos compararemos la tendencia central de dos distribuciones de una variable medida, al menos, a nivel ordinal (estadstico de W de Mann - Whitney - Wilcoxon). Las observaciones de ambas muestras son independientes. o ESTADSTICO X2 DE PEARSON DE HOMEGENEIDAD. El estadstico X2 de homogeneidad podemos contrastar la hiptesis nula de que las proporciones con que se representa una cierta caracterstica, en las categoras de una variable, son iguales, en dos poblaciones.

31

Tambin puede decirse que las dos poblaciones son homogneas en cuanto a la proporcin de sujetos que representa esa caracterstica en las categoras. El estadstico X2 se distribuye aproximadamente como una Chi cuadrado con (m-1) (c-1) grados de libertad, donde m se refiere al nmero de muestras, y c indica el nmero de categoras de la variable. Supuestos. 1. Variable dependiente medida, al menos, a nivel nominal con c categoras o a un nivel superior y categorizada.. 2. c categoras exhaustivas y mutuamente exclusivas. 3. n + n2 observaciones aleatorias e independientes. 4. La frecuencia terica de cada categora, en cada muestra, es al menos 3. Hiptesis. H0: Las dos poblaciones son homogneas en cuanto a la proporcin de la caracterstica observada en cada una de las c categoras de la variable. H1: Las dos poblaciones no son homogneas en cuanto a la proporcin de la caracterstica observada en cada una de la c categoras de la variable. Aplicacin. El estadstico de contraste X2 se basa en la comparacin de las frecuencias observadas y las frecuencias esperadas, estas ltimas calculadas bajo el supuesto de que la hiptesis nula es cierta. Si las diferencias entre ambos tipos de frecuencias son estadsticamente significativas, deberemos rechazar la hiptesis de homogeneidad. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Se rechaza H0 si x2 cae en la zona de rechazo o si p es = < que . Interpretacin. Deben interpretarse los resultados en el contexto de la investigacin. NUMERO DE FRECUENCIAS TEORICAS: Este nmero dentro de cada celda de la tabla de contingencia debe ser lo suficientemente grande. La frecuencia terica de cada categora, en cada muestra, es al menos de 3. En caso contrario debemos agrupar las categoras hasta alcanzar este criterio. En caso de agrupar las categoras, el nmero de categoras a contrastar es el obtenido despus de la recategorizacin. El contraste de homogeneidad mediante X2 de Pearson puede generalizarse a ms de dos poblaciones y c categoras. El estadstico X2 de Pearson, tambin puede aplicarse para contrastar la independencia de dos variables. En este caso, las observaciones de una muestra se clasifican de acuerdo con dos variables que pueden tener varias categoras cada una.
1

o ESTADSTICO D KOLMOGOROV - SMIRNOV. Sea S1 (y) la proporcin emprica de valores iguales o menores que y en la muestra 1. Es decir el nmero de observaciones iguales o menores que y en la muestra 1, dividido por el nmero total de observaciones de la muestra 1. Y S2 (y) que tiene el mismo significado que S1 (y) pero respecto a la muestra 2. Las fac1 y fac2 son frecuencias acumuladas hasta el valor y, en las muestras 1 y 2. Si ambas muestras proceden de poblaciones con distribuciones iguales es de esperar que no haya discrepancias entre S1(y) y S2(y), excepto por azar. Los valores de las diferencias pueden considerarse como una medida de la discrepancia entre las dos funciones de distribucin.

32

Si la mayor diferencia es pequea, las restantes tambin lo sern, por lo que no se podr rechazar la hiptesis nula de igualdad de las distribuciones. Supuestos. 1. Variable dependiente medida, al menos, a nivel ordinal. 2. n + n2 observaciones aleatorias e independientes. Hiptesis. Contraste bilateral: H0: F1(y) = F2(y) para toda y. La funcin de la distribucin es la misma en ambas poblaciones, para toda y. H1: F1(y) es distinta F2(y) para al menos una y. La funcin de distribucin no es la misma en ambas poblaciones, para al menos una y. Contraste unilateral derecho : H0: F1(y) igual o menor F2(y) para toda y. La funcin de la distribucin de la poblacin 1 es igual o menor que la de la poblacin 2,para toda y. H1: F1(y) es mayor F2(y) para al menos una y. La funcin de distribucin de la poblacin 1 es mayor que la de la poblacin 2, para al menos una y. Aplicacin. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin.
1

o ESTADSTICO W DE MANN - WHITNEY - WILCOXON. El estadstico de contraste W permite, bajo ciertos supuestos, comparar la tendencia central de dos distribuciones poblacionales en dos muestras independientes. La finalidad de la aplicacin del estadstico W es contrastar si dos muestras pertenecen a dos poblaciones idnticas o lo que es lo mismo, si pertenecen a una poblacin comn. Si las dos muestras pertenecen a una misma poblacin, es de esperar que la muestra extrada de una poblacin no diferir de la muestra extrada de la otra poblacin. El clculo de W se basa en la informacin ordinal de las observaciones (medidas, valores o puntuaciones individuales). Si ordenamos todas las puntuaciones de menor a mayor, independientemente de la muestra a la que pertenecen, si las dos muestras proceden de la misma poblacin, la suma de los rdenes de una muestra no debera ser muy distinta de la suma de los rdenes de la otra muestra. Se asigna a cada puntuacin el orden que le corresponde segn su magnitud independientemente de la muestra a la que pertenece.. Supuestos. 1. Variable dependiente medida, al menos, a nivel ordinal. 2. n + n2 observaciones aleatorias e independientes. 3. Las distribuciones de las dos poblaciones si difieren es slo en su medida de tendencia central. Hiptesis. Contraste bilateral: H0: La tendencia central de las dos poblaciones son iguales. H1: La tendencia central de las dos poblaciones es distinta.
1

33

Contraste unilateral izquierdo: mayor que la

H0: La tendencia central de la poblacin 1 es igual o de la poblacin 2. H1: La tendencia central de la poblacin 1 es menor que la de la poblacin 2. H0: La tendencia central de la poblacin 1 es igual o de la poblacin 2. H1: La tendencia central de la poblacin 1 es mayor que la de la poblacin 2.

Contraste unilateral derecho : menor que la

Aplicacin. Empates. El estadstico de contraste W requiere ordenar las medidas o puntuaciones de ambas muestras en una ordenacin nica. Ello es posible si no hay medidas iguales, es decir, si no hay empates. An si la distribucin de la variable es continua por lo que la probabilidad de un empate es nula, podemos tener empates por la limitada precisin de los instrumentos de nuestras medidas. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Aproximacin a la distribucin normal. Cuando tenemos muestras n1 > 2 y n2 > 10, podemos aplicar la aproximacin a la distribucin normal. El 0,5 es una correccin por continuidad. Se resta 0,5 si W E(W) o se suma si > E(W). Interpretacin. DISTRIBUCIN MUESTRAL. La distribucin muestral del estadstico de contraste W de Mann - Whitney - Wilcoxon, al igual que la de muchos otros estadsticos basados en sumas de rdenes, es fcil de hallar cuando los tamaos muestrales son pequeos. Cuando las muestras son de distinto tamao tenemos una distribucin muestral distinta segn calculemos las combinaciones de los n1 o n2 rdenes. o RESUMEN DEL TEMA. Tres estadsticos para el caso de dos muestras independientes. 1. X2 de Pearson. 2. D de Kolmogorov - Smirnov. 3. W de Mann - Whitney - Wilcoxon. El estadstico X2 se calcula a partir de las frecuencias de datos de una variable medida a nivel nominal, o a un nivel superior y categorizada. Y los estadsticos W y D, en base a datos ordenados. La aplicacin de los tres estadsticos no requiere hacer ningn supuesto sobre la forma de la distribucin poblacional. El estadstico X2 de Pearson permite contrastar la homogeneidad de m poblaciones en cuanto a la proporcin de veces que aparece una determinada caracterstica en las distintas categoras de una variable. El estadstico D de Kolmogorov - Smirnov compara las funciones de distribucin de ambas muestras, para cada valor de Y observado en la muestra. El estadstico W de Mann - Whitney - Wilcoxon permite comparar la tendencia central de dos poblaciones.

34

CONTRASTES PARA DOS MUESTRAS DEPENDIENTES I (TEMA-10)


o INTRODUCCIN. Dos muestras son dependientes o estn relacionadas cuando las observaciones no son independientes. Cuando se mide dos veces la misma variable en una misma muestra de sujetos como en el clsico diseo antes y despus de un tratamiento, las dos observaciones o medidas de cada sujeto pueden estar relacionadas o correlacionadas. Otro caso es cuando se mide una variable en los dos miembros de n pares de sujetos siendo los miembros de cada par muy similares en alguna o algunas variables relevantes. En los dos casos, las observaciones pueden estar relacionadas. Por lo tanto, siempre que tengamos datos procedentes de diseos de ese tipo, si no se especifica lo contrario, asumiremos que las observaciones de ambas muestras estn relacionadas. Si bien las observaciones (de un mismo sujeto o entre los dos sujetos de un mismo par) pueden estar relacionadas, ello no implica que las diferencias entre cada par de observaciones lo estn. La lgica de la inferencia es como sigue: 1. Se formulan las hiptesis estadsticas acerca de alguna caracterstica de la distribucin de la variable en la poblacin en funcin de la hiptesis cientfica y las caractersticas anteriores. 2. Se elige el estadstico de contraste ms adecuado en funcin de esas caractersticas y las hiptesis. 3. Se especifica la distribucin muestral del estadstico bajo el supuesto de que la hiptesis nula es cierta. 4. Fijamos . 5. Se calcula el estadstico de contraste elegido, con los datos de ambas muestras de observaciones que supondremos relacionadas. 6. Se obtiene la probabilidad asociada al valor del estadstico hallado. 7. Decidimos sobre el rechazo o no de la hiptesis nula. 8. Interpretamos el resultado obtenido. o CONTRASTE DE MEDIAS. Se toman las medias, antes y despus de la aplicacin de un tratamiento, es decir, en el que se obtienen medias pre y post tratamientos. En teora, las dos observaciones o puntuaciones de un mismo sujeto (o de los dos sujetos de un mismo par) pueden estar relacionadas, pero las diferencias no tienen porque estarlo. No tiene porque influir la diferencia entre dos medidas con la diferencias observada entre otras dos medidas. Lo que se pretende inferir es el efecto de una variable sobre otra variable. El procedimiento para estimar la media de las diferencias entre dos muestras relacionadas es similar al ya explicado, pues se puede considerar las diferencias obtenidas como una muestra, en este caso, de diferencias. Por los tanto el estadstico de contraste es el mismo que el utilizado para contrastar la media de una poblacin normal. Si la poblacin de las diferencias es normal con varianza conocida, la distribucin muestral de la media tambin ser normal.
35

Si se desconoce la varianza poblacional de diferencias, debemos estimarla pero en este caso, la distribucin muestral de la media de las diferencias no es normal sino que sigue un modelo de probabilidad T de Student con n-1 grados de libertad. ESTADSTICO T (Varianza poblacional desconocida). En el caso de la media de las diferencias el estadstico se obtiene tipificando la media de las diferencias D = 0 Supuestos. 1. Variable dependiente medida, al menos, a nivel intervalo. 2. Una poblacin normal de diferencias o de cualquier tipo con n igual o mayor de 30. 3. La varianza poblacional de las diferencias es desconocida. 4. n diferencias aleatorias e independientes. Hiptesis. Contraste bilateral: H0: D es = a 0. Las diferencias en la poblacin es igual a cero. H1: D no es igual a 0. Las diferencias en la poblacin es igual a cero. Contraste unilateral izquierdo: H0: D es = > a 0. Las diferencias en la poblacin es igual o mayor a cero. H1: D es < que 0. Las diferencias en la poblacin es menor que cero. Contraste unilateral derecho : poblacin es H0: D es = < que 0. Las diferencias en la igual o menor a cero. H1: D es > que 0. Las diferencias en la poblacin es mayor que cero. Aplicacin. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin. ESTADSTICO Z (varianza poblacional conocida). Cuando conocemos la varianza poblacional. El estadstico Z se distribuye normalmente, con media cero y varianza uno. Los supuestos son los siguientes: 1. Variable dependiente medida, al menos, a nivel de intervalo. 2. Una poblacin normal de diferencias o de cualquier tipo con n = > de 30. 3. La varianza poblacional de las diferencias es conocida. 4. n diferencias aleatorias e independientes. CONTRASTE DE VARIANZAS. El contraste de varianzas para dos muestras de observaciones relacionadas. ESTADSTICO T. El estadstico T se distribuye como una T de Student con n-2 grados de libertad. Supuestos. 1. Variable dependiente medida, al menos, a nivel intervalo. 2. Dos poblaciones normales o de cualquier tipo con n1 = n2 (n pares) igual o mayor de 30.

36

3. Las dos observaciones de cada par estn relacionadas entre s. Hiptesis. Contraste bilateral: H0: 21 = 22 La varianza de la poblacin 1 es igual a la varianza de la poblacin 2. H1: 21 distinta 22 La varianza de la poblacin 1 no es igual a la varianza de la poblacin 2. Contraste unilateral izquierdo: H0: 21 = > 22 La varianza de la poblacin 1 es igual o mayor a la varianza de la poblacin 2. H1: 21 < 22 La varianza de la poblacin 1 es menor que la varianza de la poblacin 2. Contraste unilateral derecho: H0: 21 = < 22 La varianza de la poblacin 1 es igual o menor a la varianza de la poblacin 2. H1: 21 > 22 La varianza de la poblacin 1 es mayor que la varianza de la poblacin 2. Aplicacin. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin. o CONTRASTE DE PROPORCIONES. Se trata de comparar la proporcin de veces que aparece una determinada caracterstica, tomando medidas pre y post tratamiento. Por lo tanto tendremos una muestra de tamao n en la que tomamos dos medidas de una misma variable. ESTADISTICO B (Binomial). El estadstico de contraste B se distribuye como una binomial con = 0,50 y n = n12 + n21. Supuestos. 1. Variable dependiente medida, al menos, a nivel nominal con dos categoras o a un nivel superior y categorizada. 2. Poblacin: N = N12 + N21 cambios. 3. n = n12 + n21 cambios independientes.

Hiptesis. Contraste bilateral: que puntan 2

H0: 21 = 12 La proporcin poblacional de sujetos en la primera medida y 1 en la segunda es igual a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H1: 21 no es igual 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda no es igual a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H0: 21 = > 12 La proporcin poblacional de
37

Contraste unilateral izquierdo:

sujetos que puntan 2 en la primera medida y 1 en la segunda es igual o mayor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H1: 21 < 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda es menor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H0: 21 = < 12 La proporcin poblacional de 2 en la primera medida y 1 en la segunda es igual o menor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H1: 21 > 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda es mayor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. Aplicacin. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin. ESTADISTICO Z. Supuestos. 1. Variable dependiente medida, al menos, a nivel nominal con dos categoras o a un nivel superior y categorizada. 2. Poblacin: N = N12 + N21 cambios. 3. n = n12 + n21 > 20. Hiptesis. Contraste bilateral: H0: 21 = 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda es igual a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H1: 21 no es igual 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda no es igual a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. Contraste unilateral izquierdo: H0: 21 = > 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda es igual o mayor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H1: 21 < 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda es menor a la proporcin poblacional de sujetos que puntan 1

Contraste unilateral derecho: sujetos que puntan

38

en la primera medida y 2 en la segunda.

Contraste unilateral derecho: sujetos que puntan

H0: 21 = < 12 La proporcin poblacional de 2 en la primera medida y 1 en la segunda es igual o menor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda. H1: 21 > 12 La proporcin poblacional de sujetos que puntan 2 en la primera medida y 1 en la segunda es mayor a la proporcin poblacional de sujetos que puntan 1 en la primera medida y 2 en la segunda.

Aplicacin. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin.

o CONTRASTE DE HIPTESIS E INTERVALOS DE CONFIANZA. El intervalo de confianza para medias y proporciones, en ambos casos, para dos muestras de observaciones relacionadas. Intervalo confidencial en torno a la media poblacional de las diferencias: Al igual que con el contraste de hiptesis, el intervalo de confianza nos permite decidir sobre le rechazo o no de H0. Como 0, el valor de la media de las diferencias estipulado en la hiptesis nula est dentro del intervalo, no rechazamos que la media de las diferencias en la poblacin es 0. Intervalo de confianza para una diferencia de proporciones:

CONTRASTES PARA DOS MUESTRAS DEPENDIENTES (TEMA 11)


o ESTADSTICO S (SIGNOS). El estadstico S est basado en lo que comnmente se llama la prueba o contraste de los signos. Se denomina as porque podemos convertir los datos en signos positivos y negativos. Se define como el nmero de signos negativos o positivos, y se distribuye como una binomial con parmetros = 0,50 y n = n+ + n-. Supuestos.

39

1. Variable dependiente medida, al menos, a nivel ordinal. 2. n = n- + n+ diferencias aleatorias e independientes. Hiptesis. Contraste bilateral: H0: 1 = 2 La mediana de la poblacin 1 es igual a la mediana de la poblacin 2. H1: 1 no es igual 2 La mediana de la poblacin 1 no es igual a la mediana de la poblacin 2. Contraste unilateral izquierdo: H0: 1 = > 2 La mediana de la poblacin 1 es igual o mayor a la mediana de la poblacin 2. H1: 1 < 2 La mediana de la poblacin 1 es menor a la mediana de la poblacin 2. Contraste unilateral derecho: H0: 1 = < 2 La mediana de la poblacin 1 es igual o menor a la mediana de la poblacin 2. H1: 1 > 2 La mediana de la poblacin 1 es mayor a la mediana de la poblacin 2. Aplicacin. Ambas probabilidades son iguales por ser simtrica la distribucin binomial en torno a n/2. En un contraste unilateral, debe tenerse en cuenta la direccin del contraste. En un contraste unilateral izquierdo, si las diferencias se obtienen restando la segunda medida de la primera, muchos signos positivos (pocos signos negativos) apoyarn le hiptesis alternativa, y si las diferencias se obtienen restando la primera medida de la segunda, muchos signos negativos (pocos positivos) apoyarn la hiptesis alternativa. En un contraste unilateral derecho, si las diferencias se obtienen restando la segunda medida de la primera, muchos signos negativos (pocos signos positivos) apoyarn le hiptesis alternativa, y si las diferencias se obtienen restando la primera medida de la segunda, muchos signos positivos (pocos negativos) apoyarn la hiptesis alternativa. Mediante el contraste de signos podemos contrastar hiptesis sobre cualquier percentil, por lo que tomar un valor u otro segn el percentil que se quiera contrastar. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin.

o ESTADSTICO W DE WILCOXON. El estadstico de contraste S slo utiliza la informacin acerca de los signos de las diferencias entre cada para de puntuaciones. El contraste de Wilcoxon, adems de esta informacin asigna un orden a cada diferencia en funcin de su magnitud. Se atribuye un rango u orden a cada diferencia segn su magnitud, independientemente de su signo. El estadstico de contraste W se define como la suma de rdenes negativos o positivos. Supuestos. 1. Variable dependiente medida, al menos, a nivel de intervalo. 2. n = n- + n+ diferencias aleatorias e independientes. 3. La distribucin poblacional de las diferencias es simtrica en torno a la mediana. Hiptesis.

40

Contraste bilateral: la mediana de

H0: 1 = 2 La mediana de la poblacin 1 es igual a la poblacin 2. H1: 1 no es igual 2 La mediana de la poblacin 1 no es igual a la mediana de la poblacin 2.

Contraste unilateral izquierdo: igual o mayor a la

H0: 1 = > 2 La mediana de la poblacin 1 es mediana de la poblacin 2. H1: 1 < 2 La mediana de la poblacin 1 es menor a la mediana de la poblacin 2. H0: 1 = < 2 La mediana de la poblacin 1 es mediana de la poblacin 2. H1: 1 > 2 La mediana de la poblacin 1 es mayor a la mediana de la poblacin 2.

Contraste unilateral derecho: igual o menor a la

Aplicacin. En un contraste unilateral, debe tenerse en cuenta la direccin del contraste. En un contraste unilateral izquierdo, si las diferencias se obtienen restando la segunda medida de la primera, rechazaremos la hiptesis nula si la suma de los rdenes positivos es significativamente mayor que la de los rdenes negativos, y si las diferencias se obtienen restando la primera medida de la segunda, rechazaremos la hiptesis nula si la suma de los rdenes positivos es significativamente menor que la de los rdenes negativos. En un contraste unilateral derecho, si las diferencias se obtienen restando la segunda medida de la primera, rechazaremos la hiptesis nula si la suma de los rdenes positivos es significativamente mayor que la de los rdenes negativos, y si las diferencias se obtienen restando la primera medida de la segunda, rechazaremos la hiptesis nula si la suma de los rdenes positivos es significativamente menor que la de los rdenes negativos. Zona de rechazo de la H0. Nivel crtico p. Toma de decisin. Interpretacin.

CONTRASTES DE INDEPENDENCIA DE DOS VARIABLES


ESTADSTICO X2 DE PEARSON DE INDEPENDENCIA DE DOS VARIABLES (ANEXO)
o INTRODUCCIN. Bajo determinados supuestos, podemos aplicar el estadstico X2 para contrastar si n

41

poblaciones son homogneas en cuanto a la proporcin de veces que aparece cierta caracterstica en las c categoras de una variable. El estadstico X2 de Pearson, tambin puede aplicarse para contrastar la independencia de dos variables. En este caso, las observaciones de una muestra se clasifican de acuerdo con dos variables que pueden tener varias categoras cada una. El diseo no es el mismo en los dos casos. En el contraste de homogeneidad tenemos m muestras procedentes de m poblaciones y se clasifican a los sujetos de cada muestra en la c categoras de una variable. Por otra parte, en el contraste de independencia tenemos una muestra procedente de una poblacin y se clasifican a los sujetos de la muestra en las c x r combinaciones resultantes de cruzar c categoras de una variable con r categoras de la otra variable. Las c categoras en el contraste de homogeneidad y las c x r combinaciones en el de independencia deben ser exhaustivas y mutuamente exclusivas. Es decir, cada sujeto de cada poblacin (o la poblacin) slo puede pertenecer a una de las c categoras (en el contraste de homogeneidad) y en las c x r combinaciones (en el contraste de independencia). Aunque los estadsticos son matemticamente equivalentes, la lgica seguida en el clculo de las frecuencias esperadas de cada celdilla, es diferente. En el contraste de homogeneidad, se calculan bajo el supuesto de que las dos poblaciones son homogneas en cuanto a la proporcin de veces que aparece la caracterstica de inters (H0). En el contraste de independencia, se obtienen bajo el supuesto de que las dos variable son independientes (H0).

o ESTADSTICO DE CONTRASTE. El estadstico X2 se distribuye aproximadamente como una 2 con (c-1) (r-1) grados de libertad, donde c y r indican el nmero de categoras de la primera y segunda variable, respectivamente. El estadstico X2 de independencia puede aplicarse cuando se tiene un nmero cualquiera de categoras en cualquiera de las dos variables, siempre que n sea lo suficientemente grande. Los datos consisten en un nmero n de observaciones que pueden clasificarse de acuerdo a dos variables con c y r categoras, respectivamente, de forma que cada observacin pertenezca de forma unvoca a una de las c x r combinaciones (o celdilla) resultantes de cruzar las categoras de las dos variables. o SUPUESTOS. 1. Dos variables medidas a nivel nominal con c y r categoras respectivamente o a un nivel superior y categorizadas. 2. Una muestra aleatoria de n sujetos extrada de una poblacin. 3. c x r combinaciones exhaustivas y mutuamente exclusivas. 4. La frecuencia terica de cada celdilla de la tabla de contingencia, al menos, 3.

HIPTESIS. H0: Las dos variables aleatorias son independientes. H1: Las dos variables aleatorias no son independientes. El estadstico de contraste X2 se basa en la comparacin de las frecuencias observadas y las frecuencias esperadas, estas ltimas bajo el supuesto de que la hiptesis nula es cierta. Si las diferencias entre ambos tipos de frecuencias son estadsticamente significativas, deberemos rechazar la hiptesis de independencia. El nmero de frecuencias tericas dentro de cada celda de la tabla de contingencia debe ser lo suficientemente grande. La frecuencia terica de caza celda sea, al menos, 3.

42