Você está na página 1de 9

PSICOESTADSTICA II

PRUEBA DE CHI CUADRADO (2) PARA UNA SOLA MUESTRA

La prueba del 2 se usa para variables de distintos niveles de medicin, incluyendo las de menor nivel, que son las nominales. Sirve para determinar si los datos obtenidos de una sola muestra presentan variaciones estadsticamente significativas respecto de la hiptesis nula. Cuando formulamos una hiptesis de trabajo, simultneamente definimos la hiptesis nula, que niega nuestra hiptesis de trabajo. De acuerdo a la hiptesis nula (H0) las variaciones en la variable independiente no tienen correspondencia con las variaciones que pudiere haber de la variable dependiente. Es decir que existe independencia estadstica. 1 Las variaciones que pudiese encontrarse se deberan a factores
Material exclusivo para el IES N 1 A. Moreau de Justo

aleatorios, ajenos a la variable independiente. Para comprobar si esto es as (y, por lo tanto, deberamos aceptar la H0) o no (y, por ende, rechazarla), podemos someter los resultados obtenidos de nuestra muestra a una prueba de 2, que se postula con la siguiente ecuacin:

2 =

(fe fo)2 fe

Se trata de la razn entre la sumatoria de los cuadrados de las diferencias entre las frecuencias esperadas (fe) y las frecuencias observadas (fo) respecto de las frecuencias esperadas (fe). Como toda razn, expresa una proporcin; en este caso, la proporcin entre las distancias observadas (elevadas al cuadrado) y las frecuencias esperadas. Pero la aplicacin del chi cuadrado no se puede hacer directamente. Es necesario, antes de ello, realizar dos pasos. Por una parte, establecer el nivel de significacin () con el cual vamos a trabajar, y determinar los grados de libertad de nuestra muestra. El nivel de significacin es arbitrario y se fija de antemano (usualmente entre 0.01 y 0.10, siendo el ms usado el de 0.05). Los grados de libertad se establecen en funcin de la cantidad de celdas que tenemos, producto de las categoras de una variable o bien de la cantidad resultante del cruce de dos variables.

Vase Unidad 3.

Prof. F. Nievas

PSICOESTADSTICA II

GRADOS DE LIBERTAD

Esta nocin se refiere a la posibilidad que se tiene de establecer, en una distribucin dada, valores arbitrarios sin modificar el marginal de dicha distribucin. As, en una variable con cinco categoras, podr establecer cuatro valores de manera arbitraria, ya que el quinto quedar determinado por la diferencia entre la sumatoria de los cuatro que establezco, y el marginal. Cuando tengo una variable, la frmula para calcular los grados de libertad es df = k 1 siendo k el nmero de categoras que tengo.
Material exclusivo para el IES N 1 A. Moreau de Justo

PRUEBA DE CHI CUADRADO (2) PARA MS DE UNA MUESTRA


Cuando trabajo con cuadros de doble entrada (dos variables), las categoras de la variable independiente constituyen, cada una, una muestra. Por ejemplo, si la variable independiente es sexo, tendr una muestra de hombres y otra de mujeres. En estos casos la forma de establecer los grados de libertad es df = (c 1) . (f 1) siendo c el nmero de columnas y f el nmero de filas. Es decir que es el producto del nmero de celdas menos uno, por el nmero de filas menos uno.

CLCULO DE LAS FRECUENCIAS ESPERADAS

Las frecuencias esperadas (fe) vienen dadas por la hiptesis nula (H0), pero no siempre se puede establecer de manera inmediata. Esto solo es posible cuando trabajamos con

Prof. F. Nievas

PSICOESTADSTICA II una variable, pero cuando tenemos cuadros de doble entrada la forma de establecer el valor de la frecuencia esperada de cada celda es el siguiente:

Categora A Categora B Categora C Marginal A/B/C

Categora 1 a d g (a+d+g)

Categora 2 b e h (b+e+h)

Categora 3 c f i (c+f+i)

Marginal 1/2/3 (a+b+c) (d+e+f) (g+h+i) N

Clculo de la frecuencia esperada (fe) para la celda a (a+d+g) (a+b+c) N


Material exclusivo para el IES N 1 A. Moreau de Justo

Clculo de la frecuencia esperada (fe) para la celda b (b+e+h) (a+b+c) N Clculo de la frecuencia esperada (fe) para la celda c (c+f+i) (a+b+c) N Clculo de la frecuencia esperada (fe) para la celda d (a+d+g) (d+e+f) N Clculo de la frecuencia esperada (fe) para la celda e (b+e+h) (d+e+f) N Clculo de la frecuencia esperada (fe) para la celda f (c+f+i) (d+e+f) N Clculo de la frecuencia esperada (fe) para la celda g (a+d+g) (g+h+i)

Prof. F. Nievas

PSICOESTADSTICA II N Clculo de la frecuencia esperada (fe) para la celda h (b+e+h) (g+h+i) N Clculo de la frecuencia esperada (fe) para la celda i (c+f+i) (g+h+i) N Como puede observarse, el procedimiento es bien sencillo. Se trata de la razn entre el producto de los marginales de la celda considerada y el total (N).
Material exclusivo para el IES N 1 A. Moreau de Justo

COMPARACIN DEL VALOR OBTENIDO Y LECTURA DEL 2

Una vez que se obtiene el resultado de la ecuacin, el nmero arrojado no tienen significacin por s mismo. En realidad lo obtenido es un parmetro para establecer la validez o no de mi hiptesis de trabajo. Si se observa la frmula de 2 (fe fo)2 fe puede notarse que cuanto mayor es la diferencia entre las frecuencias observadas y las esperadas (fo y fe respectivamente), mayor ser el numerador [ (fe fo)2] y, consecuentemente, tambin ser mayor nmero que se obtenga. Una mayor diferencia indica, por otra parte, que es menos probable que las mismas se deban puramente al azar (que es lo que indicara la Ho). Por esta razn, cuanto mayor sea el nmero obtenido, ms probable es que podamos rechazar la hiptesis nula. Decamos que el nmero obtenido es simplemente un parmetro, es decir, un punto para comparar. Y contra qu lo debemos comparar? Contra la tabla D, que es la distribucin del 2. Para ello debemos considerar los grados de libertad (df) y el nivel de significacin () que hemos elegido. En los cabezales de las columnas de la tabla D

2 =

Prof. F. Nievas

PSICOESTADSTICA II encontramos los niveles de significacin, y en las filas, los grados de libertad. Cruzando ambos (columna y fila) llegamos a una celda con un nmero determinado. Si el nmero que nosotros obtenemos mediante el clculo de 2 es igual o mayor (= >) al que figura en la tabla, rechazamos la hiptesis nula (Ho) y validamos, en consecuencia, nuestra hiptesis de trabajo (H1). Si, por el contrario, es inferior, debemos aceptar la hiptesis nula (Ho), quedando invlida nuestra hiptesis de trabajo (H1). Nmero obtenido de > Nmero de la tabla Nmero obtenido de 2 = Nmero de la tabla Nmero obtenido de 2 < Nmero de la tabla
2

Lectura Rechazo Ho. Acepto H1 Rechazo Ho. Acepto H1 Acepto Ho. Rechazo H1

CLCULO DE 2

Material exclusivo para el IES N 1 A. Moreau de Justo

Vamos a ver prcticamente cmo se calcula el 2. Tomaremos dos ejemplos, para una y ms de una muestra.

Ejemplo 1 (Clculo para una muestra)

Suponemos que los compradores en los shoppings pertenecen a las clases altas de la sociedad. Para eso tomamos una muestra de 50 casos, de manera aleatoria, a quienes indagamos sobre su pertenencia social (para ello debemos tener un instrumento que nos permita inferir a qu clase social pertenecen). Los resultados nos arrojan lo siguiente: Clase fo Baja 8 MediaBaja 9 Media 10 MediaAlta 11 Alta 12

Para saber si el resultado obtenido es estadsticamente significativo sometemos esta muestra a una prueba de 2. La hiptesis nula queda formulada de la siguiente manera: los compradores en los shoppings no pertenecen a una clase social especfica, en razn de la cual, las frecuencias esperadas han de ser de 10 casos para cada celda (si la clase social no influye, no debe haber variacin en una muestra tomada al azar, y si tal variacin existe, sta se debe a cuestiones contingentes, y no a una tendencia).

Prof. F. Nievas

PSICOESTADSTICA II El nivel de significacin que escogemos es = 0.05; procedemos, en consecuencia, a realizar el clculo de 2. Clase fo fe fe fo (fe fo)2 Baja 8 10 -2 4 MediaBaja 9 10 -1 1 Media 10 10 0 0 MediaAlta 11 10 1 1 Alta 12 10 2 4

La sumatoria [ ] de las diferencias al cuadrado [(fe fo)2] es = 4+1+0+1+4. Reemplazando los trminos obtenemos la siguiente ecuacin:

Material exclusivo para el IES N 1 A. Moreau de Justo

(fe fo)2 fe

= 10

10 =1

Estamos trabajando con 4 grados de libertad (k = 51), y el = 0.05; observamos en la tabla D el valor que corresponde a df = 4 y = 0.05 y el mismo es 9,488. Dado que 1 (el nmero obtenido) es inferior (<) al que figura en la tabla, aceptamos la hiptesis nula. Nmero obtenido de 2 < Nmero de la tabla 1 < 9,488 Acepto Ho. Rechazo H1 Acepto Ho. Rechazo H1

Tenemos que decir, en consecuencia, que los compradores en shoppings no pertenecen a una clase social especfica, y que las variaciones que encontramos (8, 9, 10, 11, 12) se deben exclusivamente al azar.

Ejemplo 2 (Clculo para cinco muestras)

Suponemos que la ideologa poltica influye en la eleccin de los medios de prensa que se leen. En razn de ello, suponemos que la gente de derecha escoge La Prensa, que los de centro derecha leen La Nacin, lo de centro leen Clarn, los de centro izquierda leen Pgina/12 y los de izquierda Le Monde Diplomatique. Para ello construimos un instrumento que nos permite establecer la ideologa, y tomamos una muestra al azar, obteniendo el siguiente resultado.

Prof. F. Nievas

PSICOESTADSTICA II Derecha La Prensa La Nacin Clarn Pgina/12 Le Monde Total 34 32 15 21 10 112 Centroderecha 12 31 55 18 8 124 Centro 8 24 68 17 15 132 Centroizquierda 5 28 61 25 25 144 Izquierda 2 20 34 21 43 120 Total 61 135 233 102 101 632

Decidimos trabajar con un = 0.05. Con el procedimiento descrito anteriormente determinamos las frecuencias esperadas, de modo que nos quedan de la siguiente manera: (Cuadro A) Derecha
Material exclusivo para el IES N 1 A. Moreau de Justo

La Prensa La Nacin Clarn Pgina/12 Le Monde Total

10,810126 23,924050 41,291139 18,075949 17,898734 112

Centroderecha 11,968354 26,487341 45,715189 20,012658 19,816455 124

Centro 12,740506 28,196202 48,664557 21,303797 21,094936 132

Centroizquierda 13,898734 30,759493 53,088607 23,240506 23,012658 144

Izquierda 11,582278 25,632911 44,240506 19,367088 19,177215 120

Total 61 135 233 102 101 632

La diferencia entre las fo y las fe es: (Cuadro B) -23,1898734 -8,07594937 26,2911392 -2,92405063 7,89873418 -0,03164557 -4,51265823 -9,28481013 2,01265823 11,8164557 4,74050633 4,19620253 -19,335443 4,30379747 6,09493671 8,89873418 2,75949367 -7,91139241 -1,75949367 -1,98734177 9,58227848 5,63291139 10,2405063 -1,63291139 -23,8227848

Los cuadrados de dichas diferencias son: (Cuadro C) 537,770229 65,2209582 691,224003 8,5500721 62,3900016 0,00100144 20,3640843 86,2076991 4,05079314 139,628625 22,4724003 17,6081157 373,859357 18,5226726 37,1482535 79,18747 7,61480532 62,5901298 3,09581798 3,94952732 91,8200609 31,7296908 104,86797 2,66639962 567,525076

Las razones (divisiones) entre el cuadrado de la diferencia (Cuadro C) y la frecuencia esperada (Cuadro A) para cada caso son:

Prof. F. Nievas

PSICOESTADSTICA II (Cuadro D) 49,746897 2,7261671 16,74025 0,4730082 3,4857215 8,367E-05 0,7688233 1,8857562 0,2024116 7,046095 1,7638546 0,6244854 7,6823746 0,8694541 1,7610034 5,6974592 0,2475595 1,1789748 0,1332079 0,1716241 7,927634 1,2378497 2,3704062 0,1376768 29,593717

La sumatoria de estos trminos (todas las celdas del Cuadro D) es 144,472496. Para comparar con la tabla tenemos que calcular los grados de libertad (df). Para ello cuento las columnas y las filas que tiene el cuadro. df = (c 1) (f 1) = (5 1) (5 1) = 4 . 4 = 16
Material exclusivo para el IES N 1 A. Moreau de Justo

En la tabla D observo que para = 0.05 y df = 16 el valor que corresponde es 26,296. Es inferior al que me arroj el clculo de 2; por tal razn, debo rechazar la hiptesis nula (H0). Se confirma as la hiptesis de trabajo (H1).

COMENTARIOS ADICIONALES

Obsrvese que hemos utilizado variables ordinales (en el primer ejemplo) y nominales (en el segundo). En ambos casos el 2 nos ofrece, de igual modo, una respuesta acerca de la asociatividad de las mismas. A qu se debe esto? A que esta prueba no nos indica si la asociacin tiene algn sentido estipulado, 2 sino nicamente si existe o no asociacin, dentro de los lmites de seguridad fijados por nosotros mismos al establecer el nivel de significacin. Con esto queremos decir que el orden en que se presenten los datos en las variables es indistinto, ya que al sumar todas las diferencias cuadrticas, eliminamos cualquier referencia a ese orden inicial. Por eso 2 es una prueba especialmente adecuada para las variables nominales, pese a que se la puede usar tambin con las ordinales. Para comprobar esto vemos que si cambiamos el orden de las categoras del ltimo ejemplo, en nada vara el resultado final, ya que las celdas cambiarn de ubicacin,

Vase direccin de la asociacin en la Unidad 3.

Prof. F. Nievas

PSICOESTADSTICA II pero los marginales sern los mismos, aunque en distinto orden. De modo tal, que el resultado final seguir siendo el mismo.

Material exclusivo para el IES N 1 A. Moreau de Justo

Prof. F. Nievas

Você também pode gostar