Escolar Documentos
Profissional Documentos
Cultura Documentos
La prueba del 2 se usa para variables de distintos niveles de medicin, incluyendo las de menor nivel, que son las nominales. Sirve para determinar si los datos obtenidos de una sola muestra presentan variaciones estadsticamente significativas respecto de la hiptesis nula. Cuando formulamos una hiptesis de trabajo, simultneamente definimos la hiptesis nula, que niega nuestra hiptesis de trabajo. De acuerdo a la hiptesis nula (H0) las variaciones en la variable independiente no tienen correspondencia con las variaciones que pudiere haber de la variable dependiente. Es decir que existe independencia estadstica. 1 Las variaciones que pudiese encontrarse se deberan a factores
Material exclusivo para el IES N 1 A. Moreau de Justo
aleatorios, ajenos a la variable independiente. Para comprobar si esto es as (y, por lo tanto, deberamos aceptar la H0) o no (y, por ende, rechazarla), podemos someter los resultados obtenidos de nuestra muestra a una prueba de 2, que se postula con la siguiente ecuacin:
2 =
(fe fo)2 fe
Se trata de la razn entre la sumatoria de los cuadrados de las diferencias entre las frecuencias esperadas (fe) y las frecuencias observadas (fo) respecto de las frecuencias esperadas (fe). Como toda razn, expresa una proporcin; en este caso, la proporcin entre las distancias observadas (elevadas al cuadrado) y las frecuencias esperadas. Pero la aplicacin del chi cuadrado no se puede hacer directamente. Es necesario, antes de ello, realizar dos pasos. Por una parte, establecer el nivel de significacin () con el cual vamos a trabajar, y determinar los grados de libertad de nuestra muestra. El nivel de significacin es arbitrario y se fija de antemano (usualmente entre 0.01 y 0.10, siendo el ms usado el de 0.05). Los grados de libertad se establecen en funcin de la cantidad de celdas que tenemos, producto de las categoras de una variable o bien de la cantidad resultante del cruce de dos variables.
Vase Unidad 3.
Prof. F. Nievas
PSICOESTADSTICA II
GRADOS DE LIBERTAD
Esta nocin se refiere a la posibilidad que se tiene de establecer, en una distribucin dada, valores arbitrarios sin modificar el marginal de dicha distribucin. As, en una variable con cinco categoras, podr establecer cuatro valores de manera arbitraria, ya que el quinto quedar determinado por la diferencia entre la sumatoria de los cuatro que establezco, y el marginal. Cuando tengo una variable, la frmula para calcular los grados de libertad es df = k 1 siendo k el nmero de categoras que tengo.
Material exclusivo para el IES N 1 A. Moreau de Justo
Las frecuencias esperadas (fe) vienen dadas por la hiptesis nula (H0), pero no siempre se puede establecer de manera inmediata. Esto solo es posible cuando trabajamos con
Prof. F. Nievas
PSICOESTADSTICA II una variable, pero cuando tenemos cuadros de doble entrada la forma de establecer el valor de la frecuencia esperada de cada celda es el siguiente:
Categora 1 a d g (a+d+g)
Categora 2 b e h (b+e+h)
Categora 3 c f i (c+f+i)
Clculo de la frecuencia esperada (fe) para la celda b (b+e+h) (a+b+c) N Clculo de la frecuencia esperada (fe) para la celda c (c+f+i) (a+b+c) N Clculo de la frecuencia esperada (fe) para la celda d (a+d+g) (d+e+f) N Clculo de la frecuencia esperada (fe) para la celda e (b+e+h) (d+e+f) N Clculo de la frecuencia esperada (fe) para la celda f (c+f+i) (d+e+f) N Clculo de la frecuencia esperada (fe) para la celda g (a+d+g) (g+h+i)
Prof. F. Nievas
PSICOESTADSTICA II N Clculo de la frecuencia esperada (fe) para la celda h (b+e+h) (g+h+i) N Clculo de la frecuencia esperada (fe) para la celda i (c+f+i) (g+h+i) N Como puede observarse, el procedimiento es bien sencillo. Se trata de la razn entre el producto de los marginales de la celda considerada y el total (N).
Material exclusivo para el IES N 1 A. Moreau de Justo
Una vez que se obtiene el resultado de la ecuacin, el nmero arrojado no tienen significacin por s mismo. En realidad lo obtenido es un parmetro para establecer la validez o no de mi hiptesis de trabajo. Si se observa la frmula de 2 (fe fo)2 fe puede notarse que cuanto mayor es la diferencia entre las frecuencias observadas y las esperadas (fo y fe respectivamente), mayor ser el numerador [ (fe fo)2] y, consecuentemente, tambin ser mayor nmero que se obtenga. Una mayor diferencia indica, por otra parte, que es menos probable que las mismas se deban puramente al azar (que es lo que indicara la Ho). Por esta razn, cuanto mayor sea el nmero obtenido, ms probable es que podamos rechazar la hiptesis nula. Decamos que el nmero obtenido es simplemente un parmetro, es decir, un punto para comparar. Y contra qu lo debemos comparar? Contra la tabla D, que es la distribucin del 2. Para ello debemos considerar los grados de libertad (df) y el nivel de significacin () que hemos elegido. En los cabezales de las columnas de la tabla D
2 =
Prof. F. Nievas
PSICOESTADSTICA II encontramos los niveles de significacin, y en las filas, los grados de libertad. Cruzando ambos (columna y fila) llegamos a una celda con un nmero determinado. Si el nmero que nosotros obtenemos mediante el clculo de 2 es igual o mayor (= >) al que figura en la tabla, rechazamos la hiptesis nula (Ho) y validamos, en consecuencia, nuestra hiptesis de trabajo (H1). Si, por el contrario, es inferior, debemos aceptar la hiptesis nula (Ho), quedando invlida nuestra hiptesis de trabajo (H1). Nmero obtenido de > Nmero de la tabla Nmero obtenido de 2 = Nmero de la tabla Nmero obtenido de 2 < Nmero de la tabla
2
Lectura Rechazo Ho. Acepto H1 Rechazo Ho. Acepto H1 Acepto Ho. Rechazo H1
CLCULO DE 2
Vamos a ver prcticamente cmo se calcula el 2. Tomaremos dos ejemplos, para una y ms de una muestra.
Suponemos que los compradores en los shoppings pertenecen a las clases altas de la sociedad. Para eso tomamos una muestra de 50 casos, de manera aleatoria, a quienes indagamos sobre su pertenencia social (para ello debemos tener un instrumento que nos permita inferir a qu clase social pertenecen). Los resultados nos arrojan lo siguiente: Clase fo Baja 8 MediaBaja 9 Media 10 MediaAlta 11 Alta 12
Para saber si el resultado obtenido es estadsticamente significativo sometemos esta muestra a una prueba de 2. La hiptesis nula queda formulada de la siguiente manera: los compradores en los shoppings no pertenecen a una clase social especfica, en razn de la cual, las frecuencias esperadas han de ser de 10 casos para cada celda (si la clase social no influye, no debe haber variacin en una muestra tomada al azar, y si tal variacin existe, sta se debe a cuestiones contingentes, y no a una tendencia).
Prof. F. Nievas
PSICOESTADSTICA II El nivel de significacin que escogemos es = 0.05; procedemos, en consecuencia, a realizar el clculo de 2. Clase fo fe fe fo (fe fo)2 Baja 8 10 -2 4 MediaBaja 9 10 -1 1 Media 10 10 0 0 MediaAlta 11 10 1 1 Alta 12 10 2 4
La sumatoria [ ] de las diferencias al cuadrado [(fe fo)2] es = 4+1+0+1+4. Reemplazando los trminos obtenemos la siguiente ecuacin:
(fe fo)2 fe
= 10
10 =1
Estamos trabajando con 4 grados de libertad (k = 51), y el = 0.05; observamos en la tabla D el valor que corresponde a df = 4 y = 0.05 y el mismo es 9,488. Dado que 1 (el nmero obtenido) es inferior (<) al que figura en la tabla, aceptamos la hiptesis nula. Nmero obtenido de 2 < Nmero de la tabla 1 < 9,488 Acepto Ho. Rechazo H1 Acepto Ho. Rechazo H1
Tenemos que decir, en consecuencia, que los compradores en shoppings no pertenecen a una clase social especfica, y que las variaciones que encontramos (8, 9, 10, 11, 12) se deben exclusivamente al azar.
Suponemos que la ideologa poltica influye en la eleccin de los medios de prensa que se leen. En razn de ello, suponemos que la gente de derecha escoge La Prensa, que los de centro derecha leen La Nacin, lo de centro leen Clarn, los de centro izquierda leen Pgina/12 y los de izquierda Le Monde Diplomatique. Para ello construimos un instrumento que nos permite establecer la ideologa, y tomamos una muestra al azar, obteniendo el siguiente resultado.
Prof. F. Nievas
PSICOESTADSTICA II Derecha La Prensa La Nacin Clarn Pgina/12 Le Monde Total 34 32 15 21 10 112 Centroderecha 12 31 55 18 8 124 Centro 8 24 68 17 15 132 Centroizquierda 5 28 61 25 25 144 Izquierda 2 20 34 21 43 120 Total 61 135 233 102 101 632
Decidimos trabajar con un = 0.05. Con el procedimiento descrito anteriormente determinamos las frecuencias esperadas, de modo que nos quedan de la siguiente manera: (Cuadro A) Derecha
Material exclusivo para el IES N 1 A. Moreau de Justo
La diferencia entre las fo y las fe es: (Cuadro B) -23,1898734 -8,07594937 26,2911392 -2,92405063 7,89873418 -0,03164557 -4,51265823 -9,28481013 2,01265823 11,8164557 4,74050633 4,19620253 -19,335443 4,30379747 6,09493671 8,89873418 2,75949367 -7,91139241 -1,75949367 -1,98734177 9,58227848 5,63291139 10,2405063 -1,63291139 -23,8227848
Los cuadrados de dichas diferencias son: (Cuadro C) 537,770229 65,2209582 691,224003 8,5500721 62,3900016 0,00100144 20,3640843 86,2076991 4,05079314 139,628625 22,4724003 17,6081157 373,859357 18,5226726 37,1482535 79,18747 7,61480532 62,5901298 3,09581798 3,94952732 91,8200609 31,7296908 104,86797 2,66639962 567,525076
Las razones (divisiones) entre el cuadrado de la diferencia (Cuadro C) y la frecuencia esperada (Cuadro A) para cada caso son:
Prof. F. Nievas
PSICOESTADSTICA II (Cuadro D) 49,746897 2,7261671 16,74025 0,4730082 3,4857215 8,367E-05 0,7688233 1,8857562 0,2024116 7,046095 1,7638546 0,6244854 7,6823746 0,8694541 1,7610034 5,6974592 0,2475595 1,1789748 0,1332079 0,1716241 7,927634 1,2378497 2,3704062 0,1376768 29,593717
La sumatoria de estos trminos (todas las celdas del Cuadro D) es 144,472496. Para comparar con la tabla tenemos que calcular los grados de libertad (df). Para ello cuento las columnas y las filas que tiene el cuadro. df = (c 1) (f 1) = (5 1) (5 1) = 4 . 4 = 16
Material exclusivo para el IES N 1 A. Moreau de Justo
En la tabla D observo que para = 0.05 y df = 16 el valor que corresponde es 26,296. Es inferior al que me arroj el clculo de 2; por tal razn, debo rechazar la hiptesis nula (H0). Se confirma as la hiptesis de trabajo (H1).
COMENTARIOS ADICIONALES
Obsrvese que hemos utilizado variables ordinales (en el primer ejemplo) y nominales (en el segundo). En ambos casos el 2 nos ofrece, de igual modo, una respuesta acerca de la asociatividad de las mismas. A qu se debe esto? A que esta prueba no nos indica si la asociacin tiene algn sentido estipulado, 2 sino nicamente si existe o no asociacin, dentro de los lmites de seguridad fijados por nosotros mismos al establecer el nivel de significacin. Con esto queremos decir que el orden en que se presenten los datos en las variables es indistinto, ya que al sumar todas las diferencias cuadrticas, eliminamos cualquier referencia a ese orden inicial. Por eso 2 es una prueba especialmente adecuada para las variables nominales, pese a que se la puede usar tambin con las ordinales. Para comprobar esto vemos que si cambiamos el orden de las categoras del ltimo ejemplo, en nada vara el resultado final, ya que las celdas cambiarn de ubicacin,
Prof. F. Nievas
PSICOESTADSTICA II pero los marginales sern los mismos, aunque en distinto orden. De modo tal, que el resultado final seguir siendo el mismo.
Prof. F. Nievas