Você está na página 1de 9

Jess Reynaga Obregn

91
Prueba de asociacin de dos variables cualitativas

Descripcin

Esta prueba se aplica en diseos de investigacin en los que se estudia a un nico grupo de individuos
donde a cada uno de ellos se han medido simultneamente dos variables cualitativas.

El resultado del recuento de ambas variables se vaca en las celdillas de una tabla compuesta por
renglones y columnas a la que se llama tabla de contingencia o de doble entrada.

La prueba compara la distribucin de frecuencias observada en las celdillas (Fo) con una distribucin
terica llamada distribucin de frecuencias esperada (Fe)

El procedimiento de la prueba incluye el clculo de la distribucin de frecuencias terica o esperada (Fe).
Esta distribucin representa la forma en que quedaran repartidas las frecuencias en las celdillas de la
tabla de contingencia, bajo la suposicin de que ambas variables no se asocian.

El propsito de la prueba es averiguar si existen diferencias estadsticamente significativas entre la
distribucin observada (Fo) y la distribucin esperada (Fe).

En la prueba se plantean las siguientes hiptesis estadsticas:

Hiptesis estadstica nula: Ho: Fo = Fe
Hiptesis estadstica alterna: Ha: Fo Fe

El procedimiento de la prueba incluye el clculo de la medida de resumen llamada Chi cuadrada. El
rechazo de la Ho ocurre cuando el valor calculado con los datos resulta mayor que el valor crtico de
dicha medida contenido en una tabla llamada Valores Crticos de Chi cuadrada. En el caso de que se
haya podido rechazar a la Ho, se dice que existe asociacin entre las dos variables medidas al grupo de
individuos.

En el caso de que el valor de Chi cuadrada calculada sea igual o menor al de Chi cuadrada crtica se dice
que no se rechaza a la Ho y, por tanto, se concluye que la Fo es semejante a la Fe. Por lo anterior, se
concluye que no parece existir asociacin entre las dos variables estudiadas en el grupo de individuos.

Ejemplo desarrollado

A un grupo de 90 estudiantes de estudiantes de licenciatura le fueron medidas simultneamente dos
variables cualitativas: orientacin poltica de sus padres y tipo de educacin primaria recibida. A las
variables correspondieron las siguientes escalas de modalidades:


Orientacin poltica
de los padres
Tipo de educacin
primaria recibida
Conservadora Rgida
Moderada Moderada
Liberal Flexible

Jess Reynaga Obregn


92

A continuacin se muestra un listado parcial de la base de datos:


Estudiante
No.
Orientacin poltica
de los padres
Tipo de educacin
primaria recibida
1 Conservadora Rgida
2 Conservadora Rgida
3 Liberal Rgida
4 Moderada Liberal
. . .
. . .
87 Liberal Flexible
88 Moderada Moderada



A partir de la base de datos se contaron los casos y se acomodaron en una tabla como la siguiente:


Frecuencias observadas (Fo)

Tipo de educacin primaria recibida Totales
Orientacin
poltica de los
padres
Rgida Moderada Flexible
Conservadora 15 10 7 32
Moderada 10 10 10 30
Liberal 5 9 14 28
Totales 30 29 31 90


Por contar con tres renglones y tres columnas para los datos, la tabla tuvo nueve celdillas para anotar la
distribucin observada de los casos (Fo). En la tabla se encontr que entre los estudiantes cuyos padres
tenan orientacin poltica conservadora hubo predominio de educacin primaria de tipo rgida; por otro
lado, entre los estudiantes cuyos padres tenan orientacin poltica liberal predomin la educacin de tipo
flexible; finalmente, se observ que no haba predominio de algn tipo de educacin primaria entre los
estudiantes cuyos padres tenan orientacin poltica de tipo moderada.

En trminos coloquiales podra decirse que a orientacin poltica conservadora correspondi educacin
rgida y que a orientacin poltica liberal correspondi educacin flexible.

Se supuso que, en el caso de que no existiera ninguna asociacin entre la orientacin poltica de los
padres y el tipo de educacin primaria recibida por los estudiantes, la distribucin de los alumnos no
habra mostrado la tendencia recin descrita.

Jess Reynaga Obregn


93
Para efectuar un contraste entre la distribucin observada (Fo) y la distribucin esperada bajo la
suposicin de que no existiera asociacin (Fe) se efectu el clculo de esta ltima distribucin. A
continuacin se muestran los resultados del clculo de la Fe:


Frecuencias esperadas bajo la suposicin de no asociacin (Fe)


Tipo de educacin primaria recibida Totales
Orientacin
poltica de los
padres
Rgida Moderada Flexible
Conservadora 11 10 11 32
Moderada 10 10 10 30
Liberal 9 9 10 28
Totales 30 29 31 90



El clculo de la frecuencia esperada para cada una de las celdillas se hizo con la siguiente frmula:


( ) tmr (tmc)
e
tt
=

donde:
e = frecuencia esperada para una celdilla determinada
tmr = total marginal del rengln de dicha celdilla
tmc = total marginal de la columna de la misma celdilla
tt = total de casos de toda la tabla

Obsrvese cmo se efectu el clculo de la frecuencia esperada (e) para la celdilla superior izquierda
que, de momento, solo contiene a la frecuencia observada (o):


15 10 7 32
10 10 10 30
5 9 14 28
30 29 31 90



tmr de la celdilla = 32; tmc de la celdilla = 30 tt o gran total = 90

e para la celdilla =
( ) ( )
( )
( ) ( )
( )
32 30
10.7 11
90
tmr tmc
tt
= =



Jess Reynaga Obregn


94
De la misma manera se procedi a calcular las frecuencias esperadas para cada una de las dems
celdillas. Las frecuencias esperadas se anotaron entre parntesis junto a la correspondiente frecuencia
observada de la siguiente manera:


15

(11)
10

(10)
7

(11)
32

(32)
10

(10)
10

(10)
10

(10)
30

(30)
5

(9)
9

(9)
14

(10)
28

(28)
30

(30)
29

(29)
31

(31)
90

Al comparar, celdilla por celdilla, las frecuencias o con las frecuencias e se encontr que algunas veces
haba notables diferencias.

Con el propsito de disponer de una medida de resumen que pudiera sintetizar en una sola cifra las
diferencias encontradas, se calcul el valor de la medida llamada Chi cuadrada o tambin Ji cuadrada,
que se simboliza de la siguiente manera
2

, y cuya frmula es la siguiente:



( )
2
2
o e
e


=

Donde:

: Letra griega sigma que indica sumar todas las expresiones del siguiente tipo
o
: Cada frecuencia observada
e
: cada frecuencia esperada



para el caso que se est ejemplificando, los clculos fueron como sigue:

( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
2 2 2 2
2 2 2
15 11 10 10 7 11 10 10
5 9 9 9 14 10
10 10 9 9 10
11 10 11 10
2 2
10 10 10 10


+ + + + + + + +



As, el resultado del clculo fue:
( )
2
2
6.3
o e
e


= =


Jess Reynaga Obregn


95
Se dedujo que si cada una de las frecuencias observadas o hubiera sido idntica a su correspondiente
frecuencia esperada e, entonces cada diferencia hubiera valido 0 (cero). Si ello hubiera ocurrido, cada
diferencia elevada al cuadrado tambin hubiera valido cero, por tanto cada expresin
( )
2
o e
e


tambin hubiera valido cero y, finalmente, el valor de su suma, es decir, el valor de Chi cuadrada hubiera
sido cero.

El valor calculado no fue cero, sino 6.3; por lo tanto se decidi que deba buscarse un valor crtico que, al
ser rebasado, indicara que la serie completa de frecuencias observadas Fo y la serie completa de
frecuencias esperadas Fe eran significativamente diferentes entre s. Para ello se recurri a un libro en
donde localiz una tabla de la que se muestra un fragmento en seguida:

Fragmento de la tabla de valores crticos de
2



Grados de libertad
Valores crticos al nivel
de significancia de 0.05
1 3.84
2 5.99
3 7.81
4 9.49
5 11.07

100 124.34
En el mismo libro, se encontr que el rengln de la columna llamada Grados de libertad en donde deba
localizarse el valor crtico por rebasar corresponda a la operacin siguiente:
Grados de libertad (G.L.) = (Columnas -1) (Renglones 1)

En vista de que la tabla de contingencia con los datos tena tres renglones y tres columnas, el resultado
de la operacin fue el siguiente:
Grados de libertad (G.L.) = (3 -1) (3 1) = (2) (2) = 4

Al encontrar que el valor calculado de Chi cuadrada (6.3) no rebasaba al valor crtico de Chi cuadrada
(que era de 9.49) se concluy que no haba una diferencia estadsticamente significativa entre la
distribucin de frecuencias observadas con la distribucin de frecuencias esperadas; es decir; que la idea
de que Fo era igual a Fe (Fo = Fe) no podra rechazarse.

En toda prueba de anlisis estadstico la suposicin de igualdad se llama hiptesis estadstica nula, que
en este caso se simboliz de la siguiente forma: Ho: Fo = Fe; por otra parte, la suposicin de diferencia
se llama hiptesis estadstica alterna, que en este caso se simboliz as: Ha: Fo Fe.

Recordando que la distribucin esperada Fo representa la suposicin de que ambas variables no estn
asociadas y, considerando que no se pudo rechazar a la Ho: Fo = Fe, se concluy que no pareca haber
Jess Reynaga Obregn


96
asociacin entre la orientacin poltica de los padres y el tipo de educacin primaria que recibieron los
estudiantes.

La anterior conclusin fue redactada as: No se rechaz a la Ho (p > 0.05).
Procedimiento

1. Confirmar que el propsito del estudio consiste en evaluar la asociacin entre dos variables
cualitativas medidas a un grupo de individuos.

2. Luego de efectuar el recuento de los datos, disponer la distribucin de frecuencias observadas
(Fo) en una tabla de contingencia.

3. Mediante la frmula
( ) tmr (tmc)
e
tt
= aplicada celdilla por celdilla, calcular la distribucin
esperada bajo la suposicin de no asociacin (Fe) y anotar los resultados de los clculos en la
misma tabla de contingencia. Las sumas horizontales y verticales de las distribuciones Fo y Fe
deben ser idnticas.
4. Mediante la frmula
( )
2
2
o e
e


=
determinar el valor de Chi cuadrada calculada.
5. Comparar el valor de Chi cuadrada calculada con el valor de Chi cuadrada crtica, usando una
tabla de valores crticos. Identificar el rengln de los grados de libertad (G.L.) correspondientes al
nmero de columnas y de renglones de la tabla de contingencia mediante la frmula
G.L. = (C 1) (R 1), donde C corresponde al nmero de columnas y R al nmero de
renglones.

6. En caso de que el valor de Chi cuadrada calculada rebase al valor crtico de la tabla, rechazar a
la hiptesis estadstica nula Ho sealando que el nivel de significancia fue de 0.05; usualmente
se acostumbra redactar lo anterior de la siguiente forma: se rechaz Ho con una p < 0.05; en
caso de que el valor calculado haya sido igual o no hubiera rebasado al valor crtico se seala
que no fue posible rechazar la Ho.

7. De acuerdo al paso anterior, establecer la conclusin referente a si ambas variables parecen
tener una asociacin significativa o no.

Problema resuelto

Los siguientes datos fueron recogidos por un investigador:


Casos de desempeo escolar deficiente segn exposicin crnica al plomo

Desempeo deficiente Exposicin
crnica SI NO
SI 42 11 53
NO 13 38 51
55 49 104
Jess Reynaga Obregn


97
El investigador observ que de los 53 individuos expuestos crnicamente al plomo 42 (79%) presentaron
desempeo escolar deficiente, mientras que de los 51 no expuestos solo 13 (26%) tuvieron desempeo
escolar deficiente; a su juicio, lo anterior pareca demostrar que exista una intensa asociacin entre
ambas variables

Con el propsito de imaginar cul hubiera sido la distribucin de los datos suponiendo que no existiera
ninguna asociacin entre las variables, decidi calcular la distribucin de frecuencias que se esperara
encontrar bajo dicha suposicin. Para ello us la frmula
( ) tmr (tmc)
e
tt
= en todas y cada una de las
celdillas de la tabla de contingencia y anot sus resultados entre parntesis en la siguiente tabla


Desempeo deficiente Exposicin
Crnica SI NO
SI
42

(28.0288)
11

(24.9712)
53

(53)
NO
13

(26.9712)
38

(24.0288)
51

(51)

55

(55)
49

(49)
104


Al observar que la distribucin que observ no era de ninguna manera semejante a la que se esperara
bajo la suposicin de no asociacin decidi determinar el valor de Chi cuadrada calculada mediante la
siguiente frmula:
( )
2
2
o e
e


=


Sus clculos produjeron el siguiente resultado:

( ) ( ) ( ) ( )
2 2 2 2
42 28.0288 11 24.9712 13 26.9712 38 24.0288
28.0288 24.9712 26.9712 24.0288
30.14

+ + + =


Aunque el valor de Chi cuadrada calculada le pareci suficientemente grande, el investigador opt por
compararlo con un valor crtico que, si era rebasado por el valor calculado, le permitira concluir que la
distribucin observada (Fo) no era semejante a la distribucin esperada (Fe)

En realidad, lo que el investigador estaba haciendo era probar las siguientes hiptesis estadsticas:

Hiptesis estadstica nula: Ho: Fo = Fe
Hiptesis estadstica alterna: Ha: Fo Fe
Jess Reynaga Obregn


98
El investigador encontr la siguiente tabla de valores crticos:

Fragmento de la tabla de valores crticos de
2



Grados de libertad
Valores crticos al nivel
de significancia de 0.05
1 3.84
2 5.99
3 7.81
4 9.49
5 11.07

100 124.34

Para ubicar el rengln correspondiente a los grados de libertad de su tabla de contingencia us la
siguiente frmula: Grados de libertad (G.L.) = (Columnas -1) (Renglones 1) = ( 2-1 ) ( 2-1 ) = 1

En virtud de que el valor crtico de Chi cuadrada correspondiente a un grado de libertad era 3.84 y de
que dicho valor era ampliamente rebasado por el valor de Chi cuadrada calculada (30.14), el investigador
concluy que podra rechazar a la hiptesis estadstica nula.

En el reporte de su estudio, el investigador escribi lo siguiente: para los 104 individuos estudiados, se
encontr asociacin estadsticamente significativa entre la exposicin crnica al plomo y el
desempeo escolar deficiente (p < 0.05). El smbolo entre parntesis se refiere a que existe un riesgo
de equivocarse al asegurar que existe dicha asociacin de un tamao menor a 0.05 (o, en porcentaje,
menor al 5%).

Problemas a resolver

Problema 1 Se asocian ambas variables?

Levantadores de pesas segn rgimen de entrenamiento y capacidad aerbica

Capacidad aerbica
Rgimen de
entrenamiento Mnima Regular Suficiente
Ligero 23 19 16
Moderado 14 17 15
Intenso 13 16 22

Jess Reynaga Obregn


99
Problema 2 Cul alimento se asoci con la diarrea?




Ingestin Presentacin de diarrea
de sopa NO SI Totales

NO

102

15


117

SI

51

192

243

153 207



Ingestin Presentacin de diarrea
de arroz NO SI Totales

NO

84

108

192

SI

69

99

168
153 207



Ingestin
de
Presentacin de diarrea
Mole NO SI Totales

NO

33

105

138

SI

120

102

222
153 207

Você também pode gostar