Escolar Documentos
Profissional Documentos
Cultura Documentos
Como ya sabemos la metodología estadística depende del tipo de variable(s) que estemos
analizando. A menudo nos va a interesar describir la relación o asociación entre dos o más
variables cualitativas. En este capítulo vamos a estudiar cómo describir y analizar dos variables
cualitativas.
Recuerde que las variables cualitativas son variables cuyas observaciones son cualidades o
categorías. Algunas variables son cualitativas por natulareza, tal como sexo, religión u ocupación,
otras se convierten en categóricas después de que, a partir de una variable cuantitativa,
clasificamos las respuestas en categorías. Por ejemplo, medimos el peso de recién nacidos en
kilos y luego los clasificamos como "bajo peso" a los que nacen con menos de 2,5 kilos, "normal"
a los que nacen entre 2,5 y 4,5 kilos y "sobrepeso" a los que nacen con más de 4,5 kilos.
Definición:
Una tabla de contingencia es una tabla donde los individuos de una muestra se clasifican en
función de dos variables cualitativas.
Nota: las tablas de contingencia se conocen también como: tablas de doble entrada, tablas de
asociación o tablas de f x c, donde f es el número de filas y c el número de columnas en la tabla.
El término tabla de contingencia se refiere a que las tablas construidas se usan para contrastar
una asociación o relación entre dos variables. Usaremos tablas de contingencia para describir dos
variable cualitativas. Veremos que la asociasión entre dos variables se puede describir mejor
calculando apropiadamente los porcentajes y usando gráficos de barras.
Estado Nutricional
Malo Regular Bueno TOTAL
Bajo 130 95 30 255
Rendimiento
Promedio 90 450 35 575
Académico
Sobre 70 30 70 170
TOTAL 290 575 135 1000
Página 2 de 5
Estado Nutricional
Malo Regular Bueno Total
Porcentaje 29,0% 57,5% 13,5% 100%
Ejemplo
Calcule la distribución marginal del rendimiento académico.
Rendimiento Académico
Bajo Promedio Sobre Total
Definiciones:
La asociación entre dos variables cualitativas se presenta calculando algunos de los porcentajes
en la forma de distribución condicional.
Estado Nutricional
Malo Regular Bueno
Bajo 44,8 16,5 22,2
Rendimiento
Promedio 31,1 78,3 25,9
Académico
Sobre 24,1 5,2 51,9
TOTAL 100% 100% 100%
Página 3 de 5
Definiciones:
Si una variable es considerada como variable explicatoria y la otra como variable respuesta,
entonces debemos analizar la distribución condicional de la variable respuesta, dada la variable
explicatoria.
Ejemplo
Degustando cervezas
El Famoso Pub elabora y distribuye cervezas de tres tipos: suave, regular y negra. Para investigar
la relación entre género y preferencia de cerveza selecciona una muestra de 450 bebedores de
cerveza. Después de probar los tres tipos de cerveza se les preguntó su preferencia y se resumió
la información en la siguiente tabla:
Preferencia cerveza
Suave Regular Negra
Hombre 60 120 60
Sexo
Mujer 90 90 30
Preferencia cerveza
Suave Regular Negra
Hombre
Sexo
Mujer
c) Basado en sus cálculos en (b) debería el "Famoso Pub" iniciar una campaña con todas sus
cervezas o debería diferenciar la promoción entre hombres y mujeres.
Página 4 de 5
Ejemplo
Perfil cardiovascular
En el año 2005 un grupo de investigadores de la U. de Talca, realizan una encuesta sobre perfil
cardiovascular en la ciudad de Talca1. Se tiene una muestra de personas entre 18 y 74 años. Una
de las preguntas de interés fue investigar si: ¿Existe asociación entre el hábito de fumar y la
edad?
En SPSS
Recuento
Categorías de edad
18-24 25-44 45-64 65-74 Total
Fuma No 35 181 191 63 470
Si 30 192 131 15 368
Total 65 373 322 78 838
Categorías de edad
18-24 25-44 45-64 65-74 Total
Fuma No Recuento 35 181 191 63 470
% de Categorías de edad 53.8% 48.5% 59.3% 80.8% 56.1%
Si Recuento 30 192 131 15 368
% de Categorías de edad 46.2% 51.5% 40.7% 19.2% 43.9%
Total Recuento 65 373 322 78 838
% de Categorías de edad 100.0% 100.0% 100.0% 100.0% 100.0%
1
Encuesta realizada por el Programa de Investigación de Factores de Riesgo de Enfermedades Cardiovasculares
http://pifrecv.utalca.cl/
Página 5 de 5
Gráfico de barras
Fuma
200
No
Si
150
Recuento
100
50
0
18-24 25-44 45-64 65-74
Categorías de edad
Test de hipótesis:
H 0 : No existe asociación
H1 : Existe asociación
Con el programa SPSS podemos calcular el valor-p para el test de asociación, que aparece bajo el
título de “Significancia”. El valor-p es menor que 0,001, indicando que existe una asociación
estadísticamente significativa entre fumar y la edad, al 5%.
Pruebas de chi-cuadrado
Sig. asintótica
Valor gl (bilateral)
Chi-cuadrado de Pearson 29.449a 3 .000
Razón de verosimilitudes 31.270 3 .000
Asociación lineal por
20.762 1 .000
lineal
N de casos válidos 838
a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mínima esperada es 28.54.