Escolar Documentos
Profissional Documentos
Cultura Documentos
CONTINGENCIAS
Hempler Orlando Barragn Vsquez
Departamento de Estadstica - Facultad de Ciencias - Universidad Nacional de Colombia
Ensennza de la Estadstica
Bogot, Colombia
15 de Abril de 2014
Resumen
1. Introduccin
Abstract
An analysis of musical tastes were performed according
to the sex of the students in the class of Teaching Statistics
from the National University of Colombia. At this point
is to establish whether there is a relationship between
the sex of the students and their musical taste. The sex
variable is nominal and has two categories of observation
(Male and Female). The variable musical taste is observed
in categories (Romantic, Techno, Tropical) by romantic
ballads, boleros, bambucos, pasillos means; considered
techno rock, reggaeton; have tropical cumbia, vallenato
and salsa. The analysis includes using bivariate contingency or summarizing the measures corresponding to two
variables in the same element of a sample data tables.
Keywords: Relationship categories, variable, bivariate
tables, crosstabs
2. Procedimiento
Para la toma de datos se suministraron dos tablas de
contingencia y se asumi una muestra de 50 personas entre
hombres y mujeres mayores de 18 aos. Para la primera
tabla se diligenci asumiendo una relacin entre las variables sexo y gusto musical (ver cuadro 1). La segunda tabla
se registr el clculo de las frecuencias esperadas, bajo el
supuesto de que no hay relacin entre las variables sexo y
gusto musical (ver cuadro 2). Se procedi a calcular las
diferencias entre las frecuencias observadas (amarillo) y
las frecuencias esperadas (azul)(ver cuadro 3). Finalmente,
se calcul le estadstico para la distribucin Chi-cuadrado
(ver cuadro 4).
4. Resultados
Cuadro 1: Tabla de frecuencias observadas
Sexo
Femenino
Masculino
Total
Romntica
14
3
17
Msica
Tecno
6
11
17
Tropical
Total
10
6
16
30
20
50
(Oi Ei )2
i=1
Ei
Este estadstico tiene una distribucin Chicuadrado con k-1 grados de libertad si n es suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la
Romntica
Sexo
Femenino
Masculino
Total
Msica
Tecno
10,2
6,8
17
Tropical
Total
9,6
6,4
16
30
20
50
10,2
6,8
17
Sexo
Femenino
Masculino
Romntica
3,8
-3,8
Msica
Tecno
4,2
-4,2
Tropical
0,4
-0,4
En este caso los grados de libertad (gl = 2) y asumiendo un nivel de significacin ( = 0, 05), cuyo valor
asociado en la tabla de probabilidades para Chi-cuadrado
es de 5, 99.
Sexo
Femenino
Masculino
Total
Romntica
Msica
Tecno
1,4157
2,1235
3,5392
1,7294
2,5941
4,3235
Tropical
Total
0,0167
0,0250
0,0417
3,1618
4,7426
7,9044
5. Anlisis Estadstico
La indenpendencia de dos variables en que la distribucin de una de las variables es similar sea cual sea el nivel
que examinemos de la otra.
La prueba Chi-cuadrado contrasta la hiptesis nula de
que las variables son independientes, frente a la hiptesis
alternativa de que una variable se distribuye de modo diferente para diversos niveles de la otra.
6. Conclusiones
El procedimiento empleado de las tablas de contingencia de manera descriptiva nos permite realizar tablas en las
que se detallen las categoras de una variable a travs de las
categoras de una segunda variable, sin involucrar las pruebas estadsticas de asociacin e independencia. Adicionalmente este procedimiento nos permite generar grficos de
barras con las variables involucradas en la tabla. Para poder determinar si existe una relacin entre dos variables no
basta con los porcentajes o los recuentos. La relacin debe
ser comprobada mediante pruebas estadsticas de asociacin de independencia como el Chi-cuadrado; esta prueba
nos permiten comprobar si existe alguna relacin entre las
variables, permitiendo determinar si el comportamiento de
las categoras de una variable presentan diferencias Estadsticamente significativas.
Referencias
En esta prueba estadstica siempre la hiptesis nula
platea que las variables analizadas son independientes.
En segundo lugar, se tiene las frecuencias esperadas, es
decir, las frecuencias que debieran darse si las variables
fueran independientes en otras palabras, si fuera cierta la
hiptesis nula. En tercer lugar, es calcular el estadstico de
prueba, en este caso es7, 9044 que compara las frecuencias