Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introducción.
2. Tablas y gráficas bivariadas.
3. Variables cuantitativas.
3.1. Covarianza.
3.2. Coeficiente de correlación de Pearson.
3.3. Matriz de varianzas/covarianzas y matriz de correlaciones.
4. Variables semicuantitativas: Coeficiente de Spearman.
5. Variables cualitativas: Indices Ji Cuadrado y V de Cramer.
6. Asociación entre variables de escalas diferentes.
7. Concepto de relaciones no lineales.
5.1 Introducción
rendimiento
rendimiento
inteligencia inteligencia inteligencia
rendimiento
rendimiento
rendimiento
inteligencia inteligencia inteligencia
Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están
relacionadas, y si la relación es positiva o negativa
5.3 Covarianza e índice de correlación de Pearson
inteligencia
inteligencia
Covarianza
X i X Yi Y
sxy i 1
X i X Yi Y
rxy
sxy
rxy i 1
sx s y
n sx s y
Interpretación
inteligencia
Coeficiente de correlación (lineal) de Pearson
Interpretación (2)
(Esa es una de las razones empleadas por las tabaqueras en el tema de la correlación
entre cáncer de pulmón y el hecho de fumar.)
Coeficiente de correlación (lineal) de Pearson
Interpretación (3)
Es importante indicar que el coeficiente de correlación de Pearson puede verse
afectado por la influencia de terceras variables.
Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba
de habilidad verbal, saldrá que los más altos también tienen más habilidad
verbal...claro, que eso puede ser debido simplemente a que en el colegio los niños
más altos serán mayores en edad que los más bajos.
Interpretación (3)
CI bajo CI alto
Un grupo heterogéneo daría pues un mayor
grado de relación entre variables que un grupo
inteligencia homogéneo.
5.4 Otros coeficientes: variables semi-cuantitativas
n
6 di2
rs 1 i 1
n n 1
2
Las frecuencias empíricas son las que tenemos en la tabla de contingencia. Ahora
bien, ¿cómo computar las frecuencias teóricas? Tal proceso es simple:
Si ambas variables son independientes, la frecuencia teórica de cada celdilla será el
resultado de multiplicar la suma de frecuencias de la fila x la suma de frecuencia de
las columnas, y ese resultado se divide por N
f f 2
c 2 e t
ft
c
Este índice se interpreta
2 de manera análoga al
coeficiente de Pearson
(pero observa que phi no
puede ser negativo...sólo
n de 0 a 1)
Prueba c2 como medida de asociación: Coeficientes derivados e
interpretación
c
m es el número menor entre el número
2
Vˆ
de filas-1 y columnas-1
nm
Este índice se interpreta análogamente al índice de Pearson (excepto por el tema
del signo).
Observa que si la tabla es 2x2 este índice coincide con el índice phi