Você está na página 1de 10

ESTADISTICA DESCRIPTIVA BIVARIADA

MEDIDAS DE RELACIÓN ENTRE


VARIABLES CUANTITATIVAS
Covarianza (Sxy)

Mide la relación lineal entre dos variables y se expresa mediante la


siguiente fórmula:

Propiedades:
Sxy es un valor que varía entre -∞ y + ∞
Si Sxy es positivo, entonces la correlación es directa (a mayor valor de X, mayor
valor de Y) y, por tanto, la recta de regresión es ascendente.
Si Sxy es negativo, entonces la correlación es inversa (a mayor valor de X, menor
valor de Y) y, por tanto, la recta de regresión es descendente.
Si Sxy es cero, entonces no hay correlación entre X e Y.
Coeficiente de correlación de Pearson (rxy)

La covarianza depende de los valores de las variables y por tanto de sus


unidades. Para tener una medida adimensional se utiliza el coeficiente de
correlación de Pearson (r xy) que nos indica qué tipo de relación existe
entre dos variables, así como la magnitud de dicha correlación, siendo
invariante frente a transformaciones lineales (cambio de origen y escala)
de las variables.

El coeficiente de correlación de Pearson fue construido bajo el supuesto


de que los datos siguen una distribución normal bivariada y la escala de
medición es al menos de intervalo.
El Coeficiente de Correlación de Pearson mide la relación lineal entre dos
variables y se define como el cociente entre la covarianza y el producto de las
desviaciones típicas de ambas variables. Toma la siguiente expresión para el
cálculo:

Propiedades:
• Es un coeficiente adimensional. Es decir, que es independiente de las unidades
en que están expresadas las variables. Por ello sirve de valor de comparación
aunque la variables vengan expresadas en unidades diferentes.
• -1 ≤ rxy ≤ 1
• Si rxy =1 ó rxy = -1, la relación es funcional. Una variable depende
matemáticamente de la otra (puede expresarse mediante una fórmula en la que
intervenga la otra, por ejemplo la longitud de una circunferencia depende del radio
mediante la fórmula (L=2πr).
Interpretación:
Si rxy está próximo a 1 ó -1 la correlación es fuerte (por encima de ±0.8).
Si rxy está próximo a 0, la correlación es débil.
Si rxy >0 la correlación es directa. Hay relación lineal positiva.
Si rxy <0 la correlación es inversa. Hay relación lineal negativa.
Si Sxy = 0 y por tanto rxy = 0 la correlación es nula. La relación lineal es nula.

Interpretación gráfica:
Si rxy = 1 los puntos (x,y) forman una línea ascendente.
Si rxy = -1 los puntos (x,y) forman una línea descendente.
Si rxy > 0 los puntos (x,y) forman una nube ascendente más cercana a una recta
cuanto más cercano sea este valor a 1.
Si rxy < 0 los puntos (x,y) forman una nube descendente más cercana a una recta
cuanto más cercano sea este valor a -1.
Si rxy = 0 la nube de puntos sigue una distribución totalmente aleatoria (circular).
MEDIDAS DE RELACIÓN ENTRE VARIABLES ORDINALES

Coeficiente de correlación de Spearman


Cuando los datos no se distribuyen según una normal bivariada o bien están medidos
con una escala ordinal, una de las posibles medidas de asociación lineal es el
coeficiente de correlación de Spearman (1904). Este coeficiente se define de igual
manera que el de Pearson, sólo que en lugar de utilizar los valores de las variables,
utiliza los rangos asociados a estos valores.

En el caso de que una variable sea ordinal y la otra cuantitativa, se analizarán los
datos como si las dos fuesen ordinales.
donde di es la diferencia entre el rango del caso i en la variable X, y en la variable Y.
Propiedades:
•- 1 ≤ rs ≤ +1
•Si rs = +1, hay correlación directa máxima.
•Si rs = -1, hay correlación inversa máxima.
•Si rs = +1, la correlación es nula.
MEDIDAS DE RELACIÓN ENTRE VARIABLES NOMINALES

En muchos casos la relación entre determinadas variables no puede medirse con


una escala cuantitativa. Por ejemplo: la relación entre el género y la ideología
política.

Al no cuantificarse numéricamente las variables no se puede hablar de una


correlación directa o inversa.

Por ejemplo: decir que a mayor género, mayor ideología política no tiene sentido.

Por lo tanto, cuando decimos que dos variables nominales X e Y están


relacionadas, queremos decir que las proporciones de X (género: hombre, mujer)
son diferentes en cada categoría de Y (ideología política: izquierda, derecha). Si
X e Y no están relacionadas, entonces las proporciones de X serán iguales en las
distintas categorías de Y.

A las frecuencias que esperaríamos obtener si X e Y estuvieran relacionadas se


les denomina frecuencias observadas.

A las frecuencias que esperaríamos obtener si X e Y no estuvieran relacionadas


se les denomina frecuencias esperadas.
REGRESIÓN LINEAL SIMPLE

En un gráfico de nube de puntos, podemos observar de manera intuitiva cierto


grado de asociación o correlación lineal entre las dos variables. Incluso se podría
trazar una recta, llamada recta de regresión, que se ajustase a la nube de puntos.

No obstante, también la apreciación visual de la existencia de correlación no es


suficiente. Vamos a proceder ahora a estudiar el procedimiento de selección de
esta recta y los parámetros de medida que debemos usar.

Una vez encontrada la función que representa esta dependencia de las variables,
podremos predecir los valores de una variable (variable dependiente o explicada) a
partir de los valores de las otras (variables independientes o
explicativas). Además, podremos calcular la fiabilidad de esta predicción.
La regresión puede o no representarse por una recta. En el caso de que elijamos
un recta para ajustarla a la nube de puntos, estaremos hablando de regresión
lineal. En otro caso, diremos que la regresión es no lineal.

Asimismo, una regresión lineal es simple cuando solamente exista una variable
independiente. Cuando sean más de una las variables independientes diremos
que la regresión lineal es múltiple.

A partir de la observación de la nube de puntos se elige el tipo de función o curva


que mejor relaciona las dos variables. Se obtiene así la ecuación de la recta o de
la curva que mejor se adapta al conjunto de puntos y que sirve para predecir el
valor de una de las variables.

Você também pode gostar