Você está na página 1de 4

Choque Sansuste Javier Armando 2013

1. Coeficiente de correlacin lineal


En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de relacin entre s. Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relacin entre ambas variables: mientras ms alto sea el alumno, mayor ser su peso. El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las variables es lineal (es decir, si representramos en un grfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado. Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los pares de valores en un grfico y ver que forma describen. El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:

Es decir: Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamao de la muestra. Denominador se calcula el producto de las varianzas de "x" y de "y", y a este producto se le calcula la raz cuadrada. Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1 Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1. Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.

Choque Sansuste Javier Armando 2013


Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1. Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos. Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica, exponencial, etc.) De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este resultado podra haberse debido al puro azar. Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente serie de datos de altura y peso de los alumnos de una clase: Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10 Aplicamos la frmula: (1/30) * (0,826) ---------------------------------------------------------(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2) Luego, positivo. . Por lo tanto, la correlacin existente entre estas dos variables es elevada (0,7) y de signo Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Peso 32 33 34 30 32 35 34 32 32 35 Alumno Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20 Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Peso 33 35 34 30 33 34 35 32 33 33 Alumno Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30 Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29 Peso 33 34 34 31 32 34 34 31 35 34

r=

Coeficiente de correlacin mltiple. En el contexto del anlisis de la regresin lineal simple el coeficiente de correlacin mltiple establece una medida del grado de asociacin lineal entre la variable respuesta y la variable predictora, concretamente entre la variable respuesta y la recta de regresin estimada. Se define, a partir de los n pares de observaciones, mediante

Choque Sansuste Javier Armando 2013


Su cuadrado, R2, denominado coeficiente de determinacin mltiple, puede interpretarse como el porcentaje de variabilidad de Y explicada o debida a la recta de regresin, en tanto que puede comprobarse que:

Cuando todos los puntos se encuentran sobre la recta de regresin estimada, es decir, "el ajuste es perfecto", la suma de cuadrados de residuos, SSE, toma el valor cero y , por tanto, R2 = 1. El denominador de la ltima expresin es una medida de la variabilidad total de las n observaciones de la variable respuesta.

2. Coeficiente de determinacin
Ajuste ordinario por mnimos cuadrados. Mientras los puntos no disten mucho de la lnea de la regresin, el coeficiente de determinacin adoptar valores altos. En estadstica, el coeficiente de determinacin, denominado R2 y pronunciado R cuadrado, es un estadstico usado en el contexto de un modelo estadstico cuyo principal propsito es predecir futuros resultados o testear una hiptesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporcin de variacin de los resultados que puede explicarse por el modelo. Hay varias definiciones diferentes para R2 que son algunas veces equivalentes. Las ms comunes se refieren a la regresin lineal. En este caso, el R2 es simplemente el cuadrado del coeficiente de correlacin de Pearson, lo cual es slo cierto para la regresin lineal simple. Si existe varios resultados para una nica variable, es decir, para una X existe una Y, Z... el coeficiente de determinacin resulta del cuadrado del coeficiente de determinacin mltiple. En ambos casos el R2 adquiere valores entre 0 y 1. Existen casos dentro de la definicin computacional de R2 donde este valor puede tomar valores negativos . Clculo Caso general: Un modelo estadstico se construye para explicar una variable aleatoria que llamaremos dependiente a travs de otras variables aleatorias a las que llamaremos factores. Dado que podemos predecir una variable aleatoria mediante su media y que, en este caso, el error cuadrtico medio es su varianza, el mximo error cuadrtico medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos es la varianza. Para estimar el modelo haremos varias observaciones de la variable a predecir y de los factores. A la diferencia entre el valor observado de la variable y el valor predicho la llamaremos residuo. La media cuadrtica de los residuos es la varianza residual. Si representamos por la varianza de la variable dependiente y la varianza residual por determinacin viene dado por la siguiente ecuacin: , el coeficiente de

Choque Sansuste Javier Armando 2013


Se mide en tantos por ciento. Si la varianza residual es cero, el modelo explica el 100% de valor de la variable; si coincide con la varianza de la variable dependiente, el modelo no explica nada y el coeficiente de determinacin es del 0%. En variables econmicas y financieras, suele ser difcil conseguir un coeficiente de determinacin mayor de un 30%. Para la regresin lineal Para la regresin basta con hacer el cuadrado del coeficiente de correlacin de Pearson.

Donde:

es la covarianza de es la desviacin tpica de la variable es la desviacin tpica de la variable En un modelo lineal, la variable dependiente se explica mediante la ecuacin

Modelo lineal

. Si observamos veces tanto la variable aleatoria como los factores, podemos ordenar nuestras observaciones de la variable dependiente en una matriz mientras que colocaremos las de los factores en la matriz de regresin . Cada observacin corresponder a una coordenada de y a una fila de . Cada columna de la matriz de regresin corresponde a las observaciones de un factor. En cada

observacin el modelo cometer un error: Estos errores se llaman residuos. La varianza residual es la varianza de estos residuos.

es la parte de la variacin de explicada por el modelo lineal. que no explica el modelo lineal. Sumando estas dos partes, obtenemos .

es la parte de la variacin de

Problema: El valor del coeficiente de determinacin siempre aumenta cuando incluimos nuevas variables en el modelo, incluso cuando stas son poco significativas o tienen poca correlacin con la variable dependiente. Para resolverlo tenemos el coeficiente de determinacin corregido. Bibliografa http://www.aulafacil.com/CursoEstadistica/Lecc-12-est.htm http://dm.udc.es/asignaturas/estadistica2/sec6_8.html

Você também pode gostar