Você está na página 1de 9

COEFICIENTE DE CORRELACION Y REGRESION

El coeficiente de correlacin es un estadstico que proporciona informacin sobre la relacin lineal existente entre dos variables cualesquiera. Bsicamente, esta informacin se refiere a dos caractersticas de la relacin lineal: la direccin o sentido y la cercana o fuerza. Es importante notar que el uso del coeficiente de correlacin slo tiene sentido si la relacin bivariada a analizar es del tipo lineal. Si sta no fuera no lineal, el coeficiente de correlacin slo indicara la ausencia de una relacin lineal ms no la ausencia de relacin alguna. Debido a esto, muchas veces el coeficiente de correlacin se define - de manera ms general - como un instrumento estadstico que mide el grado de asociacin lineal entre dos variables. El trmino correlacin se utiliza generalmente para indicar la correspondencia o la relacin recproca que se da entre dos o ms cosas, ideas, personas, entre otras. En tanto, en probabilidad y estadstica, la correlacin es aquello que indicar la fuerza y la direccin lineal que se establece entre dos variables aleatorias. (ver fig. 1) Se considera que dos variables de tipo cuantitativo presentan correlacin la una respecto de la otra cuando los valores de una ellas varen sistemticamente con respecto a los valores homnimos de la otra. Por ejemplo, si tenemos dos variables que se llaman A y B, existir el mencionado fenmeno de correlacin si al aumentar los valores de A lo hacen tambin los valores correspondientes a B y viceversa. De todas maneras, vale aclarar que la correlacin que pueda darse entre dos variables no implicar por si misma ningn tipo de relacin de causalidad. Los principales elementos componentes de una correlacin de este tipo sern: la fuerza, el sentido y la forma. El valor del coeficiente de correlacin puede tomar valores desde menos uno hasta uno, indicando que mientras ms cercano a uno sea el valor del coeficiente de correlacin, en cualquier

direccin, ms fuerte ser la asociacin lineal entre las dos variables. Mientras ms cercano a cero sea el coeficiente de correlacin indicar que ms dbil es la asociacin entre ambas variables. Si es igual a cero se concluir que no existe relacin lineal alguna entre ambas variables.

Coeficiente de correlacin de Pearson (r)

El coeficiente de correlacin de Pearson es un ndice estadstico que mide la relacin lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables. El clculo del coeficiente de correlacin lineal se realiza dividiendo la covarianza por el producto de las desviaciones estndar de ambas variables:

Siendo: XY la covarianza de (X,Y) X y Y las desviaciones tpicas de las distribuciones marginales.

Este coeficiente nos informa del grado de relacin entre dos variables. Si la relacin es lineal perfecta, r ser 1 -1. El coeficiente r ser positivo si la relacin es positiva (al aumentar x aumenta y), y r ser negativo en el caso contrario (si al aumentar x, disminuye y). En general, valores (absolutos) de r > 0,80 se consideran altos, aunque esto depende del nmero de parejas de datos con las que hemos realizado el clculo y del nivel de seguridad con el que queramos extraer nuestras conclusiones.

No vamos a entrar en el estudio del nivel de significacin del coeficiente r , pero como indicacin: para 11 parejas de datos, y si admitimos un 5% de posibilidades de equivocarnos, con r>0,553 ya podemos decir que ambas series de datos no son independientes (parece que tienen algn tipo de relacin). Si tuviramos 50 parejas de datos, nos bastara r>0,273 para sacar la misma conclusin (siempre considerando el valor absoluto de r) Si nos ponemos ms estrictos, y queremos sacar la conclusin de que las dos series no son independientes con un 99% de seguridad (slo un 1% de posibilidad de error), con 11 parejas necesitamos que r>0,684 y con 50 parejas r>0,354 Precauciones: 1. El que estemos seguros de que ambas series estn relacionadas, no quiere decir que la relacin sea tan estrecha como para estimar valores de y desconocidos a partir de valores de x conocidos; so depender del error de estimacin que aceptemos. 2. La existencia de una correlacin no indica relacin causa-efecto.

Variable Una variable es un smbolo que representa un elemento no especificado de un conjunto dado. Dicho conjunto es llamado conjunto universal de la variable, universo o dominio de la variable, y cada elemento del conjunto es un valor de la variable. Sea x una variable cuyo universo es el conjunto {1,3,5,7,9,11,13}; entonces x puede tener cualquiera de esos valores: 1,3,5,7,9,11,13. En otras palabras x puede reemplazarse por cualquier entero positivo impar menor que 14. Por esta razn, a menudo se dice que una variable es un reemplazo de cualquier elemento de su universo.

Una variable es un elemento de una frmula, proposicin o algoritmo que puede adquirir o ser sustituido por un valor cualquiera (siempre dentro de su universo). Los valores que una variable es capaz de recibir, pueden estar definidos dentro de un rango, y/o estar limitados por criterios o condiciones de pertenencia, al universo que les corresponde (en estos casos, el universo de la variable pasa a ser un subconjunto de un universo mayor, el que tendra sin las restricciones).

Medicin

La medicin es la determinacin de la proporcin entre la dimensin o suceso de un objeto y una determinada unidad de medida. La dimensin del objeto y la unidad deben ser de la misma magnitud. Una parte importante de la medicin es la estimacin de error o anlisis de errores. Es comparar la cantidad desconocida que queremos determinar y una cantidad conocida de la misma magnitud, que elegimos como unidad. Teniendo como punto de referencia dos cosas: un objeto (lo que se quiere medir) y una unidad de medida ya establecida ya sea en Sistema Ingles, Sistema Internacional, o Sistema Decimal. Al resultado de medir lo llamamos Medida. Cuando medimos algo se debe hacer con gran cuidado, para evitar alterar el sistema que observamos. Por otro lado, no hemos de perder de vista que las medidas se realizan con algn tipo de error, debido a imperfecciones del instrumental o a limitaciones del medidor, errores experimentales, por eso, se ha de realizar la medida de forma que la alteracin producida sea mucho menor que el error experimental que se pueda cometer. La medida o medicin es directa, cuando disponemos de un instrumento de medida que la obtiene, as si deseamos medir la distancia de un punto "A" a un punto "B", y disponemos del instrumento que nos permite realizar la medicin.

Diagrama de dispersin Grfica realizada trazando puntos en un plano coordenado de acuerdo con los valores pares observados para mostrar la relacin entre dos variables. (Ver fig 2-3).

Regresin La regresin estadstica o regresin a la media es la tendencia de una medicin extrema a presentarse ms cercana a la media en una segunda medicin. La regresin se utiliza para predecir una medida basndonos en el conocimiento de otra.

La recta de regresin para hacer estimaciones La recta de regresin se amolda a la nube de puntos y describe, a grosso modo, su tendencia. Por eso, a partir de la recta de regresin obtenemos, de forma aproximada, el valor esperado de y para un cierto valor de x, o viceversa. A estos valores se les llama estimaciones. Es el valor estimado de y correspondiente a sobre la recta de regresin. Es el valor estimado de x correspondiente a sobre la recta de regresin.

Las estimaciones siempre se realizan aproximadamente y en trminos de probabilidad [es probable que si entonces y valga, aproximadamente,

La aproximacin es tanto mejor cuanto mayor sea | r |, pues para valores de r prximos a 1 o a -1, los puntos estn muy prximos a la recta.

Las estimaciones slo deben hacerse dentro del intervalo de valores utilizados o muy cerca de ellos.

Solo vamos a estudiar aquellos casos que solo admiten recta: recta de regresin, que es la recta que se traza de tal forma que se acerque lo ms posible a la totalidad de los puntos. Las ecuaciones de las rectas de regresin son: Recta de Y sobre X: Recta de X sobre Y :

Hay dos rectas de regresin Como ya hemos dicho, la recta de regresin obtenida, es la recta de regresin de Y sobre X. la recta de regresin pasa por el punto (X, Y) llamado centro de gravedad. Si el criterio que siguiramos para ajustar la recta a la nube de puntos fuera hacer mnima la suma de los cuadrados de las diferencias de abscisas del punto y de la recta (mnimo) obtendramos otra recta llamada recta de regresin de X sobre Y. Posiciones de las dos rectas de regresin Cuando la correlacin es casi nula, las dos rectas forman un ngulo muy grande (prximo a 90): Si la correlacin es fuerte, el ngulo que forman las dos rectas es pequeo: Si | r | es prximo a 1, las rectas son casi coincidentes:

En la bsqueda de las ecuaciones de las rectas de regresin debe tenerse en cuenta: Ambas rectas pasan por el punto llamado centro de gravedad de la distribucin. El valor de los coeficientes de las rectas son:

se cumple m.m = r Los parmetros m y m reciben el nombre de coeficientes de regresin. No debe confundirse con el coeficiente de correlacin ya que lo nico que poseen en comn es el signo.

Estimaciones con las rectas de Regresin Gracias a las rectas de regresin se pueden realizar estimaciones. Estas ltimas sern de distintos tipos dependiendo del valor de r: Si r esta cerca de 1 y -1 la estimacin es fiable. Si r esta cerca de 0 las estructura no sirve Las estimaciones tienen sentido para los valores de las variables prximas a los datos.

Fig. 1

Fig. 2

Fig. 3

http://es.wikipedia.org/wiki/Regresi%C3%B3n_(estad%C3%ADstica) http://www.monografias.com/trabajos30/regresion-correlacion/regresioncorrelacion.shtml

Você também pode gostar