Você está na página 1de 5

Correlacin

La correlacin es una de las primeras aplicaciones de la estadstica que consiste en


estudiar la variacin de las caractersticas fsicas en poblaciones humanas (1), es un
tema que se enfoca en la direccin y el grado de la relacin. La direccin de la relacin
se refiere a si esta es positiva o negativa. El grado de la relacin afecta a la magnitud
o fuerza de la relacin. El grado puede varias de inexistente a perfecto, cuando la
relacin es perfecta la correlacin se encuentra en un grado mximo y podemos
predecir una variable a travs de la otra. (2)
A pesar que es suficiente para algunos propsitos hablar acerca de correlaciones altas
y bajas con frecuencia, es mucho ms deseable conocer la magnitud y la direccin
exactas de la correlacin. Un coeficiente de correlacin nos proporciona esta
informacin. (2)

Coeficiente de correlacin
Es el que expresa la magnitud y la direccin de la relacin de forma cuantitativa, un
coeficiente puede variar de +1 a -1, el signo del coeficiente de correlacin nos indica
si la relacin es positiva o negativa. La parte numrica del coeficiente de correlacin
describe la magnitud de la misma. Cuando mayor sea el nmero, tanto mayor ser la
correlacin. Dado que 1 es el nmero ms alto posible, representa una correlacin
perfecta. Un coeficiente de correlacin de +1 significa que la correlacin es perfecta y
que la relacin es positiva. Un coeficiente de correlacin de -1 significa que la relacin
es perfecta y que la relacin es negativa. Cuando la relacin es inexistente, el
coeficiente de la correlacin equivale a 0. (2)
En principio, el coeficiente de correlacin se puede calcular para cualquier conjunto
de puntos. Estos, en muchos casos, constituyen una muestra aleatoria de una
poblacin de puntos. En dichos casos el coeficiente de correlacin con frecuencia se
llama correlacin maestral y es una estimacin de la correlacin poblacional. (1)
Otra importante propiedad del coeficiente de correlacin es que no lo afectan las
unidades con las que se hacen las mediciones, el coeficiente de correlacin
permanece constante en cada una de las siguientes operaciones:

Multiplicar cada valor de una variable por una constante positiva


Sumar una constante a cada valor de una variable
Intercambiar los valores de X y Y (1)

Datos atpicos (1)


Los datos atpicos pueden distorsionar el coeficiente de correlacin enormemente, en
especial con conjuntos pequeos de datos, y presentan un serio problema para los
analistas de datos. Algunos datos atpicos los ocasionan errores en el registro de datos
o fallas en la secuencia del protocolo experimental.
Inferencia sobre la correlacin poblacional (1)
Cuando los puntos (

x i , y i ) son una muestra aleatoria de una poblacin de pares

ordenados, entonces cada punto considerar como observacin de un par ordenado de


variables aleatorias (X, Y). El coeficiente de correlacin, o correlacin muestral, r es
entonces una estimacin de la correlacin poblacional, Pxy.
Si las variables aleatorias X y Y tienen cierta distribucin conjunta llamada
distribucin normal bivariada, entonces la correlacin muestral r se puede utilizar
para construir intervalos de confianza y realizar pruebas de hiptesis sobre la
correlacin poblacional.
El coeficiente de correlacin lineal r de Pearson (2)
La r de Pearson es una medida del grado en el cual los puntajes pareados ocupan la
misma posicin o la opuesta dentro de sus propias distribuciones. La r de Pearson
logra correlacionar variables tan diversas como la hora del da y la posicin del sol, el
porcentaje de grasa corporal y la ingesta de caloras, pruebas de ansiedad y
calificaciones en exmenes etc.

Regresin lineal (2)

La regresin es un concepto que considera al empleo de la relacin entre dos o ms


variables para efectuar predicciones, la regresin y la correlacin estn vinculadas de
manera muy estrecha. En su nivel ms bsico, ambas implican la relacin entre dos
variables y tanto una como la otra utilizan el mismo conjunto de datos bsicos:
puntajes pareados de los mismos sujetos o de sujetos pareados.
La regresin se enfoca en el uso de la relacin para la prediccin. Esta es bastante
sencilla cuando la relacin es perfecta. Si esto es el caso, todos los puntos coinciden
en una lnea recta y todo lo que necesitamos hacer es hallar la ecuacin de tal lnea y
utilizarla para elaborar las predicciones.

Lnea de regresin (2)


La lnea de regresin es la lnea que mejor se ajusta y que se utiliza para hacer
predicciones
Lnea de regresin de mnimos cuadrados (2)
La lnea de regresin de mnimos cuadrados es aquella que minimiza el error total de
prediccin, de acuerdo con el criterio de mnimos cuadrados (Y-Y`)2. Para cualquier
relacin lineal solo existe un lnea solo existe una lnea que minimizara (Y-Y`)2 , por
lo tanto solo existe una lnea de regresin de mnimos cuadrados para cada relacin
lineal

Regresin lineal simple (3)


Un modelo con un solo regresor x que tiene una relacin con una respuesta y, donde
la relacin es una lnea recta. Este modelo de regresin lineal simple es
y = f30 + f3lx + E donde la ordenada al origen f30 y la pendiente f31 son constantes
desconocidas, y E es un componente aleatorio de error. Se supone que los errores
tienen promedio cero y varianza 0"2 desconocida. Adems, se suele suponer que los
errores no estn correlacionados. Esto quiere decir que el valor de un error no
depende del valor de cualquier otro error.
Conviene considerar que el regresor x est controlado por el analista de datos, y se
puede medir con error despreciable, mientras que la respuesta y es una variable
aleatoria. Con lo que hay una distribucin de probabilidades de y para cada valor
posible de x.
La media de esta distribucin es E(y I x) = f30 + f3x (2.2a)
La varianza es Var( y lx ) = Var(f3o + f3x + E) = 0"2 (2.2b)
As, la media de y es una funcin lineal de x, aunque la varianza de y no depende del
valor de x.
Regresin lineal mltiple (3)
Un modelo de regresin mltiple que podra describir esta relacin es donde y
representa el rendimiento, Xl la temperatura y x2 la concentracin de catalizador. Este
es un modelo de regresin lineal mltiple con dos variables regresoras. Se usa el
trmino lineal porque la ecuacin es una funcin lineal de los parmetros
desconocidos f3o, f31 y f32'
El modelo de regresin de la ecuacin describe un plano en el espacio tridimensional
de y, Xl Y x2'
Los modelos de regresin parcial mltiple se usan con frecuencia como modelos
empricos o como funciones de aproximacin, ya que se desconoce la relacin
funcional real entre y y Xl' X2..., Xk, pero dentro de ciertos mrgenes de las variables
regresoras, el modelo de regresin lineal es una aproximacin adecuada a la funcin
verdadera desconocida.

Bibliografa
1 estadstica para ingenieros y cientficos
William Navidi
Primera edicin
Captulo 7
2 estadstica para las ciencias del comportamiento
Robert R. Pagano
Novena edicin
Captulo 6 y7
3 introduccin al anlisis de regresin lineal
Montgomery Peck Vining
Tercera edicin
Captulo 2 y 3

Você também pode gostar