Você está na página 1de 8

FACULTAD DE CIENCIAS SOCIALES Y HUMANIDADES ESCUELA PROFESIONAL DE EDUCACIN PRIMARIA

TEMA: REGRESIN Y CORRELACIN LINEAL.

CURSO : ESTADSTICA GENERAL

DOCENTE: Ing. JHON AGUILAR CASTILLO

ESTUDIANTES: ABIEZER CHUINTAM SANCHEZ LEINER OCC GOMEZ GELDY GUELAC CANTA CICLO: III

CORRELACION DE DOS VARIABLES

Coeficiente de correlacin de Pearson: En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlacin de Pearson como un ndice que puede utilizarse para medir el grado de relacin de dos variables siempre y cuando ambas sean cuantitativas. Definicin En el caso de que se est estudiando dos variables aleatorias x e y sobre una poblacin estadstica; el coeficiente de correlacin de Pearson se simboliza con la letra , siendo la expresin que nos permite calcularlo:

Dnde: Es la covarianza de

es la desviacin tpica de la variable es la desviacin tpica de la variable

De manera anloga podemos calcular este coeficiente sobre un estadstico muestral, denotado como a:

Interpretacin Varios grupos de puntos (x, y), con el coeficiente de correlacin para cada grupo. Ntese que la correlacin refleja la no-linealidad y la direccin de la relacin lineal. Cuando el coeficiente vale 0 es porque la varianza de y es nula.

El valor del ndice de correlacin vara en el intervalo [-1,1]: Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en proporcin constante. Si 0 < r < 1, existe una correlacin positiva. Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todava relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlacin negativa. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en proporcin constante. Coeficiente de Pearson El ndice numrico ms comn usado para medir una correlacin es el coeficiente de Pearson. El coeficiente de Pearson (tambin llamado coeficiente de correlacin del producto-momento), se representa con el smbolo r y proporciona una medida numrica de la correlacin entre dos variables. Es til reconocer la frmula usada para calcular el coeficiente de Pearson). Le entregamos la frmula en una nota al pie de esta pgina. .Recuerde que al describir la relacin entre dos variables, necesitamos responder al menos cuatro preguntas: (1) Estn relacionadas las variables entre s? Si los cambios en el valor de una de las variables van acompaados de cambios en el valor de la otra, las variables parecen estar relacionadas. (2) Si las variables parecen estar relacionadas, qu tan fuerte es la relacin entre las variables? En otras palabras, estn estrechamente o slo levemente relacionadas? (3) La relacin entre las variables es positiva o negativa? (4) Cul es la relacin causal entre las variables? El coeficiente de Pearson no entrega respuestas a tres de estas cuatro preguntas: (1) sobre la pregunta uno, nos indica si dos variables parecen estar correlacionadas o no; (2) con respecto a la pregunta dos, el coeficiente de Pearson indica la fuerza de la aparente relacin; y (3) el coeficiente, por ltimo, nos indica si la aparente relacin es positiva o

negativa. Como ya sabemos, el anlisis de correlacin no puede responder a la ltima pregunta. El coeficiente de correlacin de Pearson (r) se mide en una escala de 0 a 1, tanto en direccin positiva como negativa. Un valor de 0 indica que no hay relacin lineal entre las variables. Un valor de 1 o 1 indica, respectivamente, una correlacin positiva perfecta o negativa perfecta entre dos variables. Normalmente, el valor de se ubicar en alguna parte entre 0 y 1 o entre 0 y 1. En las ciencias sociales en general y en educacin en particular, donde la mayora de las variables son simultneamente afectadas por una gran multitud factores, una correlacin positiva de 0,7 o una correlacin negativa de 0,7 se consideran muy fuerte. (Por ltimo, tenga en mente el coeficiente de Pearson mide slo relaciones lineales entre variables, y no es til para medir relaciones que no son lineales.) Cuadro 15. El coeficiente de Pearson de correlacin. Valor del Coeficiente de Pearson r=0 r=1 0<r<1 r = -1 -1 < r < 0 Grado de Correlacin entre las Variables Ninguna correlacin Correlacin positiva perfecta Correlacin positiva Correlacin negativa perfecta Correlacin negativa

Ntese que una correlacin negativa no es menos fuerte que una correlacin positiva. As, por ejemplo, un de 0,5 es tan grande o fuerte como un de 0,5. Los signos positivos y negativos slo indican si el valor de una variable aumenta o disminuye, respectivamente, con el aumento en el valor de la otra variable. Como usted sabe, cuando los aumentos (disminuciones) de una variable producen aumentos (disminuciones) en la otra, la relacin es positiva. Es negativa cuando los aumentos (disminuciones) de una variable producen disminuciones (aumentos) en la otra.

Segn su opinin, las calificaciones profesionales de los maestros estn correlacionadas en forma positiva o negativa con el rendimiento de los estudiantes? Qu sucede con el tamao de la clase? Y el gasto en educacin?

REGRESION LINEAL

En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modela la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

: Variable dependiente, explicada o regresando. : Variables explicativas, independientes o regresores. : Parmetros, miden la influencia que las variables explicativas tienen sobre el regresando. Donde es la interseccin o trmino "constante", las son los parmetros respectivos a cada variable independiente, y es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal. El modelo de regresin lineal El modelo lineal relaciona la variable dependiente Y con K variables explicativas (k = 1,...K), o cualquier transformacin de stas, que generan un hiperplano de parmetros desconocidos:

donde es la perturbacin aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al

modelo su carcter estocstico. En el caso ms sencillo, con una sola variable explicativa, el hiperplano es una recta:

El problema de la regresin consiste en elegir unos valores determinados para los parmetros desconocidos , de modo que la ecuacin quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observacin cualquiera i-sima (i= 1,... I) se registra el comportamiento simultneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).

Los valores escogidos como estimadores de los parmetros, , son los coeficientes de regresin, sin que se pueda garantizar que coinciden con parmetros reales del proceso generador. Por tanto, en

Los valores

son por su parte estimaciones de la perturbacin aleatoria o errores.

Hiptesis modelo de regresin lineal clsico 1. Esperanza matemtica nula.

Para cada valor de X la perturbacin tomar distintos valores de forma aleatoria, pero no tomar sistemticamente valores positivos o negativos, sino que se supone que tomar algunos valores mayores que cero y otros menores, de tal forma que su valor esperado sea cero. 2. Homocedasticidad para todo t Todos los trminos de la perturbacin tienen la misma varianza que es desconocida. La dispersin de cada en torno a su valor esperado es siempre la misma. 3. Incorrelacin.

para todo t, s con t distinto de s

Las covarianzas entre las distintas perturbaciones son nulas, lo que quiere decir que no estn correlacionadas o autocorrelacionadas. Esto implica que el valor de la perturbacin para cualquier observacin muestral no viene influenciado por los valores de la perturbacin correspondientes a otras observaciones muestrales. 4. Regresores no estocsticos. 5. No existen relaciones lineales exactas entre los regresores. 6. Suponemos que no existen errores de especificacin en el modelo ni errores de medida en las variables explicativas 7. Normalidad de las perturbaciones Supuestos del modelo de regresin lineal Para poder crear un modelo de regresin lineal, es necesario que se cumpla con los siguientes supuestos: 1. La relacin entre las variables es lineal. 2. Los errores en la medicin de las variables explicativas son independientes entre s. 3. Los errores tienen varianza constante. (Homocedasticidad) 4. Los errores tienen una esperanza matemtica igual a cero (los errores de una misma magnitud y distinto signo son equiprobables). 5. El error total es la suma de todos los errores. Tipos de modelos de regresin lineal Existen diferentes tipos de regresin lineal que se clasifican de acuerdo a sus parmetros: Regresin lineal simple Slo se maneja una variable independiente, por lo que slo cuenta con dos parmetros. Son de la forma:4

Donde

es el error asociado a la medicin del valor

y siguen los supuestos de y

modo que con ). Anlisis

(media cero, varianza constante e igual a un

Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene:

Derivando respecto a

e igualando a cero, se obtiene:

Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solucin para ambos parmetros:

La interpretacin del parmetro incrementar en Regresin lineal mltiple

es que un incremento en Xi de una unidad, Y i

La regresin lineal nos permite trabajar con una variable a nivel de intervalo o razn, as tambin se puede comprender la relacin de dos o ms variables y nos permitir relacionar mediante ecuaciones, una variable en relacin a otras variables llamndose Regresin mltiple. Constantemente en la prctica de la investigacin estadstica, se encuentran variables que de alguna manera estn relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemticamente en funcin de otra u otras variables. Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la forma:6

Donde

es el error asociado a la medicin del valor

y siguen los supuestos de y

modo que con ).

(media cero, varianza constante e igual a un

Você também pode gostar