Você está na página 1de 28

REGRESIN LINEAL Y

CORRELACIN

Mgr. Gladys Gertrudis Bentez Palacios


REGRESIN LINEAL SIMPLE

El anlisis de regresin es una tcnica estadstica


para investigar la relacin funcional entre dos
variables cuantitativas, ajustando a algn modelo
matemtico.
Cuando se estudian dos caractersticas
simultneamente sobre una muestra, se puede
considerar que una de ellas influye sobre la otra de
alguna manera
Por ejemplo la altura y el peso o las horas de estudio y la
calificacin en un examen.
REGRESIN LINEAL SIMPLE

Interesa:
Investigar de que modo se relacionan las dos
variables
Si existe relacin, estudiar la fuerza de la relacin y el
sentido de la relacin, a travs de una medida
denominada coeficiente de correlacin
Estudiar la forma de la relacin. Usando los datos
propondremos un modelo para la relacin y a partir
de ella ser posible predecir el valor de una variable
dependiente (Y) a partir de la variable independiente
(X).
REGRESIN LINEAL SIMPLE

LA FUERZA mide el grado en que los pares de observaciones


(x; Y) quedan representados en una lnea. Si la nube de
observaciones es estrecha y alargada, una lnea recta
representar adecuadamente a la nube de puntos y a la
relacin y por tanto sta ser fuerte.

EL SENTIDO de la relacin se refiere a cmo varan los


valores de Y con respecto a X. Si al crecer los valores de la
variable X lo hacen los de Y, ser una relacin positiva o
directa. Si al aumentar X, disminuye Y, ser una relacin
negativa o inversa.

LA FORMA establece el tipo de lnea a emplear para definir el


mejor ajuste. Se pueden emplear dos tipos de lneas: una lnea
recta, una curva.
Conceptos bsicos
Anlisis de Correlacin: Tcnica estadstica usadas para
medir la intensidad de la relacin entre dos variables (Y; X).

Anlisis de Regresin: Tcnica estadstica que estudia la


relacin entre variables (Y, X), con el objeto de predecir el
valor de la variable dependiente (Y) a partir del
conocimiento de una o ms variables independientes (X).

Regresin simple: cuando interviene una sola


variable independiente
Regresin lineal simple: la funcin es una
combinacin lineal de los parmetros.
=+

Conceptos bsicos
Regresin lineal mltiple: intervienen dos o ms variables
independientes.
= + + +

Variable dependiente (Y): es la variable que se desea


predecir o estimar

Variables independientes (Xi ). Son las variables que


proveen las bases para estimar.

Diagrama de dispersin: Grfico que indica el patrn de


comportamiento de los datos de (X, Y). A partir de los datos se
puede tener una idea de la relacin o asociacin entre las
variables.
REGRESIN LINEAL SIMPLE

El anlisis de regresin se fundamenta en la bsqueda de la


relacin causal propio de los estudios de nivel investigativo
explicativo, los cuales pueden ser observacionales o experimentales.

Dos variables pueden considerarse:

Variables independientes No tienen relacin (Una de


ellas no sirve para explicar los cambios de la otra).

Dependencia funcional Y = f(x)

Dependencia estadstica.
REGRESIN LINEAL SIMPLE

Por ejemplo: Imaginemos que nos interesa es relacionar las siguientes


variables:

Nmero de horas de estudio y calificacin en los


exmenes.

Ingresos y gastos

Estatura de una persona y peso.

Importe de la factura de la luz y potencia consumida.

Beneficios de una empresa y nmero de empleados de la


misma.
REGRESIN LINEAL SIMPLE
En el primer ejemplo, si se toma una muestra de 10 estudiantes y se desea
estudiar si existe relacin entre el nmero de horas de estudio y la calificacin.
X = nmero de horas semanales de estudio
Y = calificacin obtenida.
Si los cambios en la variable X (nmero de horas semanales de estudio)
influyen en Y (los cambios de las calificaciones obtenidas), decimos que estn
correlacionadas o que hay CORRELACIN entre ellas.
10
9
Si al aumentar el Nro. de Hs. 8
CALIFICACIONES

de estudio (X) aumenta las 7


6
calificaciones (Y) La 5
correlacin es DIRECTA. 4
3
Si al aumentar el Nro. de Hs. 2
de estudios (X) disminuye 1

las Calificaciones (Y) La 0


0 1 2 3 4 5 6 7 8
correlacin es INVERSA NMERO DE HORAS DE ESTUDIO
REGRESIN SIMPLE
Una de las formas de establecer la relacin entre dos
variables es mediante el grfico de dispersin o nube de
puntos.

Y Y

X X

X
X
Figura 2. Diferentes diagramas de dispersin
ANLISIS DE REGRESIN SIMPLE
Dos variables cuantitativas X y Y estn relacionadas o
existe relacin lineal entre ellas si al aumentar los
valores de X tambin lo hacen los de Y, o por el contrario
si al aumentar los valores de X disminuyen los de Y.

1 r 0 r 0 0 r 1

Correlacin negativa Correlacin Correlacin


o inversa Nula positiva o directa
Pendiente

Figura 1. Grfico de dispersin o nube de puntos


ANLISIS DE REGRESIN SIMPLE
Objetivo:
La regresin simple nos permite determinar la
ecuacin de regresin para predecir los valores de
la variable dependiente (Y) en base a los valores de
la variable independiente (X).

Procedimiento:
Seleccionar una muestra a partir de la poblacin,
Listar pares de datos para cada observacin;
Dibujar un diagrama de puntos para dar una imagen
visual de la relacin;
Determinar la ecuacin de regresin.
Si existe relacin, determinar la fuerza de la relacin a
travs del coeficiente de correlacin.
ANLISIS DE REGRESIN SIMPLE
MUESTRA
Datos
POBLACIN X Y
x1 y1
x2 y2
Modelo de regresin . .
. .
Y = + x + . .
xn yn
Ecuacin de regresin
Permite
E(Y) = + X determinar
MUESTRA
Parmetros desconocidos Ecuacin estimada
de regresin
;
= a + b X
b es la pendiente de la recta

a; b
Regresin lineal simple

Se trata de predecir el comportamiento de Y usando X, entonces, el modelo de


regresin lineal simple es de la forma:

Y = + x + Modelo de regresin de la poblacin

Donde:
Y es la variable respuesta o v. dependiente
X es la variable explicativa, predictora o v. independiente.

: Constante de regresin
: Coeficiente de regresin

y se denominan parmetros de la poblacin

: Error aleatrio, el cual se supone que tiene media 0 y varianza 2


LINEA DE REGRESIN ESTIMADA

El modelo de regresin lineal es estimado por la ecuacin:

=a+bX

EL estimado de es a y el estimado de es b y son hallado


usando el mtodo de mnimos cuadrados
yi es el valor estimado de y para distintos valores de x.
b0 y b1 se denominan coeficientes de regresin
b0 : es la interseccin o el valor estimado de Y cuando X=0

b1 : es la pendiente de la recta, mide el cambio estimado de Y por


cada unidad de cambio de x
La estimacin de la ecuacin de regresin poblacional:
Y = + 1 x +

es la ecuacin de regresin muestral estimada

yi + b xi,

El principio de mnimos cuadrados es usado para obtener a y b :


= =


= 1


=
COEFICIENTE DE CORRELACIN LINEAL

Coeficiente de Correlacin (r) requiere variables CUANTITATIVAS.


n (X Y ) (X )(Y )
r
n (X 2

) ( X ) 2 n ( Y 2 ) ( Y ) 2
Sx : Desviacin estndar de X

= Sy : Desviacin estndar de Y

Sxy : Covarianza de X e Y

R vara entre -1.00 y 1.00, es decir: -1 r 1


Si r = 1.00 hay una correlacin perfecta positiva
Si r = -1.00 hay una correlacin perfecta negativa
Si r = 0.00 no hay correlacin
Si r > 0 hay una correlacin positiva
Si r < 0 hay una correlacin negativa
CORRELACIN LINEAL DIRECTA O POSITIVA

Interpretacin del coeficiente de correlacin directa

r Interpretacin

0,01 r 0.19 Muy baja correlacin directa

0,20 r 0.39 Baja correlacin directa

0,40 r 0.59 Moderada correlacin directa

0,60 r 0.79 Alta o buena correlacin directa

Muy alta o muy buena correlacin


0,80 r 0.99
directa
CORRELACIN LINEAL NEGATIVA

Interpretacin del coeficiente de correlacin negativa o inversa

r Interpretacin
Muy alta o muy buena correlacin
-0,99 r -0,80 inversa
-0,79 r -0,60 Alta o buena correlacin inversa

-0,60 r -0,40 Moderada correlacin negativa

-0,39 r -0,20 Baja correlacin inversa

-0,19 r -0.01 Muy baja correlacin negativa


COEFICIENTE DE DETERMINACIN

Coeficiente de Determinacin (R2) mide la proporcin de la


variacin total de la variable dependiente Y, que se explica
por la variacin de la variable independiente X.
El coeficiente de determinacin es el cuadrado de la
correlacin, y varia entre 0 y 1 (0 1)
El clculo del R2 se determina con la siguiente frmula:
2

2
= Si R2 indica qu porcentaje de la
2 variacin de la variable dependiente Y
es explicada por su relacin lineal con
X
2 = 2
2 =1 significa que todos los puntos estn en la recta de regresin
2 = 0 significa que la recta de regresin es paralela al eje X
EJEMPLO DE REGRESIN SIMPLE
Analizar la relacin entre los salarios y los gastos de los
trabajadores de la FECH. Para tal efecto se consider una
muestra de los trabajadores obtenindose los siguientes
resultados:

TRABAJADOR 1 2 3 4 5 6 7 8 9 10

SALARIOS 28 25 35 40 45 50 50 35 77 80
GASTOS 25 20 32 37 40 40 45 30 55 60
Ejemplo

SALA- Y 70
GASTOS
RIOS ESTIMADO
XY X2 Y2
y = 0.6561x + 7.0389
X Y y 60
R = 0.8279
28 25 700 784 625 25.33
50
25 20 500 625 400 23.35
40
35 32 1120 1225 1024 29.95

GASTOS
40 37 1480 1600 1369 33.25 30

45 40 1800 2025 1600 36.55


20
50 40 2000 2500 1600 39.85
50 45 2250 2500 2025 39.85 10

55 30 1650 3025 900 43.15


0
70 55 3850 4900 3025 53.05 0 10 20 30 40 50 60 70 80 90
SALARIOS
80 60 4800 6400 3600 59.65
478 384 20150 25584 16168
SALARIOS GASTOS

yi + b xi, X Y XY X2 Y2
478 384 20150 25584 16168


= =


()() = (, = .
= = ,

La ecuacin de regresin estimada es:

yi + b xi
y i 7,0384 0,6561 X
Inferencia en Regresin Lineal
Inferencia acerca del coeficiente de regresin
1 Formular las hiptesis estadstica:
Lo que interesa es determinar si los
Ho: = 0 datos de la muestra proporciona
evidencia suficiente para indicar la
Ha: 0. existencia de una relacin lineal
entre X e Y en la poblacin.

2 Estadstico de prueba viene dada por: La cual se distribuye como una t



=
~ (1, 2) con n-2 grados de libertad
2
2

2



= =
2 2
CORRELACIN LINEAL
n (X Y ) (X )(Y ) SALARIOS GASTOS

r XY X2 Y2
n (X
X Y
2
) ( X ) 2 n ( Y 2 ) ( Y ) 2 478 384 20150 25584 16168

10 20150 (478)(384)
r=
10 25584 (478)2 10 16168 (384)2

17948
r= = 0,9099
27356 14224

2 = 0,9099 2
= 0,8279
ANLISIS DE REGRESIN SIMPLE

Analizar la relacin entre la edad y el tiempo de servicios de


los estudiantes de la maestra en Gestin Pblica de la UCV.
Para tal efecto se consider una muestra de 15 maestrantes
obtenindose los siguientes resultados:

Edad 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de
servicios 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Solucin
30
TIEMPO DE SERVICIOS
25

20

15

10

0
0 10 20 30 40 50 60
EDAD

Figura 4. Diagrama de dispersin de la edad y el tiempo de servicios de


los maestrantes de la maestra en gestin Pblica de la UCV
ANLISIS DE REGRESIN SIMPLE

= 2 2

= SCT SCR

Você também pode gostar