Você está na página 1de 5

Regresin lineal simple

-Mtodos Estadsticos en Ciencias de la Vida


Regresin Lineal Simple

El anlisis de regresin sirve para predecir una medida en funcin de otra medida (o varias).
Y

= Variable dependiente
predicha explicada predictora explicativa

X

= Variable independiente una relacin?

Es posible descubrir Y = f(X) + error


f es una funcin de un tipo determinado el error es aleatorio, pequeo, y no depende de X

Modelo de regresin lineal simple


Regresin lineal simple


Ejemplo: Se realiz un estudio para determinar el efecto que tiene la rapidez de mezclado sobre la cantidad de impurezas en una pintura producida mediante un proceso qumico. El estudio arroj los datos que se muestran a continuacin:

En el modelo de regresin lineal simple, dado dos variables


Y (dependiente) X (independiente, explicativa, predictora)

buscamos encontrar una funcin de X muy simple (lineal) que nos permita aproximar Y mediante

=a + b X a (ordenada en el origen, constante) b (pendiente de la recta)

Y e rara vez coincidirn por muy bueno que sea el modelo de regresin. A la cantidad

e=Y- se le denomina residuo o error residual.

Regresin lineal simple


Rapidezde agitacin(rpm) 20 22 24 26 28 30 32 34 36 38 40 42 Impurezas(%)
20,0

Regresin lineal simple


8,4 9,5 11,8 10,4 13,3 14,8 13,2 14,7 16,4 16,5 18,9 18,5
Impurezas

18,0

16,0

14,0

12,0

En el diagrama de dispersin se observa que Y aumenta al incrementarse X. Adems, grficamente, se ve que X e Y estn relacionadas linealmente. Lo que se desea encontrar es la recta que mejor ajuste a los datos.

10,0

y =a+bx
20 25 30 35 40 45

8,0

Rapidez

a: ordenada al origen b: pendiente

Regresin lineal simple


Regresi Regresin lineal simple


La recta obtenida es muestral, estima a la poblacional


El modelo lineal de regresin se construye utilizando la tcnica de estimacin mnimo cuadrados Buscar a, b de tal manera que se minimice la cantidad i ei2 Se comprueba que para lograr dicho resultado basta con elegir:

y=+x+

b=

S XY S XX

a = y bx

Con esta tcnica adems se obtiene: El error residual medio es nulo La varianza del error residual es mnima para dicha estimacin.

Regresin lineal simple


Regresin lineal simple


Clculo de coeficientes con SPSS
Coeficientes
a

Los estimadores de mnimos cuadrados de y son:


n

b=

S xy S xx

( x x) ( y
i =1 i n i =1

y)
a = y bx =

yi
i =1

( xi x) 2

xi
i =1

Modelo 1

(Constante) Rapidez

Coeficientes no estandarizados B Error tp. -,289 1,221 ,457 ,038

Coeficientes estandarizad os Beta ,966

t -,237 11,880

Sig. ,817 ,000

a. Variable dependiente: Impurezas

y = -0,289 + 0,457 x
Impurezas (%) = -0,289 + 0.457 Rapidez de agitacin(rpm)

Inferencias acerca de los coeficientes de regresin


Supuestos: Los errores son independientes y se distribuyen en forma normal con media 0 y varianza constante2. Un estimador insesgado de 2 es:
n SSE (y y i )2 S yy bS xy = s = = i n 2 i=1 n 2 n2 2

Regresin lineal simple


Clculo de s2, un estimador para 2


ANOVA b Modelo 1 Suma de cuadrados 119,275 8,451 127,727 gl 1 10 11 Media cuadrtica 119,275 ,845 F 141,130 Sig. ,000a

Regresin Residual Total

a. Variables predictoras: (Constante), Rapidez b. Variable dependiente: Impurezas

Regresin lineal simple


Regresin lineal simple


Pruebas de hiptesis e intervalo de confianza para y


Coeficientesa Coeficientes no estandarizados Modelo 1 B -,289 ,457 Error tp. 1,221 ,038 Coeficientes estandarizad os Beta ,966 t -,237 11,880 Sig. ,817 ,000 Intervalo de confianza para B al 95% Lmite superior Lmite inferior -3,009 2,431 ,371 ,542

Estimacin del Valor Esperado de y para un valor dado de x


E( y | x = x 0 ) = y x = x0 = a + b x 0

(Constante) Rapidez

Intervalo de confianza de (1-)% para


y 0 t ( ;n 2 ) s
2

a. Variable dependiente: Impurezas

E(y | x = x0)

( x x )2 1 + n 0 n ( x i x )2
i =1

Regresin lineal simple


Intervalo de confianza y predicci prediccin de (1(1-)% E ( y | x = 35) = y para y cuando x=x0


20,0 18,0

x =35

Intervalo de prediccin de (1-)% para y cuando x=x0

16,0

( x x )2 1 y 0 t ( ;n 2 ) s 1 + + n 0 2 n ( x i x )2
i =1

Intervalo de prediccin de 95% para x=35

14,0

Intervalo de confianza de 95% para x=35

Impurezas

12,0

10,0

8,0 20 25 30 35 40 45

Rapidez

Correlacin

Correlacin
Resumen del modelo Modelo 1 R ,966a R cuadrado ,934
b

Coeficiente de correlacin muestral


S r = b xx S yy

R cuadrado corregida ,927

Error tp. de la estimacin ,9193

a. Variables predictoras: (Constante), Rapidez b. Variable dependiente: Impurezas

r2 se denomina coeficiente de determinacin muestral, representa la proporcin de variacin total en los valores de Y que se explican por la relacin lineal con los valores de X

Verificacin de supuestos

Verificacin de supuestos
1,50000 1,00000

Pruebas de normalidad Kolmogorov-Smirnov Shapiro-Wilk Estadstico gl Sig. Estadstico gl ,199 12 ,200* ,920 12
a
Unstandardized Residual
0,50000

Unstandardized Residual

Sig. ,283

0,00000

*. Este es un lmite inferior de la significacin verdadera. a. Correccin de la significacin de Lilliefors

-0,50000

-1,00000

-1,50000 8,00000 10,00000 12,00000 14,00000 16,00000 18,00000 20,00000

Unstandardized Predicted Value

Você também pode gostar