Você está na página 1de 4

Ejercicio de Regresin Lineal Simple.

Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar.


(Devore, 6a. Edicin. Pg. 517, problema 16)
Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de prediccin
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP
1 5 4 25 16 20 3.0065609658 0.9934390342 -1.79026099 7.80338293 -9.28904753 15.3021695
2 12 10 144 100 120 8.7953729971 1.2046270029 4.42350582 13.1672402 -3.34075942 20.9315054
3 14 13 196 169 182 10.4493192917 2.5506807083 6.19349156 14.705147 -1.64549601 22.5441346
4 17 15 289 225 255 12.9302387337 2.0697612663 8.84321888 17.0172586 0.89378499 24.9666925
5 23 15 529 225 345 17.8920776176 -2.8920776176 14.1207035 21.6634517 5.95910857 29.8250467
6 30 25 900 625 750 23.6808896488 1.3191103512 20.2318382 27.129941 11.8458382 35.5159411
7 40 27 1600 729 1080 31.950621122 -4.950621122 28.8474511 35.0537911 20.211705 43.6895372
8 47 46 2209 2116 2162 37.7394331533 8.2605668467 34.7756243 40.703242 26.0365852 49.4422811
9 55 38 3025 1444 2090 44.3552183318 -6.3552183318 41.4286154 47.2818213 32.6617376 56.0486991
10 67 46 4489 2116 3082 54.2788960997 -8.2788960997 51.1595169 57.3982753 42.5356847 66.0221075
11 72 53 5184 2809 3816 58.4137618363 -5.4137618363 55.1357477 61.691776 46.6274196 70.2001041
12 81 70 6561 4900 5670 65.8565201622 4.1434798378 62.2018529 69.5111874 53.9599206 77.7531197
13 96 82 9216 6724 7872 78.261117372 3.738882628 73.7945743 82.7276605 66.0905589 90.4316759
14 112 99 12544 9801 11088 91.4926877291 7.5073122709 86.008974 96.9764014 78.9131963 104.072179
15 127 100 16129 10000 12700 103.897284939 -3.8972849389 97.3815516 110.413018 90.8348476 116.959722

n= 15
Sumas 798 643 63040 41999 51232 -3.19744E-014
Promedio 53.2 42.8666666667
Desv.Est. insesgada 38.346540168 32.1111166035
Varianza insesgada 1470.4571429 1031.1238095238
Sumas de cuadrados Sxx Syy Suma(Y2) Suma(X2) Sxy
20586.4 14435.7333333333 63040 41999 17024.4
Coef. de correlacin, r= 0.9875570321 Intervalo de confianza para el promedio de y dado x:
Coef. de determinacin, R2= 0.9752688917 <- 97.53% de la variacin de Y est explicada por el modelo de regresin Si xo se fija en: 50
Bo=Y-B1*X -1.128304771 <- Ordenada al origen La estimacin puntual para la respuesta media de yo es:
B1=Sxy/Sxx 0.8269731473 <- Pendiente 40.220353
SSE=Syy-B1*Sxy 357.01168409 <- Suma de cuadrados de los errores El error estndar estimado de la respuesta media es:
MSE=SSE/(n-2) 27.462437238 <- Cuadrados medios de los errores 1.3581198
El intervalo de confianza de (1-)100% es:
Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y 37.286313 a 43.154392

Si = 0.05 /2= 0.025


La regin de rechazo es: | t0 |>t/2 2.1603686565

Prueba de Hiptesis sobre 1: El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad. Intervalo de prediccin para y dado x
Si xo se fija en: 50
H 0 : 1=0 ^
La prediccin para la respuesta yo es:
1 1
T= = 22.6418585332 40.220353
H 1 : 1 0
MS E El error estndar estimado de la prediccin:
Por lo tanto: Se rechaza Ho 5.4135872
S xx Un intervalo de prediccin para yo es:
28.525008 a 51.915697
Prueba de Hiptesis sobre el coeficiente de correlacin poblacional
El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0 r n2
T= = 22.6418585332
H 1 : 0
1r2 Por lo tanto: Se rechaza Ho

140
Grfica de residuos
10
Diagrama de dispersin
120
8

100 f(x) = 0.8269731473x - 1.1283047708


6
R = 0.9752688917 ei
4 Linear (ei)
80

2
Y

60
0
ei

f(x) = - 3.76059267322827E-016x + 1.78277495438668E-014


R = 1.11022302462516E-016
40 -2
Y
Linear (Y)
LIC -4
20 LSC
LIP
LSP
-6
0
0 20 40 60 80 100 120 140
-8
0 20 40 60 80 100 120 140
-20 X
X -10
Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de prediccin
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP Diagrama de dispersin
1 1 2.8 1 7.84 2.8 2.219047619 0.580952381 1.2321869 3.20590834 0.53585232 3.90224292
2 2 4.8 4 23.04 9.6 5.4047619048 -0.6047619048 4.66386912 6.14565469 3.85293251 6.9565913
3 3 8.2 9 67.24 24.6 8.5904761905 -0.3904761905 8.01044504 9.17050734 7.10869062 10.0722618 25
4 4 12 16 144 48 11.7761904762 0.2238095238 11.1961593 12.3562216 10.2944049 13.257976
5 5 15.2 25 231.04 76 14.9619047619 0.2380952381 14.221012 15.7027975 13.4100754 16.5137342
6 6 18.1 36 327.61 108.6 18.1476190476 -0.0476190476 17.1607583 19.1344798 16.4644237 19.8308144
20
n= 6
f(x) = 3.1857142857x - 0.9666666667
Sumas 21 61.1 91 800.77 269.6 -1.33227E-015 15 R = 0.9945972397
Promedio 3.5 10.1833333333

Y
Desv.Est. insesgada 1.8708286934 5.9760912532
Varianza insesgada 3.5 35.7136666667 10

Sumas de cuadrados Sxx Syy Sxy


17.5 178.5683333333 55.75 0
0 1 2 3 4 5 6 7
X
Coef. De Correlacin, r= 0.9972949612
Intervalo de confianza para la respuesta media esperada dado x
Coef. De Determinacin,
R2= 0.9945972397 <- 99.46% de la variacin de Y est explicada por el modelo de regresin Si xo se fija en: 3.5 horas
La respuesta media esperada sera de: 10.183333
Bo=Y-B1*X -0.966666667 <- Ordenada al origen
B1=Sxy/Sxx 3.1857142857 <- Pendiente
Un intervalo de confianza para la calificacin esperada es:
SSE=Syy-B1*Sxy 0.9647619048 <- Suma de cuadrados de los errores 9.6266688 a 10.739998

MSE=SSE/(n-2) 0.2411904762 <- Cuadrados medios de los errores Error estndar estimado de la respuesta media: 0.2004954

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y Intervalo de prediccin para y dado x
Si xo se fija en: 3.5 horas
Si = 0.05 /2= 0.025 La prediccin para la respuesta yo es: 10.183333
La regin de rechazo es: | t0 |>t/2 2.7764451052
Un intervalo de prediccin para yo es:
Prueba de Hiptesis sobre 1: El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad. 8.7105374 a 11.656129

H 0 : 1=0 ^
Error estndar estimado de la prediccin: 0.530461
1 1
T= = 27.1359962085
H 1 : 10
MS E
S xx
Por lo tanto: Se rechaza Ho

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0 r n2
T= = 27.1359962085
H 1 : 0
1r2 Por lo tanto: Se rechaza Ho
FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIN
POR EL MTODO DE MNIMOS CUADRADOS

Verdadera recta de regresin: Y = 0 + 1 X


Modelo lineal simple: y i= 0 + 1 x i+ i 2
i ~ N (0, )
Los i se suponen errores aleatorios con distribucin normal, media cero y varianza 2;
0 y 1 son constantes desconocidas (parmetros del modelo de regresin)
Ahora, el modelo de regresin lineal simple ajustado (o recta estimada) es:

S xy
^y = ^ 0 + ^ 1 x donde:
^ 0 = y ^ 1
x ^ 1=

S xx
Suma de cuadrados de X Suma de cuadrados de Y
n 2 2

( )
n

n
2
S xx = ( xi x ) = x
n
2
xi
i=1
n
S yy = ( y i y ) = y
2
n
2
( )
yi
i=1

i =1 i=1
i n i =1 i=1
i n
Suma de productos cruzados de X y Y
n n

n
S xy = ( x i
x ) y i = xi y i
n ( )( )
i=1
yi
i=1
xi

i=1 i=1 n

Coeficiente de correlacin: Coeficiente de determinacin:


S xy 2 2
r= R =r
S xx S yy
El residuo o error en la estimacin se define como: e i= y i ^y i
n n
Suma de cuadrados de los errores: SS E = e 2i = ( y i ^y i )2
i =1 i =1
Cuadrado medios de los errores (o varianza residual):
n
Tambin:
( y i ^y i ) 2
MS E = i=1 =
SS E SS E =S yy ^ 1 S xy
n 2 n2
Estimacin de la respuesta media de yo dado un xo:


^Y = y
^ 0 =E ^ +
^ ( Y |x ) = ^ x
0
0 0 1 0

Bandas de confianza para la recta de regresin:

^y 0 t / 2, n2

Bandas de prediccin:
[
MS E
1 ( x o
n
+
S xx
x )2
]
^y 0 t / 2, n2 MS E
[ 1 ( x o
1+ +
n S xx
x )2
]
No. hrs. estudio Calificacin del examen Bandas de confianza Bandas de prediccin 100
No. Observ. X Y X2 Y2 XY yiestimada ei LIC LSC LIP LSP
1 1 71 1 5041 71 71.45 -0.45 67.1647411 75.7352589 63.1768167 79.7231833 95
2 2 71 4 5041 142 72.8375 -1.8375 69.0983479 76.5766521 64.8335399 80.8414601
3 4 74 16 5476 296 75.6125 -1.6125 72.6169957 78.6080043 67.9277642 83.2972358
4 4 80 16 6400 320 75.6125 4.3875 72.6169957 78.6080043 67.9277642 83.2972358 90
5 7 80 49 6400 560 79.775 0.225 76.4808953 83.0691047 71.9690251 87.5809749
6 12 86 144 7396 1032 86.7125 -0.7125 80.4657154 92.9592846 77.2729854 96.1520146
85 f(x) = 1.3875x + 70.0625
n= 6 R = 0.855625
80
Sumas 30 462 230 35754 2421 -1.42109E-014
Promedio 5 77 75

Desv.Est. insesgada 4 6 70
Varianza insesgada 16 36
65
Desv. Est. sesgada 3.6514837167 5.4772255751
Varianza sesgada 13.333333333 30
60
Sumas de cuadrados Sxx Syy Sxy
80 180 111 55

50
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Coef. De Correlacin, r= 0.925
Intervalo de confianza para la respuesta media esperada dado x
Coef. De Determinacin,
R2= 0.855625 <- 85.56% de la variacin de Y est explicada por el modelo de regresin Si los alumnos estudian en promedio: 5 horas
La calificacin esperada en promedio sera de: 77
Bo=Y-B1*X 70.0625 <- Ordenada al origen
B1=Sxy/Sxx 1.3875 <- Pendiente
Un intervalo de confianza para la calificacin esperada es:
SSE=Syy-B1*Sxy 25.9875 <- Suma de cuadrados de los errores 74.110879 a 79.889121

MSE=SSE/(n-2) 6.496875 <- Cuadrados medios de los errores

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y Intervalo de prediccin para y dado x
Si un alumno estudia 5 horas
Si = 0.05 /2= 0.025 La prediccin para su calificacin es de: 77
La regin de rechazo es: | t0 |>t/2 2.7764451052
Un intervalo de prediccin para la calificacin es:
Prueba de Hiptesis sobre 1: El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad. 69.356104 a 84.643896

H 0 : 1=0 ^
1 1
T= = 4.8688425427
H 1 : 10
MS E
S xx
Por lo tanto: Se rechaza Ho

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0 r n2
T= = 4.8688425427
H 1 : 0
1r2 Por lo tanto: Se rechaza Ho

Você também pode gostar