Escolar Documentos
Profissional Documentos
Cultura Documentos
ESPECIALIDAD:
ING. INDUSTRIAL
MATERIA:
ESTADSTICA INFERENCIAL II
TEMA:
REGRESIN LINEAL MLTIPLE
UNIDAD:
1
CATEDRTICO:
ALUMNO:
JOSIN ROSALINO RIOS SANTOS
SEMESTRE: GRUPO:
5. 4Q
1
Bibliografa.
INTRODUCCIN
La Estadstica Inferencial nos permite trabajar con una variable a nivel de intervalo o razn, as tambin
se puede comprender la relacin de dos o ms variables y nos permitir relacionar mediante ecuaciones,
una variable en relacin de la otra variable llamndose Regresin Lineal y una variable en relacin a
otras variables llamndose Regresin mltiple.
La regresin en forma grafica, trata de lograr que una dispersin de las frecuencias sea ajustada
a una lnea recta o curva.
1.1. Regresin lineal mltiple
En muchas situaciones prcticas existen varias variables independientes que se cree que
influyen o estn relacionadas con una variable de respuesta , y por lo tanto ser
necesario tomar en cuenta si se quiere predecir o entender mejor el comportamiento de
. Por ejemplo, para explicar o predecir el consumo de electricidad en una casa
habitacin tal vez sea necesario considerar el tipo de residencia, el nmero de personas
que la habitan, la temperatura promedio de la zona, etctera.
Donde los son los parmetros del modelo que se conocen como coeficientes
de regresin y es el error aleatorio, con media cero, . Si en la
ecuacin , estamos en el caso de regresin lineal simple y el modelo es una lnea recta;
si , tal ecuacin representa un plano. En general, la ecuacin representa un hiperplano
en el espacio de dimensiones generado por las variables
{ }.
El trmino lineal del modelo de regresin se emplea debido a que la ecuacin
es funcin lineal de los parmetros desconocidos La interpretacin de stos es muy
similar a lo ya explicado para el caso de regresin lineal simple:es la ordenada al
origen, y mide el cambio esperado en por cambio unitario en cuando el resto de
las variables regresoras se mantienen fijas o constantes.
Para encontrar los coeficientes de regresin mltiple por el mtodo de mnimos
cuadrados aplicamos el siguiente sistema de ecuaciones normales:
.2
Por ejemplo La siguiente tabla muestra los pesos Y a la libra ms cercana, las
estaturas X1 a la pulgada ms cercana y las edades X2 al ao ms cercano de 12
muchachos.
Tabla 1.5 Peso, estatura y edad
Peso Estatura Edad
64 57 8
71 59 10
53 49 6
67 62 11
55 51 8
58 50 7
77 55 10
57 48 9
56 52 10
51 42 6
76 61 12
68 57 9
Tabla 1.6 Procedimiento para realizar los clculos para la regresin mltiple
Y X1 X2 Y2 X 12 X 22 X 1Y X 2Y X1 X 2
64 57 8 4096 3249 64 3648 512 456
71 59 10 5041 3481 100 4189 710 590
53 49 6 2809 2401 36 2597 318 294
67 62 11 4489 3844 121 4154 737 682
55 51 8 3025 2601 64 2805 440 408
58 50 7 3364 2500 49 2900 406 350
77 55 10 5929 3025 100 4235 770 550
57 48 9 3249 2304 81 2736 513 432
56 52 10 3136 2704 100 2912 560 520
51 42 6 2601 1764 36 2142 306 252
76 61 12 5776 3721 144 4636 912 732
68 57 9 4624 3249 81 3876 612 513
y x1 x2 y 2 x12 x22 x1 y x2 y x1 x2
753 643 106 48,139 34,843 976 40,830 6,796 5,779
La ecuacin de regresin es
Peso = 3,7 + 0,855 Estatura + 1,51 Edad
Coef.
Predictor Coef de EE T P
Constante 3,65 16,17 0,23 0,826
Estatura 0,8546 0,4517 1,89 0,091
Edad 1,506 1,414 1,07 0,315
S = 5,36321 R-cuad. = 70,9% R-cuad.(ajustado) = 64,4%
Anlisis de varianza
Fuente GL SC MC F P
Regresin 2 629,37 314,69 10,94 0,004
Error residual 9 258,88 28,76
Total 11 888,25
Resultados en Excel
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,841756673
Coeficiente de determinacin R^2 0,708554296
R^2 ajustado 0,643788584
Error tpico 5,363214691
Observaciones 12
ANLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F
Regresin 2 629,3733536 314,6866768 10,9402688 0,003895018
Residuos 9 258,8766464 28,76407182
Total 11 888,25
Ejemplo
Se probar la significacin de la regresin (con utilizando los datos de los
pesos , estaturas y edades de la tabla 1.5
10,94
= =
Error o residuo
Total n-1
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,841756673
Coeficiente de determinacin R^2 0,708554296
R^2 ajustado 0,643788584
Error tpico 5,363214691
Observaciones 12
ANLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F
Regresin 2 629,3733536 314,6866768 10,9402688 0,003895018
Residuos 9 258,8766464 28,76407182
Total 11 888,25
Regresin
Anlisis de los residuales 2 629,37 314,69 10,94 0,004Error
residual 9 258,88 28,76
Observacin Pronstico Peso Residuos
Total 11 888,25 1 64,41464032 -0,414640324
2 69,13652482 1,863475177
3 54,56509625 -1,565096251
Coeficiente de determinacin 4
5
73,20668693
59,28698075
-6,20668693
-4,28698075
6 56,9260385 1,073961499
El que un modelo sea significativo no necesariamente implica que sea bueno en
7
8
65,71808511
58,22948328
11,28191489
-1,229483283
trminos de que explique la variacin de los datos. Por ello es importante tener
9 63,15425532 -7,154255319
10 48,58282675 2,417173252
mediciones adicionales de la calidad del ajuste del modelo, como las grficas de
11 73,85840932 2,141590679
residuales y el coeficiente de determinacin. Con la informacin del anlisis de varianza
12 65,92097264 2,079027356
. . .
. . .
.
.
Coeficiente de determinacin R^2 0,708554296
R^2 ajustado 0,643788584
Error tpico 5,363214691
Observaciones 12
ANLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F
Regresin 2 629,3733536 314,6866768 10,9402688 0,003895018
Residuos 9 258,8766464 28,76407182
Total 11 888,25
pH Temperatura Espesor
1,2 -8 9
1,8 -8 14
1,2 8 10
1,8 8 19
1,2 -8 8
1,8 -8 12
1,2 8 11
1,8 8 20
1,5 0 14
1,5 0 13
a) Ajuste el modelo
b) El modelo explica la variacin observada en el sabor? Argumente con base en la
significancia del modelo, los residuales y el coeficiente de determinacin.
c) Ajuste un modelo que incluya trminos cuadrticos y analice con detalle la calidad del
ajuste aplique las pruebas de hiptesis
d) Compare el error estndar de estimacin ( y los coeficientes de determinacin
( ) para ambos modelos
e) Cul modelo prefiere para explicar el sabor?
Se piensa que la energa elctrica consumida mensualmente por una planta qumica
se relaciona con la temperatura ambiente promedio ( , el nmero de das laborales del
mes ( , la pureza promedio del producto y las toneladas del producto producidas
. Se cuenta con los datos del ltimo ao, los cuales se presentan en la tabla
siguiente:
240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,841756673
Coeficiente de determinacin R^2 0,708554296
R^2 ajustado 0,643788584
Error tpico 5,363214691
Observaciones 12
ANLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crtico de F
Regresin 2 629,3733536 314,6866768 10,9402688 0,003895018
Residuos 9 258,8766464 28,76407182
Total 11 888,25
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepcin 3,651215805 16,16780562 0,22583249 0,82637676 -32,92290147 40,22533308 -32,92290147 40,22533308
Estatura 0,854609929 0,451664156 1,892135824 0,0910251 -0,167125376 1,876345234 -0,167125376 1,876345234
Edad 1,50633232 1,414265835 1,06509843 0,31457045 -1,692959268 4,705623908 -1,692959268 4,705623908
Utilizando Minitab
En Minitab la secuencia de captura para la regresin lineal simple o mltiple en la hoja
de clculo una vez capturada las columnas de datos seleccionamos Estadsticas luego
Regresin seguida de Regresin nuevamente
La ecuacin de regresin es
Peso = 3,7 + 0,855 Estatura + 1,51 Edad
Coef.
Predictor Coef de EE T P
Constante 3,65 16,17 0,23 0,826
Estatura 0,8546 0,4517 1,89 0,091
Edad 1,506 1,414 1,07 0,315
S = 5,36321 R-cuad. = 70,9% R-cuad.(ajustado) =
64,4%Anlisis de varianzaFuente GL SC MC
F P
Regresin 2 629,37 314,69 10,94 0,004
Error residual 9 258,88 28,76
Total 11 888,25
Fuente GL SC sec.
Estatura 1 596,74
Edad 1 32,63
Observaciones poco comunes
Ajuste ResiduoObs Estatura Peso Ajuste SE Residuo
estndar
7 55,0 77,00 65,72 1,96 11,28 2,26
RR denota una observacin con un residuo estandarizado grande.
1.2. Regresin no lineal
Si las dos variables X y Y se relacionan segn un modelo de lnea recta, se habla de
regresin lineal simple
Parbola de Regresin
En muchos casos, es una funcin de segundo grado la que se ajusta lo suficiente a la
situacin real dada.
La expresin general de un polinomio de 2 grado es:
Modelo potencial:
Si tomamos logaritmos en la expresin de la funcin potencial, obtendremos:
Modelo exponencial:
Tomando logaritmos en la expresin de la funcin exponencial, obtendremos:
Modelo logartmico:
La curva logartmica Y = a + b es tambin una recta, pero en lugar de estar
referida a las variables originales X e Y, est referida a y a Y.
WALPOLE, R.; MAYERS, R.H.; MAYERS, S.L. 1998. Sexta edicin. Probabilidad y
Estadstica Para Ingenieros. Pearson Education