Você está na página 1de 13

Regresin Lineal Mltiple (RLM)

Existe ms de una variable regresora xi; i=1,2,3 y una variable de respuesta (y) Cmo surge RLM? A veces el modelo inicial de RLS no cumple las expectativas o metas del ingeniero; entonces se puede buscar otra variable regresora o bien buscar ms de una variable xi, esperando encontrar un mejor modelo de prediccin. Ejemplo 1.- Con dos variables x1 y x2 Hop Scotch Airlines utiliz publicidad en un modelo de RLS, para explicar y predecir el nmero de pasajeros que volaran en sus aeronaves en cierto momento. Se desea incorporar una segunda variable explicativa dentro del modelo de Regresin con el deseo de que se pueda explicar y predecir el nmero de pasajeros. Se escogi el ingreso nacional del pas (PIB) como una segunda variable de prediccin con base en el razonamiento de que el ingreso de las personas es determinante primaria de la demanda. Los siguientes datos corresponden a las observaciones de los ltimos 15 meses sobre los datos del nmero de pasajeros (en miles) que volaron en la compaa en todo el pas; los montos en miles de dlares (x1) erogados por la empresa y el monto mensual del ingreso nacional bruto del pas (x2) en billones de dlares correspondientes. Etapas de la solucin: 1.- Obtener por mnimos cuadrados el modelo muestral de RLM 2.- Validar el modelo 3.- Hacer inferencias respecto al modelo poblacional verdadero o desconocido. 4.- Utilizar el modelo Sean las matrices: [ [ ] ]

Variables y vs x1 y vs x2

Modelo

s 0.906

r 0.968

R2 (%) 93.6

R2 adj (%) 93.3

1.56

0.903

81.5

80.1

y vs x1 y x2

0.8216

95.3

94.5

Tabla ANOVA Fuente Regresin Error Residual Total GL 2 12 14 SC 163.63 8.102 171.73 CM 81.81 0.675 F 121.18 P 0.000

s= 0.8217

R-sq= 95.3%

R-sq adj=94.5%

Validacin del Modelo

Acerca del anlisis de varianza en regresin En regresin lineal simple o mltiple se usa el enfoque del anlisis de varianza, ANOVA (Analisis of Variance) para hacer una particin de la suma total de cuadrados en una parte que se debe a la regresin, y otra que se debe al error (error de estimacin de la ecuacin) Existe tambin una variacin aleatoria o al azar dentro de la muestra en la variable de respuesta y, respecto al valor promedio de . La tcnica del anlisis de varianza consiste en analizar la variacin que hay en un conjunto de respuestas y asignar porciones de esta variacin a cada conjunto de variables independientes. Esto indica que las variables de respuesta cambian como consecuencia de la variacin.

En el anlisis de la tabla ANOVA SCE y SCT representan la variacin en los valores de respuesta que idealmente seran explicados con el modelo. La cantidad SCE es la variacin debido al error o variacin no explicada. Interpretacin de R2 y R2 adj Si la suma de cuadrados de error valiera 0 toda la variacin quedara explicada. La cantidad que representa la variacin explicada es SCT-SCE, entonces

Por ltimo R2 adj representa un valor de R2 que es ms til que R2; debido a que a medida que se incrementan las variables regresoras R2 va aumentando en forma matemtica sin que esto signifique que mejora la prediccin del modelo obtenido. El valor S El valor S que se obtiene debajo de la tabla ANOVA es la magnitud del error estndar de estimacin; significa una medida de la varianza o dispersin de los puntos de la muestra alrededor de la lnea de regresin o plano de regresin en caso de tener 2 variables regresoras.

Frmulas de R2 y R2 adj

adj R barra al cuadrado ajustado Y

Validacin del modelo 1.- Prueba de hiptesis del modelo como un todo

Como F0 Se puede concluir que con un nivel de significancia del 5% existe una relacin lineal entre y y por lo menos una de las variables regresoras. 2.- Pruebas individuales para los coeficientes de regresin

Minitab genera la siguiente tabla Predictor coef SE coef (Error estndar de los coeficientes) 0.9994 0.1419 0.7360 Ejemplo para publicidad T (Estadstico de prueba T de Student) 3.53 5.92 1.96 P (p-value)

Constant Publicid PIB

3.5284 0.8397 1.4410

0.004 0.000 0.074

Estadstico de prueba t=

De la tabla dada en MINITAB

es el error estndar del coeficiente de regresin. Conclusin es verdadera. Con un nivel de significancia de 0.01 podemos concluir que la publicidad contribuye significativamente al poder predictivo del modelo aun despus de incluir la otra variable.

Ejercicio 12.9

Validacin del modelo de RLM obtenido Anlisis de Residuales

1.- Diagnstico de la grfica visual 2.- Prueba visual de normalidad de los residuales estandarizados 3.- Prueba (no paramtrica) de normalidad (usando el estadstico RYAN JOINER Nota.- Los residuales ei deben ser independientes y estar distribuidos en forma idntica con media ()=0 y varianza comn 2. Prueba visual de normalidad de los residuales

INTERPRETACION Esta grfica se genera en la computadora graficando los residuales obtenidos en el modelo estandarizados en un papel que se denomina probabilstico en el eje vertical. La grfica consiste en una serie de puntos que corren de izquierda a derecha, en los que la computadora traza una lnea recta que pasa sobre ellos.

La prueba visual que debe hacerse consiste en observar que la mayora de los puntos corren alrededor de dicha recta; si esto es as se dice que los residuales obtenidos efectivamente son independientes y estn distribuidos en forma normal con media cero y varianza comn. Esta prueba simplemente se conoce como la prueba de normalidad de los residuales del modelo. La prueba es visual; pero debe corroborarse la interpretacin con la prueba no paramtrica que usa el estadstico RJ.

Prueba no paramtrica Procedimiento: 1.- Planteamiento de H0 y H1

2.- Se utiliza un enfoque del valor P

3.- Clculo del estadstico de prueba Ryan Joyner

4.- Decisin y conclusin Lejano a 0 Aceptar H0 Por tanto H1 es falso Conclusin

Valor P La decisin de aceptar o rechazar H0 cuando se utiliza un valor P en forma prctica se observa si la cantidad est muy cercana o no a 0. Valores de P muy cercanos a 0 se rechaza la hiptesis nula y valores lejanos a 0 se acepta H0. Una vez realizado esto con el valor P que arroja la mquina se concluye respecto a H1 y se concluye la prueba. 0.000__ Cercano a 0 0.____ Lejano a 0

ANOVA

ANOVA Predictor Constant Publicidad PIB

Coef 3.5284 0.8397 1.441

SE Coef T 0.9994 0.1419 0.736

P 3.53 5.92 1.96 0.004 0 0.074

Prueba:

Normal Probability Plot of the Residuals


(response is No. de Pasajeros)
99

95 90 80

Percent

70 60 50 40 30 20 10 5

-2

-1

0 Residual

Aparentemente los puntos corren sobre la lnea

Residuals Versus the Fitted Values


(response is No. de Pasajeros) 2.0 1.5 1.0

Residual

0.5 0.0 -0.5 -1.0 15.0 17.5 20.0 Fitted Value 22.5 25.0

Aparentemente los residuos estn dispersos en forma aleatoria alrededor de ei=0

Etapas de la RLM 1.- Obtener el modelo 2.- Evaluar el modelo a travs de (s)

Validar el modelo obtenido: -A travs del anlisis de varianza ANOVA. Prueba del modelo como un todo y pruebas individuales de los coeficientes. -A travs del anlisis de residuales En caso de no validarse el modelo, se deben elegir otras variables de regresin (elementos que afecten al resultado) y volver a aplicar el procedimiento entero. 3.- Utilizar el modelo Una aplicacin del modelo obtenido y validado es calcular un intervalo de prediccin de (y) para ciertos valores de y , con cierta confianza Se obtendra mediante:

es una matriz de una sola columna formada con los valores dados para y y cuyo primer elemento es 1 y es la matriz transpuesta de x0 y la matriz es la inversa de

Ejemplo.Obtener un intervalo de prediccin de y del 95% de confianza cuando y (en millones de dlares) del PIB Con Con u=n-k-1=15-2-1=12 Con S=0.8217 [ [ [ ] ] ] ; entonces (miles de pesos)

Finalmente el intervalo sera

15.7245253 LS=14.2362747

Interpretacin: Si se invierten 9.5 miles de pesos en publicidad y el PIB es de 2.41 billones de dlares en un mes se puede esperar que en esta aerolnea viajen entre 14236 y 15724 pasajeros con una confianza certeza de 95%.

Matrices en Excel

Você também pode gostar