Escolar Documentos
Profissional Documentos
Cultura Documentos
La pendiente indica el grado de inclinacin de una lnea y la interseccin indica el lugar en el que sta se cruza con un eje. La pendiente y
la interseccin definen la relacin lineal entre dos variables, y se pueden utilizar para estimar una tasa de cambio promedio. Mientras
mayor sea la magnitud de la pendiente, ms inclinada ser la lnea y mayor ser la tasa de cambio.
Al examinar la ecuacin de una lnea, usted puede reconocer rpidamente su pendiente y su interseccin en Y (el lugar donde la lnea se
cruza con el eje Y).
Por lo general, esta relacin puede representarse mediante la ecuacin y = b0 + b1x, donde b0 es la interseccin en Y y b1 es la pendiente.
Por ejemplo, una empresa determina que el rendimiento laboral de los empleados de un rea de produccin puede predecirse utilizando el
modelo de regresin y = 130 + 4.3x, donde x es el nmero de horas de capacitacin en la empresa (de 0 a 20), mientras que y es la
puntuacin de los empleados en una prueba de aptitud para el trabajo. El valor de la interseccin en Y (130) indica la puntuacin promedio
de aptitud para el trabajo de un empleado que no recibi capacitacin. El valor de la pendiente (4.3) indica que por cada hora de
capacitacin, la puntuacin de aptitud para el trabajo aumenta, en promedio, 4.3 puntos.
Coeficientes de regresin
Qu es un coeficiente?
Los coeficientes son los nmeros por los cuales se multiplican las variables de una ecuacin. Por ejemplo, en la ecuacin y = -3.6 +
5.0X1 - 1.8X2, las variables X1 y X2 se multiplican por 5.0 y -1.8, respectivamente, de modo que los coeficientes son 5.0 y -1.8.
El tamao y el signo de un coeficiente en una ecuacin afecta su grfica. En una ecuacin lineal simple (contiene solamente una variable
X), el coeficiente es la pendiente de la lnea
.
El coeficiente (y la pendiente) es 5 positivo.
Ecuacin de regresin
FlujoCalor = 325.4 + 2.55 Este + 3.80 Sur - 22.95 Norte + 0.0675 Insolacin
+ 2.42 Hora del da
Esta ecuacin predice el flujo de calor en una vivienda basndose en la posicin de sus puntos focales, la insolacin y la hora del da.
Minitab muestra los valores de los coeficientes de la ecuacin en la segunda columna:
Coeficientes
EE del
Trmino
Constante
325.4
96.1
3.39
0.003
Este
2.55
1.25
2.04
0.053 1.36
Sur
3.80
1.46
2.60
0.016 3.18
Norte
-22.95
Insolacin
Hora del da
2.70
-8.49
0.0675 0.0290
2.42
1.81
0.000 2.61
2.33
1.34
0.029 2.32
0.194 5.37
Cada uno de los coeficientes estima el cambio en la respuesta media por cada aumento de una unidad en X cuando todos los dems
predictores se mantienen constantes. Por ejemplo, en la ecuacin de regresin, si la variable Norte se incrementa en 1 y las dems
variables permanecen iguales, el flujo de calor disminuye aproximadamente 22.95, en promedio.
Si el valor p de un coeficiente es menor que el nivel de significancia seleccionado, como por ejemplo 0.05, la relacin entre el predictor y
la respuesta es estadsticamente significativa. Minitab tambin incluye un valor para la constante de la ecuacin en la columna Coef.
NOTA
El trmino coeficiente tambin se puede utilizar para denotar un valor numrico calculado que se utiliza como un ndice, como por
ejemplo un coeficiente de correlacin, un coeficiente de determinacin o coeficiente de Kendall.
Calcular intervalos de confianza para coeficientes de regresin
Utilice el intervalo de confianza para evaluar la fiabilidad de la estimacin del coeficiente. Mientras ms ancho sea el intervalo de
confianza, menos precisa ser la estimacin.
1.
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
3.
4.
En Presentacin de resultados, elija Tablas expandidas. Luego haga clic en Aceptar en cada cuadro de dilogo.
NOTA
De manera predeterminada, Minitab calcula intervalos de confianza bilaterales de 95%. Para cambiar la configuracin predeterminada,
elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin y, a continuacin, haga clic en Opciones. Luego ingrese el
nivel de confianza y el tipo de intervalo.
Las variables de inters en un experimento (las que se miden u observan) se denominan variables de respuesta o dependientes. Otras
variables del experimento que afectan la respuesta y que el investigador puede establecer o medir se denominan variables predictoras,
explicativas o independientes.
Por ejemplo, es posible que usted quiera determinar el tiempo de horneado recomendado para una receta de pastel o dar instrucciones de
cuidado para una nueva planta hbrida.
Una variable predictora continua tambin se menciona a veces como una covariable y una variable predictora categrica a veces se
menciona como un factor. En el experimento del pastel, una covariable podra ser diferentes temperaturas del horno y un factor podra ser
diferentes hornos.
Por lo general, usted crea una grfica de variables predictoras en el eje X y variables de respuesta en el eje Y.
Variable discreta
Un nmero finito de valores entre dos valores cualesquiera. Una variable discreta siempre es numrica. Por ejemplo, el nmero
de quejas de los clientes o el nmero de fallas o defectos.
Variable continua
Un nmero infinito de valores entre dos valores. Una variable continua puede ser numrica o de fecha/hora. Por ejemplo, la
longitud de una parte o la fecha y hora en que se recibe un pago.
Qu es falta de ajuste?
Un modelo de regresin exhibe falta de ajuste cuando no logra describir de manera adecuada la relacin funcional entre los factores
experimentales y la variable de respuesta. Una falta de ajuste puede ocurrir si no se incluyen trminos importantes del modelo, tales como
interacciones o trminos cuadrticos. Tambin puede ocurrir si al ajustar el modelo, se producen numerosos residuos extraamente
grandes.
El orden del modelo es el tipo de modelo que se utiliza para mostrar una tendencia en los datos. El orden del modelo es un factor
importante en la exactitud con la que el modelo describe los datos y pronostica una respuesta.
Por ejemplo, un modelo lineal puede mostrar una tasa constante de incremento o disminucin en los datos. Un modelo cuadrtico (suele
tener aproximadamente la forma de una U o una U invertida) puede explicar la curvatura en los datos. Un modelo cbico puede describir
un patrn de "picos y valles" en los datos.
Lineal
Y = bo + b1X
(primer orden)
Cuadrtico
Y = bo + b1X + b11X2
(segundo orden)
Cbico
Y = bo + b1X + b11X2 + b111 X3
(tercer orden)
Cada orden del modelo se corresponde con el grado de la ecuacin (la potencia ms alta de la variable X) que se utiliza para generar el
modelo, donde Y es la respuesta y X es el predictor, bo es la interseccin y b1, b11 y b111 son los coeficientes.
Ecuacin de regresin
FlujoCalor = 325.4 + 2.55 Este + 3.80 Sur - 22.95 Norte + 0.0675 Insolacin
+ 2.42 Hora del da
Coeficientes
EE del
Trmino
Constante
325.4
96.1
3.39
0.003
Este
2.55
1.25
2.04
0.053 1.36
Sur
3.80
1.46
2.60
0.016 3.18
Norte
-22.95
Insolacin
2.70
-8.49
0.0675 0.0290
Hora del da
2.42
1.81
0.000 2.61
2.33
1.34
0.029 2.32
0.194 5.37
El valor p de Hora del da (0.194) es el valor p ms alto que es mayor que 0.05, as que reducen
el modelo eliminando este trmino. Repiten la regresin, eliminando un trmino insignificante
cada vez, hasta que solo queden trminos estadsticamente significativos. El modelo reducido
final es:
Ecuacin de regresin
FlujoCalor = 483.7 + 4.796 Sur - 24.22 Norte
Coeficientes
EE del
Trmino
Constante 483.7
Sur
39.6
4.796 0.951
12.22
5.04
0.000
0.000 1.09
Norte
-24.22
1.94 -12.48
0.000 1.09
Aunque las tcnicas estadsticas pueden ser tiles para reducir el modelo, tambin se debe usar el conocimiento del proceso y el buen
juicio para decidir qu trminos eliminar. Algunos trminos podran ser esenciales, otros trminos pueden ser muy costosos o demasiado
difciles de medir. En el ejemplo anterior, el ingeniero desea eliminar todos los trminos insignificantes que se puedan eliminar sin correr
riesgos, para poder estimar el flujo de calor total con el menor nmero de variables posible.
Tambin es posible reducir los modelos DOE y GLM. Por ejemplo, el modelo completo para un experimento diseado con los trminos A,
B y C incluye A, B y C, adems de sus interacciones: A*B, A*C, B*C y A*B*C. Un posible modelo de reduccin es A, B, C, A*B.
Minitab utiliza la matriz de diseo como los valores de X en el anlisis de regresin para ajustar los modelos especificados
en Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
La matriz de diseo contiene n filas, donde n representa el nmero de observaciones, y una o ms columnas para cada trmino en el
modelo. La primera columna de la matriz es la interseccin, y la columna contiene todos los unos (1). Las columnas para los otros
trminos del modelo se almacenan en el orden que se especifica en el cuadro de dilogo principal Regresin. Los predictores categricos
se codifican utilizando la codificacin 1, 0 -1, 0, 1. Una columna de cdigos se crea para cada nivel del factor, excepto para el nivel de
referencia.
Qu es log-verosimilitud?
La log-verosimilitud es la expresin que Minitab maximiza para determinar los valores ptimos de los coeficientes estimados ().
Los valores de log-verosimilitud no se pueden utilizar por s solos como un ndice de ajuste, porque dependen del tamao de la muestra,
pero s se pueden utilizar para comparar el ajuste de diferentes coeficientes. Como lo que se desea es maximizar la log-verosimilitud, el
valor ms alto es mejor. Por ejemplo, un valor de log-verosimilitud de -3 es mejor que -7.
Qu es el error estndar del coeficiente?
La desviacin estndar de la estimacin de un coeficiente de regresin mide la precisin con la que el modelo estima el valor desconocido
del coeficiente. El error estndar del coeficiente siempre es positivo.
Utilice el error estndar del coeficiente para medir la precisin de la estimacin del coeficiente. Mientras menor sea el error estndar, ms
precisa ser la estimacin. Al dividir el coeficiente entre su error estndar, se calcula un valor t. Si el valor p asociado con este estadstico t
es menor que el nivel de significancia, usted concluye que el coeficiente es significativamente diferente de cero.
Por ejemplo, un ingeniero de materiales que trabaja para una fbrica de muebles desea evaluar la resistencia de los tableros de partculas
que utilizan. El ingeniero recoge datos de rigidez de pedazos de tableros de partculas con diferentes densidades a diferentes temperaturas
y produce la siguiente salida de regresin lineal. Los errores estndar de los coeficientes estn en la tercera columna.
Coeficientes
EE del
Trmino
Constante
20.1
12.2
Rigidez
0.2385 0.0197
Temp
-0.184 0.178
1.65
0.111
12.13
-1.03
0.000 1.00
0.311 1.00
El error estndar del coeficiente de Rigidez es ms pequeo que el de Temp. Por lo tanto, su modelo pudo estimar el coeficiente
para Rigidez con mayor precisin. De hecho, el error estndar del coeficiente de Temp es aproximadamente igual al valor del coeficiente
en s, de modo que el valor t de-1.03 es demasiado pequeo para declararlo estadsticamente significativo. El valor p resultante es mucho
mayor que los niveles comunes de , de manera que usted no puede concluir que este coeficiente es diferente de cero. Usted elimina la
variable Temp del modelo de regresin y contina con el anlisis.
Por qu todos los errores estndar de los coeficientes de regresin estimados seran iguales?
Si su matriz de diseo es ortogonal, cada coeficiente de regresin estimado tendr el mismo el error estndar, que ser igual a la raz
cuadrada de (MSE/n) donde MSE = cuadrado medio del error y n = nmero de observaciones.
Esquemas de codificacin para el anlisis de regresin
De manera predeterminada, Minitab usa el esquema de codificacin (1,0) para la regresin, pero se puede cambiar al esquema de
codificacin (-1, 0, +1) haciendo lo siguiente:
1.
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
C2 - T
Respuesta
Factor
10
Conteo
Variable
total Media
Respuesta
12 5.000
Conteo
4 2.000
4 4.500
4 8.500
Ejemplo de interpretacin del esquema de codificacin para un modelo de medias de celdas (0, 1) con un factor
Para obtener la salida, haga lo siguiente:
1.
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
3.
4.
5.
Coeficientes
EE del
Trmino
14.72
0.000
Factor
A
-6.500 0.816
-7.96
0.000 1.33
-4.000 0.816
-4.90
0.001 1.33
Anlisis de Varianza
Fuente
Regresin 2
Factor
86.00
86.00
Error
12.00
Total
11
98.00
43.000
43.000
32.25
32.25
1.333
0.000
0.000
Ecuacin de regresin
Respuesta = 8.500 - 6.500 Factor_A - 4.000 Factor_B + 0.0 Factor_C
El nivel C es el nivel de referencia y, por lo tanto, tiene un coeficiente de 0. En el caso de un solo factor, la interseccin es igual a la media
del nivel de referencia.
El coeficiente correspondiente al nivel A es 6.5. Es la diferencia que separa al nivel A del nivel de referencia. Si usted toma el coeficiente
de A y le suma la interseccin (o media de referencia), obtiene la media del nivel A: 6.5 + 8.5 = 2.0
Del mismo modo, el coeficiente correspondiente al nivel B es 4.0. Es la diferencia que separa al nivel B del nivel de referencia. Si usted
toma el coeficiente del nivel B y suma la interseccin, obtiene la media para el nivel B: 4.0 + 8.5 = 4.5
Ejemplo de interpretacin del esquema de codificacin para un modelo de efectos de factores (-1, 0, +1) con un factor
Para obtener la siguiente salida:
1.
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
3.
4.
Haga clic en Codificacin. En Codificacin para predictores categricos, elija (1, 0, +1).
5.
Coeficientes
EE del
Trmino
15.00
0.000
Factor
A
-3.000 0.471
-6.36
0.000 1.33
-0.500 0.471
-1.06
0.316 1.33
Anlisis de Varianza
Fuente
Regresin 2
Factor
86.00
86.00
Error
12.00
Total
11
98.00
43.000
43.000
1.333
32.25
32.25
0.000
0.000
C1
C2 - T
C3 - T
Respuesta
Factor 1
Factor 2
Alto
C1
C2 - T
C3 - T
Respuesta
Factor 1
Factor 2
Bajo
Alto
Bajo
Alto
Bajo
Alto
Bajo
Alto
Bajo
Alto
10
Bajo
Todo
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
3.
4.
Haga clic en Codificacin. En Codificacin para predictores categricos, elija (0, 1).
5.
6.
Coeficientes
EE del
Trmino
23.88
0.000
Factor 1
A
-4.000 0.479
-8.36
0.000 1.33
0.000 1.33
Factor 2
Alto
-1.667 0.391
-4.26
0.003 1.00
Anlisis de Varianza
Fuente
Regresin
94.3333
Factor 1
86.0000
Factor 2
8.3333
Error
3.6667
Falta de ajuste 2
Error puro
Total
6
11
31.4444
43.0000
8.3333
93.82
18.18
0.000
0.000
0.003
0.4583
0.6667
3.0000
68.61
0.3333
0.67
0.548
0.5000
98.0000
Una vez ms, el coeficiente correspondiente al nivel A es 6.5. Esta sigue siendo la distancia que separa al nivel A del nivel de referencia
(nivel C). Si usted toma la media del nivel A y le resta la media del nivel de referencia, obtendr el coeficiente: 2 8.5 = -6.5.
De igual modo, el coeficiente correspondiente al nivel B sigue siendo 4.0. Es la distancia que separa al nivel B del nivel de referencia
para el factor 1. Si usted toma la media del nivel B y le resta la media del nivel de referencia, obtendr el coeficiente: 4.5 - 8.5 = -4.0.
Finalmente, el coeficiente correspondiente al nivel Alto del factor 2 es la distancia que separa a Alto del nivel de referencia para el
factor 2 (Bajo). Entonces, si usted toma la media del nivel Alto del factor 2 y le resta la media del nivel de referencia del factor 2, obtendr
el coeficiente: 4.1667 5.8333 = -1.667.
Ejemplo de interpretacin del esquema de codificacin para un modelo de efectos de factores (-1, 0, +1) con dos factores
Para obtener la siguiente salida:
1.
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
3.
4.
Haga clic en Codificacin. En Codificacin para predictores categricos, elija (1, 0, +1).
5.
Coeficientes
EE del
Trmino
25.58
0.000
Factor 1
A
-0.500 0.276
-1.81
0.000 1.33
0.108 1.33
Factor 2
Alto
-0.833 0.195
-4.26
0.003 1.00
Anlisis de Varianza
Fuente
Regresin
94.3333
Factor 1
86.0000
Factor 2
8.3333
31.4444
43.0000
8.3333
68.61
93.82
18.18
0.000
0.000
0.003
Error
3.6667
Falta de ajuste 2
Error puro
Total
6
11
0.4583
0.6667
3.0000
0.3333
0.67
0.548
0.5000
98.0000
Observe que con este esquema de codificacin los coeficientes no cambiaron con respecto al modelo
de un factor. Ahora usted tiene un coeficiente adicional para el segundo factor.
Ahora consideremos la media general y las medias de los niveles del factor:
Media general = 5.0
A = 2.0
B = 4.5
C = 8.5
Alto = 4.1667
Bajo = 5.8333
La ecuacin de regresin es:
Ecuacin de regresin
Respuesta = 5.000 - 3.000 Factor 1_A - 0.500 Factor 1_B + 3.500 Factor 1_C
- 0.833 Factor 2_Alto + 0.833 Factor 2_Bajo
El efecto de cualquier nivel de factor especfico es la Media del nivel Media general. Por lo tanto,
Efecto del nivel A = 2.0 - 5.0 = -3.0
Efecto del nivel B = 4.5 - 5.0 = -0.5
Efecto del nivel C = 8.5 - 5.0 = 3.5
Efecto del nivel Alto = 4.1667 5.0 = -0.883
Efecto del nivel Bajo = 5.8333 5.0 = 0.883
NOTA
Cuando usted solamente tenga dos niveles y tamaos de muestra iguales, el efecto del nivel tendr la misma magnitud, porque la media
est exactamente en el centro.
La interseccin es la media general.
Los coeficientes son el efecto para cada nivel del factor. Representan la diferencia entre la media de ese nivel y la media general.
Crear una grfica de lnea ajustada y un modelo de regresin que pasen por el origen
De manera predeterminada, Minitab incluye un trmino constante para las grficas de lnea ajustada y los modelos de regresin. Para
eliminar este trmino y que el modelo pase por el origen, siga estos pasos.
Crear una grfica de lnea ajustada que pase por el origen
Supongamos que la variable predictora (X) est en C1 y la variable de respuesta (Y) est en C2.
1.
2.
3.
4.
Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
2.
3.
4.
Cuando Minitab ajusta el modelo con el trmino constante, el R-cuadrado es la proporcin de la variacin inicial, medida por la suma de
los cuadrados alrededor de la media de Y, que es explicada por la regresin. Para el modelo sin el trmino constante, el R-cuadrado es la
proporcin de la variacin alrededor del origen (es decir, alrededor del valor cero) explicada por la regresin. Esto significa que los
valores de R-cuadrado para los modelos con interseccin y sin interseccin no son similares.
Especficamente, el R-cuadrado para la regresin a travs del origen tiende a ser mayor que el R-cuadrado para la regresin con una
interseccin, incluso si la calidad del ajuste no es mejor. El modelo con interseccin calcula que las variaciones en el numerador (Ssreg) y
el denominador (Sstotal) de R-cuadrado se calculan alrededor de la media de respuesta, mientras que en el modelo sin interseccin, esas
variaciones se calculan alrededor de cero. Estos estadsticos no pueden utilizarse para la comparacin del desempeo con el modelo con
interseccin, porque el R-cuadrado del modelo sin intercepcin tiende a ser mayor que el R-cuadrado del modelo con intercepcin. Esto se
debe a que se utilizan sumas de los cuadrados (alrededor de cero) sin correccin. Si el R-cuadrado se calcula alrededor de la media de
respuesta en el modelo sin interseccin, a veces puede ser negativo.
Problemas con coeficientes de variacin pequeos en regresin
En regresin, los predictores con coeficientes de variacin pequeos que son casi constantes pueden causar problemas numricos. Por
ejemplo, la variable AO con valores desde 1970 hasta 1975 tiene un coeficiente de variacin pequeo y las diferencias numricas entre
las variables se encuentran en el cuarto dgito. El problema se agrava si AO se eleva al cuadrado. Usted podra restar una constante a los
datos, reemplazando AO por AOS DESDE 1970, que tiene valores de 0 a 5.
Si el coeficiente de variacin es moderadamente pequeo, se producir cierta prdida de exactitud estadstica. En este caso, Minitab le
avisa que el predictor es casi constante. Si el coeficiente de variacin es muy pequeo, Minitab elimina el predictor del modelo y muestra
un mensaje.
NOTA
Usted puede usar el subcomando TOLERANCE con el comando de sesin REGRESS para hacer que Minitab mantenga en el modelo un
predictor que tiene un coeficiente de variacin pequeo. Sin embargo, bajar la tolerancia podra ser peligroso debido a la posibilidad de
que se produzcan resultados numricamente inexactos.