Você está na página 1de 19

Pendiente e interseccin de la lnea de regresin

La pendiente indica el grado de inclinacin de una lnea y la interseccin indica el lugar en el que sta se cruza con un eje. La pendiente y
la interseccin definen la relacin lineal entre dos variables, y se pueden utilizar para estimar una tasa de cambio promedio. Mientras
mayor sea la magnitud de la pendiente, ms inclinada ser la lnea y mayor ser la tasa de cambio.
Al examinar la ecuacin de una lnea, usted puede reconocer rpidamente su pendiente y su interseccin en Y (el lugar donde la lnea se
cruza con el eje Y).

La pendiente es 5 positivo. Cuando X aumenta en 1, Y aumenta en 5. La interseccin en Y es 2.

La pendiente es 0.4 negativo. Cuando X aumenta en 1, Y disminuye en 0.4. La interseccin en Y es 7.2.

La pendiente es 0. Cuando X aumenta en 1, el valor de Y ni aumenta ni disminuye. La interseccin en Y es -4.

Por lo general, esta relacin puede representarse mediante la ecuacin y = b0 + b1x, donde b0 es la interseccin en Y y b1 es la pendiente.
Por ejemplo, una empresa determina que el rendimiento laboral de los empleados de un rea de produccin puede predecirse utilizando el
modelo de regresin y = 130 + 4.3x, donde x es el nmero de horas de capacitacin en la empresa (de 0 a 20), mientras que y es la
puntuacin de los empleados en una prueba de aptitud para el trabajo. El valor de la interseccin en Y (130) indica la puntuacin promedio
de aptitud para el trabajo de un empleado que no recibi capacitacin. El valor de la pendiente (4.3) indica que por cada hora de
capacitacin, la puntuacin de aptitud para el trabajo aumenta, en promedio, 4.3 puntos.

Coeficientes de regresin
Qu es un coeficiente?
Los coeficientes son los nmeros por los cuales se multiplican las variables de una ecuacin. Por ejemplo, en la ecuacin y = -3.6 +
5.0X1 - 1.8X2, las variables X1 y X2 se multiplican por 5.0 y -1.8, respectivamente, de modo que los coeficientes son 5.0 y -1.8.
El tamao y el signo de un coeficiente en una ecuacin afecta su grfica. En una ecuacin lineal simple (contiene solamente una variable
X), el coeficiente es la pendiente de la lnea

.
El coeficiente (y la pendiente) es 5 positivo.

Los coeficientes son 2 y -3.


Al calcular una ecuacin de regresin para modelar datos, Minitab estima los coeficientes para cada variable predictora basndose en la
muestra y presenta estas estimaciones en una tabla de coeficientes. Por ejemplo, la siguiente tabla de coeficientes se muestra en la salida
para una ecuacin de regresin:

Ecuacin de regresin
FlujoCalor = 325.4 + 2.55 Este + 3.80 Sur - 22.95 Norte + 0.0675 Insolacin
+ 2.42 Hora del da
Esta ecuacin predice el flujo de calor en una vivienda basndose en la posicin de sus puntos focales, la insolacin y la hora del da.
Minitab muestra los valores de los coeficientes de la ecuacin en la segunda columna:
Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante

325.4

96.1

3.39

0.003

Este

2.55

1.25

2.04

0.053 1.36

Sur

3.80

1.46

2.60

0.016 3.18

Norte

-22.95

Insolacin
Hora del da

2.70

-8.49

0.0675 0.0290
2.42

1.81

0.000 2.61

2.33
1.34

0.029 2.32
0.194 5.37

Cada uno de los coeficientes estima el cambio en la respuesta media por cada aumento de una unidad en X cuando todos los dems
predictores se mantienen constantes. Por ejemplo, en la ecuacin de regresin, si la variable Norte se incrementa en 1 y las dems
variables permanecen iguales, el flujo de calor disminuye aproximadamente 22.95, en promedio.
Si el valor p de un coeficiente es menor que el nivel de significancia seleccionado, como por ejemplo 0.05, la relacin entre el predictor y
la respuesta es estadsticamente significativa. Minitab tambin incluye un valor para la constante de la ecuacin en la columna Coef.
NOTA
El trmino coeficiente tambin se puede utilizar para denotar un valor numrico calculado que se utiliza como un ndice, como por
ejemplo un coeficiente de correlacin, un coeficiente de determinacin o coeficiente de Kendall.
Calcular intervalos de confianza para coeficientes de regresin
Utilice el intervalo de confianza para evaluar la fiabilidad de la estimacin del coeficiente. Mientras ms ancho sea el intervalo de
confianza, menos precisa ser la estimacin.
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

Complete el cuadro de dilogo.

3.

Haga clic en Resultados.

4.

En Presentacin de resultados, elija Tablas expandidas. Luego haga clic en Aceptar en cada cuadro de dilogo.

NOTA
De manera predeterminada, Minitab calcula intervalos de confianza bilaterales de 95%. Para cambiar la configuracin predeterminada,
elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin y, a continuacin, haga clic en Opciones. Luego ingrese el
nivel de confianza y el tipo de intervalo.

Qu son variables de respuesta y predictoras?

Las variables de inters en un experimento (las que se miden u observan) se denominan variables de respuesta o dependientes. Otras
variables del experimento que afectan la respuesta y que el investigador puede establecer o medir se denominan variables predictoras,
explicativas o independientes.
Por ejemplo, es posible que usted quiera determinar el tiempo de horneado recomendado para una receta de pastel o dar instrucciones de
cuidado para una nueva planta hbrida.

Una variable predictora continua tambin se menciona a veces como una covariable y una variable predictora categrica a veces se
menciona como un factor. En el experimento del pastel, una covariable podra ser diferentes temperaturas del horno y un factor podra ser
diferentes hornos.
Por lo general, usted crea una grfica de variables predictoras en el eje X y variables de respuesta en el eje Y.

Qu son variables discretas y continuas?

Las variables cuantitativas pueden clasificarse como discretas o continuas.

Variable discreta
Un nmero finito de valores entre dos valores cualesquiera. Una variable discreta siempre es numrica. Por ejemplo, el nmero
de quejas de los clientes o el nmero de fallas o defectos.
Variable continua
Un nmero infinito de valores entre dos valores. Una variable continua puede ser numrica o de fecha/hora. Por ejemplo, la
longitud de una parte o la fecha y hora en que se recibe un pago.

Falta de ajuste y pruebas de falta de ajuste

Qu es falta de ajuste?

Un modelo de regresin exhibe falta de ajuste cuando no logra describir de manera adecuada la relacin funcional entre los factores
experimentales y la variable de respuesta. Una falta de ajuste puede ocurrir si no se incluyen trminos importantes del modelo, tales como
interacciones o trminos cuadrticos. Tambin puede ocurrir si al ajustar el modelo, se producen numerosos residuos extraamente
grandes.

Prueba de falta de ajuste en Minitab


Minitab muestra la prueba de falta de ajuste cuando sus datos contienen rplicas (mltiples observaciones con valores x idnticos). Las
rplicas representan un "error puro" debido a que la variacin aleatoria puede causar diferencias entre los valores de respuesta observados.
Para determinar si el modelo ajusta los datos adecuadamente, compare el valor p (valor P) con su nivel significativo. Por lo general, un
nivel de significancia (tambin llamado alfa o ) de 0.05 funciona de manera correcta. Un de 0.05 significa que su probabilidad de
concluir que el modelo no ajusta los datos cuando realmente lo hace es solo de 5%.
Valor p < : el modelo no ajusta los datos
Si el valor p es menor que o igual a , usted concluye que el modelo no ajusta los datos de manera adecuada. Para obtener un
mejor modelo, quizs deba agregar trminos o transformar sus datos.
Valor p > : no existe evidencia de que el modelo no ajuste los datos
Si el valor p es mayor que , usted no puede concluir que el modelo no ajusta los datos de manera adecuada.

Qu es el orden del modelo?

El orden del modelo es el tipo de modelo que se utiliza para mostrar una tendencia en los datos. El orden del modelo es un factor
importante en la exactitud con la que el modelo describe los datos y pronostica una respuesta.
Por ejemplo, un modelo lineal puede mostrar una tasa constante de incremento o disminucin en los datos. Un modelo cuadrtico (suele
tener aproximadamente la forma de una U o una U invertida) puede explicar la curvatura en los datos. Un modelo cbico puede describir
un patrn de "picos y valles" en los datos.

Lineal
Y = bo + b1X
(primer orden)

Cuadrtico
Y = bo + b1X + b11X2
(segundo orden)

Cbico
Y = bo + b1X + b11X2 + b111 X3
(tercer orden)

Cada orden del modelo se corresponde con el grado de la ecuacin (la potencia ms alta de la variable X) que se utiliza para generar el
modelo, donde Y es la respuesta y X es el predictor, bo es la interseccin y b1, b11 y b111 son los coeficientes.

Qu es una variable oculta?


Una variable oculta es aquella que no se incluye como una variable explicativa o de respuesta en el anlisis, pero que puede afectar la
interpretacin de las relaciones entre las variables. Una variable oculta puede incorrectamente identificar una relacin fuerte entre las
variables o puede ocultar la verdadera relacin. Por ejemplo, un investigador estudia el efecto de dieta y ejercicio en la presin sangunea
de una persona. Las variables ocultas que tambin pueden afectar la presin sangunea son si la persona fuma y los niveles de estrs.
En los modelos estadsticos, el trmino de error explica las variables ocultas que afectan el proceso. Para descubrir variables ocultas, usted
debe dedicar tiempo a comprender sus datos y las variables importantes que pueden afectar un proceso. Tambin puede crear una grfica
de los datos para buscar tendencias no lineales que puedan identificar la presencia de variables ocultas.

Reduccin del modelo


La reduccin del modelo permite simplificar un modelo de regresin al eliminar los trminos insignificantes. Reducir el nmero de
trminos puede hacer que sea ms fcil trabajar con el modelo. Si se dejan en el modelo, los trminos insignificantes pueden reducir la
precisin de los predictores.
Un modelo se puede reducir manualmente o se puede reducir automticamente utilizando un procedimiento algortmico, como la
regresin escalonada. Otra tcnica es la regresin de los mejores subconjuntos, que determina si un subconjunto de los predictores puede
ajustarse a los datos tan bien como lo hace el conjunto completo de predictores. Para muchos modelos, usted puede determinar qu
trminos son estadsticamente significativos al examinar el valor p de cada coeficiente.

Ejemplo de reduccin de un modelo


Como parte de una prueba de energa trmica solar, unos tcnicos miden el flujo de calor total. Un ingeniero de energa desea determinar
la manera en que el flujo de calor es pronosticado por otras variables: insolacin (la posicin de los puntos focales en las direcciones este,
sur y norte) y la hora del da. Utilizando el modelo completo de regresin, determinan la siguiente relacin entre el flujo de calor y las
variables.

Ecuacin de regresin
FlujoCalor = 325.4 + 2.55 Este + 3.80 Sur - 22.95 Norte + 0.0675 Insolacin
+ 2.42 Hora del da
Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante

325.4

96.1

3.39

0.003

Este

2.55

1.25

2.04

0.053 1.36

Sur

3.80

1.46

2.60

0.016 3.18

Norte

-22.95

Insolacin

2.70

-8.49

0.0675 0.0290

Hora del da

2.42

1.81

0.000 2.61

2.33
1.34

0.029 2.32
0.194 5.37

El valor p de Hora del da (0.194) es el valor p ms alto que es mayor que 0.05, as que reducen
el modelo eliminando este trmino. Repiten la regresin, eliminando un trmino insignificante
cada vez, hasta que solo queden trminos estadsticamente significativos. El modelo reducido
final es:
Ecuacin de regresin
FlujoCalor = 483.7 + 4.796 Sur - 24.22 Norte
Coeficientes
EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante 483.7
Sur

39.6

4.796 0.951

12.22
5.04

0.000

0.000 1.09

Norte

-24.22

1.94 -12.48

0.000 1.09

Aunque las tcnicas estadsticas pueden ser tiles para reducir el modelo, tambin se debe usar el conocimiento del proceso y el buen
juicio para decidir qu trminos eliminar. Algunos trminos podran ser esenciales, otros trminos pueden ser muy costosos o demasiado
difciles de medir. En el ejemplo anterior, el ingeniero desea eliminar todos los trminos insignificantes que se puedan eliminar sin correr
riesgos, para poder estimar el flujo de calor total con el menor nmero de variables posible.
Tambin es posible reducir los modelos DOE y GLM. Por ejemplo, el modelo completo para un experimento diseado con los trminos A,
B y C incluye A, B y C, adems de sus interacciones: A*B, A*C, B*C y A*B*C. Un posible modelo de reduccin es A, B, C, A*B.

Cmo utiliza Minitab la matriz de diseo para regresin

Minitab utiliza la matriz de diseo como los valores de X en el anlisis de regresin para ajustar los modelos especificados
en Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.
La matriz de diseo contiene n filas, donde n representa el nmero de observaciones, y una o ms columnas para cada trmino en el
modelo. La primera columna de la matriz es la interseccin, y la columna contiene todos los unos (1). Las columnas para los otros
trminos del modelo se almacenan en el orden que se especifica en el cuadro de dilogo principal Regresin. Los predictores categricos
se codifican utilizando la codificacin 1, 0 -1, 0, 1. Una columna de cdigos se crea para cada nivel del factor, excepto para el nivel de
referencia.
Qu es log-verosimilitud?

La log-verosimilitud es la expresin que Minitab maximiza para determinar los valores ptimos de los coeficientes estimados ().
Los valores de log-verosimilitud no se pueden utilizar por s solos como un ndice de ajuste, porque dependen del tamao de la muestra,
pero s se pueden utilizar para comparar el ajuste de diferentes coeficientes. Como lo que se desea es maximizar la log-verosimilitud, el
valor ms alto es mejor. Por ejemplo, un valor de log-verosimilitud de -3 es mejor que -7.
Qu es el error estndar del coeficiente?

La desviacin estndar de la estimacin de un coeficiente de regresin mide la precisin con la que el modelo estima el valor desconocido
del coeficiente. El error estndar del coeficiente siempre es positivo.
Utilice el error estndar del coeficiente para medir la precisin de la estimacin del coeficiente. Mientras menor sea el error estndar, ms
precisa ser la estimacin. Al dividir el coeficiente entre su error estndar, se calcula un valor t. Si el valor p asociado con este estadstico t
es menor que el nivel de significancia, usted concluye que el coeficiente es significativamente diferente de cero.

Por ejemplo, un ingeniero de materiales que trabaja para una fbrica de muebles desea evaluar la resistencia de los tableros de partculas
que utilizan. El ingeniero recoge datos de rigidez de pedazos de tableros de partculas con diferentes densidades a diferentes temperaturas
y produce la siguiente salida de regresin lineal. Los errores estndar de los coeficientes estn en la tercera columna.

Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante

20.1

12.2

Rigidez

0.2385 0.0197

Temp

-0.184 0.178

1.65

0.111

12.13
-1.03

0.000 1.00
0.311 1.00

El error estndar del coeficiente de Rigidez es ms pequeo que el de Temp. Por lo tanto, su modelo pudo estimar el coeficiente
para Rigidez con mayor precisin. De hecho, el error estndar del coeficiente de Temp es aproximadamente igual al valor del coeficiente
en s, de modo que el valor t de-1.03 es demasiado pequeo para declararlo estadsticamente significativo. El valor p resultante es mucho
mayor que los niveles comunes de , de manera que usted no puede concluir que este coeficiente es diferente de cero. Usted elimina la
variable Temp del modelo de regresin y contina con el anlisis.

Por qu todos los errores estndar de los coeficientes de regresin estimados seran iguales?
Si su matriz de diseo es ortogonal, cada coeficiente de regresin estimado tendr el mismo el error estndar, que ser igual a la raz
cuadrada de (MSE/n) donde MSE = cuadrado medio del error y n = nmero de observaciones.
Esquemas de codificacin para el anlisis de regresin

Cambiar el esquema de codificacin


Cuando usted realiza un anlisis de regresin con predictores categricos, Minitab utiliza un esquema de codificacin para crear variables
indicadoras con el predictor categrico. Cuando los modelos se vuelven ms complicados, las interpretaciones son similares. Sin embargo,
si usted agrega una covariable o tiene tamaos de muestra desiguales dentro de cada grupo, los coeficientes se basan en las medias
ponderadas de cada nivel de factor en lugar de basarse en la media aritmtica (suma de las observaciones dividida entre n). Por lo general,
la interpretacin es la misma, sin embargo:
Cuando se usa la codificacin 1, 0, los coeficientes representan la distancia entre los niveles de los factores y su nivel de referencia.
Cuando se usa la codificacin 1, 0, -1, los coeficientes representan la distancia entre los niveles de los factores y la media general.

De manera predeterminada, Minitab usa el esquema de codificacin (1,0) para la regresin, pero se puede cambiar al esquema de
codificacin (-1, 0, +1) haciendo lo siguiente:
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

Haga clic en Codificacin.

Interpretar los esquemas de codificacin para modelos que tienen un factor


Los datos para ejemplos con un factor
En primer lugar, consideremos un diseo balanceado de un factor con tres niveles para el factor.
C1

C2 - T

Respuesta

Factor

10

Los estadsticos descriptivos para ejemplos con un factor


Examine los estadsticos descriptivos, concentrndose en las medias.

Conteo
Variable

total Media

Respuesta

12 5.000
Conteo

Variable Factor total Media


Respuesta A

4 2.000

4 4.500

4 8.500

Ejemplo de interpretacin del esquema de codificacin para un modelo de medias de celdas (0, 1) con un factor
Para obtener la salida, haga lo siguiente:
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

En Respuestas, ingrese Respuesta.

3.

En Predictores categricos, ingrese Factor.

4.

Haga clic en Codificacin. En Nivel de referencia, elija C.

5.

Haga clic en Aceptar en cada cuadro de dilogo.

Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante 8.500 0.577

14.72

0.000

Factor
A

-6.500 0.816

-7.96

0.000 1.33

-4.000 0.816

-4.90

0.001 1.33

Anlisis de Varianza
Fuente

GL SC Ajust. MC Ajust. Valor F Valor p

Regresin 2
Factor

86.00
86.00

Error

12.00

Total

11

98.00

43.000
43.000

32.25
32.25

1.333

Recuerde que las medias de los niveles del factor son:


A = 2.0
B = 4.5
C = 8.5
La ecuacin de regresin estimada es:

0.000
0.000

Ecuacin de regresin
Respuesta = 8.500 - 6.500 Factor_A - 4.000 Factor_B + 0.0 Factor_C
El nivel C es el nivel de referencia y, por lo tanto, tiene un coeficiente de 0. En el caso de un solo factor, la interseccin es igual a la media
del nivel de referencia.
El coeficiente correspondiente al nivel A es 6.5. Es la diferencia que separa al nivel A del nivel de referencia. Si usted toma el coeficiente
de A y le suma la interseccin (o media de referencia), obtiene la media del nivel A: 6.5 + 8.5 = 2.0
Del mismo modo, el coeficiente correspondiente al nivel B es 4.0. Es la diferencia que separa al nivel B del nivel de referencia. Si usted
toma el coeficiente del nivel B y suma la interseccin, obtiene la media para el nivel B: 4.0 + 8.5 = 4.5
Ejemplo de interpretacin del esquema de codificacin para un modelo de efectos de factores (-1, 0, +1) con un factor
Para obtener la siguiente salida:
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

En Respuestas, ingrese Respuesta.

3.

En Predictores categricos, ingrese Factor.

4.

Haga clic en Codificacin. En Codificacin para predictores categricos, elija (1, 0, +1).

5.

Haga clic en Aceptar en cada cuadro de dilogo.

Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante 5.000 0.333

15.00

0.000

Factor
A

-3.000 0.471

-6.36

0.000 1.33

-0.500 0.471

-1.06

0.316 1.33

Anlisis de Varianza
Fuente

GL SC Ajust. MC Ajust. Valor F Valor p

Regresin 2
Factor

86.00
86.00

Error

12.00

Total

11

98.00

43.000
43.000
1.333

32.25
32.25

0.000
0.000

Recuerde la media general y las medias de los niveles del factor:


Media general = 5.0
A = 2.0
B = 4.5
C = 8.5
La ecuacin de regresin es:
Ecuacin de regresin
Respuesta = 5.000 - 3.000 Factor_A - 0.500 Factor_B + 3.500 Factor_C
El efecto de cualquier nivel de factor especfico es la Media del nivel Media general. Por lo tanto,
Efecto del nivel A = 2.0 - 5.0 = -3.0
Efecto del nivel B = 4.5 - 5.0 = -0.5
Efecto del nivel C = 8.5 - 5.0 = 3.5
La interseccin es la media general.
El coeficiente de A es el efecto del nivel A del factor. Es la diferencia entre la media del nivel A y la media general.
El coeficiente de B es el efecto del nivel B del factor. Es la diferencia entre la media del nivel B y la media general.
Puede obtener el tamao del efecto para el nivel C sumando todos los coeficientes (excluyendo la interseccin) y multiplicando por un 1
negativo: -1 * [(-3.0) + (-0.5)] = 3.5
Para obtener las medias de los niveles, tome el tamao del efecto y smele la media general:
Media del nivel A = coeficiente de A + Interseccin = -3.0 + 5.0 = 2.0
Media del nivel B = coeficiente de B + Interseccin = -0.5 + 5.0 = 4.5
Media del nivel C = Interseccin - coeficiente de A - coeficiente de B = 5.0 (- 3.0) (-0.5) = 5.0 + 3.0 + 0.5 = 8.5

Interpretar los esquemas de codificacin para el caso de dos factores


Los datos para ejemplos con dos factores
Ahora consideremos un diseo balanceado de dos factores con tres niveles para el primer factor y dos para el segundo factor.

C1

C2 - T

C3 - T

Respuesta

Factor 1

Factor 2

Alto

C1

C2 - T

C3 - T

Respuesta

Factor 1

Factor 2

Bajo

Alto

Bajo

Alto

Bajo

Alto

Bajo

Alto

Bajo

Alto

10

Bajo

Los estadsticos descriptivos para ejemplos con dos factores


Examine los estadsticos descriptivos, concentrndose en las medias.

Filas: Factor 1 Columnas: Factor 2


Alto Bajo Todo
A

1.500 2.500 2.000

3.500 5.500 4.500

7.500 9.500 8.500

Todo

4.167 5.833 5.000

Contenido de la celda: Respuesta : Media


Ejemplo de interpretacin del esquema de codificacin para un modelo de medias de celdas (0, 1) con dos factores
Para obtener la siguiente salida:
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

En Respuestas, ingrese Respuesta.

3.

En Predictores categricos, ingrese Factor 1 y Factor 2.

4.

Haga clic en Codificacin. En Codificacin para predictores categricos, elija (0, 1).

5.

En Nivel de referencia, elija C para Factor 1 y Bajo para Factor 2.

6.

Haga clic en Aceptar en cada cuadro de dilogo.

Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante 9.333 0.391

23.88

0.000

Factor 1
A

-6.500 0.479 -13.58

-4.000 0.479

-8.36

0.000 1.33
0.000 1.33

Factor 2
Alto

-1.667 0.391

-4.26

0.003 1.00

Anlisis de Varianza
Fuente

GL SC Ajust. MC Ajust. Valor F Valor p

Regresin

94.3333

Factor 1

86.0000

Factor 2

8.3333

Error

3.6667

Falta de ajuste 2
Error puro
Total

6
11

31.4444
43.0000
8.3333

93.82
18.18

0.000
0.000
0.003

0.4583

0.6667
3.0000

68.61

0.3333

0.67

0.548

0.5000

98.0000

Recuerde que las medias de los niveles del factor son:


A = 2.0
B = 4.5
C = 8.5
La ecuacin de regresin estimada es:
Ecuacin de regresin
Respuesta = 9.333 - 6.500 Factor 1_A - 4.000 Factor 1_B + 0.0 Factor 1_C
- 1.667 Factor 2_Alto + 0.0 Factor 2_Bajo

Una vez ms, el coeficiente correspondiente al nivel A es 6.5. Esta sigue siendo la distancia que separa al nivel A del nivel de referencia
(nivel C). Si usted toma la media del nivel A y le resta la media del nivel de referencia, obtendr el coeficiente: 2 8.5 = -6.5.
De igual modo, el coeficiente correspondiente al nivel B sigue siendo 4.0. Es la distancia que separa al nivel B del nivel de referencia
para el factor 1. Si usted toma la media del nivel B y le resta la media del nivel de referencia, obtendr el coeficiente: 4.5 - 8.5 = -4.0.
Finalmente, el coeficiente correspondiente al nivel Alto del factor 2 es la distancia que separa a Alto del nivel de referencia para el
factor 2 (Bajo). Entonces, si usted toma la media del nivel Alto del factor 2 y le resta la media del nivel de referencia del factor 2, obtendr
el coeficiente: 4.1667 5.8333 = -1.667.
Ejemplo de interpretacin del esquema de codificacin para un modelo de efectos de factores (-1, 0, +1) con dos factores
Para obtener la siguiente salida:
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

En Respuestas, ingrese Respuesta.

3.

En Predictores categricos, ingrese Factor 1 y Factor 2.

4.

Haga clic en Codificacin. En Codificacin para predictores categricos, elija (1, 0, +1).

5.

Haga clic en Aceptar en cada cuadro de dilogo.

Coeficientes

EE del
Trmino

Coef coef. Valor T Valor p VIF

Constante 5.000 0.195

25.58

0.000

Factor 1
A

-3.000 0.276 -10.85

-0.500 0.276

-1.81

0.000 1.33
0.108 1.33

Factor 2
Alto

-0.833 0.195

-4.26

0.003 1.00

Anlisis de Varianza
Fuente
Regresin

GL SC Ajust. MC Ajust. Valor F Valor p


3

94.3333

Factor 1

86.0000

Factor 2

8.3333

31.4444
43.0000
8.3333

68.61
93.82
18.18

0.000
0.000
0.003

Error

3.6667

Falta de ajuste 2
Error puro
Total

6
11

0.4583

0.6667
3.0000

0.3333

0.67

0.548

0.5000

98.0000

Observe que con este esquema de codificacin los coeficientes no cambiaron con respecto al modelo
de un factor. Ahora usted tiene un coeficiente adicional para el segundo factor.
Ahora consideremos la media general y las medias de los niveles del factor:
Media general = 5.0
A = 2.0
B = 4.5
C = 8.5
Alto = 4.1667
Bajo = 5.8333
La ecuacin de regresin es:
Ecuacin de regresin
Respuesta = 5.000 - 3.000 Factor 1_A - 0.500 Factor 1_B + 3.500 Factor 1_C
- 0.833 Factor 2_Alto + 0.833 Factor 2_Bajo
El efecto de cualquier nivel de factor especfico es la Media del nivel Media general. Por lo tanto,
Efecto del nivel A = 2.0 - 5.0 = -3.0
Efecto del nivel B = 4.5 - 5.0 = -0.5
Efecto del nivel C = 8.5 - 5.0 = 3.5
Efecto del nivel Alto = 4.1667 5.0 = -0.883
Efecto del nivel Bajo = 5.8333 5.0 = 0.883
NOTA
Cuando usted solamente tenga dos niveles y tamaos de muestra iguales, el efecto del nivel tendr la misma magnitud, porque la media
est exactamente en el centro.
La interseccin es la media general.
Los coeficientes son el efecto para cada nivel del factor. Representan la diferencia entre la media de ese nivel y la media general.

Crear una grfica de lnea ajustada y un modelo de regresin que pasen por el origen
De manera predeterminada, Minitab incluye un trmino constante para las grficas de lnea ajustada y los modelos de regresin. Para
eliminar este trmino y que el modelo pase por el origen, siga estos pasos.
Crear una grfica de lnea ajustada que pase por el origen
Supongamos que la variable predictora (X) est en C1 y la variable de respuesta (Y) est en C2.
1.

Elija Grfica > Grfica de dispersin > Con regresin.

2.

En Variables Y, ingrese C2. En Variables X, ingrese C1.

3.

Haga clic en Vista Datos, luego haga clic en la ficha Regresin.

4.

Deseleccione Ajustar interseccin. Haga clic en Aceptar en cada cuadro de dilogo.

Crear un modelo de regresin que pase por el origen


Supongamos que la variable predictora (X) est en C1 y la variable de respuesta (Y) est en C2.
1.

Elija Estadsticas > Regresin > Regresin > Ajustar modelo de regresin.

2.

En Respuestas, ingrese C2. En Predictores continuos, ingrese C1.

3.

Haga clic en Modelo y deseleccione Incluir el trmino de constante en modelo.

4.

Haga clic en Aceptar en cada cuadro de dilogo.

Cuando Minitab ajusta el modelo con el trmino constante, el R-cuadrado es la proporcin de la variacin inicial, medida por la suma de
los cuadrados alrededor de la media de Y, que es explicada por la regresin. Para el modelo sin el trmino constante, el R-cuadrado es la
proporcin de la variacin alrededor del origen (es decir, alrededor del valor cero) explicada por la regresin. Esto significa que los
valores de R-cuadrado para los modelos con interseccin y sin interseccin no son similares.
Especficamente, el R-cuadrado para la regresin a travs del origen tiende a ser mayor que el R-cuadrado para la regresin con una
interseccin, incluso si la calidad del ajuste no es mejor. El modelo con interseccin calcula que las variaciones en el numerador (Ssreg) y
el denominador (Sstotal) de R-cuadrado se calculan alrededor de la media de respuesta, mientras que en el modelo sin interseccin, esas
variaciones se calculan alrededor de cero. Estos estadsticos no pueden utilizarse para la comparacin del desempeo con el modelo con
interseccin, porque el R-cuadrado del modelo sin intercepcin tiende a ser mayor que el R-cuadrado del modelo con intercepcin. Esto se
debe a que se utilizan sumas de los cuadrados (alrededor de cero) sin correccin. Si el R-cuadrado se calcula alrededor de la media de
respuesta en el modelo sin interseccin, a veces puede ser negativo.
Problemas con coeficientes de variacin pequeos en regresin

En regresin, los predictores con coeficientes de variacin pequeos que son casi constantes pueden causar problemas numricos. Por
ejemplo, la variable AO con valores desde 1970 hasta 1975 tiene un coeficiente de variacin pequeo y las diferencias numricas entre
las variables se encuentran en el cuarto dgito. El problema se agrava si AO se eleva al cuadrado. Usted podra restar una constante a los
datos, reemplazando AO por AOS DESDE 1970, que tiene valores de 0 a 5.

Si el coeficiente de variacin es moderadamente pequeo, se producir cierta prdida de exactitud estadstica. En este caso, Minitab le
avisa que el predictor es casi constante. Si el coeficiente de variacin es muy pequeo, Minitab elimina el predictor del modelo y muestra
un mensaje.
NOTA
Usted puede usar el subcomando TOLERANCE con el comando de sesin REGRESS para hacer que Minitab mantenga en el modelo un
predictor que tiene un coeficiente de variacin pequeo. Sin embargo, bajar la tolerancia podra ser peligroso debido a la posibilidad de
que se produzcan resultados numricamente inexactos.

Você também pode gostar