Escolar Documentos
Profissional Documentos
Cultura Documentos
IETA
Varianza
1. Introduccin
La Metodologa de Superficies de Respuesta (MSR) es una combinacin de anlisis de Regresin y Diseo
Experimental que fue introducida por Box y Wilson en 1951. Es una estrategia de experimentacin secuencial y modelacin que conduce a la localizacin de los valores ptimos de las variables independientes que
maximizan, minimizan o cumplen ciertas restricciones en la variable respuesta.
(1)
i xi +
i=1
i xi +
i=1
j1
k
ij xi xj + ,
(2)
j=2 i=1
donde representa el ruido o error observado en la respuesta Y , xi son factores cuantitativos observados.
En esta primera fase, se utilizan experimentos factoriales completos 2k o fraccionarios 2kp , con el fin de
estimar las respuestas medias para un modelo lineal o de primer orden, como el de la ecuacin (2). Se
recomienda generalmente agregar dos o ms observaciones en el nivel medio de cada uno de los factores
para estimar el error experimental y tener un mecanismo de evaluacin para saber si el modelo lineal es
apropiado.
En la siguiente etapa, una vez identificada la regin de respuesta ptima, los diseos factoriales completos
o fraccionarios a dos niveles no son suficientes, pues se requieren al menos tres niveles para cada factor
y el diseo debe de tener 1 + 2k + k(k 1)/2 puntos distintos para estimar los parmetros de un modelo
de regresin cuadrtica.
Modelo cuadrtico o de segundo orden:
Y = 0 +
i=1
i xi +
j1
k
j=2 i=1
ij xi xj +
ii x2 +
(3)
i=1
Entre los diseos experimentales que pueden ser utilizados en esta fase estn los experimentos factoriales
3k , sin embargo son considerados poco prcticos por el elevado nmero de combinaciones de tratamientos que requiere. Existen otros diseos desarrollados para la aproximacin a una superficie de segundo
orden, que no requieren tantas combinaciones de tratamientos, entre estos estn los diseos centrales
compuestos propuestos por Box y Wilson, y los diseos Box-Behnken.
Revista Varianza 11, 3136
31
M. G. Jimnez
Varianza
3.
IETA
La naturaleza secuencial e iterativa de la metodologa de Superficie de Respuesta requiere que en cada fase
se identifiquen los factores significativos, se realice un anlisis de adecuacin del modelo y se determine
la direccin en la cual se encuentran las condiciones ptimas de experimentacin.
Para identificar los factores que tienen mayor influencia en la respuesta y examinar la bondad de ajuste
del modelo se utiliza el anlisis de varianza. Mediante el mtodo de mxima pendiente se determina la
direccin en la cual se encuentra la regin ptima. El anlisis de la superficie ajustada se realiza mediante
el anlisis cannico, el cual permite determinar la naturaleza del punto estacionario.
En el caso de un modelo de segundo orden, la ecuacin escrita en forma matricial es:
Y = 0 + x b + x Bx
(4)
El punto crtico, si es que existe, ser un conjunto de condiciones en x tal que las derivadas parciales
son simultneamente cero, es decir:
Y
xi
Y
=
(x b + x Bx) = 0
x
x
b + 2Bx = 0,
siendo el punto estacionario
B 1 b
.
(5)
2
El punto estacionario puede ser un punto mximo, un punto mnimo o un punto de ensilladura (minimax),
la forma cannica de la funcin permite establecer su condicin.
x0 =
Y = 0 + x0 b/2.
Y = Y0 + 1 w12 + 2 w22 + + k wk2 ,
4.
Para comprender los diseos centrales compuestos, que se utilizarn en el ejemplo que se abordar, es
necesario mencionar que los factores generalmente se codifican, pues facilita los clculos, estandariza
las variables eliminando las unidades de medida de las variables originales y se incrementa la precisin al
estimar los coeficientes del modelo.
Los niveles codificados de los factores de un diseo factorial 2k se obtienen mediante la siguiente frmula:
xi = 2(Ai A)/R
i , donde Ai es el i-simo nivel del factor A, A es el nivel promedio del factor A y Ri es
el rango entre el valor ms alto y el ms bajo de del factor A. Con este procedimiento, se asigna valores
1 a las variables asociadas al arreglo factorial 2k .
Los diseos centrales compuestos son diseos de tratamientos factoriales 2k con 2k combinaciones adicionales llamadas puntos axiales y nc puntos centrales. Las coordenadas de los puntos axiales de los ejes
del factor codificado son (,0,0,. . .,0), (0, ,0,. . .,0), . . ., (0,0,0,. . ., ), y los puntos centrales son de
32
Artculo
IETA
Varianza
la forma (0,0,0,. . .,0). Dependiendo de la eleccin de en los puntos axiales, el diseo central compuesto
puede tener diferentes propiedades como ortogonalidad, rotabilidad y uniformidad. Se considerar solamente una propiedad deseable en estos diseos consistente en que la varianza de los valores estimados
sea constante en puntos equidistantes del centro del diseo. Esta propiedad llamada rotabilidad se logra
estableciendo = (2k )1/4 . As, el valor de para un diseo con dos factores es = 1,414 y para tres
factores = 1,682. La frmula para cambiar si se realizan rplicas del diseo o si se utiliza un diseo
factorial fraccionario.
5. Ejemplo de aplicacin
Para ejemplificar el procedimiento de superficies de respuesta se utilizarn los datos del ejercicio propuesto
5.6 del libro Response Surfaces de Andr I. Khuri, John A. Cornell.
Se aplicaron a parcelas experimentales de man dos tipos de fertilizantes, uno estndar de la combinacin
de Nitrgeno-Fsforo-Potasio (Factor A) y el otro un suplemento nutricional (Factor B), se observar los
efectos en el rendimiento del man medido en libras por parcela. Los niveles de cantidad (libras/parcela) de
cada fertilizante aplicado fueron determinados de acuerdo a lo requerido por el diseo central compuesto
rotable.
En el siguiente cuadro se presenta los datos utilizados, el procedimiento se realiz aplicando el software
Statgraphics, en el cual se eligi el diseo compuesto 2k estrella y el modelo cuadrtico para la estimacin
del rendimiento (Y ).
Cuadro 1 Niveles de los factores, variables codificadas y variable respuesta
Factor 1
50
120
50
120
35,5
134,5
85
85
85
85
Factor 2
15
15
25
25
20
20
12,9
27,1
20
20
x1
1
1
1
1
1,414
1,414
0
0
1,414
0
1,414
0
0
0
0
x2
1
1
1
1
0
14,22
7,9
16,49
15,73
16,3
Rendimiento (Y )
(lb/parcela)
Rplica 1 Rplica 2
7,52
8,12
12,37
11,84
13,55
12,35
16,48
15,32
8,63
9,44
12,57
7,33
17,4
17
16,3
Estimado
16,33250
3,35025
5,52991
4,89439
0,66750
3,82938
0,15200
Int. Confianza
0,97102
0,97102
0,97102
1,28454
1,37323
1,28454
0,44010
V.I.F.
1,000
1,000
1,225
1,000
1,225
1,000
Intervalos de confianza del 95.0 de confianza (intervalos) basados en el error puro con 2 g.l. (t = 4.30265).
33
M. G. Jimnez
Varianza
IETA
+
-
B:Factor_B
AA
A:Factor_A
BB
AB
0
10
15
Efecto estandarizado
20
25
El Cuadro 2 muestra las estimaciones para cada uno de los efectos estimados y las interacciones. Igualmente se muestran los intervalos de confianza del 95,0 % para los estimados. Note tambin que el factor
de inflacin de varianza (V.I.F.) ms grande, es igual a 1,225. Para un diseo perfectamente ortogonal,
todos los factores seran igual a 1.
Cuadro 3 Anlisis de varianza para el rendimiento (Y )
Fuente
A: Factor A
B: Factor B
AA
AB
BB
bloques
Falta de ajuste
Error puro
Total (corr.)
Suma de
Cuadrados
44,8965
122,319
54,754
0,891112
33,5179
0,11552
9,90654
0,40745
241,688
Gl
1
1
1
1
1
1
11
2
19
Cuadrado
Medio
44,8965
122,319
54,754
0,891112
33,5179
0,11552
0,900595
0,203725
Razn-F
Valor-P
220,38
600,41
268,76
4,37
164,52
0,57
4,42
0,0045
0,0017
0,0037
0,1716
0,0060
0,5300
0,1988
El cuadro 3 (ANOVA) particiona la variabilidad de Y (rendimiento) en valores separados para cada uno de
los efectos, prueba la significancia estadstica de cada efecto comparando su cuadrado medio contra un
estimado del error experimental. En este caso, 4 efectos tienen una valor-P menor que 0,05 indicando
que son significativamente diferentes de cero con un nivel de confianza del 95,0 %.
La prueba de falta de ajuste est diseada para determinar si el modelo seleccionado es adecuado para describir los datos observados o si se debera usar un modelo ms complicado. La prueba se realiza
comparando la variabilidad de los residuos del modelo actual con la variabilidad entre observaciones obtenidas en condiciones repetidas de los factores. Dado que el valor-P para la falta de ajuste en la tabla
ANOVA es mayor que 0,05, el modelo cuadrtico parece ser adecuado para los datos observados al nivel
de confianza del 95,0 %.
El estadstico R-cuadrado indica que el modelo, as ajustado, explica 95,7325 % de la variabilidad en Y .
El estadstico R-cuadrado ajustado, que es ms adecuado para comparar modelos con diferente nmero
de variables independientes, es 93,7629 %. El error estndar del estimado muestra que la desviacin
34
Artculo
IETA
Varianza
estndar de los residuos es 0,451359. El error medio absoluto (MAE) de 0,606823 es el valor promedio
de los residuos. El estadstico de Durbin-Watson (DW) prueba si en los residuos hay alguna correlacin
significativa basada en el orden en que se presentan los datos en el archivo. Puesto que el valor-P es
mayor que 5,0 %, no hay indicacin de autocorrelacin serial en los residuos con un nivel de significancia
del 5,0 %.
Cuadro 4 Coeficientes de regresin para VRen
Coeficiente
constante
A: Factor A
B: Factor B
AA
AB
BB
Estimado
16,3325
1,67512
2,76495
2,44719
0,33375
1,91469
15
Factor_B=1,0
13
Factor_B=-1,0
11
9
Factor_B=-1,0
-1,0
1,0
Factor_A
19
VRen
15
11
7
3
-1
-1,5
0,5
-1
-0,5
0,5
1,5
0
-0,5
-1
1,5 -1,5
Factor_B
Factor_A
35
M. G. Jimnez
Varianza
IETA
Factor B
0,0
1,0
2,0
3,0
4,0
5,0
0,0
0,913353
1,21709
1,51843
1,81851
2,11775
Prediccin para
Rendimiento (Y ) (lb)
16,3325
16,1837
9,61052
2,40338
19,8535
42,7373
Factor_B
17,0
0,5
0
-0,5
13,0 VRe n
-1,0
1,0
15,0
3,0
5,0
7,0
9,0
11,0
13,0
15,0
17,0
11,0
19,0
-1
9,0
1,0 3,0
-1,5
-1,5
-1
7,0
5,0
-0,5
0
Factor_A
0,5
1,5
1
B 1 b
=
2
2
2,447190 0,166875
0,166875 1,914690
]1 [
16,7512
2,76495
[
=
3,3934690
0,4262777
Y0 = 19,5422679
Se observa que el Rendimiento (Y ) es mayor para este punto.
Este es el trayecto, desde el centro de la regin experimental actual, a travs del cual la respuesta estimada
(Y ) cambia ms rpidamente con un cambio menor en los factores experimentales. Indica buenas caractersticas para ejecutar experimentos adicionales si el objetivo es incrementar el Rendimiento. Se nota que
la mayor respuesta (16,3325) se encuentra prxima al origen por tanto los nuevos puntos experimentales
deberan estar en esa direccin.
Referencias
[1] Box, George E. P.; Draper, Norman R. Empirical Model Building and Response Surfaces.
[2] Cochran, William G.; Cox, Getrude M. Diseos Experimentales.
[3] Draper, N. R. Center Points in Second Order Response Surface Design. Technometrics Vol.18.
[4] Heiberger, Richard M. Computation for the Analysis of Designed.
[5] Khuri, Andr I.; Cornell, John A. Response Surfaces Designs and Analyses.
36