Você está na página 1de 9

DISEÑO DE EXPERIMENTOS 

NOTAS DE CLASE: SEPTIEMBRE 2 DE 2008 
 
EL EXPERIMENTO FACTORIAL 
 
‐ Se utiliza cuando se quiere analizar el efecto de dos o más fuentes de interés (factores). 
‐ Permite analizar los efectos de las interacciones, además del efecto aislado de cada uno de 
los factores. 
Ejemplo:  Se quiere analizar la respuesta en la longitud de una pieza de determinado material, 
ante  variaciones  de  presión  y  temperatura.  En  la  tabla  siguiente  se  podrían  registrar  las 
observaciones correspondientes a cada tratamiento. 
                                                   TEMPERATURA (A)
  ALTA  BAJA 
 
ALTA
PRESIÓN (B) 
BAJA     
 
Acerca  de  la  notación:  Los  factores  se  representan  con  letras  mayúsculas,  mientras  que  los 
tratamientos se identifican mediante letras minúsculas. 
Si un investigador quisiera determinar el efecto de tres factores (A, B, C) con dos niveles cada 
uno,  podría  considerar  la  opción  de  experimentar  con  un  solo  factor  a  la  vez.  Sin  embargo, 
como  se  explicará  más  adelante,  no  es  ésta  la  forma  más  eficiente  de  conducir  un 
experimento. 
Si se realiza  el experimento de un  solo factor se consideraría de forma  directa los siguientes 
tratamientos: 
‐ Todos los factores en nivel bajo (1) 
‐ Factor A en nivel alto (a) 
‐ Factor B en nivel alto (b) 
‐ Factor C en nivel alto (c) 
Estos  tratamientos  están  representados  por  4  vértices  del  cubo  mostrado  en  la  siguiente 
figura: 
  c
 
 
 
(1)  b
 
 

 
Por otro lado,  si  el mismo  investigador  decidiera  realizar  un  experimento factorial  completo, 
adicionalmente tendría en cuenta los efectos combinados de los tratamientos. 
El  diagrama  siguiente  representa  todos  los  tratamientos  que  compondrían  el  experimento 
factorial completo con tres factores y dos niveles para cada factor: 
 
   c bc
 
ac  abc
 
(1) 
b

a  ab
 
Ahora cabe formularse la pregunta ¿Por qué el experimento factorial completo puede ser más 
eficiente que el experimento de un solo factor?  
Supóngase  que  se  quiere  experimentar  con  dos  factores  A  y  B,  uno  a  la  vez.  Si  cada  uno  de 
dichos factores se puede ajustar en dos niveles, sería necesario considerar 3 tratamientos (A 
en alto, B en alto, A y B en bajo). Para tener una base de comparación de la variabilidad dentro 
de  los  factores,  es  necesario  disponer  de  por  lo  menos  2  datos  en  cada  uno  de  los  tres 
tratamientos..  La  figura  siguiente  representa  los  tratamientos  y  los  valores  supuestos  de  los 
efectos. 
 
  27.9
  28.2

  B
 
  24.3 30.3
25.1 29.1
  A
 
Si  se  realizara  un  experimento  factorial,  se  consideraría  además  el  tratamiento  AB  en  nivel 
alto. Al incluir este tratamiento, sólo se requeriría de 1 observación en cada tratamiento, dado  
se dispondría de un par de observaciones en cada nivel de cada uno de los factores (ver figura 
siguiente). 
 
 
27.9 25.2
 
  B
 
  24.3 30.3
A
 
 
Además  de  necesitar  menos  datos  (solamente  cuatro  en  el  ejemplo  anterior),  este  plan 
experimental permitiría estudiar todas las combinaciones de los niveles de los factores, lo cual 
se permitiría analizar los efectos de las interacciones. 
 
El modelo estadístico que se utiliza para construir la tabla ANOVA del experimento factorial de 
dos factores: 
 
 
 
Donde, 
 
 : Respuesta observada cuando el factor A está en el i‐ésimo nivel (i = 1, 2, 3, …, a) y el 
factor B está en el j‐ésimo nivel ( j = 1, 2, …, b) para la k‐ésima réplica (k =  1, 2, …, n) 
 : Efecto medio global 
 : Efecto del i‐ésimo nivel del factor A 
 : Efecto del j‐ésimo nivel del factor B 
 : Efecto de la interacción entre   y   
 : Error 
 
En este modelo, el error total se puede descomponer en los siguientes elementos: 
 
SSTOTAL  = SSA + SSB + SSAB + SSERROR 
 
De manera similar se descomponen los grados de libertad: 
 
glTOTAL  = glA + glB + glAB + glERROR 
 
Si el factor A tiene a  niveles y el factor B tiene b niveles, 
 
glA : a ‐1  
glB : b ‐1 
glAB : (a ‐1)( b ‐1) 
 
Ejemplo: Se quiere analizar la dureza de un nuevo material ante cambios en la presión y la 
temperatura. Para cada tratamiento se registraron 2 observaciones. 
 
          Temperatura (oC) 
    100  200  300 
5 10 19
Presión  3 
7 12 17
(Bares) 
11  6  9 
  5 
8  8  10 
 
 Para realizar el ANOVA, se procede a obtener las sumatorias correspondientes los niveles de 
cada factor. 
 
5  10  14 
65 
7  12  17 
11  6  9 
52 
8  8  10 
31  36  50  117 
 
 
31 36 50 117
 
4 12
 
48.4 
 
65 52 117
 
6 12
 
14.08 
 Se calculará a partir de los errores de los tratamientos. Para ello se organiza la tabla de la 
siguiente manera: 
 
Tratamientos 
  100 ; 3  100; 5  200; 3  200; 5  300, 3  300; 5 
Réplica 1  5  11  10  6  14  9 
Réplica 2  7  8  12  8  17  10 
Suma  12  19  22  14  31  19 
Suma2  144  361  484  196  961  361 
 
 
144 361 484 196 961 361 117
 
2 12
 
112.75 
 
Dado que, 
 
 
112.75 48.5 14.08 
 
50.17 
 
Además, debe calcularse    . Éste se obtiene a partir del    . 
 
117
5 7 … 9 10  
12
 
128.25 
 
De esta manera,  
 
 
128.25 48.5 14.08 50.15 
 
Con esta información se construye la tabla ANOVA.  
 

 
 
 
De esta manera se obtienen los siguientes valores: 
 
FUENTE  SS  gl  Mean Square  F Calculada 
A  48.50  2  24.25  9.38 
B  14.08  1  14.08  5.44 
AB  50.15  2  25.08  9.69 
ERROR  15.52  6  2.59    
TOTAL  128.25  11       
 
FACTORIALES 2K 
En este experimento se analizan: 
• k Factores 
• 2 Niveles para cada factor 
 Por consiguiente, se consideran 2k  tratamientos. 
 
El siguiente diagrama representa los tratamientos de un factorial 2K , cuando k = 2. 
 
  ab

 
 
 
  (1)
a
 
En  este  tipo  de  experimento,  los  tratamientos  se  representan  como  se  indica  en  la  tabla 
siguiente. 
 
NIVELES DE LOS  NOTACIÓN DE LOS  FUENTES 
FACTORES  TRATAMIENTOS  A  B  AB 
FACTORES  A  B                
Bajo  Bajo   a0b0 = 1   ‐  ‐  + 
Alto  Bajo   a1b0 = a  +  ‐  ‐ 
TRATAMIENTOS 
Bajo  Alto   a0b1 = b  ‐  +  ‐ 
Alto  Alto    a1b1 =  ab  +  +  + 
 
Para analizar el impacto de cada fuente, se utiliza el concepto de contraste. El contraste i se 
refiere  la  variación  total  en  la  respuesta  ante  cambios  de  nivel  de  la  fuente  i.  Las  figuras 
siguientes representan los principales contrastes: 
 
Contraste de la fuente A: 
  b  ab 
 
 
 
(1) 
  a 
Contraste de la fuente B 
 
  b  ab 

 
 
 
  (1) a 
 
Contraste de las fuentes AB 
 
  b ab 
 
 
  a
(1) 
 
 
MODELO DE REGRESIÓN PARA EL EXPERIMENTO FACTORIAL 
 
Como  se  había  explicado  en  una  clase  anterior,  el  modelo  de  regresión  se  utiliza  cuando  los 
niveles de los factores son de carácter cuantitativo. Si se supone un modelo lineal, y se hacen n 
observaciones independientes y1 , y2 , …, yn , la i‐ésima observación puede representarse como 
 
…  
 
Mediante notación matricial, el modelo puede escribirse simplemente como 
 
 
Donde, 
 
⎡ y1 ⎤ ⎡β0 ⎤ ⎡1 X 11 X 12 ... X 1k ⎤ ⎡ε1 ⎤
⎢y ⎥ ⎢β ⎥ ⎢1 X X 22 ... X 2 k ⎥⎥ ⎢ε ⎥
Y= ⎢ 2⎥
  ,     β = ⎢ 1⎥
  ,     X = ⎢
21
,    ε = ⎢ 2⎥  
⎢:⎥ ⎢: ⎥ ⎢: : : : : ⎥ ⎢:⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ yn ⎦ ⎣β k ⎦ ⎣1 X n1 X n2 ... X nk ⎦ ⎣ε n ⎦
 
 
En el ámbito del diseño de experimentos, a   se le llama matriz de diseño. Dicha matriz está 
conformada por: 
‐ Una columna por cada estimador del modelo. 
‐ Una fila por cada observación en el experimento. 
 
Las ecuaciones de mínimos cuadrados para obtener los estimadores del modelo de regresión, 
están dadas por: 
 
( X' X)βˆ = X' Y  
Por lo tanto, 
βˆ = ( X' X) −1 X' Y  
 
Ejemplo:  A  través  de  un  experimento  factorial  22  se  intenta  determinar  la  respuesta  de  la 
dureza de un material ante cambios de presión y temperatura. 
 
  5 300; 5 
 

Presión
 
 
  3 
100  300
  Temperatura
 
Si emplea un modelo de regresión para este problema, la ecuación correspondiente es: 
 
 
 
Entonces, la matriz de diseño será: 
 
β0  β1 β2 β3
1  100  3  300 
1  100  3  300 
1  200  3  600 
1  200  3  600 
1  100  5  500 
1  100  5  500 
1  200  5  1000 
1  200  5  1000 
 
La matriz anterior es poco práctica por las siguientes razones: 
‐ Se  emplean  valores  con  diferentes  unidades  (dimensiones).  Por  lo  tanto,  no  será  posible 
realizar una comparación directa de los estimadores βi  , dado que estos también tendrán 
diferentes unidades. 
‐ La matriz no se puede operar con facilidad 
‐ Si se suprime una columna de esta matriz, cambiarán todos los términos de  ´  
 
Por  las  anteriores  razones,  se  procede  a  codificar  las  variables,  de  acuerdo  con  la  siguiente 
ecuación: 
 

 
2
 
Donde, 
 : Variable natural i 
  : Promedio de la variable i 
Rango: Rango de la variable i 
 
Por ejemplo, 
100 150

100/2
 
Al  efectuar  la  conversión  del  resto  de  las  variables,  la  matriz  de  diseño  queda  como  se 
muestra: 
β0  β1 β2 β3
1  ‐1  ‐1  +1 
1  ‐1  ‐1  +1 
1  +1  ‐1  ‐1 
1  +1  ‐1  ‐1 
1  ‐1  +1  ‐1 
1  ‐1  +1  ‐1 
1  +1  +1  +1 
1  +1  +1  +1 
 
Nota: Nuevamente, los valores de la columna β3  se pueden calcular como el producto de los 
valores de las columnas β1 y β2 en la misma fila. 
Al calcular la matriz   ´  , se obtiene: 
 
1/8  0  0  0 
0  1/8  0  0 
0  0  1/8  0 
0  0  0  1/8 
 
A la anterior, también se le denomina matriz de coeficientes varianza‐covarianza. Debido a que 
en  ella  sólo  los  únicos  elementos  diferentes  de  cero  se  encuentran  en  la  diagonal  principal, 
permite estimar el impacto aislado de cada fuente (columna). 
 
Si el vector de las respuestas Y registradas durante el experimento fuese: 
 
 

12 
16 
19 


11 

 
Entonces,  para  obtener  los  estimadores  del  modelo  de  regresión  bastará  con  hacer  las 
respectivas sustituciones en la expresión: 
 
βˆ = ( X' X) −1 X' Y  
 
De esta manera,    X' Y = 
 

 
 
Finalmente, al premultiplicar  ´  por el resultado anterior, se obtienen los estimadores 
del modelo de regresión: 
90 20 22
 
8 8 8
 
Estos estimadores también podrían haberse obtenido mediante el método de la pendiente. 
 

Você também pode gostar