Você está na página 1de 692

DISEO Y ANLISIS DE EXPERIMENTOS

,.,

DISENO Y " ANALISIS DE EXPERIMENTOS


segunda edicin

Douglas

c. Montgomerv

UNIVERSIDAD ESTATAL DE ARIZONA

~LIMUSAWILEY~

VERSIN AUTORIZADA EN ESPAllioL DE LA OBRA PUBLICADA EN INGLS CON EL TITULO: DESIGN AND ANALYSIS OF EXPERIMENTS

JOHN

WILEY & SONS, INC., NEW YORK, CHICHESTER, BRISBANE, SINGAPORE, TORONTO ANO WEINHEIM.

COLABORADOR EN LA TRADUCCiN: RODOLFO PIA GARC[A REVISiN: GRISELDAZETINAVLEZ INGENIERA QUIMICA POR LA FACULTAD DE QUIMICA DE LA UNIVERSIDAD NACIONAL AUTNOMA DE MxIco. DOCENTE EN MATEMTICAS. PROFESORA EN LA ESCUELA DE CIENCIAS QUfMICAS DE LA UNIVERSIDAD LA SALLE

LA PRESENTACiN Y DISPOSICiNEN CONJUNTODE


DISEO Y ANLISIS DE EXPERIMENTOS SONPROPIEDAD DELEDITOR. NINGUNA PARTE DE ESTOBRAPUEDE SER REPRODUCIDA O TRANSMITIDA, MEDIANTE NINGN SISTEMA O MTODO, ELECTRNICO O MECNICO (INCLUYENDO EL FOTOCOPIADO, LA GRABACiN O CUA~QUIER SISTEMA DE RECUPERACiN Y ALMACENAMIENTO DE INFORMACiN),SINCONSENTIMIENTO POR ESCRITO DEL EDITOR. D.ERECHOS RESERVADOS:

e 2004, EDITORIAL L1MUSA, S.A. DE C.V.


GRUPO NORIEGA EDITORES BALDERAS 95, MXICO, D.E C.P.

06040 85038050 01(800) 706 9100 5512 2903

Iiii Iimusa@.noriega.com.mx
"t- www.nonega.com.mx
CANIEM NM.

121

HECHO EN MXICO ISBN 968-18-6156-6

3.2

Prefacio

El presente libro es un texto de introduccin que aborda el diseo y anlisis de experimentos. Tiene como base los cursos sobre diseo de experimentos que he impartido durante ms de 25 aos en la Universidad Estatal de ATizona, la Universidad de Washington y el Instituto de 'Iecnologa de Georgia. Refleja asimismo los mtodos que he encontrado tiles en mi propia prctica profesional como consultor en ingeniera y estadstica en las reas generales de diseo de productos y procesos, mejoramiento de procesos e ingeniera de control de calidad. El libro est destinado a estudiantes que han llevado un primer curso de mtodos estadsticos. Este curso previo debe incluir por lo menos algunas de las tcnicas de estadstica descriptiva, la distribucin normal y una introduccin a los conceptos bsicos de los intervalos de confianza y la prueba de hiptesis para medias y varianzas. Los captulos 10 y 11 requieren un manejo elemental de lgebra matricial. Como los requisitos para llevar este curso son relativamente modestos, este libro puede usarse tambin en un segundo curso de estadstica enfocado en el diseo estadstico de experimentos para estudiantes de licenciatura de ingeniera, fsica, ciencias fsicas y qumicas, matemticas y otros campos de las ciencias. Durante varios aos he impartido un curso basado en este libro en el primer ao de estudios de posgrado de ingeniera. Los estudiantes de este curso provienen de los campos tradicionales de ingeniera, fsica, qumica, matemticas, investigacin de operaciones y estadstica. Tambin he usado este libro como base de un curso breve para el sector industrial sobre diseo de experimentos para tcnicos en ejercicio con una amplia diversidad en su formacin profesional. Se incluyen numerosos ejemplos que ilustran todas las tcnicas de diseo y anlisis. Estos ejemplos se basan en aplicaciones del diseo experimental en el mundo real, y se han tomado de diferentes campos de la ingeniera y las ciencias. Esto lleva al terreno de las aplicaciones a un curso acadmico para ingenieros y cientficos y hace de este libro una til herramienta de referencia para experimentadores de una amplia gama de disciplinas.

ACERCA DEL LIBRO


La presente edicin constituye una revisin sustancial del libro. He procurado mantener el equilibrio entre los tpicos de diseo y anlisis; sin embargo, hay varios temas y ejemplos nuevos; asimismo he reorganizado gran parte del material. En la presente edicin se resalta ms el uso de la computadora. Durante los ltimos aos han surgido varios productos de software excelentes que auxilian al experimentador en las fases del diseo y el anlisis para esta materia. He incluido las salidas de dos de estos productos, Minitab y Design-Expert, en varias partes del texto. Minitab es un paquete de software de estadstica de carcter general ampliamente disponible, que cuenta con tiles herramientas de anlisis de datos y que maneja bastante bien el anlisis de experimentos tanto con factores fijos como aleatorios (incluyendo el modelo mixto). Design-Expert es un paquete que se enfoca exclusivamente en el diseo experimental. Tiene muchas herramientas para la construccin y evaluacin de diseos, as como mltiples caractersticas de anlisis. En el sitio web de este libro puede obtenerse una versin para estudiantes de Design-Expert, y se hace una amplia recomendacin para usarlo. Exhorto a todos los profesores que usen este libro para que incorporen software de computadora en sus cursos. En mi caso particular, llevo a todas mis clases una compuv

vi

PREFACIO

tadora laptop y un monitor, y todos los diseos o tpicos del anlisis tratados en clase se ilustran con la computadora. En esta edicin destaco an ms la conexin entre el experimento y el modelo que puede desarrollar el experimentador a partir de los resultados del experimento. Los ingenieros (yen gran medida los cientficos de la fsica y la qumica) aprenden los mecanismos fsicos y sus modelos mecanicistas fundamentales al principio de su formacin acadmica, pero en la mayor parte de sus carreras profesionales tendrn que trabajar con estos modelos. Los experimentos diseados estadsticamente ofrecen al ingeniero una base vlida para desarrollar un modelo emptrico del sistema bajo estudio. Despus este modelo emprico puede manipularse (tal vez utilizando una superficie de respuesta o una grfica de contorno, o quiz matemticamente) como cualquier otro modelo de ingeniera. A lo largo de muchos aos de docencia he descubierto que este enfoque es muy eficaz para despertar el entusiasmo por los experimentos diseados estadsticamente en la comunidad de ingeniera. En consecuencia, al inicio del libro planteo la nocin de un modelo emprico fundamental para el experimento y las superficies de respuesta y destaco la importancia del mismo. Tambin me he esforzado por presentar mucho ms rpido los puntos crticos en los que intervienen los diseos factoriales. Para facilitar este objetivo, condens en un solo captulo (el 3) el material introductorio sobre los experimentos completamente aleatorizados con un solo factor y el anlisis de varianza. He ampliado el material sobre los diseos factoriales y factoriales fraccionados (captulos 5 al 9) en un es~ fuerzo por hacer que el material fluya con mayor eficiencia en la perspectiva tanto del lector como del profesor y por hacer mayor hincapi en el modelo emprico. El captulo sobre las superficies de respuesta (el 11) sigue inmediatamente al material sobre diseos factoriales y factoriales fraccionados y modelado de regresiones. He ampliado este captulo, agregando nuevo material sobre diseos ptimos alfabticos, experimentos con mezclas y el problema de un diseo paramtrico robusto. En los captulos 12 y 13 se analizan experimentos que incluyen efectos aleatorios, as como algunas aplicaciones de estos conceptos en diseos anidados y parcelas subdivididas. El captulo 14 es una descripcin general de temas importantes de diseo y anlisis: la respuesta no normal, el mtodo de Box-Cox para seleccionar la forma de una transformacin, y otras alternativas; experimentos factoriales no balanceados; el anlisis de covarianza, incluyendo covariables en un diseo factorial y mediciones repetidas. A lo largo del libro he destacado la importancia del diseo experimental como una herramienta que el ingeniero en ejercicio puede usar en el diseo y desarrollo de productos, as como en el desarrollo y mejoramiento de procesos. Se ilustra el uso del diseo experimental en el desarrollo de productos que sean robustos a factores ambientales y a otras fuentes de variabilidad. Considero que el uso del diseo experimental en las fases iniciales del ciclo de un producto puede reducir sustancialmente el tiempo y el costo de conducirlo, redundando en procesos y productos con un mejor desempeo en campo y una mayor confiabilidad que los que se desarrollan utilizando otros enfoques. El libro contiene ms material del que puede cubrirse sin prisas en un solo curso, por lo que espero que los profesores puedan variar el contenido de cada curso o bien estudiar ms a fondo algunos temas, dependiendo de los intereses de la clase. Al final de cada captulo hay un grupo de problemas (excepto en el 1). El alcance de estos problemas vara desde ejercicios de clculo, destinados a consolidar los fundamentas, hasta la ampliacin de principios bsicos. Mi curso en la universidad lo enfoco principalmente en los diseos factoriales y factoriales fraccionados. En consecuencia, por lo general cubro el captulo 1, el captulo 2 (muy rpido), la mayor parte del captulo 3, el captulo 4 (sin incluir el material sobre bloques incompletos y mencionando slo brevemente los cuadrados latinos), y trato en detalle los captulos 5 al8 sobre diseos factoriales con dos niveles y diseas factoriales fraccionados. Para concluir el curso, introduzco la metodologa de superficies de respuesta (captulo 11) y hago un repaso general de los modelos con efectos aleatorios (captulo 12) y los diseos anidados yen parcelas subdivididas (captulo 13). Siempre pido a los estudiantes que realicen un

PREFACIO

vii

proyecto semestral que consiste en disear, conducir y presentar los resultados de un experimento diseado estadsticamente. Les pido que trabajen en equipos, pues es la manera en que se realiza la mayor parte de la experimentacin industrial. Deben hacer la presentacin de los resultados de su proyecto de manera oral y por escrito.

MATERIAL SUPLEMENTARIO DEL TEXTO


Con esta edicin he preparado un suplemento para cada captulo del libro. En este material suplementario se desarrollan temas que no pudieron tratarse con mayor detalle en el libro. Thmbin presento algunos temas que no aparecen expresamente en el libro, pero que para algunos estudiantes y profesionistas en ejercicio podra resultar de utilidad una introduccin de los mismos. El nivel matemtico de parte de este material es ms elevado que el del texto. Estoy consciente de que los profesores usan este libro con una amplia variedad de audiencias, y es posible que algunos cursos de diseo ms avanzados puedan beneficiarse al incluir varios de los temas del material suplementario del texto. Este material est en formato electrnico en el CD/ROM del profesor (disponible slo en ingls) y se encuentra en el sitio web de este libro.

SITIOWEB
En el sitio web http://www.wiley.com/legacylcollege/engin/montgomery316490/student/student.htmlest disponible el material de apoyo para profesores y estudiantes. Este sitio se usar para comunicar informacin acerca de innovaciones y recomendaciones para el uso eficaz de este texto. El material suplementario del texto puede encontrarse en este sitio, junto con versiones electrnicas de las series de datos utilizadas en los ejemplos y los problemas de tarea, un plan de estudios del curso y proyectos semestrales del curso en la Universidad Estatal de Atizona.

RECONOCIMIENTOS
Expreso mi agradecimiento a los muchos estudiantes, profesores y colegas que han usado antes este libro y quienes me han hecho llegar tiles sugerencias para esta revisin. Las contribuciones de los doctores Raymond H. Myers, G. Geoffrey Vining, Denns Lin, John Ramberg, Joseph Pignatiello, Lloyd S. Nelson, Andre Khuri, Peter Nelson, John A. Cornell, George C. Runger, Bert Keats, Dwayne Rollier, Norma Hubele, Cynthia Lowry, Russell G. Heikes, Harrison M. Wadsworth, William W. Hines, Arvind Shah, Jane Arnmons, Diane Schaub, Pat Spagon y William DuMouche, y los seores Mark Anderson y Pat Whitcomb fueron particularmente invaluables. Mi Jefe de Departamento, el doctor Gary Hogg, ha proporcionado un ambiente intelectualmente estimulante en el cual trabajar. Las contribuciones de los profesionistas en activo con quienes he trabajado han sido invaluables. Es imposible mencionarlos a todos, pero algunos de los principales son Dan McCarville y Lisa Custer de Motorola; Richard Post de Intel; 'Iom Bingham, Dick Vaughn, Julin Anderson, Richard Alkire y Chase Neilson de Boeing Company; Mike Goza, Don Walton, Karen Madison, Jeff Stevens y Bob Kohm de Alcoa; Jay Gardiner, John Butora, Dana Lesher, Lolly Marwah, Paul Tobias y Leon Mason de IBM; Elizabeth A. Peck de The Coca-Cola Company; Sadri Khalessi y Franz Wagner de Signetics; Robert v: Baxley de Monsanto Chemicals; Harry Peterson-Nedry y Russell Boyles de Precision Castparts Corporation; Bill New y Randy Schmid de Allied-Signal Aerospace; John M. Fluke, hijo, de John Fluke Manufacturing

viii

PREFACIO

Company; Larry Newton y Kip Howlett de Georgia-Pacific, y Ernesto Ramos de BBN Software Products Corporation. Me encuentro en deuda con el profesor E.S. Pearson y con Biometrika, John Wiley & Sons, Prentice-Hall, The American Statistical Association, The Institute of Mathematical Statistics y los editores de Biometrics por el permiso para usar material protegido por derechos de autor. Lisa Custer realiz un excelente trabajo de presentacin de las soluciones que aparecen en el CD/ROM del profesor, y la doctora Cheryl Jennings realiz una correccin de estilo eficaz y de suma utilidad. Estoy agradecido con la Office of Naval Research, la National Science Foundation, las compaas integrantes de NSF/lndustrylUniversity Cooperative Research Center in Ouality and Reliability Engineering de la Universidad Estatal de Arizona, e IBM Corporation por apoyar gran parte de mis investgaciones de estadstica y diseo experimental de ingeniera. Douglas C. Montgomery Tempe, Arizona

Contenido

Captulo 1.
11
1-2

Introduccin
Estrategia de experimentacin Algunas aplicaciones tpicas del diseo experimental Principios bsicos Pautas generales para disear experimentos Breve historia del diseo estadstico Resumen: uso de tcnicas estadsticas en la experimentacin

1
1

1-3
1-4

8 11
13

15
1-6

17
19

Captulo2.
2-1 2-2 2-3 2-4

Experimentos comparativos simples


Introduccin Conceptos estadsticos bsicos Muestreo y distribuciones de muestreo Inferencias acerca de las diferencias en las medias, diseos aleatorizados 2-4.1 Prueba de hiptesis 2-4.2 Eleccin del tamao de la muestra 2-4.3 Intervalos de confianza 2-4.4 Caso en que :t; a~ 2-4.5 Caso en que se conocen y a~ 24.6 Comparacin de una sola media con un valor especificado 2-4.7 Resumen Inferencias acerca de las diferencias en las medias, diseos de comparaciones pareadas 2-5.1 El problema de las comparaciones pareadas 2-5.2 Ventajas del diseo de comparaciones pareadas Inferencias acerca de las varianzas de distribuciones normales Problemas

21
21 22 26

33
33 40 42

ai

ai

44 44 45
46 47 47 50 51 54

2-5

2-6 27

Captulo 3.
31
3-2

Experimentos con un solo factor: el anlisis de varianza


Un ejemplo El anlisis de varianza Anlisis del modelo con efectos fijos 33.1 Descomposicin de la suma de cuadrados total 3-3.2 Anlisis estadstico 3-3.3 Estimacin de los parmetros del modelo 33.4 Datos no balanceados

60

60
63

33

65
66

69
74 75

ix

CONTENIDO

3-4

3-5

3-6 3-7

3-8 3-9

3-10

3-11

Verificacin de la adecuacin del modelo 3-4.1 El supuesto de normalidad 3-4.2 Grfica de los residuales en secuencia en el tiempo 3-4.3 Grfica de los residuales contra los valores ajustados 3-4.4 Grficas de los residuales contra otras variables Interpretacin prctica de los resultados 3-5.1 Un modelo de regresin 3-5.2 Comparaciones entre las medias de los tratamientos 3-5.3 Comparaciones grficas de medias 3-5.4 Contrastes 3-5.5 Contrastes ortogonales 3-5.6 Mtodo de Scheff para comparar todos los contrastes 3-5.7 Comparacin de pares de medias de tratamientos 3-5.8 Comparacin de medias de tratamientos con un control Muestra de salida de computadora Determinacin del tamao de la muestra 3-7.1 Curvas de operacin caracterstica 3-7.2 Especificacin de un incremento de la desviacin estndar 3-7.3 Mtodo para estimar el intervalo de confianza Identificacin de efectos de dispersin El enfoque de regresin para el anlisis de varianza 3-9.1 Estimacin de mnimos cuadrados de los parmetros del modelo 3-9.2 Prueba general de significacin de la regresin Mtodos no paramtricos en el anlisis de varianza 3-10.1 La prueba de Kruskal-Walls 3-10.2 Comentarios generales sobre la transformacin de rangos Problemas

76 77 79 80

86 86
87 88 89 90 93

95
96

103
104 107 107 109 110 110 112 112 114

116
116 118 119

Captulo 4.
4-1

Bloques aleatorizados, cuadrados latinos y diseos relacionados


Diseo de bloques completos aleatorizados 4-1.1 Anlisis estadstico del diseo de bloques completos aleatorizados 4-1.2 Verificacin de la adecuacin del modelo 4-1.3 Otros aspectos del diseo de bloques completos aleatorizados 4-1.4 Estimacin de los parmetros del modelo y la prueba general de significacin de la regresin Diseo de cuadrado latino Diseo de cuadrado grecolatino Diseos de bloques incompletos balanceados 4-4.1 Anlisis estadstico del diseo de bloques incompletos balanceados 4-4.2 Estimacin de mnimos cuadrados de los parmetros 4-4.3 Recuperacin de informacin interbloques en el diseo de bloques incompletos balanceados Problemas

126
126 127 135 136 141 144 151 154

4-2 4-3 4-4

155 159
161

4-5

164

CONTENIDO

xi

Captulo S.
5-1 52 5-3

Introduccin a los diseos factoriales


Definiciones y principios bsicos La ventaja de los diseos factoriales Diseo factorial de dos factores 5-3.1 Un ejemplo 53.2 Anlisis estadstico del modelo con efectos fijos 5-3.3 Verificacin de la adecuacin del modelo 5-3.4 Estimacin de los parmetros del modelo 53.5 Eleccin del tamao de la muestra 5-3.6 El supuesto de no interaccin en un modelo de dos factores 5-3.7 Una observacin por celda Diseo factorial general Ajuste de curvas y superficies de respuesta Formacin de bloques en un diseo factorial Problemas

170
170 174 175 175 177 185 185 189 190 191 194 201 207 211

5-4 55 5-6 5-7

Captulo 6.
6-1 6-2 63 6-4 6-5 6-6 6-7

Diseo factorial 2"


Introduccin El diseo 2z El diseo 23 El diseo general 2k Una sola rplica del diseo 2k Adicin de puntos centrales en el diseo 2k Problemas

218
218 219 228 242 244 271 276

Captulo 7.
7-1 72

Formacin de bloques y confusin en el diseo factorial 2"


Introduccin Formacin de bloques de un diseo factorial 2k con rplicas Confusin del diseo factorial 2k Confusin del diseo factorial 2" en dos bloques Confusin del diseo factorial 2k en cuatro bloques Confusin del diseo factorial 2" en 'JJ' bloques Confusin parcial Problemas

287
287 287 288 289 296 297 299 301

7-3
7-4 7-5 7-6 7-7 7-8

Captulo 8.
81 8-2 8-3 8-4 8-5 8-6 8-7 8-8

Diseos factoriales fraccionados de dos niveles


Introduccin La fraccin un medio del diseo 2k La fraccin un cuarto del diseo 2k El diseo factorial fraccionado 2k -p general Diseos de resolucin III Diseos de resolucin IV y V Resumen Problemas

303
303 304 317 326 337 347 349 350

xii

CONTENIDO

Captulo 9.
9-1

Diseos factoriales y factoriales fraccionados con tres niveles y con niveles mixtos
Diseo factorial 3 9-1.1 Notacin y motivacin del diseo 3k 9-1.2 El diseo 32 91.3 El diseo 33 9-1.4 El diseo general S" Confusin en el diseo factorial 3k 9-2.1 El diseo tactoral J" en tres bloques 9-2.2 El diseo factorial 3k en nueve bloques 9-2.3 El diseo factorial S"en Y bloques Rplicas fraccionadas del diseo factorial 3k 9-3.1 La fraccin un tercio del disefio factorial 3k 9-3.2 Otros diseos factoriales fraccionados 3k - p Diseos factoriales con niveles mixtos 9-4.1 Factores con dos y tres niveles 9-4.2 Factores con dos y cuatro niveles Problemas
k

363

363

363 365
367 372

9-2

373
373 377

378
379 379

9-3

382
383

9-4

384
385 387
392

9-5

Capitulo 10.
10-1 10-2 10-3 10-4

J\iuste de modelos de regresin


Introduccin Modelos de regresin lineal Estimacin de los parmetros en modelos de regresin lineal Prueba de hiptesis en la regresin mltiple 10-4.1 Prueba de significacin de la regresin 10-4.2 Pruebas de los coeficientes de regresin individuales y de grupos de coeficientes Intervalos de confianza en regresiones mltiples 10-5.1 Intervalos de confianza para los coeficientes de regresin individuales 10-5.2 Intervalo de confianza para la respuesta media Prediccin de nuevas observaciones de la respuesta Diagnsticos del modelo de regresin 10-7.1 Residuales escalados y PRESS 10-7.2 Diagnsticos de influencia Prueba de falta de ajuste Problemas

392

393
394 409

409
412

10-5

415
415

416
416 416 417

10-6
10-7

420
421 422

10-8 10-9

Captulo 11.
11-1 11-2 11-3

Mtodos de superficies de respuesta y otros enfoques para la optimizacin de procesos


Introduccin a la metodologa de superficies de respuesta Mtodo del ascenso ms pronunciado Anlisis de una superficie de respuesta de segundo orden 11-3.1 Localizacin del punto estacionario 11-3.2 Caracterizacin de la superficie de respuesta 11-3.3 Sistemas de cordilleras

427
427

430
436 436 440 447

CONTENIDO

xi
448 455 455 456 462 466

11-4

11-5 11-6 11-7

11-8
Captulo 12.
12-1 122 12-3 12-4 12-5 12-6 12-7

11-3.4 Respuestas mltiples Diseos experimentales para ajustar superficies de respuesta 11-4.1 Diseos para ajustar el modelo de primer orden 114.2 Diseos para ajustar el modelo de segundo orden 11-4.3 Formacin de bloques en los diseos de superficie de respuesta 11-4.4 Diseos (ptimos) generados por computadora Experimentos con mezclas Operacin evolutiva Diseo robusto 11-7.1 Antecedentes 11-7.2 El enfoque de la superficie de respuesta para el diseo robusto Problemas

472
484

488 488 492 500

Experimentos con factores aleatorios


Modelo con efectos aleatorios Diseo factorial de dos factores aleatorios Modelo mixto con dos factores Determinacin del tamao de la muestra con efectos aleatorios Reglas para los cuadrados medios esperados Pruebas F aproximadas Algunos temas adicionales sobre la estimacin de los componentes de la varianza 12-7.1 Intervalos de confianza aproximados para los componentes de la varianza 12-7.2 Mtodo de grandes muestras modificado 12-7.3 Estimacin de mxima verosimilitud de componentes de la varianza Problemas

511

511
517 522

529
531 535

543 543
545

12-8

547 552

Captulo 13.
13-1

Diseos anidados y en parcelas subdivididas


Diseo anidado de dos etapas 13-1.1 Anlisis estadstico 13-1.2 Verificacin del diagnstico 13-1.3 Componentes de la varianza 13-1.4 Diseos anidados por etapas Diseo anidado general de m etapas Diseos con factores anidados y factoriales Diseo de parcelas subdivididas Otras variantes del diseo de parcelas subdivididas 13-5.1 Diseo de parcelas subdivididas con ms de dos factores 13-5.2 Diseo de parcelas con doble subdivisin 13-5.3 Diseo de parcelas subdivididas en franjas Problemas

557 557
558 563 565
566

13-2 13-3 13-4 13-5

566 569 573


578

578 580 583


584

13-6

Captulo 14.
14-1

Otros tpicos de diseo y anlisis


Respuestas y transformaciones no normales

590
590

xiv

CONTENIDO

14-1.1 Seleccin de una transformacin: el mtodo de Box-Cox 14-1.2 Modelo lineal generalizado 14-2 Datos no balanceados en un diseo factorial 14-2.1 Datos proporcionales: un caso sencillo 14-2.2 Mtodos aproximados 14-2.3 Mtodo exacto 14-3 Anlisis de covarianza 14-3.1 Descripcin del procedimiento 14-3.2 Solucin por computadora 14-3.3 Desarrollo mediante la prueba general de significacin de la regresin 14-3.4 Experimentos factoriales con covariables 14-4 Mediciones repetidas 14-5 Problemas

590 594 600 600 601 604 604 605 614 616 619 624 627

Bibliografa

630 637
Distribucin normal estndar acumulada Puntos porcentuales de la distribucin t Puntos porcentuales de la dstrbucin z? Puntos porcentuales de la distribucin F Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos fijos Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos aleatorios Rangos significativos para la prueba del rango mltiple de Duncan Puntos porcentuales del estadstico del rango studentizado Valores crticos para la prueba de Dunnett para comparar tratamientos con un control Coeficientes de polinomios ortogonales Nmeros aleatorios Relaciones de alias para diseos factoriales fraccionados 2k - P con k Glosario para el uso de Design Expert
S;

Apndice Thbla l. Thbla 11.


'labia ID. 'labia Iv. 'labia V. 'labia VI. Thbla VII. ThblaVlII. Thbla IX. ThblaX. ThblaXI. Thbla XII. ThblaXIlI. ndice

638
640

641

642
647 651 655 656 658 661 15 Yn s 64 662 663
680

681

Introduccin

1..1 ESTRATEGIA DE EXPERIMENTACIN


Investigadores de prcticamente todos los campos de estudio llevan a cabo experimentos, por lo general para descubrir algo acerca de un proceso O sistema particular. En un sentido literal, un experimento es una prueba. En una perspectiva ms formal, un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida. Este libro trata de la planeacin y realizacin de experimentos y del anlisis de los datos resultantes a fin de obtener conclusiones vlidas y objetivas. La atencin se centra en los experimentos de ingeniera y las ciencias fsicas y qumicas. En ingeniera, la experimentacin desempea un papel importante en el diseo de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. El objetivo en muchos casos sera desarrollar un proceso robusto, es decir, un proceso que sea afectado en forma mnima por fuentes de variabilidad externas. Como ejemplo de un experimento, suponga que un ingeniero metalrgico tiene inters en estudiar el efecto de dos procesos diferentes de endurecimiento, el templado en aceite y el templado en agua salada, sobre una aleacin de aluminio. El objetivo del experimentador es determinar cul de las dos soluciones de templado produce la dureza mxima para esta aleacin particular. El ingeniero decide someter varios ejemplares o muestras para ensayo de la aleacin a cada medio de templado y medir la dureza de los ejemplares despus del templado. Para determinar cul de las soluciones es la mejor, se usar la dureza promedio de los ejemplares tratados en cada solucin de templado. Al examinar este sencillo experimento salen a relucir varias cuestiones importantes: 1. Estas dos soluciones son los nicos medios de templado de inters potencial? 2. Hay en este experimento otros factores que podran afectar la dureza y que deberan investigarse o controlarse? 3. Cuntas muestras para ensayo de la aleacin debern probarse en cada solucin de templado? 4. Cmo debern asignarse las muestras para ensayo de prueba a las soluciones de templado y en qu orden debern colectarse los datos?

CAP1lJLO 1 INTRODUCCIN

S. Qu mtodo de anlisis de datos deber usarse? 6. Qu diferencia en la dureza promedio observada entre los dos medios de templado se considerar importante? Thdas estas preguntas, y tal vez muchas ms, tendrn que responderse satisfactoriamente antes de llevar a cabo el experimento. En cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen en gran medida de la manera en que se recabaron los datos. Para ilustrar este punto, suponga que el ingeniero metalrgico del experimento anterior utiliz ejemplares de una hornada para el templado en aceite y ejemplares de una segunda hornada para el templado en agua salada. Entonces, cuando compare la dureza promedio, el ingeniero no podr saber qu parte de la diferencia observada es resultado de la solucin de templado y qu parte es el resultado de diferencias inherentes entre las hornadas.' Por lo tanto, el mtodo utilizado para recabar los datos ha afectado de manera adversa las conclusiones que pueden sacarse del experimento. En general, los experimentos se usan para estudiar el desempeo de procesos y sistemas. El proceso o sistema puede representarse con el modelo ilustrado en la figura 1-1. El proceso puede por lo general visualizarse como una combinacin de mquinas, mtodos, personas u otros recursos que transforman cierta entrada (con frecuencia un material) en una salida que tiene una o ms respuestas observables. Algunas variables del proceso r., x z, ..., x p son controlables, mientras que otras Z, Zz, .o., Zq son no controlables (aunque pueden serlo para los fines de una prueba). Los objetivos del experimento podran.comprender los siguientes: 1. Determinar cules son las variables que tienen mayor influencia sobre la respuesta y. 2. Determinar cul es el ajuste de lasx que tiene mayor influencia para que y est casi siempre cerca del valor nominal deseado. 3. Determinar cul es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea reducida. 4. Determinar cul es el ajuste de lasx que tiene mayor influencia para que los efectos de las variables no controlables Z, zz, ..., Zq sean mnimos. Como se puede ver por el anlisis anterior, los experimentos incluyen muchas veces varios factores. Habitualmente, uno de los objetivos de la persona que realiza un experimento, llamada el experimenta. dor, es determinar la influencia que tienen estos factores sobre la respuesta de salida del sistema. Al enfo-

Factores controlables

.>::,

'>::2

Entradas

Proceso

Salida

%,

2:2

2:q

Factores no controlables

Figura 11 Modelo general de un proceso o sistema.

Un especialista en diseo experimental dira que los efectos de los medios de templado y las hornadas seconfundieron; es decir, los efectos de estos dos factores no pueden separarse.

1-1 ESTRATEGIA DEEXPERIMENTACIN

que general para planear y llevar a cabo el experimento se le llama estrategia de experimentacin. Existen varias estrategias que podra usar un experimentador. Se ilustrarn algunas de ellas con un ejemplo muy sencillo. Al autor le gusta mucho jugar golf. Desafortunadamente, no le agrada practicar, por lo que siempre busca la manera ms sencilla para bajar su puntuacin. Algunos de los factores que l considera importantes, o que podran influir en su puntuacin, son los siguientes: 1. 2. 3. 4. 5. 6. 7. 8. El tipo de palo usado (grande o normal). El tipo de pelota usada (de goma de balata o de tres piezas). Caminar cargando los palos de golf o hacer el recorrido en un carrito. Beber agua o cerveza durante el juego. Jugar en la maana o en la tarde. Jugar cuando hace fro o cuando hace calor. El tipo de spikes usados en los zapatos de golf (metlicos o de hule). Jugar en un da con viento o en uno apacible.

Evidentemente, hay muchos otros factores que podran considerarse, pero supongamos que stos son los de inters primario. Adems, teniendo en cuenta su larga experiencia en el juego, el autor decide que los factores 5 al8 pueden ignorarse; es decir, estos factores no son importantes porque sus efectos son tan pequeos que carecen de valor prctico. Los ingenieros y los investigadores deben tomar a menudo este tipo de decisiones acerca de algunos de los factores que examinan en experimentos reales. Consideremos ahora cmo podran probarse experimentalmente los factores 1 al4 para determinar su efecto sobre la puntuacin del autor. Suponga que en el curso del experimento pueden jugarse un mximo de ocho rondas de golf. Un enfoque consistira en seleccionar una combinacin arbitraria de estos factores, probarlos y ver qu ocurre. Por ejemplo, suponga que se selecciona la combinacin del palo grande, la pelota de goma de balata, el carrito y el agua, y que la puntuacin resultante es 87. Sin embargo, durante la ronda el autor not varios tiros descontrolados con el palo grande (en el golf, grande no siempre es sinnimo de bueno) y, en consecuencia, decide jugar otra ronda con el palo normal, manteniendo los dems factores en los mismos niveles usados anteriormente. Este enfoque podra continuar de manera casi indefinida, cambiando los niveles de uno (o quiz dos) de los factores para la prueba siguiente, con base en el resultado de la prueba en curso. Esta estrategia de experimentacin, conocida como enfoque de la mejor conjetura, es comn entre ingenieros y cientficos. Funciona de manera adecuada si los experimentadores cuentan con una gran cantidad de conocimientos tcnicos o tericos del sistema que estn estudiando, as como amplia experiencia prctica. Sin embargo, el enfoque de la mejor conjetura presenta al menos dos desventajas. Primera, supngase que la mejor conjetura inicial no produce los resultados deseados. Entonces el experimentador tiene que hacer otra conjetura acerca de la combinacin correcta de los niveles de los factores. Esto podra continuar por mucho tiempo, sin garanta alguna de xito. Segunda, supngase que la mejor conjetura inicial produce un resultado satisfactorio. Entonces, el experimentador se ve tentado a suspender las pruebas, aun cuando no hay ninguna garanta de que se ha encontrado la mejor solucin. Otra estrategia de experimentacin muy comn en la prctica es el enfoque de un factor a la vez. Este mtodo consiste en seleccionar un punto de partida, o lnea base de los niveles, para cada factor, para despus variar sucesivamente cada factor en su rango, manteniendo constantes los factores restantes en el nivel base. Despus de haber realizado todas las pruebas, se construye por lo general una serie de grficas en las que se muestra la forma en que la variable de respuesta es afectada al variar cada factor manteniendo los dems factores constantes. En la figura 1-2 se presenta una serie de grficas para el experimento del golf, utilizando como lnea base los niveles de los cuatro factores: el palo grande, la pelota de goma de

CAPTULO 1 INTRODUCCIN

JI~ !~ J~l~
G (grande) N (normal) Palo GB (Q9ITli1 de balata) TP (tras piools)

C (caminando) EC(en

Pelote

Manera de des;J1~

A (agua)

e (cerveza)

Bebida

Figura 12 Resultados de la estrategia de un factor a la vez para el experimento de golf.

balata, caminar y beber agua. La interpretacin de esta grfica es directa; por ejemplo, debido a que la pendiente de la curva de la manera de desplazarse es negativa, se concluira que hacer el recorrido en el carrito mejora la puntuacin. Con base en estas grficas de un factor a la vez, la combinacin ptima que se seleccionara sera el palo normal, desplazarse en el carrito y beber agua. El tipo de pelota de golf aparentemente carece de importancia. La desventaja principal de la estrategia de un factor a la vez es que no puede tomar en consideracin cualquier posible interaccin entre los factores. Hay una interaccin cuando uno de los factores no produce el mismo efecto en la respuesta con niveles diferentes de otro factor. En la figura 1-3 se muestra una interaccin entre los factores del tipo de palo y la bebida para el experimento del golf. Observe que si el autor utiliza el palo normal, el tipo de bebida consumida prcticamente no tiene efecto alguno sobre su puntuacin, pero si utiliza el palo grande, se obtienen resultados mucho mejores cuando bebe agua en lugar de cerveza. Las interacciones entre factores son muy comunes y, en caso de existir, la estrategia de un factor a la vez casi siempre producir resultados deficientes. Muchas personas no perciben esto y, en consecuencia, los experimentos de un factor a la vez son comunes en la prctica. (De hecho, algunas personas piensan que esta estrategia se relaciona con el mtodo cientfico o que es un principio "slido" de ingeniera.) Los experimentos de un factor a la vez siempre son menos eficientes que otros mtodos basados en un enfoque estadstico del diseo experimental. El tema se analizar con mayor detalle en el captulo 5. El enfoque correcto para trabajar con varios factores es conducir un experimento factorial. Se trata de una estrategia experimental en la que los factores se hacen variar en conjunto, en lugar de uno a la vez.

TP(tras piools)

A (agua)

e (celWZal
llpo de bebida

GB (goma de balata)'--__" - - - - - - - : - - - ' - - - - : - G (grande) N (normal) llpode palo

Figura 1-3 Interaccin entre el tipo de palo y el tipo de bebida para el experimento del golf.

Figura 1-4 Experimento factorial de dos factores que incluye el tipo de palo y el tipo de pelota.

1-1 ESTRATEGIA DE EXPERIMENTACIN

El concepto de diseo experimental factorial es de suma importancia, y varios captulos de este libro se dedican a presentar experimentos factoriales bsicos, as como algunas variantes y casos especiales tiles. Para ilustrar la forma en que se lleva a cabo un experimento factorial, considere el experimento de golf y suponga que slo dos de los factores son de inters, el tipo de palo y el tipo de pelota. En la figura 1-4 se muestra un experimento factorial para estudiar los efectos conjuntos de estos dos factores sobre la puntuacin de golf del autor. Observe que en este experimento factorial ambos factores tienen dos niveles y que en el diseo se usan todas las combinaciones posibles de los niveles de ambos factores. Geomtricamente, las cuatro corridas forman los vrtices de un cuadrado. A este tipo particular de experimento factorial se le llama diseo factorial 22 (dos factores, cada uno con dos niveles). Debido a que el autor considera razonable suponer que jugar ocho rondas de golf para investigar estos factores, un plan factible sera jugar dos rondas de golf con cada combinacin de los niveles de los factores, como se muestra en la figura 1-4. Un diseador de experimentos dira que se han hecho dos rplicas del diseo. Este diseo experimental permitira al experimentador investigar los efectos individuales (o los efectos principales) de cada factor y determinar si existe alguna interaccin entre los factores. En la figura 1-5a se presentan los resultados obtenidos al realizar el experimento factorial de la figura 1-4. En los vrtices del cuadrado se indican las puntuaciones de cada ronda de golf jugada con las cuatro combinaciones de prueba. Observe que hay cuatro rondas de golf que proporcionan informacin acerca del uso del palo normal y cuatro rondas que proporcionan informacin sobre el uso del palo grande. Al encontrar la diferencia promedio de las puntuaciones que estn en los lados derecho e izquierdo del 5b), se tiene una medida del efecto de cambiar del palo grande al palo normal, o cuadrado (como en la figura 1Ef

ecto e pa o

d 1

92+94+93+91 4

88+ 91 + 88+ 90 4

= 3.25

_----"f

92,94

GB(goma de balata) L-J G (grande)

.L-

N (normaO

lipo de palo
a) Puntuaciones del experimento de golf

TP(tres
piezas)

GB(goma

~ de balata) L..-.L.-_ _---''---

o
.

TP (tres
piezas)

TP (tres piezas)

GB 19oma de balata)

IDI

GB (goma de balata) L..-.L.-

'---

G (grande) N lnormal) G (grande) N (normal) Tipode palo Tipo de palo b) Comparacin de las puntuaciones e) Comparacin de las puntuaciones que conducen al efecto del palo que conducen al efecto de la pelota

G 19rande) N lnormal) Tipo de palo d) Comparacin de las puntuaciones que COnducen al efecto de la interaccin pelota-pelo

Figura 1-5 Puntuaciones del experimento del golf de la figura 1-4 y clculo de los efectos de los factores.

CAPTULO 1 INTRODUCCIN

Es decir, en promedio, al cambiar del palo grande al normal la puntuacin se incrementa 3.25 golpes por ronda. De manera similar, la diferencia promedio de las cuatro puntuaciones de la parte superior del cuadrado y de las cuatro puntuaciones de la parte inferior miden el efecto del tipo de pelota usado (ver la figura 15c): E-I' recto de 1 pe1 a ata

= 88+91+92+94 - 88+90+93+91 = 075 . 4 4

Por ltimo, puede obtenerse una medida del efecto de la interaccin entre el tipo de pelota y el tipo de palo restando la puntuacin promedio en la diagonal de izquierda a derecha del cuadrado de la puntuacin promedio de la diagonal de derecha a izquierda (ver la figura 1-5d), cuyo resultado es :. Efecto de la interaccin pelota-palo

92+94+88+90 4

88+91+93+91

= 025
.

Los resultados de este experimento factorial indican que el efecto del palo es mayor que el efecto de la pelota o que el de la interaccin. Podran usarse pruebas estadsticas para determinar si cualquiera de estos efectos difiere de cero. De hecho, el caso es que hay evidencia estadstica razonablemente slida de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. Por lo tanto, tal vez el autor debera jugar siempre con el palo grande. En este sencillo ejemplo se pone de manifiesto una caracterstica muy importante del experimento factorial: en los diseos factoriales se hace el uso ms eficiente de los datos experimentales. Note que este experimento incluy ocho observaciones, y que las ocho observaciones se usan para calcular los efectos del palo, de la pelota y de la interaccin. Ninguna otra estrategia de experimentacin hace un uso tan eficiente de los datos. sta es una caracterstica importante y til de los diseos factoriales. El concepto de experimento factorial puede extenderse a tres factores. Suponga que el autor desea estudiar los efectos del tipo de palo, el tipo de pelota y el tipo de bebida consumida sobre su puntuacin de golf. Suponiendo que los tres factores tienen dos niveles, puede establecerse un diseo factorial como el que se muestra en la figura 1-6. Observe que hay ocho combinaciones de prueba de estos tres factores con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geomtricamente como los vrtices de un cubo. Se trata de un ejemplo de un diseo factorial 23 . Como el autor slo desea jugar ocho rondas de golf, este experimento requerira que se juegue una ronda con cada una de las combinaciones de los factores representadas por los ocho vrtices del cubo de la figura 1-6. Sin embargo, al comparar esta situacin con el diseo factorial de dos factores de la figura 1-4, el diseo factorial 23 producira la misma informacin acerca de los efectos de los factores. Por ejemplo, en ambos diseos hay cuatro pruebas que proporcionan informacin acerca del palo normal y cuatro pruebas que proporcionan

I I I I

.......... .J-..........
Palo

Figura 16 Experimento factorial de tres factores que incluye el tipo de palo, el tipo de pelota y el tipo de bebda.

1-1 ESTRATEGIA DEEXPERIMENTACIN


Manera de dasplazarse

I
Caminando

\
En carrito

.....--------

I I I

I I
I

,.,.-/J.--~-Palo

Figura 17 Experimento factorial de cuatro factores que incluye el tipo de palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.

informacin acerca del palo grande, suponiendo que se repite dos veces cada corrida del diseo de dos factores de la figura 1-4. En la figura 1-7 se ilustra la forma en que podran investigarse los cuatro factores ---el palo, la pelota, la bebida y la manera de desplazarse (caminando o en carrito)- en un diseo factorial 24 Como en cualquier diseo factorial, se usan todas las combinaciones posibles de los niveles de los factores. Puesto que los cuatro factores tienen dos niveles, sigue siendo posible hacer la representacin geomtrica de este diseo experimental mediante un cubo (en realidad un hipercubo). En general, si hay k factores, cada uno con dos niveles, el diseo factorial requerira 2k corridas. Por ejemplo, el experimento de la figura 1-7 requiere 16 corridas. Evidentemente, cuando el nmero de factores de inters aumenta, el nmero de corridas requeridas se incrementa con rapidez; por ejemplo, un experimento con 10 factores en el que todos los factores tienen dos niveles requerira 1024 corridas. Esto pronto se vuelve impracticable en lo que se refiere al tiempo y los recursos. En el experimento del golf, el autor slo puede jugar ocho rondas, por lo que incluso el experimento de la figura 1 7 resulta demasiado largo. Por fortuna, cuando se trabaja con cuatro, cinco o ms factores, por lo general no es necesario probar todas las combinaciones posibles de los niveles de los factores. Un experimento factorial fraccionado es una variacin del diseo factorial bsico en.la que slo se realiza un subconjunto de las corridas. En la figura 1w8 se ilustra un diseo factorial fraccionado para la versin de cuatro factores del experimento del golf. Este diseo requiere slo 8 corridas en lugar de las 16 originales y se llamara fraccin un medio. Si el autor slo puede jugar ocho rondas de golf, ste es un excelente diseo en el cual estudiar los cuatro facto.res, Proporcionar informacin adecuada acerca de los efectos principales de los cuatro factores, as como cierta informacin acerca de la forma en que interactan estos factores. Los diseos factoriales fraccionados son muy comunes en la investigacin y el desarrollo industrial, as como en el mejoramiento de procesos. Estos diseos se analizarn en el captulo 8.
w

Manera de desplazarse

I
Caminando

\
En carrito

I
I

F/~---~
Palo

Figura 18 Experimento factorial fraccionado de cuatro factores que incluye el tipo de palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.

.... _ - - _ . _ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

8 1~2

CAPTULO 1 INTRODUCCIN

ALGUNAS APLICACIONES TPICAS DEL DISEO EXPERIMENTAL

Los mtodos del diseo experimental han encontrado amplia aplicacin en diversas disciplinas. De hecho, la experimentacin puede considerarse parte del proceso cientfico y uno de los medios para conocer el funcionamiento de sistemas y procesos. En general, el aprendizaje ocurre a travs de una serie de actividades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar datos del proceso y despus se usa la informacin del experimento para establecer nuevas conjeturas, lo que lleva a nuevos experimentos, y as sucesivamente. El diseo experimental es una herramienta de importancia fundamental en el mbito de la ingeniera para mejorar el desempeo de un proceso de manufactura. Thmbin tiene mltiples aplicaciones en el desarrollo de procesos nuevos. La aplicacin de las tcnicas del diseo experimental en las fases iniciales del desarrollo de un proceso puede redundar en

1. 2. 3. 4.

Mejoras en el rendimiento del proceso. Variabilidad reducida y conformidad ms cercana con los requerimientos norrrinales o proyectados. Reduccin del tiempo de desarrollo. Reduccin de los costos globales.

Los mtodos del diseo experimental desempean tambin un papel importante en las actividades del diseo de ingeniera, donde se desarrollan productos nuevos y se hacen mejoramientos en los productos existentes. Entre las aplicaciones del diseo experimental en el diseo de ingeniera se encuentran:

1. La evaluacin y comparacin de configuraciones de diseos bsicos. 2. La evaluacin de materiales alternativos. 3. La seleccin de los parmetros del diseo para que el producto tenga un buen funcionamiento en una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto. 4. La determinacin de los parmetros clave del diseo del producto que afectan el desempeo del mismo.
El uso del diseo experimental en estas reas puede redundar en productos cuya fabricacin sea ms sencilla, en productos que tengan un desempeo y confiabilidad de campo mejorados, en costos de produccin ms bajos y en tiempos ms cortos para el diseo y desarrollo del producto. A continuacin se presentan varios ejemplos que ilustran algunas de estas ideas.

EJEMPLO 1~ 1 ...........................................................
Caracterizacin de un proceso
En el proceso. de fabricacin de tarjetas de circuitos impresos se utiliza una mquina de soldadura lquida. La mquina limpia las tarjetas en un fundente, las somete a un proceso de precalentamiento y despus las hace pasar por una onda de soldadura lquida mediante una transportadora. En este proceso de soldadura se hacen las conexiones elctricas y mecnicas de los componentes recubiertos de plomo en la tarjeta. El proceso opera actualmente con un nivel de defectos aproximado de 1%. Es decir, cerca de 1% de las juntas de soldadura de una tarjeta son defectuosas y requieren correccin manual. Sin embargo, debido a que la tarjeta de circuitos impresos promedio contiene ms de 2000 juntas de soldadura, incluso un nivel de defectos de 1% representa un nmero demasiado alto de juntas de soldadura que requieren correccin. Al ingeniero responsable del proceso en esta rea le gustara usar un experimento diseado para determinar cules son los parmetros de la mquina que influyen en la ocurrencia de los defectos de soldadura y qu ajustes deberan hacerse en dichas variables para reducir los defectos de soldadura.

12 AWUNAS APLICACiONES TPICAS DEL DISEO EXPERIMENTAL

En la mquina de soldadura lquida hay diversas variables que pueden controlarse. stas incluyen:
1. 2. 3. 4.

La temperatura de la soldadura. La temperatura del precalentamiento. La velocidad de la transportadora. El tipo de fundente. s. La gravedad especfica del fundente. 6. La profundidad de la onda de soldadura. 7. El ngulo de la transportadora.

Adems de estos factores controlables, hay otros que no es sencillo manejar durante el proceso de fabricacin, aunque podran controlarse para los fines de una prueba. stos son: 1. 2. 3. 4. 5. El espesor de la tarjeta de circuitos impresos. El tipo de componentes usados en la tarjeta. La disposicin de los componentes en la tarjeta. El operador. La rapidez de produccin.

En esta situacin, el inters del ingeniero es caracterizar la mquina de soldadura lquida; es decir, quiere determinar los factores (tanto los controlables como los no controlables) que afectan la ocurrencia de defectos en las tarjetas de circuitos impresos. Para ello puede disear un experimento que le permitir estimar la magnitud y direccin de los efectos de los factores; es decir, cunto cambia la variable de respuesta (defectos por unidad) cuando se modifica cada factor, y si la modificacin de los factores en conjunto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores; es decir, existe interaccin entre los factores? En ocasiones a un experimento como ste se le llama experimento tamiz o de exploracin exhaustiva. De manera tpica, los experimentos tamiz incluyen el uso de diseos factoriales fraccionados, como en el ejemplo del golf de la figura 1-8. La informacin obtenida de este experimento tamiz se usar para identificar los factores crticos del proceso y determinar la direccin del ajuste de dichos factores a fin de conseguir una reduccin adicional del nmero de defectos por unidad. El experimento tambin puede proporcionar informacin acerca de los factores que deberan controlarse con mayor atencin durante el proceso de fabricacin a fin de evitar los niveles elevados de defectos y el desempeo errtico del proceso. Por lo tanto, una consecuencia del experimento podra ser la aplicacin de tcnicas como las cartas de control a una o ms de las variables del proceso (la temperatura de la soldadura, por ejemplo), aunadas a las cartas de control de la produccin del proceso. Con el tiempo, si se consigue una mejora sensible del proceso, quiz sea posible basar la mayor parte del programa de control del mismo en el control de las variables de entrada del proceso en lugar de aplicar cartas de control a la produccin.
11I 11I 11I 11I 11I 11I 11I 11I 11I 11I 11I 11I 11I

iII

11I

Ej'EMPLO 1~ 2

11I

11I

11I

11I

11I

11I

11I

11I

11I

11I

11I

11I

11I

Optimizacin de un proceso
En un experimento de caracterizacin, el inters suele centrarse en determinar las variables del proceso que afectan la respuesta. El siguiente paso lgico es la optimizacin, es decir, determinar la regin de los factores importantes que conduzca a la mejor respuesta posible. Por ejemplo, si la respuesta es el rendi-

10

CAPTULO 1 INTRODUCCIN

miento, se buscara la regin del rendimiento mximo, mientras que si la respuesta es la variabilidad de una dimensin crtica del producto, se buscara una regin de variabilidad mnima. Supongamos que el inters se centra en mejorar el rendimiento de un proceso qumico. Por los resultados de un experimento de caracterizacin se sabe que las dos variables ms importantes del proceso que influyen en el rendimiento son la temperatura de operacin y el tiempo de reaccin. El proceso opera ac tualmente a 145Py con 2.1 horas de tiempo de reaccin, produciendo rendimientos de cerca de 80%. En la figura 19 se muestra una vista desde arriba de la regin tiempo-temperatura. En esta grfica las lneas de rendimiento constante se unen para formar los contornos de respuesta, y se muestran las lneas de contorno para rendimientos de 60, 70, 80, 90 y 95 por ciento. Estos contornos son las proyecciones en la regin tiempo-temperatura de las secciones transversales de la superficie del rendimiento correspondiente a los rendimientos porcentuales arriba mencionados. A esta superficie se le llama en ocasiones superficie de respuesta. El personal del proceso no conoce la verdadera superficie de respuesta de la figura 19, por lo que se necesitarn mtodos experimentales para optimizar el rendimiento con respecto al tiempo y la temperatura. Para localizar el rendimiento ptimo, es necesario llevar a cabo un experimento en el que se hagan variar conjuntamente el tiempo y la temperatura, es decir, un experimento factorial. En la figura 19 se muestran los resultados de un experimento factorial inicial realizado con dos niveles tanto del tiempo como de la temperatura. Las respuestas que se observan en los cuatro vrtices del cuadrado indican que, para incrementar el rendimiento, los cambios deberan hacerse en la direccin general del aumento de la

200

SegUndo experimento de optimizacin

190

180

~ 170 ., a.
~
E

'"

160

150

140

1.5
Tiempo (horas)

Figura 1-9 Grfica de contorno del rendimiento como una funcin del tiempo de reaccin y la temperatura de reaccin, la cual ilustra la experimentacin para optimizar un proceso.

1-3 PRINCIPIOS BSICOS

11

temperatura y la reduccin del tiempo de reaccin. Se realizaran algunas corridas adicionales en esta direccin, y esta experimentacin adicional llevara a la regin del rendimiento mximo. Una vez que se ha encontrado la regin del rendimiento ptimo, el siguiente paso tpico sera realizar un segundo experimento. El objetivo de este segundo experimento es desarrollar un modelo emprico del proceso y obtener una estimacin ms precisa de las condiciones de operacin ptimas para el tiempo y la temperatura. A este enfoque para la optimizacin de un proceso se le llama la metodologa de superficies de respuesta, la cual se examina en detalle en el captulo 11. El segundo diseo ilustrado en la figura 1~9 es un diseo central compuesto, uno de los diseos experimentales ms importantes que se usan en los estudios de optimizacin de procesos.
111 111 111 111 111 111 " 111 111 111 111 111 111 111 " " 111 111 111 111

EJEMPLO 1-3 .....

111

111

41

111

111

111

111

111

111

"

Ilustracin del diseo de un producto


Con frecuencia los mtodos de diseo experimental pueden aplicarse en el proceso de diseo de un producto. Para ilustrar esto, suponga que un grupo de ingenieros est diseando el gozne de la puerta de un automvil. La caracterstica de calidad del producto que les interesa es el esfuerzo amortiguador, es decir, la capacidad de retencin del tope que impide que la puerta se cierre cuando el vehculo se estaciona en una pendiente. El mecanismo amortiguador consta de un resorte de hojas y un cilindro. Cuando la puerta se abre, el cilindro se desplaza por un arco que hace que el resorte de hojas se comprima. Para cerrar la puerta es necesario vencer la fuerza del resorte, la cual produce el esfuerzo amortiguador. El equipo de ingenieros considera que el esfuerzo amortiguador es una funcin de los siguientes factores: 1. 2. 3. 4. 5. La La La La La distancia que se desplaza el cilindro. altura del resorte del pivote a la base. distancia horizontal del pivote al resorte. altura libre del resorte auxiliar. altura libre del resorte principal. .

Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar todos estos factores dentro de ciertos rangos. Una vez que se han identificado los niveles apropiados de estos cinco factores, puede disearse un experimento que conste de varias combinaciones de los niveles de los factores, y el prototipo del gozne puede probarse con estas combinaciones. Se obtendr as informacin respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y, mediante el anlisis de esta informacin, podr mejorarse el diseo del tope.
111 111 111 111

*' "

111

111

111

"

41

111

111

111

111

111

111

111

111

"

111

111

111

1..3

PRINCIPIOS BSICOS

Si quiere llevarse a cabo un experimento como los descritos en los ejemplos 1-1 al 1-3 con la mayor eficiencia posible, es necesario utilizar un enfoque cientfico para planearlo. El diseo estadstico de experimentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados que puedan analizarse con mtodos estadsticos que llevarn a conclusiones vlidas y objetivas. El enfoque estadstico del diseo experimental es necesario si se quieren sacar conclusiones significativas de los datos. Cuando el problema incluye datos que estn sujetos a errores experimentales, la metodologa estadstica es el nico enfoque objetivo de anlisis. Por lo tanto, cualquier problema experimental incluye dos

12

CAPTULO 1 INTRODUCCIN

aspectos: el diseo del experimento y el anlisis estadstico de los datos. Estos dos aspectos se encuentran ntimamente relacionados porque el mtodo de anlisis depende directamente del diseo empleado. Ambos temas se tratan en este libro. Los tres principios bsicos del diseo experimental son la realizacin de rplicas, la aleatorizacin y la formacin de bloques. Por realizacin de rplicas se entiende la repeticin del experimento bsico. En el experimento metalrgico analizado en la seccin 1-1, una rplica consistira en el tratamiento de una muestra con el templado en aceite y el tratamiento de una muestra con el templado en agua salada. Por lo tanto, si se tratan cinco ejemplares en cada medio de templado, se dice que se han obtenido cinco rplicas. La realizacin de rplicas posee dos propiedades importantes. Primera, permite al experimentador obtener una estimacin del error experimental. Esta estimacin del error se convierte en una unidad de medicin bsica para determinar si las diferencias observadas en los datos son en realidad estadsticamente diferentes. Segunda, si se usa la media muestral (por ejemplo, y) para estimar el efecto de un factor en el experimento, la realizacin de rplicas permite al experimentador obtener una estimacin ms precisa de este efecto. Por ejemplo, si tT es la varianza de una observacin individual y hay n rplicas, la varianza de la media muestral es

La consecuencia prctica de lo anterior es que si se hicieron n = 1 rplicas y se observ YI = 145 (templado en aceite) y Y2 = 147 (templado en agua salada), probablemente no podrn hacerse inferencias satisfactorias acerca del efecto del medio de templado; es decir, la diferencia observada podra ser resultado del error experimental. Por otra parte, si n fue razonablemente grande y el error experimental fue lo suficientemente pequeo, y se observ Y1 < Y2' podra concluirse con una certeza razonable que el templado en agua salada produce una dureza mayor en esta aleacin de aluminio particular que el templado en aceite. Hay una diferencia importante entre rplicas y mediciones repetidas. Por ejemplo, suponga que una oblea de silicio se graba con un proceso de grabado qumico con plasma para oblea nica, y que se hacen tres mediciones de una dimensin crtica de esta oblea. Estas mediciones no son rplicas; son una forma de mediciones repetidas y, en este caso, la variabilidad observada en las tres mediciones repetidas es reflejo directo de la variabilidad inherente del sistema o instrumento de medicin. Como otro ejemplo, suponga que, como parte de un experimento en la manufactura de semiconductores, se procesan simultneamente cuatro obleas en un horno de oxidacin con una velocidad del flujo de gas y un tiempo particulares y que se hace despus una medicin del espesor del xido en cada oblea. De nueva cuenta, la medicin de las cuatro obleas no son rplicas sino mediciones repetidas. En este caso reflejan las diferencias entre las obleas y otras fuentes de variabilidad dentro de esa operacin de horneado particular. En las rplicas se reflejan las fuentes de variabilidad tanto entre las corridas como (potencialmente) dentro de las mismas. La aleatorizacin es la piedra angular en la que se fundamenta el uso de los mtodos estadsticos en el diseo experimental. Por aleatorizacin se entiende que tanto la asignacin del material experimental como el orden en que se realizarn las corridas o ensayos individuales del experimento se determinan al azar. Uno de los requisitos de los mtodos estadsticos es que las observaciones (o los errores) sean variables aleatorias con distribuciones independientes. La aleatorizacin hace por 10 general que este supuesto sea vlido. La aleatorizacin correcta del experimento ayuda tambin a "sacar del promedio" los efectos de factores extraos que pudieran estar presentes. Por ejemplo, suponga que los ejemplares del experimento descrito antes presentan slo ligeras diferencias en el espesor y que la efectividad del medio de templado puede ser afectado por el espesor del ejemplar. Si todos los ejemplares sometidos al templado en aceite son ms gruesos que los sometidos al templado en agua salada, quiz se est introduciendo un sesgo sistemtico en los resultados experimentales. Este sesgo estorba en uno de los medios de templa-

1-4 PAUTAS GENERALES PARA DISEAREXPERIMENTOS

13

do y, en consecuencia, invalida los resultados obtenidos. Al hacer laasignacin aleatoria de los ejemplares al medio de templado este problema se aligera en parte. Es muy comn el uso de programas de computadora para auxiliar a los experimentadores a seleccionar y construir diseos experimentales. Estos programas presentan a menudo las corridas del diseo experimental de manera aleatoria. Por lo general este modo aleatorio se crea utilizando un generador de nmeros aleatorios. Incluso con estos programas de computadora, con frecuencia seguir siendo necesario que el experimentador haga la asignacin del material experimental (como las obleas en los ejemplos de semiconductores mencionados antes), de los operadores, de los instrumentos o herramientas de medicin, etc., que se utilizarn en el experimento. Puede recurrirse a tablas de nmeros aleatorios para asegurar que las asignaciones se hacen al azar. En ocasiones los experimentadores se encuentran con situaciones en las que la aleatorizacin de un aspecto del experimento es complicada. Por ejemplo, en un proceso qumico, la temperatura puede ser una variable muy dificil de modificar, haciendo casi imposible la aleatorizacin completa de este factor. Existen mtodos de diseo estadstico para resolver las restricciones sobre la aleatorizacin. Algunos de estos enfoques se revisarn en captulos subsecuentes (ver en particular el captulo 13). La formacin de bloques es una tcnica de diseo que se utiliza para mejorar la precisin de las comparaciones que se hacen entre los factores de inters. Muchas veces la formacin de bloques se emplea para reducir o eliminar la variabilidad transmitida por factores perturbadores; es decir, aquellos factores que pueden influir en la respuesta experimental pero en los que no hay un inters especfico. Por ejemplo, en un experimento de un proceso qumico pueden requerirse dos lotes de materia prima para realizar todas las corridas necesarias. Sin embargo, podra haber diferencias entre los lotes debido a la variabilidad de un proveedor a otro y, en caso de no haber un inters especfico en este efecto, los lotes de materia prima se consideraran un factor perturbador. En general, un bloque es un conjunto de condiciones experimentales relativamente homogneas. En el ejemplo del proceso qumico, cada lote de materia prima .formara un bloque, ya que es de esperarse que la variabilidad dentro de un lote sea menor que la variabilidad entre lotes. De manera tpica, como en este ejemplo, cada nivel del factor perturbador pasa a ser un bloque. Entonces el experimentador divide las observaciones del diseo estadstico en grupos que se corren en cada bloque. En varias partes del texto se estudia en detalle la formacin de bloques, incluyendo los captulos 4, 5, 7, 8, 9, 11 Y13. En el captulo 2, seccin 2-5.1, se presenta un ejemplo sencillo para ilustrar la estructura bsica de la formacin de bloques. Los tres principios bsicos del diseo experimental, la aleatorizacin, la realizacin de rplicas y la formacin de bloques son parte de cada uno de los experimentos. Se ilustrarn y resaltarn repetidamente a lo largo de este libro.
1~4

PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

Para aplicar el enfoque estadstico en el diseo y anlisis de un experimento, es necesario que todos los que participan en el mismo tengan desde el principio una idea clara de qu es exactamente lo que va a estudiarse, cmo van a colectarse los datos, y al menos una comprensin cualitativa de la forma en que van a analizarse estos datos. En la tabla 1-1 se muestra un esquema general del procedimiento recomendado. A continuacin se presenta una breve explicacin de este esquema y se elaboran algunos de los puntos clave. Para mayores detalles, ver Coleman y Montgomery [27], as como las referencias al final del libro. Thmbin es til el material complementario para este captulo.
1. Identificacin y enunciacin del problema. Este punto podra parecer muy obvio, pero es comn que en la prctica no sea sencillo darse cuenta de que existe un problema que requiere experimentacin, y

14

CAPTULO 1 INTRODUCCIN

Tabla 1-1

Pautas generales para disear un experimento

Planeacin previa 2. Eleccin de los factores, los niveles y los rangos." ] al experimento 3. Seleccin de la variable de respuesta." 4. Eleccin del diseo experimental. 5. Realizacin delexperimento. 6. Anlisis estadstico de los datos. 7. Conclusiones y recomendaciones. a En la prctica,lospasos 2 y 3 suelenhacersesimultneamenteo en el orden inverso.

1. Identificacin y exposicin del problema.

tampoco es fcil desarrollar una enunciacin clara, con la que todos estn de acuerdo, de este problema. Es necesario desarrollar todas las ideas acerca de los objetivos del experimento. Generalmente, es importante solicitar aportaciones de todas las reas involucradas: ingeniera, aseguramiento de calidad, manufactura, mercadotecnia, administracin, el cliente y el personal de operacin (el cual por lo general conoce a fondo el proceso y al que con demasiada frecuencia se ignora). Por esta razn, se recomienda un enfoque de equipo para disear experimentos. En la mayora de los casos es conveniente hacer una lista de los problemas o las preguntas especficas que van a abordarse en el experimento. Una enunciacin clara del problema contribuye sustancialmente a menudo para alcanzar una mejor comprensin de los fenmenos bajo estudio y la solucin final del problema. Tambin es importante tener presente el objetivo global; por ejemplo, se trata de un proceso o sistema nuevo (en cuyo caso el objetivo inicial posiblemente ser la caracterizacin o tamizado de los factares) o se trata de un sistema maduro que se conoce con profundidad razonable y que se ha caracterizado con anterioridad (en cuyo caso el objetivo puede ser la optimizacin)? En un experimento puede haber muchos objetivos posibles, incluyendo la confirmacin (Zelsistema se comporta de la misma manera ahora que en el pasado?), el descubrimiento (qu ocurre si se exploran nuevos materiales, variables, condiciones de operacin, etc.?) y la estabilidad (bajo qu condiciones las variables de respuesta de inters sufren una degradacin seria?). Obviamente, las cuestiones especficas que habrn de abordarse en el experimento se relacionan de manera directa con los objetivos globales. Con frecuencia en esta etapa de la formulacin del problema muchos ingenieros y cientficos se percatan de que no es posible que un experimento comprensivo extenso responda las cuestiones clave y de que un enfoque secuencial en el que se utilice una serie de experimentos ms pequeos es una estrategia ms adecuada.
2. Eleccin de los factores, los niveles y los rangos. (Como se indica en la tabla 1-1, los pasos 2 y 3 muchas veces se hacen simultneamente o en orden inverso.) Cuando se consideran los factores que pueden influir en el desempeo de un proceso o sistema, el experimentador suele descubrir que estos factores pueden clasificarse como factores potenciales del diseo o bien como factores perturbadores. Los factores potenciales del diseo son aquellos que el experimentador posiblemente quiera hacer variar en el experimento. Es frecuente encontrar que hay muchos factores potenciales del diseo, por lo que es conveniente contar con alguna clasificacin adicional de los mismos. Algunas clasificaciones tiles son factores del diseo, factores que se mantienen constantes y factores a los que se permite variar. Los factores del diseo son los que se seleccionan realmente para estudiarlos en el experimento. Los factores que se mantienen constantes son variables que pueden tener cierto efecto sobre la respuesta, pero que para los fines del experimento en curso no son de inters, por lo que se mantendrn fijos en un nivel especfico. Por ejemplo, en un experimento de grabado qumico en la industria de los semiconductores puede haber un efecto, que es nico, de la herramienta especfica para el grabado qumico con plasma que se utiliza en el experimento. Sin embargo, sera muy difcil variar este factor en un experimento, por lo que el experimentador puede decidir llevar a cabo todas las corridas experimentales en un grabador qumico particular (idealmente "tpico"). De este modo, este factor se mantiene constante. Como un ejemplo de factores

1-4 PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

15

a los que se permite variar, las unidades experimentales o los "materiales" a los que se aplican los factores del diseo no son homogneos por lo general, no obstante lo cual con frecuencia se ignora esta variabilidad de una unidad a otra y se confa en la aleatorizacin para compensar cualquier efecto del material o la unidad experimental. Muchas veces se trabajar con el supuesto de que los efectos de los factores que se mantienen constantes y de los factores a los que se permite variar son relativamente pequeos. Por otra parte, los factores perturbadores pueden tener efectos considerables que deben tomarse en consideracin, a pesar de que no haya inters en ellos en el contexto del experimento en curso. Los factores perturbadores suelen clasificarse como factores controlables, no controlables o de ruido. Un factor perturbador controlable es aquel cuyos niveles pueden ser ajustados por el experimentador. Por ejemplo, el experimentador puede seleccionar lotes diferentes de materia prima o diversos das de la semana para conducir el experimento. La estructura bsica de la formacin de bloques, comentada en la seccin anterior, suele ser til para trabajar con factores perturbadores controlables. Si un factor perturbador no es controlable en el experimento, pero puede medirse, muchas veces puede usarse el procedimiento de anlisis denominado anlisis de covarianza para compensar este efecto. Por ejemplo, la humedad relativa en el medio ambiente del proceso puede afectar el desempeo del proceso, y si la humedad no puede controlarse, probablemente podr medirse y tratarse como una covariable. Cuando un factor que vara de manera natural y no controlable en el proceso puede controlarse para los fines de un experimento, con frecuencia se le llama factor de ruido. En tales situaciones, es comn que el objetivo sea encontrar los ajustes de los factores controlables del diseo que minimicen la variabilidad transmitida por los factores de ruido. En ocasiones a esto se le llama el estudio de robustez del proceso o el problema de robustez del diseo. La formacin de bloques, el anlisis de covarianza y los estudios de robustez del proceso se comentan ms adelante. Una vez que el experimentador ha seleccionado los factores del diseo, debe elegir los rangos en los que har variar estos factores, as como los niveles especficos con los que se realizarn las corridas. 'Iambin deber pensarse cmo van a controlarse estos factores en los valores deseados y cmo van a medirse. Por ejemplo, en el experimento de la soldadura lquida, el ingeniero ha definido 12 variables que pueden afectar la ocurrencia de defectos de soldadura. El ingeniero tambin tendr que tomar una decisin en cuanto a la regin de inters para cada variable (es decir, el rango en el que se har variar cada factor) y en cuanto al nmero de niveles de cada variable que usar. Para ello se requiere del conocimiento del proceso. Este conocimiento del proceso suele ser una combinacin de experiencia prctica y conocimientos tericos. Es importante investigar todos los factores que pueden ser de importancia y no dejarse influir demasiado por la experiencia pasada, en particular cuando uno se encuentra en las fases iniciales de la experimentacin o cuando el proceso no est del todo maduro. Cuando el objetivo del experimento es el tamizado de los factores o caracterizacin del proceso, por lo general es mejor mantener reducido el nmero de niveles de los factores. En general, dos niveles funcionan bastante bien en los estudios de tamizado de factores. Elegir la regin de inters tambin es importante. En el tamizado de factores, la regin de inters deber ser relativamente grande; es decir, el rango en el que se hacen variar los factores deber ser amplio. Conforme se sepa ms acerca de las variables que son importantes y de los niveles que producen los mejores resultados, la regin de inters se har por lo general ms estrecha.
3. Seleccin de la variDble de respuesta. Para seleccionar la variable de respuesta, el experimentador deber tener la certeza de que esta variable proporciona en realidad informacin til acerca del proceso bajo estudio. En la mayora de los casos, el promedio o la desviacin estndar (o ambos) de la caracterstica medida ser la variable de respuesta. No son la excepcin las respuestas mltiples. La eficiencia de los instrumentos de medicin (o error de medicin) tambin es un factor importante. Si la eficiencia de los instrumentos de medicin es inadecuada, el experimentador slo detectar los efectos relativamente grandes de los factores o quiz sean necesarias rplicas adicionales. En algunas situaciones en que la eficiencia de los instrumentos de medicin es pobre, el experimentador puede decidir medir varias veces cada unidad

16

CAPTULO 1 INTRODUCCIN

experimental y usar el promedio de las mediciones repetidas como respuesta observada. Suele ser de importancia determinante identificar los aspectos relacionados COn la definicin de las respuestas de inters y cmo van a medirse antes de llevar a cabo el experimento. En ocasiones se emplean experimentos diseados para estudiar y mejorar el desempeo de los sistemas de medicin. Para un ejemplo, ver el captulo 12. Se reitera 10crucial que es exponer todos los puntos de vista y la informacin del proceso en los pasos
1 al 3 anteriores. Se hace referencia a esto como planeacin previa al experimento. Coleman y Montgo-

mery [27] proporcionan hojas de trabajo que pueden ser tiles en la planeacin previa al experimento. Vase tambin la informacin complementaria del texto para ms detalles y un ejemplo del uso de estas hojas de trabajo. En muchas situaciones, no es posible que una sola persona posea todos los conocimientos requeridos para hacer esto adecuadamente. Por 10 tanto, se hace una amplia recomendacin para el trabajo en equipo durante la planeacin del experimento. La mayor parte del xito gravitar en tomo a qu tan bien se haya hecho la planeacin previa del experimento.
4. Elecci6n del diseo experimental. Si las actividades de planeacin previas al experimento se realizan como es debido, este paso es relativamente sencillo. La eleccin del diseo implica la consideracin del tamao de la muestra (nmero de rplicas), la seleccin de un orden de corridas adecuado para los ensayos experimentales y la determinacin de si entran en juego o no la formacin de bloques u otras restricciones sobre la aleatorizacin. En este libro se revisan algunos de los tipos ms importantes de diseos experimentales, y puede usarse en ltima instancia como un catlogo para seleccionar el diseo experimental apropiado para una amplia variedad de problemas. Existen tambin varios paquetes interactivos de software de estadstica que soportan esta fase del diseo experimental. El experimentador puede introducir la informacin del nmero de factores, los niveles y los rangos, y estos programas presentarn a la consideracin del experimentador una seleccin de diseos o recomendarn un diseo particular. (Nosotros preferimos ver varias alternativas en lugar de confiar en la recomendacin de la computadora en la mayora de los casos.) Estos programas proporcionan tambin por 10general una hoja de trabajo (con el orden aleatorizado de las corridas) que se usar en la conduccin del experimento. Al seleccionar el diseo, es importante tener en mente los objetivos experimentales. En muchos experimentos de ingeniera se sabe de antemano que algunos de los niveles de los factores producirn valores diferentes de la respuesta. En consecuencia, el inters se centra en identificar qu factores causan esta diferencia yen estimar la magnitud del cambio de la respuesta. En otras situaciones podra haber ms inters en verificar la uniformidad. Por ejemplo, pueden compararse dos condiciones de produccin A y B, donde A es el estndar y B es una alternativa con una eficiencia de costos mayor. El experimentador estar interesado entonces en demostrar que, por ejemplo, no hay ninguna diferencia en el rendimiento entre las dos condiciones. 5. Realizaci6n del experimento. Cuando se lleva a cabo el experimento es vital monitorear con atencin el proceso a fin de asegurarse de que todo se est haciendo conforme a la planeacin. Los errores en el procedimiento experimental en esta etapa destruirn por 10general la validez experimental. Poner en un primer plano la planeacin es crucial para el xito. Es fcil subestimar los aspectos de logstica y planeacin cuando se corre un experimento diseado en un ambiente complejo de manufactura o de investigacin y desarrollo. Coleman y Montgomery [27] sugieren que antes de llevar a cabo el experimento, es conveniente en muchas ocasiones realizar algunas corridas piloto o de prueba. Estas corridas proporcionan informacin acerca de la consistencia del material experimental, una comprobacin del sistema de medicin, una idea aproximada del error experimental y la oportunidad de poner en prctica la tcnica experimental global. Esto ofrece tambin una oportunidad para revisar, de ser necesario, las decisiones tomadas en los pasos 1 a14.

1-5 BREVE HISTORIA DEL DISEO ESTADSTICO

17

6. Anlisis estadistico de los datos. Debern usarse mtodos estadsticos para analizar los datos a fin de que los resultados y las conclusiones sean objetivos y no de carcter apreciativo. Si el experimento se ha diseado correctamente y si se ha llevado a cabo de acuerdo con el diseo, los mtodos estadsticos necesarios no deben ser complicados. Existen varios paquetes de software excelentes diseados para auxiliar en el anlisis de datos, y muchos de los programas usados en el paso 4 para seleccionar el diseo cuentan con una interfase directa para el anlisis estadstico. Con frecuencia se encuentra que los mtodos grficos simples desempean un papel importante en el anlisis e interpretacin de datos. Debido a que muchas de las preguntas que el experimentador quiere responder pueden insertarse en el marco de la prueba de hiptesis, los procedimientos para probar hiptesis y estimar intervalos de confianza son muy tiles en el anlisis de datos de un experimento diseado. Muchas veces es muy til tambin presentar los resultados de varios experimentos en trminos de un modelo emprico, es decir, mediante una ecuacin derivada de los datos que expresa la relacin entre la respuesta y los factores importantes del diseo. El anlisis residual y la verificacin de la adecuacin del modelo son tambin tcnicas de anlisis importantes. Ms adelante se revisarn en detalle estos temas. Recuerde que los mtodos estadsticos no pueden demostrar que un factor (o factores) posee un efecto particular, slo proporcionan pautas generales en cuanto a la confiabilidad y la validez de los resultados. Aplicados en forma correcta, los mtodos estadsticos no permiten la demostracin experimental de nada, pero s sirven para medir el error posible en una conclusin o asignar un nivel de confianza a un enunciado. La ventaja principal de los mtodos estadsticos es que agregan objetividad al proceso de toma de decisiones. Las tcnicas estadsticas, aunadas a una buena ingeniera o conocimiento del proceso y el sentido comn, llevarn por lo general a conclusiones slidas.

7. Conclusiones y recomendaciones. Una vez que se han analizado los datos, el experimentador debe sacar conclusiones prcticas acerca de los resultados y recomendar un curso de accin. Los mtodos grficos suelen ser tiles en esta etapa, en particular para presentar los resultados. Tambin debern realizarse corridas de seguimiento o pruebas de confirmacin para validar las conclusiones del experimento. A 10largo del proceso completo es importante tener presente que la experimentacin es una parte esencial del proceso de aprendizaje, en la que se formulan hiptesis tentativas acerca de un sistema, se realizan experimentos para investigar estas hiptesis y se formulan nuevas hiptesis con base en los resultados, y as sucesivamente. Esto sugiere que la experimentacin es iterativa. Por 10 general es un gran error disear un solo experimento comprensivo y extenso al principio de un estudio. Un experimento exitoso requiere conocer los factores importantes, los rangos en los que debern hacerse variar estos factores, el nmero apropiado de niveles que debern usarse y las unidades de medicin apropiadas para estas variables. En general, no se conocen las respuestas precisas de estas cuestiones, pero se aprende acerca de ellas sobre la marcha. A medida que avanza un programa experimental, es comn abandonar algunas variables de entrada e incorporar otras, modificar la regin de exploracin de algunos factores o incorporar nuevas variables de respuesta. Por consiguiente, generalmente la experimentacin se hace en forma secuencial y, como regla general, no deber invertirse ms de 25% de los recursos disponibles en el primer experimento. Con esto se asegurar que se contar con los recursos suficientes para realizar las corridas de confirmacin y que se alcanzar en ltima instancia el objetivo final del experimento.

1-5 BREVE HISTORIA DEL DISEO ESTADSTICO


Ha habido cuatro eras del desarrollo moderno del diseo experimental estadstico. La era agrcola fue encabezada por el trabajo pionero de Sir Ronald A. Fisher en los aos 1920 y principios de la dcada de 1930. En este periodo, Fisher fue el responsable de las estadsticas y el anlisis de datos en la Estacin

18

CAPTULO 1 INTRODUCCIN

Agrcola Experimental de Rothamsted en las cercanas de Londres, Inglaterra. Fisher se percat de que las fallas en la forma en que se llevaba a cabo el experimento que generaba los datos obstaculizaban con frecuencia el anlisis de los datos de los sistemas (en este caso sistemas agrcolas). Mediante la interaccin con mltiples cientficos e investigadores de diversos campos, Fisher desarroll las ideas que llevaron a los tres principios bsicos del diseo experimental que se revisan en la seccin 1-3: la aleatorizacin, la realizacin de rplicas y la formacin de bloques. Fisher incorpor de manera sistemtica ~l pensamiento y los principios estadsticos en el diseo de las investigaciones experimentales, incluyendo el concepto de diseo factorial y el anlisis de varianza. Sus libros [44a, b] tuvieron profunda influencia en el uso de la estadstica, particularmente en la agricultura y las ciencias biolgicas relacionadas. Para una excelente biografa de Fisher, ver Box [21]. Si bien es cierto que la aplicacin del diseo estadstico en ambientes industriales se inici en la dcada de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de la metodologa de superficies de respuesta (MSR) por parte de Box y Wilson [20]. Estos autores se percataron y explotaron el hecho de que muchos experimentos industriales son fundamentalmente diferentes de sus contrapartes agrcolas en dos sentidos: 1) la variable de respuesta puede observarse por lo general (casi) de inmediato, y 2) el experimentador puede obtener pronto informacin crucial de un pequeo grupo de corridas que puede usarse para planear el siguiente experimento. Box [12f] denomina inmediatez y secuencialidad a estas dos caractersticas de los experimentos industriales. En los 30 aos siguientes, la MSR y otras tcnicas de diseo se generalizaron en las industrias qumica y de proceso, sobre todo en el trabajo de investigacin y desarrollo. George Box fue el lder intelectual de este movimiento. Sin embargo, la aplicacin del diseo estadstico a nivel de plantas o procesos de manufactura todava no estaba muy generalizada. Algunas de las razones de ello incluyen la capacitacin inadecuada de ingenieros y otros especialistas en procesos en los conceptos y los mtodos estadsticos bsicos, as como la falta de recursos de computacin y software de estadstica que fueran fciles de usar para apoyar la aplicacin de experimentos diseados estadsticamente. El inters creciente de la industria occidental en el mejoramiento de calidad que empez a fines de la dcada de 1970 anunci la tercera era del diseo estadstico. El trabajo de Genichi Taguchi (Thguchi y Wu (109], Kackar [62] y Thguchi [108a, bD tuvo un impacto significativo en el aumento del inters y el uso de los experimentos diseados. Thguchi propugnaba por el uso de experimentos diseados para lo que denomin el diseo paramtrico robusto, es decir,

1. Hacer procesos insensibles a los factores ambientales o de otra ndole que son difciles de controlar. 2. Fabricar productos insensibles a la variacin transmitida por los componentes. 3. Encontrar los niveles de las variables del proceso que obliguen a la media a un valor deseado mientras que al mismo tiempo se reduzca la variabilidad en tomo a este valor.
Taguchi propuso diseos factoriales altamente fraccionados y otros arreglos ortogonales junto con algunos mtodos estadsticos nuevos para resolver estos problemas. La metodologa resultante gener muchas discusiones y controversias. Parte de la controversia surgi porque en Occidente la metodologa de 'Iaguchi fue defendida al principio (y sobre todo) por empresarios, y no se haba hecho la revisin escrutadora adecuada de la ciencia estadstica fundamental. Para fines de la dcada de 1980, los resultados de esta revisin indicaron que aun cuando los conceptos y los objetivos enfocados en la ingeniera de 'Iaguchi tenan bases slidas, existan problemas sustanciales con su estrategia experimental y sus mtodos para el anlisis de los datos. Para detalles especficos de estas cuestiones, ver Box [12d], Box, Bisgaard y Fung [14], Hunter [59a, b], Myers y Montgomery [85a] y Pignatiello y Ramberg [94]. Gran parte de estas preo-

1-6 RESUMEN: USO DE TCNICAS ESTADSTICAS EN LA EXPERIMENTACIN

19

cupaciones se resumen tambin en el amplio panel de discusin del nmero de mayo de 1992 de Techno-

metrics (ver Nair, et al. [86]).


Hubo al menos tres resultados positivos de la controversia desatada por Thguchi. Primero, el uso de los experimentos diseados se hizo ms generalizado en las industrias con piezas discretas, incluyendo la industria de manufacturas automotrices y aeroespaciales, de electrnica y semiconductores, y muchas otras, que anteriormente hacan poco uso de esta tcnica. Segundo, se inici la cuarta era del diseo estadstico. Esta era ha incluido un renovado inters general tanto por parte de investigadores como de profesionales en ejercicio en el diseo estadstico y el desarrollo de varios enfoques nuevos y tiles para los problemas experimentales en el mundo industrial, incluyendo alternativas a los mtodos tcnicos de Taguchi que permiten que sus conceptos de ingeniera se lleven a la prctica de manera eficaz y eficiente. Algunas de estas alternativas se revisarn e ilustrarn en captulos subsecuentes, en particular en el captulo 11. Tercero, la educacin formal en diseo experimental estadstico se est haciendo parte de los programas de ingeniera en las universidades, tanto a nivel de licenciatura como de posgrado, La integracin exitosa de una buena prctica del diseo experimental en la ingeniera y las ciencias es un factor clave en la competitividad industrial futura.

1~6

RESUMEN: USO DE TCNICAS ESTADSTICAS EN LA EXPERIMENTACIN

Gran parte de la investigacin en la ingeniera, las ciencias y la industria es emprica y hace un uso extensivo de la experimentacin. Los mtodos estadsticos pueden incrementar en gran medida la eficiencia de estos experimentos y con frecuencia pueden fortalecer las conclusiones as obtenidas. El uso correcto de las tcnicas estadsticas en la experimentacin requiere que el experimentador tenga presentes los puntos siguientes: Los experimentadores suelen poseer amplios conocimientos de sus respectivos campos. Por ejemplo, un ingeniero civil que trabaja en un problema de hidrologa cuenta de manera tpica con considerable experiencia prctica y capacitacin acadmica formal en esta rea. En algunos campos existe un cuerpo enorme de teora fsica en el cual indagar para explicar las relaciones entre los factores y las respuestas. Este tipo de conocimientos no estadsticos es invaluable para elegir los factores, determinar los niveles de los factores, decidir cuntas rplicas correr, interpretar los resultados del anlisis, etc. El uso de la estadstica no es sustituto de la reflexin sobre el problema.
1. Uso de conocimientos no estadsticos del problema.

2. Mantener el diseo y el anlisis tan simple como sea posible. Es necesario no exagerar en el uso de tcnicas estadsticas complejas y sofisticadas. Los mtodos de diseo y anlisis relativamente simples son siempre los mejores. En este punto cabe hacer hincapi nuevamente en el paso 4 del procedimiento recomendado en la seccin 1-4. Si un diseo se hace de manera cuidadosa y correcta, el anlisis casi siempre ser relativamente directo. Sin embargo, si el diseo se estropea grandemente por ineptitud, no es posible que incluso la estadstica ms compleja y elegante salve la situacin. 3. Tener presente la diferencia entre significacin prctica y significacin estadstica. Debido justamente a que dos condiciones experimentales producen respuestas medias que son estadsticamente diferentes, no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener algn valor prctico. Por ejemplo, un ingeniero puede determinar que una modificacin en el sistema de inyeccin de combustible de un automvil puede producir un mejoramiento promedio real en el rendimiento del combustible de 0.1 mi/gal. ste es un resultado estadsticamente significativo. Sin embargo, si

20

CAPTULO 1 INTRODUCCIN

el costo de la modificacin es de $1000, la diferencia de 0.1 mi/gal probablemente ser muy pequea para poseer algn valor prctico. Recuerde que en la mayora de las situaciones no es conveniente disear un experimento demasiado comprensivo al principio de un estudio. Un diseo exitoso requiere conocer los factores importantes, los rangos en los que estos factores se harn variar, el nmero apropiado de niveles para cada factor y los mtodos y las unidades de medicin adecuados para cada factor y respuesta. En general, ningn experimentador est en posicin de responder estas cuestiones al principio del experimento, sino que las respuestas aparecen sobre la marcha. Esto habla en favor del enfoque iterativo o secuencial analizado anteriormente. Desde luego, hay situaciones en las que un experimento comprensivo es totalmente apropiado pero, como regla general, la mayora de los experimentos debern ser iterativos. Por consiguiente, no deber invertirse ms de 25% de los recursos para la experimentacin (corridas, presupuesto, tiempo, etc.) en el experimento inicial. Con frecuencia estos esfuerzos iniciales constituyen slo experiencias de aprendizaje, y es necesario contar con recursos suficientes para alcanzar los objetivos finales del experimento.
4. Los experimentos son generalmente iterativos.

Experimentos comparativos simples

En este captulo se examinan los experimentos para comparar dos condiciones (llamadas en ocasiones tratamientos), a las cuales es comn denominar experimentos comparativos simples. Se empieza con el ejemplo de un experimento que se realiza para determinar si dos formulaciones diferentes de un producto producen resultados equivalentes. El estudio lleva a revisar varios conceptos bsicos de la estadstica, como variables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones de muestreo y pruebas de hiptesis.

2..1 INTRODUCCIN
La fuerza de la tensin de adhesin del mortero de cemento portland es una caracterstica importante del producto. Un ingeniero est interesado en comparar la fuerza de una formulacin modificada en la que se han agregado emulsiones de ltex de polmeros durante el mezclado, con la fuerza del mortero sin modificar. El experimentador ha reunido 10 observaciones de la fuerza de la formulacin modificada y otras 10 observacones de la formulacin sin modJificar. Los datos se muestran en la tabla 2-1. Podra hacerse referencia a las dos formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones. En la figura 21 se grafican los datos de este experimento. A esta representacin se le llama diagrama de puntos. Del examen visual de estos datos se obtiene la impresin inmediata de que la fuerza del mortero sin modificar es mayor que la fuerza del mortero modificado. Esta impresin se confirma al comparar las fuerzas de la tensin de adhesinpromedio'Yl = 16.76 kgf/cm' para el mortero modificado YY2 = 17.92 kgf/cm" para el mortero sin modificar. Las fuerzas de la tensin de adhesin promedio de estas dos muestras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia sea de la magnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quizs esta diferencia observada en nasfuerzas promedio sea el resultado de fluctuaciones del muestreo y las dos formulaciones sean idnticas en realidad. Posiblemente otras dos muestras produzcan el resultado contrario, con la fuerza del mortero modificado excediendo la de la formulacin sin modificar. Puede usarse una tcnica de la inferencia estadstica llamada prueba de hiptesis (algunos autores prefieren el trmino prueba de significacin) para auxiliar al experimentador en la comparacin de estas

21

22

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Tabla 2.1

Datos de la fuerza de la tensin de adhesin del experimento de la formulacin del cemento portland

Mortero
modificado
j
Ylj

Morterosin
modificar
Y1j

1 2

3
4 5 6 7

8
9 10

16.85 16.40 17.21 16.35 16.52 17.04 16.96 17.15 16.59 16.57

17.50 17.63 18.25 18.00 17.86 17.75 18.22 17.90 17.96 18.15

dos formulaciones. La prueba de hiptesis permite que la comparacin de las dos formulaciones se haga en trminos objetivos, con el conocimiento de los riesgos asociados si se llega a una conclusin equivocada. Antes de presentar los procedimientos de la prueba de hiptesis en experimentos comparativos simples, se har una breve revisin de algunos conceptos elementales de la estadstica.

2~2

CONCEPTOS ESTADSTICOS BSICOS

A cada una de las observaciones del experimento del cemento portland citado anteriormente se le llamara una corrida. Observe que las corridas individuales difieren, por lo que existen fluctuaciones, o ruido, en los resultados. Es comn llamar a este ruido el error experimental o simplemente el error. Se trata de un error estadstico, lo cual significa que se origina por la variacin que no est bajo control y que generalmente es inevitable. La presencia del error o ruido implica que la variable de respuesta, la fuerza de la tensin de adhesin, es una variable aleatoria. Una variable aleatoria puede ser discreta o continua. Si el conjunto de todos los valores posibles de la variable aleatoria es finito o contablemente infinito, entonces la variable aleatoria es discreta, mientras que si el conjunto de todos los valores posibles de la variable aleatoria es un intervalo, entonces la variable aleatoria es continua. Descripcin grfica de la variabilidad Es frecuente usar mtodos grficos simples como ayuda para analizar los datos de un experimento. El diagrama de puntos, ilustrado en la figura 2-1, es un recurso muy til para representar un cuerpo reducido de datos (digamos hasta unas 20 observaciones). El diagrama de puntos le permite al experimentador ver de inmediato la localizacin o tendencia central de las observaciones y su dispersin. Por ejemplo, en el experimento de la fuerza de tensin de adhesin del cemento portland, el diagrama de puntos revela

1...

OQ

OC!! 00)

15

16

17

y, '"' 16.76

Fuerza (kgf/cm 2)

Y2 .. 17.92

19

20
.. Mortero modificado o .. Mortero sin modificar

Figura 21 Diagrama de puntos de los datos de la fuerza de la tensin de adhesin de la tabla 2-1.

2-2 CONCEPTOS ESTADSTICOS BSICOS


0.16 30

23

.. e .~ .
u.

~ .:;

0.10

.;

.. .

20

c:

u.

E
10

::1

0.06

0.00

60

66

70
Recuperacin de metal (rendimiento)

Figura 22 Histograma de 200 observaciones de la recuperacin de metal (rendimiento) en un proceso de fundicin.

que probablemente las dos formulaciones difieran en la fuerza promedio, pero que ambas producen aproximadamente la misma variacin en la fuerza. Cuando los datos son muy numerosos, es difcil distinguir las observaciones graficadas en un diagrama de puntos, y en tal caso sera preferible un histograma. En la figura 2-2 se presenta el histograma de 200 observaciones de la recuperacin de metal (o rendimiento) en un proceso de fundicin. El histograma muestra la tendencia central, la dispersin y la forma general de la distribucin de los datos. Recuerde que un histograma se construye dividiendo el eje horizontal en intervalos (generalmente de longitud igual) y trazando un rectngulo sobre el intervalo j-simo con el rea del rectngulo proporcional a ni' el nmero de observaciones incluidas en ese intervalo. El diagrama de caja (o diagrama de aYa y bigotes) es una manera muy til de representar grficamente los datos. En un diagrama de caja se muestra el mnimo, el mximo, los cuartiles inferior y superior (el percentil25 y el percentil 75, respectivamente) y la mediana (el percentil50) en una caja rectangular alineada horizontal o verticalmente. La caja se extiende del cuartil inferior al cuartil superior y se traza una lnea por la mediana que atraviesa la caja. Se trazan dos lneas (o bigotes) que se extienden de los extremos de la caja hasta (de manera tpica) los valores mnimo y mximo. (Existen diversas variantes de los diagramas de caja que tienen reglas diferentes para denotar los puntos muestrales extremos. Ver Montgomery y Runger [83d] para ms detalles.) En la figura 2-3 se muestran los diagramas de caja de las dos muestras de la fuerza de la tensin de adhesin en el experimento del mortero de cemento portland. En esta representacin se revela con toda claridad la diferencia en la fuerza promedio entre las dos formulaciones. Indica asimismo que ambas formulaciones producen distribuciones de la fuerza razonablemente simtricas con una variabilidad o dispersin similar. Los diagramas de puntos, los histogramas y los diagramas de caja son tiles para resumir la informacin de una muestra de datos. Para describir con mayor detalle las observaciones que podran presentarse en una muestra, se usa el concepto de distribucin de probabilidad. Distribuciones de probabilidad La estructura de la probabilidad de una variable aleatoria, por ejemplo y, se describe mediante su distrbucin de probabilidad. Cuando y es discreta, es comn hacer referencia a su distribucin de probabl-

24

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES


Diagramas de caja y bigotes

18.4 t18 f-' 17,6 t17.2 116.8 116.4 t16 -

$
I

$
I

Modificado Sin modificar Formulacin del mortero

Figura 23 Diagramas de caja del experimento de la fuerza de la tensin de adhesin del cemento portland.

dad, por ejemplo p(y), como la funcin de probabilidad de y. Cuando y es continua, es comn hacer referencia a su distribucin de probabilidad, por ejemplo f(y), como la funcin de densidad de probabilidad de y. En la figura 2-4 se ilustran dos distribuciones de probabilidad hipotticas, una discreta y la otra continua. Observe que en la distribucin de probabilidad discreta es la altura de la funcin P(yj) la que representa la probabilidad, mientras que en el caso continuo, es el rea bajo la curva f(y) asociada con un

Yl Y2

Y3 Y4

Y5
Ya

Y7
Ya

Y9 Yl0

Y11 Y12

Y13 Y14

a) Una distribucin discreta

(1

-----=--Y

b) Una distribucin continua

Figura 24 Distribuciones de probabilidad discreta y continua.

2-2 CONCEPTOS ESTADSTICOS BSICOS

25

intervalo dado la que representa la probabilidad. Un resumen cuantitativo de las propiedades de las distribuciones de probabilidad sera el siguiente:

y discreta:

os

p(y):S 1 P(y= Y)= p(yJ

todos los valores de Yi todos los valores de Yi

L
todos los

p(yJ=1

...alore. de y j

y continua:

O:s f(y)

P(a:sy:sb)=

J: f(y)dy

f:., f(y)dy= 1
Media, varianza y valores esperados La media, u, de una distribucin de probabilidad es una medida de su tendencia central o localizacin. Matemticamente, la media se define como

u>

f:., yf(y)dy { ~yp(y)


~

y continua

y discreta

(2-1)

toda y

La media tambin puede expresarse en trminos del valor esperado o valor promedio a la larga de la variable aleatoria y como

f:., yf(y)dy Il=E(y)= { LYP(Y)


toda y

y continua y discreta

(2-2)

donde E denota el operador del valor esperado. La variabilidad o dispersin de una distribucin de probabilidad puede medirse con la varianza, la cual se define como

y continua y discreta
Observe que la varianza puede expresarse exclusivamente en trminos del valor esperado debido a que (2-4) Por ltimo, el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la varianza V tal que

V(y) == E[(Y-Il)2] =a'

(2-5)

26

CAPTIJLO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Los conceptos de valor esperado y varianza se usan constantemente a lo largo de este libro, y puede ser til revisar varios resultados elementales relacionados con estos operadores. Si y es una variable aleatoria con media # y varianza al y e es una constante, entonces

1. 2. 3. 4. 5. 6.

E(c) = c E(y) = # E(cy) = cE(y) = c# V(c) = O V(y) = 0 2 V(cy) = c 2V ( y) =C 20 2

a;, se tiene
7.
8.
donde

Si hay dos variables aleatorias, por ejemplo.y, conE(Yl) = #1 Y V(Yl) =

o YY2 conE(Y2) = #2Y V(Y2) =

E(Yl + Y2) = E(y1)+ E(y2) = #1 + #2 V(Yl +Y2)=V(Yl)+V(Y2)+2 Cov(yl' Y2)

Es posible demostrar que

(2-6)
es la covarianza de las variables aleatoriasy, YY2' La covarianza es una medida de la asociacin lineal entre Yl y Y2' Ms especficamente, puede demostrarse que si Yl y Y2 son independientes,' entonces COV(yl' Y2) = O. 'Iambin puede demostrarse que

9.

V(Yl - Y2) = V(y1)+ V(Y2)- 2 Cov (y1' Y2) V(y Y2)=V(Yl)+V(Y2)=

Si Yl YY2 son independientes, se tiene

10.
y

o +0;

Sin embargo, observe que, en general,


12.

sin importar si Y y Y2 son independientes o no.

2..3

MUESTREO Y DISTRIBUCIONES DE MUESTREO

Muestras aleatorias, media muestral y varianza muestral El objetivo de la inferencia estadstica es sacar conclusiones acerca de una poblacin utilizando una muestra de la misma. La mayora de los mtodos que se estudiarn aqu incluyen el supuesto de que se
1 Observeque el recprocono es necesariamenteverdadero; es decir,puede tenerse Cov (y"y,) = OYno obstante esto no implicaque las variablessean independientes. Para un ejemplo,ver Hines y Montgomery([55] pp. 128-129).

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

27

usan muestras aleatorias. Es decir, si la poblacin contiene N elementos y va a seleccionarse una muestra de n de ellos, y si cada una de las N!/(N - n)!n! muestras posibles tiene una probabilidad igual de ser escogida, entonces al procedimiento empleado se le llama muestreo aleatorio. En la prctica, en ocasiones es difcil obtener muestras aleatorias, para lo cual pueden ser tiles las tablas de nmeros aleatorios, como la tabla XI del apndice. En la inferencia estadstica se utilizan profusamente cantidades calculadas a partir de las observaciones de la muestra. Un estadstico se define como cualquier funcin de las observaciones de una muestra que no contiene parmetros desconocidos. Por ejemplo, suponga que YbY2, ...,Y.. representa una muestra. Entonces la media muestra)

Yi
i-1 Y=-n

"

(2-7)

y la varianza muestral

52

= ..:;i-:;.:1'--

(Yi .; y)2
_

n-l

(2-8)

son estadsticos. Estas cantidadles son medidas de la tendencia central y la dispersin de la muestra, respectivamente. En ocasiones se usa 5 = llamada la desviaci6n estndar muestral, como medida de dispersin. Los ingenieros suelen preferir el uso de la desviacin estndar para medir la dispersin debido a que se expresa en las mismas unidades que la variable de inters y.

.JS2,

Propiedades de la media y la varianza muestrales La media muestraly es un estimador puntual de la media poblacionaljz, y la varianza muestral 52es un estimador puntual de la varianza poblacional if. En general, un estimador de un parmetro desconocido es un estadstico que corresponde con dicho parmetro. Observe que un estimador puntual es una variable aleatoria. Al valor numrico particular de un estimador, calculado a partir de los datos muestrales, se le llama una estimaci6n. Por ejemplo, suponga que quiere estimarse la media y la varianza de la resistencia a la ruptura de un tipo particular de fibra textil. Se prueba una muestra aleatoria de n = 25 ejemplares de prueba de la fibra y se registra la resistencia de cada uno de ellos. La media y la varianza muestrales se calculan de acuerdo con las ecuaciones 2-7 y 28, respectivamente, obtenindose y = 18.6 Y52 = 1.20. Por lo tanto, la estimacin de fJ. es Y = 18.6 Y la estimacin de if es ~ = 1.20. Un buen estimador puntual debe tener varias propiedades. Dos de las ms importantes son las siguientes:
1. El estimador puntual deber ser insesgado. Es decir, el parmetro que se est estimando deber ser el promedio o valor esperado a la larga del estimador puntual. Aun cuando la ausencia de sesgo es deseable, esta propiedad por s sola no siempre hace que un estimador sea adecuado. 2. Un estimador insesgado deber tener la varianza mnima. Esta propiedad establece que el estimador puntual de varianza mnima tiene una varianza que es menor que la varianza de cualquier otro estimador del parmetro en cuestin.

28

CAPTULO 2 EXPERlMENTOS COMPARATIVOS SIMPLES

Es sencillo demostrar que y y S2 son estimadores insesgados de f.t y primero y. Al utilizar las propiedades del valor esperado, se tiene

er, respectivamente. Considere .

1 :-L E(y) n
n

i~l

porque el valor esperado de cada observaciny, es u. Parlo tanto.j es un estimador insesgado de u: Considere ahora la varianza muestral S2. Se tiene

E(S2)=E~i~1 ~

! [
1

(Yi n-1

Y)2]

=~E[! (Yi-y)2] n 1 i~l


= -n--1 E(SS)

donde SS =l:7~1 (Yi - y)2 es la suma de cuadrados corregida de las observaciones Yi' Entonces
(2-9)

=
Por lo tanto,

!
i~l

(f.t2 +a 2) - n(f.t 2 +a 2 In)

= (n-1)a2

(2-10)

E(S2)= _1_ E(SS) n-1


=a
2

y se observa que S2 es un estimador insesgado de

er.

2-3 MUESTREO YDISTRIBUCIONES DEMUESTREO

29

Grados de libertad A la cantidad n -1 de la ecuacin 2-10 se le llama el nmero de grados de libertad de la suma de cuadrados SS. Se trata de un resultado muy general; es decir, siy es una variable aleatoria con varianza if y SS = l:(YI - y)2 tiene v grados de libertad, entonces

(2-11)
El nmero de grados de libertad de una suma de cuadrados es igual al nmero de elementos independientes en dicha Suma de cuadrados. Por ejemplo, SS = l:~gl (YI - y)2 en la ecuacin 2-9 consiste en la suma de los cuadrados de los n elementos Y - y, Y2 - y, ..., Yn - y. No todos estos elementos son independientes 1 porque l:~"l (YI - y) = O; de hecho, slo n -1 de ellos son independientes, 10 cual implica que SS tiene n-l grados de libertad.
La distribucin normal y otras distribuciones de muestreo

En muchas ocasiones la distribucin de probabilidad de un estadstico particular puede determinarse si se conoce la distribucin de probabilidad de la poblacin de la que se tom la muestra. A la distribucin de probabilidad de un estadstico se le llama la distribuci6n de muestreo. A continuacin se revisan brevemente varias distribuciones de muestreo tiles. Una de las distribuciones de muestreo ms importantes es la distribuci6n normal. Siy es una variable aleatoria normal, la distribucin de probabilidad de y es

f(y) = _1_ e-(I/2)[(Y-I')/<J'

aJ2ii

-oo<y<oo

(2-12)

donde -00 < .t < 00 es la media dle la distribucin y if > Oes la varianza. En la figura 2-5 se ilustra la distribucin normal. Debido a que las corridas muestrales que difieren como resultado del error experimental a menudo se encuentran descritas adecuadamente en la distribucin normal, sta desempea un papel fundamental en el anlisis de los datos de experimentos diseados. Tambin es posible definir muchas distribuciones de muestreo importantes en trminos de variables aleatorias normales. Con frecuencia se usa la notacin y - N(p, if) para denotar que y sigue una distribucin normal con media .t y varianza if. Un caso especial importante de la distribucin normal es la distribuci6n normal estndar; es decir, .t = O Y if = 1. Se observa que si y - N(p, if), la variable aleatoria
z=--

Y- .t a

(2-13)

Ji

Figura 2-5 La distribucin normal.

30

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

sigue la distribucin normal estndar, denotadaz - N(O, 1). A la operacin ilustrada en la ecuacin 2-13 suele llamrsele la estandarizacin de la variable aleatoria normal y. En la tabla 1 del apndice se presenta la distribucin normal estndar acumulada. En muchas tcnicas estadsticas se supone que la variable aleatoria sigue una distribucin normal. El teorema del lmite central es con frecuencia una justificacin de la normalidad aproximada.

TEOREMA 2~ 1

111 111

"

"

111 111

111 111 111

111

El teorema del lmite central SiY,Yz, ..,Yn es una sucesin de n variables aleatorias independientes que tienen una distribucinidntica con E(y) = ..t y V(y) = el (ambas finitas) y x = Yt + Yz + ... + Ym entonces
Z
n

=--

x-r nu

"Jna z

tiene una distribucin N(O, 1) aproximada en el sentido de que, si Fiz) es la funcin de la distribucin de z; y tI>(z) es la funcin de la distribucin de la variable aleatoria N(O, 1), entonces lm, ... .,[Fn(z)/ tI>(z)] = 1.
111 111 111 111 111 111 111 111 111 111 111 111 .. 111 111 111 111 111 111 111 ,. 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 " " " '" "

Este resultado establece en esencia que la suma de n variables aleatorias independientes que tienen una distribucin idntica sigue una distribucin aproximadamente normal. En muchos casos esta aproximacin es adecuada para valores muy pequeos de n, digamos n < 10, mientras que en otros casos se necesita un valor grande de n, digamos n > 100. Frecuentemente se considera que el error de un experimento surge de una manera aditiva de varias fuentes independientes; por consiguiente, la distribucin normal se convierte en un modelo recomendable para el error experimental combinado. Una importante distribucin de muestreo que puede definirse en trminos de variables aleatorias normales es la distribucin Xl o ji-cuadrada. Si Z, Zz, ... , Zk son variables aleatorias que tienen una distribucin normal e independiente con media yvarianza 1, euya abreviatura es NID(O, 1), entonces la variable aleatoria

sigue la distribucin ji-cuadrada con k grados de libertad. La funcin de densidad de la distribucin ji-cuadrada es

x>O

(2-14)

En la figura 2-6 se ilustran varias distribuciones ji-cuadrada. La distribucin es asimtrica, o sesgada, con media y varianza

respectivamente. En la tabla III del apndice se presentan los puntos porcentuales de la distribucin ji-cuadrada.

23 MUESTREO YDISTRIBUCIONES DEMUESTREO

31

Figura 2-6 Varias distribuciones ji-cuadrada.

Como un ejemplo de una variable aleatoria que sigue la distribucin ji-cuadrada, suponga que YI> Y2' ... , y" es una muestra aleatoria de una distribucin NJl, 0-2). Entonces

Es decir, SS/rr sigue una distribucin ji-cuadrada con n - 1 grados de libertad. Muchas de las tcnicas utilizadas en este libro requieren el clculo y la manipulacin de sumas de cuadrados. El resultado dado en la ecuacin 2-15 es de suma importancia y aparece en mltiples ocasiones; cuando una suma de cuadrados de variables aleatorias normales se divide por rr sigue la distribucin ji-cuadrada. Al examinar la ecuacin 2-8, se observa que la varianza muestral puede escribirse como (2-16) Si las observaciones de la muestra son N1D(l, rr), entonces la distribucin de S2 es [rr/(n -1)]X:_l' Por lo tanto, la distribucin de muestreo de la varianza muestral es una constante multiplicada por la distribucin ji-cuadrada si la poblacin tiene una distribucin normal. son variables aleatorias independientes normal estndar y ji-cuadrada, respectivamente, la Si z y variable aleatoria

X;

1
k

=-===

~XUk

(2-17)

sigue la distribucin t con k grados de libertad, denotada IIr.- La funcin de densidad de 1 es

f(k+l)/2]
[(/)= .ffiir(k/2) [(/

1
2/k)+I](k+l l /2

-00<1<00

(2-18)

yla media y la varianza de Ison,u =Oyrr =k/(k-2) para k > 2, respectivamente. En la figura 2-7 se ilustran varias distribuciones l. Observe que si k = 00, la distribucin 1 se convierte en la distribucin normal

32

CAPTUW 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Figura J7 Varias distribuciones t.

estndar. En la tabla 11 del apndice se presentan los puntos porcentuales de la distribucin t. SiYl,Y2, ... , Yn es una muestra aleatoria de una distribucin N(..t, al), entonces la cantidad

t = SI../

Y-J.

(2-19)

se distribuye como t con n - 1 grados de libertad. La ltima distribucin de muestreo que consideraremos es la distribucinF. Si X~ y X~ son dos variables aleatorias ji-cuadrada independientes con u y v grados de libertad, respectivamente, entonces el cociente

Fu v = X~ Iv

X2 1u

(2-20)

sigue la distribucin F con u grados de libertad en el numerador y v grados de libertad en el denominador. Six es una variable aleatoria F con u grados de libertad en el numerador y v grados de libertad en el denominador, entonces la distribucin de probabilidad de x es

hx _

()- r(~r(~)[(;;~+l]'m)"
"
- - - - u-4.lI .. 10 u .. 4,lI-30 --_-- u. 10. II - 10 - - u .. 10,lI-30

r(T)(~r2

X(u/2)-1

O<x<oo

(2-21)

'" :li!

:a
-8

11

0.6

Q.

e
0.4

" '" "~ 0.2 . .


el

o
Figura J8

Varias distribuciones F.

"

24 INFERENCIAS ACERCA DELAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

33

En la figura 2-8 se ilustran varias distribuciones R Esta distribucin es muy importante en el anlisis estadstico de experimentos diseados. En la tabla IV del apndice se presentan los puntos porcentuales de la distribucin R Como un ejemplo de un estadstico que sigue una distribucin F, suponga que se tienen dos poblaciones normales independientes con varianza comn SiYwYI2> ..., Y111, es una muestra aleatoria de nI observaciones de la primera poblacin y si Y2bY22, .. , Y2", es una muestra aleatoria de n2 observaciones de la segunda, entonces

er.

_l _ _

S2 S2
2

F 11,-1.11,-1

(2-22)

donde S12 ysi son las dos varianzas muestrales. Este resultado se sigue directamente de las ecuaciones 2-15 y 2-20.

2..4

INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

Estamos preparados ahora para volver al problema del mortero de cemento portland de la seccin 2-1. Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en la fuerza de la tensin de adhesin. En esta seccin se examina cmo pueden analizarse los datos de este experimento comparativo simple utilizando procedimientos de prueba de hiptesis e intervalos de confian za para comparar las medias de dos tratamientos. A lo largo de esta seccin se supone que se usa un diseo experimental completamente aleatorizado. En este diseo, los datos se consideran como si fueran una muestra aleatoria de una distribucin normal.

2..4.1

Prueba de hiptesis

Se retoma ahora el experimento del cemento portland introducido en la seccin 2-1. Recuerde que el inters se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin modificar y una del mortero modificado. En general, estas dos formulaciones pueden considerarse como dos niveles del factor "formulaciones". Sea que Yw Y12' ..., Y111' represente las n 1 observaciones del primer nivel del factor y que Y21'Y22' .., Y2", represente las n 2 observaciones del segundo nivel del factor. Se supone que las muestras se sacan al azar de dos poblaciones normales independientes. En la figura 2-9 se ilustra la situacin.

11,
Muestra 1: Y11.,)"2... ,)"11,

Mul:lSlra 2:y21. YU..... Y2n z

Nivel 1 delfactor

Nivel2 delfactor

Figura 29 La situacin del muestreo para la prueba t de dos muestras.

34

CAPTIJLo 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Un modelo de los datos Con frecuencia los resultados de un experimento se describen con un modelo. Un modelo estadstico simple que describe los datos de un experimento como el que acaba de describirse es

i =1 2
Yij=#+Eij { j'=l'
,

2, , ni

(2-23)

donde Yj es la observacinj-sima del nivel i del factor, #i es la media de la respuesta para el nivel -simo del factor, y Eij es una variable aleatoria normal asociada con la observacin ijsima. Se supone que las Eij son NID(O, a), i 1,2. Se acostumbra hacer referencia a Eij como el componente del error aleatorio del modelo. Puesto que las medias #1 y #2 son constantes, se observa directamente a partir del modelo que las Yj son NIDCa, a ), i 1, 2, como se acaba de suponer arriba. Para ms informacin acerca de los modelos de los datos, referirse al material suplementario del texto.

Hiptesis estadsticas Una hiptesis estadstica es un enunciado o afirmacin ya sea acerca de los parmetros de una distribucin de probabilidad o de los parmetros de un modelo. La hiptesis refleja alguna conjetura acerca de la situacin del problema. Por ejemplo, en el experimento del cemento portland, puede pensarse que las fuerzas de la tensin de adhesin promedio de las dos formulaciones del mortero son iguales. Esto puede enunciarse formalmente como
H O: # 1 = #2 H 1: # 1 '# #2

donde #1 es la fuerza de la tensin de adhesin promedio del mortero modificado y #2 es la fuerza de tensin de enlace promedio del mortero sin modificar. Al enunciado H O:# 1 = #2 se le llama la hiptesis nula y aH1:#1 '# #2 se le llama la hiptesis alternativa. A la hiptesis alternativa que se especifica aqu se le llama hiptesis alternativa de dos colas porque sera verdadera si #1 < #2 o si #1 > #2Para probar una hiptesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular un estadstico de prueba apropiado para despus rechazar o no estar en posicin de rechazar la hiptesis nula Hi: Parte de este procedimiento consiste en especificar el conjunto de valores del estadstico de prueba que llevan al rechazo de H o A este conjunto de valores se le llama la regin crtica o regin de rechazo de la prueba. Pueden cometerse dos tipos de errores cuando se prueban hiptesis, Si la hiptesis nula se rechaza cuando es verdadera, ha ocurrido un error tipo 1. Si la hiptesis nula no se rechaza cuando es falsa, se ha cometido un error tipo 11. Las probabilidades de estos dos errores se expresan con smbolos especiales:

a = P( error tipo 1) = P( rechazar H IH es verdadera)

P= P( error tipo 11)= P( dejar de rechazar H IH

es falsa)

En ocasiones es ms conveniente trabajar con la potencia de la prueba, donde Potencia = 1- P= P( rechazar Ha IHa es falsa) El procedimiento general en la prueba de hip6tesis es especificar un valor de la probabilidad a del error tipo 1, llamada con frecuencia el nivel de significacin de la prueba, y despus disear el procedimiento de prueba de tal modo que la probabilidad {3 del error tipo 11tenga un valor convenientemente pequeo.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

35

La prueba t de dos muestras Considere que puede suponerse que las varianzas de las fuerzas de la tensin de adhesin fueron idnticas para ambas formulaciones del mortero. Entonces el estadstico de prueba que deber usarse para comparar las medias de dos tratamientos en el diseo completamente aleatorizado es

t"~ ~
Sp
-+~

(2-24)

n1

n2

dondej Y.Y2 son las medias muestrales, n 1Yn2 son los tamaos de las muestras, S ~ es una estimacin de la = = 2 calculada a partir de varianza comn

a a; a

(n -l)S; +(n 2 -l)S; n1 +n 2 - 2

(2-25)

YS12 y S; son las dos varianzas muestrales individuales. Para determinar si deber rechazarse H o: 1-"1 1-"2' se comparara t o con la distribucin t con n1 + n 2 - 2 grados de libertad. Si ItoI > t a/2'''1 +".-2' donde t a/2'''1 +".-2 es el punto porcentual a/2 superior de la distribucin t con n 1 + n2- 2 grados de libertad, entonces se rechazara H Yse concluira que las fuerzas promedio de las dos formulaciones del mortero de cemento portland difieren. A este procedimiento de prueba se le llama generalmente la prueba t de dos muestras. Este procedimiento puede justificarse de la siguiente manera. Si el muestreo se est haciendo de distribuciones normales independientes, entonces la distribucin de J1 -.Y2 es N[,u1 - 1-"2' ti( l/n 1 + 1/n2)]. Por lo tanto, si se conociera ti, y si H o: = 1-"2 fuera verdadera, la distribucin de 1-"1

(2-26)

seraN(O, 1). Sin embargo, al sustituir a con Sp en la ecuacin 2-26, la distribucin de Z cambia de la normal estndar a la distribucin t con n 1 + n 2 - 2 grados de libertad. Ahora bien, si H es verdadera, to de la ecuacin 2-24 se distribuye como t "1+"2- 2 y, por consiguiente, se esperara que 100(1-a) por ciento de los valores de t oestn entre-t a / 2 ,,, , +"2- 2 y t a / 2 ." , +".-2. Una muestra que produjera un valor de t oque estuviera fuera de estos lmites sera inusual si la hiptesis nula fuera verdadera y es evidencia de que H deber rechazarse. Por lo tanto, la distribucin t con n1 + n2- 2 grados de libertad es la distribucin de referencia apropiada para el estadstico de prueba too Es decir, describe el comportamiento de tocuando la hiptesis nula es verdadera. Observe que a es la probabilidad del error tipo 1 de la prueba. En algunos problemas quiz quiera rechazarse H nicamente si una de las medias es mayor que la otra. Por lo tanto, se especificara una hiptesis alternativa de una cola H 1:1-"1 > 1-"2 y H slo se rechazara si to > t a,", +".-2. Si se desea rechazar H slo si 1-"1 es menor que 1-"2' entonces la hiptesis alternativa es H 1:1-"1 < 1-"2' y H se rechazada si to < -t a,", +".-2 Para ilustrar el procedimiento, considere los datos del cemento portland de la tabla 2-1. Para estos datos, se encuentra que
Mortero modificado
ji1 = 16.76 kgf /

Mortero sin modificar

cm'

Y2

17.92 kgf / cm'

5,.2 = 0.100 5,. = 0.316


11

si =0.061
S2 =0.247 n 2 =10

= 10

36

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Puesto que las desviaciones estndar muestrales son razonablemente similares, no es improcedente concluir que las desviaciones estndar (o las varianzas) poblacionales son iguales. Por lo tanto, puede usarse la ecuacin 2-24 para probar las hiptesis
H o: #1

=#z
;t:

H: #1

#z

: Adems, ni + n z- 2 = 10 + 10 - 2 = 18, Ysi se elige a = 0.05, entonces H O ,u1=,uzse rechazara si el valor numrico del estadstico de prueba to > tOO'lS, 18 = 2.101, o si to < -10.0'lS,18 = -2.101. Estos lmites de la regin crtica se ilustran en la distribucin de referencia (t con 18 grados de libertad) de la figura 2-10. Al utilizar la ecuacin 2-25 se encuentra que
S
2
p

(ni -1)S1 +(n 2 -l)Si = -:.......:_~~----'--=---------'------=-ni +n 2


-

= 10+10-2 = 0.081 Sp = 0.284


y el estadstico de prueba es
t
o

9(0.100) + 9(0.061)

= }\ - Y2
ni

Sp - + n2

JR1

=~---===

16.76-17.92

0.284~k+fo-

=-9.13

Puesto que t o = -9.13 < -10.025,18 = -2.101, se rechazara Hjy se concluira que las fuerzas de la tensin de adhesin promedio de las dos formulaciones del mortero de cemento portland son diferentes.

"O

~ 0.3
~
.D.

.
o

"O "O

"O .;

..

0.2

:
el

0.1

Figura 210
:ttO.025
"

La distribucin t con 18 grados de libertad con la regin crtica

= 2.101.

2-4 INFERENCIAS ACERCADE LASDIFERENCIAS EN LAS MEDIAS, DISEOSALEATORIZADOS

37

El uso de valores P en la prueba de hiptesis Una manera de reportar los resultados de una prueba de hiptesis es estableciendo que la hiptesis nula fue rechazada o no para un valor de a o nivel de significacin especfico. Por ejemplo, en el experimento del mortero de cemento portland anterior puede decirse que H o:f.1 1 = f.12 se rechaz con el nivel de significacin 0.05. Esta enunciacin de las conclusiones es con frecuencia inadecuada porque no le ofrece al responsable de la toma de decisiones idea alguna de si el valor calculado del estadstico de prueba apenas rebas la regin de rechazo o si se adentr bastante en la misma. Adems, al darse los resultados de esta manera se les impone a otros usuarios de la informacin el nivel de significacin predefinido. Este enfoque puede ser insatisfactorio porque algunos responsables de la toma de decisiones podran sentirse incmodos con los riesgos que implica el valor a = 0.05. Para evitar estas dificultades, en la prctica se ha adoptado extensivamente el enfoque del valor P. El valor P es la probabilidad de que el estadstico de prueba asuma un valor que sea al menos tan extremo como el valor observado del estadstico cuando la hiptesis nula H es verdadera. Por lo tanto, un valor P transmite mucha informacin acerca del peso de la evidencia en contra de H y, por consiguiente, el responsable de la toma de decisiones puede llegar a una conclusin con cualquier nivel de significacin especificado. En trminos ms formales, el valor Pse define como el nivel de significacin menor que llevara a rechazar la hiptesis nula H o. Se acostumbra decir que el estadstico de prueba (y los datos) es significativo cuando se rechaza la hiptesis nula; por lo tanto, el valor P puede considerarse como el menor nivel a en el que los datos son significativos. Una vez que se conoce el valor P, el responsable de la toma de decisiones puede determinar la medida en que los datos son significativos sin que el analista de los datos imponga formalmente un nivel de significacin preseleccionado. No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayora de los programas de computacin modernos para realizar anlisis estadsticos reportan valores P, y pueden obtenerse tambin en algunas calculadoras porttiles. A continuacin se indicar cmo obtener una aproximacin del valor P para el experimento del mortero de cemento portland. Por la tabla II del apndice, para una distribucin t con 18 grados de libertad, la probabilidad menor en el rea de la cola es 0.0005, para la cual tO.OOO5.18 = 3.922. Ahora bien, It oI = 9.13 > 3.922, de donde, ya que la hiptesis alternativa es de dos colas, se sabe que el valor P debe ser menor que 2(0.0005) 0.001. Algunas calculadoras porttiles tienen la capacidad para calcular valores P. Una de ellas es la HP-48. Utilizando esta calculadora se obtiene el valor P para el valor to = -9.13 del experimento de la formulacin del mortero de cemento portland como P = 3.68 x 10--8. Por lo tanto, la hiptesis nula H o:f.1 I = f.12 se rechazara con cualquier nivel de significacin a ;:: 3.68 x 10--8.

Solucin por computadora Hay muchos paquetes de software de estadstica que cuentan con la capacidad para probar hiptesis estadsticas. En la tabla 2-2 se presenta la salida del procedimiento para la prueba t de dos muestras de Minitab aplicado al experimento de la formulacin del mortero de cemento portland. Observe que la salida incluye algunos estadsticos concisos acerca de las dos muestras (la abreviatura "SE Mean" ["SE media"] se refiere al error estndar de la media, s / .J), as como alguna informacin sobre los intervalos de confianza para la diferencia en las dos medias (los cuales se revisan en las secciones 2-4.3 y 2-6). El programa tambin prueba la hiptesis de inters, permitiendo que el analista especifique la naturaleza de la hiptesis alternativa ("not =" ["no ="] significa H:f.1 ~ f.12) Yla eleccin de a (a = 0.05 en este caso). La salida incluye el valor calculado de to, el valor P (llamado el nivel de significacin) y la decisin que debera tomarse dado el valor especificado de a. Observe que el valor calculado del estadstico t difiere ligeramente del valor que se calcul manualmente aqu y que el valor P que se reporta es P = 0.0000. Mu-

38
Tabla 2-2

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES


Prueba t de dos muestras usando Minitab para el experimento del mortero de cemento portland Prueba t de dos muestras e intervalo de confianza

Two sample T for Modified vs Unmod


N

Modified Unmod

10 10

Mean 16.774 17.922

StDev 0.309 0.248

SE Mean 0.098 0.078

mu Unmod: (-1.411, -0.885) 95% el for mu Modified t-Test mu Modified = mu Unmod (vs not =): T = -9.16 P = 0.0000 DF = 18 80th use Pooled StDev = 0.280
chos paquetes de software no reportarn un valor P real menor que 0.0001 y en su lugar presentan un valor "por omisin". ste es el caso aqu.

Verificacin de los supuestos en la prueba t Para utilizar el procedimiento de la prueba t se establecen los supuestos de que ambas muestras se toman de poblaciones independientes que pueden describirse con una distribucin normal, que las desviaciones estndar o las varianzas de ambas poblaciones son iguales, y que las observaciones son variables aleatorias independientes. El supuesto de independencia es crtico, pero si el orden de las corridas est aleatorizado (y, de ser apropiado, se seleccionan al azar otras unidades y materiales experimentales), este supuesto por 10general se satisfar. Los supuestos de la igualdad de las varianzas y la normalidad son fciles de verificar utilizando una grfica de probabilidad normal. En general, la graficacin de probabilidades es una tcnica para determinar si los datos muestrales se ajustan a una distribucin hipotetizada con base en un examen visual subjetivo de los datos. El procedimiento general es muy simple y puede realizarse rpidamente con la mayora de los paquetes de software de estadstica. En el material suplementario del texto se analiza la construccin manual de las grficas de probabilidad normaL Para construir una grfica de probabilidad, primero se ordenan de menor a mayor las observaciones de la muestra. Es decir, la muestraycy; ...,Yn se ordena como Y(l)'Y(Z)' ,Y(n), donde Y(l) es la observacin menor,y(Z)es la segunda observacin menor, y as sucesivamente, conY(n) la mayor. Las observaciones ordenadas y (j) se grafican entonces contra sus respectivas frecuencias acumuladas observadas (j - O.5)/n. La escala de la frecuencia acumulada se ha dispuesto de tal modo que si la distribucin hipotetizada describe de manera adecuada los datos, los puntos graficados estarn aproximadamente sobre una lnea recta; si los puntos graficados muestran una desviacin significativa de una recta, el modelo hipotetizado no es apropiado. Generalmente, determinar si los datos graficados pertenecen o no a una recta es una decisin subjetiva. Para ilustrar el procedimiento, suponga que quiere verificarse el supuesto de que la fuerza de la tensin de adhesin en el experimento de la formulacin del mortero de cemento portland sigue una distribucin normal. Inicialmente slo se consideran las observaciones de la formulacin del mortero sin modificar. En la figura Z-l1a se ilustra una grfica de probabilidad normal generada por computadora. La mayora de las grficas de probabilidad normal muestran 100(; - 0.5)/n en la escala vertical izquierda (yen ocasiones se muestra 100[1- (j - O.S)/n] en la escala vertical derecha), con el valor de la variable graficado en la escala horizontal. Algunas grficas de probabilidad normal convierten la frecuencia acumulada en un valor z normalizado. Una lnea recta, elegida de manera subjetiva, se ha trazado en medio de los pun-

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LASMEDIAS, DISEOS ALEATORIZAOOS

39

1
e

"" ~
~

~ E
0.1 17.5 17.7 17.9 18.1

Fuerza de la tensin de edhesin

al Mortero sin modificar


_ 99.9

1;1

iii

.. ~ .'"
u

99 95
80

1;1 1;1

:s

:.c

..

~ e

50 20 5

0.1 16.3

16.5

16.7

16.9

Fuerza de la tensin de adhesin b) Mortero modificado

Figura 211 Grficas de probabilidad normal de la fuerza de la tensin de adhesin en el experimento del cemento portland.

tos graficados. Al trazar la lnea recta, uno deber guiarse ms por los puntos de la parte media de la grfica que por los puntos extremos. Una buena regla emprica es trazar la recta aproximadamente entre los puntos de los cuartiles 25 y 75. As se determin la recta de la figura 2-11a. Para evaluar la "proximidad" de los puntos a la lnea recta, imagine un lpiz grueso colocado sobre la recta. Si este lpiz imaginario cubre todos los puntos, entonces una distribucin normal describe de manera adecuada los datos. Puesto que los puntos de la figura 2-11a pasaran la prueba del lpiz grueso, se concluye que la distribucin normal es un modelo apropiado para la fuerza de la tensin de adhesin del mortero sin modificar. En la figura 2-11b se presenta la grfica de probabilidad normal para las 10 observaciones de la fuerza de la tensin de adhesin del mortero modificado. De nueva cuenta, se concluira que es razonable el supuesto de una distribucin normal. Es posible obtener una estimacin de la media y la desviacin estndar directamente de la grfica de probabilidad normal. La media se estima como el percentil50 de la grfica de probabilidad y la desviacin estndar se estima como la diferencia entre los percentiles 84 y 50. Esto significa que el supuesto de la igualdad de las varianzas poblaconales en el experimento del cemento portland puede verificarse comparando las pendientes de las dos rectas de las figuras 2-11a y 2-11b. Ambas rectas tienen pendientes muy si-

40

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

milares, por lo que el supuesto de la igualdad de las varianzas es razonable. Si se viola este supuesto, deber usarse la versin de la prueba t que se describe en la seccin 2-4.4. En el material suplementario del texto hay ms informacin acerca de la verificacin de los supuestos de la prueba t. Cuando ocurren violaciones importantes de los supuestos, se afectar el desempeo de la prueba t. En general, las violaciones de pequeas a moderadas no son motivo de preocupacin particular, pero no deber ignorarse cualquier falla del supuesto de independencia, as como los indicios claros de que no se satisface el supuesto de normalidad. Tanto el nivel de significacin de la prueba como la capacidad para detectar diferencias entre las medias sern afectados adversamente por el incumplimiento de estos supuestos. Un recurso para resolver este problema son las transformaciones. Este tema se analiza con mayor detalle en el captulo 3. Tambin es posible utilizar procedimientos no paramtricos para la prueba de hiptesis cuando las observaciones provienen de poblaciones no normales. Referirse a Montgomery y Runger [83d] para ms detalles. Una justificacin alternativa de la prueba t La prueba t de dos muestras que acaba de presentarse depende en teora del supuesto fundamental de que las dos poblaciones de las que se seleccionaron las muestras al azar son normales. Aun cuando el supuesto de normalidad es necesario para desarrollar formalmente el procedimiento de prueba, como ya se mencion, las desviaciones moderadas de la normalidad no afectarn seriamente los resultados. Puede argumentarse (por ejemplo, ver Box, Hunter y Hunter [18]) que el uso de un diseo aleatorizado permite probar hiptesis sin ningn supuesto respecto de la forma de la distribucin. En resumen, el razonamiento es el siguiente. Si los tratamientos no tienen ningn efecto, todas las [20!/(10!1O!)] = 184,756 formas posibles en que podran ocurrir las 20 observaciones son igualmente posibles. Hay un valor de t o para cada uno de estos 184,756posibles arreglos. Si el valor de t o que se obtiene en realidad de los datos es inusualmente grande o inusualmente pequeo con referencia al conjunto de los 184,756valores posibles, es una indicacin de que fll :; fl2' A este tipo de procedimiento se le llama prueba de aleatorizaci6n. Puede demostrarse que la prueba t es una buena aproximacin de la prueba de aleatorizacin. Por lo tanto, se usarn aqu pruebas t (y otros procedimientos que pueden considerarse aproximaciones de pruebas de aleatorizacin) sin prestar demasiada atencin al supuesto de normalidad. sta es una de las razones por las que un procedimiento simple, como las grficas de probabilidad normal, es adecuado para verificar el supuesto de normalidad.
2~4.2

Eleccin del tamao de la muestra

La eleccin de un tamao de la muestra apropiado es uno de los aspectos ms importantes de cualquier problema de diseo experimental. La eleccin del tamao de la muestra y la probabilidad f3 del error tipo II guardan una estrecha relacin. Suponga que se estn probando las hiptesis H o : #1 = #2 H 1 : #1 :; #2 Yque las medias no son iguales, por lo que = #1-#2' Puesto que HO:#1 = #2no es verdadera, la preocupacin principal es cometer la equivocacin de no rechazar H o La probabilidad del error tipo II depende de la verdadera diferencia en las medias O. A una grfica de f3 contra opara un tamao particular de la muestra se le llama la curva de operacin caracterstica, o curva OC, de la prueba. El error f3 tambin es una funcin del tamao de la muestra. En general, para un valor dado de o, el error f3 se reduce cuando el tamao de la muestra se incrementa. Es decir, es ms fcil detectar una diferencia especificada en las medias para tamaos grandes de la muestra que para los tamaos pequeos.

2-4 INFERENCIAS ACERCA DELAS DIFERENCIAS ENLAS MEDIAS, DISEOS ALEATORIZADOS

41

En la figura 2-12 se muestra un juego de curvas de operacin caracterstica para las hiptesis
:# HO l

= #2

H1;#1~#2

para el caso en que las dos varianzas poblacionales son desconocidas pero iguales = = 2) y para un nivel de significacin de a = 0.05. Las CUlVas tambin parten del supuesto de que los tamaos de las muestras de las dos poblaciones son iguales; es decir, n 1 =n2 =n. El parmetro del eje horizontal de la figura 2-12 es

a ya;

(a a; a

d )#1 - ."21 = ~ 2a 2a La divisin de Id I por 2a permite al experimentador usar el mismo juego de curvas, independientemente del valor de la varianza (la diferencia en las medias se expresa en unidades de desviacin estndar). Por otra parte, el tamao de la muestra usado para construir las curvas es en realidad n * = 2n - 1. Al examinar estas curvas, se observa 10 siguiente:
1. Entre ms grande sea la diferencia en las medias, #1 - #2' menor ser la probabilidad del error tipo 11 para un tamao de la muestra y un valor de a dados. Es decir, para un tamao de la muestra y un valor de a especificados,la prueba detectar con mayor facilidadlas diferencias grandes que las pequeas. 2. Cuando el tamao de la muestra se hace ms grande, la probabilidad del error tipo 11 se hace ms pequea para una diferencia en las medias y un valor de a dados. Es decir, para detectar una diferencia d especificada, puede aumentarse la potencia de la prueba incrementando el tamao de la muestra. Las curvas de operacin caracterstica son con frecuencia tiles para seleccionar el tamao de la muestra que debe usarse en un experimento. Por ejemplo, considere el problema del mortero de cemento portland comentado antes. Suponga que si las dos formulaciones difieren en la fuerza promedio hasta en 0.5 kgf/cm', sera deseable detectarlo con una probabilidad alta. Por 10 tanto, puesto que #1 - #2 =

::tl'"

.. . "
~

0.6

.. " " 0.4 ~


JIl
D..

Figura 212 Curvas de operacin caracterstica para la prueba t de dos colas con a = 0.05. (Reproducida con permiso de "Operating Characteristics Curves for the Common Statistical Tests of Significance", C.L. Ferris, F.E. Grubbs y c.L. Weaver, Annals o{ Mathematical Statistics.)

42

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

0.5 kgf/crrr'es la diferencia "crtica" en las medias que quiere detectarse, se encuentra que d, el parmetro del eje horizontal de la curva de operacin caracterstica de la figura 2-12, es

Desafortunadamente, d incluye al parmetro desconocido a. Sin embargo, suponga que con base en la experiencia previa se piensa que es altamente improbable que la desviacin estndar de cualquiera de las observaciones de la fuerza exceda 0.25 kgf/cnr'. Entonces al usar a = 0.25 en la expresin anterior para d se obtiened =1. Si quiere rechazarse la hiptesis nula 95% de las veces cuandoPI-pz = 0.5, entonces,8 = 0.05, y en la figura 2-12 conf3 = 0.05 y d = 1 se obtiene n" = 16, aproximadamente. Por lo tanto, puesto que n * = 2n - 1, el tamao de la muestra requerido es

n= n*+1 = 16+1 = &5=9


2 2

y se usaran los tamaos de las muestras ni = n z = n = 9. En el ejemplo que se ha venido considerando, el experimentador utiliz en realidad un tamao de la muestra de 10. Quizs el experimentador decidi incrementar ligeramente el tamao de la muestra a fin de prevenir la posibilidad de que la estimacin previa de la desviacin estndar comn a haya sido demasiado conservadora y quiz fuera un poco mayor que 0.25. Las curvas de operacin caracterstica desempean con frecuencia un papel importante en la eleccin del tamao de la muestra en los problemas de diseo experimental. Su utilizacin a este respecto se revisa en captulos subsecuentes. Para un anlisis de los usos de las curvas de operacin caracterstica en otros experimentos comparativos simples similares a la prueba t de dos muestras, vase Montgomery y Runger [83d].

2-4.3

Intervalos de confianza

Aun cuando la prueba de hiptesis es un procedimiento til, en ocasiones no cuenta la historia completa. Muchas veces es preferible proporcionar un intervalo dentro del cual cabra esperar que estara incluido el valor del parmetro o los parmetros en cuestin. A las declaraciones de estos intervalos se les llama intervalos de confianza. En muchos experimentos de ingeniera e industriales, el experimentador sabe de antemano que las medias PI y pz difieren; por consiguiente, la prueba de la hiptesis #1 = #z es de escaso inters. Por lo general el experimentador estara ms interesado en un intervalo de confianza para la diferencia en las medias PI - pz. Para definir un intervalo de confianza, suponga que 9 es un parmetro desconocido. Para obtener una estimacin del intervalo de 8, es necesario encontrar dos estadsticosL y Utales que la declaracin de probabilidad
P( L s 9 :So U)

= 1- a

(2-27)

sea verdadera. Al intervalo

Ls,8sU

(2-28)

se le llama intervalo de confianza de 100(1- a) por ciento para el parmetro 8. La interpretacin de este intervalo es que si, en muestreos aleatorios repetidos, se construye gran nmero de estos intervalos, 100(1 -a) por ciento de ellos contendrn el verdadero valor de 8. Alos estadsticosL y Use les llanialos lmites

2-4 INFERENCIAS ACERCA DELAS DIFERENCIAS ENLAS MEDIAS, DISEOS ALEATORIZAOOS

43

de confianza inferior y superior, respectivamente, ya 1- a se le llama el coeficiente de confianza. Si a = 0.05, a la ecuacin 2-28 se le llama intervalo de confianza de 95% para 8. Observe que los intervalos de confianza tienen una interpretacin de frecuencia; es decir, no se sabe si la declaracin es verdadera para esta muestra especfica, pero s se sabe que el mtodo usado para generar el intervalo de confianza produce declaraciones correctas en 100(1 - a) por ciento de las veces. Suponga que quiere encontrarse un intervalo de confianza de l00(I-a) por ciento para la verdadera diferencia de las medias #1 - #2 en el problema del cemento portland. El intervalo puede deducirse de la siguiente manera. El estadstico

se distribuye como t"l +".-2' Por lo tanto,

=1-a

(2-29)

(2-30) es un intervalo de confianza de 100(1 - a) por ciento para #1 - #2' La estimacin real del intervalo de confianza de 95% para la diferencia en la fuerza de la tensin de adhesin promedio de las formulaciones del mortero de cemento portland se encuentra haciendo la siguiente sustitucin en la ecuacin 2-30: 16.76-17.92- i(2101)0.284~fo+fo--s #1 - #2 S 16.76-17.92+(2101)0.284~fo-+fo -1.16-0.27s#1-#2 s-1.16+0.27 -1.43s #1 - #2 S -0.89 Por lo tanto, el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de -1.43 kgf/cm2 a -0.89 kgf/cm2. Expresado en otros trminos, el intervalo de confianza es #1 - #2 = -1.16 kgflcm2 0.27 kgf/cm2, o la diferencia en las fuerzas promedio es -1.16 kgf/cnr', y la precisin de esta estimacin es de 0.27 kg/cm 2. Observe que como,u1-,u2 = Ono est incluida en este intervalo, los datos no apoyan la hiptesis de que #1 = #2 con el nivel de significacin de 5%. Es probable que la fuerza media de la formulacin sin modificar exceda la fuerza media de la formulacin modificada. Observe que en la ta-

44

CAP"l ULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

bla 2-2 Minitab tambin report este intervalo de ccnfianza cuando se llev a cabo el procedimiento de la prueba de hiptesis" 2..4.4 Caso en que

a ;t: a;
n.. #1 = #2
HI:#I
;te.

Si se est probando
#2

Yno hay bases para suponer que las varianzas son iguales, entonces es necesario hacer ligeras modificaciones en la prueba t de dos muestras. En este caso el estadstico de prueba es

oi yo;

t 0-

5\ - Y2
52 52 _1+_2
ni n2

(2-31)

Este estadstico no se distribuye exactamente como t. No obstante, t es una buena aproximacin de la distribucin de to si se usa

(2-32)

para los grados de libertad. Una indicacin clara de la desigualdad de las varianzas en una grfica de probabilidad normal sera una situacin que requerira esta versin de la prueba t. El lector no deber encontrar problemas para desarrollar una ecuacin para encontrar ese intervalo de confianza para la diferencia en las medias en el caso de varianzas desiguales.

2-4.5

Caso en que se conocen

a yai
H O:#I=#2 H I:#I;te.#2

Si las varianzas de ambas poblaciones se conocen, entonces las hiptesis

pueden probarse utilizando el estadstico

Z 0--

YI - Y2
0 0 _'+_2
2 2

(2-33)

ni

n2

Si ambas poblaciones son normales, o si los tamaos de las muestras son lo suficientemente grandes para aplicar el teorema del lmite central, la distribucin de Zo es N(O, 1) si la hiptesis nula es verdadera. Por lo tanto, la regin crtica se encontrara utilizando la distribucin normal en lugar de la distribucin t. Especficamente, H se rechazara si IZo I > Za/2' donde Zal2 es el punto porcentual a/2 superior de la distribucin normal estndar.

2-4 INFERENCIAS ACERCA DE LASDIFERENCIAS EN LASMEDIAS, DISEOS ALEATORIZADOS

45

A diferencia de la prueba t de las secciones anteriores, en la prueba de las medias con varianzas conocidas no se requiere el supuesto de que el muestreo se haga de poblaciones normales. Puede aplicarse el teorema del lmite central para justificar una distribucin normal aproximada para la diferencia en las medias muestrales YI - Y2' El intervalo de confianza de 100(1-a) por ciento parare, -,u2 cuando las varianzas se conocen es

(2-34)
Como ya se seal, el intervalo de confianza es con frecuencia un complemento til del procedimiento de prueba de hiptesis. 2..4 .6 Comparacin de una sola media con un valor especificado

Algunos experimentos incluyen la comparacin de la media,u de una sola poblacin con un valor especificado, por ejemplo ,uo. Las hiptesis son

Ho:,u=,uo H]:,u '#,uo


Si la poblacin es normal con varianza conocida, o si la poblacin no es normal pero el tamao de la muestra es lo suficientemente grande para aplicar el teorema del lmite central, entonces la hiptesis puede probarse utilizando una aplicacin directa de la distribucin normal. El estadstico de prueba es

Z
o

= y-,uo
a/.J

(2-35)

Si Ho:,u =,uo es verdadera, entonces la distribucin de Z es N(O, 1). Por lo tanto, la regla de decisin para Ha:,u = ,uo es rechazar la hiptesis nula si IZo1 > Za/2' El valor de la median especificado en la hiptesis nula se determina por lo general mediante una de las tres formas siguientes. Puede ser resultado de evidencia, conocimientos o experimentacin previos. Puede ser resultado de alguna teora o modelo que describe la situacin bajo estudio. Por ltimo, puede ser resultado de especificaciones contractuales. El intervalo de confianza de 100(1 - a) por ciento para la verdadera media poblacional es

(2-36)

EJEMPLO 2"1

111

Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la resistencia a la ruptura promedio excede 200 psi. De ser as, el fabricante aceptar el lote. La experiencia pasada indica que un valor razonable para la varianza de la resistencia a la ruptura es 100(psif Las hiptesis que debern probarse son

Ho:,u = 200 H]:,u > 200


Observe que se trata de una hiptesis alternativa de una cola. Por lo tanto, el lote se aceptara slo si la hiptesis nula Ha:,u = 200 pudiera rechazarse (es decir, si Zo > Za)'

46

CAPlULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

y = 214 psi. El valor del

Se seleccionan cuatro ejemplares aleatoriamente, y la resistencia a la ruptura promedio observada es estadstico de prueba es Z
o

= y- #0 = 214- 200 = 2.80 a /.J 1O/.J4

Si se especifica un error tipo 1 de a = 0.05, en la tabla 1 del apndice se encuentra que Z = ZO-os = 1.645. Por lo tanto, H se rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200 psi.

...............................................................................

Cuando no se conoce la varianza de la poblacin, es necesario establecer el supuesto adicional de que la poblacin sigue una distribucin normal, aunque las desviaciones moderadas de la normalidad no afectarn seriamente los resultados. Para probar H o:# = #0 en el caso de la varianza desconocida, se usa la varianza muestral S2 para estimar a', Al sustituir a con S en la ecuacin 2-35, se obtiene el estadstico de prueba
I

= y- #0
o

S/J!i

(2-37)

La hiptesis nula H o: # = P. o se rechazara si 110 I > la/2." -1, donde la12." -1 denota el punto porcentual a/2 superior de la distribucin I con n -1 grados de libertad. El intervalo de confianza de 100(1- a) por ciento es en este caso (2-38)

2 ..4.7

Resumen

En las tablas 2-3 y 2-4 se resumen los procedimientos de prueba estudiados aqu para las medias muestrales. Se muestran las regiones crticas para hiptesis alternativa tanto de una como de dos colas.

Thbla 23

Pruebas para medias con varianza conocida

Hiptesis
H o:/1

Estadstico de prueba

Criterios de rechazo

=/10
Z < -Za

H 1:W:;t; /10
H o:/1 = /10

H 1 :/1 < /10 H o:/1 =/10 H 1 :/1 > /10


:/11 H O =/12

H 1 :/12 "" /12 :/11 H O = /12 H 1:/11 < /12 H O = /11 :/11 H 1 :;, > /12

25 INFERENCIAS ACERCA DELAS DIFERENCIAS ENLAS MEDIAS, DISEOS DECOMPARACIONES PAREADAS


Tabla 2-4 Pruebas para medias de distribuciones normales, varianza desconocida

47

Hiptesis H o:/4 = P,o H:p, 'I! /lo

Estadstico de prueba Criterios de rechazo


Itol> t"'12.tH

Ho:p, =P,o H:p, < 11-0 Ho:p, =P,o H:p,> Po Ho:1lJ. H:/4

Y-/4o t o = S / J

t o < -t",,,,_ t o > t",,,,..

sia

=a~

=P,2
;l!: P,2

to =
S
P

ji -J2

v=n+n 2 - 2 Ho:p, =/42 H:p, < /42


si a; 'l!a~

!F1
-+n n 2

. Itol> ta / 2

ji - ji2 to = S2 S~ -+n n 2
. n

to < -ta

Ho:p, =/42 H:p, > /42 v

(S2+s~r
nZ n2 - 1

t t a .v

= (S2 / ni + (S~ / nzl


n -1

2..5
2..5.1

INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS DE COMPARACIONES PAREADAS


El problema de las comparaciones pareadas

En algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la precisin haciendo comparaciones de observaciones pareadas del material experimental. Por ejemplo, considere una mquina para probar la dureza que presiona una barra con una punta afilada sobre un ejemplar de prueba de metal con una fuerza conocida. Al medir la profundidad de la depresin producida por la punta, se determina la dureza del ejemplar de prueba. En esta mquina pueden instalarse dos puntas diferentes y aun cuando la precisin (la variabilidad) de las mediciones hechas con las dos puntas parece ser la misma, se sospecha que una de las puntas produce diferentes lecturas de la dureza que la otra. Sera posible realizar un experimento de la siguiente manera. Podran seleccionarse al azar varios ejemplares de prueba del metal (por ejemplo, 20). La mitad de estos ejemplares de prueba podran probarse con la punta 1 y la otra mitad con la punta 2. La asignacin exacta de los ejemplares a las puntas se determinara de manera aleatoria. Puesto que se trata de un diseo completamente aleatorizado, la dureza promedio de las dos muestras podra compararse utilizando la prueba t descrita en la seccin 2-4. Al reflexionar un poco al respecto, se descubrira una seria desventaja del diseo completamente aleatorizado en este problema. Suponga que los ejemplares de prueba del metal se cortaron de barras di-

48

CAPTULO 2 EXPERlMENTOS COMPARATIVOS SIMPLES

ferentes que se fabricaron a temperaturas diferentes o que no fueran exactamente homogneos en cualquier otra forma que pudiera afectar la dureza. Esta falta de homogeneidad entre los ejemplares contribuir a la variabilidad de las mediciones de la dureza y tender a inflar el error experimental, haciendo ms difcil detectar una diferencia real entre las puntas. Para protegerse de esta posibilidad, considere un diseo experimental alternativo. Suponga que cada ejemplar de prueba tiene el tamao suficiente para que puedan hacerse en l dos determinaciones de la dureza. Este diseo alternativo consistira en dividir cada ejemplar de prueba en dos secciones, para despus asignar de manera aleatoria una punta a una mitad de cada ejemplar de prueba y la otra punta a la otra mitad. El orden en que se prueban las puntas en un ejemplar de prueba particular se seleccionara al azar. El experimento, cuando se llev a cabo de acuerdo con este diseo con 10 ejemplares de prueba, produjo los datos (codificados) que se muestran en la tabla 2-5. Un modelo estadstico que describe los datos de este experimento puede expresarse como

Yi}

i =1 2 = ,ti +P j +Ei} { j=;, 2, ... , 10

(2-39)

donde Yi} es la observacin de la dureza para la punta i en el ejemplar de pruebaj.u, es la verdadera dureza promedio de la punta i-sima, P es un efecto sobre la dureza debido al ejemplar de pruebaj-simo, y Ei} es j Es decir, es la varianza de las mediciones el error experimental aleatorio con media cero y varianza de la dureza hechas con la punta 1 ya; es la varianza de las mediciones de la dureza hechas con la punta 2. Observe que si se calcula la diferencia pareada j-sima .

a .

d j = Y1j - Y2j
el valor esperado de esta diferencia es

j = 1, 2, ... , 10

(2-40)

,td

= E(d j)
= E(Y1j - Y2j) = E(Y1j )- E(Y2j ) = ,t1 +P j -(,t2 +P j) =,t1-,t2

Es decir, pueden hacerse inferencias acerca de la diferencia en las lecturas de la dureza promedio de las dos puntas ,t1 - ,t2 haciendo inferencias acerca de la media de las diferencias ,td' Observe que el efecto adi-

Tabla 2.5

Datos del experimentode la prueba de la dureza Ejemplar de prueba Punta 1. Punta 2

176
233 335 4 4 3 5 8 8 632 724 8 9 9
954

10

2-5 INFERENCIAS ACERCA DELAS DIFERENCIAS ENLAS MEDIAS, DISEOS DECOMPARACIONES PAREADAS

49

tivo de las {Ji de los ejemplares de prueba se cancela cuando las observaciones estn pareadas de esta manera. Probar H O:.tl = .tz es equivalente a probar Ho:.td=O H1:.td El estadstico de prueba para esta hiptesis es
;f:.

O
(2-41)

donde
(2-42)

es la media muestral de las diferencias y

Sd

t (di _d)z]1I2 =[ =
J-I

[t
J-l

dI -~(t d)2]1I2
J~l

(2-43)

n-l

n-l

es la desviacin estndar muestral de las diferencias. H o: .td = Ose rechazara si It oI > tan." _i- Debido a que las observaciones de los niveles del factor estn "pareadas" en cada unidad experimental, a este procedimiento suele llamrsele prueba t pareada. Por los datos de la tabla 2-5, se encuentra di = 7-6= 1 d = 3- 2= 1 dz = 3-3= O d 7 = 2- 4 = - 2 d 3 = 3- 5= - 2 d, = 9-9= O d, = 4-3= 1 d 9 = 5-4= 1 d 5 = 8-8= O diO =4-5=-1 Por 10 tanto, 1 d = -1" d = -(-1)= -0.10 n ~l 10

L ." J~l Sd = [

dI --nI (L." d )Z]1I2


n-1

J~l

[13- tlr (-1


10-1

)z ]I/Z _ -1.20

Suponga que se elige a =0.05. Entonces, para tomar una decisin se calculara toYH se rechazara si ItoI > t O.025 9 = 2.262. El valor calculado del estadstico de prueba t pareada es

t - -----:=
0-

s, .J
-0.10

-1.20M
=-0.26

50

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

-e ~ 0.3

..2l

~ 0.2

" '" " 0.1 .~


e
--4

-2

o
lO

Figura 2-13 La distribucin de referencia (t con 9 grados de libertad) para el problema de la prueba de la dureza.

y como ItoI = 0.2~ '1' tO.025 9 = 2.262, la hiptesis HO:..td = Ono puede rechazarse. Es decir, no hay evidencia que indique que las dos puntas producen lecturas de la dureza diferentes. En la figura 2-13 se muestra la distribucin de t ocon 9 grados de libertad, la distribucin de referencia para esta prueba, con el valor de to indicado en relacin con la regin crtica. En la tabla 2-6 se muestra la salida de computadora del procedimiento para la prueba t pareada de Minitab para este problema. Observe que el valor P para esta prueba es P = 0.80, lo cual implica que no puede rechazarse la hiptesis nula con ningn nivel de significacin razonable. 2..5.2 Ventajas del diseo de comparaciones pareadas

Al diseo que se utiliz en realidad para este experimento se le llama diseo de comparaciones pareadas, el cual ilustra el principio de la formacin de bloques comentado en la seccin 1-3. De hecho, es un caso especial de un tipo de diseo ms general llamado diseo de bloques aleatorizados. El trmino bloque se refiere a una unidad experimental relativamente homognea (en el caso tratado aqu, los ejemplares de prueba del metal son los bloques), y el bloque representa una restriccin sobre la aleatorizacin completa debido a que las combinaciones de los tratamientos slo se aleatorizan dentro del bloque. En el captulo 4 se examina este tipo de diseos. En dicho captulo el modelo matemtico del diseo, la ecuacin 2-39, se escribe en una forma ligeramente diferente.
Tabla 26 Resultados de Minitab de la prueba t pareada para el ejemplo de la prueba de la dureza Prueba t pareada e intervalo de confianza

Paired T for Tip 1 Tip 1 Tip 2 Difference


10 10 10

Tip 2 Hean 4.800 4.900 -0.100 StDev 2.394 2.234 1.197 SE Mean 0.757 0.706 0.379

95% el for mean difference: (-0.956, 0.756) t-Test of mean difference = O (vs not = O): T-Value = -0.26 P-Value = 0.798

2-6 INFERENCIAS ACERCADE LASVARIANZAS DE DISTRIBUCIONES NORMALES

51

Antes de dejar este experimento, es necesario destacar varios puntos. Observe que, aun cuando se han hecho 2n = 2(10) = 20 observaciones, se cuenta nicamente con n - 1 = 9 grados de libertad para el estadstico t. (Se sabe que conforme se incrementan los grados de libertad para t, la prueba se hace ms sensible.) Al hacer la formacin de bloques o pareo, se han "perdido" en realidad n -1 grados de libertad, pero se espera haber ganado un mejor conocimiento de la situacin al eliminar una fuente adicional de variabilidad (la diferencia entre los ejemplares de prueba). Puede obtenerse una indicacin de la calidad de la informacin producida por el diseo pareado comparando la desviacin estndar Sd de las diferencias con la desviacin estndar combinada Sp que habra resultado si el experimento se hubiera conducido de manera completamente aleatorizada y se hubieran obtenido los datos de la tabla 2-5. Al utilizar los datos de la tabla 2-5 como dos muestras independientes, la desviacin estndar combinada que se calcula con la ecuacin 2-25 es Sp = 2.32. Al comparar este valor con Sd = 1.20, se observa que la formacin de bloques o pareo ha reducido la estimacin de la variabilidad en cerca de 50%. Esta informacin tambin puede expresarse en trminos de un intervalo de confianza para,ul-,u2' Utilizando los datos pareados, un intervalo de confianza de 95% para u, - #2 es

d tO.02S.9Sd / J
-0.1O(2.262)(1.20)/ .JfO -0.1O0.86 Recprocamente, al utilizar el anlisis combinado o independiente, un intervalo de confianza de 95% para # 1 - #2 es

4.80- 4.90(2101)(232)~rlr+rlr - 0.102.18 El intervalo de confianza basado en el anlisis pareado tiene una anchura sensiblemente menor que el intervalo de confianza del anlisis independiente. Esto ilustra la propiedad de reduccin del ruido de la formacin de bloques. La formacin de bloques no es siempre la mejor estrategia de diseo. Si la variabilidad dentro de los bloques es la misma que la variabilidad entre los bloques, la varianza de JI - Y2 ser la misma independientemente del diseo que se use. De hecho, la formacin de bloques en esta situacin sera una eleccin de diseo pobre porque la formacin de bloques produce la prdida de n ~ 1 grados de libertad y llevar en realidad a un intervalo de confianza con una anchura mayor paran, - #2' En el captulo 4 se ofrece una revisin ms amplia de la formacin de bloques.

2..6

INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES

En muchos experimentos, el inters se encuentra en las posibles diferencias en la respuesta media de dos tratamientos. Sin embargo, en algunos experimentos es la comparacin de la variabilidad en los datos lo que es importante. En la industria de alimentos y bebidas, por ejemplo, es importante que la variabilidad del equipo de llenado sea pequea para que todos los empaques estn cerca del peso neto nominal O el

52

CAPfruLO 2 EXPERIMENTOSCOMPARATIVOS SIMPLES

volumen del contenido neto nominal. En los laboratorios qumicos, tal vez quiera compararse la variabilidad de dos mtodos de anlisis. A continuacin se examinan brevemente las pruebas de hiptesis y los intervalos de confianza para las varianzas de distribuciones normales. A diferencia de las pruebas para las medias, los procedimientos para las pruebas de varianzas son bastante ms sensibles al supuesto de normalidad. En el apndice 2A de Davies [36] hay un buen anlisis del supuesto de normalidad. Suponga que quiere probarse la hiptesis de que la varianza de una poblacin normal es igual a una constante, por ejemplo, a~. Expresado en trminos formales, quiere probarse

H o :a

= a~

(2-44)

H 1 :a ~ a~
2

El estadstico de prueba para la ecuacin

2~44
2

es

Xo

= -;2 =
o

SS

(n-l)S2 a2
o

(2-45)

donde SS = 7~1 (Yi - y)2 es la suma de cuadrados corregida de las observaciones muestrales. La distribucin de referencia apropiada para X~ es la distribucin ji-cuadrada con n - 1 grados de libertad. La hipte. 2 ' 2 X1-(aI2),n-t> donde XaI2,n-1 y X 2- (a I2 ),n- 1 son 1 punt os porcentuaSlS nu 1 ase rechaza si vj > X a12,n-1 o SIX o <2 aza SIXo on e r ' os 1 les a/2 superior y 1 - (a/2) inferior de la distribucin ji-cuadrada con n - 1 grados de libertad, respectivamente. En la tabla 27 se presentan las regiones crticas para las hiptesis alternativas de una cola. El intervalo de confianza de 100(1 - a) por ciento para a2 es

(n-l)S2
2 X

a12,n~1

sa s

(n-l)S2
->-:-2- - ' - - X 1-(aI2),n-l

(2~46)

Considere ahora la prueba de la igualdad de las varianzas de dos poblaciones normales. Si se toman muestras aleatorias independientes de tamao n 1 Yn 2 de las poblaciones 1 y 2, respectivamente, el estadstico de prueba para
2 H o'a2 - a 2 1 (2~47)

H1:a;t:ai
es el cociente de las varianzas muestrales

(2A8)
La distribucin de referencia apropiada para F, es la distribucinF con n, -1 grados de libertad en el numeradory n 2 -1 grados de libertad en el denominador. La hiptesis nula se rechazara si F o > F a 12,n,-1.n2-1 o si F < F~(aI2),n,-l,n2-1' donde FaI2.n,-1.n2-1 YF-(aI2),n ,-l,n2-1 denotan los puntos porcentualesa/2 superior y 1 - (a/2) inferior de la distribucin F con nl - 1 Yn 2 - 1 grados de libertad. En la tabla IV del apndice slo aparecen los puntos porcentuales para la cola superior de F; sin embargo, los puntos de las colas superior e inferior se relacionan por
(2~49)

2-6 INFERENCIAS ACERCA DELAS VARIANZAS DEDISTRIBUCIONES NORMALES Tabla 27 Pruebas para las varianzas de distribuciones normales

53

Hiptesis
H o:a H :a'
2

Estadstico de prueba

Criterios de rechazo
x~ > X:/'",- o X~ < XLaf',.-

=
o!o

a~ a~
Xo =

Ho:a' =a~ H:a 2 < a~ H o:a 2 =a6 H:a' > a6 Ho:a =a~ H:a o!oa; Ho:a = a; H:a < a; Ho:a =a; H:a > a;

(n-1)S' z ao

X6 < XLa",-

F, > ]1",.,-,.,- F, > ]1",., -I",,-

En el captulo 3, seccin 3-4.3, se analizan los procedimientos de prueba para ms de dos varianzas. Se revisar tambin el uso de la varianza o la desviacin estndar como variable de respuesta en situaciones experimentales ms generales.

'EJE~LO

2;;2

111

111

111 111

111

111 111 111 111

111

111 111

111

111 111 111

111 111 111 111

111

111

111 111 111

111

111

111 111 111

111

Un ingeniero qumico investiga la variabilidad inherente de dos tipos de equipo de prueba que pueden usarse para monitorear la produccin de un proceso. El ingeniero sospecha que el equipo antiguo, tipo 1, tiene una varianza mayor que la del equipo nuevo. Por lo tanto, quiere probar las hiptesis H O''02 1
2 = 0. 2

H:o >oi
Se toman dos muestras aleatorias de ni = 12 Yn 2 = 10 observaciones, y las varianzas muestrales son S2 = 14.5 YS; = 10.8. El estadstico de prueba es
F. o

= S2 = 14.5 = 1.34
S; 10.8

En la tabla IV del apndice se encuentra que F O.05, 11,9 = 3.10, por lo que no puede rechazarse la hiptesis nula. Es decir, se ha encontrado evidencia estadstica insuficiente para concluir que la varianza del equipo antiguo sea mayor que la varianza del equipo nuevo .
111 111 111 111 111 111 111 111 111 111 '" 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 . . . . . . 111 111 111 111 111 111 111 111 111 111

2/0 2

El intervalo de confianza de 100(1- a) por ciento para el cociente de las varianzas poblacionales 2 es
_1

S2

2 S2

02 S2 F. <_1 <_1 F -a/2,.,-I,.,- - 2"" a/2,.,-,.,-

a2

s:
2

(2-50)

54

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

o / o~

Para ilustrar el uso de la ecuacin 2-50, el intervalo de confianza de 95% para el cociente de las varianzas del ejemplo 2-2 es, utilizando Fo.o2s, 9,11 = 3.59 Y FO.97S,9,11 = 1IF .o2S,11,9 = 113.92 0.255, o

14.5 (0.255) -s o~ s 14.5 (3.59)

10.8

Oz
0
2

10.8

0.34$-+ $ 4.81
O2

2~7

PROBLEMAS

2-1. Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La experiencia pasada indica que la desviacin estndar de la resistencia a la ruptura es a = 3 psi. Se prueba una muestra aleatoria de cuatro ejemplares de prueba, y los resultados son YI = 145, Yz = 153, Y3 = 150 YY4 = 147. a) Enunciar las hiptesis que el lector considere que deberan probarse en este experimento. b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega? e) Encontrar el valor P para la prueba del inciso b. d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio. 2~2~ Supuestamente, la viscosidad de un detergente lquido debe promediar 800 centistokes a 25C. Se colecta una muestra aleatoria de 16 lotes del detergente, y la viscosidadpromedio es 812.Suponga que se sabe que la desviacin estndar de la viscosidad es a = 25 centistokes. a) Enunciar las hiptesis que debern probarse. b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega? e) Cul es el valor P para la prueba? d) Encontrar un intervalo de confianza de 95% para la media. 2-3. Los dimetros de las flechas de acero producidas en cierto proceso de manufactura debern tener un promedio de 0.255 pulgadas. Se sabe que el dimetro tiene una desviacin estndar de a = 0.0001 pulgadas. Una muestra aleatoria de 10 flechas tiene un dimetro promedio de 0.2545 pulgadas. a) Establecer las hiptesis apropiadas para la media Ji. b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega? e) Encontrar el valor P para esta prueba. d) Construir un intervalo de confianza de 95% para el dimetro promedio de las flechas. 2-4. Una variable aleatoria con una distribucin normal tiene una media desconocida Ji y varianza aZ = 9. Encontrar el tamao de la muestra que se necesita para construir un intervalo de confianza de 95% para la media, cuya anchura total sea de 1.0. 2-5. La vida de anaquel de una bebida carbonatada es motivo de inters. Se seleccionan 10 botellas al azar y se prueban, obtenindose los siguientes resultados: Das
108 124 124 106
115

138 163 159 134 139

a) Quiere demostrarse que la vida media de anaquel excede los 120 das. Establecer las hiptesis apropia" das para investigar esta afirmacin. b) Probar estas hiptesis utilizando a = 0.01. A qu conclusiones se llega?

2-7 PROBLEMAS

55

e) Encontrar el valor P para la prueba del inciso b. d) Construir un intervalo de confianza de 99% para la vida media de anaquel. 2-6. Considere los datos de la vida de anaquel del problema 2-5, La vida de anaquel puede describirse o modelarse adecuadamente con una distribucin normal? Qu efecto tendra la violacin de este supuesto sobre el procedimiento de prueba usado para resolver el problema 2-5? 27. El tiempo para reparar un instrumento electrnico es una variable aleatoria medida en horas que sigue una distribucin normal. El tiempo de reparacin de 16 de estos instrumentos elegidos al azar es el siguiente:

159 224 222 149

280 379 362 260

Horas 101 179 168 485

212
264

250 170

a) Quiere saberse si elltiempo de reparacin promedio excede 225 horas. Establecer las hiptesis apropiadas para investigar esta cuestin. b) Probar las hiptesis que se formularon en el inciso a. A qu conclusiones se llega? Utilizar a = 0.05. e) Encontrar el valor P para la prueba. d) Construir un intervalo de confianza de 95% para el tiempo de reparacin promedio. 2-8. Considere nuevamente los datos del tiempo de reparacin del problema 2-7. En opinin del lector, el tiempo de reparacin puede modelarse de manera adecuada con una distribucin normal? 2-9. Se utilizan dos mquinas para llenar botellas de plstico con un volumen neto de 16.0onzas. Puede suponerse que el proceso de llenado es normal, con desviaciones estndar de a = 0.015 yaz = 0.018. El departamento de ingeniera de calidad sospecha que ambas mquinas llenan el mismo volumen neto, sin importar si este volumen es 16.0 onzas o no. Se realiza un experimento tomando una muestra aleatoria de la produccin de cada mquina.

Mquina 1 16.03 16.01 16.04 15.96 16.05 15.98 16.05 16.02 16.02 15.99

Mquina 2 16.02 15.97 15.96 16.01 15.99 16.03 16.04 16.02 16.01 16.00

a) Enunciar las hiptesis que debern probarse en este experimento. b) Probar estas hiptesis utilizando a 0.05. A qu conclusiones se llega? e) Encontrar el valor P para esta prueba. d) Encontrar un intervalo de confianza de 95% para la diferencia en el volumen de llenado promedio de las dos mquinas. 2-10. Un fabricante de calculadoras electrnicas puede usar dos tipos de plstico. La resistencia a la ruptura de este plstico es importante. Se sabe que o = az = 1.0psi. Demuestras aleatorias den = lOyn z = 12se obtiene JI = 162.5 Y.Y2 = 155.0.La compaa no emplear el plstico 1 a menos que su resistencia a la ruptura exceda la del plstico 2 por al menos 10 psi. Con base en la informacin muestral, deber usarse el plstico 1? Para responder esta pregunta se deben establecer y probar las hiptesis apropiadas utilizando a = 0.01. Construir un intervalo de confianza de 99% para la verdadera diferencia media en la resistencia a la ruptura.

56
2-11.

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

A continuacin se presenta el tiempo de combustin de dos cohetes qumicos con formulaciones diferentes. Los ingenieros de diseo se interesan tanto en la media como en la varianza del tiempo de combustin.

Tipo 1 65 81 57 66 82 82 67 59 75 70

Tipo 2 64 71 83 59 65 56 69 74 82 79

2-12.

a) Probar la hiptesis de que las dos varianzas son iguales. Utilizar a = 0.05. b) Utilizando los resultados del inciso a, probar la hiptesis de que los tiempos de combustin promedio son iguales. Utilizar a = 0.05. Cul es el valor P para esta prueba? c) Comentar el papel del supuesto de normalidad en este problema. Verificar el supuesto de normalidad para ambos tipos de cohetes. En un artculo de Solid State Technology, "Diseo ortogonal para optimizacin de procesos y su aplicacin en el grabado qumico con plasma" de G.Z. Yin y D.W: Jille, se describe un experimento para determinar el efecto de la velocidad del flujo de C2f 6 sobre la uniformidad del grabado en una oblea de silicio usada en la fabricacin de circuitos integrados. Los datos de la velocidad del flujo son los siguientes:

Flujo de
~F6

Observacin de la uniformidad 1 2.7 4.6 2 4.6 3.4 3 2.6 2.9 4 3.0 3.5 5 3.2 4.1 6 3.8 5.1

125 200

2-13.

2-14.

a) La velocidad del flujo de C2F6 afecta la uniformidad del grabado promedio? Utilizar a = 0.05. b) ZCul es el valor P para la prueba del inciso a? c) La velocidad del flujo de ~F6 afecta la variabilidad de una oblea a otra en la uniformidad del grabado? Utilizar a = 0.05. d) Trazar diagramas de caja que ayuden a interpretar los datos de este experimento. Se instala un nuevo dispositivo de filtrado en una unidad qumica. Antes de instalarlo, de una muestra alea2 toria se obtuvo la siguiente informacin sobre el porcentaje de impurezas: YI = 12.5, SI = 101.17 YnI = 8. Despus de instalarlo, de una muestra aleatoria se obtuvo Y2 = 10.2, = 94.73, n 2 = 9. a) Puede concluirse que las dos varianzas son iguales? Utilizar a = 0.05. b) El dispositivo de filtrado ha reducido de manera significativa el porcentaje de impurezas? Utilizar a = 0.05. Se hacen 20 observaciones de la uniformidad del grabado en obleas de silicio durante un experimento de evaluacin de un grabador de plasma. Los datos son los siguientes:

Si

5.34 6.00 5.97 5.25

6.65 7.55 7.35 6.35

4.76 5.54 5.44 4.61

5.98 5.62 4.39 6.00

7.25 6.21 4.98 5.32

a) Construir una estimacin con un intervalo de confianza de 95% de a2 b) Probar la hiptesis de que a2 = 1.0. Utilizar a = 0.05. A qu conclusiones se llega?

2-7 PROBLEMAS

57

2-15.

c) Comentar el supuesto de normalidad y su papel en este problema. tI) Verificar la normalidad construyendo una grfica de probabilidad normal. A qu conclusiones se llega? Doce inspectores midieron el dimetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de calibradores. Los resultados fueron

Inspector
1 2 3 4 5 6 7 8 9 10 11 12

Calibrador 1
0.265 0.265 0.266 0.267 0.267 0.265 0.267 0.267 0.265 0.268 0.268 0.265

Calibrador 2
0.264 0.265 0.264 0.266 0.267 0.268 0.264 0.265 0.265 0.267 0.268 0.269

2-16.

a) Existe una diferencia significativa entre las medias de la poblacin de mediciones de las que se seleccionaron las dos muestras? Utilizar a == 0.05. b) Encontrar el valor P para la prueba del inciso a. e) Construir un intervalo de confianza de 95 % para la diferencia en las mediciones de los dimetros promedio para los dos tipos de calibradores. En un artculo de Joumal o[ Strain Analysts (vol. 18, no. 2) se comparan varios procedimientos para predecir la resistencia al corte de vigas de placas de acero. Los datos para nueve vigas en la forma del cociente de la carga predicha y la observada para dos de estos procedimientos, los mtodos Karlsruhe y Lehigh, son los siguientes

Viga
S1/1 S2/1 S3/1

Mtodo Karlsruhe
1.186 1.151 1.322 1.339 1.200 1.402 1.365 1.537 1.559

Mtodo Lehigh
1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052

84/1
S5/1 S2/1 S2/2

SV3 SV4

a) Existe alguna evidencia que apoye la afirmacin de que hay una diferencia en el desempeo promedio entre los dos mtodos? Utilizar a == 0.05. b) Cul es el valor P para la prueba del inciso a? e) Construir un intervalo de confianza de 95% para la diferencia en la carga promedio predicha y la observada. d) Investigar el supuesto de normalidad en ambas muestras. e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos mtodos. /) Comentar el papel del supuesto de normalidad en la prueba t pareada.

58

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

2-17. Se estudia la temperatura de deflexin bajo carga de dos formulaciones diferentes de un tubo de plstico ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada formulacin y las temperaturas de deflexin (en F) se presentan abajo: Formulacin 1 192 193 207 210 185 194 189 178 Formulacin 2 177 176 185 197 200 206 201 197

206 188 205 187

198 188 189 203

a) Construir las grficas de probabilidad normal para ambas muestras. Estas grficas apoyan los supuestos de normalidad y de la igualdad de la varianza de ambas muestras? b) Los datos apoyan la afirmacin de que la temperatura promedio de deflexin bajo carga de la formulacin 1 excede la de la formulacin 2? Utilizar a = 0.05. e) Cul es el valor P para la prueba del inciso a? 2-18. Referirse a los datos del problema 2-17. Los datos apoyan la afirmacin de que la temperatura promedio de deflexin bajo carga de la formulacin 1 excede la de la formulacin 2 en al menos 3F? 2-19. En la fabricacin de semiconductores es comn el uso del grabado qumico hmedo para eliminar el silicio de la parte posterior de las obleas antes de la metalizacin. La rapidez del grabado es una caracterstica importante de este proceso. Se estn evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas seleccionadas al azar en cada solucin, y las cifras de la rapidez del grabado observada (en milsimas de pulgada/min) se muestran abajo
Solucin 1 9.9 9.4 10.0 10.3 10.6 10.3 9.3 9.8 Solucin 2 10.6 10.2 10.0 10.2 10.4 10.7 10.5 10.3

a) Los datos indican que la afirmacin de que ambas soluciones tienen la misma rapidez de grabado promedio es verdadera? Utilizar a '= 0.05 y suponer la igualdad de las varianzas. b) Encontrar un intervalo de confianza de 95% para la diferencia en la rapidez de grabado promedio. e) Usar grficas de probabilidad normal para investigar la adecuacin de los supuestos de normalidad e igualdad de las varianzas. 2-20. Se estn comparando dos populares analgsicos con base en la rapidez de absorcin del cuerpo. Especficamente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que a~ ya; se conocen. Desarrollar un estadstico de prueba para
H o:2/1- =/1-2 H:2/A, ~ /1-2

2-21. Suponga que se est probando


H o:/1- =/1-2 H:/1- ~/1-2

donde a; ya; se conocen. Los recursos para hacer el muestreo son limitados, por 10que n + n2 '= N. Cmo debern asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia ms alta? 2-22. Desarrollar la ecuacin 2-46 para un intervalo de confianza de 100(1-a) por ciento para la varianza de una distribucin normal.

2-7 PROBLEMAS

59

2-23. Desarrollar la ecuacin 250 para un intervalo de confianza de 100(1- a) por ciento para el cociente a; / a~, donde a; y a~ son las varianzas de dos distribuciones normales. 224. Desarrollar una ecuacin para encontrar un intervalo de confianza de 100(1- a) por ciento para la diferen~ a~. Aplicar la ecuacin desarrollada a los datos cia en las medias de dos distribuciones normales donde del experimento del cemento portland, y encontrar un intervalo de confianza de 95%. 2-25. Construir un conjunto de datos para los que el estadstico de prueba t pareada sea muy grande, pero para el cual el estadstico de prueba t de dos muestras o combinada usual sea pequefio. En general, describir cmo se crearon los datos. Le da esto al lector alguna idea respecto de cmo funciona la prueba t pareada?

a;

Experimentos con un solo factor: el anlisis de varianza

En el captulo 2 se analizaron los mtodos para comparar dos condiciones o tratamientos. Por ejemplo, el experimento de la fuerza de la tensin de adhesin del cemento portland incluy dos formulaciones diferentes del mortero. Otra forma de describir este experimento es como un experimento con un solo factor, con dos niveles del factor, donde el factor es la formulacin del mortero y los dos niveles son los dos mtodos diferentes para hacer la formulacin. Muchos experimentos de este tipo involucran ms de dos niveles del factor. En este captulo se presentan los mtodos para el diseo y el anlisis de los experimentos con un solo factor con a niveles del mismo (o a tratamientos). Se supondr que el experimento se ha aleatorizado completamente.

3..1 UN EJEMPLO
Un ingeniero de desarrollo de productos tiene inters en investigar la resistencia a la tensin de una fibra sinttica nueva que se usar para hacer tela de camisas para caballero. El ingeniero sabe por experiencia previa que la resistencia a la tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de materiales de la fibra. Adems, sospecha que al aumentar el contenido de algodn se incrementar la resistencia, al menos en un principio. Sabe asimismo que el contenido de algodn deber variar entre 10 y 40 por ciento para que el producto final tenga otras caractersticas de calidad que se desean (como la capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodn: 15,20,25,30 Y35 por ciento. 'Iambin decide probar cinco ejemplares en cada nivel del contenido de algodn. Se trata de un ejemplo de un experimento con un solo factor con a == 5 niveles del factor y n = 5 rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar cmo puede aleatorizarse el orden de las corridas, suponga que las corridas se numeran de la siguiente manera:

60

31 UN EJEMPLO

61

Peso porcentual del algodn

15
20
25 30 35

Nmero de corrida experimental 1 2 3 4 6 7 8 9 11 12 13 14 16 17 18 19 21 22 23 24

5
10

15
20
25

Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero es 8. Entonces la observacin nmero 8 (20% de algodn) se corre primero. Este proceso se repetira hasta que las 25 observaciones tengan asignada una posicin en la secuencia de prueba.' Muchos paquetes de software de computadora para ayudar a los experimentadores a seleccionar y construir un diseo, aleatorzan el or-' den de las corridas utilizando nmeros aleatorios de esta manera. Suponga que la secuencia de prueba obtenida es
Secuencia de prueba
1 2 3 4 5 6 7 8
9 10 11

Nmero de corrida

Peso porcentual del algodn

8 18 10 23 17

20 30 20 35 30

5
14

15
25

6
15 20 9 4 12 7 1

20
25 30 20 15 25 20 15 35 35 25 15 25 35 30 35 30 15

12 13 14 15 16 17 18 19

24
21 11 2 13 22 16 25 19 3

20
21 22 23 24 25

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas-las cuales quiz varen fuera de control durante el experimento-contaminen los resultados. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodn, despus se prue1 La nicarestriccinsobre la aleatorizacn en este caso,es que sise sacade nuevoel mismonmero (es decir,8), se descarta.Se trata de una restriccin secundaria y se ignora.

62

CAPTULO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

Tabla 3-1 Datos (en lb/pulgada') del experimento de la resistencia a la tensin


Peso porcentual del algodn Observaciones

15 20 25 30 35

1 7 12 14 19 7

2 7 17 18 25 10

4
11

15 12 18 22
11

18 19 19 15

5 9 18 19 23
11

Total

Promedio

49 77 88 108 54 376

9.8 15.4 17.6 21.6 10.8 15.04

ban los cinco ejemplares con 20% de algodn, etc.), Si la mquina empleada para probar la resistencia a la tensin presenta un efecto de calentamiento tal que entre ms tiempo est funcionando sean menores las lecturas de la resistencia a la tensin observadas, el efecto del calentamiento contaminar potencialmente los datos de la resistencia a la tensin y destruir la validez del experimento. Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 3-1 se muestran las observaciones que obtiene para la resistencia a la tensin. Siempre es una buena idea examinar grficamente los datos experimentales. En la figura 3-1 se muestran los diagramas de caja para la resistencia a la tensin con cada nivel del peso porcentual de algodn, y en la figura 3-2 se ilustra un diagrama de dispersin de la resistencia a la tensin contra el peso porcentual del algodn. En la figura 3-2, los puntos rellenos son las observaciones individuales y los crculos huecos son los promedios de la resistencia a la tensin observada. Ambas grficas indican que la resistencia a la tensin se incrementa cuando el contenido de algodn se incrementa, hasta cerca de 30% de algodn. Despus de 30% de algodn, hay un marcado descenso de la resistencia a la tensin. No hay evidencia slida que sugiera que la variabilidad de la resistencia a la tensin alrededor del promedio dependa del peso porcentual del algodn. Con base en este anlisis grfico simple, se tienen firmes sospechas de que 1) el contenido de algodn afecta la resistencia a la tensin y 2) alrededor de 30% de algodn produce la resistencia mxima. Suponga que se quiere ser ms objetivo en el anlisis de los datos. Especficamente, imagine que quieren probarse las diferencias entre las resistencias a la tensin promedio con todos los niveles a = 5 del
30

'bi
"3

~
:2

a.
c: 20

l!! !!

.!!!

m 'iiJ

.. ..

5i 10 .

"' a::

o1--_...l-_----l._ _
15 20

..J...._--L_~~--::'.

25

30

PesoporcentuaI del aIgod6n

Figura 31 Diagramas de caja <le la resistencia a la tensin contra el peso porcentual del algodn.

32 ELANUSISDEVARIANZA
30

63

...

O'------'---.......- - - - ' - - - ' - - - - J 15 25 30 35


P1l50oorcentual del aloodn

Figura 32 Diagrama de dispersin de la resistencia a la tensin contra el peso porcentual del algodn.

peso porcentual del algodn. Por lo tanto, el inters se centra en probar la igualdad de las cinco medias. Pudiera parecer que este problema se resolvera realizando una prueba t para todos los pares de medias posibles. Sin embargo, no es sta la mejor solucin de este problema, porque llevara a una distorsin considerable en el error tipo I. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la hiptesis nula en cada prueba individual es de 1 - a = 0.95, la probabilidad de aceptar correctamente la hiptesis nula en las 10 pruebas es de (0.95)10 = 0.60 si las pruebas son independientes. Por lo tanto, ha ocurrido un incremento sustancial en el error tipo l. El procedimiento correcto para probar la igualdad de varias medias es el anlisis de varianza. Sin embargo, el anlisis de varianza tiene un rango de aplicaciones mucho ms amplio que el problema anterior. Probablemente sea la tcnica ms til en el campo de la inferencia estadstica.

3..2

EL ANLISIS DE VARIANZA

Suponga que se tienen a tratamientos o niveles diferentes de un solo factor que quieren compararse. La respuesta observada de cada uno de los a tratamientos es una variable aleatoria. Los datos apareceran como en la tabla 3-2. Una entrada de la tabla 3-2 (por ejemplo.yj) representa la observacinj-sima to-

labia 32 Datos tpicos de un experimento de un solo factor Tratamiento (nivel) Observaciones lbtales Promedios 1
fu fu
~

h
h

~.

Y.

Y.2

Y...
Y..

Y..

64

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

mada bajo el nivel del factor o tratamiento i. Habr, en general, n observaciones bajo el tratamiento i-simo. Observe que la tabla 3-2 es el caso general de los datos del experimento de la resistencia a la tensin de la tabla 3-1. Modelos para los datos Se encontrar til describir las observaciones de un experimento con un modelo. Una manera de escribir este modelo es
i = l ' 2,... , a Yij=.t+eij { J'=l , 2, ... , n .

(3-1)

donde Yj es la observacin ij-sima,.tes la media del nivel del factor o tratamiento isimo, y Ej es un componente del error aleatorio que incorpora todas las dems fuentes de variabilidad del experimento, incluyendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las unidades experimentales (como los materiales de prueba, etc.) a las que se aplican los tratamientos, y el ruido de fondo general en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables ambientales, etc.). Es conveniente considerar que los errores tienen media cero, de tal modo queE(yj) = .t. A la ecuacin 3-1 se le llama el modelo de las medias. Una forma alternativa de escribir un modelo de los datos es definiendo i de tal modo que la ecuacin 3-1 se convierte en i =1, 2,... , a Yij=.t+7:+E 1 { "=12, 1 J , ---, n (3-2)

= 1, 2, ... , a

En esta forma del modelo, .t es un parmetro comn a todos los tratamientos al que se llama la media global, y 7:;es un parmetro nico del tratamiento i-simo al que se le llama el efecto del tratamiento ;simo. A la ecuacin 3-2 se le llama por lo general el modelo de los efectos. Tanto el modelo de las medias como el de los efectos son modelos estadsticos lineales; es decir, la variable de respuesta Y;j es una funcin lineal de los parmetros del modelo. Aun cuando ambas formas del modelo son tiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseo experimental. Tiene cierto atractivo intuitivo por cuanto .t es una constante y los efectos de los tratamientos 7:; representan desviaciones de esta constante cuando se aplican los tratamientos especficos. A la ecuacin 3-2 (o a la 3-1) se le llama tambin el modelo del anlisis de varianza simple o de un solo factor (o direccin), porque nicamente se investiga un factor. Adems, ser un requisito que el experimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos (llamados con frecuencia unidades experimentales) sea lo ms uniforme posible. Por lo tanto, el diseo experimental es un diseo completamente aleatorizado. Los objetivos sern probar las hiptesis apropiadas acerca de las medias de los tratamientos y estimarlas. Para probar las hiptesis, se supone que los errores del modelo son variables aleatorias que siguen una distribucin normal e independiente con media cero y varianza rT. Se supone asimismo que la varianza rT es constante para todos los niveles del factor. Esto implica que las observaciones

y que las observaciones son mutuamente independientes.

3-3 ANUSIS DEL MODEW CON EFEcrOS FIJOS

65

Factor fijo o aleatorio?

El modelo estadstico (ecuacin 3-2) describe dos situaciones diferentes con respecto a los efectos de los tratamientos. Primera, los a tratamientos pudieron ser elegidos expresamente por el experimentador. En esta situacin quieren probarse hiptesis acerca de las medias de los tratamientos, y las conclusiones se aplicarn nicamente a los niveles del factor considerados en el anlisis. Las conclusiones no pueden extenderse a tratamientos similares que no fueron considerados explcitamente. Tambin se podra querer estimar los parmetros del modelo (p., f, a2). A ste se le llama el modelo con efectos fijos. De manera alternativa, los a tratamientos podran ser una muestra aleatoria de una poblacin ms grande de tratamientos. En esta situacin sera deseable poder extender las conclusiones (las cuales se basan en la muestra de los tratamientos) a la totalidad de los tratamientos de la poblacin, sea que se hayan considerado explcitamente en el anlisis o no. Aqu las f son variables aleatorias, y el conocimiento de las f particulares que se investigaron es relativamente intil. Ms bien, se prueban hiptesis acerca de la variabilidad de las t, y se intenta estimar su variabilidad. A ste se le llama el modelo con efectos aleatorios o modelo de los componentes de la varianza. La revisin de experimentos con factores aleatorios se pospondr hasta el capitulo 12.

3..3

ANLISIS DEL MODELO CON EFECTOS FIJOS

En esta seccin se desarrolla el anlisis de varianza de un solo factor para el modelo con efectos fijos. Recuerde que y. representa el total de las observaciones bajo el tratamiento i-simo. Sea que y. represente el promedio de las observaciones bajo el tratamiento i-simo. De manera similar, sea que Y.. represente el gran total de todas las observaciones y que Y.. represente el gran promedio de todas las observaciones. Expresado simblicamente,

yr,

= J ~
j~l

Yo, ~

i = 1, 2, ... , a
(3-3)

- Y.. - Y.. IN
donde N =an es el nmero totall de observaciones. Se nota que el subndice "punto" implica la operacin suma sobre el subndice que reemplaza. El inters se encuentra en probar la igualdad de las a medias de los tratamientos; es decir, E(yj) =/1 + f = /1, i = 1, 2, ..., a. Las hiptesis apropiadas son

H o: /1 1 =P2
H 1 : /1 .". /1j

=... =P.
para al menos un par (i, j)

En el modelo de los efectos, la median, del tratamiento -simo se descompone en dos componentes tales que /1 = /1 + f, Por lo general, p. se considera como una media global, de tal modo que
!/1
i-l --=p a

Esta definicin implica que

.,,1

66

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANLISIS DEVARlANZA

Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones de la media global.' Por consiguiente, una forma equivalente de escribir las hiptesis anteriores es en trminos de los efectos de los tratamientos f l , por ejemplo

H o:f,""f 2""f.""O H 1 : f I ;i:. O para al menos una i


Por lo tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos de los tratamientos (las f l ) son cero. El procedimiento apropiado para probar la igualdad de las medias de los a tratamientos es el anlisis de varianza. 3..3.1 Descomposicin de la suma de cuadrados total

El nombre anlisis de varianza se deriva de la particin de la variabilidad total en sus partes componentes. La suma de cuadrados total corregida

SST ""

!! (Yij - y.. )2
1-1 j-l

se usa como una medida de lavariabilidad global de los datos. Intuitivamente, esto es razonable porque, si SST tuviera que dividirse por el nmero apropiado de grados de libertad (en este caso, an -1 "" N -1), se obtendra la varianza muestral de las y. La varianza muestral es, desde luego, una medida estndar de variabilidad. Observe que la suma de cuadrados total corregida SST se puede escribir como

LL (Yij - y.. )2 "" L L [(YI. - Y.. )+(Yij - YI. )]2


Iml j g 1 1"'1 j"'1

(3-4)

+2!! (YI. -Y.. )(Yij -YI.)


Ig1 j g 1

(3-5)

Sin embargo, el trmino del producto cruzado de la ecuacin 3-5 es cero, ya que

!
Se tiene, por lo tanto,

(Yij -YI.)"" YI. -nYI. "" YI. -n(YI. In)"" O

j"'1

La ecuacin 3-6 establece que puede hacerse la particin de la variabilidad total de los datos, medida por la suma de cuadrados total corregida, en una suma de cuadrados de las diferencias entre los promedios de los tratamientos y el gran promedio, ms una suma de cuadrados de las diferencias de las observaciones dentro de los tratamientos y el promedio de los tratamientos. Entonces, la diferencia entre los promedios
2

Para ms informacin sobre este tema, referirse al material suplementario del texto del captulo 3.

3-3 ANLISIS DEL MODELO CON EFEcrOS FIJOS

67

de los tratamientos observados y el gran promedio es una medida de las diferencias entre las medias de los tratamientos, mientras que las diferencias de las observaciones dentro de un tratamiento y el promedio del tratamiento, pueden deberse nicamente al error aleatorio. Por 10tanto, la ecuacin 3-6 puede escribirse simblicamente como

SSr

=SSn-atamientos + SS

donde a SSna'amiemos se le llama la suma de cuadrados debida a los tratamientos (es decir, entre los tratamientos), ya SSE se le llama la suma de cuadrados debida al error (es decir, dentro de los tratamientos). Hayan = N observaciones en total; por lo tanto, SS r tiene N - 1 grados de libertad. Haya niveles del factor (y medias de a tratamientos), de donde SSna,amientos tiene a -1 grados de libertad. Por ltimo, dentro de cualquier tratamiento hay n rplicas que proporcionan n - 1 grados de libertad con los cuales estimar el error experimental. Puesto que haya tratamientos, se tienen a(n -1) = an - a = N - a grados de libertad para el error. Es til examinar explcitamente los dos trminos del lado derecho de la identidad fundamental del anlisis de varianza (ecuacin 3-6). Considere la suma de cuadrados del error

En esta forma es fcil ver que el trmino entre corchetes, si se divide por n -1, es la varianza muestral del tratamiento i-simo, o

S2 = .:...i-_1

(Yij - Ji.)2
_

n-l

= 1, 2, ..., a

Ahora pueden combinarse a varianzas muestrales para obtener una sola estimacin de la varianza poblacional comn de la siguiente manera:
2 2 2

(n-l)Sl +(n-l)S2 + + (n-l)S. (n-l)+(n-l) + + (n-l)

=_i-_l-=.::.i_-1

[!
~

(Yij -

Ji. )2]

--=

.4J (n-l)

SSE =--=-(N-a) Por 10tanto, SSE/(N-a) es una estimacin combinada de la varianza comn dentro de cada uno de los a tratamientos. De manera similar, si no hubiera diferencias entre las medias de los a tratamientos, podra usarse la variacin de los promedios de los tratamientos y el gran promedio para estimar U-. Especficamente
SSTratamientos

a-l

= ---"=-----a-l

es una estimacin de UZ si las medias de los tratamientos son iguales. La razn de esto puede verse de manera intuitiva de la siguiente manera. La cantidad l:~_l6'i. -y'y/(a -1) estima u-/n, la varianza de los pro-

68

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANUSISDEVARIANZA

medios de los tratamientos, de donde n'1:.;_1 (ji. - y-l/(a -1) debe estimar cr si no hay diferencias en las medias de los tratamientos. Se observa que la identidad del anlisis de varianza (ecuacin 3-6) nos proporciona dos estimaciones de cr: una basada en la variabilidad inherente dentro de los tratamientos y una basada en la variabilidad entre los tratamientos. Si no hay diferencias en las medias de los tratamientos, estas dos estimaciones debern ser muy similares, y si no lo son, se sospecha que la diferencia observada puede ser causada por diferencias en las medias de los tratamientos. Aun cuando se ha usado un razonamiento intuitivo para desarrollar este resultado, puede adoptarse un enfoque un tanto ms formal. A las cantidades
MS _
Tratamientos

= SSTra,amien,o,
a- 1

se les llama cuadrados medios. Se examinarn ahora los valores esperados de estos cuadrados medios. Considere

Al sustituir el modelo (ecuacin 3-1) en esta ecuacin se obtiene

Entonces, al elevar al cuadrado y tomar el valor esperado de la cantidad entre corchetes, se observa que los trminos que incluyen ae~ ye son reemplazados porcryncr, respectivamente, debido a queE(eij) = O. Adems, todos los productos cruzados que incluyen a E tienen valor esperado cero. Por lo tanto, despus de elevar al cuadrado y tomar el valor esperado, la ltima ecuacin se convierte en

a] E(MS E ) = - 1 [ a T~+Na2-Nfl2-nT~-aa2 _ Nfl2+ n N a ;-1 ;-1


o

J.J ANLISIS DEL MODELO CONEFECTOS FIJOS

69

Aplicando un enfoque similar puede demostrarse tambin que"

E(M.STratamiento< ) = a Z + ---:":a~--l1-1
Por 10tanto, como se argument heursticamente.rj, = SSE/(N-a) estimafily, si no hay diferencias en las medias de los tratamientos (lo cual implica que Ti = O), MSn-atamientos = SSn-atamienIOJ(a - 1) tambin estima filo Sin embargo, observe que si las medias de los tratamientos difieren, el valor esperado del cuadrado medio de los tratamientos es mayor que el. Parece claro que es posible realizar una prueba de la hiptesis de que no hay diferencias en las medias de los tratamientos comparando MSnatamientos y MS E' Se considera ahora cmo puede hacerse esta comparacin.

n! fi

3..3.2

Anlisis estadstico

Se investiga ahora cmo puede llevarse a cabo una prueba formal de la hiptesis de que no hay diferencias en las medias de los tratamientos (HO = f.lz =...= f.l., o de manera equivalente, H o:f 1 = f z = f. = :f.ll O). Puesto que se ha supuesto que los errores El} siguen una distribucin normal e independiente con media cero y varianza el, las observacionesYi} tienen una distribucin normal e independiente con media f.l + t, y varianza filo Por lo tanto, SST es una suma de cuadrados de variables aleatorias con una distribucin normal; por consiguiente, puede demostrarse que SS.,el tiene una distribucin ji-cuadrada con N -1 grados de libertad. Adems, puede demostrarse que SSE/el es una variable ji-cuadrada con N -a grados de libertad y que SSnatamiemoJfil es una variable ji-cuadrada con a -1 grados de libertad si la hiptesis nula HO:TI = Oes verdadera. Sin embargo, las tres sumas de cuadrados no son necesariamente independientes, ya que la suma de SSn-alamientos y SSE es SSp El siguiente teorema, que es una forma especial de un teorema atribuido a William Cochran, es til para establecer la independencia de SSE Y SSn-atamienlos'

TEOREMA 3..1

111.

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

111

Teorema de Cochrao
Sea Z igual a NID(O, 1) para i

= 1, 2, ..., v Y
"
1_1

Z Zi = Ql + Qz + ...

+ Qs

donde s :S v, YQ tiene V grados de libertad (i = 1,2, ..., s). Entonces Ql, Q2, ..., Qs son variables aleatorias ji-cuadrada independientes con VI' V 2s ... , V s grados de libertad, respectivamente, si y slo si
V= VI
111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111

+vz
111 111

+ ... +vs
111 111 111 111 111 111 111 111 111 111 111 111 111

Puesto que los grados de libertad de SSnatamientos YSSEsuman N -1, el nmero total de grados de libertad, el teorema de Cochran implica que SSnatamienloJfil y SSE/el son variables aleatorias ji-cuadrada con
3

Referirse al material suplementario del texto del captulo 3.

70

CAPTULO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA


Tabla de anlisis de varianza para el modelo con un solo factor y efectos fijos

Tabla 3-3

Fuente de variacin Entre los tratamientos Error (dentro de Jos tratamientos) lbtal
SSrnll.mion.o,

Suma de cuadrados
== n

Grados de libertad

Cuadrado medio
E ==
O

L
:~l

(ji.- ji..

a-1
N-a N-1

MSna.amieo.os

MS E

SSE == SSr -

SSTta.amien.os

una distribucin independiente. Por lo tanto, si la hiptesis nula de que no hay diferencias en las medias de los tratamientos es verdadera, el cociente

F.
o

= SSTra.amien.o. l(a-1) = MSTra.amienlO,


SSe I(N-a) MS E

(3-7)

se distribuye como F con a - 1 y N - a grados de libertad. La ecuacin 3-7 es el estadstico de prueba para la hiptesis de que no hay diferencias en las medias de los tratamientos. Por los cuadrados medios esperados se observa que, en general, MS E es un estimador insesgado de er. Asimismo, bajo la hiptesis nula, MSnatamien.os es un estimador insesgado de o', Sin embargo, si la hiptesis nula es falsa, el valor esperado de MSnatamientos es mayor que er. Por lo tanto, bajo la hiptesis alternativa, el valor esperado del numerador del estadstico de prueba (ecuacin 3-7) es mayor que el valor esperado del denominador, y H deber rechazarse para valores del estadstico de prueba que son muy grandes. Esto implica una regin crtica de una sola cola superior. Por lo tanto, H deber rechazarse y concluirse que hay diferencias en las medias de los tratamientos si

Fo > Fa,a-l,N-a donde F se calcula con la ecuacin 3-7. De manera alternativa, podra usarse el enfoque del valor Ppara tomar una decisin. Es posible obtener frmulas para calcular estas sumas de cuadrados reescribiendo y simplificando las definiciones de SSnatamientos Y SST en la ecuacin 36. Se obtiene as
(3-8)

y
.
SS
Tratamientos

~ =;; LJ
i-1

2 Y. Yi. - N

(3-9)

La suma de cuadrados del error se obtiene por sustraccin como


SSE

= SST -

SSTratamientos

(3-10)

El procedimiento de prueba se resume en la tabla 3-3. Se le conoce como tabla del anlisis de varianza.

EJEMPLO

3~

1 .......... ,. ...

111

111

111

111

El experimento de la resistencia a la tensin


Para ilustrar el anlisis de varianza, se retoma al ejemplo que empez a comentarse en la seccin 3-1. Recuerde que al ingeniero de desarrollo de productos le interesa determinar si el peso porcentual del algo-

3-3 ANLISIS DEL MODELO CONEFECTOS FIJOS

71

dn en una fibra sinttica afecta la resistencia a la tensin, y ha llevado a cabo un experimento completamente aleatorizado con cinco niveles del peso porcentual del algodn y cinco rplicas. Por conveniencia, a continuacin se repiten los datos de la tabla 3-1: Peso porcentual del algodn 15 20 25 30 35 Resistencia a 1 7 12 14 19 7 2 7 17 18 25 10

(lb/pulgt)

la tensinobservada
3 15 12 18 22 11 4 11 18 19 19 15 5 9 18 19 23 11 lbtales Yi 49 77 88 108 54 Y.."" 376 Promedios YI 9.8 15.4 17.6 21.6 10.8 Y "" 15.04 .

Se usar el anlisis de varianza para probar H o'# :=: f..t2 :=: f..t3 :=: f..t4 :=: f..ts contra la hiptesis alternativa H:algunas medias son diferentes. Las sumas de cuadrados requeridas se calculan como sigue:

SSr:=:

~L Y~_L..
j~ j~

= (7)2 +(7)2 +(15)2 + ... +(15)2


SS

(376)2 +(11)2 -~:=: 636.96

Tratamientos

:=: - ~ Yi. - N n i~ :=:![(49)2+ ... +(54)2]_(376)2 =475.76

Y..

SSe

:=: :=:

5 SSr - SS Tratamientos
636.96- 475.76

25

=161.20

Generalmente estos clculos se realizaran en una computadora, utilizando paquetes de software con la capacidad de analizar datos de experimentos diseados. En la tabla 3-4 se resume el anlisis de varianza. Observe que el cuadrado medio entre los tratamientos (118.94) es varias veces mayor que el cuadrado medio dentro de los tratamientos o cuadrado medio del error (8.06). Esto indica que no es posible que las medias de los tratamientos sean iguales. En trminos ms formales, puede calcularse el cociente F, F :=: 118.94/8.06 :=: 14.76, y comparar este valor con un punto porcentual apropiado de la cola superior de la distribucin F 4, 20' Suponga que el experimentador ha seleccionado a = 0.05. En la tabla IV del apndice se encuentra que Fo,os, 4, 20 :=: 2.87. Puesto que F = 14.76 > 2.87, se rechaza H, y se concluye que las medias de los tratamientos difieren; es decir, el peso porcentual del algodn en la fibra afecta de manera significativa la resistencia a la tensin media. Tambin Tabla 34 Anlisis de varianza de los datos de la resistencia a la tensin Sumade Gradosde Cuadrado Fuente de variacin cuadrados libertad medio Pesoporcentual del algodn 475.76 4 118.94 Error 161.20 20 8.06 lbtal 636.96 24

ValorP <0.01

72

CAPTIJLO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARlANZA

;g 0.6 ""
:s .3
E
c. 0.4
Q)

"" 3!

""

~ 0.2 o

Fa
Figura 3-3 La distribucin de referencia (F. 20) para el estadstico de prueba F o en el ejemplo 3-1.

podra calcularse un valor P para este estadstico de prueba. En la figura 3~3 se muestra la distribucin de referencia (F4 20 ) para el estadstico de prueba F Evidentemente, el valor P es muy pequeo en este caso. Puesto que FO.01420 = 4.43 YF > 4.43, puede concluirse que un lmite superior del valor Pes 0.01; es decir, P < 0.01 (el valor P exacto es P = 9.11 X 10-6). Clculos manuales Posiblemente el lector haya notado que la suma de cuadrados se defini en trminos de promedios; es decir, por la ecuacin 3-6,
SS"alamienlOS

= n~
;~1

(V;. - Ji.. )2

pero las frmulas de clculo se desarrollaron utilizando los totales. Por ejemplo, para calcular SSnalamienlos> se usara la ecuacin 3-9: 1 a 2 SS =- ~ 2_L Tratamientos n LJ Yi. N
1-1

La razn principal de esto es por conveniencia; adems, los totales Yi. y Y.. estn menos sujetos al error de redondeo que los promedios Yi. y Y..' En general, no deber prestarse demasiada atencin a los clculos, ya que se cuenta con una amplia variedad de programas de computadora para realizarlos. Estos programas de computadora son tambin tiles para realizar muchos otros anlisis asociados con el diseo experimental (como el anlisis residual y la verificacin de la adecuacin del modelo). En muchos casos, estos programas tambin ayudarn al experimentador a establecer el diseo. Cuando es necesario realizar los clculos manualmente, en ocasiones es til codificar las observaciones. Esto se ilustra en el ejemplo siguiente.

EJEMPLO 3#2
Codificacin de observaciones Los clculos del anlisis de varianza pueden hacerse con frecuencia de manera ms precisa o simplificada codificando las observaciones. Por ejemplo, considere los datos de la resistencia a la tensin del ejemplo

33 ANLISIS DELMODELOCON EFECTOS FIJOS

73

Tabla 35

Datos codificados de la resistencia a la tensin del ejemplo 3-2 Observaciones Thtales

Peso porcentual del algodn

1
-8

2
-8 2 3
10

3
O

15 20 25 30 35

-4

--6
3
4

-3 -1
4

-3 3
7 -4

3
4 4

Yi -26 2
13

8
--4

-8

-5

33 -21

3-1. Suponga que se resta 15 de cada observacin. Los datos codificados se muestran en la tabla 3-5. Es sencillo verificar que
SST
=:

(_8)2 +(_8)2 + .. ' +(_4)2 _ (-26)2 +(2)2 + ... +(-21)2 5

(~2

=:

636.96

SSTtatamientos =:

25 =: 475.76

(1)2

SSe

=:

161.20

Al comparar estas sumas de cuadrados con las que se obtuvieron en el ejemplo 3-1, se observa que al restar una constante de los datos originales las sumas de cuadrados no se modifican. Suponga ahora que cada una de las observaciones del ejemplo 3-1 se multiplica por 2. Es sencillo verificar que las sumas de cuadrados de los datos transformados son SST =: 2547.84, SSnatanricntos =: 1903.04 Y SSE =: 644.80. Estas sumas de cuadrados parecen diferir considerablemente de las que se obtuvieron en el ejemplo 3-1. Sin embargo, si se dividen por 4 (es decir, 22) , los resultados son idnticos. Por ejemplo, para la suma de cuadrados de los tratamientos, 1903.04/4 =: 475.76. Asimismo, para los datos codificados, el cociente F es F =: (1903.04/4)/(644.80/20) =: 14.76, que es idntico al cociente F de los datos originales. Por lo tanto, los anlisis de varianza son equivalentes.

Pruebas de aleatorizadn y anlisis de varianza En el desarrollo del anlisis de varianza con la prueba F, se ha utilizado el supuesto de que los errores aleatorios f:ij son variables aleatorias que siguen una distribucin normal e independiente. Tambin es posible justificar la prueba F como la aproximacin de una prueba de aleatorizaci6n. Para ilustrar esto, suponga que se tienen cinco observaciones de cada uno de dos tratamientos y que quiere probarse la igualdad de las medias de los tratamientos. Los datos apareceran as:

1httamiento 1
Y11
YI2

Tratamiento 2
Y21

Y22
Y23
Y24 Y15

Yu
Y14 Y15

Podra usarse el anlisis de varianza con la prueba F para probar Ho:}ll =: #2' De manera alternativa, podra recurrirse a un enfoque un tanto diferente. Suponga que se consideran todas las formas posibles de

74

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

asignar los 10 nmeros de la muestra anterior a los dos tratamientos. Hay 10!/5!5! = 252 arreglos posibles de las 10 observaciones, Si no hay ninguna diferencia en las medias de los tratamientos, los 252 arreglos son igualmente posibles. Para cada uno de los 252 arreglos, se calcula el valor del estadstico F usando la ecuacin 3-7. A la distribucin de estos valores F se le llama distribucin de aleatorizacin, y un valor grande de F indica que los datos no son consistentes con la hiptesis H O l = #2' Por ejemplo, si el valor de :# F que se observ realmente fue excedido slo por 5 de los valores de la distribucin de aleatorizacin, esto :# correspondera con el rechazo de H O l = #2 con un nivel de significacin de a = 5/252 = 0.0198 (o 1.98%). Observe que no es necesario ningn supuesto de normalidad en este enfoque. La dificultad con este enfoque es que, incluso en problemas relativamente pequeos, los clculos requeridos hacen inviable la enumeracin de la distribucin de aleatorizacin exacta. Sin embargo, numerosos estudios han demostrado que la distribucin F comn de la teora normal es una buena aproximacin de la distribucin de aleatorizacin exacta. Por lo tanto, incluso sin el supuesto de normalidad, la prueba F puede considerarse como una aproximacin de la prueba de aleatorizacin. Para ms detalles sobre las pruebas de aleatorizacin en el anlisis de varianza, ver Box, Hunter y Hunter [18].
3~3.3

Estimacin de los parmetros del modelo

Se presentan ahora los estimadores de los parmetros del modelo con un solo factor

Ylos intervalos de confianza para las medias de los tratamientos. Ms adelante se demostrar que estimadores razonables de la media global y de los efectos de los tratamientos estn dados por

Y.. ti = jii. jl=

ji.. ,

i = 1, 2, ... , a

(311)

Estos estimadores poseen un considerable atractivo intuitivo; observe que la media global se estima con el gran promedio de las observaciones y que el efecto de cualquier tratamiento no es sino la diferencia entre el promedio del tratamiento y el gran promedio. Es posible determinar con facilidad una estimacin del intervalo de confianza de la media del tratamiento i-simo. La media del tratamiento -simo es

Un estimador puntual de ..t sera tt i = tt + ti = jii.. Ahora bien, si se supone que los errores siguen una distribucin normal, cadaj, es unaNID(ui' o2/n). Por 10 tanto, si 02 fuera conocida, podra usarse la distribucin normal para definir el intervalo de confianza. Al utilizar MS E como estimador de 02, el intervalo de confianza se basara en la distribucin t. Por 10 tanto, un intervalo de confianza de 100(1 7,) a) por ciento para la media u, del tratamiento isimo es
Yi.

-t(f;/2,N-a

~MSE S# -n-

SYi.

+t a/2.N- a

~MSE -n-

(3-12)

Un intervalo de confianza de 100(1- a) por ciento para la diferencia en las medias de dos tratamientos cualesquiera, por ejemplo u, - #i' sera

_ _ ~2MSE _ _ ~2MSE Yi. - Yi. - t n.s- - - < # i - # i < Yi. - Yi. +t n.s- -nn -

(3-13)

3-3 ANLISIS DEL MODEW CON EFECTOS FIJOS


EJE~LO

75
.

33

Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la media global y de los efectos de los tratamientos como {i = 376/25 = 15.04 Y

f 1 = Y - Y.. = 9.80-15.04=-5.24 l
f2 = f3 =

Yz. - Y.. = 15.40-15.04 = +0.36

Y3. - Ji.. = 17.60-15.04= -2.56 i 4 = Y4. - Y.. = 21.60-15.04 = +6.56 i 5 = Y5. - Y.. = 10.80-15.04 = -4.24
Un intervalo de confianza de 95% para la media del tratamiento 4 (30% de algodn) se calcula con la ecuacin 3-12 como

21.60-2.086 ~8.06 :s.!J.4 s 21.60+2086 ~8.06 -5-5-

o
21.60-2.65:s.!J.4 s 21.60+265
Por Jo tanto, el intervalo de confianza de 95% deseado es 18.95
.. o

!J.4

s 24.25.
" .

Intervalos de confianza simultneos Las expresiones para los intervalos de confianza dados en las ecuaciones 3-12y 3-13son intervalos de confianza uno a la vez. Es decir, el nivel de confianza 1 - a slo se aplica a una estimacin particular. Sin embargo' en muchos problemas, el experimentador tal vez quiera calcular varios intervalos de confianza, uno para cada una de varias medias o diferencias entre medias. Si hay inters en r de estos intervalos de confianza de 100(1-a) por ciento, la probabilidad de que los r intervalos sean correctos simultneamente es al menos 1- ra. A la probabilidad ra se le llama con frecuencia ndice de error en el modo del experimento o coeficiente de confianza global. El nmero de intervalos r no tiene que ser muy grande antes de que el conjunto de intervalos de confianza se vuelva relativamente falto de informacin. Por ejemplo, si hay r = 5 intervalos y a = 0.05 (una eleccin tpica), el nivel de confianza simultneo para el conjunto de los cinco intervalos de confianza es de al menos 0.75, y si r = 10 Ya = 0.05, el nivel de confianza simultneo es de al menos 0.50. Un enfoque para asegurarse de que el nivel de confianza simultneo no sea demasiado pequeo es sustituir a/2 con a/(2r) en las ecuaciones 3-12y 3-13 del intervalo de confianza uno a la vez. A ste se le llama el mtodo de Bonferroni, y le permite al experimentador construir un conjunto de r intervalos de confianza simultneos para las medias de los tratamientos o las diferencias en las medias de los tratamientos para los que el nivel de confianza global es de al menos 100(1- a) por ciento. Cuando r no es muy grande, ste es un mtodo muy atinado que produce intervalos de confianza razonablemente cortos. Para ms informacin, referirse al material suplementario del texto del captulo 3.
3 ..3.4 Datos no balanceados

En algunos experimentos con un solo factor, puede ser diferente el nmero de observaciones que se hacen dentro de cada tratamiento. Se dice entonces que el diseo es no balanceado. Sigue siendo posible aplicar el anlisis de varianza descrito arriba, pero deben hacerse ligeras modificaciones en las frmulas

76

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

de las sumas de cuadrados. Sea que se hagan ni observaciones bajo el tratamiento i (i = 1,2, ..., a) y que N = l:~_1ni' Las frmulas para calcular manualmente SST y SSTr.l.mienlos quedan como
SST =

LL y: _L... N
;_1 j-1

nI

(3-14)

y
SSTr.lamienlos

y; L - - Y.~ N
i-1 ni

(3-15)

No se requieren ms cambios en el anlisis de varianza. Hay dos ventajas al elegir un diseo balanceado. Primera, el estadstico de prueba es relativamente insensible a las desviaciones pequeas del supuesto de la igualdad de las varianzas de los a tratamientos cuando los tamaos de las muestras son iguales. No es ste el caso cuando los tamaos de las muestras son diferentes. Segunda, la potencia de la prueba se maximiza cuando las muestras tienen el mismo tamao.

3-4

VERIFICACIN DE LA ADECUACIN DEL MODELO

La descomposicin de la variabilidad presente en las observaciones mediante la identidad del anlisis de varianza (ecuacin 3-6) es una relacin puramente algebraica. Sin embargo, el uso de la particin para probar formalmente que no hay diferencias en las medias de los tratamientos requiere que se satisfagan ciertos supuestos. Especficamente, estos supuestos son que el modelo

Yij = ..t+fi +eij describe de manera adecuada las observaciones, y que los errores siguen una distribucin normal e independiente con media cero y varianza dl constante pero desconocida. Si estos supuestos se satisfacen, el procedimiento del anlisis de varianza es una prueba exacta de la hiptesis de que no hay diferencias en las medias de los tratamientos. Sin embargo, es comn que en la prctica estos supuestos no se satisfagan exactamente, Por consiguiente, en general no es prudente confiar en el anlisis de varianza hasta haber verificado estos supuestos. Las violaciones de los supuestos bsicos y la adecuacin del modelo pueden investigarse con facilidad mediante el examen de los residuales. El residual de la observacinj-sima en el tratamiento i-simo se define como (3-16)
donde
5'ij

es una estimacin de la observacin Yij correspondiente que se obtiene como sigue:

s, ={J.+f
= Ji.

=Y.. +(- - Y.. Yi. -)


(3-17)

La ecuacin 3-17 da el resultado intuitivamente claro de que la estimacin de cualquier observacin en el tratamiento i-simo no es sino el promedio del tratamiento correspondiente. El examen de los residuales deber ser una parte automtica de cualquier anlisis de varianza. Si el modelo es adecuado, los residuales debern estar sin estructura; es decir, no debern contener patrones obvios. A travs de un estudio de los residuales, pueden descubrirse muchos tipos de inadecuaciones del modelo y violaciones de los supuestos subyacentes. En esta seccin se indica cmo puede hacerse con facilidad la verificacin de diagnstico del modelo mediante el anlisis grfico de los residuales y cmo resolver varias anormalidades que ocurren comnmente.

3-4 VERlFICACIN DE LAADECUACiN DELMODELO

77

3 ..4.1

El supuesto de nonnaJlidad

La verificacin del supuesto de normalidad podra hacerse graficando un histograma de los residuales. Si se satisface el supuesto de NID(O, al) para los errores, esta grfica deber aparecer como una muestra de una distribucin normal con centro en cero. Desafortunadamente, cuando se trabaja con muestras pequeas, suelen ocurrir fluctuaciones significativas, por lo que la aparicin de una desviacin moderada de la normalidad no implica necesariamente una violacin seria de los supuestos. Las desviaciones marcadas de la normalidad son potencialmente serias y requieren anlisis adicional. Un procedimiento en extremo til es construir una grfica de probabilidad normal de los residuales. Recuerde que en el captulo 2 se utiliz una grfica de probabilidad normal de los datos originales para verificar el supuesto de normalidad cuando se us la prueba t. En el anlisis de varianza, por lo general es ms eficaz (y directo) hacer lo mismo con los residuales. Si la distribucin fundamental de los errores es normal, esta grfica tendr la apariencia de una lnea recta. Para visualizar la lnea recta, deber prestarse ms atencin a los valores centrales de la grfica que a los valores extremos. En la tabla 3-6 se muestran los datos originales y los residuales de los datos de la resistencia a la tensin del ejemplo 3-1. La grfica de probabilidad normal se muestra en la figura 3-4. La impresin general que surge al examinar esta representacin es que la distribucin de los errores puede tener un ligero sesgo, con la cola derecha siendo ms larga que la izquierda. La tendencia de la grfica de probabilidad normal a curvarse hacia abajo ligeramente del lado izquierdo, implica que la cola izquierda de la distribucin de los errores sea un tanto ms delgada de lo que se anticipara con una distribucin normal; es decir, los residuales negativos no son tan grandes (en valor absoluto) como se esperaba. Sin embargo, esta grfica no muestra una desviacin marcada de la distribucin normal. En general, las desviaciones moderadas de la normalidad no son motivo de gran preocupacin en el anlisis de varianza de efectos fijos (recuerde el anlisis de las pruebas de aleatorizacin de la seccin 3-3.2). Una distribucin de los errores que tiene colas considerablemente ms gruesas o delgadas que la distribucin normal es motivo de mayor preocupacin que una distribucin sesgada. Puesto que la prueba F slo se afecta ligeramente, se dice que el anlisis de varianza (y los procedimientos relacionados como las comparaciones mltiples) es robusto con respecto al supuesto de normalidad. Las desviaciones de la normalidad hacen por lo general que tanto el verdadero nivel de significacin como la verdadera potencia difieran ligeramente de los valores anunciados, con la potencia siendo generalmente ms baja. El modelo de los efectos aleatorios que se revisar en el captulo 12 se afecta en forma ms severa por la no normalidad.
Tabla 3.6 Datos y residuales del ejemplo 3-1 a Peso porcentual del algodn

Observaciones (j)
2 7 12 14 1-2.8 (15) 1-3.4 (8) 1-3.6 (l8)

3
1 5.2

4
1.2 11 (12)

5
9 19 1-0.8 (6) 9.8
1504

1-2.8
7 17 18 25 (19) 1 1.6 (14) 12 18 22
11

15
20 25 30 35

15 (25)
1-304 (l)

I
18 19 19 15

2.6
(11)

2.6 (3)

0.4

(13)

0.4 (20)

1 lA (7) 1-2.6 (24)

I
19

lA (9)

17.6 21.6

1-2.6 19 (22) 7 1-3.8 (17)

1 3.4 (5)

1 0.4 (2) 1 0.2 (4)

I
23

1.4 (lO)

0.2 1 4.2 10.8 (16) 11 (23) . . .. . "Los residuales se ndcan en el recuadro de cada celda. Los nmeros entre parntesis indican el orden en que se recolectaron los datos .

1'-0.8 10 (21)

78

CAPTULO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

99

96 90
;;

80 70

E e

<5

"'C

.B
~

;g 60 :c
E c.

IV

30 20

'#-

-3.8
-1.66 0.7
Residual

2.95

6.2

Figura 34 Grfica de probabilidad normal de los residuales del ejemplo 3-1.

Una anomala muy comn que suele ponerse de manifiesto en las grficas de probabilidad normal es un residual que es mucho ms grande que cualquier otro. A un residual as se le llama con frecuencia punto atpico. La presencia de uno o ms puntos atpicos puede introducir serias distorsiones en el anlisis de varianza, por lo que cuando se localiza un punto atpico potencial, se requiere una investigacin atenta. En muchas ocasiones, la causa del punto atpico es un error en los clculos o un error al codificar o copiar los datos. Si no es sta la causa, las circunstancias experimentales que rodean esta corrida particular deben estudiarse con atencin. Si la respuesta atpica ocurre en un valor particularmente deseable (alta resistencia, costo bajo, etc.), el punto atpico puede ser ms informativo que el resto de los datos. Deber tenerse cuidado de no rechazar o descartar una observacin atpica a menos que se tengan razones no estadsticas de peso para hacerlo. En el peor de los casos, puede terminarse con dos anlisis; uno con el punto atpico y uno sin l. Existen varios procedimientos estadsticos formales para detectar puntos atpicos (por ejemplo, ver Bametty Lewis [8], John YPrescott [60]y Stefansky [107]). Puede hacerse una verificacin aproximada de los puntos atpicos examinando los residuales estandarizados

dij

= ..}MS
E

eij

(3-18)

H VERIFICACIN DELAADECUACIN DEL MODELO

79

Si los errores Eij son N(O, a2), los residuales estandarizados debern ser aproximadamente normales con media cero y varianza unitaria. Por lo tanto, cerca de 68% de los residuales estandarizados debern estar incluidos dentro de los lmites 1, cerca de 95% de ellos debern estar incluidos dentro de 2 y virtualmente todos ellos debern estar incluidos dentro de 3. Un residual mayor que 3 o 4 desviaciones estndar a partir de cero es un punto atpico potencial. Para los datos de la resistencia a la tensin del ejemplo 3-1, la grfica de probabilidad normal no produce indicio alguno de puntos atpicos. Adems, el residual estandarizado mayor es

d13=~=~=
.jMSE .j8.06
el cual no deber ser motivo de preocupacin.

2.84

5.2 =1.83

34.2

Grfica de los residuales en secuencia en el tiempo

La graficacin de los residuales en el orden temporal de la recoleccin de los datos es til para detectar correlaciones entre los residuales. Una tendencia a tener corridas de residuales positivos y negativos indio ca una correlacin positiva. Esto implicara que el supuesto de independencia de los errores ha sido violado. Se trata de un problema potencialmente serio y cuya solucin es difcil, por lo que de ser posible es importante evitar el problema cuando se colecten los datos. La aleatorizacin adecuada del experimento es un paso importante para conseguir la independencia. En ocasiones las habilidades del experimentador (o los sujetos) pueden cambiar conforme el experimento avanza, o el proceso bajo estudio puede "vagar sin rumbo" o volverse ms errtico. Esto producir con frecuencia un cambio en la varianza del error con el tiempo. Esta condicin suele llevar a una grfica de los residuales contra el tiempo que muestra una dispersin mayor en uno de sus extremos que en el otro. Una varianza no constante es un problema potencialmente serio. En las secciones 3-4.3 y 3-4.4 se abundar sobre el tema. En la tabla 36 se muestran nos residuales y la secuencia en el tiempo de la recoleccin de los datos para el experimento de la resistencia a la tensin. En la figura 3-5 se presenta una grfica de estos residua6

5
4
3

2
a;

'Si

"t>

::J

'"

',>

O'

cr -1

10

15
Tlempo

20

25

-2
-3 -4

-5

Figura 3-5 Grfica de los residuales contra el tiempo.

SO

CAPITuLO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

les contra el tiempo. No hay razn para sospechar cualquier violacin de los supuestos de independencia o de una varianza constante. 3..4 .3 Grfica de los residuales contra los valores ajustados

Si el modelo es correcto y se satisfacen los supuestos, los residuales debern estar sin estructura; en particular, no debern estar relacionados con ninguna otra variable, incluyendo la respuesta predicha. Una verificacin simple es graficar los residuales contra los valores ajustados Jij' (Para el modelo de un experimento con un solo factor, recuerde que Ji,. =Yi.' el promedio del tratamiento i-simo.) Esta grfica no deber mostrar ningn patrn obvio. En la figura 3-6 se grafican los residuales contra los valores ajustados para los datos de la resistencia a la tensin del ejemplo 3-1. No es evidente ninguna estructura inusual. Un defecto que sale a relucir en ocasiones en esta grfica es una varianza no constante. En ocasiones la varianza de las observaciones se incrementa cuando la magnitud de la observacin se incrementa. ste sera el caso si el error o ruido de fondo del experimento fuera un porcentaje constante de la magnitud de la observacin. (Esto ocurre comnmente con muchos instrumentos de medicin; el error es un porcentaje de la escala de medicin.) Si ste fuera el caso, los residuales se haran mayores conforme Yij se hiciera ms grande, y la grfica de los residuales contraYij se vera como un embudo o un megfono con la boca hacia afuera. Una varianza no constante tambin surge en los casos en que los datos siguen una distribucin no normal, sesgada., porque en las distribuciones sesgadas la varianza tiende a ser una funcin de la media. Si se viola el supuesto de la homogeneidad de las varianzas, la prueba F slo resulta afectada ligeramente en el modelo balanceado (el mismo tamao de la muestra en todos los tratamientos) con efectos fijos. Sin embargo, en diseos no balanceados en casos en que una de las varianzas es considerablemente ms grande que las dems, el problema es ms grave. Especficamente, si los niveles del factor que tienen las varianzas mayores corresponden tambin con los tamaos de las muestras ms pequeos, el ndice de error tipo 1 real es mayor que 10 previsto (o los intervalos de confianza tienen niveles de confianza reales ms bajos que los que fueron especificados). Recprocamente, si los niveles del factor con las varianzas mayores tienen tambin los tamaos de las muestras mayores, los niveles de significacin son mucho menares que lo anticipado (los niveles de confianza son ms altos). sta es una buena razn para escoger tamaos de las muestras iguales siempre que sea posible. Para los modelos con efectos aleatorios, las

6
5
4

2
~

15

:>!

oI -_ _.J...._ _~:....-_...l- _....L..._ _--'-_


5
-2

a: -1

III

10

-3
-4

-5
-6

Figura 3-6

Grfica de los residuales contra los valores ajustados.

3-4 VERIFICACIN DELAADECUACIN DEL MODEW

81

varianzas del error diferentes pueden introducir alteraciones significativas en las inferencias sobre los componentes de la varianza, incluso cuando se usan diseos balanceados. El enfoque usual para abordar el problema de una varianza no constante que ocurre por las razones expuestas antes consiste en aplicar una transformacin para estabilizar la varianza para correr despus el anlisis de varianza en los datos transformados. En este enfoque, deber tenerse presente que las conclusiones del anlisis de varianza se aplican a las poblaciones transformadas. Se han dedicado considerables esfuerzos de investigacin a la seleccin de una transformacin adecuada. Si los experimentadores conocen la distribucin terica de las observaciones, pueden hacer uso de esta informacin para elegir la transformacin. Por ejemplo, si las observaciones siguen la distribucin de o yij ~1 + yIj Si los datos siguen la Poisson, se usara la transformacin de la raz cuadrada yij distribucin lognormal, la transformacin logartmica yij = log y; es adecuada. Para datos binomiales expresados como fracciones, la trnnsfonnacin arcsen yij = arcsen:Y;; es til. Cuando no hay una transformacin obvia, el experimentador realizar por lo general la bsqueda empfrica de una transformacin que iguale la varianza independientemente del valor de la media. Al final de esta seccin se ofrecen algunos consejos al respecto. En los experimentos factoriales, los cuales se introducen en el captulo 5, otro enfoque es seleccionar una transformacin que minimice el cuadrado medio de las interacciones, siendo el resultado un experimento cuya interpretacin es ms sencilla. En el captulo 14 se revisan con mayor detalle los mtodos para seleccionar analticamente la forma de la transformacin. Las transformaciones que se hacen para la desigualdad de la varianza afectan tambin la forma de la distribucin del error. En la mayora de los casos, la transformacin hace que la distribucin del error est ms cerca de la distribucin normal. Para ms detalles sobre las transformaciones, referirse a Bartlett [7], Box y Cox [15], Dolby [38] y Draper y Hunter {39].

=y;;

Pruebas estadsticas para la igualdad de la varianza Aun cuando es frecuente el uso de las grficas residuales para diagnosticar la desigualdad de la varianza, se han propuesto tambin varias pruebas estadsticas. Estas pruebas pueden considerarse como pruebas formales de las hiptesis H O''a2 -a 2 - ' " -a 2 1 2 Q

H 1 : el enunciado anterior no es verdadero para al menos una Un procedimiento muy utilizado es la prueba de Bartlett. El procedimiento incluye el clculo de un estadstico cuya distribucin de muestreo est aproximada muy de cerca por la distribucin ji-cuadrada con a - 1 grados de libertad cuando las a muestras aleatorias son de poblaciones normales independientes. El estadstico de prueba es

a;

x~
donde

= 23026~ e

q= (N-a)loglo
c=1+

S; - !
Q

2 (ni -1)loglO SI

3(a 1)

(!
1"'1 ..:..1"'....:1

1",1

(n-1 f 1- (N - a)-t )
I2

L (ni -1)S S2 =
P

N-a

y SI2 es la varianza muestral de la poblacin i-sima.

82

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

La cantidad q es grande cuando la diferencia entre las varianzas muestrales Si2 es considerablemente grande, y es igual a cero cuando todas las Si2 son iguales. Por lo tanto, H deber rechazarse para los valores de X~ que sean muy grandes; es decir, se rechaza H slo cuando

2 Xo >X2 a,a-I
donde X~.a-I es el punto porcentual a superior de la distribucin ji-cuadrada con a -1 grados de libertad. Tambin podra usarse el enfoque del valor P para tomar una decisin. La prueba de Bartlett es muy sensible al supuesto de normalidad. Por consiguiente, cuando la validez de este supuesto est en duda, no deber usarse la prueba de Bartlett.

EJEMPLO 3.. 4 ..... , . .

Ya que el supuesto de normalidad no est en entredicho, la prueba de Bartlett puede aplicarse a los datos de la resistencia a la tensin del experimento del peso porcentual de algodn del ejemplo 3-1. Se calculan = 9.8, = 4.3, primero las varianzas muestrales de cada tratamiento y se encuentra que l2 = 11.2, = 6.8 y = 8.2. Entonces

S;

S;

S;

Si

S~ = 4(11.2)+4(9.8)+~~3)+4(6.8)+4(8.2) = 8.06

q = 20 log., (8.06)- 4[10glo 11.2+ log., 9.8+ log. 4.3+ log., 6.8+ 10glO 8.2] = 0.45
c= 1+ 3(14) y el estadstico de prueba es

(-

;0)= 1.10

Xo

= 23026 (0.45) = 0.93 (1.10)

Puesto que X~.05, 4 = 9.49, no puede rechazarse la hiptesis nula y se concluye que las cinco varianzas son iguales. Se trata de la misma conclusin a la que se lleg al analizar la grfica de los residuales contra los valores ajustados.

Debido a que la prueba de Bartlett es sensible al supuesto de normalidad, puede haber situaciones en las que sera til un procedimiento alternativo. Anderson y McLean [2] presentan una atinada revisin de algunas pruebas estadsticas de la igualdad de la varianza. La prueba de Levene modificada (ver Levene [72] y Conover, Johnson y Johnson [31]) es un procedimiento muy til que es robusto en cuanto a las desviaciones de la normalidad. Para probar la hiptesis de que las varianzas son iguales en todos los tratamientos, la prueba de Levene modificada utiliza la desviacin absoluta de las observaciones Yij de cada tratamiento de la mediana de los tratamientos, por ejemplo Y;. Sea que estas desviaciones se denoten por
i = 1, 2, ... , a dij =1 Yij - Y;I { J' = 1, 2, , ni

La prueba de Levene modificada evala entonces si la media de estas desviaciones es igualo no para todos los tratamientos. Cuando las desviaciones medias son iguales, las varianzas de las observaciones de

3-4 VERIFICACIN DE LAADECUACIN DELMODELO

83

'labia 3-7 Datos de la descarga pico

Mtodo de estimacin
1

Observaciones
0.34 0.91 6.31 17.15 0.12 2.94 8.37 11.82 1.23 2.14 9.75 10.95 0.70 2.36 6.09 17.20 1.75 2.86 9.82 14.35 0.12 4.55 7.24 16.82

Yi.
0.71 2.63 7.93 14.72

y;
0.520 2.610 7.805 15.59

2
3

4 Mtodode estimacin
1 2 3 4

Si 0.66 1.09 1.66 2.77

Desviaciones dij para la prueba de Levene modificada


0.18 1.70 1.495 1.56 0.40 0.33 0.565 3.77 0.71 0.47 1.945 4.64 0.18 0.25 1.715 1.61 1.23 0.25 2.015 1.24 0.40 1.94 0.565 1.23

todos los tratamientos sern iguales. El estadstico de prueba para la prueba de Levene es simplemente el estadstico F ANOVA usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas.

EJEMPLO 3~S

11I

11I

11I

11I

11I

11I

11I

11I

11I

11I

11I

Un ingeniero civil est interesado en determinar si cuatro mtodos diferentes para estimar la frecuencia de las inundaciones producen estimaciones equivalentes de la descarga pico cuando se aplican a la misma cuenca. Cada procedimiento se usa seis veces en la cuenca, y los datos de las descargas resultantes (en pies cbicos por segundo) se muestran en la parte superior de la tabla 3-7. El anlisis de varianza de los datos, el cual se resume en la tabla 3-8, implica que hay una diferencia en las estimaciones de la descarga pico promedio obtenidas en los cuatro procedimientos. La grfica de los residuales contra los valores ajustados, la cual se muestra en la figura 3-7, es preocupante porque la forma de embudo con la boca hacia afuera indica que no se satisface el supuesto de una varianza constante. Se aplicar la prueba de Levene modificada a los datos de la descarga pico. La parte superior de la tabla 3-7 contiene las medianas de los tratamientos y; y la parte inferior contiene las desviaciones d ij alrededor de las medianas. La prueba de Levene consiste en realizar un anlisis de varianza estndar en las dijo El estadstico de pruebaF que resulta en este caso es F =4.55, para el cual el valor P esP = 0.0137. Por lo tanto, la prueba de Levene rechaza la hiptesis nula de que las varianzas son iguales, coincidiendo en esencia con el diagnstico que se hizo a partir del examen visual de la figura 3-7. Los datos de la descarga pico son un buen candidato para una transformacin de datos.
Seleccin emprica de una transformacin Se seal ya que si los experimentadores conocieran la relacin entre la varianza de las observaciones y la media, podran usar esta informacin como gua para la seleccin de la forma de la transformacin. Se

Tabla 3-8 Anlisis de varianza de losdatos de la descarga pico

Fuente de variacin Mtodos Error Thtal

Sumade cuadrados
708.3471 62.0811 770.4282

Gradosde libertad
3 20 23

Cuadrado medio
236.1157 3.1041 76.07

ValorP
<0.001

84
4

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANLISIS DE VARIANZA

3
2

'"

:~

-1

-2

-3
--4


Yij para
el

Figura 3-7 Grfica de los residuales contra ejemplo 3-5.

desarrolla ahora este punto y se presenta un mtodo para seleccionar empricamente la forma de la transformacin requerida de los datos. SeaE(y) =,tIa media de y, y suponga que la desviacin estndar de y es proporcional a una potencia de la media de y tal que

Quiere encontrarse una transformacin de y que produzca una varianza constante. Suponga que la transformacin es una potencia de los datos originales, por ejemplo

(3-20)
Puede demostrarse entonces que

a y.

ec

r:

IJ

A+a-l

(3-21)

Evidentemente, si se hace). = 1 - a, la varianza de los datos transformados y* es constante. En la tabla 3-9 se resumen varias de las transformaciones comunes analizadas anteriormente. Observe que). = Oimplica la transformacin logartmica. Estas transformaciones se enlistan en el orden de fuerza creciente. Por fuerza de una transformacin se entiende la cantidad de curvatura que induce. Una transformacin suave aplicada a datos que se extienden en un rango estrecho tiene escaso efecto sobre el

Tabla 3-9

Transformaciones para estabilizar la varianza

Relacin entre

uyY /l

A=l-a 1

'Iransformacin

Comentario Datos (nmeros) de Poisson

o
1/2 1 3/2 2

1/2 O
-1/2 -1

Sin transformacin Raz cuadrada Log Raz cuadrada recproca Recproco

3-4 VERIFICACiN DE LA ADECUACiN DEL MODELO


1.5

85

1.0

r.;,..!2
ti>

0.5

-0.5

-1

Figura 38 Grfica de lag Sicontra 10gYi. para los datos de la descarga pico del ejemplo 3-5.

anlisis, mientras que una transformacin fuerte aplicada en un rango amplio puede tener resultados dramticos. Con frecuencia las transformaciones tienen escaso efecto a menos que el cociente YmYIYmfn sea mayor que 2 o 3. En muchas situaciones de diseo experimental en las que se usan rplicas, a puede estimarse empricamente a partir de los datos. Puesto que la combinacin z-smo de los tratamientos o s, oc 11 ~ = fJll~ , donde fJ es una constante de proporcionalidad, pueden tomarse logaritmos para obtener
lago YI

= 10gfJ+a lag 11 i

(3-22)

Por lo tanto, una grfica de lag o Yi contra loglli sera una lnea recta con pendiente a. Puesto que no se conocen o v, y Ili, pueden sustituirse estimaciones razonables de ellos en la ecuacin 3-22 y usar la pendiente del ajuste de la lnea recta resultante como estimacin de a. De manera tpica, se usara la desviacin estndar Si y el promedio Ji. del tratamiento r-simo (o, en trminos ms generales, la combinacin i-sima de los tratamientos o conjunto de condiciones experimentales) para estimar o YI y u; Para investigar la posibilidad de usar una transformacin para estabilizar la varianza en los datos de la descarga pico del ejemplo 3-5, en la figura 3-8 se grafica lag Si contra 10gYi.. La pendiente de la recta que pasa por estos cuatro puntos est cerca de 1/2 y, por la tabla 3-9, esto implica que la transformacin de la raz cuadrada puede ser apropiada, El anlisis de varianza de los datos transformados Y* = ..y se presenta en la tabla 3-10, y en la figura 3-9 se muestra una grfica de los residuales contra la respuesta predicha. Esta grfica residual muestra una mejora sensible en comparacin con la figura 3-7, por lo que se concluTabla310 Anlisis de varianza de los datos transformados de la descarga pico, y* = yY Fuente de Suma de Grados de Cuadrado variacin cuadrados libertad medio 32.6842 10.8947 Mtodos 3 Error 2.6884 0.1415 19 Total 35.3726 22

ValorP
76.99
<0.001

86
1.00 0.75 0.50 0.25

CAPTULO 3

EXPERIMENTOSCON UN SOLO FAcrOR: EL ANLISIS DE VARIANZA

..:"

-0.25 -0.50 -0.75 -1.00


O

y;

Figura 39 Grfica de los residuales de los datos transformados contra para los datos de la descarga pico del ejemplo 3-5.

ye que la transformacin de la raz cuadrada ha sido til. Observe que en la tabla 3-10 se han reducido los grados de libertad del error en 1 para tomar en consideracin el uso de los datos para estimar el parmetro de la transformacin a. En la prctica, muchos experimentadores seleccionan la forma de la transformacin probando varias alternativas y observando el efecto de cada transformacin en la grfica de los residuales contra la respuesta predicha. Entonces se selecciona la transformacin que produjo la grfica residual ms satisfactoria.
3~4.4

Grficas de los residuales contra otras variables

Si se han recolectado datos de cualesquiera otras variables que posiblemente pudieran afectar la respuesta, los residuales debern graficarse contra estas variables. Por ejemplo, en el experimento de la resistencia a la tensin del ejemplo 3-1, la resistencia puede ser afectada de manera significativa por el espesor de la fibra, por 10 que los residuales debern graficarse contra el espesor de la fibra. Si se usaron diferentes mquinas de prueba para recolectar los datos, los residuales debern graficarse contra las mquinas. Los patrones en tales grficas residuales implican que la variable afecta la respuesta. Esto sugiere que la variable debera controlarse con mayor atencin en experimentos futuros o que debera incluirse en el anlisis.

3~5

INTERPRETACIN PRCTICA DE LOS RESULTADOS

Despus de realizar el experimento, llevar a cabo el anlisis estadstico e investigar los supuestos fundamentales, el experimentador est listo para sacar conclusiones prcticas acerca del problema bajo estudio. Muchas veces esto es relativamente fcil, y ciertamente en los experimentos sencillos que se han considerado hasta este punto, esto podra hacerse de manera un tanto informal, tal vez mediante la inspeccin de las representaciones grficas, como los diagramas de caja y el diagrama de dispersin de las figuras 3-1 y 3-2. Sin embargo, en algunos casos es necesario aplicar tcnicas ms formales. En esta seccin se presentarn algunas de ellas.

3-5 INTERPRETACIN PRCTICA DE LOSRESULTADOS

87

3..5 .1

Un modelo de regresin

Los factores que intervienen en un experimento pueden ser cuantitativos o cualitativos. Un factor cuantitativo es aquel cuyos niveles pueden asociarse con puntos en una escala numrica, como la temperatura, la presin o el tiempo. Los factores cualitativos, por otra parte, son aquellos cuyos niveles no pueden ordenarse por magnitud. Los operadores, los lotes de materia prima y los cambios de tumo son factores cualitativos tpicos, ya que no existe ninguna razn para ordenarlos bajo algn criterio numrico particular. En lo que se refiere al diseo inicial y al anlisis del experimento, ambos tipos de factores se tratan de manera idntica. El experimentador est interesado en determinar las diferencias, en caso de haberlas, entre los niveles de los factores. Si el factor es cualitativo, como los operadores, no tiene sentido considerar la respuesta de una corrida subsecuente en un nivel intermedio del factor. Sin embargo, con un factor cuantitativo como el tiempo, el experimentador tiene inters por lo general en el rango completo de los valores usados, particularmente la respuesta de una corrida subsecuente con un nivel intermedio del factor. Es decir, si se usan los niveles 1.0, 2.0 Y3.0 en el experimento, tal vez quiera predecir la respuesta de 2.5 horas. Por lo tanto, el experimentador tiene con frecuencia inters en desarrollar una ecuacin de interpolacin para la variable de respuesta del experimento. Esta ecuacin es un modelo emprico del proceso que se ha estudiado. Al enfoque general para ajustar modelos empricos se le llama anlisis de regresin, el cual se analiza en detalle en el captulo 10. Vase tambin el material suplementario del texto para este captulo. En esta seccin se ilustra brevemente la tcnica utilizando los datos de la resistencia a la tensin del ejemplo 3~1. En la figura 3-10 se presenta el diagrama de dispersin de la resistencia a la tensin y contra el peso porcentual del algodn x en la tela para el experimento del ejemplo 3-1. Los crculos huecos de la grfica son las resistencias de tensin promedio para cada valor x del peso porcentual del algodn. A partir del examen del diagrama de dispersin, es evidente que la relacin entre la resistencia a la tensin y el peso

25

20

...

~ 15 e

s s

.!!!

.~
a:

..
III

10

.111

Figura 310 Diagrama de dispersin para los datos de la resistencia a la tensin del ejemplo 31.

88

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

porcentual del algodn no es lineal. Como una primera aproximacin, podra intentarse ajustar un modelo cuadrtico para los datos, por ejemplo

donde f3o, f31 y f32 son parmetros desconocidos que debern estimarse y e es un trmino del error aleatorio. El mtodo que se usa con mayor frecuencia para estimar los parmetros en un modelo como ste es el mtodo de mnimos cuadrados. ste consiste en elegir estimaciones de las f3 tales que minimicen la suma de cuadrados de los errores (las e). El ajuste de mnimos cuadrados en el ejemplo que se considera aqu es

y= -39.9886+4.596x- 0.0886x 2
(Si el lector no est familiarizado con los mtodos de regresin, vea el captulo 10y el material suplementario del texto para este captulo.) En la figura 3-10 se muestra este modelo cuadrtico. No parece muy satisfactorio, ya que subestima de manera drstica las respuestas para x = 30% de algodn y sobrestima las respuestas para x = 25%. Quiz pueda lograrse un mejoramiento agregando un trmino cbico enx. El ajuste con el modelo cbico resultante es

y= 62.6114- 9.0114x+0.4814x 2 -

0.0076x 3

Este ajuste cbico se ilustra tambin en la figura 310. El modelo cbico parece mejor que el cuadrtico porque proporciona un ajuste mejor para x = 25 Y x = 30% de algodn. En general, sera preferible hacer el ajuste con el polinomio de orden menor que describa adecuadamente el sistema o proceso. En este ejemplo, el polinomio cbico parece un mejor ajuste que el cuadrtico, por lo que la complejidad adicional del modelo cbico se justifica. Sin embargo, seleccionar el orden del polinomio de aproximacin no siempre es fcil, y es relativamente sencillo excederse en el ajuste, es decir, agregar polinomios de orden superior que no mejoran en realidad el ajuste pero que incrementan la complejidad del modelo y con frecuencia demeritan su utilidad como predictor o ecuacin de interpolacin. En este ejemplo, el modelo emprico podra usarse para predecir la resistencia a la tensin media para los valores del peso porcentual del algodn dentro de la regin de experimentacin. En otros casos, el modelo emprico podra usarse para la optimizacin del proceso, es decir, para encontrar los niveles de las variables del diseo que dan como resultado los mejores valores de la respuesta. Ms adelante se analizarn e ilustrarn en detalle estos problemas.
3~5.2

Comparaciones entre las medias de los tratamientos

Suponga que al hacer el anlisis de varianza en el modelo con efectos fijos se rechaza la hiptesis nula. Por lo tanto, hay diferencias entre las medias de los tratamientos, pero no se especifica exactamente cules medias difieren. En ocasiones pueden ser de utilidad en esta situacin las comparaciones y los anlisis adicionales entre grupos de las medias de los tratamientos. La media del tratamiento i-simo se define como J.1i = J.1 + Ti' y Pi se estima con )Ji.. Las comparaciones entre las medias de los tratamientos se hacen ya sea en trminos de los totales de los tratamientos {y;,} o bien de los promedios de los tratamientos {Y;,}. Es comn llamar a los procedimientos para hacer estas comparaciones mtodos de comparaciones mltiples. En varias de las secciones siguientes se analizan los mtodos para hacer comparaciones entre las medias de los tratamientos individuales o de grupos de estas medias.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

89

3..5.3

Comparaciones grficas de medias

Es muy sencillo desarrollar un procedimiento grfico para la comparacin de las medias despus de un anlisis de varianza. Suponga que el factor de inters tiene a niveles y que Y1.,Y2., ...,Ya. son los promedios de los tratamientos. Si se conoce u, el promedio de cualquier tratamiento tendra una desviacin estndar ulV. Por consiguiente, si todas las medias de los niveles del factor son idnticas, las medias muestrales observadas Yi. se comportaran como un conjunto de observaciones tomadas al azar de una distribucin normal con medaji.. y desviacin estndar u/Vii. Visualice una distribucin normal con la capacidad de ser deslizada sobre un eje abajo del cual estn graficadasyuyv ...,Y.,Si todas las medias de los tratamientos son iguales, deber haber una posicin de esta distribucin que haga evidente que los valores Yi. se sacaron de la misma distribucin. Si no es ste el caso, los valores Yi. que no parecen haberse sacado de esta distribucin se asocian con los niveles del factor que producen respuestas medias diferentes. La nica falla en esta lgica es que a es desconocida. Sin embargo, puede sustituirse u con .J MS E del anlisis de varianza y usar una distribucin t con un factor de escalacin .J MS E I n en lugar de la distribucin normal. En la figura 3-11 se muestra este arreglo para los datos de la resistencia a la tensin del ejemplo 3-1. Para trazar la distribucin t de la figura 3-11, simplemente se multiplica el valor de la abscisa t por el factor de escalacin

.JMS E In

= .J8.061 5 =1.27

y se grafica contra la ordenada de t en ese punto. Dada la gran similitud entre la distribucin t y la normal, excepto porque la primera es un poco ms plana cerca del centro y tiene colas ms largas, por lo general este trazo se construye fcilmente a ojo. Si quiere obtenerse mayor precisin, en Box, Hunter y Hunter [18] se incluye una tabla de los valores de las abscisas t y las ordenadas correspondientes. La distribucin puede tener un origen arbitrario, aun cuando por lo general es mejor uno que est en la regin de los valores Yi. que van a compararse. En la figura 3-11, el origen es 15 lb/pulg", Visualice ahora el desplazamiento de la distribucin t de la figura 3-11 sobre el eje horizontal y examine las cinco medias graficadas en la figura. Observe que no hay ninguna posicin de la distribucin tal que los cinco promedios puedan considerarse como observaciones tpicas seleccionadas al azar de la distribucin. Esto implica que las cinco medias no son iguales; por lo tanto, la figura es una representacin grfica de los resultados del anlisis de varianza. La figura indica que 30% de algodn produce resistencias a la tensin mucho ms altas que 20 o 25 por ciento de algodn (las cuales son aproximadamente iguales), y que 15 o 35 por ciento de algodn (las cuales son aproximadamente iguales) produciran resistencias a la tensin an ms bajas.

25
5
10 15

30 20

25

Resistencia a la tensin promedio (Ib,1pulg 2 )

Figura 311 Promedio de la resistencia a la tensin del experimento del peso porcentual del algodn en relacin con una distribucin t con un factor de escalacin .)MSe / n ==J8.D6 /5 =127.

90

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Este procedimiento simple es una tcnica aproximada pero eficaz en muchos problemas de comparaciones mltiples. Sin embargo, existen mtodos ms formales. A continuacin se presenta una breve revisin de algunos de estos procedimientos.

3-5.4

Contrastes

Muchos mtodos de comparaciones mltiples utilizan el concepto de contraste. Considere el problema de la prueba de la fibra sinttica del ejemplo 3-1. Puesto que se rechaz la hiptesis nula, se sabe que algunos pesos porcentuales del algodn producen resistencias a la tensin diferentes que otros, pero, Zcules son los que causan en realidad esta diferencia? Al principio del experimento podra sospecharse que los niveles 4 y 5 del peso porcentual del algodn (30 y 3S por ciento) producen la misma resistencia a la tensin, lo cual implicara que la hiptesis por probar sera .
H O:# 4 =#s H l :# 4 :t: #s

o, de manera equivalente,
H a :# 4 - # S = 0 H l :# 4 - #s :t: O

(3-23)

Si desde el principio del experimento se hubiera sospechado que el promedio de los niveles ms bajos del peso porcentual del algodn (1 y 2) no difera del promedio de los niveles ms altos del peso porcentual del algodn (4 Y S), entonces la hiptesis habra sido

Ha:#l +#2 =#4 +#s H:# +#2:t: #4 +#s


o

H a:# +#2 - #4 - #s =0 H l : #1 + # 2 - # 4 - # s = O
En general, un contraste es una combinacin lineal de parmetros de la forma

(3-24)

donde las constantes de los contrastes Cl> C2, ... , ca suman cero; es decir, ~~_c riores pueden expresarse en trminos de contrastes:

= O. Las dos hiptesis ante-

Ha:! c,,
-l

=O
(3-25)
O

Hl

:!

C# :t:

"l

Las constantes de los contrastes para las hiptesis de la ecuacin 3-23 son c l =e2 = C3 = O, c4 = + 1 y Cs = -1, mientras que para las hiptesis de la ecuacin 3-24 son c l = c 2 = + 1, c 3 = O, Y C4 = Cs = -1.

3-5 INTERPRETACIN PRCTICA DELOS RESULTADOS

91

Las pruebas de hiptesis que incluyen contrastes pueden hacerse de dos maneras bsicas. En el primer mtodo se utiliza la prueba l. El contraste de inters se escribe en trminos de los totales de los tratamientos, obtenindose

c=
La varianza de

,LJ e.y.l. 1
1-1

e es
V(C)=

nq2! e;
1-1

(3-26)

cuando los tamaos de las muestras de cada tratamiento son iguales. Si la hiptesis nula de la ecuacin 3-25 es verdadera, el cociente
,LJ c.y.l. ,

tiene la distribucin N(O, 1). Entonces se sustituira la varianza desconocida a2 con su estimacin, el error cuadrtico medio MSE , y se utilizara el estadstico

.LJ '

e.y.
1-

(3-27)

para probar las hiptesis de la ecuacin 3-25. La hiptesis nula se rechazara si 110 I de la ecuacin 3-27 excede t a /2. N-o(J' En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de una variable aleatoria I con v grados de libertad es una variable aleatoria F con un grado de libertad en el numerador y v grados de libertad en el denominador. Por lo tanto, puede obtenerse

- 2 _ F. - 1o - _,-,-I--=-I~~=-o a

! (

CiYI.)2

nMSE

e;
;-1

(3-28)

como un estadstico F para probar la ecuacin 3-25. La hiptesis nula se rechazara si F > Fa 1,N-o(J ' Este estadstico de prueba de la ecuacin 3-28 puede escribirse como SSc /1 MS c F. = - - = - o MS E MS E donde la suma de cuadrados de los contrastes con un solo grado de libertad es

ss =
C

....:..:....1-:::....1_----:..._

(t

CIYI.)2
a

n e;
1-1

(3-29)

92

CAPTULO 3 EXPERIMENTOS CON UN SOLOfACTOR: ELANLISIS DEVARIANZA

Intervalo de confianza para un contraste En lugar de probar hiptesis acerca de un contraste, puede ser ms til construir un intervalo de confianza. Entonces el contraste suele expresarse en trminos de los promedios de los tratamientos J. Suponga que el contraste de inters es

Al sustituir las medias de los tratamientos con los promedios de los tratamientos se obtiene

c=! cy.
j~l

cuando los tamaos de las muestras son iguales. Si se usaMSE para estimar 100(1 - a) por ciento para el contraste 'L7~lC;/li es .

er, el intervalo de confianza de


(3-30)

_ MS E ~ 2 CiYi, +t"/2,N-a --.L.J c n ~l

Evidentemente, si este intervalo de confianza incluye al cero, no podra rechazarse la hiptesis nula en la ecuacin 3-25.
Contraste estandarizado Cuando hay inters en ms de un contraste, con frecuencia es til evaluarlos en la misma escala. Unaforma de hacer esto es estandarizando el contraste para que su varianza sea o', Si el contraste 'L7mlcf.-li se expresa en trminos de los totales de los tratamientos como 'L7~1 C Y. , al dividirlo por ~ n'L7~1 c se obtendr un contraste estandarizado con varianza er. Entonces el contraste estandarizado es en realidad

donde

Tamaos de las muestras desiguales Cuando los tamaos de las muestras de cada tratamiento son diferentes, se introducen modificaciones menores en los resultados anteriores. Primero, observe que la definicin de un contraste requiere ahora que

~ .L.J n.c. =0
I

i~l

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

93

Otros cambios requeridos son directos. Por ejemplo, el estadstico t de la ecuacin 3-27 queda como

{-, c,.~. ~
t

MSE

nc;

~l

y la suma de cuadrados de los contrastes de la ecuacin 3-29 queda como

3..5.5

Contrastes ortogonales

Un caso especial til del procedimiento de la seccin 3-5.4 es el de los contrastes ortogonales. Dos contrastes con coeficientes {c} y {dJ son ortogonales si

o, para un diseo no balanceado, si

n.c.d,

=O

i~l

Para a tratamientos, el conjunto de a - 1 contrastes ortogonales hace la particin de la suma de cuadrados debida a los tratamientos en a -1 componentes independientes con un solo grado de libertad. Por 10 tanto, las pruebas que se realizan en los contrastes ortogonales son independientes. Existen varias maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto de tratamientos. En general, algn elemento en la naturaleza del experimento deber sugerir las comparaciones que son de inters. Por ejemplo, si haya = 3 tratamientos, donde el tratamiento 1 es de control y donde los niveles del factor en los tratamientos 2 y 3 son de inters para el experimentador, los contrastes ortogonales apropiados podran ser los siguientes: Coeficientes de los contrastes ortogonales
~2

Tratamiento 1 (control) 2 (nivel 1) 3 (niveI2)

o
-1 1

1 1

Observe que el contraste 1 con cj = -2, 1, 1 compara el efecto promedio del factor con el control, mientras que el contraste 2 con d, = O, -1, 1 compara los dos niveles del factor de inters. En general, el mtodo de contrastes (o de contrastes ortogonales) es til para lo que se llama comparaciones preplaneadas. Es decir, los contrastes se especifican antes de llevar a cabo el experimento y de examinar los datos. La razn de esto es que, si las comparaciones se seleccionan despus de examinar los

94

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANLISIS DEVARIANZA

datos, la mayora de los experimentadores construiran pruebas que corresponderan con las diferencias grandes observadas en las medias. Estas diferencias grandes podran ser el resultado de la presencia de efectos reales o podran ser el resultado del error aleatorio. Si los experimentadores se inclinan consistentemente a escoger las diferencias ms grandes para hacer las comparaciones, inflarn el error tipo 1 de la prueba porque es probable que, en un porcentaje inusualmente elevado de las comparaciones seleccionadas, las diferencias observadas sern el resultado del error. Al examen de los datos para seleccionar las comparaciones de inters potencial se le llama con frecuencia curioseo o sondeo de datos. El mtodo de Scheff para todas las comparaciones, el cual se comenta en la seccin siguiente, permite el curioseo o sondeo de datos.

Ej'EMPLO 3 ~6 . . . . . . . . .

111

iII

..

..

..

..

..

..

111

..

..

..

..

..

..

Considere los datos del ejemplo 3-1. Hay cinco medias de los tratamientos y cuatro grados de libertad entre estos tratamientos. Suponga que antes de correr el experimento se especific la siguiente serie de comparaciones entre las medias de los tratamientos (y sus contrastes asociados): Hiptesis
H o:1l4 =Ils H O:11.1+ 113 = 11.4 + I1.s H O:11.1 =11.3 H o:4l1.z = 11.1 + 11.3+ 11. 4+ I1.s

Contraste
C
=

e, =

-Y4. + Ys. + YJ. -Y4. ~Ys.

C3 = YI. -Y3. C4 =-h+ 4yz. -Y3. -Y4. -Ys.

Observe que los coeficientes de los contrastes son ortogonales. Utilizando los datos de la tabla 3-4, se encuentra que los valores numricos de los contrastes y de las sumas de cuadrados son los siguientes:

c=
1

-1(108)+1(54) = -54

SSc,

(-54)2 5(2)

= 291.60

C 2 = +1(49)
C]

+ 1(88)-1(108)-1(54) = -25 SS , c -1(88) =-39


SSc, SS
c.

= (-25)2 = 31.25
5(4)

= +1(49)

= =

(-39)2 5(2) (9)2 5(20)

152.10

C4 =-1(49)+4(77)-1(88)-1(108)-1(54)= 9

= 0.81

Tabla 3-11 Fuente de variacin

Anlisis de varianza de los datos de la resistencia a la tensin Suma de Grados de cuadrados libertad 475.76 (291.60) (31.25) (152.10) (0.81) 161.20 636.96
4

Cuadrado medio 118.94 291.60 31.25 152.10 0.81 8.06

Fo
14.76 36.18 3.88 18.87 0.10

Valor P <0.001 <0.001 0.06 <0.001 0.76

Peso porcentual del algodn contrastes ortogonales


C:11.4 = I1.s C2:11.1+ 11.3 = 11.4 + I1.s C3:11. =11.3 C4:41l2 = 11.1 + 11.3 + 11.4 + Ils Error

1 1 1 1 20 24

Total

3-5 INTERPRETACIN PRCTICA DE WS RESULTAOOS

95

Estas sumas de cuadrados de los contrastes hacen la particin completa de la suma de cuadrados de los tratamientos. Las pruebas de estos contrastes ortogonales se incorporan por 10 general en el anlisis de varianza, como se muestra en la tabla 3-11. Por los valores P se concluye que hay diferencias significativas entre los niveles 4 y 5 Y1 Y3 del peso porcentual del algodn, pero que el promedio de los niveles 1 y 3 no difiere del promedio de los niveles 4 y 5 con el nivel a = 0.05, Yque el nivel 2 no difiere del promedio de los otros cuatro niveles.

3 ..5.6

Mtodo de Scheff para comparar todos los contrastes

En muchas situaciones, los experimentadores pueden no conocer de antemano cules son los contrastes que quieren comparar, o pueden tener inters en ms de a -1 posibles comparaciones. En muchos experimentos de exploracin, las comparaciones de inters slo se descubren despus del examen preliminar de los datos. Scheff [98a] ha propuesto un mtodo para comparar todos y cada uno de los contrastes posibles entre las medias de los tratamientos. En el mtodo de Scheff, el error tipo 1 es a 10 sumo a para cualquiera de las comparaciones posibles. Suponga que se ha determinado un conjunto de m contrastes

r u = clufll +c 2ufl2 + ... +c.ufl.

u= 1, 2, ... ,

(3-31)

en las medias de los tratamientos de inters. El contraste correspondiente de los promedios de los tratamientos Ji. es

C;

= C1uJl +C 2uJ2. + ... +couJ..


Sc.= MS E

u= 1, 2, ... , m

(3-32)

y el error estndar de este contraste es

.,I

(c~/n;)

(3-33)

donde n es el nmero de observaciones en el tratamiento z-smo. Puede demostrarse que el valor crtico contra el que deber compararse Cu es

.J(a-1)Fa ,. _I,N_. (3-34) Para probar la hiptesis de que el contraste T, difiere de manera significativa de cero, se compara C; con el valor crtico. Si ICu I > S u, se rechaza la hiptesis de que el contraste T, es igual a cero. El procedimiento de Scheff puede usarse tambin para formar intervalos de confianza para todos los contrastes posibles entre las medias de los tratamientos. Los intervalos resultantes, por ejemplo Cu Sa,u :S r u :S Cu + Sa,u, son intervalos de confianza simultneos por cuanto la probabilidad de que todos ellos sean verdaderos simultneamente es al menos 1 - a. Para ilustrar el procedimiento, considere los datos del ejemplo 3-1 y suponga que los contrastes de inters son
u

s., = Se

r 2 = fll - u ,
Los valores numricos de estos contrastes son

Cl

= Jl + h - )14. - )15. = 9.80+ 17.60- 21.60-10.80


=5.00

96
y

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

C 2 == J\ - Y4. = 9.80- 21.60

= -11.80
y los errores estndar se encuentran con la ecuacin 3-33 como

SC, == MSEL (c~/n,)==.J8.06(1+1+1+1)/5==2.54


iEl1

y
5

SC, == MSEL (c:2 / n) "" .J8.06(1+1)/ 5 = 1.80


i~l

Por la ecuacin 3-34, los valores crticos de 1% son


SO.Ol,l

== SC] ~(a-1)FO.01,a_1,N_a "" 2,54.J4(4.43) "" 10,69

SO.01,2 "" Se, ~(a-1 )F0.01,d,N-a == 1.80.J4( 4.43) == 7.58


Puesto que I C 1 1 < SO.Ol,l' se concluye que el contraste r 1 = Ji1 + /13 - Ji4 - Ji5 es igual a cero; es decir, no existe evidencia slida para concluir que las medias de los tratamientos 1 y 3 como grupo difieren de las medias de los tratamientos 4 y 5 como grupo. Sin embargo, como I C 2 1 > SO_01,2, se concluye que el contraste r 2 = Ji1 - Ji4 no es igual a cero; es decir, las resistencias medias de los tratamientos 1 y 4 difieren significativamente. En muchas situaciones prcticas, querrn compararse slo pares de medias. Frecuentemente, es posible determinar cules son las medias que difieren probando las diferencias entre todos los pares de medias de los tratamientos. Por lo tanto, el inters se encuentra en los contrastes de la forma r = u, - Jij paratodai :;t: j. Aun cuando el mtodo de Scheff podra aplicarse fcilmente a este problema, no es el procedimiento ms sensible para tales comparaciones. Se pasa ahora a la consideracin de los mtodos diseados especficamente para las comparaciones por pares entre todas las a medias poblacionales.

3..5.7

Comparacin de pares de medias de tratamientos

Suponga que el inters se encuentra en comparar todos los pares de a medias de tratamientos y que las hiptesis nulas que quieren probarse son H o:/1 = /1j para toda i :;t: j. A continuacin se presentan cuatro mtodos para hacer estas comparaciones.

Prueba de Tukey Suponga que, despus de un anlisis de varianza en el que se ha rechazado la hiptesis nula de la igualdad de las medias de los tratamientos, quieren probarse todas las comparaciones de las medias por pares:

H o :/1 "" Ji j
H 1 : /1
:;t: /1 j

para toda i :;t: j. Thkey [111d] propuso un procedimiento para probar hiptesis para las que el nivel de significacin global es exactamente a cuando los tamaos de las muestras son iguales y es a lo sumo a cuando

3-5 INTERPRETACIN PRCTICA DELOS RESULTADOS

97

los tamaos de las muestras no son iguales. Este procedimiento puede usarse tambin para contraer los intervalos de confianza para las diferencias en todos los pares de medias. Para estos intervalos, el nivel de confianza simultneo es de 100(1-a) por ciento cuando los tamaos de las muestras son iguales y de al menos 100(1- a) por ciento cuando los tamaos de las muestras no so?-iguales. Se trata de un procedimiento excelente para curiosear sobre los datos cuando el inters se centra en pares de medias. El procedimiento de 'Iukey hace uso de la distribucin del estadstico del rango studentizado

q=

YlI1x - YIDln
.JMSE / n

donde YlI1xYYIDln son las medias muestrales mayor y menor, respectivamente, sacadas de un grupo de p medias muestrales. La tabla VIII del apndice contiene los valores de qa(P,f), los puntos porcentuales a superiores de q, donde f es el nmero de grados de libertad asociados con MSE' Para tamaos de las muestras iguales, la prueba de Thkey declara que dos medias son significativamente diferentes si el valor absoluto de sus diferencias muestrales excede (3-35) De manera equivalente, podra construirse una serie de intervalos de confianza de 100(1 - a) por ciento para todos los pares de medias de la siguiente manera: (3-36) Cuando los tamaos de las muestras no son iguales, las ecuaciones 3-35 y 3-36 quedan como (3-37)

Yi. - Yi. - q <z(a, f) '"


",,2

Fs

(1 1) -+- '5. u, - ,ti


ni

ni

'5. Yi.

- - Yi. -

+ q a (a, f) M SE (1' 1). :e J. (3-38) '" -+- ,l


",,2
ni

nj

respectivamente. A la versin para tamaos de las muestras diferentes se le llama en ocasiones el procedimiento Tukey-Kramer.

EJEMPLO 3.,7 .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


Para ilustrar la prueba de Tukey, se usan los datos del experimento del peso porcentual del algodn del f ejemplo 3-1. Con a = 0.05 Y = 20 grados de libertad para el error, en la tabla VIII del apndice se obtiene qo.os(5, 20) = 4.23. Por lo tanto, por la ecuacin 3-35,
1'1).05

= qo.os (5, 20)~MSE = 4.23~8.06 = 5.37 -n-5-

--------

----------------------------- - - -

98
j,.

CAPTULO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

9.8

Figura 3-12 Resultados de la prueba de Thkey.

Por lo tanto, cualquier par de promedios de los tratamientos que difieran en valor absoluto por ms de 5.37 implicara que el par correspondiente de medias poblacionales son significativamente diferentes. Los cinco promedios de los tratamientos son

YL = 9.8

)12. = 15.4

Y3. = 17.6
-5.6* -7.8* -11.8* -1.0 - 2.2 - 6.2* 4.6 - 4.0 6.8* = 21.6-10.8= 10.8*

)15.

=10.8

y las diferencias en los promedios son

YL -Y2. = 9.8-15.4= 5\-Y3.= 9.8-17.6= YL-Y4.= 9.8-21.6= YL - Ys. = 9.8-10.8= Y2. - )13. = 15.4-17.6 = Y2. - )14. =15.4- 21.6= Y2. - Ys. = 15.4-10.8= Y3. - Y4. = 17.6- 21.6= h - Ys. =17.6-10.8=
)14. -

Ys.

Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. Suele ser til trazar una grfica, como la de la figura 3-12, donde se subraya a los pares de medias que no difieren significativamente. Esta grfica da una indicacin de que las medias de los tratamientos forman tres grupos: f..li y f..ls, f..l2 Y f..l3, Y f..l4' Sin embargo, la pertenencia a estos grupos no es del todo clara. .

Cuando se utiliza cualquiera de los procedimientos para probar las medias por pares, ocasionalmente se encuentra que la prueba F global del anlisis de varianza es significativa, pero la comparacin de las medias por pares falla para revelar cualquier diferencia significativa. Esta situacin ocurre porque la prueba F considera simultneamente todos los contrastes posibles en los que intervienen las medias de los tratamientos, no slo las comparaciones por pares. Es decir, en los datos a la mano, quiz no todos los contrastes significativos sean de la forma f..li - #j' Algunos paquetes de software de computadora presentan comparaciones por pares con intervalos de confianza. Para el procedimiento de Thkey, estos intervalos se calcularan con la ecuacin 3-36 o la 3-38, dependiendo de si los tamaos de las muestras son iguales o no. La deduccin del intervalo de confianza de Thkey de la ecuacin 3-36 para tamaos de las muestras iguales es directa. Para el estadstico del rango studentizado q se tiene

p(mxU1. - .JMS mn()lI. - #1) #1)In


E

S q (a
a ,

f)) =1- a

35 INTERPRETACIN PRCTICA DELOS RESULTADOS

99

Si mx(Vi. -f.li)-n cYi. -f.li) es menara igual queqia,f).jMSE / n, debe ser verdadero que I(Vi. -f.li) - (Vj,f.lj) I S qa(a, f) MS ! para cada par de medias. Por lo tanto,
P (-q,,(a,f)V----;;--n- S Yi. - Yj. -(f.li - f.lJsqa(a,f)V----;;--n-

{MS;

(MS;) =

1-a

Al reordenar esta expresin para aislar u, - f.l entre las desigualdades se llegar al conjunto de intervalos de confianza simultneos de 100(1 - a) por ciento dado en la ecuacin 3-38.

El mtodo de la diferencia significativa mnima (LSD) de Fisher En este procedimiento se utiliza el estadstico F para probar HO:f.li

= J,lj
(3-39)

Yi. - Yj.
o

MS E

(-+1
ni n

1)

Suponiendo una hiptesis alternativa de dos colas, los pares de medias f.li y f.lj se declararan significativamente diferentes si IYi. - Yj.1 > tan. N-<J~ MSE(l/ni + 1 / n ). A la cantidad LSD

= ta/2oN-a

MSE(~i + :)
o

(3-40) = na = n, y
(3-41)

se le llama diferencia significativa mnima. Si el diseo es balanceado, n 1 = n2 = LSD

= t al2 ,N-a~2MSE -n-

Para usar el procedimiento LSD de Fisher, simplemente se compara la diferencia observada entre cada par de promedios con la LSD correspondiente. Si IYi. -Yj.1 > LSD, se concluye que las medias poblacionales J,li y f.lj difieren.

Ej'EMPLO 3..8 ...

'!

Para ilustrar el procedimiento, si se usan los datos del experimento del ejemplo 3-1,la LSD con a = 0.05 es LSD = t
.025,20

~2MSE n

2.086~2(8.06) = 3.75 5

Por lo tanto, cualquier par de promedios de los tratamientos que difiera del valor absoluto por ms de 3.75 implicara que el par correspondiente de medias poblacionales es significativamente diferente. Las diferencias en los promedios son

Yl-Y2.= 9.8-15.4= Yl - y). = 9.8-17.6 = Yl - Y4. = 9.8- 21.6= Yl - Ys. = 9.8-10.8= Y2. - Y3. = 15.4-17.6= Y2. - Y4. = 15.4- 21.6= Y2. - Ys. = 15.4-10.8= Y3. - Y4. = 17.6- 21.6= Y3. - Ys. = 17.6-10.8= Y4, - Ys, = 21.6-10.8=

-5.6* - 7.8* -11.8* -1.0 - 22 - 6.2* 4.6* - 4.0* 6.8* 10.8*

100
Y,.
9.8

CAPTULO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

Y,.
17.6

Figura 3-13 Resultados del procedimiento LSD.

Los valores marcados con asterisco indican pares de medias que son significativamente diferentes. En la figura 3-13 se resumen los resultados. Evidentemente, los nicos pares de medias que no difieren significativamente son 1 y 5 Y 2 Y 3, Y el tratamiento 4 produce una resistencia a la tensin significativamente mayor que los otros tratamientos.
11I 11I 11I 11I 11I 11I

Observe que el riesgo global a puede inflarse de manera considerable al utilizar este mtodo. Especficamente, cuando a se hace ms grande, el error tipo 1 del experimento (el cociente del nmero de experimentos en los que se comete al menos un error tipo 1y el nmero total de experimentos) se hace grande.
Prueba del rango mltiple de Duncan Un procedimiento muy utilizado para comparar todos los pares de medias es la prueba del rango mltiple desarrollada por Duncan [41]. Para aplicar la prueba del rango mltiple de Duncan cuando los tamaos de las muestras son iguales, los a promedios de los tratamientos se arreglan en orden ascendente, y el error estndar de cada promedio se determina como
SYi.

= ~MSE -n

(3-42)

Para tamaos de las muestras desiguales, se sustituye n en la ecuacin 342 con la media armnica n h del {ni}, donde

a n; =-a---(1/ n)

;;1

Observe que si n 1 = n 2 =... =na> n h = n. En la tabla de Duncan de los rangos significativos (tabla VII del apndice) se obtienen los valoresrip,j) parap = 2,3, ..., a, donde a es el nivel de significacin y/es el nmero de grados de libertad del error. Estos rangos se convierten en un conjunto de a -1 rangos mnimos de significacin (por ejemplo, R p ) para p = 2, 3, ..., a calculando parap = 2, 3, ... , a (3-44)

Entonces, se prueban las diferencias observadas entre las medias, empezando con la ms grande contra la menor, la cual se comparara con el rango mnimo de significacin R a Despus se calcula la diferencia de la mayor y la segunda menor y se compara con el rango mnimo de significacin R, -1' Estas comparaciones se continan hasta que todas las medias se han comparado con la media mayor. Por ltimo, se calcula la diferencia entre la segunda media mayor y la menor y se compara con el rango mnimo de significacin Ra _ 1 Este proceso se contina hasta que se han considerado las diferencias entre todos los a(a ~ 1)/2 pares de medias posibles. Si una diferencia observada es mayor que el rango de significacin mnima correspondiente, se concluye que el par de medias en cuestin es significativamente diferente. Para evitar

3-5 INTERPRETACIN PRCTICA DELOSRESULTADOS

101

contradicciones, ninguna de las diferencias entre un par de medias se considera significativa si las dos medias en cuestin se localizan entre otras dos medias que no difieren significativamente.

EJEMPLO 3 9 ..

iII

La prueba del rango mltiple de Duncan puede aplicarse al experimento del ejemplo 3-1. Recuerde que MS E = 8.06, N = 25, n = 5, Yhay 20 grados de libertad del error. Al arreglar los promedios de los tratamientos en orden ascendente, se tiene

Yl = 9.8 Ys. = 10.8 Y2. = 15.4


)13. = 17.6

Y.
.~.

= 21.6

El error estndar de cada promedio es S- = v'8.06/5 = 1.27. En el conjunto de rangos significativos de la . tabla VII del apndice para 20 grados de libertad y a = 0.05, se obtiene 'o.os(2, 20) = 2.95, 'o.os(3, 20) = 3.10, 'o.os(4, 20) = 3.18 Y'o.os(5, 20) = 3.25. Por lo tanto, los rangos de significacin mnima son

R2 = 'o.os (2, 20)Sy, = (2.95)(1.27) = 175 R 3 ='o.os(3, 20)Sy,. =(110)(1.27)=3.94


R. = '0. os (4, 20)SYI = (118)(1.27)= 4.04

Rs

= 'o.os (5, 20)Sy,.


1: 5: 2: 3: 1: 5: 2: 1: 5: 1: 21.6 21.6 21.6 21.6 17.6 17.6 17.6 15.4 15.4 10.8 -

= (3.25)(1.27) = 4.13

Los resultados de las comparaciones seran 4 vs, 4 vs, 4 vs. 4 vs. 3 vs. 3 VS. 3 vs. 2 VS. 2 vs. 5 vs. 9.8 = 11.8 > 10.8 = 10.8 > 15.4 = 6.2 > 17.6 = 4.0 > 9.8 = 7.8 > 10.8 = 6.8 > 15.4 = 2.2 < 9.8 = 5.6 > 10.8 = 4.6 > 9.8 = 1.0 < 4.13 (Rs) 4.04 (R.) 3.94 (R3) 3.75 (R 2) 4.04 (R.) 3.95 (R3 ) 3.75 (R2) 3.94 (R3 ) 3.75 (R2 ) 3.75 (R2)

Por el anlisis se observa que hay diferencias significativas entre todos los pares de medias con excepcin de la 3 y la 2 y la5 y la 1. En la figura 3-14 se muestra una grfica en la que esas medias que no son significativamente diferentes aparecen subrayadas. Observe que en este ejemplo la prueba del rango mltiple de Duncan y el mtodo LSD llevan a conclusiones idnticas.

JI,.
9.8

)'s.

Y z
16.4

y.
21.6

10.8

Figura 314 Resultados de la prueba de rango mltiple de Duncan.

102

CAPruLO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

En la prueba del rango mltiple de Duncan se requiere una diferencia observada ms grande para detectar pares significativamente diferentes de medias, cuando el nmero de medias incluidas en el grupo aumenta. De esta forma, en el ejemplo anterior R 2 = 3.75 (dos medias) mientras que R, = 3.94 (tres medias). Para dos medias, el valor crtico R 2 ser exactamente igual al valor LSD de la prueba t. Los valores r(l(p,f) de la tabla VII del apndice se eligen de tal modo que se obtenga un nivel de proteccin especificado. Es decir, cuando se comparan dos medias que estn p pasos aparte, el nivel de proteccin es ,(1 ~ a y -1, donde a es el nivel de significacin especificado para dos medias adyacentes. Por lo tanto, el ndice de error de reportar al menos una diferencia significativa incorrecta entre dos medias es 1- (1- a y-l, cuando el tamao del grupo esp. Por ejemplo, si a = 0.05, entonces 1- (1- 0.05)1 = 0.05 es el nivel de significacin para comparar el par de medias adyacentes, 1 - (1- 0.05)2 = 0.10 es el nivel de significacin para medias que estn un paso aparte, y as sucesivamente. En general, si el nivel de proteccin es a, las pruebas de las medias tienen un nivel de significacin que es mayor o igual que a. Por consiguiente, el procedimiento de Duncan tiene una gran potencia; es decir, es muy eficaz para detectar diferencias entre medias cuando existen diferencias reales. Por esta razn, la prueba del rango mltiple de Duncan es muy popular.
La prueba de Newman-Keuls Esta prueba fue creada por Newman [90]. Debido a que un inters renovado en la prueba de Newman fue generado por Keuls [64], al procedimiento se le llama la prueba de Newman-Keuls, Operacionalmente, el procedimiento es similar a la prueba del rango mltiple de Duncan, salvo porque las diferencias crticas entre las medias se calculan en una forma un tanto diferente. Especficamente, se calcula una serie de valores crticos K; =q(l(P,f)SYi, p=2, 3, ... , a (345)

donde q(l(P,f) es el punto porcentual a superior del rango studentizado para grupos de medias de tamao p y con/grados de libertad del error. Una vez que se calculan los valoresx, con la ecuacin 3-45, los pares de medias extremos en los grupos de tamao p se comparan conKp exactamente igual que en la prueba del rango mltiple de Duncan. Qu mtodo de comparacin por pares debe usarse? Ciertamente, una pregunta lgica en este punto es qu mtodo de comparacin por pares debe usarse. Desafortunadamente, no hay una respuesta precisa para esta pregunta, y los especialistas en estadstica estn con frecuencia en desacuerdo en cuanto a la utilidad de los diferentes procedimientos. Carmer y Swanson [24] han realizado estudios de simulacin Montecarlo con varios procedimientos de comparaciones mltiples, incluyendo algunos que no se han considerado aqu. Estos autores reportan que el mtodo de la diferencia significativa mnima es una prueba muy eficaz para detectar diferencias reales en las medias si se aplica slo despus de que la prueba F en el anlisis de varianza sea significativa en 5%. Reportan asimismo un buen desempeo en la deteccin de diferencias reales con la prueba del rango mltiple de Duncan. Esto no es motivo de sorpresa, ya que estos dos mtodos son los ms poderosos de los que se han comentado aqu. Sin embargo, estos mtodos no incluyen el ndice de error en el modo del experimento. Debido a que el mtodo de Thkey efecta un control sobre el ndice de error global, muchos experimentadores prefieren su uso. La prueba de Newman-Keuls es ms conservadora que la prueba del rango mltiple de Duncan por cuanto a que el ndice de error tipo 1es menor. Especficamente, el error tipo 1 del experimento es a para todas las pruebas que incluyen el mismo nmero de medias. Por consiguiente, debido a que a es por lo ge neral bajo, la potencia de la prueba de Newman-Keuls casi siempre es menor que la de la prueba del rango mltiple de Duncan. Para demostrar que el procedimiento de Newman-Keuls lleva a una prueba con menor potencia que la prueba del rango mltiple de Duncan, se observa por una comparacin de las ta-

3-5 INTERPRETACIN PRCTICA DELOS RESULTADOS

103

blas VII YVIII del apndice queparap > 2se tieneqa(PJ) > ra(p,f). Es decir, es "ms dificil" declararque un par de medias es significativamente diferente al utilizar la prueba de Newman-Keuls que cuando se usa el procedimiento de Duncan, Esto se ilustra a continuacin para el caso en que a = 0.01, a = 8 Y = 20: f
p

4.02 4.02

3 4.22 4.64

4
4.33

5.02

5 4.40 5.29

4.47 5.51

4.53

5.69

8 4.58 5.84

Como se seal antes, existen otros procedimientos de comparaciones mltiples. Algunos artculos que describen estos mtodos son los de Miller [78], O'Neill y Wetherill [91] YNelson [89]. Thmbin se recomienda el libro de Miller [77].

3..5.8

Comparacin de medias de tratamientos con un control

En muchos experimentos, uno de los tratamientos es un control, y el analista se interesa en comparar cada una de las medias de los a -1 tratamientos restantes con el control. Por lo tanto, slo es necesario hacer a - 1 comparaciones. Un procedimiento para hacer estas comparaciones ha sido desarrollado por Dunnett [42]. Suponga que el tratamiento a es el control y que quieren probarse las hiptesis

tt..,

=..tQ

H1:..t:;t: ..tQ

para i = 1, 2, ..., a - 1. El procedimiento de Dunnett es una modificacin de la prueba t comn. Para cada hiptesis se calculan las diferencias observadas en las medias muestrales

i = 1, 2, ... , a-l
La hiptesis nula Ho:..t

= ..t.

se rechaza utilizando un ndice a de error tipo I si

Iy - Y I>da(a-l,f) ..
.

MSE(~+~) n n.

(3-46)

donde la constante dia -l,f) se da en la tabla IX del apndice. (Pueden hacerse pruebas tanto de una como de dos colas.) Observe que a es el nivel de significacin conjunto asociado con las a -1 pruebas.

EJEMPLO 3~lO

,.

Para ilustrar la prueba de Dunnett, considere el experimento del ejemplo 3-1, asumiendo que el tratamiento S es el control. En este ejemplo, a = 5, a -1 = 4,f = 20 Yn = n = 5. Con el nivel de S%, en la tabla IX del apndice se encuentra que do.os(4, 20) = 2.6S. Por lo tanto, la diferencia crtica es
do.os(4,

20)~2~SE = 2.6S~2(8;06) = 4.76

(Observe que se trata de una simplificacin de la ecuacin 346 que resulta de un diseo balanceado.) Por lo tanto, cualquier media de los tratamientos que difiera del control por ms de 4.76 se declarara significativamente diferente. Las diferencias observadas son 1 vs. 5: Yl. 2 vs. 5: Y2. 3 vs. S: Y3. 4 vs. 5: Y4.

- Ys. - Ys. - Ys. - Ys_

= 9.8 - 10.8= = lS.4 - 10.8= = 17.6 - 10.8= = 21.6 ~ 10.8=

-1.0 4.6 6.8 10.8

104

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Slo las diferenciasji, -Y5. YY4. -Y5. indican alguna diferencia significativa cuando se comparan con el control; por lo tanto, se concluye que #3 ;t: #5 Y#4 ;t: 115' Cuando se hace la comparacin de los tratamientos con un control, una buena idea es usar ms observaciones para el tratamiento de control (por ejemplo, na) que para los dems tratamientos (por ejemplo, n), suponiendo un nmero igual de observaciones para los a - 1 tratamientos restantes. El cociente naln deber elegirse de tal modo que sea aproximadamente igual a la raz cuadrada del nmero total de tratamientos. Es decir, se elige nfn "'= ,
111
~III

3..6

MUESTRA DE SALIDA DE COMPUTADORA

Hay una gran cantidad de programas de computadora para apoyar el diseo experimental y la realizacin de anlisis de varianza. En la figura 315 se muestra la salida de uno de estos programas, Design-Expert, utilizando los datos del experimento con un solo factor del ejemplo 3-1.La suma de cuadrados correspondiente al "Modelo" ("Model") es la SSnatamientos usual de un diseo con un solo factor. Esa fuente se identifica adicionalmente como ''A''. Cuando hay ms de un factor en el experimento, la suma de cuadrados ("Sum of Squares") del modelo se descompondr en varias fuentes (A,B, etc.). Observe que el resumen del anlisis de varianza de la parte superior de la salida de computadora contiene las sumas de cuadrados, los grados de libertad ("DF", degrees offreedom), los cuadrados medios ("Mean Square") y el estadstico de pruebaF ("F Value") acostumbrados. La columna "Prob > F" es el valor P (de hecho, el lmite superior del valor p, ya que a las probabilidades menores que 0.0001 se les asigna el valor por omisin 0.0001). Adems del anlisis de varianza bsico, el programa presenta informacin adicional til. La cantidad "R cuadrada" ("R-Squared") se define como R2 "'= SSModelo "'= 475.76 = 0.746923 SSTotaJ 636.96 y se interpreta en trminos generales como la proporcin de la variabilidad en los datos "explicada" por el modelo del anlisis de varianza. Por lo tanto, en los datos para probar la resistencia de la fibra sinttica, el factor "peso porcentual del algodn" explica cerca de 74.69% de la variabilidad en la resistencia a la tensin. Evidentemente, debe tenerse O:S R 2 :S 1, siendo ms deseables los valores ms grandes. En la salida se presentan tambin otros estadsticos en R 2 R 2 "ajustada" ('~dj R-Squared") es una variante del estadstico R 2 comn que refleja el nmero de factores presentes en el modelo. Puede ser un estadstico til en experimentos ms complejos en los que intervienen varios factores en el diseo, cuando quiere evaluarse el impacto de aumentar o disminuir el nmero de trminos del modelo. "Desviacin estndar" ("Std. Dev.") es la raz cuadrada del cuadrado medio del error, v'8.060 "'= 2.839, y "c.v" es el coeficiente de variacin, definido como (.J MS E I Y)100. El coeficiente de variacin mide la variabilidad no explicada o residual de los datos como un porcentaje de la media ("Mean") de la variable de respuesta. "PRESS" son Ias siglas de Prediction Error Sum ofSquares (suma de cuadrados del error de prediccin) y es una medida de la adecuacin con que es posible que el modelo del experimento predecir las respuestas en un nuevo experimento. Son deseables valores pequeos de PRESS. Alternativamente, puede calcularse una R 2 para predicciones con base en PRESS (ms adelante se indicar cmo hacer esto). Esta R;'ed ("Pred R-Squared") para el problema tratado aqu es 0.6046, el cual no es irrazonable, considerando que el modelo explica cerca de 75% de la variabilidad del experimento en curso. El estadstico "Prediccin adecuada" ('~deq Precision") se calcula dividiendo la diferencia entre la respuesta predicha mxima y la respuesta predicha mnima por la desviacin estndar promedio de todas las respuestas predichas. Son deseables valores grandes de esta cantidad, y los valores que exceden cuatro indican por 10 general que el modelo tendr un desempeo razonable en la prediccin.

Utilice el mouse para posicionarse en una celda y su definicin.

Response: Strength in psi ANOVA for Selected Factorial Model Analys$ of variance table [Partial sum of squares] Source
Model

A
Residual

LackofFit Pure Error


CarTetal

Sumof Squares 475.76 475.76 161.20 0.000 161.20 636.96

DF 4 4 20 O 20 24

Mean Square 118.94 118.94 8.06 8.06

F Value 14.76 14.76

Prob> F <0.0001 <0.0001

sgnificativ.o

El valor F del Modelo de 14.76implica que el modelo es significativo. Slo hay una probabilidad de

0.01 % de que un "Valor F del Modelo" de esta magnitud pudiera ocurrir debido a Nido.
Los valores de "Prob > P' menores que 0.0500 indican que los trminos del modelo son significativos. En este caso A son trminos significativos del modelo. Los valores mayores que 0.1000 indican que los trminos del modelo no son significativos. Si hay muchos trminos del modelo no significativos (sin contar los que se necesitan para apoyar la jerarquizacin), la reduccin del modelo puede mejorarlo. Std.Oev. Mean

C.V.
PRESS

2.84 15.04 18.88 251.88

R-Squared Adj R-Squared Pred R-Squared Adeq Precision

0.7469 0.6963 0.6046 9.294

La "R cuadrada predicha" de 0.6046concuerda razonablemente con la "R cuadrada ajustada" de 0.6983. Una diferencia mayor que 0.20 entre la 1t cuadrada predicha" y la 1t cuadrada ajustada" indica un posible problema con el modelo y/o los datos.
"Precisin adecuada" mide la relacin de la seal a Nido. Es deseable una relacin mayor que 4. la relacin de 9.294 indica una seal adecuada para usar este modelo para navegar el espacio del diseo.

Treatment Meana (Adjusted, l1F NecBSlary) EstImateel Stenclard Mean Error 9.80 1.27 1-15 15.40 1.27 2-20 17.60 1.27 3-26 21.60 1.27 4-30 10.80 1.27 5-35 Treatment 1 vs 2 1 vs 3 1 vs 4 1 vs 5
2 vs 3

Mean Difference -5.60 -7.80 -11.80


~1.00

DF
1

1 1
1

2 vs4
2 vs 5

3 vs4
3 vs 5
4vs 5

-2.20 -6.20 4.60 -4.00


6.80

10.80

1 1 1 1 1 1

Standard Error 1.80 1.80 1.80 1.80 1.80


1.80

1.80 1.80 1.80 1.80

tfor Ha Coeff=O -3.12 -4.34 -6.67 -0.66 -1.23 -3.45 2.56 -2.23 3.79 6.01

Prob> Itl 0.0054 0.0003 <0.0001 0.5838 0.2347 0.0025 0.0186 0.0375 0.0012 <0.0001

Los valores de "Prob > Iti" menores que 0.0500 indican que la diferencia en las medias de los dos tratamientos es significativa. Los valores de "Prob > Iti" mayores que 0.1000 indican que la diferencia en las medias de los dos tratamientos no es significativa.

Figura 315 Salida de computadora de Design-Expert para el ejemplo 3-1.

106

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANLISIS DEVARIANZA

Diagnostic Case Statistlcs Standard Actual Predlcted Order Value Value

Residual Leverage

Student Cook's Residual Dlstance Outller t

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

7.00 7.00 15.00 11.00 9.00 12.00 17.00 12.00 18.00 18.00 14.00 18.00 18.00 19.00 19.00 19.00 25.00 22.00 19.00 23.00 7.00 10.00 11.00 15.00 11.00

9.80 9.S0 9.80 9.80 9.80 15.40 15.40 15.40 15.40 15.40 17.60 17.60 17.60 17.60 17.60 21.60 21.60 21.60 21.60 21.60 10.80 10.80 10.80 10.80 10.80

-2.80 -2.80 5.20 1.20 -0.80 -3.40 1.60 -3.40 2.60 2.60 -3.60 0.40 0.40 1.40 1.40 -2.60 3.40 0.40 -2.60 1.40 -3.80 -0.80 0.20 4.20 0.20

0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200 0.200

-1.103 -1.103 2.048 0.473 -0.315 -1.339 0.630 -1.339 1.024 1.024 -1.418 0.158 0.158 0.551 0.551 -1.024 1.339 0.158 -1.024 0.561 -1.496 -0.316 0.079 1.664 0.079

0.061 0.061 0.210 0.011 0.006 0.090 0.020 0.090 0.052 0.052 0.100 0.001 0.001 0.015 0.015 0.052 0.090 0.001 0.052 0.015 0.112 0.005 0.000 0.137 0.000

.,....1.109 -1.109 2.245 0.463 -0.308 -1.368 0.620 -1.368 1.026 1.025 -1.457 0.154 0.154 0.542 0.542 -1.025 1.368 0.154 -1.025 0.642 -1.548 -0.30S 0.077 1.735 0.077

Proceder con las grficas de dla;nstico (el icono siguiente en progresin). Asegurarse de examinar: 1) La grfica de probabilidad normal de los residuales studentizados para verificar la normalidad de los residuales. 2) Los residuales studentizados contra los valores predichos para verificar la constante del error. 3) Los puntos atpicos t contra el orden de las corridas para buscar puntos atpicos. es decir. valores influyentes o importantes 4) La grfica de Box-Cox para las transformaciones de potencia. Si todos los estadsticos del modelo y las grficas de diagnstico estn correctos. finalizar con el icono Model Graphs (Grficas del Modelo).

Figura 315

(Continuacin.)

Se hace la estimacin de las medias ("Estimated Mean") de los tratamientos y se muestra el error estndar ("Standard Error") (o desviacin estndar muestra1 de la media de cada tratamiento, .J MSt Las diferencias entre pares de medias ("Mean Difference") de los tratamientos se investigan utilizando el mtodo LSD de Fisher descrito en la seccin 3 El programa de computadora tambin calcula y despliega los residuales, segn se definen en la ecuacin 316. El programa producir tambin todas las grficas de los residuales que se comentaron en la seccin 34. En la salida se muestran asimismo varios diagnsticos residuales ms. Algunos de ellos se revisarn ms adelante. Por ltimo, observe que el programa de computadora incluye tambin algunas guas para hacer la interpretacin. Esta informacin "aconsejable" es muy comn en muchos paquetes de estadstica para computadoras personales. Al leer estas guas, recuerde que estn escritas en trminos muy generales, y quiz no se ajusten exactamente a los requerimientos de redaccin del reporte de un experimentador particular. Esta salida aconsejable puede ser eliminada por el usuario.
MS.7.

37 DETERMINACIN DELTAMAODE LAMUESTRA

107

3..7

DETERMINACIN DEL TAMAO DE LA MUESTRA

En cualquier problema de diseo experimental, una decisin crtica es la eleccin del tamao de la muestra; es decir, determinar el nmero de rplicas que deben correrse. En general, si el experimentador tiene inters en detectar efectos pequeos, se necesitan ms rplicas que cuando el experimentador se-interesa en detectar efectos grandes. En esta seccin se analizan varios enfoques para determinar el tamao de la muestra. Aun cuando la revisin se centra en un diseo con un solo factor, la mayora de los mtodos pueden usarse en situaciones experimentales ms complejas.

3..7.1

Curvas de operacin caracterstica

Recuerde que una CU"8 de operacn caraeterstca es una grfica de la probabilidad del error tipo 11 de una prueba estadstica para un tamao de la muestra particular contra un parmetro que refleja la medida en que la hiptesis nula es falsa. El experimentador puede usar estas curvas como gua en la seleccin del nmero de rplicas para que el diseo sea sensible a diferencias potenciales importantes en los tratamientos. Se considera la probabilidad del error tipo 11 del modelo con efectos fijos para el caso en que se usa el mismo tamao de las muestras en cada tratamiento, por ejemplo

fJ =1- p{Rechazar H 01 H o es falsa}

= 1- p{ F > Fa,.-l,N-.1 H

(3-47)

es falsa}

Para evaluar el enunciado de probabilidad de la ecuacin 3-47, es necesario conocer cul es la distribucin del estadstico de prueba F si la hiptesis nula es falsa. Puede demostrarse que, si H es falsa, el estadstico F = MSnawmentolMSE se distribuye como una variable aleatoria F no central con a - 1 y N - a grados de libertad y parmetro de no centralidad O. Si o = O, la distribucinF no central se convierte en la distribucin F (central) comn. Las curvas de operacin caracterstica que se presentan en la parte V del apndice se usan para evaluar el enunciado de probabilidad de la ecuacin 3-47. En estas curvas se grafica la probabilidad del error tipo 11 (/3) contra un parmetro <1>, donde

(3-48) La cantidad <1>2 est relacionada con el parmetro de no centralidad . Se cuenta con curvas para a = 0.05 y a = 0.01 y un rango de grados de libertad para el numerador y el denominador. Al usar las curvas de operacin caracterstica, el experimentador debe especificar el parmetro <1>. Con frecuencia es difcil hacer esto en la prctica. Una manera de determinar <1> es elegir los valores reales de las medias de los tratamientos para los que querra rechazarse la hiptesis nula con una alta probabilidad. Por lo tanto, Si#1'#2' ...,#. son las medias de los tratamientos especificadas, la ti de la ecuacin 3-48 se encuentra como ti = #i - ji, donde = (l/a )I~=l = .ties el promedio de las medias de los tratamientos individuales. Se requiere asimismo una estimacin de lT. En ocasiones se cuenta con este valor por experiencia previa, un experimento anterior o una prueba preliminar (como se sugiri en el captulo 1), o por una estimacin discrecional. Cuando no se tiene la seguridad acerca del valor de a', los tamaos de las a fin de estudiar el efecto de este muestras podran determinarse para un rango de valores posibles de parmetro sobre el tamao de la muestra requerido, antes de hacer la eleccin final.

er,

108

CAPTULO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

EJEMPLO 3-11

..

Considere el experimento de la resistencia a la tensin descrito en el ejemplo 3-1. Suponga que el experimentador est interesado en rechazar la hiptesis nula con una probabilidad de al menos 0.90 si las medias de .Ios cinco tratamientos son
,ul=11 ,u2=12 ,u3=15 ,u4=18
y

,us=19

Planea utilizar a = 0.01. En este caso, puesto que I:.~"'I,u1 = 75, se tiene = (1/5)75 = 15 Y
f 1 f 2
f 3

=,ul-;U=11-15=-4 =,u2 -;U = 12-15=-3

= ,u 3

;U = 15-15 =

r 4 = ,u 4
f

;U = 18-15 = s =,us-;U=19-15=

O 3 4

Por lo tanto, I:.~"'1 = 50. Suponga que el experimentador piensa que la desviacin estndar de la resistencia a la tensin con cualquier nivel particular del peso porcentual del algodn no ser mayor que a=3 psi. Entonces, al utilizar la ecuacin 3-48, se tiene

f;

Se usa la curva de operacin caracterstica para a - 1 = 5 -1 = 4 con N - a = a(n - 1) = 5(n - 1) grados de libertad del error y a = 0.01 (ver la parte V del apndice). Como primera conjetura para el tamao de la 2 muestra requerido, se prueba con n = 4 rplicas. Esto produce w = 1.11(4) = 4.44, W = 2.11 Y5(3) = 15 grados de libertad del error. Por consiguiente, en la parte V se encuentra que P=0.30. Por lo tanto, la potencia de la prueba es aproximadamente 1-f3 = 1- 0.30 = 0.70, que es menor que el 0.90 requerido, por lo que se concluye que n = 4 rplicas no son suficientes. Procediendo de manera similar, puede construirse la siguiente tabla:
n
4
a(n -1)

Potencia (1 - /3)
0.30 0.15 0.04 0.70 0.85

5 6

4.44 5.55 6.66

2.11
2.36 2.58

15

20 25

0.96

Por lo tanto, deben realizarse al menos n =6 rplicas para ootener una prueba con la potencia requerida. El nico problema con este enfoque para usar las curvas de operacin caracterstica es que por lo general es difcil seleccionar el conjunto de las medias de los tratamientos en el que se basar la decisin del tamao de la muestra. Un enfoque alternativo es seleccionar un tamao de la muestra tal que si la diferencia entre las medias de dos tratamientos cualesquiera excede un valor especificado, la hiptesis nula deber rechazarse. Si la diferencia entre las medias de dos tratamientos cualesquiera es tan grande como D, pue2 de demostrarse que el valor mnimo de w es

w2 = nD

Zao?

3-7 DETERMINACIN DELTAMAO DE LA MUESTRA

109

Puesto que ste es un valor mnimo de <1>2, el tamao de la muestra correspondiente que se obtiene de la curva de operacin caracterstica es un valor conservador; es decir, proporciona una potencia al menos tan grande como la que especific el experimentador. Para ilustrar este enfoque, suponga que en el.experimento de la resistencia a la tensin del ejemplo 3-1, el experimentador quisiera rechazar la hiptesis nula con una probabilidad de al menos 0.90 si las medias de dos tratamientos cualesquiera difieren hasta en 10 psi. Entonces, suponiendo que a =3 psi, se encuentra que el valor minimo de <1>2 es
<1>2 = n(lO) 2

2(5)(3 2 )

= 1.Un

y, por el anlisis del ejemplo 3-11, se concluye que se necesitan n = 6 rplicas para obtener la sensibilidad deseada cuando a = 0.01.

3..7.2

Especificacin de un incremento de la desviacin estndar

Este enfoque es til en ocasiones para elegir el tamao de la muestra. Si las medias de los tratamientos no difieren, la desviacin estndar de una observacin elegida al azar es a. Sin embargo, si las medias de los tratamientos son diferentes, la desviacin estndar de una observacin elegida al azar es

Si se escoge un porcentaje P para el incremento de la desviacin estndar de una observacin, ms all del cual quiera rechazarse la hiptesis de que las medias de todos los tratamientos son iguales, esto es equivalente a escoger

+(! r; /a)
,0.1

=1+0.01P (P=porciento)

(. r; )
la
"'1

= ~(1+0.01P)2-1

de donde

al-J

~(1+0.01P)2 -1(-J)

(3-50)

Por lo tanto, para un valor especificado de P, <1> puede calcularse con la ecuacin 3-50 y despus usar las curvas de operacin caracterstica de la parte V del apndice para determinar el tamao de la muestra requerido.

110

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Por ejemplo, en el experimento de la resistencia a la tensin del ejemplo 3-1, suponga que se desea detectar un incremento de la desviacin estndar de 20% con una probabilidad de al menos 0.90 ya=: 0.05. Entonces

<1>= ~(1.2)2 -1(.J) = 0.66.J


La referencia a las curvas de operacin caracterstica indica que se necesita n lidad deseada. 3 ..7.3 Mtodo para estimar el intervalo de confianza

=9 para obtener la sensibi-

En este enfoque se supone que el experimentador quiere expresar los resultados finales en trminos de intervalos de confianza y que est dispuesto a especificar por anticipado cul es el ancho que desea para estos intervalos de confianza. Por ejemplo, suponga que en el experimento de la resistencia a la tensin del ejemplo 31 se quiere que un intervalo de confianza de 95% para la diferencia en la resistencia a la tensin media de dos pesos porcentuales del algodn cualesquiera sea 5 psi y una estimacin previa de a es 3. Entonces, al utilizar la ecuacin 3-13, se encuentra que la precisin del intervalo de confianza es
tn.s- ~2MSE -n-

Suponga que se prueba con n = 5 rplicas. Entonces, al usar a2 = 32 = 9 como una estimacin de MSE' la precisin del intervalo de confianza es

2.086~~) "" 3.96


que es ms preciso que el requerimiento. Al probar con n

= 4 se obtiene

2132~~) =4.52
Al probar con n

= 3 se obtiene

2.22~~) = 5.46
Evidentemente, n = 4 es el tamao de la muestra menor que llevar a la precisin deseada. El nivel de significacin consignado en el ejemplo anterior se aplica a un solo intervalo de confianza. Sin embargo, puede usarse el mismo enfoque general si el experimentador desea especificar de antemano un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza simultneo o conjunto (ver los comentarios acerca de los intervalos de confianza simultneos de la seccin 3-3.3). Adems, los intervalos de confianza podran construirse con respecto a contrastes ms generales en las medias de los tratamientos, que la comparacin por pares ilustrada antes.

3..8

IDENTIFICACIN DE EFECTOS DE DISPERSIN

Nos hemos enfocado aqu en el uso del anlisis de varianza y de otros mtodos relacionados para determinar los niveles del factor que resultan.en diferencias entre las medias de los tratamientos o los niveles del factor. Se acostumbra referirse a estos efectos como efectos de localizacin. Cuando ocurri la desigual-

3-8 IDENTIFICACIN DE EFECTOS DE DISPERSIN

111

Tabla 3.12 Datos del experimento de fundicin Algoritmo para controlar la proporcin Observaciones

1
4.93(0.05) 4.85(0.04) 4.83(0.09) 4.89(0.03)

2 4.86(0.04) 4.91(0.02) 4.88(0.13) 4.77(0.04)

3 4.75(0.05) 4.79(0.03) 4.90(0.11) 4.94(0.05)

4 4.95(0.06) 4.85(0.05) 4.75(0.15) 4.86(0.05)

5 4.79(0.03) 4.75(0.03) 4.82(0.08) 4.79(0.03)

6 4.88(0.05) 4.85(0.02) 4.90(0.12) 4.76(0.02)

1
2 3 4

dad de la varianza con los diferentes niveles del factor, se utilizaron transformaciones para estabilizar la varianza y mejorar as las inferencias hechas sobre los efectos de localizacin. Sin embargo, en algunos problemas el inters se centra en descubrir si los diferentes niveles del factor afectan la variabilidad; es decir, el inters est en descubrir efectos de dispersin potenciales. Esto ocurrir siempre que la desviacin estndar, la varianza o cualquier otra medida de la variabilidad se use como variable de respuesta: Para ilustrar estos conceptos, considere los datos de la tabla 3-12, los cuales se obtuvieron de un experimento diseado en una fundicin de aluminio. El aluminio se produce combinando almina con otros ingredientes en una celda de reaccin y aplicando calor al hacer pasar una corriente elctrica a travs de la celda. La almina se agrega de manera continua a la celda para mantener la proporcin apropiada de la misma con respecto a los otros ingredientes. En este experimento se investigaron cuatro algoritmos para controlar la proporcin. Las variables de respuesta estudiadas se relacionaron con el voltaje de la celda. Especficamente, un sensor registra el voltaje de la celda varias veces cada segundo, produciendo miles de mediciones del voltaje durante cada corrida del experimento. Los ingenieros del proceso decidieron usar como variables de respuesta el voltaje promedio y la desviacin estndar del voltaje de la celda (indicado entre parntesis) en la corrida experimental. El voltaje promedio es importante porque afecta la temperatura de la celda, y la desviacin estndar del voltaje (llamada "ruido del crisol" por los ingenieros del proceso) es importante porque afecta la eficiencia global de la celda. Se llev a cabo un anlisis de varianza para determinar si los diferentes algoritmos para controlar la proporcin afectan el voltaje promedio de la celda. ste revel que el algoritmo para controlar la proporcin no tuvo ningn efecto de localizacin; es decir, al cambiar los algoritmos para controlar la proporcin no hubo ningn cambio en el voltaje promedio de la celda. (Referirse al problema 3-28.) Para investigar los efectos de dispersin, lo mejor suele ser utilizar log(s) o log(s 2) como variable de respuesta, ya que la transformacin logartmica es eficaz para estabilizar la variabilidad en la distribucin de la desviacin estndar muestral, Puesto que todas las desviaciones estndar del voltaje del crisol son menores que la unidad, se usar

y= -ln(s)
como la variable de respuesta. En la tabla 313 se presenta el anlisis de varianza para esta respuesta, el logaritmo natural del "ruido del crisol". Observe que la eleccin de un algoritmo para controlar la proporcin afecta el ruido del crisol; es decir, el algoritmo para controlar la proporcin tiene un efecto de disTabla 313 Anlisis de varianza del logaritmonatural del ruido del crisol Fuente de variacin Algoritmo para controlar la proporcin Suma de cuadrados 6.166 1.872 8.038 Grados de libertad Cuadrado medio 2.055 0.094 21.96 Valor P <0.001

Error
Thtal

3 20 23

112

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: ELANLISIS DEVARIANZA

3 2.00

4
3.00

4,00

Ruido del crlsol loqarltmico promedio [-1n (sil

Figura 316 Ruido del crisol logartmico promedio [-ln(s)] de cuatro algoritmos para controlar la proporcin en relacin con una distribucin t escalada con factor de escalamiento ,j MS E/n ""
"'0.094/ 6 ""0.125.

persi6n. Las pruebas estndares de la adecuacin del modelo, incluyendo las grficas de probabilidad normal de los residuales, indican que no hay problemas con la validez del experimento. (Referirse al problema 3-29.) En la figura 3-16 se grafica el logaritmo promedio del ruido del crisol de cada algoritmo para controlar la proporcin y se presenta tambin una distribucin t escalada que se usa como distribucin de referencia para discriminar entre los algoritmos de la proporcin. Esta grfica revela con toda claridad que el algoritmo 3 para controlar la proporcin produce ms ruido del crisolo una desviacin estndar del voltaje de la celda mayor que los otros algoritmos. No parece haber gran diferencia entre los algoritmos 1, 2 Y 4.

3..9

EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

Se ha ofrecido un desarrollo intuitivo o heurstico del anlisis de varianza. Sin embargo, es posible presentar un desarrollo ms formal. El mtodo ser de utilidad ms adelante para entender los fundamentos del anlisis estadstico de diseos ms complejos. Llamada la prueba general de significacin de la regresin, el procedimiento consiste en esencia en encontrar la reduccin en la suma de cuadrados total para ajustar el modelo con todos los parmetros incluidos y la reduccin en la suma de cuadrados cuando el modelo se restringe a la hiptesis nula. La diferencia entre estas dos sumas de cuadrados es la suma de cuadrados de los tratamientos con la que puede realizarse la prueba de la hiptesis nula. El procedimiento requiere los estimadores de mnimos cuadrados de los parmetros en el modelo del anlisis de varianza. Se dieron ya (en la seccin 3-3.3) las estimaciones de estos parmetros; sin embargo, ahora se presenta un desarrollo formal.

3..9.1

Estimacin de nnimos cuadrados de los parmetros del modelo

Se desarrollan ahora los estimadores de los parmetros en el modelo con un solo factor

ti'

utilizando el mtodo de mnimos cuadrados. Para encontrar los estimadores de mnimos cuadrados de fJ- y primero se forma la suma de cuadrados de los errores

3-9 ELENFOQUE DEREGRESIN PARAEL ANLISIS DEVARlANZA

113

y se eligen despus los valores de ,ty TI' por ejemplo p,y ti' que minimicen L. Los valores adecuados seran las soluciones de las o + 1 ecuaciones simultneas

a,t

aLI -o
'.i:i

aT I

aLI
J ..r

=0

i = 1, 2,... ,
Ti

Al derivar la ecuacin 3-51 con respecto a # y

Y al igualar con cero se obtiene

-2!
i'~l

(Yij-p,-fl)=O

i = 1, 2,... , o

de la que, despus de simplificar, se obtiene Np, + nf I + nf 2 + ... + nf = Y..


d

np,+nf 1 np, np, +nf 2

= Yl = Y2.

(3-52)

A las o + 1 ecuaciones (ecuacin 3-52) con o + 1 incgnitas se les llama las ecuaciones normales de mnimos cuadrados. Observe que si se suman la ltimas o ecuaciones normales, se obtiene la primera ecuacin normal. Por lo tanto, las ecuaciones normales no son linealmente independientes, y no existe una solucin nica paran, TI' ..., Td Esta dificultad puede superarse mediante varios mtodos. Puesto que los efectos de los tratamientos se han definido como desviaciones de la media global, parece razonable aplicar la restriccin

(3-53)
Utilizando esta restriccin, se obtiene como solucin de las ecuaciones normales p, = Y..
fl

= YI- - Y ..

i=1,2, ... , 0

Evidentemente, esta solucin no es nica y depende de la restriccin (ecuacin 3-53) que se ha elegido. Al principio esto puede parecer desafortunado porque dos experimentadores diferentes podran analizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. Sin embargo, ciertas funciones del parmetro del modelo son estimadas de manera nica, independientemente de la restriccin. Algunos ejemplos son TI - Ti' que se estimara con f i - f j YI. - y}.:, y la media del tratamiento i-simo #1 # + TI' que se estimara con P, I P, + ti YI.: Puesto que el inters se encuentra generalmente en las diferencias entre los efectos de los tratamientos y no en sus valores reales, no produce preocupacin alguna que TI no pueda estimarse de manera n-

114

CAPTULO 3

EXPERlMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

ca. En general, cualquier funcin de los parmetros del modelo que sea una combinacin lineal del miembro del lado izquierdo de las ecuaciones normales (ecuaciones 3-52) puede estimarse de manera nica. A las funciones que se estiman de manera nica independientemente de la restriccin que se use se les llama funciones estimables. Para ms informacin, ver el material suplementario del texto de este captulo.Nos encontramos listos para usar estas estimaciones de los parmetros en un desarrollo general del anlisis de varianza.

3 ..9.2

Prueba general de significacin de la regresin

Una parte fundamental de este procedimiento es escribir las ecuaciones normales del modelo. Estas ecuaciones siempre podrn obtenerse formando la funcin de mnimos cuadrados y derivndola con respecto a cada parmetro desconocido, como se hizo en la seccin 3-9.1. Sin embargo, se cuenta con un mtodo ms sencillo. Las reglas siguientes permiten escribir directamente las ecuaciones normales del modelo de cualquier diseo experimental:

REGLA 1. Hay una ecuacin normal para cada parmetro del modelo que va a estimarse. REGLA 2. El miembro derecho de cualquier ecuacin normal es slo la suma de todas las observaciones que contienen el parmetro asociado con esa ecuacin normal particular. Para ilustrar esta regla, considere el modelo con un solo factor. La primera ecuacin normal corresponde al parmetro p.; por lo tanto, el miembro derecho es Y.., ya que todas las observaciones incluyen a p.. REGLA 3. El miembro izquierdo de cualquier ecuacin normal es la suma de todos los parmetros del modelo, donde cada parmetro est multiplicado por el nmero de veces que aparece en el total del miembro derecho. Los parmetros se escriben con un acento circunflejo r) para indicar que son estimadores y no los verdaderos valores de los parmetros.
Por ejemplo, considere la primera ecuacin normal en un experimento con un solo factor. De acuerdo con las reglas anteriores, sta sera

porque f.J. aparece en las N observaciones, tI slo aparece en las n observaciones hechas bajo el primer tratamiento, t 2 aparece slo en las n observaciones tomadas bajo el segundo tratamiento, etc. Por la ecuacin 3-52 se verifica que la ecuacin presentada arriba es correcta. La segunda ecuacin normal correspondera a tI Y es

porque slo las observaciones del primer tratamiento contienen a tI (esto day como miembro derecho), p. y tI aparecen exactamente n veces eny., y todas las dems ti aparecen cero veces. En general, el miembro izquierdo de cualquier ecuacin normal es el valor esperado del miembro derecho. Ahora bien, considere encontrar la reduccin en la suma de cuadrados ajustando un modelo particular a los datos. Al ajustar un modelo a los datos se "explica" parte de la variabilidad; es decir, la variabilidad no explicada se reduce en cierta cantidad. La reduccin en la variabilidad no explicada es siempre la suma de las estimaciones de los parmetros, cada una de ellas multiplicada por el segundo miembro de la

3-9 ELENFOQUE DE REGRESIN PARAELANLISIS DEVARIANZA

115

ecuacin normal que corresponde al parmetro especfico. Por ejemplo, en un experimento con un solo factor, la reduccin debida al ajuste del modelo completo Yij = /1- + t + E ij es
R(jt,
'r)=

'Y.. +r1Yt +r 2 Y 2. + ... +raya.

=PY.. +

(3-55)
riyi.

I~l

La notacinR(u, r) significa la reduccin en la suma de cuadrados a partir del ajuste del modelo que contiene a /1- y {r}. A R(u, r) se le llama en ocasiones la suma de cuadrados "de regresin" del modelo como pleto Yij = # + t, + fijO El nmero de grados de libertad asociado con una reduccin en la suma de cuadrados, tal como R(u, r), siempre es igual al nmero de ecuaciones normales linealmente independientes. El resto de la variabilidad no explicada por el modelo se encuentra con
SSE

!! y: ~l j~l

R(#, r)

(3-56)

Esta cantidad se usa en el denominador del estadstico de prueba de HO:T1 = 'r 2 = ... = 'ra = O. A continuacin se ilustra la prueba general de significacin de la regresin para un experimento con un solo factor y se demuestra que produce el anlisis de varianza de un solo factor comn. El modelo es Yij = # + t, + Eij , y las ecuaciones normales se encuentran con las reglas anteriores como
Nft + nf1+ nf 2+ ... + nr a nft+nf 1 nji +nr 2 nft

= Y.. = Yl =h

Compare estas ecuaciones normales con las que se obtuvieron en la ecuacin 3-52. Al aplicar la restriccin ~ ~~l f 1 = O, los estimadores de # y Ti son
ji= Y ..
:;,
'i

= Yi.

Y.

i=l,2, ... ,a

La reduccin en la suma de cuadrados debida al ajuste de este modelo completo se encuentra con la ecuacin 355 como

= U.. )Y..

(Ji. - Y )Y. ..

- - - - - - - - - - - - - - - - - - - _... _.. _._---_._-_.-

116

CAPTIlLO 3

EXPERIMENTOSCON UN SOLO FACTOR: EL ANUSIS DE VARIANZA

que tiene a grados de libertad porque haya ecuaciones normales linealmente independientes. La suma de cuadrados del error es, por la ecuacin 3-56,
SSE

= ~! Y~ ;-1 j-I

R(f.l, r)

y tiene N - a grados de libertad. Para encontrar la suma de cuadrados que resulta de los efectos de los tratamientos (el {rJ), se considera que el modelo se restringe a la hiptesis nula; es decir, t = Opara toda i. El modelo reducido es Y; = f.l + e;. Hay una sola ecuacin normal para este modelo:
Nl= Y..

y el estimador de f.l es l "" Y.' Por lo tanto, la reduccin en la suma de cuadrados que resulta de ajustar el modelo reducido que slo contiene a f.l es
R( ) .f.l -

o.x Y. )- L... Y. - N

Puesto que hay una sola ecuacin normal para este modelo reducido, R(.l) tiene un grado de libertad. La suma de cuadrados debida al {rJ, dado que /1 ya est incluida en el modelo, es la diferencia entre R(.l, r) Y R(.l), que es
R( ti f.l) "" R(/1, t)- R(f.l)

"" R(Modelo Completo)- R(Modelo Reducido)

"";;? Y;- ]V ,-1


con a - 1 grados de libertad, que por la ecuacin 3-9 se identifica como SSn.t.mientos' Estableciendo el supuesto de normalidad usual, el estadstico apropiado para probar H o: tI = t 2 "" "" ra "" O es
F.
o
:::E

R(tlf.l)/(a-l)

[a n

~# Y~ -R(f.l, r)

/(N-a)

que se distribuye como Fa-I,N-<J bajo la hiptesis nula. Se trata, desde luego, del estadstico de prueba para el anlisis de varianza de un solo factor.

3..10 3..10.1

MTODOS NO PARAMTRICOS EN EL ANLISIS DE VARIANZA


La prueba de Kruskal.. allis W

En situaciones en las que el supuesto de normalidad no est justificado, el experimentador quiz quiera usar un procedimiento alternativo del anlisis de varianza con la prueba F que no dependa de este su-

)10 MTODOS NO PARAMTRICOS ENELANUSIS DEVARIANZA

117

puesto. Kruskal y Wallis [68] han desarrollado este procedimiento. La prueba de Kruskal-Wallis se usa para probar la hiptesis nula de que los a tratamientos son idnticos contra la hiptesis alternativa de que algunos de los tratamientos generan observaciones que son mayores que otras. Debido a que el procedimiento est diseado para ser sensible al probar las diferencias en las medias, en ocasiones es conveniente considerar la prueba de Kruskal-Wallis como una prueba de la igualdad de las medias de los tratamientos. La prueba de Kruskal-Wallis es una alternativa no paramtrica del anlisis de varianza usual. Para realizar la prueba de K.ruskal-Wallis, primero se hace la clasificacin en rangos de lasy, observaciones en orden ascendente y cada observacin se reemplaza con su rango, por ejemplo Rj, asignndole a la observacin menor el rango 1. En el caso de empates (observaciones que tienen el mismo valor), se asigna el rango promedio a cada una de las observaciones empatadas. Sea R.la suma de los rangos del tratamiento i-simo. El estadstico de prueba es (3-57) donde n es el nmero de observaciones del tratamiento i-simo, N es el nmero total de observaciones y (3-58) Observe que S2 es slo la varianza de los rangos. Si no hay empates, S2 prueba se simplifica a

=N(N + 1)/12, Yel estadstico de


(3-59)

Cuando el nmero de empates es moderado, habr pequeas diferencias entre las ecuaciones 3-57 y 3-59, y puede usarse la forma ms simple (ecuacin 3-59). Si las n, son razonablemente grandes, por ejemplo n, ~ 5, H se distribuye aproximadamente como X bajo la hiptesis nula. Por lo tanto, si

;-1

H> X~ .- l
la hiptesis nula se rechaza. Tambin podra usarse el enfoque del valor P.

EJEMPLO 316112

111

111

111

111

111

En la tabla 3-14 se muestran los datos del ejemplo 3-1 y sus rangos correspondientes. Puesto que hay un nmero bastante grande de empates, la ecuacin 3-57 se usa como el estadstico de prueba. Por la ecuacin 3-58 se encuentra

S2

=~[!~
N 1 ~1 j~l

R:_

N(N+1)2] 4

= ~ [549779- 25(26)2]
24 . 4

= 53.03

118

CAPTlJLo 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

Tabla 314 Datos y rangos para el experimento de la resistencia a la tensin del ejemplo 3-1 Peso porcentual del algodn

15

20
Rlj

25
Rq Y3j R3 j Y4j

30
R4j YSj

35
RS j

YIj 7 7 15 11 9
R.

Yq

2.0 2.0 12.5 7.0 4.0 27.5

12 17 12 18 18

9.5 14.0 9.5 16.5 16.5 66.0

14 18 18 19 19

11.0 16.5 16.5 20.5 20.5 85.0

19 25 22 19 23

20.5 25.0 23.0 20.5 24.0 113.0

7
10

11 15 11

2.0 5.0 7.0 12.5 7.0 33.5

y el estadstico de prueba es
H'= - 1
'=

S2 i~l

[a Ri~ --N(N+l)2] L- - - -'- - - - - -' - - ni

_1_ [5245.0- 25(26)2] 4 5103 19.25

'=

Puesto que H> X~ 01 4,4 = 13.28, se rechazara la hiptesis nula y se concluira que los tratamientos difieren. (El valor PparaH ee 19.25 esP '= 0.0002.) Se trata de la misma conclusin obtenida por el anlisis de varianza usual con la prueba F
3~10.2

Comentarios generales sobre la transformacin de rangos

Al procedimiento utilizado en la seccin anterior de reemplazar las observaciones con sus rangos se le llama la transformacin de rangos. Es una tcnica muy poderosa y tiL Si se aplicara la prueba F comn a los rangos en lugar de a los datos originales, se obtendra
F '= H/(a-l) o (N-I-H)/(N-a)

(3-60)

como el estadstico de prueba (ver Conover [20], p. 337). Observe que cuando el estadstico H de Kruskal-Wallis se incrementa o decrementa, F tambin se incrementa o decrementa, por lo que la prueba de Kruskal-Wallis es equivalente a aplicar el anlisis de varianza comn a los rangos. La transformacin de rangos tiene una amplia aplicabilidad en los problemas de diseo experimental para los que no existe ninguna alternativa no paramtrica para el anlisis de varianza. Esto incluye muchos de los diseos de captulos subsecuentes de este libro. Si los datos estn en rangos y se aplica la pruebaF comn, el resultado es un procedimiento aproximado que tiene buenas propiedades estadsticas (ver Conover e Iman [30a, bj), Cuando existe preocupacin acerca del supuesto de normalidad o por el efecto de puntos atpicos o valores "absurdos", se recomienda que el anlisis de varianza comn se realice tanto en los datos originales como en los rangos. Cuando ambos procedimientos producen resultados similares, probablemente los supuestos del anlisis de varianza se satisfacen razonablemente, y el anlisis estndar es satisfactorio. Cuando los dos procedimientos difieren, deber darse preferencia a la transformacin de rangos, ya que es menos posible que sea distorsionada por una condicin de no normalidad o la presencia de observaciones inusuales. En tales casos, tal vez el experimentador quiera investigar el uso de transfor-

3-11 PROBLEMAS

119

maciones para la falta de normalidad y examinar los datos y el procedimiento experimental a fin de determinar si hay puntos atpicos y por qu han ocurrido.
3~11

PROBLEMAS
Se estudia la resistencia a la tensin del cemento portland. Pueden usarse econmicamente cuatro diferentes tcnicas de mezclado. Se han colectado los siguientes datos: Tcnica de mezclado Resistencia a la tensin (lb/pulg-) 3129 3200 2800 2600 3000 3300 2900 2700 2865 2975 2985 2600 2890 3150 3050 2765

3-1.

1
2

3 4

= 0.05. Construir una representacin grfica como se describi en la seccin 3-S.3para comparar las resistencias a la tensin promedio de las cuatro tcnicas de mezclado. A qu conclusiones se llega? e) Usar el mtodo LSD de Fisher con a = 0.05 para hacer comparaciones entre pares de medias. d) Construir una grfica de probabilidad normal de los residuales. Qu conclusiones se sacaran acerca de la validez del supuesto de normalidad? e) Graficar los residuales contra la resistencia a la tensin predicha. Comentar la grfica. 1) Hacer un diagrama de dispersin de los resultados como ayuda para la interpretacin de los resultados de este experimento. 3-2. a) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba del rango mltiple de Duncan con a = O.OS. Hay alguna diferencia en las conclusiones? b) Resolver de nuevo el inciso b del problema 3-1 utilizando la prueba de Thkey con a = 0.05. Se llega a las mismas conclusiones con la prueba de Tukey que las obtenidas con el procedimiento grfico y/o con la prueba del rango mltiple de Duncan? c) Explicar la diferencia entre los procedimientos de Duncan y de Thkey. 3-3. Considere nuevamente el problema 3-1. Encontrar un intervalo de confianza de 95% para la resistencia a la tensin media del cemento portland que produce cada una de las cuatro tcnicas de mezclado. Encontrar tambin un intervalo de confianza de 95% para la diferencia en las medias de las tcnicas 1 y 3. Sirve esto de ayuda para interpretar los resultados del experimento? 3-4. Se llev a cabo un experimento a fin de determinar si cuatro temperaturas de coccin especficas afectan la densidad de cierto tipo de ladrillo. El experimento produjo los siguientes datos:

a) Probar la hiptesis de que las tcnicas de mezclado afectan la resistencia del cemento. Utilizar a

b)

Temperatura 100 125 150 175

Densidad 21.8 21.7 21.9 21.9 21.9 21.4 21.8 21.7 21.7 21.S 21.8 21.8 21.6 21.4 21.6 21.4 21.7 21.S

a) La temperatura de coccin afecta la densidad de los ladrillos? Utilizar a = 0.05. b) Es apropiado comparar las medias utilizando la prueba del rango mltiple de Duncan (por ejemplo) en este experimento? c) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza? d) Construir una representacin grfica de los tratamientos como se describi en la seccin 3-5.3. Esta grfica resume adecuadamente los resultados del anlisis de varianza del inciso a?

120
3-5.

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

3-6.

Resolver de nuevo el inciso d del problema 3-4 utilizando el mtodo LSD de Fisher. A qu conclusiones se llega? Explicar en detalle cmo se modific la tcnica para tomar en cuenta los tamaos de las muestras desguales. Un fabricante de televisores est interesado en el efecto de cuatro tipos diferentes de recubrimientos para cinescopias de color sobre la conductividad de un cinescopio. Se obtienen los siguientes datos de la conductividad:

Tipo de recubrimiento 1 2 3 4 143 152 134 129

Conductividad 141 149 136 127 150 137 132 132 146 143 127 129

a) Hay alguna diferencia en la conductividad debida al tipo de recubrimiento? Utilizar a = 0.05. b) Estimar la media global y los efectos de los tratamientos. e) Calcular la estimacin de un intervalo de confianza de 95% para la media del tipo de recubrimiento 4. Calcular la estimacin de un intervalo de confianza de 99% para la diferencia media entre los tipos de recubrimiento 1 y 4. d) Probar todos los pares de medias utilizando el mtodo LSD de Fisher con a = 0.05. e) Usar el mtodo grfico comentado en la seccin 3-5.3 para comparar las medias. Cul es el tipo de recubrimiento que produce la conductividad ms alta? f) Suponiendo que el recubrimiento tipo 4 es el que se est usando actualmente, Zqu se recomendara al fabricante? Quiere minimizarse la conductividad. 3-7. Considere nuevamente el experimento del problema 3-6. Analizar los residuales y sacar conclusiones acerca de la adecuacin del modelo. 3-8. En un artculo deACI Materials Joumal (vol. 84, pp. 213-216) se describen varios experimentos para investigar el varillado del concreto para eliminar el aire atrapado. Se us un cilindro de 3 X 6 pulgadas; y el nmero de veces que esta barra se utiliz es la variable del diseo. La resistencia a la compresin resultante de la muestra de concreto es la respuesta. Los datos se muestran en la tabla siguiente:

Nivel de varillado 10 15 20 25 1530 1610 1560 1500

Resistencia a la compresin 1530 1650 1730 1490 1440 1500 1530 1510

3-9.

a) Hay alguna diferencia en la resistencia a la compresin debida al nivel de varillado? Utilizar a = 0.05. b) Encontrar el valor P para el estadstico F del inciso a. e) Analizar los residuales de este experimento. Qu conclusiones pueden sacarse acerca de los supuestos fundamentales del modelo? d) Construir una representacin grfica para comparar las medias de los tratamientos, como se describi en la seccin 3-5.3. En un artculo de Environment Intemational (vol. 18, no. 4) se describe un experimento en el que se investig la cantidad de radn liberado en las duchas. Se us agua enriquecida con radn en el experimento, y se probaron seis dimetros diferentes de los orificios de las regaderas. Los datos del experimento se muestran en la siguiente tabla:

3-11 PROBLEMAS

121

Dimetro de los orificios 0.37 0.51 0.71 1.02 1.40 1.99 80 75 74 67 62 60

Radn liberado (%) 83 75 73 72 62 61 83 79 76 74 67 64 85 79 77 74 69 66

a) El tamao de los orificios afecta el porcentaje promedio del radn liberado? Utilizar a '" 0.05. b) Encontrar el valor P para el estadstico F del inciso a. e) Analizar los residuales de este experimento.
d) Encontrar un intervalo de confianza de 95% para el porcentaje promedio de radn liberado cuando el dimetro de los orificios es 1.40. e) Construir una representacin grfica para comparar las medias de los tratamientos, como se describi en la seccin 3-5.3. Qu conclusiones pueden sacarse? Se determin el tiempo de respuesta en milisegundos para tres diferentes tipos de circuitos que podran usarse en un mecanismo de desconexin automtica. Los resultados se muestran en la siguiente tabla:

3-10.

Tipo de circuito
1

Tiempo de respuesta
9 20 6

12 21

10 23

8 17 16

15 30

a) Probar la hiptesis de que los tres tipos de circuitos tienen el mismo tiempo de respuesta. Utilizar a'" 0.01.
b) Usar la prueba de Thkey para comparar pares de medias de los tratamientos. Utilizar a ee 0.01. e) Usar el procedimiento grfico de la seccin 3-5.3 para comparar las medias de los tratamientos. Qu conclusiones pueden sacarse? Cmo se comparan con las conclusiones del inciso b? d) Construir un conjunto de contrastes ortogonales, suponiendo que al principio del experimento se sospechaba que el tiempo de respuesta del circuito tipo 2 era diferente del de los otros dos. e) Si el lector fuera el ingeniero de diseo y quisiera minimizar el tiempo de respuesta, qu tipo de circuito seleccionara? f) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza bsico? 3-11. Se estudia la vida efectiva de los fluidos aislantes en una carga acelerada de 35 kV. Se han obtenido datos de una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes:

Tipo de fluido 1 2 3 4 17.6 16.9 21.4 19.3 18.9 15.3 23.6 21.1

Vida (en horas) con 35 kV de carga 16.3 18.6 19.4 16.9 17.4 17.1 18.5 17.5 20.1 19.5 20.5 18.3 21.6 20.3 22.3 19.8

122

CAPTIJLO 3 EXPERIMENTOS CON UN SOLOFACTOR: ELANLISIS DEVARIANZA

a) Hay algn indicio de que los fluidos difieran? Utilizar a = 0.05. b) Cul fluido seleccionara el lector, dado que el objetivo es conseguir la vida efectiva ms larga? e) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza bsico? 3-12. Se estudian cuatro diferentes tipos de diseos de un circuito digital de computadora para comparar la cantidad de ruido presente. Se obtienen los siguientes datos:

Diseo del circuito 1 2 3 4

19 80 47 95

Ruido 20 61 26 46

observado 30 19 56 73 35 25 78 83

8 80 50 97

a) La cantidad de ruido presente es la misma para los cuatro diseos? Utilizar a

= 0.05.

b) Analizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza? c) Qu diseo del circuito se seleccionara para usarlo? El ruido bajo es mejor.

3-13.

Se pide a cuatro qumicos que determinen el porcentaje de alcohol metlico en cierto compuesto qumico. Cada qumico hace tres determinaciones, y los resultados son los siguientes:

Qumico
1 2 3 4

Porcentaje de alcohol metlco 84.99 85.15 84.72 84.20 84.04 85.13 84.48 84.10 84.38 84.88 85.16 84.55

a) Los qumicos difieren significativamente? Utilizar a = 0.05. b) Analizar los residuales de este experimento.

c) Si el qumico 2 es un empleado nuevo, construir un conjunto razonable de contrastes ortogonales que podra haberse usado al principio del experimento. 3-14. Se someten a estudio tres marcas de bateras. Se sospecha que las vidas (en semanas) de las tres marcas son diferentes. Se prueban cinco bateras de cada marca con los resultados siguientes:

Marca 1 100 96 92 96 92

Semanas de vida Marca 2 76 80 75 84 82

Marca 3 108 100 96 98 100

a) Las vidas de estas tres marcas son diferentes?


b) Analizar los residuales de este experimento. c) Construir la estimacin de un intervalo de confianza de 95% para la vida media de la batera marca 2.

Construir la estimacin del intervalo de confianza de 99% para la diferencia media entre las vidas de las . bateras marcas 2 y 3.

3-11 PROBLEMAS

123

3-15.

d) Qu marca seleccionara el lector para usarla? Si el fabricante reemplazara sin cargo cualquier batera que dure menos de 85 semanas, Zqu porcentaje esperara reemplazar la compaa? Se estn investigando cuatro catalizadores que pueden afectar la' concentracin de un componente en una mezcla lquida de tres componentes. Se obtienen las -siguientes concentraciones:

Catalizador
1

2 56.3 545 57.0 55.3

3
50.1 54.2 55.4

4
52.9 49.9 50.0 51.7

58.2 57.2 58.4 55.8 54.9

a) Los cuatro catalizadores tienen el mismo efecto sobre la concentracin?


b) Analizar los residuales de este experimento. e) Construir la estimacin de un intervalo de confianza de 99% para la respuesta media del catalizador 1.

3-16.

Se llev a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se probaron cuatro muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla. Los tiempos de falla (en minutos) se muestran abajo:

Material 1 2 3 4 5 110 1 880 495 7

Tiempo de falla (minutos) 157 2 1256 7040 5 194 4 5276 5307 29 178 18 4355 10,050 2

3-17.

a) Los cinco materiales tienen el mismo efecto sobre el tiempo de falla? b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los residuales. Qu informacin transmiten estas grficas? c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del tiempo de falla y sacar las conclusiones apropiadas. Un fabricante de semiconductores ha desarrollado tres mtodos diferentes para reducir el conteo de partculas en las obleas. Los tres mtodos se prueban en cinco obleas y se obtiene el conteo de partculas despus del tratamiento. Los datos se muestran abajo:

Mtodo
1

Conteo

31
62 53

2 3

10 40 27

21 24 120

4 30 97

1 35 68

a) Todos los mtodos tienen el mismo efecto sobre el conteo promedio de partculas? b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los residuales. Hay motivo de preocupacin potencial acerca de la validez de los supuestos? c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del conteo de partculas y sacar las conclusiones apropiadas.

124
3-18.

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

3-19. 3-20.

3-21.

322.

3-23.

3-24.

3-25.

3-26.

327.

3-28.

3-29.

330.

Considere la prueba de la igualdad de las medias de dos poblaciones normales, donde las varianzas son desconocidas pero se suponen iguales. El procedimiento de prueba apropiado es la prueba t agrupada o combinada. Demostrar que la prueba t combinada es equivalente al anlisis de varianza de un solo factor. Demostrar que la varianza de la combinacin lineall:~~lcIYi. es a2J:.~~lnlc. En un experimento con efectos fijos, suponga que hay n observaciones para cada uno de cuatro tratamientos. Qi, O; los componentes con un solo grado de libertad de los contrastes ortogonales. Demostrar que Sean SSnatamiento, = (f + Qi + 0;. Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el problema 3-14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varianzas con el examen de las grficas de los residuales? Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface en el problema 3-14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varianzas con el examen de las grficas de los residuales? Referirse al problema 3-10. Si quiere detectarse una diferencia mxima en los tiempos de respuesta promedio de 10 milisegundos con una probabilidad de al menos 0.90, Zqu tamao de la muestra deber usarse? Cmo se obtendra una estimacin preliminar de a2? Referirse al problema 3-14. a) Si quiere detectarse una diferencia mxima en la vida de las bateras de 10 horas con una probabilidad de al menos 0.90, Zqu tamao de la muestra deber usarse? Comentar cmo se obtendra una estimacin preliminar de a2 para responder esta pregunta. b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviacin estndar de una observacin se incremente en 25%, qu tamao de la muestra deber usarse si quiere detectarse esto con una probabilidad de al menos 0.90? Considere el experimento del problema 3-14. Si quiere construirse un intervalo de confianza de 95% para la diferencia en las vidas medias de dos bateras que tenga una precisin de 2 semanas, cuntas bateras de cada marca deben probarse? Suponga que cuatro poblaciones normales tienen medasre, = 50,,u2 = 60,,u3 = 50 y,u4 = 60. Cuntas observaciones debern hacerse en cada poblacin para que la probabilidad de rechazar la hiptesis nula de la igualdad de las medias poblacionales sea al menos 0.90? Suponer que a = 0.05 Yque una estimacin razonable de la varianza de error es a2 = 25. Referirse al problema 3-26. a) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental fuera a2 = 36? b) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental fuera a 2 = 49? e) Puede sacarse alguna conclusin acerca de la sensibilidad de la respuesta dada en esta situacin particular acerca de cmo afecta la estimacin de a la decisin referente al tamao de la muestra? d) Puede hacerse alguna recomendacin acerca de cmo debera usarse este enfoque general para elegir n en la prctica? Referirse al experimento de la fundicin de aluminio descrito en la seccin 3-8. Verificar que los mtodos para controlarla proporcin de almina no afectan el voltaje promedio de la celda. Construir una grfica de probabilidad normal de los residuales. Graficar los residuales contra los valores predichos. Existe algn indicio de que se violan algunos de los supuestos fundamentales? Referirse al experimento de la fundicin de aluminio de la seccin 3-8. Verificar el anlisis de varianza del ruido del crisol que se resume en la tabla 313. Examinar las grficas de los residuales usuales y comentar la validez del experimento. Se investigaron cuatro diferentes velocidades de alimentacin en un experimento con una mquina CNC que produce una pieza que se usa en la unidad de potencia auxiliar de un avin. El ingeniero de manufactura a cargo del experimento sabe que una dimensin crtica de la pieza de inters puede ser afectada por la velocidad de alimentacin. Sin embargo, la experiencia previa indica que es probable que slo estn presentes

a.

3-11 PROBLEMAS

125

efectos de dispersin. Es decir, al cambiarse la velocidad de alimentacin no se afecta la dimensin promedio, pero podra afectarse la variabilidad dimensional. El ingeniero realiza cinco corridas de produccin con cada velocidad de alimentacin y obtiene la desviacin estndar de la dimensin crtica (en 10-3 mm). Los datos se muestran abajo. Suponer que todas las corridas se hicieron en orden aleatorio. Velocidad de alimentacin (pulgadas/minuto) 10 12 14 16 Corrida de produccin
1

2
0.10 0.09 0.08 0.13

3
0.13 0.12 0.08 0.15

4
0.08 0.07 0.05 0.20

5
0.07 0.12 0.06 0.11

0.09 0.06 0.11 0.19

a) La velocidad de alimentacin tiene algn efecto sobre la desviacin estndar de esta dimensin crtica? b) Usar los residuales de este experimento para investigar la adecuacin del modelo. Hay algn problema

con la validez experimental? Considere los datos del problema 3-10. a) Escribir las ecuaciones normales de mnimos cuadrados para este problema y resolverlas para #. y i i' utilizando la restriccin usual (~:.lj = O} Estimar t' - t'z. b) Resolver las ecuaciones del inciso a utilizando la restriccin i 3 = o. Los estimadores i I Y#. son los mismos que se encontraron en el inciso a? Por qu? Estimar ahora t' - t'2 Ycomparar la respuesta con la del inciso a. Qu afirmacin puede hacerse respecto de estimar los contrastes en las t'? c) Estimar p, + t', 2t'-t'z -T3, YP, + T + T z utilizando las dos soluciones de las ecuaciones normales. Comparar los resultados obtenidos en cada caso. 3-32. Aplicar la prueba general de significacin de la regresin en el experimento del ejemplo 3-1. Demostrar que el procedimiento produce los mismos resultados que el anlisis de varianza usual. 3-33. Usar la prueba de Kruskal-Wallisen el experimento del problema 3-11. Comparar las conclusiones obtenidas con las del anlisis de varianza usual. 3-34. Usar la prueba de Kruskal-Wallisen el experimento del problema 3-12. Los resultados son comparables con los encontrados por el anlisis de varianza usual? 3-35. Considere el experimento del ejemplo 3-1. Suponga que la observacin mayor de la resistencia a la tensin se registr incorrectamente como 50. Qu efecto tiene esto sobre el anlisis de varianza usual? Qu efecto tiene sobre la prueba de Kruskal-Wallis? 3-31.

Bloques aleatorizados, cuadrados latinos y diseos relacionados

4~1

DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resultados. En general, un factor perturbador puede definirse como un factor del diseo que probablemente tenga un efecto sobre la respuesta, pero en el que no existe un inters especfico. En ocasiones un factor perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso puede tener niveles variables mientras se est realizando el experimento. La aleatorizacin es la tcnica de diseo que se utiliza para protegerse contra estos factores perturbadores "que estn al acecho". En otros casos, el factor perturbador es conocido pero no controlable. Si por 10menos puede observarse el valor que asume el factor perturbador en cada corrida del experimento, es posible hacer la compensacin correspondiente en el anlisis estadstico mediante el uso del anlisis de covarianza, una tcnica que se revisar en el captulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, puede usarse una tcnica de diseo llamada fonnacin de bloques para eliminar de manera sistemtica su efecto sobre las comparaciones estadsticas entre los tratamientos. La formacin de bloques es una tcnica de diseo en extremo importante que se utiliza ampliamente en la experimentacin industrial, y es la materia de este captulo. Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes producen o no lecturas diferentes en una mquina para probar la dureza. Un experimento como ste podra ser parte de un estudio de la aptitud en la calibracin de los instrumentos. La mquina funciona presionando la punta en un ejemplar de prueba de metal, y por la profundidad de la depresin resultante puede determinarse la dureza del ejemplar. El experimentador ha decidido obtener cuatro observaciones para cada punta. Hay un solo factor--el tipo de punta-, y un diseo completamente aleatorzado de un solo factor consistira en asignar al azar cada una de las 4 x 4 = 16 corridas a una unidad experimental, es decir, a un ejemplar de prueba de metal, y observar qu resulta de la lectura de la dureza. Por 10tanto, se necesitaran 16 ejemplares de prueba de metal en este experimento, uno por cada corrida del diseo. Existe un problema potencialmente serio con un experimento por completo aleatorizado en esta situacin de diseo. Si los ejemplares de prueba de metal difieren ligeramente en sus durezas, como podra

126

41 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

127

Tabla 4-1 Disefio de bloques completos aleatorizados para el


experimento de la prueba de la dureza

Tipode punta
1 2 3 4

1
9.3 9.4 9.2 9.7

Ejemplarde prueba 2 3
9.4 9.3 9.4 9.6 9.6 9.8 9.5 10.0

10.0 9.9 9.7 10.2

ocurrir si se tomaran de lingotes que se produjeron con temperaturas diferentes, las unidades experimentales (los ejemplares de prueba) contribuirn a la variabilidad observada en los datos de la dureza. Como resultado, el error experimental reflejar tanto el error aleatorio como la variabilidad entre los ejemplares de prueba. El objetivo sera hacer el error experimental tan pequeo como fuera posible; es decir, querra eliminarse del error experimental la variabilidad entre los ejemplares de prueba. Un diseo para lograr esto requiere que el experimentador pruebe cada punta una vez en cada uno de los cuatro ejemplares de prueba. A este diseo, que se muestra en la tabla 4-1, se le llama diseo de bloques completos aleatorizados (RCBD, randomized complete block design). La respuesta observada es la dureza en la escala C de Rockwell menos 40. La palabra "completos" indica que cada bloque (ejemplar de prueba) contiene todos los tratamientos (puntas). Al utilizar este diseo, los bloques O ejemplares de prueba forman una unidad experimental ms homognea en la cual comparar las puntas. De hecho, esta estrategia de diseo mejora la precisin de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. Dentro de un bloque, el orden en que se prueban las cuatro puntas se determina aleatoriamente. Observe la similitud de este problema de diseo con el de la seccin 2-5, donde se analiz la prueba t pareada. El diseo de bloques completos aleatorizados es una generalizacin de ese concepto. El RCBD es uno de los diseos experimentales ms utilizados. Son numerosas las situaciones en las que el RCBD es apropiado. Las unidades de equipo o maquinaria de prueba son con frecuencia diferentes en sus caractersticas de operacin y seran un factor de formacin de bloques tpico. Lotes de materia prima, personas y el tiempo tambin son fuentes de variabilidad perturbadora comunes en un experimento que pueden controlarse de manera sistemtica mediante la formacin de bloques. La formacin de bloques tambin puede ser til en situaciones que no incluyen necesariamente factores perturbadores. Por ejemplo, suponga que un ingeniero qumico est interesado en el efecto de la velocidad de alimentacin del catalizador sobre la viscosidad de un polmero. Sabe que hay varios factores, como la fuente de la materia prima, la temperatura, el operador y la pureza de la materia prima, que son muy difciles de controlar en proceso en gran escala. Por lo tanto, decide probar en bloques la velocidad de alimentacin del catalizador, donde cada bloque consiste en alguna combinacin de estos factores no controlables. De hecho, est utilizando los bloques para probar la robustez de su variable de proceso (la velocidad de alimentacin) para las condiciones que no puede controlar con facilidad. Para un anlisis ms amplio de este punto, ver Coleman y Montgomery [27].

4..1.1

Anlisis estadstico del diseo de bloques completos aleatorlzados

Suponga que se tienen, en general, a tratamientos que van a compararse y b bloques. El diseo de bloques completos aleatorizados se muestra en la figura 4-1. Hay una observacin por tratamiento en cada bloque, y el orden en que se corren los tratamientos dentro de cada bloque se determina al azar. Debido a

128
Bloque 1

CAPTULO 4

BLOQUES ALEATORIZAOOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS


Bloque b

Bloque 2

Yo'

Figura 41 El diseo de bloques completos aleatorizados.

que la nica aleatorizacin de los tratamientos se hace dentro de los bloques, con frecuencia se dice que los bloques representan una restriccin sobre la aleatorizacin. El modelo estadstico del RCBD puede escribirse de varias maneras. El tradicional es el modelo de los efectos:
i 1, ~ ... , a Yi=..t+'r+Pj+Ei { ] '=1') ..., b

,...,

(4-1)

donde s es la media global, t, es el efecto del tratamiento i-simo, P es el efecto del bloque j-simo, y Eij es j el trmino del error NID(O, d2) usual. Se considerar inicialmente que los tratamientos y los bloques son factores fijos. Como en el modelo del diseo experimental con un solo factor del captulo 3, el modelo de los efectos para el RCBD es un modelo sobreespecificado. En consecuencia, los efectos de los tratamientos y los bloques se consideran por 10 general como desviaciones de la media global, por lo que

'Iambin es posible usar un modelo de las medias para el RCBD, por ejemplo
Yi

= #j +Eij {i> 1, ~

i = l, ~

,a ,b

donde ..ti = # + t, + Pi' Sin embargo, en este captulo se usar el modelo de los efectos de la ecuacin 4-1. En un experimento en el que se use el RCBD, el inters se encuentra en probar la igualdad de las medias de los tratamientos. Por lo tanto, las hiptesis de inters son
H O:#l =#2 = ... =..t.

H 1 : al menos una ..t

:;t: ..t j

Puesto que la media del tratamiento i-simo es ..t = (1/b)1:~-1 (..t + t, + Pj) =..t + 'r, una manera equivalente de escribir las hiptesis anteriores es en trminos de los efectos de los tratamientos, por ejemplo
H O:'r1=T 2 = " = T . = O H 1 : 'r :;t: O para al menos una i

Seay, el total de observaciones hechas bajo el tratamiento i., el total de observaciones del bloquej,y__ el gran total de las observaciones y N ab el nmero total de observaciones. Expresado matemticamente,

41 DISEO DE BWQUES COMPLETOS ALEATORIZADOS

129
(4-2)

i=I,2, ... ,a

Y.j
y

=!
i",1

Yij

j= 1,2, ... , b

De manera smar.j es el promedio de las observaciones hechas bajo el tratamiento i'Yi es el promedio de las observaciones del bloque j, Y.. es el gran promedio de todas las observaciones. Es decir,

Yi.
b

= Yi_ / b
Q

s, = v, / a

y_ / N

(4~5)

La suma de cuadrados total corregida puede expresarse como

L L (Yij - Y.. )2 = LL [Ui. - Y.. )+(Y.j - Y.. )+(Y - Yi. - s, + Y.. )]2
i",1 j"'l i"'l JDI

(4-6)

Al desarrollar el miembro del lado derecho de la ecuacin 4-6 se obtiene


Q

LJ LJ
i"'l jml

~~

( Y _ Y.. )2 = b LJ (- _ Y. )2 + aLJ (~ _ Y.. )2 ~ ~ Yi. Yj iDI


Q

JDI
b
Q

+~~ (

LJ LJ
i-l
Q

j~l

Y _- _- +- )2+2~"'" (- i . _- )(- _-) Yi. v, Y.. LJ LJ Y Y. v, Y..


i-l j-l

+2~~ (- --)( Yij -- -- +-) LJ ~ r, Y.. v. v, Y..


i~1

j"'

+2LJ LJ (- - Y.- Yij - Yi . ~ ~ v; -)( i"'l JDI

s, +- ) Y.

Mediante procedimientos algebraicos simples, pero laboriosos, se prueba que los tres productos cruzados son cero. Por lo tanto,

(4-7)

representa una particin de la suma de cuadrados total. Al expresar simblicamente las sumas de cuadrados de la ecuacin 4-7, se tiene

SST = SSTralamitoo +SSBloqu +SSE

(4-8)

Puesto que hay N observaciones, SST tiene N - 1 grados de libertad. Haya tratamientos y b bloques, de donde SSnalamienlos YSSBloque. tienen a -1 y b -1 grados de libertad, respectivamente. La suma de cuadra-

130

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

dos del error es slo la suma de cuadrados entre las celdas menos la suma de cuadrados de los tratamientos y los bloques. Hay ab celdas con ab -1 grados de libertad entre ellas, de donde SSE tiene ab - 1- (a -1) -(b -1) = (a -l)(b-l) grados de libertad. Adems, la suma de los grados de libertad del lado derecho de la ecuacin 4-8 es igual al total del lado izquierdo; por lo tanto, al establecer los supuestos de normalidad usuales para los errores, puede usarse el teorema 3-1 para demostrar que SSTratamientojcr, SSBIOGUejcr y SSE/cr son variables aleatorias ji-cuadrada con distribuciones independientes. Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. Puede demostrarse que el valor esperado de los cuadrados medios, si los tratamientos y los bloques son fijos, es

A"S B( JYl, Tratamiento. ) = a 2

+-----'---i~-"-l_

b! r
ab
j~l

E(MSBloque.)= a

aL fJ~
+ b-l

E(MSE ) = a 2

Por lo tanto, para probar la igualdad de las medias de los tratamientos, se usara el estadstico de prueba
F. = MSTratamiento. o MS E

que se distribuye como Fa-l. (a-l)(b-l) si la hiptesis nula es verdadera. La regin crtica es la cola superior de la distribucin F, y H se rechazara si Fo > Fa, a-l. (a-l)(b-l)' 'Iambn podra haber inters en comparar las medias de los bloques porque, en caso de que la diferencia entre estas medias no sea considerable, quiz no sea necesaria la formacin de bloques en experimentos futuros. Por los cuadrados medios esperados, aparentemente la hiptesis Ho:fJj = puede probarse comparando el estadstico Fo = MSBloqn.jMSE con Fa. b-l. (a-I)(l>-1)' Sin embargo, recuerde que la aleatorizacin slo se ha aplicado a los tratamientos dentro de los bloques; es decir, los bloques representan una restriccin sobre la aleatorizacin. Qu efecto tiene esto sobre el estadstico F = MS S1o quejMSE? Existen diferentes puntos de vista para abordar esta cuestin. Por ejemplo, Box, Hunter y Hunter [18]sealan que la pruebaF del anlisis de varianza comn puede justificarse exclusivamente con base en la aleatorizacin,' sin el uso directo del supuesto de normalidad. Agregan que en la prueba para comparar las medias de los bloques no puede recurrirse a dicha justificacin debido a la restriccin sobre la aleatorizacin; pero si los .errores son NID(O, cr), puede usarse el estadstico Fo = MSBloqucjMSE para comparar las medias de los bloques. Por otra parte, Anderson y McLean [2] argumentan que la restriccin sobre la aleatorizacin impide que este estadstico sea una prueba significativa para comparar las medias de los bloques y que este cociente F es en realidad una prueba de la igualdad de las medias de los bloques ms la restriccin sobre la aleatorizacin (ala que llaman el error de la restriccin; ver Anderson ' y McLean [2] para detalles adicionales). Entonces, Zqu se hace en la prctica? Debido a que con frecuencia el supuesto de normalidad es cuestionable, considerar Fo = MSBluqucjMSE como una prueba F exacta para la igualdad de las medias de los bloques no es una buena prctica general. Por esa razn, esta prueba F no se incluye en la tabla del anlisis de varianza. Sin embargo, como un procedimiento aproximado para investigar el efecto de la variable formacin de bloques, examinar el cociente MSBloquejMS E es muy razonable. Si este cociente es muy

1 De hecho, la distribucin F de la teora normal es una aproximacin de la distribucin de aleatorizacin generada al calcular F a partir de cada asignacin posible de las respuestas a los tratamientos.

4-1 DISEO DEBLOQUES COMPLETOS ALEATORIZADOS


Tabla 42 Anlisis de varianza de un diseo de bloques completos aleatorizados

131

Fuente de
variacin

Suma de cuadrados
SS Thltomien'C1S
SSOloque,

Grados de libertad
a-1

Cuadrado medio
SSTtntamien'o' MSTtntamien,01l

'Iratamentos Bloques Error lbtal

a-1

MS"

b-l
(a-l)(b-l)

SSBloque,

SSE SST

b-l SSE (a-l)(b-l)

N-1

grande, implica que el factor formacin de bloques tiene un efecto considerable y que la reduccin del ruido obtenida por la formacin de bloques probablemente fue til para mejorar la precisin de la comparacin de las medias de los tratamientos. El procedimiento suele resumirse en un esquema de anlisis de varianza, como el que se muestra en la tabla 4-2. En general, los clculos se realizaran con un paquete de software de estadstica. Sin embargo, es posible obtener frmulas de clculo manual de las sumas de cuadrados para los elementos de la ecuacin 4-7 expresndolos en trminos de los totales de los tratamientos y los bloques. Estas frmulas de clculo son

(4-9)
SS Tratamientos
SSBloqueS

=b L y; - N
.-1
1
b

y2

(4-10)

=- L
a j-1

y'j - -

i
N

(4-11)

Y la suma de cuadrados del error se obtiene por sustraccin como


SSE

= SST -

SSTratamientos - SSBloques

(4-12)

Ej"EMPLO 4..1

Considere el experimento de la prueba de la dureza de la seccin 4-1. Hay cuatro puntas y cuatro ejemplares de prueba de metal. Cada punta se prueba una vez en cada ejemplar, resultando un diseo de bloques completos aleatorizados. Los datos obtenidos se repiten por conveniencia en la tabla 4-3. Recuerde que el orden en que se probaron las puntas en un ejemplar particular se determin al azar. Para simplificar los
Tabla 4.3 Diseo de bloques completos aleatori2ados para el experimento de la prueba de la dureza

Ejemplar de prueba (bloque)


~~~~

1
9.3 9.4 9.2 9.7

2
9.4 9.3 9.4 9.6

3
9.6 9.8 9.5 10.0

4
10.0 9.9 9.7 10.2

1 2 3 4

132

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-4 Datos codificados delexperimento de la prueba de la dureza Ejemplar de prueba (bloque) 1 2 3 4 Tipo de punta Yi. ~2 -1 1 5 1 3 -2 3 4 -1 2 4
3
4
Y.

-3

-1

2 -4

5
9

7
18

-2 15 20"" y..

-3

clculos, los datos originales se codifican restando 9.5 de cada observacin y multiplicando el resultado por 10. Se obtienen as los datos de la tabla 4-4. Las sumas de cuadrados se obtienen de la siguiente manera:
SST ""

LL Yj~ - :
j~l

j&l

= 154.00SS'natamientos

b? y; - N
4
,~l

16 = 129.00
y2

(20)2

= ! [(3)2 +( 4)2 +(_2)2 +(15)2]- (20)2 = 38.50


4
a

16

SS

Bloques

=-

" 2 .L.i Y.j - Y. N

j~l

= [(_4)2 +(_3)2 +(9)2 +(18)2]~ (2 0 = 82.50


1
SSE

= SST - SSTratamientotl - SSBIOqUeS = 129.00- 38.50- 82.50= 8.00

En la tabla 4-5 se presenta el anlisis de varianza. Utilizando a = 0.05, el valor crtico de F es F O.05,3,9 = 3.86. Puesto que 14.44 > 3.86, se concluye que el tipo de punta afecta la lectura de la dureza media. El valar P para la prueba tambin es muy pequeo. Adems, al parecer los ejemplares (bloques) difieren de manera significativa, ya que el cuadrado medio de los bloques es grande en relacin con el error. Es interesante observar los resultados que se habran obtenido si no se hubiera tenido conocimiento de los diseos de bloques aleatorizados. Suponga que se usaran cuatro ejemplares, asignando al azar las puntas a cada uno de ellos, y que resultara (por casualidad) el mismo diseo que el de la tabla 4-3. El anlisis incorrecto de estos datos como un diseo completamente aleatorizado de un solo factor se presenta en la tabla 4-6. Tabla 4-5 Anlisis de varianza delexperimento de la prueba de la dureza Fuente de Sumade Grados de variacin cuadrados libertad Tratamientos (tipo 38.50 3 de punta) 82.50 3 Bloques (ejemplares) 8.00 9 Error 129.00 15 Thtal

Cuadrado medio
12.83 27.50 0.89 14.44

ValorP
0.0009

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

133

Tabla 46

Anlisisincorrecto del experimento de la prueba de la dureza como un diseo completamente aleatorizado Fuente de Suma de Grados de Cuadrado variacin cuadrados libertad medio
38.50 90.50 129.00

Tipo de punta

3
12

12.83

1.70

Error
Total

7.54

15

Puesto que F O.05,3,l Z = 3.49, no puede rechazarse la hiptesis de la igualdad de las mediciones de la dureza media de las cuatro puntas. Por lo tanto, el diseo de bloques aleatorizados reduce 10 suficiente la cantidad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. Esto ilustra un punto muy importante. Si un experimentador no recurre a la formacin de bloques cuando debera haberlo hecho, el efecto puede ser inflar el error experimental a tal grado que las diferencias importantes entre las medias de los tratamientos sean indetectables.

Muestra de salida de computadora

En la figura 4-2 se muestra la salida de computadora condensada obtenida con Design-Expert para los datos de la prueba de la dureza del ejemplo 4-1. Recuerde que en el anlisis original de la tabla 4-5 se utilizaron datos codificados. (Las respuestas originales se codificaron restando 9.5 y multiplicando el resultado por 10.) El anlisis de computadora utiliz las respuestas originales. Por consiguiente, las sumas de cuadrados de la figura 4-2 son iguales a las de la tabla 4-S divididas entre 100 (observe que Design-Expert ha redondeado las sumas de cuadrados con dos cifras decimales). Los residuales se enlistan en la parte inferior de la salida de computadora. stos se calculan como
eij

= Yij -

Yij
Jij

y, como se demostrar ms adelante, los valores ajustados son


eij

Yi. + y} - Y.,

de donde

= Yij - 5\. -

Y. j

+ Y..

(4-13)

En la seccin siguiente se indicar cmo se usan los residuales en la verificacin de la adecuacin del modelo. Comparaciones mltiples Si los tratamientos en un RCBD son fijos, y el anlisis indica una diferencia significativa en las medias de los tratamientos, al experimentador le interesarn por 10 general comparaciones mltiples para descubrir cules son los tratamientos cuyas medias difieren. Para ello puede utilizarse cualquiera de los procedimientos de comparaciones mltiples del captulo 3 (seccin 3-S). Simplemente se sustituye en las frmulas de la seccin 3-S el nmero de rplicas (n) en el diseo completamente aleatorizado de un solo factor con el nmero de bloques (b). Asimismo, es necesario recordar usar el nmero de grados de libertad del error para el bloque aleatorizado [(a -1)(b -1)] en lugar de los grados de libertad del diseo completa1)]. mente aleatorizado En la salida de Design-Expert de la figura 4-2 se ilustra el procedimiento LSD de Fisher. Observe que si se usa a = O.OS, se concluira que I-tz = 1-t3' Ahora bien, puesto que Y3. ::s; Yl. ::s; Yz. (es decir, las medias Yz. y Y3. abarcan algunas de las medias restantes), una conclusin inmediata sera que a, =,uz = ,u3' Adems.u, es diferente de las otras tres medias. Se concluye por lo tanto que la punta tipo 4 produce una dureza media que es significativamente ms alta que las lecturas de la dureza media de los otros tres tipos de puntas.

raen -

134

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Response: Hardness in Rockwell C ANOVA for Selected Factorial Model Analysis of variance table [Partlal sum of squaresJ Source Block Model Sum of Squares 0.82 0.38
0.38

A
Residual Cor Total Std. Dev. Mean C.V. PRESS

0.080 1.29 0.094 9.63 0.98 0.25

DF 3 3 3 9 15

Mean Square 0.27 0.13


0.13

F Value 14.44 14.44

Prob> F 0.0009
0.0009

significant

8.889E-003

R-Squared Adj R-Squared Pred R-Squared Adeq Precision

0.8280 0.7706 0.4563 15.635

Treatment Means IAdjusted, If Necessary) Estimated Standard Error Mean 1-A1 9.57 0.47 2-A2 0.47 9.60 3-A3 9.45 0.47 9.88 0.47 4-A4 Treatment 1 vs 2 1 vs 3 1 vs 4 2 vs 3 2 vs 4 3 vs 4 Mean Difference -0.025 0.13 -0.30 0.15 -0.27 -0.43 DF 1 1 1 1 1 1 Standard Error 0.067 0.067 0.067 0.067 0.067 0.067 tfor Ho Coeff=O -0.38 1.87 -4.50 2.25 -4.12 -6.37 Student Residual -0.707 0.354 -1.061 1.414 0.354 -1.414 1.414 -0.354 -0.354 2.121 -0.707 -1.061 0.707 -1.061' 0.354 0.000 Prob> [t] 0.7163 0.0935 0.0015 0.0510 0.0026 0.0001 Cook's Distance 0.056 0.014 0.125 0.222 0.014 0.222 0.222 0.014 0.014 0.500 0.056 0.125 0.056 0.125 0.014 0.000 Outlier t -0.686 0.336 -1.069 1.512 0.336 -1.512 1.512 -0.336 -0.336 2.828 -0.686 -1.069 0.686 -1.069 0.336 0.000

Diagnostics Case Statistics Standard Actual Predicted Value Order Value 9.30 9.35 1 9.40 9.38 2 9.60 9.67 3 4 10.00 9.90 9.40 9.38 5 9.30 9.40 6 9.80 9.70 7 9.90 9.93 8 9 9.20 9.22 9.40 9.25 10 9.50 9.55 11 9.78 12 9.70 9.70 9.65 13 9.68 14 9.60 9.97 15 10.00 10.20 10.20 16
Fi~lJr"

Residual -0.050 0.025 -0.075 0.100 0.025 -0.100 0.100 -0.025 -0.025 0.150 -0.050 -0.075 0.050 -0.075 0.025 0.000

Leverage 0.438 0.438 0.437 0.438 0.438 0.437 0.437 0.437 0.438 0.437 0.437 0.437 0.438 0.437 0.437 0.437

4-2

Salid" de Design-Expert (condensada) para el ejemplo 4-1.

4-1 DISEO DEBLOQUES COMPLETOS ALEATORIZADOS

135

Punta
-1

Punta Punta 1 2

Punta 4

Dureza promedio (codificada)

Figura 4-3 Las medias del tipo de punta en relacin con una distribucin t escalada con un factor de escalacin JMS E / b ==./0.89/4 =0.47.

Thmbin puede usarse el procedimiento grfico del captulo 3 (seccin 3-5.1) para comparar las medias del tipo de punta. En la figura 4-3 se grafican las cuatro medias del tipo de punta del ejemplo 4-1 en relacin con una distribucin t escalada con un factor de escalacin.J MS E / b =";0.89/4 = 0.47.Esta grfica indica que las puntas 1, 2 Y3 producen probablemente mediciones de la dureza promedio idnticas, pero que la punta 4 produce una dureza media mucho ms alta. Esta figura confirma los resultados de la prueba LSD de Fisher incluida en la salida de Design-Expert de la figura 4-2.

4..1.2

Verificacin de la adecuacin del modelo

Se ha comentado ya la importancia de verificar la adecuacin del modelo supuesto. En general, deber estarse alerta a los problemas potenciales con el supuesto de normalidad, con la desigualdad de la varianza por tratamiento o bloque, y con la interaccin bloque-tratamiento. Como en el diseo completamente aleatorzado, el anlisis residual es la herramienta principal que se utiliza en estos diagnsticos de verificacin. En la parte inferior de la salida de Design-Expert de la figura 42 se enlistan los residuales del diseo de bloques aleatorizados. Los residuales codificados se encontraran multiplicando estos residuales por 10. Las observaciones, los valores ajustados y los residuales de los datos codificados de la prueba de la dureza del ejemplo 4-1 son los siguientes:
Yq

P q
-1.50
~1.25

e j ...().50 0.25 ...().75 1.00 0.25 -1.00 1.00 ...().25 ...().25 1.50 ...().50 ...().75 0.50 ...().75 0.25 0.00

-2.00 -1.00 1.00 5.00 -1.00 -2.00 3.00 4.00 -3.00 -1.00 0.00 2.00 2.00 1.00 5.00 7.00

1.75 4.00 -1.25 -1.00 2.00 4.25 -2.75 -2.50 0.50 2.75 1.50 1.75 4.75 7.00

En la figura 4-4 se muestra la grfica de probabilidad normal y el diagrama de puntos de estos residuales. No hay indicios marcados de no normalidad y tampoco hay evidencia que apunte a la posible presencia de puntos atpicos. En la figura 45 se muestran las grficas de los residuales por tipo de punta o

138

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS YDISEOS RELACIONADOS

bloque 1 en conjunto esE(Yll) = # + t'1 + PI # + 5 + 2 = # + 7. En general, el tratamiento 1 incrementa siempre la respuesta esperada 5 unidades sobre la suma de la media global y del efecto del bloque. Aun cuando este modelo aditivo simple muchas veces es til, hay situaciones en las que resulta inadecuado. Suponga, por ejemplo, que se estn comparando cuatro formulaciones de un producto qumico utilizando seis lotes de materia prima; los lotes de materia prima se consideran bloques. Si una impureza en el lote 2 afecta de manera adversa la formulacin 2, dando como resultado un rendimiento inusualmente bajo, pero no afecta las dems formulaciones, ha ocurrido una interaccin entre las formulaciones (o tratamientos) y los lotes (o bloques). De manera similar, pueden ocurrir interacciones entre los tratamientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por lo tanto, una relacin que es multiplicativa en las unidades originales, por ejemplo

E(Yij) = f.lt'J3 j
es lineal o aditiva en una escala logartmica, ya que, por ejemplo,

o
E(y~)= f.l.

+r; +P:

Aun cuando este tipo de interaccin puede eliminarse con una transformacin, no todas las interacciones pueden tratarse con tanta facilidad. Por ejemplo, una transformacin no elimina la interaccin formulacin-lote que se seal antes. El anlisis residual y otros procedimientos de diagnstico de verificacin pueden ser tiles para detectar la no aditividad. Si una interaccin est presente, puede afectar seriamente el anlisis de varianza y posiblemente lo invalide. En general, la presencia de una interaccin infla el cuadrado medio del error y puede afectar adversamente la comparacin de las medias de los tratamientos. En situaciones en las que ambos factores, as como su posible interaccin, son de inters, deben usarse diseos factoriales. Estos diseos se analizan en detalle en los captulos 5 al 9." Tratamientos y bloques aleatorios Aun cuando el procedimiento de prueba se ha descrito considerando los tratamientos y los bloques como factores fijos, se utiliza el mismo procedimiento de anlisis si los tratamientos o los bloques (o ambos) son aleatorios. Sin embargo, hay algunas modificaciones en la interpretacin de los resultados. Por ejemplo, si los bloques son aleatorios, como es con mucha frecuencia el caso, se espera que las comparaciones entre los tratamientos sean las mismas a lo largo de la poblacin de bloques de la cual se seleccionaron aleatoriamente para realizar el experimento. Estn tambin las modificaciones correspondientes en los cuadrados medios esperados. Por ejemplo, si los bloques son variables aleatorias independientes con varianza comn, entonces E(MSBloques) = cr + aa~, donde a~ es el componente de la varianza de los efectos de los bloques. En cualquier situacin, E(MSnatamientos) siempre est libre de cualquier efecto de bloque, y el estadstico de prueba para la variabilidad entre los tratamientos siempre esFo = MSnalamiento/MSE. En situaciones en las que los bloques son aleatorios, si est presente una interaccin tratamiento-bloque, las pruebas para las medias de los tratamientos no estn afectadas por la interaccin. La razn de ello es que los cuadrados medios esperados de los tratamientos y del error contienen ambos el efecto de la interaccin; por consiguiente, la prueba de las diferencias en las medias de los tratamientos puede realizarse como de costumbre comparando el cuadrado medio de los tratamientos con el cuadrado medio del error. Este procedimiento no proporciona ninguna informacin acerca de la interaccin.

4.1 DISEO DEBLOQUES COMPLETOS ALEATORIZADQS

139

Eleccin del tamao de la muestra La eleccin del tamao de la muestra, o nmero de bloques que deben correrse, es una decisin importante cuando se usa un RCBD. Al incrementar el nmero de bloques, se incrementa el nmero de rplicas y el nmero de grados de libertad del error, con lo cual se aumenta la sensibilidad del diseo. Cualquiera de las tcnicas descritas en el captulo 3 (seccin 3-7) para seleccionar el nmero de rplicas que deben correrse en un experimento completamente aleatorizado con un solo factor puede aplicarse de forma directa al RCBD. Para el caso de un factor fijo, las curvas de operacin caracterstica de la parte V del apndice pueden usarse con

(4-14) donde haya -1 grados de libertad en el numerador y (a -1 )(b -1) grados de libertad en el denominador.

EJEMPLO 4..2

"

"

"

"

"

"

"

"

"

"

"

"

"

"

"

"

"

"

"

"

Considere el problema de la prueba de la dureza del ejemplo 4-1. Suponga que quiere determinarse el nmero apropiado de bloques que deben correrse si el inters se encuentra en detectar una diferencia mxima real en las lecturas de la dureza media de 0.4 con una alta probabilidad, y una estimacin razonable de la desviacin estndar de los errores es a = 0.1. (Estos valores se dan en las unidades originales; recuerde que el anlisis de varianza se realiz usando datos codificados.) Por la ecuacin 3-49, el valor mnimo de <1>2 es (escribiendo b, el nmero de bloques, en lugar de n)
<1>2

= bD 2
Zaa

donde D es la diferencia mxima que quiere detectarse. Por lo tanto,


<1>2

b(0.4)2 2(4)(0.1)2

=2.0b

Si se usan b = 3 bloques, entonces < = V'I15 = V2.i'i'{3) = 2.45, Yhay (a -1 )(b -1) = 3(2) = 6 grados de libertad del error. La parte V del apndice con 111 = a -1 = 3 Ya = 0.05 indicaque el riesgo Pde este diseo es aproximadamente 0.10 (potencia = 1-P = 0.90). Si se usanb = 4 bloques, <1> = V21J5 = v'2.0(4) = 2.83, con (a -1)(b -1) = 3(3) = 9 grados de libertad del error, y el riesgo Pcorrespondiente es aproximadamente 0.03 (potencia = 1-P = 0.97). Tres o cuatro bloques darn como resultado un diseo con una alta probabilidad de detectar la diferencia entre las lecturas de la dureza media consideradas importantes. Debido a que los ejemplares de prueba (bloques) son baratos y estn en disponibilidad y el costo de la prueba es bajo, el experimentador decide usar cuatro bloques.
" " " " " " " *' "
111 " " " " " " " " " " " " " " " " " " " " 111

Estimacin de valores faltantes Cuando se usa el RCBD, en ocasiones falta una observacin en uno de los bloques. Esto puede ocurrir debido a descuido o error o por razones fuera del control del experimentador, tal como un dao inevitable a una unidad experimental. Una observacin faltante introduce un nuevo problema en el anlisis debido a que los tratamientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratamientos en

140

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS YDISEOS RELACIONADOS


Tabla 4-7 Disefio de bloques completos aleatorzados para el experimento de la prueba de dureza con un valor faltante

TipO de punta 1 2 3 4

Ejemplar de prueba (bloque) 1 2 3 -2 -1 1 -1 -2 x -3 -1 O 2 1 5

4 5
4 2

cada uno de los bloques. Existen dos enfoques generales para el problema de los valores faltantes. El primero es un anlisis aproximado, en el cual la observacin faltante se estima y se lleva a cabo el anlisis de varianza usual como si la observacin estimada fuera un dato real, con los grados de libertad del error reducidos en 1. Este anlisis aproximado es materia de esta seccin. El segundo es un anlisis exacto, el cual se revisa en la seccin 4-1.4. Suponga que falta la observaciny del tratamiento i en el bloque j. La observacin faltante se denota comox. Como una ilustracin, suponga que en el experimento de la prueba de dureza del ejemplo 4-1 el ejemplar de prueba 3 se rompi mientras se probaba la punta 2 y que no pudo obtenerse el dato para esa punta. Los datos apareceran como en la tabla 47. En general, se har que represente el gran total con una observacin faltante, que represente el total del tratamiento con una observacin faltante, y que y.~ sea el total del bloque con una observacin faltante. Suponga que quiere estimarse la observacin faltante x de tal modo que x tenga una participacin mnima en la suma de cuadrados del error. Puesto que SSe = ~~~l ~~~1 (Yij - Yi. - Y.j + y,. )2, esto es equivalente a elegir x para minimizar

y:

y;.

SSe

b 1 1 b 1 b f; ~ Y~ - b f; (b Yij )2 - ~ ~ f; v, )2 + ab f; ~ Yij ]2 ~
Q Q (Q (Q

o
(4-15) donde R incluye todos los trminos en los que no interviene x. A partir de dSSe/dx=O, se obtiene

ay;. +by'~ x = (a-1)(b-1)


como la estimacin de la observacin faltante. Para los datos de la tabla 4-7, se encuentra que 4-16,

y:
(4-16)

y;. = 1, /3 = 6 Yl = 17. Por lo tanto, por la ecuacin

_ 4(1)+4(6)-17 x = Y23 = (3)(3) = 1.22


Ahora puede realizarse el anlisis de varianza comn utilizando Y23 = 1.22 Yreduciendo los grados de libertad del error en 1. El anlisis de varianza se muestra en la tabla 4-8. Compare los resultados de este anlisis aproximado con los resultados obtenidos para el conjunto de datos completo (tabla 4-5).

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

141

Tabla 48 Anlisis devarianza aproximado delejemplo 4-1 conun valor faltante

Fuente de variacin Tipode punta Ejemplares de prueba (bloques) Error Thtal

Sumade cuadrados
39.98 79.53 6.22 125.73

Gradosde libertad
3 3 8
14

Cuadrado medio
13.33 26.51

ValorP
17.12

0.0008

0.78

Si son varias las observaciones faltantes, pueden estimarse escribiendo la suma de cuadrados del error como una funcin de los valores faltantes, derivando con respecto a cada valor faltan te, igualando los resultados con cero y resolviendo las ecuaciones resultantes. De manera alternativa, puede usarse la ecuacin 416 de manera iterativa para estimar los valores faltantes. Para ilustrar el enfoque iterativo, suponga que faltan dos valores. Se estima arbitrariamente el primer valor faltante y despus se usa este valor junto con los datos reales y la ecuacin 4-16 para estimar el segundo. Entonces puede usarse la ecuacin 4-16para volver a estimar el primer valor faltante, y despus de esto, puede volver a estimarse el segundo. Este proceso se contina hasta que se obtiene la convergencia. En cualquier problema con valores faltan tes, los grados de libertad del error se reducen en una unidad por cada observacin faltante. 4 ..1.4 Estimacin de los parmetros del modelo y la prueba general de significacin de la regresin

Si tanto los tratamientos como los bloques son fijos, los parmetros del RCBD pueden estimarse por mnimos cuadrados. Recuerde que el modelo estadstico lineal es i == 1, 2,... , a Yij=fl+T:+l3 j+eij { J'=1 , 2, ... , b
(4-17)

Al aplicar las reglas de la seccin3~9.2 para encontrar las ecuaciones normales del modelo de un diseo experimental, se obtiene

u: abfi + bi, + bf2 + ... + bi; + ap + a'A + ... + aPb 't: bfi + bi,
't z:

= Y.
=Yl. = Y2.

bfi

+ bf z

+ p + 'A + ... + Pb + p + P2 + ... + Pb


+ bi + PI + P2 + ... + Pb

'ta: bf,

131: af, + f l + f 2 + f32: af, + f + f z +


f3b: afi + f + f Z

+ fa + aPl + fa
+ apz

= = =

Ya.
Y.l

(4-18)

Yz

+ ... + fa

+ aPb = Yb

Observe que la suma de la segunda a la (a + 1)-sima ecuaciones de la ecuacin 4-18 e-s la primera ecuacin normal, como tambin es el caso de las b ltimas ecuaciones. Por lo tanto, hay dos dependencias

142

CAPTIJLO 4 BLOQUES ALEATOIUZAOOS. CUADRADOS LATINOS YDISEOS RELACIONADOS

lineales en las ecuaciones normales, 10 cual implica que deben imponerse dos restricciones para resolver la ecuacin 418. Las restricciones usuales son (4-19) Al utilizar estas restricciones, las ecuaciones normales se simplifican considerablemente. De hecho, quedan como
abfi = Y.. bfi+bf. = y. afi +ap'. =
J

y..
.J

i=l, 2, , a j= 1,2, , b

(4-20)

cuya solucin es
fi= Y .. t.=y-.-y-. l. i=l,2, ,a j= 1,2, , b

..... '

(4-21)

{Jj = Y.j - Y ..

Al utilizar la solucin de la ecuacin normal de la ecuacin 4-21, puede encontrarse el valor estimado o ajustado de Ylj como

~ij = fi+f; +P j

=Y.
~

+(~

=YI. +Y.

~ YI. - Y. )+(- - Y. Y.j -)

j -

Y ..

Este resultado se us anteriormente en la ecuacin 4-13 para calcular los residuales de un diseo de bloques aleatorizados. La prueba general de significacin de la regresin puede usarse para desarrollar el anlisis de varianza del diseo de bloques completos aleatorizados. Al utilizar la solucin de las ecuaciones normales dada por la ecuacin 4-21, la reduccin en la suma de cuadrados para ajustar el modelo completo es
R(Il, r; (J)= fiy.. +

f YI. + Pv, =Y. Y.. + ~ o - Y.. Yi. + ~ YI. -)


I

1...1

j".l

~
;;1

~
j;l

(~ - Y.. v, ~)
2

v.,

_L+~

2.

~
1;1

- _L+~ Y.jY.j _L YI.YI. b ~ ab


_.1 _ _ ..

y2 b = _,.+
1-1

a j;l 2. y2 y
a ab

j-1

con a

+ b - 1 grados de libertad, y la suma de cuadrados del error es


SSE

= LL
b
1-1 j-1

y: -R(Il,t,{J)

b ~~ - - Y. = ~ ~ (Yij - YI. - Yj +- )2
1;1 j;l

41 DISEO DE BLOQUES COMPLETOS ALEATORlZADOS

143

con (a - 1)(b ~ 1) grados de libertad. Compare esta ltima ecuacin con SSE en la ecuacin 4-7. Para probar la hiptesis Ho:r = O, el modelo reducido es
YIj

=p.+P

+EIj

que es un anlisis de varianza de un solo factor. Por analoga con la ecuacin 3-5, la reduccin en la suma de cuadrados para ajustar el modelo reducido es
R(p., P) =

L
j=1

Y.j
a

que tiene b grados de libertad. Por lo tanto, la suma de cuadrados debida a {r} despus de ajustar p. y {P) es
R(r\ u, P) = R(!l, t, P)- R(p., P) =R(Modelo completo) - R(Modelo reducido)

=L
/=1

.2

Yi. + Y.j b j'-l a

22

_L..._
ab

b
j-l

Y.j a

=
;;:1

Y-~b

expresin que se identifica como la suma de cuadrados de los tratamientos con a - 1 grados de libertad (ecuacin 4-10). La suma de cuadrados de los bloques se obtiene ajustando el modelo reducido
YIj

= p.+r/ +Eif

que tambin es un anlisis de un solo factor. De nueva cuenta, por analoga con la ecuacin 3-5, la reduccin en la suma de cuadrados para ajustar este modelo es
R(p., r) =

L
i=1

con a grados de libertad. La suma de cuadrados de los bloques {Pj} despus de ajustar p. y {r/} es
R(P1!l, r)

= R(p., r, P)- R(p., r)

-z ~+L _'J_L..._~
2
b

y2

/=1

j-l

ab

/'-1

=L
j=l

z..z. a ab
2 2

con b - 1 grados de libertad, la cual se haba dado anteriormente como la ecuacin 4-11. Se han desarrollado las sumas de cuadrados de los tratamientos, de los bloques y del error en el diseo de bloques completos aleatorizados utilizando la prueba general de significacin de la regresin. Aun cuando la prueba general de significacin de la regresin no se usara ordinariamente para hacer el anlisis real de los datos en un bloque completo aleatorizado, en ocasiones el procedimiento resulta til en diseos de bloques aleatorizados ms generales, como los que se revisan en la seccin 4-4.

144

CAPTIJLO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS YDISEOS RELACIONADOS

Anlisis exacto del problema del valor faltante En la seccin 4-1.3 se present un procedimiento aproximado para solucionar las observaciones faltantes .en el RCBD. Este anlisis aproximado consiste en estimar el valor faltante de tal modo que se minimice el cuadrado medio del error. Puede demostrarse que el anlisis aproximado produce un cuadrado medio sesgado de los tratamientos en el sentido de que E(MSnalamienlos) es mayor que E(MSE) si la hiptesis nula es verdadera. Por consiguiente, se reportan demasiados resultados significativos. El problema del valor faltante puede analizarse exactamente utilizando la prueba general de significacin de la regresin. El valor faltante hace que el diseo sea no balanceado, y dado que no todos los tratamientos ocurren en todos los bloques, se dice que los tratamientos y los bloques no son ortogonales. Este mtodo de anlisis tambin se usa en tipos ms generales de diseos de bloques aleatorizados; el tema se analiza con mayor amplitud en la seccin 4-4. En el problema 4-26 se le pide al lector que realice el anlisis exacto para un diseo de bloques completos aleatorizados con un valor faltante.

4..2

DISEO DE CUADRADO LATINO

En la seccin 4-1 se introdujo el diseo de bloques completos aleatorizados como un diseo para reducir el error residual de un experimento al eliminar la variabilidad debida a una variable perturbadora conocida y controlable. Hay otros tipos de diseos que utilizan el principio de la formacin de bloques. Por ejemplo, suponga que un experimentador estudia los efectos que tienen cinco formulaciones diferentes de la carga propulsora utilizada en los sistemas de expulsin de la tripulacin de un avin basado en la rapidez de combustin. Cada formulacin se hace con un lote de materia prima que slo alcanza para probar cinco formulaciones. Adems, las formulaciones son preparadas por varios operadores, y puede haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer hay dos factores perturbadores que sern "calculados en promedio" en el diseo: los lotes de materia prima y los operadores. El diseo apropiado para este problema consiste en probar cada formulacin exactamente una vez con cada uno de los cinco operadores. Al diseo resultante, ilustrado en la tabla 4-9, se le llama diseo de cuadrado latino. Observe que el diseo es un arreglo cuadrado y que las cinco formulaciones (o tratamientos) se denotan por las letras latinas A, B, e, D y E; de ah el nombre de cuadrado latino. Se observa que tanto los lotes de materia prima (renglones) como los operadores (columnas) son ortogonales a los tratamientos. El diseo de cuadrado latino se usa para eliminar dos fuentes de variabilidad perturbadora; es decir, permite hacer la formacin de bloques sistemtica en dos direcciones. Por 10tanto, los renglones y las columnas representan en realidad dos restricciones sobre la aleatorizacin. En general, un cuadrado latino para p factores, o cuadrado latino p X p, es un cuadrado con p renglones y p columnas. Cada una de las p2

Tabla 4.9

Disefio del cuadrado latino para el problema de la carga propulsora

Lotes de materia prima

1
A = 24

2
B = 20

Operadores 3

1 2 3
4 5

B= e= D = E =

17 18 26 22

e = 24

D = 38 E = 31 A = 30

e =19 D = 30 E = 26 A = 26 B = 20

D =24 E=27 A =27 B = 23 C= 29

5 E=24 A = 36 B =21 C=22 D = 31

4-2 DISEO DECUADRADO LATINO

145

celdas resultantes contiene una de las p letras que corresponde a los tratamientos, y cada letra ocurre una y slo una vez en cada rengln y columna. Algunos ejemplos de cuadrados latinos son

4x4
ABDC BCAD CDBA DACB

5x5
ADBEC DACBE CBEDA BEACD ECDAB

6x6
ADCEBF BAECFD CEDFAB DCFBEA FBADCE EFBADC

El modelo estadstico de un cuadrado latino es

i = l , 2, , p
Yjk

= f..l +a +r + Pk +ejk {
j

1, 2, , P k-1, 2, , P

j:

(4-22)

donde Yjk es la observacin en el rengln z-simo y la columna k-sima para el tratamiento j-simo, It es la media global, a es el efecto del rengln i-simo, t j es el efecto del tratamiento j-simo, Pk es el efecto de la columna k-sima, y ejk es el error aleatorio. Observe que se trata de un modelo de los efectos. El modelo es completamente aditivo; es decir, no hay interaccin entre renglones, columnas y tratamientos. Puesto que hay una sola observacin en cada celda, slo se necesitan dos de los tres subndices i, j Yk para denotar una observacin particular. Por ejemplo, con referencia al problema de la carga propulsora de la tabla 4-9, si i = 2 Yk = 3, se encuentra automticamente quej = 4 (formulacinD), y si i = 1 Yj = 3 (formulacin C), se encuentra que k =3. sta es una consecuencia de que cada tratamiento aparezca una vez exactamente en cada rengln y columna. El anlisis de varianza consiste en hacer la particin de la suma de cuadrados total de las N = p2 observaciones en los componentes de los renglones, las columnas, los tratamientos y el error, por ejemplo,
SST

= SS R.nglone> + SS Columna. + SS 'Tratamientos + SSE

(4-23)

con los respectivos grados de libertad

p2 -1 = p-1 + p-l+ p-1+(p- 2)(p-1)


Bajo el supuesto usual de que e'k es NID(O, 02), cada suma de cuadrados del lado derecho de la ecuacin 4-23 es, al dividir por 02, una variable aleatoria ji-cuadrada con una distribucin independiente. El estadstico apropiado para probar que no hay diferencias en las medias de los tratamientos es

F.0-

MSTratami.nto.

.MSE

que se distribuye como Fp - 1. (p - 2)(p - l ) bajo la hiptesis nula. Tambin puede probarse la ausencia de efectos de los renglones o la ausencia de efectos de las columnas formando el cociente de MS&nglone. o MSColumnas conMSE Sin embargo, puesto que los renglones y las columnas representan restricciones sobre la aleatorizacin,estas pruebas quiz no sean apropiadas. En la tabla 4-10 se presenta el procedimiento de clculo para el anlisis de varianza. Por las frmulas de clculo para las sumas de cuadrados, se observa que el anlisis es una extensin simple del RCBD, con la suma de cuadrados resultante de los renglones obtenida a partir de los totales de los renglones.

- - -

_ _ "O

146

CAPTIJLO 4 BLOQUES ALEATORIZAOOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 410 Anlisisde varianza del diseo del cuadrado latino Fuente de Grados de variacin Suma de cuadrados libertad 1l:atamientos Renglones Columnas

SSTta,amien'", - Y.j. - N P j-l SSRe.glooe. = SSColumn.. =

_1

Cuadrado medio
R = MSTratamie.,os o MS;

Y~"

p-1 p-1 p-1


(p -2)(P -1)

1 2 N p.. Yi.. - Y... ,.1


p

SSRenglo.e. p-1 SSColumn.. p-1


SSE
(p-2)(p~

p2: Y.,k - Y... N


P

knl

Error
lbtal

SS; (por sustraccin)

1)

SS =
T

2:2:2: y 2 _YN...
,

2
p2-1

"

"k

ljk

EJEMPLO 4,.3 .......................".."""...",,...................................


Considere el problema de la carga propulsora descrito previamente, donde tanto los lotes de materia prima como los operadores representan restricciones sobre la aleatorizacin. El diseo para este experimento, el cual se muestra en la tabla 4-9, es un cuadrado latino 5 x 5. Despus decodificar los datos restando 25 de cada observacin, se obtienen los datos de la tabla 411. Las sumas de cuadrados del total de los lotes (renglones) y los operadores (columnas) se calculan de la siguiente manera:

SST

= LJ LJ LJ ~~~
, I

~-~ Y,jk N

=680- (10)2 =676.00


SS
Lote.

~ -p ~
,~1

25

2 y __ Ji.. - N

SS

Operadores

= !.[(-14)2 +9 2 +5 2 +3 2 +7 2]_ (10)2 = 68.00 5 ~ 1 p 2 ~ 2 Y...

= p LJ
k-l

Y.. k

Ji

= !.[(-18)2 +182 +(_4)2 +5 2 +9 2]_ (10)2 = 150.00


5 25
Tabla 411 Datos codificados para el problemade la carga propulsora Operadores Lotes de

materia prima

1
A =-1 B=-8 C=-7 D= 1 E=-3

2 B=-5 C=-l D=13 E= 6 A= 5

3
C =--6 D= 5 E= 1 A= 1 B=-5

4
D=-l E= 2 A= 2 B =-2 c= 4

5
E= A= B= c= D=
9

1
2

-1
11 -4

3 4 5
Y.. k

Yi.. -14 9 5

-3
6

3
7

-18

18

-4

10 = Y..

42 DISEO DECUADRADO LATINO

147

Tabla 412 Anlisis de varianza del experimento de la carga propulsora

Fuente de variacin Formulaciones Lotes de materia prima Operadores Error lbtal

Sumade cuadrados
330.00 68.00 150.00 128.00 676.00

Grados de libertad
4 4 4 12

Cuadrado medio
82.50 17.00 37.50 10.67 7.73

Valor P
0.0025

24

Los totales para los tratamientos (las letras latinas)


Letra latina

SOL.

Total del tratamiento


Y.l. = 18 Y.2.

A B

= -24 =

e
D E

Y.3. =-13 YA. = 24


Y.5.

La suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales como SS Fonnulaoionos

= p"f:t

~ y2_~

.).

= 182 +(-24)2 +(;13)2 +24


SSE

+5

(1~{

= 330.00

La suma de cuadrados del error se encuentra por sustraccin:

= SST - SS Lotes - SSOperado .... - SSFonnulaoionc. = 676.00- 68.00-150.00- 330.00 = 128.00

El anlisis de varianza se resume en la tabla 4-12. Se concluye que hay una diferencia significativa en la rapidez de combustin media generada por las diferentes formulaciones de la carga propulsora. Thmbin hay indicios de que hay diferencias entre los operadores, por lo que la formacin de bloques de este factor fue una buena precaucin. No hay evidencia slida de una diferencia entre los lotes de materia prima, por lo que al parecer en este experimento particular hubo una preocupacin innecesaria en esta fuente de variabilidad. Sin embargo, la formacin de bloques de los lotes de materia prima es por lo general una buena idea.
" " " " " 11I 11I 11I " " " " " " " " " " " 11I 11I 11I " "

Como en cualquier problema de diseo, el experimentador debera investigar la adecuacin del modelo inspeccionando y graficando los residuales. Para un cuadrado latino, los residuales estn dados por
eijk

= Yijk -

Yijk

Yijk -

Yi.. - Y. j . - Y.. k + 2y._.

El lector deber encontrar los residuales del ejemplo 4-4 y construir las grficas apropiadas.

148
Tabla 4-13
Tamao

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS YDISEOS RELACIONADOS


Cuadrados latinos estndares y nmero de cuadrados latinos de varios tamaos3x3 4x4 5x5 6x6 7x7
ABC BCA CAB ABCD BCDA CDAB DABC ABCDE BAECD CDAEB DEBAC ECDBA ABCDEF BCFADE CFBEAD DEABFC EADFCB FDECBA ABCDEFG BCDEFGA CDEFGAB DEFGABC EFGABCD FGABCDE GABCDEF

p xp ABC BCD CDE P A 8

Ejemplos de cuadrados estndares

PAB ... (P-l)

Nmero de cuadrados estndares Nmero total de cuadrados latinos

56 161,280

9408 818,851,200

16,942,080 61,479,419,904,000
p!(P-l)! x (nmero de cuadrados estndares)

12

576

-Partc dc la informacin de esta tabla se encuentra en Statisticallllbles for Biologica~ Agriculturala7Ui Medical Research; 4a. edicin, de RA. Fisher y F. Yates, Oliver & Boyd, Edmburgo. Es poco lo que se sabe de las propiedades de los cuadrados latinos ms grandes que 7 x 7.

A un cuadrado latino en el que el primer rengln y la primera columna constan de letras escritas en orden alfabtico se le llama cuadrado latino estndar, que es el diseo que se utiliz en el ejemplo 4-3. Siempre es posible obtener un cuadrado latino estndar escribiendo el primer rengln en orden alfabtico y escribiendo despus cada rengln sucesivo como la sucesin de letras que estn justo arriba, recorridas un lugar a la izquierda. En la tabla 4-13 se resumen varios hechos importantes acerca de los cuadrados latinos y de los cuadrados latinos estndares. Como con cualquier diseo experimental, las observaciones del cuadrado latino debern tomarse de manera aleatoria. El procedimiento de aleatorizacin correcto es seleccionando al azar el cuadrado empleado. Como se observa en la tabla 4-13, hay un gran nmero de cuadrados latinos de un tamao particular, por 10 que es imposible enumerar todos los cuadrados y seleccionar uno al azar. El procedimiento usual es seleccionar un cuadrado latino de una tabla de estos diseos, como en Fisher y Yates [45], Y despus arreglar al azar el orden de los renglones, las columnas y las letras. Esto se analiza con mayor detalle en Fisher y Yates [45]. Ocasionalmente, falta una observacin en un cuadrado latino. Para un cuadrado latino p x p, el valor faltante puede estimarse con 2Y... P Yi .. + Yr + Y.k (4-24) Yijk = (p_ 2)(p-l)
( I I I )_ I

donde las primas indican los totales del rengln, la columna y el tratamiento con el valor faltante, y es el gran total con el valor faltante. Los cuadrados latinos pueden ser tiles en situaciones en las que los renglones y las columnas representan los factores que el experimentador en realidad quiere estudiar yen las que no hay restricciones sobre la aleatorizacin. Por lo tanto, los tres factores (renglones, columnas y letras), cada uno con p niveles, pueden investigarse en slo p2 corridas. En este diseo se supone que no existe interaccin entre los factores. Se abundar ms adelante sobre el tema de la interaccin. Rplicas de cuadrados latinos Una desventaja de los cuadrados latinos pequeos es que proporcionan un nmero relativamente pequeo de grados de libertad del error. Por ejemplo, un cuadrado latino 3 x 3 slo tiene dos grados de libertad del error, un cuadrado latino 4 x 4 slo tiene seis grados de libertad del error, etc. Cuando se usan cuadrados latinos pequeos, con frecuencia es deseable hacer rplicas de los mismos para incrementar los grados de libertad del error.

v:

4-2 DISEO DECUADRADO LATlNO Tabla 4.14 Anlisis de varianza de un cuadrado latino con rplicas, caso 1

149

Fuente de variacin
Tratamientos

Sumade cuadrados
np. IgI
1
P

Grados de libertad
p-l p-l p-l n-l (p-l)[n(p + 1)-3]

Cuadradomedio
SS1'ra.amiCDIO.

Yj-N
2

y~

MSTratarnienlOS

p-l
SSRCnglODC'

Renglones Columnas Rplicas Error Thtal

2 Y"'- y.... np. N 1 2 Y.. y.... np N 1 " y.... p2 Y..I-N


1=1

p-l
SSColwnnas

L-

lftl

p-l
SSR6plicas

Iftl

n~1

Sustraccin
L L L L yJkJ

SSE

(p-l)[n(p+l)....,3]

-j;

np2-1

Existen varias maneras de hacer rplicas de un cuadrado latino. Para ilustrar este punto, suponga que se hacen n rplicas del cuadrado latino 5 X 5 utilizado en el ejemplo 4-3. Esto podra haberse hecho de la manera siguiente:
1. Usando los mismos lotes y operadores en cada rplica. 2. Usando los mismos lotes pero operadores diferentes en cada rplica (o, de manera equivalente, usando los mismos operadores pero lotes diferentes). 3. Usando diferentes lotes y diferentes operadores.

El anlisis de varianza depende del mtodo utilizado para hacer las rplicas. Considere el caso 1, donde en cada rplica se usan los mismos niveles de los factores para la formacin de bloques en los renglones y las columnas. Sea Yijklla observacin del rengln i, el tratamiento j, la columna ky la rplica l. Hay en total N = np2observaciones. El anlisis de varianza se resume en la tabla 4-14. Considere ahora el caso 2 y suponga que en cada rplica se usan nuevos lotes de materia prima pero los mismos operadores. Por lo tanto, hay ahora cinco nuevos renglones (en general, p nuevos renglones)
Tabla 4.15 Anlisis de varianza de un cuadrado latino con rplicas, caso 2

Fuente de variacin
Tratamientos

Sumade cuadrados
np. p
1

y'j"-N
2

Grados de libertad
p-l n(p -1) p-l n-l (p -l)(np -1)

Cuadradomedio
SSTratamleD'OS

y.2..

1-1

p-l
SSRcnglDDC.

Renglones Columnas Rplicas Error Thtal

~LLy2 -L z;
1-1

1 " 1

"2

i~1

1..1

Iftl

p2

n(p-l)
SSCD]Umnas

np p2

1 "

Y...
2
Iftl

k~1

Y.l,- N
. 2

2 y....

p-l
SSR6p1icas

I-

Y... N
2

n-l
SSE

Sustraccin

(p-l)(np-l).

Y5kl - ; . j k
I

np2-1

150 Fuente de variacin

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRAIXJS LATINOS Y DISEOS RELACIONADOS

Tabla 4.16 Anlisis de varianza de un cuadrado latino con rplicas, caso 3

Sumade cuadrados
1 p np. J~l 1 n 1
n

Gradosde libertad
p-l

Cuadradomedio
SSnatamientos
MSrratamientD!I

Tratamientos Renglones

L Yj,-N y ....
2
2

p-l
SS"engloneo

p~~ YJ./- ~ p~6 Y~kJ- ~


1
---
P
n

Id.
p2
2

n(p -1) n(p -1) n-l (p -1)[n(p -1) -1]

n(p-l)
SSColomnas

Columnas Rplicas Error


Total

LL
p2

n(p-l)
SSRplicas

L Y.. /-N y ....


n

/~1

Sustraccin

n-l SSE (p -1)[n(p -1)-1]

~~~~ Y:kJ _Y;;

np2-1

dentro de cada rplica. El anlisis de varianza se resume en la tabla 4-15. Observe que la fuente de variacin de los renglones mide en realidad la variacin entre los renglones dentro de las n rplicas. Por ltimo, considere el caso 3, donde se usan nuevos lotes de materia prima y nuevos operadores en cada rplica. Ahora la variacin que resulta tanto de los renglones como de las columnas mide la variacin que resulta de estos factores dentro de las rplicas. El anlisis de varianza se resume en la tabla 4-16. Hay otros enfoques para analizar cuadrados latinos con rplicas que permiten la presencia de algunas interacciones entre tratamientos y cuadrados (referirse al problema 419). Diseos alternados y diseos balanceados para efectos residuales Ocasionalmente aparece un problema en el que los periodos son uno de los factores del experimento. En general, hay p tratamientos que deben probarse en p periodos utilizando np unidades experimentales. Por ejemplo, un analista del desempeo humano est estudiando el efecto de dos fluidos de restitucin para la deshidratacin en 20 sujetos. En el primer periodo, a la mitad de los sujetos (elegidos al azar) se le administra el fluido A y a la otra mitad el fluido B. Al trmino del periodo se mide la respuesta, y se deja transcurrir un lapso en el que se elimina cualquier efecto fisiolgico de los fluidos. Despus el experimentador hace que los sujetos que tomaron el fluido A tomen el fluido B y aquellos que tomaron el fluido B tomen el fluidoA. A este diseo se le llama diseo alternado o entrecruzado. Se analiza como un conjunto de 10 cuadrados latinos con dos renglones (los periodos) y dos tratamientos (los tipos de fluido). Las dos columnas en cada uno de los 10 cuadrados corresponden a los sujetos. En la figura 4-7 se muestra la disposicin de este diseo. Observe que los renglones del cuadrado latino representan a los periodos y que las columnas representan a los sujetos. Los 10 sujetos que recibieron primero el fluido A (1, 4, 6, 7, 9, 12, 13, 15, 17 Y 19) se determinaron al azar.
Cuadrados latinos

-- -Sujeto Periodo 1 Periodo 2

11

1II

IV

VI

A B

4 A B

5
B

6
A B

7 A

8
B

9 10
A

11 12
B A

-- -- -- -13 14
B

VII

VIII

IX

15 16
B

17 18
B A

19 20
B A

B A

B A

A B

A B

A B

Figura 4.7

Un diseo alternado.

4-3 DISENO DECUADRADO GRECOLATINO

151

Tabla 417 Anlisis de varianza del diseo alternado de la figura 47 Grados de Fuente de libertad variacin Sujetos (columnas) 19 Periodos (renglones) 1 Fluidos (letras) 1 Error 18 39 Total

En la tabla 4-17 se resume un anlisis de varianza. La suma de cuadrados de los sujetos se calcula como la suma de cuadrados entre los totales de los 20 sujetos corregida, la suma de cuadrados de los pe~ riodos es la suma de cuadrados entre los renglones corregida, y la suma de cuadrados de los fluidos se calcula como la suma de cuadrados entre los totales de las letras corregida. Para ms detalles del anlisis estadstico de estos diseos, ver Cochran y Cox [26], John [61d] y Anderson y McLean [2]. 'Iambin es posible emplear diseos tipo cuadrado latino para experimentos en los que los tratamientos tienen un efecto residual; es decir, por ejemplo, si los datos del fluidoB en el periodo 2 siguen reflejando algn efecto del fluido A tomado en el periodo 1. En Cochran y Cox [26] y John [61d] se estudian en detalle los diseos balanceados para efectos residuales.

4..3 DISEO DE CUADRADO GRECOLATINO


Considere un cuadrado latino p x p al cual se le superpone un segundo cuadrado latino p x p en el que los tratamientos se denotan con letras griegas. Si cuando se hace la superposicin los dos cuadrados tienen la propiedad de que cada letra griega aparece una y slo una vez con cada letra latina, se dice que los dos cuadrados latinos son ortogonales, y al diseo obtenido se le llama cuadrado grecolatino. En la tabla 4~ 18 se muestra un ejemplo de un cuadrado grecolatino 4 x 4. El diseo de cuadrado grecolatino puede usarse para controlar sistemticamente tres fuentes de variabilidad extraa, es decir, para hacer la formacin de bloques en tres direcciones. El diseo permite la investigacin de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una conp niveles en slo p2 corridas. Existen cuadrados grecolatinos para toda p ~ 3, excepto p = 6.

Tabla 418 Diseo delcuadrado grecolatino 4 X 4 Columna 1 2 3 Rengln 1 Aa Cy Bf3


2 3 4 B

Ay
Da C

Df3
A

Ca
By

Cf3

Ba

Af3

152

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 419 Anlisis de varianza de un diseo del cuadrado grecolatino

Fuente de variacin Tratamientoscon letras latinas Tratamientoscon letras griegas Renglones Columnas
Error
L

Suma de cuadrados
1 P SS=-~
P
2

Grados de libertad
p-l p-l

p? 1-1
k~1

2._k Y.I . N

SS SS SS

1 =-2: y p

.z; ..k. N
2 2

Renglone. -

1 P -- ~

Columnas -

~- ~ 2 ~L p L.J Y .../ N
'~l
2

.-1 1
P

2_k p? v.: N
2

p-l p-l

SSE (por sustraccin) SST =


i

(p - 3)(P -1)

lbtal

2:2:2:2: Yi~kI -yN""


j
k 1

El modelo estadstico para el diseo de cuadrado grecolatino es


i = 1, 2,
Yij/d=fl+(Ji+ Tj+w k+'I'/+eijkl

, P
(4-25)

{
.

j= 1,2, , P k=l , 2, , P
l = 1, 2,

, P

donde Yijkl es la observacin del rengln i y la columna l para la letra latinaj y la letra griega k, (Ji es el efecto del rengln i-simo, Tj es el efecto del tratamiento de letra latinaj, W k es el efecto del tratamiento de letra griega k, '111 es el efecto de la columna l, y e ijkl es un componente NID(O,02) del error aleatorio. Slo son necesarios dos de los cuatro subndices para identificar completamente una observacin. El anlisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas aparecen exactamente una vez en cada rengln y columna, y exactamente una vez con cada letra latina, el factor representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de letras latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir de los totales de las letras griegas y el error experimental se reduce adicionalmente en esta cantidad. En la tabla 4-19 se ilustran los detalles de los clculos. La hiptesis nula de la igualdad de tratamientos de renglones, columnas, letras latinas y letras griegas, se probara dividiendo el cuadrado medio correspondiente por el cuadrado medio del error. La regin de rechazo es la cola superior del punto de la distribucin

Fp _1,

(P-3)(P-l)'

EJEMPLO 4-4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Suponga que en el experimento de la carga propulsora del ejemplo 4-3 un factor adicional, los montajes de prueba, podra ser importante. Sea que haya cinco montajes de prueba denotados por las letras griegas a, P, y, t:5 y e. En la tabla 4-20 se muestra el diseo de cuadrado grecolatino 5 x 5 resultante. Observe que, debido a que los totales de los lotes de materia prima (renglones), los operadores (columnas) y las formulaciones (letras latinas) son idnticos a los del ejemplo 4-3, se tiene

SSlJ:Jte.

= 68.00

SSOperadore.

= 150.00

SSPonnuladone.

= 330.00

4-3 DISEO DECUADRADO GRECOLATINO

153

Tabla 4-20 Disefiodel cuadrado grecolatino para el problemade la carga propulsora Lotes de materia prima Operadores Aa BfJ Cy D Ee

1 2 3 4 5

1 =-1 :-8 :-7 = 1 = -3

2
By = -5 C =-1

De =13 Ea: 6 AfJ = 5

3 Ce :-6 Da= 5 EfJ = 1 Ay : 1 B =-5

DfJ Ey A Be Ca

4 =-1 : 2 : 2 :-2 = 4 5

E Ae Ba CfJ

5 =-1 :11 :-4 :-3 Dy= 6


9

v.:
-14 9 5 3 7 10 = Y.

v.

-18

18

-4

Los totales de los montajes de prueba (las letras griegas) son Letra griega Total de la prueba de ensamblaje

a 3
y

= 10 Y.2. = - 6 Y.3. = - 3
Y.. L

d
E

YA.= -4

Y.5.

13

Por lo tanto, la suma de cuadrados debida a los montajes de prueba es


1 P 2 SS Enoamblllieo - - LJ Y..2_b " k. N - p
k~l

En la tabla 4*21 se resume el anlisis de varianza completo. Las formulaciones son diferentes significativamente en 1%. Al comparar las tablas 4*21 y 4*12, se observa que al sacar la variabilidad debida a los montajes de prueba, e~ error experimental disminuye. Sin embargo, al disminuir el error experimental, se han reducido tambin los grados de libertad de 12 (en el diseo del cuadrado latino del ejemplo 4-3) a 8. Por lo tanto, la estimacin del error tiene menos grados de libertad, y la prueba puede ser menos sensible .
.. .. .. 111 .

Tabla 4.21

Anlisis de varianza del problemade la carga propulsora Suma de cuadrados Grados de libertad
4 4 4 4 8

Fuente de variacin Formulaciones Lotes de materia prima Operadores Montajes de la prueba Error lbtal

Cuadrado medio

ValorP

330.00 68.00 150.00 62.00 66.00 676.00

82.50 17.00 37.50 15.50 8.25

10.00

0.0033

24

-------------------------------------

154

CAPTIJLO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS YDISEOS RELACIONADOS

Puede hacerse cierta ampliacin del concepto de los pares ortogonales de cuadrados latinos que forman un cuadrado grecolatino. Un hipercuadrado p x p es un diseo en el que se superponen tres o ms cuadrados latinos ortogonales p x p. En general, hasta p + 1 factores podran estudiarse si se dispone de un conjunto completo de p - 1 cuadrados latinos ortogonales. En este diseo se utilizaran todos los (p + 1)(P -1) = p2 -1 grados de libertad, por lo que se necesita una estimacin independiente de la varianza del error. Desde luego, no debe haber interacciones entre los factores cuando se usan hipercuadrados.

4..4

DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

En ciertos experimentos en los que se utilizan diseos de bloques aleatorizados quiz no sea posible correr todas las combinaciones de los tratamientos en cada bloque. Situaciones como sta ocurren generalmente por limitaciones del aparato experimental o de las instalaciones o por el tamao fsico del bloque. Por ejemplo, en el experimento de la prueba de la dureza (ejemplo 4-1), suponga que debido a sus dimensiones cada ejemplar de prueba slo puede usarse para probar tres puntas. Por 10 tanto, no es posible probar todas las puntas en cada uno de los ejemplares. Para este tipo de problema es posible utilizar diseos de bloques aleatorizados en los que cada tratamiento no est presente en cada bloque. Estos diseos se conocen como diseos de bloques incompletos aleatorizados. Cuando las comparaciones de todos los tratamientos son igualmente importantes, las combinaciones de los tratamientos usadas en cada bloque debern seleccionarse en una forma balanceada, es decir, de tal manera que cualquier par de tratamientos ocurra conjuntamente el mismo nmero de veces que cualquier otro par. Por 10 tanto, un diseo de bloques incompletos balanceados (BIBD, balanced incomplete block design) es un diseo de bloques incompletos en el que dos tratamientos cualesquiera aparecen conjuntamente el mismo nmero de veces. Suponga que haya tratamientos y que cada bloque puede contener exactamente k (k < a) tratamientos. Un diseo de bloques incompletos balanceados puede construirse tomando G) bloques y asignando una combinacin de tratamientos diferente a cada bloque. Con frecuencia, sin embargo, puede obtenerse un diseo balanceado con menos de (: ) bloques. Tablas de BIBD se proporcionan en Fisher y Yates [45], Davies [36] y Cochran y Cox [26]. Como un ejemplo, suponga que un ingeniero qumico piensa que el tiempo de reaccin de un proceso qumico es una funcin del tipo de catalizador empleado. Se estn investigando cuatro catalizadores. El procedimiento experimental consiste en seleccionar un lote de materia prima, cargar la planta piloto, aplicar cada catalizador en una corrida separada de la planta piloto y observar el tiempo de reaccin. Debido a que las variaciones en los lotes de materia prima pueden afectar el desempeo de los catalizadores, el ingeniero decide usar los lotes de materia prima como bloques. Sin embargo, cada lote es apenas 10 suficientemente grande para permitir que se prueben tres catalizadores. Por lo tanto, debe usarse un diseo

Tabla 4.22 Disefio de bloques incompletos balanceados para el


experimento del catalizador

Tratamiento (catalizador) 1 2 3 4
Yi

Bloque (lote de materia prima) 1 2 3 73 74 75 67 73 75 68 75 72 221 224 207

4 71 72 75

Yi.

218 214 216 222 870= Y..

218

4-4 DISEOS DEBLOQUES INCOMPLETOS BALANCEADOS

155

de bloques incompletos aleatorizados. El diseo de bloques incompletos balanceados para este experimento, junto con las observaciones registradas, se muestran en la tabla 4-22. El orden en que se corren los catalizadores en cada bloque est aleatorizado.

4..4.1

Anlisis estadstico del diseo de bloques incompletos balanceados

Como de costumbre, se supone que haya tratamientos y b bloques. Adems, se supone que cada bloque contiene k tratamientos, que cada tratamiento ocurre r veces en el diseo (o que se hacen r rplicas del mismo), y que hay N = ar = bk observaciones en total. Asimismo, el nmero de veces que cada par de tratamientos aparece en el mismo bloque es A = r(k-1)

a-1

= b, se dice que el diseo es simtrico. El parmetro Adebe ser un entero. Para deducir la relacin para A, considere cualquier tratamiento, por ejemplo el tratamiento 1. Puesto que el tratamiento 1 aparece en r bloques y hay otros k -1 tratamientos en cada uno de esos bloques, hay r(k -1) observaciones en un bloque que contiene al tratamiento 1. Estas r(k - 1) observaciones tambin tienen que representar a los a - 1 tratamientos restantes Aveces. Por lo tanto, A(a - 1) = r(k - 1). El modelo estadstico del BIBD es
Si a
Yij

=J1.+T +{Jj +E;

(4-26)

donde Yij es la observacin i-sima en el bloque j-simo, J1. es la media global, T es el efecto del tratamiento i-simo, {Jj es el efecto del bloque j-simo, y Ej es el componente NID(O, 02) del error aleatorio. La variabilidad total en los datos se expresa por la suma de cuadrados totales corregida:

SST =

LL Y~ - ~
I )

(4-27)

Puede hacerse la particin de la variabilidad total en

SST

= SSTtalalnientos(ajustadoo) +SSBlnques +SSE

donde la suma de cuadrados de los tratamientos est ajustada para separar los efectos de los tratamientos y de los bloques. Este ajuste es necesario porque cada tratamiento est representado en un conjunto diferente de r bloques. Por lo tanto, las diferencias entre los totales de los tratamientos no ajustados Yl.>Y2., ..., Ya. tambin son afectadas por las diferencias entre los bloques. La suma de cuadrados de los bloques es (4-28) donde Yj es el total del bloquej-simo. SSBloques tiene b - 1 grados de libertad. La suma de cuadrados de los . tratamientos ajustada es

SSTratamientos(ajuotados)

=.......:.::.:....--

(4-29)

156
Fuente de variacin

CAPTULo 4

BLOQUESALEATORIZADOS, CUADRAIX)S LATINOS y DISEOS RELACIONAroS

Tabla 423 Anlisis de varianza del disefio de bloques incompletos balanceados

Suma de cuadrados

Grados de libertad

Cuadrado medio
SSTtaliUDicotmi(ajustadolj)

Tratamientos (ajustados)
1

k: ~ Aa

a-l
2

Bloques Error Total

-: y2._ L k ./ N

b-l
N-a-b + 1 N-1

a-l SSBloqu", b-1


SSE

SSE(por sustraccin)

N-a-h+l

:: YI~-~

donde Q es el total ajustado del tratamiento i-simo, el cual se calcula como


Q

= Y. -k
b
j~l

nijY.j

= 1,2, ... , a

(4-30)

con nij = 1 si el tratamiento i aparece en el bloque j y nj = Oen caso contrario. Los totales de los tratamientos ajustados siempre sumarn cero. SSnatamientos(ajustado.) tiene a - 1 grados de libertad. La suma de cuadrados del error se calcula por sustraccin como SSE

= SST -

SSTralamientos(ajustados) -

SS Bloques

(4-31)

y tiene N - a - b + 1 grados de libertad. El estadstico apropiado para probar la igualdad de los efectos de los tratamientos es

F.
o

= MS Tralamientos(ajustados)
MS E

En la tabla 4-23 se resume el anlisis de varianza.


EJEMPLO 4.. 5 .... '" . . . . . . . . . . . . . . . . . '" . . . . .

11I ..

'"

'"

'"

'"

..

..

..

Considere los datos de la tabla 4-22 para el experimento del catalizador. Se trata de un BIBD con a = 4, b = 4, k = 3, r = 3, A = 2 YN = 12.El anlisis de estos datos es el siguiente. La suma de cuadrados total es

SST =

I /

Yt -

i;
2

= 63,156- (8~~)2 = 81.00


La suma de cuadrados de los bloques se encuentra con la ecuacin 4-28 como
SSBloques

= "3 Y.~ /~l

y2

12

1 (870)2 =3[(221)2 +(207)2 +(224)2 +(218)2]- ----z = 55.00

44 DISEOS DEBWQUES INCOMPlETOS BALANCEADOS


Tabla 4.24 Anlisis de varianza del ejemplo 45 Fuente de variacin

157

Suma de cuadrados
22.75 55.00

Tratamientos (ajustados para los bloques) Bloques Error lbtal

Grados de libertad 3

Cuadrado medio
7.58 0.65

Fu 11.66

ValorP
0.0107

3
5

3.25
81.00

11

Para calcular la suma de cuadrados de los tratamientos ajustados para los bloques, primero se determinan los totales de los tratamientos ajustados utilizando la ecuacin 4-30 como

Q1 = (218)- +{221 +224+218) = -9/ 3


Q2 = (214)-+{207+224+218)=-7/3

Q3 = (216)-+{221+207+224)=-4/3 Q4 = (222)- +(221+ 207+ 218) = 20/3

La suma de cuadrados de los tratamientos ajustados se calcula con la ecuacin 4-29 como

k Q2
SS Tratamicntoo(ajuslJ>dos)
.,1 = -"";;'Aa--

= 3[(-9/3)2 +(-7/3)2 +(-4/3)2 +(20/3)2] = 227S


(2)(4)

La suma de cuadrados del error se obtiene por sustraccin como


SSE

= SST -

SSTratamiculOO(ojustadoo) -

SSBloqu

= 81.00-2275-55.00= 3.25
En la tabla 4-24 se muestra el anlisis de varianza. Puesto que el valor P es pequeo, se concluye que el catalizador empleado tiene un efecto significativo sobre el tiempo de reaccin.
" " 111 " " "

Si el factor bajo estudio es fijo, las pruebas para las medias de tratamientos individuales pueden ser de inters. Si se emplean contrastes ortogonales, los contrastes deben hacerse sobre los totales de los tratamientos ajustados, las {Q} en lugar de las {Yi)' La suma de cuadrados de los contrastes es

SS e

k(!

CQ)2

---:..,:....=:....1-----'"-

Aa! C2
i-1

donde {c} son los coeficientes de los contrastes. Pueden usarse otros mtodos de comparacin mltiple

158

CAPhuLO 4

BLOQUES ALEATORIZAIXJS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

para comparar todos los pares de efectos de los tratamientos ajustados (seccin 4-4.2), los cuales se estiman con Ti = kQ/(Aa). El error estndar del efecto de un tratamiento ajustado es

_ S_

~~~E
AU

(4-32)

En el anlisis que acaba de describirse, se ha hecho la particin de la suma de cuadrados total en una suma de cuadrados de los tratamientos ajustados, una suma de cuadrados de los bloques sin ajuste y una suma de cuadrados del error. En ocasiones habra inters en evaluar los efectos de los bloques. Para ello se requiere hacer una particin alternativa de SSTl es decir, .

SST = SSTratamientos

+SSBloques(ajUstados)

+SSE

Aqu, SSn-atamientos est sin ajuste. Si el diseo es simtrico, es decir, si a = b, puede obtenerse una frmula simple para SSBloques(ajustadOS)' Los totales de los bloques ajustados son

Q~
y

= y.J. -

L n.. v,
a
i-1
'J

j= 1,2, ... , b

(4-33)

r
SSBloquCS(ajustados)

~
j_1

(Qj)2

Ab

(4-34)

El BIBD del ejemplo 4-5 es simtrico porque a = b = 4. Por lo tanto,

Q; = (221)- t(218+ 216+ 222) = 7/3


Q~

= (224)-t(218+214+216) = 24/3

Q; = (207)-t(214+216+222)= -31/3 Q; = (218)-t(218+214+222)= O


y

s
SBloque.(ajuslados)

= 3[(7/3)2 +(24/3)2 +(-31/3)2 +(0)2] (2)( 4)

66.08

Asimismo,

ss
Tabla 4-25

= (218)2 +(214)2 +(216)2 +(222)2


3

T,ratamJentos

(870)2 = 11 67 12 .

Anlisis de varianza del ejemplo 4-5, incluyendo tanto los tratamientos como los bloques

Fuente de variacin Tratamientos (ajustados) Tratamientos (sin ajuste) Bloques (sin ajuste) Bloques (ajustados) Error Thtal

Suma de cuadrados 22.75 11.67 55.00 66.08

Grados de libertad 3 3 3 3

Cuadrado medio 7.58


22.03

ValorP

11.66 33.90

0.0107 0.0010

3.25
81.0

5
11

0.65

4-4 DISEOS DEBLOQUES INCOMPLETOS BALANCEADOS

159

En la tabla 4-25 se presenta un resumen del anlisis de varianza del BIBD simtrico. Observe que las sumas de cuadrados asociadas con los cuadrados medios de la tabla 4-25 no producen la suma de cuadrados total, es decir,

SST ;t SSTratamiontOS(ausladOS) +SSBIOQues(au,tados) +SSE


Esto es consecuencia del carcter no ortogonal de los tratamientos y los bloques.

Salida computadora Existen varios paquetes de computadora que realizarn el anlisis de un diseo de bloques incompletos balanceados. El procedimiento de Modelos Lineales Generales (General Linear Models) del SAS es uno de ellos, y Minitab, un paquete de estadstica para computadoras personales de uso generalizado, es otro. La parte superior de la tabla 4-26 es la salida del procedimiento de Modelos Lineales Generales de Minitab para el ejemplo 4-5. Al comparar las tablas 4-26 y 4-25, se observa que Minitab ha calculado la suma de cuadrados de los tratamientos ajustados y la suma de cuadrados de los bloques ajustados (en la salida de Minitab se les llama '~djSS" o SS ajustada). La parte inferior de la tabla 4-26 es un anlisis de comparaciones mltiples, en el que se utiliza el mtodo de Thkey. Se presentan los intervalos de confianza para las diferencias de todos los pares de medias y la prueba de Thkey. Observe que el mtodo de 'Iukey llevara a la conclusin de que el catalizador 4 es diferente de los otros tres.

de

4..4.2

Estimacin de mnimos cuadrados de los parmetros

Considere la estimacin de los efectos de los tratamientos en el modelo BIBD. Las ecuaciones normales de mnimos cuadrados son
a

b
j&1

/l-:Np,+r f+k Pj=Y..


.,1

T:rp,+rf

njPj

= Y.

i=l, 2,... , a j= 1, 2,... , b

(4-35)

j.,1

/3:k#+

~ ~jti +k{3j = Y-
-1

Al imponer las restricciones 1:t i

= ~ =

O, se encuentra que
b

p. = 5'. ' Adems, al utilizar las ecuaciones


b

para {p} para eliminar los efectos de los bloques de las ecuaciones para {T}, se obtiene
rld - -

nnpjT p = Iey. -
_
p.,1
pYf.;

nY.j

(4-36)

.,

Observe que el miembro del lado derecho de la ecuacin 4-36 es kQ, donde Qes el total del tratamiento ajustado r-simo (verla ecuacin 4-29). Entonces, puesto que 1:~"lnnpj = sip ;t i yn; = npj (ya quenp j O o 1), la ecuacin 4-36 puede reescribirse como

A.

r( k -l)t

A.!
p&1
p~i

tp

=kQ

i=l,2, ... ,a

(4-37)

Tabla 4-26 Anlisis de Minitab (Modelo Lineal General) para el ejemplo 4-5
ModeloLinealGeneral

Factor Catalyst Block

Type Levels Values fixed 4 1 2 3 4 fixed 4 1 2 3 4

Analysis of Variance for Time, using Adjusted SS for Tests Source Catalyst Block Error Total DF 3
3

5 11

Seq SS 11.667 66.083 3.250 81.000

Adj SS 22.750 66.083 3.250

Adj MS 7.583 22.028 0.650

11. 67 33.89

0.011 0.001

Tukey 95.0% Simultaneous Confidence Intervals Response Variable Time All Pairwise Comparisons among Levels of Catalyst Catalyst Catalyst
2 3 4

=1

subtracted from: Center 0.2500 0.6250 3.6250 Upper 2.827 3.202 6.202

Lower -2.327 -1.952 1.048

----------+---------+---------+-----(---------*---------) (----------*---------) (----------*---------) ----------+---------+---------+-----0.0 2.5 5.0


----------+---------+---------+------

Catalyst Catalyst
3 4

=2

subtracted from: Center 0.3750 3.3750 Upper 2.952 5.952

Lower -2.202 0.798

----------+---------+---------+-----0.0 2.5 5.0 ----------+---------+---------+-----(---------*---------) ----------+-._-------+---------+-----0.0 2.5 5.0

(---------*---------) (----------*---------)

Catalyst = 3 subtracted from: Catalyst


4

Lower 0.4228

Center 3.000

Upper 5.577

Tukey Simultaneous Tests Response Variable Time All Pairwise Comparisons among Levels of Catalyst Catalyst = 1 subtracted from: Level Catalyst
2 3 4

Oifference of Means 0.2500 0.6250 3.6250

SE of Oifference 0.6982 0.6982 0.6982

T-Value 0.3581 0.8951 5.1918

Adjusted P-Value 0.9825 0.8085 0.0130

C.ata l yst = 2 subtracted from: Level Catalyst 3


4

Oifference of JlIeans 0.3750 3.3750

SE of .oi fference 0.6982 0.6982

T-Value 0.5371 4.8338

Adjusted P-Value 0.9462 0.0175

Catalyst = 3 subtracted from: Level Catalyst 4 Difference of Means 3.000 SE of Difference 0.6982 T-Value 4.297 Ad)usted P-Value 0.0281

H DISEOS DEBLOQUES INCOMPLETOS BALANCEADOS

161

Por ltimo, observe que la restriccin 1:~~1 ti == oimplica que 1:~~lt p = -tj Y recuerde que r(k-1) = A(a1), de donde se obtiene p"i
Mt

= kQj

i = 1, 2, ..., a

(4-38)

Por lo tanto, los estimadores de mnimos cuadrados de los efectos de los tratamientos en el modelo de bloques incompletos balanceados son i = 1, 2,... , a (4-39)

Como una ilustracin, considere el BmD del ejemplo 4-5. Puesto que Ql = -9/3, Q2 = -7/3, Q3 = -4/3
Y Q4 = 20/3, se obtiene

_ 3(-9/3) __ 8 tI - (2)(4) - 9/

t == 3(-7/3)=_7/8
2

(2)(4)
4

t - 3(-4/3) __4
3 -

(2)(4) -

/8

t == 3(20/3) = 20/8

(2)(4)

como se encontr en la seccin 4-4.1.

4..4.3

Recuperacin de informacin interbloques en el diseo de bloques incompletos balanceados

Al anlisis del BIBD presentado en la seccin 4-4.1 suele llamrsele el anlisis intrabloques porque las diferencias de los bloques se eliminan y todos los contrastes de los efectos de los tratamientos pueden expresarse como comparaciones entre las observaciones del mismo bloque. Este anlisis es apropiado independientemente de si los bloques son fijos o aleatorios. Yates [1l3c] seal que si los efectos de los bloques son variables aleatorias no correlacionadas con medias cero y varianza a ~, es posible obtener informacin adicional acerca de los efectos de los tratamientos t; Yates llam anlisis interbloques al m. todo para obtener esta informacin adicional. Considere los totales de los bloques y como una coleccin de b observaciones. El modelo para estas observaciones (siguiendo a John [61d]) es
Y.} == /qJ.+

~ nijf +(k8 +~
j

Eij)

(4-40)

donde el trmino entre parntesis puede considerarse como el error. Los estimadores interbloques de .t y
t, se encuentran minimizando la funcin de mnimos cuadrados

Se obtienen as las siguientes ecuaciones normales de mnimos cuadrados:

u: Nji.+r! Tj
i;l

= Y..

'r:krfi+ri+AL t p ==
p-l
p~i

L nijY.
}-1

(4-41)
j

i=l,2, ... ,a

162

CAPTuLo 4 BLOQUES ALEATOIUZADOS, CUADRADOS LATINOS YDISEOS RELACIONADOS

donde fi y i i denotan los estimadores interbloques. Al imponer la restriccin :I: ~-l f I = O, se obtienen las soluciones de las ecuaciones 4-41 como '

(4-42)

i=l,2, ... ,a

(4-43)

Es posible demostrar que los estimadores interbloques {f I } Ylos estimadores intrabloques {f I } no estn correlacionados. Los estimadores interbloques {T,} pueden diferir de los estimadores intrabloques {f i } . Por ejemplo, los estimadores interbloques para el BIBD del ejemplo 4-5 se calculan de la siguiente manera:

T
1

= 663- (3)(3)(72.50) = 10.50


3-2 649-(3)(3)(72.50) = 3-2 -3.50 -0.50 -6.50

t'z

r3

=
=

652- (3)(3)(72.50) 3- 2 646-(3)(3)(72.50) 3-2

t'4

Observe que los valores de 1: ~-l nij Y,j se usaron en la pgina 157 para calcular los totales de los tratamientos ajustados en el anlisis intrabloques. Suponga ahora que quieren combinarse los estimadores interbloques e intrabloques para obtener una sola estimacin de la varianza mnima insesgada de cada ti' Es posible demostrar que f i Yi son insesgados y tambin que
I

V(

ti

= k( a -

Aa 2

1)

(intrabloques)

y (intrabloques) Se usa una combinacin lineal de los dos estimadores, por ejemplo

(4-44)

-r; deber tener las ponderaciones al = Ul/(U l + u 2) Ya 2 = uJ(u l + u z), donde u 1 = l/V(f;) y U2 = l/V(i;).
f.
I

para estimar ti' En este mtodo de estimacin, el estimador combinado insesgado de la varianza mnima

Por 10 tanto, las ponderaciones ptimas son inversamente proporcionales a las varianzas de f i Yf t : Esto implica que el mejor estimador combinado es

k(a-1)

a(r-A) Aa

(a 2 +ka 2 )+f.
P
I

k(a-1) Z a A,a2
P

k( a -1) 2 k( a -1) ( 2 k 2) -----'----'-a + a + a 2

i=l, 2,... ,

a(r- A)

4A DISEOS DEBLOQUES INCOMPLETOS BALANCEADOS

163

que puede simplificarse como

t.

kQ,(a' +ku:

= -------:--'-=----:-------=-----'------2
(r- ).)0 +Aa(02 +ko~)

)+(~ ",Ji - kry}'

i=l, 2,... , a

(4-45)

Desafortunadamente, la ecuacin 4-45 no puede usarse para estimar ti porque no se conocen las varianzas a2y o~. El enfoque comn es estimara2yo~ a partir de los datos y sustituir estos parmetros de la ecuacin 4-45 con las estimaciones. La estimacin que suele tomarse para a2 es el cuadrado medio del error del anlisis de varianza intrabloques, o el error intrabloques. Por lo tanto,
(j2

= MS E

La estimacin de o~ se encuentra a partir del cuadrado medio de los bloques ajustados para los tratamientas. En general, para un diseo de bloques incompletos balanceados, este cuadrado medio es

k! ~~a
MS .
Bloquesfajustados)

Qi

2 b

L -')-L ~l k ~l
(b-1)

Yi,
r
---'-

...0--

(4-46)

y su valor esperado (cuya deduccin se hace en Graybill [50]) es

ElMS l3Io<ue,raju,tad05) ] = o- +

a(r-1) 2 b -1 o p

Por lo tanto, si MSBloque,rajustadOs) > MSE> la estimacin de (j~ es


A

[MS Bloquesfajustados) - MS e l( b ~ 1) = ----'---'-'----'------a(r-1)

(4-47)

y si MSBloque,raju,tadO,) ::5 MSe , se hace o~


kQ({j2

= O.

Esto resulta en el estimador combinado

+k{;~)+(~ ,, _kry" t.2


)~1

t; =

(r-..1.)02 +..1.a({j2 +k{;~)


Yi . -(1/ a)y

(4- 48a)
{j2 - O p-

(4-48b)

A continuacin se calculan las estimaciones combinadas para los datos del ejemplo 4-5. Por la tabla 4-25 se obtiene (j2 = MS e = 0.65 YMSBloquesrajusladOs) = 22.03. (Observe que para calcular MSBloque,raju"ado,) se hace uso del hecho de que ste es un diseo simtrico. En general, debe usarse la ecuacin 4-46.) Puesto que MSBloquesraju,lado,) > MS E, se usa la ecuacin 447 para estimar o~ como
2

(j p

(22.03- 0.65)(3) 4(3-1) = 8.02

Por lo tanto, pueden sustituirse 0 2 = 0.65 Y{j ~ = 8.02 en la ecuacin 4-48a para obtener las estimaciones combinadas que se enlistan enseguida. Por conveniencia, tambin se presentan las estimaciones intrablo-

164

CAPTULO 4

BLOQUES ALEATORIZADOS. CUADRADOS LATINOS Y DISEOS RELACIONADOS

ques e interbloques. En este ejemplo, las estimaciones combinadas estn prximas a las estimaciones intrabloques debido a que la varianza de las estimaciones interbloques es relativamente grande.

Parmetro

Estimacin intrabloques

Estimacin interbloques

Estimacin combinada

-1.12 -0.88 -0.50 2.50

10.50 -3.50 -0.50 --6.50

-1.09 -0.88 -0.50


2.47

4~5

PROBLEMAS
Un qumico quiere probar el efecto de cuatro agentes qumicos sobre la resistencia de un tipo particular de tela. Debido a que podra haber variabilidad de un rollo de tela a otro, el qumico decide usar un diseo de bloques aleatorizados, con los rollos de tela considerados como bloques. Selecciona cinco rollos y aplica los cuatro agentes qumicos de manera aleatoria a cada rollo. A continuacin se presentan las resistencias a la tensin resultantes. Analizar los datos de este experimento (utilizar a = 0.05) Ysacar las conclusiones apropiadas. Agente qumico 1 2 3 4 Rollo

4-1.

1
73 73 75 73

2 68 67 68 71

3 74 75 78 75

4
71 72 73 75

5
67 70 68 69

4-2.

Se estn comparando tres soluciones de lavado diferentes a fin de estudiar su efectividad para retardar el crecimiento de bacterias en contenedores de leche de 5 galones. El anlisis se hace en un laboratorio y slo pueden realizarse tres ensayos en un da. Puesto que los das podran representar una fuente potencial de variabilidad, el experimentador decide usar un diseo de bloques aleatorizados. Se hacen observaciones en cuatro das, cuyos datos se muestran enseguida. Analizar los datos de este experimento (utilizar a = 0.05) Y sacar las conclusiones apropiadas. Das Solucin 1 2 3
1
13 16 5

2
22 24 4

3 18 17 1

4 39 44

22

4-3.

4-4. 4-5.

Graficar las resistencias a la tensin medias observadas para cada tipo de agente qumico en el problema 4-1 y compararlas con una distribucin t con la escalacin apropiada. Qu conclusiones se sacaran a partir de esta representacin grfica? Graficar los conteos de bacterias promedio para cada solucin en el problema 4-2 Ycompararlos con una distribucin t escalada. Qu conclusiones pueden sacarse? En un artculo de Eire Safety Joumal ("El efecto del diseo de boquillas en la estabilidad y el desempeo de surtidores de agua turbulenta", vol. 4) se describe un experimento en el que se determin un factor de la forma para varios diseos diferentes de boquillas con seis niveles de la velocidad del flujo de salida del surtidor.

4-5 PROBLEMAS

165

El inters se centr en las diferencias potenciales entre los diseos de las boquillas, con la velocidad considerada como una variable perturbadora. Los datos se presentan a continuacin.

Diseo de la boquilla 1 2 3 4 5

Velocidad del flujo de salida del surtidor (mis) 11.73 14.37 16.59 20.43 23.46 28.74 0.78 0.80 0.81 0.75 0.77 0.78 0.85 0.85 0.92 0.86 0.81 0.83 0.93 0.92 0.95 0.89 0.89 0.83 1.14 0.97 0.98 0.88 0.86 0.83 0.97 0.86 0.78 0.76 0.76 0.75

a)

4-6.

El diseo de la boquilla afecta el factor de la forma? Comparar las boquillas con un diagrama de dispersin y con un anlisis de varianza, utilizando a = 0.05. b) Analizar los residuales de este experimento. c) Qu diseos de las boquillas son diferentes con respecto al factor de la forma? Trazar una grfica del factor de la forma promedio para cada tipo de boquilla y compararla con una distribucin t escalada. Comparar las conclusiones que se sacaron a partir de esta grfica con las de la prueba del rango mltiple de Duncan. Considere el experimento del algoritmo para controlar la proporcin de almina del captulo 3, seccin 3-8. El experimento se llev a cabo en realidad como un diseo de bloques aleatorizados, en el que se seleccionaron seis periodos como bloques, y se probaron los cuatro algoritmos para controlar la proporcin en cada periodo. El voltaje promedio de la celda y la desviacin estndar del voltaje (indicada entre parntesis) para cada celda son los siguientes:

Algoritmo para controlar la proporcin 1 2 3 4

Tiempo 1 4.93 (0.05) 4.85 (0.04) 4.83 (0.09) 4.89 (0.03) 2 4.86 (0.04) 4.91 (0.02) 4.88 (0.13) 4.77 (0.04) 3 4.75 (0.05) 4.79 (0.03) 4.90 (0.11) 4.94 (0.05) 4 4.95 (0.06) 4.85 (0.05) 4.75 (0.15) 4.86 (0.05) 5 4.79 (0.03) 4.75 (0.03) 4.82 (0.08) 4.79 (0.03) 6 4.88 (0.05) 4.85 (0.02) 4.90 (0.12) 4.76 (0.02).

4-7.

a) Analizar los datos del voltaje promedio de las celdas. (Utilizara = 0.05.) La eleccin del algoritmo para controlar la proporcin afecta el voltaje promedio de las celdas? b) Realizar el anlisis apropiado de la desviacin estndar del voltaje. (Recuerde que a ste se le llam "ruido del crisol".) La eleccin del algoritmo para controlar la proporcin afecta el ruido del crisol? e) Realizar los anlisis residuales que parezcan apropiados. d) Qu algoritmo para controlar la proporcin debera seleccionarse si el objetivo es reducir tanto el voltaje promedio de las celdas como el ruido del crisol? El fabricante de una aleacin maestra de aluminio produce refinadores de textura en forma de lingotes. La compaa produce el producto en cuatro hornos. Se sabe que cada horno tiene sus propias caractersticas nicas de operacin, por lo que en cualquier experimento que se corra en la fundicin en el que se use ms de un horno, los hornos se considerarn como una variable perturbadora. Los ingenieros del proceso sospechan que la velocidad de agitacin afecta la medida de la textura del producto. Cada horno puede operarse con

166

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATL",OS y OISENOS RELACIONADOS

cuatro diferentes velocidades de agitacin. Se lleva a cabo un diseo de bloques aleatorizados para un refinador particular y los datos resultantes de la medida de la textura se muestran a continuacin: Horno Velocidad de agitacin (rpm) 1 8 14 14 17 2 4 5 6 9
3

4
6 9 2 6

5
10 15 20

5 6 9 3

a) Existe evidencia de que la velocidad de agitacin afecta la medida de la textura?


Representar los residuales de este experimento en una grficade probabilidad normal. Interpretar esta grfica. Graficar los residuales contra el horno y la velocidad de agitacin. Esta grfica proporciona alguna informacin til? d) Cul sera la recomendacin de los ingenieros del proceso con respecto a la eleccin de la velocidad de agitacin y del horno para este refinador de textura particular si es deseable una medida de la textura pequea? Analizar los datos del problema 4-2 utilizando la prueba general de significacin de la regresin. Suponiendo que los tipos de agentes qumicos y los rollos de tela son fijos, estimar los parmetros del modelo T; y j3j del problema 4-1. Trazar una curva de operacin caracterstica para el diseo del problema 4-2. La prueba parece ser sensible a las diferencias pequeas en los efectos de los tratamientos? Suponga que faIta la observacin del agente qumico 2 y el rollo 3 en el problema 4-1. Analizar el problema estimando el valor faltante. Realizar el anlisis exacto y comparar los resultados. Dos valoresfaltantes en un bloque aleatorizado, Suponga que en el problema 4-1 faltan las observaciones del agente qumico tipo 2 y el rollo 3 y del agente qumico tipo 4 y el rollo 4. a) Analizar el diseo haciendo la estimacin iterativa de los valores faltantes, como se describe en la seccin 4-1.3. b) Derivar SSE con respecto a los dos valores faltantes, igualar los resultados con cero y resolver las ecuaciones para las estimaciones de los valores faltantes. Analizar el diseo utilizando estas dos estimaciones de los valores faltantes. e) Deducir las frmulas generales para estimar dos valores faltantes cuando las observaciones estn en bloques diferentes. d) Deducir las frmulas generales para estimar dos valores fa1tantes cuando las observaciones estn en el mismo bloque. Un ingeniero industrial est realizando un experimento sobre el tiempo de enfoque del ojo. Se interesa en el efecto de la distancia del objeto alojo sobre el tiempo de enfoque. Cuatro distancias diferentes son de inters. Cuenta con cinco sujetos para el experimento. Debido a que puede haber diferencias entre los individuos, el ingeniero decide realizar el experimento en un diseo de bloques aleatorizados. Los datos obtenidos se presentan a continuacin. Analizar los datos de este experimento (utilizar a = 0.05) Ysacar las conclusiones apropiadas.
b)

e)

4-8. 4-9. 4-10. 4-11.

4-12.

4-13.

Sujeto Distancia (pies) 4 6 1


10 7

2
6 6

3
6 6

4
6 1 2 2

5
6 6

8
10

5
6

3
4

3 4

5 3

4~5 PROBLEMAS

167

4-14.

Se estudia el efecto de cinco ingredientes diferentes (A, B, C, D y E) sobre el tiempo de reaccin de un proceso qumico. Cada lote de material nuevo slo alcanza para permitir la realizacin de cinco corridas. Adems, cada corrida requiere aproximadamente 11/ 2 horas, por lo que slo pueden realizarse cinco corridas en un da. El experimentador decide realizar el experimento como un cuadrado latino para que los efectos del da y el lote puedan controlarse sistemticamente. Obtiene los datos que se muestran enseguida. Analizar los datos de este experimento (utilizar a = 0.05) Y sacar conclusiones.

Da Lote 1 2 3 4 1
2

3 D

A =8 C=l1 B=4 D=6 E =4

B=7 E=2 A = 9 C=8 D=2

A =7

=1

C = 10 E = 6

B =3

C=7 D =3 E=l B=6 A =8

E =3 B=8 D =5 A=lO C=8

4-15.

Un ingeniero industrial investiga el efecto de cuatro mtodos de ensamblaje (A, B, Cy D) sobre el tiempo de ensamblaje de un componente de televisores a color. Se seleccionan cuatro operadores para el estudio. Adems, el ingeniero sabe que todos los mtodos de ensamblaje producen fatiga, de tal modo que 'el tiempo requerido para el ltimo ensamblaje puede ser mayor que para el primero, independientemente del mtodo. Es decir, se desarrolla una tendencia en el tiempo de ensamblaje requerido. Para tomar en cuenta esta fuente de variabilidad, el ingeniero emplea el diseo del cuadrado latino que se presenta a continuacin. Analizar los datos de este experimento (a = 0.05) Y sacar las conclusiones apropiadas.

Orden de ensamblaje
1

Operador
1

2
D = 14

3
A = 7

C=lO

2 3 4

B=7
A =5 D=lO

B=lO

= 18

A = 10

D = 11 C=ll B = 12

B=8
A =8 D =9 C= 14

4-16. 4-17. 4-18. 4-19.

Suponga que en el problema 4-14 falta la observacin del lote 3 en el da 4. Estimar el valor faltante con la ecuacin 4-24, y realizar el anlisis utilizando este valor. Considere un cuadrado latino p x p con renglones (a j ) , columnas (fik) y tratamientos (rj ) fijos. Obtener estimaciones de mnimos cuadrados de los parmetros del modelo a, f3k y rj . Deducir la frmula del valor faltante (ecuacin 4-24) para el diseo del cuadrado latino. Diseos que incluyen varios cuadrados latinos. (Ver Coehran y Cox [26] y John [61d].) El cuadrado latino p x p contiene nicamente p observaciones para cada tratamiento. Para obtener ms rplicas, el experimentador puede usar varios cuadrados, por ejemplo n. No es relevante si los cuadrados usados son el mismo o son diferentes. El modelo apropiado es i
Yijkh

= jl+Ph +a(h) +r j +f3k(h) +(rp)jh + Eijkh

, P j , , ,P h= 1,2, , n
k= 1 2

= 1, 2, j = 1, 2,

, p

168

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

4-20. 4-21. 4-22.

donde Yijkh es la observacin del tratamiento j en el rengln i y la columna k del cuadrado h-simo. Observe que ai(h) YfJk(h) son los efectos del rengln y la columna en el cuadrado h-simo, PI. es el efecto del cuadrado h-simo y (rp )jh es la interaccin entre los tratamientos y los cuadrados. a) Establecer las ecuaciones normales para este modelo y resolverlas para las estimaciones de los parmetros del modelo. Suponga que las condiciones auxiliares apropiadas de los parmetros son ~hPh = O, ~;iti(h) = OY ~kfJk(h) = Opara cada h, ~/ij = o, ~j(ip)jh = O para cada h y ~h(ip)jh = Opara cada i. b) Desarrollar la tabla del anlisis de varianza para este diseo. Comentar la forma en que pueden utilizarse las curvas de operacin caracterstica del apndice con el diseo del cuadrado latino. Suponga que en el problema 4-14los datos tomados en el da 5 se analizaron incorrectamente y fue necesario descartarlos. Desarrollar un anlisis apropiado para los datos restantes. El rendimiento de un proceso qumico se midi utilizando cinco lotes de materia prima, cinco concentraciones del cido, cinco tiempos de procesamiento (A, B, C, D y E) Y cinco concentraciones del catalizador (a, fJ, y, 15, e). Se us el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar a = 0.05) Y sacar conclusiones.

Concentracin del cido Lote 1 2 3 4 5 1 Aa=26 By = 18 Ce = 20 DfJ = 15 Ed = 10 2 3 4 5 &=13 AfJ = 21 B15 = 13 Ca = 17 Dy = 14

BfJ = 16 C15 = 21 Da = 12 Ey = 15 Ae = 24

Cy = 19 De = 18 EfJ = 16 A15 =22 Ba = 17

D15 = 16 Ea = 11 Ay =25 Be = 14 Cfl = 17

4-23.

Suponga que en el problema 4-15 el ingeniero sospecha que los sitios de trabajo usados por los cuatro operadores pueden representar una fuente adicional de variacin. Es posible introducir un cuarto factor, el sitio de trabajo (a, fl, y, ), Yrealizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. Analizar los datos de este experimento (utilizar a = 0.05) Y sacar conclusiones.

Orden de ensamblaje

Operador
1 2 3 Cfl = 11 By = 10 Dd = 14 Ba = 8 Cd = 12 Ay = 10 Ad = 9 Da = 11 Bfl = 7 Afl = 8 Ca = 18 Dy =9

1 2 3 4

4 Aa =8 Dfl = 12 Cy = 15 Bd =6

4-24. 4-25. 4-26.

4-27.

Construir un hipercuadrado 5 x 5 para estudiar los efectos de cinco factores. Desarrollar la tabla del anlisis de varianza para este diseo. Considere los datos de los problemas 4-15 y 4-23. Despus de eliminar las letras griegas del problema 4-23, analizar los datos utilizando el mtodo desarrollado en el problema 4-19. Considere el diseo de bloques aleatorizados con un valor faltante en la tabla 4-7. Analizar los datos utilizando el anlisis exacto del problema del valor faltante revisado en la seccin 4-1.4. Comparar los resultados con el anlisis aproximado de estos datos que se presenta en la tabla 4-8. Un ingeniero estudia las caractersticas del rendimiento de combustible de cinco tipos de aditivos de gasolina. En la-prueba de carretera el ingeniero desea usar los automviles como bloques; sin embargo, debido a

4-5 PROBLEMAS

169

una restriccin de tiempo, debe utilizar un diseo de bloques incompletos. Realiza el diseo balanceado con los cinco bloques siguientes. Analizar los datos de este experimento (utilizar a = 0.05) Ysacar conclusiones. Automvil Aditivo 1 2 3 4 5 4-28. 4-29. 1 14 12 13 11 2 17 14 11 12 3 14 13 11
10

4 13 13 12 12

5
12 10 9 8

Construir un conjunto de contrastes ortogonales para los datos del problema 4-27. Calcular la suma de cuadrados para cada contraste. Se estudian siete concentraciones diferentes de madera dura para determinar su efecto sobre la resistencia del papel producido. Sin embargo, en la planta piloto slo pueden hacerse tres corridas de produccin por da. Dado que los das pueden diferir, el analista utiliza el diseo de bloques incompletos balanceados que se muestra abajo. Analizar los datos de este experimento (utilizar a = 0.05) Y sacar conclusiones. Concentracin de madera dura (%) 2 4 6 8 10 12 14 Das 1 114 126 141 145 120 136 2 120 137 3 4

S
120

6 119

7 117 134

117 129

149

ISO

143 118

123 130

127

4-30. 4-31. 432. 4-33. 4-34. 4-35. 4-36. 4-37. 438.

Analizar los datos del ejemplo 4-6 utilizando la prueba general de significacin de la regresin. Demostrar que k~:~lct I (la) es la suma de cuadrados ajustada de los tratamientos en un BIBD. Un experimentador quiere comparar cuatro tratamientos en bloques de dos corridas. Encontrar un BIBD para este experimento con seis bloques. Un experimentador quiere comparar ocho tratamientos en bloques de cuatro corridas. Encontrar un BIBD con 14 bloques y l = 3. Realizar el anlisis interbloques del diseio del problema 4-27. Realizar el anlisis interbloques del diseo del problema 4-29. Comprobar que no existe un BIBD con parmetros a = 8, r = 8, k = 4 Y b = 16. Demostrar que la varianza de los estimadores intrabloques {r,} es k(a ~ 1 )a 2 I (la 2 ) . Diseos extendidos de bloques incompletos. Ocasionalmente, el tamao del bloque cumple con la relacin a < k < 20. Un diseio extendido de bloques incompletos consiste en una sola rplica de cada tratamiento en cada bloque junto con un diseo de bloques incompletos con k" = k - a. En el caso balanceado, el diseo de bloques incompletos tendr los parmetros k" = k - a, r" = r - b Yl ", Desarrollar el anlisis estadstico. (Sugerencia: en el diseo extendido de bloques incompletos, se tiene l = 2r - b + l *.)

Introduccin a los diseos factoriales

5~ 1

DEFINICIONES Y PRINCIPIOS BSICOS

En muchos experimentos interviene el estudio de los efectos de dos o ms factores. En general, los diseos factoriales son los ms eficientes para este tipo de experimentos. Por diseo factorial se entiende que en cada ensayo o rplica completa del experimento se investigan todas las combinaciones posibles de los niveles de los factores. Por ejemplo, si el factor A tiene a niveles y el factor B tiene b niveles, cada rplica contiene todas las ab combinaciones de los tratamientos. Cuando los factores estn incluidos en un diseo factorial, es comn decir que estn cruzados. El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel del factor. Con frecuencia se le llama efecto principal porque se refiere a los factores de inters primario en el experimento. Por ejemplo, considere el experimento sencillo de la figura 5-1. Se trata de un experimento factorial de dos factores en el que los dos factores del diseo tienen dos niveles. A estos niveles se les ha denominado "bajo" y "alto" y se denotan como "-" y "+", respectivamente. El efecto principal del factor A de este diseo de dos niveles puede visualizarse como la diferencia entre la respuesta promedio con el nivel bajo de A y la respuesta promedio con el nivel alto de A. Numricamente, esto es A

= 40+52 _
2

20+30 = 21
2

Es decir, cuando el factor A se incrementa del nivel bajo al nivel alto se produce un incremento de la respuesta promedio de 21 unidades. De manera similar, el efecto principal de B es
B= 30+52 _ 20+40 = 11 2 2

Cuando los factores tienen ms de dos niveles, es necesario modificar el procedimiento anterior, ya que existen otras formas de definir el efecto de un factor. Este punto se estudia con mayor profundidad ms adelante. En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma para todos los niveles de los otros factores. Cuando esto ocurre, existe una interac-

170

5-1 DEFINICIONES YPRINCIPIOS BSICOS


12

171

+
(Alto)
I:Q

30

52
I:Q

+
(Alto)

40

<J

LL

..
(Bajo)

20

D
FactorA

~ LL
40
+

<5

(Bajo)

20

D
FactorA

50 +

(Bajo)

(Alto)

(Bajo)

(Alto)

Figura 5-1 Experimento factorial de dos factores con la respuesta (y) indicada en los vrtices.

Figura 52 Experimento factorial de dos factores con interaccin.

cin entre los factores. Por ejemplo, considere el experimento factorial de dos factores que se ilustra en la figura 5-2. Con el nivel bajo del factor B (o 11), el efecto de A es
A= 50-20= 30

y con el nivel alto del factor B (o B+), el efecto de A es


A= 12-40= -28

Puesto que el efecto deA depende del nivel que se elige para el factor B, se observa que existe una interaccin entre A y B. La magnitud del efecto de la interaccin es la diferencia promedio de estos dos efectos de A, o AB = (-28 - 30)/2 = -29. Evidentemente, en este experimento la interaccin es grande. Estas ideas pueden ilustrarse grficamente. En la figura 5-3 se grafican los datos de las respuestas de la figura 5-1 contra el factorA para ambos niveles del factor B. Observe que las rectas B''y B+ son aproximadamente paralelas, lo cual indica la ausencia de interaccin entre los factores A y B. De manera similar, en la figura 5-4 se grafican los datos de las respuestas de la figura 5-2. En este caso se observa que las rectas zr y B+ no son paralelas. Esto indica una interaccin entre los factores A y B. Grficas como stas son de gran ayuda para interpretar las interacciones significativas y para reportar los resultados al personal sin preparacin estadstica. Sin embargo, no debern utilizarse como la nica tcnica para el anlisis de datos, ya que su interpretacin es subjetiva y su apariencia con frecuencia es engaosa.

60

B+

60

40
~

50

~ 30 a: 20

~B-

. 4O
50
~30 .,
~

a: 20

10

10

FactorA

FactorA

Figura 53 Experimento factorial sin interaccin.

Figura 54 Experimento factorial con interaccin.

172

CAPTULO 5 INlRODUCCIN A LOS DISEOS FACTORlALES

El concepto de interaccin puede ilustrarse de otra manera. Suponga que los dos factores del diseo tratado son cuantitativos (temperatura, presin, tiempo, etc.). Entonces una representacin con un modelo de regresin del experimento factorial de dos factores podra escribirse como

y=

Po +pX +P2 X2 +P12XX2 +e

Po

donde y es la respuesta, las Pson parmetros cuyos valores deben determinarse, X es una variable que representa al factorz.x, es una variable que representa al factor B, y e es un trmino del error aleatorio. Las variables X y X2 se definen en una escala codificada de -1 a + 1 (los niveles bajo y alto deA y B), YXX 2representa la interaccin entre X y X2' Las estimaciones de los parmetros en este modelo de regresin resultan estar relacionadas con las estimaciones de los efectos. Para el experimento ilustrado en la figura 5-1 se encuentra que los efectos principales deA y B sonA = 21 YB = 11. Las estimaciones de p y P2 son la mitad del valor del efecto principal correspondiente; por 10 tanto, = 21/2 = 10.5 Y P2 = 11/2 = 5.5. El efecto de la interaccin de la figura 5-1 es AB = 1, por 10 que el valor del coeficiente de la interaccin en el modelo de regresin es P12 =1/2 = 0.5. El parmetro Po se estima con el promedio de las cuatro respuestas, o =(20+40+30+52)/4 = 35.5. Por 10 tanto, el modelo de regresin ajustado es

y= 35.5+1O.5x +5.5x 2 +0.5xx 2

59

t- -

- _+

_
1

49
y 39

29

0.6 0.2 -0.2 :1--:o~---:~~~;;.-_,,-_Jl.,. -0.6 %2 . -1 -0.2 0.2 0.6

al La superficie de respuesta

0.6 0.2
%2

-0.2 -0.6
-1

-1

-0.6

-0.2

0.2

b)

La grfica de contorno

Figura 5-5 La superficie de respuesta y la grfica de'contorno para el modelo y =' 35.5 + 10'&1 + 5.Sx2

5-1 DEFINICIONES Y PRINCIPIOS BSICOS

173

Las estimaciones de los parmetros obtenidas de esta manera para el diseo factorial en el que todos los factores tienen dos niveles (- y +) resultan ser estimaciones de mnimos cuadrados (se abundar sobre el tema ms adelante). El coeficiente de la interaccin (/312 0.5) es pequeo en comparacin con los coeficientes de los efectos principales '131 y '13 2' La interpretacin que se har de este hecho es que la interaccin es pequea y puede ignorarse. Por lo tanto, al eliminar el trmino 0.SxX2 se obtiene el modelo

)1= 3S.S+10,Sxl +S,Sx2

En la figura S-S se muestran las representaciones grficas de este modelo. En la figura S-Sa se tiene una grfica del plano de los valores de y generados por las diferentes combinaciones de Xl y X2' A esta grfica tridimensional se le llama grfica de superficie de respuesta. En la figura S-Sb se muestran las lneas de contorno para las respuestas constantes y en el plano Xl' X 2 Observe que como la superficie de respuesta es un plano, la grfica de contorno contiene lneas rectas paralelas. Suponga ahora que la contribucin de la interaccin en el experimento no fuera insignificante; es decir, que el coeficiente /312 no fuera pequeo. En la figura 5-6 se presenta la superficie de respuesta y la grfica de contorno del modelo

al La superficie de respuesta

0.6 0.2

'" "

-0.2
~0.6

-1

bl

La grfica de contorno

Figura 56 La superficie de respuesta y la grfica de contorno para el modelo y = 35.5 + 10'~1 + 5'~2 + &!t2'

174

CAPTULO 5

INTRODUCCIN A LOS DISENOS FACTORIALES

(Se ha hecho que el efecto de la interaccin sea el promedio de los dos efectos principales.) Observe que el efecto significativo de la interaccin provoca el "torcimiento" del plano de la figura S-6a. Este torcimiento de la superficie de respuesta produce lneas de contorno curvas para las respuestas constantes en el planox1,x2, como se muestra en la figura 5-6b. Por lo tanto, una interaccin es una forma de curvatura en el modelo de superficie de respuesta fundamental del experimento. El modelo de superficie de respuesta de un experimento es de gran importancia y utilidad. El tema se ampliar en la seccin S-S y en captulos posteriores. En general, cuando una interaccin es grande, los efectos principales correspondientes tienen escaso significado prctico. En el experimento de la figura 5-2, la estimacin del efecto principal deA sera
A= 50+12_ 20+40 = 1

que es muy pequeo, y se llegara a concluir que no hay ningn efecto debido a A. Sin embargo, cuando se examinan los efectos deA con niveles diferentes del factor B, se observa que no es ste el caso. El factor A tiene un efecto, pero depende del nivel del factor B. Es decir, el conocimiento de la interaccinAB es ms til que el conocimiento del efecto principal. Una interaccin significativa suele enmascarar la significacin de los efectos principales. Estos puntos se ponen de manifiesto con claridad en la grfica de la interaccin de la figura 5-4. En presencia de una interaccin significativa, el experimentador deber por lo general examinar los niveles de uno de los factores, por ejemplo del factor A, manteniendo fijos los niveles de los otros factores para sacar conclusiones acerca del efecto principal de A.
5~2

LA VENTAJA DE LOS DISEOS FACTORIALES

Es sencillo ilustrar la ventaja de los diseos factoriales. Suponga que se tienen dos factores A y B, cada uno con dos niveles. Los niveles de los factores se denotan porA-,A+,B-y B+. Podra obtenerse informacin acerca de ambos factores hacindolos variar uno a la vez, como se muestra en la figura 5-7. El efecto de cambiar el factor A est dado por A +B- -A-B-, Yel efecto de cambiar el factor B est dado por A-B+ A-B-. Debido a que est presente el error experimental, es deseable realizar dos observaciones, por ejemplo, para cada combinacin de tratamientos y estimar los efectos de los factores utilizando las respuestas promedio. Por lo tanto, se necesita un total de seis observaciones. Si se hubiera efectuado un experimento factorial, se habra registrado una combinacin adicional de los tratamientos,A +B+. Ahora, utilizando slo cuatro observaciones, pueden hacerse dos estimaciones del efecto deA:A +B- -A-B-yA +B+ -A-B+. De manera similar, pueden hacerse dos estimaciones del

A-B+
+
'Q

tS
LL

...
A-Ir A+B-

'"

FactorA

Figura 5-7 Experimento con un. factor a la vez.

5.3 DISENO FACTORIAL DE 005 FACTORES


4.0 3.5

175

'g

.~ 3.0 ., 1i .,
2.5 2.0

'" ;g w

1.5
1.0
I--_ ____L
.......
~-----L-

2
Nmero de factores

Figura 58 Eficiencia relativa de un diseo factorial con respecto a un experimento de un factor a la vez (dos niveles del factor).

efecto de B. Estas dos estimaciones de cada efecto principal podran promediarse para producir efectos principales promedio que tienen la misma precisin que las estimaciones del experimento con un solo factor, pero slo se requieren cuatro observaciones en total, y nosotros diramos que la eficiencia relativa del diseo factorial con respecto al experimento de un factor a la vez es de (6/4) = 1.5. En general, esta eficiencia relativa aumentar conforme se incremente el nmero de factores, como se muestra en la figura 5-8. Suponga ahora que est presente una interaccin. Si el diseo de un factor a la vez indicara queA-B+ y A +B- dieron mejores respuestas queA-B-, una conclusin lgica sera que A +B+ sera todava mejor. Sin embargo, si est presente una interaccin, esta conclusin puede ser una equivocacin grave. Para un ejemplo, referirse al experimento de la figura 5-2. En resumen, observe que los diseos factoriales ofrecen varias ventajas. Son ms eficientes que los experimentos de un factor a la vez. Adems, un diseo factorial es necesario cuando puede haber interacciones presentes a fin de evitar llegar a conclusiones incorrectas. Por ltimo, los diseos factoriales permiten la estimacin de los efectos de un factor con varios niveles de los factores restantes, produciendo conclusiones que son vlidas para un rango de condiciones experimentales.

5~3
5~3.1

DISEO FACTORIAL DE DOS FACTORES


Un ejemplo

Los tipos ms simples de diseos factoriales incluyen nicamente dos factores o conjuntos de tratamientos. Haya niveles del factor A y b niveles del factor B, los cuales se disponen en un diseo factorial; es decir, cada rplica del experimento contiene todas las ah combinaciones de los tratamientos. En general, hay n rplicas. Como ejemplo de un diseo factorial en el que intervienen dos factores, un ingeniero est diseando una batera que se usar en un dispositivo que se someter a variaciones de temperatura extremas. El nico parmetro del diseo que puede seleccionar en este punto es el material de la placa o nodo de la batera, y tiene tres elecciones posibles. Cuando el dispositivo est fabricado y se enve al campo, el ingeniero no tendr control sobre las temperaturas extremas en las que operar el dispositivo, pero sabe por expe-

176

CAPTULO 5 INTRODUCCIN A LOSDISEOS FACTORIALES

Tabla 51 Datos de la vida (enhoras) parael ejemplo del diseo de la batera Temperatura eF) Tipo de material 15 125 70 1 130 155 34 40 20 70 74 180 80 75 82 58 2 122 150 25 70 188 136 159 126 106 115 58 45 3 138 110 174 120 96 104 168 160 150 139 82 60 riencia que la temperatura probablemente afectar la vida efectiva de la batera. Sin embargo, la temperatura puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba. El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura -15, 70 Y 125"F-, ya que estos niveles de temperatura son consistentes con el medio ambiente donde se usar finalmente el producto. Se prueban cuatro bateras con cada combinacin del material de la placa y la temperatura, y las 36 pruebas se corren de manera aleatoria. En la tabla 5-1 se presentan los datos del experimento y de la vida observada de la batera. En este problema, el ingeniero quiere responder las preguntas siguientes:

1. Qu efectos tienen el tipo de material y la temperatura sobre la vida de la batera? 2. Existe alguna eleccin del material que produzca de manera regular una vida larga de la batera

independientemente de la temperatura?
La segunda pregunta es de particular importancia. Quiz sea posible encontrar una alternativa del material que no resulte afectada considerablemente por la temperatura. De ser ste el caso, el ingeniero puede hacer que la batera sea robusta para la variacin de la temperatura en el campo. Se trata de un ejemplo de la aplicacin del diseo experimental estadstico en el diseo de productos robustos, un problema de ingeniera muy importante. El anterior es un ejemplo especfico del caso general de un diseo factorial de dos factores. Para pasar al caso general, seaYljk la respuesta observada cuando el factorA tiene el nivel i-simo (i 1,2, ..., a) y el factor B tiene el nivel j-simo (j = 1,2, ..., b) en la rplica k-sima (k "" 1,2, ..., n). En general, el experimento factorial de dos factores aparecer como en la tabla 5-2. El orden en que se hacen las abn observaciones se selecciona al azar, por lo que este diseo es un diseo completamente aleatorizado.

Tabla 52 Arreglo general de un diseo factorial de dosfactores Factor B


1 1
Yll1'Yll2'
""Yl1n Y211,Y212,

2
YI2bY122, ''''YI2n
Y221,Y222, ""Y22n

b
YlbbYlb2,
""Ylbo Y2bbY2b2, ""Y2bo

Factor A

""Y2ln

a
I

Y.WY.12,

"'Y.I.

Y.2bY.22, 'Y.2n

Y.bl,Y.bZ, "'Y.bo

5-3 DISEO FACTORIAL DE005 FACTORES

177

Las observaciones de un experimento factorial pueden describirse con un modelo. Hay varias formas de escribir el modelo de un experimento factorial. El modelo de los efectos es

Yijk

= .t+r +f3 +(rf3)ij +eijk

i.: {=

1, 2, , a ) -1, 2, , b k 1, 2, , n

(5-1)

donde .t es el efecto promedio global, t, es el efecto del nivel i -simo del factor A de los renglones, f3 es el efecto del nivelj-simo del factor B de las columnas, (rf3) es el efecto de la interaccin entre r y f3, y ek es un componente del error aleatorio. Se supone que ambos factores son fijos, y los efectos de los tratamientos se definen como las desviaciones de la media global, por lo que 1:~"1r = Oy'I.~"1f3 = O. De manera similar, los efectos de las interacciones son fijos y se definen de tal modo que 'I.~_l(rf3)ij = 'I.~"l(rf3)ij = O. Puesto que hay n rplicas del experimento, hay abn observaciones en total. Otro modelo posible de un experimento factorial es el modelo de las medias

Yijk
donde la media de la celda if-sima es

= .tij +eijk

i.: {

1, 2, , a } -1, 2, , b k = 1, 2, , n

.ti

= .t+r +f3+(1:/J)ij

'Iambin podra usarse un modelo de regresin como en la seccin 5-1. Los modelos de regresin resultan particularmente tiles cuando uno o ms de los factores del experimento son cuantitativos. En la mayor parte de este captulo se usar el modelo de los efectos (ecuacin 5-1) con referencia al modelo de regresin en la seccin 5-5. En el diseo factorial de dos factores, los factores (o tratamientos) de los renglones y las columnas,A y B, son de igual inters. Especficamente, el inters se encuentra en probar hiptesis acerca de la igualdad de los efectos de los tratamientos de los renglones, por ejemplo,

Ha:r 1 = r 2 =...= r = O H 1 : al menos una r :;e O


G

(S-2a)

y de la igualdad de los efectos de los tratamientos de las columnas, por ejemplo,

:f31 HO

= f32 =...= f3b = O

(5-2b)

H 1 : al menos una f3 '# O

Tambin existe inters en determinar si los tratamientos de los renglones y las columnas interactan. Por lo tanto, tambin querra probarse Ha: (rf3)ij = O para todas las i, j (S-2c) H 1 : al menos una (rf3) ij :;e O
A continuacin se indica cmo se prueban estas hiptesis utilizando un anlisis de varianza de dos factores.
5~3.2

Anlisis estadstico dlel modelo con efectos fijos

Sea que Ji.. denote el total de observaciones bajo el nivel r-smo del factor A, que y J. denote el total de observaciones bajo el nivel j-simo del factor B, que Yi. denote el total de observaciones de la celda

178

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

ij-sima, y que Y .. denote el gran total de todas las observaciones. Se defineny,.. 'YJ.,Yij. y Y,como los pro. medios correspondientes de los renglones, las columnas, las celdas y el gran promedio. Expresado matemticamente,

Yi.. Yi.. == bn

i==1,2, ... ,a

v, ==

!! Yijk
I~l k~l
k~l

y-JY==,j. an
_

i : 1,2, ... , b
(S-3)
i==l,2, j== 1,2,

ylJr :

YIj_ == !Yljk

Yij.
-

,a
,b

Y... == abn

Y...

La suma de cuadrados total corregida puede escribirse como

+(Yij. - Yi.. - Y.. + Y... )+(Yljk - YIjJ]Z


a
i~l

" Yt.. -)z " Y. -)z == bnLJ( - - y... + anLJ( - - Y..


j~l

(S-4)

+n2:2: (YIj. -Yi.. -Y.j, +Y.... )z


i~l j~l

+2:2:2:
i~l j~l k~l

(Yijk - YIjJz

ya que los seis productos cruzados del lado derecho de la igualdad son cero. Observe que se ha hecho la particin de la suma de cuadrados total en una suma de cuadrados debida a "los renglones", o factor A (SSA); una suma de cuadrados debida a "las columnas", o factor B (SSB); una suma de cuadrados debida a la interaccin entreA y B (SSAB); y una suma de cuadrados debida al error (SSE). Por el ltimo componente del lado derecho de la igualdad de la ecuacin S-4, se observa que debe haber por lo menos dos rplicas (n ;::: 2) para obtener una suma de cuadrados del error. La ecuacin S-4 puede escribirse simblicamente como
SST == SSA +SSB +SS AB +SSE

(S-S)

El nmero de grados de libertad asociado con cada suma de cuadrados es

Efecto

Grados de libertad

A B Interaccin AB Error Thtal

a-l

b-l
(a-l)(b-l)
aben -1) abn-l

53 DISEO FACTORIALDEOOS FACTORES

179

Esta asignacin de los abn - 1 grados de libertad totales a las sumas de cuadrados puede justificarse de la siguiente manera: los efectos principales A y B tienen a y b niveles, respectivamente; por lo tanto, tienen a - 1 Yb - 1 grados de libertad, como se indica. Los grados de libertad de la interaccin son s610el nmero de grados de libertad de las celdas (que es ab - 1) menos el nmero de grados de libertad de los dos efectos principalesA yB; es decir,ab-1- (a -1)-(b-1) = (a -l)(b -1). Dentro de cada una de lasab celdas hay n -1 grados de libertad entre las n rplicas; por lo tanto hay ab(n -1) grados de libertad para el error. Observe que la suma del nmero de grados de libertad en el lado derecho de la ecuacin 5-5 es igual al nmero total de grados de libertad. Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. Los valores esperados de los cuadrados medios son

bn! SS E( MS A) = E(_A) = 0 2 + i~1

r;

a-1

a-1
b

j SS ) 2 E(MSB ) = Lj~b_B1 = 0 +
E( MS
AH

an~ f3~
~-~ 1
a

) = E(
(

a -1)( b - 1)

SS AH

= 02 +

n (r{3)~
,m1

( a- 1)(b - 1)

j~1

E(MSE

) ~a;:~l)= =

Observe que si es verdadera la hiptesis nula de que no hay efectos de los tratamientos de los renglones, ni de los tratamientos de las columnas, ni interaccin, entonces MSA'MSB, MSAH y MSE son todas estimaciones de 02. Sin embargo, si hay diferencias entre los efectos de los tratamientos de los renglones, por ejemplo, entonces MSA ser mayor que MS E De manera similar, si estn presentes efectos de los tratamientos de las columnas o de la interaccin, entonces los cuadrados medios correspondientes sern mayores que MSE Por lo tanto, para probar la significacin de los dos efectos principales y su interaccin, simplemente se divide el cuadrado medio correspondiente por el cuadrado medio del error. Los valores grandes de este cociente implican que los datos no apoyan la hiptesis nula. Si se supone que el modelo (ecuacin 5-1) es adecuado y que los trminos del error f: ijk tienen una distribucin normal e independiente con varianza 02 constante, entonces cada uno de los cocientes de cuadrados medios MSA/MSE , MSJMSE y MSAJMS E se distribuyen como F con a -1, b -1 y (a - l)(b -1) grados de libertad en el numerador, respectivamente, yab(n - 1) grados de libertad en el denominador,' y la regin crtica sera la cola superior de la distribucinF. El procedimiento de prueba suele resumirse en una tabla del anlisis de varianza, como se muestra en la tabla 5-3. En lo que a los clculos se refiere, por lo general se emplea un paquete de software de estadstica para realizar el anlisis de varianza. Sin embargo, no es complicado obtener frmulas para calcular manual1

La prueba F puede considerarse como una aproximacin de una prueba de aleatorizacn, como se seal anteriormente.

180

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-3 La tabla del anlisis de varianzapara el diseo factorial de dos factores, modelo con efectosfijos Fuente de Suma de Grados de variacin cuadrados libertad Cuadrado medio SSA ltatamientosA SSA a-1 MS =~ A a-1

Tratamientos B
Interaccin Error Thtal
SSAB

b-1

SSB MS B = b-1 SSAB B MS A = (a-1)(b -1)

(a-1)(b-1) ab(n -1)


abn~l

SSE MS E = ab(n-1)

mente las sumas de cuadrados de la ecuacin 5-5. La suma de cuadrados total se calcula como de costumbre con (5-6) Las sumas de cuadrados de los efectos principales son 1 a 2 SS =~ ~ y2_LA bn L, i~l abn
L

(5-7)

SSB

=~

L an
b

j;l

2 y.~ y--.i abn

(5-8)

Es conveniente obtener SSAB en dos pasos. Se calcula primero la suma de cuadrados entre los totales de las ab celdas, a la que se denomina la suma de cuadrados debida a los "subtotales": 1 a b y2 SS Subtctalea =;; Y~. - ab~

L?
,;1 };1

Esta suma de cuadrados tambin contiene a SSA y SSB. Por lo tanto, el segundo paso consiste en calcular SSAB como (5-9) SS AH = SS Subtotalee - SS A - SSB Puede calcularse SSE por sustraccin como (5-10) SSE = SST - SS AH - SSA - SSB o SSE

= SST 11I 11I 11I 11I

SS Subtotales
11I 11I 11I 11I 11I 11I

EJEMPLO 5 ~ 1 .....

11I

11I

El experimento del diseo de la batera


En la tabla 54 se presenta la vida efectiva (en horas) observada en el ejemplo del diseo de la batera que se describi en la seccin 5-3.1. Los totales de los renglones y las columnas se indican en los mrgenes de la tabla y los nmeros encerrados en un crculo son los totales de las celdas.

S-3 DISEO FAcrORlAL DE 005 FAcrORES

181

Tabla54 Datos de la vida (en horas) del experimento del diseo de la batera 'Iemperatura eF) Tipo de material 15 70 1 130 155 34 20 40 74 180 80 82 75 2 150 136 25 188 122 159 126 58 106 115 138 174 120 110 96 3 168 150 160 139 82 1291 1738 YJ.

125 70 58 70 45 104 60 770

Yi:

@ @

@ @ @

@ @ @

998 1300 1501 3799 = Y...

Las sumas de cuadrados se calculan de la siguiente manera:


SST

=LLL
ig1 j-1 k-1

ab"

2
Yijk -

Y.~

abn

= (130)2 +(155)2 +(74)2 + ... +(60)2 _ (37::)2 = 77,646.97


SS

MateriAl -

--~

1 a 2 2_L bn ~ Yi.. abn

,-1

= _1_[(998)2 +(1300)2 +(1501)2]- (3799)2 = 10,683.72 (~(~ 36


1 b - SS Tempetlltura -an. m1
J

L
b

2
Y-~

.j.

Y... abn

= _1_[(1738)2 +(1291)2 +(770)2]- (3799)2 = 39,118.72 (~(4) 36


SS IntetllCci6n

=;; L L
,-1 j-1

y'~

Yq, - abn - SS MateriAl - SS Temperatura

= [(539)2 +(229)2 +

+(342)2]- (37::)2 -10,68172

- 39,118.72= 9613.78
y

SS E

= SST -

SS Material - SS Temperatura - SS Interaccin = 77,646.97-10,683.72- 39,118.72- 9613.78= 18,230.75

En la tabla 55 se muestra el anlisis de varianza. Puesto que Fo.os. 4. 27 = 2.73, se concluye que hay una interaccin significativa entre los tipos del material y la temperatura. Adems, F O.05, 2. 27 = 3.35, por lo que los efectos principales del tipo de material y la temperatura tambin son significativos. En la tabla 5-5 tambin se muestran los valores P para los estadsticos de la prueba. Como ayuda para interpretar los resultados de este experimento, es conveniente construir una grfca de las respuestas promedio para cada combinacin de los tratamientos. Esta grfica se muestra en la fgura 59. El hecho de que las rectas no sean paralelas indica que la interaccin es significativa. En general, se consigue una vida ms larga con una temperatura baja, independientemente del tipo de material. Al cambiar de una temperatura baja a una intermedia, la vida de la batera con el material tipo 3 tiene un in-

182

CAProLO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 55 Anlisis de varianza de los datos de la vida de la batera

Fuente de variacin Tipos de material 'Iemperatura Interaccin Error lbtal

Suma de cuadrados 10,683.72 39,118.72 9,613.78 18,230.75 77,646.97

Grados de libertad 2 2 4 27 35

Cuadrado medio 5,341.86 19,559.36 2,403.44 675.21

7.91 28.97 3.56

ValorP 0.0020 0.0001 0.0186

cremento real, mientras que con los materiales tipos 1 y 2 disminuye. Con una temperatura de intermedia
a alta, la vida de la batera disminuye para los materiales tipos 2 y 3 Yse mantiene en esencia sin cambio para el material tipo 1. El material tipo 3 parece producir los mejores resultados si se quiere una prdida menor de la vida efectiva cuando la temperatura cambia.
" " " " " " " *
111 111 " " " " " " " " " 111 " 111 "

Comparaciones mltiples Cuando el anlisis de varianza indica que las medias de los renglones o las columnas difieren, por lo general es de inters hacer comparaciones entre las medias individuales de los renglones o las columnas para descubrir diferencias especficas. Los mtodos de comparaciones mltiples revisados en el captulo 3 son tiles a este' respecto. Se ilustra ahora el uso de la prueba de Thkey con los datos de la vida de la batera del ejemplo 5-1. Observe que en este experimento, la interaccin es significativa. Cuando la interaccin es significativa, las comparaciones entrelas medias de uno de los factores (por ejemplo,A) pueden ser oscurecidas por la interaccinAB. Una forma de abordar esta cuestin consiste en fijar el factor B en un nivel especfico y aplicar la prueba de Thkey a las medias del factor A con ese nivel. Para ilustrar, suponga que en el ejemplo 5-1 el inters se encuentra en detectar las diferencias entre las medias de los tres tipos de material. Puesto que la interaccin es significativa, esta comparacin se hace con un solo nivel de la temperatura, por ejemplo el nivel 2 (700P). Se supone que la mejor estimacin de la varianza del error es MSE de la tabla del anlisis de varianza, utilizando el supuesto de que la varianza del error experimental es la misma para todas las combinaciones de tratamientos.

175

160
,;:';>125

1i 100 E
~ .g
75

Material tipo 3 . . .- - ~ ~ Material tipo 1 Material tipo 2

:>

50
25

OL.....-_-~----:i-:----~::-----

Temperatura (OFI

Figura 5-9 Grfica tipo de material-temperatura para el ejemplo 5-1.

5-3 DISEO FACTORIAL DEDOS FACTORES

183

Los promedios de los tres tipos de material a 700P dispuestos en orden ascendente son
Y12.

= 57.25 = 119.75 Y32. =145.75


Y22.

(material tipo 1) (material tipo 2) (material tipo 3)

TO05 = QO.05 (3, 27 ~MSE -n-

= 3.50~67~21

=45.47
donde Qo.os(3, 27) = 3.50 se obtiene por interpolacin en la tabla VIII del apndice. Las comparaciones por pares dan como resultado

3 vs. 1: 3 vs. 2: 2 vs. 1:

145.75 - 57.25 145.75 - 119.75 119.75 - 57.25

= 88.50 > To.os = 45.47 = 26.00 < To.os = 45.47 = 62.50 > TO05 = 45.47

Este anlisis indica que con el nivel de temperatura de 70 o P, la vida media de la batera es la misma para los materiales tipos 2 y 3,Yque la vida media de la batera para el material tipo 1 es significativamente menor. Si la interaccin es significativa, el experimentador podra comparar las medias de todas las ab celdas para determinar cules difieren significativamente. En este anlisis, las diferencias entre las medias de las celdas incluyen los efectos de la interaccin, as como ambos efectos principales. En el ejemplo 5-1, esto dara 36 comparaciones entre todos los pares posibles de las nueve medias de las celdas.

Salida de computadora
En la figura 5-10 se presenta la salida de computadora de Design-Expen para los datos de la vida de la batera del ejemplo 5-1. Observe que SSModelo

= SSMllerial +SSTempelllluno +SS"'leroccln

=10,683.72+39,118.72+9613.78 =59,416.22
y que

R2 = SSModcIo
SSTotII

= 59,416.22 = 0.7652
77,646.97

Es decir, cerca de 77% de la variabilidad de la vida de la batera es explicada por el material de la placa de la batera, la temperatura y la interaccin entre el tipo de material y la temperatura. En la salida de computadora se muestran tambin los residuales del modelo ajustado. A continuacin se indica cmo usar estos residuales para verificar la adecuacin del modelo.

184

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

in hours Response: Life ANOVA for Selected Factorial Model Analysis of variance table [Partial sum of squares] Mean Sumof Squares DF Square Souree 7427.03 59416.22 8 Model 5341.86 10683]2 A 2 39118]2 B 2 19559.36 9613]8 4 2403.44 AB 27 675.21 18230.75 Residual 0.000 O Lack ofFit 675.21 27 18230.75 Pure Error 77646.97 35 Cor Total Std. Dev. Mean

F
Value Prob F

11.00 7.91 28.97 3.56

<0.0001
0.0020 <0.0001 0.0186

significant

C.V.
PRESS

25.98 105.53 24.62 32410.22

R-Squared Adj RSquared Pred R-Squared Adeq Precision

0.7652 0.6956 0.5826 8.178


Student ResIdual Cook's Distanee Outlier t

Diagnostlcs Case Statistics Standard Actual Predicted Value Value Order

Residual

Leverage

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

35
36
Figura 5-10

130.00 74.00 155.00 180.00 150.00 159.00 188.00 126.00 138.00 168.00 110.00 160.00 34.00 80.00 40.00 75.00 136.00 106.00 122.00 115.00 174.00 150.00 120.00 139.00 20.00 82.00 70.00 58.00 25.00 58.00 70.00 45.00 96.00 82.00 104.00 60.00

134.75 134.75 134.75 134.75 155.75 155.75 155.75 155.75 144.00 144.00 144.00 144.00 57.25 57.25 57.25 57.25 119.75 119.75 119.75 119.75 145.75 145.75 145.75 145.75 57.50 57.50 57.50 57.50 49.50 49.50 49.50 49.50 85.50 85.50 85.50 85.50

-4.75 -60.76 20.25 45.25 -6.76 3.25 32.25 -29.75


~6.00

24.00 -34.00 16.00 -23.26 22.75 -17.25 17.75 16.25 -13.75 2.25
~4.75

28.25 4.25 -25.76 -6.75 -37.50 24.50 12.50 0.50 -24.50 8.50 20.50
~4.5G

10.50 -3.50 18.50 -25.50

0.260 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.260 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.250 0.260 0.250 0.250 0.250 0.250 0.260 0.250 0.250 0.250 0.250

-0.211 -2.700 0.900 2.011 -0.256 0.144 1.433 -1.322 -0.267 1.066 -1.511 0.711 -1.033 1.011 -0.767 0.789 0.722 -0.611 0.100 -0.211 1.255 0.189 -1.144 -0.300 -1.666 1.089 0.665 0.022 -1.089 0.378 0.911 -0.200 0.467 -0.156 0.822 -1~ 133

0.002 0.270 0.030 0.150 0.002 0.001 0.076 0.065 0.003 0.042 0.085 0.019 0.040 0.038 0.022 0.023 0.019 0.014 0.000 0.002 0.058 0.001 0.048 0.003 0.103 0.044 0.011 0.000 0.044 0.005 0.031 0.001 0.008 0.001 0.025 0.048

-0.207 -3.100 0.897 2.140 -0.251 0.142 1.463 -1.341 -0.262 1.069 -1.650 0.704 -1.035 1.011 -0.761 0.783 0.716 -0.604 0.098 -0.207 1.269 0.185 -1.151 -0.295 -1.726 1.093 0.548 0.022 -1.093 0.372 0.908 -0.196 0.460 -0.153 0.817 -1.139

Salida de Design-Expert para el ejemplo 5-1.

5-3 DISEO FACfORlALDEDOSFACTORES

185

5..3.3

Verificacin de la adecuacin del modelo

Antes de adoptar las conclusiones del anlisis de varianza, deber verificarse la adecuacin del modelo fundamental. Como anteriormente, la herramienta primaria de diagnstico es el anlisis residual. Los residuales del modelo factorial de dos factores son

y puesto que el valor ajustado Y'jk cin 5-11 queda como

= Y,j.

(el promedio de las observaciones de la celda ij-sima), la ecua-

En la salida de computadora de Design-Expert (figura 5-10) y en la tabla 5-6 se muestran los residuales de los datos de la vida de la batera del ejemplo 5-1. La grfica de probabilidad normal de estos residuales (figura 5-11) no revela nada particularmente problemtico, aun cuando el residual negativo ms grande (-60.75 con 15F para el material tipo 1) se aparta un poco de los dems. El valor estandarizado de este residual es -60.75/v'OTill = -2.34, Y es el nico residual cuyo valor absoluto es mayor que 2. En la figura 5-12 se grafican los residuales contra los valores ajustados Yijk' Esta grfica indica una ligera tendencia de la varianza de los residuales a incrementarse cuando la vida de la batera se incrementa. En las figuras 5-13 y 5-14 se grafican los residuales contra los tipos del material y la temperatura, respectivamente. Ambas grficas indican una ligera desigualdad de la varianza, con la combinacin del tratamiento 15F y material tipo 1, teniendo posiblemente una varianza mayor que las dems. En la tabla 5-6 se observa que la celda 15F-material tipo 1 contiene los dos residuales extremos (-60.75 Y45.25). Estos dos residuales son los principales responsables de la desigualdad de la varianza detectada en las figuras 5-12 a 5-14. Al examinarse nuevamente los datos no se observa ningn problema obvio, tal como un error al registrar los datos, por lo que estas respuestas se aceptan como legtimas. Es posible que esta combinacin de tratamientos particular produzca una vida de la batera ligeramente ms errtica que las dems. Sin embargo, el problema no es lo suficientemente grave como para tener un impacto dramtico en el anlisis y las conclusiones.

S..3 .4

Estimacin de los parmetros del modelo

Los parmetros del modelo de los efectos para el diseo factorial de dos factores
Yjjk

=u + r

+ f3 j +(rf3) ij + E ijk

(5-13)

Tabla 56 Residualesdel ejemplo 5-1 . Tipo de material 1 2 3 -4.75 --60.75 -5.75 3.25 --6.00 24.00 1bmperatura(OF) 15 20.25 45.25 32.25 -29.75 -34.00 16.00 -23.25 22.75 16.25 -13.75 28.25 4.25 70 -17.25 17.75 2.25 -4.75 -25.75 --6.75
~37.50

125 24.50 -24.50 8.50 10.50 -3.50 12.50 0.50 20.50 -4.50 18.50 -25.50

1St

CAPTIJLO 5 INTRODUCCIN A LOS DISEOS FACfORIALES

99

-60.75

-34.25

-7.75
Residual

18.76

46.25

Figura 511 Grfica de probabilidad normal de los residuales del ejemplo 51.

pueden estimarse por mnimos cuadrados. Puesto que el modelo tiene 1 + a + ab parmetros que deben estimarse, hay 1 + a + b + ab ecuaciones normales. Al utilizar el mtodo de la seccin 3-9, no es difcil demostrar que las ecuaciones normales son

ui abnis-vbn~
;-1

r; +an ~Pj +n ~~ (T:f3)ij


j-l
;_1 j-1

1\

= Y..

(5-14a)

80 60
40

20

.,
50

'"


Yijk

100

200

-20
-40

-SO
-80

Figura 512 Grfica de los residuales contra Yqk para el ejemplo 5-1.

5-3 DISEO FACTORIALDEDOSFAcroRES


60

187

40

20

FIgura 513 Grfica de los residuales contra el tipo de material para el ejemplo 5-1.

r:bnjl.+bnt +n
d

j-l

P +n (rp)" = y.. j
j=1
d A

=1, 2, ... ,0

(5-14b) (5-14c) (5-14d)

Pj:onjl.+n

L t +OnPj +n(rP)" =s:


i-1 jEl
"A

j= 1, 2,...,b

(rp),,: njl.+ ni + nfJ J + n(rp)

=Y".

{i.=_I,2, ... ,o }-l,2, ...,b

Por conveniencia, el parmetro que corresponde a cada ecuacin normal se indica a la izquierda de las ecuaciones 5
w14.

60
40

20

1
170

..

:!l

o
-20
~

:125

Temperatura (OF)

-ee -ao

Figura 514 Grfica de los residuales contra la temperatura para el ejemplo 5-1.

188

CAPlULO 5 INTRODUCCIN A LOS DISEOS fACTORIALES

El modelo de los efectos (ecuacin 5-13) est sobreparametrizado. Observe que la suma de las a ecuaciones de la ecuacin 5-14b es igual a la ecuacin 5-14a y que la suma de las b ecuaciones de la ecuacin 5-14c es igual a la ecuacin 5-14a. Asimismo, la operacin suma de la ecuacin 5-14d sobrej para una i particular dar la ecuacin 5-14b, y la operacin suma de la ecuacin 5-14d sobre i para unaj particular dar la ecuacin 5-14c. Por lo tanto, haya + b + 1 dependencias lineales en este sistema de ecuaciones y no existir ninguna solucin nica. A fin de obtener una solucin, se imponen las restricciones

L Ti=O L P =0 j-l
i-l b
j

(5-15a) (5-15b) (5-15c)

" L (r{3)ij = O i-l


y

j= 1, 2, ... ,b

" L (r{3)ij = O j-l

i = 1, 2, ... , a

(5-15d)

Las ecuaciones 5~ 15a y 5-15b constituyen dos restricciones, mientras que las ecuaciones 5-15c y 5-15d forman a + b - 1 restricciones independientes. Por lo tanto, se tienen en total a + b + 1 restricciones, el nmero que se requiere. Al aplicar estas restricciones, las ecuaciones normales (ecuaciones 5-14) se simplifican considerablemente, y se obtiene la solucin

ft= Y ...

,(r{3)ij =Yij. - Yi.. - Y. -:

=Yi.. - Y... P = Y.j. - Y... j


ti

i =1, 2,

,a

j= 1, 2, ,b
j.

+ y.

{iJ' = 1, 2,... , ab = 1 2,
,

...,

(5-16)

Observe el gran atractivo intuitivo de esta solucin de las ecuaciones normales. Los efectos de los tratamientos de los renglones se estiman con el promedio del rengln menos el gran promedio; los tratamientos de las columnas se estiman con el promedio de la coiumna menos el gran promedio, y la interaccin ij-sima se estima con el promedio de la celda ij-sima menos el gran promedio, el efecto del rengln i-simo y el efecto de la columna j-sima. Al utilizar la ecuacin 5-16, el valor ajustado Yijk puede encontrarse como

Yijk

~ " = ft+t i +{3j +(r{3)ij

= Y.. +(- - Y... )+(- - Y.. Yi.. Yj. -) - - Ji.. - Y.j. + Y.. ) +( Yij. =Yij. Es decir, la observacin k-sima de la celda ij-sima se estima con el promedio de las n observaciones de esa celda. Este resultado se us en la ecuacin 5-12 para obtener los residuales del modelo factorial de dos factores. Puesto que se han usado restricciones (ecuaciones 5-15) para resolver las ecuaciones normales, los parmetros del modelo no tienen estimaciones nicas. Sin embargo, ciertas funciones importantes de los parmetros del modelo son estimables, es decir, tienen una estimacin nica independientemente de las restricciones elegidas. Un ejemplo es ri- ru + (rp)i. - (rp)u., que podra considerarse como la "verdade-

53 DISEO FACfORIAL DEOOSFACfORES

189

ra" diferencia entre los niveles i-simo y u-simo del factor A. Observe que la verdadera diferencia entre los niveles de cualquier efecto principal incluye un efecto de la interaccin "promedio". Es este resultado el que perturba las pruebas de los efectos principales en presencia de una interaccin, como se seal anteriormente. En general, cualquier funcin de los parmetros del modelo que sea una combinacin lineal del miembro izquierdo de las ecuaciones normales es estimable. Esta propiedad tambin se hizo notar en el captulo 3 cuando se estudi el modelo de un solo factor. Para mayores detalles, ver el material suplementario del texto de este captulo.

5..3.5

Eleccin del tamao de la muestra

Para determinar un tamao de la muestra (el nmero de rplicas, n) apropiado en un diseo factorial de dos factores, el experimentador puede apoyarse en las curvas de operacin caracterstica que aparecen en la parte V del apndice. En la tabla S-7 se muestra el valor apropiado del parmetro 112, as como los grados de libertad del numerador y el denominador. Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de 112 que corresponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera. Por ejemplo, si la diferencia en las medias de dos renglones cualesquiera es D, entonces el valor mnimo de 112 es
<})2

= nbD2
2au

(S-17)

mientras que si la diferencia en las medias de dos columnas cualesquiera es D, entonces el valor mnimo de 11 2 es 11
2

=,::
2

(S-18)

Por ltimo, el valor mnimo de <lJ2 que corresponde a una diferencia D entre dos efectos de interaccin cualesquiera es
<})2

nD 2q2 [(o -l)(b-l)+l]

(S-19)

Para ilustrar el uso de estas ecuaciones, considere los datos de la vida de la batera del ejemplo S-l. Suponga que antes de correr el experimento se decide que la hiptesis nula deber rechazarse con una alta

Tabla 57

Parmetros de la curva de operacin caracterstica de la parte V del apndice para el dseo factorial de dos factores, modelo con efectos fijos Grados de libertad del numerador Grados de libertad del denominador

Factor

A
a0
b

a-l
2

ab(n -1)

an
j-l

13:

b-l

ab(n -1)

AB
0
2

(o -1)(b-l)
[(0 -1 )(b -1)+ 1]

ab(n -1)

190

CAPTIlLO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

probabilidad si la diferencia en la vida media de la batera entre dos temperaturas cualesquiera es hasta de 40 horas. Por lo tanto D =40. Ysi se supone que la desviacin estndar de la vida de la batera es aproximadamente 25. entonces por la ecuacin 518 se obtiene

~2

= naD 2
2ba

_ n(3)(40)2 - 2(3)(25)2

= 1.2&
como el valor mnimo de ~2. Suponiendo que a construir la tabla siguiente:
n 2 3 4
cIl2 cIl

= 0.05. ahora puede usarse la parte V del apndice para


V 2 "" Grados de libertad del error

VI "" Grados de libertad del numerador

fJ

2.56 3.84 5.12

1.60 1.96 2.26

2 2 2

9 18 27

0.45 0.18 0.06

Observe que con n = 4 rplicas se obtiene un riesgo {3 de cerca de 0.06. o una probabilidad aproximada de 94%, de rechazar la hiptesis nula si la diferencia en la vida media de la batera con dos niveles de temperatura cualesquiera es hasta de 40 horas. Por lo tanto, se concluye que cuatro rplicas bastan para proporcionar la sensitividad deseada siempre y cuando la estimacin usada para la desviacin estndar de la vida de la batera no tenga un error grave. En caso de duda, el experimentador podra repetir el procedimiento anterior con otros valores de a para determinar el efecto que tendra una estimacin equivocada de este parmetro sobre la sensitividad del diseo.

5..3.6

El supuesto de no interaccin en un modelo de dos factores

Ocasionalmente, un experimentador siente que es apropiado un modelo de dos factores sin interaccin, por ejemplo

,a b { k =1, 2, , n

i.: 1, 2, }-l,2,

(5-20)

Sin embargo, se deber ser muy cuidadoso al hacer caso omiso de los trminos de interaccin, ya que la presencia de una interaccin significativa puede tener un impacto dramtico sobre la interpretacin de los datos. El anlisis estadstico de un modelo factorial de dos factores sin interaccin es directo. En la tabla 5-8 se presenta el anlisis de los datos de la vida de la batera del ejemplo 5-1, suponiendo que es vlido el moTabla 5.8 Anlisis de varianza de losdatos de la vidade la baterasuponiendo que no hay interaccin Fuente de Suma de Grados de Cuadrado variacin cuadrados libertad medio . 10,683.72 2 5,341.86 Tipos de material

'Iemperatura
Error

lbtal

39,118.72 27,844.51 77,646.96

2 31 35

19,559.36 898.21

5.95 21.78

5-3 DISEO FACTORIAL DEOOSFACTORES

191

delo sin interaccin (ecuacin 5-20). Como ya se seal. los dos efectos principales son significativos. Sin embargo. tan pronto como se efecta el anlisis residual de estos datos. se pone de manifiesto que el modelo sin interaccin es inadecuado. Para el modelo de dos factores sin interaccin. los valores ajustados YI. son 'pijk = . + Yi. -y.... En la figura 5-15 se presenta la grfica deYij. - ~jk (los promedios de las celdas menos el valor ajustado de esa celda) contra el valor ajustado ~jk' Ahora las cantdadesji; - Y,,t pueden considerarse como las diferencias entre las medias de las celdas observadas y las medias de las celdas estimadas suponiendo que no hay interaccin. Cualquier patrn en estas cantidades sugiere la presencia de una interaccin. En la figura 5-15 se observa un patrn claro cuando las cantidadesjj - Y'k pasan de positivo a negativo. y despus de nuevo a positivo y a negativo. Esta estructura es el resultado de la interaccin entre los tipos del material y la temperatura.

5..3.7

Una observacin por celda

En ocasiones se encuentran experimentos de dos factores con una sola rplica, es decir. en los que slo hay una observacin por celda. Cuando hay dos factores y una sola observacin por celda. el modelo de los efectos es

i {.:

1.2, ... a j-1.2, ... b

(5-21)

El anlisis de varianza para esta situacin se presenta en la tabla 5-9. suponiendo que ambos factores son fijos. Al examinar los cuadrados medios esperados. se observa que la varianza del error q2 es no estimable; es decir. que el efecto de la interaccin de los dos factores (r:P)ij y el error experimental no pueden separarse de alguna manera obvia. Por consiguiente. no se cuenta con pruebas para los efectos principales a menos que el efecto de la interaccin sea cero. Si no hay una interaccin presente. entonces (r:P)ij =Opara toda i y i, y un modelo plausible es

i {.:

1.2, .... a j-1.2, ... b

Si el modelo (ecuacin 5-22) es apropiado, entonces el cuadrado medio de los residuales de la tabla 5-9 es un estimador insesgado de 02. y los efectos principales pueden probarse comparando MSA y MSB con MSRaiduaJ.
30
30

10
,~

50

s
o
-10 100


150 200

l~;"

'IJ>

-20
-30

Fipra S15 Grfica de h - YI/k contra YJ/< para los datos de la vida de la batera.

- - - - - - - - - - - - - - - - - - - - - - - - - - - , - - - -----

192

CAProLO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

'labia 59 Anlisis de varianza de un modelo de dos factores, una observacin por celda

Fuente de variacin Renglones (A) Columnas (B) Residual oAB Thtal

Suma de cuadrados

Grados de libertad
a -1

Cuadrado medio
MS
A

Cuadrado medio esperado

~
h

Yi. _1... b ~
2 2

# :;
Y; Sustraccin

b -1
(a~I)(b-l)

MS B

MSResidual

ab-l

Una prueba desarrollada por 'Iukey [Ula] es til para determinar si est presente una interaccin. En el procedimiento se supone que el trmino de la interaccin tiene una forma particularmente simple, a saber,

('r{3)ij = yri{3j donde r es una constante desconocida. Al definir as el trmino de la interaccin, puede usarse un enfoque de regresin para probar la significacin del trmino de la interaccin. En la prueba se hace la particin de la suma de cuadrados de los residuales en un componente con un solo grado de libertad debido a la no aditividad (interaccin) y un componente del error con (a -1)(b -1) -1 grados de libertad. En lo que a los clculos se refiere, se tiene

(5-23)

con un grado de libertad, y

ss_ = SSReoidUal -SSN (5-24) con (a - l)(b -1) - 1 grados de libertad. Para probar la presencia de una interaccin, se calcula
F=
o
SSError

/[(a-1)(b-1)-1]

(5~)
-

Si F > Fa,

1, (4 _ l)(b _ 1) _ l'

debe rechazarse la hiptesis de que no hay ninguna interaccin.

EJEMPLO 5..2

'" '"

'" '"

iII

111

Las impurezas presentes en un producto qumico son afectadas por dos factores, la presin y la temperatura. En la tabla 510 se muestran los datos de uJ?a sola rplica de un experimento factorial. Las sumas de cuadrados son

53 DISEO FAeTORIAL DE DOS FACfORES

193

Tabla 5.10 Datos de las impurezas del ejemplo 52

Thmperatura
eF)
100 125 150
25

Presin 30 4 1
1

5 3 1

35 6 4 3

40

45 5 3 2
10

3 2
1

Yi. 23
13 8

s,

13

44 "'Y ..

SSRcsldual = SST - SSA - SS8 = 36.96- 23.33-11.60 '" 200

La suma de cuadrados de la no aditividad se calcula con la ecuacin 5-23 de la siguiente manera:

LL v.s., = (5)(23)(9)+(4)(23)(6)++(2)(8)(10)= 7236


;~1

j-1

[! }: YijYI.Y.j _ Y.. (SSA +SS8 + ~:)]2


.-1
J~l

SSN

=
-

abSSASSB

[7236- (44)(23.33+ 11.60+ 129.07)]2 (3)(5)(23.33)(11.60)

= [20.00]2 = 00985 4059.42 . y la suma de cuadrados del error es, por la ecuacin 5-24,
SS Error

=SSResidual -

SSN '" 200-0.0985= 1.9015

El anlisis de varianza completo se resume en la tabla 5-11. El estadstico de prueba para la no aditividad es F o = 0.0985/0.2716 = 0.36, de donde se concluye que no hay evidencia de interaccin en estos datos. Los efectos principales de la temperatura y la presin son significativos.
.. .. .. .. 111

Para concluir esta seccin, se hace notar que el modelo factorial de dos factores con una observacin por celda (ecuacin 5-22) luce exactamente igual que el modelo de bloques completos aleatorizados

194

CAPTIJLO 5 INTRODUCCIN A LOS DISEOS fACTORIALES

'ThbIa 5.11 Anlisisde varianzadel ejemplo52 Suma de Grados de Fuente de variacin cuadrados libertad 23.33 2 'Iemperatura

Cuadrado medio

Fo
42.97 10.68 0.36

ValorP

Presin
No aditividad Error Thtal

11.60 0.0985 1.9015 36.93

4 1 7 14

11.67 2.90 0.0985 0.2716

0.0001 0.0042 0.5674

(ecuacin 4~1). De hecho, la prueba de Tukey can un solo grado de libertad para la no aditividad puede aplicarse directamente para probar la presencia de una interaccin en el modelo de bloques aleatorizados. Sin embargo, es necesario recordar que las situaciones experimentales que llevan al modelo de bloques aleatorzados y al modelo factorial son muy diferentes. En el modelo factorial, todas las ab corridas se hacen de manera aleatoria, mientras que en el modelo de bloques aleatorizados la aleatorizacin slo ocurre dentro del bloque. Los bloques constituyen una restriccin sobre la aleatorizacin. Por lo tanto, la manera en que se corren los experimentos, as como la interpretacin de los dos modelos, es muy diferente. 1;(

5..4

DISEO FACTORIAL GENERAL

Los resultados del disefio factorial de dos factores pueden ampliarse al caso general en que haya niveles del factor A, b niveles del factor B, e niveles del factor e, etc., dispuestos en un experimento factorial. En general, habr abe ... n observaciones totales si se hacen n rplicas del experimento completo. De nueva cuenta, observe que es necesario un mnimo de dos rplicas (n ;:: 2) para determinar una suma de cuadrados debida al error si todas las interacciones posibles estn incluidas en el modelo. Cuando todos los factores del experimento son fijos, es sencillo formular y probar hiptesis acerca de los efectos principales y las interacciones. Para un modelo con efectos fijos, los estadsticos de prueba para cada efecto principal e interaccin pueden construirse dividiendo el cuadrado medio correspondiente del efecto o interaccin por el cuadrado medio del error. Thdas estas pruebas F sern de una cola superior. El nmero de grados de libertad de cualquier efecto principal es el nmero de niveles del factor menos uno, y el nmero de grados de libertad de una interaccin es el producto del nmero de grados de libertad asociados con los componentes individuales de la interaccin. Por ejemplo, considere el modelo del anlisis de varianza de tres factores:

YijId

=#+1:/ +P j +Yk +(1:P) +(T)')ik +(Pr)jk i =1, 2, , a


+ (1:Pr) .. +E Ijk ijId

1, 2, , b { k - 1, 2, , e 1= 1, 2, ,

t:

(5-26)

Suponiendo queA, B y e son fijos, la tabla del anlisis de varianza se presenta en la tabla 5-12. Las pruebas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios esperados.

'labia 5-12 La tabla del anlisis de varianza del modelo de tres factores con efectos fijos
Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio Cuadrado medio esperado

Fo

A B
C

SSA

a-l

MS A MSB MSc MSAB

a+

bcn2: -r; a-l b-l

Fa

MS A
= MS

SSB

b-l

2 aen
a +

2: fJ:
Yi

R = MSB o MSE

SSc

e-l

rr+ abn2:
e-l

Po =

MSe MS
E

AB AC BC ABC
Error
Thtal

SSAB

(a -1)(b -1)

2 en (} +
2

2:2: (-rfJk 2:2:

(a-l)(b-l)

Fa = MSE

MSAB

SSAC

(a-l)(e-l)

MS A C

a+

bn (lJI); (a-l)(e-l)

Po = Po = Po=

MSAc MS E MSB c MS E MS ABC MSE

SSBC

(b -1)(e -1)

MSBC

(}2+ an 2 (} +

2:2: ({Jy)~

(b-l)(e-l)

SSABC SSE SST

(a - 1)(b -1)(e -1) abe(n -1) aben-l

MS ABC MSE

n2:2:2: (-r{Jy~
(a-l)(b-l)(e-l)

a2

\O

....

\JI

196

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

En general, los clculos del anlisis de varianza se efectuaran utilizando un paquete de software de estadstica. Sin embargo, en ocasiones resultan tiles las frmulas para calcular manualmente las sumas de cuadrados de la tabla 5-12. La suma de cuadrados total se encuentra de la manera acostumbrada como (5-27) Las sumas de cuadrados de los efectos principales se encuentran a partir de los totales de los factores A(yi.J, B(y JJ Y C(y..d de la siguiente manera: SS

= -~ Aben LJ
1m

y 2 -~ i... aben

(5-28)

1 b 2 SS --~ y2_~ B ~ aen LJ .t.. aben


J-1

(5-29)

SS =_~ 2_~ C abn LJ Y.k. ab en k~1

(5-30)

Para calcular las sumas de cuadrados de las interacciones de dos factores, se necesitan los totales de las celdasA x B,A x C y B x C. Con frecuencia es til desplegar la tabla de los datos originales en tres tablas de dos vas para calcular estas cantidades. Las sumas de cuadrados se encuentran con 1 a b 2 SS = - ~~ ~ -~-SS -SS AB en LJ LJ Y'J.. aben A B
,~l I~l

= SSSublolalcS(AB) SSAe

SSA - SSB
2

(5-31)

= -b L:L: Yi~k. -

Y.... - SSA n i-1 k,;,1 aben = SSSubtol.les(AC) - SSA - SSc


2

~ SSC
(5-32)

y
Yik.
2

-~-SS ~SS aben B C


(5-33)

Observe que las sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los totales de cada tabla de dos vas. La suma de cuadrados de la interaccin de los tres factores se calcula a partir de los totales de las celdas {YijkJ de tres vas como 1 a b e 2 SSABC ~~6 Y~k. - ~~n - SSA -SSB - SSC -SSAB - SSAC -SSBC (5-34a)

=;:;

= SSSublolalcS(ABC) -

SSA

SSB - SSC - SSAB - SSAC - SSBC

(5-34b)

La suma de cuadrados del error puede encontrarse restando la suma de cuadrados de cada efecto principal e interaccin de la suma de cuadrados total o con

SSE

= SST -

SSSubtolaleS(ABe)

(5-35)

540I5EOFACTORlALOENERAL

197

EJEMPLO 5~3 .. "" ... "" ... ""." ...... """" ...... , ....
El problema del embotellado de un refresco
Una empresa embotelladora de refrescos est interesada en obtener alturas de llenado ms uniformes en las botellas que se fabrican en su proceso de manufactura. 'Iericamente, la mquina de llenado llena cada botella a la altura objetivo correcta, pero en la prctica, existe variacin en tomo a este objetivo, y a la embotelladora le gustara entender mejor las fuentes de esta variabilidad y, en ltima instancia, reducirla. El ingeniero del proceso puede controlar tres variables durante el proceso de llenado: el porcentaje de carbonatacin (A), la presin de operacin en el llenador (B) y las botellas producidas por minuto o rapidez de lnea (C). Es sencillo controlar la presin y la rapidez, pero el porcentaje de carbonatacin es ms difcil de controlar durante la manufactura real debido a que vara con la temperatura. Sin embargo, para los fines de un experimento, el ingeniero puede controlar la carbonatacin en tres niveles: 10, 12 Y14 por ciento. Elige dos niveles para la presin (25 y 30 psi) Ydos niveles para la rapidez de lnea (200 y 250 bpm). El ingeniero decide correr dos rplicas de un diseo factorial con estos tres factores, haciendo las 24 corridas de manera aleatoria. La variable de respuesta observada es la desviacin promedio de la altura del llenado objetivo que se observa en una corrida de produccin de botellas con cada conjunto de condiciones. En la tabla 5-13 se muestran los datos que resultaron de este experimento. Las desviaciones positivas son alturas de llenado arriba del objetivo, mientras que las desviaciones negativas son alturas de llenado abajo del objetivo. Los nmeros encerrados en crculos de la tabla 5~ 13 son los totales de las celdas de tres vas Yijk.' La suma de cuadrados total corregida que se encuentra con la ecuacin 5-27 es

SST =

LLLL Y:kl- ;;;~n


;;1 j;1
k~1

1-1

= 571- ~ =

(75)2

336.625

'labia 5.13 Datos de la desviacin de la altura de llenado del ejemplo 5-3 Presin de operacin (B) 25 psi Porcentaje de carbonatacin (A) 10 12 14 Rapidez de lnea (C) 200 250 200

30 psi
Rapidez de lnea (C) 250

-1

-3

GP
~

-1

Q\
~

-1

O
2 3 7 9

Q\

e yJk.
6
lbtalesA x B
Y/j.

CD

21

i
~
15

CD
@

t5' \.V tW
20

1
6 5 10 11 34 54

@ @

-4

20
59

'Iotales B x

75 =Y._

lbtalesA x

e
250 1 14
34

e
30
1
A

A 10 12
14

25 -5 4

200

22

16 37

10 12
14

-5 6
25

198

CAPTIJLO S IN1RODUCCIN A LOS DISEOS FACTORIALES

y las sumas de cuadrados de los efectos principales que se calculan con las ecuaciones 5-28,5-29 Y5-30 son SS
Carl>onataein

1 a Z =_~ y2_~

ben ~
1~1

t.:

aben
Z
= 252.750

~[(-4)2 +(20)z +(59)z]- (72d


1
b Z
J-1

SS . =_~ yZ _~ PTe&ln aen ~ .J.- aben

=~[(21)Z +(54)z]- (75)z = 45.375


12 24
y

SS

Rapidez -

Z Y.... abn LJ Y..k. - bcn


k-1

=~[(26)2 +(49)2]- (75)2 4 ' = 22042 12 . 2


Para calcular las sumas de cuadrados de las interacciones de dos factores, se deben encontrar los totales de las celdas de dos vas. Por ejemplo, para encontrar la carbonatacin-presin o interaccinAB, se necesitan los totales de las celdas A x B {Yij) que se muestran en la tabla 5-13. Utilizando la ecuacin 5-31, se encuentra que las sumas de cuadrados son
SSAB

=- ~~ YZ-- - ~...
en
i-1 j-1

a en

-SSA -SSJI

=~[(_5)Z +(1)2 +(4)2 +(16)Z +(22)2 +(37)2]- (7~2 -252750-45.375 = 5.250


Para la carbonatacin-rapidez o interaccinAC se usan los totales de las celdasA x C {yi.d que se muestran en la tabla 5-13 y la ecuacin 5-32:
SSAC

= -b L~
n
i~l k~l

yZk. - Y -SSA -SSc ab en

= [(_S)2 +(1)2 +(6)2 = 0.583

+(14)2 +(25)z +(34)2]- (7;{ - 252.750- 22.042

La presin-rapidez o interaccin BC se encuentra con los totales de las celdas B x C {y jk} que se muestran en la tabla 5-13 y la ecuacin 5-33:
SS
Be

1 b e = - ~~

an LJ LJ
J~1 k~1

2 Y.jk.

-~-SS -SS aben B e


45.375- 22.042

= ~[(6)2 +(15)2 +(20)z +(34)z]- (7;{ = 1.042

5-4 DISEO FACTORIAL GENERAL

199

La suma de cuadrados de la interaccin de los tres factores se encuentra con los totales de las celdas A x B x e {yijd, los cuales estn encerrados en un crculo en la tabla 5-13. Por la ecuacin 5-34a se encuentra 1 a b e y2 SSABC =Y~k. - -b - SSA - SSB - SSC - SSAB - SSAC - SSBC n ;.1 j-l 10-1 a cn

2: 2:
2

= 2[(-4)

2 2 2 2 (75)2 +(-1) +(-1) +"+(16) +(21) ]-z-

- 252.750- 45.375- 22042- 5.250- 0.583-1.042 = 1.083 Por ltimo, al observar que
SSSUblolales(ABC)

=- 2:2:2: n
= SST = 8.500

i-l j-l 10-1

Yijk. - -b- = 328.125 a cn

l_

se tiene
SSE

SSSUbtotales(ABC)

= 336.625- 328.125

En la tabla 5-14 se resume el anlisis de varianza. Se observa que el porcentaje de carbonatacin, la presin de operacin y la rapidez de lnea afectan significativamente el volumen de llenado. El cociente F de la interaccin carbonatacin-presin tiene un valor P de 0.0558, lo cual indica cierta interaccin entre estos factores. El siguiente paso deber ser un anlisis de los residuales de este experimento. Se deja como ejercicio para el lector, pero se seala que la grfica de probabilidad normal de los residuales y los dems diagnsticos usuales no indican ning.n motivo de preocupacin importante. Como ayuda para la interpretacin prctica de este experimento, en la figura 5-16 se grafican los tres efectos principales y la interaccinAB (carbonatacin-presin). Las representaciones de los efectos principales son slo grficas de los promedios de las respuestas marginales para los niveles de los tres factores. Observe que las tres variables tienen efectos principales positivos; es decir, el incremento de la variable mueve hacia arriba la desviacin promedio del llenado objetivo. La interaccin entre la cabonatacin y la presin es bastante pequea, como lo indica la forma similar de las dos curvas de la figura 5-16d. Puesto que la empresa quiere que la desviacin promedio del llenado objetivo est cerca de cero, el ingeniero decide recomendar el nivel bajo de la presin de operacin (25 psi) y el nivel alto de la rapidez de lnea (250 bpm, que maximizar la rapidez de produccin). En la figura 5-17 se grafica la desviacin
Tabla 5.14 Anlisis de varianza del ejemplo 5-3 Suma de Fuente de variacin cuadrados Porcentaje de carbonatacin (A) Presin de operacin (B) Rapidez de lnea (C) AB AC BC ABC Error Thtal 252.750 45.375 22.042 5.250 0.583 1.042 1.083 8.500 336.625

Grados de libertad 2 1 1 2 2 1 2 12 23

Cuadrado medio 126.375 45.375 22.042 2.625 0.292 1.042 0.542 0.708

r,
178.412 64.059 31.118 3.706 0.412 1.471 0.765

ValorP <0.0001 <0.0001 0.0001 0.0558 0.6713 0.2485 0.4867

200
~
~
c '"

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORlALES 8

6
4

6
4 2
O

'O

.,
c

-o

~
g

2
O

os: '"
o

-2

10

12

14

-2

I....-......L----~B

25

30

Porcentaje de carbonataci6n (A) a)

Presi6n (B)
b)

10
"O
C

~ Q;
"O

'"
6
6
o

'ii
E
o

4
2

-c " 003
o~

i5. i

'" O " _21....----I.---...I...--C


250 Rapidez de linea (el
e)

o
-2 L----L_...1._...l-_A

200

10

12

14

carbonatacln-prasin
d)

Interaoci6n

Figura 5-16 Grficas de los efectos principales y la interaccin del ejemplo 5-30 a) Porcentaje de carbonatacin (A), b) presin (B), c) rapidez de lnea (C), d) interaccin carbonatacn-presin.

promedio observada de la altura de llenado objetivo con los tres diferentes niveles de carbonatacin para este conjunto de condiciones de operacin. Ahora, el nivel de la carbonatacin no puede actualmente controlarse perfectamente en el proceso de manufactura, y la distribucin normal indicada con la lnea continua de la figura 5-17 es una aproximacin de la variabilidad de los niveles de carbonatacin que se
"O
C

--8K
.!!c.
~~
~cv

'" " "'

..

6
Distribucin mejorada del porcentaje de carbonatacln

Z;Q Oig

l'!"

4
2
O

o'"
...

U
"'-l'!

"'-

I I

,, ",
12 14

. os:

~8

c"

-2

10

Porcentaje de carbonatacin (A)

Figura 517 Desviacin promedio de la altura de llenado con rapidez alta y presin baja para diferentes niveles de carbonatacin.

5-5 AJUSTEDECURVASYSUPERFICIES DE RESPUESTA

201

registran actualmente. Como el proceso es impactado por los valores del nivel de carbonatacin sacado de esta distribucin, la fluctuacin de las alturas de llenado ser considerable. Esta variabilidad de las alturas de llenado podra reducirse si la distribucin de los valores del nivel de carbonatacin siguieran la distribucin normal indicada con la lnea punteada de la figura 5-17. La reduccin de la desviacin estndar de la distribucin del nivel de carbonatacin se consigui finalmente mejorando el control de la temperatura durante la manufactura.

Se seal ya que si todos los factores de un experimento factorial son fijos, la construccin del estadstico de prueba es directa. El estadstico para probar cualquier efecto principal o interaccin se forma siempre dividiendo el cuadrado medio del efecto principal o la interaccin por el cuadrado medio del error. Sin embargo, si el experimento factorial incluye uno o ms factores aleatorios, la construccin del estadstico de prueba no siempre se hace de esta manera. Es necesario examinar los cuadrados medios esperados para determinar las pruebas correctas. La revisin completa de los experimentos con factores aleatorios se pospone hasta el captulo 12.

5..5

AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

Se ha visto que puede resultar til ajustar una curva de respuesta a los niveles de un factor cuantitativo para que el experimentador cuente con una ecuacin que relacione la respuesta con el factor. Esta ecuacin podra utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles intermedios entre los factores, respecto de los que se utilizaron realmente en el experimento. Cuando al menos dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir y con varias combinaciones de los factores del diseo. En general, se usan mtodos de regresin lineal para ajustar estos modelos a los datos experimentales. Este procedimiento se ilustra en la seccin 3-5.1 para un experimento con un solo factor. A continuacin se presentan dos ejemplos que incluyen experimentos factoriales. Se utilizar un paquete de software de computadora para generar los modelos de regresin. Para mayor informacin acerca del anlisis de regresin, referirse al captulo 10 y al material suplementario del texto de este captulo.

EJEMPLO 5..4

Considere el experimento que se describe en el ejemplo 5-1. El factor temperatura es cuantitativo y el tipo de material es cualitativo. Adems, hay tres niveles de la temperatura. Por consiguiente, puede calcularse un efecto de la temperatura lineal y uno cuadrtico para estudiar la forma en que la temperatura afecta la vida de la batera. En la tabla 5-15 se presenta la salida condensada de Design-Expert para este experimento, donde se supone que la temperatura es cuantitativa y el tipo de material es cualitativo. El anlisis de varianza de la tabla 5-15 indica que la fuente de variabilidad "modelo" se ha subdividido en varios componentes. Los componentes "A" Y"A 2" representan los efectos lineal y cuadrtico de la temperatura, y "B" representa el efecto principal del factor tipo de material. Recuerde que el tipo de material es un factor cualitativo con tres niveles.Los trminos "AB" y "A 2E" son las interacciones del factor temperatura lineal y cuadrtico con el tipo de material. Los valores P indican queA 2 y AB no son significativos, mientras que el trminoA 2B es significativo. Con frecuencia se piensa en eliminar los trminos o factores no significativos del modelo, pero en este

Tabla 515 Salida de Design-Exj)en para el ejemplo 54

Response: Llfe In hr ANOVAfor Response Surface Reduced Cublc Model Analysls of varlance table lPartlal sum of squares] F Sum of Mean Source Squares DF Square Value 11.00 59416.22 8 7427.03 Modal 39042.67 1 39042.67 57.82 A 10683.72 7.91 2 5341.86 a2 A 76.06 1 76.06 0.11 1.71 2315.08 AB 2 1157.54 5.40 7298.69 2 3649.35 Na 18230.75 27 675.21 Residual 0.000 O Lack of Fit 675.21 18230.75 27 Pure Error Cor Total 77646.97 35 Std.Dev. Mean CV PRESS Term Intercept A-Temp 8[1] B[2] A2 AB[1! AB[2] A2B[1] A2B[2] 25.98 105.53 24.62 32410.22 Coefficient Estlmate 107.58 -40.33 -50.33 12.17 -3.08 1.71 -12.79 41.96 -14.04 R-Squared Adj R-Squared Pred R-Squared Adeq Precision DF 1 1 1 1 1 1 1 1 1 Standard Error 7.50 5.30 10.61 10.61 9.19 7.50 7.50 12.99 12.99

Prob> F <0.0001
<0.0001 0.0020 0.7398 0.1991 0.0106

significant

0.7652 0.6956 0.5826 8.178


95%CI Low 92.19 -51.22 -72.10 -9.60 -21.93 -13.68 -28.18 15.30 -40.70 95%CI High 122.97 -29.45 -28.57 33.93 15.77 17.10 2.60 68.62 12.62

VIF 1.00 1.00

Final Equation in Terrns of Codad Factors: Life '" +107.58 -40.33 *A -50.33 *B[1] +12.17 *8[2] -3.08 *A2 +1.71 *AB[1] -12.79 *AB[2] +41.96 *A2B[11 -14.04 *A2B[2] Final Equation in Terms of Actual Factors: Material Type 1 Lifa '" +169.38017 -2.48860 *Temp +0.012851 *Te m p2 Material Type 2 Life '" +159.62397 -0.17901 *Temp +0.41627 *Te mp2 Material. Type 3 Life '"' +132.76240 +0.89264 *Temp -0.43218 *Tem p2

5-5 AJUSTE DECURVAS y SUPERFICIES DERESPUESTA

203

caso eliminar A 2y AB Yconservar A 2B resultar en un modelo que no es jerrquico. El principio de jerarqua establece que si un modelo contiene un trmino de orden superior (tal comoA 2B), deber contener tambin todos los trminos de orden inferior que lo componen (A 2 YAB en este caso). La jerarqua promueve un tipo de consistencia interna en un modelo, y muchos constructores de modelos estadsticos siguen rigurosamente este principio. Sin embargo, la jerarqua no es siempre una buena idea, y muchos modelos en realidad funcionan mejor como ecuaciones de prediccin que no incluyen los trminos no significativos que propone la jerarqua. Para mayor informacin, ver el material suplementario del texto de este captulo. La salida de computadora incluye tambin estimaciones de los coeficientes del modelo y una ecuacin para la prediccin final de la vida de la batera en trminos de factores codificados. En esta ecuacin, los niveles de la temperatura sanA = -1, 0, + 1, respectivamente, cuando la temperatura est en los niveles bajo, intermedio y alto (15, 70, 125P). Las variablesB[l] y B[2] son variables indicadoras codificadas que se definen de la siguiente manera:
~-------~

Tipo de material 123


1 O O 1 -1 -1

B[I] B[2]

Hay tambin ecuaciones para la prediccin de la vida de la batera en trminos de los niveles de los factores reales. Observe que como el tipo de material es un factor cualitativo, hay una ecuacin para la vida predicha como una funcin de la temperatura para cada tipo de material. En la figura 5~ 18 se muestran

188

20 16.00


42.50
70.00
Temperatura

97.50

125.00

Figura S-18 La vida predicha como una funcin de la temperatura para los tres tipos de material, ejemplo 5-4. .

204

cxrmno

INTRODUCCIN A LOS DISEOS FACTORIALES

las curvas de respuesta generadas por estas tres ecuaciones de prediccin. Comprense con la grfica de la interaccin de dos factores para este experimento de la figura 5-9.
.. .. .. .. .. .. .. .. .. .. .. .. .. 111 111 111 .

Si varios de los factores de un experimento factorial son cuantitativos, puede usarse una superficie de respuesta para modelar la relacin entre y y los factores del diseo. Adems, los efectos de los factores cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. De manera similar, es posible hacer la particin de las interacciones de factores cuantitativos en componentes de interaccin con un solo grado de libertad. Esto se ilustra en el ejemplo siguiente.

EJEMPLO 5,.5 . . . . . . . . . . .

111

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

..

111

111

..

..

..

..

..

..

..

..

..

..

..

..

..

Se piensa que la vida efectiva de una herramienta de corte instalada en una mquina controlada numricamente se afecta por la velocidad de corte y el ngulo de la herramienta. Se seleccionan tres velocidades y tres ngulos, y se lleva a cabo un experimento factorial con dos rplicas. En la tabla 5-16 se muestran los datos codificados. Los nmeros de las celdas encerrados en crculos son los totales de las celdas {yijJ. En la tabla 5-17 se presenta la salida condensada de Design-Expert para este ejemplo. Los trmnosA y A 2 son los efectos lineal y cuadrtico del ngulo de la herramienta, y By B 2 son los efectos lineal y cuadrtico de la velocidad. Los trminosAB,A 2B,AB2yA 2B2 representan los componentes lineal x lineal, cuadrtico x lineal, lineal x cuadrtico y cuadrtico x cuadrtico de la interaccin de dos factores. Aun cuando hay algunos valores P grandes, se han conservado todos los trminos del modelo para respetar la jerarqua. En la ecuacin de prediccin expresada en factores codificados se utilizan los niveles -1, OY + 1 de A y B para representar los niveles bajo, intermedio y alto, respectivamente, de estos factores. En la figura 5-19 se presenta la grfica de contorno de la superficie generada por la ecuacin de prediccin de la vida de la herramienta. El examen de esta superficie de respuesta indica que la vida mxima de la herramienta se consigue con velocidades de corte de alrededor de 150 rpm y ngulos de la herramienta de 25. La grfica de la superficie de respuesta tridimensional de la figura 5-20 proporciona en esencia la misma informacin, pero ofrece una perspectiva diferente, y en ocasiones ms til, de la superficie de respuesta de la vida de la herramienta. La exploracin de las superficies de respuesta es un aspecto muy importante del diseo experimental, el cual se estudiar en detalle en el captulo 11.

Tabla 5-16 Datos del experimento de la vida de la herramienta de corte

ngulo de la herramienta (grados)

Velocidad de corte (pulg/min)

125 -2
~1

150
-3 O
1

175

Yi..

15
20

25
Ji-

2 -1
O

@ @

2
3

G)

-1
16 9

0
@
12

4
6

@)

ED
-2

5
6

O -1

@
14

24 =Y...

55 AJUSTE DECURVAS YSUPERFICIES DERESPUESTA


Tabla 5.17 Salida de Design-Expert para el ejemplo S-S

205

Response: Lite in Hours ANOVA for Response Surface Reduced Order 4 Analysis of variance table IPartlal sum of squares] Sum of Mean Source Squares IOF Square Model 111.00 8 13.87 1 49.00 49.00 A 1 16.00 16.00 S A'l 0.000 1 0.000

Model
F Value 9.61
33.92

ArJl A2rJl
Residual LackofFt
Pure Error

rJl AS A2S

1.33

CorTotal Std.Dev. Mean C.V. PRESS Factor Intercept A-Tool Angle B-Speed A2 B2 AB A2B AS 2 A'lB'l

8.00 2.67 42.67 8.00 13.00 0.000 13.00 124.00 1.20 1.33 90.14 52.00 Coefficient Estimate 2.00 3.50 2.00 0.000 1.00 -1.00 -1.00 -4.00 -3.00

1 1

1.33

1 1
1 9 O 9
17

8.00 2.67 42.67 8.00 1.44 1.44

11.08 0.000 0.92 5.54 1.85 29.54 5.54

Prob> F 0.0013 0.0003 0.0088 1.0000 0.3618 0.0431 0.2073 0.0004 0.0431

significant

IR-Squared Adj R-Squared Pred R"Squared Adeq Precision

0.8952 0.8020 0.5806 8.237


95% el Low 0.078 2.14 0.64 -2.35 -1.35 -1.96 -2.66 -5.66

DF
1 1 1 1 1 1 1 1 1

Standard Error 0.85 0.60 0.60 1.04 1.04 0.42 0.74 0.74 1.27

-5.88

95% ca High 3.92 4.86 3.36 2.35 3.35 -0.039 0.66 -2.34 -0.12

VlF

3.00 3.00 3.00 3.00 1.00 3.00 3.00 5.00

Final Equation in Terms of Coded Factors: Life :; +2.00 +3.50 *A +2.00 *8 +0.000 *A2 +1.00 *B2 -1.00 *A *8 -1.00 *A2 *B -4.00 *A *8 2 -3.00 *A2 *B2 Final Equation in Terms of ActUlal Factors: Life :; -1068.00000 +136.30000 *Tool Angle + 14.48000 *Speed -4.08000 *Tool Angle2 -0.049600 *Speed'l -1.86400 *Tool Angle *Speed +0.056000 *Tool Angle2 *Speed +6.40000E-003 *Tool Angle *Speecf -1.92000E-004 *Tool Angle2 *Spee[J2

2 2 2 175.00 "-..:---~------""--....,,....---Ir"'""-""l::=:;--.

162.50

137.50

125.00 ..._....L. 15.00

.l..-....c....
17.50

.....

20.00
ngulo de la herramienta

.....L._.......,::::....._ _ 22.50 25.00

Figura 519 Grfica de contorno bidimensional de la superficie de respuesta de la vida de la herramienta del ejemplo 5-5.

5.5

-e

lO

-2

175.00

l--o::::.-----

Velocidad

ngulo de la herramienta

Figura 5-20 Superficie de respuesta tridimensional de la vida de la herramienta del ejemplo 5-5.

206

5-6 FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

207

5..6

FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

Se han revisado los diseos factoriales en el contexto de un experimento completamente aleatorlzado. En ocasiones no es factible o prctico hacer la aleatorizacin completa de todas las corridas de un diseo factorial. Por ejemplo, la presencia de un factor perturbador puede hacer necesario que el experimento se corra en bloques. Los conceptos bsicos de la formacin de bloques se analizaron en el captulo 4 en el contexto de un experimento con un solo factor. Ahora se indica la forma en que la formacin de bloques puede incorporarse en un diseo factorial. Otros aspectos de la formacin de bloques en diseos factoriales se presentan en los captulos 7, 8, 9 Y 13. Considere un experimento factorial con dos factores (A y B) Yn rplicas. El modelo estadstico lineal de este diseo es i.: 1, 2, , a (5-36) Yijk = u-r t , +P j +(rp)ij +Cijk J -1,2, , b { k = 1, 2, , n donde r,pj y (rp)j representan los efectos de los factoresA, B y la interaccinAB, respectivamente. Suponga ahora que para realizar este experimento se necesita una materia prima particular. Esta materia prima est disponible en lotes cuyo tamao no es suficiente para permitir que se corran todas las abn combinaciones de los tratamientos con el mismo lote. Sin embargo, si un lote contiene material suficiente para hacer ab observaciones, entonces un diseo alternativo es correr cada una de las n rplicas utilizando un lote separado de materia prima. Por consiguiente, los lotes de materia prima representan una restriccin sobre la aleatorizacin o un bloque, y se corre una sola rplica de un experimento factorial completo dentro de cada bloque. El modelo de los efectos para este nuevo diseo es i.: 1, 2, , a (5-37) Yljk = u-rt +P j +(rp)1j +Ok +Cljk J -1,2, , b { k = 1, 2, , n donde Ok es el efecto del bloque k-simo. Desde luego, dentro de un bloque el orden en que se corren las combinaciones de los tratamientos est completamente aleatorizado. En el modelo (ecuacin 5~37) se supone que la interaccin entre los bloques y los tratamientos es insignificante. Anteriormente se estableci el mismo supuesto en el anlisis de diseos de bloques aleatorizados. Si estas interacciones existen, no pueden separarse del componente del error. De hecho, el trmino del error en este modelo se compone en realidad de las interacciones (ro )ik' (/Jo )jk y (rpo)jk' En la tabla 518 se describe el anlisis de varianza. La disposicin tiene un gran parecido con la de un diseo factorial, con la suma de cuadrados del error reducida por la suma de cuadrados de los bloques. En lo que a los clculos se refiere, la suma de cuadrados de los bloques se encuentra como la suma de cuadrados entre los totales de los n bloques {Y.k}' En el ejemplo anterior, la aleatorizacin se restringi al interior de un lote de materia prima. En la prctica, una diversidad de fenmenos pueden producir restricciones sobre la aleatorizacin, como el tiempo, los operadores, etc. Por ejemplo, si el experimento factorial completo no pudo correrse en un da, entonces el experimentador podria correr una rplica completa el da 1, una segunda rplica el da 2, etc. Por consiguiente, cada da sera un bloque.

EjEl\-fPLO 5..6 ,. .

111

*'

111

111

..

..

*' ..

111

111

Un ingeniero estudia los mtodos para mejorar la capacidad para detectar objetivos en el campo de accin de un radar. Dos factores que el ingeniero considera importantes son la cantidad de ruido de fondo, o "desorden de terreno", en el campo de accin del radar y el tipo de filtro colocado sobre la pantalla. Se

208

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-18 Anlisis de varianza de un disefio factorial de dos factores en bloques completos aleatorizados Fuente de variacin Suma de cuadrados
~~

Grados de libertad
2

Cuadrado medio esperado

Bloques

abLJ k

y 2 _ ..L... .1< abn

n-1

A B
1

1 ~ 2 Y.~. bnLJ Ji.. - abn 1 1 _

0-1
b-1 (a-1)(b-l) (ab -1)(n -1)

MS A MS E MS B MS E MS AB MS E

an LJ
J

2 2_..L...
Y.j.

abn

AB

- ~ ~ Y~ _..L... -SS -SS n LJLJ IJ. abn A B


1

Error
Thtal

Sustraccin

LJ LJ LJ
J

~~~
k

2 Yljk -

ahn

y~.

abn-1

disea un experimento utilizando tres niveles del desorden de terreno y dos tipos de filtro. Estos factores se considerarn fijos. El experimento se lleva a cabo seleccionando al azar una combinacin de los tratamientas (nivel del desorden de terreno y tipo de filtro) e introduciendo despus una seal que representa el objetivo en el campo de accin del radar. La intensidad de este objetivo se incrementa hasta que el operador lo observa. Entonces se mide el nivel de intensidad en el momento de la deteccin como la variable de respuesta. Debido a la disponibilidad de los operadores, es conveniente seleccionar un operador y mantenerlo en el sistema hasta que se han realizado todas las corridas necesarias. Adems, los operadores difieren en su habilidad y capacidad para operar el sistema. Por consiguiente, parece lgico usar los operadores como bloques. Se seleccionan cuatro operadores al azar. Una vez que se ha elegido a un operador, el orden en que se corren las seis combinaciones de los tratamientos se determina aleatoriamente. Por lo tanto, se tiene una corrida de un experimento factorial 3 x 2 en un bloque completo aleatorizado. Los datos se presentan en la tabla 519. El modelo lineal para este experimento es

donde Ti representa el efecto del desorden de terreno, Pj representa el efecto del tipo de filtro, (TP)ij es la interaccin, d k es el efecto del bloque y tijk es el componente NID(O, 02) del error. Las sumas de cuadrados del desorden de terreno, del tipo de filtro y de su interaccin se calculan de la manera usual. La suma de
Tabla 5-19 Nivel de intensidad al detectarse el objetivo Operadores (bloques) Tipo de filtro Desorden de terreno Bajo Intermedio Alto

1
1

2 2 86 87 93 1 96 106 112 2 84 90
91

3 1 100 105 108


2

4 1 92 96 98
2

90 102 114

92 97 95

81 80 83

S-6 FORMACIN DE BLOQUES EN UN DISENOFACTORIAL

209

Tabla 5-20 Anlisis de varianza del ejemplo 5-6

Fuente de variacin Desordende terreno (G) Tipo de filtro (F)


GF

Sumade cuadrados
335.58 1066.67 77.08 402.17 166.33 2047.83

Grados de libertad
2 1

Cuadrado medio
167.79 1066.67 38.54 134.06 11.09

Fo
15.13 96.19 3.48

Valor P
0.0003 <0.0001 0.0573

2
3 15 23

Bloques Error Thtal

cuadrados debida a los bloques se encuentra a partir de los totales de los operadores {Y.k} de la siguiente manera: 1 n 2
SS
Bloque.

= ab,.tJ
k~l

. ~

2 Y.. Y. - abn

(3)(2) = 402.17

= _1_[(572)2 +(579)2 +(597)2 +(530)2]-

(2278)2 (3)(2)(4)

En la tabla 520 se resume el anlisis de varianza completo de este experimento. La presentacin de la tabla 520 indica que todos los efectos se probaron dividiendo sus cuadrados medios por el cuadrado medio del error. Tanto el desorden de terreno como el tipo de filtro son significativos en el nivel de 1%, mientras que su interaccin slo es significativa en el nivel de 10%. Por lo tanto, se concluye que tanto el nivel del desorden de terreno como el tipo de filtro de campo usado en la pantalla afectan la habilidad del operador para detectar el objetivo, y existe cierta evidencia de una ligera interaccin entre ambos factores.
.. .. .. .. .. .. .. .. .. 111 111 111 " " " " 111 " " " " " " .. " 111 111

En el caso de dos restricciones sobre la aleatorizacin, cada una con p niveles, si el nmero de combinaciones de los tratamientos en un diseo factorial de k factores es exactamente igual al nmero de niveles de la restriccin, es decir, sip = ah ... m, entonces el diseo factorial puede correrse en un cuadrado latino p X p. Por ejemplo, considere una modificacin del experimento de la deteccin del objetivo en el radar del ejemplo 5-6. Los factores de este experimento son el tipo de filtro (dos niveles) y el desorden de terreno (tres niveles), y los operadores se consideran como bloques. Suponga ahora que debido a limitaciones de tiempo, slo pueden hacerse seis corridas por da. Por lo tanto, los das se convierten en una segunda restriccin sobre la aleatorizacn, lo cual resulta en un diseo del cuadrado latino 6 x 6, como se muestra en la tabla 5-21. En esta tabla se han usado las letras minsculas)'; y gj para representar los niveles i-simo y j-simo del tipo de filtro y del desorden de terreno, respectivamente. Es decr.j'g2 representa el filtro tipo 1 y un desorden de terreno intermedio. Observe que se necesitan ahora seis operadores, en lugar de los cuatro del experimento original, por lo que el nmero de combinaciones de tratamientos en el diseo factorial 3 x 2 es exactamente igual al nmero de niveles de restriccin. Adems, en este diseo cada operador se usara una sola vez en cada da. Las letras latinas A, B, e, D, E YF representan las 3 x 2 = 6 combinaciones de tratamientos del diseo factorial como sigue: A =!gl,B = !-$2, e = f-$3,D = f'J8bE = f'J82 Y F = !783'

210

CAPTULO S INTRODUCCIN A LOSDISEOS FACfORIALES

Tabla 521 Elexperimento de la detecci6n del radarrealizado en un cuadrado latino 6 x 6 Operador 1 2 3 4 5 Da A(fg = 90) 1 B(fgz = 106) C(fg3 = 108) D(fJ = 81) F(fJ3 = 90) 2 C(fg3 = 114) A(fg = 96) B(fgz = 105) F(fJ3 = 83) E(fJz = 86) 3 B(fgz = 102) E(fJz = 90) A(fg = 92) F(fJ3 = 95) D(fJ = 85) 4 E(fJz = 887) D(fJ = 84) A(fg = 100) B(fgz = 96) C(fg3 = 110) 5 C(fg3 = 112) D(fJ = 92) F(fJ3 = 93) A(fg = 90) E(fJz = 80) 6 D(fJ = 86) C(fg3 = 98) B(fgz = 100) F(fJ3 = 91) E(fJz = 97)

E(fJz = 88) D(fJ = 84) C(fg3 = 104) F(fJ3 = 91) B(f8z = 98) A(fg = 92)

Los cinco grados de libertad entre las seis letras latinas corresponden a los efectos principales del tipo de filtro (un grado de libertad), el desorden de terreno (dos grados de libertad) y su interaccin (dos grados de libertad). El modelo estadstico lineal de este diseo es

i = 1, 2, ... ,6
Yijld =
.t +a

+r j + {3k + (r{3) jk +0 1 +Eijld

j=1,2,3 k=12

(5-38)

1=1,'2, ... ,6

donde Tj Y{3k son los efectos del desorden de terreno y del tipo de filtro, respectivamente, y a y 01 representan las restricciones sobre la aleatorizacin de los das y los operadores, respectivamente. Para calcular las sumas de cuadrados, la siguiente tabla de dos vas de los totales de los tratamientos es til: Desorden de terreno Bajo Intermedio Alto
Y.. . k

Filtro tipo 1
560 607 646

Filtro tipo 2
512 528 543

-1813

--

1583

--

Y.j.. 1072 1135 1189

3396 =Y..

Adems, los totales de los renglones y las columnas son Renglones (y.jld): Columnas (Ylik.):
563 572 568 579 568 597 568 530 565 561 564 557

En la tabla 5-22 se resume el anlisis de varianza. Se ha agregado una columna a esta tabla que indica cmo se determina el nmero de grados de libertad de cada suma de cuadrados. Tabla5.22 Anlisis devarianza delexperimento deladetecci6n en elradarrealizado como un disefio factorial 3 x cuadrado latino Frmula general para los grados Cuadrado Fuente de Sumade Grados de variacin libertad de libertad medio cuadrados Fa a-1 Desorden de terreno, G 571.50 2 285.75 28.86 148.43 Tipo de filtro, F 1469.44 1 1469.44 b-l (a -l)(b -1) 63.37 6.40 GF 126.73 2 ab-1 0.87 Das (renglones) 4.33 5 ab-1 85.60 Operadores 428.00 5 (columnas) (ab -l)(ab - 2) 9.90 20 Error 198.00 (ab)L1 2798.00 lbtal 36
2 en un

ValorP
<0.0001 <0.0001 0.0071

5-7 PROBLEMAS

211

5..7
5-1.

PROBLEMAS
Se estudia el rendimiento de un proceso qumico. Se piensa que las dos variables ms importantes son la presin y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con dos rplicas. Los datos del rendimiento son:

Temperatura rC) 150 160 170

200 90.4 90.2 90.1 90.3 90.5 90.7

Presin (psig) 215 90.7 90.6 90.5 90.6 90.8 90.9

230 90.2 90.4 89.9 90.1 90.4 90.1

5-2.

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05. b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo. e) Bajo qu condiciones debera operarse este proceso? Un ingeniero sospecha que el acabado superficial de una pieza metlica se afecta por la velocidad de alimentacin y la profundidad de corte. Selecciona tres velocidades de alimentacin y cuatro profundidades de corte. Despus realiza un experimento factorial y obtiene los siguientes datos:

Velocidad de alimentacin (pulg/min) 0.20

0.25

0.30

Profundiad de corte (pulg) 0.15 0.18 0.20 0.25 74 79 82 99 64 68 88 104 60 73 92 96 92 98 99 104 86 104 108 110 88 88 95 99 99 104 108 114 98 99 110 111 102 95 99 107

5-3. 5-4.

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05. b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo. e) Obtener estimaciones puntuales del acabado superficial promedio con cada velocidad de alimentacin. d) Encontrar los valores P para las pruebas del inciso a. Para los datos del problema 5-2, calcular la estimacin de un intervalo de confianza de 95% de la diferencia media en la respuesta para velocidades de alimentacin de 0.20 y 0.25 pulg/min. En un artculo de Industrial Quality Control se describe un experimento para investigar el efecto del tipo de cristal y del tipo de fsforo sobre la brillantez de un cinescopio. La variable de respuesta es la corriente (en microamperes) necesaria para obtener un nivel de brillantez especfico. Los datos son los siguientes:

212

CAPTULO 5 INTRODUCCIN A LOSDISEOS FACTORIALES

Tipo de cristal
1

1 280 290 285 230 235 240

Tipo de fsforo 2 300 310 295 260 240 235

3 290 285 290 220 225 230

a) Existe algn indicio de que alguno de los dos factores influye en la brillantez? Utilizar a = 0.05. b) Los dos factores interactan? Utilizar a = 0.05. e) Analizar los residuales de este experimento. 5-5. Johnson y Leone (Statistics and Experimental Design in Engineering and the Physieal Scienees, John Wiley) describen un experimento realizado para investigar la torcedura de placas de cobre. Los dos factores estudiados fueron la temperatura y el contenido de cobre de las placas. La variable de respuesta fue una medida de la cantidad de torcedura. Los datos fueron los siguientes:
Contenido de cobre (%) 60 80 16,21 24,22 18,13 17,12 18,21 25,23 23,21 23,22

Temperatura (OC) 50 75 100 125

40 17,20 12, 9 16,12 21,17

100 28,27 27,31 30,23 29,31

a) Existe algn indicio de que alguno de los dos factores afecta la cantidad de torcedura? Hay alguna interaccin entre los factores? Utilizar a = 0.05. b) Analizar los residuales de este experimento. c) Graficar la torcedura promedio con cada nivel del contenido de cobre y compararlas con una distribucin t con la escala apropiada. Describir las diferencias en los efectos de los diversos niveles del contenido de cobre sobre la torcedura. Si es deseable una torcedura baja, qu nivel del contenido de cobre debera especificarse? d) Suponga que no es sencillo controlar la temperatura en el medio ambiente donde van a usarse las placas de cobre. Este hecho modifica la respuesta que se dio para el inciso c? 5-6. Se estudian los factores que influyen en la resistencia a la ruptura de una fibra sinttica. Se eligen cuatro mquinas de produccin y tres operadores yse corre un experimento factorial utilizando fibra del mismo lote de produccin. Los resultados son los siguientes:

Operador 1 2 3

1 109 110 110 112 116 114

Mquina 2 3 110 108 115 109 110 111 111 109 112 114 119 115

4 110 108 114 112 120 117

5-7 PROBLEMAS

213

5-7.

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05. b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo. Un ingeniero mecnico estudia la fuerza de empuje desarrollada por una taladradora. Sospecha que la velocidad de taladrado y la velocidad de alimentacin del material son los factores ms importantes. Selecciona cuatro velocidades de alimentacin y usa una velocidad de taladrado alta y otra baja elegidas para representar las condiciones de operacin extremas. Obtiene los siguientes resultados. Analizar los datos y sacar conclusiones. Utilizar a = 0.05.

Velocidad de taladrado 125 200

Velocidad de alimentacin 0.030 0.045 0.060 0.015 2.45 2.60 2.75 2.70 2.49 2.72 2.78 2.86 2.83 2.85 2.86 2.94 2.86 2.80 2.87 2.88

5-8.

Se realiza un experimento para estudiar la influencia de la temperatura de operacin y tres tipos de placas de recubrimiento de cristal, en la salida luminosa de un tubo de osciloscopio. Se registraron los siguientes datos:

Tipo de cristal 1

100 580 568 570 550 530 579 546 575 599

Temperatura 125 1090 1087 1085 1070 1035 1000 1045 1053 1066

150 1392 1380 1386 1328 1312 1299 867 904 889

5-9.

S-lO.

a) Utilizar a = 0.05 en el anlisis. Existe un efecto de interaccin significativo? El tipo de cristal O la temperatura afectan la respuesta? A qu conclusiones se llega? b) Ajustar un modelo apropiado que relacione la salida luminosa con el tipo de cristal y la temperatura. e) Analizar los residuales de este experimento. Comentar la adecuacin de los modelos que se hayan considerado. Considere el experimento del problema 5-1. Ajustar un modelo apropiado a los datos de la respuesta. Usar este modelo como gua para las condiciones de operacin del proceso. Usar la prueba de Th.key para determinar los niveles del factor presin que son significativamente diferentes para los datos del problema 5-1.

214

cAPITULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

5-11. Se llev a cabo un experimento para determinar si la temperatura de coccin o la posicin en el horno afectaban el espesor del endurecimiento de un nodo de carbono. Los datos se presentan a continuacin: 'Iemperatura 825 1063 1080 1043 988 1026 1004

eq
850 565 510 590 526 538 532

Posicin 1

800 570 565 583 528 547 521

Suponga que se considera que no existe ninguna interaccin. Desarrollar el modelo estadstico. Realizar el anlisis de varianza y probar las hiptesis sobre los efectos principales. Qu conclusiones pueden sacarse? Comentar la adecuacin del modelo. 5-12. Deducir los cuadrados medios esperados para un anlisis de varianza de dos factores con una observacin por celda, suponiendo que ambos factores son fijos. 5-13. Considere los siguientes datos de un experimento factorial de dos factores. Analizar los datos y sacar conclusiones. Realizar una prueba de no aditividad. Utilizar a = 0.05. Factor de la columna 2 3 39 36 20 22 37 33

Factor del rengln 1 2 3

1 36 18 30

4 32 20 34

5-14. Se piensa que la resistencia al corte de un adhesivo se afecta por la presin de aplicacin y la temperatura. Se realiza un experimento factorial en el que ambos factores se suponen fijos. Analizar los datos y sacar conclusiones. Realizar una prueba de no aditividad. 'Iemperatura eF) 250 260 9.60 11.28 9.69 10.10 8.43 11.01 9.98 10.44

Presin
(lb/pulgs)

120 130 140 150 5-15. Considere el modelo de tres factores

270 9.00 9.57 9.03 9.80

Yijk

= # +7:/ + Pi +1'k +(7:P)ij +(PY)jk +e ijk

i.: 1, 2, , a ) - 1, 2, , b

k = 1, 2, , e

Observe que hay una sola rplica. Suponiendo que los tres factores son fijos, desarrollar la tabla del anlisis de varianza, incluyendo los cuadrados medios esperados. Qu se usara como "error experimental" para probar las hiptesis?

5-7 PROBLEMAS

215

5-16.

El porcentaje de la concentracin de madera dura en la pulpa bruta, la presin de la cuba y el tiempo de coccin de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel. Se seleccionan tres niveles de la concentracin de madlera dura, tres niveles de la presin y dos tiempos de coccin. Se lleva a cabo un experimento factorial con dos rplicas, obtenindose los siguientes datos:

Porcentaje de la concentracin de madera dura 2 4 8

Tiempo de coccin 3.0 horas Presin

Tiempo de coccin 4.0 horas Presin 400 198.4 198.6 197.5 198.1 197.6 198.4 500 199.6 650 200.6 200.9 199.6 199.0 198.5 199.8

400
196.6 196.0 198.5 197.2 197.5 196.6

500 197.7 196.0 196.0 196.9 195.6 196.2

650 199.8 199.4 198.4 197.6 197.4 198.1

200.4
198.7 198.0 197.0 197.8

5-17.

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05. b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo. e) Bajo qu conjunto de condiciones deberla operarse este proceso? Por qu? El departamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores sobre el teido de una tela de algodn y fibras sintticas utilizada para fabricar camisas para caballero. Se seleccionaron tres operadores, tres duraciones del ciclo y dos temperaturas, y se tieron tres ejemplares pequeos de la tela bajo cada conjunto de condiciones. La tela terminada se compar con un patrn, y se le asign una evaluacin numrica. Los datos se presentan enseguida. Analizar los datos y sacar conclusiones. Comentar la adecuacin del modelo.

Temperatura 300 Duracin del ciclo 40


0

350 0 Operador 3 31 32 29 33 34 35 26 27 25 1 24 23 28 37 39 35 26 29 25 2 38 36 35 34 38 36 36 37 34 3 34 36 39 34 36 31 28 26 24

Operador

1
23 24 25 36 35 36

2 27 28 26 34 38 39 35 35 34

50

28
60

24 27

5-18.

519.

Suponga que en el problema 5-1 quiere rechazarse la hiptesis nula con una alta probabilidad si la diferencia entre el verdadero rendimiento promedio con dos presiones cualesquiera es mayor que 0.5. Si una estimacin previa razonable de la desviacin estndar del rendimiento es 0.1, cuntas rplicas debern correrse? Se estudia elrendimiento de un proceso qumico. Los dos factores de inters son la temperatura y la presin. Se seleccionan tres niveles de cada factor; sin embargo, slo es posible hacer nueve corridas en un da. El ex-

216

CAPTULO 5 INTRODUCCIN A LOS DISEOSFAcrORIALES

perimentador corre una rplica completa en cada da. Los datos se muestran en la tabla siguiente. Analizar los datos, suponiendo que los das son bloques.

Da 1 Presin

Da 2 Presin 270 85.8 89.0 91.3 250 86.1 89.4 91.7 260 85.2 89.9 93.2 270 87.3 90.3 93.7

'Iemperatura Baja Intermedia Alta

250 86.3 88.5 89.1

260 84.0 87.3 90.2

5-20. 5-21. 5-22.

Considere los datos del problema 5-5. Analizar los datos, suponiendo que las rplicas son bloques. Considere los datos del problema 5-6. Analizar los datos, suponiendo que las rplicas son bloques. En un artculo de Joumal ofTestingand Evaluation (vol. 16, no. 2, pp. 508-515) se investigaron los efectos de la frecuencia de carga cclica y de las condiciones ambientales sobre el crecimiento de las fisuras por fatiga con un esfuerzo constante de 22 MPa para un material particular. Los datos del experimento se presentan abajo (la respuesta es el ndice de crecimiento de las fisuras por fatiga):

Medio ambiente Frecuencia Aire 2.29 2.47 2.48 2.12 2.65 2.68 2.06 2.38 2.24 2.71 2.81 2.08 Hz 2.06 2.05 2.23 2.03 3.20 3.18 3.96 3.64 11.00 11.00 9.06 11.30 Hz salada 1.90 1.93 1.75 2.06 3.10 3.24 3.98 3.24 9.96 10.01 9.36 10.40

10

0.1

5-23.

a) Analizar los datos de este experimento (utilizar a = 0.05). b) Analizar los residuales. e) Repetir los anlisis de los incisos a y b utilizando In(y) como la respuesta. Comentar los resultados. En un artculo de IEEE Transactions on Electron Devices se describe un estudio sobre el dopado del polisilicio, El experimento que se muestra a continuacin es una variante de dicho estudio. La variable de respuesta es la corriente fundamental.
Dopado del polisilicio (iones) Thmperatura de revenido 900 4.60 4.40 3.20 3.50 950 10.15 10.20 9.38 10.02

Cc)
1000 11.01 10.58 10.81 10.60

1 x 1{)20
2 X 1020

5-7 PROBLEMAS

217

a) Existe evidencia (con a = 0.05) que indique que el nivel de dopado del polisilicioo la temperatura de fijacin afecten la corriente fundamental? b) Construir representaciones grficas como ayuda para interpretar este experimento. c) Analizar los residuales y comentar la adecuacin del modelo. d) El modelo

Y= /30 +/31X1+/32 x2 +/322x~ +/312 X1 X2 +e


est apoyado por este experimento (Xl = nivel de dopado.x, = temperatura)? Estimar los parmetros de este modelo y graficar la superficie de respuesta.

Diseo factorial 2k

6..1 INTRODUCCIN
Los diseos factoriales se usan ampliamente en experimentos que incluyen varios factores cuando es necesario estudiar el efecto conjunto de los factores sobre una respuesta. En el captulo 5 se presentaron los mtodos generales para el anlisis de los diseos factoriales. Sin embargo, hay varios casos especiales del diseo factorial general que son importantes debido a su uso generalizado en el trabajo de investigaci6n y porque constituyen las bases de otros diseos de gran valor prctico. El ms importante de estos casos especiales es el de k factores, cada uno con s610 dos niveles. Estos niveles pueden ser cuantitativos, como dos valores de temperatura, presi6n o tiempo, o bien cualitativos, como dos mquinas, dos operadores, los niveles "alto" y "bajo" de un factor, o quiz la presencia o ausencia de un factor. Una rplica completa de este diseo requiere 2 x 2 x ... x 2 = 2k observaciones y se le llama diseno factorial 2k Este captulo se enfoca en esta clase en extremo importante de diseos. A 10largo del captulo se supone que 1) los factores son fijos, 2) los diseos son completamente aleatorizados y 3) se satisfacen los supuestos de normalidad usuales. El diseo 2k es de particular utilidad en las etapas iniciales del trabajo experimental, cuando probablemente se estn investigando muchos factores. Este diseo proporciona el menor nmero de corridas con las que pueden estudiarse k factores en un diseo factorial completo. Por consiguiente, estos diseos se usan ampliamente en los experimentos de tamizado o seleccin de factores. Puesto que s610 hay dos niveles para cada factor, se supone que la respuesta es aproximadamente lineal en el rango elegido para los niveles de los factores. En muchos experimentos de tamizado de factores, cuando se acaba de iniciar el estudio del proceso o sistema, este supuesto suele ser razonable. En la secci6n 6-6 se presentar un mtodo simple para verificar este supuesto, y se analizarn las acciones que debern emprenderse en caso de que se viole.

218

6-2 ELDISEO 23

219

6..2 EL DISEO 22
El primer diseo de la serie 2k es el que slo tiene dos factores, por ejemplo, A y B; cada uno se corre a dos niveles. A este diseo se le llama diseo factorial 22 Los niveles de los factores pueden denominarse arbitrariamente "bajo" y "alto", Como un ejemplo, considere la investigacin del efecto de la concentracin del reactivo y de la cantidad del catalizador sobre la conversin (rendimiento) de un proceso qumico. Sea la concentracin del reactivo el factor A, y sean 15 y 25 por ciento los dos niveles de inters. El catalizador es el factor B, con el nivel alto dlenotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso de 1 libra. Se hacen tres rplicas del experimento, y los datos son los siguientes:
Factor

Combinacin de tratamientos

Rplica
1

11
25

III
27

lbtal

+ +

+ +

A bajo, B bajo A alto, B bajo A bajo, Balto A alto, Balto

28 36 18 31

32 19 30

32
23

80 100
60 90

29

Las combinaciones de los tratamientos se ilustran grficamente en la figura 6-1. Por convencin, el efecto de un factor se denota con una letra mayscula latina. Por lo tanto, "A" se refiere al efecto del factor A, "B" al efecto del factor B, y "AB" a la interaccinAB. En el diseo 22, los niveles bajo y alto deA y B se denotan por "-" y "+", respectivamente, en los ejesA y B. Por lo tanto, - en el ejeA representa el nivel bajo de la concentracin (15%), mientras que + representa el nivel alto (25%), Y- en el eje B representa el nivel bajo del catalizador, mientras que + denota el nivel alto. Las cuatro combinaciones de tratamientos suelen representarse con letras minsculas, como se muestra en la figura 6-1. Por la figura se observa que el nivel alto de cualquiera de los factores en una combinacin de tratamientos se denota por la letra minscula correspondiente y que el nivel bajo de un factor en una combinacin de tratamientos se denota por la ausencia de la letra respectiva. Por lo tanto, a repreb .. 60
(2 libras)

ab .. 90
(31 + 30 +291

Alto

(18 + 19 + 231

Bajo _ (1 libra)

111 .. 80
(28 + 25 + 271

G'"'

100

(36 + 32 + 321

I
Bajo (15%)

I
+ Alto
(25%)

Concentracin del reactivo,

Figura 61 Combinaciones de los tratamientos en el diseo 22

220

CAPTIJLO 6 DISEO FACTORIAL 2k

senta la combinacin de tratamientos conA en el nivel alto y B en el nivel bajo, b representa A en el nivel bajo y B en el nivel alto, y ab representa ambos factores en el nivel alto. Por convencin, se usa (1) para denotar que ambos factores estn en el nivel bajo. Esta notacin se utiliza en todas las series 2k En un diseo factorial con dos niveles, el efecto promedio de un factor puede definirse como el cambio en la respuesta producido por un cambio en el nivel de ese factor promediado para los niveles del otro factor. Asimismo, los smbolos (1), a, by ab representan ahora el total de las n rplicas hechas con la combinacin de los tratamientos, como se ilustra en la figura 6-1. Ahora el efecto deA en el nivel bajo de B es [a - (l)]/n y el efecto deA con el nivel alto deB es [ab-b]/n.Al promediarse estas dos cantidades se obtiene el efecto principal de A:

A= -{[ab-b]+[a-(l)]} 2n
=

-[ab+a-b-(l)] 2n

(6-1)

El efecto principal promedio deB se encuentra a partir del efecto deB con el nivel bajo deA (es decir, [b - (1) ]/n) y con el nivel alto de A (o sea, [ab - a]/n) como

1 B= -{[ab-a]+[b-(l)]} 2n
1 =-[ab+b-a-(l)]

2n

(6-2)

El efecto de la interacci6nAB se define como la diferencia promedio entre el efecto deA con el nivel alto de B y el efecto de A con el nivel bajo de B. Por lo tanto,

AB= -{[ab-b]-[a-(l)]} 2n

=-[ab+(l)-a-b]
2n

(6-3)

De manera alternativa, AB puede definirse como la diferencia promedio entre el efecto de B con el nivel alto de A y el efecto de B con el nivel bajo de A. Esto llevar tambin a la ecuacin 6-3. Las frmulas de los efectos deA, ByAB pueden deducirse con otro mtodo. El efecto deA puede encontrarse como la diferencia en la respuesta promedio de las dos combinaciones de tratamientos situadas a la derecha del cuadrado de la figura 6-1 (a este promedio se le llama y>, porque es la respuesta promedio con las combinaciones de tratamientos donde A est en el nivel alto) y las dos combinaciones de tratamientos situadas a la izquierda del cuadrado de la figura 6-1 (o YA-). Es decir,

A= Y + - YA A ab+a b+(l) =----2n 2n

=-[ab+a-b-(l)]
Se trata exactamente del mismo resultado que el de la ecuacin 6-1. El efecto deB, ecuacin 6-2, se encuentra como la diferencia entre el promedio de las dos combinaciones de tratamientos de la parte su-

1 2n

6-2 ELDISEO 2'

221

perior del cuadrado <YB+) y el promedio de las dos combinaciones de tratamientos de la parte inferior <YB-)' o

B= Y + - YB B ab+b a+(l) =----2n 2n


1 =-[ab+b-a-(l)]

2n

Por ltimo, el efecto de la interaccinAB es el promedio de las combinaciones de tratamientos de la diagonal de derecha a izquierda del cuadrado [ab y (1)] menos el promedio de las combinaciones de tratamientos de la diagonal de izquierda a derecha (ay b), o

AB= ab+(l) 2n

a+b

2n 1 =-[ab+(l)-a-b] 2n

resultado que es idntico a la ecuacin 6-3. Utilizando el experimento de la figura 6-1, los efectos promedio pueden estimarse como
A = 2(3) (90+ 100- 60- 80) = 8.33
1 B = 2(3) (90+ 60-100- 80) = -5.00

AB = 2(3) (90+ 80-100- 60) = 1.67


El efecto de A (concentracin del reactivo) es positivo; esto sugiere que al incrementar A del nivel bajo (15%) al nivel alto (25%), el rendimiento se incrementar. El efecto de B (catalizador) es negativo; esto sugiere que al incrementar la cantidad del catalizador que se agrega al proceso se reducir el rendimiento. El efecto de la interaccin parece ser pequeo en comparacin con los dos efectos principales. En muchos experimentos que incluyen diseos 2\ se examinar la magnitud y la direccin de los efectos de los factores a fin de determinar las variables que son de posible importancia. En la mayora de los casos puede usarse el anlisis de varianza para confirmar esta interpretacin. Hay varios paquetes de software de estadstica excelentes que son tiles para establecer y analizar diseos 2k Se cuenta tambin con mtodos especiales que ahorran tiempo cuando los clculos se hacen manualmente. Considere las sumas de cuadrados deA, By AB. Observe, por la ecuacin 6-1, que se us un contraste para estimar A, a saber Contraste A

= ab+a-b-(l)

(6-4)

A este contraste suele llamrsele el efecto total deA. A partir de las ecuaciones 6-2 y 6-3, se observa que tambin se usan contrastes para estimar B y AB. Adems, estos tres contrastes son ortogonales. La suma de cuadrados de cualquier contraste puede calcularse con la ecuacin 3-29, la cual establece que la suma de cuadrados del contraste es igual al cuadrado del contraste dividido por el nmero de observaciones en

222

CAPfn.W 6 DISEO FACTORIAL2k

cada total del contraste multiplicado por la suma de cuadrados de los coeficientes del contraste. Por consiguiente, se tienen

ss = [ab+a-b-(1)]2
A

4n

SS
B

= [ab+b-a-(1)]2
4n

(6-6)

SS
AB

= [ab+(l)-a-bf
4n

(6-7)

como las sumas de cuadrados de A, B YAB. Al utilizar el experimento de la figura 61, las sumas de cuadrados de las ecuaciones 65, 6-6 Y6-7 pueden encontrarse cOlpo

SS
A

= (50)2 = 208.33
4(3) 7500 .
(6-8)

SS = (-30)2 B 4(3)

ss
AS

= (10)2 = 8.33
4(3)

La suma de cuadrados total se encuentra como de costumbre, es decir, 22" 2 SST = Yijk - 4n

LLL
i~l j~l k~l

y:

(6-9)

En general, SST tiene 4n -1 grados de libertad. La suma de cuadrados del error, con 4(n -1) grados de libertad, suele calcularse por sustraccin como

SSA - SSB - SSAB Para el experimento de la figura 6-1, se obtiene


SSE SST

= SST -

(6-10)

2 2 3 2 Y.: = ~~~ Yijk - 4(3) =9398.00- 9075.00 = 323.00

SSE

=323.00- 208.33-75.00- 8.33


= 31.34

= SST -

SSA

SSB

SSAB

al utilizar SSA' SSB y SSAB de la ecuacin 6-8. En la tabla 6-1 se resume el anlisis de varianza completo. Con base en los valoresP, se concluye que los efectos principales son estadsticamente significativos y que no hay interaccin entre estos factores. Esto confirma la interpretacin de los datos que se hizo originalmente con base en las magnitudes de los efectos de los factores. Con frecuencia resulta conveniente escribir las combinaciones de los tratamientos en el orden (1), a,

6-2 EL DISEO 2Z
'Thbla61 Fuente de variacin Anlisis de varianza del experimento de la figura 6-1 Suma de cuadrados 208.33
~m

223

Grados de libertad

Cuadrado medio 208.33 75.00 8.33 3.92 53.15 19.13 2.13

ValorP 0.0001 0.0024 0.1826

A B
AB Error Thtal

8.33 31.34 323.00

1 1 1 8 11

b, abo Se hace referencia a esto como el orden estndar (u orden de Yates, por el Dr. Frank Yates). Al
utilizar este orden estndar, se observa que los coeficientes de los contrastes usados para estimar los efectos son
Efectos (1) a

A: B:

AB:

-1 -1 +1

+1 -1
-1

b -1 +1
-1

ab +1 +1 +1

Observe que los coeficientes de los contrastes para estimar el efecto de la interaccin son slo el producto de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un contraste es siempre +10 -1, y puede usarse una tabla de signos positivos y negativos como la tabla 62 para determinar el signo correcto para cada combinacin de tratamientos. Los encabezados de las columnas de la tabla 62 son los efectos principales (A y B), la interaceinAB e l, que representa el total o promedio del experimento completo. Observe que la columna que corresponde a l incluye nicamente signos positivos. Las etiquetas de los renglones son las combinaciones de los tratamientos. Para encontrar el contraste para estimar cualquier efecto, simplemente se multiplican los signos de la columna apropiada de la tabla por la combinacin de tratamientos correspondiente y se hace la suma. Por ejemplo, para estimarA, el contraste es -(1) + a - b + ab, que concuerda con la ecuacin 6-1. El modelo de regresin En un diseo factoral Z es sencillo expresar los resultados del experimento en trminos de un modelo de regresin. Puesto que 2k es tan slo un diseo factorial, podra usarse un modelo de los efectos o de las medias, pero el enfoque del modelo de regresin es mucho ms natural e intuitivo. Para el experimento del proceso qumico de la figura 6-1, el modelo de regresin es

y= {Jo +{JtXt +{J2 X2 +e


dondex es una variable codificada que representa la concentracin del reactivo y X 2 es una variable codificada que representa la cantidad del catalizador y las fJ son los coeficientes de regresin. La-relacin enTabla 6.2 Signos algebraicospara calcular los efectos en el dseo 22 Efecto factorial

Combinacin de tratamientos (1)

a
b ab

+
+ + +

AB + +

+
+

224

CAPTULO 6 DISEO FACTORIAL 2k

tre las variables naturales -la concentracin del reactivo y la cantidad de catalizador-- y las variables codificadas es Concentracin - (Concentracin baja + Concentracin alta ) / 2

x=---------------'---------1 (Concentracin alta - Concentracin baja ) /2


Catalizador- (Catalizadorbajo +Catalizadora1Io ) /2 (Catalizadorj :.... Catalizadorbajo ) / 2

y
x=----------,-------'-------~2

Cuando las variables naturales slo tienen dos niveles, esta codificacin producir la familiar notacin 1 para los niveles de las variables codificadas. Para ilustrar esto en el ejemplo tratado, observe que

x
1

Concentracin - (15+ 25) /2 =--------'----"-----(25-15)/2

Concentracin - 20

Por 10 tanto, si la concentracin est en el nivel alto (Concentracin = 25%), entonces Xl == centracin est en el nivel bajo (Concentracin == 15%), entonces Xl == -1. Adems,

+ 1; si la con-

x == -------'---'...-.-2

Catalizador- (1 + 2)/2 (2-1)/2 Catalizador-1.5 0.5

==

Por lo tanto, si el catalizador est en el nivel alto (Catalizador == 2 libras), entoncesz, == dor est en el nivel bajo (Catalizador == 1 libra), entonces X 2 = -1. El modelo de regresin ajustado es

+ 1; si el cataliza-

Ji= 27.5+(8.;3) Xl +(-5~00)X2


donde la ordenada al origen es el gran promedio de las12 observaciones, y los coeficientes de regresin 131 y 132 son la mitad de las estimaciones de los efectos de los factores correspondientes. La razn de que el coeficiente de regresin sea la mitad de la estimacin del efecto es que un coeficiente de regresin mide el efecto de un cambio unitario en x sobre la media de y, y la estimacin del efecto se basa en un cambio de dos unidades (de -1 a + 1). Se demostrar ms adelante que este mtodo simple para estimar los coeficientes de regresin consiste en producir las estimaciones de mnimos cuadrados de los parmetros. Ver tambin el material suplementario de este captulo. Residuales y adecuacin del modelo El modelo de regresin puede usarse para obtener el valor predicho o ajustado de y en los cuatro puntos del diseo. Los residuales son las diferencias entre el valor observado y el valor ajustado de y. Por ejemplo, cuando la concentracin del reactivo est en el nivel bajo (Xl = -1) Yel catalizador est en el nivel bajo (x2 = -1), el rendimiento predicho es

8.33) Ji= 27.5+ (-2- (-1)+ (-5.00) (-1) -2-

= 25.835

6-2 ELDISEO 2Z

225

Hay tres observaciones en esta combinacin de tratamientos, y los residuales son


el

= 28- 25.835 = 2.165 ez = 25- 25.835= -0.835 e 3 = 27- 25.835 = 1.165

Los valores predichos y los residuales restantes se calculan de manera similar. Para el nivel alto de la concentracin del reactivo y el nivel bajo del catalizador,

8.33) y= 27.5+ (-2- (+1)+ (-5.00) (-1) -2= 34.165


y
e 4 = 36- 34.165= 1.835 e 5 = 32- 34.165= -2165 e 6 = 32- 34.165= -2.165

Para el nivel bajo de la concentracin del reactivo y el nivel alto del catalizador,

8.33) y= 27.5+ (-2- (-1)+ (-5.00) (+1) -2= 20.835


y
e 7 = 18- 20.835 = - 2.835
es = 19- 20.835 = -1.835

e9 = 23- 20.835= 2165


Por ltimo, para el nivel alto de ambos factores,

8.33) y= 27.5+ (-2- (+1)+ (-5.00) (+1) -2= 29.165


y
el O = 31- 29.165 = 1.835

en = 30- 29.165= 0.835 e12 = 29- 29.165= -0.165

En la figura 6-2 se presenta una grfica de probabilidad normal de estos residuales y una grfica de los residuales contra el rendimiento predicho. Estas grficas parecen ser satisfactorias, por lo que no hay razn para sospechar problemas con la validez de las conclusiones.
La superficie de respuesta

El modelo de regresin

8.33) y= 27.5+ (-2- Xl + (-5.00) X z -2-

-------------------------------------------------

226
99
95 90

CAPTULo 6 DISEO FACTORIAL 2k

~ 80 (5 70 e

11 11 30
~ 20
10

50

-2.000

2.167

-0.333
Residual

0.500

1.333

2.167

o) Grfica de probabilidad normal

2.167 1.333 0.500

- k
-

IX

I X

X X

.,
-;

Cll

" -0.333 "gj


a:
X

-1.167 f-2.000 f-2.833 1X X

~
20.83

23.06

25.28

27.50

29.72

31.94

34.17

Rendimiento predicho
b) Residuales contra el rendimiento predicho

Figura 6-2 Grficas de los residuales para el experimento del proceso qumico.

puede usarse para generar grficas de superficie de respuesta. Si se desea construir estas grficas en trminos de los niveles de los factores naturales, entonces simplemente las relaciones entre las variables naturales y las . codificadas que se dieron anteriormente se sustituyen en el modelo de regresin, de donde se obtiene

y= 27.5+ (8;3)(Concentr;cin - 20)+(-5~OO)(Cataliz~~or-1.5)


= 18.33+ O.8333Concentracin- 5.0OCatalizador
En la figura 6-3a se presenta la grfica de superficie de respuesta tridimensional del rendimiento de este modelo, y la figura 6-3b es la grfica de contorno. Puesto que el modelo es de primer orden (es decir, contiene nicamente los efectos principales), la superficie de respuesta ajustada es un plano. Al examinar

6-2 EL DISEO 22

227

34.17

29.72

y 25.28

20.83

2.000 1.800 ~I] 1.600 ~/iz <l',yQl 1.400 6><,,,,, 1.200


6>~

~c..

1.000

al Superficie de respuesta
2.000 r - - - - - - - : r - - - - - . ,.......-----,----""'T"1

1.833

"'C

15

-;

.~

1.500

'" :g

"'C

1.333

1.167

25.00
Concentracin del reactivo
b) Grfica de contorno

Figura 63 Grfica de la superficie de respuesta y grfica de contorno del experimento del proceso qumico.

la grfica de contorno se observa que el rendimiento aumenta cuando la concentracin del reactivo se incrementa y la cantidad de catalizador disminuye. Frecuentemente se usa una superficie ajustada como sta para encontrar la direccin del mejoramiento potencial de un proceso. Una manera formal de hacer esto, llamada mtodo del ascenso ms pronunciado, se presentar en el captulo 11 cuando se estudien los mtodos para realizar la exploracin sistemtica de las superficies de respuesta.

228
6~3

CAPruL 6 DISEO FACTORIAL 2'

EL DISEO 23

Suponga que tres factores,A, By C, cada uno con dos niveles, son de inters. Al diseo se le llama diseo factorial 23, y en este caso la representacin geomtrica de las ocho combinaciones de tratamientos puede hacerse con un cubo, como se muestra en la figura 6-4a. Utilizando la notacin" +" y "-" para representar los niveles alto y bajo de los factores, las ocho corridas del diseo 23 pueden enlistarse como en la figura 6-4b. Se le conoce en ocasiones como la matriz del diseo. Haciendo una ampliacin de la notacin de las etiquetas revisada en la seccin 6-2, las combinaciones de los tratamientos en el orden estndar se escriben como (1), a, b, ab, c, ac, be y abe. Recuerde que estos smbolos representan tambin el total de las n observaciones hechas con esa combinacin de tratamientos particular. Existen en realidad tres notaciones diferentes para las corridas del diseo 23 que son de uso general. La primera es la notacin + y -, llamada con frecuencia notacin geomtrica. La segunda es el uso de las etiquetas en letras minsculas para identificar las combinaciones de los tratamientos. La tercera y ltima notacin utiliza 1 y Opara denotar los niveles alto y bajo, respectivamente, de los factores, en lugar de + y -. Estas diferentes notaciones se ilustran enseguida para el diseo 23 :
Corrida
A

Etiquetas
(1) a

1
2 3 4

+ +
+

o
1 O 1 O 1 O 1

o
O 1 1 O O 1 1

e o
O O O 1 1 1 1

+ +

b ab

5 6 7 8

+ +
+ +

+
+

ae be abe

Hay siete grados de libertad entre las ocho combinaciones de tratamientos del diseo 23 Tres grados de libertad se asocian con los efectos principales deA, B y e. Cuatro grados de libertad se asocian con las interacciones; uno con cada una de las interacciones AB, AC y Be y uno con la interaccin ABe. Considere la estimacin de los efectos principales. Primero, considere la estimacin del efecto principalA. El efecto deA cuando B y C estn en el nivel bajo es [a - (1)]/n. De manera similar, el efecto deA

~---",abc

Factor

~
LL

A'to+l

~
Bajo /
(1)

/);----~- + Alto ah
/
-:

ac

Corrida

A
+ + + +

-Bajo
a

1 2 3 4 5

+ + + + + +

I
Bajo Factor A

Alto

6
7

+ +

a) Vista geomtrica

b) Lamatriz del diseno

Figura 64 El diseo factorial 2',

63 EL DISEO 2'

229

cuandoB est en el nivel alto ye est en el nivel bajo es [ab -b]/n. El efecto deA cuando e est en el nivel alto yB est en el nivel bajo es [ae-el/no Por ltimo, el efecto deA cuando tantoB como e estn en el nivel alto es [abe -be]/n. Porlo tanto, el efecto promedio deA es slo el promedio de estos cuatro efectos, o A= -[a-(l)+ab-b+ae-e+abe-be] 4n

(6-11)

Esta ecuacin tambin puede desarrollarse como un contraste entre las cuatro combinaciones de tratamientos de la cara derecha del cubo de la figura 6-5a (dondeA est en el nivel alto) y las cuatro de la cara izquierda (donde A est en el nivel bajo). Es decir, el efecto deA es slo el promedio de las cuatro corridas donde A est en el nivel alto (YA +) menos el promedio de las cuatro corridas donde A est en el nivel bajo <YA-)' o A= YA. - YA -

a+ab+ae+abe 4n

(l)+b+e+bc 4n

Esta ecuacin puede reescribirse como 1 A:= -[a+ab+ae+abe-(l)-b- e-be] 4n que es idntica a la ecuacin 6-11.

.~..,....
O O

J!lil
O

. lIIi
11

r
.
B

al Efectos principales

AB

AC
bl
Interaccin de dos factores

BC

CfL:
A

=corridas +
o
JII

corridas-

ABC

el

Interaccin de los tres factores

Figura 65 Representacin geomtrica de los contrastes que corresponden a los efectos principales y las interacciones del diseno 2'.

230

CAPTULO 6 DISEOfACTORIAL 2

De manera similar, el efecto de B es la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara frontal del cubo y las cuatro de la cara posterior. Se obtiene as

B = Y)l+ - Y r
1 =-[b+ab+be+abe-(l)-a-e-ae]

4n

(6-12)

El efecto de C es la diferencia en los promedios entre las cuatro combinaciones de tratamientos de la cara superior del cubo y las cuatro de la cara inferior, es decir,
C= Ye+
1
-

Ye
(6-13)

= 4n [c+ae+bc+abc-(l)-a- b-ab]

Los efectos de la interaccin de dos factores pueden calcularse con facilidad. Una medida de la interaccinAB es la diferencia entre los efectos promedio deA con los dos niveles de B. Por convencin, a la mitad de esta diferencia se le llama la interaccin AB. Utilizando smbolos,

Alto (+)
Bajo (-) Diferencia

Efecto promedio de A [(abe-be)+(ab -b)]

2n
{(ae-e)+[a-(1)]}

2n
[abe -be+ ab -b -ae+ e -a+ (1)]

2n
Puesto que la interaccin AB es la mitad de esta diferencia,

AB= [abe-be+ab-b-ae+c-a+(l)] 4n
La ecuacin 6-14 puede escribirse de la siguiente manera:

(6-14)

AB= abe+ab+e+(l) _ bc+b+ac+a 4n 4n


En esta forma, resulta fcil ver que la interaccinAB es la diferencia en los promedios entre las corridas de dos planos diagonales del cubo de la figura 6-Sb. Utilizando un razonamiento lgico similar y con referencia a la figura 6-5b, las interacciones AC y BC son

AC = -[(l)-a+b-ab- c+ac- bc-tubc] 4n


y

(6-15)

BC= -[(l)+a-b-ab- c-ac+bc+abc] 4n

(6-16)

6-3 ELDISEO 2'

231

La interaccinABC se define como la diferencia promedio entre la interaccinAB para los dos diferentes niveles de C. Por lo tanto,

ABC = -{[abc- bc]- [ac- c]- [ab- b]+[a-(I)]}

4n
1

=-[abc-bc-ac+c-ab+b+a-(I)]
4n

(6-17)

Como antes, la interaccinABC puede considerarse como la diferencia de dos promedios. Si se aslan las corridas de los dos promedios, stas definen los vrtices de los dos tetraedros que componen el cubo de la figura 6-Sc. En las ecuaciones 6-11 a 6-17, las cantidades entre corchetes son contrastes de las combinaciones de los tratamientos. Es posible desarrollar una tabla de signos positivos y negativos a partir de los contrastes, la cual se muestra en la tabla 6-3. Los signos de los efectos principales se determinan asociando un signo positivo con el nivel alto y un signo negativo con el nivel bajo. Una vez que se han establecido los signos de los efectos principales, los signos de las columnas restantes pueden obtenerse multiplicando las columnas precedentes apropiadas, rengln por rengln. Por ejemplo, los signos de la columnaAB son el producto de los signos de la columnaA y la columna B en cada rengln. El contraste de cualquier efecto puede obtenerse fcilmente con esta tabla. La tabla 6-3 tiene varias propiedades interesantes: 1) Con excepcin de la columna 1, cada una de las columnas tienen el mismo nmero de signos positivos y negativos. 2) La suma de los productos de los signos de dos columnas cualesquiera es cero. 3) La columna 1 multiplicada por cualquiera de las columnas deja la columna sin cambio. Es decir, 1 es un elemento identidad. 4)El producto de dos columnas cualesquiera produce una columna de la tabla. Por ejemplo, A x B = AB, Y

ABxB= AB 2

=A

Se observa que los exponentes de los productos se forman utilizando la aritmtica mdulo 2. (Es decir, el exponente slo puede ser Oo 1; si es mayor que 1, se reduce con mltiplos de 2 hasta que es Oo 1.) Todas estas propiedades se derivan de la ortogonalidad de los contrastes usados para estimar los efectos. Las sumas de cuadrados de los efectos se calculan con facilidad, ya que cada efecto tiene un contraste correspondiente con un solo grado de libertad. En el diseno 23 con n rplicas, la suma de cuadrados de cualquier efecto es

ss = (Contraste)2
&t

(6-18)

Tabla 6.3

Signos algebraicospara calcular los efectos del disefio 23 Combinacin de Efecto factorial tratamientos A 1 B AB C
(1)

AC

a b ab e ae be abe

+ + + + + + + +

+ + + +

+ + + + + + + +

+ + + + + + + +

BC +

ABe

+ +

+ +

_._-----------

232

CAPTULO 6 DISEO FACTORIAL 2"

EJEMPLO 6~ 1 ....................................................
Recuerde el ejemplo 5-3, donde se present un estudio del efecto del porcentaje de carbonatacin, la presin de operacin y la velocidad de lnea sobre la altura de llenado de una bebida carbonatada. Suponga que slo se usan dos niveles de carbonatacin, de tal modo que el experimento es un diseo factorial 23 con dos rplicas. Los datos (es decir, las desviaciones de la altura de llenado de especificacin) se muestran en la tabla 6-4, y en la figura 6-6 se presenta la representacin geomtrica del diseo. Al utilizar los totales bajo las combinaciones de los tratamientos que se muestran en la tabla 6-4, los efectos de los factores pueden estimarse de la siguiente manera: 1 .

A= -[a-(l)+ab-b+ac-c+abc-bc] 4n .

= 8[1-(-4)+5- (-1)+3- (-1)+11- 2]


8 1 B = 4n [b+ab+bc+abc- (1)- a~ c-ac]

1 1

= -[24]= 100

= 8[-1 +5+2+11-(..,-4)-1- (-1)- 3]

1 = 8[18]= 2.25
1 C= -[c+ac+bc+abc-(l)-a-b-ab] 4n . 1

= 8[-1 +3+2+11-(-4)-1-(-1)- 5]

1 =8[14]= 1.75 1 AB = 4n [ab-a- b+(l)+abc-bc-ac+c]


= 8[5-1-(-1)+(-4)+11- 2- 3+(-1)]
1

= 8[6] = 0.75
Tabla 6-4 El experimento de la altura de llenado, ejemplo 6-1 Factores codificados Corrida Desviacin de la altura de llenado Niveles del factor Bajo (-1) Alto (+1)

e
-1 -1 -1 -1 1 1 1 1

Rplica 1

Rplica 2

1
2

3 4

5
6 7 8

-1 1 -1 1 -1 1 -1 1

-1 -1 1 1 -1 -1 1 1

-3
O

-1 1

-1
2

-1
2

o
1 1
5

O 3

A (psi) 10 25 B (psi) e (b/min) 200

12
30 250

1
6

6.3 EL DISEO Z'


bc=2
e =-1
250 bpm

233

abe =11

+ F - - _......_-lIf"

Velocidad (e)

I I I I

,.j!:'-l.
11)_-4

""

a-'

Figura 66 El diseo 23 para el experimento de la desviacin de la altura de llenado del ejemplo 6-1.

AC= -[(l)-a+b-ab-c+ac-bc+abc] 4n = -[-4-1 +(-1)- 5-(-1)+3- 2+11] 8 = "2[2]= 0.25 BC = - [(1 )+a - b- ab- c- ac+bc+abc] 4n = -[-4+1-(-1)- 5-(-1)- 3+2+11] 8 1 = -'[4]= 050 8 .
y
1 1 1 1 1

ABC= -[abc-bc-ac+c-ab+b+a-(l)] 4n = -[11- 2- 3+(-1)- 5+(-1)+1-(-4)] 8 = -[4]= 050 8 .


Los efectos ms grandes son para la carbonatacin (A = 3.00), la presin (B = 2.25), la velocidad (C = 1.75) Yla interaccin carbonatacin-presin (AB = 0.75), si bien el efecto de la interaccin no parece tener un impacto tan grande sobre la desviacin de la altura de llenado como los efectos principales. Las sumas de cuadrados se calculan con la ecuacin 6-18 de la siguiente manera:
1 1

SS = (24)2 = 36.00 A 16 SS = (18)2 = 20.25 B 16 SS = (14)2 = 12.25 e 16

234

CAPTIlLO 6 DISENO FACTORIAL 2k

Tabla6-5 Resumen de la estimacin de losefectos delejemplo 6-1 Estimacin Sumas de Factor del efecto cuadrados A 3.00 36.00 B 20.25 2.25 C 12.25 1.75 AB 2.25 0.75 AC 0.25 0.25 BC 1.00 0.50 ABC 0.50 1.00 Error puro 5.00 Total 78.00

Contribucin porcentual 46.1538 25.9615 15.7051 2.88462 0.320513 1.28205 1.28205 6.41026

SSAB = SSAC

(:~2
(2)2

= 2.25

=16= 0.25
=(4)2=1.00 16

SS

BC

y
SSABC

= 16 = 1.00

( 4)2

La suma de cuadrados total es SST = 78.00, Ypor sustraccin, SSE = 5.00. En la tabla 6-5 se resumen las estimaciones de los efectos y las sumas de cuadrados. La columna etiquetada "contribucin porcentual" mide la contribucin porcentual de cada uno de los trminos del modelo a la suma de cuadrados total. La contribucin porcentual es con frecuencia una gua aproximada pero efectiva de la importancia relativa de cada trmino del modelo. Observe que los efectos principales dominan en realidad este proceso, explicando ms de 87% de la variabilidad total, mientras que la interaccin AB explica menos de 3%. El anlisis de varianza de la tabla 6-6 puede usarse para confirmar la magnitud de estos efectos. Por la tabla 6-6 se observa que los efectos principales son altamente significativos (todos tienen valores P muy

Tabla6-6 Anlisis de varianza de losdatosde la alturade llenado Fuente de Suma de Grados de libertad variacin cuadrados 36.00 Porcentaje de carbonatacin (A) 1 20.25 Presin (B) 1 Velocidadde lnea (C) 12.25 1 2.25 1 AB AC 0.25 1 1.00 BC 1 1.00 ABC 1 Error 5.00 8 78.00 15 Total

Cuadrado medio 36.00 20.25 12.25 2.25 0.25 1.00 1.00 0.625

Fo 57.60 32.40 19.60 3.60 0.40 1.60 1.60

Valor P <0.0001 0.0005 0.0022 0.0943 0.5447 0.2415 0.2415

6-3 ELDISEO 23

235

pequeos). La interaccinAB es significativa con un nivel aproximado de 10%; por 10 tanto, existe una ligera interaccin entre la carbonatacin y la presin. Quiz el lector quiera referirse al ejemplo 5-3 para la interpretacin prctica de este experimento. Los responsables del proceso decidieron correrlo con presin baja y velocidad de lnea alta, y reducir la variabilidad de la carbonatacin controlando con mayor precisin la temperatura. Se consigui as una reduccin sustancial en la desviacin de la altura de llenado del valor objetivo .
11I 11I 11I 11I 11I 11I 11I ' 11I 11I 11I 11I

El modelo de regresin y la superficie de respuesta El modelo de regresin para predecir la desviacin de la altura de llenado es

y= {Jo + {J1Xl +/J2 X2 +/J3 X3 +{Jn Xl x2


3.00) = 1.00+ (-2- Xl + (2.25) x 2 + (1.75) X 3 + (0.75) X -22 2
1X 2'

donde las variables codificadas Xl> X 2 YX 3 representan a A, B Ye, respectivamente. El trmino xh es la interaccinAB. Los residuales pueden obtenerse como la diferencia entre las desviaciones de la altura de llenado observada y la predicha. El anlisis de estos residuales se deja como ejercicio para el lector. En la figura 67 se muestra la superficie de respuesta y la grfica de contorno para la desviacin de la altura de llenado obtenida con el modelo de regresin, suponiendo que la velocidad de lnea est en el nivel alto (x3 = 1). Observe que como el modelo contiene la interaccin, las lneas de contorno de la desvacin de las alturas de llenado constantes son curvas (o la superficie de respuesta es un plano "torcido"). Es deseable operar este proceso de llenado de tal modo que la desviacin del llenado est tan cerca de cero como sea posible. La grfica de contorno indica que si la velocidad de lnea est en el nivel alto, entonces hay varias combinaciones de los niveles de la carbonatacin y la presin que satisfarn este objetivo. Sin embargo, ser necesario ejercer un control preciso de estas dos variables. Solucin por computadora Hay muchos paquetes de software de estadstica que establecern y analizarn diseos factoriales con dos niveles. La salida de uno de estos programas de computadora, Design-Expert, se muestra en la tabla 6-7. En la parte superior de la tabla se presenta el anlisis de varianza del modelo completo. El formato de esta presentacin es un tanto diferente de los resultados dados en la tabla 66. Observe que el primer reno gln del anlisis de varianza es un resumen global del modelo completo (todos los efectos principales y las interacciones), y la suma de cuadrados del modelo es
SSModelo = SSA +SSB +SSc +SSAII +SSAC +SSIIC +SSAIIC

= 710
Por lo tanto, el estadstico

F
est probando las hiptesis

= MSModelO = 10.43 = 16.69


MS E 0.63

H u:!3 l = /32

=/33 = /312 = /313 = /323 =/3123 = O


/3 ~ O

Hi: al menos una

236

CAPfTUW 6 DISEO FACTORIALZk

3.125

1.375

-0.3750

30.00 29.00 28.00 ~ 27.00 ....4, 26.00 25.00 10.00

12.00 11.60 11.20

10.40 CP~

10.80 ~.,,\tf'

al La superficie de respuesta

30.00 ,..---.--r---r-'r------,r----r-.....- " " " T -.....- - ,

29.17

27.50

26.87

12.00
Carbonstaci6n
b)

La grfica de contorno

Figura 6-7 Superficie de respuesta y grfica de contorno de la desviacin de la altura de llenado, con la velocidad en el nivel alto (250 bpm), ejemplo 6-1.

Tabla 67

Salida de Design-Expert para el ejemplo 6-1

Response: FUI Deviation in HelJght ANOVA for SeIected Factorial Modal Analysls of variance table (Partlal Mlm of equaresJ Sumof Mean F Source Squares DF Squar. Valu. Model 73.00 7 10.43 16.69 36.00 1 36.00 A 57.60

Prob~ F

0.0003
<0.0001 0.0005

significant

8
C

AB

BC ABC
Residual

AC

20.25 12.25 2.25 0.25


1.00 1.00

1 1 1
1

5.00
0.000

1 1 8
O

20.25 12.25 2.25 0.25 1.00 1.00 0.63 0.63

32.40 19.60 3.60 0.40 1.60 1.60

0.0022
0.0943
0.5447

0.2416 0.2416

LackofFit Pure Error


Cor Total Std.Oev. Mean C.V. PAESS Factor Intercept A-Carbonatlan B-Pressure C-Speed AB AC BC ABC

5.00 78.00
0.79 1.00 79.06 20.00
CoeffIcIent Estimate

8 15

A-Squared Adj A-Squared Pred A-Squared Adeq Preclslon

0.9359 0.8798 0.7436 13.416


Error

StancIMI
DF

1.00 1.50 1.13 0.88 0.38 0.13 0.26 0.26

1 1 1 1 1 1 1 1

0.20 0.20 0.20 0.20 0.20 0.20 0.20 0.20

95% el Low 0.54 1.04 0.67 0.42 -0.081 -0.33 -0.21 -0.21

95% a Hlgh 1.46 1.96 1.58 1.33 0.83 0.58 0.71 0.71

VlF

1.00 1.00 1.00 1.00 1.00 1.00 1.00

Final Equatlon in Terms of Coded FectOrs: FiII Oeviation '"

+1.00 +1.50 +1.13 +0.88 +0.38 +0.13 +0.25 +0.25

*A *8 *C *A *8 *A *C *B *C *A *B *C

Final Equetion In Terms of Actual Faeton: FlII Oevlation '"

-225.50000 +21.00000 +7.80000 + 1.08000 -0.75000 -0.10500 -0.040000 +4.00000E-oO:

*Cal"bonatian *Pressure *Speed *Call"bonatian *Pressure *Call'bonation Speed *Pressure *Speed *Carbonation Pressure *Speed

Reduced Model: Response: FIII Daviation in HdJight ANOVA for Seleeted FlICItOrial ModeI Analysis of variance tabla (Partial Mlm of ......J

237

Tabla 67

(continuacin)

Source Model

AS
Residual
Lack ofFit Pure Error

Car Total Std. Dev. Mean C.V. PRESS Factor Intercept A-Carbonaton 8-Pressure C-Speed

Sumof Squares 70.75 36.00 20.25 12.25 2.25 7.25 2.25 5.00 78.00 0.81 1.00 81.18 15.34

DF 4 1 1 1 1 11 3 8 15

Mean Square 17.69 36.00 20.25 12.25 2.25 0.66 0.75 0.63

F Value 26.84 54.62 30.72 18.59 3.41


1.20

Prob> F <0.0001 <0.0001 0.0002 0.0012 0.0917


0.3700

significant

not significant

R-Squared Adj R-Squared Pred R-Squared Adeq Precision DF 1 1 1 1 1 Standard Error 0.20 0.20 0.20 0.20 0.20

0.9071 0.8733 0.8033 15.424

AS

Coefficlent Estimate 1.00 1.50 1.13 0.88 0.38

950/0 CI Low 0.55 1.05 0.68 0.43 -0.072

95%CI High 1.45 1.95 1.57 _ 1.32 0.82

VIF 1.00 1.00 1.00 1.00

Final Equation in Terms of Coded Factors: FiII Deviation = +1.00 +1.50 *A +1.13*B +0.88 *C +0.38 *A *B Final Equation in Terms of Actual Factors: FiII Deviatan = +9.62500 -2.62500 *Carbonatlon -1.20000 *Pressure +0.035000 *Speed +0.15000 *Carbanation *Pressure Diagnostics Case Statistics Standard Actual Predicted Value Order Value -3.00 -2.13 1 -1.00 -2.13 2 0.000 0.12 3 4 1.00 0.12 -0.63 -1.00 5 -0.63 0.000 6 2.00 3.13 7 3.00 3.13 8 -1.00 -0.37 9 -0.37 0.000 10 11 2.00 1.88 1.00 1.88 12 1,13 1.00 13 1.00 1.13 14 6.00 4.88 15 5.00 4.88 16 Student Residual -1.300 1.671 -0.186 1.300 -0.557 0.928 -1.671 -0.186 -0.928 0.557 0.186 -1.300 -0.186 -0.186 1.671 0.186 Cook's Distance 0.154 0.254 0.003 0.154 0.028 0.078 0.254 0.003 0.078 0.028 0.003 0.154 0.003 0.003 0.254 0.003 Outlier t -1.347 1.845 -0.177 1.347 -0.539 0.922 -1.845 -0.177 -0.922 0.539 0.177 -1.347 -0.177 -0..177 1.845 0.177

Residual -0.88 1.13 -0.12 0.88 -0.38 0.63 -1.13 -0.13 -0.63 0.37 0.13 -0.88 -0.13 -0.13 1.13 0.13

Leverage 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313 0.313

238

6-3 EL DISEO 2"

239

Puesto que F oes grande, se concluira que al menos una de las variables tiene un efecto diferente de cero. Entonces se prueba la significacin de cada efecto factorial individual utilizando el estadstico F. Estos resultados concuerdan con la tabla 66. Abajo del anlisis de varianza del modelo completo se presentan varios estadsticos R 2 La R 2 ordinaria es R2= SSModelo = 73.00 = 0.9359 SS Total 78.00 y mide la proporcin de la variabilidad total explicada por el modelo. Un problema potencial con este estadstico es que siempre se incrementa cuando se agregan factores al modelo, incluso cuando estos factores no son significativos. El estadstico R 2 ajustada, definido como

R2.
AJu.tada

=1-

SSE / dIE
SSTotal /

dlTotal

=1-

5.00/8 78.00/15

0.8798

es un estadstico que est ajustado para el "tamao" del modelo; es decir, para el nmero de factores. La R 2 ajustada puede decrecer en realidad si se agregan trminos no significativos al modelo. El estadstico PRESS es una medida de qu tan bien predecir datos nuevos el modelo (PRESS es en realidad el acrnimo de Prediction Error Sum 01Squares -suma de cuadrados del error de prediccin-, y se calcula a partir de los errores de prediccin obtenidos al predecir el punto simo de los datos con un modelo que incluye todas las observaciones, excepto la i-sima). Un modelo con un valor pequeo de PRESS indica que es posible que el modelo sea un buen predictor. El estadstico "R 2 de prediccin" se calcula como
R2
,.

= 1- PRESS = 1- 20.00 = 07436


SSTotal 78.00

Prediccin

Esto indica que se esperara que el modelo completo explique cerca de 74% de la variabilidad de los datos nuevos. La siguiente seccin de la salida presenta el coeficiente de regresin de cada trmino del modelo y el error estndar (se, standard error) de cada coeficiente, definido como

se(~)= ~V(~) = ~MSE = JO.625 = 0.20 k


n2 2(8)
Los intervalos de confianza de 95% para cada coeficiente de regresin se calculan a partir de

s-t O.025,N_pse(~):s f3:s ~ +t O_025,N_pse(~)


donde los grados de libertad de t es el nmero de grados de libertad del error; es decir, N es el nmero total de corridas en el experimento (16), yP es el nmero de parmetros del modelo (8). Tambin se presenta el modelo completo en trminos de las variables codificadas y de las variables naturales. En la ltima seccin de la tabla 67 se ilustra la salida despus de eliminar los trminos de las interacciones no significativas. Este modelo reducido contiene ahora slo los efectos principales A, By C, y la interaccinAB. La suma de cuadrados de los residuales o del error se compone ahora de un componente del error puro ("Pure Error") que surge de las rplicas de los ocho vrtices del cubo, y un componente de falta de ajuste ("Lack of Fit"), compuesto por las sumas de cuadrados de las interacciones que se eliminaron del modelo (BC, AC y ABC). De nueva cuenta, la representacin del modelo de regresin de los resultados experimentales se presenta en trminos de las variables codificadas y las variables na-

240

CAPTULo 6 DISEOFACTORIAL 2'

turales. La proporcin de la variabilidad total de la desviacin de la altura del llenado que se explica por este modelo es

R2 = SS Modelo
SS Total

= 70.75 = 0.9071
78.00

que es menor que laR 2 del modelo completo. Observe, sin embargo, que laR 2 ajustada del modelo reducido apenas ha cambiado ligeramente respecto de la R 2 ajustada del modelo completo, y PRESS del modelo reducido es considerablemente menor, lo cual produce un valor ms grande de R;,edicci6n del modelo reducido. Evidentemente, la eliminacin de los trminos no significativos del modelo completo ha producido un modelo final que posiblemente funcionar con mayor eficiencia como predictor de datos nuevos. Observe que los intervalos de confianza para los coeficientes de regresin del modelo reducido son ligeramente ms cortos que los intervalos de confianza correspondientes en el modelo completo. En la ltima seccin de la salida se presentan los residuales del modelo reducido. Design-Expert tambin construir todas las grficas de los residuales que se estudiaron anteriormente. Otros mtodos para evaluar la significacin de los efectos El anlisis de varianza es una manera formal de determinar cules son los efectos de los factores que son diferentes de cero. Existen varios mtodos ms que son tiles. A continuacin se indica cmo calcular el error estndar de los efectos y cmo usar los errores estndar para construir intervalos de confianza para los efectos. Otro mtodo, que se ilustrar en la seccin 6-5, utiliza grficas de probabilidad normal para valorar la importancia de los efectos. . Es sencillo encontrar el error estndar de un efecto. Si se supone que hay n rplicas en cada una de las 2k corridas del diseo, y si Yi!' Yi2' ..., Yi" son las observaciones de la corrida i-sima, entonces
i = 1,2, ... , 2 k

es una estimacin de la varianza de la corrida i-sima. Las estimaciones de la varianza del diseo 2k pueden combinarse para dar una estimacin de la varianza global:
(6-19)

sta es tambin la estimacin de la varianza dada por el cuadrado medio del error en el anlisis de varianza. La varianza de la estimacin de cada efecto es V(Efecto) =V

(c:n;~~lste )
1
k- 1 ) 2

=(n2

V(Contraste)

Cada contraste es una combinacin lineal de los 2" totales de los tratamientos, y cada total consta de n observaciones. Por lo tanto, V(Contraste) = n2 k 0
2

6-3 EL DISEO 2'

241

y la varianza de un efecto es
1 k 2 V(Efecto) = (n2 k - t )2 n2 a

1 =__ a k 2
n2
-

2a

= .Jn2k
El error estndar estimado se encontrara sacando la raz cuadrada de esta ltima expresin y sustituyencon su estimacin 52: do 25 se(Efecto) = ~ (6-20) k

cr

.,n2

Observe que el error estndar de un efecto es el doble del error estndar de un coeficiente de regresin estimado en el modelo de regresin del diseo 2k (ver la salida de computadora de Design-Expen del ejemplo 61). Los intervalos de confianza de 100(1- a) por ciento para los efectos se calculan a partir de Efecto ta12,N -pS'e(Efecto), donde los grados de libertad de t son slo los grados de libertad de los residuales o del error (N - p = nmero total de corridas - nmero de parmetros del modelo). Para ilustrar este mtodo, considere el experimento de la desviacin de la altura de llenado del ejemplo 6-1. El cuadrado medio del error esM5E = 0.625. Por 10 tanto, el error estndar de cada efecto es (utilizando 52 = M5 E)

25 se(Efecto) = ,--;::;; k
.,n2
=

2.Jif.625
~2(23 )

=0.40
Entonces, tO.025, 8 = 2.31Yto.o25,rtS'e(Efecto) = 2.31(0.40) = 0.92, de donde los intervalos de confianza de 95% aproximados para los efectos de los factores son

A: lOO0.92 B: 2250.92 C: 1.750.92 AB: 0.750.92 AC: 0.250.92 BC: 0.500.92 ABC: 0.500.92
Este anlisis indica queA, By C son factores importantes, porque son las nicas estimaciones de los efectos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero. Efectos de dispersin El ingeniero de proceso que trabaj en el caso del llenado tambin se interes en los efectos de dispersin; es decir, Zalguno de los factores afecta la variabilidad de la desviacin de la altura de llenado de una

242

CAPTULO 6 DISEO FACTORIAL 2"

Roe 1

250 bpm

F o - -.......---..., I I

I
Velocidad (e)

I
Rm~

__

"" ""
I

""

10%
Carbonatacin lA)

Figura 68

Rangos de la desviacin de la altura de llenado del

ejemplo 6-1.

corrida a otra? Una manera de responder esta pregunta es examinando el rango de las desviaciones de la altura de llenado para cada una de las ocho corridas del diseo 23 Estos rangos se grafican en el cubo de la figura 6-8. Observe que los rangos son aproximadamente iguales para las ocho corridas del diseo. Por consiguiente, no hay evidencia slida que indique que alguna de las variables del proceso afecte directamente la variabilidad de la desviacin de la altura de llenado en el proceso.

6~4

EL DISEO GENERAL t

Los mtodos de anlisis que se han presentado hasta este punto pueden generalizarse para el caso de un diseo factorial2k, es decir, un diseo con k factores 'l.uetienen dos niveles cada uno. El modelo estadstico para un diseo 2k incluira k efectos principales, ( ~) interacciones de dos factores, ( ~ ) interacciones de tres factores, ..., y una interaccin de k factores. Es decir, para un diseo 2k el modelo completo contendra 2k - 1 efectos. Tambin se usa aqu la notacin introducida anteriormente para las combinaciones de los tratamientos. Por ejemplo, en un diseo 25, abd denota la combinacin de tratamientos con los factores A, By D en el nivel alto y los factores e y E en el nivel bajo. Las combinaciones de los tratamientos pueden escribirse en orden estndar introduciendo los factores uno a la vez y combinando sucesivamente cada nuevo factor con los que 10 preceden. Por ejemplo, el orden estndar de un diseo 24 es (1), a, b, ab, e, ae, be, abe, d, ad, bd, abd, ed, aed, bcd y abed. El enfoque general para el anlisis estadstico del diseo 2k se resume en la tabla 6-8. Como se seal anteriormente, suele emplearse un paquete de software de computadora en este proceso de anlisis. A estas alturas, la secuencia de pasos de la tabla 6-8 debe resultar familiar. El primer paso es estimar los efectos de los factores y examinar sus signos y magnitudes. De este modo el experimentador obtiene inTabla 6.8 1. 2. 3. 4. 5. 6. Procedimiento de anlisis para un disefio 2k

Estimar los efectos de los factores Formar el modelo inicial Realizar las pruebas estadsticas Refinar el modelo Analizar los residuales Interpretar los resultados

6-4 ELDISEO GENERAL 2

243

formacin preliminar respecto de los factores y las interacciones que pueden ser importantes, y en qu direcciones debern ajustarse estos factores para mejorar la respuesta. Para formar el modelo inicial del experimento, por lo general se elige el modelo completo, es decir, todos los efectos principales y las interacciones, siempre que se haya hecho una rplica de al menos uno de los puntos del diseo (en la seccin siguiente se revisa una modificacin de este paso). Despus, en el paso 3 se usa el anlisis de varianza para probar formalmente la significacin de los efectos principales y las interacciones. En la tabla 6-9 se presenta la forma general de un anlisis de varianza para un diseo factorial 2k con n rplicas. El paso 4, refinar el modelo, suele consistir en la eliminacin de las variables no significativas del modelo completo. El paso 5 es el anlisis residual usual para verificar la adecuacin del modelo y los supuestos. En ocasiones ocurrir una refinacin del modelo despus del anlisis residual, si se encuentra que el modelo es inadecuado o que hay violaciones serias de los supuestos. El ltimo paso consiste generalmente en el anlisis grfico: grficas de los efectos principales o las interacciones, o superficies de respuesta y grficas de contorno. Aun cuando los clculos descritos se realizan por lo general con una computadora, en ocasiones es necesario calcular manualmente la estimacin de un efecto o la suma de cuadrados de un efecto. Para estimar un efecto o calcular la suma de cuadrados de un efecto, primero debe determinarse el contraste asociado con ese efecto. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos, como la tabla 6-2 o 63. Sin embargo, para valores grandes de k esto resulta laborioso, y puede usarse un mtodo alternativo. En general, el contraste del efecto AB"'K se determina expandiendo el miembro derecho de Contraste AB ...K

= (a l)(b l)(kl)
Grados de libertad 1 1
1

(6-21)

Tabla 69 Anlisis de varianza de un disefio 2" Fuente de Suma de variacin cuadrados k efectosprincipales

A
B K
(~ ) interacciones de dos factores

SSA SSB SSK SSAB SSAC SSJK SSABC SSABD SS/JK

AB

1
1

AC
/K

1
1 1 1

(; ) interacciones de tres factores


ABC ABD l/K

<Z ) = 1 interaccinde k factores


ABC .. K

Error Total

SSABC...K SSE SST

1 2k(n -1) n2 k -1, .

. '.",." . -.
~.. ~.

.'

244

CAPTULO 6 DISEO FAcrORIAL 2k

Para expandir la ecuacin 6-21 se usa el lgebra ordinaria reemplazando "1" con (1) en la expresin final. El signo de cada grupo de parntesis es negativo si el factor est incluido en el efecto y es positivo si el factor no est incluido. Para ilustrar el uso de la ecuacin 6-21, considere un diseo factorial 2 3 El contraste deAB sera Contraste AB

= (a-1)(b-1)(c+ 1) =abc+ab+c+(1)-ac-bc-a-b

Como un ejemplo ms, en un diseo 25 , el contraste de ABCD sera Contraste ABCD = (a-1)(b-1)(c-1)(d -l)(e+ 1)

=abcde+ cde + bde +ade + bce


+ace+abe +e +abcd +cd + bd +ad +bc+ac+ab+(l)- a - b- c - abc- d - abd - acd - bcd - ae - be- ce- abce- de- abde- acde- bcde
Una vez que se han calculado los contrastes de los efectos, pueden estimarse los efectos y calcular las sumas de cuadrados de acuerdo con
AB .. K

= ~(Contraste AB ..K ) n2 k
(Contraste AB ...K
2

(6-22)

y SS AB ...K
1 = n2 k
)

(6-23)

respectivamente, donde n denota el nmero de rplicas. Se cuenta tambin con un algoritmo tabular debido al Dr. Frank Yates que en ocasiones puede ser til para el clculo manual de las estimaciones de los efectos y las sumas de cuadrados. Referirse al material suplementario del texto de este captulo.

6~5

UNA SOLA RPLICA DEL DISEO 2k

Incluso para un nmero moderado de factores, el nmero total de combinaciones de tratamientos en un diseo factorial 2k es grande. Por ejemplo, un diseo 25 tiene 32 combinaciones de tratamientos, un diseo 2 6 tiene 64 combinaciones de tratamientos, etc. Debido a que por lo general los recursos son limitados, el nmero de rplicas que el experimentador puede emplear quizs est restringido. Con frecuencia, los recursos disponibles permiten hacer nicamente una sola rplica del diseo, a menos que el experimentador est dispuesto a omitir algunos de los factores originales. Un riesgo obvio cuando se realiza un experimento que tiene una sola corrida para cada combinacin de prueba es que el modelo puede ajustarse al ruido. Es decir, si la respuesta y es sumamente variable, pueden resultar conclusiones engaosas del experimento. La situacin se ilustra en la figura 6-9a. En esta figura, la lnea recta representa el verdadero efecto del factor. Sin embargo, debido a la variabilidad aleatoria presente en la variable de respuesta (representada por la franja sombreada), el experimentador ob tiene en realidad las dos respuestas medidas representadas por los puntos negros. Por consiguiente, el efecto del factor estimado est cerca de cero y el experimentador ha llegado a una conclusin errnea respecto de este factor. Ahora bien, si hay menos variabilidad en la respuesta, la posibilidad de una conclusin errnea ser ms reducida. Otra forma de asegurarse de que se obtienen estimaciones confiables de los efectos es incrementando la distancia entre los niveles bajo (-) y alto ( +) del factor, como se ilustra en

6-5 UNA SOlA RPUCA DEL DISEO 21

245

Verdadero afecto del factor

Factor, %
al Distancia pequellu entre los niveles del factor

Verdadero efecto del factor

Efecto m;timado del factor

Factor. %
bl Separacin agresiva de los niveles del factor

Figura 69 El impacto de la eleccin de los niveles del factor en un diseo no replicado.

la figura 6-9b. Observe que en esta figura la distancia incrementada entre los niveles bajo y alto del factor resulta en una estimacin razonable del verdadero efecto del factor. El uso de la estrategia de una sola rplica es comn en los experimentos de exploracin cuando hay un nmero relativamente grandle de factores bajo consideracin. Debido a que en estos casos nunca puede tenerse la certeza absoluta de que el error experimental es pequeo, una buena prctica en este tipo de experimentos es separar los niveles de los factores de manera agresiva. Quizs el lector encuentre til releer las pautas generales para elegir los niveles de los factores del captulo 1. Una sola rplica de un diseo 2k se denomina en ocasiones diseo factorial no replicado. Con una sola rplica, no se cuenta con ninguna estimacin interna del error (o "error puro"). Una forma de abordar este anlisis de un diseo factorial no replicado consiste en suponer que algunas interacciones de orden superior son insignificantes y combinar sus cuadrados medios para estimar el error. Esto es una apelacin al principio de efectos esparcidos; es decir, la mayora de los sistemas estn dominados por algunos de los efectos principales y las interacciones de orden inferior, y la mayor parte de las interacciones de orden superior son insignificantes.

- - - - - - - - - - - - - - - - - - - - - - - - - ..

246

CAPfTIJLO 6 DISEO FACfORIAL 2k

Cuando se analizan datos de diseos factoriales no replicados, ocasionalmente ocurren interacciones de orden superior reales. El uso de un cuadrado medio del error que se obtiene agrupando las interacciones de orden superior no es apropiado en estos casos. Un mtodo de anlisis atribuido a Daniel [35a] proporciona una forma simple de resolver este problema. Daniel sugiere examinar una grfica de probabilidad normal de las estimaciones de los efectos. Los efectos que son insignificantes siguen una y tendern a localizarse sobre una lnea recta en esta distribucin normal, con media cero y varianza grfica, mientras que los efectos significativos tendrn medias diferentes de cero y no se localizarn sobre la lnea recta. Por lo tanto, el modelo preliminar se especificar de tal modo que contenga aquellos efectos que aparentemente son diferentes de cero, con base en la grfica de probabilidad normal. Los efectos aparentemente insignificantes se combinan como una estimacin del error.

er,

Ej"EMPLO 6 2

111

111

111

111

111

111

111

111

111

111

111

111

Una sola rplica del diseo 24


Un producto qumico se fabrica en un envase presurizado. Se lleva a cabo un experimento factorial en la planta piloto para estudiar los factores que se piensa influyen en el ndice de filtracin de este producto. Los cuatro factores son la temperatura (A), la presin (B), la concentracin del formaldehdo (C) y la velocidad de agitacin (D). Cada factor est presente con dos niveles. La matriz del diseo y los datos de la respuesta obtenidos de una sola rplica del experimento 24 se muestran en la tabla 6-10 y en la figura 6-10. Las 16 corridas se hacen de manera aleatoria. El ingeniero del proceso est interesado en maximizar el ndice de filtracin. Las condiciones actuales del proceso producen ndices de filtracin de alrededor de 75 gal/h. Asimismo, en el proceso actual la concentracin de formaldehdo, factor e, se usa en el nivel alto. Al ingeniero le gustara reducir la concentracin de formaldehdo lo ms posible, pero no ha podido hacerlo porque siempre produce ndices de filtracin ms bajos. El anlisis de estos datos se iniciar construyendo una grfica de probabilidad normal de las estimaciones de los efectos. La formacin de signos positivos y negativos para las constantes de los contrastes

Tabla 6-10 Experimento del ndice de filtracin en la planta piloto

Nmero
de corrida

Factor

Etiqueta de la corrida

ndice de filtracin (gal/h) 45 71 48 65 68 60 80 65 43 100 45 104 75 86 70 96

1 2
'3 4

(1)

+ + + +
.. i.: "

+ + +
+

a b ab

,6,
T 8 '.9 ! 10 :"1

5, '

+ + +
+

+ + + +

-13

12
.r

,..

+ + + +

- 14 ' 15 16

+ + + +

+ + +

+ +

+ +

ae be abe d ad bd abd ed acd bcd abcd

.~

.";,;.,

65 UNASOLA RPLICA DEL DISEO Zt

247

.-----------+

cfL
A

Figura 610 Datos del experimento del ndice de filtracin en la planta piloto para el ejemplo 6-2.

del diseo 24 se muestra en la tabla 611. A partir de estos contrastes pueden estimarse 15 efectos factoriales, y las sumas de cuadrados se presentan en la tabla 6-12. En la figura 6-11 se muestra la grfica de probabilidad normal de estos efectos. Thdos los efectos que caen sobre la recta son insignificantes, mientras que los efectos grandes estn apartados de ella. Los efectos importantes que surgen de este anlisis son los efectos principales de A, C y D Ylas interacciones ACyAD. Los efectos principales de A, C y D se grafican en la figura 6-12a. Los tres efectos son positivos, y si slo se consideraran estos efectos principales, los tres factores se correran en el nivel alto a fin de maxi.mizar el ndice de filtracin. Sin embargo, siempre es necesario examinar cualquier interaccin que sea importante. Recuerde que los efectos principales no tienen mucho significado cuando estn presentes en interacciones significativas. Las interaccionesAC yAD se grafican en la figura 6-12b. Estas interacciones son la clave para resolver el problema. Observe, por la interaccinAC, que el efecto de la temperatura es muy pequeo cuando la concentracin est en el nivel alto y muy grande cuando la concentracin est en el nivel bajo, obtenindose los mejores resultados con la concentracin baja y la temperatura alta. La interaccinAD indica que la velocidad de agitacinD tiene un efecto reducido con una temperatura baja, pero un efecto positivo grande con la temperatura alta. Por lo tanto, los mejores ndices de filtracin pareceran obtenerse cuandoA y D estn en el nivel alto y C est en el nivel bajo. Esto permitira la reduccin de la concentracin de formaldehdo a un nivel ms bajo, otro de los objetivos del experimentador.
,. ,. ,. .o ,. ,.
~

,. ,.

Proyeccin de un diseo Es posible hacer otra interpretacin de los efectos de la figura 6-11. Pue~t qe B (presin) no es significativa y todas las interacciones en las que interviene B son insignificantes, B puede descartarse del experimento, de tal modo que el diseo se convierte en un factorial 23 enA, C yD con dos rplicas. Esto es fcil de ver examinando nicamente las columnasz, e y D en la matriz del diseo que se muestra en la tabla la tabla 6-13 se resume el 6-10 y observando que esas columnas forman dos rplicas de un diseo 23 anlisis de varianza de los datos utilizando este SPPl1esto de simplificacin. Las conclusiones que se sacaran de este anlisis se mantienen en esencia sin cambios respecto de las del ejemplo 6-2. Observe que al hacer la proyeccin de la rplica nica del diseo 24 en un diseo 23 con dos rplicas, se tiene ahora tanto una estimacin de la interl.f<;inACz?corno una estimacin del error basada en lo que en ocasiones se de. . nomina rplica oculta. ' -. "..' ' ,:,':, . . ," .

En

..::.. 00

Tabla 611 Constantes de los conttastes del disefio 24 A B AS AC C


(1)

Be

+
-

a
b
ah

+
-

+
-

+
-

+ +
-

+ +
-

ABC -

AD

BD

+
-

+
-

+ +
-

+ +
-

ABD -

CD

ACD
-

BCD
-

ABCD

e
oc be abe d ad bd abd cd ocd bed abcd

+ +

+ +
-

+
-

+
-

+ +

+ +
-

+ + + +
-

+
-

+ + + +
-

+ + + + + + + +

+
-

+
-

+ +
-

+ +
-

+ +
-

+
-

+
-

+ +
-

+ +
-

+ + + +
-

+ + +
-

+ +

+ + + +
-

+ +
-

+
-

+ -

+ +

+
-

+ +

_.
+

+ + + +

+
-

+ +

+ + + + + + + +

+
-

+ +
-

+ +
-

+
-

+
-

+ +
-

+
-

+ +

+ + + +

+
-

+ +

6-5 UNASOLARPLICA DEL DISEO 21 Tabla 612 Estimaciones de los efectos de los factores y sumas de cuadrados del diseo factoral Z!del ejemplo 6-2 Trmino del Estimacin Suma de Contribucin modelo cuadrados porcentual del efecto

249

A B
C

D AB AC
AD

BC BD CD ABC ABD ACD BCD ABCD

21.625 3.125 9.875 14.625 0.125 -18.125 16.625 2.375 -0.375 -1.125 1.875 4.125 -1.625 -2.625 1.375

1870.56 39.0625 390.062 855.563 0.0625 1314.06 1105.56 22.5625 0.5625 5.0625 14.0625 68.0625 10.5625 27.5625 7.5625

32.6397 0.681608 6.80626 14.9288 0.00109057 22.9293 19.2911 0.393696 0.00981515 0.0883363 0.245379 1.18763 0.184307 0.480942 0.131959

99

95 90

o
c:

80

70

~ :a 50
.l!l
{l

O
e
AC

AO

30
20 10

#-

21.62
Efecto

Figura 611 Grfica de probabilidad normal de los efectos para el diseo factorial 24 del ejemplo 6-2.

250
~

CAPTULO 6

DISEO FACTORIAL Z

'i%" 90 El

, 90

90 80

'g

a
'o '0
<::

E o

80

70

:::

~ 60

."

.s

'i:;

l'l 50

'"

/
A
Interacci6n AC

80 70
60
50
C

/
100

70
60

-:
D

60

al Grficas de los efectos principales

100

'" El 90 o
'O

Cm-

90 80

'" E 80

e o,

. 70

."
.~

~ '"
'"

-o

70
60

60

-.s:

." 50
40L...J~------!--

50

40
A

61 Grficas de las interacciones

Figura 6-12 Grficas de los efectos principales y las interacciones para el ejemplo 6-2.

Tabla 6-13 Anlisis de varianza del experimento del ndice filtracin en la planta piloto en A, Fuente de Suma de Grados de Cuadrado variacin cuadrados libertad medio 1870.56 1870.56 A 1 390.06 C 1 390.06 855.56 855.56 D 1 1314.06 1314.06 AC 1 1105.56 1105.56 AD 1 5.06 5.06 1 ACD 10.56 10.56 1 179.52 22.44 Error 8 5730.94 Total 15

e yD
83.36 17.38 38.13 58.56 49.27 <1 <1 Valor P <0.0001 <0.0001 <0.0001 <0.0001 <0.0001

eD

6-5 UNA SOLARPUCA DEL DISEO 2l

251

El concepto de proyectar un diseo factorial no replicado en un diseo factorial con rplicas en menos factores es muy til. En general, si se tiene una sola rplica del diseo 2\ y si h (h < k) factores son insignificantes y pueden descartarse, entonces los datos originales corresponden a un diseo factorial completo con dos niveles en los k - h factores restantes con 2h rplicas.
Verificacin de diagnstico

Debern aplicarse las verificaciones de diagnstico usuales a los residuales de un diseo 2k El anlisis realizado indica que los nicos efectos significativos sanA = 21.625, C = 9.875,D = 14.625,AC = -18.125 YAV = 16.625. Si esto es correcto, los ndices de filtracin estimados estn dados por
r

21.625) "'=7O06+ (-2- x


r

r>:

+ (9.875) x 3 + (14.625) x 4 - (18.125) xx -2 -2 -2 - 13

16.625) + (- 2 - X 1X4
donde 70.06 es la respuesta promedio y las variables codificadasx,x3, x 4 asumen valores entre -1 y + 1. El ndice de filtracin predicho para la corrida (1) es

y= 70.06+ (21.~25) (-1)+ (9.~75) (-1)+ C4.~25)(-1)


_

(18.~25) (_1)(_1)+C6.~25) (-1)(-1)

= 46.22
Puesto que el valor observado es 45, el residual es e = y - y = 45 - 46.22 sentan los valores de y, y y e = y - y para las 16 observaciones.
y
(1) 45

=-1.22. A continuacin se pre-

y
46.22 69.39 46.22 69.39 74.23 61.14 74.23 61.14 44.22 100.65 44.22 100.65 72.23 92.40 72.23 92.40

e =y-y
-1.22 1.61 1.78 -4.39 --6.23 -1.14 5.77 3.86 -1.22 -0.65 0.78 3.35 2.77 -6.40 -2.23 3.60

a b ab e ae be abe d ad bd abd ed aed bed abcd

71
48 65 68 60 80 65 43 100 45 104 75 86 70 96

En la figura 6-13 se muestra la grfica de probabilidad normal de los residuales. Los puntos de esta grfica se localizan razonablemente prximos a una lnea recta, brindando apoyo a la conclusin de que A, e, D, AC yAD son los nicos efectos significativos y que se satisfacen los supuestos fundamentales del anlisis.

252

CAPTULO 6 DISEO FACTORIAL 2k

99

-6.375

-3.34375

-0.3125
Residual

2.71875

5.75

Figura 613 Grfica de probabilidad normal de los residuales del ejemplo 6-2.

La superficie de respuesta
Las grficas de las interacciones de la figura 6-12 se utilizaron para ofrecer una interpretacin prctica de los resultados de este experimento. En ocasiones es til emplear la superficie de respuesta para este fin. La superficie de respuesta se genera por el modelo de regresin
fI= J

7006 + (21.625) Xl + (9.875) x 3 + (14.625) 2 2 2 x4 18.125) - (- 2 - X1X3 + (16.625) XlX4 -2-

En la figura 6-14a se muestra la grfica de contorno de la superficie de respuesta cuando la velocidad de agitacin est en el nivel alto (es decir, X4 =1). Los contornos se generan a partir del modelo anterior conr, =1,o

Y = 773725+(38.25)Xl +(9.875) x 3 _ (18.125) X lX3 . 2 2 2


A

Observe que los contornos son lneas curvas porque el modelo contiene un trmino de interaccin. La figura 6-14b es la grfica de contorno de la superficie de respuesta cuando la temperatura est en el nivel alto (es decir, Xl = 1). Cuando se hace Xl = 1 en el modelo de regresin se obtiene

J= 80.8725-(8~)X3

+e

1 ;25) X4

6-5 UNA SOlA RPLICA DELDISEO 2"


1,000 .----~--"'T'"T""-~-__r--....,..T"""___.

253

90.00

1.000
a) Grflca de contorno con la velocidad de agitacin (D). "4 - 1

1.000

~0.667

-1,000 "'"""::.-......._ _........_ _"--_:;;;..a._ _....L.._---' -1.000 -0.867 -0.333 0.000 0.333 0.667 1.000
Concentracin.

e (s3)

b) Grfica de oontorno con la temperatura

\A). x, = 1

Figura 6-14 Grficas de contorno del ndice de filtracin, ejemplo 6-2.

Estos contornos son rectas paralelas porque el modelo contiene nicamente los efectos principales de los factores e (X3) y D. (X4)' Ambas grficas de contorno indican que si se quiere maximizar el ndice de filtracin, las variables A (xt ) y D (x4 ) debern estar en el nivel alto y que el proceso es relativamente robusto para la concentracin C. Se obtuvieron conclusiones similares a partir de las grficas de las interacciones.
La mitad de grfica normal de los efectos Una alternativa para la grfica de probabilidad normal de los efectos de los factores es la mitad de grfica normal. Es una grfica del valor absoluto de las estimaciones de los efectos contra sus probabilidades normales acumuladas. En la figura 615 se muestra la mitad de grfica normal de los efectos para el ejemplo 62. La lnea recta de la mitad de grfica normal siempre pasa por el origen y deber pasar tambin cerca del valor de los datos del percentil cincuenta. Muchos analistas sienten que es ms fcil interpretar la mitad de

254

CAPTULO 6 DISEO FACTORlAL 2k

99

97
"'C

'E

9.5

AC

10
.:
"'C

90 85 80 70

E o

t
'" 'f.
"'C

'" ;g

AD

60
40 20

o
0.00 5.41 10.81
Efecto

16.22

21.63

Figura 615

Mitad de grfica normal de los efectos de los factores del ejemplo 6-2.

grfica normal, en particular si slo se cuenta con pocas estimaciones de los efectos, como cuando el experimentador ha usado un diseo de ocho corridas. Algunos paquetes de software construirn ambas grficas.
Otros mtodos para analizar diseos factoriales no replicados El procedimiento de anlisis estndar para un diseo factorial de dos factores no replicado es la grfica normal (o mitad de grfica normal) de los efectos estimados de los factores. Sin embargo, los diseos no replicados son tan usados en la prctica que se han propuesto muchos procedimientos formales de anlisis para resolver la subjetividad de la grfica de probabilidad normal. Hamada y Balakrishnan [52] compararon algunos de estos mtodos. Encontraron que el mtodo propuesto por Lenth [70] tiene una potencia adecuada para detectar efectos significativos. Tambin es fcil de implementar y, como resultado, est empezando a aparecer en algunos paquetes de software para analizar datos de diseos factoriales no replicados. Se ofrece una breve descripcin del mtodo de Lenth. ' ". :' ,,' Suponga que se tienen m contrastes de inters, por ejemplo Cl , C2, , cm:Siel diseo es'un fetorial 2k no replicado, estos contrastes corresponden a las m = 2k -1 estimaciones'de los efeCt:osde los factores: La base del mtodo de Lenth es estimar la varianza de un-contraste a partir de'aiestimacionesm!l'pequeas (en valor absoluto) de los contrastes. Sean " ,.....:,~;,

""s~== t.s >i'medlana '(Pi!>,:'

.':\).::... ;.

l.

~'I

'.

,.,

':~ . :

'".::

,".-(

.-","
",'
,~

'. ~ .: :.
:'.~.:. ~

'"

.....:

,.,
-.: I

..

6-5 UNASOLA RPLICA DEL DISEO 2'

255

PSE denota el "pseudo error estndar", y Lenth demuestra que es un estimador razonable de la varianza del contraste cuando no hay muchos efectos activos (significativos). El PSE se usa para juzgar la significacin de los contrastes. Un contraste individual puede compararse con el margen de error (ME, margin 01 error) ME = t 0.025 ,d x P5E

donde los grados de libertad se definen como d = m13. Para hacer inferencias sobre un grupo de contrastes, Lenth sugiere usar el margen de error simultneo (5ME, simuJtaneous nuugin 01 error)
SME=
tr,d

xPSE

donde el punto porcentual de la distribucin t que se usa es y = 1 - (1 + O.95 1/m)/2. Para ilustrar el mtodo de Lenth, considere el experimento 24 del ejemplo 6-2. Los clculos dan como resultado So = 1.5 x 1-2.6251 = 3.9375 Y 2.5 x 3.9375 = 9.84375, de donde
PSE= 1.5 x 11.7~= 2625 ME = 2571 x 2625 = 6.75 SME= 5.219 x 2625= 1170

Considere ahora las estimaciones de los efectos de la tabla 6-12. El criterio SME indicara que los cuatro efectos ms grandes (en magnitud) son significativos, ya que las estimaciones de sus efectos exceden SME. El efecto principal de C es significativo de acuerdo con el criterio ME, pero no con respecto al SME. Sin embargo, puesto que es evidente que la interaccinAC es importante, probablemente C se incluira en la lista de efectos significativos. Observe que en este ejemplo el mtodo de Lenth produjo la misma respuesta que la obtenida anteriormente con el examen de la grfica de probabilidad normal de los efectos. Varios autores (ver Ramada y Balakrishnan [52], Loughin [73], Loughin y Noble [74]y Larntz y whtcomb [69]) han hecho notar que el mtodo de Lenth falla para controlar los ndices del error tipo 1,y que pueden usarse mtodos de simulacin para calibrar su procedimiento. Larntz y Whitcomb [69] sugieren reemplazar los multiplicadores ME y 5ME con multiplicadores ajustados de la siguiente manera:
Nmero de contrastes ME original ME ajustado SME original SME ajustado
7 3.764 2.295 9.008 4.891 15 2.571 2.140 5.219 4.163 31 2.218 2.082 4.218 4.030

Estos resultados coinciden en gran medida con los de Ye y Hamada [114]. En general, el mtodo de Lenth es un procedimiento ingenioso y til. Sin embargo, recomendamos utilizarlo como complemento de la grfica de probabilidad normal usual de los efectos, no como su sustituto. Bisgaard [10] ha proporcionado una sutil tcnica grfica, llamada carta de inferencia condicional, como ayuda para interpretar la grfica de probabilidad normal. La finalidad de esta grfica es ayudar al experimentador a juzgar los efectos significativos. Esto sera relativamente sencillo si se conociera la desviacin estndar a, o si pudiera estimarse a partir de los datos. En disefios no replicados, no se cuenta con ninguna estimacin interna de a, por lo que la carta de inferencia condicional est disefiada para ayudar al experimentador a evaluar la magnitud de los efectos para un rango de valores de la desviacin estndar.

256

CAPfrow 6 DISEO FACTORIAL 2k

Bisgaard fundamenta la grfica en el resultado de que el error estndar de un efecto, en un diseo de dos niveles con N corridas (para un diseo factorial no replicado, N ::: 2k ) , es 2u

.JN
donde a es la desviacin estndar de una observacin individual. Entonces 2 veces el error estndar de un efecto es
+--

4a

-.JN

Una vez que se estiman los efectos, se hace una grfica como la que se muestra en la figura 6~ 16, con las estimaciones de los efectos graficadas en el eje vertical, o eje y. En esta figura se han usado las estimaciones de los efectos del ejemplo 6-2. El eje horizontal, OX, de la figura 6-16 es la escala de la desviacin estndar (a). Las dos rectas estn en
y=+- y

4a

.JN.

y=-~

4a

.JN

En el ejemplo tratado aqu,N = 16, por lo que las rectas estn eny = +ayy = -(J. Por lo tanto, para cualquier valor dado de la desviacin estndar a, la distancia entre estas dos rectas puede leerse como un intervalo de confianza de 95% aproximado para los efectos insignificantes. En la figura 6-16 se observa que si el experimentador piensa que la desviacin estndar est entre 4 y 8, entonces los factores A, C, D y las interaccionesAC y AD son significativos. Si el experimentador piensa que la desviacin estndar tiene un valor de hasta 10, el factor C quiz no sea significativo. Es decir, para
A

22.
18

AD

D 14.

C 10.

+4a{'N

21

-21
-10

.IE--~_....L...._~-~-~=----(J

-14
-18 AC

-22 Figura 616 Carta de inferencia condicional para el ejemplo 6-2.

6-5 UNASOLARPUCA DEL DISEO 21

257

--------+

4'IT(~
2.7-2.44

.}.n-- ~/.43

el
A

Figura 6-17 Datos del experimento de perforacin del ejemplo 6-3.

cualquier supuesto dado acerca die la magnitud de a, el experimentador puede construir una "cinta de medir" para juzgar la significacin aproximada de los efectos. La carta tambin puede usarse en sentido inverso. Por ejemplo, suponga que estuviera en duda si el factor e es significativo o no. Entonces el experimentador podra preguntar si es razonable esperar que a pudiera ser tan grande como 10 o ms. Si es improbable que a sea tan grande como 10, entonces puede concluirse que e es significativo. Se presentan ahora tres ilustrativos ejemplos de diseos factoriales t' no replicados.

Ej'EMPW 6-,3

IJI

1)1

IJI ..

1)1

1i'ansformacin de datos en un diseo factorial Daniel [35b] describe un diseo factorial z4 utilizado para estudiar la rapidez de avance de una perforadora
como una funcin de cuatro factores: la carga de la perforadora (A), la rapidez de flujo (B), la velocidad de rotacin (C) y el tipo de lodo de perforacin usado (D). Los datos del experimento se presentan en la figura 6-17. En la figura 6-18 se muestra la grfica de probabilidad normal de las estimaciones de los efectos de este experimento. Con base en esta grfica, los factores B, C y D, junto con las interacciones BC y BD, requieren interpretacin. La figura 6-19 es la grfica de probabilidad normal de los residuales y la fi-

99

5
x ~
I

e
D

95
90

10 20

80

z, 30.
"ii

70

E so o
e

so';
g,;'"
30 20 10

"i 70 :s! :i5 SO


90 95 99

4
Estimacin del efecto

o
Figura 618

Grfica de probabilidad normal de los efectos del ejemplo 63.

258

CAPfTIJLO 6

DISEO FACfORIAL 2"

99

5
o ~ 10

95
90

x
I

;;:... 20

80 70
o o
~...

=.
1ij

30 50

E o
c:

50 '; 30 20 10

~ :s 80

i 70

.21

D..

90 95 99
-2

-1
O
Residuales

Figura 619 Grfica de probabilidad normal de los residuales del ejemplo 6-3.

gura 6-20 es la grfica de los residuales contra la velocidad de avance predicha a partir del modelo que contiene los factores identificados. Hay problemas evidentes con la normalidad y la igualdad de la varanza. Con frecuencia se usa una transformacin de los datos para abordar estos problemas. Puesto que la variable de respuesta es una razn de cambio, la transformacin logartmica parece un candidato razonable.

Figura 6-20 Grfica de los residuales contra la velocidad de avance predicha en el ejemplo 6-3.

6-5 UNA SOLARPLICA DEL DISEO 2k


99

259

B
5
~ 10 x ~.... 20
o

95 90
80

= E
ij
c:

30

70

g
~

50

SO';
30 20 10

....

~ 70
c..

~ 80

90 95
99
O

0.3
0.6
Estimacin del efecto

0.9

1.2

Figura 6-21 Grfica de probabilidad normal de los efectos del ejemplo 6-3 despus de la transformacin logartmica.

En la figura 6-21 se presenta la grfica de probabilidad normal de las estimaciones de los efectos despus de hacer la transformacin y* = lny. Observe que al parecer ahora es posible una interpretacin mucho ms simple, ya que slo los factores B, e y D estn activos. Es decir, expresar los datos en la mtrica correcta ha simplificado su estructura hasta el punto de que las dos interacciones han dejado de requerirse en el modelo explicatorio.

99 5 95 90
80

:= x

10

j";> 20 I 30

=
a;

70

S
c:
"C
al

50

so';
~....

o o

70 :2 :iS 80 90 95

30 20 10

99
~.2

1)

0.1

0.2

Residuales

Figura 6-22 Grfica de probabilidad normal de los residuales del ejemplo 6-3 despus de la transformacin logartmica.

260
0.2

CAPTULO 6 DISEO FACTORIAL Z

0.1

-;;
."

.;
a:

"
'"

'" '"

~.1

O
Velocidad de avance logartmica predicha

Figura 6-23 Grfica de los residuales contra la velocidad predicha para el ejemplo 6-3 despus de la transformacin logartmica.

En las figuras 6-22 y 6-23 se presentan, respectivamente, una grfica de probabilidad normal de los residuales y una grfica de los residuales contra la rapidez de avance predicha para el modelo en la escala logartmica que contiene a B, C y D. Ahora estas grficas son satisfactorias. Se concluye que el modelo y* = lny slo requiere los factoresB, Cy D para una interpretacin adecuada. En la tabla 6-14 se resume el anlisis de varianza de este modelo. La suma de cuadrados del modelo es SS Modelo = SSB +SSc +SSD = 5.345+1.339+0.431

= 7.115
y R = SSModc1jSST = 7.11517.288 = 0.98, por lo que el modelo explica cerca de 98% de la variabilidad de la rapidez de avance de la perforadora.
2

EJEMPLO

6~4

. . . . . . . ,. ,. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

Efectos de localizacin y dispersin en un diseo factorial no replicado


Se corri un diseo 24 en un proceso de manufactura de paneles laterales y ventanas de un avin comercial. Los paneles se hacen en una prensa, y bajo las condiciones actuales es demasiado elevado el nmero
Tabla 6-14 Anlisis de varianza del ejemplo 6-3 despus de la transformacin logartmica

Fuente de variacin B (Flujo) e (Velocidad) D (Lodo)

Suma de cuadrados

5.345
1.339 0.431 0.173 7.288

Error
Total

Grados de libertad 1 1 1 12

Cuadrado medio

ValorP
381.79

5.345
1.339 0.431

<0.0001 95.64 <0.0001

30.79 <0.0001

0.014

15

65 UNA SOLA RPUCA DEL DISEO 2.


Factores Bajo(-)
Alto(+)

261

295 A Temperatura (OF) 7 B - Tiempo de sujecin (min)

326
9

e .. Flujo de resina

D .. TIempo de cierre (s)


D

10 15

20 30

55

6/

lY

J-_I~/
12.5

-15.5

cf
A

Figura 624 Datos del experimento del proceso de los paneles del ejemplo 6-4.

promedio de defectos por panel en una operacin de prensado. (El promedio actual del proceso es 5.5 defectos por panel.) Se investigan cuatro factores utilizando una sola rplica de un diseo 24, en el que cada rplica corresponde a una sola operacin de prensado. Los factores son la temperatura (A), el tiempo de sujecin (B), el flujo de resina (C) y el tiempo de cierre en el prensado (D). En la figura 6-24 se muestran los datos de este experimento. En la figura 6-25 se muestra la grfica de probabilidad normal de los efectos de los factores. Es evidente que los dos efectos ms grandes sonA =5.75 Ye =~.2S. Ningn efecto de los otros factores parece ser tan grande, y A Y e explican cerca de 77% de la variabilidad total, por lo que se concluye que la temperatura (A) baja y el flujo de resina (C) alto reduciran la incidencia de defectos en los paneles. El anlisis residual cuidadoso es un aspecto importante de cualquier experimento. La grfica de probabilidad normal de los residuales no indic anomalas, pero cuando el experimentador grafic los resi99

eA
5 10
o

95 90 80 70 60 30 20 10

~ 20

~~ 30

x
I

1
c:
't>

= 50
70 80 90 95
~

:;~

:c 1l

'"

:f

c.

99

-10

-5

O Efectosde los factores

10

Figura 6-25 Grfica de probabilidad normal de los efectos de los factores para el experimento del proceso de los paneles del ejemplo 6-4.

262
5

CAPTIlLO 6 DISEO FACTORIAL

(j
::l

:ll
O
.~

-o ...

B ~ Tiempo de sujecin

.~

Figura 626 Grfica de los residuales contra el tiempo de sujecin para el ejemplo 6-4.

duales contra cada uno de los factores A a D, la grfica de los residuales contra B (tiempo de sujecin) present el patrn de la figura 6-26. Este factor, que carece de importancia en lo que se refiere al nmero promedio de defectos por panel, es muy importante en su efecto sobre la variabilidad del proceso, con el tiempo de sujecin bajo dando como resultado una variabilidad menor en el nmero promedio de defectos por panel en una operacin de prensado. El efecto de dispersin del tiempo de sujecin tambin es muy evidente en la grfica de cubo de la figura 6-27, donde se grafica el nmero promedio de defectos por panel y el rango del nmero de defectos en cada punto del cubo definido por los factores A, By C. El rango promedio cuando B est en el nivel alto (la cara posterior del cubo de la figura 6-27) es R == 4.75, Ycuando B est en el nivel bajo es RB- == 1.25. Como resultado de este experimento, el ingeniero decidi operar el proceso con la temperatura baja y el flujo de resina alto para reducir el nmero promedio de defectos, con el tiempo de sujecin bajopara reducir la variabilidad en el nmero de defectos por panel, y con el tiempo de cierre en el prensado bajo (el cual no tuvo ningn efecto ni sobre la localizacin ni sobre la dispersin). El nuevo ajuste de las condiciones de operacin produjo un nuevo promedio del proceso de menos de un defecto por panel. Los residuales de un diseo 2k proporcionan mucha informacin acerca del problema bajo estudio. Puesto que los residuales pueden considerarse como los valores observados del ruido o error, con frecuencia ofrecen informacin acerca de la variabilidad del proceso. Puede hacerse el examen sistemtico de los residuales de un diseo 2k no replicado para proporcionar informacin acerca de la variabilidad del proceso.
R~3.5

R-4.5
7.25

20

c= Flujo de resina

R-O.V R=2/ 0.>5 !R_uj'"


R
~ 1

3.25

R-U
9

,,"

10

5.5 ! 295 A
~

-:

5.75 - -

- - -12.25

R... 1.5 =
11.75 I 325

07

B ~ Tiempo de sujecin (min)

Temperatura(F)

Figura 6-27 Grfica de cubo de la temperatura, el tiempo de sujecin y el flujo de resina para el ejemplo 6-4.

Tabla 6.15

Clculo de los efectos de dispersin para el ejemplo 6-4

Corrida
1 2 3 4 5 6 7 8 9
10

A
-

B
-

AB +

C
-

AC +
-

BC + +
-

ABC
-

AV

+
-

+ +
-

+ +

+
-

+ +

BD + +
-

ABD
+ +
-

+ +
-

+
-

+
-

+
-

+ +
-

+ + +

+
-

+ +
-

+
+

+ +
+
-

+
-

+ + + + + +

CD + + + +
-

ACD

BCD
-

+
-

ABCD +

Residual -0.94 -0.69 -2.44 -2.69 -1.19 0.56 -0.19 2.06 0.06 0.81 2.06 3.81 -0.69 -1.44 3.31 -2.44

+ +
-

+
-

+
-

+ +
-

+
-

+ + + +

+
-

+ +
-

+
-

+
-

+
-

11
12 13 14 15 16

+ +
-

+ +

+
+
-

+
-

+ +

+,
-

+ +
-

+
+ +
-

+
-

+ +
-

+
-

+
-

+
2.25 1.85 0.39

+ +
2.72 0.83 2.37

+ +
+
1.91 2.20 -0.28

+
-

+ +
2.28 1.61 0.70

+
-

+
2.21 1.86 0.34

+
1.81 2.24 -0.43

+ +
1.80 2.26 -0.46

+
1.80 2.24 -0.44

+ +
2.24 1.55 0.74

+
+
1.93 1.58 0.40

+
2.05 1.93 0.12

+
1.97 2.11 -0.14

+
1.52 2.16 -0.70

+ +
2.09 1.89 0.28

+
1.61 2.33 -0.74

S(t) SW)

Ft

N 0\ r..,

264

CAPTIJLO 6

DISEO FACTORIAL 2k

Considere la grfica de los residuales de la figura 626. La desviacin estndar de los ocho residuales donde B est en el nivel bajo es S(Ir) = 0.83, Yla desviacin estndar de los ocho residuales donde B est en el nivel alto es S(B+) = 2.72. El estadstico F*
B

=In S2(B+)
S2(B-)

(6-24)

tiene una distribucin aproximadamente normal cuando las dos varianzas cr(B+) y cr(B-) son iguales. Para ilustrar los clculos, el valor de F; es F* =ln S2(B+) B S2(B-)

= In (272)2
(0.83)2

=2.37
En la tabla 6-15 se presenta el conjunto completo de contrastes para el diseo 24 junto con los residuales para cada corrida del experimento del proceso de los paneles del ejemplo 6-4. Cada columna de esta tabla contiene el mismo nmero de signos positivos y negativos, y es posible calcular la desviacin estndar de los residuales de cada grupo de signos en cada columna, por ejemplo, S(i+) y SW), i = 1,2, oo., 15. Entonces S2(i+) r=ln i 1, 2, ... ,15 (6-25) S2(i-)
1

es un estadstico que puede usarse para evaluar la magnitud de los efectos de dispersin del experimento. Si la varianza de los residuales de las corridas donde el factor i es positivo es igual a la varianza de los residuales de las corridas donde el factor i es negativo, entonces F" tiene una distribucin aproximadamente normal. Los valores de P;" se presentan al final de cada columna de la tabla 6-15. La figura 6-28 es la grfica de probabilidad normal de los efectos de dispersin P;" . Evidentemente, B es un factor importante en lo que se refiere a la dispersin del proceso. Para un estudio ms amplio de
0.1

99.9 99

.... x ;:;...

o o

95

=
-j

80
50 20
6

o .s..;
lil

8 ....
x
t:a:,.. .

:c
a..

0.1 0.2 1.2

F" 1
Figura 628 Grfica de probabilidad normal de los efectos de dispersin p,. del ejemplo 6-4.

6-5 UNA SOLA RPLICA DEL DISEO 2t

265

este procedimiento, ver Boxy Meyer [19]y Myers y Montgomery [85a]. Asimismo, para que los residuales del modelo ofrezcan la informacin apropiada acerca de los efectos de dispersin, es necesario especificar correctamente el modelo de Bocalizacin. Referirse al material suplementario del texto de este captulo para mayores detalles y un ejemplo.

EJEMPLO 6- S .

11I

..

iII

11I

11I

..

11I

11I

11I

11I

Mediciones duplicadas de la respuesta


Un equipo de ingenieros en una fbrica de semiconductores realizaron un diseo factorial 24 en un horno de oxidacin vertical. Se "apilan" cuatro obleas en el horno, y la variable de respuesta de inters es el espesor del xido en las obleas. Los cuatro factores del diseo son la temperatura (A), el tiempo (B), la presin (C) y el flujo de gas (D). El experimento se lleva a cabo cargando cuatro obleas en el horno, ajustando las variables del proceso en las condiciones de prueba requeridas por el diseo experimental, procesando las obleas y midiendo despus el espesor del xido en las cuatro obleas. En la tabla 6-16 se presentan el diseo y las mediciones del espesor resultantes. En esta tabla, las cuatro columnas bajo el encabezado "Espesor" contienen las mediciones del espesor del xido de cada oblea individual, y las dos ltimas columnas contienen el promedio muestral y la varianza muestral de las mediciones del espesor en las cuatro obleas de cada corrida. La manera apropiada de analizar este experimento es considerar las mediciones del espesor de las obleas individuales como mediciones duplicadas, y no como rplicas. Si fueran en realidad rplicas, cada oblea se habra procesado individualmente en una sola corrida del horno. Sin embargo, debido a que las cuatro obleas se procesaron en conjunto, recibieron los factores de los tratamientos (es decir, los niveles de las variables del diseo) simultneamente, por 10 que hay mucho menos variabilidad en las mediciones del espesor de las obleas individuales que la que se habra observado si cada oblea fuera una rplica. Por lo tanto, el promedio de las mediciones del espesor es la variable de respuesta correcta que deber considerarse inicialmente. En la tabla 6-17 se muestran las estimaciones de los efectos de este experimento, utilizando el espesor del xido promedio ycomo la variable de respuesta. Observe que los factores A y B Yla interaccinAB tienen efectos grandes que explican en conjunto cerca de 90% de la variabilidad del espesor promedio del
Tabla6-16 El experimento del espesor del xido
Orden estndar Orden de la corrida

e
-1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1

Espesor

S2

1 2 3 4 5 6 7 8 9
10

11

12
13

14 15 16

10 7 3 9 6 2 5 4 12 16 8 1 14 15
11

13

-1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1

-1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1

-1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1

378 415 380 450 375 391 384 426 381 416 371 445 377 391 375 430

376 416 379 446 371 390 385 433 381 420 372 448 377 391 376 430

379 416 382 449 373 388 386 430 375 412 371 443 379 386 376 428

379 417 383 447 369 391 385 431 383 412 370 448 379 400 377 428

378 416 381 448 372 390 385 430 380 415 371 446 378 392 376 429

2 0.67 3.33 3.33 6.67 2 0.67 8.67 12.00 14.67 0.67 6 1.33 34 0.67 1.33

266

CAPTULO 6 DISEO FACTORIAL 2-

Tabla 617 Estimaciones de los efectos del ejemplo 6-5, la variable de respuesta es el espesor promedio del xido Trmino del modelo Estimacin del efecto 43.125 18.125 -10.375 -1.625 16.875 -10.625 1.125 3.875 -3.875 1.125 -0.375 2.875 -0.125 -0.625 0.125 Suma de cuadrados 7439.06 1314.06 430.562 10.5625 1139.06 451.563 5.0625 60.0625 60.0625 5.0625 0.5625 33.0625 0.0625 1.5625 0.0625 Contribucin porcentual 67.9339 12.0001 3.93192 0.0964573 10.402 4.12369 0.046231 0.548494 0.548494 0.046231 0.00513678 0.301929 0.000570753 0.0142688 0.000570753

A B C D

AB AC
AD

BC BD CD ABC ABD ACD BCD ABCD

xido. La figura 629 es una grfica de probabilidad normal de los efectos. Al examinar esta representacin, se concluira que los factores A, By C y las interaccionesAB yAC son importantes. En la tabla 6-18 se muestra el anlisis de varianza de este modelo. El modelo para predecir el espesor promedio del xido es

Y"'" 399.19+ 21.56x +9.06x 2 -5.19x 3 +8.44xx 2 -5.31xx3


El anlisis residual de este modelo es satisfactorio. Los experimentadores estn interesados en obtener un espesor promedio del xido de 400 A, Ylas especificaciones del producto requieren que el espesor sea de entre 390 y 410 . En la figura 6-30 se presentan dos grficas de contorno del espesor promedio, una con el factor C (o x 3 ) , la presin, en el nivel bajo (es decir, x 3 "'" -1) Yla otra con C (o x 3 ) en el nivel alto (es decir, X 3 "'" + 1). Al examinar estas grficas de contorno, es evidente que hay muchas combinaciones del tiempo y la temperatura (factores A y B) que producirn resultados aceptables. Sin embargo, si la presin se mantiene constante en el nivel bajo, la "ventana" de operacin se corre hacia el extremo izquierdo, o ms bajo, del eje del tiempo, indicando que se necesitarn duraciones del ciclo ms cortas para conseguir el espesor del xido deseado. Es interesante observar los resultados que se hubieran obtenido si las mediciones del espesor del xido de las obleas se hubieran considerado incorrectamente como rplicas. En la tabla 6-19 se presenta el anlisis de varianza del modelo completo basado en tratar el experimento como un diseo factorial Z" con rplicas. Observe que hay muchos factores significativos en este anlisis, 10 cual sugiere un modelo mucho ms complejo del que se encontr cuando se utiliz el espesor promedio del xido como la respuesta. La razn de esto es que la estimacin de la varianza del error de la tabla 6-19 es muy pequea ( 2 "'" 6.12). El cuadrado medio de los residuales de la tabla 6-19 refleja la variabilidad entre las obleas dentro de una corrida y la variabilidad entre las corridas. La estimacin del error que se obtiene en la tabla 618 es mucho ms grande, 2 "'" 17.61, Yes principalmente una medida de la variabilidad entre las corridas. sta es la mejor estimacin del error que deber usarse para juzgar la significacin de las variables del proceso que se modifican de una corrida a otra. Una pregunta lgica que podra plantearse es: Zqu dao causa identificar demasiados factores como importantes?, como ciertamente sera el caso en el anlisis incorrecto de la tabla 6-19. La respuesta es que

6-5 UNASOLA RPUCA DEL DISEO 2l

267

29.69
Efecto

43.13

Figura 629 Grficade probabilidadnormal de los efectospara la respuesta del espesor promedio del xido, ejemplo 65. Tabla 6.18 Anlisis de varianza (de Design-Expen) para la respuesta espesor promedio del xido, ejemplo 65 Source Mode! A Sumof Squares DF Mean Squ8re

F
Value

AS AC
Residual CorTotal Std.Oev. Mean

10774.31 7439.06 1314.06 430.56 1139.06 451.56 176.12 10950.44 4.20 399.19 1.05 450.88
Coefficient Estlmate

5 1 1 1 1 1 10 15

2154.86 7439.06 1314.06 430.56 1139.06 451.56 17.61

122.35 422.37 74.61 24.45 64.67 25.64

Prob> F <0.000 <0.000 <0.000 0.0006 <0.000 0.0005

C.V.
PRESS

R-Squared Adj. R-Squared Pred. R-Squared Adeq. Precision Standard Error

0.9839 0.9759 0.9588 27.967


95%CI Low 95%CI

Factor Intercept ATime B-Temp CPressure

DF
1 1 1 1 1 1

Hlgh
401.53 -_. 23.90: 11.40 -2.85: 10.78 -2.97

AS
AC

399.19 21.56 9.06 -5.19 8.44 -5.31

1.05 1.05 1.05 1.05 1.05 1,05

396.85 19.22 6.72 -7.53 6.10 -7.65

--------- -- - - - - - - - - - - - - - - - - - - - - - - - - - -

268

CAPTULO 6 DISEOFACfORIAL 2'

1.00 I'""T'"--.,....---,r----.---,.--~~---___,

0.50

:::l

E ~

!. 0.00

380

-0.50

-1.00 L_--L_ _-L._--'-_ _..J-_""''_ _L-_....Jo._.....J -1.00 -0.50


Tiempo
(a)x 3 ~-1

1.00l'"T'----r---....----r-----.r---,

0.50

f :::l 1i

t-

0 00 .

-0.50

_1.ooL--_~....L.

--...IL_

~....;::,

......_ - - - . I

-1.00

-0.50

0.00
Tiempo
(b)x 3 = +1

1.00

Figura 6-30 Grficas de contorno del espesor promedio del xido con la presin (X3) mantenida constante.

intentar manipular u optimizar los factores que no son importantes sera un desperdicio de recursos, y podra resultar en agregar variabilidad innecesaria a otras respuestas de inters. Cuando se hacen mediciones duplicadas de la respuesta, casi siempre hay informacin til acerca de algn aspecto de la variabilidad del proceso contenida en estas observaciones. Por ejemplo, si lasmediciones duplicadas son pruebas mltiples hechas con un instrumento de medicin en la misma unidad ex-

6-5 UNASOLA RPLICA DEL DISEO 2t


Thbla 6.19

269

Anlisis de varianza (de Design-Expert) de la respuesta individual del espesor del xido de las obleas

Source Model

Sumof Squar.

DF

Mean $quare 2920.12 29756.25 5256.25 1722.25 42.25 4556.25 1806.25 20.25 240.25 240.25 20.25 132.25 2.25 0.25 6.25 0.25 6.12

F Velue

Prob> F

A C D AS AC AD BC SD CD ABD ASC ACD BCD ABCD


Residual Lack ofFit Pure Error Coro Total

43801.75 29756.25 5256.25 1722.25 42.25 4556.25 1806.25 20.25 240.25 240.25 20.25 132.25 2.25 0.25 6.25 0.25 294.00 0.000 294.00 44096.76

15 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
48

476.75 4858.16 858.16 281.18 6.90 743.88 294.90 3.31 39.22 39.22 3.31 21.59 0.37 0.041 1.02 0.041

<0.0001 <0.0001 <0.0001 <0.0001 0.0115 <0.0001 <0.0001 0.0753 <0.0001 <0.0001 0.0753 <0.0001 0.5473 0.8407 0.3175 0.8407

O
48

6.13

63

perimental, entonces las mediciones duplicadas proporcionan cierta informacin acerca de la eficiencia del instrumento de medicin. Si las mediciones duplicadas se hacen en diferentes lugares dentro de una unidad experimental, pueden brindar cierta informacin acerca de la uniformidad de la variable de respuesta en esa unidad. En el ejemplo tratado aqu, ya que se tiene una observacin en cada una de cuatro unidades experimentales que se han sometido a un procesamiento conjunto, se tiene cierta informacin acerca de la variabilidad dentro de las corridas del proceso. Esta informacin se encuentra contenida en la varianza de las mediciones del espesor del xido de las cuatro obleas de cada corrida. Sera de inters determinar si alguna de las variables del proceso influye en la variabilidad al interior de las corridas. .La figura 6-31 es una grfica de probabilidad normal de las estimaciones de los efectos obtenidas utilizando ln(s2) como la respuesta. Recuerde que en el captulo 3 se indic que la transformacin logartmica es por lo general apropiada para modelar la variabilidad. No hay ningn efecto individual fuerte, pero el factor A y la interaccin BD son los ms grandes. Si se incluyen tambin los efectos principales de By D para obtener un modelo jerrquico, entonces el modelo de ln(S2) es

/i--)= 1.08+0.4lx1 ln(s

OAOx 2 +O.20x 4 - O.56x 2 X 4

El modelo explica apenas poco menos de la mitad de la variabilidad en la respuesta In(s2), lo cual desde luego no es nada espectacular para un modelo emprico, pero con frecuencia es dificil obtener modelos excepcionalmente buenos de las varianzas. La figura 6-32 es una grfica de contorno de la varianza predicha (no del logaritmo de la varianza predicha) con la presinz, en el nivel bajo (recuerde que con esto se minimiza la duracin del ciclo) y el flujo de gasx, en el nivel alto. Esta eleccin del flujo de gas produce los valores mnimos de la varianza predicha en la regin de la grfica de contorno. En este caso, los experimentadores se enfocaron en seleccionar valores de las variables de diseo que dieran un espesor medio del xido dentro de las especificaciones del proceso y tan cerca de 400 A como fuera posible, haciendo al mismo tiempo que la variabilidad dentro de las corridas sea pequefta, por ejemplo S2 s 2...

270

CAPfTIJLO 6 DISEO FACfORIALIk

99

95 90
1ij

E o
e

80 70 50 30 20 10 5

i.,
"O

.a

'1ft

-1.12

BD

-o,15
Efecto

0.34

0.82

Ftgura631 Grfica de probabilidad normal de los efectos utilizando In (SZ) como la respuesta, ejemplo 6-5.
1.00';-',--------::0,....;.;,;..;;;..;;;;..-------::;1-..,

-1.00 l-_~::......L.. -1.00

---'L..-~;....__...L..

--J

0.00
TIempo

0.50

1.00

Figura 632 Grfica de contorno de S2 (variabilidad dentro de las corridas) con la presin en el nivel bajo y el flujo de gas en el nivel alto.

66 ADICIN DEPUNTOSCENTRALES EN ELDISEO Z'

271

-0.&0

0.00 Tiempo

Figura 633 Superposicin del espesor promedio del xido y las respuestas s' con la presin en el nivel bajo y el flujo de gas en el nivel alto.

Una manera posible de encontrar un conjunto de condiciones adecuado es superponiendo las grficas de contorno de las figuras 630 y 6-32. La grfica de la superposicin se muestra en la figura 6-33, con las especificaciones del espesor medio del xido y la restriccin :5; 2 indicadas como contornos. En esta grfica, la presin se mantiene constante en el nivel bajo y el flujo de gas se mantiene constante en el nivel alto. La regin no sombreada cerca de la parte central izquierda de la grfica identifica una regin factible para las variables tiempo y temperatura. ste es un ejemplo simple del uso de las grficas de contorno para estudiar dos respuestas simultneamente. Este problema se analizar con mayor detalle en el captulo 11.

41 41

111

111

41

41 41

*' *' *' *'

111

41

*' *'

111

111

111

111

6..6

ADICIN DE PUNTOS CENTRALES EN EL DISEO 2k

Una preocupacin potencial en el uso de diseos factoriales de dos niveles es el supuesto de la linealidad de los efectos de los factores. Desde luego, no es necesaria la linealidad perfecta, y el sistema 2k funcionar bastante bien incluso cuando el supuesto de linealidad sea vlido slo de manera muy aproximada. De hecho, se ha sealado ya que si se agregan los trminos de interaccin a un modelo de los efectos principales o de primer orden, de donde se obtiene
Y=

/30 + L /3X + LL /3;xx +e


mI

(6-26)

entonces se tiene un modelo con la capacidad de representar cierta curvatura en la funcin de respuesta. Esta curvatura, desde luego, es resultado del torcimiento del plano inducido por los trminos de nteraccin /3;riX'

272

CAPrruLO 6 DISEOFACTORIAL2k

Habr situaciones en que la curvatura de la funcin de respuesta no est modelada adecuadamente por la ecuacin 6-26. En tales casos, un modelo lgico por considerar es y= Po +

j~l

PjX j +

i<j

PijXiX j +

j~l

PjjXJ +e

(6-27)

donde laspjj representan efectos cuadrticos o de segundo orden puros. Ala ecuacin 6-27 se le llama IDO delo de superficie de respuesta de segundo orden. Cuando se realiza un experimento factorial de dos niveles, por lo general se anticipa el ajuste del modelo de primer orden de la ecuacin 6-26, pero deber estarse alerta ante la posibilidad de que el modelo de segundo orden de la ecuacin 627 sea en realidad ms apropiado. Existe un mtodo para hacer una rplica de ciertos puntos de un diseo factorlal Z" que ofrecer proteccin contra la curvatura de los efectos de segundo orden a la vez que permitir una estimacin independiente del error que va a obtenerse. El mtodo consiste en agregar puntos centrales en el diseo 2k. stos consisten en n rplicas que se corren en los puntos Xi = O(i = 1, 2, ..., k). Una razn importante para agregar rplicas de las corridas en el centro del diseo es que los puntos centrales no afectan las estimaciones usuales de los efectos en un diseo 2k Cuando se agregan puntos centrales, se supone que los k factores son cuantitativos. Para ilustrar este enfoque, considere un diseo 22 con una observacin en cada uno de los puntos factoriales (-,-), (+,-), (-, +)y (+, + ),y n e observaciones en el punto central (O, O). En la figura 6-34se ilustra la situacin. Sea YF el promedio de las cuatro corridas en los cuatro puntos factoriales y sea Ye el promedio de las n corridas en el punto central. Si la diferencia YF - Ye es pequea, entonces los puntos e centrales caen en el plano (o cerca de l) que pasa por los puntos factoriales, y no hay curvatura cuadrtica. Por otra parte, si YF -Ye es grande, entonces est presente una curvatura cuadrtica. La suma de cuadrados de la curvatura cuadrtica pura con un solo grado de libertad est dada por

SS

Cuadrtica pura -

_ nFne O'F - Jc )2 n +n
F

(6-28)

donde, en general, nF es el nmero de puntos del diseo factorial. Esta cantidad puede compararse con el cuadrado medio del error para probar la curvatura cuadrtica pura. Ms especficamente, cuando se
y

Figura 634 Diseo 2' con puntos centrales.

66 ADICIN DEPUNTOS CENTRALES ENEL DISEO 21

273

agregan puntos en el centro del diseo 2k , con la prueba de la curvatura (utilizando la ecuacin 6-28) en realidad se prueban las hiptesis
k

Ho:L Pjj =0
Jm 1

H1:

L Pjj
J-l

'#

Adems, si los puntos factoriales del diseo no tienen rplicas, pueden usarse los n puntos centrales para construir una estimacin del error con n - 1 grados de libertad.

Ej'EMPW 6-6 .

111

111

111

111

111

111

".

111

Un ingeniero qumico estudia el rendimiento de un proceso. Hay dos variables de inters, el tiempo de reaccin y la temperatura de reaccin. Debido a que no se tiene la seguridad sobre el supuesto de linealidad en la regin de exploracin, el ingeniero decide realizar un diseo factorial 22 (con una sola rplica de cada corrida factorial) aumentando con cinco puntos centrales. El diseo y los datos del rendimiento se muestran en la figura 6-35. En la tabla 6-20 se resume el anlisis de varianza de este experimento. El cuadrado medio del error se calcula a partir de los puntos centrales de la siguiente manera:

MS = SSE E n-1 e

=;.:Pun::::IOo=::::_= .....
Por lo tanto, por la tabla 6-20,

MS = ..:.:i"':.:.l
E

(Yi - 40.46)2
_

0.1720 =-4

= 0.0430
40.0 160 41.5

E
e :::>
ti 8.
~
11

156

ll:l

160

-1
I

39.3
-1
I
30

r
40.5 40.7 40.2 40.6

40.9
I

o
35

+1
40

A '" Tiempo de reaccin (min)

Figura 6-35 El diseo 22 con cinco puntos centrales para el ejemplo 6-6.

274

CAPTULO 6 DISEO FACfORIAL 2k

Tabla 6-20 Anlisis de varianza del ejemplo 6-6 Fuente de Suma de Grados de variacin cuadrados libertad

Cuadrado inedia 2.4025 0.4225 0.0025 0.0027 0.0430

Fo
55.87 9.83 0.06 0.06

ValorP 0.0017 0.0350 0.8185 0.8185

A (Tiempo) B (Temperatura)
AB Cuadrtica pura Error lbtal

2.4025 0.4225 0.0025 0.0027 0.1720 3.0022

1 1 1 1 4 8

El promedio de los puntos de la parte factorial del diseo es yp 40.425, Yel promedio de los puntos situados en el centro eSYe = 40.46. La diferenciaYp-Ye = 40.425 -40.46 = -0.035 parece ser pequea. La suma de cuadrados de la curvatura cuadrtica pura de la tabla del anlisis de varianza se calcula con la ecuacin 628 de la siguiente manera:

SS

_ npne (:rp Cuadrtica pun -

np + n e

:re )2

(4)(5)(-0.035)2 4+5 = 0.0027 El anlisis de varianza indica que ambos factores tienen efectos principales significativos, que no existe interaccin, y que no hay evidencia de curvatura de segundo orden en la respuesta en la regin de exploracin. Es decir, la hiptesis nula Ho: Pll + P22 = O no puede rechazarse.
.. 11I 11I 11I

*'

11I

..

En el ejemplo 6-6 se lleg a la conclusin de que no haba indicios de efectos cuadrticos; es decir, un modelo de primer orden

y= Po +P1X1+P2X 2 +P12 X1X2 +e


es apropiado (aun cuando probablemente no se necesite el trmino de la interaccin). Habr situaciones en las que se necesitarn los trminos cuadrticos. Es decir, se tendr que suponer entonces un modelo de segundo orden tal como

y= Po +P1X1+P2X2 +{312 xl x2 +Pux +{322 x; +e


Desafortunadamente, los parmetros desconocidos (las P) de este modelo no pueden estimarse, ya que hay seis parmetros por estimar y el diseo 22 ms los puntos centrales de la figura 6-35 slo tienen cinco corridas independientes. Una solucin simple y de gran efectividad de este problema es aumentar el diseo 22 con cuatro corridas axiales, como se ilustra en la figura 6-360. El diseo resultante, llamado dseo central compuesto, puede usarse entonces para ajustar el modelo de segundo orden. En la figura 6-36b se muestra un diseo central compuesto para k = 3- factores. Este diseo tiene 14 + n e corridas (generalmente 3 S n e S 5), y es un diseo muy eficiente para ajustar el modelo de segundo orden con 10 parmetros en k = 3 factores. Los diseos compuestos centrales se usan ampliamente para construir modelos de superficie de respuesta de segundo orden. Estos diseos se estudiarn con mayor detalle en el captulo 11.

6-6 ADICIN DEPUNTOS CENTRALES EN EL DISEO 2

275

-~f--"""-+---

%1

--1-~r."..:;"'I--+-- %1

al

Dos factores

b) Tres factores

Figura 6-36 Diseiios centrales compuestos.

Se concluye esta seccin con algunas sugerencias y observaciones adicionales tiles referentes al uso de puntos centrales. 1. Cuando un experimento factorial se lleva a cabo en un proceso en marcha, considere utilizar las condiciones de operacin actuales (o de receta) como el punto central del diseo. Esto con frecuencia le asegura al personal de operacin que al menos una parte de las corridas del experimento van a realizarse bajo condiciones familiares, y por lo tanto es improbable que los resultados obtenidos (por lo menos para estas corridas) sean peores que los que se obtienen tpicamente. 2. Cuando el punto central de un experimento factorial corresponde con las condiciones de operacin actuales, el experimentador puede usar las respuestas observadas en el punto central para proporcionar una verificacin aproximada de si algo "inusual" ocurri durante el experimento. Es decir, las respuestas del punto central debern ser muy similares a las respuestas observadas histricamente en la operacin rutinaria del proceso. Con frecuencia el personal de operacin llevar una carta de control para monitorear el desempeo del proceso. En ocasiones las respuestas de los puntos centrales pueden graficarse directamente en la carta de control como una verificacin de la forma en que estuvo operando el proceso durante el experimento. 3. Considere correr las rplicas del punto central en orden no aleatorio. Especficamente, debern correrse uno o dos puntos centrales en o cerca del principio del experimente, uno o dos cerca de la parte media, y uno o dos cerca del final, Al separar los puntos centrales en el tiempo, el experimentador tiene una verificacin aproximada de la estabilidad del proceso durante el experimento. Por ejemplo, si ha ocurrido una tendencia en la respuesta mientras se realizaba el experimento, graficar las respuestas de los puntos centrales contra el tiempo puede poner de manifiesto esta situacin. 4. En ocasiones los experimentos tienen que realizarse en situaciones en las que la informacin previa acerca de la variabilidad del proceso es escasa o nula. En estos casos, correr dos o tres puntos centrales como las primeras corridas en el experimento puede ser de suma utilidad. Estas corridas pueden proporcionar una estimacin preliminar de la variabilidad. Si la magnitud de la variabilidad parece razonable, se contina; por otra parte, si la variabilidad observada es mayor que la anticipada (io que la razonable!), habr que detenerse. Con frecuencia es muy provechoso estudiar la cuestin de por qu es tan grande la variabilidad antes de proceder con el resto del experimento. 5. Generalmente, se utilizan puntos centrales cuando todos los factores del diseo son cuantitativos. Sin embargo, en ocasiones habr una o ms variables cualitativas o categricas y varias cuan-

276

CAPTULO 6 0I5ENOFACTORlAL2k

---:,
I I

.>
o

I
I

I I
I

,
, , ,.
I
I

I I I I

.a
!

i!!

I I
I

t-.
~ ~\BI<'~.
Tipo de catalizador

--------~---------------

-------

Figura 637 Un diseo 23 con un factor cualitativo y puntos centrales.

titativas. Sigue siendo posible emplear los puntos centrales en estos casos. Para ilustrar este punto, considere un experimento con dos factores cuantitativos, el tiempo y la temperatura, cada uno con dos niveles, y un solo factor cualitativo, el tipo de catalizador, tambin con dos niveles (orgnico e inorgnico). En la figura 6-37 se muestra el diseo 23 para estos factores. Observe que los puntos centrales se colocan en las caras opuestas del cubo que incluyen los factores cuantitativos. En otras palabras, los puntos centrales pueden correrse con las combinaciones de los tratamientos en los niveles alto y bajo de los factores cualitativos, siempre y cuando esos subespacios incluyan nicamente factores cuantitativos.
6~7

PROBLEMAS
Un ingeniero est interesado en los efectos de la velocidad de corte (A), la geometra de la herramienta (B) y el ngulo de corte (C) sobre la vida (en horas) de una mquina herramienta. Se eligen dos niveles de cada factor y se corren tres rplicas de un diseo factorial 23. Los resultados fueron los siguientes:

6-1.

Combinacin de tratamientos

Rplica I

11

III
25

+ + + +

+ + + +

(1) a b ab

+ + + +

ae be abe

22 32 35 55 44 40 60 39

31 43 34 47 45 37 50 41

29 50 46 38 36 54 47

6-2.

a) Estimar los efectos de los factores. Qu efectos parecen ser grandes? b) Usar el anlisis de varianza para confirmar las conclusiones del inciso a. c) Escribir un modelo de regresin para predecirla vida de la herramienta (en horas) con base en los resultados de este experimento. d) Analizar los residuales. Hay algn problema evidente? e) Con base en el anlisis de las grficas de los efectos principales y las interacciones, cules seran los niveles de A, B y e que se recomendara utilizar? Considere nuevamente el inciso e del problema 6-1. Utilizar el modelo de regresin para generar las grficas de la superficie de respuesta y de contorno de la respuesta, la vida de la herramienta. Interpretar estas grficas. Ofrecen alguna idea respecto de las condiciones de operacin deseables para este proceso?

6-7 PROBLEMAS

277

Encontrar el error estndar de los efectos de los factores y aproximar los lmites de confianza de 95% para los efectos de los factores en el problema 6-1. Los resultados de este anlisis concuerdan con las conclusiones del anlisis de varianza? 6-4. Representar los efectos de los factores del problema 6-1 en una grfica relativa a una distribucin t escalada apropiadamente. En esta representacin grfica se identifican de manera adecuada los factores importantes? Comparar las conclusiones de esta grfica con los resultados del anlisis de varianza. 6-5. Se usa una mquina para hacer ranuras de localizacin en una tarjeta de circuitos impresos. El nivel de vibracin en la superficie de la tarjeta cuando se hacen las ranuras se considera una fuente principal de variacin dimensional de las ranuras. Se piensa que dos factores influyen en la vibracin: el tamao de las ranuras (A) Y la velocidad de corte (B). Se seleccionan dos tamaos de las ranuras (ky de pulgada) y dos velocidades (40 y 90 rpm), y se hacen ranuras en cuatro tarjetas con cada conjunto de condiciones que se muestran abajo. La variable de respuesta es la vibracin medida como el vector resultante de tres acelermetros (x,y yz) en cada tarjeta de prueba. Combinacin de tratamientos (1) Rplica
1

6-3.

TI

III

IV 14.4 22.5 14.2 39.9

+ +

+ +

a b ab

18.2 27.2 15.9 41.0

18.9 24.0 14.5 43.9

12.9 22.4 15.1 36.3

a) Analizar los datos de este experimento.

b) Construir una grfica de probabilidad normal de los residuales, y graficar los residuales contra el nivel de vibracin predicho. Jlnterpretar estas grficas. . e) Hacer la grfica de la interaccinAB. Interpretar esta grfica. Qu niveles del tamao de las ranuras y la velocidad se recomendaran para la operacin rutinaria? 66. Considere nuevamente el experimento descrito en el problema 6-1. Suponga que el experimentador efectu nicamente ocho ensayos de la rplica 1.Adems, corri cuatro puntos centrales y obtuvo los siguientes valores de la respuesta: 36, 40, 43, 45. a) Estimar los efectos de los factores. Qu efectos son grandes? b) Efectuar un anlisis de varianza, incluyendo una verificacin de la curvatura cuadrtica pura. A qu conclusiones se llega? e) Escribir un modelo apropiado para predecir la vida de la herramienta, con base en los resultados de este experimento. Este modelo difiere en alguna forma sustancial del modelo del problema 6-1, inciso e? d) Analizar los residuales. e) A qu conclusiones se llegara acerca de las condiciones de operacin apropiadas para este proceso? 6-7. Se Ilev a cabo un experimento para mejorar el rendimiento de un proceso qumico. Se seleccionaron cuatro factores y se corrieron dos rplicas de un experimento completamente aleatorizado. Los resultados se presentan en la tabla siguiente:

Combinacin de tratamientos (1)

Rplica 1 TI 90 74 81 83 77 81 88 73 93 78 85 80 78 80 82 70

Combinacin de tratamientos

a b ab
e

ae be abe

d ad bd abd ed aed bcd abed

Rplica 1 TI 98 95 72 76 87 83 85 86 99 90 79 75 87 84 80 80

278

CAPTIJLO 6 DISEO FACTORIAL 2~

6-8.

a) Estimar los efectos de los factores. b) Construir la tabla del anlisis de varianza y determinar cules factores son importantes para explicar el rendimiento. e) Escribir un modelo de regresin para predecir el rendimiento, suponiendo que los cuatro factores se hicieron variar en el rango de -1 a + 1 (en unidades codificadas). d) Graficar los residuales contra el rendimiento predicho y en una escala de probabilidad normal. El anlisis residual parece ser satisfactorio? e) Dos interacciones de tres factores,ABC y ABD, aparentemente tienen efectos grandes. 'Irazar una grfica de cubo en los factores A, By C con los rendimientos promedio indicados en cada vrtice. Repetir 10 anterior utilizando los factores A, B y D. Estas dos grficas ayudan en la interpretacin de los datos? Dnde se recomendara que se corriera el proceso con respecto a las cuatro variables? Un bacterilogo est interesado en los efectos de dos medios de cultivo diferentes y dos tiempos diferentes sobre el crecimiento de un virus particular. Realiza seis rplicas de un diseo 22, haciendo las corridas de manera aleatoria. Analizar los datos del crecimiento viral que se presentan enseguida y sacar las conclusiones apropiadas. Analizar los residuales y comentar la adecuacin del modelo.

Medio de cultivo Tiempo,h 12 21 23 20 37 38 35 1 22 28 26 39 38 36 25 24 29 31 29 30 2 26 25 27 34 33 35

18

6-9.

Un ingeniero industrial empleado por una compaa refresquera est interesado en los efectos de dos diferentes tipos de botellas de 32 onzas sobre el tiempo de entrega de cajas de 12 botellas del producto. Los dos tipos de botellas son de vidrio y de plstico. Se usan dos empleados para realizar una tarea que consiste en mover 40 cajas del producto 50 pies en una plataforma de carga estndar y acomodarlas en un estante de venta. Se hacen cuatro rplicas de un diseo factorial 2 2 y los tiempos observados se enlistan en la siguiente tabla. Analizar los datos y sacar las conclusiones apropiadas. Analizar los residuales y comentar la adecuacin del modelo.

Empleado Tipo de botella Vidrio Plstico 5.12 4.98 4.95 4.27 1 4.89 5.00 4.95 4.25 6.65 5.49 5.28 4.75 2 6.24 5.55 4.91 4.71

6-10.

En el problema 6-9, el ingeniero tambin estuvo interesado en las diferencias en la fatiga potencial que resulta de los tipos de botellas. Como una medida de la cantidad de esfuerzo requerido, midi el aumento del ritmo cardiaco (pulso) inducido por la tarea. Los resultados se presentan a continuacin. Analizar los datos y sacar conclusiones. Analizar tos residuales y comentar la adecuacin del modelo.

6-7 PROBLEMAS

279

Empleado Tipo de botella Vidrio Plstico 39 58 44 42 1 45 35 35 21 20 16 13 16 2 13 11 10 15

6-11. 6-12.

Calcular los lmites de confianza aproximados para los efectos de los factores del problema 610. Los resultados de este anlisis concuerdan con el anlisis de varianza realizado en el problema 6-1O? En un artculo deAT&T TechnicalJoumal (vol. 65, pp. 39-50) se describe la aplicacin de diseos factoriales de dos niveles en la fabricacin de circuitos integrados. Un paso bsico del procesamiento es hacer crecer una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el interior de una campana de cristal y se introducen vapores qumicos. El susceptor se hace girar y se aplica calor hasta que la capa epitaxial tiene el espesor suficiente. Se corri un experimento utilizando dos factores: rapidez de flujo de arsnico (A) Ytiempo de deposicin (B). Se corrieron cuatro rplicas y se midi el espesor de la capa epitaxial (en .um). Los datos se muestran a continuacin:

Rplica A

Niveles de factores III IV 13.907 13.914 14.878 14.932 A Bajo (-) 55% Corto (10 min) Alto (+) 59% Largo (15 min)

I 14.037 13.880 14.821 14.888

11
16.165 13.860 14.757 14.921

+ + + +

13.972 14.032 14.843 14.415

6-13.

614.
6-15.

a) Estimar los efectos de los factores. b) Conducir un anlisis de varianza. Qu factores son importantes? c) Escribir una ecuacin de regresin que podra usarse para predecir el espesor de la capa epitaxial en la regin de la velocidad de flujo del arsnico y el tiempo de deposicin utilizado en este experimento. d) Analizar los residuales. Se observa algn residual que debiera causar preocupacin? e) Comentar la forma en que se podra resolver el punto atpico potencial encontrado en el inciso d. Continuacin delproblemtl 612. Usar el modelo de regresin del inciso e del problema 6-12 para generar una grfica de contorno de la superficie de respuesta para el espesor epitaxial. Suponga que es de importancia crtica obtener un espesor de la capa de 14.5 /-lm. Qu ajustes de la velocidad de flujo del arsnico y del tiempo de deposicin se recomendaran? Continuacin delproblemtl 613. En qu forma cambiara la respuesta dada en el problema 6-13 si la velocidad de flujo del arsnico fuera ms difcil de controlar en el proceso que el tiempo de deposicin? Se utiliza una aleacin de nquel y titanio para fabricar componentes de los motores de turbina de aviones. La formacin de fisuras es un problema potencialmente serio de las piezas terminadas, ya que pueden provocar fallas irreversibles. Se realiza una prueba de las piezas para determinar el efecto de cuatro factores sobre las fisuras. Los cuatro factores son la temperatura de vaciado (A), el contenido de titanio (B), el mtodo de tratamiento trmico (C) y la cantidad de refinador de grano usada (D). Se hacen dos rplicas de un diseo 24 y se mide la longitud de las fisuras (en mm x 10-2) inducidas en un ejemplar de prueba de muestra sometido a una prueba estndar. Los datos se muestran en la siguiente tabla:

280

CAPTULO 6 DISEO FAcrORIAL 2k

Combinacin de tratamientos
(1)

Rplica I
7.037 14.707 11.635 17.273 10.403 4.368 9.360 13.440 8.561 16.867 13.876 19.824 11.846 6.125 11.190 15.653

11
6.376 15.219 12.089 17.815 10.151 4.098 9.253 12.923 8.951 17.052 13.658 19.639 12.337 5.904 10.935 15.053

+
+ +

+ +
+

a b ab

+
+

+
+ + +

+ +

+ + +

+
+

+
+ + + + +

+ + + + +

ae be abe d ad bd abd ed aed bed abed

a) Estimar los efectos de los factores. Qu efectos de los factores parecen ser grandes? b) Conducir un anlisis de varianza. Alguno de los factores afecta la formacin de fisuras? Utilizar a '= 0.05. e) Escribir un modelo de regresin que pueda usarse para predecir la longitud de las fisuras como una funcin de los efectos principales y las interacciones significativas que se han identificado en el inciso b. d) Analizar los residuales de este experimento. e) Hay algn indicio de que alguno de los factores afecte la variabilidad de la formacin de fisuras? f) Qu recomendaciones se haran respecto de las operaciones del proceso? Utilizar grficas de las interacciones y/o de los efectos principales como ayuda para sacar conclusiones. 6-16. Continuaci6n del problema 6-15. Una de las variables del experimento descrito en el problema 6-15, el mtodo de tratamiento trmico (C), es una variable categrica. Suponga que los dems factores son continuos. a) Escribir dos modelos de regresin para predecir la longitud de las fisuras, uno para cada nivel de la variable mtodo de tratamiento trmico. Qu diferencias, en caso de haberlas, se observan en estas dos ecuaciones? b) Generar las grficas de contorno apropiadas de la superficie de respuesta para los dos modelos de regresin del inciso a. e) Qu conjunto de condiciones se recomendara para los factores A, By D si se utiliza el mtodo de tratamiento trmico C '= +? d) Repetir el inciso e suponiendo que quiere usarse el mtodo de tratamiento trmico C = -. 6~ 17. Un experimentador corre una sola rplica de un diseo 24 Se calcularon las siguientes estimaciones de los efectos:

A'= 76.95
B = -67.52 C = -7.84 D = -18.73

AB = -51.32 AC = 11.69 AD = 9.78 BC = 20.78

BD'= 14.74 CD'= 1.27

ABD = -6.50 ACD = 10.20 BCD = -7.98 ABCD = -6.25

ABC

'=

-2.82

a) Construir una grfica de probabilidad normal de estos efectos. b) Identificar un modelo tentativo, con base en la grfica de los efectos del inciso a.

67 PROBLEMAS

281

6-18.

En un artculo de Salid State Technology ("Diseo ortogonal para optimizacin de procesos y su aplicacin en el grabado qumico con plasma") se describe la aplicacin de diseos factoriales en el desarrollo de un proceso de grabado qumico con nitrurosen un dispositivo de grabado qumico con plasma para una sola oblea. El proceso usa C:zF como gas de reaccin. Cuatro factores son de inters: el entrehierro nodo-ctodo (A), la presin en la cmara delreactor (B), el flujo del gas C 2F6 (C) y la potencia aplicada al ctodo (D). La respuesta de inters es la rapidez de grabado para el nitruro de silicio. Se corre una sola rplica de un diseo 24; los datos se muestran enseguida:

Nmero de Orden real de corrida la corrida 1 13 2 8 12 3 4 9 5 4 15 6 16 7 8 3 1 9 14 10 11 5 10 12 13 11 14 2 7 15 6 16

+ + + + + + + + + + + + + + + + + +

+ +
+ + + +

+
+

+
+ +

+ +
+

Rapidez de grabado Niveles de los factores (lmin) Bajo (-) Alto (+) A (cm) 1.20 550 0.80 B (m'Iorr) 450 550 669 604 C(SCCM) 125 200 650 275 D(W) 325 633 642 601 635 1037 749 1052 868 1075 860 1063 729

a) Estimar los efectos de los factores. Considere una grfica de probabilidad normal de los efectos de los factores. Qu efectos parecen ser grandes? b) Efectuar un anlisis de varianza para confirmar los resultados obtenidos en el inciso a. e) Cul es el modelo de regresin que relaciona la rapidez de grabado con las variables significativas del proceso? d) Analizar los residuales de este experimento. Comentar la adecuacin del modelo. e) Si no todos los factores son importantes, hacer la proyeccin del diseo 24 en un diseo 2k con k < 4 y conducir el anlisis de varianza. /) Trazar grficas para interpretar cualquier interaccin significativa. g) Graficar los residuales contra el orden real de las corridas. Qu problemas podran ponerse de manifiesto en esta grfica? 6-19. Continuacin delproblema 6-18. Considere el modelo de regresin obtenido en el inciso e del problema 6-18. a) Construir las grficas de contorno de la rapidez de grabado utilizando este modelo. b) Suponga que fuera necesario operar este proceso con una rapidez de 800 lmin. Cules seran los ajustes de las variables del proceso que se recomendaran? 6-20. Considere la rplica nica del diseo 24 del ejemplo 6-2. Suponga que se decidi arbitrariamente analizar los datos suponiendo que las interacciones de tres y cuatro factores eran insignificantes. Conducir este anlisis y comparar los resultados con los que se obtuvieron en el ejemplo. Piensa el lector que es una buena idea suponer de manera arbitraria que las interacciones son insignificantes incluso cuando sean de orden relativamente alto? 6-21. Se realiz un experimento en una fbrica de semiconductores en un esfuerzo para incrementar el rendimiento. Se estudiaron cinco factores, cada uno con dos niveles. Los factores (y los niveles) fueron: A = ajuste de apertura (pequea, grande), B = tiempo de exposicin (20% abajo del nominal, 20% arriba del nominal),

282

CAPTULO 6 DISENO FACTORIAL 2"

C = tiempo de desarrollo (30 s, 45 s), D = tamao de la mscara (pequea, grande) yE = tiempo de grabado (14.5 min, 15.5 min), Se corri el diseo 25 no replicado que se muestra a continuacin. (1) = 7 a=9 b = 34 ab = 55 e = 16 ae = 20 be = 40 abe =60
d=8 ad = 10 bd = 32 abd = 50 ed = 18 aed = 21 bed = 44 abed = 61 e=8 ae = 12 be = 35 abe = 52 ce = 15 aee = 22 bee = 45 abee = 65 de = 6 ade = 10 bde = 30 abde = 53 ede = 15 aede = 20 bede = 41 abede= 63

a) Construir una grfica de probabilidad normal de las estimaciones de los efectos. Qu efectos parecen ser grandes? b) Efectuar un anlisis de varianza para confirmar los resultados obtenidos en el inciso a. e) Escribir el modelo de regresin que relacione el rendimiento con las variables significativas del proceso. d) Graficar los residuales en papel probabilidad normal. La grfica es satisfactoria? e) Graficar los residuales contra los rendimientos predichos y contra cada uno de los cinco factores. Comentar las grficas. f) Interpretar cualquier interaccin significativa. g) Qu recomendaciones se haran respecto de las condiciones de operacin del proceso? h) Hacer la proyeccin del diseo 25 de este problema en un diseo 2k en los factores importantes. Esquematizar el diseo e indicar el promedio y el rango de los rendimientos en cada corrida. Es de ayuda este esquema para interpretar los resultados de este experimento? 6-22. Continuaci6n delproblema 621. Suponga que el experimentador corri cuatro puntos centrales adems de los 32 ensayos del experimento original. Los rendimientos obtenidos en las corridas de los puntos centrales fueron 68, 74, 76 y 70. a) Analizar de nuevo el experimento, incluyendo una prueba para la curvatura cuadrtica pura. b) Comentar cul sera el siguiente paso. 6-23. Se estudiaron cuatro factores, cada uno con dos niveles, en un estudio del rendimiento de un proceso: el tiempo (A), la concentracin (B), la presin (C) y la temperatura (D). Se corri una sola rplica de un diseo 24 y los datos obtenidos se muestran en la siguiente tabla:

Nmero de Orden real de corrida la corrida 1 2 3 4 5 6 7 8 9 10


11

Rendimiento (lbs) 12 18 13 16 17 15 20 15 10 25 13 24 19 21 17 23

Niveles de los factores BajoH A (h) B(%) e (psi) 2.5 14 60 225 Alto (+) 3 18 80 250

9
8 13 3 7 14 1 6
11

+
+ + + + + +

+ +

DeC)

+
+ + + + +

+ + + + + + + + + + + +

12 13 14 15 16

2 15 4 16 10 12

+ + + +

6-7 PROBLEMAS

283

a) Construir una grfica die probabilidad norinal de las estimaciones de los efectos. Qu factores parecen
tener efectos grandes? b) Efectuar un anlisis de varianza utilizando la grfica de probabilidad normal del inciso a como gua para formar el trmino del error. A qu conclusiones se llega? e) Escribir un modelo de regresin que relacione el rendimiento con las variables importantes del proceso. d) Analizar los residuales de este experimento. El anlisis indica algn problema potencial? e) Es posible plegar este diseo a un diseo 23 con dos rplicas? De ser as, esquematizar el diseo con el promedio y el rango del rendimiento indicados en cada punto del cubo. Interpretar los resultados. 624. Continuaci6n delproblema 6-23. Usar el modelo de regresin del inciso e del problema 6-23 para generar una grfica de contorno de la superficie de respuesta del rendimiento. Analizar el valor prctico de esta grfica de superficie de respuesta. 6-25. El experimento del brownie (pastelito) exquisito. El autor es un ingeniero hecho en la prctica y un firme creyente de aprender haciendo las cosas. Durante muchos aos ha impartido el curso de diseo experimental a una amplia variedad de audiencias y siempre asigna la planeacin, realizacin y anlisis de un experimento real a los participantes de la clase. Los participantes parecen disfrutar esta experiencia prctica y siempre aprenden mucho de ella. En este problema se utilizan los resultados de un experimento realizado por Gretchen Krueger en la Universidad Estatal de Arizona. Existen muchas formas diferentes de hornear brownies. El propsito de este experimento fue determinar la forma en que el material del molde, la marca de la harina para brownies y el mtodo de batido afectan la exquisitez de los brownies. Los niveles de los factores fueron:

Factor A = material del molde B = mtodo de batido e = marca de la harina

Bajo (-) Vidrio Cuchara Cara

Alto (+) Aluminio Batidora Barata

La variable de respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado a los sujetos que hicieron el muestreo de cada lote de brownies. (Este cuestionario inclua aspectos como el sabor, la apariencia, la consistencia, el aroma, etc.) Un panel de prueba integrado por ocho personas hizo el muestreo de cada lote y llen el cuestionario. La matriz del diseo y los datos de la respuesta se presentan a continuacin:

Lote de brownies 1 2 3 4 5 6 7 8

Resultados del panel de prueba


A

1
11 15

2
9

3 10 16 11 15 15 14 13 15

4 10 14 11 12 8 13 10 13

5
11 12 11

6
10
9

8
9

+ + + +

+ +
+ +

+ + + +

16 10 12 10 15

10 12 17 11 13 12 12

8 6
11

13

6
9

7 12

11 13 8 13 7 12

11
9

15 12 11 14
9

14 17

13 14

a) Analizar los datos de este experimento como si se tratara de ocho rplicas de un diseo 23. Comentar los
resultados.

284

CAPTULO 6 DISEO FACfORIAL 2"

6-26.

b) El anlisis del inciso a es el enfoque correcto? Hay nicamente ocho lotes; se tienen en realidad ocho rplicas de un diseo factorial 23? e) Analizar el promedio y la desviacin estndar del puntaje de la exquisitez. Comentar los resultados. Este anlisis es ms apropiado que el del inciso a? Por qu s o no? Se condujo un experimento en un proceso qumico para producir un polmero. Los cuatro factores estudiados fueron la temperatura (A), la concentracin del catalizador (B), el tiempo (C) y la presin (D). Se observaron dos respuestas, el peso molecular y la viscosidad. La matriz del diseo y los datos de la respuesta se presentan a continuacin:

Nmero Orden real de de corrida las corridas

A
+

Peso molecular

Viscosidad

Niveles de los factores Alto (+) Bajo (-)

1 2
3

4 5 6 7 8 9 10
11

18 9 13 8 3
11

+ + + + +
+

12 13 14 15 16 17 18 19 20

14 17 6 7 2 10 4 19 15 20 1 5 16 12

+ + + + + + + + + + + + + + + + + + + +
+

o o O o o O o o O O o o

+ + + +

o o o o

2400 2410 2315 2510 2615 2625 2400 2750 2400 2390 2300 2520 2625 2630 2500 2710 2515 2500 2400 2475

1400 1500 1520 1630 1380 1525 1500 1620 1400 1525 1500 1500 1420 1490 1500 1600 1500 1460 1525 1500

AeC)
B(%) e (min) D (psi)

100 4 20 60

120 8 30 75

6-27.

a) Considere nicamente la respuesta del peso molecular. Graficar las estimaciones de los efectos en una escala de probabilidad normal. Qu efectos parecen ser importantes? b) Usar un anlisis de varianza para confirmar los resultados del inciso a. Hay algn indicio de curvatura? e) Escribir un modelo de regresin para predecir el peso molecular como una funcin de las variables importantes. d) Analizar los residuos y comentar la adecuacin del modelo. e) Repetir los incisos a-d utilizando la respuesta de la viscosidad. Continuacin delproblema 6-26. Utilizar los modelos de regresin del peso molecular y la viscosidad para responder las preguntas siguientes. a) Construir una grfica de contorno de la superficie de respuesta para el peso molecular. En qu direccin se ajustaran las variables del proceso a fin de incrementar el peso molecular? b) Construir una grfica de contorno de la superficie de respuesta para la viscosidad. En qu direccin se ajustaran las variables del proceso para disminuir la viscosidad?

6-7 PROBLEMAS

285

6-28.

6-29.

6-30.

e) Qu condiciones de operacin se recomendaran si fuera necesario producir un producto con peso molecular entre 2400 y 2500, Y con la viscosidad ms baja posible? Considere una sola rplica del diseo 24 del ejemplo 6-2. Suponga que se hicieron cinco corridas de puntos en el centro (O, O, O, O) Yque se observaron las respuestas siguientes: 73, 75, 71, 69 Y76. Probar la curvatura en este experimento. Interpretar los resultados. Un valorfaltante en un dseofactoritJl2l No es raro encontrar que falta una de las observaciones de un diseo 2k debido a un equipo de medicin defectuoso, una prueba fallida, O alguna otra razn. Si el diseo se hace con n rplicas (n > 1), puede emplearse alguna de las tcnicas estudiadas en el captulo 5. Sin embargo, para un diseo factorial sin rplicas (n = 1) debe usarse otro mtodo. Un enfoque lgico es estimar el valor faltante con un nmero que haga cero el contraste de la interaccin de orden ms alto. Aplicar esta tcnica al experimento del ejemplo 6-2, suponiendo que falta la corrida abo Compare los resultados obtenidos con los del ejemplo 6-2. Un ingeniero realiz un experimento para estudiar el efecto de cuatro factores sobre la aspereza superficial de una pieza maquinada. Los factores (y sus niveles) sonA = ngulo de la herramienta (12, 15),B = viscosidad del fluido de corte (300, 400), e = velocidad de alimentacin (10, 15 pulg/min) yD = enfriador del fluido de corte usado (no, s). Los datos de este experimento (con los factores codificados en los niveles usuales -1, + 1) se muestran a continuacin.

Corrida 1 2 3 4 5 6 7 8 9 10
11

Rugosidad superficial 0.00340 0.00362 0.00301 0.00182 0.00280 0.00290 0.00252 0.00160 0.00336 0.00344 0.00308 0.00184 0.00269 0.00284 0.00253 0.00163

+ + + + + + +
+

+ + + + + + + +

+ + + +

12 13 14 15 16

+ + + +

+ + + + + + + +

a) Estimar los efectos de los factores. Representar las efectos de los factores en una grfica de probabilidad normal y seleccionar un modelo tentativo. b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Hay algn indicio de que el modelo no sea adecuado? e) Repetir el anlisis de los incisos a y b utilizando 1ry como la variable de respuesta. Hay algn indicio de que la transformacin ha sido til? d) Ajustar un modelo en trminos de las variables codificadas que pueda usarse para predecir la rugosidad superficial. Convertir esta ecuacin de prediccin en un modelo en las variables naturales. 6-31. La resistividad de una oblea de silicio est influida por varios factores. Los resultados de un experimento factorial 24 realizado durante un paso crtico del procesamiento se muestran en la tabla siguiente:

286

CAPTULO 6 DISEO FACTORIAL Z'

Corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Resistividad 1.92 11.28 1.09 5.75 2.13 9.53 1.03 5.35 1.60 11.73 1.16 4.68 2.16 9.11 1.07 5.30

+ + + + + + + +

+ + + + + + + +

+ + + +

+ + + +

+ + + + + + + +

a) Estimar los efectos de los factores. Representar las efectos de los factores en una grfica de probabilidad
normal y seleccionar un modelo tentativo.
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Hay algn indicio de que el mode-

lo no sea adecuado? Repetir el anlisis de los incisos a y b utilizando In (y) como la variable de respuesta. Hay algn indicio de que la transformacin haya sido til? d) Ajustar un modelo en trminos de las variables codificadas que pueda usarse para predecir la resistividad. 6-32. Continuacin delproblema 6-31. Suponga que el experimentador corri tambin cuatro puntos centrales junto con las 16 corridas del problema 6-31. Las mediciones de la resistividad en los puntos centrales son: 8.15, 7.63, 8.95 Y6.48. Analizar de nuevo el experimento incorporando los puntos centrales. Qu conclusiones pueden sacarse ahora? 6-33. Es frecuente usar el modelo de regresin ajustado de un diseo factoral Z" para hacer predicciones en puntos de inters del espacio del diseo. a) Encontrar la varianza de la respuesta predicha y en un puntox..x; ...,Xk del espacio del diseo. Sugerencia: recuerde que lasx estn codificadas, y suponga un diseo 2k con 'el mismo nmero de rplicas n en cada punto del disetio, de tal modo que la varianza de un coeficiente de regresin jJ sea a Z/(n2k ) y que la covarianza entre cualquier par de coeficientes de regresin sea cero. b) Usar el resultado del inciso a para encontrar la ecuacin de un intervalo de confianza de 100(1- a) por ciento para la verdadera respuesta media en el punto x, xz, ..., Xk del espacio del diseo. 6-34. Modelosjerrquicos. Se ha usado varias veces el principio de jerarqua para seleccionar un modelo; es decir, se han incluido trminos de orden inferior no significativos en un modelo porque eran factores que estaban incluidos en trminos de orden superior significativos. Ciertamente, la jerarqua no es un principio absoluto que deba seguirse en todos los casos. Para ilustrar esto, considere el modelo que result en el problema 6-1, el cual requiri que se incluyera un efecto principal no significativo para respetar la jerarqua. Utilizar los datos del problema 6-1. a) Ajustar el modelo jerrquico y el modelo no jerrquico. b) Calcular el estadstico PRESS, la RZ ajustada y el cuadrado medio del error para ambos modelos. e) Encontrar un intervalo de confianza de 95% para la estimacin de la respuesta media en el vrtice de un cubo (x = X 2 = X 3 = 1). Sugerencia: usar los resultados del problema 6-33. d) Con base el. 'los anlisis que se han realizado, qu modelo preferira el lector? c)

Formacin de bloques y confusin en el diseo factorial 2k

7..1

INTRODUCCIN

Hay mltiples situaciones en las que es imposible efectuar todas las corridas de un experimento factorial 2k bajo condiciones homogneas. Por ejemplo, un lote de materia prima podra no ser suficiente para hacer todas las COrridas requeridas. En otros casos, podra ser conveniente modificar deliberadamente las condiciones experimentales para asegurar que los tratamientos tengan la misma efectividad (es decir, que sean robustos) en diversas situaciones que es posible encontrar en la prctica. Por ejemplo, un ingeniero qumico puede correr un experimento en una planta piloto con varios lotes de materia prima porque sabe que en el proceso real a gran escala posiblemente se usarn diferentes lotes de materia prima con diversos grados de calidad. La tcnica de diseo utilizada en estas situaciones es la formacin de bloques. Este captulo se enfoca en algunas tcnicas especiales para separar en bloques un diseo factorial '2!'.

7..2

FORMACIN DE BLOQUES DE UN DISEO FACTORIAL 2 CON RPUCAS

Suponga que se han corrido n rplicas del diseo factoral Z". Esta situacin es idntica a la que se estudi en el captulo 5, donde se indic cmo correr un diseo factorial general en bloques. Si hay n rplicas, entonces cada conjunto de condiciones no homogneas define un bloque, y cada rplica se corre en uno de los bloques. Las corridas de cada bloque (o rplica) se haran de manera aleatoria. El anlisis del diseo

Tabla 7-1 Experimento del proceso qumicoen tres bloques Bloque 1 Bloque 2 Bloque 3 (1)=28 a = 36 b = 18 ab = 31 B = 113 (1)=25 a = 32 b = 19 ab = 30 B2 = 106 (1)=27 a = 32 b = 23 ab = 29 B 3 = 111

Thtales de los bloques

287

288
Tabla 7-2

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2'

Anlisis de varianza del experimento del proceso qumico en tres bloques

Fuente de variacin Bloques A (concentracin) B (catalizador)


AB

Suma de cuadrados
6.50 208.33
~m

Grados de libertad
2 1
1

Cuadrado medio
3.25 208.33
~m

ValorP

Error lbtal

8.33 24.84 323.00

1 6 11

8.33 4.14

50.32 18.12 2.01

0.0004 0.0053 0.2060

es similar al de cualquier experimento factorial separado en bloques; por ejemplo, vase la revisin de la seccin 5-6.

EJEMPLO 7-1

111

111

"

"

* *

111

111

"

"

"

111

111

"

"

"

"

"

"

Considere el experimento del proceso qumico que se describi en la seccin 6-2. Suponga que slo pueden hacerse cuatro ensayos experimentales con un solo lote de materia prima. Por lo tanto, se necesitarn tres lotes de materia prima para correr las tres rplicas de este diseo. En la tabla 7-1 se muestra el diseo donde cada lote de materia prima corresponde a un bloque. En la tabla 7-2 se muestra el anlisis de varianza de este diseo separado en bloques. Todas las sumas de cuadrados se calculan exactamente igual que en un diseo 2k estndar sin formacin de bloques. La suma de cuadrados de los bloques se calcula a partir de los totales de los bloques. Sea que B 1, B 2 YB 3 representen los totales de los bloques (ver la tabla 7-1). Entonces
-

SS Bloques

= L 4-12
-l

B2

Y.~

(113)2 +(106)2 +(111)2 4 =6.50

(330)2

12

Hay dos grados de libertad entre los tres bloques. La tabla 7-2 indica que las conclusiones de este anlisis, si el diseo se hubiera corrido en bloques, son idnticas a las de la seccin 6-2 y que el efecto de los bloques es relativamente pequeo.
111 111 " " 111 111 " " " 111 .. 111 " 111 111 "

7~3

CONFUSIN DEL DISEO FACTORIAL 2k

Hay muchos problemas en los que es imposible realizar una rplica completa de un diseo factorial en un bloque. La confusin (o mezclado) es una tcnica de diseo mediante la cual un experimento factorial completo se distribuye en bloques, donde el tamao del bloque es menor que el nmero de combinaciones de los tratamientos de una rplica. La tcnica hace que la informacin acerca de ciertos efectos de los tratamientos (por 10 general las interacciones de orden superior) sea indistinguible de los bloques o est confundida con los bloques. En este captulo la atencin se centra en los sistemas de confusin (o mezclado) para el diseo factorial Z", Observe que aun cuando los diseos que se presentan son diseos de bloques incompletos, ya que cada bloque no contiene todos los tratamientos o las combinaciones de los tratamientos, la estructura especial del sistema factorial Z"permite un mtodo de anlisis simplificado. Se considera la construccin y el anlisis del diseo factorial 2k en 2! bloques incompletos, donde p < k. Por consiguiente, estos diseos pueden correrse en dos bloques, en cuatro bloques, en ocho bloques, etctera.

74 CONFUSIN DEL DISEO FAcrORIAL 2k EN ros BLOQUES

289

7..4

CONFUSIN DEL DISEO FACTORIAL 2k EN DOS BLOQUES

Suponga que quiere correrse una sola rplica del diseo 22 Cada una de las 22 = 4 combinaciones de los tratamientos requiere una cantidad de materia prima, por ejemplo, y cada lote de materia prima slo alcanza para probar dos combinaciones de tratamientos. Por lo tanto, se necesitan dos lotes de materia prima. Si los lotes de materia prima se consideran como bloques, entonces deben asignarse a cada bloque dos de las cuatro combinaciones de tratamientos. En la figura 7-1 se muestra lUDO de los diseos posibles para este problema. La vista geomtrica, figura 7-1a, indica que las combinaciones de tratamientos localizadas en diagonales opuestas se asignan a bloques diferentes. Observe, por la figura 7 lb, que el bloque 1 contiene las combinaciones de los tratamientos (1) Yab y que el bloque 2 contiene a y b. Desde luego, el orden en que se corren las combinaciones de los tratamientos dentro de un bloque se determina aleatoriamente. Tambin se decidir aleatoriamente cul de los bloques se correr primero. Suponga que los efectos principales deA y B se estiman como si no se hubiera hecho la formacin de bloques. Por las ecuaciones 6-1 y 6-2 se obtiene

A= t[ab+a-b-(I)] B= t[ab+b-a-(I)]
Observe que niA ni B son afectados por la formacin de bloques, debido a que en cada estimacin hay una combinacin de un tratamiento positivo y uno negativo de cada bloque. Es decir, cualquier diferencia entre el bloque 1 y el bloque 2 se cancela. Considere ahora la interaccin AB

AB= t[ab+(I)-a-b]
Puesto que las dos combinaciones de tratamientos con signo positivo [ab y (1)] estn en el bloque 1 y las dos con signo negativo (a y b) estn en el bloque 2, el efecto de los bloques y la interaccinAB son idnticos. Es decir, AB est confunllido (o mezclado) con los bloques. La razn de esto es evidente en la tabla de signos positivos y negativos del diseo 22 Se present originalmente en la tabla 6-2, pero por conveniencia se repite como la tabla 7-3. A partir de esta tabla se observa que todas las combinaciones de tratamientos que tienen signo positivo para AB se asignan al bloque 1,
+ 0 - - - - -..
,. Corrida en el bloque 1

O - Corrida en el bloque 2

al Vista geomtricll
Bloque 1 Bloque 2

r-ml

L:J

b) Asignacin de las cuatro corridas en dos bloques

Figura 71 Diseo 2Z en dos bloques.

290

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL z-

Tabla73 Tabla de signos positivos y negativos para el disefio 22 Efecto factorial Combinacinde 1 A B AB tratamientos
(1)

a b ab

+ + + +

+ +

+ + + +

mientras que todas las combinaciones de tratamientos que tienen signo negativo para AB se asignan al bloque 2. Este enfoque puede usarse para confundir o mezclar cualquier efecto (A, B o AB) con los bloques. Por ejemplo, si (1) Yb se hubieran asignado al bloque 1 y a yab al bloque 2, el efecto principal deA se habra confundido con los bloques. La prctica usual es confundir la interaccin de orden ms alto con los bloques. Este esquema puede usarse para confundir o mezclar cualquier diseo 2k en dos bloques. Como un segundo ejemplo, considere un diseo 23 que se corre en dos bloques. Suponga que se quiere confundir la interaccin de los tres factoresABC con los bloques. Por la formacin de signos positivos y negativos de la tabla 7~4, las combinaciones de tratamientos que son negativas paraABC se asignan al bloque 1 y las que son positivas paraABC al bloque 2. El diseo resultante se muestra en la figura 7-2. De nueva cuenta se resalta que las combinaciones de tratamientos dentro de un bloque se corren de manera aleatoria. Otros mtodos para construir bloques Se cuenta con otro mtodo para construir estos disefios. El mtodo utiliza la combinacin lineal (7-1) donde r, es el nivel del factor i-simo que aparece en una combinacin de tratamientos particular y a es el exponente que aparece en el factor i-simo para el efecto que va a confundirse. Para el sistema 2\ se tiene a O01 yx O(nivel bajo) o r, 1 (nivel alto). Ala ecuacin 7-1 se le llama la definicin de contrastes. Las combinaciones de tratamientos que producen el mismo valor de L (mod 2) se colocarn en el mismo bloque. Puesto que los nicos valores posibles deL (mod 2) son Oy 1, con esto las 2k combinaciones de tratamientos se asignarn a exactamente dos bloques.

Tabla74 Tabla de signos positivos y negativos para el diseo 23 Combinacinde Efecto factorial tratamientos 1 A B AB C (1) + +

a b ab
e

ae be abe

+ + + + + + +

AC +

+ + +

+ + + +

+ + +

+ + + + +
+

BC + +

ABC

+ + +

+ +

7-4 CONFUSIN DEL DISEO FACTORIAL 2k ENDOSBLOQUES


g

291

Corrida en el bloque 1 COrrida en el bloque 2

I I
I

'"'"

J--Bloque 1
(1)

CfL:
A
Bloque 2

a) Vista geomtrica

ab
ac

e
abe

be

b) Asignacin de las ocho corridas en dos bloques

Figura 72 El disefio 2' en dos bloques conABC confundido.

Para ilustrar este enfoque, considere un diseo 23 conABC confundido con los bloques. En este caso, Xl corresponde aA,x z aB,x3 a C y al = a z = a3 = 1. Porlo tanto, la definicin del contraste correspondiente aABC es

L=xI +x z +x 3
La combinacin de tratamientos (1) se escribe 000 en la notacin (O, 1); por Io tanto,

L= 1(0)+1(0)+1(0)= 0= O(mod 2)
De manera similar, la combinacin de tratamientos a es 100, obtenindose

L= 1(1)+ 1(0)+1(0) = 1 = 1 (mod 2)


Por lo tanto, (1) ya se correran en bloques diferentes. Para el resto de las combinaciones de tratamientos se tiene .

b: ab: e: ae: be: abe:

L= 1(0)+1(1)+1(0)= 1 = 1 (mod 2) L= 1(1)+1(1)+1(0)= 2= O (mod 2) L= 1(0)+1(0)+1(1)= 1 = 1 (mod 2) L= 1(1)+1(0)+1(1)= 2= O (mod 2) L= 1(0)+1(1)+1(1)= 2= O (mod 2) L= 1(1)+1(1)+1(1)= 3= 1 (mod 2)

Por lo tanto, (1), ab, ae y be se corren en el bloque 1 ya, b, e yabe se corren en el bloque 2. Se trata del mismo diseo que se ilustr en la figura 72, el cual se gener con la tabla de signos positivos y negativos. Puede usarse otro mtodo para construir estos diseos. Al bloque que contiene la combinacin de tratamientos (1) se le llama el bloque principal. Las combinaciones de los tratamientos incluidas en este bloque poseen una til propiedad de la teora de grupos; a saber, forman un grupo con respecto a la multi-

292

CAPTULO 7 FORMACIN DE BLOQUES YCONFUSIN EN ELDISEO FACTORIAL 2'

plicacin mdulo 2. Esto implica que cualquier elemento [con excepcin de (1)] del bloque principal puede generarse multiplicando otros dos elementos del bloque principal mdulo 2. Por ejemplo, considere el bloque principal del diseo 23 conABC confundido, como se muestra en la figura 7-2. Observe que
ab'ae=- a 2be= be ab 'be = ab 2e = ae ae'be= abe'

= ab

Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse multiplicando uno de los elementos del nuevo bloque por cada uno de los elementos del bloque principal mdulo 2. Para el diseo 23 conABC confundido, puesto que el bloque principal es (1), ab, ae y be, se sabe que b est en el otro bloque. Por lo tanto, los elementos de este segundo bloque son
b'(l)
2

=b =e

b'ub=ab =a b-ac = abe b-bc v b 2e

Estos resultados concuerdan con los que se obtuvieron anteriormente. Estimacin del error Cuando el nmero de variables es pequeo, por ejemplo k = 2 o 3, por 10 general es necesario hacer rplicas del experimento a fin de obtener una estimacin del error. Por ejemplo, suponga que un diseo factorial 23 debe correrse en dos bloques con ABC confundido, y el experimentador decide hacer cuatro rplicas del diseo. El diseo resultante podra verse como el de la figura 7-3. Observe queABC est confundido en cada rplica. En la tabla 7-5 se muestra el anlisis de varianza de este diseo. Hay 32 observaciones y 31 grados de libertad. Adems, puesto que hay ocho bloques, siete grados de libertad deben asociarse con estos bloques. En la tabla 7-5 se presenta la descomposicin de esos siete grados de libertad. La suma de cuadrados del error se compone en realidad de las interacciones de dos factores entre las rplicas, y cada uno de los efectos (A, B, C, AB, AC, BC). Por 10 general es seguro considerar que las interacciones son cero y tratar el cuadrado medio resultante como una estimacin del error. Los efectos principales y las interacciones de dos factores se prueban contra el cuadrado medio del error. Cochran y Cox [25b] hacen notar que el cuadrado medio del bloque oABC podra compararse con el error del cuadrado medioABC, que es en realidad rplicas x bloques. Esta prueba suele tener una sensibilidad muy baja. Si se cuenta con recursos suficientes para hacer rplicas de un diseo confundido, por lo general es mejor usar un mtodo ligeramente diferente para disear los bloques en cada rplica. Este enfoque consiste en confundir un efecto diferente en cada rplica para obtener cierta informacin sobre todos los
Rplica 1 Bloque 1 (1) Bloque 2 Rplica 11 Bloque 1
(1)

Rplica ID Bloque 1 Bloque 2

Rplica IV Bloque 1 Bloque 2

Bloque 2

abe a b
e

abe a b
e

(1)

abe a

(1 ) ac

abe a

ae ab be

ae ab be

ae ab be

b
c

ab be

b
e

Figura 73

Cuatro rplicas del diseo 23 con ABe confundido.

HCONFUSIN DEL DISEO FACTORIAL 2k EN OOS BLOQUES

293

Tabla 7-5

Anlisis de varianza de cuatro rplicas de un disefio 23 con ABe confundido

Fuente de variacin Rplicas Bloques (ABC) Error deABC (rplicas x bloques)


A B C AB

Gradosde libertad
3 1 3 .1
1

1 1
1

AC
BC

Error (o rplicas x efectos) Total

1 18

31

efectos. A este procedimiento se le llama confusin (o mezclado) parcial, y se estudia en la seccin 7-7. Si k es moderadamente grande, por ejemplo k ;:= 4, con frecuencia slo es posible hacer una rplica. El experimentador suele suponer que las interacciones de rdenes superiores son insignificantes y combina sus sumas de cuadrados como el error. La grfica de probabilidad normal de los efectos de los factores puede ser muy til a este respecto.

EJEMPLO 7tl2

111

Considere la situacin descrita en el ejemplo 6-2. Recuerde que se estudian cuatro factores-e-la temperatura (A), la presin (B), la concentracin de formaldehdo (C) y la velocidad de agitacin (D)- en una planta piloto para determinar su efecto sobre el ndice de filtracin del producto. Se usar este experimento para ilustrar las ideas de la formacin de bloques y la confusin en un diseo no replicado. Se introducirn dos modificaciones al experimento original. Primera, suponga que no es posible correr las 24 = 16 combinaciones de tratamientos utilizando un solo lote de materia prima. El experimentador puede correr ocho combinaciones de los tratamientos con un solo lote de material, por lo que un diseo 24 confundido en dos bloques parece apropiado. Es lgico confundir la interaccin de orden ms alto ABCD con los bloques. La definicin del contraste es
L=
Xl +X 2 +X] +X 4

y es sencillo verificar que el diseo es como el que se ilustra en la figura 7-4. De manera alternativa, puede examinarse la tabla 6-12 y observar que las combinaciones de los tratamientos que son + en la columna ABCD se asignan al bloque 1 y que las que son - en la columna ABCD, estn en el bloque 2. La segunda modificacin que se har es introducir un efecto de los bloques para que pueda demostrarse la utilidad de la formacin de bloques. Suponga que cuando se seleccionan los dos lotes de materia prima que se necesitan para correr el experimento, uno de ellos es de calidad mucho ms baja y, como resultado, todas las respuestas sern 20 unidades menores en este lote de material que en el otro. El lote de calidad menor se convierte en el bloque 1y el lote de buena calidad se convierte en el bloque 2 (no es relevante a cul de los dos lotes se le llama bloque 1 o bloque 2). Entonces todas las pruebas del bloque 1 se realizan primero (las ocho corridas del bloque se hacen, desde luego, de manera aleatoria), pero las respuestas son 20 unidades ms bajas que las que se habran obtenido si se hubiera usado el material de buena calidad. En la figura 7-4b se muestran las respuestas resultantes; observe que stas se han encontrado

294

CAPTULO 7 FORMACiN DEBLOQUES YCONFUSiN EN ELDISEO FACTORIAL 2k


D
+

~ Corridas en el bloque 1 o - Corridas en el bloque 2 a) Viste geomtrica Bloque 1 (1) - 25 Bloque 2

eL
A

ab-45 00-40 be -60 M_SO bd-25 cd-55 abcd-76

a-71 b-48 c-68 d-43 abe-65 bcd=70


acd~S6

abd-l04

b) Asignacin de las 16 corridas

en los dos bloques

Figura 7-4 El diseo 2 en dos bloques para el ejemplo 72.


4

restando el efecto del bloque de las observaciones originales dadas en el ejemplo 6-2. Es decir, la respuesta original de la combinacin de tratamientos (1) fue 45, y en la figura 7-4b se consigna como (1) = 25 (= 45 - 20). Las dems respuestas de este bloque se obtienen de manera similar. Despus de que se realizan las pruebas del bloque 1, se prosigue con las ocho pruebas del bloque 2. No hay ningn problema con la materia prima de este lote, por lo que las respuestas son exactamente como fueron originalmente en el ejemplo 6-2. En la tabla 7-6 se muestran las estimaciones de los efectos para esta versin "modificada" del ejemplo 6-2. Observe que las estimaciones de los cuatro efectos principales, de las seis interacciones de dos factores y de las cuatro interacciones de tres factores son idnticas a las estimaciones de los efectos obtenidas en el ejemplo 6-2, donde no hubo ningn efecto de bloques. Cuando se construye una grfica de probabilidad normal de estas estimaciones de los efectos, los factores A, C, D y las interacciones A C y AD aparecen como los efectos importantes, justo como en el experimento original. (El lector deber verificar esto.) Qu puede decirse del efecto de la interaccin ABCD? La estimacin de este efecto en el experimento original (ejemplo 6-2) fueABCD = 1.375. En el presente ejemplo, la estimacin del efecto de la interaccinABCD esABCD =-18.625. Puesto queABCD est confundido con los bloques, la interaccin ABCD estima el efecto de la interaccin original (1.375) ms el efecto de bloque (-20), de dondeABCD = 1.375 + (-20) = -18.625. (Puede el lector ver por qu el efecto del bloque es -20?) El efecto del bloque

74 CONFUSIN DEL DISEO FACTORIAL 2. ENDOSBLOQUES


Tabla 7-6 Estimaciones de losefectos para el diseo 24 separado en bloques del ejemplo 72 Coeficiente Estimacin de regresin . del efecto 10.81 1.56 4.94 7.31 0.062 -9.06 8.31 1.19 -0.19 -0.56 0.94 2.06 -0.81 -1.31 21.625 3.125 9.875 14.625 0.125 -18.125 16.625 2.375 -0.375 -1.125 1.875 4.125 -1.625 -2.625 -18.625 Suma de cuadrados 1870.5625 39.0625 390.0625 855.5625 0.0625 1314.0625 1105.5625 22.5625 0.5625 5.0625 14.0625 68.0625 10.5625 27.5625 1387.5625 Contribucin porcentual 26.30 0.55 5.49 12.03 <0.01 18.48 15.55 0.32 <0.01 0.07 0.20 0.96 0.15 0.39 19.51

295

Trmino del modelo

A B
C

D AB AC
AD

BC BD CD ABC ABD ACD BCD


Bloques (ABCD)

tambin puede calcularse directamente como la diferencia en la respuesta promedio entre los dos bloques, o Efecto del bloque = YBIoquo 1 - YBloque 2 406 555 =--8 8 -149 = 8 = -18.625 Desde luego, este efecto es en realidad la estimacin de Bloques + ABCD. En la tabla 7-7 se resume el anlisis de varianza de este experimento. Los efectos que tienen estimaciones grandes estn incluidos en el modelo, y la suma de cuadrados de los bloques es

ss
Bloques

= (406)2 +(555)2 (9~~)2 =1387.5625


8
Grados de libertad 1 1 1 1 1 1 9 15 Cuadrado medio 1870.5625 390.0625 855.5625 1314.0625 1105.5625 20.8403

Tabla 77 Anlisis de varianza del ejemplo 7-2 Fuente de Suma de cuadrados variacin Bloques (ABCD)

Fo
89.76 18.72 41.05 63.05 53.05

ValorP <0.0001 0.0019 0.0001 <0.0001 <0.0001

A
C

D AC
AD
Error Thtal

1387.5625 1870.5625 390.0625 855.5625 1314.0625 1105.5625 187.5625 7111.4375

------ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

296

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL Z

Las conclusiones de este experimento coinciden exactamente con las del ejemplo 6-2, donde no estuvo presente ningn efecto de bloques. Observe que si el experimento no se hubiera corrido en bloques, y si un efecto de magnitud -20 hubiera afectado los 8 primeros ensayos (los cuales se habran seleccionado de manera aleatoria, ya que los 16 ensayos se habran corrido en orden aleatorio en un diseo sin formacin de bloques), los resultados pudieron haber sido muy diferentes.

7~5

CONFUSIN DEL DISEO FACTORIAL 2k EN CUATROBLOQUES

Es posible construir diseos factoriales 2k confundidos en cuatro bloques con 2k - Z observaciones cada uno. Estos diseos son particularmente tiles en situaciones en las que el nmero de factores es moderadamente grande, por ejemplo k <:= 4, y el tamao de los bloques es relativamente pequeo. Como un ejemplo, considere el diseo 25 Si cada bloque incluir nicamente ocho corridas, entonces debern usarse cuatro bloques. La construccin de este diseo es relativamente directa. Se seleccionan dos efectos para confundirlos con los bloques, por ejemploADE y BCE. Estos efectos tienen las dos definiciones de contrastes

t; = Xl +X 4 +X 5 L 2 = X 2 +X 3 +X 5
asociadas con ellos. Entonces cada combinacin de tratamientos producir un par particular de valores de L (mod 2) y L; (mod 2), es decir, cualquiera de (L 1,L z) = (O, O), (O, 1), (1, O) o bien (1,1). Las combinaciones de tratamientos que producen los mismos valores de (L, L z) se asignan al mismo bloque. En el ejemplo tratado aqu se encuentra
L
T LJ T LJ

= O, L, = O
=1, L 2 =0

=0, L 2 =1
=1, L 2 =1

T LJ

para (1), ad, be, abed, abe, aee,'ede, bde para a, d, abe, bed, be, abde, ee, aede para b, abd, e, aed, ae, de, abce, bede para e, ade, bee, abede, ab, bd, ae, cd

Estas combinaciones de tratamientos se asignaran a bloques diferentes. En la figura 7-5 se muestra el diseo completo. Con un poco de reflexin, nos damos cuenta de que otro efecto adems deADE y BCE debe confundirse con los bloques. Puesto que hay cuatro bloques con tres grados de libertad entre ellos, y puesto que ADE y BCE tienen un solo grado de libertad cada una, es evidente la necesidad de confundir un efecto adicional con un grado de lihertad. Este efecto es la interaccin generalizada deADE y BCE, la cual se
"

Bloque 1

Bloque 2

Bloque 3

Bloque 4

L,

~O

Ll~O

L, -1 L2 - O
a d abe be abde ce

L, -O Ll ~ 1

L,- 1 L2 - 1
e abede

(1)

abe aee cde

b abce
abd e acd
1M

ad be

ade bd
bce ab

bcde de

ac
cd

abcd bde

bcd acde

Figura 7-5 El diseo 25 en cuatro bloques conADE,


BCE y ABCD confundidos.

7-6 CONFUSIN DEL DISEO FACTORIAL 2 EN 2P BLOQUES

297

define como el producto deADE y BCE mdulo 2. Por lo tanto, en el ejemplo tratado aqu la interaccin generalizada (ADE)(BCE) = ABCDE2 = ABCD tambin est confundido con los bloques. Es sencillo verificar esto refirindose a la tabla de signos positivos y negativos del diseo 25, como en Davies [36]. La inspeccin de esta tabla revela que las combinaciones de los tratamientos se asignan a los bloques de la siguiente manera:
Combinaciones de los tratamientos en el Bloque 1 Bloque 2 Bloque 3 Bloque 4

SignodeADE

Signo deBCE

Signo deABCD

+ +

+ + + +

Observe que el producto de los signos de dos efectos cualesquiera de un bloque particular (por ejemplo ADE y BCE) produce el signo del otro efecto de ese bloque (en este caso, ABCD). Por lo tanto, ADE, BCE y ABCD estn confundidos con los bloques. Las propiedades de la teora de grupos del bloque principal mencionadas en la seccin 7-4 siguen siendo vlidas. Por ejemplo, se observa que el producto de dos combinaciones de tratamientos del bloque principal produce otro elemento del bloque principal. Es decir,
ad bc = abcd

y abebde = ab 2de 2 = ad

etctera. Para construir otro bloque se selecciona una combinacin de tratamientos que no est en el bloque principal (por ejemplo b), Yb se multiplica por todas las combinaciones de tratamientos del bloque principal. Se obtiene as
b'(l)= b
b-ad v abd
b -abcd = ab cd = acd

etctera, lo que producir las ocho combinaciones de tratamientos del bloque 3. En la prctica, el bloque principal puede obtenerse a partir de la definicin de contrastes y de la propiedad de la teora de grupos, y los dems bloques pueden determinarse a partir de estas combinaciones de los tratamientos aplicando el mtodo que se present anteriormente. El procedimiento general para construir un diseo 2k confundido en cuatro bloques consiste en elegir dos efectos para generar los bloques, confundindose automticamente un tercer efecto que es la interaccin generalizada de las dos primeras. Despus se construye el diseo utilizando las dos definiciones de contrastes (L 1, L 2 ) Ylas propiedades de la teora de grupos del bloque principal. Al seleccionar los efectos que van a confundirse con los bloques, debe tenerse cuidado de obtener un diseo en el que no estn confundidos efectos que pueden ser de inters. Por ejemplo, en un diseo 25 podra elegirse confundir ABCDE y ABD, con lo cual se confunde automticamente CE, un efecto que es de posible inters. Una mejor eleccin es confundir ADE y BCE, con lo cual se confunde automticamenteABCD. Es preferible sacrificar informacin en las interacciones de tres factoresADE y BCE en lugar de la interaccin de dos factores CE.

7..6

CONFUSIN DEL DISEO FACTORIAL 2k EN 2P BLOQUES

Los mtodos descritos antes pueden extenderse a la construccin de un diseo factoral Z''confundido (o mezclado) en 2P bloques (p < k), donde cada bloque contiene exactamente 2k-p corridas. Se seleccionanp efectos independientes que van a confundirse, donde por "independientes" se entiende que ninguno de los efectos elegidos es la interaccin generalizada de los dems. Los bloques pueden generarse mediante

Interacciones confundidas con los bloques


ABC AB,AC,BC ABCD ABC,ACD, BD AB, BC, CD, AC, BD, AD, ABCD ABCDE ABC, CDE, ABDE ABE, BCE, CDE, AC, ABCD, BD, ADE

Todas las interacciones de dos y cuatro factores (15 efectos)


ABCDEF ABCF, CDEF, ABDE ABEF, ABCD, ACE, BCF, BDE, CDEF, ADF ABE, ACF, BDF, DEF, BC, ABCD, ABDE, AD, ACDE, CE, BDF, BCDEF, ABCEF, AEF, BE

Todas las interacciones de dos, cuatro y seis factores (31 efectos)


ABCDEFG ABCFG, CDEFG, ABDE ABC, DEF, AFG, ABCDEF, BCFG, ADEG, BCDEG ABCD, EFG, CDE, ADG, ABCDEFG, ABE, BCG, CDFG, ADEF, ACEG, ABFG, BCEF, BDEG, ACF, BDF ABG, BCG, CDG, DEG, EFG, AC, BD, CE, DF, AE, BE, ABCD, ABDE, ABEF, BCDE, BCEF, CDEF, ABCDEFG, ADG, ACDEG, ACEFG, ABDFG, ABCEG, BEG, BDEFG, CFG, ADEF, ACDF, ABCF,AFG

64

AB, BC, CD, DE, EF, FG

Todas las interacciones de dos, cuatro y seis factores (63 efectos)

7-7 CONFUSIN PARCIAL

299

el uso de las p definiciones de contrastes L 1, L 2, , L p asociadas con estos efectos. Asimismo, se confundirn otros 2! - P -1 efectos con los bloques, siendo stos las interacciones generalizadas de los p efectos independientes elegidos inicialmente. Deber tenerse cuidado al seleccionar los efectos que van a confundirse para que no se sacrifique informacin sobre los efectos que pueden ser de inters potencial. El anlisis estadstico de estos diseos es directo. Las sumas de cuadrados de todos los efectos se calculan como si no se hubiera hecho la formacin de bloques. Despus, la suma de cuadrados de los bloques se encuentra sumando las sumas de cuadrados de todos los efectos confundidos con los bloques. Obviamente, la eleccin de los p efectos usados para generar el bloque es crtica, ya que la estructura de la confusin (o mezclado) del diseo depende directamente de ellos. En la tabla 7-8 se presenta una lista de diseos tiles. Para ilustrar el uso de esta tabla, suponga que quiere construirse un diseo 26 confundido en 23 =8 bloques con 23 = 8 corridas cada uno. La tabla 7-8 indica que se elegiranABEF, ABCD yACE como losp = 3 efectos independientes para generar los bloques. Los 2! - P -1 = 23 - 3 -1 = 4 efectos restantes que estn confundidos son las interacciones generalizadas de estos tres; es decir, (ABEF)(ABCD) (ABCD)( A CE) (ABEF)(ABCD)(ACE)

= A 2 B 2CDEF= CDEF
= A 2 Bc 2 ED = BDE

(ABEF)( ACE) = A 2 BCE 2 F = BCF

=A

B 2C 2 DE 2 F= ADF

En el problema 7-11 se le pide al lector que genere los ocho bloques de este diseo.

7~7

CONFUSIN PARCIAL

En la seccin 7-4 se subray que, a menos que los experimentadores cuenten con una estimacin previa del error o que estn dispuestos a suponer que ciertas interacciones son insignificantes, deben hacer rplicas del diseo para obtener una estimacin del error. En la figura 7-3 se muestra un diseo factorial 23 en dos bloques conABC confundido, con cuatro rplicas. Por el anlisis de varianza de este diseo, el cual se presenta en la tabla 7-5, se observa que no puede sacarse informacin acerca de la interaccinABC debido a queABC est confundido con los bloques en todas lS rplicas. Se dice que este diseo est completamente confundido (o mezclado). Considere la alternativa que se presenta en la figura 7-6. De nueva cuenta hay cuatro rplicas del diseo 23, pero en cada rplica se ha confundido una interaccin diferente. Es decir,ABC est confundido en la rplica I,AB est confundido en la rplica 11, BC est confundido en la rplica 111 yAC est confundido en la rplica I~ Como resultado puede obtenerse informacin deABC a partir de los datos de las.rplicas 11, 111 YIV; informacin deAB puede obtenerse de las rplicas 1,111 YIV; informacin deAC puede obteRplica U

Rplica 1

Rplicaill

Rplica IV

ABe Confundido
(1)

AB Confundido
(1)

BC Confundido
(11

AC Confundido
(11

a
b
e

a
b
oc

a
e

ab oc be

e ab
abe

abe

be

a be abe

e ab ce

oc
abe

ab
be

Figura 76 Confusin parcial en el diseo 23

300

CAPTULO 7 FORMACIN DE BLOQUES YCONFUSIN EN ELDISEO FACTORIAL Zk

Tabla 79 Anlisis de varianza de un diseflo 23 parcialmente confundido

Fuente de variacin Rplicas Bloques dentro de rplicas [oABC (rp. 1) + AB (rp, 11) + BC (rp. I1I) + AC (rp. IV)]

Grados de libertad 3 4
1 1 1

A
B

e
AB (de las rplicas 1, III YIV) A C (de las rplicas 1, 11 YI1I) BC (de las rplicas 1,11 YIV) ABC (de las rplicas 1, III YIV) Error lbtal

1 1 1 1 17 31

nerse de las rplicas 1,11 Y111; e informacin de BC puede obtenerse de las rplicas 1, 11 YIV. Se dice que pueden obtenerse tres cuartas partes de la informacin de las interacciones porque no estn confundidas en slo tres rplicas. Yates [113b] llama a la relacin 3/4 la informacin relativa de los efectos confundidos. Se dice que este diseo est parcialmente confundido (o mezclado). En la tabla 7-9 se muestra el anlisis de varianza de este diseo. Para calcular las sumas de cuadrados de las interacciones, slo se usan los datos de las rplicas en las que no est confundida una interaccin. La suma de cuadrados del error consta de las sumas de cuadrados de rplicas x sumas de cuadrados de efecto principal, ms las sumas de cuadrados de rplicas x sumas de cuadrados de interaccin para cada rplica en la que esa interaccin no est confundida (por ejemplo, rplicas x ABC para las rplicas 11, 111 YIV). Adems, hay siete grados de libertad entre los ocho bloques. Es comn hacer la particin de tres grados de libertad para las rplicas y cuatro grados de libertad para los bloques dentro de las rplicas. La composicin de la suma de cuadrados de los bloques se muestra en la tabla 7-9 y se sigue directamente de la eleccin del efecto confundido en cada rplica.

'Ej'EMPLO 7-3 . . . . . . '" . . . . . . . . . . . . . . """. . . . . . . Un diseo 23 con confusin parcial

41

"

"

'"

"

'"

Considere el ejemplo 6-1, en el que se realiz un estudio para determinar el efecto del porcentaje de carbonatacin (A), la presin de operacin (B) y la velocidad de lnea (C) sobre la altura de llenado de una bebida carbonatada. Suponga que cada lote de jarabe alcanza slo para probar cuatro combinaciones de tratamientos. Por lo tanto, cada rplica del diseo 23 debe correrse en dos bloques. Se corren dos rplicas, con ABC confundido en la rplica I y AB confundido en la rplica 11. Los datos son los siguientes:

Rplica 1 ABe confundido


(1) ab ae be
= = = =

Rplica 11 AB confundido
(1) = -1

-3 2
2 1

= e = -1 abe = 6

a O b = -1

a = 1

e=
ab = abe =

O
3
5

b=O
ac = 1
be = 1

7-8 PROBLEMAS

301

Tabla7.10 Anlisis de varianza del ejemplo 7-3 Fuente de Suma de variacin cuadrados Rplicas 1.00 Bloques dentro de las rplicas 2.50 A 36.00 B 20.25 C 12.25 AB (slo en la rplica 1) 0.50 AC 0.25 BC 1.00 ABC (slo en la rplica 11) 0.50 Error 3.75 Thtal 78.00

Grados de libertad 1 2 1 1 1 1 1 1
1

5 15

Cuadrado medio 1.00 1.25 36.00 20.25 12.25 0.50 0.25 1.00 0.50 0.75

Fo
48.00 27.00 16.33 0.67 0.33 1.33 0.67

ValorP

0.0001 0.0035 0.0099 0.4503 0.5905 0.3009 0.4503

Las sumas de cuadrados deA, B, C, ACy BC pueden calcularse de la manera usual, utilizando las 16 observaciones. Sin embargo, SSABC debe encontrarse utilizando nicamente los datos de la rplica II y SSAB utilizando nicamente los datos de la rplica 1 de la siguiente manera: SS = [a+b+c+abc-ab-ac-bc-(1)]2
ABC

n2" [1+0+0+5- 3-1-1-(-1)]2 = (1)(8) n2"


(1)(8)

= 0.50

_ [(1)+abc-ac+c-a-b+ab-bc]2

AB -

= [-3+6- 2+(-1)- 0-(-1)+2-1]2 =0.50


La suma de cuadrados de las rplicas es, en general, " R2 y2 SSRep = 2: -

L
h=l

= (6)2 +(10)2 _ (16)2 =1 00


8

16'

donde R h es el total de las observaciones en la rplica h-sima. La suma de cuadrados de los bloques es la ABC AB suma de SS de la rplica 1 y SS de la rplica 11, o SSmoqu = 2.50. En la tabla 7-10 se resume el anlisis de varianza. Los tres efectos principales son importantes.
'*' '*' .., '*' '*' '*' '*' '*' '*' '*' '*' '*' '*' '*' '*' '*'

7..8
7-1. 7-2. 7-3.

PROBLEMAS
Considere el experimento descrito en el problema 6-1. Analizar este experimento suponiendo que cada rplica representa un bloque de un solo turno de produccin. Considere el experimento descrito en el problema 65. Analizar este experimento suponiendo que cada una de las cuatro rplicas representa un bloque. Considere el experimento de la formacin de fisuras en la aleacin de nquel y titanio descrito en el problema 6-15. Suponga que slo pudieron hacerse 16 corridas en un solo da, por lo que cada rplica se trat como un bloque. Analizar el experimento y sacar conclusiones.

302
7-4.

CAPTULO 7 FORMACIN DEBLOQUES YCONFUSIN ENELDISEO FACTORIAL

7-5. 76. 7-7. 7-8. 7-9. 7-10. 7-11.

712. 7-13.

7-14. 7-15. 7-16. 7-17.

Considere los datos de la primera rplica del problema 6-1. Suponga que no fue posible correr todas estas observaciones utilizando barras del mismo lote. Establecer un diseo para correr estas observaciones en dos bloques de cuatro observaciones cada uno con ABC confundido. Analizar los datos. Considere los datos de la primera rplica del problema 6-7. Construir un diseo con dos bloques de ocho observaciones cada uno con ABCD confundido. Analizar los datos. Repetir el problema 7-5 suponiendo que se requieren cuatro bloques. Confundir ABD y ABC (y por consiguiente CD) con los bloques. Utilizando los datos del diseo 25 del problema 6-21, construir y analizar un diseo en dos bloques con ABCDE confundido con los bloques. Repetir el problema 7-7 suponiendo que se necesitan cuatro bloques. Sugerir un esquema de confusin (o mezclado) razonable. Considere los datos del diseo 25 del problema 6-21. Suponga que fue necesario correr este diseo en cuatro bloques con ACDE y BCD (y por consiguiente ABE) confundidos. Analizar los datos de este diseo. Disear un experimento para confundir un diseo factorial 26 en cuatro bloques. Sugerir un esquema de confusin apropiado, diferente del que se ilustr en la tabla 7-8. Considere el diseo 26 en ocho bloques con ocho corridas cada uno conABCD, ACE y ABEF como los efectos independientes elegidos para confundirlos con los bloques. Generar el diseo. Encontrar los dems etectos confundidos con los bloques. Considere el diseo 22 en dos bloques conAB confundido. Hacer la demostracin algebraica de que SS..w = SSBloque. Considere los datos del ejemplo 7-2. Suponga que todas las observaciones del bloque 2 se incrementan en 20. Analizar los datos que resultaran. Estimar el efecto de bloque. Puede el lector explicar su magnitud? Los bloques parecen ser ahora un factor importante? Hay otras estimaciones de los efectos que sufran el impacto de este cambio hecho en los datos? Suponga que en el problema 6-1 se confundi ABC en la rplica 1,AB en la rplica 11 y BC en la rplica 111. Calcular las estimaciones de los efectos. Construir la tabla del anlisis de varianza. Repetir el problema 6-1 suponiendo que ABC se confundi con los bloques en todas las rplicas. Suponga que en el problema 6-7ABCD se confundi en la rplica I yABC se confundi en la rplica 11. Realizar el anlisis estadstico de este diseo. Construir un diseo 23 conABC confundido en las dos primeras rplicas y BC confundido en la tercera rplica. Delinear el anlisis de varianza y comentar la informacin obtenida.

Diseos factoriales fraccionados de dos niveles

8..1 INTRODUCCIN
Cuando el nmero de factores de un diseo factorial Z" se incrementa, el nmero de corridas necesarias para realizar una rplica completa del diseo rebasa con rapidez los recursos de la mayora de los expermentadores. Por ejemplo, una rplica completa de un diseo 26 requiere 64 corridas. En este diseo, slo 6 de los 63 grados de libertad corresponden a los efectos principales, y slo 15 a las interacciones de dos factores. Los 42 grados de libertad restantes se asocian con las interacciones de tres o ms factores. Si el experimentador puede suponer razonablemente que ciertas interacciones de orden superior son insignificantes, es posible obtener informacin de los efectos principales y las interacciones de orden inferior corriendo nicamente una fraccin del experimento factorial completo. Estos diseos factoriales fraccionados se encuentran entre los tipos de disefios de uso ms generalizado en el diseo de productos y procesos y en el mejoramiento die procesos. Una de las principales aplicaciones de los disefios factoriales fraccionados es en los experimentos de tamizado o exploracin. Se trata de experimentos en los que se consideran muchos factores y el objetivo es identificar aquellos factores (en caso de haberlos) que tienen efectos grandes. Los experimentos de tamizado suelen realizarse en las etapas iniciales de un proyecto, cuando es posible que muchos de los factores considerados en un principio tengan un efecto reducido o nulo sobre la respuesta. Entonces los factores que se identifican como importantes se investigancon mayor detalle en experimentos subsecuentes. El uso exitoso de los disefios factoriales fraccionados se basa en tres ideas clave:

1. Elprincipiode efectos esJXUCidos o escasez deefectos. Cuando hay varias variables, es posible que el sistema o proceso est dominado principalmente por algunos de los efectos principales y las interacciones de orden inferior. 2. La propiedad de proyecci6n. Los diseos factoriales fraccionados pueden proyectarse en diseos ms fuertes (ms grandes) en el subconjunto de los factores significativos. 3. Experimentaci6n secuencial. Es posible combinar las corridas de dos (o ms) disefios factoriales fraccionados para ensamblar secuencialmente un diseo ms grande para estimar los efectos de los factores y las interacciones de inters.

303

304

CAPfTIJLO 8 DISEOS FACTORIALES FRACCIONAOOS DE DOS NIVELES

Este captulo se enfoca en estos principios, los cuales se ilustran con varios ejemplos.

8..2

LA FRACCIN UN MEDIO DEL DISEO 2k

Considere una situacin en la que tres factores, cada uno con dos niveles, son de inters, pero los experimentadores no estn en posicin de correr las 23 8 combinaciones de tratamientos. Sin embargo, pueden llevar a cabo cuatro corridas. Esto sugiere una fraccin un medio de un diseo 23 Puesto que el diseo contiene 23--1 4 combinaciones de tratamientos, es comn llamar diseo 23 -1 a una fraccin un medio del diseo 23 En la tabla 8-1 se muestra la agrupacin de signos positivos y negativos del diseo 23 Suponga que se seleccionan las cuatro combinaciones de tratamientos a, b, e yabe como la fraccin un medio con la que se trabajar. Estas corridas se muestran en la parte superior de la tabla 8-1 y en la figura 8-1a. Observe que el diseo 23--1 se forma seleccionando slo las combinaciones de tratamientos que tienen signo positivo en la columnaABC. Por lo tanto, aABe se le llama el generador de esta fraccin particular. En ocasiones se har referencia a un generador, por ejemploABC, como una palabra. Adems, la columna identidad I tambin es siempre positiva, por lo que a

I=ABC
se le llama la relaci6n de definici6n del diseo. En general, la relacin de definicin de un diseo factorial fraccionado ser siempre el conjunto de todas las columnas que son iguales a la columna identidad l. Las combinaciones de tratamientos del diseo 23--1 producen tres grados de libertad que pueden usarse para estimar los efectos principales. Con referencia a la tabla 8-1, se observa que las combinaciones lineales de las observaciones usadas para estimar los efectos principales de A, B Y e son

fA
lB

= Ha-b-e+abe)

fe

=H-a+b-c+abe) =H-a-b+e+abe)

Tambin es sencillo verificar que las combinaciones lineales de las observaciones usadas para estimar las interacciones de dos factores son

l Be =.1(a-b-e+abe) 2
f

AC

=H-a+b- e+abe)

lAB =!(-a-b+c+abc)

Tabla 81

Signos positivos y negativos del diseo factoral Z' Efecto factorial

Combinacin de tratamientos

a b e abe ab ae be (1)

+ + + + + + + +

A +

AB

AC

+ + + +

+ + +

+ + + +

+ +

+ + + +

BC +

+ + +

ABC + + + +

+
+

82 LAFRACCiN UN MEDIO DEL DISEO 2k


abe

305

C"'---t--r'
I

I
......

......

......~-a

al Lafraccin principal, 1- +ABC

be

......
(1)

......

......

I I I 1 __ -

ab

b) Lafraccin alterna, 1 - -ABC

Figura 81 Las dos fracciones un medio del diseo 2'.

Por lo tanto, fA = f BC, f B = f AC Yfe = fAB; por consiguiente, es imposible diferenciar entreA y BC, entre B y AC y entre C yAB. De hecho, cuando se estiman A, By C, se estn estimando enrealidadA + BC, B + AC y C + AB. A dos o ms efectos que tienen esta propiedad se les llama alias. En el ejemplo tratado aqu,A y BC son alias, B yAC son alias y C y AB son alias. Esto se indica con la notacin , -+ A + BC, .lB -+ B + AC y .le -+ C + AB. La estructura de los alias para este diseo puede determinarse con facilidad utilizando la relacin de definicin 1 =ABe. Al multiplicar cualquier columna (o efecto) por la relacin de definicin se obtienen los alias de esa columna (o efecto). En el ejemplo tratado aqu se encuentra que el alias de A es A/= AABC= A 2BC o, puesto que el cuadrado de cualquier columna es la identidad 1,
A=BC

De manera similar, se encuentra que los alias de B y C son B/=BABC


B=AB 2C=AC
y

C/=CABC C= ABC 2 = AB

A esta fraccin un medio, con 1 = +ABC, suele llamrsele la fraccin principal. Suponga ahora que se eligi la otra fraccin un medio, es decir, las combinaciones de tratamientos de la tabla 8-1 asociadas con los signos negativos de la columna ABe. Esta fraccin un medio alterna o com-

306

CAPITuLO 8 DISEOS FAeTORIALES FRACCIONADOS DE DOS NIVELES

plementaria (la cual se compone de las corridas (1), ab, ae y be) se ilustra en la figura 8-lb. La relacin de definicin de este diseo es
I=-ABC

De la combinacin lineal de las observaciones, por ejemplo l' A' l' BY l' o de la fraccin alterna se obtiene

r. -A-BC
l~ """"B-AC l~ """"C-AB

Por 10 tanto, cuando se estiman A, B YC con esta fraccin particular, en realidad se estn estimando A-BC, B-AC y C-AB. En la prctica, no importa cul de las fracciones se usa. Ambas fracciones pertenecen a la misma familia; es decir, las dos fracciones un medio forman un diseo 23 completo. Esto puede observarse con facilidad con referencia a los incisos a y b de la figura 8-l. Suponga que despus de correr una de las fracciones un medio del diseo 23, tambin se corri la otra. Por lo tanto, se cuenta ahora con las ocho corridas asociadas con el diseo 23 completo. Pueden obtenerse entonces las estimaciones sin alias de todos los efectos analizando las ocho corridas como un diseo 23 completo en dos bloques de cuatro corridas cada uno. Esto tambin podra hacerse sumando y restando la combinacin lineal de los efectos de las dos fracciones individuales. Por ejemplo, considere lA """" A + BC y 1'A """" A - Be. Esto implica que
t(lA +l~)= t(A+BC+A- BC)"""" A
y que

tUA -l~)=HA+BC-A+BC)""""BC

Por 10 tanto, para los tres pares de combinaciones lineales se obtendra lo siguiente:

A B

A B

BC

AC
AB

Resolucin del diseo Al diseo 23-1 precedente se le llama diseo de resolucin DI. En este diseo, los efectos principales son alias de las interacciones de dos factores. Un diseo es de resolucin R cuando ningn efecto del factor p es alias de otro efecto que contiene menos de R -p factores. Por lo general se emplea un subndice con un numeral romano para denotar la resolucin del diseo; por 10 tanto, la fraccin un medio del diseo 23 con la relacin de definicin 1 = ABC (o I = -ABC) es un diseo 2~jI1. Los diseos de resolucin III, IV YV son particularmente importantes. A continuacin se presentan las definiciones de estos diseos y un ejemplo de cada uno: 1. Diseos de resoluci6n [JI. Se trata de diseos en los que ninguno de los efectos principales es alias de ningn otro efecto principal, pero los efectos principales son alias de las interacciones de dos factores, y algunas de las interacciones de dos factores pueden ser alias entre s. El diseo 23-1 de la tabla 8-1 es un diseo de resolucin III (2~1). 2. Diseos de resoluci6n Iv. Se trata de diseos en los que ninguno de los efectos principales es alias de ningn otro efecto principal ni de las interacciones de dos factores, pero las interacciones de

8-2 LA FRACCIN UN MEDIO DEL DISEO 2~

307

dos factores son alias entre s. Un diseo 24-1 con 1


(2~1).

= ABCD es un

diseo de resolucin IV

3. Diseos de resolucin V. Se trata de diseos en los que ninguno de los efectos principales ni de las interacciones de dos factores son alias de otro efecto principal o interaccin de dos factores, pero las interacciones de dos factores son alias de las interacciones de tres factores. Un diseo 25- 1 con 1 = ABCDE es un diseo de resolucin V (2~-1).

En general, la resolucin de un diseo factorial fraccionado de dos niveles es igual al menor nmero de letras en cualquier palabra de la relacin de definicin. Por consiguiente, los diseos precedentes podran denominarse diseos de tres, cuatro y cinco letras, respectivamente. Por lo comn, es preferible emplear diseos fraccionados que tengan la resolucin ms alta posible que sea consistente con el grado de fraccionamiento requerido. Entre ms alta sea la resolucin, menos restrictivos sern los supuestos que se requieren respecto de cules de las interacciones son insignificantes para obtener una interpretacin nica de los datos. Construccin de fracciones un medio Una fraccin un medio del diseo 2k de la resolucin ms alta puede construirse apuntando el diseo bsico, que consta de las corridas de un diseo factorial Z:' completo, y agregndole despus el factor k-si mo identificando sus niveles positivo y negativo con los signos positivo y negativo de la interaccinABC ... (K -1) del orden ms alto. Por 10 tanto, el diseo factorial fraccionado 2~~1 se obtiene apuntando el diseo 22 completo como diseo bsico e igualando despus el factor C con la interaccinAB. La fraccin alterna se obtendra igualando el factor con la interaccin -AB. Este enfoque se ilustra en la tabla 8-2. Observe que el diseo bsico siempre tiene el nmero correcto de corridas (renglones), pero le falta una columna. El generador 1 = ABe ...K se resuelve entonces para la columna faltante (K), de tal modo que K =ABe ...(K - 1) define el producto de los signos positivos y negativos que deber usarse en cada rengln para producir los niveles del factor k-simo. Observe que podra usarse cualquier efecto de interaccin para generar la columna del factor k-si mo. Sin embargo, al utilizarse cualquier efecto que no seaABC ... (K -1), no se producir el diseo con la resolucin ms alta posible. Otra forma de visualizar la construccin de una fraccin un medio es mediante la particin de las corridas en dos bloques con la interaccin de orden ms alto ABC ...K confundida. Cada bloque es un diseo factorial fraccionado 2k - 1 con la resolucin ms alta.

Proyeccin de fracciones en diseos factoriales Cualquier diseo factorial fraccionado de resolucin R contiene diseos factoriales completos (posiblemente diseos factoriales con rplicas) en cualquier subconjunto de R - 1 factores. ste es un concepto importante y til. Por ejemplo, si un experimentador tiene varios factores de inters potencial pero piensa
Tabla8.2 Las dos fracciones un medio del disefio 23 Diseo factorial 22 completo (diseo bsico) A Corrida B A
1

2~',I=ABC

2i~I, 1 = -ABC

C=AB

C=-AB

2 1
4

+ + + +

+ +

+ +

+ + + + +

+ +

308

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

"'B 1
1
1 1

/ /
/

~
/c

===~=
j/ /

/ / I
/.

-/j

b/
I

/ / /

--7--

--7--- e / I I / I I

-7r-- I
11-~_ _

'7"--

abe

I J ___ I

I I I I I

0;,.--+H,, V

Figura 82 Proyeccin de un diseo 2~' en tres diseos 22

que slo R - 1 de ellos tienen efectos importantes, entonces un diseo factorial fraccionado de resolucin R es la eleccin de diseo apropiada. Si el experimentador est en lo correcto, el diseo factorial fraccionado de resolucin R se proyectar en un diseo factorial completo en los R - 1 factores significativos. Este proceso se ilustra en la figura 8-2 para el diseo 2:~', el cual se proyecta en un diseo 22 en cada subconjunto de dos factores. Puesto que la mxima resolucin posible de una fraccin un medio del diseo 2k es R = k, todos los diseos 2k- 1 se proyectarn en un factorial completo en (k -1) cualquiera de los k factores originales. Adems, un diseo 2k- 1 puede proyectarse en dos rplicas de un factorial completo en cualquier subconjunto de k - 2 factores, cuatro rplicas de un factorial completo en cualquier subconjunto de k - 3 factores, etctera.

EJEMPLO 8... 1 ..

111

111

*'

111

111

'"

111

111

'"

"

111

'"

111

Considere el experimento del ndice de filtracin del ejemplo 6-2. El diseo original, ilustrado en la tabla 6-10, es una sola rplica del diseo 24 En ese ejemplo se encontr que los efectos principales deA, C y D Y las interaccionesAC y AD eran diferentes de cero. Se retoma ahora este experimento y se simula lo que habra ocurrido si se hubiera corrido una fraccin un medio del diseo 24 en vez del diseo factorial completo. Se usar el diseo 24-1 con 1 = ABCD, ya que esta eleccin del generador dar como resultado un diseo con la resolucin ms alta posible (IV). Para construir el diseo, primero se apunta el diseo bsico, el cual es un diseo 23, como se muestra en las tres primeras columnas de la tabla 8-3. Este diseo bsico tiene el nmero necesario de corridas (ocho) pero slo tres columnas (factores). Para encontrar los niveles del cuarto factor, se resuelve 1 =ABCD paraD, oD =ABC. Parlo tanto, el nivel deD de cadacorrda
Tabla 8.3 Corrida El disefio2t 1 con la relacin de definicin 1= ABCD Diseo bsico A B C

D ::ABC

Combinacin de tratamientos
(1)

ndice de filtracin
45

1
2 3 4 5

+ + + +

+
+ +

+ + + + + + + +

6
7 8

ad bd ah ed ae be
abcd

100
45 65 75

60 80 96

82 LA FRACCiN UN MEDIO DEL DISEO


D
+

309

abcd 96
cd-75

",.--",. ",.

I I I I

I I I
bd-45~
",. ",. ",.

__

ad -100

Figura

8~3

El diseo 2~1 para el experimento del ndice de filtracin del ejemplo 8-1.

es el producto de los signos positivos y negativos de las columnas A, B y e. El proceso se ilustra en la tabla 83. Puesto que el generador ABCD es positivo, este diseo 2~1 es la fraccin principal. El diseo se ilustra grficamente en la figura 8-3. Utilizando la relacin de definicin, se observa que cada uno de los efectos principales es alias de una interaccin de tres factores; es decir, A =A 2BCD BCD,B =AB2CD =ACD,C =ABC2D =ABDyD = ABCD2 = ABe. Adems, cada interaccin de dos factores es alias de otra interaccin de dos factores. Estas relaciones de los alias sonAB = CD,AC = BD YBC = AD. Los cuatro efectos principales ms los tres pares de alias de interacciones de dos factores representan los siete grados de libertad del diseo. En este punto, normalmente se aleatorizaran las ocho corridas y se llevara a cabo el experimento. Puesto que se ha corrido ya en diseo 24 completo, simplemente se seleccionan los ocho ndices de filtracin observados del ejemplo 6-2 que corresponden a las corridas del diseo 2~1 . Estas observaciones se muestran en la ltima columna de la tabla 8-3, as como en la figura 8-3. En la tabla 8-4 se muestran las estimaciones de los efectos obtenidas de este diseo 2~1. Para ilustrar los clculos, la combinacin lineal de las observaciones asociadas con el efecto de A es

fA

= t(-45+100- 45+65-75+60- 80+96)= 19.00-+ A+BCD

mientras que para el efecto AB se obtendra


f
AB

= t(45-100-45+65+75- 60- 80+96)= -1.00~ AB+CD

Por la inspeccin de la informacin de la tabla 8-4, no es irrazonable concluir que los efectos principales de A, C y D son grandes. Adems, si A, C y D son los efectos principales importantes, entonces es lgico concluir que las dos cadenas de alias de interaccionesAC + BD y AD + BC tienen efectos grandes, ya que

Tabla 84

Estimaciones de los efectos

y los alias del ejemplo 8-1 a Estimacin Estructura de los alias

"B = le = e; =

lA

;:: 19.00

lAl} ~ AD+ Be "Los efectossignificativos se indicanen negritas.

1.50 14.00 16.50 lAB ;; -1.00 lAC ;; -18.50 lAl};; 19.00

e,

A+BCD B+ ACD le -. C+ ABD


lA
~AC+BD

lD~D+ABC

lAB ~ AB+ CD
lAC

310

CAPTULO 8
75

DISEOS FACTORIALES FRACCIONAIXJS DE DOS NIVELES


96

60
Alta

I I I
I

Baja

: ...- ...-

...- ...-

...-

...- ...-

46 -----.:---

(temperatura)

Figura 8-4 Proyeccindel diseo y D para el ejemplo 8-1.

2~1

en un diseo 23 enA,

las interaccionesAC y AD tambin son significativas. En otras palabras, siA, C y D son significativos, entonces lo ms posible es que las interacciones significativas seanAC y AD. Se trata de una aplicacin de la navaja de Ockham (en honor de Guillermo de Ockham), un principio cientfico que establece que cuando uno se confronta con varias interpretaciones posibles de un fenmeno, la interpretacin ms simple suele ser la correcta. Observe que esta interpretacin concuerda con las conclusiones del anlisis del diseo 24 completo del ejemplo 6-2. Puesto que el factor B no es significativo, puede sacarse de consideracin. Por consiguiente, este diseo 2~1 puede proyectarse en una sola rplica del diseo 23 en los factores A, C y D, como se muestra en la figura 8-4. El examen visual de esta grfica de cubo nos hace sentimos ms cmodos con las conclusiones a las que se lleg antes. Observe que si la temperatura (A) est en el nivel bajo, la concentracin (C) tiene un efecto positivo grande, mientras que si la temperatura est en el nivel alto, la concentracin tiene un efecto muy pequeo. Esto se debe probablemente a una interaccinz'. Adems, si la temperatura est en el nivel bajo, el efecto de la velocidad de agitacin (D) es insignificante, mientras que si la temperatura est en el nivel alto, la velocidad de agitacin tiene un efecto positivo grande. Esto se debe probablemente a la interaccin AD que se identific de manera tentativa unos prrafos antes. Con base en el anlisis anterior, puede obtenerse ahora un modelo para predecir el ndice de filtracin en la regin experimental. Este modelo es

y= '130 +31Xl +33 X3 +34 X4 +313 X1X3

+3l4 X1 X4

dondex.,, YX4 son variables codificadas (-1 s XI ~ +1) que representan aA, Cy D, y las '13 son coeficientes de regresin que pueden obtenerse a partir de las estimaciones de los efectos como se hizo anteriormente. Por lo tanto, la ecuacin de prediccin es

y= 70.75+(19~OO)

Xl

+C4~OO) x 3 +C 6:

O) x

+(-1~.50) X 1X3 +C9~OO) X 1X4

Recuerde que la ordenada al origen Po es el promedio de todas las respuestas en las ocho corridas del diseo. Este modelo es muy similar al que result del diseo factorial 2/c completo del ejemplo 6-2.

8-Z LA FRACCIN UN MEDIO DEL DISEO Zk

311

EJEMPLO 8..2 ..... . """.. . . . . . "". . . """. . . . . . . . . . """. . . . . "". . . . . """. . . . . . """". Un diseio 25-1 usado para mejorar un proceso
Se investigaron cinco factores en un proceso de manufactura de un circuito integrado en un diseo 25- 1 con el objetivo de mejorar el rendimiento del proceso. Los cinco factores fueron A = ajuste de apertura (pequea, grande), B = tiempo de exposicin (20% abajo del nominal, 20% arriba del nominal), C = tiempo de desarrollo (30 s, 45 s), D = tamao de la mscara (pequea, grande) y E = tiempo de grabado (14.5 min, 15.5 min). En la tabla 8-5 se muestra la construccin del diseo 25- 1 Observe que el diseo se construy apuntando el diseo bsico que tiene 16 corridas (un diseo 24 en A, B, Cy D), seleccionando ABCDE como generador, y ajustando despus los niveles del quinto factor E =ABCD. En la figura 8-5 se presenta una representacin geomtrica del diseo. La relacin de definicin del diseo es 1 = ABCDE. Por consiguiente, todos los efectos principales son alias de una interaccin de cuatro factores (por ejemplo, fA - A + BCDE), y cada una de las interacciones de dos factores son alias de una interaccin de tres factores (por ejemplo, fM -+ AB + CDE). Por lo tanto, el diseo es de resolucin V. Se esperara que este diseo 25-1 proporcionara excelente informacin respecto de los efectos principales y las interacciones de dos factores. La tabla 8-6 contiene las estimaciones de los efectos, las sumas de cuadrados y los coeficientes del modelo de regresin para los 15 efectos de este experimento. En la figura 8~6 se presenta la grfica de probabilidad normal de las estimaciones de los efectos de este experimento. Los efectos principales deA, By C y la interaccinAB son grandes. Recuerde que, debido a los alias, estos efectos son en realidad A + BCDE, B + ACDE, C + ABDE yAB + CDE. Sin embargo, puesto que parece plausible que las interacciones de tres factores y de rdenes superiores sean insignificantes, uno siente seguridad en concluir que slo A, E, C y AB son los efectos importantes. En la tabla 8-7 se resume el anlisis de varianza de este experimento. La suma de cuadrados del modelo es SSModeO =SSA + SSB + SSc + SSAB = 5747.25, Yesto explica ms de 99% de la variabilidad total del rendimiento. En la figura 8-7 se presenta la grfica de probabilidad normal de los residuales

Tabla 85

Un diseo 25-1 para el ejemplo 8-2

Diseobsico Corrida 1 2 3 4 5 6
7
8 9 10

E=ABCD

+ + + + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + +

+ + + +

11

12
13

14 15 16

+ + + +

Combinacin de tratamientos e a b abe e aee bee abe d ade bde abd ede

Rendimiento
8

9 34 52 16 22 45 60 6
10

acd
bed abcde

30 50 15 21
44

63

312

CAPTULO 8 DISEOS FACTORIALES FRACCIONAOOS DEDOS NIVELES


D
bce
~

45

abede '" 63

I
+
/' /'

I I
/'

I I
abe ~ 52
/'

/' bde "'30

. . J --ade
D

10

abe '" 60

beb",44

I
I I
/'

.......

.......

0'=9

ckB
A Figura 8-5 El diseo 2~-1 del ejemplo 8-2.

Tabla 8-6

Efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-2

Variable
A B C D E

Variable Promedio global


A B C D E AB

Nombre Apertura Tiempo de desarrollo Tiempo de exposicin 'Iamao de la mscara Tiempo de grabado Coeficiente de regresin
30.3125 5.5625 16.9375 5.4375 -0.4375 0.3125 3.4375 0.1875 0.5625 0.5625 0.3125 -0.0625 -0.0625 0.4375 0.1875 -0.6875

Nivel-l
~1.000

Nivel +1
1.000 1.000 1.000 1.000 1.000

-1.000 ~1.000

-1.000
-1.000

Efecto estimado
11.1250 33.8750 10.8750 -0.8750 0.6250 6.8750 0.3750 1.1250 1.1250 0.6250 -0.1250 -0.1250 0.8750 0.3750 -1.3750

Suma de cuadrados
495.062 4590.062 473.062 3.063 1.563 189.063 0.563 5.063 5.063 1.563 0.063 0.063 3.063 0.563 7.563

AC
AD AE BC

BD

BE

CD CE DE

99
B

e
95 90

5
o ~
x
I

10

;... 20
!:'.
ii

e
AB

eA eC

SO
70
o o
~...

30

50 c: .., 70
'" :5!
:iS SO
90 95 99
O

50 '; 30 20 10 5

10

15

20

25

30

Estimaciones de los efectos

Figura 86 Grfica de probabilidad normal de los efectos del ejemplo 8-2. Tabla 8.7 Anlisis de varianza del ejemplo 8-2 Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio

Fo
193.20 1791.24 184.61 73.78

ValorP

A (Apertura) B (Tiempo de exposicin) e (Tiempo de desarrollo) AB Error Thtal

495.0625 4590.0625 473.0625 189.0625 28.1875 5775.4375

1 1 1 1
11

495.0625 4590.0625 473.0625 189.0625 2.5625

<0.0001 <0.0001 <0.0001 <0.0001

15

99

e
5
95

~
I

10 20

90 80

;-,
ii

!:'. 30

70 ~ :s 80
al

E o e ..,
11 o

50

g SO';
~...

70

30 20 10 5

.t 90

95

99
-3 -2 -1
O
Residuales

Figura 87 Grficade probabilidadnormalde losresidualesdel ejemplo8-2.

313

314
2

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DEDOS NIVELES

;;;J -e O 'ij

Gj

.'"
-1

a:

-2

-3 L-_.L-_ _'---_.-.....I_ _----L_ _---I..._ _-J..._ _ 40 50 60 10 20 30


Rendimiento predicho

Figura 8-8 Grfica de los residuales contra el rendimiento predicho para el ejemplo 8-2.

y la figura 8-8 es una grfica de los residuales contra los valores predichos. Ambas grficas son satisfactorias. Los tres factoresA, B ye tienen efectos positivos grandes. La interaccin apertura-tiempo de exposicin oAB se grafica en la figura 8-9. Esta grfica confirma que el rendimiento es ms alto cuando tanto A . como B estn en el nivel alto.

63

B+

_"!

2 e

'ii

E
c:

B+

J!

B"
6LBajo

...... BA
Alto

Figura 89 Interaccinapertura-tiempo de exposicindel ejemplo 8-2.

8-2 LA FRACCIN UN MEDIO DEL DISEl::~O 2k


61.5

315

32.0 + r- t J - - - - . L - - -..

Figura 810 Proyeccin del diseo 2~-1 del ejemplo 82 en dos rplicas de un diseo 23 en los factores A, B y C.

El diseo 25- 1 se reducir a dos rplicas de un diseo 23 en tres cualesquiera de los cinco factores originales. (Observar la figura 8-5 ayuda a visualizar esto.) La figura 8-10 es una grfica de cubo en los factores A, By C con los rendimientos promedio superpuestos en los ocho vrtices. Es evidente por la inspeccin de la grfica de cubo que los rendimientos ms altos se consiguen conA, By C en el nivel alto. Los factores D y E tienen un efecto pequeo sobre el rendimiento promedio del proceso y pueden ajustarse en los valores que optimicen otros objetivos (como el costo).
.. .. .. .. D .

Secuencias de diseos factoriales fraccionados El uso de los diseos factoriales fraccionados lleva con frecuencia a una gran economa y eficiencia en la experimentacin, en particular si las corridas pueden hacerse secuencialmente. Por ejemplo, suponga que se estn investigando k 4 factores (2 4 16 corridas). Casi siempre es preferible correr un diseo fraccionado 2~1 (ocho corridas), analizar los resultados y despus decidir cul es la mejor serie de corridas que deber correrse despus. Si es necesario resolver ambigedades, siempre puede correrse la fraccin alterna y completar el diseo 24 Cuando se usa este mtodo para completar el diseo, ambas fracciones un medio representan bloques del diseo completo con las interacciones de orden superior confundidas con los bloques (en este casoABCD estara confundida). Por lo tanto, la experimentacin secuencial tiene como resultado la prdida de informacin slo en la interaccin de orden ms alto. Su ventaja es que en muchos casos se saca informacin suficiente de la fraccin un medio para proceder a la siguiente etapa de la experimentacin, lo cual podra implicar la incorporacin o eliminacin de factores, el cambio de las respuestas, o la variacin de algunos de los factores en nuevos rangos. Algunas de estas posibilidades se ilustran grficamente en la figura 8-11.

'Ej"EMPLO 8111'3

..

..

..

..

..

"

..

..

..

..

..

"

"

Considere nuevamente el experimento del ejemplo 8-1. Se ha usado un diseo 2~1 y se ha hecho la identificacin tentativa de los tres efectos principales grandes: A, C y D. Hay dos efectos grandes asociados con interacciones de dos factores,AC + BD y AD + Be. En el ejemplo 8-2 se utiliz el hecho de que el efecto principal de B era insignificante para concluir de manera tentativa que las interacciones importantes eran

316

CAPtruLo 8 DISEOS FACTORIALES FRACCIONADOS DEDOSNIVELES

I I I

I I
I

--~~

,,
Dise\O inicial

;...---

al Moverse a une nueva localizacin pera explorar una tendencia aparente a la respuesta

b) Agregar otra fraccin pera resolver las ambigiiedades de la fraccin original

J------/

fl Hacer un aumento para


modelar la curvatura aparente

e) Reascalar algunos factor'" porque pueden haberse hecho veriar en los rangos inapropiados

;...--//
Temperatura ___

: I

;f .<...#<f

e l Hacer una rplica para mejorar


las estimaciones de los efectos o porque algunas corridas se hicieron incorrectamente

dl Eliminar V agregar factores porque el factor original correspondiente a la velocidad de alimentacin del catalizador es insignificante

Figura 811 Posibilidades para el seguimiento de la experimentacin despus de un experimento factorial fraccionado [adaptado de Box ("Sequential Experimentation and Sequential Assembly of Designs") con permiso del editor].

AC y AD. En ocasiones el experimentador tendr que procesar conocimientos que puedan ayudarle a dis-

criminar entre las interacciones que probablemente sean importantes. Sin embargo, siempre es posible aislar la interaccin significativa corriendo la fraccin alterna, dada por 1 =-ABCD. Es directa la demostracin de que el diseo y las respuestas son los siguientes:
Diseo bsico Corrida A B

D=-ABC

Combinacin de tratamientos
d

ndice de filtracin

1
2 3 4 5
6 7 8

+ + + +

+ + + + + + + +

43
71

a
b

48

abd
e

104
68

+ + + +

acd bcd abe

86
70 65

83 LAFRACCIN UNCUARTO DEL OlSElilO z

317

Las combinaciones lineales de las observaciones obtenidas a partir de esta fraccin alterna son l/A = 24.25 .... A - BCD
l~ l~

4.75-+B-ACD

5.7S-+C-ABD l~ = 12.7S -+ D- ABC l'AB = 1.25 AB- CD l~c =-17.75 AC-BD l'.w = 14.25 AD- BC
Estas estimaciones pueden combinarse con las que se obtuvieron de la fraccin un medio original para obtener las siguientes estimaciones de los efectos:

A B C D

21.63 ~A 3.13 ~B
9.88 .... C

-2.63 .... BCD


-1.63~ACD 4.13~ABD

AB
AC

14.63 ~D 0.13 ~AB


-18.13 .... AC

1.88 .... ABC

-1.13 ~ CD
~.38~BD

AD

16.63 ~AD

2.38 ~BC

Estas estimaciones concuerdan exactamente con las del anlisis original de los datos como una sola rplica de un diseo factorial 24, como se consigna en el ejemplo 6-2. Evidentemente, son las interaccionesAC y AD las que son grandes.

.... ........... .............. .......... ......... . .. ......................

Agregar la fraccin alterna a la fraccin principal puede considerarse como un tipo de experimento de confirmacin, por cuanto proporciona informacin que permitir fortalecer las conclusiones iniciales acerca de los efectos de la interaccin de dos factores. En la seccin 8-5 se investigarn otros aspectos de la combinacin de diseos factoriales fraccionados para aislar las interacciones. En ocasiones un experimento de confirmacin no es tan elaborado como ste. Por ejemplo, podra usarse la ecuacin del modelo para predecir la respuesta en un punto de inters dentro del espacio del diseo (no uno de los puntos del diseo actual), correr despus realmente ese ensayo (quiz varias veces) y usar la comparacin entre la respuesta predicha y la observada para confirmar los resultados.

8..3

LA FRACCIN UN CUARTO DEL DISEO 2k

Para un nmero moderadamente grande de factores, con frecuencia son tiles fracciones menores del diseo Considere una fraccin un cuarto del diseo 2k Este diseo contiene 2k- 2 corridas y es comn llamarlo diseo factorial fraccionado 2A- 1 El diseo 2k- 2 puede construirse apuntando primero un diseo bsico compuesto por las corridas asociadas con un diseo factorial completo en k - 2 factores y asociando despus las dos columnas adicionales con las interacciones elegidas apropiadamente que incluyan los primeros k - 2 factores. Por lo tanto,

318

CAPfroLO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

una fraccin un cuarto del diseo 2k tiene dos generadores. Si P YQ representan los generadores escogidos, entonces a I = P e I Q se les llama las relaciones generadoras del diseo. Los signos de P y Q ( + o -) determinan cul de las fracciones un cuarto se produce. Las cuatro fracciones asociadas con la eleccin de los generadores Py Q pertenecen a la misma familia. La fraccin para la que tanto P como Q son positivas es la fraccin principal. La relacin de definicin completa del diseo est compuesta por todas las columnas que son iguales a la columna identidad 1. stas constarn de P, Q y su interaccin generalizadaPQ; es decir, la relacin de definicin es I = P Q = PQ. A los elementos P, Q y PQ de la relacin de definicin se les denomina palabras. Los alias de cualquier efecto se obtienen mediante la multiplicacin de la columna de ese efecto por cada palabra de la relacin de definicin. Evidentemente, cada efecto tiene tres alias. El experimentador deber estar atento al elegir los generadores para que los efectos potencialmente importantes no sean alias entre s. Como un ejemplo, considere el diseo 26-2. Suponga que se escogen I = ABCE e I = BCDF como los generadores del diseo. Entonces la interaccin generalizada de los generadores ABCE y BCDF es ADEF; por lo tanto, la relacin de definicin completa de este diseo es

I = ABCE = BCDF = ADEF


Por consiguiente, se trata de un diseo de resolucin IV. Para encontrar los alias de cualquier efecto (por ejemplo deA), se multiplica ese efecto por cada palabra de la relacin de definicin. ParaA, esto produce

A = BCE = ABCDF = DEF


Es sencillo verificar que todos los efectos principales son alias de interacciones de tres y cinco factores, mientras que las interacciones de dos factores son alias entre s y de interacciones de rdenes superiores. Por lo tanto, cuando se estimaA, por ejemplo, en realidad se est estimando A + BCE + DEF + ABCDF. En la tabla 8-8 se muestra la estructura completa de los alias de este diseo. Si las interacciones de tres factores y de rdenes superiores son insignificantes, este diseo produce estimaciones claras de los efectos principales. Para construir este diseo se anota primero el diseo bsico, el cual consiste en las 16 corridas para un diseo completo 26-2 = 24 enA, B, C y D. Despus se aaden los dos factores E y F, asociando sus niveles ms y menos con los signos ms y menos de la interaccinABC y BCD, respectivamente. Este procedimiento se muestra en la tabla 8-9. Otra forma de construir este diseo es deduciendo los cuatro bloques del diseo 26 con ABCE y BCDF confundidas y eligiendo despus el bloque con las combinaciones de tratamientos que son positivas paraABCE y BCDF. Se tratara de un diseo factorial fraccionado 26-2 con relaciones generadorasI = ABCE e I = BCDF, y puesto que los dos generadoresABCE y BCDF son positivos, se trata de la fraccin principal.

Tabla 8.8 Estructura de los alias del diseo con 1 = ABCE = BCDF = ADEF

2;2

A = BCE = DEF = ABCDF B = ACE = CDF =ABDEF C =ABE = BDF = ACDEF D = BCF =AEF = ABCDE E =ABC =ADF = BCDEF F = BCD =ADE ABCEF ABD = CDE =ACF = BEF ACD = BDE ABF = CEF

AB = CE = ACDF = BDEF AC = BE =ABDF = CDEF AD = EF = BCDE =ABCF AE = BC = DF =ABCDEF AF = DE = BCEF =ABCD BD= CF =ACDE =ABEF BF = CD =ACEF =ABDE

8-3 lA FRACCIN UN CUARTO DEL DISEO 2"

319

Tabla 89 Construccin del diseo Ztyz con los generadores 1 = ABCE e 1 = BCDF Disefio bsico
Corrida

E=ABC

F=BCD

1 2 3 4 5 6
7

+ + + + + + + +

+ + + + + + + +

+ + + + + + + + + + + +

+ + + + + +

8
9

10
11

12 13 14 15 16

+ + + +

+ + + + + + + +

+ +

Hay, desde luego, tres fracciones alternas de este diseo 2~2 particular. Se trata de las fracciones con las relaciones generadoras 1 =ABCE el = -BCDF; 1 = -ABCE el = BCDF; el = -ABCE el = -BCDF. Es sencillo construir estas fracciones con el mtodo que se muestra en la tabla 8w9. Por ejemplo, si quiere encontrarse la fraccin para la que 1 = ABCE el = -BCDF, entonces en la ltima columna de la tabla 8-9 se hace F = -BCD, Yla columna de los niveles del factor F queda como

++----++--++++-La relacin de definicin completa de esta fraccin alterna es 1 =ABCE = -BCDF = -ADEF. Ahora ciertos signos en la estructura de los alias de la tabla 8-9 se han cambiado; por ejemplo, los alias deA son A =BCE =-DEF =-ABCDF. Por lo tanto, la combinacin lineal de las observaciones lA estima en realidad A + BCE - DEF - ABCDF. Por ltimo, observe que el diseo factorial fraccionado 2~2 se proyectar en una solarplica de un diseo 24 en cualquier subconjunto de cuatro factores que no sea una palabra de la relacin de definicin. Tambinse pliega en una fraccin un medio con una rplica de un diseo 24 en cualquier subconjunto de cuatro factores que sea una palabra de la relacin de definicin. Por lo tanto, el diseo de la tabla 8-9 se convierte en dos rplicas de un diseo 24-1 en los factoresABCE, BCDFyADEF, porque stas son las palabras de la relacin de definicin. Hay otras 12 combinaciones de los seis factores, comoABCD,ABCF, etc., para las que el diseo se proyecta en una sola rplica del diseo 24 Este diseo tambin se pliega en dos rplicas de un diseo 23 en cualquiersubconjunto de tres de los seis factores o en cuatro rplicas de un diseo 22 en cualquier subconjunto de dos factores. En general, cualquier diseo factorial fraccionado 2k- 2 puede plegarse en un diseo factorial completo o bien en un dseo factorial fraccionado en algn subconjunto de r :S k - 2 de los factores originales. Estos subconjuntos de variables que forman diseos factoriales completos no son palabras de la relacin de definicin completa.
'EJ'~W

8..4 "". ". ". . . . . . . . . . . . . """""". . . . ". . . . . . . . """. """"""". . ". . . . . """"

Las piezas fabricadas en un proceso de moldeo por inyeccin estn presentando una contraccin excesiva. Esto est ocasionando problemas en las operaciones de ensamblaje que se realizan despus del moldeo por inyeccin. Un equipo de mejoramiento de calidad ha decidido llevar a cabo un experimento

320

CAPITuLO 8

DISEOS FACTORIALES FRACCIONAOOS DE DOS NIVELES

diseado para estudiar el proceso de moldeo por inyeccin a fin de poder reducir la contraccin. El equipo decide investigar seis factores -la temperatura de moldeo (A), la velocidad del enroscado (B), el tiempo de retencin (C), laduracin del ciclo (D), el tamao del vaciadero (E) y la presin de la retencin (F)- con dos niveles cada uno, con el fin de saber cmo se afecta la contraccin debido a cada factor, as como para obtener informacin preliminar acerca de la forma en que los factores interactan. El equipo decide usar el diseo factorial fraccionado de 16 corridas con dos niveles de la tabla 8-9. El diseo se muestra de nuevo en la tabla 8-10, junto con la contraccin observada (x 10) en la pieza de prueba producida en cada una de las 16 corridas del diseo. En la tabla 8-11 se muestran las estimaciones de los efectos, las sumas de cuadrados y los coeficientes de regresin de este experimento. En la figura 8-12 se presenta la grfica de probabilidad normal de las estimaciones de los efectos de este experimento; Los nicos efectos grandes sonA (temperatura de moldeo), B (velocidad del enroscado) y la interaccinAB. A la luz de las relaciones de los alias de la tabla 8-8, parece razonable adoptar estas conclusiones de manera tentativa. La grfica de la interaccin AB de la figura 8-13 indica que el proceso muestra una alta insensibilidad a la temperatura si la velocidad del enroscado est en el nivel bajo, pero que es muy sensible a la temperatura si la velocidad del enroscado est en el nivel alto. Con la,. velocidad del enroscado en el nivel bajo, el proceso deber producir una contraccin promedio de alrededor de 10%, independientemente del nivel de temperatura elegido. Con base en este anlisis inicial, el equipo decide hacer el ajuste de la temperatura de moldeo y la velocidad del enroscado en el nivel bajo. Este conjunto de condiciones reducir la contraccin media de las piezas en alrededor de 10%. Sin embargo, la variabilidad de la contraccin de una pieza a otra sigue siendo un problema potencial. De hecho, la contraccin media puede reducirse adecuadamente mediante las modificaciones anteriores; sin embargo, la variabilidad de la contraccin de una pieza a otra en una corrida de produccin podra seguir causando problemas en el ensamblaje. Una manera de abordar esta cuestin es investigando si alguno de los factores del proceso afecta la variabilidad de la contraccin de las piezas. En la figura 8-14 se presenta la grfica de probabilidad normal de los residuales. Esta grfica parece ser satisfactoria. Se construyeron despus las grficas de los residuales contra cada factor. En la figura

Tabla 8.10 Un disefio2 ~.;~ para el experimento del moldeo por inyeccin del ejemplo 84
Diseo bsico
Corrida

E=ABC

F=BCD

Contraccin observada (x 10)

1 2 3 4
5

+
+

+ + + + +
+ +

+ + + + + + + + + + + +

10

6 7 8
9 10 11

+ +
+

+ + +
+

32
60

4
15

12
13

+ + +

14 15 16

+ + +
+

+ + + + + + +
+

+ +

26 60 8 12 34 60 16
5

+ +

37 52

8J LAFRACCINUNCUARTODELDlSEOZ.

321

Tabla 8.11

Efectos, sumas de cuadrados y coeficientes de regresin del ejemplo 84

Variable A B C D E F Variable" Promedio global A B C D E F

Nombre temperatura_moldeo velocidad enroscado duracin retencin duracin-ciclo tamao vaciadero presin=retencin Coeficiente de regresin 27.3125 6.9375 17.8125 -0.4375 0.6875 0.1875 0.1875 5.9375 -0.8125 -2.6875 -0.9375 0.3125 -0.0625 -0.0625 0.0625 -2.4375

Nivel-l -1.000 -1.000 -1.000 -1.000 -1.000 -1.000 Efecto estimado 13.8750 35.6250 -0.8750 1.3750 0.3750 0.3750 11.8750 -1.6250 -5.3750 -1.8750 0.6250 -0.1250 -0.1250 0.1250 -4.8750

Nivel +1 1.000 1.000 1.000 1.()()() 1.000 1.000 Suma de cuadrados 770.062 5076.562 3.063 7.563 0.563 0.563 564.063 10.562 115.562 14.063 1.563 0.063 0.063 0.063 95.063

AB+CE AC+BE AD+EF AE+BC+DF AF+DE BD+CF BF+CD ABD ABF

Slo los efectos principales y las interacciones de dos factores.

99

!2 x

96
90

10

AS-

~.., 20

= 'ii
i .., 11

30

80
70

S 50 c::
70
90

50';
30 20 10 5

a;,'"

~ SO

95 99

-5

10

15

20

25

30

E6timaclones de loe ~1;JC\06

Figura 8-12 Grfica de probabilidad normal de los efectos del ejemplo 8-4.

322
60

CAPTULO 8

DISEOS FACfORIALES FRACCIONAOOS DE DOS NIVELES


B+

B
41..-

.._----------.B_
Alta Temperatura de moldeo, A

Baja

Figura 8-13 Grfica de la interaccinAB (temperatura de moldeo-velocidad del enroscado) para el ejemplo 8-4.

8-15 se muestra una de estas grficas, la de los residuales contra el factor e (tiempo de retencin). La grfica revela que hay una dispersin sensiblemente menor en los residuales con el tiempo de retencin bajo que con el tiempo de retencin alto. Estos residuales se obtuvieron de la manera usual a partir del modelo de la contraccin predicha:
j>=

=27.3125+6.9375x

Po +PI

Xl

+P2 X2 +P12 XI X2
1

+ 17.8125x2 + 5.9375x1x2
99

5
~
x
I
C>

95 90

10

z- 20
::
1ii

SO
70

30

E so o
c:

8
50 ';
g;,-'

"i 70

:c
..8 o

80

30 20 10

d: 90

96
99

-6

-3

o
Residuales

Figura 814 Grfica de probabilidad normal de los residuales del ejemplo 8-4.

8-3 LAFRACCIN UN CUARTO DEL DISEO 2k

323

.~ a:

.a

., '" "liI

1:
t

01-------------------2

-4
Baja


Alta Tiempo de retencin (e)

Figura 815 Residuales contra el tiempo de retencin (C) para el ejemplo 84.

dondexbx2 y XX2 son las variables codificadas que corresponden a los factores A y B ya la interaccinAB. Entonces los residuales son

e= y- y
El modelo de regresin usado para producir los residuales elimina, en esencia, los efectos de localizacin deA, ByAB de los datos; por lo tanto, los residuales contienen informacin acerca de la variabilidad no explicada. La figura 815 indica que existe un patrn en la variabilidad y que la variabilidad de la contraccin de las piezas puede ser menor cuando el tiempo de retencin est en el nivel bajo (recuerde que en el captulo 6 se seal que los residuales slo transmiten informacin acerca de los efectos de dispersin cuando es correcto el modelo de localizacin o la media). Lo anterior se observa con mayor claridad en el anlisis de los residuales que se presenta en la tabla 8-12. En esta tabla, los residuales se ordenan en los niveles bajo (-) y alto ( +) de cada factor, y se ha calculado la desviacin estndar de los residuales en los niveles bajo y alto de cada factor. Observe que la desviacin estndar de los residuales con C en el nivel bajo [S(C-) = 1.63] es considerablemente menor que la desviacin estndar de los residuales con e en el nivel alto [S(C+) = 5.70]. En el ltimo rengln de la tabla 8-12 se presenta el estadstico F' = In S2(i+) S2(i-)
I

Recuerde que si las varianzas de los residuales en los niveles alto ( +) y bajo (-) del factor i son iguales, entonces este cociente sigue una distribucin aproximadamente normal con media cero, y puede usarse para evaluar la diferencia en la variabilidad de la respuesta en los dos niveles del factor i. Puesto que el cociente F~ es relativamente grande, se concluira que la aparente dispersin o efecto de variabilidad observado en la figura 8-15 es real. Por lo tanto, ajustar el tiempo de retencin en su nivel bajo contribuira a reducir la variabilidad de una pieza a otra durante una corrida de produccin. En la figura 8-16 se presen-

N -&>.

VJ

labia 812 Clculo de los efectos de dispersindel ejemplo 8-4 Corrida A B AB=CE C AC =BE AE=BC =DF E 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

AD =EF BD

+ +

+
-

+ + +

+ +
-

+ +

+ +

+ +
+ +
-

+ +

+ +
+

+ + +
-

+
-

= CE + + -

ABD

BF= CD

ACD

F
-

AF

+ + + +

+ +

+ +
+

+ +

+ +
-

+ +
+
-

+ + + +

+
-

+
-

+ + + + + + + +

+ +
-

+ + + +
-

+
-

+ +
-

+ +
-

+
4.33 4.10 0.11

+ + + +
5.70 1.63 2.50

+
-

+ +

+ +
-

+
-

+
-

+ + + +
-

= DE + -

Residual -2.50 --0.50 --0.25 2.00 -4.50 4.50 -6.25 2.00 -0.50 1.50 1.75 2.00 7.50 -5.50 4.75 -6.00

+ +
-

+
-

+
3.68 4.53 -0.42 ,~

+ +
3.85 4.33 -0.23

+ +

+
-

+ +
4.01 4.41 -0.19

+ +

+ +
-

+ +

+
3.39 2.75 0.42

+
4.72 3.51 0.59

+ + + +
4.71 3.65 0.51

+ +
-

+ +

+
-

+
4.87 3.40 0.72

S(i+) 3.80 4.01 S(i-) 4.60 4.41 F' -0.38 -0.19

4.17 4.64 4.25 3.59 -0.04 0.51

3.50 3.88 3.12 4.52 0.23 --0.31

83 LA FRACCIN UN CUARTO DEL DISEO 2k


99.9 99

325

;;:
I

5 20 50

c.

95
80

...

=
a;

g
50
X
~

o:
"C

...

.2l

'" ;g 80 :c

20
5

I;! "-

0.1

0.6

1.1

2.1

2.6

1';
Figura 8-16 Grfica de probabilidad normal de los efectos de dispersin p,. del ejemplo 8-4.

ta una grfica de probabilidad normal de los valores f;" de la tabla 8-12; sta tambin indica que el factor C tiene un efecto de dispersin grande. En la figura 8-17 se muestran los datos de este experimento proyectados en un cubo en los factoresA, By C. La contraccin promedio observada y el rango de la contraccin observada se indican en cada vrtice del cubo. Por la inspeccin de la figura se observa que correr el proceso con la velocidad del enroscado (B) en el nivel bajo es la clave para reducir la contraccin promedio de las piezas. Si B est en el nivel bajo, virtualmente cualquier combinacin de la temperatura (A) Yel tiempo de retencin (C) resultar en valores bajos de la contraccin promedio de las piezas. Sin embargo, al examinar los rangos de los valores de la contraccin en cada vrtice del cubo, es claro de inmediato que ajustar el tiempo de retencin (C) en el nivel bajo es la nica eleccin razonable si se quiere mantener baja la variabilidad de la contraccin de una pieza a otra en una corrida de produccin.
*'
111 111 111

111

111

111

"

111

111

111

I Y~31.5 I R 11
g

I I I
I

I I

Y ~ 10.0 I
,,,,-"

Rg1~----

y 7.0 "
B

Y- 11.0
R~2

R~2

't

A. temperatura de moldeo

Figura 8-17 Contraccin promedio y rango de la contraccin en los factores A, B Y e para el ejemplo 8-4.

326

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

8..4

EL DISEO FACTORIAL FRACCIONADO 2k- p GENERAL

A un diseo factorial fraccionado 2k que contiene 2k -p corridas se le llama fraccin 1/21' del diseo 2k o, de manera ms simple, diseo factorial fraccionado 2k -p . En estos diseos deben seleccionarse p generadores independientes. La relacin de definicin de este diseo se compone de los p generadores elegidos inicialmente y sus 21' - P - 1 interacciones generalizadas. En la presente seccin se estudia la construccin y el anlisis de estos diseos. La estructura de los alias puede encontrarse multiplicando la columna de cada efecto por la relacin de definicin. Deber prestarse atencin al elegir los generadores para que los efectos de inters potencial no sean alias entre s. Cada efecto tiene 21' - 1 alias. Para valores moderadamente grandes de k, es comn suponer que las interacciones de rdenes superiores (por ejemplo, de tercero y cuarto orden y superiores) son insignificantes, con lo cual se simplifica en gran medida la estructura de los alias. Es importante seleccionar los p generadores de un diseo factorial fraccionado 2k--p de tal modo que se obtengan las mejores relaciones de los alias posibles. Un criterio razonable es seleccionar los generadores para que el diseo 2k - p resultante tenga la resoluci6n ms alta posible. Para ilustrar, considere el diseo 2~2 de la tabla 8-9, donde se usaron los generadores E =ABCyF = BCD, con lo cual se produce un diseo de resolucin IV: ste es el diseo con la resolucin ms alta. Si se hubieran seleccionado E = ABC y F = ABCD, la relacin de definicin completa hubiera sido 1 = ABCE = ABCDF = DEF, Yel diseo habra sido de resolucin 111. Se trata, evidentemente, de una eleccin inferior porque sacrifica de manera innecesaria informacin acerca de las interacciones. En.ocasiones la resolucin por s sola no es suficiente para distinguir entre los diseos. Por ejemplo, considere los tres diseos 2~2 de la tabla 8-13. Todos estos diseos son de resolucin IV; pero tienen estructuras de los alias muy diferentes (se ha supuesto que las interacciones de tres factores y las de rdenes superiores son insignificantes) con respecto a las interacciones de dos factores. Evidentemente, el diseo A es el que tiene ms alias y el diseo e el que tiene menos, por lo que el diseo C sera una buena eleccin para un diseo 2i~2 . Las tres palabras del diseo A tienen longitud 4; es decir, el patrn de la longitud de las palabras es {4, 4, 4}. Para el diseo B es {4, 4, 6} Ypara el diseo e es {4, 5, 5}. Observe que la relacin de definicin del diseo C tiene una sola palabra de cuatro letras, mientras que los dems diseos tienen dos o tres. Por lo tanto, el diseo C minimiza el nmero de palabras de la relacin de definicin que son de longitud mnima. A un diseo como ste se le llama diseo de aberracin mnima. Minimizar la aberracin en un diseo de resolucin R asegura que el diseo tiene el nmero mnimo de efectos principales que son alias de

Tabla 8-13 Tres elecciones de generadores parael dseo 2~z Generadoresdel disefio A: Generadoresdel disefio B:
F =ABC, G = BCD 1 =ABCF = BCDG =ADFG F =ABC, G =ADE 1 =ABCF = ADEG = BCDEFG I

F =ABCn, G =ABDE =ABCDF =ABDEG = CEFG CE=FG CF=EG CG=EF

Generadoresdel diseoC:

Alias(interacciones de dos factores)


AB=CF AC=BF AD=FG AG=DF BD=CG BG=CD AF=BC=DG

Alias (interacciones de dos factores)


AB=CF AC=BF AD=EG AE=DG AF=BC AG=DE

Alias(interacciones de dos factores)

8-4 EL DISEO FACTORIAL FRACCIONADO 2... GENERAL

327

interacciones de orden R -1, el nmero mnimo de interacciones de dos factores que son alias de interacciones de orden R - 2, etctera. Referirse a Fries y Hunter [46] para mayores detalles. En la tabla 8-14 se presenta una seleccin de diseos factoriales fraccionados 2k-p para k s 15 factores y hasta n -s 128 corridas. Los generadores sugeridos en esta tabla resultarn en un diseo con la resolucin ms alta posible. Son tambin los diseos con aberracin mnima. Las relaciones de los alias para todos los diseos de la tabla 8-14 para los que n ~ 64 se presentan en la tabla XlI(a-w) del apndice. Las relaciones de los alias incluidas en esta tabla se enfocan en los efectos principales y las interacciones de dos y tres factores. Se da la relacin de definicin completa para cada diseo. Esta tabla del apndice hace muy sencillo seleccionar un diseo con la resolucin suficiente para asegurar que cualesquiera interacciones de inters potencial puedan estimarse.

Ej'EMPLO 8..5

111

iII

Para ilustrar el uso de la tabla 8-14, suponga que se tienen siete factores y que el inters se encuentra en estimar los siete efectos principales y hacerse una idea aproximada de las interacciones de dos factores. Estamos dispuestos a suponer que las interacciones de tres factores y de rdenes superiores son insignificantes. Esta informacin sugiere que un diseo de resolucin IV sera apropiado. La tabla 8-14 muestra que se cuenta con dos fracciones de resolucin IV: la 2~2 con 32 corridas y la 2;~3 con 16 corridas. La tabla XII del apndice contiene las relaciones de los alias completas para estos dos diseos. Los alias para el diseo 2~3 de 16 corridas se encuentran en la tabla XlI(i) del apndice. Observe que los siete efectos principales son alias de interacciones de tres factores. Las interacciones de dos factores son alias en grupos de tres. Por lo tanto, este diseo satisfar los objetivos del problema; es decir, permitir la estimacin de los efectos principales y dar cierta idea respecto de las interacciones de dos factores. No es necesario correr el diseo 2~2, el cual requerira 32 corridas. La tabla XII(j) del apndice indica que este diseo permitira la estimacin de los siete efectos principales y que 15 de las 21 interacciones de dos factores tambin podran estimarse de manera nica. (Recuerde que las interacciones de tres factores y de rdenes superiores son insignificantes.) sta es ms de la informacin necesaria acerca de las interacciones. El diseo completo se muestra en la tabla 8-15. Observe que se construy empezando con la corrida 16 del diseo 24 enA, B, C y D como el diseo bsico y agregando despus las tres columnas E =ABC, F =BCD YG =ACD. Los generadores son 1 =ABCE,I = BCDF e 1 =ACDG (tabla 8-14). La relacin de definicin completa es 1 =ABCE = BCDF =ADEF =ACDG = BDEG = CEFG = ABFG.
*

Anlisis de los diseos factoriales fraccionados 2k-p Hay varios programas de computadora que pueden usarse para analizar el diseo factorial fraccionado 2k -p . Por ejemplo, el programa Design-Expert ilustrado en el captulo 6 tiene esta capacidad. El diseo tambin puede analizarse recurriendo a los principios bsicos; el efecto i-simo se estima con
f _= 2(Contraste) = Contraste

(N/~

donde el Contraste se encuer..tra utilizando los signos positivos y negativos de la columna i y donde = 2k -p es el nmero total de observaciones. El diseo 2k -p slo permite la estimacin de 2k -p -1 efectos (y sus alias).

Tabla 8-14 Diseos factoriales fraccionados 24 seleccionados

Nmero de factores, k

Fraccin
2~' 2~'
2~'

Nmero de corridas

Generadores del diseo

3 4

4 8

16
8

2in2

C= D = E = D = E=
F= E= F= D= E= F=

AB ABC ABCD AB AC ABCDE ABC BCD AB AC BC

2 6- 1 VI 2 6- 2 IV

32

16
8

64 32

16

G= F= G= E= F= G= D= E= F=

ABCDEF ABCD ABDE ABC BCD ACD AB AC BC G = ABC

2 8- 2 V
28-~

64

IV

32

28-4
IV

16

G = ABCD H= ABEF F= ABC G= ABD H= BCDE E= BCD F= ACD G= ABC H= ABD

92 VI 2

128
64

32

16

H= J= G= H= J= F= G= H= J= E= F= G= H= J=

ACDFG BCEFG ABCD ACEF CDEF BCDE ACDE ABDE ABCE ABC BCD ACD ABD ABCD

10

128

H= ABCG J= ACDE K= ACDF

328

Tabla 8-14

(continuacin)

Nmero de factores, k

Fraccin

Nmero de corridas

Generadores del diseo


G = BCDF

210- 4 N

64

zt-S
IV

32

H= 1= K= F=

210- 6 m

16

11

211 - S N

64

211- 6 N

32

211- 7 111

16

12

212- 8 m

16

13

213- 9 m

16

ACDF ABDE ABCE ABCD G = ABCE H= ABDE 1= ACDE K= BCDE E= ABC F= BCD G = ACD H: ABD 1= ABCD K: AB G: CDE H: ABCD 1: ABF K: BDEF L: ADEF F: ABC G= BCD H= CDE J= ACD K= ADE L = BDE E= ABC F= BCD G= ACD H= ABD J= ABCD K= AB L= AC E= ABC F= ABD G= ACD H= BCD 1= ABCn K= AB L= AC M=AD E= ABC F= ABD G= ACD H= BCD 1= ABCD K= AB

329

330

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-14 (continuacin) Nmero de Fraccin factores, k

Nmero de corridas

Generadores del diseo


L=AC M=AD N=BC

14

16

E= ABC F= ABD G = ACD H= BCD J= ABCD K= AB L= AC M=AD N=BC 0= BD E= ABC F= ABD G = ACD H= BCD J= ABCD K= AB L= AC M=AD N=BC 0= BD p= CD

15

16

Tabla 815 Un disefio factorial fraccionado2;,,' Diseo bsico Corrida 1 2 3 4 5 6 7 8


9 10

E=ABC

F=BCD

G=ACD

+ + + +

+ +

+ +
+ + + +

+ +

+ + + +

+
+

+ + + +

+ + +

+ + + +
+

11 12 13 14 15 16

+ +

+ +

+ + + +

+ + + + + + + +

+ +
+

+ + + +

8-4 ELDISEO FACTORIAL FRACCIONADO 2"'" GENERAL

331

Proyeccin del diseo factorial fraccionado 21o-P El diseo 2k -p se reduce a un factorial completo o bien a un factorial fraccionado en cualquier subconjunto de r S k - p de los factores originales. Esos subconjuntos de factores que producen diseos factoriales fraccionados son subconjuntos que aparecen como palabras en la relacin de definicin completa. Esto resulta de particular utilidad en los experimentos de tamizado cuando se sospecha desde el principio del experimento que la mayora de los factores originales tendrn efectos pequeos. El diseo factorial fraccionado 2k -p puede proyectarse entonces en un factorial completo, por ejemplo, en los factores de mayor inters. Las conclusiones a que se llegue con diseos de este tipo debern considerarse tentativas y someterse a anlisis adicional. Por lo general es posible encontrar explicaciones alternativas de los datos que intervienen en interacciones de rdenes superiores. Como un ejemplo, considere el diseo 2~3 del ejemplo 8-5. Se trata de un diseo con 16 corridas en el que intervienen siete factores. Se proyectar en un factorial completo en cuatro cualesquiera de los siete factores originales que no sean una palabra de la relacin de definicin. Hay 35 subconjuntos de cuatro factores, siete de los cuales aparecen en la relacin de definicin completa (ver la tabla 8-15). Por lo tanto, hay 28 subconjuntos de cuatro factores que formaran diseos 24 Una combinacin que es obvia al inspeccionar la tabla 8-15 es A, B, e y D. Para ilustrar apropiadamente la utilidad de esta proyeccin, suponga que se realiza un experimento para mejorar la eficiencia de un molino de bolas y los siete factores son los siguientes: 1. 2. 3. 4. 5. 6. 7. Velocidad del motor Muesca Modo de alimentacin 'Iamao de la alimentacin Tipo de material ngulo de la criba Nivel de vibracin de la criba

Se tiene una certeza razonable de que la velocidad del motor, el tamao de la alimentacin y el tipo de material afectarn la eficiencia y que adems estos factores pueden interactuar. Se sabe menos del papel de los otros tres factores, pero es probable que sean insignificantes. Una estrategia razonable sera asignar la velocidad del motor, el modo de alimentacin, el tamao de la alimentacin y el tipo de material a las columnas A, B, C y D, respectivamente, de la tabla 8-15. La muesca, el ngulo de la criba y el nivel de vibracin de la criba se asignaran a las columnas E, F YG, respectivamente. Si se est en lo correcto y las "variables menores" E, Fy G son insignificantes, quedar un diseo 24 completo en las variables clave del proceso. Separacin en bloques de diseos factoriales fraccionados Ocasionalmente, un diseo factorial fraccionado requiere tantas corridas que no es posible realizarlas todas bajo condiciones homogneas. En estas situaciones, los diseos factoriales fraccionados pueden confundirse o mezclarse en bloques. La tabla XII del apndice contiene los arreglos recomendados para la separacin en bloques de varios de los diseos factoriales fraccionados de la tabla 8-14. El tamao mnimo de los bloques para estos diseos es de ocho corridas. Para ilustrar el procedimiento general, considere el diseo factorial fraccionado 2~2 con la relacin de definicin 1 = ABCE = BCDF = ADEF que se muestra en la tabla 8-10. Este diseo fraccionado contiene 16 combinaciones de tratamientos. Suponga que quiere correrse este diseo en dos bloques con ocho combinaciones de tratamientos cada uno. Al seleccionar una interaccin para confundirla con los bloques, se observa por el examen de la estructura de los alias de la tabla XII(f) del apndice que hay dos

332
Bloque 1
(1)

CAPTULO 8 DISEOS FACTORIALES FRACCIONAroS DE DOS NIVELES


Bloque 2

ae
acf bef be df abd cde abcdef

abf

a.f
abce abef bde

aro
bcdf

Figura 818 El diseo 2~z en dos bloques con ABD confundida.

series de alias que incluyen nicamente interacciones de tres factores. La tabla sugiere seleccionar ABD (y sus alias) para confundirla con los bloques. Se obtendran as los dos bloques que se muestran en la figura 8-18. Observe que el bloque principal contiene las combinaciones de tratamientos que tienen un nmero igual de letras en comn con ABD. Son tambin las combinaciones de tratamientos para las que L = Xl + X 2 + X 4 = O (mod 2).

'EJEMPLO 8",6 ... .

11I

11I

11I

11I

11I

11I

11I

11I

Se usa una mquina CNC de cinco ejes para maquinar un propulsor utilizado en un motor de turbina. Los perfiles de los labes son una caracterstica importante de la calidad. Especficamente, es de inters la desviacin del perfil del labe del perfil especificado en el plano de ingeniera. Se corre un experimento para determinar cules son los parmetros de la mquina que afectan la desviacin del perfil. Los ocho factores seleccionados en el diseo son los siguientes:
Factor A = desviacin en el eje x (0.001 pulg) B = desviacin en el eje y (0.001 pulg) e = desviacin en el eje z (0.001 pulg) D = fabricante de la herramienta E = desviacin del eje a (0.001 grados) F = velocidad del aremetro (%) G = altura de la plantilla sujetadora (0.001 pulg) H = velocidad de alimentacin (%) Nivel bajo H Nivel alto ( +)

o
O
O 1

15 15 15
2

30
110

90
O

15
110

90

Se selecciona un labe de prueba en cada pieza para inspeccionarlo. La desviacin del perfil se mide utilizando una mquina de medicin coordenada, y la desviacin estndar de la diferencia entre el perfil real y el perfil especificado se usa como la variable de respuesta. La mquina tiene cuatro aremetros. Puesto que puede haber diferencias en los aremetros, los ingenieros del proceso piensan que stos debern tratarse como bloques. Los ingenieros se sienten confiados de que las interacciones de tres o ms factores no son muy importantes, pero estn renuentes a ignorar las interacciones de dos factores. Por la tabla 8-14, inicialmente dos

8-4 ELDISEO FACTORIAL FRACCIONADO 2....GENERAL

333

diseos parecen ser apropiados: el diseo 2~4 con 16 corridas y el diseo 2~3 con 32 corridas. La tabla XII(I) del apndice indica que si se usa el diseo con 16 corridas, habr un nmero considerable de alias con interacciones de dos factores. Adems, este diseo no puede correrse en cuatro bloques sin confundir cuatro interacciones de dos factores con los bloques. Por lo tanto, los experimentadores deciden usar el diseo 2~3 en cuatro bloques. En este diseo se confunden con los bloques una cadena de alias de interacciones de tres factores y una interaccin de dos factores (EH) y sus alias de interacciones de tres factores. La interaccin EH es la interaccin entre la desviacin del eje a y la velocidad de alimentacin, y los ingenieros consideran que una interaccin entre estas dos variables es altamente improbable. La tabla 8-16 contiene el diseo y las respuestas resultantes en trminos de desviacin estndar x lQ3 pulg. Puesto que la variable de respuesta es una desviacin estndar, con frecuencia es mejor efectuar el anlisis despus de una transformacin logartmica. En la tabla 8-17 se muestran las estimaciones. de los efectos. La figura 8-19 es una grfica de probabilidad normal de las estimaciones de los efectos, utilizando In (desviacin estndar x 1(3) como la variable de respuesta. Los nicos efectos grandes sonA "" desviacin del eje x, B "" desviacin del eje y, y la cadena de alias que incluyeAD + BG. Ahora bien,AD es la in-

Tabla 8.16 El diseo 26-3 en cuatro bloques del ejemplo 8-6 Diseo bsico Corrida A 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 B
C

F=ABC G =ABD H=BCDE

Orden real Desviacin estndar Bloque de las corridas (x 103 pulg) 3 2 4 1 1 4 2 3 1 4 2 3 3 2 4 1 2 3 1 4 4 1 3 2 4 1 3 2 2 3 1 4 18 16 29 4 6 26 14 22 8 32 15 19 24 11 27 3 10 21 7 28 30 2.76 6.18 2.43 4.01 2.48 5.91 2.39 3.35 4.40 4.10 3.22 3.78 5.32 3.87 3.03 2.95 2.64 5.50 2.24 4.28 2.57 5.37 2.11 4.18 3.96 3.27 3.41 4.30 4.44 3.65 4.41 3.40

+ + + + + + + + + + +

+ +

+ +

+ +

+ +

+ + + + + + + +

+ +

+ +
+ + + + + + + + +
+ +

+
+ +

+ +

+ + + +

+ + + + + + + +

+ +
+ + + +

+ + +

+ + + + + + + +

+ + + +

+ + +

+ + + +

+ + + + + + + +

+ + + + + + + + + + + + + + + +

+ +
+ + +

+ + + +

2
17 13

+ +

25
1 23 12 9 20 5 31

+ +

- - - - - - - - - - - - - - - - - _ ...

------------

334

CAPf11JLO 8 DISEOS FACfORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-17 Estimaciones de los efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-6 Variable Nombre Nivel-1 Nivel + 1 A Desviacin del eje x O 15 B Desviacin del eje y O 15 O 15 C Desviacin del eje z D Fabricante de la herramienta 1 2 E Desviacin del eje a O 30 F Velocidad del aremetro 90 110 G Altura de la plantilla sujetadora O 15 H Velocidad de alimentacin 90 110 Variable Coeficiente de regresin Efecto estimado Suma de cuadrados Promedio global 1.28007 A 0.14513 0.674020 0.29026 -0.20054 B -0.10027 0.321729 -0.02576 0.005310 C -0.01288 D 0.05407 0.10813 0.093540 -5.063E-04 E -2531E-04 2.050E-06 -0.03871 0.011988 F -0.01936 G 0.05804 0.11608 0.107799 0.001606 0.01417 H 0.00708 -0.00588 2.767E-04 AB + CF + DG -0.00294 -0.06206 0.030815 AC + BF -0.03103 -0.37412 1.119705 AV + BG -0.18706 0.00804 5.170E-04 AE 0.00402 AF + BC -0.02251 -0.04502 0.016214 AG + BD 0.02644 0.05288 0.022370 AH -0.02521 -0.05042 0.020339 BE 0.04925 0.09851 0.077627 BH 0.00654 0.01309 0.001371 0.03452 CD + FG 0.01726 0.009535 0.03982 0.012685 CE 0.01991 CG + DF -0.00733 -0.01467 0.001721 CH 0.03040 0.06080 0.029568 0.01708 DE 0.00854 0.002334 DH 0.00784 0.01569 0.001969 EF -0.00904 -0.01808 0.002616 EG -0.02685 -0.05371 0.023078 -0.03534 EH -0.01767 0.009993 FH -0.01404 -0.02808 0.006308 1.914E-04 0.00245 GH 0.00489 0.03331 -0.008874 ABE 0.01665 ABH -0.00631 -0.01261 0.001273 -0.05433 0.023617 ACD -0.02717
S610los efectos principales y las interacciones de dos factores.

8-4 ELDISEO FACTORIAL FRACCIONADO 2~ GENERAL


A
99

335

95

~ X ;:. . 20
I

10

90

SO
70

S
15
O

30

50
70 80 90 95

SO';
~...

e e

c: ..,

"-

:2

30 20 10 5

AD
99

-.40

-.30

~.20

-.10

.10

.20

.30

Estimaciones de los efectos

Figura 8-19 Grfica de probabilidad normal de las estimacionesde los efectos

del ejemplo 8-6.

teraccin desviacin del eje x-fabricante de la herramienta, y BG es la interaccin desviacin del eje y-altura de la plantilla sujetadora, y como estas dos interacciones son alias es imposible separarlas con base en los datos del experimento en curso. Puesto que ambas interacciones incluyen un efecto principal grande, tambin es difcil aplicar cualquier simplificacin lgica "obvia" en esta situacin. Si se contara con algn conocimiento de ingeniera o del proceso que arrojara luz sobre la situacin, entonces quiz podra hacerse una eleccin entre las dos interacciones; en caso contrario, se necesitarn ms datos para separar estos dos efectos (el problema de agregar corridas en un diseo factorial fraccionado para separar los alias de las interacciones, se estudia en la seccin 8-5 y en el material suplementario de este captulo). Suponga que el conocimiento del proceso sugiere que posiblemente la interaccin apropiada seaAD. La tabla 8-18 es el anlisis de varianza resultante para el modelo con los factores A, B, D y AD (el factor D se incluy para preservar el principio de jerarqua). Observe que el efecto del bloque es pequeo, lo cual sugiere que los aremetros de la mquina no son muy diferentes. La figura 8-20 es una grfica de probabilidad normal de los residuales de este experimento. Esta grfica sugiere la presencia de colas ligeramente ms gruesas que las normales, por lo que posiblemente deTabla 8.18 Anlisis de varianza del ejemplo 86
Fuente de variacin Suma de cuadrados Grados de libertad Cuadrado medio

Fa
39.42 18.81 5.47 65.48

ValorP

A B D AD Bloques Error 1btal

0.6740 0.3217 0.0935 1.1197 0.02101 0.4099 2.6389

1 1 1 1 3 24 31

0.6740 0.3217 0.0935 1.1197 0.0067 0.0171

<0.0001 0.0002 0.0280 <0.0001

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ------ ---

336

CAPtTuLO 8

DISEOS FACTORIALES FRACCIONADOS DE OOS NIVELES

5
o

99

95 90

~
x
I

10

ii:-. 20
!: SO
Oi

SO
70

o o

:s SO

g ca " 70 ~
90
95

E 50

50 -;;

;-.

SO
20 10 5

99 -0.25
O Residuales

0.25

Figura 820 Grfica de probabilidad normal de los residuales del ejemplo 8-6.

1.825

Ir

D0.75
Baja Desviacin del eje x (A) Alta

Figura 821 Grfica de la interaccin AV para el ejemplo 86.

85 DISEOS DERESOLUCIN III


1.247 1.273

337

0.8280 +15

I I
I

Desvlecln del eje y-B


/

//.-----.~---- 2
/ / /0.9595 1.745
1

I 1.504

1.310

Fabricante de le herramienta.D

I I O +15 Desviacin del eje x, A

Figura 8-22 El diseo 2~3 del ejemplo 8-6 proyectado en cuatro rplicas de un diseo 23 en los factores A, B YD.

ban considerarse otras transformaciones. La grfica de la interaccinAD se presenta en la figura 8-21. Observe que el fabricante de la herramienta (D) y la magnitud de la desviacin del ejex (A) tienen un impacto profundo en la variabilidad, del perfil del labe, de las especificaciones de diseo. Correr A en el nivel bajo (O desviacin) y comprar las herramientas al fabricante 1 produce los mejores resultados. En la figura 8-22se muestra la proyeccin de este diseo 2~3 en cuatro rplicas de un diseo 23en los factores A, By D. La mejor combinacin de las condiciones de operacin esA en el nivel bajo (O desviacin), B en el nivel alto (0.015 en desviacin) y D en el nivel bajo (fabricante de herramientas 1).

8..5 DISEOS DE RESOLUCIN 111


Como se seal anteriormente, el uso secuencial de los diseos factoriales fraccionados es muy til, llevando con frecuencia a una gran economa y eficiencia de la experimentacin. Se ilustran ahora estas ideas utilizando la clase de los diseos de resolucin 111. Es posible construir diseos de resolucin 111 para investigar hasta k = N -1 factores en slo N corridas, donde N es un mltiplo de 4. Con frecuencia estos diseos son tiles en la experimentacin industrial. Los diseos en los que N es una potencia de 2 pueden construirse con los mtodos presentados anteriormente en este captulo, y stos se presentan primero. De particular importancia son los diseos que requieren 4 corridas para hasta 3 factores, 8 corridas para hasta 7 factores y 16 corridas para hasta 15 factores. Si k = N - 1, se dice que el diseo factorial fraccionado est saturado. Un diseo para analizar hasta tres factores en cuatro corridas es el diseo 2~~1, el cual se present en la seccin 8-2. Otro diseo factorial fraccionado saturado muy til es el diseo para estudiar siete factores en ocho corridas, es decir, el diseo 2;;;4. Este diseo es una fraccin un dieciseisavo del diseo 27 Puede construirse apuntando primero los niveles positivos y negativos de un diseo 23 completo en A, B YC como el diseo bsico, y asociando despus los niveles de cuatro factores adicionales con las interacciones de los tres factores originales de la siguiente manera: D =AB, E =AC, F := BC y G =ABe. Por lo tanto, los generadores de este diseo son/ =ABD,l =ACE,/ =BCFe/ =ABCG. El diseo se muestra en la tabla 8-19.

338

CAPTULO 8

DISEOS FACTORIALES FRACCIONAlX)S DE DOS NIVELES

Tabla 8.19 El disee 2~-4 con los generadores 1 = ABD, 1 = ACE, r = BCF e 1 = ABCG
Disefio bsico Corrida

D=AB

E=AC

F=BC

G=ABC

1 2

+ + + +

+ + + + + + + +

+ + + +

+ +

3
4 5 6 7 8

+ + +

+ + + +

+ +

def afg beg abd edg aee be!


abcdefg

La relacin de definicin completa de este diseo se obtiene multiplicando entre s los cuatro generadoresABD, ACE, BCFyABCG de dos en dos, de tres en tres y los cuatro a la vez, de donde se obtiene

1= ABD= ACE= BCF= ABCG= BCDE= ACDF= CDG = ABEF = BEG= AFG= DEF = ADEG= CEFG= BDFG= ABCDEFG
Para encontrar los alias de cualquier efecto, simplemente se multiplica el efecto por cada palabra de la relacin de definicin. Por ejemplo, los alias de B son

B= AD= ABCE= CF= ACG= CDE= ABCDF= BCDG= AEF= EG = ABFG= BDEF = ABDEG= BCEFG= DFG= ACDEFG
Este diseo es una fraccin un dieciseisavo, y como los signos elegidos para los generadores son positivos, se trata de la fraccin principal. Es tambin de resolucin 111 porque el nmero menor de letras de cualquier palabra de la definicin de contraste es tres. Cualquiera de los 16 diferentes diseos 14 de esta 1 familia podra construirse utilizando los generadores con 1 de los 16 arreglos posibles de los signos en

21

= ABD,I =

ACE,I = BCF, 1

ABCG.

Los siete grados de libertad de este diseo pueden usarse para estimar los siete efectos principales. Cada uno de estos efectos tiene 15 alias; sin embargo, si se supone que las interacciones de tres o ms factores son insignificantes, se consigue entonces una simplificacin considerable en la estructura de los alias. Estableciendo este supuesto, cada una de las combinaciones lineales asociadas con los siete efectos principales de este disefio es en realidad una estimacin del efecto principal y las tres interacciones de dos factores:
lA -A+BD+CE+FG
lB -B+AD+CF+EG

le -C+AE+BF+DG
lD -D+AB+CG+EF
lE -E+AC+BG+DF

(8-1)

lF -F+BC+AG+DE

lG -G+CD+BE+AF

Estos alias se encuentran en la tabla XII(h) del apndice, ignorando las interacciones de tres factores y de rdenes superiores.

8-5 DISEOS DERESOLUCIN III

339

El diseo saturado 2iI~4 de la tabla 8-19 puede usarse para obtener diseos de resolucin Ill para estudiar menos de siete factores en ocho corridas. Por ejemplo, para generar un diseo para seis factores en ocho corridas, simplemente se elimina cualquiera de las columnas de la tabla 8-19, digamos la G. Se obtiene as el diseo que se muestra en la tabla 8-20. Es sencillo verificar que este diseo es tambin de resolucin Ill: de hecho es un diseo 2~I~3 , o una fraccin un octavo, del diseo 26 La relacin de definicin del diseo 2~rr3 es igual a la relacin de definicin del diseo 2ri~4 original, con las palabras que incluyen la letra G eliminadas. Por 10 tanto, la relacin de definicin del nuevo diseo es
1 = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF

En general, cuando se eliminan d factores para producir un nuevo diseo, la nueva relacin de definicin se obtiene de las palabras de la relacin de definicin original que no contienen ninguna de las letras eliminadas. Cuando se construyen diseos con este mtodo, deber prestarse atencin para obtener el mejor arreglo posible. Si se elimin.an las columnas B, D, F YG de la tabla 8-19, se obtiene un diseo para tres factores en ocho corridas, no obstante que las combinaciones de tratamientos corresponden a dos rplicas de un diseo 23 Probablemente el experimentador preferira correr un diseo 23 completo enA, C y E. Tambin es posible obtener un diseo de resolucin Ill para estudiar hasta 15 factores en 16 corridas. Este diseo 2~~-11 saturado puede generarse apuntando primero las 16 combinaciones de tratamientos asociadas con un diseo 24 enA,B, C y D e igualando despus 11 nuevos factores con las interacciones de dos, tres y cuatro factores de los cuatro factores originales. En este di