Você está na página 1de 286

Control y mejora de la calidad

Prat Barts, Albert


Tort-Martorell Llabrs, Xavier
Grima Cintas, Pere
Pozueta Fernndez, Lourdes
Cuando decidimos escribir este libro, lo hicimos con un objetivo fundamental: satisfacer las
necesidades y expectativas, en cuanto a formacin estadstica, de los estudiantes de ingeniera y de
todos aquellos tcnicos, ingenieros y cientficos que quieren utilizar mtodos estadsticos para acelerar
la adquisicin de conocimientos.
El proceso de deteccin de estas necesidades y expectativas ha sido largo pero extraordina-
riamente interesante. La principal fuente de informacin ha sido la experiencia adquirida por los
autores durante las mltiples asesoras realizadas a todo tipo de organismos pblicos y privados tanto
nacionales como multinacionales. Este contacto intenso con la realidad, adems de ser una fuente
inestimable de temas para la investigacin terica y aplicada, permite la obtencin de datos reales y la
aplicacin de los mtodos estadsticos a problemas relevantes para el pblico a quien se dirige el texto.
En este sentido, el captulo 1 introduce al lector en la importancia actual de los conceptos de la
calidad total y sita el papel de la estadstica como uno de los tres pilares en los que se fundamentan
dichos conceptos.
Una de las constataciones realizadas por personajes de la talla de Deming y Juran es que un
porcentaje muy elevado de problemas por mala calidad en la industria y los servicios se pueden resolver
mediante la utilizacin masiva y sistemtica de las herramientas que se explican en el captulo 2.
Los captulos 3 y 4 presentan de forma conceptual y resumida los elementos bsicos de la
variabilidad y de su medida en la teora de la probabilidad. Los resultados tericos de estos dos
captulos constituyen la base en que se fundamentan los mtodos estadsticos descritos en el texto.
Los captulos 5 y 6 contienen los mtodos utilizados para comparar dos o ms poblaciones,
tanto para el caso de diseos totalmente aleatorizados como para los diseos en bloques completos
aleatorizados.
En la actualidad, las tcnicas de diseo de experimentos, tanto en su versin clsica de diseos
factoriales y factoriales fraccionales, como en su versin de mtodos de Taguchi para el diseo de
parmetros en ingeniera de la calidad, son de gran importancia en todo tipo de organizaciones
industriales. A ellas hemos dedicado los captulos 7, 8, 9 y 10.
Finalmente, otra rea de gran inters para el control y la mejora de la calidad es la de control
estadstico de procesos (SPC) que se expone brevemente en el captulo 11.
Al final de cada grupo temtico se proponen una serie de ejercicios que pretenden facilitar la
compresin de los conceptos tericos.
Prlogo
7
El enfoque del libro est tambin influenciado por las largas conversaciones y el trabajo en
comn de algunos de los autores con dos autnticos maestros de la estadstica: George E. P. Box y el
difunto William G. Hunter. Compartimos con ellos la idea de mantener al mnimo imprescindible el
aparato matemtico utilizado en el texto, e intentar que, a travs de la utilizacin de datos reales, el
lector pueda apreciar toda la complejidad del proceso iterativo de adquisicin de conocimientos y en
la resolucin de problemas de inters para la industria y los servicios.
Este libro es el resultado de muchos aos de experiencia en la enseanza de la estadstica. Esta
experiencia no se limita nicamente a los estudiantes de ingeniera en la Escola Tcnica Superior de
Enginyers Industrials de Barcelona, y a los de la diplomatura de Estadstica de la Facultat de
Matemtiques i Estadstica de la Universitat Politcnica de Catalunya, sin que se extiende a la
enseanza de la estadstica en los mltiples cursos realizados a medida para ingenieros, economistas,
tcnicos, etc., en distintas empresas de una gran variedad de campos de actividad.
Desearamos que nuestro libro satisfaga realmente a nuestros lectores pero, como todo producto
es mejorable, les estimulamos a que nos hagan llegar todo tipo de comentarios y sugerencias que
permitan mejorarlo en ediciones futuras.
Finalmente, deseamos manifestar nuestro agradecimiento a la Universitat Politcnica de
Catalunya, a la cual pertenecemos, por concedernos un premio a la elaboracin de material docente que
ha facilitado la elaboracin del presente texto, a los becarios Natalia Montolo y Santiago Fernndez,
que han colaborado en la recopilacin de los problemas y la elaboracin de las tablas que figuran en
el libro, as como a Pia Margarit por su trabajo en la edicin del primer original.
Albert Prat
Xavier Tort-Martorell
Pere Grima
Lourdes Pozueta
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
8

1 El entorno de la calidad total


1.1 Evolucin histrica del concepto de control de la calidad . . . . . . . . . . . . . . . . . . . . . . . . . .15
1.1.1 Inspeccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
1.1.2 Control estadstico de procesos (C.E.P) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17
1.1.3 Calidad en la etapa de diseo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18
1.2 Mantenimiento, mejora e innovacin en la calidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18
1.2.1 Conceptos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18
1.2.2 El ciclo PDCA como estrategia bsica de los procesos de mejora continua . . . . . . .20
1.3 Conceptos bsicos de la gestin de la calidad total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21
1.4 Mtodos estadsticos en la calidad total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
2 Herramientas bsicas para la mejora de la calidad
2.1 Plantillas para la recogida de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26
2.2 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28
2.3 Diagramas de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
2.4 Diagramas causa-efecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34
2.5 Diagramas bivariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36
2.6 Estratificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42
Apndice 2A Datos e informacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .45
3 Causas y medidas de la variabilidad
3.1 Causas de la variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47
3.2 Medidas de la variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49
3.2.1 Variabilidad en una muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
3.3 Densidad de probabilidad. Variabilidad en la poblacin . . . . . . . . . . . . . . . . . . . . . . . . . . .50
3.4 Esperanza matemtica y varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51
3.5 Funcin de distribucin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52
3.6 Caso discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53
ndice
9
3.7 El caso bivariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .54
3.7.1 Variabilidad muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .54
3.8 Densidades de probabilidad conjunta y densidades marginales . . . . . . . . . . . . . . . . . . . . . .54
3.8.1 Densidades marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .55
3.9 Densidades condicionales e independencia de variables aleatorias . . . . . . . . . . . . . . . . . . .55
3.10 Covarianza y coeficiente de correlacin lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .56
3.11 Esperanza matemtica y varianza de combinaciones lineales de variables aleatorias . . . . .58
3.12 Ejemplo del helicptero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .59
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62
4 Algunos modelos probabilsticos
4.1 La ley normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66
4.1.1 Funcin de distribucin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .68
4.2 La ley binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .70
4.3 Ley de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .72
4.4 Distribucin de estadsticos en muestras aleatorias simples de poblaciones normales . . . . .74
4.5 Distribucin de Y (
2
conocida) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .75
4.6 La ley de Chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .76
4.7 La ley t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77
4.8 Distribucin de S
2
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .79
4.9 Distribucin de Y (
2
desconocida) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .79
4.10 El caso de dos poblaciones normales independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .80
4.11 La ley F-Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .81
4.12 Distribucin del cociente de dos varianzas muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . .82
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .83
5 Comparacin de dos tratamientos
5.1 Caso 1: comparacin de dos productos en un proceso de curtido de piel . . . . . . . . . . . . . .85
5.1.1 Planteamiento del problema. Recogida de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . .85
5.1.2 Anlisis exploratorio. Formalizacin del problema . . . . . . . . . . . . . . . . . . . . . . . . . .86
5.1.3 Resolucin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87
5.2 Generalizacin del caso de la comparacin de dos productos para el curtido:
comparacin de medias en diseos totalmente ateatorizados . . . . . . . . . . . . . . . . . . . . . . .89
5.3 Caso 2: comparacin de dos tratamientos superficiales para lentes . . . . . . . . . . . . . . . . . . .91
5.3.1 Planteamiento. Recogida de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91
5.3.2 Anlisis exploratorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91
5.3.3 Resolucin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92
5.4 Generalizacin del caso de la comparacin de dos tratamientos superficiales de lentes: . . . . .
comparacin de medias en diseos en bloques aleatorizados . . . . . . . . . . . . . . . . . . . . . . .93
5.5 Aleatorizacin y bloqueo: recapitulacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94
5.6 Contraste de hiptesis. Formalizacin y limitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . .95
5.7 Un anlisis alternativo: intervalos de confianza para la diferencia de medias . . . . . . . . . . .97
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .99
Apndice 5A Test de comparacin de medias cuando no puede asumirse la igualdad
de varianzas poblacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102
Apndice 5B Prubelo Ud. mismo. Comparacin de dos tipos de helicptero . . . . . . . . . . . . . . .103
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
10

EL ENTORNO DE LA CALIDAD TOTAL


6 Comparacin de ms de dos tratamientos: anlisis de la varianza
6.1 Mtodo grfico de comparacin de medias para poblaciones independientes . . . . . . . . . .106
6.1.1 Ideas bsicas para la aplicacin del mtodo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106
6.1.2 Requisitos de aplicacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .108
6.1.3 Caso de la comparacin de procedimientos de montaje. Aplicacin del mtodo . .110
6.2 Caso de la comparacin de procedimientos de montaje con datos bloqueados.
Hiptesis sobre el modelo de la respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .113
6.2.1 Resolucin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .114
6.3 Mtodo clsico de anlisis de la varianza. Tabla ANOVA . . . . . . . . . . . . . . . . . . . . . . . . .117
6.3.1 Planteamiento de un caso y cuestiones previas . . . . . . . . . . . . . . . . . . . . . . . . . . . .117
6.3.2 Construccin e interpretacin de la tabla ANOVA en diseos
totalmente aleatorizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .118
6.3.3 Tabla ANOVA para diseos bloqueados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .121
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .124
7 Diseos factoriales
7.1 Necesidad de la experimentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127
7.1.1 Avance del conocimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127
7.1.2 Diferencia entre experimentar y analizar datos existentes . . . . . . . . . . . . . . . . . . . .127
7.1.3 Modelos mecanicistas y empricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .129
7.2 Posibles estrategias experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130
7.2.1 Estrategia secuencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130
7.2.2 Diseos factoriales frente a intuicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131
7.2.3 Concepto de interaccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133
7.3 Variabilidad de la respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134
7.3.1 Variabilidad en el sistema de medicin de la respuesta . . . . . . . . . . . . . . . . . . . . . .135
7.4 Diseos factoriales con las variables a dos niveles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135
7.4.1 Diseos factoriales a dos niveles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .136
7.4.2 Matriz de diseo. Construccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .137
7.4.3 Aleatorizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .138
7.4.4 Rplicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .139
7.5 Clculo de los efectos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .140
7.5.1 Clculo de los efectos a partir del cubo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .140
7.5.2 Algoritmos de clculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .142
7.6 Significacin de los efectos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .144
7.6.1 Significacin cuando se dispone de rplicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .145
7.6.2 Papel probabilstico normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .147
7.7 Interpretacin de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .150
7.7.1 Clculo de residuos. Diagnosis del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .151
7.8 Diseos a dos niveles bloqueados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .152
Apndice 7A Relacin entre los algoritmos de clculo y el mtodo de los mnimos cuadrados . .153
Apndice 7B Papel probabilstico normal para diseos con ocho y diecisis
experimentos y casos prcticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .155
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .162
11

8 Diseos factoriales fraccinales


8.1 Utilidad y justificaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .165
8.1.1 Justificaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .165
8.2 Ejemplo introductorio. Cinco variables en diecisis experimentos . . . . . . . . . . . . . . . . . .166
8.2.1 Confusin de los efectos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .169
8.3 Construccin de diseos fraccionales y clculo de las confusiones introducidas . . . . . . . .170
8.3.1 Construccin de diseos fraccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .170
8.3.2 Clculo de las confusiones introducidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .171
8.3.3 Concepto de resolucin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .172
8.4 Otros diseos fraccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .172
8.4.1 Medias fracciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .172
8.4.2 Fraccin complementaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .173
8.4.3 Diseos saturados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .175
8.4.4 Diseos intermedios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .177
8.5 Bloqueo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .179
8.5. 1 Bloqueo de factoriales completos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .179
8.5.2 Ejemplo de proceso qumico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .180
8.5.3 Factoriales completos divididos en ms de dos bloques . . . . . . . . . . . . . . . . . . . . . .182
8.5.4 Fraccionales divididos en bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .183
8.6 Tablas de diseos fraccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .184
8.7 Estrategia secuencial utilizando diseos fraccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .187
8.7.1 Advertencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .188
8.7.2 Fracciones complementarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .188
8.7.3 Efecto bloque al aadir fracciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .191
8.7.4 Adicin de experimentos para conseguir clarificaciones puntuales . . . . . . . . . . . . .191
Apndice 8A Teora de la proyeccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .195
Apndice 8B Significacin de las interacciones de dos factores . . . . . . . . . . . . . . . . . . . . . . . . .196
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .198
9 Introduccin a la metodologia de superficie de respuesta
9.1 Introduccin. Necesidad de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .201
9.2 Grado de conocimiento y objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
9.3 Estrategias de la metodologa de superficie de respuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . .203
9.4 Aproximacin lineal a las condiciones ptimas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .206
9.5 Aproximacin por el camino de mxima pendiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .209
9.6 Aproximacin cuadrtica. Diseos centrales compuestos . . . . . . . . . . . . . . . . . . . . . . . . . . .212
9.7 Anlisis cannico de la superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .215
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .221
10 Diseo de productos robustos
10.1 Concepto de producto robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .223
10.2 Variabilidad funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .224
10.3 Metodologa del diseo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .225
10.4 Diseo de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .226
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
12

EL ENTORNO DE LA CALIDAD TOTAL


10.5 Matriz de diseo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .227
10.6 Ejemplo de producto robusto a ruido externo: suavizante . . . . . . . . . . . . . . . . . . . . . . . . .229
10.7 Ejemplo de producto robusto a ruido interno: tubo calefactor . . . . . . . . . . . . . . . . . . . . . .236
10.8 Diseo de tolerancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .238
Apndice 10A Funcin de prdidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .239
Apndice 10B Mtodo de Taguchi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .240
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .242
11 Control estadstico de procesos
11.1 Evolucin del CEP y objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .243
11.2 Proceso en estado de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .244
11.2.1 Comportamiento esperado de las observaciones individuales
en un proceso en estado de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .244
11.2.2 Comportamiento de la media de un proceso en estado de control . . . . . . . . . . . . . .246
11.3 Qu es un grfico de control? Metodologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .247
11.4 Grficos de control para variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .248
11.4.1 Grficos X-R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .249
11.4.2 Grfico de observaciones individuales y grfico de rangos mviles . . . . . . . . . . . .251
11.4.3 Grfico de medias mviles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .252
11.4.4 Interpretacin de los grficos de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .252
11.4.5 Estudios de capacidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .255
11.5 Grficos de control para atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .258
11.5.1 Grfico P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .258
11.5.2 Grfico NP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .261
11.5.3 Grfico C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .263
11.5.4 Grfico U . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .265
11.6 Otros grficos de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .266
11.6.1 Grfico CUSUM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .266
11.6.2 Grficos EWMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .269
11.7 El precontrol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .271
11.8 Grficos de control para observaciones dependientes . . . . . . . . . . . . . . . . . . . . . . . . . . . .272
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .274
Apndice 1: Tablas estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .277
ndice alfabtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .295
Bibliografa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .299
13

[ABRA64] ABRAMOWITZ, M.; STEGUN, I. Handbook of Mathematical Functions pover. Nueva York, 1964.
[AT&T85] AT & T. Statistical Quality Control Handbook. ASQC, 1985.
[BOX76] BOX, G.; JENKINS, G. Time series analysis forecasting and control. Holden-Day, California, 1976.
[BOX86] BOX, G.; FUNG, C. Studies in Quality Improvement. Minimizing Transmitted Variation by Parametrer
Design. Center for Quality and Productivity Improvement, Report Num. 8, University of Wisconsin-
Madison, 1986.
[BOX87] BOX, G. Empirical Model-Building and Response Surfaces. Draper, Norman Richard, John Wiley &
Sons, Nueva York, 1987.
[BOX88] BOX, GEORGE E.P.; HUNTER, WILLIAM G.; HUNTER, J. STUART. Estadstica para investigadores. Revert,
Barcelona, 1988.
[BOX92] BOX, G.E.; KRAMER. Statistical Process Monitoring and Feedback Adjustment. Technometrics, 1992.
[BRIT80] BRITISH STANDARDS INSTITUTION. Guide to Data analysis and quality control using cusum techniques.
1980.
[CHUN68] CHUNG, KAILAI. A course in Probability Theory. Hartcolurt, Brace & world, Inc., Nueva York, 1968.
[DEMI82] DEMING, W. EDWARDS. Out of the Crisis. MIT, Massachussets, 1982.
[DEMI83] DEMING, W. EDWARDS. Quality, Productivity and Competitive Position. MIT Center for Advanced
Engineering Study, Cambridge- Massachussets, 1983.
[DOUG91] DOUGLAS, C.; MONTGOMERY, D.C. Introduction to Statistical Quality Control Second Edition. Wiley, 1991.
[GRIM93] GRIMA, P. Aportaciones metodologicas al diseo de productos robustos. Tesis doctoral. Universitat
Politcnica de Catalunya, 1993.
[HOGG78] HOGG, R.; CRAIG, A. Introduction to mathematical statistics. Macmillian, Nueva York, 1978.
[IMAI86] IMAI, MASAAKI. Kaizen, the key to Japanis competitive success the Random House. Nueva York,
1986.
[ISHI85] ISHIKAWA, KAORU. Gua de control de calidad. Ed. UNIPUB, Nueva York, 1985.
[ISHI85] ISHIKAWA, KAORU. Wath is Total Quality Control? The Japanese way, Prentice-Hall. Inc. Englewood
clidds, Nueva York, 1985.
[JOHN71] JOHN, PET ER. Statistical design and analysis of experiments. The MacMillan Company. Nueva York
(1971)
[JOHN70] JOHNSON, NORMAN; KOTZ, SAMUEL. Distributions in Statistics: Continuous Univariate Distributions 1
and 2. Houghton Mifflin Company, Boston. 1970.
[JURA51] JURAN, J.M. Quality Control Handbook. McGraw-Hill, Nueva York, 1951.
[JURA80] JURAN & GRYNA. Quality Planning and Analysis. McGraw-Hill, 1980.
[JURA90] JURAN, J.M. Juran y la planificacin para la calidad. Ed. Daz de Santos, Barcelona, 1990.
[KACK85] KACKAR, R.N. Off-Line Quality Control, Parametrer Design, and the Taguchi Method. Journal of
Quality Technology, vol. 17, N 4, 1985.
Bibliografa
299
[KANO87] KANO, NONAKI. TGC as total Quality Creation. ICGC, Tokyo, 1987.
[KARA91] KARATSU, HAIJME. CTC: La sabidura japonesa. Ediciones Gestin 2000 S.A., Barcelona, 1991.
[KHUR87] KHURI, A.I; CORNELL, J.A. Response Surfaces. Design and Analyses. Marcel Dekker, Inc. ASGC
Quality Press, 1987.
[LUKA56] LUKACS, E. Procedings 3d Berkeley Symposium on Mathematical Statistics. Probabilidad 2, pp.
195-214, 1956.
[MACG90] MACGREGOR, J.F. A Different View of the Funnel Experiment. J.Q.T., 1990.
[MAGH90] MAGHSOODLOO, S. The Exact Relation of Taguchis Signal-to-Noise Ratio to His Quality Loss
Function. Journal of Quality Technology. vol. 22, n 1, 1990.
[MILL84] MILLIKEN & JOHNSON. Analysis of Messy Data. vol. 1 Designed Experiments, Van Nostrand Reinhold,
Nueva York, 1984.
[MONT91] MONTGOMERY, D.C.; MASTRANGELO, C.M. Some Statistical Process Control Methods for
Autocorrelated Data Journal of Quality Technology. vol. 23, n 3, 1991.
[PATE82] PATEL, JAGDISH K.; READ, CAMPBELL B. Handbook of the normal distribution. M. Dekker, Nueva York,
1982.
[PEA86] PEA, D.; PRAT, A. Cmo controlar la calidad. Manuales IMPL, Ministerio de Industria y Energa,
Madrid, 1986.
[ROSS88] ROSS, P.J. Taguchi Techniques for Quality Engineering. McGraw-Hill, Nueva York, 1988.
[RYAN88] RYAN, T.P. Taguchis Approach to Experimental Design: Some Concerns. Quality Progress, 1988.
[SHEW31] SHEWHART, W.A. Economic control of Quality of Manufactured Product. American Society for Q.C,
1931.
[SHOE91] SHOEMAKER, A.C.; TSUI, C.F.; WU, JEFF. Economical Experimentation Methods for Robust Design.
Technometrics, vol. 33, n 4, 1991.
[SNED37] SNEDECOR, G.W. Statistical Methods. Colegiate Press, Ames, Iowa, 1937.
[TAGU86] TAGUCHI, G. Introdution to Quality Engineering: Designing Quality Into Products and Processes.
Asian Productivity Organization, Tokyo, 1986.
[TORT85] TORT-MARTORELL, J. Diseos factoriales fraccionales. Aplicacin al control de calidad mediante el
diseo de productos y procesos. Tesis doctoral.
Universitat Politcnica de Catalunya, 1985.
[TRIB89] TRIBUS, M.; SZONYI, G. An Alternative View of the Taguchi Approach. Quality Progress, 1989.
[VACH92] VACHETTE, J.L. Mejora contnua de la calidad. Ediciones Ceac, S.A., Barcelona, 1992.
[WU87] WU, C.F.J.; MAO, S.S.; MA, F.S. An Investigation of OA-Based Methods for Parameter Design
Optimitation. Center for Quality and Productivity Improvement, Report Num. 24, University of
Wisconsin-Madison, 1987.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
300

Aleatorizar 89, 95, 138


Algoritmo de Yates 142-144, 153, 154, 176,
177, 204
Anlisis exploratorio de los datos 90, 94, 108,
118
Bloque 93-95, 113, 114, 116, 164, 179-183,
188, 191-193, 198-200, 210, 212-216
Bloquear 95, 152, 164, 179, 181, 183, 185-187
Brainstorming 35
Calidad total 15, 18, 21, 23, 244
Capacidad 15, 16, 69, 83, 135, 201, 223-225,
254-258, 275, 276
Causa asignable 48, 49, 60, 225, 245, 250, 253,
254, 260, 267, 269, 271
comn 48, 49, 60, 244, 248, 249, 273
fundamental 34
potencial 36
primaria 35, 36
trivial 32
Ciclo PDCA 20, 203
Cliente 16, 18, 22, 223-226, 229, 233, 239,
244, 247, 257, 261
Competitividad 15, 16
Condicin experimental 139, 145, 146, 151,
164, 175, 199, 230
Confusin de los efectos 128, 154, 169, 175
Control de calidad 16, 36, 255
Correlacin 36, 37, 39-42, 56, 57, 63, 193
Covarianza 56, 57, 63
Creatividad 15, 19, 188
Criterio de ortogonalidad 212
Criterio de rotabilidad 212
Cultura de la calidad 21
Curvas de nivel 132, 202, 204, 215, 216
Datos apareados 105
inconsistentes 128
Densidad 23, 28, 47, 50-52, 54-56, 60, 62, 63,
66-68, 74, 76-78, 106, 128, 129, 133, 157
Densidad condicional 55
de probabilidad 23, 28, 47, 50-52, 54-56,
60, 63, 66, 68, 74, 76-78
de probabilidad conjunta 54, 56
marginal 55
Desviacin tipo 23, 67, 70, 83, 92, 94, 97, 107,
111, 115, 135, 145-147, 256, 276
Diagrama 33-37, 39-42, 94, 129, 130
bivariante 37, 39, 42, 129, 130
causa-efecto 36, 42
de barras 33
de Pareto 31-34
Diferencia de medias 86, 95, 97, 98
Diseo central compuesto 204, 205, 212
de experimentos 18, 22, 23, 130, 135, 223,
225, 271
de productos robustos 23, 223, 225, 238
de tolerancias 226, 238
en bloques aleatorizados 102
estrella 205, 212-214
factorial 136, 153, 154, 162-165, 179, 199,
200, 205, 212
factorial a dos niveles 136, 155
primario 225
ndice alfabtico
295
secundario 226
terciario 226
Distribucin 19, 20, 23, 30, 47, 48, 52, 53, 55,
62, 63, 65, 67-71, 73-79, 81, 82, 88-90, 92-
95, 100, 102, 105-108, 112-114, 117, 121,
123, 146, 147, 149, 184, 215, 229, 231, 233,
246-248, 252, 255-257, 261, 263, 265, 270
Efecto aditivo 93, 114
bloque 93, 114, 179, 181, 183, 188, 191,
192, 199, 212-216
principal 140-143, 150, 176, 196, 199
Estadsticamente significativa 89, 94, 96, 105
Estadstico de prueba 94, 95, 123
Estado de control 49-52, 59, 68, 243, 244, 246-
248, 250, 253, 255-259, 262, 269-272
Estimador 75, 79, 88, 90, 97, 111, 116, 119,
120, 262
Estrategia experimental 130
secuencial 130, 131, 147, 158, 175, 177,
187-189
Estructura organizativa 17
Evaluacin 20, 138
Experimentar 127, 130, 132, 136, 152, 175,
192, 203, 205, 209, 210, 236, 237, 240
Experimentos independientes 70
Factor de control 227, 232
de escala de la t-Student 111
Fraccin complementaria 173, 174, 188, 191
Frecuencia absoluta 28, 29
relativa 28, 29, 51, 54, 60
Gestin de la calidad total 21
Grado de libertad 145, 183, 192, 211
Grfico C 263, 264
CUSUM 266-268
de control 246-248, 254, 256, 260, 261,
263, 264, 269, 270, 275
de observaciones individuales 251, 252
EWMA 269, 270
NP 261
P 258-262
R 250, 252, 254
Shewart 271
U 265
Heterocedasticidad 109, 110
Hiptesis alternativa 86, 90, 96, 111
Hiptesis nula 86, 89, 95, 96, 98, 110, 111,
113, 211
Histograma 28-30, 48, 50, 51, 54, 60, 103, 255
Igualdad de varianzas poblacionales 88, 90,
102
Independencia de las diferencias 94
de las poblaciones 90
ndice de capacidad 256, 257
Innovacin 15, 18, 19
Inspeccin 16-18, 30, 225, 243, 250, 260
Intervalo de confianza 97-99
de confianza para la diferencia de medias 97
Lmite de control 248
Mantenimiento 15, 18, 19, 35, 47, 72, 224, 225,
238, 255
Media muestral 74, 83, 119, 250
poblacional 52, 119
ponderada de las varianzas muestrales 111
fracciones 172, 173, 175, 177, 188
Mejora continua 15, 18-20, 244, 247, 256
Mtodo de matriz producto 230
de Taguchi 226, 240, 241
Modelo de segundo orden 207, 211, 214, 217,
221, 237
Muestra aleatoria simple 74, 79, 94
Muestreo 16, 17, 45, 247, 248, 260, 272
Nivel codificado 137, 138
Normalidad de las poblaciones 89
Planificar 19, 72, 89, 113, 130
Plantilla 26, 33, 250, 256, 268, 269
Poblacin conceptual 51, 54, 59, 61, 74
Poblacin normal 75, 121
Proceso en estado de control 49-52, 59, 68,
244, 246, 247, 258, 259, 270, 272
Productividad 16, 22, 93, 110, 111, 113, 116,
117
Producto robusto 223, 229, 236
Quality function deployement (QFD) 18
Rango 30, 41, 128, 129, 154, 202, 231, 248-
252, 257
Recogida de datos 25, 26, 41, 45, 89, 90, 93-
95, 113, 203, 248
Regin de operabilidad 206
Relacin no causal 129
Rplica 139, 163, 164
Residuo 151
Resolucin 22, 34, 45, 87, 92, 110, 114, 172,
173, 175, 177, 178, 183-185, 187, 189-191,
195, 196, 198, 200, 203, 228-230, 233
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
296

NDICE ALFABTICO
Responsabilidad 19, 22, 48
Recurso humano 130
Riesgo 91, 247, 267, 268
Ruido externo 226, 227, 229, 232, 235, 236
Ruido interno 226, 227, 236-238
Sesgado 30
Sistema 48, 49, 68, 134, 135, 139, 144, 145,
149, 158, 188, 193, 248
Suceso 74
Tolerancia 30, 69, 275
Tratamiento 23, 89, 91, 92, 94, 95, 111, 113,
115, 117, 118, 229, 271
Valor de prueba 39, 40
Valor previsto 115, 151, 270
Variabilidad funcional 224
Variable aleatoria 23, 49, 51-54, 60, 62, 65-67,
70, 74, 76, 121
Variable oculta 129, 154
Varianza 23, 51, 52, 58, 62, 71, 73, 77-81, 88,
90, 97, 105, 108-111, 115-121, 133, 141,
144-146, 152, 231, 236, 238, 239, 241, 248,
61, 263, 266
Volante de Deming 20
297

En este captulo se justifica la importancia de la calidad de los productos y servicios como elemento
estratgico para la competitividad de las organizaciones que los producen. El concepto de calidad que
subyace a lo largo de este libro es el de que la calidad es inversamente proporcional a las prdidas e
inconvenientes de todo tipo que un producto o servicio provoca al usuario.
Los mtodos utilizados en la industria para asegurar la calidad de sus productos han
evolucionado a lo largo del tiempo. En este captulo se analiza crticamente dicha evolucin y se
refuerza la idea de que el mejor momento para considerar la calidad de un producto es cuando se est
diseando.
A continuacin, y siguiendo todava en el mbito de calidad de los productos (o servicios), se
analizan tres clases de actividad que requieren distintos tipos de actitud por su distinta complejidad.
Dichas actividades son las de mantenimiento o control de la calidad, actividades de mejora
continua y, finalmente, las de innovacin o creatividad.
En el apartado 1.4 se discuten los aspectos culturales, organizativos e instrumentales necesarios
para que la calidad sea un elemento bsico en la gestin de las organizaciones, y para que stas sean
capaces de satisfacer a sus clientes tanto en calidad como en precio, plazo de entrega y servicio
postventa de sus productos.
Finalmente, y dado que este libro trata sobre mtodos estadsticos para el control, la mejora y
la innovacin de la calidad, se discute el papel que tiene el mtodo cientfico en general y la estadstica
en particular dentro de las organizaciones para el desarrollo de los tres tipos de actividad.
1.1 Evolucin histrica del concepto de control de la calidad
Desde sus orgenes, probablemente el ser humano ha considerado de vital importancia el disponer de
productos de alta calidad. Es de suponer que el cazador que dispona de mejores flechas obtena ms
y mejores presas y que este hecho no deba pasar inadvertido a nuestros antepasados.
La organizacin del trabajo en la era industrial ha aadido otros puntos de vista acerca del
producto tales como costes, plazo de entrega, servicio postventa, seguridad, fiabilidad, etc.
La prioridad asignada a los diversos conceptos ha ido evolucionando con el tiempo. As, por
ejemplo, en situaciones en las que la demanda de productos ha sido muy superior a la capacidad de
oferta, la gestin empresarial se ha orientado hacia la produccin y ha dado alta prioridad a la
15
1
El entorno de la calidad total
productividad, mientras que cuando la demanda
de ciertos productos ha sido menor que la capa-
cidad de oferta, la gestin se ha orientado hacia
el cliente y la calidad ha sido altamente
prioritaria.
En la actualidad pocos discuten la impor-
tancia estratgica de la calidad como factor de
competitividad industrial en una situacin de
fuerte saturacin y globalizacin de los
mercados.
Paralelamente, tambin ha ido evolu-
cionando la etapa del desarrollo de un
producto en la que se ha intentado asegurar su
calidad. Dicha evolucin est representada en
la figura 1.1.
1.1.1 Inspeccin
Durante el inicio de la era industrial la calidad de los productos se intentaba asegurar mediante la
inspeccin de los mismos antes de ser enviados al mercado.
El modelo conceptual del enfoque basado en la inspeccin es el de la figura 1.2.
Fig. 1.2 Enfoque conceptual de la inspeccin
A la inspeccin, ya sea exhaustiva (100%) o mediante muestreo estadstico, se le asignan dos
objetivos:
a) separar el producto defectuoso para ser reprocesado o desechado, y
b) advertir al responsable del proceso de fabricacin sobre la aparicin del producto
defectuoso para que aqul pueda tomar las medidas de ajuste que estime oportunas.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
16

Fig. 1.1 Historia del control de calidad


EL ENTORNO DE LA CALIDAD TOTAL
17

Es bien conocido el hecho de que la inspeccin, incluso si es al 100%, no cumple eficazmente


el objetivo (a), debido a la fatiga del inspector entre otras causas. Pero aunque pudisemos suponer una
inspeccin perfecta, no se debe olvidar que el producto detectado como defectuoso ya ha sido
producido y, por lo tanto, se han consumido recursos de mano de obra, materia prima, energa, etc que
incrementarn el coste del producto. Adems, en el producto considerado como aceptable puede existir
una proporcin elevada de unidades cuya calidad no se diferencie mucho de las unidades rechazadas,
y el operario se puede desentender de la calidad confiando en la inspeccin. Si aadimos a lo anterior
que la inspeccin es una actividad no productiva, y que en muchas organizaciones la estructura
organizativa no facilita la comunicacin necesaria para hacer posible la consecucin del objetivo (b),
se entiende que este enfoque para asegurar la calidad claramente no es adecuado.
1.1.2 Control estadstico de procesos (C.E.P.)
Durante los aos que precedieron al inicio de la II Guerra Mundial, y debido principalmente a los
trabajos de W. Shewhart (1931), el aseguramiento de la calidad se desplaz a la etapa de fabricacin
de los productos.
El esquema conceptual del C.E.P. (o S.P.C. en abreviacin inglesa) es el de la figura 1.3.
Fig. 1.3 Modelo conceptual del control estadstico de procesos
Se trata, esencialmente, de minimizar la produccin de unidades defectuosas reduciendo el
tiempo que transcurre entre la ocurrencia y la deteccin de algn desajuste en el proceso de
fabricacin, as como la identificacin de las causas del mismo a fin de evitar su repeticin.
Este tipo de control, que se desarrolla en el captulo 11 de este libro, se implementa mediante
muestreo de caractersticas fsicas del producto (longitud, peso, dimetro, etc.), o de variables del
proceso (temperatura, presin de rodillo, etc.).
Dado que el C.E.P. no conseguir eliminar por completo la fabricacin de unidades defectuosas,
puede ser necesario mantener cierto grado de inspeccin final tal como se indica en la figura 1.3.
Ahora, sin embargo, la inspeccin tiene como finalidad el separar el producto defectuoso.
1.1.3 Calidad en la etapa de diseo
Tanto la inspeccin como el C.E.P. son mecanismos internos de la organizacin. Es por ello que,
aunque en una cierta empresa funcionasen a la perfeccin tanto las inspecciones a la recepcin de
materias primas como las de producto acabado, as como el control estadstico de los principales
procesos de la misma, nada o muy poco aportaran estos procedimientos a algo tan importante como
saber los problemas que los productos de la empresa en cuestin provocan a sus clientes cuando los
utilizan, o por qu algunas personas utilizan productos de la competencia, etc.
Es por ello que, en la actualidad, el control de la calidad es una actividad globalizadora, que
incluye, no slo a todas las personas y procesos de una cierta empresa, sino tambin a los proveedores
y a los distribuidores, tal como queda reflejado en la figura 1.4.
Fig. 1.4 Modelo conceptual de la calidad total
En esta figura destaca, en primer lugar, que la calidad ha de venir determinada por las
necesidades y expectativas del cliente y no por necesidades internas de la propia organizacin. En
segundo lugar se observa que el mejor momento para asegurar la calidad de los productos o servicios
es durante el diseo de los mismos. Para ello es necesario, por un lado, actuar sobre los proveedores
para poder mejorar la calidad de los componentes no fabricados en la empresa y, por otro, la utilizacin
de herramientas como el diseo de experimentos (DEX) o el Quality Function Deployement (QFD)
para intentar que las expectativas de los clientes se introduzcan y optimicen en la etapa de diseo y
prototipo.
1.2 Mantenimiento, mejora e innovacin en la calidad
1.2.1 Conceptos bsicos
En el terreno de la calidad es conveniente distinguir tres tipos de actividades diferentes: mantenimien-
to, mejora continua e innovacin. El lector puede encontrar una buena presentacin de estos conceptos
en el libro Kaizen de Imai (1986).
Por actividades de mantenimiento entendemos todas aquellas actividades tendentes a conservar
los estndares tecnolgicos, de gestin y de operacin actuales.
mantenimiento = estandarizar + control
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
18

EL ENTORNO DE LA CALIDAD TOTAL


Parece recomendable que, antes de embarcarse en cualquier programa de mejora de la calidad,
una empresa estandarice la mejor forma conocida de operar y se asegure de que todo el personal trabaja
de acuerdo a dichos estndares. En nuestra opinin, los estndares deben ceirse a las operaciones
verdaderamente importantes, deben estar redactados de forma clara y ser comprendidos por el personal
que debe seguirlos. El control del cumplimiento de dichos estndares es responsabilidad de la gestin
de la empresa
Por actividades de mejora continua (Kaizen en japons) entendemos todas aquellas actuaciones
dirigidas hacia la mejora constante de los estndares actuales.
Tal como indica Bill Hunter, todo proceso u operacin adems de producto fsico, genera
informacin suficiente para mejorarlo. Hasta tal punto es cierta esta afirmacin que es muy probable
que cuando un estndar est en vigor ms de seis meses sin ser modificado, ello sea debido a que no
es seguido por nadie dentro de la propia organizacin.
Las actividades de mejora constante se realizan mediante la secuencia (Plan, Do, Check,
Action), es decir, planificar la mejora, implementarla, verificar sus efectos y actuar en funcin de los
resultados de dicha verificacin, tal como explicamos en el apartado 1.2.2.
Creemos importante destacar que a toda mejora en los estndares operativos deben seguir
actividades de mantenimiento, ya que de lo contrario es casi seguro que los efectos beneficiosos de la
mejora desaparecern rpidamente (ver figura 1.5).
Por actividades de innovacin entendemos aquellas actividades sistemticas tendentes a la
creacin de productos/servicios con fun-
ciones, operatividad, coste, etc., nunca
experimentados antes.
Uno de los activos intangibles
que toda empresa debera incrementar, lo
constituyen las metodologas y herra-
mientas que permiten utilizar los conoci-
mientos y la creatividad de todo el per-
sonal de la organizacin para crear
nuevos productos que satisfagan con
creces las necesidades y expectativas de
los clientes potenciales.
Cada una de las actividades que
acabamos de describir requiere distinto
nivel de conocimiento y de respon-
sabilidad por parte del personal que la
realiza. As, por ejemplo, Imai (1986)
considera que la distribucin del tiempo
de trabajo de los distintos niveles de
responsabilidad en las distintas acti-
vidades se distribuye en Japn segn el
grfico de la figura 1.6.
Destacan el poco tiempo dedi-
cado a las actividades de mantenimiento
(el da a da) por parte de la alta direc-
cin, y el tiempo que dedican capataces y
trabajadores a las actividades de mejora
continua.
19

Fig. 1.5 Mantenimiento, mejora e innovacin


Fig. 1.6 Concepcin japonesa de las funciones
1.2.2 El ciclo PDCA como estrategia bsica de los procesos de mejora continua
Desde su primera visita a Japn en 1950, Deming transmiti a los ejecutivos e ingenieros
japoneses que asistan a sus sesiones de consulta la importancia transcendental de la interaccin
constante entre I+D, diseo, fabricacin y servicio postventa. Esta idea se generaliz en lo que
diversos autores (Imai (1986), Ishikawa (1985)) han llamado el volante de Deming, tambin
conocido por el ciclo PDCA (Plan, Do,
Check, Action). La versin de Ishikawa del
ciclo PDCA se encuentra en la figura 1.7.
Este ciclo es til para actividades
tan diversas como la planificacin estra-
tgica de una empresa, o la mejora del pro-
ceso de distribucin del correo interno en
la misma. En el contexto que discutimos en
este captulo, se propone el ciclo PDCA
como la estrategia a seguir en toda acti-
vidad de mejora constante de los estndares
existentes en una organizacin.
En primer lugar debe planificarse
(Plan) la mejora.
La etapa de planificacin comprende,
entre otras actividades:
a) definicin de los objetivos a alcanzar,
b) definicin de medidas que permitan saber en un momento dado el nivel de cumplimiento de
sus objetivos,
c) definicin del equipo responsable de la mejora,
d) definicin de los recursos o medios necesarios para alcanzar los objetivos propuestos.
En segundo lugar aparece la ejecucin (Do) de las tareas necesarias para implementar la mejora.
En esta etapa es importante considerar la necesidad de educar y entrenar al personal responsable
de la implementacin de la mejora. La omisin de esta actividad suele hacer fracasar una buena parte
de los proyectos de mejora. Evidentemente la fase de ejecucin requiere la puesta en prctica de las
modificaciones del producto o del proceso que han sido consideradas como oportunas y efectivas por
el equipo de trabajo.
En tercer lugar tenemos la etapa de evaluacin (Check). Esta fase es de enorme importancia. Se
trata de verificar los resultados de la implementacin de la mejora comparndolos con los objetivos
iniciales. Es importante aclarar en este punto que, en general, no es suficiente evaluar los resultados
finales. En efecto, si fuese cierto algo del tipo: Si se aplica la solucin Y debera obtenerse el resultado
X, no se tratara de verificar si se ha obtenido X sino tambin si se ha aplicado la solucin Y.
Finalmente, en cuarto lugar, tenemos la etapa de actuacin (Action).
De la etapa de verificacin debe desprenderse la necesidad de actuar sobre el proceso para
corregir los aspectos que hayan merecido una evaluacin negativa. La actuacin puede implicar y
mejorar el propio plan, por ejemplo, fijando nuevos objetivos, o mejorando el proceso de educacin
del personal, o modificando la asignacin de recursos para el proyecto de mejora, etc.
Una vez completado el ciclo es importante seguir dando vueltas al volante PDCA, repitiendo
las cuatro etapas en un nuevo proceso de mejora. Slo mediante esta perseverancia puede una empresa
mejorar realmente todos los procesos y, en consecuencia, la calidad de sus productos y servicios.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
20

Fig. 1.7 El ciclo PDCA


EL ENTORNO DE LA CALIDAD TOTAL
1.3 Conceptos bsicos de gestin de la calidad total
Este libro no cuenta entre sus objetivos entrar en el detalle de las diferentes teoras existentes sobre la
gestin de la calidad total, que se encuentran desarrolladas en las obras de Deming (1982), Juran &
Gryna (1980) e Ishikawa (1985), entre otros muchos autores.
De todas maneras, lo que tienen en comn las teoras de estos pensadores de la calidad total es
que sta se asienta sobre tres pilares: cultura de la calidad, sistemas y recursos humanos, y utilizacin
de la estadstica. Si en una organizacin falla alguno de estos tres pilares, ser difcil, por no decir
imposible, introducir la gestin de la calidad total.
En la figura 1.8 se resume lo que el consultor norteamericano Brian Joiner llama la teora Q.
La cultura de la empresa respecto a la calidad es un pilar esencial. Hoy en da es difcil encontrar
directivos en las organizaciones que no digan que para ellos, la calidad es lo ms importante. Pero por
desgracia, los hechos no siempre concuerdan con estas afirmaciones. Es fundamental que los
propietarios o la alta direccin se involucren en la introduccin de esta cultura de la calidad en sus
empresas.
21

Fig. 1.8 La teora Q de Brian Joiner


CULTURA
MTODO CIENTFICO UN SOLO EQUIPO
Dicha cultura empieza por reconocer que la calidad viene definida por las necesidades y
expectativas del cliente, y no por consideraciones internas de los departamentos de la empresa. La idea
fundamental es que los productos y servicios deben cumplir siempre las especificaciones del cliente e
incluso sorprender al mismo con prestaciones en las que ni tan siquiera haba pensado. Es esta calidad
excitante (en la denominacin de Kano (1987)) la que puede captar nuevos usuarios y ampliar la cuota
de mercado de la organizacin que sea capaz de fabricar este tipo de productos.
Adems, cuando se habla de cliente, hay que tener en cuenta que nos referimos, tanto al cliente
externo o destinatario final de los productos y servicios, como al cliente interno. En este sentido es
importante tener presente que toda unidad operativa dentro de la empresa se caracteriza por tener
proveedores (el proceso anterior), tener clientes (el siguiente proceso) y realizar las operaciones
propias de la unidad. Todo proceso debe, pues, intentar satisfacer las expectativas del proceso que le
sigue (cliente interno) y, por descontado, intentar no crearle problemas o inconveniencias.
Otra idea bsica en el aspecto cultural de las organizaciones es que la calidad se mejora
nicamente mejorando todos los procesos de la organizacin. La mejora constante de la calidad es
responsabilidad de todo el personal. De hecho podra decirse que en cualquier descripcin de las
funciones de un puesto de trabajo debera figurar la de mejorarlo constantemente.
Atendiendo al elevado porcentaje de componentes en un producto final que son comprados a
proveedores externos, pero que el cliente final asociar a la empresa que sita el producto en el
mercado, se ha impuesto la idea de que es importante asociar a los proveedores en la responsabilidad
de la mejora de la calidad. Esta idea, que en la versin de Deming se debera realizar mediante
colaboracin entre proveedor y comprador en beneficio mutuo y en convenios a largo o medio plazo,
no siempre se aplica con este enfoque y puede generar importantes tensiones entre las partes
involucradas.
Los distribuidores pueden aportar informacin pertinente sobre el comportamiento de los
productos cuando estn en manos del cliente y, en consecuencia, aportar a la empresa datos sobre las
necesidades y expectativas del mercado que deberan ser satisfechas por los productos y servicios de
la organizacin.
Finalmente, el tercer pilar lo constituye la utilizacin masiva del mtodo cientfico y ms en
concreto de la estadstica.
El lector habr observado que hemos puesto en cursiva la palabra masiva. En efecto, no se trata
tanto de que un porcentaje reducido del personal utilice mtodos estadsticos altamente complejos sino
de que en toda la organizacin se utilicen datos fiables para la toma de decisiones a todos los niveles.
Como deca Bill Hunter, (1) si una organizacin desea mejorar sus niveles actuales de calidad y
productividad debe actuar, es decir, tomar decisiones; (2) para tomar decisiones es necesario disponer
de buena informacin y, (3) la estadstica es la disciplina especializada en convertir datos en
informacin. De este simple razonamiento se desprende la importancia del tercer pilar.
Creemos conveniente insistir en la necesidad de la existencia de los tres pilares en toda
organizacin que quiera situar la calidad en el centro de sus actividades, y que desee mejorar su
productividad y sus costes por el nico camino real, que es la mejora de la calidad. As, por ejemplo,
de poco servira que se utilizasen grficos de control o diseo de experimentos en una empresa donde
no existiera la cultura necesaria, o se quisieran solucionar los problemas de calidad mediante la
introduccin de crculos de calidad sin que stos supiesen utilizar las herramientas estadsticas bsicas
y sin que la alta direccin asumiera la responsabilidad en la resolucin de los problemas que slo ella
pudiese abordar. Es importante insistir en esta idea dado que el presente libro se refiere exclusivamente
a mtodos estadsticos y el lector podra deducir, equivocadamente, que son slo estos mtodos los
necesarios para mejorar la calidad de los productos y servicios de una organizacin.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
22

EL ENTORNO DE LA CALIDAD TOTAL


1.4 Mtodos estadsticos en la calidad total
En este libro presentamos algunos de los mtodos estadsticos ms utilizados para la mejora y el
control de la calidad de productos y servicios.
No pretendemos ser exhaustivos y quedan fuera de este trabajo algunos mtodos de uso muy
extendido como la regresin mltiple, la fiabilidad y los experimentos con mezclas, entre otros.
En el captulo 2 se presentan algunas herramientas bsicas, conocidas como las herramientas de
Ishikawa, cuyo uso sistemtico y masivo en toda la organizacin es suficiente para resolver un
porcentaje muy elevado de problemas de calidad. Uso sistemtico significa entender las organizacio-
nes como sistemas y tener en cuenta, por lo tanto, que una modificacin o mejora en un cierto proceso
puede influir en otros procesos de la organizacin. El lector deber, pues, prestar ms atencin al
concepto de uso sistemtico y, uso por parte de todas las personas con un enfoque claro de mejora de
la calidad, que en las tcnicas o herramientas en s mismas.
En el captulo 3, se estudian de manera conceptual algunas ideas bsicas de la teora de la
probabilidad, tales como variable aleatoria, densidad de probabilidad y funcin de distribucin y los
modelos probabilsticos ms usuales.
El captulo 4 se dedica al estudio de las distribuciones asociadas a muestras aleatorias simples
de poblaciones normales, que constituyen la base terica necesaria para el desarrollo del resto del libro.
En el captulo 5 se presentan los mtodos basados en la t-Student para comparar dos
poblaciones. En la prctica es frecuente que un mismo producto sea fabricado en dos o ms procesos
idnticos que funcionan en paralelo. Antes de mezclar las producciones de dos mquinas, deberamos
asegurarnos de que, efectivamente, estn trabajando con la misma media y desviacin tipo. Esta
comprobacin puede hacerse mediante pruebas de significacin basadas en la t-Student para diseos
totalmente aleatorizados.
Otro tipo de problemas que se resuelven con los mtodos de la t-Student para diseos en
bloques aleatorizados son, por ejemplo, comparar una poblacin de individuos antes y despus de
haber sido sometida a un tratamiento, como podra ser un plan de formacin.
En el captulo 6 se generalizan los mtodos estudiados en el captulo 5, al caso de comparar ms
de dos poblaciones. Dicha comparacin se realiza mediante tcnicas de anlisis de la varianza que se
presentan para el caso de diseos totalmente aleatorizados y para diseos en bloques aleatorizados.
Los captulos 7 y 8 estn dedicados a la presentacin de los conceptos y mtodos para el diseo
de experimentos con factores a dos niveles. Se estudian tanto los diseos factoriales como los
factoriales fraccionales con o sin bloqueo. El captulo 9 extiende los conceptos de los dos captulos
anteriores al estudio de las superficies de respuesta.
Las aportaciones de G. Taguchi al diseo de productos robustos y las posibles mejoras a sus
mtodos, son objeto de estudio en el capitulo 10.
Finalmente el captulo 11 se dedica al estudio del control estadstico de procesos.
23

Es prctica habitual en todas las empresas fijar unos objetivos en cuanto a ventas, produccin, stocks,
beneficios, etc., y peridicamente ir comprobando si los resultados obtenidos coinciden con las
previsiones realizadas, para tomar las acciones correctoras oportunas en el caso de que las desviaciones
respecto a lo previsto sean importantes.
Sin embargo, las acciones en cuanto a la mejora de la calidad se toman en muchas ocasiones
basndose en sensaciones, impresiones u opiniones, pero no en el anlisis cientfico de datos objetivos.
Cada vez est ms extendida la idea de que los problemas de calidad deben ser atacados
mediante la aplicacin de mtodos cientficos de recogida y anlisis de datos (estadstica). Pero el uso
de esta prctica no debe quedar restringido a un grupo reducido de expertos en calidad sino que todo
el personal puede (y debe!) participar en el proceso de control y mejora de la calidad.
Naturalmente, no todos deben aplicar las mismas tcnicas. Por ejemplo, los planes de
experimentacin para la optimizacin de productos (que se estudian con detalle en los captulos 7 y 8
de este libro) exigen la utilizacin de importantes recursos materiales y requieren un cierto nivel de
especializacin y conocimientos; por tanto, deben quedar en manos de los cuadros tcnicos.
No obstante, existen otras tcnicas que s deben ser conocidas y utilizadas por todo el personal
de la empresa. Estas tcnicas se conocen con el nombre de Las siete herramientas bsicas de
Ishikawa, ya que ha sido este ingeniero japons el que ms ha promocionado su uso, primero en
Japn, con notable xito, y despus en el resto del mundo.
Existe unanimidad entre los expertos de ms prestigio en temas de calidad respecto a que estas
sencillas herramientas, bien utilizadas por parte de todo el personal de la empresa, permiten solucionar
en torno al 90 % de los problemas de calidad que se presentan. Conviene, por tanto, tenerlas presentes
y fomentar su utilizacin. Las herramientas son:
Plantillas para la recogida de datos.
Histogramas.
Diagramas de Pareto.
Diagramas causa-efecto.
Diagramas bivariantes.
Estratificacin.
Grficos de control.
En este captulo se presentan con detalle las seis primeras. A los grficos de control, por su
mayor envergadura, se les dedica el captulo 11 de este libro.
25
2
Herramientas bsicas
para la mejora de la calidad
2.1 Plantillas para la recogida de datos
No es difcil suponer que para mejorar la calidad se necesitan datos. Pero muchas veces los datos se
toman de forma desordenada o mal documentada, haciendo imposible su anlisis posterior. Otras veces
los datos son incorrectos porque se han tomado de forma distinta a la prevista, y las conclusiones que
se obtienen a partir de stos carecen de sentido por mucho esmero que se ponga en su anlisis.
Por tanto, la recoleccin de datos debe efectuarse de manera cuidadosa y exacta, y para ello
nada mejor que utilizar plantillas especialmente diseadas para cada caso.
Los objetivos que se pretenden con el uso de las plantillas son:
facilitar las tareas de recogida de la informacin,
evitar la posibilidad de errores o malos entendidos,
permitir el anlisis rpido de los datos.
Las plantillas para la recogida de datos pueden tener distintas finalidades: controlar una variable
de un proceso, llevar un control de productos defectuosos, estudiar la localizacin de defectos en un
producto, estudiar las causas que originan los defectos o realizar la revisin global de un producto.
Las figuras 2.1 a 2.4 muestran algunos ejemplos.
La experiencia demuestra que en la recogida de
datos conviene seguir algunas reglas, stas son:
1. No tomar datos si despus no se van a utilizar. Puede parecer obvio pero es una costumbre
bastante arraigada. Los datos intiles slo sirven para dificultar la localizacin de los tiles.
2. Asegurarse de que los datos se toman de forma que se anlisis sea fcil, de lo contrario es
probable que no se haga nunca. Entretenerse en el diseo de la plantilla de recogida de datos es
una de las actividades ms rentables que pueden realizarse.
3. No pasar los datos a limpio. Es una prdida de tiempo y una fuente de errores. Es necesario
anotarlos de forma clara y ordenada a la primera.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
26

CONTROL DE SERPENTINES
Identificacin
Tipo:
Lote:
Hoja de ruta:
Fecha:
L4nea:
Operario:
Total revisado:
Defectos:
Tipo Total
Soldadura
Poro
Deformado
Incompleto
Otros
Notas e incidencias:
Fig. 2.2 Plantilla para la localizacin de poros
en guantes de goma. Obsrvese la diferencia
que supone conocer la informacin que aqu
figura respecto a saber que se presentan
muchos poros. (Tomado de J.M. Juran Manual
de Control de Calidad)
Fig. 2.1 Ejemplo de plantilla para el control de productos defectuosos.
El conocimiento de cules son los defectos que se presentan ms
corrientemente permite dar prioridad a las acciones que se deben tomar
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
28

2.2 Histogramas
En muchos casos, si los datos han sido tomados de forma correcta, las conclusiones que se pueden
obtener a partir de los mismos son inmediatas. Si no es as, raramente se precisan anlisis estadsticos
complicados, suele bastar con una adecuada representacin grfica.
La tabla de datos que figura a continuacin corresponde a una muestra, tomada aleatoriamente
durante 20 das, del peso en gramos de cierto embutido que puede ser elaborado por dos mquinas
distintas (1 y 2), que a su vez son atendidas indistintamente por dos operarios (A y B).
Las especificaciones del peso son 220 10 g, y ltimamente se han detectado ciertos proble-
mas a este respecto. Veamos cul sera el diagnstico de la situacin y la propuesta de medidas a tomar
a la vista de estos datos.
Cuando se trata, como en este caso, de analizar la dispersin que presentan unos datos, la
representacin grfica ms adecuada es el histograma. Para realizar un histograma se marcan una serie
de intervalos sobre un eje horizontal, y sobre cada intervalo se coloca un rectngulo de altura
proporcional al nmero de observaciones (frecuencia absoluta) que caen dentro de dicho intervalo.
Si se pretende comparar varios histogramas construidos con distinto nmero de datos, es
preferible que las alturas de los rectngulos sean proporcionales al porcentaje de observaciones en cada
intervalo o al tanto por uno (frecuencia relativa). Utilizando la frecuencia relativa en el eje de
ordenadas tambin se facilita la comparacin entre el histograma obtenido y un determinado modelo
terico representado por una funcin densidad de probabilidad (vase el captulo 3). En este caso se
considera que la frecuencia relativa es proporcional al rea definida por cada columna. Puede
interpretarse la funcin densidad de probabilidad como la representacin del histograma cuando el
nmero de observaciones tiende a infinito y la anchura de los rectngulos tiende a cero.
DA OPERAR. MQUINA 1 MQUINA 2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
A
B
B
B
A
A
A
B
B
A
B
B
B
A
A
B
B
A
A
A
220.3
215.8
220.4
221.5
215.7
222.7
216.0
219.4
219.8
220.2
218.0
219.3
220.0
223.9
218.1
216.9
217.9
224.2
214.1
221.1
215.5
222.0
218.7
227.0
225.3
215.1
218.8
218.3
222.6
219.5
223.9
219.6
214.1
220.6
218.8
221.6
225.7
216.2
219.7
225.0
219.1
218.9
218.6
219.5
223.0
219.6
217.9
216.7
219.1
222.4
219.6
218.8
224.3
219.5
218.4
220.6
222.2
219.9
222.4
222.7
219.2
213.6
219.6
222.5
218.0
217.3
213.0
224.1
217.7
219.9
221.9
219.9
217.4
219.6
217.9
222.6
216.1
220.4
224.5
222.2
220.3
216.9
222.9
223.1
216.0
212.1
216.9
216.2
216.2
222.9
214.9
219.0
218.0
211.8
214.6
215.6
212.5
215.8
213.7
212.5
208.0
213.4
219.7
215.3
210.9
213.0
216.0
218.4
212.2
214.3
212.6
216.7
219.5
218.2
215.7
220.4
214.6
219.9
209.7
217.5
214.4
217.7
209.4
220.4
221.4
218.0
213.5
216.6
216.9
219.1
219.4
216.4
219.5
218.3
218.0
217.3
209.7
216.5
216.9
217.4
219.2
217.7
221.6
215.6
210.9
216.5
219.2
214.9
214.9
216.7
212.3
213.5
222.3
217.4
216.4
216.2
211.3
211.9
213.1
215.7
Tabla 2.1 Datos sobre el peso (en gramos) de cierto embutido
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
29

En la figura 2.5 se han realizado dos histogramas con todos los datos (en total 160). En el
histograma de la izquierda se ha colocado la frecuencia absoluta en el eje vertical y en el de la derecha
la frecuencia relativa. La nica diferencia es la escala vertical, pero naturalmente las conclusiones que
se pueden obtener son las mismas: El proceso est descentrado y se est produciendo un cierto
porcentaje de unidades fuera de tolerancias (por defecto). A partir de estos histogramas no puede
obtenerse ninguna otra conclusin, pero la forma en que se han anotado los datos permite construir
histogramas para las unidades producidas por cada operario y tambin por cada mquina.
Los histogramas realizados por operario no revelan nada til, pero los realizados por mquina
(figura 2.6) ponen de manifiesto el origen del problema. Mientras que la mquina 1 est centrada y
produce dentro de tolerancias, la mquina 2 est descentrada, y esto es lo que produce que un cierto
porcentaje est por debajo del peso mnimo.
Tambin pueden realizarse grficos por operario y mquina, pero no revelan nada que no
sepamos ya. No hay diferencias entre operarios, la diferencia est en las mquinas.
Fig. 2.5 Histograma de los datos globales, colocando en el eje vertical la
frecuencia absoluta y la frecuencia relativa
Fig. 2.6 Histogramas correspondientes a las unidades producidas por cada mquina
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
30

Los histogramas que se han presentado han sido elaborados con ayuda de un paquete de
software estadstico. En algunos casos, especialmente si son los operarios los que analizan los datos
que ellos mismos recogen, puede ser ms rpido y cmodo construir los histogramas a mano. En este
caso, conviene seguir una sistemtica adecuada como la siguiente:
1. Colocar los datos a representar en filas de aproximadamente 10 nmeros.
2. Identificar y sealar el mximo y el mnimo de cada fila.
3. A partir del mximo y el mnimo de cada fila, localizar el mximo y el mnimo globales.
4. Calcular el rango (R) de los datos.
R = Valor mximo - Valor mnimo
5. Optar por un nmero de intervalos (k), en
primera aproximacin, utilizando la siguiente
tabla:
6. Determinar la amplitud (h) de los intervalos, haciendo:
y redondeando el valor obtenido a un mltiplo exacto de la precisin de los datos.
7. Fijar los lmites de los intervalos. Para evitar el problema que se presenta al asignar un valor a
un intervalo cuando dicho valor coincide con el extremo superior de un intervalo y el extremo
inferior del otro, conviene fijar dichos extremos con una precisin igual a la mitad de la
precisin de los valores.
As, si los datos se presentan con un solo decimal y los extremos de los intervalos son de la
forma 2,15 - 2,35, est claro que los valores 2,2 y 2,3 debern situarse en este intervalo, 2,4 en
el intervalo siguiente, etc.
8. Rellenar la tabla de frecuencias, indicando el nmero de veces que aparecen datos dentro de
cada uno de los intervalos definidos.
9. Construir el histograma.
En la figura 2.7 se presentan varias formas de histograma que responden a patrones de
comportamiento tpico.
El histograma 1 corresponde a la forma de campana habitual que representa la variabilidad
debida a causas aleatorias. El histograma 2, con dos mximos diferenciados, responde a una
distribucin denominada bimodal y se presenta cuando estn mezclados datos de distinto origen
centrados en valores distintos.
El histograma 3 se denomina, por su forma, sesgado a la derecha, y responde a la variabilidad
que presentan ciertas variables que no siguen una ley normal, como los tiempos de vida. Tambin
puede representar una magnitud con un cero natural, como la tolerancia entre eje y cojinete.
Al histograma 4 parece faltarle una parte y por ello se le llama censurado (en este caso, a la
izquierda). No representa una variabilidad natural y por tanto hay que sospechar que se han eliminado
algunos valores. Esto ocurre si despus de la produccin se realiza una inspeccin al 100 % para
separar las unidades fuera de tolerancias.
En los histogramas 5 y 6 aparecen datos que no siguen el patrn de comportamiento general
(anomalas, errores, etc.). Su variabilidad puede atribuirse a alguna causa asignable que deber ser
identificada y eliminada.
NM. DE DATOS NM. DE INTERVALOS
<50
50 - 100
100 - 250
>250
5 - 7
6 - 10
7 - 12
10 - 20
h
R
k
=
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
31

2.3 Diagramas de Pareto


Existen muchos aspectos de cualquier actividad industrial (y tambin no industrial) susceptibles de
mejora. En algunos casos, la mejora es obligada, pero el problema a abordar es de tal envergadura que
parece imposible de resolver. Pensemos, por ejemplo, en una lnea de envasado que sufre frecuentes
paradas por avera en alguno de los mdulos (no siempre el mismo) de que est compuesta. Puede
plantearse la necesidad de cambiar la lnea entera, pero en muchas ocasiones sta es una inversin
importante que se va postergando.
Supongamos que despus de tomar datos durante seis meses, la informacin obtenida puede
resumirse mediante la tabla 2.2.
Fig. 2.7 Diversas formas tpicas que pueden presentar los histogramas
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
32

La informacin que contienen estos datos se manifiesta de forma ms clara construyendo unos
grficos como los de la figura 2.8.
Estos grficos se denominan diagramas de Pareto y ponen de manifiesto que, cuando se
analizan las causas de un problema, en general son unas pocas las responsables de su mayor parte. A
estas pocas se les llama causas fundamentales, al resto, que son muchas pero ocasionan una pequea
parte del problema se les denomina causas triviales.
En el caso que estamos analizando, slo dos causas han ocasionado en torno al 80 % del
problema (el 79,7 % del tiempo de parada y el 85,7 % del nmero de paradas). Por tanto, stas sern
las primeras causas a atacar. Todo el esfuerzo debe concentrarse en la eliminacin de las causas
fundamentales, ignorando en principio las triviales, que ya sern atacadas ms adelante.
Los diagramas de Pareto pueden aplicarse a situaciones muy distintas con el fin de establecer
las prioridades de mejora, y siempre reflejan el mismo principio de pocas fundamentales y muchas
triviales.
La construccin de estos diagramas puede realizarse siguiendo los pasos que a continuacin se
indican:
CAUSA NM. DE PARADAS TIEMPO DE PARADA
Ma. Tar. - Ma. Tar. -
Rotura hilo
Cinta
Vibrador
Tornillo sin fin
Apelmazamiento
Rotura saco
Otros
(1)
(2)
(3)
(4)
(5)
(6)
(7)
18
15
92
1
0
2
1
24
10
88
6
1
1
0
42
25
180
7
1
3
1
20
12
62
2
0
4
8
31
10
68
8
1
1
0
51
22
130
10
1
5
8
Tabla 2.2 Nmero de paradas y tiempo de parada en una lnea de envasado
Fig. 2.8 Diagramas de Pareto para el nmero total de paradas y el tiempo de parada total
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
33

1. Plantear exactamente cul es el problema que se desea investigar, qu datos sern necesarios,
cmo recogerlos (no olvidar el diseo de la plantilla) y durante qu perodo.
2. Tabular los datos recogidos. Si se trata de analizar las reclamaciones de clientes durante un ao,
dicha tabulacin tendr el aspecto que se indica en la tabla 2.3.
3. Rellenar el formulario previo a la construccin del diagrama. Las causas deben ordenarse de
mayor a menor importancia, situando otras siempre al final.
Para los datos de la tabla anterior, el formulario tiene el aspecto que se indica en la tabla 2.4.
4. Iniciar la realizacin del diagrama dibujando los ejes. Se coloca un eje horizontal dividido en
tantas partes como causas figuran en el formulario anterior, y dos ejes verticales. El eje de la
izquierda se marca desde 0 hasta el total (de reclamaciones, en este caso) y el eje de la derecha,
que sirve colocar los porcentajes, se marca del 0 al 100 %.
5. Construir el diagrama de barras. La altura de cada barra debe corresponder al nmero de
observaciones correspondientes a cada causa, de acuerdo con la graduacin del eje de la
izquierda.
6. Construir el polgono de frecuencias acumulado y aadir toda la informacin relativa al grfico
para que pueda ser fcilmente interpretado. El resultado final tiene el aspecto que se presenta
en la figura 2.9.
CAUSA
NM. DE
RECLAMACIONES
TOTAL
ACUMULADO PORCENTAJE
PORCENTAJE
ACUMULADO
D
B
F
A
C
E
Otras
104
42
20
10
6
4
14
104
146
166
176
182
186
200
52
21
10
5
3
2
7
52
73
83
88
91
93
100
TOTAL 200 100
Tabla 2.4 Formulario previo a la construccin del diagrama de Pareto
CAUSA TABULACIN TOTAL
A
B
C
D
E
F
Otras
10
42
6
104
4
20
14
TOTAL 200
Tabla 2.3 Tabulacin de los datos recogidos para la relacin
de un diagrama de Pareto
... ...
... ...
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
34

Siempre que sea posible, es conveniente


utilizar unidades monetarias en el eje vertical
izquierdo. Consideremos, por ejemplo, que se ha
realizado una auditora final a un lote de productos
y se han detectado 200 defectos por causas
indicadas en la tabla 2.5.
Con esta informacin, y realizando el
diagrama de Pareto por nmero de defectos, se
llegara a la conclusin de que la primera causa a
atacar es la A. Sin embargo, considerando los
costes que origina cada tipo de defecto, la tabla
podra ser la 2.6 y, por tanto, vista la situacin de
esta forma, la causa que tendra un inters
prioritario sera la B.
Otra recomendacin importante es recoger
los datos de forma que puedan ser fcilmente
estratificados segn su origen (turno, operario,
mquina, da de la semana, tipo de materia prima, etc.). No hay que conformarse con un diagrama de Pareto
global, sino estratificar segn el origen de los datos, comparar los diagramas y sacar conclusiones.
2.4 Diagramas causa-efecto
En muchas ocasiones, cuando se presenta un problema, se confunde su resolucin con la eliminacin
de los efectos que produce, y esta prctica suele traer consigo malas consecuencias.
Ishikawa, en su libro Qu es el control total de calidad?, presenta un caso de su propia
experiencia. Explica que cierto dispositivo iba unido a una mquina por medio de cuatro pernos. El
perno 1 se rompa con frecuencia por lo que se decidi sustituirlo por otro de mayor dimetro. A partir
del cambio no se volvi a romper el perno 1, pero empez a romperse el perno 2. Ante la nueva
situacin se decidi que los cuatro pernos deberan ser ms grandes y se procedi al cambio. Ya no
Fig. 2.9 Ejemplo de representacin de un diagrama de Pareto
TIPO DE CAUSA NM. DE DEFECTOS PROPORCIN PROPORCIN ACUMULADA
A
B
C
D
Otras
110
45
22
6
17
0.55
0.23
0.11
0.03
0.08
0.55
0.78
0.89
0.92
1.00
Tabla 2.5 Causas ordenadas segn su frecuencia de aparicin
TIPO DE
CAUSA
NM. DE
DEFECTOS
COSTE
UNITARIO
COSTE POR
CAUSA
PROPORCIN
COSTE
PROPORCIN
ACUMULADA
B
A
C
D
Otras
45
110
22
6
17
5
1
3
2
1.5
225
110
66
12
22.5
0.51
0.25
0.15
0.03
0.06
0.51
0.76
0.91
0.94
1.00
Tabla 2.6 Causas ordenadas segn el coste ocasionado por cada una de ellas
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
35

se volvi a romper ningn perno, pero empezaron a


aparecer fracturas en la placa de hierro en la que estaba
situado el dispositivo. Se cambi la placa de hierro por otra
ms gruesa y se anunci que el problema haba quedado
resuelto definitivamente.
Un estudio ms profundo realizado posteriormente
puso de manifiesto que una vibracin que llegaba al
dispositivo era lo que ocasionaba los fenmenos de
ruptura, y que si no se eliminaba acabara rompiendo la
nueva placa metlica o inutilizando el dispositivo con
graves consecuencias.
Lo que se haba hecho era intentar evitar el efecto del problema, pero sin eliminar su causa, y si
la causa permanece, el efecto vuelve a manifestarse, de forma an todava ms perjudicial.
Para solucionar un problema deben estudiarse sus causas y eliminarlas (en el caso de Ishikawa la
causa era la vibracin, aunque tambin debera haberse investigado el origen de la misma). La idea est
clara, para solucionar un problema: atacar las causas, no los efectos!
Pero descubrir el entramado de posibles causas que hay detrs de un efecto no es fcil. Para hacerlo
es conveniente seguir una determinada metodologa y construir el llamado diagrama causa-efecto
1
. Una
buena forma de hacerlo es siguiendo los puntos que ha continuacin se describen:
1. Determinar e identificar claramente cul es el efecto (el problema, la caracterstica de calidad, etc.)
a estudiar.
2. Reunir a las personas que puedan aportar ideas sobre el origen del problema y realizar un
brainstorming de posibles causas.
Existen distintas formas de organizar este tipo de reuniones, pero el objetivo bsico es siempre
asegurarse de que cada participante aporta todo lo que lleva dentro. Una posibilidad es establecer
rondas de intervenciones en las que todos participen siguiendo un orden establecido. Cada persona
deber ir aportando posibles causas hasta que las ideas se hayan agotado totalmente.
3. Realizar una seleccin de las causas aportadas. Seguramente algunas de las causas que aparecen en
el brainstorming son descabelladas o estn repetidas. Es necesario, por tanto, realizar una seleccin
acordada de cules son las causas que deben aparecer en el diagrama.
4. Construir el diagrama. Con todas las causas aportadas, una sola persona, especialista en estas
tareas y con un buen conocimiento del
problema estudiado, debe ser la respon-
sable de construir el diagrama.
En el diagrama las causas se presentan
de forma jerarquizada y agrupadas en unos
cuatro o seis grandes grupos denominados
causas primarias, las cuales suelen ser: mano
de obra, maquinaria, materiales, mtodos,
medio ambiente y mantenimiento (conocidas
como las seis M). Cada causa primaria est
integrada por varias secundarias, estas ltimas
por terciarias, y as sucesivamente, tal como
se indica en la figura 2.11.
Fig. 2.10 Dispositivo unido a una mquina por
cuatro pernos
Fig. 2.11 Disposicin jerarquizada de causas en un diagrama
causa-efecto
1
Tambin diagrama de espina de pez o diagrama de Ishikawa
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
36

En la figura 2.12 se reproduce un


diagrama en el que slo se han consi-
derado cuatro causas primarias.
No debe perderse de vista que las
causas anotadas en el diagrama son causas
potenciales. Por tanto, ser necesario
recoger datos para confirmar que las
relaciones causa-efecto realmente existen.
Como consecuencia de lo anterior,
el diagrama causa-efecto debe ser consi-
derado un diagrama vivo. Es decir, un
diagrama que va cambiando a medida que
se van adquiriendo nuevos conocimientos
sobre el fenmeno estudiado. Algunas causas desaparecen porque se han logrado eliminar, otras
porque se ha constatado que no influyen. Cuando una causa deja de ser considerada, debe tacharse, ms
que borrarse, para dejar constancia de que ya se ha estudiado. Tambin pueden aparecer nuevas causas
potenciales que en un primer momento no se haban considerado.
2.5 Diagramas bivariantes
Una forma de comprobar si existe relacin entre una caracterstica de calidad y un factor que puede
afectarle es la construccin de diagramas bivariantes. El profesor Hajime Karatsu, en su libro CTC.
La sabidura japonesa, explica un interesante caso en el que la utilizacin de este tipo de diagramas
permiti resolver un importante problema. Dice as:
El sintonizador suele ser lo primero que se estropea en un televisor. Actualmente los boto-
nes electrnicos son algo corriente, pero en el pasado todos los selectores de canal tenan que girar-
se manualmente y podan funcionar mal si el sintonizador tena un contacto pobre.
El sintonizador es el punto en que las ondas magnticas se captan por primera vez. Los sin-
tonizadores estandarizados se producan en masa y se empleaban en distintos modelos de televisor.
Hace algn tiempo, un experto en control de calidad investig el nivel de mal funcionamiento de los
sintonizadores. Descubri que, aunque se utilizaban sintonizadores idnticos, la proporcin de mal
funcionamiento era muy distinta de un modelo de televisor a otro. Se dio cuenta de que el problema
debera estar relacionado con alguna cosa que no fuera el propio sintonizador; no obstante, segua
teniendo el problema de descubrir el verdadero factor entre varias alternativas posibles. La gente
utiliza sus televisores de distinta manera; algunos los colocan en rincones polvorientos, otros los
tienen en el saln, ms o menos como un objeto decorativo. La frecuencia de uso y la fuente de elec-
tricidad tambin pueden ser distintas. En consecuencia, la avera de un televisor poda estar cau-
sada por el entorno o por un simple error en el proceso de fabricacin. Los datos reunidos en cien-
tos y cientos de televisores revelaron, sin embargo, que los sintonizadores se estropeaban en funcin
del tipo de televisor en que haban sido instalados.
El experto en control de calidad analiz los datos desde distintos ngulos y descompuso en
factores cada una de las condiciones concebibles y su relacin con la proporcin de averas:
Estaba relacionada con el tamao de la caja, o con un aumento de la temperatura? Se trataba de
la longitud del eje del sintonizador o de la diferencia en unidades de corriente elctrica? Durante
bastante tiempo, pareca que no haba ninguna correlacin entre ninguno de los factores, pero al
final surgi la causa.
Fig. 2.12 Ejemplo de diagrama causa-efecto
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
37

La correlacin resida en la distancia


entre el sintonizador y el altavoz. Cuanto ms
cerca estaba el sintonizador del altavoz, con
ms frecuencia se averiaba; cuanto ms
lejos, menor era la proporcin de mal
funcionamiento. Una vez establecida esta
correlacin, los fabricantes empezaron a
colocar los altavoces tan lejos de los
sintonizadores como permitan los cajas, y el
resultado fue que las quejas de los
consumidores se redujeron drsticamente.
(figura 2.13)
La construccin de un diagrama
bivariante puede realizarse de la siguiente
forma:
1. Reunir pares de datos de las variables
cuya relacin se desea investigar. Con
menos de 30 pares es difcil sacar
conclusiones. En torno a 50 suele ser
suficiente.
2. Trazar los ejes. Decidir las escalas de
forma que ambos ejes tengan aproxi-
madamente la misma longitud.
Marcar los ejes con valores fciles de
leer.
Si una variable es una caracterstica de
calidad y la otra un factor (de diseo o
de produccin), se sita la primera en el
eje vertical.
3. Situar los puntos en el grfico. Si dos o
ms puntos coinciden, se seala mar-
cando crculos concntricos.
4. Incorporar toda la informacin perti-
nente que ayude a interpretar el grfico
(ttulo del diagrama, nmero de pares
de datos, ttulo y unidades de cada eje,
identificacin del autor, etc.).
Los datos de la tabla 2.7 indican la
temperatura a que se ha realizado cierta reaccin
qumica y el rendimiento que se ha obtenido en
la misma. A partir de esta tabla se obtiene el
grfico de la figura 2.14.
Los diagramas bivariantes pueden
presentar distintos aspectos segn el tipo de relacin que exista entre las variables. En la figura 2.15 se
han representado los diversos tipos de diagramas que pueden aparecer. En algunas ocasiones no est claro
si existe o no correlacin. Para estos casos, Ishikawa propone la realizacin del llamado test de
correlacin de las medianas. Para ello se sigue el siguiente procedimiento:
Fig. 2.13 Diagrama de correlacin entre la proporcin
de averas y la distancia altavoz-sintonizador, obtenida
a partir de los datos de un gran conjunto de televisores
Tabla 2.7 Datos correspondientes a las temperaturas de
realizacin y el rendimiento obtenido en 50 reacciones qumicas
OBS. TEMP. REND. OBS. TEMP. REND.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
162
154
148
116
152
136
158
126
140
160
160
160
144
120
126
134
164
162
132
130
170
148
144
112
126
94.6
93.0
93.9
92.7
92.8
92.5
93.5
91.5
93.8
93.6
92.6
94.1
92.9
91.0
92.0
92.4
93.4
93.6
92.3
91.1
93.0
91.4
93.0
91.6
92.0
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
160
110
138
140
150
134
162
180
142
152
170
150
160
104
130
160
138
152
130
110
120
110
152
172
126
94.0
91.3
92.5
92.0
92.2
92.0
93.5
95.2
92.1
92.4
92.9
91.5
93.0
91.0
92.5
93.1
93.0
93.4
93.4
92.0
92.5
92.3
92.8
92.0
92.6
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
38

Fig. 2.14 Diagrama bivariante elaborado


a partir de los datos de la tabla 2.7
Fig. 2.15 Distintos aspectos que puede
presentar un diagrama bivariante
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
39

1. Determinar las medianas de las x (variable colocada en el eje horizontal) y de las y (variable
colocada en el eje vertical).
2. Trazar ambas medianas en el diagrama bivariante. De esta forma, el diagrama queda dividido
en cuatro cuadrantes, que son notados como I, II, III y IV, a partir del extremo superior derecho
y en sentido contrario a las agujas del reloj.
3. Contar los puntos que quedan en cada cuadrante excluyendo los que estn situados sobre las
medianas. Determinar la suma de puntos en los dos cuadrantes opuestos (I y III o II y IV) que
presenten la suma menor. Este nmero se denomina valor de prueba.
4. Comparar el valor de prueba en la tabla 2.8. Si el valor de prueba obtenido es igual o inferior a
la cantidad lmite que se da en la tabla, puede decirse que existe correlacin con una
probabilidad de error igual o menor al 5 %. La justificacin terica de las cantidades lmite de
la tabla requiere el uso del modelo binomial que se estudia en el captulo 4.
NM. DE
PUNTOS
LMITE DEL VALOR
DE PRUEBA
NM. DE
PUNTOS
LMITE DEL VALOR
DE PRUEBA
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
5
5
5
6
6
7
7
7
8
8
9
9
9
9
10
10
11
12
12
12
13
13
14
14
15
15
15
16
16
17
17
18
18
18
19
19
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
20
20
21
21
21
22
22
23
23
24
24
25
25
25
26
26
27
27
28
28
28
29
29
30
30
31
31
32
32
32
33
33
34
34
35
Tabla 2.8 Lmites del valor de prueba para el test de correlacin de Ishikawa
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
40

En el diagrama temperatura-rendimiento (figura 2.16), los puntos


que se obtienen en cada cuadrante son:
Por tanto, en este caso el valor de prueba ser 10 (nmero de puntos en los cuadrantes II+IV).
El nmero de puntos a considerar es de 46, ya que del total se restan los que caen sobre las medianas
(cuatro en este caso). El valor lmite que da la tabla para N=46 es 15, y como 10<15, podemos afirmar
con una probabilidad de equivocarnos menor del 5 % que existe correlacin entre temperatura y
rendimiento. (Ver figura 2.16.)
Respecto a la construccin de este tipo de diagramas, cabe hacer las siguientes recomen-
daciones:
1. Representar los datos con distinto smbolo segn su origen (estratificar).
Observe la figura 2.17. El diagrama de la derecha representa la relacin entre la humedad final
de un producto tras un pro-ceso de secado y el tiempo de molturacin a que fue sometido
previamente. Del anlisis de este diagrama parece deducirse la inexis-tencia de correlacin. Sin
embargo, no se ha considerado que las medidas han sido toma-das por dos aparatos distintos, y
teniendo este hecho en cuenta, se ha representado el diagrama de la derecha.
ste no es un caso raro, puesto que, cuando se toman medidas con dos aparatos distintos, stos
pueden estar calibrados de forma distinta y conviene distinguir los puntos que han sido
obtenidos con uno u otro aparato.
Lo mismo podramos decir si los datos hubieran sido tomados por dos (o ms) operarios, de
varios turnos, de varias mquinas, de materias primas de distinto origen, etc.
CUADRANTE PUNTOS
I
II
III
IV
18
5
18
5
Fig. 2.16 Test de correlacin de Ishikawa sobre los datos de la tabla 2.7
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
41

2. Aunque los datos histricos de que se dispone no indiquen la presencia de correlacin, no


significa que sta no exista.
Quiz los datos de que se dispone, sobre el factor cuyo efecto se estudia, se mueven en un rango
de variacin demasiado pequeo para poner de manifiesto la correlacin existente, tal como
pone de manifiesto la figura 2.18.
3. La existencia de correlacin no implica una
relacin causa-efecto.
Se ha comprobado que existe una alta
correlacin entre la temperatura media de un
mes y el nmero de matrimonios que durante
ese mes se celebran. Sin embargo, no cabe
esperar que una ola de calor en el mes de
febrero aumente el nmero de matrimonios
ese mes. Esta relacin es debida a otras
variables interpuestas (en este caso, quiz:
calor $ vacaciones, vacaciones $ matrimonio).
Es necesario, por tanto, ser prudente a la hora
de sacar conclusiones ante un diagrama que
presenta una clara correlacin.
2.6 Estratificacin
La estratificacin es tambin una de las siete herramientas bsicas que propone Ishikawa. En realidad,
no es una tcnica nueva, sino que es una metodologa que conviene incorporar a cada una de las
herramientas que ya hemos visto.
As, las plantillas para la recogida de datos deben pensarse para que posteriormente pueda
realizarse los anlisis dividiendo los datos segn su origen. En el caso de los histogramas, los
diagramas de Pareto o los diagramas bivariantes, una correcta estratificacin permite obtener una
informacin de gran importancia que, de otra forma, no se pondra de manifiesto.
Fig. 2.18 Aunque los datos de que se dispone no indiquen
la presencia de correlacin, no significa que sta no exista
Fig. 2.17 Diagrama bivariante con los datos sin estratificar y estratificados
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
42

Ejercicios
2.1 Durante una semana, se ha medido diariamente el contenido de humedad correspondiente a 24
paquetes de un determinado producto, tomados al azar a la salida de una lnea de envasado.
Los resultados obtenidos son:
Indicar qu conclusiones se pueden obtener a partir de estos datos.
2.2 Construir los diagramas causa-efecto para los siguientes efectos:
a) llegar tarde al trabajo,
b) suspender un examen,
c) derrota en una competicin deportiva.
2.3 En un diagrama causa-efecto aparece la temperatura de la matriz de una prensa como posible
causa de la aparicin de poros en el producto. Para confirmarlo, se recogen datos de 50
prensadas y se realiza un diagrama bivariante entre la temperatura (T) y el nmero de poros
obtenidos (P).
Indique cules seran las conclusiones obtenidas al realizar el test de correlacin de Ishikawa,
en cada uno de los siguientes casos.
LUNES 8.20
8.36
8.37
8.52
8.05
8.76
8.51
8.18
8.53
8.64
8.83
8.35
8.48
8.34
8.51
8.08
8.15
8.15
8.68
8.79
8.79
8.91
8.32
8.49
MARTES 8.61
9.14
8.52
9.20
9.30
8.58
8.81
8.68
8.59
8.66
8.70
9.08
8.32
8.33
8.41
9.07
9.08
9.13
8.69
8.46
8.43
8.66
9.17
8.56
MIRCOLES 9.43
8.85
8.66
8.89
9.28
9.14
9.41
9.34
9.59
9.15
8.75
9.18
8.86
9.28
8.50
9.19
9.19
9.12
9.20
8.80
9.22
8.85
8.56
9.46
JUEVES 8.97
9.02
9.61
9.15
9.21
9.53
9.28
9.28
8.86
8.75
9.64
9.05
8.76
9.21
8.76
9.40
9.55
9.50
9.48
9.58
9.38
9.58
9.09
9.46
VIERNES 8.46
8.00
8.32
8.91
8.17
8.60
8.48
8.65
8.97
8.20
8.33
8.26
8.64
8.81
8.73
8.73
8.40
8.60
8.47
8.10
8.17
8.11
8.05.
8.89
A B C D
CUADRANTE 1 19 10 5 8
CUADRANTE 2 4 12 20 21
CUADRANTE 3 20 11 5 8
CUADRANTE 4 5 10 20 13
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
43

2.4 Los datos que figuran a continuacin corresponden a una caracterstica de calidad de cierto
producto (y), y los valores de cuatro factores de produccin (x
1
, x
2
, x
3
, x
4
), que se considera que
pueden influir en ella.
Realizar diagramas bivariantes e indicar qu conclusiones se pueden obtener con estos datos.
2.5 Hace unos aos, en una revista editada en la Escola Tcnica Superior dEnginyers Industrials
de Barcelona (ETSEIB), apareca una nota de la Direccin de la Escuela en la que se informaba
que en el primer parcial de ese curso se haba gastado el 75% de todo el papel de examen que
se necesit en el curso anterior. Se inclua tambin la siguiente tabla:
Desde el punto de vista de la economa de la escuela y con el nico objetivo de disminuir al
mximo el consumo de papel, si slo se pudiera llamar la atencin a un departamento, cul
habra escogido usted?
NM. y x1 x2 x3 x4 NM. y x1 x2 x3 x4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
18.96
12.81
11.15
19.38
18.41
13.00
10.37
15.39
11.90
21.50
11.45
18.04
10.63
17.39
13.27
6.39
5.54
5.24
6.44
6.33
5.57
5.08
5.94
5.38
6.66
5.29
6.28
5.13
6.20
5.62
8.34
6.90
6.44
8.43
8.22
6.95
6.21
7.54
6.65
8.86
6.53
8.14
6.29
8.00
7.02
5.25
6.03
6.10
5.17
5.34
6.02
6.11
5.78
6.08
4.77
6.10
5.40
6.11
5.50
6.00
9.99
9.23
8.89
10.02
9.94
9.27
8.70
9.63
9.06
10.15
8.96
9.91
8.76
9.85
9.31
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
25.27
15.04
20.65
11.15
18.53
23.55
11.81
23.51
25.74
12.64
25.45
18.26
10.56
15.46
10.98
7.01
5.89
6.57
5.24
6.34
6.86
5.36
6.86
7.05
5.51
7.03
6.31
5.12
5.95
5.20
9.58
7.46
8.69
6.44
8.25
9.26
6.63
9.25
9.67
6.85
9.61
8.19
6.27
7.56
6.39
3.96
5.82
4.94
6.10
5.32
4.34
6.08
4.35
3.85
6.04
3.92
5.37
6.11
5.77
6.11
10.28
9.58
10.10
8.89
9.95
10.23
9.04
10.23
10.28
9.20
10.28
9.93
8.75
9.64
8.85
DEPARTAMENTO ALUMNOS HOJAS
Matemticas
Mecnica
Cons. Arq. Ind.
Gestin empresarial
Ing. Elctrica
Informtica
Proyectos
Tc. Cuant. Gestin
Tcnicas Exp. Grf.
Transp. y motores
Ing. Electrnica
Ing. Qumica
Fsica
Ing. Ciberntica
Mecnica de fluidos
Ing. de materiales
Qumica
Ing. Nuclear
Termodinmica
2282
1030
178
682
675
515
173
560
1114
329
350
181
1371
222
630
470
1128
258
723
27000
35000
700
2700
8100
2000
1000
5500
---
3900
4000
2700
9500
1900
3500
5500
8500
1000
4500
Justifique su respuesta realizando el grfico que le parezca ms adecuado.
2.6 El nmero de piezas defectuosas detectadas en un mes debido a diversas causas es el que se
muestra a continuacin:
Se realiza una modificacin para intentar reducir el nmero de piezas defectuosas y se obtienen
los siguientes resultados:
Realice un grfico que ponga de manifiesto los efectos de la modificacin introducida.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
44

CAUSA NM. DE PIEZAS DEFECTUOSAS


Presin
Temperatura
Ruido
Humedad
Otros
42
15
10
6
12
CAUSA NM. DE PIEZAS DEFECTUOSAS
Presin
Temperatura
Ruido
Humedad
Otros
5
11
9
7
12
HERRAMIENTAS BSICAS PARA LA MEJORA DE LA CALIDAD
Apndice 2A Datos e informacin
No es extrao que en una empresa se recojan y archiven gran cantidad de datos y, sin embargo, cuando
se pretende solucionar un problema concreto, no se disponga de los datos para realizar un diagnstico
seguro. O los datos son incompletos o, simplemente, no son fiables.
J. M. Juran aclara esta aparente paradoja, distinguiendo claramente entre los conceptos de datos
e informacin.
Los datos pueden definirse como la concrecin numrica de hechos o realidades, mientras que
la informacin debe entenderse como la respuesta a preguntas previamente planteadas.
Datos = Hechos, realidades
Informacin = Respuesta a preguntas
Cuando se plantea un problema, su resolucin exige disponer de una cierta informacin
(respuestas a preguntas del tipo, con qu frecuencia se presenta el problema?, en qu circunstancias
se presenta?, etc.). Pero, mientras que la buena informacin siempre est basada en datos, un
determinado volumen de datos, por grande que sea, no necesariamente aporta la informacin que se
precisa para resolver el problema.
La informacin incluye datos.
Los datos no necesariamente incluyen informacin.
As pues, la clave no est en cmo recoger datos, sino en cmo obtener informacin que resulte
til.
El proceso de generar informacin puede resumirse en las siguientes etapas:
1. Formular claramente las preguntas que se desea contestar.
2. Recopilar datos relativos a la cuestin planteada.
3. Analizar los datos para determinar la respuesta a la pregunta.
4. Presentar los datos de forma adecuada para poner claramente de manifiesto cul es la respuesta
a la pregunta.
Es importante tener presente cul es la pregunta que se desea contestar, cuando se planifica la
recogida de datos. Unos datos correctos y muy exactos, recopilados mediante un elaborado diseo de
muestreo estadstico, son intiles si no permiten contestar alguna pregunta de inters.
45

Consideremos el proceso de correr 100 m libres por parte de un atleta. En principio cada carrera
representa una repeticin de ciertos pasos del proceso: precalentamiento, colocacin en los tacos de
salida, la salida en aceleracin, mantenimiento de la velocidad, etc. La evidencia nos indica que, a
pesar de que se intenta repetir todos los pasos en forma idntica, el resultado no es el mismo en todas
las carreras. Esta variacin en el producto (resultado de la carrera en nuestro ejemplo) recibe el
nombre de variabilidad y est presente en todo proceso real, de modo que no se puede predecir con
exactitud el resultado de una carrera antes de que sta se celebre. Ello no significa que la variabilidad
no se pueda medir. En nuestro ejemplo, s suele ser posible saber el tiempo aproximado en que
acostumbra a correr la prueba el atleta en cuestin, o con qu frecuencia corre por debajo de 10,2 seg
por ejemplo, ya que no hay que confundir la variabilidad con ausencia total de regularidad.
En la vida real, casi siempre hay que tomar decisiones en presencia de ruido o variabilidad,
y es la estadstica la disciplina especializada en el tema.
En este captulo se analizan conceptualmente las distintas causas que generan variabilidad en la
mayora de procesos, y se introducen los importantes conceptos de funcin de densidad de
probabilidad y funcin de distribucin que nos permiten medirla.
3.1 Causas de variabilidad
Consideramos el proceso genrico de la figura 3.1.
47
3
Causas y medidas de la variabilidad
Fig. 3.1 Variabilidad en un proceso
En la prctica, existen siempre variaciones en las entradas de un proceso y, en consecuencia,
existirn diferencias (variaciones) entre las caractersticas de las distintas unidades de producto obtenidas
como salida del proceso.
Si, por ejemplo, consideramos un cierto proceso de mecanizacin de piezas de acero y de cada
pieza medimos su dimetro, el histograma de la parte derecha de la figura 3.1. representar la variabilidad
del dimetro de las distintas piezas producidas. Toda variabilidad tiene sus causas, y el hecho de que los
dimetros de dos piezas fabricadas por el mismo proceso sean distintos es la consecuencia de variaciones
en la materia prima (diferencias en el porcentaje de carbono entre distintas partidas de acero), de la
variabilidad en la mano de obra (los operarios no trabajan siempre de la misma manera), o de la
variabilidad en cualquier otra entrada del proceso.
Un hecho de trascendental importancia, y que justifica la gran utilidad de la estadstica en el estudio
de la variabilidad, consiste en que, aunque los dimetros de las distintas piezas sean distintos, si se mantiene
constante el sistema de causas que producen variabilidad en las entradas, las frecuencias con que se
observan los distintos valores de los dimetros tienden a estabilizarse en forma de una distribucin predecible.
En otras palabras, si bien el dimetro de una pieza individual es impredecible, cuando el sistema de
causas de variabilidad es estable, se pueden hacer predicciones estadsticas sobre grupos de piezas.
En la argumentacin anterior ya se intuye que las causas de variabilidad podrn tener consecuencias
muy distintas, dependiendo de que su presencia en el proceso sea estable o espordica. Pero lo ms
importante es que, segn cuales sean las caractersticas de una causa de variabilidad, su eliminacin del
proceso o, por lo menos, la reduccin de sus efectos corresponder a distintos niveles de autoridad y
responsabilidad dentro de la organizacin.
Como se explica en Pea, Prat (1986), bajo supuestos muy generales, las prdidas que un producto
causa a la sociedad cuando se utiliza son directamente proporcionales a la variabilidad de la caracterstica
de calidad del producto en cuestin. Por ello, en general, ser cierto que:
As pues, la estrategia bsica para la mejora de la calidad pasa por la identificacin de las causas
que producen variabilidad, y por una correcta asignacin de la misma a una u otra de las dos categoras
definidas ya por Shewhart (1931):
1) Causas comunes, cuya eliminacin es responsabilidad de la direccin de la empresa y que
acostumbran a ser responsables de ms del 90% de los problemas de calidad.
2) Causas asignables, cuya eliminacin es ms sencilla y son responsabilidad del operario, si bien
representan menos del 10% de los problemas de calidad de un cierto proceso.
Aunque no existe una definicin precisa de estos dos tipos de causas, en la tabla 3.1 se
encuentran algunas caractersticas de cada uno de ellos.
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
48

MEJORAR LA CALIDAD REDUCIR LA VARIABILIDAD


CAUSAS COMUNES CAUSAS ASIGNABLES (ESPECFICAS)
Suelen ser muchas y cada una produce pequeas
variaciones.
Son parte permanente del proceso. Su suma
(superposicin) determina la capacidad del proceso.
Son dif4ciles de eliminar. Forman parte del sistema y es
responsabilidad de la direccin disminuir sus efectos.
Afectan al conjunto de mquinas, operarios, etc.
La variabilidad debida a estas causas admite
representacin estad4stica (densidad de probabilidad).
Suelen ser pocas pero de efectos importantes.
Aparecen espordicamente en el proceso. Este
hecho facilita su identificacin y eliminacin
(grficos de control).
Son relativamente fciles de eliminar por parte
de operarios y/o tcnicos.
Afectan espec4ficamente a una mquina,
operario, etc.
No admite representacin estad4stica.
Tabla 3.1 Caractersticas de las causas de variabilidad
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
49
En la tabla 3.2 se encuentra una lista de condiciones a las que normalmente se asocian las dos
categoras de causas de variabilidad.
No es exagerado decir que toda la teora de los grficos de control de Shewart tena como
objetivo el desarrollo de mtodos que permitiesen identificar la ocurrencia de causas asignables de
variabilidad en un determinado proceso, para proceder a su eliminacin y mejorar as la calidad de los
productos industriales. Al mismo autor se debe el concepto de proceso en estado de control, como
aquel proceso sobre el que nicamente acta un sistema estable de causas de variabilidad (las causas
comunes), y cuyo output es, en consecuencia, predecible estadsticamente.
Todas estos conceptos sern desarrollados con mayor detalle en el captulo 11 de este libro.
3.2 Medidas de la variabilidad
Las unidades producidas y las que conceptualmente puede producir un proceso en estado de control son
un ejemplo de lo que en estadstica se conoce como poblacin.
Consideremos, por ejemplo, un proceso de rellenado automtico de botellas de agua y supongamos
que est en estado de control. Un conjunto de n botellas, seleccionadas aleatoriamente de entre las
fabricadas por el proceso, constituye una muestra
aleatoria de dicha poblacin.
Recibe el nombre de variable aleatoria la
funcin, Y, que asocia, por ejemplo, cada botella
de agua con su contenido en cm
3
. El concepto de
variable aleatoria es objeto de estudio profundo en
cualquier libro de estadstica matemtica y, aunque
este estudio queda lejos de los objetivos de este
libro, es conveniente observar que la funcin Y
convierte la muestra de observables (botellas de
agua) en nmeros reales (contenidos en cm
3
),
que se pueden tratar matemticamente.
Estos conceptos se representan esque-
mticamente en la figura 3.2.

CONDICIONES ASOCIADAS A
CAUSAS COMUNES
CONDICIONES ASOCIADAS A
CAUSAS ASIGNABLES
Inevitable
Estable
Homogneo
Constante
Normal
Estacionario
Controlado
Predecible
Consistente
Permanente
No significativo
Estad4sticamente estable
M@ltiple
Evitable
Inestable
Heterognea
Errtico
Anormal
Descontrolado
Impredecible
Inconsistente
Espordico
Diferente
Importante
Significativo
Desgaste
Pocas
Fig. 3.2 Poblacin, muestra y variable aleatoria
Tabla 3.2 Condiciones asociadas a las causas de variabilidad
3.2.1 Variabilidad en una muestra
Es evidente que una manera de representar grficamente la variabilidad en los datos muestrales es el
histograma de dichos datos.
En la figura 3.3 se presenta el histograma
con los contenidos en cm
3
de una muestra de
100 botellas rellenadas por el proceso
considerado.
El histograma permite contestar fcil-
mente a preguntas del tipo:
1. Qu proporcin de botellas en la
muestra tienen un contenido inferior a
198 cm
3
?
2. Qu proporcin de botellas en la
muestra cumplen con las especificaciones
200 2 cm
3
?
A pesar de que sera de considerable inters tener respuestas a las preguntas anteriores, no cabe
duda que sera de mayor utilidad an poder contestar a preguntas similares, pero referidas a la
poblacin de las botellas que se pueden rellenar con el proceso en estado de control. Esta idea la
desarrollamos a continuacin.
3.3 Densidad de probabilidad. Variabilidad en la poblacin
En este apartado vamos a introducir de forma intuitiva un concepto cuya formulacin matemtica
correcta nos llevara excesivo tiempo y que el lector interesado puede encontrar en cualquier libro de
estadstica matemtica, desde textos introductorios como Hogg-Craig (1978) hasta textos como
Chung (1968).
Consideramos la situacin descrita en la figura 3.4.
Fig. 3.4 Concepto intuitivo de densidad de probabilidad
Si tomamos una muestra de, por ejemplo, n=20 unidades de un cierto proceso y representamos
la variabilidad de la muestra mediante un histograma, muy probablemente ste presentar la forma
irregular de la parte izquierda de la fig. 3.4. El reducido tamao de muestra obligar a definir una
amplitud de intervalo grande, y adems pueden existir intervalos con pocos efectivos.
Si la muestra fuese de n=200 unidades, seguiramos hablando de una muestra real de un proceso
real y el histograma resultante sera, posiblemente, ms regular que el anterior y con intervalos de
menor amplitud. Mantenindonos en el mundo real podramos extraer una muestra de 2.000 unidades
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
50

Fig. 3.3 Histograma del contenido en cm


3
en una muestra de
tamao 100
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
51
y, seguramente, el histograma que representase la variabilidad muestral sera todava ms regular y con
unos intervalos de menor amplitud.
Pasemos ahora al mundo de las abstracciones. Siguiendo el proceso anterior hasta el lmite,
cuando n
="
o, lo que es lo mismo, cuando tuvisemos valores de la poblacin conceptual formada
por todas las unidades que se pueden rellenar con el proceso en estado de control, en una gran
mayora de casos el histograma que se obtendra sera tan regular como la funcin f(y)
representada en la parte derecha de la figura 3.4. Esta curva suave es la que recibe el nombre de
funcin densidad de probabilidad (d.p.) de la variable aleatoria Y considerada.
Por tanto, en trminos coloquiales podramos
decir que la densidad de probabilidad es como el
histograma realizado con todas las unidades que
constituyen la poblacin. La d.p. es evidentemente un
ente abstracto o modelo matemtico y, como todo
modelo, est sometido a la afirmacin de Box: Todos
los modelos son falsos; algunos modelos son tiles.
Esta afirmacin viene a decirnos que, cuando formu-
lemos una d.p., f(y) debe ser til para hacer previsiones
sobre las unidades fabricadas por dicho proceso, pero
no podemos afirmar que la variabilidad del proceso sea
exactamente la implicada por f ( y).
Consideremos ahora la figura 3.5.
Hemos visto en el captulo anterior que, en un
histograma, el rea sobre un cierto intervalo era la frecuencia relativa con que se haban observado
valores en dicho intervalo.
Teniendo en cuenta que una de las definiciones de probabilidad es que sta es el lmite hacia el
que tiende a estabilizarse la frecuencia relativa cuando el tamao de la muestra crece indefinidamente,
y la relacin entre histograma y d.p. que hemos visto anteriormente, se deduce que:
donde informalmente Prob(aYb) significa la probabilidad de que la variable aleatoria Y tome, en una
unidad de la poblacin, un valor en el intervalo cuyos extremos son a y b.
No todas las funcines matemticas pueden ser una d.p. En efecto, de la relacin intuitiva entre
histograma y d.p. se deduce que, para que una funcin f pueda ser d.p., se requiere:
(a) f ( y)0 para todo y
(b)
3.4 Esperanza matemtica y varianza
Al igual que en una muestra, parte de la variabilidad puede venir sintetizada en un par de estadsticos
muestrales como y S
2
y
, la variabilidad representada exhaustivamente por la d.p. f(y), puede tambin
ser caracterizada parcialmente por dos parmetros poblacionales: =E(Y) y
2
=Var(Y) cuya
definicin es:
x

f y dy a Y b
a
b
( ) ( )

Prob (3.1)
f y dy ( )

1


E Y yf y dy ( ) ( ) (3.2)

Fig. 3.5 Densidad de probabilidad


asociada con el nombre de media poblacional o esperanza matemtica de la variable aleatoria y
conocida como varianza poblacional.
El parmetro es un parmetro de localizacin, es decir, es el valor alrededor del cual toman
valores los individuos de la poblacin considerada, mientras que
2
es un parmetro de dispersin, ya
que es la esperanza matemtica de las desviaciones respecto a , al cuadrado.
Si bien en la estadstica matemtica se definen mltiples parmetros de localizacin y de
dispersin, y
2
son los ms utilizados en el presente libro.
3.5 Funcin de distribucin
Supongamos de nuevo, que la funcin f ( y) de la figura 3.5 es d.p. del contenido en cm
3
de la poblacin
de botellas de agua rellenadas por un proceso en estado de control.
Est claro que f ( y) contiene toda la informacin sobre la variabilidad de proceso. En efecto,
conocida f ( y) se pueden contestar preguntas del tipo:
1. Qu proporcin de las botellas rellenadas por el proceso tendrn contenidos entre a y b?
Respuesta:
2. Qu proporcin de las botellas rellenadas por el proceso tendrn contenidos inferiores a a?
Respuesta:
3. Qu proporcin de las botellas rellenadas por el proceso tendrn contenidos superiores a b?
Respuesta:
El nico inconveniente es que cada respuesta
implica calcular un rea bajo la curva f ( y). Por ello
resulta de gran utilidad el concepto de funcin de
distribucin.
Dada una variable aleatoria Y, se llama
funcin de distribucin de la v.a. Y a la funcin F de
la recta real en el intervalo [0,1] definida por:
La figura 3.6 representa esquemticamente la
relacin existente entre la densidad de probabilidad
y la funcin de distribucin de una variable
aleatoria.
Es importante observar que las ordenadas
F(y) son directamente probabilidades, mientras que
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
52


2 2 2

Var Y y f y dy E Y ( ) ( ) ( ) ( ) (3.3)

f y dy
a
b
( )

f y dy
a
( )

f y dy
b
( )

F y f t dt Y y
y
( ) ( ) ( )

Prob
Fig. 3.6 Relacin entre la funcin de distribucin y la
densidad de probabilidad
(3.4)
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
53
en f ( y) las ordenadas son densidades de probabilidad y, en consecuencia, las respuestas a las preguntas
(1), (2) y (3) seran ahora: F(b)-F(a); F(a) y 1-F(b).
Toda funcin de distribucin es obviamente montona no decreciente, continua por lo menos
por la derecha y tal que y .
3.6 Caso discreto
El lector puede preguntarse en este momento por qu decimos que toda funcin de distribucin (f.d.)
es continua por lo menos por la derecha. La razn es que no todas las variables aleatorias son
continuas, como la considerada en el ejemplo del
contenido de las botellas de agua.
Consideremos un proceso con una variable
aleatoria que vamos a denominar discreta. Supon-
gamos que lanzamos 10 veces una moneda y que la
variable aleatoria considerada, Y, es ahora el
nmero de veces que ha salido cara. En este caso, Y
slo puede tomar los valores 0, 1, 2,..., 10.
En este caso recibe el nombre de
distribucin de probabilidad la funcin f definida
por:
f ( y) = Prob (Y=y) para y = 0,1,2,...,10
f ( y) = 0 en el resto
Est claro que para una v.a. discreta, f ya no
es una curva suave como ocurra en el caso
continuo, sino que tendr una forma como la de la
figura 3.7.
La funcin de distribucin de Y, ser ahora:
Su forma geomtrica ser del tipo repre-
sentado en la figura 3.8. (Razone el lector la conti-
nuidad por la derecha.)
Para el caso discreto, los parmetros y
2
se definen:

lim F y
y
( ) 0 lim F y
y
( ) 1
Fig. 3.8 Funcin de distribucin de una variable aleatoria
discreta
Fig. 3.7 Distribucin de probabilidad de una variable
aleatoria discreta
F y f k
k
y
( ) ( )

0

2 2

( ) ( ) y f y
y


y f y
y
( ) (3.5)
(3.6)
3.7 El caso bivariante
Consideremos de nuevo el proceso de envasado representado en la figura 3.1.
Supongamos ahora que a cada individuo de la poblacin le asignamos un par de valores (x,y)
en el que x es el contenido de la botella en cm
3
e y es su peso en gr. Matemticamente hablando, esta
asignacin estara representada por una funcin (X,Y) que hace corresponder a cada individuo de la
poblacin un elemento de (x,y) de
2
. Dicha funcin recibe el nombre de variable aleatoria bidimensio-
nal o vector aleatorio de dimensin 2.
Los conceptos de variabilidad muestral y poblacional discutidos en apartados anteriores se
generalizan de manera inmediata al caso bivariante, como veremos a continuacin.
3.7.1 Variabilidad muestral
Supongamos que disponemos de n pares
de valores (x
i
,y
i
) i=1,2,...,n; correspon-
dientes a valores muestrales de un cierto
vector (X,Y). Una forma razonable de
representar la variabilidad muestral es el
histograma generalizado de la figura 3.9
en el que el volumen del paraleppedo
correspondiente a la celda rayada en el
plano x, y, representa la frecuencia rela-
tiva de individuos muestrales, con la que
X,Y toman valores en dicho rectngulo
(celda).
3.8 Densidades de probabilidad conjunta y densidades marginales
Al igual que hemos hecho en el apartado 3.3,
cuando consideremos la poblacin conceptual en
lugar de una muestra concreta, en el histograma
generalizado de la figura 3.9, las v.a. X e Y
convergern en general hacia una superficie
regular, f ( x,y) denominada densidad de proba-
bilidad conjunta (d.p.c), y que puede tener una
forma como la de la figura 3.10, por ejemplo.
De nuevo, no todas las funciones
matemticas f ( x,y) pueden ser una densidad de
probabilidad conjunta.
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
54

Fig. 3.9 Histograma generalizado


Fig. 3.10 Densidad de probabilidad conjunta
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
55
Para ello es necesario que:
(a) f (x,y) 0 para todo (x,y)
2
(b)
En el caso bivariante tendremos que:
3.8.1 Densidades marginales
A partir del conocimiento de la d.p.c. f ( x,y) de un vector aleatorio (X,Y), siempre es posible obtener la
densidad de probabilidad univariante correspondiente a cada una de las dos variables aleatorias que
definen el vector.
La distribucin univariante de X se conoce como densidad marginal en X y est definida por:
La distribucin univariante de Y se conoce como densidad marginal en Y y est definida por:
Veremos que, por el contrario, no siempre es posible obtener la densidad conjunta a partir de las
densidades marginales, aunque s lo ser en el caso en que las variables aleatorias X e Y sean
estocsticamente independientes. Este concepto se desarrolla en el siguiente apartado.
3.9 Densidades condicionales e independencia de variables aleatorias
Sea (X,Y) un vector aleatorio cuya d.p.c. es f ( x,y) y sea y
0
un cierto valor de Y tal que f
Y
( y
0
) 0.
Se define como densidad de X condicional al valor y
0
de Y a la densidad univariante:
Si x
0
es un valor de X tal que f
X
(x
0
) 0, se puede definir tambin la densidad de Y condicionada
al valor x
0
de X como:
As pues, en general se tiene que:
El concepto de densidad condicional permite definir la nocin de independencia entre variables alea-
torias. Dado el vector aleatorio (X,Y), diremos que X,Y son variables aleatorias independientes si y slo si

f x y dx dy ( , )

2
P x X x dx y Y y dy f x y dxdy ( , ) ( , )
0 0 0 0 0 0
+ + (3.7)
f x f x y dy
X
( ) ( , )

(3.8)
(3.9)
f y f x y dx
Y
( ) ( , )

f x Y y f x y
f x y
f y
Y
( ) ( )
( , )
( )

0 0
0
(3.11a)
f y X x f y x
f x y
f x
X
( ) ( )
( , )
( )

0 0
0
(3.11b)
f x y f y x f x f x y f y
X Y
( , ) ( ) ( ) ( ) ( )
0 0 0 0
(3.12)
Observe el lector que en este caso:
y por lo tanto, si las variables X,Y son independientes, es posible obtener la densidad como producto
de las marginales.
Los conceptos de densidad conjunta, marginal y condicional as como las de independencia
estocstica pueden extenderse fcilmente a los vectores de dimensin n. En particular, si (Y
1
, Y
2
,..., Y
n
)
es un vector aleatorio, diremos que las variables que lo componen Y
1
, Y
2
,..., Y
n
son variables aleatorias
independientes si y slo si la densidad de probabilidad conjunta es tal que:
Para ilustrar de manera intuitiva el concepto de independencia entre variables aleatorias
consideremos un caso concreto.
Supongamos que en una cierta poblacin de individuos se define el vector aleatorio (X, Y) tal
que X es la estatura en cm de un cierto individuo e Y es su peso en kilos.
Puede el lector imaginarse la forma geomtrica de f(y|150)? y la f(y|180)? Cree el lector que
ambas densidades sern idnticas?
Es casi seguro que la densidad de probabilidad de los pesos de todas las personas que miden
150 cm est centrada en un valor menor que la de las personas que miden 180 cm, ya que en general
esta subpoblacin estar constituida por individuos que pesan ms que los correspondientes a una
estatura de 150 cm.
En este caso, por tanto, no se cumple la expresin (3.13), ya que f(y|x
0
) depende del valor de x
0
.
Este hecho coincide con la nocin intuitiva de que la estatura y el peso de una persona no son
independientes sino que, en general, las personas ms altas tambin pesan ms.
Si, por el contrario, las variables fuesen independientes, la densidad de probabilidad de la
variable X sera la misma fuese cual fuese el valor de Y.
3.10 Covarianza y coeficiente de correlacin lineal
Sea (X, Y) un vector aleatorio. Sabemos que la variabilidad de dicho vector est representada por su
funcin de densidad de probabilidad conjunta f ( x,y).
Un parmetro de inters para caracterizar la dependencia lineal entre las v.a X e Y es la
covarianza definida de la manera siguiente:
donde
x
y
y
son las medias de las densidades marginales.
Comprobamos de manera intuitiva que
11
mide el grado de dependencia lineal entre X e Y. En
efecto, si suponemos que X e Y estn relacionadas de la manera indicada en la figura 3.11(a), como
sera seguramente el caso si X e Y fuesen respectivamente la estatura y el peso de una cierta poblacin,
vemos que, si para un cierto individuo, (X-
x
) es positivo y grande (un individuo de mucho mayor
peso que la media de la poblacin), tambin en general (Y-
y
) ser positivo y grande (el individuo
ser ms alto que la media), y si (X-
x
) es negativo (individuo de menor peso que la media),
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
56

f x y f x
X
( ) ( )
0
(3.13)
f x y f x f y
X Y
( , ) ( ) ( )
(3.14)
f y y y f y f y f y
n Y Y Y n
n
( , , , ) ( ) ( ) ( )
1 2 1 2
1 2
(3.15)
[ ]

11
COV X Y E X Y
x y
( , ) ( )( ) (3.16)
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
57
probablemente (Y-
y
) ser tambin negativo
(individuos ms bajo que la media). En
consecuencia, la mayora de productos (Y-

y
) (X-
x
) sern positivos y, por lo tanto,
11
,
que es el valor medio esperado de dichos
productos, ser positivo.
Un razonamiento parecido al anterior
nos conduce a la conclusin de que, en el
caso de la figura 3.11(b), la covarianza
11
sera negativa. Podemos utilizar como X,Y, la
temperatura mxima de un cierto da como
variable X, y el consumo de electricidad para
calefaccin durante el mismo da en una
cierta unidad como variable Y.
En un da que sea ms fro que la
media probablemente se consumir ms
electricidad para calefaccin que la que se
consume en media, es decir que, cuando (X-
x
) sea negativo, (Y-
y
) ser positivo. Anlogamente en un
da ms clido que la media, el consumo de energa para calefaccin ser menor que la media y, por lo
tanto, cuando (X-
x
) es positivo, se tiene que (Y-
y
) es frecuentemente negativo. As pues, los
productos (X-
x
) (Y-
y
) sern negativos para una mayora de individuos de la poblacin y, por lo tanto,

11
ser negativa.
Cuando no exista dependencia lineal, como ocurre en el caso de la figura 3.11 (c), para un
individuo en el que (X-
x
) sea positivo, ser equiprobable que (Y-
y
) sea positivo o negativo y, por lo
tanto, es razonable pensar que
11
ser nulo.
De los razonamientos anteriores se desprende que el signo de la covarianza es un indicador del
tipo de dependencia lineal entre X e Y. No ocurre lo mismo con el valor de
11
, ya que ste depende de
las unidades de medida. As, para el caso de la figura 3.11 (a), si X se mide en toneladas e Y en
kilmetros,
11
ser un nmero pequeo, mientras que si X se mide en miligramos e Y en micras,
11
tendr un valor muy grande.
En consecuencia, es conveniente definir un parmetro que tenga siempre el mismo signo que la
covarianza, pero cuyo valor sea independiente de las unidades en las que se midan las variables X,Y.
Este parmetro se denomina coeficiente de correlacin lineal y se define:
Se puede demostrar fcilmente que, si entre X,Y existe una relacin lineal exacta:
entonces
As pues,
xy
puede tomar valores desde -1 a +1, y toma el valor 0 cuando X e Y son
independientes.

Fig. 3.11 Algunos patrones en los diagramas bivariantes


xy
x y
COV X Y

( , )
(3.17)
Y X +
0 1

xy
signo ( )
1
1
3.11 Esperanza matemtica y varianza de combinaciones lineales de variables aleatorias
Sean Y
1
, Y
2
,..., Y
n
variables aleatorias y sean c
1
, c
2
,..., c
n
constantes reales. Consideremos una
combinacin lineal del tipo:
De la definicin de esperanza matemtica, se deduce que E, es un operador lineal y, por lo tanto:
Por otro lado se tiene que:
De la expresin (3.19 a) se deduce que, cuando las variables Y
1
, Y
2
,..., Y
n
sean independientes:
Es muy importante entender correctamente el campo de aplicacin de la expresin (3.19 b), y
para ello vamos a considerar un ejemplo concreto.
Supongamos un proceso de rellenado de gel en unas botellas de plstico. Definamos las
siguientes variables aleatorias:
X $ peso neto de gel en una botella
Y $ peso de la botella vaca
Z $ peso de la botella llena de gel
Es razonable pensar que ser fcil obtener datos experimentales que permitan estimar la
varianza
y
2
de la variable Y y la varianza
z
2
de las botellas llenas, mientras que ser casi imposible
obtener datos experimentales de la variable X (parte del gel quedara pegado a las paredes de la botella
y el vaciado sera imperfecto). No obstante, si tenemos en cuenta que:
Z = X + Y
y que es razonable pensar que X e Y son independientes, podemos aplicar:
y obtener:
y, por lo tanto:
Observe el lector que si hubiese enfocado la solucin al clculo de
x
2
a partir de:
X = Z - Y
debera tener en cuenta que ahora Z e Y son claramente dependientes y, en consecuencia, debera
aplicarse la expresin (3.19 a)
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
58

Z c Y
i i
i
n

1
(3.18)
E Z c E Y c
i i
i
n
i i
i
n
( ) ( )


1 1

V Z E c Y c E c Y
c Var Y c c COV Y Y
i i
i
n
i i
i
n
i i i
i
n
i i
i
n
i j i j
j i
n
i
n
( ) ( )
( ) ( , )

1
]
1

1
]
1

+

+



1 1
2
1
2
2
1 1 1
1
2

(3.19a)
V c Y c Var Y
i i
i
n
i i
i
n

_
,


1
2
1
( ) (3.19b)
V c Y c Var Y
i i
i
n
i i
i
n

_
,


1
2
1
( )

z x y
2 2 2
+

x z y
2 2 2

CAUSAS Y MEDIDAS DE LA VARIABILIDAD
59
en lugar de la (3.19 b)
3.12 Ejemplo del helicptero
Para ilustrar los conceptos bsicos de este captulo,
vamos a utilizar el helicptero de papel cuyo diseo
est realizado en la figura 3.12. La idea de utilizar este
ejemplo a lo largo del libro le fue sugerida a uno de
sus autores por George E. P. Box, Soren Bisgaard y
Conrad Fung de la Universidad de Wisconsin.
El proceso de fabricacin de helicpteros
consistira, entre otros, en los siguientes pasos (ver
figura 3.13.):
Supongamos que la caracterstica de calidad
ms importante en los helicpteros fabricados es el
tiempo que tardan en caer desde tres metros de altura.
Si el lector tiene paciencia suficiente para
construir unos cuantos helicpteros a partir del diseo
de la figura 3.12, y una vez fabricados los lanza desde
una altura de 3 m y mide el tiempo de cada, observar
lo obvio: no todos los helicpteros tardan el mismo
tiempo en recorrer los 3 m. Por qu existe variabi-
lidad en estos tiempos?
Como ejemplo de algunas de las causas de variabilidad podramos considerar las de la tabla 3.3.
Obsrvese que en la variabilidad final intervienen, no slo las causas que actan durante el
proceso de fabricacin de los helicpteros, sino tambin las que actan durante el proceso de
lanzamiento y medida del tiempo de cada.
En este ejemplo la poblacin conceptual estara formada por todos los helicpteros que se
pueden fabricar por el proceso en estado de control, es decir, eliminando las causas asignables como
la citada antes en segundo lugar en la tabla 3.3.

c Var Y c c COV Y Y
i i
i
n
i j i j
j i
n
i
n
2
1 1 1
1
2 ( ) ( , )
+


+
V c Y c Var Y
i i
i
n
i i
i
n

_
,


1
2
1
( )
Fig. 3.12 Diseo del helicptero de papel
Fig. 3.13 Proceso de fabricacin de los helicpteros
Tabla 3.3 Algunas causas de variabilidad en el ejemplo del helicptero
Una muestra estara constituida, por ejemplo,
por 10 helicpteros seleccionados al azar de
entre los fabricados por el proceso.
El experimento consiste en dejar caer
un helicptero desde 3 m de altura. Midiendo
el tiempo de cada definimos la variable
aleatoria Y, que asociara a los 10 helicpteros
de la muestra los 10 nmeros reales corres-
pondientes a sus tiempos de cada. Dichos
tiempos, en segundos, podran ser: 3,25; 3,14;
2,68; 2,96; 2,99; 2,60; 2,90; 2,75; 2,86; 3,05.
Dado el reducido nmero de datos
muestrales, la representacin grfica ms
adecuada ser la de la figura 3.14.
Si en lugar de seleccionar una muestra
de 10 helicpteros, hubisemos elegido una
muestra de mayor tamao (100 helicpteros
por ejemplo), la representacin grfica de los
datos sera el histograma de la figura 3.15.
El rea rayada en la figura 3.15 es
proporcional a la frecuencia relativa o la
proporcin de los 100 helicpteros muestrales
cuyos tiempos de cada desde 3 m han estado
comprendidos entre 2,4 y 3,6 segundos.
Conceptualmente podemos suponer
que, si experimentsemos con todos y cada
uno de los helicpteros de la poblacin,
obtendramos como lmite del histograma una
cierta densidad de probabilidad como la de la
figura 3.16.
En esta densidad, el rea rayada
representa la probabilidad de que un heli-
cptero de la poblacin tarde ms de 3,2 y
menos de 3,4 segundos en caer desde 3 m o, lo
que es lo mismo, la proporcin de helicpteros
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
60

CAUSA TIPO
Variabilidad en la calidad (textura, peso, etc.) de los folios
utilizados como materia prima.
Distraccin durante el dibujo de las l4neas de corte del 5
helicptero.
No siempre dejaremos caer el helicptero desde 3 metros
exactamente.
Variabilidad en las corrientes del aire en la habitacin donde se
dejan caer los helicpteros.
Com@n
Asignable
Com@n
Com@n
Fig. 3.14 Representacin grfica con pocos datos
Fig. 3.15 Histograma de los tiempos de cada de 100
helicpteros.
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
61
en la poblacin cuyo tiempo de cada estara
comprendido entre 3,2 y 3,4 segundos.
Finalicemos este captulo indicando que
uno de los objetivos bsicos de la estadstica es
hacer inferencias acerca de una poblacin
conceptual a partir de datos muestrales de dicha
poblacin.

Fig. 3.16 Densidad de probabilidad en el caso de los helicpteros


Ejercicios
3.1 El nmero de averas que sufre una determinada mquina a lo largo del da est descrito por la
siguiente distribucin de probabilidad:
Calcular la esperanza matemtica y la varianza de la variable aleatoria nmero de averas.
3.2 Una variable aleatoria tiene la siguiente distribucin de probabilidad:
Calcular:
a) E(x
2
)
b) E[(x-x)
2
]
c) E(x)
d) E(2x-1)
3.3 Se considera la variable X suma del resultado de lanzar dos dados a la vez.
Calcular:
a) E(x)
b) V(x)
3.4 Una variable aleatoria tiene la siguiente distribucin de probabilidad:
f ( x) = k(1-x)
2
0<x<1
f ( x) = 0 en los dems casos.
Hallar E(x) y V(x).
3.5 Una variable aleatoria x se distribuye segn la funcin de densidad:
f ( x) = 3kx 0<x<3
f ( x) = 1+3kx 3<x<5
f ( x) = 0 en los dems casos.
a) Hallar el valor de K.
b) Hallar la esperanza matemtica de x.
c) Hallar la varianza de x.
d) Dibujar la funcin de distribucin.
MTODOS ESTADSTICOS.CONTROL Y MEJORA DE LA CALIDAD
62

NM. DE AVERAS (X) PROBABILIDAD P(X)


0
1
2
3
4
5
0.1
0.2
0.2
0.2
0.2
0.1
VALOR DE X PROBABILIDAD P(X)
30
31
32
33
34
35
36
37
1/12
2/12
3/12
2/12
1/12
1/12
1/12
1/12
CAUSAS Y MEDIDAS DE LA VARIABILIDAD
63
3.6 La viscosimetra es una tcnica corrientemente utilizada en la industria qumica para conocer la
distribucin de pesos moleculares de polmeros.
Un investigador estudi muestras de polimetacrilato de metilo a lo largo de una semana, y
obtuvo los siguientes resultados:
a) Calcular la covarianza y el coeficiente de correlacin entre el peso (expresado en gramos) y
la viscosidad (en poises).
b) Calcular la covarianza y el coeficiente de correlacin entre el peso (expresado en kilogramos)
y la viscosidad (en poises).
c) Qu se puede deducir a la vista de los resultados de los apartados a) y b)?
d) Existe relacin entre la temperatura y la viscosidad?
e) Y entre la temperatura y el peso de los polmeros?
f) Realizar diagramas bivariantes y decir si los resultados obtenidos son coherentes con dichos
diagramas.
3.7 En un estudio de mercado se observ que el consumo de una determinada revista dependa de
la edad segn la siguiente densidad de probabilidad:
f ( edad) =0 edad<18
f ( edad) =k/edad
4
edad18
a) Calcular el valor de k.
b) Utilizando dicha densidad de probabilidad, calcular la probabilidad de que una persona que
compre la revista, escogida al azar, tenga una edad comprendida entre 25 y 30 aos.
3.8 Un fabricante de juguetes de madera utiliza en sus productos cuatro tipos de material (a, b, c,
d) que une mediante cuatro tipos diferentes de cola (A,
B, C, D). Ha observado que en ciertas condiciones sus
productos se rompen con facilidad segn la distribucin
de probabilidad conjunta de la siguiente tabla:
a) Cul es la probabilidad de que se despeguen las
piezas utilizando el material b y la cola C?
b) Cul es la probabilidad de que la pieza se rompa
utilizando la cola A?
c) Cul es la probabilidad marginal de b?

DA PESO (G) VISCOSIDAD (PO) TEMP. LABORTORIO (C)


1
2
3
4
5
6
7
0.8241
0.6022
0.4554
0.4287
0.2290
0.2000
0.3325
0.6749
0.668
0.641
0.6240
0.6010
0.5750
0.6200
22.3
22.1
18.9
22.6
23.1
22.5
23.0
A B C D
a 0.01 0 0.07 0.02
b 0.02 0.05 0.1 0.23
c 0.06 0.11 0.03 0
d 0.01 0.24 0 0.05
Consideremos tres situaciones frecuentes en la industria:
S1.Consideremos el control de recepcin de materias primas o de componentes semielaborados. En
general, el control consistir en extraer una muestra aleatoria del pedido y aceptar o rechazar el
mismo en funcin del nmero de componentes defectuosas halladas en la muestra.
S2.Consideremos un estudio de mercado destinado a estimar el porcentaje de hogares que tienen
instalado un cierto electrodomstico. El estudio consistir en seleccionar una muestra aleatoria
de hogares y estimar el porcentaje en la poblacin en funcin del nmero de ellos que en la
muestra tengan el electrodomstico en cuestin.
S3.Supongamos que una empresa desea estimar la proporcin de facturas emitidas que tardan ms
de tres meses en ser cobradas. Para ello se seleccionar una muestra de las facturas emitidas en
el pasado y a partir de la proporcin muestral de facturas cobradas con el retraso antes indicado,
se estimar dicha proporcin en el total de facturas.
Las tres situaciones son asimilables al siguiente modelo:
Una urna contiene bolas de dos tipos, B y en cantidades N
B
y N-N
B
respectivamente. Se
extraen n bolas de la urna, sin reposicin, y se considera la variable aleatoria X, definida por el nmero
de bolas del tipo B que han aparecido en la muestra.
En dicho modelo, la probabilidad de que X=x (x=0,1,2,3...,n) sera:
donde, por ejemplo, es el nmero de combinaciones de orden x entre N
B
elementos.
La expresin (4.1) es la distribucin de probabilidad de un modelo probabilstico conocido
como modelo hipergeomtrico.
La tabla 4.1 muestra cmo las situaciones S1, S2 y S3 se adaptan conceptualmente al modelo
hipergeomtrico, es decir, que sera correcto basarnos en dicho modelo para hacer las inferencias
necesarias en los tres casos descritos.
B
65
4
Algunos modelos probabilsticos
h x N N n
N
x
N N
n x
N
n
B
B B
( ; , , )

_
,

_
,

_
,

(4.1)
N
x
B

_
,

Tabla 4.1 Situaciones que se adaptan al modelo hipergeomtrico


En la teora de la probabilidad existen otros muchos modelos tericos que resultan de utilidad
en una gran variedad de situaciones prcticas. El objetivo de este captulo es presentar las ms
relevantes desde un punto de vista conceptual. El lector interesado en los aspectos matemticos
involucrados en la deduccin de dichos modelos y de sus principales caractersticas puede, de nuevo,
dirigirse a los textos de estadstica matemtica mencionados en el captulo anterior.
4.1 La ley normal
En este apartado vamos a estudiar las principales caractersticas de la ley normal, tambin conocida
como ley de Laplace-Gauss. Dicho modelo probabilstico desempea un papel esencial en la teora y la
prctica de la estadstica, as como en la teora de la probabilidad, especialmente en los teoremas lmite.
Se dice que una variable aleatoria Y se distribuye segn una ley normal de parmetros y [lo
abreviaremos diciendo: YN(;)], cuando su densidad de probabilidad viene dada por:
para -"<y<"; -"<<" y >0.
Desde un punto de vista geomtrico, la ley normal tiene la conocida forma de campana de la
figura 4.1.
Es fcil comprobar los siguientes elementos ms
relevantes:
a) f(y) es simtrica respecto del eje y=.
b) La grfica de f(y) presenta un mximo relativo
en .
c) La grfica de f(y) presenta puntos de inflexin
en y=- e y=+.
d) f(y)0 para todo valor de y.
e) .
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
66

,
1
2

_
,

f y dy ( )

SITUACIN TIPO B TIPO B N NB n


S1 Componente
defectuosa
Componente
buena
N@mero de
componentes
en el pedido
N@mero de
componentes
defectuosas
en el pedido
N@mero de
componentes
extra4das
para control
S2 Hogar con
electro-
domstico
Hogar sin
electro-
domstico
N@mero de
hogares en
la poblacin
estudiada
N@mero de hogares
de la poblacin que
tienen electrodomsticos
N@mero de
hogares
en la muestra
S3 Factura
retrasada
Factura
cobrada
antes
de 3 meses
N@mero total
de facturas
emitidas
Nmero de facturas
emitidas y cobradas
con retraso de ms
de 3 meses
N@mero de
facturas
examinadas
en el estudio
f y
y
( ) exp
( )

1
]
1
1
2 2
2
2

(4.2)
Fig. 4.1 Grfica de la densidad de probabilidad N(; )
B
ALGUNOS MODELOS PROBABILSTICOS
A nivel estrictamente geomtrico, es
interesante observar que variar el valor del
parmetro equivale nicamente a variar la
posicin de la campana sin variar su forma.
Por el contrario, una variacin en el valor del
parmetro implica una modificacin de la
forma de la curva (si aumenta , se alejan del
eje y= los puntos de inflexin y disminuye
la ordenada del mximo relativo), pero no
afecta a la posicin de la misma. En la figura
4.2 se observan estos efectos.
Estos efectos son perfectamente
razonables, ya que:
As pues, y no son ms que
la esperanza matemtica y la desviacin
tipo de la variable aleatoria y, en con-
secuencia, es un parmetro de loca-
lizacin, mientras que afecta a la
dispersin y, por lo tanto, a la forma de
la densidad.
La gran utilidad de la ley normal
en la prctica es consecuencia de su
origen histrico, muy ligado a la teora
de los errores de medida. De hecho, si
bien la ley normal fue descubierta por
Abraham de Moivre como lmite de un
modelo binomial, su uso fue potenciado
por Laplace y especialmente por Gauss
en sus estudios sobre los problemas de
medicin en astronoma. Parece muy
razonable suponer que la distribucin
de los errores de medida en un
instrumento normal sea simtrica,
centrada en el valor 0, y que la proba-
bilidad de cometer un error sea de
alguna manera inversamente propor-
cional a la magnitud del error. Gauss
obtuvo la densidad (4.2) a partir de
estas hiptesis.
En el siglo XIX, Bessel justifica
la utilidad de (4.2) a partir del principio
de superposicin, que est en la base de
67

Fig. 4.2 Efectos de y sobre la grfica de la ley normal


E Y y f y dy
R
( ) ( )


V Y y f y dy
R
( ) ( ) ( )


2 2
Fig. 4.3 Distribuciones obtenidas por simulacin de las puntuaciones
medias al lanzar un determinado nmero de dados
los teoremas centrales del lmite de la estadstica matemtica. La idea consiste en suponer que el error
observado en una medicin concreta es consecuencia de una gran cantidad de causas independientes,
con distribuciones de probabilidad parecidas, y cada una de ellas con un efecto pequeo comparado
con el efecto total resultante. En este caso la utilidad de la ley normal para modelar el efecto total es
consecuencia del teorema central del lmite que dice, en lenguaje no formalizado, que la suma
(superposicin) de un nmero no muy pequeo de variables aleatorias independientes, idnticamente
distribuidas, en condiciones muy generales, se distribuye segn la ley normal.
Este teorema puede ser comprobado empricamente con el ejemplo ilustrado en la fig.4.3.
Si X
1
, X
2
, ..., X
n
representan los valores obtenidos al tirar varias veces un dado perfecto, la
distribucin de probabilidad de X
i
sera: para i=1, 2,..., 6. Automticamente comprobamos
que las distribuciones de probabilidad de la media obtenida en 2, 3, 4,..., 8, tiradas, es decir, la
distribucin de probabilidad de:
sera la de la figura 4.3(a), (b), (c), (d) para n=2, 3, 4, 8 respectivamente.
Obsrvese que podemos abordar la suma (dividida por 8) de 8 variables independientes
equidistribuidas segn la figura 4.3(a) mediante una ley normal con algn tipo de correccin por
continuidad que comentaremos ms adelante.
Si el lector repasa los conceptos de proceso en estado de control y el de sistema de causas
comunes de variabilidad, comprender que como consecuencia del teorema central del lmite, la
variabilidad en este tipo de procesos se puede representar en muchas ocasiones por medio de la ley
normal.
4.1.1 Funcin de distribucin
La funcin de distribucin (f.d.) de la ley normal viene dada por: , donde f(t) viene
dada por (4.2). Puesto que f(t) no tiene funcin primitiva, no existe expresin analtica para F(y) y, en
consecuencia, la f.d. de la ley normal aparece en forma de tablas o programada en muchas de las
calculadoras existentes en el mercado. El lector interesado en las distintas aproximaciones para el
clculo numrico de F(y) puede encontrar abundante material en Abramowitz y Stegun (1964),
Johnson y Kotz (1970) o Patel y Read (1982) entre otros.
Existen tablas de la f.d. de la ley N(0;1), tambin conocida como ley normal centrada y
reducida o ley normal estndar, y cuya densidad de probabilidad, que se obtiene haciendo =0 y =1
en (4.2), resulta ser
La funcin de distribucin de esta ley N(0;1) ser:
y est tabulada en la tabla C del apndice.
Mediante esta tabla, es posible calcular el valor en cualquier punto de la funcin de distribucin
de una ley normal genrica N(;). En efecto, si YN(;) entonces:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
68

f x
i
( )
1
6
1
2
1
3
1
1 2 1 2 3 1 2
( ), ( ), , ( ) X X X X X
n
X X X
n
+ + + + + +
F y f t dt
y
( ) ( )

(z
z
z ) exp

1
]
1
< < +
1
2 2
2

para
( ( z t dt
z
) )

ALGUNOS MODELOS PROBABILSTICOS


Con el cambio de variable tendremos:
En la figura 4.4 se representa grficamente
la funcin de distribucin de una ley normal
N(;) y se sealan algunos valores de uso
frecuente.
Observemos que ahora es posible interpretar
el significado de en el caso de distribucin
normal; as, por ejemplo, si Y es el contenido en
cm
3
de unas botellas rellenadas por un cierto
proceso, y suponemos que YN(200;10), entonces
el 95,44% (97,72-2,28) de las botellas estar entre
2, es decir, entre 180 y 220 cm
3
. Si otra
mquina rellenase botellas con =4 cm y =200,
entonces el mismo porcentaje, 95,44%, de botellas
tendran contenidos entre 192 y 208 cm
3
, es decir,
una poblacin ms homognea.
Es tambin evidente que entre -4 y +4
se encontrar el 99,994% de la poblacin, es decir,
que un intervalo de 8 centrado en la media
comprender prcticamente a todos los individuos
de la poblacin. Por este motivo, a veces 8 recibe
el nombre de capacidad o tolerancia intrnseca de
una mquina cuya produccin se distribuya nor-
malmente.
Si para graduar el eje vertical utilizamos
una escala especial, que se deduce de los valores
de la f.d. de una ley normal N(;) de la manera
indicada en la figura 4.5, entonces, en un papel
grfico con dicha escala en el eje probabilstico, la
f.d. de N(;) ser una recta.
Este hecho nos permite utilizar este papel,
conocido como papel probabilstico normal, para
estudios de capacidad de mquina y de proceso,
para anlisis de la normalidad de los residuos en
un modelo de regresin lineal, o bien para
identificar los efectos importantes en los diseos
experimentales que se estudiarn en el captulo 7.
69

F y Y y
y
dy
y
( ) ( ) exp
0 0
2
1
2
1
2
0

_
,

1
]
1
1

Prob

z
y

F y
z
dz z dz z
z
y
z
y
( ) exp ( ) ( )
0
2
0
1
2 2
0
0
0
0

1
]
1


Fig. 4.4 Funcin de distribucin de la ley normal N(; )
Fig. 4.5 Escala del eje vertical en el papel probabi-
lstico normal
En este mismo captulo veremos la utilidad de la ley normal para abordar, en condiciones
asintticas bastante generales otras distribuciones de probabilidad tales como la t-Student, la ley
binomial y la ley de Chi-cuadrado entre otras.
Finalicemos este apartado con un importante resultado cuya justificacin puede hallarse en
Lukacs (1956): Si Y
i
(i=1, 2, ..., n) son variables aleatorias independientes tales que Y
i
N(
i
;
i
) y
a
i
(i=1,2,...,n) son constantes reales, entonces:
La expresin (4.3) tiene importantes aplicaciones en el clculo de tolerancias. En efecto,
supongamos que se quieren ensamblar tres varillas tal como se indica en la figura 4.6.
Fig. 4.6 Ensamblaje de tres varillas
Si todas las varillas han sido fabricadas independientemente y de manera que su longitud X se
distribuya normalmente segn N(;), la longitud total L se distribuir segn N(3; ). El
conocimiento de la desviacin tipo de L nos permitir el clculo de tolerancias del montaje en serie de
las tres varillas.
En el ejemplo anterior, hemos definido L=X
1
+X
2
+X
3
con X
i
N(;) i=1,2,3. Es interesante que
el lector reflexione sobre el error que se cometera si se hubiese definido L=3X.
4.2 La ley binomial
Supongamos que en una urna hay una proporcin p de bolas blancas y, por lo tanto, una proporcin
q=1-p de bolas negras. Extraemos n bolas de la urna con reposicin (es decir, devolvemos la bola a la
urna despus de haber anotado su color). Sea X el nmero de bolas blancas que han aparecido entre las
n bolas extradas. Esta situacin se caracteriza por:
(i) se realizan n experimentos independientes (la extraccin de las n bolas);
(ii) para cada experimento slo hay dos sucesos posibles: A (la bola blanca) y (es negra);
(iii) p=P(A); q=1-P(A), la probabilidad de que ocurra A es constante;
(iv) la variable aleatoria de inters X es el nmero de veces que ocurre A en los n experimentos.
Cuando se cumplen todas las condiciones (i)...(iv) anteriores, se dice que X sigue la ley
binomial.
La distribucin de probabilidad binomial es:
donde es el nmero de combinaciones sin repeticin de orden x entre n elementos y su valor es
A
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
70

a Y N a a
i i i i i i
( ; ) con y
2 2
(4.3)
3
Prob( ) ( ; , ) ( ) , , , , X x b x n p
n
x
p p x n
x n x

_
,

1 01 2 para
n
x

_
,
n
x
n
x n x

_
,

!
!( )!

ALGUNOS MODELOS PROBABILSTICOS


La grfica de b(x;n,p) depende del valor de sus dos parmetros n y p, tal como se indica en la
figura 4.7.
Fig. 4.7 Distribucin de probabilidad de la ley binomial
La funcin de distribucin se define de la siguiente manera:
Su grfica es la de una funcin en escaln,
continua por la derecha y montona no decreciente, tal
como se indica en la figura 4.8.
B(x;n,p) se encuentra tabulada para algunos
valores de n y p en la tabla binomial del apndice 1.
La esperanza matemtica y la varianza de una v.a. que
sigue una ley binomial de parmetros n y p son:
Es interesante observar que y
2
no son
independientes.
Existen varias aproximaciones de la ley
binomial que presentamos a continuacin.
Cuando n es grande y p no toma valores extremos, la ley binomial se puede aproximar mediante
una ley normal. Las condiciones bajo las cuales esta aproximacin conduce a resultados correctos
varan segn distintos autores. Segn nuestra experiencia las condiciones ms aceptables son:
es la funcin de distribucin de la ley normal estndar en el punto b.
El factor que aparece en la expresin anterior es debido a la correccin por continuidad
necesaria al aproximar una distribucin de probabilidad de una v.a. discreta con una continua.
71

B x n p X x b j n p
j
x
( ; , ) ( ) ( ; , )

Prob
0
Fig. 4.8 Funcin de distribucin de una ley binomial
E X np ( )

2
1 V X np p ( ) ( )
Si y entonces donde n
n
p
p
p
p
B x n p
x np
np p
b

<
+

_
,

5
1 1
1
0 3
1 2
1
, , ( ; , )
( )
, ( )
Si en lugar de considerar la v.a. X se considera la proporcin de veces que ocurre A en los n
experimentos, es decir, p
*
, tendremos:
En este caso, cuando se cumpla la condicin:
Finalmente, en el prximo apartado veremos que, cuando n es grande, p pequeo y np es finito,
la ley binomial se puede aproximar por la ley de Poisson.
4.3 Ley de Poisson
En este apartado se presenta la ley de Poisson desde dos puntos de vista. El primero es como lmite de
la ley binomial cuando n$", p$ 0 y np= es finito, y el segundo como proceso de Poisson.
Supongamos una mquina que funciona durante 20.000 segundos diarios. Sea p
1
=0,0001 la
probabilidad de que la mquina se avere durante un segundo dado, y admitamos la hiptesis de que la
ocurrencia de una avera en un segundo dado es independiente de lo ocurrido con antelacin. Para
planificar el mantenimiento de dicha mquina es necesario calcular las probabilidades de 0, 1, 2, ...,
averas durante un da.
Dichas probabilidades se podran calcular utilizando la ley binomial y seran:
Si disponemos de otra mquina menos utilizada, que funcione durante 10.000 segundos diarios y
con una probabilidad p
2
=0,0002 de averiarse durante un segundo dado, las probabilidades de 0, 1, 2, ...,
averas en esta segunda mquina seran:
Es interesante constatar que las probabilidades calculadas para las dos mquinas prcticamente
coinciden. Por qu?
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
72

p
X
n

E p
n
E X p ( ) ( )


1
V p
n
V X p
p
n
( ) ( )
( )


1 1
2
n
n
p
p
p
p
p a
a
n
p
p p
n

< <
+

_
,

5
1 1
1
0 3
1
2
1
y tendremos que , , ( )
( )
Prob
NM. DE AVERAS
EN UN DA (x) 0 1 2 3 4
PROBABILIDADES:
b (x; 20.000; 0,0001) 0.13532 0.27067 0.27068 0.18046 0.09022
NM. DE AVERAS
EN UN DA (x) 0 1 2 3 4
PROBABILIDADES:
b (x; 10.000; 0,0002) 0.13531 0.27067 0.27070 0.18046 0.09022
ALGUNOS MODELOS PROBABILSTICOS
Observemos que en los dos modelos binomiales n es muy grade y p es muy pequeo, mientras
que el nmero medio de averas por da es np=2 en ambas mquinas.
Se demuestra fcilmente que:
La distribucin lmite p(x;) se conoce como ley de Poisson. En nuestro caso tendramos que:
Y es evidente la coincidencia prctica de los resultados obtenidos mediante la ley de Poisson y
los obtenidos aplicando las leyes binomiales respectivas.
La grfica de la distribucin de Poisson p(x;) depende de , tal como se indica en la figura 4.9.
La funcin de distribucin de la ley de
Poisson vendr dada por:
Dicha funcin de distribucin est
tabulada en el apndice de las tablas y su
grfica para =2 es la de la figura 4.10.
La ley de Poisson viene caracterizada
por un nico parmetro y es sencillo probar
que E(X)= y V(X)=, es decir, que la media y
la varianza de una ley de Poisson coinciden y
que las dos son iguales a .
73

lim b x n p e
x
p x np finito
n
p
x


0
( ; , )
!
( ; ) ( )


con (4.4)
NM. DE AVERAS
EN UN DA (x) 0 1 2 3 4
PROBABILIDADES:
0,13534 0,27067 0,27067 0,18045 0,09022
P x X x p j
j
x
( ; ) ( ) ( ; )

Prob
0
Fig. 4.10 Funcin de distribucin de la ley de Poisson para 2
e
x
x

!
( ) 2
Fig. 4.9 Distribucin de Poisson
La ocurrencia de averas en una mquina puede ser vista como un proceso estocstico
particular.
Supongamos que las averas ocurren a lo largo del tiempo, y llamemos X(t) al nmero de
sucesos (averas en este caso) que ocurran durante el intervalo del tiempo (0,t) con t0, y supongamos
sin prdida de generalidad que X(0)=0.
Para que los sucesos (averas en nuestro caso) sigan un proceso de Poisson, deben cumplirse las
siguientes hiptesis:
(i) La probabilidad de que durante el intervalo (,+t) ocurran exactamente x sucesos depende slo
de x y de t, pero no de .
(ii) El nmero de sucesos que ocurren en intervalos de tiempo disjuntos son mutuamente
independientes.
(iii)La probabilidad de que durante un intervalo de tiempo de amplitud h ocurra un suceso es
h+O(h) y la probabilidad de que ocurra ms de un suceso es O(h) donde es un valor
constante y O(h)/h$0 cuando h$0.
Bajo estas condiciones, llamamos p(x;t) a la probabilidad de que en un proceso de Poisson
ocurran exactamente x sucesos durante un intervalo de tiempo (0,t) y es:
es decir, la distribucin de Poisson de parmetro t.
La coincidencia entre los dos puntos de vista que acabamos de exponer es intuitivamente clara
si consideramos el intervalo (0,t) dividido en n intervalos disjuntos de amplitud h=t/n.
Cuando n$", las hiptesis (i), (ii) y (iii) equivalen al lmite de un modelo binomial en el que
h$0, pero es finito.
En la expresin 4.5, representa, pues, el nmero medio de sucesos por unidad de tiempo.
4.4 Distribucin de estadsticos en muestras aleatorias simples de poblaciones normales
Se dice que una muestra extrada de una cierta poblacin es una muestra aleatoria simple (m.a.s) de la
misma, cuando todo elemento de dicha poblacin tiene la misma probabilidad de ser escogido para
formar parte de la muestra. Si Y es una cierta variable aleatoria ser til imaginar una poblacin
conceptual en la que la frecuencia con que aparezcan los distintos individuos sea la definida por la
funcin de distribucin de Y. En este caso, una muestra aleatoria simple sera cualquier conjunto de n
realizaciones independientes de Y. Es decir, (Y
1
,Y
2
,...,Y
n
) es una m.a.s. de Y si y slo si:
(i) las v.a. Y
i
son independientes;
(ii) Y
i
f(y) i=1,2,...,n donde f(y) es la densidad de probabilidad de Y.
Sea (y
1
,y
2
,...,y
n
) una m.a.s. de Y; los estadsticos muestrales ms utilizados en el presente libro son:
Tanto la media muestral , como S
2
son variables aleatorias, y uno de los objetivos del
presente captulo es obtener las densidades de probabilidad de y de S
2
en m.a.s. de poblaciones
normales. La figura 4.11 indica de forma grfica este objetivo.
Y
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
74

p x t e
t
x
x
t
x
( ; )
( )
!


= 0,1,2,
(4.5)
Y
Y
n
y S
Y Y
n
i
i
i
n


2
2
1
1
( )
Y
ALGUNOS MODELOS PROBABILSTICOS
Fig. 4.11 Los estadsticos y S
2
son variables aleatorias
4.5 Distribucin de (
2
conocida)
Sea (Y
1
,Y
2
,...,Y
n
) una m.a.s. de YN(;). Dado que = Y
i
/n se tiene que:
a) La distribucin de ser normal por ser una combinacin lineal de Y
i
, que son normales.
b) .
c) , por ser Y
i
v.a. independientes.
En consecuencia,
Conviene reflexionar sobre el resultado (4.6). En primer lugar observamos que sera un
estimador insesgado de o, lo que es lo mismo, que toma valores alrededor del verdadero valor de .
En segundo lugar, la variancia V( ) puede hacerse tan pequea como se quiera, si se toma un tamao
de muestra adecuado (aunque puede resultar caro) y, por lo tanto, el valor de en una muestra concreta
puede ser tan prxima a como se desee.
Por ello, cuando se quiera obtener una buena estimacin del parmetro en una poblacin
normal, dicha estimacin ser .
Y
Y Y
Y
Y
75

E Y
n
E Y
n
i
i
n
( ) ( ) ( ) + +

1 1
1

V Y
n
V Y
n n
i
i
n
( ) ( ) ( ) + + +

1 1
2 2
1
2 2 2
2

Y N
n

_
,

(4.6)
Y
Y

Y Y

Y
Y
Tambin es importante observar que (4.6) es tambin cierto para muestras de una poblacin
cualquiera (no necesariamente normal), aunque en este caso el tamao de muestra no debe ser muy
pequeo. Ello es debido al teorema central de lmite aplicado a la suma de v.a. del numerador de
= Y
i
/n.
La distribucin de cuando no sea conocida se estudiar en el apartado 4.9.
4.6 La ley de Chi-cuadrado
Para la obtencin de la densidad de probabilidad de S
2
es necesario introducir una nueva ley de
probabilidad conocida como la ley de Chi-cuadrado.
La ley de (Chi-cuadrado con grados de libertad) es la distribucin de la suma de los
cuadrados de variables aleatorias independientes y todas ellas de distribucin N(0;1).
La figura 4.12 ilustra el concepto de .
Supongamos que disponemos de urnas con papeletas en cada una de las cuales hay escrito un
nmero con cuatro decimales, de modo que las frecuencias con que aparecen dichos nmeros sean las
definidas por la d.p. de la ley N(0,1). Si extraemos una papeleta de cada urna y observamos los
nmeros escritos en ellas tendremos: (Y
11
,Y
12
,...,Y
1
). Si elevamos al cuadrado y los sumamos
obtendramos un cierto valor . Repitiendo esta operacin conceptualmente se iran obteniendo
valores , ,...,que seran realizaciones de la variable aleatoria:

2
Y
Y
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
76

Fig. 4.12 Esquema conceptual de la ley de Chi-cuadrado

2 2
1

Y
i
i
donde Y
i
N(0;1) para i=1,2,..., y las Y
i
son independientes.
Y
i 1
2
Y
i 3
2
Y
i 2
2
ALGUNOS MODELOS PROBABILSTICOS
La densidad de probabilidad de es:
donde () a la funcin gamma incompleta.
La esperanza matemtica y la varianza de son:
Obsrvese que los grados de libertad de la ley de Chi-cuadrado, , son el nmero de variables
aleatorias independientes que aparecen en el sumatorio:
La grfica de f( ) depende de . Es
asimtrica y sesgada hacia la izquierda para
pequeo como puede observarse en la figura
4.13.
La ley de Chi-cuadrado est par-
cialmente tabulada en el apndice de tablas
(tabla F).
Para >30 existen diversas aproxi-
maciones, como la de Fisher o la de Wilson-
Hilferty. Segn nuestra experiencia y de forma
emprica, la ley de se puede aproximar de
la forma siguiente:
4.7 La ley t-Student
Student era el seudnimo utilizado por William Gosset cuando trabajaba en la empresa cervecera
Guiness en Dublin, que le oblig a no publicar con su autntico nombre.
En aquellos tiempos de principios de siglo, la totalidad de la teora estadstica existente era
teora asinttica y, en consecuencia, vlida nicamente para muestras de tamao grande. Por el
contrario, Gosset quera estudiar la relacin existente entre la calidad de ciertas materias primas, como
la cebada y la calidad del producto final, y slo dispona de muestras pequeas. Para este tipo de
muestras Gosset dedujo la distribucin conocida hoy en da como la t-Student.
Este es un ejemplo ms de que el contacto con la realidad es la mejor fuente de inspiracin en la
investigacin terica de alta calidad.

2
77

( )
f y e y
y
( )


2
1
1
2
1
2
0
2 2 2

_
,

'

>


para
(4.7)
E V ( ) ( )

2 2
2 y

2 2
1

Y
i
i
Fig. 4.13 Algunas densidades de

2
( )
Para > 200

2
2 N ;
Para 30 200
2
2
<

_
,

log log ; N

f ( )
2
Conceptualmente la ley t-Student con grados de libertad la obtuvo Gosset como distribucin
del estadstico:
en el que:
a) ZN(0,1).
b) U .
c) Z y U son independientes.
La densidad de probabilidad de t

depende de y tiene la expresin:


para t<".
Los grados de libertad de la t-Student coinciden con los grados de libertad de la ley de Chi-
cuadrado que aparece en el denominador de t

. La ley t-Student est parcialmente tabulada en el


apndice de tablas (Tabla D).
La esperanza matemtica y la varianza de t

slo estn definidas para >1 y >2, respectiva-


mente, y son:
La grfica de f(t

) tiene tambin forma de campana,


centrada en cero y con colas ms extensas que la ley
normal, por lo que la t-Student puede resultar de utilidad
para modelar datos en los que se sospeche que haya algunas
anomalas moderadas. Cuando $" (en la prctica, para
>30), la densidad f(t

) se puede aproximar mediante la ley


normal centrada y reducida. En la fig. 4.14 se representan
algunas distribuciones de t

.
Veremos en el apartado 4.8 que Gosset encontr la
densidad del estadstico t

cuando se interes por la


distribucin del estadstico:
para muestras pequeas, que es el equivalente a
cuando es desconocido y se sustituye por su estimacin S.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
78

t
Z
U

2
f t
t
( )

_
,

_
,

_
,

+
1
1
2
2
1
1
2
1
2

(4.8)
E t ( )

> 0 1 para
V t ( )


2
para > 2
Fig. 4.14 Densidad de probabilidad de la ley
t-Student
t Y n S ( ) ,
Z
Y
n
( )

ALGUNOS MODELOS PROBABILSTICOS


4.8 Distribucin de S
2
Sea (Y
1
,Y
2
,...,Y
n
) una muestra aleatoria simple de YN(;).
La varianza muestral se acostumbra a definir:
Para m.a.s. de poblaciones normales se puede demostrar que:
a) y S
2
son independientes;
b) se distribuye segn una ley con =n-1 grados de libertad.
Una forma intuitiva de comprender a) es la siguiente: Si Y es el vector de observaciones
muestrales, se puede descomponer en dos componentes ortogonales e Y- tal como se indica en la
figura 4.15.
Obsrvese que S
2
est relacionado nicamente con la
norma de (Y- ).
La ortogonalidad es debido a que
De b) se deduce que y, por lo tanto:
Estas dos ltimas expresiones justifican el hecho de que S
2
se utilice frecuentemente como
estimador de
2
, ya que cumple las dos propiedades que hemos comentado para como estimador de .
4.9 Distribucin de (
2
desconocida)
Sea (Y
1
,Y
2
,...,Y
n
) una m.a.s. de YN(;). En general ser desconocida, por lo que el estadstico
no ser de gran utilidad.
Se podra sustituir por una estimacin S que, si se obtiene a partir de una muestra
suficientemente grande, tomar un valor prximo a y, por lo tanto, la distribucin del estadstico:
podra considerarse idntica a la de Z, es decir, N(0;1). Este razonamiento es tpico de la teora
asinttica. Cuando n$", todo resulta fcil.
Ya hemos comentado en el apartado 4.6 que Gosset se enfrentaba al problema de determinar la
distribucin de t para muestras pequeas.
Y
Y
Y
Y Y

2
Y
79

S
Y Y
n
Y
Y
n
i i 2
2
1



( )
donde
( ) n
S
1
2
2

Fig. 4.15 Descomposicin ortogonal del


vector Y
Y Y Y
i
i
n
( ) .

1
0
S
n
n
2
2
1
2
1


E S
n
E
n
n
n
( ) ( ) ( )
2
2
1
2
2
2
1 1
1

Z Y n ( )
t
Y
S n


V S
n
V
n
n
n
n
( ) ( )
( )
( )
2
2
2
1
2
4
2
4
1 1
2 1
2
1

_
,

Si se tiene en cuenta la independencia entre y S


2
, que y que
se deduce que:
donde, evidentemente, ZN(0;1) y U con =n-1 y adems Z y U son independientes, pues Z
slo depende de y U de S
2
. En consecuencia, t se distribuye segn la ley t-Student con =n-1 grados
de libertad, es decir, que para muestras pequeas:
4.10 El caso de dos poblaciones normales independientes
Supongamos que X e Y son dos v.a. independientes y tales que XN (
x
;
x
) e YN (
y
,
y
). El lector
puede suponer que X es la duracin de vida de las bombillas fabricadas por la empresa A e Y es la
duracin de vida de las bombillas fabricadas por la empresa B.
Sean (X
1
, X
2
,...,X
n
x
) una m.a.s. de tamao n
x
extrada de la poblacin de bombillas de A, y
(Y
1
, Y
2
,...,Y
n
y
) una m.a.s. de tamao n
y
extrada de las bombillas de B.
Sean , S
x
2
, y S
y
2
las medias y varianzas muestrales.
Es fcil demostrar que:
En efecto, la normalidad es consecuencia de la normalidad de las distribuciones de y , y el
valor de la esperanza matemtica y la varianza del estadstico - es consecuencia inmediata de la
expresin (4.3).
En consecuencia se tendr que:
y si adems
x
2
=
y
2
=
2
, entonces se cumplir que:
X Y
Y X
Y
Y
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
80

t
Y n
S
Y n
S
Z
S
Z
n
n
S
Z
U

( )
( )
( )
( )

1
1
2
2

2
t
Y
S n
n

t - Student con grados. 1


( ) ; Y X N
n n
y x
y
y
x
x
+

_
,




2
2
Y X
Z
Y X
n n
y x
y
y
y
x


+
( ) ( )

2 2
Z
Y X
n n
N
y x
y x


+
( ) ( )
( ; )

1 1
01
(4.9)
(4.10)
Z
Y
n
N

( ; ) 01

( ) n
S
n


1
2
2 1
2

ALGUNOS MODELOS PROBABILSTICOS


En general
2
ser desconocida, pero se puede estimar a partir de una media ponderada de las
dos varianzas muestrales. La estimacin de la varianza comn desconocida ser por tanto:
En este caso se tendr que:
grados de libertad, ya que ste es el denominador de (4.11) utilizado para estimar
2
.
4.11 La ley F-Snedecor
Si definimos una v.a. F:
tal que y U , V y U y V son independientes, entonces F se distribuye segn la ley F-Snedecor
con
1
grados de libertad para el numerador y
2
grados de libertad para el denominador.
La distribucin F debe su importancia al uso que de ella se hace en el anlisis de la varianza y
tambin cuando se quieren comparar dos varianzas de poblaciones normales, como veremos en el
apartado siguiente.
La esperanza matemtica y la varianza de F son:
En el apndice de tablas estn tabulados los valores F

(
1
,
2
) para algunos valores de , es
decir el valor F

(
1
,
2
) que, en una ley F de Snedecor con grados de libertad
1
para el numerador y
2
para el denominador, deja un rea de valor a su derecha.
Para el manejo de estas tablas resulta de utilidad el hecho de que:
81

S
n S n S
n n
y y x x
y x
2
2 2
1 1
2

+
+
( ) ( )
t
Y X
S
n n
n n
y x
y x
y x


+
+
( ) ( )

1 1
2 t - Sudent con
F
U
V

1
2

1
2

2
2
E F ( )

>


2
2
2
2
2 para
V F ( )
( )
( ) ( )

+

>
2 2
2 4
4
2
2
1 2
1 2
2
2


para
F
F



( , )
( , )
1 2
1 2 1
1

4.12 Distribucin del cociente de dos varianzas muestrales


Para la situacin descrita en el apartado 4.9 vamos a estudiar la distribucin de S
y
2
/S
x
2
.
Dado que:
donde, como hemos visto en 4.7, U , V y U, V son independientes, en consecuencia:
En el caso particular en que
y
2
=
x
2
se tiene que:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
82

S
S
n
S
n
n
S
n
U
n
V
n
y
x
y
y
y
y
y
x
x
x
x
x
y
y
x
x
2
2
2
2
2
2
2
2
2
2
1
1
1
1
1
1

( )
( )

n
y1
2
S
S
F n n
y
x
y
x
y x
2
2
2
2 1 1

( , )

S
S
F n n
y
x
y x
2
2 1 1
( , )

n
x1
2

ALGUNOS MODELOS PROBABILSTICOS


Ejercicios
4.1 Un estudiante desea aprobar una asignatura que consta de 100 temas estudiando el mnimo
posible.
El examen consta de tres preguntas que el alumno escoge al azar de una urna con 100 papeletas
numeradas del 1 al 100; las tres papeletas que saca el estudiante corresponden a los tres temas de
los cuales debe escoger uno para exponer.
a) Cul es el menor nmero de temas que puede estudiar para que con una probabilidad no inferior
al 95% extraiga alguna papeleta correspondiente a un tema conocido?
b) Y si la probabilidad es del 100%?
4.2. Un jugador observa que en 100 jugadas consecutivas de la ruleta el rojo ha aparecido en 70
ocasiones. Se puede decir que ello es debido al azar?
4.3. Una mquina fabrica arandelas cuyo radio interior r se distribuye segn una ley normal de
media 20 mm y desviacin tipo 0,3 mm, y cuyo radio exterior R se distribuye segn una ley
normal de media 50 mm y desviacin tipo 0,4 mm. Ambas variables aleatorias son
independientes.
Se considera que una pieza es defectuosa si la diferencia de radios supera los 30,98 mm o bien
si dicha diferencia es menor de 29,22 mm.
a) Cul es la probabilidad de que una arandela sea defectuosa?
b) Si se recoge una muestra de 20 arandelas, cul es el valor esperado de la proporcin de
arandelas defectuosas?
c) De la muestra de 20 arandelas, qu probabilidad existe de que se encuentren 5 arandelas
defectuosas?
4.4. La duracin en horas de las lmparas adquiridas en una determinada empresa se distribuye segn
una ley normal N(1.200;). Se sabe que el 97% de todas las lmparas citadas dura entre 1.178,3
horas y 1.221,7 horas.
Si se extraen 200 muestras aleatorias simples de 9 lmparas cada una:
a) Cul es la probabilidad de que la media muestral supere las 1.203,5 horas en al menos 90 de las
200 muestras?
b) Cul es la probabilidad de que la s
2
muestral supere el valor 193,84 h en 40 muestras como
mximo?
4.5. Una lnea elctrica se avera cuando la tensin sobrepasa la capacidad de la lnea. Si la tensin
es N (
1
=100;
1
=20) y la capacidad es N(
2
= 140;
2
= 10), calcular la probabilidad de
avera.
4.6. En un concesionario de ventas de automviles se supone, por la experiencia que se tiene, que
cuando una persona entra a interesarse por un coche, acaba comprndolo en el 20% de los casos.
Si en un da se atiende a seis de estos clientes potenciales:
a) Cul es la probabilidad de que realicen cuatro ventas en este da exactamente?
b) Y la probabilidad de que en este da se realicen ms de cuatro ventas?
c) Cul sera la probabilidad, en el caso de que apareciesen 15 clientes, de que se realizasen menos
de tres ventas?
83

4.7. Una cierta mquina de fabricacin de rollos de cinta aislante tiene un promedio de dos defectos
cada 1.000 m. Calcular la probabilidad de que un rollo de 3.000 m:
a) no contenga defectos;
b) contenga exactamente 5 defectos;
c) contenga menos de 4 defectos.
4.8. Mediante un estudio estadstico realizado en una fbrica de componentes electrnicos se sabe
que slo 1 de cada 100 es defectuoso. Si se empaquetan dichos componentes en cajas por
grupos de 500, cul es la probabilidad de que la caja no contenga ningn componente
defectuoso?
Y si se decide empaquetar las cajas en grupos de 100 componentes, cul es la probabilidad de
que una determinada caja no tenga ningn componente defectuoso?
4.9. Una empresa fabricante de detergentes tiene dos mquinas de llenado. Se sabe que la mquina
A llena segn N(87,5 g; 0,5 g) y otra mquina B llena segn N(87,5 g; 0,8 g). Para que no se
rechace una bolsa llena, el contenido de detergente no puede ser menor de 86 gramos.
a) Qu probabilidad hay de que una bolsa, escogida la azar, llenada por la mquina A sea
rechazada? Idem si es llenada por la mquina B.
b) Si la bolsas vacas tienen un peso que se distribuye segn N(21,5 g; 1,2 g), cul es la
probabilidad de que el peso de una bolsa llena, escogida al azar, llenada por la mquina A sea
mayor de 110 gramos? Idem para la mquina B.
c) Se ha recogido una muestra de 10 bolsas llenas producidas por una nica mquina y se han
pesado. El resultado es el siguiente:
109 105 112 111 108.5 107.5 111.5 108 109.5 108
Qu mquina cree que las habr producido? Razone la respuesta.
4.10. Se sabe que el 20% de los rboles de un determinado bosque estn atacados por un cierto tipo
de parsitos.
a) Cul es la probabilidad de que el nmero de rboles con el parsito en una muestra de 300 est
entre 49 y 71?
b) Suponga que en la muestra de 300 rboles hay 72 con el parsito.
Contradice esto la hiptesis de que la poblacin est parasitada en un 20%? Razone la
respuesta justificndola con las hiptesis necesarias.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
84

El anlisis estadstico que se aborda en este captulo tiene como objetivo la comparacin de dos
poblaciones, que representan lo que genricamente denominamos tratamientos, pudiendo referirnos
bajo esta denominacin a dos mquinas, dos mtodos de trabajo, dos catalizadores, dos proveedores,
o dos tipos de materia prima distintos. Dicha comparacin se realiza a partir de datos muestrales.
Se tratar de determinar si la diferencia que presentan las medias de las dos muestras es
indicativa de una diferencia en las medias poblacionales o si, por el contrario, puede ser atribuida al
azar.
Es importante tener presente que el estudio estadstico no se refiere simplemente a la aplicacin
del test de rigor a unos datos de los que no se cuestiona su calidad (quin, cmo, cundo, con qu
criterio se han tomado).
Tal como veremos a continuacin, el anlisis empieza con un claro planteamiento del problema
y sigue con el adecuado diseo de la recogida de los datos (sin descuidar el rigor necesario en su
recogida fsica). A continuacin se realiza un anlisis exploratorio para detectar posibles valores
anmalos, constatar que no existe evidencia de incumplimiento de las hiptesis del mtodo, y tambin
para obtener unas primeras conclusiones en torno al objetivo del estudio.
Finalmente, se realiza el test estadstico (contraste de hiptesis) y se interpreta el resultado
obtenido.
5.1 Caso 1: Comparacin de dos productos en un proceso de curtido de piel
5.1.1 Planteamiento del problema. Recogida de los datos
Una industria dedicada al curtido de pieles utiliza normalmente una cierta solucin A, en la que
sumerge el cuero durante 4 horas en la fase final de su proceso de curtido. Aunque el producto A
produce unos resultados satisfactorios, se presenta la oportunidad de sustituirlo por otro producto B,
considerablemente ms barato. Se sospecha, sin embargo, que la nueva solucin puede afectar a las
caractersticas del cuero reduciendo su resistencia a la traccin.
Los responsables del proceso deciden cambiar, slo en el caso de constatar experimentalmente
que la nueva solucin no reduce la resistencia a la traccin. Para ello, realizan unos experimentos con
el fin de analizar los resultados obtenidos y tomar una decisin sobre este tema.
85
5
Comparacin de dos tratamientos
Para la realizacin del experimento se toman 20 porciones de cuero, todos ellos de calidad y
caractersticas lo ms parecidas posible, y aleatoriamente se asignan 10 para ser tratados con el
producto A y otros 10 con el B.
Para realizar la prueba se dispone de 20 recipientes, todos ellos
idnticos, a 10 de los cuales se le asigna la solucin A y a otros 10 la
B. Los trozos de cuero se sumergen simultneamente, y todos ellos se
retiran al cabo de las 4 horas.
Posteriormente se dejan reposar durante 2 das (todos ellos en iguales
condiciones) y se procede a medir su resistencia a la traccin,
aplicando una metodologa perfectamente definida. Para evitar la
influencia de posibles derivas en el aparato de medida, o vicios en el
proceso de medicin, ste se realiza tambin de manera aleatoria. Los
valores obtenidos (en unidades de la escala del aparato de medida)
son los que figuran en la tabla adjunta.
El valor indicado como suprandice en los resultados, se
refiere a su orden de obtencin.
5.1.2 Anlisis exploratorio. Formalizacin del problema
Siempre conviene representar los datos grficamente. En la figura 5.1 se presentan los diagramas de
puntos correspondientes a ambos conjuntos de datos. No se observan valores anmalos, y ya se adivina
que la diferencia de medias va a resultar significativa.
Fig. 5.1 Diagramas de puntos correspondientes a los datos obtenidos en las pruebas de curtido
Para constatar que el orden en que se han realizado las mediciones no ha afectado a la respuesta,
pueden realizarse diagramas en los que se coloque el orden de obtencin en el eje horizontal y en el
vertical el valor obtenido. La figura 5.2 presenta dichos diagramas para cada una de las soluciones, sin
que se observe nada anormal.
Supongamos, como hiptesis de partida, que las resistencias a la traccin son iguales,
independientemente de la solucin utilizada. A esta hiptesis se la denomina hiptesis nula (H
0
) y
supondremos, asimismo, que en caso de no cumplirse dicha hiptesis, las unidades curtidas con la solu-
cin A tendrn una resistencia mayor que las que hayan utilizado la solucin B. Esta hiptesis, que es
la que consideramos que se cumple en el caso de no cumplirse la hiptesis nula, se denomina hiptesis
alternativa (H
1
). Podemos notar el planteamiento realizado de la forma:
H
0
:
A
=
B
H
1
:
A
>
B
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
86

CURTIDO CON
SOLUCIN A
CURTIDO CON
SOLUCIN B
24.3
(2)

25.6
(3)

26.7
(5)
22.7
(9)
24.8
(11)
23.8
(12)
25.9
(14)
26.4
(16)
25.8
(17)
25.4
(18)
24.4
(1)
21.5
(4)
25.1
(6)

22.8
(7)
25.2
(8)
23.5
(10)
22.2
(13)
23.5
(15)
23.3
(19)
24.7
(20)
n
y
s
A
A
A
=
=
=
10
2514
1242
.
.
n
y
s
B
B
B
=
=
=
10
2362
1237
.
.
A
B
COMPARACIN DE DOS TRATAMIENTOS
5.1.3 Resolucin
Es frecuente realizar la hiptesis de que las poblaciones de las cuales provienen las muestras son
normales, por tanto, podemos escribir:
Y anlogamente para los valores obtenidos con la solucin B:
Por tanto, las medias de los valores obtenidos se distribuirn de la forma:
y de acuerdo con lo visto en el captulo 4:
Por tanto:
87

28
27
26
25
24
23
22
21
10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 10
RESP.
SOLUCIN A SOLUCIN B
( ) y N
A A A
,
( ) y N
B B B
,
y N
n
A A
A
A

y N
n
B B
B
B

Fig. 5.2 Diagramas en secuencia temporal de los resultados obtenidos


y y N
n n
A B A B
A
A
B
B
+



,
2 2

Pero no conocemos
A
2
ni
B
2
, sino que los estimamos a partir de sus respectivas varianzas
muestrales: s
A
2
= 1,54, s
B
2
= 1,53. Estos valores son tan parecidos que, evidentemente, podremos
suponer que las varianzas poblacionales son iguales. En el caso de que las varianzas muestrales
presentaran mayor diferencia, antes de realizar esta suposicin se debera realizar el test de igualdad
de varianzas, utilizando la distribucin F de Snedecor.
Ejemplo 5.1a Se toman 2 muestras aleatorias simples de tamao n = 10 de sendas poblaciones
normales, y se obtiene s
A
2
= 1,54 y s
B
2
= 2,18. Puede considerarse que las
varianzas poblacionales son iguales?
Hacemos:
Comparando el valor obtenido con una distribucin F de Snedecor con 9 y 9
grados de libertad, se obtiene que el rea de la cola es mayor de 0,25 y, por tanto,
nada se opone a suponer que
A
2
=
B
2
.
Ejemplo 5.1b Igual planteamiento que en el ejemplo anterior, pero ahora consideramos que
s
A
2
=1,54 y s
B
2
=16,3.
En este caso se obtiene F=10,58, y el rea de la cola resulta ser menor de 0,001,
luego no podr trabajarse con la hiptesis de igualdad de varianzas poblacionales.
En el apndice 5A se comenta qu hacer en el caso de que se d esta
circunstancia.
En nuestro caso, calcularemos un estimador de la varianza poblacional nica, que ser la
media de las varianzas muestrales ponderada segn los grados de libertad de cada muestra (si las
muestras son del mismo tamao como en nuestro caso, esto se convierte en una simple media
aritmtica).
Con dicho estimador nico podemos escribir:
Si se cumpliera que
A
-
B
= 0, tendramos que:
En nuestro caso tenemos:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
88

( ) ( )
( )
y y
n n
N
A B A B
A
A
B
B

+


2 2
0 1 ,
F
s
s
B
A
= = =
2
2
2 18
154
1 42
,
,
,
( ) ( ) y y
s
n n
t n n g l
A B A B
A B
A B

+
+

1 1
2 con . .
( )
t
y y
s
n n
t n n g l
A B
A B
A B 1
1 1
2 =

+
+ con . .
COMPARACIN DE DOS TRATAMIENTOS
Si se cumpliera la hiptesis nula (recordemos: H
0
:
A
=
B
), el valor t
1
obtenido pertenecera a
una distribucin t de Student con 18 grados de libertad. Puede considerarse que esto es as?
Una forma de determinar hasta qu punto es normal un valor en una distribucin, es a travs del
rea de la cola que define. Consultando las tablas observamos que Pr(t > 2,74) = 0,007, luego ste es
un valor muy poco probable en su distribucin de referencia.
Si las medias de A y B fueran iguales, se daran diferencias como la observada o mayores,
realizando una prueba como la que aqu se ha hecho, el 0,7 % de las veces. Luego, en este caso, lo ms
razonable ser considerar que las medias poblacionales son distintas y diremos que la diferencia entre
las medias muestrales es estadsticamente significativa.
Estamos absolutamente seguros de que la media de resultados con la solucin B es menor que
con la solucin A? La respuesta es no pero la probabilidad de equivocarnos al hacer esta afirmacin es
slo del 0,7 %.
5.2 Generalizacin del caso de la comparacin de dos productos para el curtido:
comparacin de medias en diseos totalmente aleatorizados
La recogida de datos debe hacerse de forma que el nico factor que influya de forma distinta en ambas
muestras sea aquel cuyo efecto se desea estudiar. Si otros factores tambin afectaran de forma distinta,
sera imposible distinguir si las diferencias apreciadas (en el caso de que existieran) deberan ser
atribuidas al factor estudiado o a otros de los que accidentalmente hubieran podido influir.
Debern seguirse, por tanto, dos reglas bsicas al planificar la recogida de datos:
Asegurarse de que todos los factores que puedan tener alguna influencia en la respuesta,
influyan exactamente igual en las dos muestras (excepto aquel cuyo efecto se desea estudiar).
Aleatorizar todo lo que se pueda para protegerse de posibles sesgos introducidos por factores
no identificados.
As, en el ejemplo de la comparacin de soluciones ha sido necesario asegurarse de que todos
los factores que podan influir en la respuesta (tipo de piel, tiempo que est sumergida en la solucin,
tiempo y condiciones de secado, etc.) afectasen exactamente igual a las unidades tratadas con ambas
soluciones. Y aunque consideremos que los 20 retales de piel son muy parecidos (no sern idnticos),
los asignaremos aleatoriamente a cada tratamiento y, por si influyera el orden de medicin, tambin
mediremos aleatoriamente.
Una vez recogidos los datos es necesario constatar que nada se opone al cumplimiento de las
hiptesis en que se basa el mtodo a aplicar. stas son:
Normalidad de las 2 poblaciones. Una forma prctica de comprobarlo sera realizando los
histogramas de ambas muestras, pero en la prctica difcilmente encontraremos evidencia
de no normalidad de las poblaciones, porque dispondremos de muestras de tamaos
pequeos.
En cualquier caso, sta es una hiptesis poco crtica, ya que lo que realmente se supone es
que las medias se distribuyen segn una normal, lo cual en general podr considerarse
cierto por el teorema central del lmite. Por otra parte, se conoce que las pruebas que
utilizan como distribucin de referencia la t-Student son robustas frente a la hiptesis de
normalidad.
89

( )
t
1
2514 23 62
1 24
1
10
1
10
2 74 =

+
=
, ,
,
,
Independencia de las poblaciones. Es una hiptesis que suponemos al decir que:
El origen de los datos pone de manifiesto si las poblaciones pueden considerarse independien-
tes o no.
Aleatoriedad de las muestras. sta es una hiptesis absolutamente crtica. El objetivo es extraer
conclusiones sobre las poblaciones a partir del anlisis de las muestras y, por lo tanto, stas
debern ser representativas. La aleatoriedad garantiza la representatividad. La obtencin de
muestras verdaderamente aleatorias debe ser el objetivo del diseo de la recogida de datos. Una
correcta aleatorizacin contribuye a asegurar el cumplimiento de esta hiptesis.
Igualdad de varianzas poblacionales. Si se trabaja con esta hiptesis es necesario comprobar
que nada se opone a su cumplimiento. Para ello se puede aplicar el test de igualdad de varianzas
tal como se ha presentado en el captulo 4.
Un adecuado anlisis exploratorio de los datos tambin ayuda a constatar el cumplimiento de
las hiptesis anteriores, adems de identificar posibles valores anmalos o extraer unas primeras
conclusiones, tal como se ha visto en el ejemplo anterior.
A continuacin, los clculos a desarrollar son los siguientes:
1. Calcular el estimador de la varianza poblacional nica (media de las varianzas muestrales
ponderada segn los grados de libertad de cada muestra).
2. Calcular el valor de t
0
, el cual pertenecer a una distribucin t de Student con n
A
+n
B
-2 grados
de libertad, si las medias poblacionales son iguales.
3. Comparar el valor de t
0
con su distribucin de referencia. Si la hiptesis alternativa es del tipo
H
1
:
A
>
B
, como en el caso que se ha planteado, se determina la probabilidad de que se
presente un valor como el obtenido o mayor, y a esta probabilidad se le denomina nivel de
significacin.
En el apartado 5.6 se explica cmo calcular el
nivel de significacin segn sea la hiptesis
alternativa planteada.
El nivel de significacin obtenido es una
informacin que ayuda a tomar la decisin ms
adecuada. En general, un nivel de significacin
pequeo aconseja rechazar la hiptesis de igual-
dad de medias, aunque para tomar la decisin
habr que considerar tambin otro tipo de infor-
macin: costes, riesgos que se corren en caso de
equivocarse, etc.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
90

( ) V y y
n n
A B
A
A
B
B
= +

2 2
( ) ( )
s
n s n s
n n
A A B B
A B
=
+
+
1 1
2
2 2
t
y y
s
n n
A B
A B
0
1 1
=

+
Fig. 5.3 Comparacin del estadstico de prueba en su distri-
bucin de referencia
COMPARACIN DE DOS TRATAMIENTOS
5.3 Caso 2: comparacin de dos tratamientos superficiales para lentes
5.3.1 Planteamiento. Recogida de los datos
Cierta industria fabricante de lentes para gafas desea comparar dos tipos de recubrimiento
antirreflectante. Los dos tipos tienen idntico aspecto y prestaciones, pero antes de decidirse por uno
u otro desean comprobar si el tipo de recubrimiento influye en el deterioro que sufre la lente.
En un principio, piensan seleccionar al azar 20 personas que utilicen gafas, y asignar aleatoria-
mente gafas sometidas al tratamiento A a 10 de ellas y gafas con el tratamiento B a las otras 10. Al
cabo de 6 meses se realizara un control y, tras tomar medidas con el instrumento adecuado, se
analizara si existan o no diferencias estadsticamente significativas.
Pero el mtodo planteado tiene un inconveniente. En el desgaste que sufre la lente no slo
influye el recubrimiento superficial, sino tambin el trato que recibe por parte del usuario. Si la
recogida de los datos se lleva a cabo de la forma antes planteada, se corre el riesgo de que, si algunas
personas, por sus hbitos o profesin, deteriorasen las lentes ms de lo normal (o menos) y no se
repartiesen equitativamente entre los dos tratamientos, atribuyamos a algn tratamiento un efecto que
no le correspondiera, ya que en realidad lo pro-
vocaran las personas.
Es posible eliminar el efecto de las
personas en el desgaste de las lentes? S puede
hacerse. La mejor forma ser construyendo las
gafas con una lente de cada tipo. Si alguien las
desgasta mucho lo har con ambos trata-
mientos, igual que si las desgasta poco. Natu-
ralmente, el mtodo de anlisis de los datos
deber tener en cuenta la forma en que se han
recogido.
Supongamos que la prueba se ha reali-
zado de esta forma (con 10 individuos) y que al
cabo de 6 meses se mide el desgaste, y se
obtienen los valores que se indican en la tabla
5.1 (en unidades codificadas).
5.3.2 Anlisis exploratorio
Cuando los datos se han recogido de esta
forma, una representacin grfica muy
adecuada es la que se indica en la figura
5.4. Adems, por supuesto, se pueden
realizar los grficos que en cada caso se
consideren oportunos.
91

Tabla 5.1 Resultados del estudio realizado para comparar el


desgaste de dos tipos de lentes. La letra entre parntesis indica
la posicin (izquierda o derecha) a que se ha asignado aleato-
riamente cada lente
INDIVIDUO
DESGASTE
LENTE A
DESGASTE
LENTE B
DIFERENCIA
B-A
1
2
3
4
5
6
7
8
9
10
Media
6.7 (I)
5.0 (I)
3.6 (D)
6.2 (I)
5.9 (D)
4.0 (D)
5.2 (D)
4.5 (I)
4.4 (D)
4.1 (I)
4.96
6.9 (D)
5.8 (D)
4.1 (I)
7.0 (D)
7.0 (I)
4.6 (I)
5.5 (I)
5.0 (D)
4.3 (I)
4.8 (D)
5.50
0.2
0.8
0.5
0.8
1.1
0.6
0.3
0.5
-0.1
0.7
0.55
A
B
7.5
7.0
6.5
6.0
5.5
5.0
4.5
4.0
3.5
3.0
10 9 8 7 6 5 4 3 2 1


Respuesta
Individuo
Fig. 5.4 Representacin grfica de los resultados
obtenidos en el estudio de comparacin del desgaste
de dos tipos de lentes
5.3.3 Resolucin
El anlisis de los datos no se realiza como en el caso anterior (ahora no se cumplira la hiptesis de
poblaciones independientes), sino que se analizan las diferencias que se observan dentro de cada
individuo entre un tratamiento y otro.
Seguiremos suponiendo que los resultados de ambos tratamientos pertenecen a sendas
poblaciones normales, es decir:
y
A
N(
A
,
A
)
y
B
N(
B
,
B
)
y por tanto:
y
B-A
N(
B
-
A
,
d
)
donde
d
es la desviacin tipo de las diferencias. Si las medias poblacionales son iguales, y
B-A
se
distribuir segn una normal de media cero y una desviacin tipo que puede estimarse mediante la
desviacin tipo de las diferencias.
Obtenindose con nuestros datos, s
d
= 0,344 y la media de las diferencias se distribuir de la
forma:
En nuestro caso tenemos que = 0,54. Podemos considerar que pertenece a la distribucin
anterior? Si as fuera tendramos que:
O, al trabajar con un valor estimado de
d
:
En nuestro caso tenemos que:
y ste es un valor muy poco probable en su distribucin de referencia (nivel de significacin de
0,0008). Por tanto, podemos afirmar con una probabilidad de error de 0,0008 que el recubrimiento B
se deteriora ms fcilmente que el A (figura 5.5).
d
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
92

( )
s
d d
n
d
i
=

2
1
d N
n
d
0,

( )
d
n
N
d

0 1 ,
d
s
n
t n g l
d
Student con 1 . .
d
s
n
d
= 4 97 ,
COMPARACIN DE DOS TRATAMIENTOS
5.4 Generalizacin del caso de la comparacin de dos tratamientos superficiales de
lentes: comparacin de medias en diseos en bloques aleatorizados
En muchos casos existe algn factor que influye sobre la respuesta y no puede asegurarse que afecte
exactamente igual a los dos tratamientos. En el caso anterior se trataba del efecto del individuo en el
desgaste de sus lentes, y las diferencias se calculaban para cada individuo, es decir, dentro de bloques
homogneos.
En muchas otras circunstancias conviene disear la recogida de datos de esta forma. Tiempo,
mquina o materia prima, pueden afectar a la respuesta y requerir que se formen bloques para analizar
los datos dentro de los mismos. Dentro de cada bloque, el orden de recogida de los datos se aleatoriza,
por eso se llaman diseos en bloques aleatorizados.
Ejemplo 5.1 Se desea comparar el valor obtenido con un aparato electrnico para la medida de
la tensin arterial con un instrumento clsico de columna de mercurio. Cmo
deberan tomarse los datos?
Naturalmente, no sera un buen procedimiento elegir dos grupos de personas,
tomar la tensin con el aparato electrnico a un grupo, con el clsico al otro y
comparar. En la respuesta, adems del aparato influye la persona y, por tanto, lo
correcto ser tomar la tensin a cada uno con los dos instrumentos y analizar las
diferencias por persona.
Ejemplo 5.2 Se desea comparar la cantidad de producto fabricado utilizando dos procedi-
mientos de montaje distintos. Una unidad de medida que se considera correcta es
la produccin obtenida durante 4 horas. Se sabe que no hay variaciones de
productividad a lo largo del da, pero s puede haberlas de un da a otro. Cmo
tomar los datos?
Podran tomarse dos datos cada da, uno con cada procedimiento, correspon-
dientes a la produccin obtenida durante 4 horas seguidas (aleatorizando cada da
qu procedimiento se haca primero). De esta forma, la diferencia de produccin
de un da a otro no afectara a las conclusiones obtenidas.
Cuando los datos se han recogido de esta forma, y considerando que el efecto bloque afecta por
igual a los dos tratamientos (efecto aditivo), su mtodo de anlisis requiere el cumplimiento de las
siguientes hiptesis:
Normalidad de las dos poblaciones. En realidad lo que se supone es la normalidad de y
B
-y
A
,
aunque, como en el caso de los diseos totalmente aleatorizados, sta es una hiptesis poco
crtica, ya que siempre se podr suponer que la diferencia media sigue una distribucin normal.
93

Fig. 5.5 Comparacin del valor obtenido con su distribucin de referencia


Independencia de las diferencias. O lo que es lo mismo, las diferencias son una muestra
aleatoria simple de la poblacin de diferencias. Si se ha aleatorizado correctamente y la
recogida de datos se ha llevado a cabo con la meticulosidad requerida, en general se podr
suponer el cumplimiento de esta hiptesis.
El obligado anlisis exploratorio de los datos servir tambin para poner de manifiesto que no existen
pruebas de incumplimiento de la hiptesis anterior. Adems del grfico del tipo que se visto en la
figura 5.4, puede realizarse, por ejemplo, un grfico de las diferencias en funcin del orden de
obtencin de los datos. En el caso de las lentes, tendr el aspecto que se indica en la figura 5.6, que
pone de manifiesto un patrn de comportamiento aleatorio en torno a su valor medio, tal como era de
esperar.
Una vez se tienen los datos, los clculos que se
deben desarrollar son los siguientes:
1. Calcular las diferencias dentro de cada bloque, y
tambin la media ( ) y la desviacin tipo (s
d
) de
dichas diferencias.
2. Calcular el valor del estadstico de prueba.
3. Comparar el valor del estadstico de prueba con su
distribucin de referencia, que ser una t de Student
con n-1 grados de libertad. Determinar la probabilidad
de que en dicha distribucin se presente un valor igual
que el obtenido o superior. Esta probabilidad ser el
nivel de significacin de la prueba.
Si el nivel de significacin es bajo se rechazar la hiptesis de igualdad de medias y diremos
que la diferencia observada entre un tratamiento y otro es estadsticamente significativa.
5.5 Aleatorizacin y bloqueo: recapitulacin
En una prueba para la comparacin de dos tratamientos, puede considerarse que en los datos obtenidos
influyen cuatro tipos de factores:
i) El factor cuyo efecto se desea estudiar (el tipo de recubrimiento superficial en el caso que
hemos visto anteriormente).
ii) Factores identificados que pueden influir en la respuesta, pero que es posible mantener
constantes para los dos tratamientos (como podra ser el tipo de montura, que quiz influya en
el desgaste de lente, pero cuyo efecto se podra neutralizar utilizando siempre monturas del
mismo tipo).
iii) Factores identificados que pueden influir en la respuesta y que resulta imposible mantener
constantes para los dos tratamientos (como el trato que se da a las gafas y el desgaste que
sufren).
iv) Otros factores, no identificados, que tambin pueden tener influencia en los resultados
obtenidos (quiz el orden en que se efectan las mediciones por la existencia de pequeas
derivas en el aparato de medida, tal como se ha comentado anteriormente).
d
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
94

1.2
0.8
0.4
0.0
-0.4
-0.8
-1.2
10 9 8 7 6 5 4 3 2 1

B-A
Diferencia
Individuo
Fig. 5.6 Diagrama que representa la diferencia de des-
gaste para cada individuo
t
d
s
n
d
=
COMPARACIN DE DOS TRATAMIENTOS
Obviamente, el factor estudiado debe afectar de forma distinta a cada tratamiento (en el caso de
afectar igual sera imposible detectar su posible efecto).
Qu hacer con los factores identificados del tipo ii? No nos interesar que afecten de forma
distinta a cada tratamiento, por tanto, debern mantenerse exactamente igual tanto en un tratamiento
como en el otro.
Pero, y si no es posible mantenerlos constantes? (caso de los factores tipo iii). En este caso ser
necesario bloquear, es decir, analizar las diferencias dentro de bloques homogneos en los que estos
factores afecten por igual.
En general, a medida que transcurre el tiempo, y cuanto mayor es el perodo en el que se
procede a la recogida de los datos, mayor es la probabilidad de que aparezcan variabilidades no
deseadas (los lunes se trabaja de forma distinta a los viernes, la humedad o la temperatura varan con
el tiempo, etc.). En estos casos, suele ser una buena idea utilizar perodos de tiempo como bloques. As,
en el caso de que se comparen dos mtodos de trabajo a partir de un dato por turno, pero se sospeche
que el turno de la maana puede dar un nivel de respuesta distinto del de la tarde, la mejor forma de
disear la recogida de datos sera la que se indica en la figura 5.7.
Dentro de cada da (bloque) conviene aleatorizar para protegernos de la influencia de posibles
factores del tipo iv (factores no identificados). Si stos existen, al aleatorizar cabe esperar que su efecto
se difumine entre los dos tratamientos y no altere las conclusiones del anlisis.
La consigna en el diseo de la recogida de datos podra ser Bloquear lo que se pueda y
aleatorizar el resto. Bloquear neutraliza la influencia de fuentes de variacin conocidas, pero no
deseadas. Aleatorizar protege del efecto de posibles factores con cierta influencia, pero no
identificados.
Volvamos, para terminar este apartado, al caso del curtido de pieles. Si se aprecia que las
porciones de cuero no son idnticas (lo cual es bastante posible) un diseo mejor que el propuesto
consistira en tomar slo 10 retales, dividirlos por la mitad, aplicar a un trozo el tratamiento A y al
otro el B. Aleatoriamente, por supuesto.
5.6 Contraste de hiptesis. Formalizacin y limitaciones
El procedimiento seguido en el anlisis de los datos para la comparacin de medias puede resumirse
en las siguientes etapas:
1. Formular las hiptesis nula (H
0
) y alternativa (H
1
).
2. A partir de los datos disponibles se calcula un valor relevante (estadstico de prueba) mediante
una determinada expresin. Si no existe diferencia de medias, el valor obtenido pertenece a una
determinada distribucin de probabilidad denominada distribucin de referencia.
3. Se compara el estadstico de prueba con su distribucin de referencia, determinando la
probabilidad (nivel de significacin) de que un valor como el observado (o mayor) sea debido
al azar en el caso de que la hiptesis nula sea cierta.
95

Fig 5.7 Diseo bloqueado por das debido a la diferencia entre turnos
4. Si el nivel de significacin es pequeo se rechaza la hiptesis de igualdad de medias y se dice
que la diferencia obtenida es estadsticamente significativa.
Este esquema de razonamiento, muy usado en estadstica, recibe el nombre de contraste de
hiptesis, ya que lo que hace es suponer que se cumple una determinada hiptesis (H
0
) y contrastar si
los datos de que se dispone son o no coherentes con sta.
Normalmente, la hiptesis nula es del tipo de las que se han planteado en los caso anteriores, es
decir:
H
0
:
A
=
B
La hiptesis alternativa puede ser de la forma:
Los dos primeros planteamientos son, en esencia, el mismo (si no son iguales, una media es
mayor que la otra), pero el tercero refleja una mayor desinformacin sobre el fenmeno que se estudia,
lo cual se traduce en una distinta medida del nivel de significacin.
La tabla 5.2 indica el enfoque que se da al anlisis de los datos en funcin del resultado obtenido
y de cul sea la hiptesis alternativa planteada.
Ntese que si la hiptesis alternativa es del tipo
A

B
se esperan diferencias de medias tanto
positivas como negativas. De hecho, en este caso, dada una diferencia, se considera igualmente
probable la diferencia en sentido contrario y, por tanto, el nivel de significacin (rea de cola) se
multiplica por 2 en este caso.
Tabla 5.2 Acciones a emprender en funcin del planteamiento del contraste y del resultado obtenido
El tipo de hiptesis alternativa que se plantea depende del conocimiento que se tiene del
fenmeno en estudio. En una prueba para estudiar la eficacia de un cierto abono, puede saberse (por
razonamientos biolgicos) que el fertilizante puede aumentar la cosecha o no tener ningn efecto, pero
no es posible que la reduzca (en este caso H
1
sera del tipo
A
>
B
). Tambin puede plantearse en
funcin del enfoque que se d al problema. Si tenemos un proveedor habitual (A), del que estamos
bsicamente satisfechos, y se plantea la posibilidad de cambiar a otro (B), que podra ser mejor, la
hiptesis alternativa debera ser del tipo
A
<
B
.
Puede plantear una cierta perplejidad la circunstancia de que el nivel de significacin sea uno o
justamente el doble en funcin de cul sea la hiptesis alternativa que se plantee (decisin no exenta,

MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD


96

H H H
A B A B A B 1 1 1
: : : > < o o
PLANTEAMIENTO DEL CONTRASTE
RESULTADO
OBTENIDO
H0: A=B
H1: A<B
H0: A=B
H1: A>B
H0: A=B
H1: AUB
Resultado esperado. Se tratar
de analizar, mediante el proce-
dimiento adecuado, si la dife-
rencia obtenida es estadstica-
mente significativa o no.
No hace falta que realicemos
ningn clculo. Con el
resultado obtenido es obvio
que no podemos rechazar H0
para quedarnos con H1.
No hace falta que realicemos
ningn clculo. Con el resul-
tado obtenido es obvio que no
podemos rechazar H0 para
quedarnos con H1.
Resultado esperado. Se tratar
de analizar, mediante el proce-
dimiento adecuado, si la dife-
rencia obtenida es estadstica-
mente significativa o no.
En este caso, que prcticamente no se dar (sera una casualidad), obviamente no podr rechazarse la
hiptesis nula, sea cual sea la alternativa.
y y
A B
<
y y
A B
>
y y
A B
=
Es necesario analizar si la
diferencia obtenida es estads-
ticamente significativa.
COMPARACIN DE DOS TRATAMIENTOS
en algunos casos, de cierta arbitrariedad). Esta
forma de proceder puede justificarse con el
argumento de que, si slo se sabe que las
medias son iguales o son distintas, se conoce
menos sobre el proceso que si se est seguro de
que, si no son iguales, una en concreto es
mayor que la otra. La menor informacin que
se tiene en el primer caso se traduce en una
mayor probabilidad de error al rechazar H
0
para
un resultado dado.
5.7 Un anlisis alternativo: intervalos de confianza para la diferencia de medias
La comparacin de medias tambin se puede abordar aplicando el concepto de intervalo de confianza.
Un intervalo de confianza 1- para la media de la poblacin se obtiene mediante una expresin del
tipo:
Estimando
2
a partir de la varianza muestral, obtenemos:
En general, estos intervalos responden a la expresin:
estadstico t
/2,
. desviacin tipo del estadstico
Por tanto, a partir de los datos de un diseo totalmente aleatorizado, puede plantearse el
siguiente intervalo de confianza para la diferencia de medias poblacionales
A
-
B
:
donde s es el estimador conjunto de la varianza poblacional.
Si el diseo es bloqueado, la expresin obtenida es:
Ejemplo 5.3 Calcular un intervalo de confianza del 95 % para la diferencia de medias poblacio-
nales tomando el planteamiento y los datos del caso 1.
Tenemos que: y
A
= 25.14
y
B
= 23.62
t
0.025,18
= 2.101
s = 1.24
n
A
= 10
n
B
= 10
Luego el intervalo es: 1.52 1.17
97

Fig. 5.8 Nivel de significacin cuando la hiptesis alternativa


es del tipo
A B

y z
n

2
y t
s
n

2 ,
y y t s
n n
A B
A B
+

2
1 1
,
d t
s
n
d

2
,
Ejemplo 5.4 Igual al ejemplo 5.3 pero a partir del caso 2.
En este caso:
d = 0.55
t
0.025.9
= 2.262
s
d
= 0.344
n = 10
Y se obtiene:
0.55 0.25
Si el cero est incluido en el intervalo 1-, cabe considerar que ste no es un valor extrao para
la diferencia de medias y, por tanto, no se podr rechazar la hiptesis nula de igualdad de las medias
poblacionales con un nivel de significacin de .
Ejercicio Si en un contraste de hiptesis del tipo:
H
0
:
A
=
B
H
1
:
A

B
se obtiene un nivel de significacin exactamente igual a 0.05, qu peculiaridad
tendr uno de los extremos del intervalo de confianza del 95% para
A
-
B
?

MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD


98

COMPARACIN DE DOS TRATAMIENTOS


Ejercicios
5.1. Se desea saber si un determinado plan de seguridad en el trabajo es efectivo en la reduccin del
nmero de accidentes laborales y, por tanto, en la prdida de horas de trabajo debido a
accidentes. Los siguientes datos son las horas de trabajo semanales perdidas a causa de
accidentes en seis fbricas, antes y despus de implantar el nuevo plan de seguridad.
a) Especificar las hiptesis necesarias.
b) Se puede decir con estos datos que el plan de seguridad es efectivo?
5.2. Una fbrica de automviles dispone de dos proveedores (A y B) de llantas de aluminio.
Se tiene la sospecha de que existen diferencias en cierta caracterstica mecnica (X) de las
llantas, segn sea el proveedor que las suministra.
Para analizar el tema se toman muestras aleatorias de cada uno de los proveedores,
obtenindose los valores que se indican en la tabla adjunta.
a) Puede decirse que existen diferencias en las llantas segn el
proveedor que las suministre?
b) Calcular los tamaos de muestra (iguales para ambos
proveedores) para que un intervalo de confianza del 95% de

B
-
A
pueda expresarse de la forma:
x
B
-x
A
0,3
5.3. Unos grandes almacenes desean cubrir un puesto de vendedor, para lo cual contratan
temporalmente durante tres meses a dos candidatos.
Los datos obtenidos despus de estos tres meses son:
N de das trabajados: A= 66 das
B= 60 das (6 das de baja por enfermedad)
S(A)= 3.000 pts
S(B)= 3.100 pts
Se admite que los puestos de trabajo a que han sido asignados tienen idnticas posibilidades de
venta.
Despus del perodo de prueba el candidato A ha vendido producto por un valor medio de
56.000 pts/da, y el candidato B por valor de 53.000 pts/da.
Justifica esta diferencia la afirmacin de que A vende ms que B?
5.4. Una empresa suministra tubos de escape a la industria del automvil. En el tubo de
escape se coloca un sensor que comunica al ordenador del coche el contenido de CO en
los gases de escape. La empresa dispone de dos tipos de sensores, A y B, basados en
principios de medicin diferentes. Tanto uno como otro se colocan en el silencioso del
tubo de escape.
El departamento I+D de la empresa sospecha que pueden haber diferencias entre las
mediciones efectuadas por los dos tipos de sensor y decide realizar un experimento.
99

PLANTA
1 2 3 4 5 6
ANTES 12 29 16 37 28 15
DESPUS 10 28 17 35 25 16
PROVEEDOR A PROVEEDOR B
n
x
s
A
A
A
=
=
=
100
543
120
.
.
n
x
s
B
B
B
=
=
=
94
575
112
.
.
La primera idea consiste en seleccionar 10 sensores del tipo A y otros 10 del tipo B, y colocarlos
en los tubos de escape de 20 coches distintos. No obstante, un ingeniero de la empresa sugiere
que el experimento debera bloquearse para evitar que la variabilidad entre coches distintos
enmascarase los resultados del experimento. Para ello sugiere que se utilicen 10 coches y que
en cada uno de ellos se monte un sensor A y otro B, ambos colocados en el silencioso y en dos
posiciones cercanas entre s.
El contenido en partes por milln de CO observado en el experimento fue el que se indica en la
siguiente tabla.
a) Describa brevemente el mecanismo de aleatorizacin del
experimento.
b) Cul sera la distribucin de referencia para comparar los
valores medios de los dos tipos de sensores, si el experimento se
hubiera llevado a cabo con los 20 coches?
c) Qu decisin se tomara con la distribucin de referencia
anterior?
d) Dado que el experimento se ha realizado segn el diseo del
propuesto por el ingeniero, es decir con 10 coches, es preferible
utilizar 10 coches del mismo modelo, o 10 coches de modelos y
cilindradas diferentes?
5.5. Una fbrica de jabones produce detergente en dos plantas gemelas, una en Getafe y otra en
Granollers. En Granollers utilizan materia prima del proveedor A y en Getafe materia prima del
proveedor B. Se desea comparar la influencia de los dos proveedores en la produccin, para lo
cual se recopilan cantidades producidas en las dos plantas durante 25 das, con los siguientes
resultados:
a) Basndose en este estudio, qu pro-
veedor es preferible?
b) Comentar el diseo del experimento y
los resultados obtenidos.
5.6. Se desea comparar dos programas de entrenamiento de trabajadores en una lnea de produccin.
Se escogen 10 al azar para ser entrenados por el mtodo A y 10 para ser entrenados por el
mtodo B. Finalizados los programas de entrenamiento, se mide el tiempo que tardan en realizar
una de las operaciones en la cadena, y se obtenienen los siguientes resultados:
a) Es mejor uno de los mtodos que el otro?
b) Qu suposiciones han sido necesarias?
c) Qu papel desempea la aleatorizacin a la hora de escoger a los trabajadores?
d) Qu otros factores pueden tener importancia en el tiempo empleado por cada trabajador? Es
posible protegerse de los mismos?
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
100

NM. TIPO A TIPO B


1
2
3
4
5
6
7
8
9
10
72.1
68.2
70.9
74.3
70.7
66.6
69.5
70.8
68.8
73.3
74.0
68.8
71.2
74.2
71.8
66.4
69.8
71.3
69.3
73.6
PROVEEDOR A PROVEEDOR B
DAS 25 25
PRODUCCIN MEDIA 130.0 Tm 127.2 Tm
DESVIACIN TIPO 4.5 Tm 3.1 Tm
TIEMPO (minutos)
MTODO A 15 20 11 23 16 21 18 16 27 24
MTODO B 23 31 13 19 23 17 28 26 25 28
COMPARACIN DE DOS TRATAMIENTOS
5.7. Una fbrica dedicada a la fabricacin de losetas para el recubrimiento de
naves espaciales recibe el encargo de una empresa muy importante
dedicada a la aeronutica.
Dicha fbrica produce dos tipos de losetas, A y B. Para saber qu tipo de
losetas preferir la empresa se hace una prueba con 18 losetas (9 del tipo
A y 9 del tipo B), introducindolas en hornos a 10.000C y anotando el
tiempo transcurrido hasta su rotura. Los resultados, en horas, son los
indicados en la tabla adjunta.
a) Qu losetas preferir la empresa?
b) Cmo se podra haber mejorado la precisin del experimento? Por qu?
101

A B
54.6
45.8
57.4
40.1
56.3
51.5
50.7
64.5
52.6
58.9
65.7
55.6
57.6
64.2
60.8
59.8
59.0
50.3
Apndice 5A Test de comparacin de medias cuando no puede asumirse la igualdad
de varianzas poblacionales
Una de las hiptesis que hacamos al aplicar la tcnica de comparacin de medias en diseos
totalmente aleatorizados era suponer la igualdad de varianzas poblacionales. Si no puede asumirse esta
hiptesis, puede obtenerse una buena aproximacin al nivel de significacin resultante calculando el
estadstico:
Si n
A
= n
B
= n, el nivel de significacin se determina
utilizando como distribucin de referencia una t de
Student con n-1 grados de libertad (figura 5A.1).
Si n
A
n
B
, con el valor calculado de t se
hallan los niveles de significacin p
A
y p
B
en
distribuciones t de Student con n
A
-1 y n
B
-1 grados
de libertad (figura 5A.2).
Siendo en este caso el nivel de significacin de la prueba:
con:
Ejercicio: Qu hacer si en un diseo en bloques aleatorizados no puede suponerse la
hiptesis de igualdad de varianzas poblacionales? (Ayuda: Repase cules son las
hiptesis que se realizan en este caso.)

MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD


102

( )
t
y y
s
n
s
n
B A
A
A
B
B
' =

+
2 2
Fig. 5A.1 Nivel de significacin en el caso de muestras
del mismo tamao
p
p p
A A B B
A B
=
+
+

A
A
A
s
n
=
2

B
B
B
s
n
=
2
Fig. 5A.2 Valores previos al clculo del nivel de significacin en el caso de tamaos de muestra
diferentes
COMPARACIN DE DOS TRATAMIENTOS
Apndice 5B Prubelo Ud. mismo. Comparacin de dos tipos de helicptero.
Vamos a utilizar de nuevo helicpteros del tipo que hemos presentado en el apartado 3.12.
En primer lugar hay que construirlos. Para ello deber tomar una hoja DIN A-4 y cortarla
longitudinalmente por la mitad. Uno de los trozos obtenidos deber recortarlo y doblarlo tal como se
indica en la figura 5B.1.
Si lo deja caer desde una cierta altura (3 metros, por ejemplo), observar que primero hace un
recorrido de aproximadamente 0,5 metros de forma desordenada (rgimen turbulento), hasta que se le
despliegan las alas y empieza a caer de forma lenta y suave (rgimen laminar).
Ejercicio: Consiga un cronmetro y deje caer varias veces (10, por ejemplo) el helicptero
desde la misma altura y en idnticas condiciones. Anote cada vez el tiempo que
ha tardado en caer. Represente grficamente los datos obtenidos (histograma,
serie temporal, etc.). Por qu realizando la prueba siempre en idnticas
condiciones, el resultado obtenido no es siempre el mismo?
Vamos a intentar mejorar el diseo para aumentar el tiempo que
tarda en caer. Probaremos recortando las puntas de las alas tal como se
indica en la figura 5B.2.
Qu hacer para comprobar si el nuevo diseo es mejor que el
anterior? Desde luego no sera una prueba fiable que dejramos caer un
helicptero de cada tipo y comparramos los dos resultados obtenidos
(por qu?). Lo correcto sera construir varios helicpteros con el primer
diseo y otros tantos con el segundo, dejarlos caer tomado datos y
compararlos (test de la t de Student para datos totalmente aletorizados).
Ejercicio: Por qu no se utiliza un solo helicptero de cada
tipo dejndolo caer tantas veces como se desee?
Qu tipo de error se puede cometer si la prueba
se realiza de esta forma?
103

Fig. 5B.1 Esquema de construccin del helicptero (cotas en cm)


Fig. 5B.2 Esquema de construc-
cin del helicptero mejorado
La prueba que hemos propuesto tiene un inconveniente: todos los helicpteros deben ser
construidos con el mismo tipo de papel y esto implica que, si el nuevo diseo es mejor, lo ser con ese
tipo de papel, pero nada puede asegurarse para helicpteros construidos con papel de caractersticas
distintas al usado en la prueba.
Dado que este tipo de construccin puede realizarse con una cierta gama de papel de uso
habitual (ms o menos pesado, ms o menos rgido, etc.), en rigor no podemos asegurar que un diseo
sea mejor que otro sin hacer referencia al tipo de papel que se ha utilizado.
Ejercicio: Cmo realizar la comparacin considerando que los helicpteros pueden
construirse con distintos tipos de papel? (Ayuda: Recuerde que con cada hoja se
pueden construir dos helicpteros. Quiz convendra tomar un conjunto de hojas
representativas de las usadas habitualmente para estos menesteres y...)
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
104

Como ya se ha visto en el captulo anterior, para la comparacin de dos medias se utiliza, en la mayora
de los casos, un estadstico que tiene como distribucin de referencia la t de Student. Este estadstico
se calcula de una forma u otra segn se trate de muestras independientes o de datos apareados.
Normalmente, el test que se realiza en ambos casos se denomina test de la t de Student, en relacin
con la distribucin de referencia utilizada.
Cuando se trata de comparar ms de dos medias, la tcnica que se utiliza recibe el nombre de
anlisis de la varianza. El lector se preguntar por qu anlisis de la varianza, cuando el objetivo
es comparar medias. Un sencillo ejemplo nos servir para aclarar la razn de esta denominacin.
Supongamos que se desea analizar si la diferencia entre las medias de tres muestras es
estadsticamente significativa o no. Consideremos dos situaciones distintas, representadas por los
diagramas de puntos de la figura 6.1.
A la vista del grfico resulta sencillo sacar la conclusin de que en el caso a) s puede hablarse
de diferencias significativas, mientras que en el caso b) no. Pero, por qu? Las diferencias de medias
son exactamente iguales tanto en un caso
como en otro, entonces, por qu en un
caso se ha considerado que la diferencia
es significativa y en el otro no?
La razn es, simplemente, que se
ha analizado si las diferencias (varia-
bilidad) entre las medias es mayor de la
que cabra esperar a partir de la varia-
bilidad dentro de cada muestra. Y se ha
llegado a la conclusin, con toda la razn,
de que en el caso a) esas diferencias s son
mayores de lo que cabra esperar, pero en
el caso b) no.
En definitiva, lo que se ha hecho
es un anlisis de la variabilidad, o
anlisis de la varianza, para decidir si las
diferencias de medias son o no estads-
ticamente significativas.
6
Comparacin de ms de dos tratamientos:
anlisis de la varianza
105
Fig. 6.1 Son significativas las diferencias de las medias muestrales?
6.1 Mtodo grfico de comparacin de medias para poblaciones independientes
6.1.1 Ideas bsicas para la aplicacin del mtodo
Vamos a desarrollar en este apartado una sencilla metodologa grfica, que nos permitir discernir si
un conjunto de medias pueden considerarse iguales o distintas. Lo haremos de una forma ms objetiva
que la usada anteriormente, basada en la simple contemplacin de los correspondientes diagramas de
puntos, aunque no conviene desestimar este mtodo, que en muchas ocasiones puede ser suficiente y
en otras puede utilizarse como complementario.
Empezaremos planteando un sencillo ejercicio: Puede considerarse que
los valores: 15, 17, 16, 21 y 14, pertenecen a una distribucin normal con = 1?
Una forma de resolver este problema es representando a escala una
distribucin normal con = 1, junto con los valores dados, para ver si se puede
considerar que pertenecen a esta distribucin o no.
El clculo de las ordenadas de la distribucin normal puede hacerse a partir
de la frmula de su funcin densidad de probabilidad
1
, y como no hay ninguna
limitacin en cuanto a la media, consideramos = 0 y obtenemos la tabla de la
derecha cuya representacin ser la de la figura 6.2.
Dado que el parmetro (media) en una
ley normal es un parmetro de localizacin, pasar
de una ley normal de = 0 a cualquier otro valor
de se consigue mediante una simple traslacin
del eje de simetra de la campana al valor de .
En la figura 6.3 hemos centrado la campa-
na sobre el valor 16, pero lo podramos haber
hecho sobre cualquier otro.
Lo que se trata de ver es si todos los
valores dados caben debajo de la campana, para
alguna posicin de la misma.
En nuestro caso, est claro que no caben
todos los valores; el 21 se queda fuera, y si
centramos la campana en el 21, se quedan fuera
todos los dems. Luego, en este caso se
puede considerar que todos los valores
dados pertenecen a una normal con = 1,
excepto el 21.
Si en vez de comparar nuestros datos
con una normal de = 1, lo hiciramos con
una de = 3, deberamos construir una
campana distinta?
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
106

x f(x)
0
0.5
1
1.5
2
2.5
3
0.399
0.352
0.242
0.130
0.054
0.018
0.004
Fig. 6.2 Representacin a escala de una distribucin
normal con = 0, = 1
Fig. 6.3 Representacin de valores junto a una N(0,1)
( ) f x e
x
=
1
2
2
2

1
Con = 1 y = 0, se tiene:
0.30
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
No necesariamente. Para una distribucin normal con = 3 podemos mantener la escala de
abcisas del grfico anterior y variar la forma de la campana, o mantener la forma de la campana y variar
la escala de abcisas. La distribucin de probabilidad representada en la figura 6.4, con la misma forma
que la anterior pero con distinta escala en el eje de abcisas, corresponde a una normal con = 3.
Y si en esta escala representamos nuestros valores, tendremos:
Luego s puede considerarse que pertenecen todos a una normal con = 3.
Obsrvese, por tanto, que cuando se desea realizar este tipo de estudio comparando un
conjunto de datos con la distribucin normal, no es necesario dibujar una campana distinta para
cada caso, sino que bastar con una sola variando la escala de abcisas, multiplicndola por un
cierto factor de escala, que ser igual a la desviacin tipo de la distribucin que se desee
representar.
Pero cuando se quiere resolver este tipo de problema y no se conoce la desviacin tipo de
la poblacin, sino que se tiene una estimacin de la misma, no puede utilizarse la normal como
distribucin de referencia, sino una t de Student con los grados de libertad que correspondan
segn sea el tamao de la muestra utilizada para estimar .
Con los datos de nuestro ejemplo, si la desviacin tipo de la poblacin se ha estimado a
partir de una muestra de tamao n = 5, y se ha obtenido s = 3, la distribucin de referencia ser una
t de Student con = 4 grados de libertad y con un factor de escala igual a 3.
Como la forma de la t de Student no es siempre la misma (depende del nmero de grados de
libertad), deberan calcularse las ordenadas en cada caso, pero esto no es necesario, ya que se hallan
tabuladas en tablas como la que se adjunta en el apndice 1.
Para realizar la comparacin en este caso conviene construir una pequea tabla previa, como
la siguiente:
107

Fig. 6.5 Representacin de valores junto a una N(0,3)


Fig. 6.4 Representacin de una distribucin normal con = 3
t 0 0.5 1 1.5 2 2.5 3
ORDENADA
(v=4)
0.375 0.322 0.215 0.123 0.066 0.036 0.020
t * 3 0 1.5 3 4.5 6 7.5 9
Y a continuacin se construye la t de Student
situando los valores dados en un eje horizontal con
la misma escala que la utilizada para la distribucin.
(Ver figura 6.6.)
Tambin en este caso podemos considerar
que todos los valores pertenecen a la misma
poblacin.
6.1.2 Requisitos de aplicacin
El mtodo grfico que acabamos de ver nos va a servir para realizar comparaciones de medias, pero
para que el procedimiento sea vlido, es necesario que se cumplan tres requisitos:
a. Las muestras cuyas medias se desee comparar, deben ser muestras aleatorias simples de sus
correspondientes poblaciones. De lo contrario, las muestras no pueden considerarse represen-
tativas y el mtodo carece de validez.
b. Las poblaciones de las que proceden cada una de las muestras deben ser normales, aunque este
requisito es poco crtico y ligeras desviaciones respecto a la normalidad no afectan a la validez
del mtodo.
c. Todas las poblaciones de las que proceden las muestras deben tener la misma varianza.
A travs de un anlisis exploratorio de los datos podemos cerciorarnos de que no hay pruebas
de que estos requisitos no se cumplen. En el caso del tercer requisito, los grficos de residuos (valor
observado menos media de la muestra), frente a valores previstos (media de la muestra) son de gran
utilidad.
Vemoslo en los siguientes ejemplos.
Ejemplo 6.1: Sean los datos:
Recordando que los residuos son las diferencias entre los valores observados y los previstos por
el modelo (en este caso las medias muestrales) tendremos:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
108

Fig. 6.6 Comparacin de valores con una t de Student con


4 grados de libertad
MUESTRA 1 2 3 4 5
DATOS 14.0
18.1
18.0
15.7
16.4
16.3
13.5
12.3
15.1
16.2
14.0
13.8
14.1
12.5
13.7
17.4
17.4
15.6
15.4
15.2
13.8
13.4
16.8
15.7
15.1
14.5
15.4
14.1
15.0
19.1
18.5
16.7
17.4
17.3
15.0
MEDIA 16.0 14.0 15.5 15.0 17.0
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
Y el grfico de residuos frente a valores previstos tiene el aspecto:
Luego nada nos hace pensar que la variabilidad (varianza) seas distinta entre poblaciones, y
podemos asumir el tercer requisito.
Ejemplo 6.2: Sean los datos:
En este caso los residuos son:
109

MUESTRA 1 2 3 4 5
RESIDUOS -2.0
2.1
2.0
-0.3
0.4
0.3
-2.5
-1.7
1.1
2.2
0.0
-0.2
0.1
-1.5
-1.8
1.9
1.9
0.1
-0.1
-0.3
-1.7
-1.6
1.8
0.7
0.1
-0.5
0.4
-0.9
-2.0
2.1
1.5
-0.3
0.4
0.3
-2.0
Fig. 6.7 Grfico de residuos frente a valores previstos (no se observa heterocedasticidad)
MUESTRA 1 2 3 4 5
DATOS 14.0
19.1
18.0
15.7
16.4
16.3
12.5
13.3
14.1
15.2
14.0
14.8
13.1
13.5
13.8
18.2
16.9
15.6
16.6
15.2
12.2
13.4
16.8
15.7
15.1
14.5
15.4
14.1
13.0
21.1
18.7
16.7
17.2
17.3
15.0
MEDIA 16.0 14.0 15.5 15.0 17.0
R
e
s
i
d
u
o
s
Se obtiene el siguiente grfico de residuos frente a valores previstos:
En este caso no se puede suponer que la variabilidad sea la misma para todas las poblaciones.
De hecho, se da un fenmeno que suele ocurrir con cierta frecuencia, y es que la varibilidad aumenta
al aumentar la media, dando origen a grficos como el que nosotros hemos representado, con una tpica
forma de embudo. Este fenmeno se denomina heterocedasticidad, y cuando se da, no se pueden
aplicar las tcnicas clsicas de anlisis de la varianza como las que veremos a continuacin.
6.1.3 Caso de la comparacin de procedimientos de montaje. Aplicacin del mtodo
Los datos que se presentan a continuacin corresponden a la productividad media por hora en el montaje
de un cierto mecanismo, segn que el procedimiento empleado sea el A, el B o el C. Supondremos que
la recogida de los datos se ha aleatorizado convenientemente y que nada hace suponer que exista algn
factor que no ejerza el mismo tipo de influencia
para todos los resultados obtenidos.
Puede decirse que los tres procedimientos
no dan la misma productividad?, y en este caso,
cul o cules son distintas?
El razonamiento que se hace en la reso-
lucin de este tipo de problemas es considerar que
se da la circunstancia ms conservadora (hiptesis
nula, H
0
), que en nuestro caso sera considerar que
los tres procedimientos dan la misma producti-
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
110

MUESTRA 1 2 3 4 5
RESIDUOS -2.0
3.1
2.0
-0.3
0.4
0.3
-3.5
-0.7
0.1
1.2
0.0
0.8
-0.9
-0.5
-1.7
2.7
1.4
0.1
1.1
-0.3
-3.3
-1.6
1.8
0.7
0.1
-0.5
0.4
-0.9
-4.0
4.1
1.7
-0.3
1.2
0.3
-3.0
PROCEDIMIENTO
A B C
PRODUCTIVIDAD/h. 2.6
2.5
3.1
2.6
3.2
3.1
3.5
3.4
2.6
2.5
2.7
2.7
MEDIA 2.7 3.3 2.625
DES. TIPO 0.27 0.18 0.10
Fig. 6.7 Grfico de residuos frente a valores previstos. Se observa heterocedasticidad
R
e
s
i
d
u
o
s
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
vidad, contrastando a continuacin si los datos de que se dispone son coherentes con la hiptesis
planteada o, por el contrario, no lo son, en cuyo caso es rechazada.
Que los tres procedimientos den la misma productividad significa que sus medias poblaciona-
les son iguales, es decir que podemos plantear la hiptesis nula de la forma:
H
0
:
A
=
B
=
C
La hiptesis alternativa (H
1
) es la que se considera cierta en el caso de que no se cumpliese la
hiptesis nula, que en este caso ser simplemente considerar que no todas las medias son iguales.
La metodologa que se debe seguir, si no existe evidencia de incumplimiento de los requisitos
necesarios, puede resumirse en las siguientes etapas:
a) Estimar la varianza poblacional nica
2
(recuerde que ste era uno de los requisitos) mediante
una media ponderada de las varianzas muestrales.
Cada una de las varianzas muestrales es un buen estimador de
2
, pero seguramente todas son
distintas. Entonces, con cul nos quedamos? Si las muestras son iguales en tamao utilizaremos la
media aritmtica de las varianzas muestrales y, si no lo son, haremos una media de las s
2
ponderada
segn los grados de libertad de cada muestra (nos fiamos ms de las muestras ms grandes).
La frmula general para el clculo de la estimacin de
2
, que llamaremos s
R
2
, ser:
donde:
k: Nmero de procedimientos (o, en general, tratamientos) a comparar
n
t
: Nmero de datos de que se dispone correspondientes al tratamiento t
s
t
2
: Varianza de los datos correspondientes al tratamiento t
N: Nmero total de datos en los k tratamientos
En nuestro caso, al ser iguales los tamaos de muestra, no es necesario aplicar ponderacin
alguna, sino que podemos calcular s
R
2
de la forma:
De donde:
con = 9 grados de libertad (3 de cada muestra).
b) Calcular el factor de escala de la t-Student con = 9.
Recuerde que la media de una muestra se distribuye con una desviacin tipo igual a la
desviacin tipo de la poblacin, dividida por la raz cuadrada del tamao de la muestra (teorema central
del lmite). Por tanto, en nuestro caso el factor de escala ser:
Si los tamaos de las muestras no son iguales (pero no muy distintos), entonces en lugar de n
se utiliza:
111

( )
( )
( )
s
n s
n
n s
N k
R
t t
t
k
t
t
k
t t
t
k
2
2
1
1
2
1
1
1
1
=

=
=
=

s
s s s
R
A B C 2
2 2 2
3
0 073 0 032 0 010
3
0 038 =
+ +
=
+ +
=
. . .
.
factor de escala = = =
s
n
R
0196
4
0 098
.
.
s
R
= = 0 038 0196 . .
c) Construir la distribucin de referencia segn el mtodo visto anteriormente
En este caso, la tabla ser:
Con lo que se obtiene una distribucin de la forma indicada en la figura 6.9.
d) Situar las medias en un eje horizontal con la misma escala que la utilizada en la distribucin de
referencia. Deslizar la distribucin y sacar conclusiones.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
112

n
n
k
t
t
k
=
=

1
t 0 0.5 1 1.5 2 2.5 3
ORDENADA
( = 9)
0.388 0.388 0.229 0.127 0.062 0.028 0.012
t*0.098 0 0.049 0.098 0.147 0.196 0.245 0.294
Fig. 6.9 Construccin de una distribucin de referencia
Fig. 6.10 Comparacin de valores con su distribucin de
referencia (misma escala del eje de abcisas!)
Fig. 6.11 No se puede afirmar que A y B sean distintos, ni
que lo sean B y C, pero s que lo son A y C
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
Vemos que no se puede considerar que las tres medias muestrales pertenezcan a la distribucin
a la que deberan pertenecer si las medias poblacionales fueran iguales. Luego los datos no estn en
consonancia con la hiptesis nula realizada que, por tanto, ser rechazada.
La conclusin es que los procedimientos A y C son estadsticamente indistinguibles, mientras
que el B presenta una diferencia significativa respecto a los otros dos. Ntese que el hecho de que A
sea indistinguible de B y B indistinguible de C, no implica que A sea indistinguible de C, tal como pone
de manifiesto la figura 6.11.
6.2 Caso de la comparacin de procedimientos de montaje con datos bloqueados.
Hiptesis sobre el modelo de la respuesta
Supongamos que en el experimento anterior de anlisis de la productividad de tres tcnicas de montaje
distintas se desea tomar cuatro datos de cada procedimiento, pero considerando ahora que slo se
puede tomar un dato cada da, y de forma que se tiene la sospecha de que el da de la semana tambin
puede influir en la productividad.
En este caso, es mejor no recoger los datos de una forma totalmente aleatoria, ya que podra ocurrir
que tres datos correspondientes al procedimiento A fueran tomados el lunes, y si este da de la semana el
nivel de productividad fuera menor, achacaramos una disminucin del nivel de respuesta al
procedimiento, cuando en realidad correspondera al da en que se tomaran los datos.
En circunstancias como sta, es indispensable planificar la recogida de datos de forma que el posible
efecto de ese factor, que no se puede mantener constante, quede convenientemente neutralizado.
Una forma de hacerlo es tomando los datos de la siguiente forma:
El experimento ha consistido en cuatro bloques (das), y se han tomado datos para cada uno de
los procedimientos de forma aleatoria dentro de cada bloque (diseo en bloques aleatorizados). De
esta forma, dentro de cada bloque pueden compararse las productividades (respuesta) de cada procedi-
miento, por mucha variacin que haya en las medias de los bloques.
Consideraremos que cada resultado obtenido y
ti
se puede expresar mediante el modelo:
donde:
: Media general

i
: Efecto correspondiente al bloque i

t
: Efecto correspondiente al tratamiento t

ti:
Perturbacin aleatoria correspondiente a la observacin ti.
ti
N(0,
2
).
113

PROCEDIMIENTO
A B C DA
2.6 3.2 2.6 Lunes
PRODUCTIVIDAD 2.1 2.7 2.1 Martes
3.5 3.9 3.1 Mircoles
2.6 3.4 2.7 Jueves
y
ti i t ti
= + + +
Como puede observarse en el modelo, el bloque tiene un efecto aditivo sobre la respuesta,
subiendo o bajando el nivel de la misma para todas las observaciones incluidas en el bloque. Si no
existe efecto bloque,
i
=0 para cualquier i.
6.2.1 Resolucin
El objetivo ser hallar una distribucin de referencia para comparar las medias de los bloques y otra
para la media de los procedimientos (esta ltima es la de inters fundamental).
Pero en primer lugar siempre es conveniente representar los datos grficamente. Una
representacin grfica de los datos que resulta muy adecuada en este tipo de casos es la que se indica
en la figura 6.12.
Para iniciar el anlisis de los datos, en primer lugar escribiremos la tabla de resultados incluyendo las
medias de los bloques y de los procedimientos.
El suprandice sobre cada uno de los valores corresponde al orden de toma de los datos que, tal
como se ha dicho, es aleatorio dentro de cada bloque.
La metodologa que se debe seguir en estos casos se resume en las siguientes etapas:
a. Eliminar las diferencias de nivel entre bloques, restndole a cada dato la media de su bloque:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
114

PROCEDIMIENTOS
MEDIAS
DE LOS
A B C
BLOQUES
Lunes 2.6
(2)
3.2
(1)
2.6
(3)
2.8
Martes 2.1
(1)
2.7
(3)
2.1
(2)
2.3
Mircoles 3.5
(2)
3.9
(1)
3.1
(3)
3.5
Jueves 2.6
(3)
3.4
(2)
2.7
(1)
2.9
MEDIAS 2.7 3.3 2.625
PROCEDIMIENTOS SUMA
A B C
Lunes -0.2 0.4 -0.2 0
Martes -0.2 0.4 -0.2 0
Mircoles 0 0.4 -0.4 0
Jueves -0.3 0.5 -0.2 0
MEDIAS -0.175 0.425 -0.250
Fig. 6.12 Grfico para la comparacin de las productividades
obtenidas con los datos bloqueados
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
b. Calcular los residuos. Es decir, a cada observacin de la tabla obtenida en la etapa anterior,
restarle la media de su columna (valor previsto):
c. Estimar la varianza poblacional
2
.
La estimacin de la varianza poblacional puede hacerse de la siguiente forma:
En este caso, si llamamos a al nmero de tratamientos y b al nmero de bloques, el nmero de
grados de libertad es:
Realmente, en la tabla de residuos, sabiendo que las filas y las columnas suman cero, podemos
tapar los datos correspondientes a cualquier fila y tambin los correspondientes a cualquier columna,
y volverlos a deducir. Slo hay 6 residuos que se mueven libremente (6 grados de libertad).
Por tanto, en nuestro caso tendremos:
de donde,
d. Calcular el factor de escala para la comparacin de tratamientos.
Si H
0
:
A
=
B
=
C
fuera cierta, las medias muestrales correspondientes a cada procedimiento
se distribuiran segn una t de Student con = 6 grados de libertad y con un factor de escala
(desviacin tipo):
donde b es el nmero de observaciones dentro de cada tratamiento, o lo que es lo mismo, el tamao de
las muestras.
e. Calcular el factor de escala para comparar las medias de los bloques
En este caso ser:
115

PROCEDIMIENTOS SUMA
A B C
Lunes -0.025 -0.025 0.05 0
Martes -0.025 -0.025 0.05 0
Mircoles 0.175 -0.025 -0.15 0
Jueves -0.125 0.075 0.05 0
SUMA 0 0 0
s
R
2
=
Suma de cuadrados de los residuos
Grados de libertad
( ) ( ) Grados de libertad = = = a b 1 1 2 3 6
( ) ( ) ( ) ( )
s
R
2
2 2 2 2
0 025 0 025 0175 0 05
6
0 014167 =
+ + + +
=
. . . ... .
.
s
R
= = 0 014167 0119 . .
factor de escala = = =
s
b
R
0119
4
0 0595
.
.
factor de escala = = =
s
a
R
0119
3
0 0687
.
.
donde a el nmero de observaciones dentro de cada bloque, o tamao de las muestras a partir de las
que se han calculado las medias de los bloques.
f. Construir las distribuciones de referencia.
Elaboramos la tabla previa, construida de forma que sea til para las dos distribuciones.
Luego hay diferencias de productividad segn el mtodo utilizado (resultado que nos interesaba
saber), y tambin podemos afirmar que existe diferencia de productividad segn el da de la semana.
Qu hubiera ocurrido si a unos datos bloqueados como los anteriores, les hubiramos aplicado
la tcnica de anlisis que corresponde a datos independientes (diseos totalmente aleatorizados)?
En este caso, el estimador de la varianza poblacional nica (con las desviaciones tipo de los
procedimientos A, B y C) hubiera sido:
Luego:
el factor de escala sera:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
116

t 0 0.5 1 1.5 2 2.5 3


ORDENADA
( = 6)
0.383 0.332 0.223 0.126 0.064 0.032 0.016
t * 0.0595
(PROCEDIMIENTO)
0 0.030 0.060 0.089 0.119 0.149 0.179
t * 0.0687
(BLOQUES)
0 0.034 0.069 0.103 0.137 0.172 0.206
Fig. 6.13 Comparacin de las medidas de los tratamientos Fig. 6.14 Comparacin de las medidas de los bloques
Y tenemos, para los tratamientos: y para los bloques:
s g l
R
2
2 2 2
058 050 0 41
3
0 25 9 =
+ +
= =
. . .
. , . . con
s
R
= = 0 5 9 . con
factor de escala = = =
s
n
R
0 5
4
0 25
.
.
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
Se obtiene, por tanto, la siguiente tabla:
que da lugar a la distribucin de referencia
que se indica en la figura 6.15, a la vista de la
cual, no puede decirse que existan diferencias
entre los tres procedimientos.
Esta conclusin errnea se debe a que
la varianza poblacional est sobreestimada
por la variabilidad que produce la diferencia
entre das de la semana. Por tanto, las
conclusiones que se obtienen se ven afectadas
si a datos obtenidos en diseos bloqueados se
les aplica una tcnica de anlisis propia de
datos totalmente aleatorizados.
6.3 Mtodo clsico de anlisis de la varianza. Tabla ANOVA
6.3.1 Planteamiento de un caso y cuestiones previas
Vamos a ver a continuacin un mtodo analtico para
comparar las medias de varios tratamientos. ste es el
mtodo clsico que se basa en la construccin y
anlisis de una tabla denominada tabla ANOVA
(ANalisys Of VAriance).
Para ilustrar su aplicacin utilizaremos los
mismos datos que ya utilizamos en la descripcin del
mtodo grfico. Recordemos el caso en que se compa-
raba la productividad obtenida aplicando diversos
procedimientos de montaje, en el que tenamos:
Y la pregunta que nos plantebamos era: Puede decirse que los tres procedimientos no dan la
misma productividad? Antes de iniciar el mtodo para contestar esta pregunta, abordaremos dos
cuestiones previas.
a. Requisitos para la aplicacin del mtodo.
Los requisitos que se deben cumplir son los mismos que ya se comentaron para el mtodo
grfico, y pueden resumirse en que los datos correspondientes a cada tratamiento deben ser
117

t 0 0.5 1 1.5 2 2.5 3


ORDENADA
(=9)
0.388 0.388 0.229 0.127 0.062 0.028 0.012
t * 0.25 0 0.125 0.250 0.375 0.500 0.625 0.750
Fig. 6.15 Comparacin de datos con su distribucin de referencia
PROCEDIMIENTO
A B C
PRODUCTIVIDAD 2.6
2.5
3.1
2.6
3.2
3.1
3.5
3.4
2.6
2.5
2.7
2.7
MEDIA 2.7 3.3 2.625
DES. TIPO 0.27 0.18 0.10
muestras aleatorias simples de sus correspondientes poblaciones, poblaciones que deben ser
todas normales y de la misma varianza, es decir, iguales en todo excepto, quiz, en su media.
Como siempre, un adecuado anlisis exploratorio de los datos sirve para verificar que nada se
opone al cumplimiento de los requisitos establecidos.
b. Notacin.
En general, consideraremos que existen k tratamientos y que el tratamiento t contiene n
t
observaciones, de forma que los datos se pueden escribir:
A la media general de todos los datos se le denomina .
6.3.2 Construccin e interpretacin de la tabla ANOVA en diseos totalmente aleatorizados
a) Clculo de s
R
2
.
Se trata de la estimacin de la varianza poblacional nica,
2
, a partir de la variacin dentro de
los tratamientos.
El mtodo habitual consiste en calcular la media de las varianzas de las muestras, ponderndola
segn los grados de libertad de cada muestra.
Teniendo en cuenta que:
tenemos:
y por tanto, podemos escribir:
En nuestro caso:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
118

y y y y
y y y y
y y y y
t k
i i ti ki
n n tn kn
t k
11 21 1 1
1 2
1 2
1 2




s
s s s s
R
t t k k
t k
2 1 1
2
2 2
2 2 2
1 2
=
+ + + + +
+ + + + +


... ...
... ...
( )
t t ti t
i
n
t
s y y S C
t
2
1
2
=
=

( ) SC y y S C
t
t
k
t
k
ti t
i
n
R
t
=
= = =

1 1 1
2
( )
( ) ( ) ( )
s
y y
n n n
SC
N k
R
t
k
ti t
i
n
k
R
t
2
1 1
2
1 2
1 1 1
=

+ + +
=

= =

...
y
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
b) Clculo de s
T
2
.
Se trata de realizar una estimacin de
2
basndonos en la variacin entre tratamientos.
Si no hubiera diferencia entre las medias poblacionales de los tratamientos, todas las
poblaciones seran iguales (en realidad sera una sola poblacin) y podramos obtener una estimacin
de
2
a partir de la variacin de las medias de los tratamientos respecto a la media general.
Supongamos que todos los tratamientos tienen el mismo nmero de observaciones n. Como la
media muestral se distribuye con varianza
2
/n, tendremos que:
Luego:
Qu ocurre si no todos los tratamientos tienen el mismo nmero de observaciones?
Sustituyendo n por n
t
, que en este caso deber ir colocado dentro del sumatorio, obtenemos:
El nuevo estimador de
2
, slo vlido cuando las medias poblacionales son iguales, se llama s
T
2
,
y su frmula es:
En nuestro caso tenemos:
Obsrvese que si la media pobla-
cional de los tratamientos no es la mis-
ma, s
T
2
ser mayor que s
R
2
, ya que en este
caso est afectada, no slo por la
119

A B C
nt
st
2
SCt
SCR
N-k
sR
2
4
0.073
0.220
4
0.033
0.100
4
0.010
0.027
= 0.3475
= 12 - 3 = 9
= 0.3475 / 9 = 0.0386
( ) y y
k n
t
t
k

1
2
2
1
es un estimador de

( ) n y y
k
t
t
k

1
2
1
es un estimador de
2

( ) n y y
k
t t
t
k

1
2
1
( )
s
SC
n y y
k
T
T
t
t t
t
k
2
1
2
1
= =

A B C
2.7 3.3 2.625
-0.175 0.425 -0.250
0.031 0.181 0.625
nt 4 4 4
nt 0.1225 0.7225 0.250 - = 1.095
y
t
y y
t

( ) y y
t

2
n y y
t t
( )
2
s
T
2
1095
2
055 = =
.
.
y = 2 875 .
variabilidad dentro de los tratamientos (caso de s
R
2
), sino tambin por la variabilidad entre
tratamientos.
c) Comparacin entre s
R
2
y s
T
2
.
Tenemos dos estimadores de
2
:
s
R
2
:Se obtiene a partir de la varianza de las observaciones de cada uno de los tratamientos. Siempre
es un buen estimador de
2
.
s
T
2
:Se obtiene a partir de la varianza de las medias de los tratamientos. Slo es un buen estimador
de
2
si la hiptesis de igualdad de medias poblacionales es cierta.
Si s
T
2
es mucho mayor que s
R
2
(como en el caso de nuestro ejemplo), nos induce a pensar que
la hiptesis de igualdad de medias entre tratamientos es insostenible.
Ms adelante se ver cmo se puede contrastar esta sospecha de forma ms objetiva.
d) Tercera forma de estimar
2
.
Si las medias de todos los tratamientos son iguales, otro estimador de
2
es el obtenido
calculando la varianza de todas las observaciones globalmente, sin distinguir entre tratamientos. A esta
nueva estimacin se la denomina s
D
2
, y tiene como expresin:
El valor N-1 son los grados de libertad de s
D
2
, para los cuales se utiliza la notacin
D
.
Puede comprobarse algebricamente que se verifican las siguientes igualdades:
y que para el clculo de SC
D
puede utilizarse la expresin:
e) Presentacin de la tabla ANOVA.
Los clculos realizados anteriormente se resumen en una tabla que tiene el siguiente aspecto:
Los valores de SC
D
y
D
, que son los ms fciles de calcular, sirven para verificar la correccin
de los clculos de SC
T
, SC
R
,
T
y
R
.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
120

( )
s
y y
N
SC
N
D
t
k
ti
i
n
D
t
2
1
2
1
1 1
=

= =

SC SC SC
D R T
= +

D R T
= +
SC y N y
D
t
k
ti
i
n
t
=
= =

1
2 2
1
FUENTE DE
VARIACIN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADOS
MEDIOS RELACIN
Entre
tratamientos
SCT = 1.095 T = 2 sT
2
= 0.5475 sT
2
/sR
2
= 14.2
Dentro de los
tratamientos
SCR = 0.3475 R = 9 sR
2
= 0.0386
Total respecto a la
media general
SCD = 1.4425 D = 11
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
f) Uso de la tabla ANOVA.
Es sabido que, si s
y
2
es la varianza de una muestra aleatoria de tamao n
y
de una poblacin
normal de varianza
y
2
y, anlogamente, s
x
2
es la varianza de una muestra aleatoria de tamao n
x
de
una poblacin normal de varianza
x
2
, se verifica que:
y por otra parte, si U es una variable aleatoria que sigue una distribucin de
2
con
1
grados de
libertad, y V otra variable aleatoria que tambin sigue una distribucin
2
, pero esta vez con
2
grados
de libertad, siendo U y V independientes, se verifica que:
A partir de las expresiones anteriores, y mediante transformaciones algebraicas, puede llegarse a:
Por tanto, si
1
2
=
2
2
, se tiene que:
Es decir, si s
1
2
estima la misma varianza poblacional que s
2
2
, su cociente se distribuye segn una
F de Snedecor con
1
y
2
grados de libertad.
Podemos decir en nuestro caso que s
R
2
y s
T
2
estiman la misma
2
?
La relacin s
T
2
/s
R
2
es igual a 14.18. Si las tres poblaciones tuvieran la misma media, sera un
valor de una distribucin F de Snedecor con 2 y 9 grados de libertad. Es esto posible? S, pero es muy
poco probable. Consultando las tablas se observa que tal probabilidad es de 0.002, luego podemos
decir que nuestros datos no son coherentes con la hiptesis de igualdad de medias, hiptesis que por
tanto ser rechazada.
6.3.3 Tabla ANOVA para diseos bloqueados
Tomamos los datos y el planteamiento ya
realizados en el apartado 6.2:
121

( ) n
s
y
y
y
n
y


1
2
2 1
2


( ) n
s
x
x
x
n
x


1
2
2 1
2


( ) F
U
U
=


1
2
1 2
F- Snedecor ;

s
s
F
1
2
2
2
1
2
2
2 1 2

s
s
F
1
2
2
2 1 2

PROCEDIMIENTOS MEDIAS DE
A B C LOS BLOQUES
Lunes 2.6
(2)
3.2
(1)
2.6
(3)
2.8
Martes 2.1
(1)
2.7
(3)
2.1
(2)
2.3
Mircoles 3.5
(2)
3.9
(1)
3.1
(3)
3.5
Jueves 2.6
(3)
3.4
(2)
2.7
(1)
2.9
MEDIAS 2.7 3.3 2.625
En este caso de diseos bloqueados se usa la notacin:
Las frmulas generales de las sumas de cuadrados para la construccin de la tabla son
2
:
Suma de cuadrados debida a la variacin entre bloques:
Suma de cuadrados debida a la variacin entre tratamientos:
Suma de cuadrados debida a la variacin dentro de los tratamientos:
Suma de cuadrados total:
Con los siguientes grados de libertad:
La tabla ANOVA de nuestros datos, tendr la siguiente forma:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
122

Tratamiento
Media de
los bloques
1 2 ... t ... k
1 y11 y21 ... yt1 ... yk1
2 y12 y22 ... yt2 ... yk2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
que i y1i y2i ... yti ... yki
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
n y1n y2n ... ytn ... ykn
dia de
amientos:
... ...
Media general
y
i
y
y
1
y
2
y
t
y
k
Bloque
Media de
tratamientos
( ) SC k y y
B i
i
n
=

2
( ) SC n y y
T t
i
k
=
2
( ) SC y y y y
R
t
k
ti i t
i
n
= +

2
SC y nky
D
t
k
ti
i
n
=

2 2
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
SCB
SCT
SCR
SCD
n-1
k-1
(n-1)(k-1)
nk-1
2
La deduccin detallada de estas frmulas puede verse en el libro de Box, Hunter y Hunter Estadstica para
investigadores. Ed. Revert, Barcelona, 1988.
.

.

.
.

.

.
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
s
B
2
/s
R
2
es el estadstico de prueba que sirve para contrastar si existe diferencia entre las medias
de los bloques, utilizando como distribucin de referencia una F de Snedecor con
B
y
R
grados de
libertad. Anlogamente, s
T
2
/s
R
2
es el estadstico para contrastar las diferencias de medias entre
tratamientos utilizando como distribucin de referencia la F de Snedecor con
T
y
R
grados de
libertad.
El lector puede comprobar, consultando las tablas de la F de Snedecor, que existen diferencias
significativas, tanto en las medias de los bloques como de los tratamientos, conclusin idntica a la que
ya se haba obtenido analizando los datos por el mtodo grfico.
123

FUENTE DE
VARIACIN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADOS
MEDIOS RELACIN
Entre bloques SCB = 2.1825 B = 3 sB
2
= 0.73 sB
2
/sR
2
= 52.1
Entre
tratamientos
SCT = 1.0950 T = 2 sT
2
= 0.55 sT
2
/sR
2
= 39.3
Dentro de los
tratamientos
SCR = 0.0850 R = 6 sR
2
= 0.014
Total respecto a la
media general
SCD = 3.3625 D = 11
Ejercicios
6.1 Se selecciona una muestra aleatoria de 30 muelles. Esta muestra se divide en tres partes y se
pintan los muelles de cada parte con una pintura diferente.
Posteriormente, los muelles son sometidos a una prueba de elongacin y se obtienen los
siguientes valores:
Realice los grficos y anlisis que le parezcan convenientes. Compruebe las hiptesis. Hay
algn efecto del tipo de pintura en la elongacin?
6.2 Para comparar la efectividad de tres tipos diferentes de pinturas fosforescentes para seales de
trfico, se pintan ocho cuadrantes con cada una de las pinturas. Luego se iluminan los
cuadrantes y los siguientes datos indican los minutos que dieron luz por encima de un cierto
umbral, despus de que la iluminacin fuese apagada.
Pueden considerarse idnticos los tres tipos de pintura? En caso contrario decir cul es el
mejor, razonando la respuesta.
6.3 En una determinada fbrica de galletas, se desea saber si las harinas de sus tres proveedores
producen la misma viscosidad en la masa. Para ello produce durante un da nueve masas, tres
de cada tipo de harina, y mide su viscosidad. Los resultados obtenidos son:
Puede decirse que existen diferencias en las viscosidades obtenidas?
No satisfechos con el resultado, se repite el experimento quince das ms tarde, con los
siguientes resultados:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
124

PINTURA A PINTURA B PINTURA C


0.38
0.26
0.41
0.33
0.33
0.37
0.54
0.76
0.39
0.74
0.53
0.35
0.38
0.45
1.09
0.46
0.57
0.46
0.39
0.56
0.51
0.63
0.46
0.47
0.42
0.45
0.41
0.39
0.66
0.76
TIPO A 46.3 48.2 42.0 41.8 48.9 51.0 49.7 50.1
TIPO B 48.7 53.6 49.3 47.3 51.4 53.9 43.6 48.8
TIPO C 62.3 64.7 56.2 60.2 53.6 55.5 61.8 54.5
PROVEEDOR A PROVEEDOR B PROVEEDOR C
19
23
21
17
18
21
22
21
24
COMPARACIN DE MS DE DOS TRATAMIENTOS: ANLISIS DE LA VARIANZA
Considerando estos resultados, junto con los obtenidos anteriormente, cambia nuestra
conclusin sobre la influencia del proveedor en la viscosidad obtenida?
6.4 Se realiza un estudio sobre la inflamabilidad en cuatro fibras distintas. Para estas cuatro fibras
se obtienen los siguientes tiempos de ignicin (en segundos):
a) Qu fibras podemos considerar que tienen igual tiempo de ignicin?
b) Cul es la que tiene un tiempo menor de ignicin?
6.5. Una fbrica de paales utiliza habitualmente tres laboratorios para comprobar la absorcin de
sus productos. En un momento determinado, se decide llevar a cabo un estudio llevando 9
paales lo ms parecidos posible a los laboratorios (3 a cada uno). Las cantidades absorbidas
detectadas son:
a) Cul es la variabilidad entre laboratorios? (Cantidad absorbida.)
b) Cul es la variabilidad entre paales?
c) Qu se deduce de la comparacin entre estas dos variabilidades?
125

PROVEEDOR A PROVEEDOR B PROVEEDOR C


24
23
25
22
20
24
27
25
23
FIBRA 1 FIBRA 2 FIBRA 3 FIBRA 4
17.8
16.2
17.5
17.4
15.0
11.2
11.4
15.8
10.0
10.4
11.8
11.0
10.0
9.2
9.2
14.9
10.8
12.8
10.7
10.7
PAAL LABORATORIO
CANTIDAD
ABSORBIDA (g)
PESO
PULPA (g)
1
2
3
4
5
6
7
8
9
1
1
1
2
2
2
3
3
3
15.5
15.2
14.6
16.0
15.6
14.6
14.5
15.8
15.9
8.8
8.6
8.0
9.1
8.8
8.0
8.5
9.9
10.0
7.1 Necesidad de la experimentacin
7.1.1 Avance del conocimiento
La adquisicin de conocimientos nuevos, el descubrimiento, viene condicionado por dos elementos
esenciales: la ocurrencia de algn hecho diferente de lo habitual, cosa por tanto poco frecuente, y
la circunstancia de que este hecho se produzca en presencia de una persona capaz de identificarlo
como extrao, reflexionar sobre l y, lo que es ms difcil, extraer consecuencias.
La unin de estos dos sucesos es extremadamente rara, aunque podemos citar aqu algunos
casos famosos: la manzana, Newton y la ley de gravitacin universal; la tapadera de la olla, Watt
y la mquina de vapor; el incensario, Galileo y la ley del pndulo, o la aparicin de hongos,
Fleming y la penicilina, por citar solo algunos de los casos ms conocidos.
La experimentacin no consiste ms que en reproducir artificialmente estas dos circunstancias.
Se trata, pues, de forzar la aparicin de circunstancias extraas en presencia de personas
especialmente preparadas para interpretar y extraer conclusiones de lo que ocurra.
Es indudable que, en el mundo competitivo en el que se mueve actualmente cualquier
organizacin, uno de los factores clave de xito es el ritmo con el que la organizacin es capaz de
aprender. La experimentacin es uno de los elementos que ms pueden contribuir a aumentar ese
ritmo.
7.1.2 Diferencia entre experimentar y analizar datos existentes
Al intentar aprender de los procesos industriales, una situacin que se plantea con frecuencia es la de
disponer de gran cantidad de datos sobre el funcionamiento diario del proceso en cuestin, y surge la
pregunta: Es realmente necesario hacer experimentos?, no se podra llegar a las mismas conclusiones
analizando convenientemente (con frecuencia se sugieren las tcnicas de regresin) los datos
disponibles? A continuacin, y sin que ello signifique que no se pueda aprender, y mucho, analizando
los datos del pasado, exponemos cuatro riesgos que se corren y de los que conviene ser consciente,
cuando se analizan datos cuya recogida no ha sido planificada.
7
Diseos factoriales
127
a) Datos inconsistentes
Los procesos industriales cambian con el tiempo, el envejecimiento, las reparaciones, los
cambios en procedimientos, etc. Todo este tipo de cambios no suelen registrarse conjuntamente con los
datos que suelen ser presiones, temperaturas, caudales, concentraciones, etc. Esto provoca que los
datos recogidos mecnicamente no sean consistentes y por tanto intentar extraer conclusiones sobre el
comportamiento del proceso a base de analizarlos es una tarea con escasas posibilidades de xito.
b) Rango de las variables limitado por el control
La figura 7.1 muestra un grfico entre la concentracin (una variable importante del proceso) y
la pureza (una caracterstica de calidad crtica del producto). En ella se aprecia la relacin que hay entre
estas dos variables. Sin embargo, y precisa-
mente porque se sabe que la concentracin
tiene una gran influencia en la pureza, durante
la produccin se controla de forma muy estricta
el rango de variacin de la concentracin. Si el
rango de control es pequeo en relacin a la
variabilidad en la pureza para una
concentracin dada, resulta imposible detectar
la relacin entre ambas por muy fuerte que sea.
Esta situacin es muy frecuente cuando
se intenta establecer modelos a base de datos
recogidos en las operaciones habituales.
Adems, causa sorpresas y comentarios del
tipo: Cmo es posible que la concentracin no
influya en la pureza?
c) Variables altamente correlacionadas
Cuando dos variables del proceso estn correlacionadas, se pueden producir dos tipos diferentes
de situacin engaosa al analizar datos recogidos durante las operaciones habituales.
La primera situacin se produce cuando los datos recogidos incluyen, entre otras, las dos
variables en cuestin. Esta situacin es conocida como confusin de los efectos.
d) Confusin de los efectos
Considrese un proceso de extrusin en el que
una caracterstica importante del producto final
es la densidad (en gr/l) y se han recogido datos
del caudal o velocidad de avance a travs de la
extrusora (en r.p.m.) y del contenido de grasas
(en %) de la materia prima, una mezcla de
harinas vegetales. Y supngase que la relacin
entre estas dos variables y la densidad es la que
aparece en la figura 7.2.
Resulta claro que al aumentar el caudal y
el contenido en grasa, aumenta la densidad.
Pero lo que no se puede discernir es si el
incremento de la densidad es debido al
incremento del caudal, al del % de grasa o al
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
128

Fig. 7.1 Relacin entre la pureza y la concentracin cuando se


restringe el rango de variacin
Fig. 7.2 Relacin entre el caudal, el % de grasa y la densidad
(nmero entre parntesis)
DISEOS FACTORIALES
aumento combinado de las dos variables. Es por este motivo que en estos casos se dice que los efectos
de las variables estn confundidos.
La segunda situacin se produce cuando slo se han recogido (o tenido en cuenta en el anlisis)
los datos correspondientes a una de las dos variables correlacionadas. Ello produce la aparicin de una
relacin no causal debida a la existencia de una variable oculta.
e) Relacin no causal. Variable oculta
Considrese de nuevo el proceso de extrusin, pero suponiendo que no se han recogido datos
del contenido de grasa de la materia prima. Al realizar un diagrama bivariante (figura 7.3) entre el
caudal y la densidad, se observara una relacin entre estas dos variables que inducira a pensar que se
puede obtener la densidad deseada,
regulando las r.p.m. del caudal de
alimentacin de materia prima.
Sin embargo, una persona que
intentase regular la densidad manipu-
lando las r.p.m., se encontrara con la
desagradable sorpresa de no conseguirlo.
Y es que la relacin que existe entre
estas dos variables no es de causa-efecto.
De hecho, es debida a una tercera
variable (el % de grasa de la materia
prima), ya que un aumento del % de
grasa provoca a un tiempo un aumento
en las r.p.m. (al ser ms fluida la materia
prima, con la misma potencia se obtiene
una mayor velocidad), y un aumento en
la densidad. En este caso el % de grasa
es una variable oculta.
7.1.3 Modelos mecanicistas y empricos
En la industria, las tcnicas de diseo y anlisis de experimentos se utilizan bsicamente en dos reas:
el diseo o mejora de productos y el diseo o mejora de procesos. Y ello es as porque actualmente
tanto los productos como los procesos son tan complejos, que resulta prcticamente imposible -salvo
en casos excepcionales- encontrar maneras de mejorarlos mediante consideraciones de tipo terico.
Los modelos mecanicistas, basados en conocimientos tericos, son tiles para describir las
grandes lneas de comportamiento de los productos y procesos, pero muy rara vez sirven para describir
el comportamiento del proceso o producto que tenemos entre manos, bien por ser poco conocido o, con
mayor frecuencia, por ser excesivamente complejo. En estos casos, una descripcin aproximada,
limitada a una regin de inters (rango de variacin de los factores restringido), y obtenida a partir de
la experimentacin puede resultar de extrema utilidad.
En este captulo se utilizan ejemplos relativos a productos y a procesos. Queremos dejar
constancia de que independientemente de cul sea el ejemplo que hayamos utilizado, todos los
conceptos y tcnicas que se mencionan son aplicables a la mejora o diseo de productos y procesos
indistintamente.
129

Fig. 7.3 Diagrama bivariante caudal-densidad


7.2 Posibles estrategias experimentales
Experimentar significa variar deliberadamente las condiciones habituales de trabajo para encontrar
mejores maneras de proceder, y ganar al mismo tiempo un conocimiento ms profundo sobre el
comportamiento de productos y/o procesos.
El problema bsico del diseo de experimentos reside en decidir qu conjunto de pruebas
pondrn de manifiesto, de forma ms clara y con menor esfuerzo, los diversos aspectos de inters del
problema. Si, simplificando, se considera un experimento con slo dos variables (temperatura y
tiempo), las pruebas que hace el experimentador se pueden representar mediante puntos en un
diagrama bivariante, en el que los ejes sean las variables con las que se experimente. En la figura 7.4,
el punto P representa un experimento realizado a temperatura 210C y tiempo 23 minutos. En P
mediramos la o las respuestas de inters, como por ejemplo, la viscosidad o la cantidad producida.
La cuestin de dnde situar los puntos no es trivial y requiere ciertas suposiciones sobre el
comportamiento de la funcin respuesta. En concreto, que sta sea continua y suave, o que las
discontinuidades sean en gran medida conocidas. ste es el caso, por ejemplo, en las discon-
tinuidades producidas por cambios de estado -
lquido a gas-, por energas de activacin
necesarias, por imposibilidad fsica de acopla-
miento entre dos piezas si no cumplen unos
requisitos bsicos, etc. Resultara prcticamente
imposible llegar a conocer por mtodos experi-
mentales una funcin cuya respuesta viniese
representada por una superficie similar al lomo
de un puercoespn.
Afortunadamente, los fenmenos indus-
triales, salvo discontinuidades como las comen-
tadas que resultan en gran medida conocidas,
cumplen estos requisitos de continuidad y
suavidad.
7.2.1 Estrategia secuencial
La principal barrera que se opone a la utilizacin del diseo de experimentos -aparte de la formacin
inicial del personal- es que requiere una inversin importante en tiempo, materias primas, etc. Lo cual
provoca que, aun suponiendo que se decida llevar adelante la investigacin, el nmero de experimentos
a realizar sea siempre limitado. La consigna es, por tanto, obtener la mxima informacin con el
mnimo de recursos.
En la manera de utilizar los recursos disponibles para la investigacin, podemos distinguir
claramente tres posibles estrategias:
a) Experimentar sin planificar
Seguramente es la ms utilizada. Se usa la intuicin para realizar pruebas, sin excesivo orden y
en forma individual, por iniciativas personales y aprovechando momentos que por las
circunstancias - averas, relajacin en la carga de trabajo, necesidad de solucionar un problema,
etc.- sean propicios. Sin duda esta manera de proceder no puede ser considerada como una
estrategia.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
130

Fig. 7.4 Representacin grfica de un punto experimental


DISEOS FACTORIALES
b) Decidir de golpe cmo se va a invertir todo el presupuesto
Esta estrategia consiste en decidir de entrada en qu condiciones se van a realizar todos y cada uno
de los experimentos que permite el presupuesto disponible. Por supuesto esta decisin se realiza
tras haber considerado los objetivos del experimento y estudiado cuidadosamente todos los
aspectos que, por razones tericas o de experiencia, se conocen sobre el problema en cuestin.
c) Estrategia secuencial
En este caso, tras considerar los objetivos y recursos disponibles, se decide en qu condiciones
se van a realizar un reducido nmero de experimentos, de manera que los conocimientos
adquiridos se utilizan para decidir en qu condiciones realizar los siguientes. En una primera
decisin lo ms recomendable es invertir del orden del 40% del presupuesto.
Entre las tres estrategias, sin ninguna duda, la preferible es la tercera. sta reserva una parte del
presupuesto para poder aclarar las cuestiones confusas que hayan surgido -siempre surgen- como
consecuencia del anlisis del primer experimento y, adems, permite aproximarse paulatinamente a la
zona donde los resultados son ptimos, invirtiendo en ella un mayor nmero de experimentos.
Veamos un ejemplo. Supngase que se desea realizar un mapa de la superficie del fondo del mar
o encontrar el punto ms profundo en una determinada zona -en este caso, sta es la respuesta de
inters, en la fbrica ser la pureza, la cantidad producida o cosas similares- y que para ello solamente
podemos realizar 100 mediciones de la profundidad. En este caso, obviamente, el equivalente a las
variables del experimento -que en la fbrica, sern temperaturas, tipo de materias primas,
concentraciones, etc.- son la longitud y la latitud. La mejor manera de distribuir los cien puntos, si esto
se desea hacer de golpe y no se dispone de conocimientos previos, es distribuirlos uniformemente en
una retcula. Comprese esta estrategia con situar en una retcula slo 40 puntos, reservndose 60 para
investigar con mayor detalle aquellas zonas en las que la superficie sea ms rugosa o en que la
profundidad sea mayor.
A esto hay que aadir que la situacin de estos primeros 40 puntos resultar tanto ms
informativa en la medida en que hayamos utilizado nuestros conocimientos previos sobre la forma de
la superficie del fondo del mar para situarlos. Estos conocimientos previos se pueden haber obtenido
de conversaciones con los pescadores de la zona, de informaciones sobre corrientes y mareas, etc. Los
equivalentes en el caso industrial son obviamente los conocimientos tericos sobre el proceso y las
conversaciones con operarios y encargados en contacto directo con el proceso o producto.
Por tanto, una primera regla de oro de la experimentacin es:
No invertir nunca todo el presupuesto en un primer conjunto de experimentos y utilizar en su
diseo toda la informacin previa disponible.
7.2.2 Diseos factoriales frente a intuicin
Suponga que desea optimizar un proceso (obtener la mxima cantidad de producto, por ejemplo) sobre
el que se piensa que pueden influir diez variables. Cmo planificara los experimentos? Una
planificacin aparentemente correcta sera fijar nueve variables e ir probando diferentes niveles de la
dcima hasta encontrar aquel en el que se maximize la cantidad. A continuacin, se fijara esta variable
a su mejor nivel y se probara cambiando los niveles de una de las nueve restantes. El procedimiento
continuara hasta haber experimentado con las diez variables tomndolas de una en una.
Aparentemente el procedimiento est bien organizado, conduce al ptimo y, adems, tiene la gran
ventaja de que los resultados son muy fciles de analizar.
Veamos grficamente cmo funciona este procedimiento en un caso con slo dos variables (con
diez resulta imposible visualizarlo, pero la situacin es totalmente anloga). Se desea maximizar la
131

cantidad de producto obtenida como resultado de una reaccin, sobre la que se sabe que hay dos
variables que pueden resultar tremendamente influyentes: la temperatura del reactor (habitualmente
fijada en 225C) y el tiempo de reaccin (habitualmente 110 minutos). La cantidad que se obtiene en
estas condiciones es 84 gr.
Para ello (ver figura 7.5) se mantiene fija la temperatura a su valor habitual y se prueban
diversos tiempos, con lo que se obtiene una cantidad mxima de 87 gr que corresponde a un tiempo de
130 minutos. Una cierta mejora. Sigamos con el procedimiento. A continuacin se fija el tiempo en
130 min y se experimenta con diversos valores de la temperatura (ver figura 7.6). La nueva cantidad
mxima es de 95gr, correspondiente a una temperatura de 240C.
As pues, una vez concluido el experimento, que ha sido un xito, se ha conseguido aumentar
la cantidad producida en once gramos.
Ha sido un xito? Veamos la situacin desde otro punto de vista. En la figura 7.7 el eje de
ordenadas corresponde a la temperatura y el
eje de abcisas al tiempo, y la cantidad est
representada por curvas de nivel. Salta a la
vista que con el procedimiento anterior no se
ha alcanzado el ptimo, a pesar de lo sencillo
del caso, que slo considera dos variables, y de
que la superficie representada por la cantidad
es simple.
Este procedimiento no resulta adecuado.
Lo correcto, aunque parezca ir en contra de la
intuicin, es experimentar con todas las combi-
naciones de variables y niveles; slo as se
puede detectar la direccin de las pendientes y
alcanzar las cimas o los valles de la superficie
en sucesivos experimentos.
Los diseos que permiten experimentar
con todas las combinaciones de variables y niveles
se denominan diseos factoriales.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
132

Fig. 7.5 Cantidad de producto obtenido en funcin del


tiempo, con la temperatura fija a 225C
Fig. 7.6 Cantidad de producto obtenido en funcin de la
temperatura, manteniendo el tiempo fijo a 130 min.
Fig. 7.7 Curvas de nivel que representan la cantidad de
producto obtenido en funcin del tiempo y de la temperatura
DISEOS FACTORIALES
Este tipo de diseos presenta diversas ventajas. Permiten, utilizados secuencialmente, acercarse
al ptimo y estimar interacciones (concepto de gran inters que se explica en el siguiente apartado), y
proporcionan estimaciones de los efectos de las variables con una varianza reducida, ya que, como se
ve en el apartado 7.5, se calculan con todas las observaciones y son relativamente sencillos de construir
y analizar.
Su principal inconveniente es que requieren un gran nmero de experimentos. Este
inconveniente se soluciona a travs de dos caminos. El primero, que comentamos inmediatamente, es
la utilizacin de dos niveles para cada variable. El segundo, del que se habla en el apartado 8.10, utiliza
los diseos factoriales fraccionales.
7.2.3 Concepto de interaccin
Todos conocemos por experiencia el efecto de una dosis moderada de alcohol sobre nuestro organismo:
ponernos contentos, sensacin de euforia. Tambin conocemos el efecto del medicamento X, que
ingerimos para contrarrestar los efectos de la gripe: disminuir la fiebre, provocar una cierta sensacin
de bienestar. La figura 7.8 representa grficamente la situacin.
La cuestin es, qu ocurre cuando ingerimos las dos cosas? La intuicin parece indicar que
deberamos sentir sensacin de euforia y bienestar; la experiencia y la medicina indican que la
sensacin ser de somnolencia y mareo. ste es un caso tpico de interaccin, en que los efectos de las
dos variables consideradas no son aditivos.
Esto ocurre con relativa frecuencia en los procesos industriales, causando desconcierto y admi-
racin. Son muy frecuentes los comentarios del tipo:
a) Este proceso no hay quien lo entienda, el otro da aument la velocidad de extrusin y aument
la densidad, hoy he aumentado de nuevo la velocidad de extrusin y la densidad ha disminuido!
b) Nuestro proceso es muy complejo, no siempre reacciona igual. El nico que es capaz de mane-
jarlo es Juan, un encargado que lleva muchos aos.
Comentarios de esta ndole son casi con seguridad el reflejo de interacciones.
En el ejemplo de la temperatura y el tiempo (figura 7.7), la superficie ms bien parece
excesivamente sencilla para ser real, pues bien, esa forma refleja la existencia de una interaccin entre
el tiempo y la temperatura. Considrese un encargado que cierto da, trabajando a temperatura 220C,
aumenta el tiempo de 90 a 150 minutos: observar que la cantidad aumenta de 68 a 78 gr. Si al da
siguiente, en el que la temperatura es de 230C, decide tambin aumentar el tiempo de 90 a 150 min
para, basndose en su experiencia del da anterior aumentar en 10 gr la cantidad producida, se
encontrar con que la cantidad permanece inalterable. La situacin est representada en la figura 7.9.
133

Fig. 7.8 Representacin de la interaccin alcohol-medicamento X Fig. 7.9 Interaccin tiempo-temperatura


230 85 85
T
e
m
p
220 68 78
90 tiempo 150
(con)- bienestar somnolencia y
mareo
medicamento
X
(sin)- normal euforia
(sin) Alcohol (con)
85
85
68
78
Ntese que los valores estn extrados de la superficie representada en la figura 7.7.
Pues bien, en situaciones como sta se dice que las dos variables interaccionan. Una definicin
general es: dos variables interaccionan, cuando el efecto de una de ellas sobre la respuesta depende del
nivel de la otra.
7.3 Variabilidad de la respuesta
Ya se ha comentado en el captulo 3 que ningn sistema es totalmente determinista. Es decir, si se
repiten exactamente las mismas acciones varias veces, no siempre se obtiene exactamente el mismo
resultado. Esta idea es una constante a lo largo de todo el libro; veamos ahora cmo este hecho,
especialmente importante cuando se plantean experimentos en la industria, donde los sistemas
(procesos, mquinas, etc.) con los que se experimenta suelen ser complejos, afecta al diseo y anlisis
de experimentos industriales.
La figura 7.10 representa la situacin. Supngase que una determinada caracterstica de un producto
depende de dos variables del proceso de produccin X1 y X2. A cada valor de X1 y X2 le corresponde
un determinado valor de esa caracterstica representado aqu por f(X1,X2).
La realidad es que ese valor f(X1,X2)
es solamente un valor terico, ya que cuando
produzcamos realmente bajo las condiciones
X1 y X2, obtendremos un valor ms o menos
prximo, pero no igual al esperado. Ello es
debido a que en el complejo mundo industrial
actual cada caracterstica depende de un
nmero enorme de variables. Resulta aqu de
aplicacin el principio de Pareto, ya que
depende en gran medida de un reducido
nmero de variables (X1 y X2) y muy poco de
otras muchas, como condiciones ambientales,
diferencias en materias primas, operarios, etc.
Esas otras muchas son las que provocan esa
fluctuacin en principio no explicada y que
en general representamos por .
Esta parte no explicada por las
variables con las que se ha experimentado y
que, por tanto, estn incluidas en el modelo,
provoca la variacin en la respuesta.
En general podemos describir la superficie por una ecuacin de la forma:
Y = f(X1,X2) +
donde:
Y : respuesta
f(X1,X2): parte determinista
: parte estocstica (aleatoria)
No hay que olvidar que, como ya se ha comentado, es el fruto de las pequeas variaciones en
todos aquellos factores que influyen en la respuesta, pero que no han sido considerados en el modelo.
Por tanto, puede ser escrito como (Z1,Z2,...,Zn). En muchas ocasiones uno de los objetivos de la
experimentacin es averiguar cules de esas variables, en principio no consideradas, afectan a la
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
134

Fig. 7.10 Error experimental en la medida de la respuesta


DISEOS FACTORIALES
respuesta en mayor medida y cmo lo hacen, para poder tener un nuevo modelo en el que la parte
estructural incluya un mayor nmero de variables y la parte aleatoria, tambin llamada ruido, sea
menor. As, el modelo:
Y = f(X1,X2,Z3,Z7) +
proporcionara una mejor descripcin del fenmeno bajo estudio.
Los efectos de las variables son detectables en la medida en que son mayores que el ruido. Esta
misma cuestin ha surgido en captulos anteriores, por ejemplo al intentar detectar diferencias entre las
medias de dos poblaciones. Por tanto, pasando variables inicialmente incluidas en la parte aleatoria a
la parte determinista, se disminuye el ruido lo que, a su vez, nos permite detectar la influencia de
nuevas variables. Como se ve este proceso iterativo est ntimamente ligado a la naturaleza secuencial
de la experimentacin.
En otras ocasiones, el objetivo de la investigacin es conseguir reducir la variacin de la
respuesta provocada por algunas de las variables no consideradas inicialmente en el modelo (Z), que
se sabe que afectan a la respuesta, pero que varan de una forma imposible de controlar. La utilizacin
del diseo de experimentos para este fin es una de las grandes contribuciones de G. Taguchi. Este tema
se tratar en el captulo 9.
7.3.1 Variabilidad en el sistema de medicin de la respuesta
Un aspecto de gran importancia y muchas veces olvidado es el hecho de que una parte importante de
es debida a variaciones en el sistema de medida de la respuesta. Esto ocurre, bien sea porque las
mediciones se realizan con poco cuidado, bien porque los instrumentos de medida son poco precisos.
Como ya se ha comentado la posibilidad de poder detectar los efectos de las variables
depende del tamao del ruido, y el ruido provocado por el sistema de medida puede en muchas
ocasiones ser reducido.
Por ello, el primer paso es conocer la variabilidad del proceso de medicin. En ocasiones la
proporciona el propio fabricante del equipo de medicin. En otras habr que recurrir a realizar un
estudio de capacidad (ver capitulo 11).
Si una vez conocido es evidente que resulta muy grande comparado con el tamao de los efectos
que se pretenden detectar, o si simplemente se sospecha que este es escaso, la manera ms sencilla de
reducirlo consiste en medir repetidas veces la respuesta de cada prueba y considerar como la verdadera
respuesta la media de estas mediciones. Con ello el ruido se reduce segn la conocida frmula:
No hay que caer en el error, sin embargo, de considerar que la desviacin tipo de esas medidas
repetidas representa el ruido del experimento. Representa nicamente el ruido del sistema de medida.
Este aspecto es importante y se volver a insistir sobre l al hablar de rplicas en el apartado 7.4.
7.4 Diseos factoriales con las variables a dos niveles
En el apartado 7.2 se ha comentado la necesidad de utilizar diseos factoriales, es decir, experi-
mentando con todas las combinaciones de variables y niveles. A continuacin vamos a comentar los
conceptos ms habituales que intervienen en el planteamiento de este tipo de diseos experimentales.
135


media
obs indiv
n
=
. .
Respuesta: es el nombre genrico que se da a la
caracterstica estudiada. En este libro nos
centraremos en ejemplos en los que se estudia una
sola respuesta, si bien en la practica es frecuente
que se estudien varias respuestas como conse-
cuencia de un solo diseo. En el captulo 12 se
muestran ejemplos de ello.
Factores: se designa de esta forma a las variables
que se considera que pueden afectar a la respuesta y, por tanto, se incluyen en el plan de
experimentacin.
Niveles: son los valores que toma un factor en un determinado experimento.
Supngase que se desea disear un muelle de manera que el nmero mximo de compresiones
hasta la rotura sea lo mayor posible, y que para ello se puede jugar con tres variables: la longitud, el
grosor del alambre de partida y el tipo de acero del alambre (obviamente hay muchas otras variables a
considerar, pero en este caso slo se va a experimentar con estas tres). Adems, se ha determinado que
se experimentar con dos valores de longitud, 10 cm y 15 cm, y con dos valores de grosor, dimetros
5 mm y 7 mm, y con dos tipos de acero, que llamaremos A y B. La tabla 7.1 resume las variables y
niveles del experimento propuesto.
En este caso la respuesta (Y) ser el nmero de compresiones hasta la rotura.
La notacin utilizada para referirnos a los diseos factoriales es una potencia de n, del tipo n
k
.
La n significa que cada factor tomar n niveles (n valores distintos), y k es el nmero total de factores
que intervendrn en la experimentacin. El resultado de elevar n
k
proporciona el nmero de
experimentos elementales que se deben realizar. En el caso del alambre, el diseo factorial adecuado
sera un 2
3
.
Tambien se pueden realizar diseos en los que el nmero de niveles no sea el mismo para todos
los factores. Por ejemplo, si considersemos estudiar cuatro factores a dos niveles y cinco a tres
niveles, se tendra un diseo 2
4
3
5.
Este tipo de diseos, sin embargo, excede el mbito de este libro. En
Peter John (1.971) se encuentra una introduccin a este tipo de diseos.
7.4.1 Diseos factoriales a dos niveles
En la industria los diseos ms utilizados, con una gran diferencia sobre los dems, son los diseos
factoriales a dos niveles. Es decir diseos del tipo 2
k
. En este caso, los valores correspondientes a los
dos niveles se codifican asignando al nivel bajo el valor -1 (o simplemente -) y al alto +1 (o
simplemente +). Si el factor es cualitativo, a un nivel se le asigna -1 y al otro +1 arbitrariamente.
Algunos autores utilizan los smbolos 1 y 2 para denotar los niveles; en este libro utilizaremos la
notacin -1 y +1, ya que tiene algunas ventajas conceptuales, si bien al escribir resulta ms rpido
utilizar simplemente - y +.
La difusin industrial de los diseos 2
k
se fundamenta en tres motivos:
1. Proporcionan una excelente relacin entre el esfuerzo experimental y la informacin obtenida.
2. Son sencillos de construir, realizar, analizar e interpretar.
3. Son fciles de combinar entre ellos para obtener otros diseos ms complejos. (Supngase el
caso ms sencillo en el que se realiza un experimento 2
1
, una variable a dos niveles -la
temperatura a 50C y a 60C- y que a continuacin se vuelve a realizar un experimento 2
1
con
la temperatura a 70C y 80C; en conjunto se ha realizado un experimento 4
1
. Es fcil imaginar
casos ms complejos.)
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
136

FACTORES ABREVIATURA NIVELES


Longitud
Grosor
Tipo acero
L
G
T
10 cm y 15 cm
5 mm y 7 mm
A y B
Tabla 7.1 Factores y niveles. Ejemplo del muelle
DISEOS FACTORIALES
Resulta evidente que los diseos en los que cada
factor slo se vara a dos niveles tienen un grave incon-
veniente: slo permiten estudiar relaciones lineales.
As, en la figura 7.11 aparece un diseo 2
1
; por
supuesto el experimentador slo ver los dos puntos
marcados en el grfico y, a partir de ellos, a la relacin
entre el factor X y la respuesta Y le ajustar una
relacin lineal del tipo:
Si la relacin entre X e Y fuese no lineal, la divergencia entre el verdadero modelo (no lineal) y
el ajustado (lineal) estara incorporada al trmino de error () de este ltimo.
Este inconveniente queda en gran medida compensado por dos hechos. En primer lugar, los
niveles los escoge el investigador, por lo que siempre puede escogerlos lo suficientemente juntos como
para que una recta sea una buena aproximacin a la verdadera forma de la respuesta en la regin de
inters. Por otra parte acabamos de ver que una de las ventajas de estos diseos es que resultan fciles
de combinar para obtener diseos ms complejos.
Por ello en este captulo y en el siguiente nos vamos a centrar en los diseos 2
k
.
7.4.2 Matriz de diseo. Construccin
La matriz de diseo es la relacin que define el valor que deben tomar los factores en cada uno de los
experimentos a realizar.
Siguiendo con el ejemplo del muelle, la tabla 7.2
refleja los factores y niveles con su codificacin.
La tabla 7.3 refleja la relacin de condiciones
experimentales para realizar un diseo 2
3
.
Ntese que no hay dos condiciones experimentales
repetidas, ni tampoco falta ninguna combinacin posible
de los niveles de los factores de diseo.
En la tabla 7.3 se muestra la matriz de diseo para el
caso del muelle y se especifican los valores reales de los
137

Fig. 7.11 Diseo 2


1
Y X = + +
1 1
NIVELES
FACTORES -1 +1
(L) Longitud
(G) Grosor
(T) Tipo acero
10 cm
5 mm
A
15 cm
7 mm
B
EXPER. LONGITUD GROSOR
TIPO
ACERO
NM. DE COMPRESIONES
HASTA LA ROTURA
(RESPUESTA)
1
2
3
4
5
6
7
8
10
15
10
15
10
15
10
15
5
5
7
7
5
5
7
7
A
A
A
A
B
B
B
B
.
(A determinar mediante
la experimentacin)
.
.
.
Tabla 7.2 Factores y niveles codificados.
Ejemplo del muelle
Tabla 7.3 Matriz de diseo. Ejemplo del muelle
niveles. En general esta matriz se escribe con las variables codificadas,
indicando con un -1 cuando la variable debe tomar el nivel bajo y con
un +1, para simplificar 1, cuando la variable debe tomar el nivel alto.
La tabla 7.4 representa, con esta notacin, la matriz de diseo para el
ejemplo del muelle.
Este orden en el que se presenta la secuencia de experimentos a
realizar se denomina orden estndar de la matriz de diseo. En este
orden resulta particularmente sencillo construir la matriz: conocido el
nmero de experimentos a realizar (recurdese que viene delimitado
por el nmero de factores) queda fijado el nmero de filas y a partir de
ah, para el primer factor se van alternando (-1) y (1) hasta haber
completado todas las filas, para el segundo se van alternando 2 (-1) y
2 (1), para el tercero 4 (-1) y 4 (1), para el cuarto 8 y 8, y as
sucesivamente hasta haberlos agotado. Construyendo la matriz de esta forma, se tiene la seguridad de
no omitir ni repetir ninguna combinacin de valores de los factores de diseo.
7.4.3 Aleatorizacin
El orden estndar resulta muy conveniente para escribir la matriz de diseo e incluso, como veremos
ms adelante, para calcular los efectos de las variables, pero no para realizar los experimentos.
El orden de realizacin debe ser aleatorio. Se ha hablado ya en captulos anteriores de la
importancia de la aletorizacin. Aleatorizar protege al experimentador de la influencia de
variables sobre la respuesta -desconoce cules son y qu efecto tienen- y que, al no permanecer
constantes durante todo el experimento, pudiesen afectar a la evaluacin e interpretacin de los
resultados.
Supngase que en el ejemplo del muelle los prototipos se realizan en el orden marcado por la
matriz de diseo. Como los cuatro primeros se realizan con el acero tipo A y los cuatro siguientes
con el tipo B, si hubiese cualquier otro factor de los que intervienen en la fabricacin del muelle -
temperatura del horno, tipo de templado etc.- que cambiase a lo largo del tiempo, de forma que
hiciese empeorar paulatinamente la calidad (nmero de compresiones hasta la rotura) del muelle, se
llegara a la conclusin, tal vez errnea, de que el acero B es peor que el A.
Por tanto, siempre que sea posible y no origine ningn problema serio, ni coste adicional
importante en la realizacin del experimento, es conveniente aletorizar totalmente el orden de
experimentacin, ya que ello protege contra posibles efectos de factores no considerados en el
experimento e ignorados por el experimentador.
En ocasiones, el coste de cambiar un factor de nivel es muy elevado (esto ocurre con frecuencia
cuando uno de los factores es la temperatura y el coste energtico y tiempo del calentamiento es muy
elevado, as como el tiempo para el enfriamiento). Se puede recurrir a aleatorizaciones restringidas
para minimizar el nmero de veces que se cambia el nivel de un factor.
Supngase que se est experimentando con un proceso de prensado donde la temperatura de la
matriz es una de las cuatro variables a estudiar. Se va utilizar un diseo 2
4
que implica, por tanto,
realizar 16 experimentos. La aleatorizacin total del orden de experimentacin podra obligar a
cambiar el nivel de esa temperatura hasta trece veces. Una solucin es realizar, en primer lugar y en
orden aleatorio, los ocho experimentos en los que esa temperatura est a nivel bajo, y a continuacin,
y tambin en orden aleatorio, los ocho experimentos en los que la temperatura de la matriz est a nivel
alto. Obviamente esta solucin es la ms drstica, ya que slo requiere un cambio de nivel. Se pueden
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
138

EXP. L G T
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
Tabla 7.4 Matriz de diseo en
orden estndar. Niveles codifi-
cados. Ejemplo del muelle
DISEOS FACTORIALES
pensar soluciones intermedias en las que se fija un nmero mximo de cambios de nivel (por ejemplo
cuatro) y se aleatoriza de forma que se respete esta restriccin.
Esta prctica debe ser realizada slo cuando sea imprescindible y prestando atencin al analizar
los resultados a su posible influencia en las conclusiones. En estos casos, la forma correcta de analizar
los resultados es la tcnica del Split-plot; su descripcin excede el mbito de este libro, pero se puede
hallar en Milliken and Johnson (1984).
7.4.4 Rplicas
Cuando se sabe que el sistema objeto de la experimentacin es muy variable, se hacen varios
experimentos bajo cada condicin experimental. A estas repeticiones se las denomina rplicas. Como
se ver en el apartado 7.6, al analizar los resultados se considera la media de estas rplicas como la
nica respuesta, y se procede a calcular los efectos como si slo se hubiese experimentado una vez bajo
cada condicin y el resultado hubiese sido precisamente esa media.
Es evidente que esta prctica reduce el efecto de la variabilidad del sistema experimental en la
respuesta, pues se ha visto ya en repetidas ocasiones que:
donde n es el nmero de observaciones que componen la media.
Conviene destacar que una rplica implica la realizacin de todo el experimento (bajo la condicin
sealada) y no recoger dos medidas de la respuesta, ambas consecuencia del mismo experimento.
Por ejemplo, supngase que se est experimentando con un proceso de inyeccin de plsticos.
Obtener dos mediciones de la respuesta, como consecuencia de medir dos piezas producidas en dos
cavidades diferentes del mismo molde y producto de la misma inyectada, no son rplicas. O medir
dos piezas de la misma cavidad obtenidas en dos inyectadas consecutivas y realizadas bajo las
mismas condiciones, no son rplicas. En ninguno de los dos casos mencionados, la diferencia entre
las dos medidas refleja la totalidad de la variacin del proceso. Para que se pudiesen considerar
rplicas, las dos medidas tendran que ser de la misma cavidad del mismo molde, pero producidas
en dos inyectadas diferentes, realizadas bajo las mismas condiciones, pero habindolas variado en
el nterin.
Es decir, hay que tener en cuenta que la realizacin de un experimento incluye desde la
preparacin de la mquina hasta el hecho de fijar las variables. Por tanto, en el caso de la inyeccin,
para obtener dos rplicas hay que preparar la materia prima, fijar la temperatura, la presin de
inyeccin, etc., esperar que est a rgimen y obtener la primera pieza de la cavidad sealada. A
continuacin habra que obtener piezas bajo otras condiciones y repetir exactamente los mismos pasos:
preparacin de la materia prima, fijar la temperatura, la presin, etc., y obtener una segunda pieza de
la cavidad sealada. Las respuestas medidas en esas dos piezas seran rplicas, ya que las diferencias
entre ellas incorporaran todas las fuentes de variabilidad existentes en el proceso.
Las rplicas as consideradas tienen la ventaja de que permiten medir la variabilidad del sistema
con el que se est experimentando, y esta variabilidad puede ser utilizada para determinar la
significacin de los efectos de los factores, tal como se ver en el apartado 7.5.
Si considerramos como respuesta la media de dos cavidades del mismo molde de una misma
inyectada, podr ayudarnos a reducir una parte de la variabilidad de la respuesta, al igual que ocurra
en el caso de medir varias veces. Pero no proporcionara una medida de la variabilidad del sistema.
139


( )
( )
media
obs. individuales
=
n
7.5 Clculo de los efectos
7.5.1 Clculo de los efectos a partir del cubo
Una vez realizado el experimento se procede a calcular de qu manera afectan a la respuesta los
factores con los que se ha experimentado. Estos clculos se repetirn tantas veces como respuestas
haya.
Considrese el ejemplo anterior en el que los experimentos se hubiesen replicado. La tabla
7.5 muestra los experimentos y la respuesta; entre parntesis al lado de cada respuesta aparece el
orden -aleatorio- en el cual se han realizado.
Como ya se ha comentado, se procede al anlisis del experimento como si la nica respuesta
fuese el promedio de las rplicas.
Dado que este experimento es un 2
3
se puede representar grficamente por medio de un cubo,
como en la figura 7.12.
En primer lugar se calculan los efectos de cada factor por separado, a los cuales se denomina
efectos principales. El efecto principal de un factor indica cunto cambia la respuesta (en promedio) al
pasar dicho factor del nivel bajo (-1) al nivel alto (+1).
As, el efecto principal de L corresponde al promedio de valores de la respuesta con L a nivel
1, menos el promedio de valores con L a nivel -1. En este caso ser:
Es decir, que al cambiar la longitud de 10 a 15, el nmero de compresiones hasta la rotura
aumenta, en promedio, 18 miles de compresiones (MC). Anlogamente se pueden calcular los efectos
principales para G y T. (El efecto principal de un factor se designa con la misma notacin que la
utilizada para designar al propio factor.) Y se obtendr:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
140

EXP. FACTORES
RESPUESTA (NM. COMP. ROTURA)
(EN MILES)
L G T RPLICAS MEDIA
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
77 (6)
98 (12)
76 (1)
90 (15)
63 (8)
82 (9)
72 (3)
92 (7)
81 (13)
96 (4)
74 (16)
94 (10)
65 (2)
86 (14)
74 (11)
88 (5)
79
97
75
92
64
84
73
90
Fig. 7.12 Representacin grfica de variables y
respuesta. Ejemplo del muelle
Tabla 7.5 Matriz de diseo, orden de experimentacin y respuesta.
Ejemplo del muelle
L =
+ + +

+ + +
=
97 92 84 90
4
79 75 64 73
4
18
G =
+ + +

+ + +
=
75 92 73 90
4
79 97 64 84
4
1 5 , T =
+ + +
+
+ + +
=

64 84 73 90
4
79 97 75 92
4
8 ;
DISEOS FACTORIALES
Una mirada a la figura 7.12 muestra claramente que no siempre que el grosor pasa de 5 a 7 la
respuesta aumenta 1.5 MC. Es ms, esto no ocurre en ninguna combinacin de las otras variables.
Como ya se ha indicado, slo ocurre en promedio.
Est claro, por tanto, que con los efectos principales no hay suficiente para explicar la forma en
que los factores afectan a la respuesta. Ello es debido, como acabamos de ver, a que en muchas
ocasiones el efecto de un factor depende del valor que toma otro. Hemos comentado ya que cuando
esto ocurre, se dice que estos dos factores interaccionan.
Veamos si en el ejemplo anterior interaccionan el grosor y el tipo de acero. Para ello haremos
los siguientes clculos:
a) Efecto principal del grosor con el tipo de acero a nivel 1 (nos olvidamos de las respuestas con
el tipo de acero a nivel -1, o lo que es lo mismo nos centramos en la cara trasera del cubo):
b) Efecto principal del grosor con el tipo de acero a nivel -1:
Por tanto, el efecto del grosor es distinto segn se use uno u otro tipo de acero. Con el tipo B
aumentar el grosor hace aumentar la respuesta, mientras que con el acero tipo A la hace
disminuir. Esta claro que G y T interaccionan, ya que el efecto de uno depende del nivel a que
se encuentra el otro.
La forma de cuantificar la interaccin de 2 factores -A y B- es la siguiente:
Interaccin AB = (1/2)(Efecto de A con B a nivel 1) -
- (1/2)(Efecto de A con B a nivel -1)
Si esta diferencia es cero indica que el efecto de un factor es independiente del nivel del otro y,
por tanto, que no interaccionan. La diferencia se divide por 2 para que la varianza de las interacciones sea
igual que la de los efectos principales (ver la seccin significacin de los efectos de este mismo apartado).
Puede demostrarse, fcilmente, que la interaccin AB es exactamente igual que la BA.
As, en el ejemplo :
GT = TG = (1/2)(7.5) - (1/2)(-4.5) = 6
De la misma forma se podran calcular, y lo dejamos como ejercicio para el lector, las otras dos
interacciones de dos factores y se obtendra:
LG = -1
LT = 0.5
Y con la respuesta en el eje vertical y un factor en el eje horizontal, el otro se indica con
smbolos (figura 7.14).
Anlogamente, tres factores interaccionan cuando la interaccin de dos de ellos depende del
nivel de la tercera. En la inmensa mayora de los casos, se consigue explicar de forma muy satisfactoria
el comportamiento de las respuestas a travs de los factores sin necesidad de considerar las interacciones
de tres o ms factores. Sin embargo, es muy importante tener en cuenta las interacciones de dos.
El lector puede calcular la interaccin LGT de forma similar a como se ha calculado la LG.
Basta para ello calcular la interaccin LG cuando T est a nivel alto y restarle el valor de la interaccin
LG cuando T est a nivel bajo. Como en el caso anterior y por el mismo motivo, el resultado de esta
diferencia debe ser dividido por 2.
LTG = -0.5
141

G =
+

+
=
73 90
2
64 84
2
7 5 ,
G =
+

+
=
75 92
2
79 97
2
4 5 ,
7.5.2 Algoritmos de clculo
El mtodo que se ha visto para calcular los efectos de los factores tiene la ventaja de ser muy intuitivo,
pero tambin el inconveniente de ser muy laborioso, y de ser aplicable slo cuando el nmero de
factores es igual o inferior a tres. Existen dos maneras rpidas y sencillas de calcular los efectos
(cuando hablamos de efectos lo hacemos en forma genrica, y se incluyen tanto los efectos principales
como las interacciones de todo tipo); son el algoritmo de los signos tambin llamado de Box, Hunter
y Hunter (en el apndice 7A se justifica su funcionamiento), y el del algoritmo de Yates, que es el que
requiere un menor nmero de operaciones y, al mismo tiempo, es el ms adecuado para implementarlo
en una hoja de clculo o cualquier otro programa de ordenador.
a) Algoritmo de los signos
Este algoritmo calcula los efectos a partir de los signos utilizados para definir los niveles en la
matriz de diseo.
Como quiera que entonces slo se podran calcular los efectos principales, se aade una
columna para cada interaccin. Los signos de esas columnas se obtienen multiplicando
algebraicamente los signos de las columnas de las variables que la componen. Se aade adems una
columna con +1, que servir para calcular la media. Este valor es el promedio de todas las respuestas
obtenidas durante la experimentacin, pero resulta de escasa utilidad prctica. La tabla 7.6 muestra la
matriz de diseo completa, as generada.
Para hallar cualquiera de los efectos, se suma algebricamente la respuesta, de acuerdo con los
signos definidos en la columna del efecto correspondiente, y se divide por la mitad del nmero de
condiciones experimentales. Para hallar la media la operacin es exactamente la misma de antes,
excepto que se divide por el nmero de condiciones experimentales especificadas en la matriz de diseo.
As, la estimacin de la media sera:
la estimacin del efecto principal de la longitud (L):
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
142

Fig. 7.14 Interaccin GT. Ejemplo del muelle Fig. 7.13 Interaccin GT. Ejemplo del muelle
media =
+ + + + + + +
=
79 97 75 92 64 84 73 90
8
81,75
L =
+ + + +
=
79 97 75 92 64 84 73 90
4
18
DISEOS FACTORIALES
y la estimacin de la interaccin LG:
Tabla 7.6 Matriz de diseo completa (2
3
). Ejemplo del muelle
b) Algoritmo de Yates
La aplicacin de este algoritmo, ilustrada en la figura 7.15, se realiza de la siguiente manera:
1. Colocar la respuesta en columna y en el orden estndar de la matriz de diseo.
2. Aadir tantas columnas auxiliares como factores de diseo existan.
La primera columna auxiliar se completa de la siguiente forma:
Primera mitad de valores:
1er. valor: Suma de las respuestas 1 y 2,
2 valor: Suma de las respuestas 3 y 4,
y as sucesivamente.
Segunda mitad de valores:
1er. valor: Resta de la 2 respuesta menos la 1,
2 valor: Resta de la 4 respuesta menos la 3, y as sucesivamente.
La segunda columna auxiliar se completa igual que la primera, utilizando los valores de esta
ltima como respuestas. Anlogamente para la 3, la 4, etc.
3. Crear una nueva columna dividiendo el primer valor de la ltima columna auxiliar por un
divisor igual al nmero de condiciones
experimentales. Para el resto de valores
el divisor es igual a la mitad del nmero
de condiciones experimentales.
4. En la ltima columna creada el primer
valor es igual a la media de las respuestas
y el resto corresponde a los efectos.
La correspondencia entre valores y
efectos se realiza a travs de la locali-
zacin de los 1 en su fila correspon-
diente de la matriz de diseo.
Si un valor slo tiene 1 en la columna
del factor B, corresponder al efecto
principal de B. Si lo tiene en las
columnas correspondientes a los facto-
res A y C, corresponder a la interaccin
de AC, etc.
143

MEDIA L G T LG LT GT LGT RESPUESTA


1
1
1
1
1
1
1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
-1
1
1
-1
1
-1
-1
1
79
97
75
92
64
84
73
90
Fig. 7.15 Esquema de aplicacin del algoritmo de Yates
Seguramente ser til repasar (tabla 7.7) la aplicacin de este algoritmo en el ejemplo del muelle.
Obsrvese que, adems de los efectos ya comentados (efectos principales, interacciones de dos
y de tres factores), el algoritmo de Yates proporciona la media.
Tabla 7.7 Algoritmo de Yates. Ejemplo del muelle
7.6 Significacin de los efectos
Que la estimacin de un efecto, hallada a travs del experimento, sea distinta de cero no implica que
el verdadero valor del mismo lo sea. Es decir, no implica que afecte de forma detectable a la respuesta
y que, por tanto, corresponda a un trmino que deba ser incluido en el modelo.
El origen de este aparente contrasentido reside en que cuando se determina una respuesta
indefectiblemente est afectada por una variabilidad -en el apartado 7.3 se ha hablado con detalle de la
variabilidad de la respuesta- y esta variabilidad se transmite inevitablemente a los efectos (recurdese
que los efectos, principales o interacciones, se calculan a partir de la respuesta bajo las diferentes
condiciones experimentales). De forma que, si un efecto es nulo, el valor que de l obtendremos como
consecuencia de la experimentacin no ser exactamente nulo, sino un valor en torno al cero, que
puede estar tanto ms alejado de ste cuanto mayor sea la variabilidad -tambin llamada error
experimental- del sistema.
Por tanto, una vez calculados los efectos, la primera tarea, mediante la tcnica estadstica ms
adecuada, ser distinguir cules son significativamente distintos de cero (realmente existentes) y cules
no lo son. (Como hablar de efecto significativamente distinto de cero es un tanto largo, se abrevia
diciendo slo efecto significativo.)
Hay dos situaciones de partida distintas al abordar este problema: cuando se ha replicado el
experimento, y cuando cada experimento elemental se ha llevado a cabo una sola vez. Por razones
obvias de economa experimental, la segunda situacin es la ms habitual.
El motivo bsico para replicar es reducir la variabilidad de los efectos calculados. Como hemos visto,
el clculo de los efectos es una combinacin lineal de las observaciones (la diferencia entre dos medias, cada
una con la mitad de observaciones) y, por tanto, de acuerdo con la frmula de la varianza de los efectos, sta
es tanto menor cuanto mayor es el nmero de observaciones que se ha utilizado para calcularla.
En general, cuando se est dispuesto a realizar el doble de experimentos para reducir la
variabilidad de los efectos estimados, resulta ms aconsejable introducir un nuevo factor
experimental, aunque a priori no se considerase imprescindible. De esta manera se consigue
exactamente la misma reduccin en la variabilidad de los efectos estimados, y adems la oportunidad
de ampliar el estudio.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
144

MATRIZ
DISEO RESP.
COLUMNAS
AUXILIARES DIV. EFECTO IDENTIFIC.
L G T Y (1) (2) (3)
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
79
97
75
92
64
84
73
90
176
167
148
163
18
17
20
17
343
311
35
37
-9
15
-1
-3
654
72
6
-4
-32
2
24
-2
8
4
4
4
4
4
4
4
81.75
18.0
1.5
-1.0
-8.0
0.5
6.0
-0.5
Media
L
G
LG
T
LT
GT
LGT
DISEOS FACTORIALES
7.6.1 Significacin cuando se dispone de rplicas
Cuando se dispone de rplicas, estudiar la significacin de los efectos es un caso particular de las
pruebas de significacin que se han visto en captulos anteriores.
Vemoslo en el ejemplo de los muelles. Recurdese que se haban realizado dos experimentos
en cada condicin experimental, lo que nos permite calcular la varianza -con dos observaciones en este
caso- en cada una de ellas (ver tabla 7.6).
Tabla 7.6 Media y varianza de los experimentos. Ejemplo del muelle
Supondremos (suposicin en general razonable) que la variabilidad no depende de la condicin
bajo la que se est experimentando, sino que es una caracterstica del sistema experimental y, por tanto,
que se cumple la hiptesis de igualdad de varianzas. Entonces, una buena medida del error
experimental ser el promedio de estas varianzas.
El promedio de las ocho varianzas calculadas es:
con lo que S
R
= 2.24 es la desviacin tipo del error experimental, estimada con ocho grados de libertad,
ya que es el promedio de ocho varianzas, cada una de ellas calculada con un grado de libertad.
En general, y admitiendo que por diversas circunstancias propias de cada experimento el
nmero de rplicas en cada condicin experimental puede ser diferente, la S
2
R
ser:
con n
1
+ n
2
+ ... + n
C
- C grados de libertad, donde C es el nmero de condiciones experimentales
distintas (C=2
k
) y n
i
el nmero de rplicas de la i-sima condicin experimental.
Para poder determinar la significacin de los efectos, es necesario disponer de una medida de
la variacin que el error experimental ha inducido en la estimacin de los mismos. Esta medida la
proporcionar la desviacin tipo de los efectos, que puede ser calculada, ya que:
cada efecto es una combinacin lineal de las respuestas obtenidas en las distintas condiciones
experimentales;
las respuestas obtenidas en las distintas condiciones experimentales son independientes entre s.
145

EXP. FACTORES RESPUESTA


L G T RPLICAS MEDIA VARIANZA
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
77
98
76
90
63
82
72
92
81
96
74
94
65
86
74
88
79
97
75
92
64
84
73
90
8
2
2
8
2
8
2
8
S
2
8 2 2 8 2 8 2 8
8
5 =
+ + + + + + +
=
S
n S n S n S
n n n N
R
N N
N
2 1 1
2
2 2
2 2
1 2
1 1 1
=
+ + +
+ + +
( ) ( ) ( )

Considrese en primer lugar el caso de un diseo 2


2
en el que cada
condicin experimental ha sido replicada, tabla 7.7.
el efecto de A ser:
Por lo que, suponiendo que todas las respuestas son
independientes y tienen la misma varianza
2
, se obtiene:
En general, y teniendo en cuenta que cada efecto es un estadstico formado a base (recurdese el
algoritmo de los signos) de hacer el promedio de la mitad de las observaciones con signo +, representado
por , y restarle el promedio de la otra mitad con signo -, representado por , se obtiene que:
donde cada media ha sido calculada con N/2 observaciones, y donde N es el nmero total de
experimentos que se han realizado -incluidas por tanto, las rplicas.
La varianza de un efecto ser:
donde, por estar calculadas con el mismo nmero de observaciones, provenientes de la misma ley normal:
Y como e son independientes:
Y su estimacin es, por tanto:
Ntese que esta frmula slo es vlida cuando el nmero de replicas es idntico bajo todas las
condiciones experimentales; en caso de que esto no sea as, habr que deducir la frmula adecuada en
forma anloga a la utilizada aqu. Asimismo, se puede calcular de forma inmediata la desviacin tipo
de la media, si bien rara vez resulta de utilidad prctica.
En el ejemplo de los muelles la estimacin de la varianza de los efectos ser, pues:
Estrictamente, lo correcto sera realizar una prueba de significacin para cada efecto, utilizando
la t-Student (con los grados de libertad con los que se ha calculado la S
R
) como distribucin de
referencia. Para ello, el estadstico:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
146

EXP.
FACTORES
A B
RESPUESTA
RPLICAS
1
2
3
4
-1
-1
1
-1
-1
1
1
1
Y11 Y12
Y21 Y22
Y31 Y32
Y41 Y42
Tabla 7.7 Diseo 2
2
con rplicas
efecto A
Y Y Y Y Y Y Y Y
=
+
+
+

+
+
+
21 22 41 42 11 12 31 32
2 2
2
2 2
2
V A V Y Y Y Y Y Y Y Y ( ) ( ) efecto = + + +

1
4
21 22 41 42 11 12 31 22
efecto =
+
Y Y
V V Y Y (efecto) =
+
( )
V Y V Y Y
N
( ) = = =
+
( ) ( )

2
2
V
N
(efecto) =
4
2

V
N
S
R
(efecto) =
4
2

,25 V (efecto) = =
4
16
5 1
Y
+
Y

Y
+
Y

DISEOS FACTORIALES
se comparara con la t-Student mencionada y se calculara el p-valor.
En la prctica, por razones de comodidad y rapidez, se recurre al clculo de intervalos de
confianza aproximados, en la forma:
efecto X desviaciones tipo de los efectos
y se consideran como significativos aquellos efectos cuyo intervalo no contiene el cero.
El valor de X se escoge en funcin de los objetivos del experimento. As, si interesa identificar
slo aquellos efectos que con gran seguridad influyen en la respuesta, se escogen valores de X elevados
(tres o ms). Si, por el contrario, interesa identificar todos aquellos efectos con una posible influencia
en la respuesta, se escogen valores de X cercanos a 1. El valor que se utiliza con mayor frecuencia es
el 2, ya que proporciona intervalos de confianza en el entorno del 90%-95%.
Obviamente, este procedimiento es una
aproximacin, pero ms que suficiente en las
aplicaciones industriales, ya que si el cero est
prximo de un intervalo calculado de esta forma, ya
sea por dentro o por fuera, y no se dispone de cono-
cimientos tcnicos que aclaren la cuestin, debe ser
objeto de una posterior investigacin (recurdese la
estrategia secuencial).
Aplicando lo anterior al caso de los muelles
se obtienen los intervalos de la tabla 7.8.
En este caso resulta evidente que los efectos
significativos son la longitud, el tipo de acero y la
interaccin entre el tipo de acero y el grosor.
7.6.2 Papel probabilstico normal
Ya se ha comentado que lo habitual es no realizar rplicas. El mtodo que veremos a continuacin
permite detectar los efectos significativos en forma sencilla y eficaz.
Este mtodo se basa en representar los efectos en papel probabilstico normal. Se ha comentado
en el captulo el origen y utilidad del papel probabilstico normal, y que al representar en l datos
provenientes de una ley normal, los puntos aparecern aproximadamente alineados.
La respuesta experimental est sometida, como ya se ha comentado, a variacin aleatoria. Esta
variacin seguir, en general, una ley normal con media cero y una desviacin tipo que refleja el error
experimental. An en el caso infrecuente de que no siguiese una ley normal, los efectos son
combinaciones lineales de la repuesta, y por el teorema central del lmite tendrn tendencia a seguirla.
Tenemos, por tanto, que los efectos siguen una ley normal. Supngase ahora un experimento en
el que todos los efectos sean no significativos. Los efectos hallados oscilarn alrededor de cero, siguiendo
una ley normal. Al representarlos en papel probabilstico normal aparecern todos ellos alineados. En la
figura 7.16 se representan los quince efectos de un diseo 2
4
, en el que los factores eran inertes.
Ntese que la recta pasa aproximadamente por el punto (0,50), indicando que la media de la
distribucin es cero. Asimismo, la pendiente de la recta es una indicacin del tamao del error
experimental. Una recta ms horizontal indicara una mayor variabilidad. Por tanto, los efectos no
significativos se distribuyen segn:
147

t
S
efecto - 0
efecto
=
EFECTO
ESTIMACIN
2 DESV. TIPO
Longitud (L)
Grosor (G)
Tipo acero (T)
Long. X Grosor (LG)
Long. X Tipo (LT)
Grosor X Tipo (GT)
Lon. X Gro. X Tip. (LGT)
18.0 2.24
1.5 2.24
8.0 2.24
-1.0 2.24
0.5 2.24
6.0 2.24
-0.5 2.24
Tabla 7.8 Intervalos de confianza aproximados para los
efectos. Ejemplo del muelle
N(0,
efectos
)
Por el contrario, en los efectos significa-
tivos, si bien tienen la misma desviacin tipo,
la media vara dependiendo del tamao del
efecto. De manera que se distribuyen segn:
N(
efecto
,
efectos
)
donde la
efecto
es distinta en cada caso.
En la figura 7.17 se representan los
quince efectos de un diseo 2
4
en el que doce
efectos son no significativos y los tres restantes
significativos.
En la figura 7.17 se aprecia claramente
cmo los efectos principales A, C y D son
significativos y puede haber dudas (que
debern resolverse mediante los conocimientos
tericos o empricos previos a la experimen-
tacin, o realizando nuevas pruebas) respecto a
la significacin de la interaccin CD.
Recurdese que para representar en
papel probabilstico normal basta con:
ordenar los valores (en este caso los
efectos excluyendo la media) de menor
a mayor;
calcular la proporcin de efectos
menores que el que se est considerando
(con el factor de correccin 0.5 para
poder representar el efecto menor). ste
ser el valor de la ordenada. Para ello se
puede utilizar la frmula:
P = 100(i-0.5)/n
donde:
i es el nmero de orden de cada efecto
n es el nmero total de efectos
graduar el eje no probabilstico del papel;
representar las parejas (efecto, P).
Veamos cmo sera la representacin en
papel probabilstico normal de los efectos del
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
148

10 0 -10
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos
Porcentaje
Fig. 7.16 Representacin en papel probabilstico normal de los
efectos de un 2
4
con factores inertes
20 10 0 -10 -20
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos


Porcentaje
A
C
CD
D
Fig. 7.17 Representacin en papel probabilstico normal de los
efectos de un 2
4
con tres factores activos
NM. 1 2 3 4 5 6 7
EFECTO -8 -1 -0.5 0.5 1.5 6 18
IDENTIDAD T LG LGT LT G GT L
P 7.14 21.4 35.7 50 64.3 78.6 92.9
Tabla 7.9 Efectos ordenados para su representacin en papel probabilstico normal. Ejemplo del muelle
DISEOS FACTORIALES
ejemplo del muelle que hemos venido
comentando.
Construir una tabla como la 7.9 o
similar facilita considerablemente la
representacin. Ntese que se utiliza una
fila para mantener la identidad de los efectos
y facilitar su identificacin una vez
representados.
En la figura 7.18 se aprecia clara-
mente que hay cuatro efectos que aparecen
alineados (aproximadamente) y que esa
recta pasa (tambin aproximadamente), por
el punto (0,50). Esto indica que estos efectos
siguen una ley normal con media cero, lo
que es seal de que no son significativos.
Han salido diferentes de cero a causa de la
variabilidad del sistema.
Por el contrario, hay tres efectos que
estn fuera de esa lnea; por lo tanto no se
puede pensar que provengan de una distri-
bucin con media cero. Son los efectos de
L, T y GT. En consecuencia, diremos que
son claramente significativos.
Requiere una cierta prctica trazar
correctamente las rectas e interpretar los
resultados. Es obvio que la recta debe
ajustarse a los puntos centrales y no a los de
los extremos, que son los efectos potencial-
mente significativos. Un error comn es
considerar como significativos efectos que
se apartan de la recta por estar demasiado
prximos al cero (esto ocurre con cierta
frecuencia, ya que al extraer muestras de
tamao reducido de una ley normal los
extremos tienden a estar sobrepresentados).
La figura 7.19 muestra un ejemplo de lo que
se acaba de comentar.
Los efectos A y B no son sig-
nificativos a pesar de que estn fuera de
la recta.
En el apndice 7B se presenta papel
probabilstico normal especialmente prepa-
rado para representar los efectos de experi-
mentos bajo ocho, y diecisis condiciones
experimentales. Se incluyen, adems, diversos casos de representaciones en papel probabilstico
normal, provenientes de investigaciones reales, para que el lector se familiarice con la manera de trazar
las rectas y juzgar la significacin.
149

20 10 0 -10 -20
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos
L
GT
T
Porcentaje
Fig. 7.18 Representacin en papel probabilstico normal de los
efectos. Ejemplo del muelle
20 10 0 -10 -20
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos
A
B
Porcentaje
Fig. 7.19 Representacin en papel probabilstico normal de los
efectos de un 2
4
con todos los factores inertes
7.7 Interpretacin de resultados
Una vez calculados los efectos y determinado cules son significativos, lo nico que resta es interpretar
fsicamente esos resultados.
Se ha comentado ya la interpretacin que se debe hacer de los
efectos principales y que la mejor manera de interpretar las
interacciones es por medio de grficos. Por supuesto es impres-
cindible hacer estas interpretaciones a la luz de los conocimientos
previos que sobre el problema se pudiesen tener.
Es fundamental tener bien asimilada la posible existencia
de interacciones de dos factores para entender el comportamiento
de la respuesta, y elegir de forma acertada la mejor combinacin
de los factores de diseo.
En el ejemplo del muelle, y a la vista de los efectos que han
resultado significativos (tabla 7.10), la interpretacin sera:
Aumentar la longitud de 10 cm a 15 cm hace aumentar el nmero de compresiones hasta la
rotura en 18.000 (recurdese que la respuesta estaba medida en miles de unidades).
El tipo de acero y el grosor interaccionan y por lo tanto, se deben estudiar conjuntamente con
la ayuda de la figura 7.13 o la 7.14. Reproducimos aqu la 7.13.
El nmero mximo de compresiones hasta la rotura se obtiene al trabajar con el tipo de acero A
y un grosor de 5 mm. Pero si las circunstancias obligasen a trabajar con acero tipo B, lo indicado sera
utilizar un grosor de 7 mm.
Otra manera de interpretar los efectos calculados,
que en ocasiones puede ser de ayuda, es considerar que lo
que se pretende a travs de la experimentacin es construir
un modelo. Si bien no se puede pretender hallar una
funcin que represente exactamente la relacin entre la
respuesta y los factores, s se puede hallar una
aproximacin a la misma, en la zona experimental (es
peligrossimo extrapolar las variables ms all de los
niveles en los que se han considerado), que resulte til.
Mediante diseos 2
k
se pueden estimar los
coeficientes de modelos polinmicos sin trminos
cuadrticos. Para un diseo con 3 factores el modelo a
estimar es del tipo:
donde:

0:
Trmino independiente del modelo. Corresponde a la media.

1
, ...,
123
: Coeficientes. Son la mitad de los efectos calculados. Esto es debido a que el efecto
principal de un factor representa el cambio en la respuesta al pasar del nivel bajo (-1)
al nivel alto (+1). Mientras que el coeficiente representa el cambio en la respuesta al
cambiar el factor una unidad (del 0 al 1, o del -1 al 0)
A, B, C : Valores que toman cada uno de los factores.
AB, AC, BC, ABC : Productos de los valores que toman los factores que se indican. En el
modelo representan los efectos de las interacciones.
y : Valor que toma la respuesta para los valores dados de A, B, C.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
150

FACTOR EFECTO
Longitud 18
Tipo de acero -8
Interaccin
Grosor-Tipo de acero 6
Tabla 7.10 Efectos significativos.
Ejemplo del muelle
Fig.7.20 Interaccin GT. Ejemplo del muelle
y A B C AB AC BC ABC = + + + + + + +
0 1 2 3 12 13 23 123
DISEOS FACTORIALES
As, en el ejemplo del muelle, un modelo que explicara el nmero de compresiones hasta la
rotura en funcin de la longitud, el grosor y el tipo de acero sera:
Num. Comp. =81.75 +9L-4T+3GT
Ntese que en el modelo slo aparecen los trminos correspondientes a aquellos factores que
han resultado ser significativos.
Tambin es importante resaltar que en este modelo las unidades de los factores no son las
originales, ya que stos han sido codificados. Si se desea se puede descodificar por medio de la frmula:
donde el subndice C indica unidades codificadas y el O originales. Los niveles superior e inferior se
expresan en las unidades originales.
Aplicndolo al ejemplo del muelle resulta:
No es necesario decodificar la variable tipo de acero, por ser cualitativa.
Con lo que en la ecuacin resultara:
Num. Comp. = 36.75 + 3.6L
O
- 22T + 3G
O
T
y debe ser utilizada con los valores originales de las variables.
Las ecuaciones con las variables en las unidades originales deben ser tratadas con cautela, ya que su
interpretacin es ms compleja. Son tiles para predecir, pero no para interpretar los efectos de los factores.
7.7.1 Clculo de residuos. Diagnosis del modelo
A partir del modelo es posible calcular el valor previsto ( ) para cada condicin experimental y
tambin el residuo, es decir, la diferencia entre el valor observado y el previsto por el modelo. En la
tabla 7.12 aparecen los residuos calculados para el ejemplo de los muelles.
Tabla 7.12 Clculo de los residuos. Ejemplo del muelle
151

X
X
c
=

0
nivel sup. + nivel inf.
2
nivel sup. - nivel inf.
2
L
L
c
=

0
12 5
2 5
,
,
G
G
c
=

0
6
1
,
EXP. FACTORES RESPUESTA VALORES RESIDUOS
L G T RPLICAS PREVISTOS
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
77
98
76
90
63
82
72
92
81
96
74
94
65
86
74
88
79.75
97.75
73.75
91.75
65.75
83.75
71.75
89.75
-2.75
0.25
2.25
-1.75
-2.75
-1.75
0.25
2.25
1.25
-1.75
0.25
2.25
-0.75
2.25
2.25
-1.75
y
Los residuos as calculados permiten comprobar si se cumplen las hiptesis del modelo, que son:
independencia,
normalidad,
varianza constante,
y pueden ser comprobadas mediante tcnicas grficas.
7.8 Diseos a dos niveles bloqueados
La tcnica del bloqueo, si bien ya ha sido introducida y utilizada en el contexto de la comparacin de
medias, tiene particularidades en el caso de los diseos factoriales.
En ocasiones no se pueden realizar todos los experimentos elementales que componen un
diseo bajo las mismas condiciones. Por ejemplo podra ocurrir que se desease realizar un experimento
2
4
, pero slo hubiese materia prima de la misma partida para realizar ocho experimentos y que se
sospechase que la materia pudiese afectar en forma importante a la respuesta.
Hay muchos motivos que podran provocar que el experimento no se llevase a cabo bajo
condiciones homogneas. En la industria el ms frecuente es que transcurra un perodo de tiempo largo
entre la realizacin del primer experimento y el ltimo y esto siempre provoca que sea difcil asegurar
que no haya cambiado nada durante ese perodo. Pero cambios de turno, materia prima, operario, etc.,
son tambin motivos frecuentes de bloqueo.
Bloquear es dividir el global de experimentos a realizar en grupos (bloques), dentro de los
cuales se piensa que las condiciones bajo las que se va a experimentar son homogneas.
Para conseguir esas divisiones, se confunden interacciones, de las que en principio se piensa
que no son importantes (en general, de tres o ms factores), con los factores de bloqueo. La tcnica es
muy similar a la que se explica en el siguiente captulo para disear experimentos factoriales
fraccionales. Por ello, postergamos la explicacin detallada hasta el apartado 8.5, en que dispondremos
de una mayor base para su presentacin. Baste resear aqu la importancia de bloquear para aumentar
la precisin de los experimentos, especialmente en la industria, y dejar constancia de esa posibilidad.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
152

DISEOS FACTORIALES
Apndice 7A Relacin entre los algoritmos de clculo y el mtodo de los mnimos
cuadrados
En este captulo se han detallado dos algoritmos para calcular los efectos, cuando los resultados
provienen de un diseo factorial con las variables a dos niveles. Los dos, algoritmo de Yates y
algoritmo de los signos, estn basados en la simplificacin que supone, en el caso general de la
estimacin de coeficientes por mnimos cuadrados (regresin lineal), el hecho de que las columnas de
la matriz de diseo sean ortogonales.
En este apndice se detalla la relacin entre estos algoritmos y el caso general, suponiendo que
el lector est familiarizado con los aspectos bsicos de la regresin lineal.
Dado un conjunto de variables X
1
, X
2
, ..., X
p
(variables independientes o regresoras), de las que se
piensa que pueden contribuir a explicar las variaciones de una variable Y (dependiente) segn el modelo:
el problema bsico de la regresin lineal es estimar los coeficientes
i
a partir de los datos disponibles
para esas variables y, por tanto, estimar el modelo anterior por medio de la ecuacin:
donde las b
i
son las estimaciones de las
i
.
Estas estimaciones se realizan por el mtodo de los mnimos cuadrados. Es decir, se eligen
valores de b de tal manera que minimicen la suma de los cuadrados de los residuos (e).
Llamando X a una matriz formada por las variables independientes, e Y a un vector formado por
las observaciones de la variable dependiente, en la forma siguiente,
los valores del vector b:
que minimizan las sumas de cuadrados
de los residuos, vienen dados por:
b = (XX)
-1
XY.
Considrese ahora la matriz de
diseo completa de un 2
3
para las
variables A, B y C:
Llammosla X. Entonces:
153

y X X X
p p
= + + + + +
0 1 1 2 2

y b b X b X b X e
p p
= + + + + +
0 1 1 2 2

X
X X X
X X X
X X X
X X X
Y
Y
Y
Y
Y
p
p
p
n n pn n
=

1
1
1
1
11 21 1
12 22 2
13 23 3
1 2
1
2
3

b
b
b
b
b
p
=

0
1
2

media A B C AB AC BC ABC
1
1
1
1
1
1
1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
1
1
-1
-1
-1
-1
1
1
-1
1
1
-1
1
-1
-1
1
Ntese que XX es diagonal porque las columnas
correspondientes a los efectos son contrastes ortogonales
entre s. Este hecho resulta de gran transcendencia, ya
que esa ortogonalidad es la que provoca que las b
estimadas (los efectos) sean independientes entre s y por
tanto, fcilmente interpretables.
Resulta evidente que la matriz (XX)
-1
es tambin
una matriz diagonal, pero con 1/8 a lo largo de la diagonal
principal.
Por tanto, la estimacin b resulta:
donde Y es un vector que representa la respuesta del experimento.
Explicitando las matrices resulta:
que es exactamente la misma operacin que se realizaba en el algoritmo de los signos, con la nica
salvedad de que en este caso los coeficientes se obtienen dividiendo por ocho (el nmero de
experimentos) en lugar de por cuatro (la mitad del nmero de experimentos). Esto es as, como ya se
ha comentado en el apartado 7.5, porque los coeficientes indican el cambio en la respuesta al cambiar
una unidad la variable, mientras que los efectos estiman el cambio en la respuesta al pasar del nivel
bajo (-1) al nivel alto (+1) de la variable.
El lector comprobar fcilmente que en el algoritmo de Yates las operaciones son exactamente
las mismas que en el algoritmo de los signos, slo que se resulta ms eficiente, ya que stas se realizan
agrupadas.
Por otra parte, y dejando al margen que el mtodo de estimacin sea el mismo, conviene poner
de manifiesto dos diferencias bsicas entre la estimacin de un modelo cuando la respuesta se ha
obtenido como resultado de un experimento diseado, y la que se obtiene cuando la respuesta y las
variables se han recogido como consecuencia de las operaciones habituales:
Los peligros ya mencionados al inicio de este captulo cuando los datos no provienen de un
experimento diseado. Inconsistencia de los datos, rango de variacin de las variables limitado
por el control, confusin de los efectos e imposibilidad de determinar relaciones causa-efecto
(variable oculta).
Cuando los datos no provienen de un diseo factorial, las variables independientes no son, en
la practica totalidad de los casos, ortogonales. Esto complica considerablemente la
interpretacin de los modelos resultantes.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
154

X X ' =

8 0 0 0 0 0 0 0
0 8 0 0 0 0 0 0
0 0 8 0 0 0 0 0
0 0 0 8 0 0 0 0
0 0 0 0 8 0 0 0
0 0 0 0 0 8 0 0
0 0 0 0 0 0 8 0
0 0 0 0 0 0 0 8
b X Y =
1
8
'
b =






1
8
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
Y
Y
Y
Y
Y
Y
Y
Y
Y
=

1
2
3
4
5
6
7
8
DISEOS FACTORIALES
Apndice 7B Papel probabilstico normal para diseos con ocho y diecisis
experimentos y casos prcticos
Papel probabilstico normal preparado para el anlisis de diseos factoriales a dos niveles
Las dos figuras (7B.1 y 7B.2) que presentamos a continuacin representan papel probabilstico
normal, que simplifica considerablemente la representacin de los efectos. En ellas slo aparecen las
lneas correspondientes a la probabilidad requerida en cada caso. As, en el papel para ocho
experimentos slo aparecen siete lneas horizontales, que estn situadas precisamente en las
probabilidades (7.14, 21.43, 35.71, 50.00, 64.29, 78.57, 92.86), de manera que para realizar la
representacin basta con ordenar los efectos de menor a mayor y representarlos secuencialmente.
Las dos plantillas ahorran, por tanto, el clculo de las probabilidades para diseos bajo ocho y
diecisis condiciones experimentales.
Representaciones de efectos provenientes de experimentos reales
A continuacin presentamos diversos casos reales para que el lector se familiarice con el trazado de las
rectas y la forma de juzgar la significacin.
Siempre presentamos en primer lugar una figura con los efectos sobre el papel normal.
Invitamos al lector a que ensaye diversas rectas y decida cules son, a su juicio, los efectos
significativos. A continuacin se presenta la misma figura con la recta que recomendamos, los efectos
significativos y algunos comentarios. Al referirnos a los efectos lo haremos utilizando su nmero de
orden en la representacin grfica.
155

Fig. 7B.1 Papel probabilstico normal para diseos con


8 experimentos
Fig. 7B.2 Papel probabilstico normal para diseos
con 16 experimentos
Por supuesto, al juzgar la significacin es muy importante tener en cuenta los conocimientos
previos del investigador y cualquier otra informacin pertinente sobre el proceso en cuestin. Por
razones de espacio se han omitido aqu estos aspectos, si bien en algn caso se hace referencia a la
necesidad de tenerlos en cuenta.
a) Con ocho condiciones experimentales
Breve descripcin de los casos y representacin de los efectos en papel probabilstico normal
Caso 3: En esta ocasin se trata del proceso de obtencin de una emulsin polimrica utilizada
como aditivo en pinturas industriales con el fin de conferirles ciertas propiedades mecnicas. El
objetivo era obtener emulsiones que permitiesen aumentar al mismo tiempo la elongacin (medida en
%) y la resistencia (medida en N/200mm.). El experimento realizado fue un 2
4-1
y se consideraron las
dos respuestas mencionadas, identificadas como caso 3a y caso 3b.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
156

Caso 1: Los efectos provienen de un


diseo 2
3
, con el que se pretenda optimizar la
viscosidad de una emulsin. La respuesta es por
tanto la viscosidad.
Caso 2: Este experimento tena como
objetivo solucionar problemas en el compor-
tamiento de transistores causados por el proceso
de encapsulado plstico de los mismos. El diseo
era un 2
5-2
.
Fig. 7B.3 Casos 1, 2 y 3. Representacin de efectos en papel probabilstico normal
DISEOS FACTORIALES
Caso 4: Las tres respuestas de este experimento (caso 4a: densidad aparente de la pasta, caso
4b: consistencia de la pasta y caso 4c: retencin de agua de la pasta) corresponden a un diseo 2
4-1
. Con
l se pretenda optimizar la formulacin de cementos.
Caso 5: Este caso corresponde a la optimizacin de la densidad del producto final en un proceso
de mezclado de resinas con carga mineral. El diseo era un 2
3
.
Comentarios a las rectas trazadas y los efectos considerados como significativos en cada uno de
los casos planteados. Como ya se ha comentado, por razones de concisin, nos referiremos a cada
efecto por su nmero de orden, que corresponde al que est sealado en el eje de ordenadas.
157

Fig. 7B.4 Casos 4 y 5. Representacin de los efectos en papel probabilstico normal


Caso 4a
Caso 1: Ntese que la recta pasa aproximadamente por el punto (0,50) y recurdese que, tal
como se han etiquetado los ejes, la probabilidad 50% corresponde al punto 4. El hecho de que los
efectos 3 y 4 tengan prcticamente el mismo valor confiere a los puntos un aspecto de no alineados.
Por otra parte, segn como se trace la recta, el efecto 1 podra quedar claramente fuera de la misma,
pero en ningn caso puede considerarse como significativo, ya que est fuera de la recta por estar
demasiado cerca de cero. Obviamente los significativos son los que estn fuera de la recta por estar
alejados del cero. Por tanto, en este caso no hay ningn efecto que pueda ser considerado como
significativo.
Caso 2: La recta esta algo desplazada del punto (0,50); esto puede ser una indicacin de la
existencia de algn valor anmalo en los datos correspondientes a la respuesta, que se debera
comprobar analizando los residuos. El efecto 1 puede considerarse como significativo, si bien por
escaso margen. El efecto 7 claramente no, ya que se aparta de la recta, pero por estar ms cerca del
cero de lo que le correspondera.
Caso 3a: La situacin es aparentemente clara, la recta engloba a los tres efectos centrales (3, 4
y 5) y los efectos 1, 2 , 6 y 7 son significativos. Ntese, sin embargo, que la recta est muy desplazada
del punto (0,50), lo que de nuevo requiere un anlisis de los residuos para aclarar la posible existencia
de anomalas. Es de destacar que en este caso, a diferencia del anterior, si se diese por buena la recta
se estara admitiendo que los efectos 1 y 2, cuyo valor es -12 y -9 (aproximadamente), seran
significativos, mientras que los efectos 4 y 5, que valen 8 y 11, podran ignorarse. Este caso requiere
una revisin en profundidad de todo el experimento.
Caso 3b: ste es un caso claro, en el que los efectos 1 y 2 son significativos.
Caso 4a: No hay ningn efecto significativo, los dos que se apartan de la recta, el 1 y el 7, lo
hacen por estar demasiado cerca del cero.
Caso 4b: En esta situacin hay tres efectos que son claramente significativos, el 1, el 6 y el 7,
y un cuarto efecto, el 5, que resulta difcil de juzgar sin tener conocimientos adicionales sobre el
sistema con el que se est experimentando. Si estos conocimientos no fuesen suficientes, habra que
recurrir a realizar ms experimentos para despejar las dudas (estrategia secuencial).
Caso 4c: Es totalmente anlogo al caso 2 ya comentado.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
158

Fig. 7B.5 Casos 1 y 2. Recta de efectos no significativos


DISEOS FACTORIALES
Caso 5: Es similar al caso 3b, con la diferencia de que los dos efectos significativos son en este
caso positivos.
Conviene destacar que en los casos 3 y 4, correspondientes a experimentos en los que se ha
considerado ms de una respuesta, es conveniente realizar una interpretacin global tras interpretar los
resultados para cada respuesta individualmente. No lo hacemos aqu, ya que el propsito es nicamente
clarificar la interpretacin del papel probabilstico normal.
b) Bajo diecisis condiciones experimentales
Breve descripcin de los casos y representacin de los efectos en papel probabilstico normal.
Caso 6: Los efectos corresponden a un diseo 2
5-1
donde el objetivo era optimizar los
parmetros en un proceso de termofijacin de entretelas.
Caso 7: Los efectos corresponden a un proceso de curvado de tubos. La respuesta de inters
eran las deformaciones en el dimetro interior. El diseo realizado fue un 2
6-3
.
159

Fig. 7B.6 Casos 3, 4 y 5. Recta de efectos no significativos


Caso 8: Los efectos provienen de un experimento realizado en un proceso de fabricacin de
papel con una mquina de doble tela. El diseo fue un 2
5-1
y la respuesta (a) corresponde a la resistencia
longitudinal del papel y la (b) a la resistencia transversal.
Comentarios a las rectas trazadas y los efectos considerados como significativos en cada uno de
los casos planteados. De nuevo, nos referiremos a cada efecto por su nmero de orden, que
corresponde al que est sealado en el eje de ordenadas (figura 7B.8).
Ntese que, en general, la interpretacin del papel probabilstico resulta ms sencilla cuando se
han realizado dieciseis experimentos que cuando slo se han realizado ocho. Ello es debido a que al
aparecer un mayor nmero de efectos no significativos, la recta queda mejor definida. Tambin
conviene destacar que en ninguno de los cuatro casos considerados aparecen problemas de posibles
anomalas y que todas las rectas pasan, aproximadamente, por el punto (0,50) que en este caso
corresponde al (0,8).
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
160

Fig. 7B.7 Casos 6, 7 y 8. Representacin de efectos en papel probabilstico normal


DISEOS FACTORIALES
Caso 6: Hay un efecto claramente significativo, el 15, y otro que a nuestro juicio tambin lo es
pero con menor seguridad, que es el 14. Para juzgar este ltimo resultara conveniente conocer el
proceso.
Caso 7: Los efectos 13, 14 y 15 son significativos, y puede haber dudas respecto al 1 (aunque
nos inclinamos por considerarlo no significativo), que como siempre se deberan clarificar a partir de
los conocimientos del proceso o recurriendo a la realizacin de nuevos experimentos.
Caso 8a: Slo el efecto 15 es claramente significativo. Al igual que en el caso anterior podra
haber una ligera duda sobre el efecto 1.
Caso 8b: Los efectos 14 y 15 son obviamente significativos. Nos inclinamos por considerar que,
si bien en menor medida, tambin lo son el 1 y el 2, aunque dependiendo del significado fsico de los
mismos.
161

Fig. 7B.8 Casos 6, 7 y 8. Representacin de efectos en papel probabilstico normal


Ejercicios
7.1. En un diseo factorial 2
3
sin rplicas, efectuado con las variables x1, x2, x3, se han obtenido
las siguientes estimaciones:
Analizar qu efectos son significativos e interpretar los resultados.
7.2. Una fbrica de pilas de nquel-cadmio desea obtener una capacitancia lo ms alta posible con
los procesos de fabricacin de que dispone.
En un primer estudio de mejora de la calidad se seleccionaron tres macrovariables:
El estudio se realiz con 48 pilas (6 rplicas) con materias primas homogneas y con el mismo
aparato para medir la capacitancia final.
Los resultados obtenidos fueron: capacitancia (datos codificados)
a) Describir un mecanismo de posible aleatorizacin del experimento.
b) Efectuar un estudio completo para determinar la influencia de las macrovariables en la calidad
del producto obtenido, interpretando los resultados y sugiriendo posibles acciones a emprender
en la fbrica.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
162

ESTIMACIN
EFECTOS
PRINCIPALES
x1
x2
x3
-1.91
5.25
0.45
INTERACCIONES
BINARIAS
x1x2
x1x3
x2x3
-0.07
1.55
-4.07
INTERACCIN
DE TERCER ORDEN
x1x2x3 0.85
A1 A2
B1 B2 B1 B2
C1 C2 C1 C2 C1 C2 C1 C2
-0.1 1.1 0.6 0.7 0.6 1.9 1.8 2.1
1.0 0.5 1.0 -0.1 0.8 0.7 2.1 2.3
0.6 0.1 0.8 1.7 0.7 2.3 2.2 1.9
-0.1 0.7 1.5 1.2 2.0 1.9 1.9 2.2
1.4 1.3 1.3 1.1 0.7 1.0 2.6 1.8
0.5 1.0 1.1 -0.7 0.7 2.1 2.8 2.5
A: Lnea de produccin A1: Lnea de produccin A1
A1: Lnea de produccin A1
B: Lnea de montaje B1: Lnea de montaje B1
B2: Lnea de montaje B2
C: Estacin de proceso final C1: Estacin C1
C2: Estacin C2
DISEOS FACTORIALES
7.3. En un proceso de fabricacin de tubos de
escape para la industria del automvil se desea
optimizar la calidad de una determinada
soldadura, que se realiza automticamente en
un componente de acero inoxidable. Para ello
se lleva a cabo un diseo factorial 2
3
replicado,
considerando los factores:
Y se obtienen los siguientes resultados (mayor valor de la
respuesta significativa implica mayor a liad)
a) Constate, mediante el test estadstico que le parezca ms
adecuado (como se vio en el capitulo 5), que no existe
diferencia significativa entre los valores obtenidos en la
primera y segunda rplica.
b) Calcule todos los efectos y utilice el error experimental en la
medida de la respuesta para identificar cules pueden
considerarse significativos.
7.4. Se realiza un experimento para comprobar si la temperatura (x1) y la velocidad de agitacin (x2)
influyen en el dimetro de ciertas partculas. Para ello se lleva a cabo un diseo 2
2
por triplicado (el
experimento fue debidamente aleatorizado). Los resultados obtenidos en dicho experimento son:
a) Analizar el experimento e interpretar los resultados, suponiendo que se cumplen las hiptesis
del modelo.
b) Dado que las varianzas bajo las diferentes condiciones experimentales son muy diferentes,
parece conveniente transformar los datos.(recomendacin: considerar el volumen) y analizar de
nuevo el experimento.
7.5. Se planifica un experimento para estudiar cmo se modifica la potencia de un motor de 6
cilindros al variar ligeramente las dimensiones crticas del carburador (A,B,C,D).
Los datos obtenidos fueron:
cul es la dimensin del carburador que tiene mayor efecto en la potencia del motor?
163

NIVELES
- +
A: CAUDAL DE GAS (L/MIN) 8 12
B: INTENSIDAD (AMP) 230 240
C: VELOCIDAD CADENA (M/MIN) 0.6 1
A B C Y1 Y2
-
+
-
+
-
+
-
+
-
-
+
+
-
-
+
+
-
-
-
-
+
+
+
+
13
25
11
22
13
21
15
22
14
24
14
21
13
25
11
24
EXP. NM. X1 X2 DIMETRO DI (M) Sd
1
2
3
4
- -
+ -
- +
+ +
4,16
9,86
10,14
12,68
2,12
10,03
9,94
12,58
0,32
10,11
9,92
12,54
2,2
10,0
10,0
12,6
1,921
0,122
0,128
0,072
DIMENSIONES RESPUESTA DIMENSIONES RESPUESTA
A B C D (POTENCIA) A B C D (POTENCIA)
-
+
-
+
-
+
-
+
-
-
+
+
-
-
+
+
-
-
-
-
+
+
+
+
-
-
-
-
-
-
-
-
14.8
24.8
12.3
20.1
13.8
22.3
12.0
20.0
-
+
-
+
-
+
-
+
-
-
+
+
-
-
+
+
-
-
-
-
+
+
+
+
+
+
+
+
+
+
+
+
16.3
23.7
13.5
19.4
11.3
23.6
11.2
21.8
d S
d
7.6. Se desea optimizar cierta caracterstica de calidad y de un producto, y para ello se realiza un
diseo factorial 2
3
en el que los factores A, B y C son las variables de las que se sospecha que
pueden tener alguna influencia en y.
Las posibilidades de experimentacin permiten la realizacin de cuatro rplicas en cada
condicin experimental pero como slo pueden realizarse 16 experimentos diarios, la experi-
mentacin se bloquea por da.
Los resultados obtenidos son:
a) Describa brevemente cmo podra aleatorizarse la realizacin de este experimento. Calcule los
efectos. Qu opinin le merece el generador del bloque elegido?
b) Indique cules son los efectos significativos. Era necesario bloquear?
c) Considere que los resultados anteriores se han obtenido utilizando cuatro mquinas,
correspondiendo la primera rplica a los datos de la mquina 1, la segunda rplica a los datos
de la mquina 2, y as sucesivamente. Podemos seguir considerando que tenemos cuatro
rplicas? Por qu?
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
164

A B C Y1 Y2 Y3 Y4
DA 1
-
-
+
+
-
+
-
+
-
-
+
+
83
86
84
83
76
82
79
75
78
87
81
81
79
81
76
77
DA 2
+
+
-
-
-
+
-
+
-
+
-
+
71
74
88
94
66
70
84
87
74
72
91
91
69
68
85
88
8.1 Utilidad y justificaciones
En el captulo anterior se ha desarrollado en detalle el diseo, anlisis e interpretacin de los diseos
factoriales completos. Tambin se han comentado las ventajas e inconvenientes de su utilizacin, y
entre estos ltimos el ms importante es el elevado nmero de experimentos que requieren. Este
nmero crece, como resulta evidente en la notacin 2
k
utilizada, en forma exponencial con el nmero
de factores. No es inusual en la industria desear estudiar el efecto de 6, 7, 8 o ms factores sobre una
respuesta.
En el caso de considerar siete factores, un diseo factorial completo exigira la realizacin de
2
7
= 128 experimentos, y tal volumen de experimentacin resulta, en la mayora de ocasiones,
prohibitivo. Los diseos factoriales fraccionales permiten estudiar un elevado nmero de factores en
un nmero de experimentos mucho menor de lo que requerira un factorial completo.
8.1.1 Justificaciones
Pinsese que un diseo 2
7
implica realizar 128 experimentos y, por tanto, se dispone de 128 grados de
libertad que permiten estimar 128 efectos que son, adems de la media:
7 efectos principales
21 interacciones de 2 factores
35 interacciones de 3 factores
35 interacciones de 4 factores
21 interacciones de 5 factores
7 interacciones de 6 factores
1 interaccin de 7 factores
En la prctica resulta extremadamente raro que aparezcan interacciones de tres o ms factores
que resulten ser significativas. Dicho de otra manera, en general, se obtienen modelos suficientemente
aproximados considerando slo los efectos principales y las interacciones de dos factores.
Este hecho no debe resultar sorprendente: los efectos significativos engloban las caractersticas
ms importantes de la superficie que se est estudiando, y en la prctica resulta infrecuente que estas
sean muy rugosas. La situacin es similar a la que se produce cuando, al desarrollar una funcin en
serie de Taylor, se trunca la aproximacin en la segunda derivada. Resultara adems contradictorio
8
Diseos factoriales fraccionales
165
incluir tminos de tercer o cuarto orden en un modelo, en el que ya desde el inicio (al decidir realizar
el experimento con los factores a dos niveles) se han desestimado los trminos cuadrticos puros.
Se puede, por tanto, prescindir de parte de la informacin que proporciona un diseo 2
7
completo y esto permite, a su vez, prescindir de la realizacin de algunos experimentos.
Para estudiar los efectos de inters, ser suficiente con realizar una parte (fraccin) del
diseo completo. Estos diseos reciben el nombre de: diseos factoriales fraccionales o,
simplemente, diseos fraccionales. Para los diseos fraccionales se utiliza la notacin 2
k-p
, donde
2 sigue siendo el nmero de niveles, k el nmero de factores con los que se experimentar y la letra
p indica el grado de fraccionamiento (ms adelante se comenta su significado especfico). De tal
manera que el resultado de elevar 2 a k-p indica el nmero de experimentos que se van a realizar.
Veamos unos ejemplos:
2
7-1
permite estudiar siete variables en 64 experimentos. Suponiendo que todas las interacciones
de cuarto orden o superior sean cero, permitira estimar los efectos principales y las
interacciones de segundo y tercer orden.
2
7-3
permite estudiar siete variables en 16 exprimentos. Suponiendo que todas las interacciones
de tercer orden o superior y una parte de las de segundo orden sean cero, permitira estimar los
efectos principales y los de las restantes interacciones de dos factores.
2
7-4
permite estudiar siete variables en solamente ocho experimentos. Suponiendo que todas las
interacciones sean cero, permitira estimar los efectos principales de las siete variables en
cuestin.
Hay otra justificacin para la realizacin de diseos factoriales fraccionales y es que en la
significacin de los efectos se cumple, en general, el principio de Pareto. Cuando, sobre todo en las
fases iniciales de una experimentacin, se incluye un elevado nmero de factores se suele cumplir que
unos pocos son responsables de la mayor parte de variaciones en la respuesta (escasos efectos
significativos), mientras que la mayora de factores producen cambios en la respuesta de menor cuanta
(indistinguibles del ruido experimental). Cuando esto ocurre los diseos factoriales fraccionales
permiten estudiar de manera completa los efectos de las variables activas. En el apndice 8A se
comenta este hecho con mayor detalle.
8.2 Ejemplo introductorio. Cinco variables en dieciseis experimentos
En una investigacin -en laboratorio- sobre solidez del color en tejidos se consideraron cinco variables,
cada una de ellas a dos niveles, que se situaron alrededor de los habituales en el proceso de tintado. La
tabla 8.1 muestra las variables y niveles.
La respuesta medida es la cantidad de color dejada
por la muestra, resultado del experimento, sobre
un testigo y comparada con un testigo estndar.
De manera que lo que se desea es hallar las condi-
ciones que minimicen la respuesta.
Esta investigacin se desarroll por medio
de un diseo 2
5
completo. Los experimentos
realizados (en orden aleatorio) aparecen en la
tabla 8.2 (en orden estndar) junto con la
respuesta obtenida.
Como se han realizado 32 experimentos se
dispone de 32 grados de libertad, que permiten
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
166

CDIGO VARIABLE NIVELES


- +
A
B
C
D
E
Ph fijado
Temp. fijado
Concentr. fijador
Temp. acabado
Tiempo acabado
4.5
70C
1 g/l
170C
50 seg.
5.5
80C
3 g/l
190C
70 seg.
Tabla 8.1 Variables y niveles. Ejemplo del tintado
DISEOS FACTORIALES FRACCIONALES
estimar los siguientes 32 efectos:
Representando estos efectos en papel probabilstico normal se obtine la representacin de la
figura 8.1.
En la figura 8.1 se observa claramente que hay cinco efectos significativos: B, C, D, BC y DE.
Es decir se cumple el principio de la escasez de efectos.
Dejamos como ejercicio para el lector la interpretacin de los resultados, de acuerdo con el
objetivo planteado en la investigacin.
Como acabamos de ver, se han podido estimar 32 efectos, si bien es cierto que ya antes de
realizar el experimento haba 16 efectos que considerabamos despreciables -las interacciones de tres,
cuatro y cinco factores.
Qu hubiese ocurrido si en lugar de realizar los 32 experimentos de un 2
5
se hubiesen hecho
slo los 16 indicados por un 2
5-1
? Podramos haber realizado solamente 16 experimentos, y nos
hubiesen servido para estimar los efectos principales y las interaccciones de dos factores?
Imaginemos que realmente se han realizado slo 16 experimentos y que stos han sido un
subconjunto de los 32 del diseo completo. En la tabla 8.3 aparecen estos 16 experimentos. Invitamos
al lector a comprobar como la respuesta coincide con la que se ha obtenido bajo esas mismas
167

EXP. A B C D E RESP.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
13.1
9.9
8.1
7.5
9.0
9.2
-1.0
-1.0
10.6
8.2
11.0
11.2
5.1
9.7
4.1
2.9
EXP. A B C D E RESP
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
6.4
9.8
9.0
6.6
4.9
5.3
-5.1
-3.7
17.3
12.7
12.9
13.7
12.4
12.4
3.8
4.0
Tabla 8.2 Matriz de diseo y respuesta (32 experimentos). Ejemplo del tintado
MEDIA INTERACCIONES DE DOS INTERACCIONES DE TRES INTERACC. DE CUATRO
media = 7.5 AB = 0.0
AC = 0.9
AD = -0.1
AE = 0.1
BC = -3.5
ABC = -0.6
ABD = 0.3
ABE = 0.1
ACD = 0.3
ACE = -0.3
ABCD = -1.1
ABCE = 0.8
ABDE = 1.0
ACDE = 0.1
BCDE = 0.2
EFECTOS PRINCIPALES BD = 1.4 ADE = -0.7 INTERACCIONES DE CINCO
A = -0.2
B = -4.5
C = -6.0
D = 4.0
E = 0.3
BE = -0.5
CD = 0.6
CE = -0.8
DE = 3.0
BCD = 0.4
BCE = -0.5
BDE = -1.5
CDE = 0.2
ABCDE = -0.4
condiciones en el diseo completo; para facilitar la tarea, hemos conservado la numeracin original de
los experimentos. Ms adelante justificaremos la eleccin de estos experimentos y no otros, por el mo-
mento concentrmonos en el anlisis de los mismos.
Ntese que los experimentos se han reordenado para que al menos en los cuatro primeros
factores (A,B,C,D), el diseo aparezca en orden estndar.
Al plantear el experimento 2
5-1
hemos renunciado voluntariamente a las interacciones de orden
tres o superior. Utilicemos el algoritmo de los signos para calcular los efectos en los que estbamos
interesados. Para ello, adems de las columnas de la matriz de diseo que aparecen en la tabla 8.3,
tendremos que calcular las correspondientes a la media y a las interacciones de dos factores. Aparecen
en la tabla 8.4.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
168

4 2 0 -2 -4 -6
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos

D
DE
BC
B
C
P
o
r
c
e
n
t
a
j
e
Tabla 8.3 Matriz de diseo y respuesta (16 experi-
mentos). Ejemplo del tintado
Fig. 8.1 Efectos del ejemplo del tintado (32 experimentos) en
papel probabilstico normal
EXP.
NM. A B C D E RESP.
17
2
3
20
5
22
23
8
9
26
27
12
29
14
15
32
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
6.4
9.9
8.1
6.6
9.0
5.3
-5.1
-1.0
10.6
12.7
12.9
11.2
12.4
9.7
4.1
4.0
MED AB AC AD AE BC BD BE CD CE DE RESP
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
6.4
9.9
8.1
6.6
9.0
5.3
-5.1
-1.0
10.6
12.7
12.9
11.2
12.4
9.7
4.1
4.0
Tabla 8.4 Columnas de signos de las interacciones de dos factores. Ejemplo del tintado (16 experimentos)
DISEOS FACTORIALES FRACCIONALES
En la tabla 8.4 se ha aadido la respuesta para facilitar la utilizacin del algoritmo de los signos,
que una vez aplicado proporciona los efectos indicados en la siguiente tabla.
Comparando estos efectos con los obtenidos utilizando 32 experimentos, se observa que, si bien no
son iguales, son muy similares. De hecho las diferencias son de orden similar a las que hubiese podido
provocar el ruido del experimento.
Veamos cules resultan significativos, representndolos en papel probabilstico normal (figura 8.2).
Resulta evidente que los efectos significativos son los mismos que cuando disponamos de los 32
experimentos. Por tanto, bsicamente hemos obtenido la misma informacin con la mitad de los experi-
mentos. Se ha perdido algo al reducir el nmero de experimentos?
8.2.1 Confusin de los efectos
Al calcular los efectos del 2
5-1
se han considerado nicamente
aquellos en los que estbamos interesados: efectos principales
e interacciones de dos factores. De hecho se dispona de 16
grados de libertad, provinentes de los 16 experimentos realiza-
dos, y se han estimado 16 efectos, por lo que, en principio, no
es posible estimar nada ms.
Sin embargo, nada nos impide utilizar el algoritmo de
los signos para calcular las interacciones de tercer o cuarto
orden. Veamos qu ocurre si decidimos calcular, por ejemplo,
la interaccin ABC. La columna correspondiente se obtiene
multiplicando las columnas A, B y C (tabla 8.5).
Con lo que se obtiene:
ABC = 2.4
Obsrvese que el valor obtenido coincide con el del
efecto DE. Es debido a la casualidad?; en absoluto. Ntese
que la columna del algoritmo de los signos correspondiente a
la interaccin ABC coincide con la columna DE.
169

MEDIA EFECTOS
PRINCIPALES
ITERACIONES
DE DOS
media = 7.3 A = 0.0
B = -4.4
C = -5.0
D = 4.8
E = -0.8
AB = 0.2
AC = -0.6
AD = -0.6
AE = 0.5
BC = -4.2
BD = 1.1
BE = -0.2
CD = 0.7
CE = -0.5
DE = 2.4
5 0 -5
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos

D
DE
BC
B
C
P
o
r
c
e
n
t
a
j
e
Fig. 8.2 Efectos del ejemplo del tintado (16 experimentos) en
papel probabilstico normal
A B C ABC RESP.
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
6.4
9.9
8.1
6.6
9.0
5.3
-5.1
-1.0
10.6
12.7
12.9
11.2
12.4
9.7
4.1
4.0
Tabla 8.5 Columna de signos de la interaccin
ABC. Ejemplo del tintado (16 experimentos)
El valor 2.4 que hemos estimado, corresponde a
ABC o a DE?
Veamos un ejemplo ms sencillo.
Supngase que un atleta realiza un expe-
rimento con las variables de la tabla 8.6 para intentar
mejorar su marca en los 100 m. Y con la matriz de
diseo que aparece en la tabla 8.7 junto con la
respuesta.
Como quiera que siempre que calza Nike no toma caf, mientras
que siempre que calza Adidas s lo toma, no se sabe a cul de los
dos factores atribuir la ganancia de dos segundos. De hecho, con la
informacin disponible cualquiera de las siguientes explicaciones
podra ser vlida:
Calzar Adidas en lugar de Nike hace ganar al atleta 2 segundos.
Tomar caf hace ganar al atleta 2 segundos.
Calzar Adidas le hace ganar un segundo y tomar caf otro segundo.
Calzar Adidas le hace ganar tres segundos y tomar caf le hace
perder uno.
La lista no es en absoluto exhaustiva, ya que las posibles interpretaciones son inagotables. Los
dos efectos estn confundidos. Al calcularlos se obtiene el mismo valor:
pero en realidad lo que se est estimando es la suma de los dos efectos. Es decir, T+C.
As pues, cuando a dos efectos les corresponde la misma columna de signos decimos que estn
confundidos, y que el contraste lineal definido por esa columna estima la suma de sus efectos.
Volvamos al ejemplo del tintado de fibras. Hemos visto que, si para estudiar cinco factores
realizamos un 2
5
completo, podemos estimar 32 efectos, mientras que si realizamos un 2
5-1
solamente
podemos estimar 16. Que ocurre con los 16 restantes? La respuesta es sencilla, la confusin entre ABC
y DE no es la nica existente, los efectos estn confundidos dos a dos.
Una manera de averiguar cul est confundido con cul sera repetir el procedimiento que
hemos utilizado para la interaccin ABC con el resto de interacciones de tercer cuarto y quinto orden.
El procedimiento sera tedioso. En el siguiente apartado se presenta un procedimiento alternativo
mucho ms simple.
8.3 Construccin de diseos fraccionales y clculo de las confusiones introducidas
8.3.1 Construccin de diseos fraccionales
Cmo se escogieron los 16 experimentos del diseo 2
5-1
?
De hecho, no se escogieron 16 experimentos de entre los 32 del diseo completo, se construy
la matriz de diseo de la siguiente manera (tabla 8.8):
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
170

CDIGO VARIABLE NIVELES


+ -
T
C
Tipo de calzado
Ingestin de caf
Nike
No
Adidas
S
Tabla 8.6 Variables y niveles. Ejemplo del atleta
T C RESP.
-1
-1
1
1
-1
-1
1
1
13 seg.
13 seg.
11 seg.
11 seg.
Tabla 8.7 Matriz de diseo y respuesta.
Ejemplo del atleta
T =
+ +
=
13 13 11 11
2
2
C =
+ +
=
13 13 11 11
2
2
DISEOS FACTORIALES FRACCIONALES
Se escribi la matriz de diseo de un 2
4
completo para las
variables A,B,C y D.
Se escribi la columna de signos para la interaccin ABCD y
se asignaron esos signos a la variable E. Se confundi
deliberadamente la interaccin de cuarto orden, la mayor de
las disponibles, con la quinta variable.
Como se ver ms adelante, el procedimiento es general.
A esta confusin introducida para poder escribir la matriz de
diseo se la denomina generador. De manera que el generador del
diseo 2
5-1
utilizado es:
E = ABCD
8.3.2 Clculo de las confusiones introducidas
Ahora que sabemos cmo se ha construido el 2
5-1
, veamos una manera sencilla de hallar todas las
confusiones que presenta un diseo de este tipo. Para ello se define una operacin entre las columnas
de la matriz de diseo.
La operacin es la misma que hemos utilizado en el algoritmo de los signos, esto es: dadas las
columnas A y B se define la columna AB como aquella que tiene en cada fila el signo correspondiente
al producto de los signos de A y B en esa fila.
Utilizaremos la letra I para denotar una columna slo de unos (+1); es la correspondiente a la media.
Cualquier columna por ella misma es la columna I. AA=I.
Cualquier columna por I es la columna original. AI=A.
Propiedad asociativa. (AB)C = A(BC).
Propiedad conmutativa. AB = BA.
Si utilizando esta operacin, multiplicamos ambos miembros del generador por E obtenemos la
relacin de definicin.
Generador: E = ABCD
Relacin de definicin: EE = EABCD
I = ABCDE
La relacin de definicin est formada por todas aquellas interacciones a las que corresponde
una columna con todo unos. Dicho de otra manera, est formada por todas las interacciones
confundidas con la media.
171

A B C D E
ABCD
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
Tabla 8.8 Construccin de la matriz de diseo del 2
5-1
A B AB =

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

La relacin de definicin permite hallar
fcilmente cmo estn confundidos los efectos,
sin ms que multiplicar ambos miembros por el
efecto de inters. As, para hallar con cul esta
confundida la interaccin ABC:
ABC(I) = ABC(ABCDE)
ABC = (ABC)(ABC)DE
ABC = (I)DE
ABC = DE
El clculo se puede realizar fcilmente sin
desarrollar todos los pasos. La tabla 8.9 muestra
todas las confusiones existentes en el diseo 2
5-1
utilizado en el ejemplo del tintado de fibras.
Ntese que, aunque utilizamos la misma
notacin para designar las columnas de signos
que los efectos que ellas permiten estimar, ello
no debe inducir a error.
8.3.3 Concepto de resolucin
Se dice que el diseo 2
5-1
es de resolucin V. La resolucin de un diseo indica el nivel de confusiones
que se presentan en la estimacin de los efectos. As, en este caso, y tal como se puede ver en la tabla
8.9, los efectos principales estn confundidos con interacciones de cuatro factores y las interacciones
de dos con las de tres.
En general, un diseo de resolucin R es aquel en el que ningn efecto de q factores est
confundido con otro que contenga menos de R-q. As, un diseo de resolucin V indica que como
mximo se confunden interacciones de tres factores con interacciones de dos. Si la resolucin es IV se
confunden interacciones de dos entre s, o efectos principales con interacciones de tres. Si la resolucin
es III, se confunden efectos principales con interacciones de dos, etc.
La resolucin se define como la longitud del trmino ms corto de la relacin de definicin (en
el diseo 2
5-1
solo tiene uno, pero no siempre es as, como veremos en el apartado siguiente).
La resolucin de un diseo se denota por un nmero romano situado como subndice. As, el
diseo estudiado sera:
8.4 Otros diseos fraccionales. Generalizacin de conceptos
8.4.1 Medias fracciones
Del diseo 2
5-1
que ha servido para introducir los diseos fraccionales, se dice que es una media
fraccin, ya que implica realizar la mitad de los experimentos que hubiese requerido el completo.
Resulta muy sencillo escribir medias fracciones. El procedimiento es escribir el diseo
completo para el nmero de variables deseado y asignar la variable restante a la interaccin mayor
disponible. Veamos algunos ejemplos.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
172

RELACIN ENTRE
COLUMNAS
PATRN DE
CONFUSIN
EFECTOS
ESTIMADOS
A=BCDE
B=ACDE
C=ABDE
D=ABCE
E=ABCD
AB=CDE
AC=BDE
AD=BCE
AE=BCD
BC=ADE
BD=ACE
BE=ACD
CD=ABE
CE=ABD
DE=ABC
I=ABCDE
A+BCDE
B+ACDE
C+ABDE
D+ABCE
E+ABCD
AB+CDE
AC+BDE
AD+BCE
AE+BCD
BC+ADE
BD+ACE
BE+ACD
CD+ABE
CE+ABD
DE+ABC
media+1/2(ABCDE)
0.0
-4.4
-5.0
4.8
-0.8
0.2
-0.6
-0.6
0.5
-4.2
1.1
-0.2
0.7
-0.5
2.4
7.2
Tabla 8.9 Patrn de confusin del 2
5-1
. Ejemplo del tintado
2
5 1
V

DISEOS FACTORIALES FRACCIONALES


Diseo: - Escribir un 2
2
para las variables A y B.
- El generador del diseo es: C = AB.
- La relacin de definicin es: I = ABC.
- La resolucin es III.
- Patrn de confusin: A + BC
B + AC
C + AB
media + ABC.
Diseo: - Escribir un 2
3
para las variables A, B y C.
- El generador del diseo es: D = ABC.
- La relacin de definicin es: I = ABCD.
- La resolucin es IV.
- Patrn de confusin: A + BCD
B + ACD
C + ABD
D + ABC
AB + CD
AC + BD
AD + BC
media + ABCD.
En el apartado anterior se ha visto el . El procedimiento es general y , por tanto, sencillo
construir diseos , , etc.
8.4.2 Fraccin complementaria
El procedimiento descrito sirve para escribir media fraccin.
Qu ocurre si deseamos escribir la otra media? Se la llama la
fraccin complementaria, ya que juntas reproducen el diseo
completo.
Una manera de hallarla sera escribir el diseo completo
y seleccionar los experimentos que no estn incluidos en la
media fraccin original.
Hay un procedimiento ms sencillo; consiste en utilizar
el mismo generador, pero cambiado de signo. Vemoslo en el
caso del tintado de fibras.
El generador sera E = -ABCD, con lo que la matriz de
diseo resultante es la que aparece en la tabla 8.10, a
continuacin.
La relacin de definicin es:
I = - ABCDE
y el patrn de confusin aparece en la tabla 8.11.
Supongamos que despus de haber completado una
media fraccin se hubiese aadido la otra, de manera que se
173

2
3 1
III

2
4 1
IV

2
5 1
V

2
6 1
VI

2
7 1
VII

A B C D EABCD
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1
Tabla 8.10 Matriz de diseo (2
5-1
) de la
fraccin complementaria del 2
5-1
inicial
dispusiese del factorial completo. Entonces se podran estimar todos los efectos sin confusin,
reanalizando los 32 experimentos, o bien obtenerlos por sumas y diferencias de los efectos estimados
en cada una de las medias fracciones. La tabla 8.12 muestra esta segunda opcin.
Obsrvese cmo los efectos para el diseo completo concuerdan con los obtenidos en la seccin
8.2 para el diseo 2
5
, excepto el de la interaccin ABCDE que, por estar confundido con la media,
aparece dividido por dos.
Tabla 8.11 Patrn de confusin de la fraccin complementaria
Tabla 8.12 Efectos del diseo completo 2
5
, obtenidos por sumas y diferencias de las fracciones complementarias
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
174

RELACIN ENTRE
COLUMNAS
PATRN DE
CONFUSIN
EFECTOS
ESTIMADOS
A=BCDE
B=ACDE
C=ABDE
D=ABCE
E=ABCD
AB=CDE
AC=BDE
AD=BCE
AE=BCD
BC=ADE
BD=ACE
BE=ACD
CD=ABE
CE=ABD
DE=ABC
I=ABCDE
A-BCDE
B-ACDE
C-ABDE
D-ABCE
E-ABCD
AB-CDE
AC-BDE
AD-BCE
AE-BCD
BC-ADE
BD-ACE
BE-ACD
CD-ABE
CE-ABD
DE-ABC
media-1/2(ABCDE)
-0.4
-4.6
-7.0
3.2
1.4
-0.2
2.4
0.4
-0.3
-2.8
1.7
-0.8
0.5
-1.1
3.6
7.7
PATRN DE
CONFUSIN
1 FRACC.
EFECT.
1 FR.
x1
PATRN DE
CONFUSIN
2 FRACC.
EFECT.
2 FR.
x2
EFECTOS DISEO COMPLETO
1/2(x1+x2) 1/2(x1-x2)
A+BCDE
B+ACDE
C+ABDE
D+ABCE
E+ABCD
AB+CDE
AC+BDE
AD+BCE
AE+BCD
BC+ADE
BD+ACE
BE+ACD
CD+ABE
CE+ABD
DE+ABC
I+1/2(ABCDE)
0.0
-4.4
-5.0
4.8
-0.8
0.2
-0.6
-0.6
0.5
-4.2
1.1
-0.2
0.7
-0.5
2.4
7.3
A-BCDE
B-ACDE
C-ABDE
D-ABCE
E-ABCD
AB-CDE
AC-BDE
AD-BCE
AE-BCD
BC-ADE
BD-ACE
BE-ACD
CD-ABE
CE-ABD
DE-ABC
I-1/2(ABCDE)
-0.4
-4.6
-7.0
3.2
1.4
-0.2
2.4
0.4
-0.3
-2.8
1.7
-0.8
0.5
-1.1
3.6
7.7
A=-0.2
B=-4.5
C=-6.0
D=4.0
E=0.3
AB=0.0
AC=0.9
AD=-0.1
AE=0.1
BC=-3.5
BD=1.4
BE=-0.5
CD=0.6
CE=-0.8
DE=3.0
med=7.5
BCDE=0.2
ACDE=0.1
ABDE=1.0
ABCE=0.8
ABCD=-1.1
CDE=0.2
BDE=-1.5
BCE=-0.5
BCD=0.4
ADE=-0.7
ACE=-0.3
ACD=0.3
ABE=0.1
ABD=0.3
ABC=-0.6
1/2ABCDE=-0.2
DISEOS FACTORIALES FRACCIONALES
8.4.3 Diseos saturados
Las medias fracciones son los diseos menos fraccionados. Veamos ahora el extremo opuesto, los
diseos lo ms fraccionados posible. Se denominan saturados, ya que se obtienen mediante la
saturacin de un completo 2
k
asignando a cada interaccin una nueva variable, lo cual permite estudiar
2
k-1
variables. Son, por tanto, diseos de resolucin III.
Ejemplos de diseos saturados son:
Permite estudiar 3 variables en 4 experimentos.
Permite estudiar 7 variables en 8 experimentos.
Permite estudiar 15 variables en 16 experimentos.
Resulta evidente que, si se intentase estudiar un mayor nmero de variables, los diseos
resultaran de resolucin II. Esto es, confundiran los efectos principales entre ellos y, por tanto,
resultaran de escasa o nula utilidad. Un ejemplo de diseo de resolucin II es el del corredor de 100 m
que se ha utilizado para introducir el concepto de confusin de los efectos.
Estos diseos tambin se llaman diseos de efectos principales, y resultan especialmente tiles
en los estadios iniciales de una investigacin, cuando lo que se desea es identificar las variables activas
(screening), para posteriormente, y utilizando la estrategia secuencial, estimar sus efectos y averiguar
la posible existencia de interacciones entre ellas.
Veamos con detalle un ejemplo de diseo .
Un fabricante de tubos de escape tena problemas en una operacin de curvado y decidi llevar
a cabo una investigacin para hallar mejores condiciones de funcionamiento. El objetivo era mltiple;
sin embargo, nos centraremos en conseguir el dimetro del tubo deseado. La mquina era nueva, lo que
motiv que se identificasen como potencialmente importantes siete variables y que se conociese muy
poco sobre ellas a priori. Adems, se dispona de poco tiempo para experimentar.
Bajo estas condiciones un diseo saturado pareca idneo. Las variables y niveles eran los de
la tabla 8.13.
La matriz de diseo utilizada aparece en la tabla 8.14.
Por supuesto los experimentos se llevaron a cabo en orden aleatorio y se tomaron diversas
precauciones para medir el dimetro. De hecho, se realizaron cinco tubos bajo cada condicin
experimental (no constituyen autnticas rplicas) y la respuesta que se muestra es el promedio.
Ntese que, tras escribir un 2
3
completo, se asign una nueva variable a cada una de las
interacciones disponibles. Por tanto, este diseo tiene cuatro generadores que son:
D = AB E = AC F = BC G = ABC
175

2
3 1
III

2
7 4
III

2
15
III

2
7 4
III

CDIGO VARIABLE NIVELES


-1 1
A
B
C
D
E
F
G
Presin mordaza
Presin seguidor
Velocidad seguidor
Velocidad eje y
Velocidad eje b
Velocidad eje c
Ajuste utillaje
50
45
-5
7
7
7
2.2
60
55
+5
9
9
9
0.2
EXP.
NM. A B C
AB
D
AC
E
BC
F
ABC
G
RESP.
DIAM.
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
1
1
-1
-1
-1
-1
1
1
-1
1
1
-1
1
-1
-1
1
34.6
46.3
48.6
44.9
49.7
34.0
46.5
49.0
Tabla 8.13 Variables y niveles. Ejemplo del curvado Tabla 8.14 Matriz de diseo 2
7-4
. Ejemplo del curvado
Con lo que la relacin de definicin es:
I = ABD = ACE = BCF = ABCG
(productos de dos) = BCDE = ACDF = CDG = ABEF = BEG = AFG
(productos de tres) = DEF = ADEG = BDFG = CEFG
(productos de cuatro) = ABCDEFG
La relacin de definicin, adems de estar compuesta por los cuatro trminos obtenidos a partir
de los generadores, est compuesta por sus productos dos a dos, tres a tres, etc. Resulta evidente que
estos productos tambien proporcionan columnas slo de masas y que, por lo tanto, forman parte de la
relacin de definicin.
En general, un diseo 2
k-p
tiene p generadores y 2
p
trminos en la relacin de definicin
(incluyendo la I). Si no se incluye tiene 2
p
-1 trminos.
Una vez se tiene la relacin de definicin se puede calcular el patrn de confusin, de forma
anloga a cmo se hizo anteriormente. La nica diferencia es que ahora cada efecto estar confundido
con 15 efectos ms, cosa perfectamente razonable, ya que en 2
7
se pueden estimar 128 efectos; si slo
realizamos los ocho experimentos correspondientes a un 2
7-4
, slo podemos estimar ocho efectos y, por
tanto, cada uno de ellos tiene que estimar 128/8 = 16, es decir, cada efecto tiene que estar confundido
con otros 15. En este caso el patrn de confusin es:
A + BD + CE + ABCF + BCG + ABCDE + CDF + ACDG + BEF + ABEG + FG + ADEF +
DEG + ABDFG + ACEFG + BCDEFG
B + AD + ABCE + CF + ACG + CDE + ABCDF + BCDG + AEF + EG + ABFG + BDEF +
ABDEG + DFG + BCEFG + ACDEFG
C + ...
Como se ve, el patrn de confusin es, en los diseos altamente fraccionados, tedioso de
calcular y escasamente informativo. Por ello, cuando el nmero de confusiones es muy elevado, se
suele utilizar el patrn de confusin restringido, en el que slo se representan los efectos principales y
las interacciones de dos factores. En este caso es:
A + BD + CE + FG
B + AD + CF + EG
C + AE + BF + DG
D + AB + CG + EF
E + AC + BG + DF
F + BC + AG + DE
G + CD + BE + AF
En el ejemplo del tintado de fibras, los efectos se calcularon utilizando el algoritmo de los
signos. Para calcular los efectos en diseos fraccionales utilizando el algoritmo de Yates, se debe
proceder como si el diseo fuese el completo correspondiente al nmero de experimentos realizados y
a continuacin utilizar el patrn de confusin para identificar los efectos estimados. La tabla 8.15
muestra la utilizacin del algoritmo de Yates en el ejemplo de la operacin de curvado.
Representando los efectos en papel probabilstico normal, se obtiene la figura 8.3.
Ntese que a la vista de los efectos (con sus confusiones) que han resultado significativos, y
teniendo en cuenta que es extremadamente raro que la interaccin entre dos factores sea significativa
sin serlo el efecto principal de ninguna de ellas, hay cuatro interpretaciones posibles:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
176

DISEOS FACTORIALES FRACCIONALES


Los efectos activos son: B, E y G.
Los efectos activos son: B, E y BE.
Los efectos activos son: E, G y EG.
Los efectos activos son: B, G y BG.
Si los conocimientos previos sobre el
proceso no permiten quedarse con una de
ellas, se habrn de realizar ms experi-
mentos (estrategia secuencial) para aclarar
la situacin. En la seccin 8.7 se discuten
los posibles caminos a seguir.
Ntese que este diseo ha permitido
reducir el nmero de variables de las siete
iniciales a tres, es decir, ha servido para
realizar un screening.
8.4.4 Diseos intermedios
Entre las medias fracciones y los diseos saturados, existe toda una gama intermedia de diseos, que
permiten realizar menos experimentos que las medias fracciones y con confusiones ms favorables que
los diseos saturados. As, entre el 2
7-1
y el 2
7-4
existen el 2
7-2
y el 2
7-3
.
El procedimiento a seguir para su construccin es el mismo: escribir el diseo completo
correspondiente al nmero de experimentos que se desea realizar y asignar los factores restantes a las
interacciones.
El problema con los diseos intermedios es que no siempre es evidente a qu interacciones hay
que asignar los factores restantes para obtener diseos de mxima resolucin (que son los que tienen
un patrn de confusin ms favorable). El criterio, intuitivamente razonable, de asignarlos a las
interacciones de mayor orden disponibles no suele proporcionar el mejor diseo.
Veamos un ejemplo. Supngase que se desea estudiar los efectos de siete variables, pero que en
un primer experimento (estrategia secuencial) slo se est dispuesto a realizar 16 experimentos.
Ello implica realizar un diseo 2
7-3
. Para construirlo se parte de un diseo completo 2
4
y se
asignan los tres factores restantes a interacciones.
177

A B C RESP. (1) (2) (3) EFEC. EST. PATR. CONF.


-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
34.6
46.3
48.6
44.9
49.7
34.0
46.5
49.0
80.9
93.5
83.7
95.5
11.7
-3.7
-15.7
2.5
174.4
179.2
8.0
-13.2
12.6
11.8
-15.4
18.2
353.6
-5.2
24.4
2.8
4.8
-21.2
-0.8
33.6
44.2
-1.3
6.1
0.7
1.2
-5.3
-0.2
8.4
med
A
B
AB
C
AC
BC
ABC
media
A+BD+CE+FG
B+AD+CF+EG
D+AB+CG+EF
C+AE+BF+DG
E+AC+BG+DF
F+BC+AG+DE
G+CD+BE+AF
Tabla 8.15 Clculo de los efectos. Algoritmo de Yates. Ejemplo del curvado
20 10 0 -10
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos

G+CD+BE+AF
B+AD+CF+EG
E+BC+AG+DE
P
o
r
c
e
n
t
a
j
e
Fig. 8.3 Efectos en papel probabilstico normal. Ejemplo del curvado
En la tabla 8.16 aparece la matriz de diseo completa correspondiente al 2
4
y dos posibles
asignaciones.
Tabla 8.16 Matriz de diseo completa de un 2
4
con dos posibles asignaciones para construir un 2
7-3
Un posible conjunto de generadores sera, siguiendo el criterio de utilizar las interacciones de
mayor orden disponibles (primera asignacin):
E = ABCD F = ABC G = BCD
Con lo que la relacin de definicin sera:
I = ABCDE = ABCF = BCDG
= DEF = AEG = ADFG
= BCEFG
Y por lo tanto el diseo resultante es un .
Mientras que, en la segunda asignacin (ntese que en este caso no se utiliza la interaccin de
cuarto orden), los generadores son:
E = ABC F = BCD G = ACD
La relacin de definicin resultante es:
I = ABCE = BCDF = ACDG
= ADEF = BDEG = ABFG
= CEFG
Y, en consecuencia, proporcionan un diseo .
Por supuesto, para llevar a cabo el experimento slo son necesarias las columnas
correspondientes a los factores, esto es, las correspondientes a A, B, C, D, E, F y G.
En la seccin 8.6 se proporcionan tablas para facilitar la construccin de diseos fraccionales
de mxima resolucin.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
178

PRIMERA ASIGNACIN F G E
SEGUNDA ASIGNACIN E G F
EXP. A B C D AB AC AD BC BD CD ABC ABD ACD BCD ABCD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
2
7 3
IV

2
7 3
III

DISEOS FACTORIALES FRACCIONALES


8.5 Bloqueo
En la seccin 7.8 se introduca la utilidad de bloquear los diseos factoriales completos, cuando se
sospechaba que las condiciones bajo las que se iban a llevar a cabo los diferentes experimentos no eran
homogneas. Se comentaba que en la industria el motivo ms frecuente para recurrir al bloqueo era el
tener que llevar a cabo los experimentos a lo largo de un perodo dilatado de tiempo, pero que otros
motivos frecuentes eran cambios de turno, de operario, de materia prima, etc. Lgicamente, lo mismo
sucede con los fraccionales.
Como ya se vio en los captulos 5 y 6, bloquear resulta de utilidad cuando el efecto que provoca
la falta de homogeneidad en las condiciones de realizacin del experimento es aditivo. Es decir, no
provoca cambios en los efectos del resto de factores ni interacciona con ellos. Slo provoca un cambio
en el nivel de la respuesta, que se traduce en un cambio de nivel en la media.
Cmo se bloquea un diseo factorial? Para construir diseos en bloques se utiliza el mismo
principio que para construir diseos fraccionales. Confundir el efecto del bloque con alguna
interaccin, a ser posible, de las consideradas despreciables a priori.
8.5.1 Bloqueo de factoriales completos
Veamos qu ocurre (tabla 8.17) cuando un diseo 2
3
se divide en dos bloques, confundiendo el efecto
del bloque con la interaccin de tres factores.
Designamos a los factores de bloqueo mediante nmeros para distinguirlos de las variables del
experimento, que siempre hemos designado mediante letras maysculas.
Ntese que todos los experimentos del bloque I corresponden a los signos menos de la
interaccin ABC y todos los del bloque II a los signos ms. La figura 8.4 muestra la situacin.
En la figura 8.4, los experimentos enmarcados en un crculo corresponden al bloque I y los
normales (dentro de un cuadrado) al bloque II. Obsrvese que en cada cara del cubo hay dos
experimentos de cada bloque, con lo que al calcular los efectos principales -diferencias entre las
medias de las caras- el efecto bloque queda compensado. Lo mismo ocurre con las interacciones de dos
factores. Esta propiedad -que no es ms que una consecuencia de la ortogonalidad- se puede observar
tambin en la tabla 8.17, imaginando que se va a aplicar el algoritmo de los signos.
Por el contrario, la interaccin de tres factores estar confundida con el efecto bloque, ya que el
diseo se ha construido precisamente a partir de esa confusin. De hecho, el generador del diseo es:
179

NM FACTORES 1
EXP. A B C AB AC BC ABC BLOQUE
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
1
1
-1
-1
-1
-1
1
1
-1
1
1
-1
1
-1
-1
1
I
II
II
I
II
I
I
II
Tabla 8.17 Matriz de diseo de un 2
3
dividido en dos bloques
Fig. 8.4 Representacin grfica de un diseo 2
3
en
dos bloques de cuatro experimentos cada uno
1 = ABC
y la relacin de definicin es:
I = ABC1
Con lo que el patrn de confusin resultante es el que aparece en la tabla 8.18.
Tabla 8.18 Patrn de confusin de un 2
3
dividido en dos bloques
Como quiera que ya se ha comentado que los factores de bloqueo no interaccionan con las
variables del experimento (esas interacciones son cero), el nico efecto confundido es el de la
interaccin ABC. En lo sucesivo, escribiremos directamente el patrn de confusin sin incluir esas
interacciones.
8.5.2 Ejemplo de proceso qumico
Imaginemos que se lleva a cabo un experimento 2
3
con las variables siguientes y que la respuesta es la
cantidad obtenida.
Supngase, adems, que el experimento se debe realizar
en dos das distintos para no interferir en las necesidades de la
produccin. Como se sospecha que esto puede influir en el
resultado del experimento, se decide llevar a cabo el experimento
en dos bloques. El orden de experimentacin dentro
de cada bloque se decide aleatoriamente.
Los resultados del experimento, presentados
en el orden de realizacin, aparecen en la tabla 8.19.
Calculando los efectos, se puede utilizar
indistintamente el algoritmo de los signos o el de
Yates sin ms requisito que tener en cuenta las
confusiones. Se obtiene:
media = 43.5 AB = 1.0
A = 9.0 AC = 1.0
B = -1.0 BC = 3.0
C = -6.0 ABC + 1 = 6.0
Representados en papel probabilstico resulta
la figura 8.5.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
180

PATRN DE CONFUSIN INCLUIDAS


INTERACCIONES DE FACTOR DE BLOQUE
PATRN DE CONFUSIN DEL 2
3
EN 2 BLQ. DE 4 EXPERIM.
media + ABC1
A + BC1
B + AC1
C + AB1
AB + C1
AC + B1
BC + A1
ABC + 1
media
A
B
C
AB
AC
BC
ABC + 1
CDIGO VARIABLE
A
B
C
Temperatura
Concentracin
Velocidad agitacin
BLOQUE
NM.
STD A B C RESP.
I
6
4
1
7
1
1
-1
-1
-1
1
-1
1
1
-1
-1
1
41
46
42
33
II
5
3
8
2
-1
-1
1
1
-1
1
1
-1
1
-1
1
-1
38
43
50
55
Tabla 8.19 Matriz de diseo y respuesta. Ejemplo del
proceso qumico
DISEOS FACTORIALES FRACCIONALES
Con lo que resulta que los efectos
significativos son el A, el C y la interaccin
ABC confundida con el efecto bloque. Supo-
niendo la interaccin de tercer orden despre-
ciable, diremos que el efecto bloque es 6, es
decir, que la respuesta en los cuatro expe-
rimentos del primer bloque ha sido unifor-
memente seis unidades ms alta que en los
cuatro del segundo bloque.
Qu hubiese ocurrido en este expe-
rimento si no se hubiese bloqueado?
La tabla 8.20 muestra la respuesta que
se hubiese obtenido, en orden estndar, si los
ocho experimentos se hubiesen podido rea-
lizar el primer da.
Ntese que tanto las respuestas de la
tabla 8.19 como las de la tabla 8.21 se corres-
ponden con stas (tabla 8.20), para lo que
basta aadir 6 (el efecto bloque) a las
correspondientes a experimentos realizados el segundo da. Por supuesto, el efecto bloque tambin esta
sometido a variabilidad, y en la prctica nunca ser un valor constante.
La tabla 8.21 muestra los resultados obtenidos, en el orden de realizacin de los experimentos,
al realizar el experimento en dos das diferentes y sin bloquear.
Con lo que los efectos resultan:
media = 43.5 AB = 1.0
A = 9.0 AC = 1.0
B = -1.0 BC = 9.0
C = -6.0 ABC = 0.0
Que representados en papel probabilstico normal proporcionan la figura 8.6.
181

10 0 -10
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos

A
ABC + 1
C
Porcentaje
Fig. 8.5 Efectos en papel probabilstico normal. Ejemplo del
proceso qumico
NM.
STD A B C RESP.
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
42
49
37
46
32
41
33
44
Tabla 8.20 Matriz de diseo y respuesta si todos los
experimentos se hubiesen realizado el primer da. Ejemplo
del proceso qumico
NM.
STD A B C RESP. DA
4
6
5
3
8
1
2
7
1
1
-1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
46
41
32
37
50
48
55
39
1
1
1
1
2
2
2
2
Tabla 8.21 Matriz de diseo y respuesta, experimentos
realizados en das diferentes, sin bloquear. Ejemplo del
proceso qumico
Fig. 8.6 Efectos en papel probabilstico normal. Ejemplo qumico realizado en dos das diferentes sin bloquear
Con lo que se hubiese llegado a la errnea conclusin de que los efectos significativos son el A,
el C y el BC.
8.5.3 Factoriales completos divididos en ms de dos bloques
Si el experimento anterior se hubiese tenido que llevar a cabo en cuatro das en lugar de dos, el diseo
se hubiese tenido que dividir en cuatro bloques de dos experimentos cada uno. Veamos cmo hacerlo.
Para ello habr que introducir dos generadores de bloque (en general para coseguir 2
k
bloques
se requieren k generadores de bloque):
1 = AB
2 = AC
Con lo que la matriz de diseo ser la de tabla 8.22.
El criterio utilizado para asignar experi-
mentos a bloques es que aquellos que tienen los
mismos signos en los dos generadores de bloque
quedan incluidos en el mismo bloque.
Con estos generadores de bloques, la
relacin de definicin queda:
I = AB1 = AC2 = BC12
Y, por tanto, el patrn de confusin es:
media AB + 1
A AC + 2
B BC + 12
C ABC
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
182

15 10 5 0 -5 -10 -15
99
95
90
80
70
60
50
40
30
20
10
5
1
Efectos
Porcentaje
A
BC
C
EXP. FACTORES 1 2 BLOQUE
NM. A B C AB AC
1
2
3
4
5
6
7
8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
1
-1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
I
II
III
IV
IV
III
II
I
Tabla 8.22 Matriz de diseo de un 2
3
en cuatro bloques de dos
experimentos (un factor de bloqueo)
DISEOS FACTORIALES FRACCIONALES
Hay varios aspectos destacables en este patrn de confusin:
En primer lugar que la interaccin BC aparece confundida con 12, cuando se ha dicho que los
bloques no interaccionaban. La explicacin es simple: entre los cuatro bloques definidos hay tres
grados de libertad (anlogamente, en el caso anterior entre los dos bloques definidos haba un grado de
libertad) y, por tanto, se requieren tres columnas para poder estimar sus efectos. Por tanto, 12 no define
una interaccin entre bloques, sino que define un factor de bloqueo exactamente con las mismas
implicaciones que el factor 1 o el factor 2.
Por otra parte, se requiere que la interaccin ABC no est confundida con ningn efecto bloque.
Dejamos al lector que averige las consecuencias de utilizar la interaccin triple como generador de
bloque. En este caso resulta sencillo hallar los generadores ms apropiados, pero en general puede ser
un problema complejo; por ello en la seccin 8.6 se proporcionan tablas (tabla 8.25) para facilitar el
bloqueo.
El diseo construido es de resolucin III, ya que las interacciones de dos estn confundidas con
efectos de un slo factor, aunque en este caso sea de bloqueo. La resolucin de los diseos
bloqueados es, como en los fraccionales, la
longitud del trmino ms corto de la relacin de
definicin, con la nica consideracin de que en
los trminos con interacciones entre factores de
bloqueo, stas cuentan como un solo factor. As, el
trmino AC12 tiene longitud tres.
El diseo que acabamos de comentar sirve
para acomodar un factor (da de realizacin del
experimento) de bloqueo con cuatro niveles
(cuatro das diferentes). O bien, para acomodar dos
factores de bloqueo (da de realizacin de
experimento y operario), cada uno de ellos a dos
niveles (dos das distintos, 1 y 2, y dos operarios,
A y B). La tabla 8.23 muestra cmo hacerlo.
8.5.4 Fraccionales divididos en bloques
Hasta ahora hemos bloquedo diseos factoriales completos. La tcnica es igualmente til para bloquear
diseos factoriales fraccionales.
Cosidrese el caso en el que se desean estudiar 6 variables en cuatro bloques y solamente
diecisis experimentos. Lo que se requiere es un diseo 2
6-2
divido en cuatro bloques. Los generadores,
que se pueden hallar en la tabla de la seccin 8.6, son:
E = ABC
F = BCD
1 = ACD
2 = ABD
Se requieren dos generadores para el fraccional y dos para los bloques. Estos generadores se
podran haber hallado por tanteo -lamentablemente no hay ninguna regla que permita hallarlos de
forma sencilla-, pero hubiese resultado tedioso.
En la tabla 8.24 aparece la matriz de diseo, ya dividida en bloques.
183

EXP. FACTORES 1 2 BLOQUE DA OPER.


NM. A B C AB AC
1
8
2
7
3
6
4
5
-1
1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
I
I
II
II
III
III
IV
IV
1
2
1
2
A
A
B
B
Tabla 8.23 Matriz de diseo de un 2
3
en cuatro bloques de
dos experimentos (dos factores de bloqueo)
Tabla 8.24 Matriz de diseo de un 2
6-2
en cuatro bloques de cuatro experimentos
La relacin de definicin es:
I =ABCE=BCDF=ACD1=ABD2
=ADEF=BDE1=CDE2=ABF1=ACF2=BC12
=CEF2=BEF2=AE12=DF12
=ABCDEF
Aparentemente el diseo es de resolucin IV,
pero recurdese que 12 es de longitud uno y, por tanto,
los trminos en los que aparece son de longitud tres,
por lo que el diseo es de resolucin III.
El patrn de confusin que proporciona es:
Como se ve, las confusiones no estn repartidas uniformemente. En otros diseos la
distribucin puede ser mucho ms irregular, por lo que, al asignar las variables del experimento a las
columnas de la matriz de diseo, es conveniente tener presente el patrn de confusin, y realizar la
asignacin de manera que aquellos efectos que a priori parezcan ms importantes les correspondan
confusiones ms favorables.
Hallar los generadores que proporcionan diseos fraccionales bloqueados con mxima
resolucin no es tarea sencilla, ya que desgraciadamente no existe una regla y se han de hallar por
tanteo. Por ello la tabla 8.25 de la seccin siguiente proporciona los generadores para los diseos ms
comnmente utilizados.
8.6 Tablas de diseos fraccionales
En esta seccin presentamos una tabla (tabla 8.25a y 8.25b) que proporciona los generadores para todos
los diseos factoriales, completos o fraccionales y bloqueados o no, que implican la realizacin de 8
16 experimentos. Se han omitido de la tabla los diseos compuestos por cuatro experimentos, tanto por
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
184

NM. ABC BCD ACD ABD BLOQUE


STD A B C D E F 1 2
1
8
10
15
-1
1
1
-1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
1
1
-1
-1
-1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
I
3
6
12
13
-1
1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
-1
1
1
1
-1
-1
1
1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
II
4
5
11
14
1
-1
-1
1
1
-1
1
-1
-1
1
-1
1
-1
-1
1
1
-1
1
1
-1
1
1
-1
-1
1
1
1
1
-1
-1
-1
-1
III
2
7
9
16
1
-1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
1
-1
-1
1
-1
-1
1
1
1
1
1
1
1
1
1
1
IV
CONFUNDIDO CON
INTERACCIONES DE 3 O MS
CONFUSIONES
MS SERIAS
media
A
B
C
D
E
F
1
2
AB + CE
AC + BE
BC + AE + DF + 12
AD + EF
BD + CF
CD + BF
AF + DE
DISEOS FACTORIALES FRACCIONALES
razones de espacio como de sencillez de construccin. Los diseos con 32 experimentos requeriran una
tabla de gran tamao, cuya inclusin no consideramos justificada dado lo infrecuente de su utilizacin.
La tabla proporciona un nico conjunto de generadores. Obviamente se pueden utilizar las
reglas comentadas en el apartado 8.7 (a continuacin) para, cambiando los signos de los generadores,
obtener fracciones complementarias.
Los generadores que aparecen son aquellos que proporcionan diseos con mxima resolucin.
Incluso, en los casos en que para un diseo se pueden encontrar varios conjuntos de generadores que
producen la misma resolucin, el conjunto suministrado es el que proporciona un patrn de confusin
ms favorable. De tal manera que en muchas ocasiones, se pueden hallar conjuntos de generadores que
producen patrones de confusin del mismo tipo que el conjunto proporcionado, pero nunca mejor.
Tabla 8.25a Diseos factoriales, completos y fraccionales, bloqueados y sin bloquear. Hasta siete factores con ocho y 16
experimentos
185

NM. DE EXPERIMENTOS
NM. 8 16
FACT. SIN
BLQ
2 BLQ de
4 EXP.
4 BLQ de
2 EXP.
SIN
BLQ
2 BLQ de
8 EXP.
4 BLQ de 4
EXP.
8 BLQ de
2 EXP.
3 2
3
1=ABC 1=AB
2=AC
4
D=ABC D=ABC
1=AB
D=ABC
1=AB
2=AC 1=ABCD
1=ABC
2=BCD
1=AB
2=BD
3=BC
5
D=AB
E=AC
D=AB
E=AC
1=BC E=ABCD
E=ABC
1=BCD
E=ABC
1=BCD
2=ACD
E=ABC
1=AB
2=BD
3=BC
6
D=AB
E=AC
F=BC
D=AB
E=AC
F=BC
1=ABC
E=ABC
F=BCD
E=ABC
F=BCD
1=ACD
E=ABC
F=BCD
1=ACD
2=ABD
E=ABC
F=BCD
1=AB
2=BD
3=BC
7
D=AB
E=AC
F=BC
G=ABC
E=ABC
F=BCD
G=ACD
E=ABC
F=BCD
G=ACD
1=ABD
E=ABC
F=BCD
G=ACD
1=AB
2=BD
E=ABC
F=BCD
G=ACD
1=AB
2=BD
3=BC
2
3
IV
2
3
IV
2
4 1
IV

2
4 1
III

2
4 1
II

2
5 2
III

2
5 2
III

2
5 1
V

2
4
V
2
5 1
IV

2
5 1
III

2
4
IV
2
4
III
2
5 1
III

2
6 2
III

2
6 2
III

2
6 2
IV

2
6 2
IV

2
6 3
III

2
6 3
III

2
7 4
III

2
7 3
IV

2
7 3
IV

2
7 3
III

2
7 3
III

MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD


186

NM. 16 EXPERIMENTOS
FACT. SIN BLQ 2 BLQ de 8 EXP. 4 BLQ de 4 EXP. 8 BLQ de 2EXP.
8
E=ABC
F=BCD
G=ACD
H=ABD
E=ABC
F=BCD
G=ACD
H=ABD
1=ABCD
E=ABC
F=BCD
G=ACD
H=ABD
1=ABCD
2=BC
E=ABC
F=BCD
G=ACD
H=ABD
1=ABCD
2=AB
3=AC
9
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
1=AB
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
1=AB
2=AC
10
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
1=AC
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
1=AC
2=AD
11
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
I=AD
E=ABC
F=BCD
G=ACD
H=ABD
J=AB
K=AC
L=AC
L=AD
1=BC
2=BD
12
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
1=BC
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
1=BC
2=BD
Tabla 8.25b Diseos factoriales,
completos y fraccionales, bloque-
ados y sin bloquear. De ocho a 12
factores con 16 experimentos
2
8 4
IV

2
8 4
III

2
8 4
III

2
8 4
III

2
9 5
III

2
9 5
III

2
9 5
III

2
10 6
III

2
10 6
III

2
10 6
III

2
11 7
III

2
11 7
III

2
11 7
III

2
12 8
III

2
12 8
III

2
12 8
III

DISEOS FACTORIALES FRACCIONALES


En la tabla 8.25 aparece, adems, la
resolucin del diseo, lo que permite prever
el tipo de confusiones que proporciona un
diseo determinado. Este hecho es de gran
importancia, ya que entonces se puede
decidir si es conveniente cambiar el nmero
de factores (aadir o suprimir alguno), el
nmero de bloques, o incluso si es posible
disminuir el nmero de experimentos o
conviene aumentarlo, para conseguir el tipo
de confusin deseada.
8.7 Estrategia secuencial utilizando diseos fraccionales
Los diseos fraccionales permiten explotar al mximo la estrategia secuencial en la experimentacin
y, en muchas ocasiones, conseguir la informacin deseada con un menor nmero de experimentos
La idea de comenzar una investigacin realizando un nmero de experimentos del orden del
40% del total disponible, adquiere especial relevancia cuando se conocen y utilizan los diseos
fraccionales. Ahora bien, la utilizacin de esta estrategia plantea la necesidad de saber, a la vista de las
conclusiones extradas en un primer experimento, cul es el siguiente experimento a realizar, de forma
que d respuesta a las cuestiones que hayan quedado pendientes y se aprovechen los concimientos
adquiridos en el primero.
En esta seccin comentamos una serie de cuestiones que, adems de poder resultar de utilidad
al aplicar la estrategia secuencial, contribuirn, sin duda, a desarrollar una mejor comprensin de los
temas ya tratados.
Antes, sin embargo, queremos dejar constancia de que los caminos a seguir en una investigacin
son mltiples y no hay ninguno que a priori se pueda considerar el mejor. Con frecuencia, slo al
concluir la investigacin se puede afirmar cul hubiese sido el camino que, con menor esfuerzo, nos
hubiera conducido a las conclusiones correctas. sta es precisamente la justificacin para la utilizacin
de la estrategia secuencial poder corregir el camino a medida que se avanza por l. Es por ello que lo
187

13 FACTORES 14 FACTORES 15 FACTORES


SIN
BLQ
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
N=BC
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
N=BC
O=BD
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
N=BC
O=BD
P=CD
2
BLQ
de
8
EXP.
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
N=BC
1=BD
E=ABC
F=BCD
G=ACD
H=ABD
J=ABCD
K=AB
L=AC
M=AD
N=BC
O=BD
1=CD
Tabla 8.25c Diseos factoriales, completos y fraccionales,
bloqueados y sin bloquear. De 13 a 15 factores con 16 experimentos
2
14 10
III

2
13 9
III

2
15 10
III

2
13 9
III

2
14 10
III

comentado en esta seccin son cuestiones que pueden resultar de utilidad, pero que en ningn caso
pueden reemplazar la creatividad y los conocimientos sobre el sistema estudiado por el investigador.
8.7.1 Advertencias
Los mtodos y tcnicas que se exponen a continuacin estn basados en la idea de que el investigador
utilizar las mismas variables a los mismos niveles en la fraccin aadida y en la original. Obviamente
esto no tiene por qu ser as. Es ms, en la mayora de ocasiones, el anlisis de los resultados del primer
experimento permitir descartar alguna variable, aconsejar cambiar los niveles de otras, o sealarn
la necesidad de incluir alguna nueva variable que inicialmente no se tuvo en cuenta. Cuando sea as,
se pueden analizar los resultados de cada experimento por separado y luego extraer conclusiones
conjuntas de todos ellos, pero si se deseasen analizar los resultados de todos los experimentos
conjuntamente, la forma de proceder es recurrir a la regresin lineal (mtodo que queda excluido del
mbito de este libro).
Siempre que, utilizando la estrategia secuencial, se realizen experimentos con el mismo sistema
de forma consecutiva, hay que tener en cuenta la posibilidad de que entre el primer y el segundo
experimento se hayan producido cambios en el sistema, quiz no detectados por el investigador, pero
que afecten a la respuesta. En otras palabras, hay que tener en cuenta la posible existencia de un efecto
bloque entre el primer y el segundo experimento.
8.7.2 Fracciones complementarias
En el ejemplo del tintado de fibras se vio que, combinando las dos medias fracciones (2
5-1
), se
consegua reproducir el diseo 2
5
completo. Y se coment una manera fcil de obtener la media
fraccin complementaria: cambiar de signo el generador. Esto es siempre posible, aun cuando los
diseos sean mucho ms fraccionados. El procedimiento es sencillo: basta con cambiar de signo los
generadores del diseo fraccional original para obtener nuevas fracciones de la misma familia.
Segn la notacin empleada, un diseo 2
k-p
es una fraccin 1/2
p
del diseo completo y su
construccin requiere p generadores. Pues bien, para generar las 2
p
fracciones que unidas reconstruyen
el diseo completo, basta con considerar que cada uno de los p generadores se puede escribir con signo
+ y con signo -, y escribir los 2
p
conjuntos de p generadores resultado de combinar los signos.
Veamos un ejemplo. Supongamos que tras realizar un 2
6-3
(los ocho experimentos de este diseo
representan 1/8 de los 64 experimentos del diseo completo)
con generadores:
D = AB
E = AC
F = BC
obtenidos a partir de la tabla 8.25, se desea aadir ocho
experimentos ms (una nueva fraccin 2
6-3
), de tal manera
que juntas proporcionen un diseo 2
6-2
. Adems de la
fraccin realizada inicialmente, hay otras siete fracciones
que representan un octavo del diseo completo. En la tabla
8.26 aparecen los generadores que permiten construirlas.
Considerando conjuntamente los ocho diseos que
proporciona la tabla 8.26 se obtendra un 2
6
completo.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
188

FRACCIN GENERADORES
1
2
3
4
5
6
7
8
D=AB
D=-AB
D=AB
D=AB
D=-AB
D=-AB
D=AB
D=-AB
E=AC
E=AC
E=-AC
E=AC
E=-AC
E=AC
E=-AC
E=-AC
F=BC
F=BC
F=BC
F=-BC
F=BC
F=-BC
F=-BC
F=-BC
Tabla 8.26 Los ocho conjuntos de tres gene-
radores que proporcionan diseos 2
6-3
DISEOS FACTORIALES FRACCIONALES
Con cualquier conjunto de generadores de los que aparecen en la tabla 8.26 conseguiramos
nuestro propsito. Consideremos el de la fraccin nmero 5. Cal sera la relacin de definicin del
diseo 2
6-2
resultante?
La relacin de definicin de la primera fraccin es:
I = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF
La de la segunda fraccin es:
I = -ABD = -ACE = BCF = BCDE = -ACDF = -ABEF = DEF
Para obtener la del diseo combinado, no hay ms que recordar que cada trmino de la relacin
de definicin significa que, multiplicando los signos de las columnas de cada una de las letras que lo
compone, se obtiene una nueva columna slo con signos ms. Resulta entonces evidente que la
relacin de definicin del diso 2
6-2
obtenido ser:
I = BCF = BCDE = DEF
Es decir, estar compuesta por aquellos trminos que tengan el mismo signo en las relaciones
de definicin de las dos fracciones.
El diseo 2
6-2
obtenido es, pues, de resolucin III, mientras que, si se hubiese planificado de
entrada un 2
6-2
se hubiese podido escoger de resolucin IV. Aunque no siempre, en muchas ocasiones ste
es el precio que se paga por el hecho de utilizar la estrategia secuencial. A cambio, no hay que olvidar
que la segunda fraccin la hemos escogido entre siete posibles, y que cada una de ellas proporciona para
el diseo combinado una relacin de definicin diferente y, por tanto, un patrn de confusin diferente.
Como la eleccin se realiza sabiendo los resultados de la primera fraccin, siempre se puede aadir una
segunda que proporcione un patrn de confusin conjunto para aclarar los puntos conflictivos.
Cuando se desea aadir una fraccin para clarificar confusiones entre los efectos significativos
detectados en una primera fraccin, hay unas reglas que pueden resultar de utilidad.
En los diseos de resolucin III, al aadir una nueva fraccin obtenida de la siguiente forma:
Multiplicando por -1 (cambiar de signo) los signos de una columna correspondiente a una
variable, se obtiene un diseo combinado en el que esa variable y todas las interacciones de dos
en las que est involucrada estn confundidas con interacciones de orden superior.
Ejemplo: Considrese el caso del curvado , en el que los generadores eran:
D = AB, E = AC, F = BC y G = ABC y la relacin de definicin:
I = ABD = ACE = BCF = ABCG
= BCDE = ACDF = CDG = ABEF = BEG = AFG
= DEF = ADEG = BDFG = CEFG
= ABCDEFG
que proporciona el patrn de confusin restringido:
A + BD + CE + FG
* B + AD + CF + EG
C + AE + BF + DG
D + AB + CG + EF
* E + AC + BG + DF
F + BC + AG + DE
* G + CD + BE + AF
189

2
7 4
III

Se han marcado con un asterisco los que resultan significativos. A la vista de esto, las
interpretaciones posibles son:
- Los efectos activos son: B, E y G.
- Los efectos activos son: B, E y BE.
- Los efectos activos son: E, G y EG.
- Los efectos activos son: B, G y BG.
Para aclarar la situacin se podra llevar a cabo una nueva fraccin 2
7-4
, cambiando los signos
de alguno de los tres efectos principales (B, E o G). Supongamos que cambiamos los de B. Los
generadores de la nueva fraccin seran D = -AB, E = AC, F = -BC y G = -ABC, y la relacin
de definicin conjunta de las dos fracciones (obtenida tomando slo aquellos trminos que
tengan el mismo signo en las dos fracciones):
I = ACE = ACDF = CDG = AFG = DEF = ADEG = CEFG
que proporciona el siguiente patrn de confusin restringido (ntese que slo aparecen 14
efectos. De los dos restantes, uno estima la media y sus confusiones, y el otro interacciones de
orden superior):
A + CE + FG AB
B AD + CF + EG
C + AE + DG BC
D + CG + EF BD
E + AC + DF BE
F + AG + DE BF
G + CD + AF BG
Obsrvese que se ha conseguido la propiedad deseada. Obsrvese tambin que, casi con toda
seguridad, se solventaran los problemas de interpretacin planteados en la primera fraccin.
Multiplicando por -1 (cambiar de signo) los signos de todas las variables, se obtiene un diseo
combinado de resolucin IV. Es decir, un diseo en el que los efectos principales slo estn
confundidos con interacciones de orden tres o superior.
Ejemplo: En el mismo caso del curvado, cambiando de signo todos los factores, la segunda
fraccin tendra como generadores: D = -AB, E = -AC, F = -BC y G = ABC, y la relacin de
definicin del diseo combinado sera, por tanto:
I = ABCG = BCDE = ACDF = ABEF = ADEG = BDFG = CEFG
Con lo que claramente el diseo combinado es de resolucin IV y proporciona el siguiente
patrn de confusin restringido (de nuevo aparecen nicamente catorce efectos, los dos
restantes estiman la media e interacciones de orden superior):
A AB + CG + EF
B AC + BG + DF
C AD + CF + EG
D AE + BF + DG
E BC + AG + DE
F BD + CE + FG
G CD + BE + AF
Tambin este diseo hubiese servido para aclarar las dudas planteadas tras el analisis del
ejemplo del curvado.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
190

DISEOS FACTORIALES FRACCIONALES


Como ya se ha comentado, estas reglas nicamente son aplicables a los diseos de resolucin
III. En los diseos de resolucin IV, las reglas son distintas. Al aadir una fraccin de la siguiente
forma:
Multiplicando por -1 (cambiar de signo) los signos de una columna correspondiente a una
variable, se obtiene un diseo combinado en el que todas las interacciones de dos en las que esa
variable est involucrada estn confundidas con interacciones de orden superior.
Si todos los trminos de la relacin de definicin son de longitud cuatro, multiplicar por -1
(cambiar de signo) los signos de todas las variables reproduce la fraccin original y, por tanto,
no tiene ninguna utilidad. Ahora bien, si en la relacin de definicin, adems de terminos de
longitud cuatro, hay trminos ms largos, entonces al cambiar de signo todas las columnas se
obtiene un diseo combinado de resolucin superior a IV. Es decir, un diseo en el que las
interacciones de dos no estn confundidas entre ellas.
8.7.3 Efecto bloque al aadir fracciones
Como ya se ha comentado, al aadir una segunda fraccin hay que tener en cuenta la posible existencia
de un efecto bloque entre el primer y el segundo experimento.
Considrese de nuevo el ejemplo del tintado. En la seccin 8.2 se describe un primer diseo 2
5-1
y en la seccin 8.4 se describe cmo se le aade la fraccin complementaria (un nuevo 2
5-1
).
Recordando que para la estimacin de la media utilizamos el smbolo I (la columna slo con
+1), en la tabla 8.12 vemos que en las dos fracciones la media (I) est confundida con ABCDE. Pero
en forma distinta, ya que en la primera fraccin es I + ABCDE y en la segunda es I - ABCDE.
Si se piensa que puede haber un efecto bloque entre las dos fracciones, lo que en realidad se
est pensando es que las dos medias pueden ser diferentes. Llamemos I
1
a la de la primera fraccin y
I
2
a la de la segunda. Entonces la tabla 8.27 resume la situacin y los efectos hallados (tomados de la
tabla 8.12).
El efecto bloque vendr dado, en consecuencia, por la diferencia entre la media de la primera
fraccin I
1
y la media de la segunda I
2
(efecto bloque = I
1
- I
2
). Ntese que estar confundido con la
interaccin ABCDE, ya que al hacer la diferencia entre la estimacin de la primera y la segunda
fraccin obtenemos:
(I
1
- I
2
) + 2(ABCDE) = -0.4
no pudiendo separar el efecto bloque de la interaccin ABCDE.
Por supuesto, si los diseos que se combinan estn ms fraccionados, el efecto bloque estar
confundido con ms interacciones. As, si consideramos el caso de combinar dos diseos 2
5-2
,
tendramos la situacin de la tabla 8.28.
191

FRACCIN PATRN DE CONFUSIN EFECTO


1
2
I1 + ABCDE
I2 - ABCDE
7.3
7.7
DISEO GENERADORES RELACIN DE DEFINICIN
1
2
25-2
25-2
D = AB, E = AC
D = AB, E =-AC
I1 = ABD = ACE = BCDE
I2 = ABD = -ACE = -BCDE
Tabla 8.27 Patrn de confusin (ejemplo del tintado)
considerando un posible efecto bloque entre las dos
fracciones
Tabla 8.28 Generadores y patrn de confusin de dos diseos 2
5-2
realizados secuencialmente
Y por tanto el efecto bloque (I
1
- I
2
) estara confundido con las interacciones ACE y BCDE. De
hecho la confusin vendra dada por:
(I
1
- I
2
) + 2(ACE) + 2(BCDE)
8.7.4 Adicin de experimentos para conseguir clarificaciones puntuales
En ocasiones, tras la realizacin de un diseo fraccional, no se desea ni aadir variables, ni cambiar los
niveles, ni realizar una nueva fraccin con todos los factores, sino realizar el mnimo de experimentos
que permitan aclarar algn aspecto (en general una confusin) que haya quedado oscuro, o simplemente
confirmar frente a una confusin que el responsable de la significacin es el efecto sospechado.
Se ha comentado ya que cada experimento realizado supone un grado de libertad y permite, en
consecuencia, estimar un efecto. Ello significa que si
nicamente se desea eliminar la confusin entre dos efectos,
con un experimento que permita estimar uno de ellos libre de la
confusin con el otro tendramos suficiente para conseguir
nuestro propsito. En la prctica necesitaremos dos
experimentos adicionales, ya que utilizaremos uno de los
grados de libertad para estimar un posible efecto bloque.
Consideremos de nuevo el ejemplo del curvado. Tras el
anlisis se haba hallado que los efectos significativos eran los
de la tabla 8.30.
Si aceptamos la idea de que es muy difcil que la
interaccin de dos factores sea significativa sin que lo sean los efectos principales de los factores que
la componen (apndice 8.2), la explicacin ms creble -ya comentada en elapartado 8.4- es que los
responsables sean los factores B, E y G, o sus interacciones.
Frente a esta situacin hay muchas maneras de proceder para resolver las dudas. Algunas de
ellas son:
Aadir una nueva fraccin 2
7-3
como se ha comentado en este mismo apartado.
Experimentar con estas tres variables (2
3
), manteniendo o no los niveles.
Experimentar con dos de estas tres variables, realizando un 2
2
completo.
Experimentar con estas tres variables ms alguna nueva que haya podido surgir en el transcurso
de la investigacin.
Aadir el mnimo nmero de experimentos que permitan clarificar la situacin.
En cada caso el investigador deber escoger entre estas y otras opciones aquella que mejor se
adapte a sus necesidades.
Supongamos que en este caso la escogida es la ltima, sin que ello signifique que sea la mejor
opcin. De hecho, en este caso concreto, realizando un 2
2
completo con dos variables de las tres
implicadas, se obtiene el mismo nmero de experimentos y una mayor sencillez de anlisis. De todas
formas, el objetivo es describir un procedimiento que sea general y aplicable a muchas otras
situaciones.
Como se desean deshacer tres confusiones (B+EG, E+BG y G+BE), el mnimo nmero de
experimentos que permite clarificar la situacin (permitiendo detectectar la posible existencia de un
efecto bloque) es de cuatro. Se podran haber deshecho todas las confusiones existentes entre los
efectos significativos, pero esto hubiese requerido 10 experimentos.
Para escoger estos cuatro hay que tener en cuenta dos cuestiones:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
192

PATRN DE CONFUSIN EFECTO


media
B+AD+CF+EG
E+AC+BG+DF
G+CD+BE+AF
44.2
6.1
-5.3
8.4
Tabla 8.30 Efectos significativos, con sus
confusiones, en el ejemplo del curvado
DISEOS FACTORIALES FRACCIONALES
Que los efectos que se desea desconfundir tengan signos (niveles) diferentes.
Que considerando la totalidad de experimentos (los ya realizados y los que se aaden), la matriz de
diseo sea lo ms ortogonal posible.
En general, no ser ortogonal, pero
algunas elecciones proporcionan
correlaciones entre los coeficientes
menores (matriz ms ortogonal)
que otras (matriz menos ortogonal).
As, en el caso que nos ocupa, un
posible conjunto de cuatro experimentos
que cumple la primera cuestin es el de la
tabla 8.31.
Ntese que las cuatro variables, A, C, D y F, que haban resultado inertes, se mantienen
constantes, en este caso al nivel alto. En general, se mantendrn a aquel nivel que resulte ms
econmico o conveniente.
Tambin conviene destacar que no debe preocupar el hecho de que, en los experimentos
aadidos, haya confusiones entre los efectos. Como el nmero que se aade suele ser muy pequeo,
este hecho es inevitable. A este respecto, lo nico importante es que las columnas correspondientes a
los efectos entre los que se desea eliminar la confusin tengan signos distintos. En la tabla 8.31 resulta
fcil comprobar que esto ocurre y que, por supuesto, los signos de BE, BG y EG se han obtenido
multiplicando convenientemente los de B, E y G.
Sin embargo, es posible aadir cuatro experimentos que permiten estimar los efectos de inters
con menor correlacin entre ellos. En la tabla 8.32 aparecen estos cuatro experimentos.
Tabla 8.32 Cuatro experimentos adicionales que producen estimaciones
poco correlacionadas. Caso del curvado
La correlacin entre B y EG, E y BG, y G y BE es menor, ya que en los cuatro experimentos
aadidos los signos de estas tres parejas de columnas (que en los ocho experimentos iniciales eran
exactamente iguales) son totalmente contrarios. No siempre es posible conseguirlo completamente,
pero conviene tener en cuenta que las columnas entre las que se desea eliminar la confusin tengan el
mximo nmero de signos opuestos en los experimentos aadidos.
En la tabla 8.32 aparece, adems, la respuesta correspondiente a los cuatro experimentos que,
por ser ms ortogonales, se realizaron. El problema que surge es cmo incorporarlos a los ocho
anteriores para obtener una estimacin de los efectos de inters. Esto se puede conseguir siempre (si
bien en aquellos casos en que la correlacin entre los efectos sea muy elevada, se pueden plantear
problemas de clculo al invertir la matriz XX) por el mtodo de los mnimos cuadrados (en el
apndice 7A aparece una breve descripcin).
Un mtodo alternativo es plantear un sistema de ecuaciones con la informacin disponible.
De los ocho primeros experimentos hemos aprendido que los factores A, C, Dy F son inertes y que:
193

A C D F B E G BE BG EG
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
1
-1
1
-1
-1
1
1
1
1
1
1
1
-1
-1
1
-1
1
-1
1
-1
-1
1
1
A C D F B E G BE BG EG RESP.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
1
-1
1
-1
-1
1
1
-1
1
1
-1
1
-1
-1
1
1
1
-1
-1
1
-1
1
-1
45.5
43.1
33.0
46.4
Tabla 8.31 Cuatro experimentos para deshacer las confusiones.
Caso del curvado
B + EG = 6.1
E + BG = -5.3
G + EB = 8.4
A partir de los cuatro experimentos adicionales podemos plantear las cuatro ecuaciones
siguientes:
I
2
+ 1/2(- B - E - G + BE + BG + EG) = 45.5
I
2
+ 1/2(+ B - E + G - BE + BG - EG) = 43.1
I
2
+ 1/2(- B + E + G - BE - BG + EG) = 33.0
I
2
+ 1/2(+ B + E - G + BE - BG - EG) = 46.4
donde I
2
representa la media de este segundo bloque de cuatro experimentos aadidos y los efectos
estn multiplicados por 1/2 para que, tal como se explica en la seccin 7.7, representen lo que cambia
la respuesta al cambiar una unidad el nivel.
Resolviendo el sistema planteado de siete ecuaciones con siete incgnitas, se obtiene que:
I
2
= 42.00
B = 5.80
E = -4.95
G = 0.25
BE = 8.15
BG = -0.35
EG = 0.30
Y, por tanto, la confusin queda deshecha, ya que claramente los efectos significativos son el B
(presin del seguidor), el E (velocidad del eje b) y su interaccin. La media de los primeros ocho
experimentos era I
1
= 44.2, por lo que no est claro si se ha producido un descenso de nivel o puede
ser atribuible al ruido, pero en cualquier caso no afecta a las conclusiones.
En este ejemplo no haba, tras los primeros experimentos, ningn efecto no confundido que
fuese significativo. Si lo hubiese habido naturalmente se tendra que haber incorporado a las
ecuaciones. Por ejemplo, si el efecto de A hubiese sido 12, en las ecuaciones hubiese tenido que
aadirse un trmino 1/2(A), es decir, 6. Con signo + en aquellas ecuaciones correspondientes a
experimentos en los que A hubiese estado a nivel alto (todos en este caso) y signo - en caso caso
contrario. Entonces cobra sentido incorporar I
2
a las ecuaciones, ya que en el ejemplo descrito, el valor
de I
2
coincide con el promedio de los cuatro experimentos aadidos.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
194

DISEOS FACTORIALES FRACCIONALES


Apndice 8A Teora de la proyeccin
Se ha comentado en la seccin 8.1 que una de las justificaciones para la utilizacin de los diseos
fatoriales fraccionales es el cumplimiento del principio de Pareto respecto al tamao de los efectos. El
principio es aplicable a la situcin, frecuente en la industria, de tratar de encontrar entre los muchos
factores que pueden afectar a una respuesta los pocos que, en general, la afectan apreciablemente. En
estos casos se suelen utilizar diseos altamente fraccionados (de resolucin III), que provocan patrones
de confusin complejos.
Relacionada con este principio est la teora de la proyeccin de diseos fraccionales. En
esencia, esta teora dice que, cuando tras realizar y analizar un diseo fraccional con k factores, uno
resulta inerte, es como si se hubiese realizado un experimento con solo k-1 factores (y el mismo
nmero de experimentos) y, por tanto, se hubiese utilizado un diseo menos fraccionado.
Para ver con ms detalle la idea de proyeccin, supongamos que de los k factores considerados
slo un subconjunto pequeo de tamao d desconocido, cuya identidad tambin es desconocida, sern
activos (producirn efectos principales e interacciones apreciables) y que los restantes k-d sern inertes.
En estos casos, si se trabaja con diseos 2
k-p
y al analizar los resultados se comprueba que varios
factores son inertes, el diseo resultante en los factores activos puede tener un patrn de confusin
mucho ms favorable que el diseo original.
Como ilustracin consideremos el caso de un 2
3-1
con factores A, B y C. Si una de las tres
variables resulta ser inerte, cualesquiera que sea, el diseo proporciona un diseo 2
2
completo en las
dos variables activas (ver figura 8A.1).
Sobre la relacin de definicin, el efecto de eliminar un factor que ha resultado ser inerte es el
de suprimir todos los trminos en los que ste apareca. As, en el 2
3-1
la relacin de definicin es I =
ABC, por lo que al eliminar cualquier factor la relacin de definicin desaparece, indicando que el
diseo proyeccin es un factorial completo.
En general al proyectar (eliminar los factores que han resultado inertes) se pueden obtener
diseos factoriales fraccionales (replicados o no) o diseos factoriales completos (replicados o no),
dependiendo del diseo de partida y de los factores que
resulten inertes.
Los diseos de resolucin R se proyectan como
factoriales completos en cualquier subconjunto de R-1
factores. As:
el 2
3-1
es de resolucin III y se proyecta como un
completo en cualquier subconjunto de dos
variables.
un 2
7-3
de resolucin IV se proyecta como un
factorial completo 2
3
(replicado) en cualquier
subconjunto de tres variables.
un 2
15-11
de resolucin III se proyecta como un
factorial completo 2
2
(replicado cuatro veces) en
cualquier subconjunto de dos variables.
De hecho, es posible ir ms all de lo enunciado,
ya que este mismo diseo 2
15-11
se proyecta como un
factorial completo 2
3
(replicado) en 420 de los 455
subconjuntos posibles de tres variables, y como un
factorial completo 2
4
en 840 de los 1365 subconjuntos
posibles de cuatro variables.
195

Fig. 8A Proyeccin de un diseo 2


3-1
en tres
diseos 2
3
completos
El problema que se plantea en todo lo expuesto es que, al proyectar un diseo altamente
fraccionado, se est dando por supuesto que los factores cuyo efecto principal no es importante no
interaccionan con los dems. Recurdese que las interaccionas de dos factores estarn, en general
(resolucin III), confundidas con los efectos principales y, por lo tanto, es obligado admitir que son
indistinguibles del ruido sin ningn tipo de comprobacin, si se desea eliminar ese factor.
Por este motivo, la teora de la proyeccin resulta ms util como justificacin para la utilizacin
de diseos fraccionales que como herramienta prctica al analizarlos. A continuacin, en el apndice
8B, se expone una posible justificacin para su utilizacin en la prctica.
Apndice 8B Significacin de las interacciones de dos factores
Al interpretar los resultados de diseos factoriales fraccionales, especialmente si son de resolucin
inferior a V, se plantea el problema de tener que decidir si es factible que una interaccin de dos
factores que est confundida con otras interacciones de dos o incluso con algn efecto principal sea
significativa.
Una consideracin que puede ayudar a resolver las
dudas es la siguiente: es raro que aparezca una interaccin
de dos factores significativa sin que lo sea por lo menos uno
de los efectos principales de los dos factores que la
componen, y extremadamente raro sin que los sea ninguno
de ellos.
Veamos estas dos situaciones a travs de un ejemplo
sencillo. Supongamos que al representar la interaccin de
dos factores A y B obtenemos el grfico de la figura 8b.1,
donde X
1
, X
2
, X
3
y X
4
representan la media de las respuestas
obtenidas bajo las condiciones de A y B indicadas.
A la vista del grfico, est claro que los efectos son:
Y, por lo tanto, para que A = 0 y AB 0, se debe cumplir que:
X
2
+ X
4
= X
1
+ X
3
X
1
+ X
4
X
2
+ X
3
Cosa que ocurre, por ejemplo, cuando:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
196

Fig. 8B
A
X X X X
=
+ +
1 2 3 4
2
B
X X X X
=
+ +
1 2 3 4
2
AB
X X X X
=
+
1 2 3 4
2

+1
+2
X
1
X
3
X
4
X
2
-1 FACTOR A +1
F
A
C
T
O
R

B
DISEOS FACTORIALES FRACCIONALES
X
1
= 50
X
2
= 40
X
3
= 10
X
4
= 20
Estos casos son relativamente raros. Ya que, adems de que el efecto de una variable tiene que
cambiar de signo al cambiar el nivel de la otra, stos se han de compensar. Pinsese en la forma de la
superficie de respuesta que valores de este tipo implican.
Con todo, el caso anterior se presenta en la prctica con cierta frecuencia, incluso mayor de lo
que la intuicin parece indicar. Lo que es extremadamente raro es el segundo caso mencionado, es
decir, que ninguno de los dos factores tenga efecto significativo y s lo tenga su interaccin. Para que
esto ocurra (A=0, B=0 y AB0) debe suceder que:
X
2
+ X
4
= X
1
+ X
3
X
1
+ X
2
= X
3
+ X
4
X
1
+ X
4
X
2
+ X
3
Cosa que ocurre, por ejemplo, cuando:
X
0
= 50
X
1
= 40
X
2
= 10
X
3
= 20
Como se ve, esto implica haber escogido los niveles de las variables de forma tal que la zona
de la superficie de repuesta hallada sea realmente particular.
Estos criterios han sido los utilizados en el ejemplo del curvado de la seccin 8.4 para decidir
cules eran las interpretaciones ms probables de los resultados hallados.
197

10
50
20
40
10
50
20
40
En los captulos 7 y 8 se han expuesto las tcnicas de diseo y anlisis de experimentos, que permiten
al experimentador seleccionar aquellos factores que influyen en una determinada caracterstica de
calidad, y los niveles de los mismos que optimicen tal caracterstica en la regin donde se haya
experimentado.
En la prctica, el experimentador desea extender estos objetivos a otras regiones de
experimentacin y se pregunta: qu factores influyen en la caracterstica en general?, cul es la
regin ptima?, cmo se relacionan los factores con la respuesta en esta regin?
En este captulo presentaremos tcnicas que comprenden lo que se denomina metodologa de
superficie de respuesta (MSR), que permitirn encontrar la regin de inters y contestar a las anteriores
preguntas en esta regin.
9.1 Introduccin. Necesidad de los modelos
Uno de los deseos ms fuertes que a lo largo de la historia ha mostrado la humanidad es el de modelar
la realidad, es decir, el de encontrar funciones matemticas que expliquen los distintos fenmenos de
ndole fsica, social, econmica, etc.
Este deseo de encontrar modelos responde principalmente a las dos aplicaciones ms
inmediatas que se pueden derivar de ellos:
a) La capacidad de predecir o explicar el valor de cierta respuesta Y una vez conocidos los valores
de ciertas variables X
1
, X
2
,..., X
k
.
b) El hecho de poder seleccionar aquellas condiciones de los factores X
1
, X
2
,..., X
k
que permitan
optimizar la respuesta Y.
Aunque, como veremos en el captulo 10, conocer el modelo ayuda tambin a:
c) Determinar aquellas condiciones de los factores X
1
, X
2
,..., X
k
en que la respuesta sea ms robusta
o insensible al efecto de variaciones en factores que no son controlados por el experimentador
(tales factores se denominan factores ruido).
En la prctica, es muy difcil intentar resolver este problema de buscar un modelo nico, si no
utpico. En su lugar, se intenta aproximar tales relaciones de forma local a travs de funciones
polinmicas de primer y segundo orden. Adems, el anlisis de estas aproximaciones permitir, como
se ver ms adelante, localizar la regin ptima de una manera secuencial.
9
Introduccin a la metodologa
de superficie de respuesta
201
La figura 9.1 refleja la utilidad del uso de
aproximaciones locales para abordar la relacin
terica de la respuesta. En esta figura se ha
representado con curvas de nivel una supuesta
relacin entre cierta caracterstica Y, y dos
factores
1
y
2
, en un amplio rango de
variacin de estos dos factores. Aunque la
mejor funcin que expresa tal relacin en toda
la regin es una funcin complicada, en la
regin R
1
podra aproximarse dicha relacin
mediante un modelo lineal, ya que el incre-
mento de la respuesta parece ser lineal en tal
regin. Sin embargo, en la zona R
2
cercana al
mximo, la superficie ya presenta evidencia de
curvatura y, por lo tanto, la aproximacin local
se ha de hacer con modelos que incluyan trmi-
nos cuadrticos.
En la prctica, generalmente nunca se
obtendr el modelo que rige la relacin
existente para cualquier combinacin de los factores, sino que se obtendrn aproximaciones locales a
tal modelo en diferentes regiones de los factores.
Tabla 9.1 Grado de conocimiento y objetivos en las diferentes etapas de la investigacin
9.2 Grado de conocimiento y objetivos
Los modelos pueden ser, atendiendo al mtodo que se siga para obtenerlos, mecanicistas o
empricos (este tema fue anteriormente tratado en el apartado 7.1 del captulo 7). En los primeros
se utilizan leyes fsicas especializadas en el dominio concreto para seleccionar la estructura del
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
202

Fig. 9.1 Relacin entre una caracterstica Y con dos factores


1
y
2
a travs de las curvas de nivel
GRADO DE
DESCONOCIMIENTO OBJETIVO NOMBRE DESCRIPTIVO
ESTADO
Determinar el subconjunto de las
variables importantes de un con-
junto X grande de variables poten-
cialmente importantes
Eliminacin de variables
Diseos factoriales fraccionales
CUL
Determinar empricamente los
efectos de las variables conocidas
Determinar una aproximacin de
f( , ) mediante interpolacin local
g( , )
Construccin del modelo emprico
Diseo de experimentos
Metodologa de superficie de
respuesta
CMO
Determinar f
Determinar
Construccin de un modelo
mecanicista
Estimacin de un modelo
mecanicista
POR QU
f

'

'

'

X

INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
modelo y, en general, es necesario estimar los parmetros que en ellos aparecen a travs de la recogida
de datos.
Cuando no se tiene conocimiento terico de la estructura del modelo, se hace una
aproximacin de forma emprica con los datos obtenidos en la experimentacin. Tal experimentacin
se ha de realizar de una forma secuencial y con una metodologa que depender del grado de
conocimiento que se tenga del problema. Este conocimiento ayudar en la seleccin de un modelo
que se ajuste a la respuesta y en la seleccin del diseo a realizar para poder estimar todos los
parmetros de inters.
La tabla 9.1 presenta la relacin existente entre el grado de conocimiento que se tiene de un
problema, los objetivos en cada instante y la metodologa estadstica que se lleva a cabo para conseguir
tales objetivos.
A la etapa de seleccin de variables y estimacin de sus efectos se han dedicado los captulo 7
y 8 de este libro y a ellos remitimos a aquellos lectores que deseen ampliar estos puntos.
En una primera etapa experimental, los mtodos que se denominan metodologa de superficie
de respuesta utilizan la experimentacin para lograr principalmente tres objetivos:
Encontrar un modelo capaz de explicar la relacin existente entre cierta respuesta seleccionada
y determinados factores en una regin de inters.
Localizar las condiciones ptimas de los factores de experimentacin para la respuesta (las
condiciones que hagan mxima la respuesta, por ejemplo).
Realizar un estudio geomtrico de la relacin existente entre la respuesta y los factores en la
regin ptima, por medio del anlisis cannico del modelo estimado.
El logro de tales objetivos est ligado a las caractersticas que definen la MSR. En primer
lugar, es una metodologa secuencial: la aproximacin a la regin de inters se realiza de forma
iterativa utilizando diseos cada vez ms complejos dependiendo de la informacin que se obtiene en
cada etapa.
En segundo lugar, el mtodo de trabajo que se utiliza es el descrito en el ciclo PDCA (ver el
apartado 1.2.2 del captulo 1), que consiste esencialmente en plantear un modelo tentativo, seleccionar
un diseo que permita estimar los parmetros de inters, analizar los datos y verificar si el modelo
planteado es adecuado.
9.3 Estrategias de la metodologa de superficie de respuesta
La metodologa de superficie de respuesta contiene toda una serie de estrategias que el investigador
puede seguir para estimar el modelo, f(,), que relaciona la respuesta de inters Y con los factores
lo ms adecuadamente posible, con el mnimo coste de experimentacin. El investigador acta como
un detective buscando las pistas que le lleven a la resolucin del problema. Tales pistas son obtenidas
a travs de la informacin que proporciona la experimentacin secuencial.
Al comienzo de la experimentacin se puede conocer poco del problema y en tal caso es
razonable suponer que la regin donde se comienza a experimentar est lejos de la regin ptima. Si
es as, una aproximacin suficientemente buena a f(,) es la que se obtiene con modelos lineales de
primer orden estimados a partir de diseos factoriales fraccionales a dos niveles.
Por el contrario, cuando se tiene un conocimiento ms preciso sobre la relacin existente, o se
est prximo a la regin ptima, el experimentador se aproxima a la relacin f(,) mediante modelos
de segundo orden estimados a partir de diseos ms complejos.
Por lo tanto, distinguiremos entre dos tipos de estrategias:
203

Estrategias de primer orden:


Diseo 2
k-p
Estimacin por mnimos cuadrados
1
Modelos de primer orden
Mapas de contornos o curvas de nivel
Camino de mximo ascenso o steepest ascent
Estrategias de segundo orden:
Diseo central compuesto
Estimacin por mnimos cuadrados
Modelos de segundo orden
Mapas de contornos y anlisis cannico
En la primera etapa, a la vez que se emplean los diseos 2
k-p,
se pueden llevar a cabo otras
acciones propias de los comienzos de la experimentacin, tales como borrar o aadir factores en el
diseo, cambiar la escala de variacin de los factores, replicar para una mejor estimacin del error
experimental, aadir fracciones para romper las confusiones, etc. Estas acciones, representadas
grficamente en la figura 9.2, tienen en comn que, utilizadas adecuadamente, ayudan a salir de
diversas situaciones de incertidumbre.
Por otra parte, en cada momento existen mtodos de chequeo que permitirn comprobar si el
modelo lineal de primer orden es suficientemente bueno, o detectar una evidencia de curvatura en la
respuesta. Este hecho implicar la seleccin de modelos de segundo orden y, por tanto, estrategias de
segundo orden.
En cuanto al modelo matemtico a utilizar para aproximar f(,), se emplearn funciones
polinmicas g(X,) de primer o segundo grado, las cuales pueden ser interpretadas como las resultantes
de hacer el desarrollo de Taylor de f(,) alrededor de (0,0), centro de la experimentacin en unidades
codificadas, cortando el desarrollo en los trminos de primer o segundo grado respectivamente.
Estos polinomios tienen la siguiente estructura para el caso particular de dos factores:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
204

Figura 9.2 Algunas acciones que se llevan a cabo con ms frecuencia durante las primeras etapas de la
experimentacin. (A: Borrar o aadir factores; B: Cambiar la escala; C: Replicar y D: Aadir fracciones )
Y X X + + +
0 1 1 2 2
Y X X X X X X + + + + + +
0 1 1 2 2 11 1
2
22 2
2
12 1 2
1
La estimacin de los efectos en diseos 2
k-p
tal como se ha realizado en los captulos 7 y 8 utilizando la regla de los signos
o el algoritmo de Yates, es equivalente a la estimacin por mnimos cuadrados.
( ) g x X X
H
, + + +
0 1 1 2 2
(9.1)
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
para los modelos de primer orden, y
para los modelos de segundo orden. En ambos, representa el efecto de aquellos factores que no se
han tenido en cuenta en la experimentacin o el efecto de aquellos presentes en el estudio, pero cuyo
efecto no se ha podido recoger adecuadamente con el modelo seleccionado.
Los modelos de segundo orden necesitan ms experimentos para ser estimados y slo se recurre
a ellos cuando existe evidencia de curvatura en el modelo y, por lo tanto, la aproximacin lineal no es
adecuada. Para poder detectar la curvatura, a los diseos de primer orden 2
k-p
se les aaden puntos
centrales, los cuales, como se ver en el apartado 9.4, permitirn realizar un test de curvatura.
Aquellas regiones de experimentacin en las que la superficie no presenta evidencia de
curvatura son interpretadas como regiones lejanas a la zona ptima y, una vez ms, existe una
estrategia consistente en acercarse lo ms rpidamente a esta zona a lo largo de la direccin de mximo
cambio de la respuesta. La figura 9.3 presenta las dos
ltimas estrategias para k=2 factores.
Por ltimo, una vez se detecta la cercana de la
regin ptima, se pasa a la utilizacin de estrategias de
segundo orden. Una de ellas consiste en la seleccin de
un diseo de segundo orden apropiado que permita una
buena estimacin de un modelo cuadrtico.
Los diseos ms utilizados son los diseos
centrales compuestos que aparecen en la figura 9.4,
obtenidos al aadir un diseo estrella a un diseo
factorial. Las caractersticas de estos diseos en cuanto
a los niveles en que se han de colocar los factores,
propiedades de las estimaciones obtenidas, etc., se
estudiarn ms adelante en el apartado 9.5.
Una vez obtenida una aproximacin cuadrtica
que se ajuste a la superficie, es conveniente realizar un
anlisis cannico del modelo resultante para interpretar
de manera sencilla la geometra de la superficie
estimada en la regin de experimentacin y obtener
informacin que pueda ser til para sugerir posibles
explicaciones tericas del problema.
205

( ) g x x x x x x x
H
, + + + + + +
0 1 1 2 2 12 1 2 11 1
2
22 2
2
(9.2)
Fig. 9.3 Estrategias de experimentacin. A) Aadir
puntos centrales para detectar curvatura. B)
Experimentar a lo largo del camino de mximo
crecimiento o decrecimiento
Fig. 9.4 Diseo central compuesto formado al aadir un diseo estrella
a un diseo 2
k-p
En lo que queda de captulo se van a desarrollar las diferentes estrategias presentadas en este
apartado, aplicadas en un ejemplo particular, el de la fundicin de una determinada pieza de aluminio
por inyeccin.
El apartado 9.4 se dedica a las estrategias secuenciales de primer orden, los test de curvatura y
los mtodos de seleccin del modelo lineal. A continuacin, en el apartado 9.5 se presenta la tcnica
del camino de mximo ascenso (descenso).
En el apartado 9.6 aparecen las estrategias de segundo orden, la estimacin del modelo
cuadrtico y los test que permiten la comprobacin de la validez del modelo obtenido.
Finalmente, el apartado 9.7 est dedicado al anlisis cannico de la superficie obtenida. En este
mismo apartado se incluir la clasificacin cannica de las superficies en funcin de su modelo
cannico.
9.4 Aproximacin lineal a las condiciones ptimas
El presente ejemplo trata de un proceso de fundicin de tapas de aluminio por inyeccin, en el que se
intenta minimizar el ndice de porosidad encontrado en ellas. Tal ndice es obtenido mediante un
mtodo estndar a travs de rayos-X. Al parecer la temperatura del aluminio lquido y la presin con
que ste se inyecta en el molde afectan al ndice de porosidad de la placa resultante.
Los objetivos de la experimen-
tacin son encontrar unas condi-
ciones ptimas de trabajo en las
cuales la porosidad sea mnima, y
estimar la relacin existente entre
el ndice de porosidad con la
temperatura y la presin, en una
regin prxima a las condiciones
ptimas.
Los conocimientos que sobre
el tema tienen los tcnicos del
proceso recomiendan no trabajar con
temperaturas externas al intervalo
600-900 C ni con presiones por de-
bajo de 700 Kg/cm
2
. Tales restriccio-
nes definen la regin de operabilidad.
En la figura 9.5 se presentan
las estrategias de primer orden que
se seguirn en este ejemplo. En
primer lugar se plantea la hiptesis
sobre el modelo que mejor apro-
xima la respuesta en la zona de
experimentacin de partida. Puesto
que estamos en los comienzos de la
experimentacin y poco conoce-
mos, se asume que las condiciones
ptimas no tienen por qu estar
prximas y que, por lo tanto, la
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
206

Fig. 9.5 Estrategias de primer orden en el ejemplo de la porosidad en tapas de


aluminio
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
superficie de respuesta puede ser aproximada
mediante un modelo de primer orden.
Para estimar tal modelo se selecciona un
diseo 2
2
con dos puntos centrales tal como aparece
en la tabla 9.2.
Los puntos centrales permitirn comprobar
mediante un test de curvatura que se presenta en
(9.13), si el modelo de primer orden es adecuado
o, por el contrario, se necesita un modelo de se-
gundo orden.
Adems, el hecho de tener rplicas (en este
caso para 650C y 975 Kg/cm
2
) permite obtener una
estimacin de
2
independiente del modelo selec-
cionado. Tal estimacin puede ser comparada con la
estimacin obtenida a travs de los residuos del modelo mediante un test de comparacin de varianzas,
tal como se vio en el apartado 4.12 del captulo 4. En el caso de que ambas estimaciones difieran
significativamente, tendremos la prueba de que el modelo propuesto no se ajusta bien a la superficie y
tendremos que pensar en transformar los datos o en aproximaciones cuadrticas.
El diseo anterior permite estimar los parmetros de un modelo como el presentado en (9.1) que
puede ser expresado en forma matricial como:
donde Y corresponde al vector de observaciones, X es la matriz de diseo, es el vector de los
parmetros del modelo y es el vector de errores. Para el ejemplo que nos ocupa:
La estimacin mnimo cuadrtica de los coeficientes del modelo en 9.3 se puede realizar
empleando las tcnicas de regresin lineal, lo cual equivale a resolver la ecuacin siguiente:
con
obtenindose los resultados
207

TEMPERATURA
(C)
PRESIN
(kg/cm
2
)
NDICE DE
POROSIDAD
-1 (640) -1 (950) 6.09
+1 (660) -1 (950) 5.53
-1 (640) +1 (1.000) 6.78
+1 (660) +1 (1.000) 6.16
0 (650) 0 (975) 5.93
0 (650) 0 (975) 6.12
Tabla 9.2 Resultados de un primer experimento con
llantas de aluminio. Entre parntesis figuran las unidades
originales de los factores
Y X e +
(9.3)
Y X

1
]
1
1
1
1
1
1
1
1

1
]
1
1
1
1
1
1
1
1

1
]
1
1
1
6 09
553
6 78
616
593
612
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
0
0
0
1
2
.
.
.
.
.
.
, ,

(9.4)
( ) ( ) b X X X Y X X

' '

'
1
2
1
Varianza (b) = (9.5)
( ) X X X ' '
/
/
/
/
/
/
/
/
/
/
/
/
/ /

1
]
1
1
1
1
1 6
1 4
1 4
1 6
1 4
1 4
1 6
1 4
1 4
1 6
1 4
1 4
1 6
0
0
1 6
0
0
(9.6)
y, por lo tanto, todos los coeficientes significativos.
En esta etapa, y tal como aparece en la figura 9.5, se ha de comprobar si existe alguna prueba
de que el modelo lineal estimado no sea una buena aproximacin a la respuesta y se necesiten modelos
ms complejos, es decir, modelos cuadrticos.
Ello equivale a plantear el siguiente test:
H
0
= Modelo esperado:
H
1
= Modelo temido
2
:
o en forma matricial
H
0
= Modelo esperado:
H
1
= Modelo temido:
donde Z corresponde a la matriz de trminos cuadrticos y al vector de sus coeficientes.
El test que se debe utilizar para tomar una decisin en (9.8) est relacionado con las
consecuencias que se derivan de aceptar como mejor aproximacin la que da un modelo lineal (H
0
),
cuando en realidad la mejor es la de un modelo cuadrtico (H
1
).
En efecto, si se estiman los parmetros del modelo como en (9.5), suponiendo que H
0
es cierta,
cuando en realidad lo es H
1
se obtiene
es decir,
con A = (XX)
-1
XZ denominada matriz de alias o de confusiones.
Esta confusin en las estimaciones para el caso de las tapas de aluminio es
Por lo tanto, en caso de que b
11
+b
22
fuese significativo, al aproximar la superficie mediante
modelos lineales se comete un error en la estimacin de la constante del modelo.
Los diseos de primer orden no pueden estimar por separado
11
y
22
, pero s su efecto
conjunto,
11
+
22
. La estimacin de tal efecto por mnimos cuadrados es equivalente a comparar los
promedios de la porosidad en el centro de la superficie con el promedio en las esquinas del cubo, tal
como lo muestra la figura 9.6.
Luego el test de hiptesis planteado en (9.8) sobre la necesidad de modelos de segundo orden
es equivalente al test de hiptesis:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
208

1
]
1
1
1

1
]
1
1
1
610
0 29
0 33
0 045
0 055
0 055
.
.
.
.
.
.
Desv. estandar (b)
y x x + + +
0 1 1 2 2
y x x x x x x + + + + + +
0 1 1 2 2 12 1 2 11 1
2
22 2
2
Y X +
Y X Z + +
(9.8)
2
The Feared Model tal como lo denomina el profesor N. Draper, autor, junto con G. Box, del libro Empirical Model-Building
and Response Surfaces.
[ ] ( )
[ ]
( ) [ ] ( ) ( ) ( ) E b E X X X Y X X X E Y X X X X Z X X X Z + +

' ' ' ' ' ' ' '
1 1 1 1

[ ]
E b A + (9.10)
[ ] ( ) E b
0 0 11 22
2
3
+ +
[ ] [ ]
E b E b
1 1 2 2
;
(9.11)
H Y Y
H Y Y
0
1
0
0
:
:
cubo centro
cubo centro

'

(9.12)
(9.9)
(9.7)
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
sobre la existencia de curvatura, que puede comprobarse comparando el valor del estadstico
con el valor de la t de Student con grados de libertad, siendo los grados de libertad con los que se
ha estimado ,. a partir de s.
En el ejemplo de las tapas, al aplicar la ecuacin 9.12 se obtiene
con s
2
=0.012 estimada con 3 grados de libertad. Por lo tanto,
al obtener un valor no significativo, no encontramos
evidencia de curvatura. En consecuencia, no se puede
rechazar Ho en (9.8), y concluimos que el modelo lineal
realiza una aproximacin suficientemente buena de la
respuesta de inters.
En consecuencia, se intuye que se est lejos de la
regin ptima y, por lo tanto, la siguiente estrategia ser la de
en alejarse lo ms rpidamente posible en la direccin de
mximo decrecimiento (se desea obtener llantas con mnimo
ndice de porosidad) hacia las condiciones ptimas de
experimentacin, y all volver a plantear un diseo de primer
orden con puntos centrales, o directamente uno de segundo si
existe alguna evidencia de curvatura.
9.5 Aproximacin por el camino de mxima pendiente
En este momento del experimento, la estrategia que se debe adoptar es la de experimentar a lo largo
de la direccin de mximo decrecimiento hasta que la porosidad deje de disminuir. Tal hecho indicar
que, o bien se ha cruzado la zona ptima, o bien hay que rectificar la direccin de mximo
decrecimiento.
Siguiendo con el ejemplo de las tapas de aluminio, a partir del modelo
Y = 6.10 - 0.29 T + 0.33 P (9.14)
obtenido de (9.7), se puede obtener la direccin de mximo crecimiento de la respuesta a travs de la
direccin del gradiente, la cual se obtiene derivando respecto a cada factor,
y, por lo tanto, la direccin de mximo decrecimiento ser la opuesta,
d=[0.29, -0.33] (9.16)
209

Fig. 9.6 Figura que representa la diferencia


entre la respuesta en el centro y en las
esquinas del cubo en una superficie que
presenta curvatura
Y Y
s n s n
cubo centro
cubo centro

+
2 2
/ /
(9.13)
614 6 025
0 012 4 0 012 2
121
. .
. / . /
.

+
(9.14)

Y
T
0 29 .

Y
P
033 .
(9.15)
la cual marca una direccin orientativa sobre la direccin a seguir en los nuevos experimentos. Si se
desea experimentar en puntos a distancias de una unidad, similar a la distancia entre las condiciones
experimentales anteriores, se puede utilizar el vector unidad como vector orientativo.
El nmero de experimentos que
deben realizarse y la cercana de stos
depende en todo momento del cono-
cimiento que tenga el experimentador
sobre el proceso. En el ejemplo de las
tapas se han realizado cuatro
experimentos ms, cada uno a dos
unidades de distancia del anterior, tal
como lo muestra la tabla 9.3.
Cabe notar que, para obtener
los valores originales de la temperatura y la presin, basta con descodificar las unidades de la tabla 9.3
utilizando las expresiones:
donde x
1
y x
2
son los valores de la temperatura y la presin en unidades codificadas.
La direccin de mximo decrecimiento se ha de tomar como un camino orientativo, pero los
experimentos no tienen porqu coincidir exactamente con tal direccin. En el ejemplo de las tapas, los
valores en unidades originales resultantes de descodificar las cuatro posiciones se han adaptado a la
operabilidad del proceso.
Como se puede observar, la porosidad ha ido disminuyendo excepto en el experimento 4, donde
ha vuelto a aumentar significativamente. Ello induce a pensar que se ha atravesado la superficie y
que por lo tanto, no es recomendable proseguir experimentando por este camino, aunque exista
incertidumbre sobre la zona por donde se ha atravesado.
Si sta es la zona ptima, la superficie ha de mostrar una curvatura tal, que ser necesario
utilizar modelos de segundo orden para aproximarla. En cambio, si no es as, pudiera ser que la
aproximacin por modelos de primer orden fuese todava lo suficientemente buena como para
continuar por este camino. En tal situacin, se seguira experimentando posteriormente a lo largo de
una direccin del steepest descent rectificada.
En cualquier caso, la MSR permite experimentar secuencialmente utilizando un diseo de
primer orden para estimar el modelo plano, pudiendo aadir en un segundo bloque uno de
segundo orden, si se llega a la conclusin de que el modelo lineal no se ajusta suficientemente bien
a la respuesta.
En el ejemplo de las tapas, seleccionando el experimento 3 de la tabla 9.3 como el centro de
la nueva regin de experimentacin, se ha decidido utilizar un diseo de primer orden y se han
obtenido los resultados que aparecen en la tabla 9.4. El experimento sealado con una flecha es el
experimento 3 de la etapa anterior; se ha considerado conveniente incluirlo para una mejor estimacin
de la respuesta.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
210

POSICIN TEMPERATURA
( C)
PRESIN
(Kg/cm
2
)
NDICE DE
POROSIDAD
1 3 u = (2.01, -2.25) 670 920 4.53
2 5u = (3.35, -3.75) 685 880 3.28
3 7u = (4.69, -5.25) 700 845 2.54
4 9u = (6.03, -6.85) 710 805 4.15
Tabla 9.3 Experimentos adicionales en la direccin de mximo decrecimiento
x
T
x
P
1 2
650
10
975
25


[ ]
u

1
]
1

0 295
0 44
0 33
0 44
0 67 0 75
.
.
,
.
.
. , .
(9.17)
T x P x + + 650 10 975 25
1 2
(9.18)
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
Con las rplicas de este experimento se puede obtener una estimacin del error experimental
con dos grados de libertad. Asimismo, se puede obtener otra estimacin del error con un grado de
libertad con las rplicas del primer experimento, que se
encuentran en la tabla 9.2. Ponderando estas dos
estimaciones se obtiene una estimacin de
2
con tres
grados de libertad de s
2
= 0.0318. Esta estimacin, obtenida
a travs de rplicas, se denomina error puro.
A continuacin se trata de repetir los pasos del
apartado 9.4 para confirmar si el modelo lineal realiza una
aproximacin suficientemente buena a la superficie o si, por
el contrario, existen indicios de curvatura. Aplicando el test
de curvatura de (9.13) para los datos en la tabla 9.4 se obtiene:
que es un valor estadsticamente significativo en la t de Student con tres grados de libertad. Por lo
tanto, en el test planteado en (9.8) se rechaza la hiptesis nula y se acepta que el modelo de segundo
orden:
se aproxima mejor a la respuesta.
As pues, ahora es el momento de comenzar a utilizar las estrategias de segundo orden, que
estn esquemticamente representadas en la figura 9.7.
Fig. 9.7 Estrategias de segundo orden
211

TEMPERATURA
(C)
PRESIN
(kg/cm
2
)
NDICE DE
POROSIDAD
-1 (690) -1 (820) 2.20
+1 (710) -1 (820) 3.71
-1 (690) +1 (870) 2.86
+1 (710) +1 (870) 3.49
0 (700) 0 (845) 2.53
0 (700) 0 (845) 2.30
0 (700) 0 (845) 2.54 %
Tabla 9.4 Resultados del experimento 3 en el
ejemplo de las llantas de aluminio.
Y Y
s n s n
cubo centro
cubo centro


+
2 2
306 2 46
014 1 4 1 3
/ /
. .
. / /
(9.19)
y x x x x x x + + + + + +
0 1 1 2 2 12 1 2 11 1
2
22 2
2
(9.20)
9.6 Aproximacin cuadrtica. Diseos centrales compuestos
En estos momentos de la experimentacin se ha de aadir un segundo diseo al realizado anteriormente
en la tabla 9.4 si se quiere estimar un modelo cuadrtico con la precisin suficiente.
El hecho de realizar la experimentacin en dos tiempos puede provocar un efecto bloque (ver
el apartado 7.8 del captulo 7 sobre efectos bloque si se quiere ampliar el tema), que puede afectar a la
estimacin de los efectos si las condiciones experimentales del segundo diseo no se han seleccionado
adecuadamente.
Para que esto no ocurra, es decir, para que la estimacin de los factores sea independiente del
hecho de haber experimentado en dos bloques, el efecto bloque ha de ser ortogonal a efectos de las
dems variables.
Si adems se desea que las estimaciones de los factores sean independientes entre s, los dos
diseos han de ser ortogonales en sus factores y ortogonales con los bloques.
El primer diseo,
ya cumple la condicin de ortogonalidad, basta con multiplicar las columnas del diseo entre s y
observar que todos los productos se anulan.
El segundo diseo, denominado diseo estrella, contiene los experimentos dispuestos de la
siguiente forma
donde y el nmero de puntos centrales n
0e
se han de determinar segn los criterios que se explican a
continuacin.
El resultado de aadir un diseo factorial y un diseo estrella se conoce como diseo central
compuesto o central composite design. La forma de tal diseo para tres factores se puede ver en la
figura 9.4.
La seleccin de y n
0e
est basada en dos criterios: el criterio de ortogonalidad mencionado
anteriormente y el criterio de rotabilidad. Se dice que un diseo es rotable si la precisin en la
estimacin de la superficie es igual para todos los puntos equidistantes del centro del diseo,
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
212

1
]
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
0
0
X

1
]
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0


INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
independientemente de la direccin en que se encuentren; es decir, se puede girar la superficie sobre
su centro y la precisin en la estimacin es la misma.
La rotabilidad en diseos centrales compuestos slo depende del valor de y del nmero de
experimentos que se haya realizado en el cubo sin contar los puntos centrales, N
c
, a travs de la frmula,
La condicin de ortogonalidad en cambio, implica que las estimaciones de los parmetros en el
modelo (9.20) son independientes entre s e independientes a su vez del efecto bloque. Para que esto
ocurra se han de cumplir dos condiciones:
1. Cada bloque debe contener un diseo ortogonal.
2. La fraccin del total de la suma de cuadrados de cada variable x
i
en cada bloque debe ser igual
a la fraccin del nmero total de observaciones distribuidas en cada bloque. Es decir, para cada
variable i y sobre cada bloque b se ha de cumplir:
i = Indicador de la variable i.
j = Indicador de la observacin j de la variable i en el bloque b.
n
b
= Nmero de observaciones en el bloque b.
N = Nmero total de observaciones.
Llamando n
0c
y n
0e
al nmero de puntos centrales en el cubo y en el diseo estrella
respectivamente, y k al nmero de factores en el diseo, al aplicar la condicin de ortogonalidad (9.24)
al caso particular de los diseos compuestos centrales se obtiene la frmula simplificada siguiente
donde N
c
el nmero de puntos en el primer diseo exceptuando los puntos en el centro. (N
c
ser de la
forma 2
k
o 2
k-p
.)
La tabla 9.5 muestra algunos diseos compuestos centrales con los correspondientes valores de
si se quiere obtener ortogonalidad y rotabilidad. Como se puede observar, algunas veces no se
pueden conseguir los dos criterios exactamente.
Volviendo al ejemplo de las tapas de aluminio, si se desea aadir un nuevo diseo ortogonal al
presentado en la tabla (9.4) y tal que el conjunto sea rotable, basta con sustituir los valores de las
constantes: k=2, N
c
=4 y n
0c
=3 en las expresiones (9.23) y (9.25), y se obtiene:
para la condicin de ortogonalidad y rotabilidad respectivamente.
Por lo tanto, si se han de cumplir las dos condiciones, el nmero de puntos centrales que ha de
contener el diseo estrella ser de n
oe
=3.
213

N
c
4
(9.23)
x
x
n
N
bij
j
n
bij
j
N
b
b
2
1
2
1

(9.24)
( )
( )

+
+
N k n
N n
c oe
c oc
2
2
(9.25)
( )
( )

+
+

4 4
2 4 3
4 2
4
n
oe
y
(9.26)
La matriz del diseo estrella resultante, junto con los
resultados de la experimentacin, se puede encontrar
en la tabla 9.6. Adems, en la figura 9.8 se puede
localizar el conjunto de los experimentos realizados
hasta el momento y desde el comienzo con las dife-
rentes estrategias utilizadas.
Con los datos de los dos diseos en las tablas
9.4 y 9.6 se puede estimar un modelo de segundo
orden por mnimos cuadrados, resolviendo la
ecuacin (9.5) para el modelo en (9.20). Si adems
se aade una variable con signos -1 y 1, se lograr
estimar el efecto bloque como diferencia entre los
promedios de los dos bloques dependiendo
de si los experimentos vienen del primer
diseo o del segundo.
El resultado del anlisis por regre-
sin se encuentra en la tabla 9.7. El modelo
as obtenido explica un porcentaje elevado
de la variabilidad en el ndice de porosidad
en funcin de los dos factores estudiados:
presin y temperatura.
Se observa que existe un efecto
bloque estadsticamente significativo, es
decir, el hecho de realizar el experimento
en dos tiempos diferentes ha afectado a la
respuesta con un aumento de 0.71 unidades
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
214

( )
( )

+
+

4 4
2 4 3
2 3
n
n
oe
oe
(9.27)
TEMPERATURA
(C)
PRESIN
(kg/cm
2
)
NDICE DE
POROSIDAD
-/2 (685) 0 (845) 3.02
/2 (715) 0 (845) 4.40
0 (700) -/2 (810) 3.90
0 (700) /2 (880) 3.76
0 (700) 0 (845) 3.20
0 (700) 0 (845) 3.28
0 (700) 0 (845) 3.17
2
2
2
2
Tabla 9.6 Diseo estrella y resultados en el ejemplo de
las tapas de aluminio con los puntos en la estrella a una
distancia de 1.41
La ecuacin de regresin es
Porosidad = 2.84+0.36 B + 0.51T + 0.26 T
2
+ 0.32 P
2
- 0.22 TP
Predictor Coef. Stdev. t-ratio p-valor
Constante
Bloque
Temperatura
(Temperatura)
2
(Presin)
Temp. Presin
2.84
0.36
0.51
0.26
0.32
-0.22
0.048
0.031
0.041
0.043
0.043
0.058
59.65
11.70
12.42
6.07
7.47
-3.78
0.000
0.000
0.000
0.000
0.000
0.005
s = 0.1165 (8 g. l.) R-Sq = 98.0 % R-Sq(adj) = 96.7 %
Tabla 9.7 Resultado del anlisis por medio de regresin lineal de los
datos de la tabla 9.6
Tabla 9.5 Algunos diseos centrales compuestos
k 2 3 4 5 5(1/2) 6
Fraccin del cubo 1 1 1 1
Nc 4 8 16 32 16 32
Bloques en cubo - 2 x 4 2 x 8 4 x 8 - 2 x 16
Ne=2 k 4 6 8 10 10 12
nco por bloque 3 2 x 2 2 x 2 2 x 4 6 4 x 2
nso 3 2 2 4 1 2
N total 14 20 30 54 33 54
(ortogonalidad) 1.4142 1.6330 2.000 2.3664 2.000 2.3664
(rotabilidad) 1.4142 1.6818 2.000 2.3784 2.000 2.3784
Generadores de
bloque
- B=123 B=1234 B1=123
B2=2345
- B=123
Generadores del
diseo fraccional
- - - - 5=1234 6=12345
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
de porosidad del segundo al primer experimento. Este hecho induce a una investigacin por parte de
los tcnicos para encontrar las condiciones que han cambiado en las dos etapas y que provocan este
cambio en la porosidad.
Antes de aceptar el modelo obtenido por regresin se ha de hacer una prueba de ajuste de los
datos al modelo. Esta prueba se realiza comparando dos estimaciones independientes de
2
, una de las
cuales depende totalmente de la bondad del ajuste del modelo.
La estimacin de
2
en la tabla 9.7 ha sido obtenida como un promedio de otras dos estimaciones:
Donde s
p
2
es la obtenida a travs de las seis
rplicas (una vez eliminado el efecto bloque)
y denomina estimacin pura
s
p
2
=0.011 con 4 g. l. (9.29)
Y s
aj
2
es la obtenida a travs de los residuos
por falta de ajuste de los datos al modelo. A
esta estimacin se le denomina estimacin
por falta de ajuste y tendr 3 g. l. Llevando
el valor de (9.29) a (9.28) se obtiene
s
aj
2
=0.016 con 4 g. l. (9.30)
Por lo tanto, si el modelo se ajusta bien a los
datos, los valores en (9.29) y (9.30) son estimaciones
independientes de
2
y, segn se vio en el captulo 3, el cociente de ambos valores ser un valor tpico
en la distribucin F de Snedecor con cuatro y cuatro grados de libertad.
lo cual es cierto. En consecuencia, se acepta que la aproximacin a la respuesta en la regin prxima
a las condiciones de 700 C y 845 kg/cm
2
por el modelo
y = 2.84 + 0.36 B + 0.51 Temp. + 0.26 Temp.
2
+ 0.32Presion
2
- 0.22 Temp. * Presin (9.32)
es una buena aproximacin.
Una vez obtenida la aproximacin cuadrtica a la respuesta, se ha de analizar si la regin en que
se ha aproximado contiene las condiciones ptimas de porosidad. Para poder resolver este dilema se
ha de realizar el anlisis cannico que se presenta en el prximo apartado.
9.7 Anlisis cannico de la superficie
La interpretacin del modelo resultante puede hacerse bien a travs de curvas de nivel, o bien en
funcin del anlisis cannico del modelo. El anlisis grfico es posible cuando se estudian dos o tres
factores. Si el nmero de factores aumenta no se pueden representar conjuntamente los factores y la
respuesta en un mismo grfico. Cuando el nmero de factores es alto, se puede trabajar con
proyecciones sobre un subconjunto de dos o tres factores, pero entonces la interpretacin de la
superficie es ms compleja.
215

Fig. 9.8 Direccin del camino de mximo descenso


(steepest descent)
s
s s
total
puro ajust 2
2 2
4 4
8

+
(9.28)
s
s
ajuste
puro
2
2
0 016
0 011
145
.
.
.
(9.31)
Para k=2 factores, stos se representan
en los ejes de ordenadas y abcisas indistin-
tamente. Entonces, sustituyendo pares de
valores de la temperatura y la presin en (9.32)
se obtiene el valor de la respuesta, el cual se
lleva al grfico situndolo sobre el punto
representado por el par de condiciones. Una
vez obtenida una cantidad suficiente de valores
de la respuesta, se trazan lneas de nivel para
valores de respuesta similar. Las lneas as
formadas representan la proyeccin tridimen-
sional de la respuesta en el plano de experi-
mentacin formado por los dos factores.
Vemoslo en el ejemplo de las tapas de
aluminio. La representacin se ha realizado
promediando el efecto bloque, ya que el efecto bloque no influye en la localizacin del ptimo. Para el
grfico se han utilizado las variables en unidades originales.
Del anlisis grfico se observa que las curvas de nivel son concntricas y su valor disminuye
conforme se acercan al punto central. Existe, por lo tanto, una nica condicin ptima en cuanto a
porosidad mnima en torno a la condicin: temperatura 690 C y presin 835 Kg/cm
2
.
Las coordenadas de tal punto tambin se pueden encontrar derivando la ecuacin de la respuesta
respecto a sus parmetros e igualando a 0.
T = -1.15, P = -0.39
Las coordenadas del punto crtico en unidades originales, as como el valor estimado de la
porosidad, son:
P
c
(688.5 C, 835.1 Kg/cm
2
)
Y
Pc
= 2.19 (Bloque 1) (9.34)
Y
Pc
= 2.91 (Bloque 2)
Anlisis cannico
El conjunto de todas las superficies cuadrticas se clasifican segn su forma cannica. sta
corresponde a la representacin de la superficie con ejes de simetra paralelos a los ejes de coordenadas
y centrada en el origen (de coordenadas 0 en todas las variables x).
Las superficies que se obtienen de la metodologa de superficie de respuesta no tienen por qu
cumplir las dos condiciones anteriores y, en tal caso, resulta difcil conocer el tipo de superficie de que
se trata. Sin embargo, mediante las dos operaciones que a continuacin se detallan, se puede
recodificar la superficie para expresarla en su forma cannica. Estas dos operaciones son:
Utilizar los ejes de simetra como nuevos ejes de coordenadas.
Seleccionar el punto crtico de la superficie como nuevo origen de coordenadas.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
216

3.1
3.7
4.3
4.9 5.5
6.1
6.7
7.3
7.9
8.5
725 715 705 695 685 675
900
850
800
Temperatura
Fig. 9.9. Anlisis grfico de la porosidad por curvas de nivel
( )

Y
T
B T T P T P
T
T P
+ + + +
+
284 036 051 0 26 032 0 22
051 052 0 22 0
2 2
. . . . . .
. . .
( )

Y
P
B T T P T P
P
P T
+ + + +

284 036 051 0 26 032 0 22
0 64 0 22 0
2 2
. . . . . .
. .
(9.33)
P
r
e
s
i

n
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
La ecuacin resultante de la primera operacin se denomina forma cannica A y, si se aplica la
segunda condicin, la ecuacin resultante se denomina forma cannica B.
Si llamamos,
el mtodo general de obtener las dos formas cannicas es muy simple y est basado en las propiedades
algebraicas de la matriz B.
Para ello, primero expresaremos el modelo de segundo orden para la superficie de respuesta en
forma matricial,
Y = b
0
+ Xb + X B X (9.36)
Ahora, si M es la matriz en cuyas columnas estn los vectores propios estandarizados de B: m
1
,
m
2
, ..., m
k
, siendo
1
,
2
, ...,
k
, sus valores propios, se cumple:
BM = M
M= M (9.37)
MBM = MM =
donde es la matriz diagonal con
1
,
2
, ...,
k
, en la diagonal.
Dado que MM = I, se puede intercalar este producto de matrices en la ecuacin (9.36), y
agrupando convenientemente se obtiene
Utilizando las propiedades en (9.37) en (9.38), la ecuacin (9.36) puede reescribirse como,
Forma cannica A
Y = b
0
+ X + XX
(9.39)
X=Mx y =Mb
La forma cannica A obtenida en (9.39) slo contiene trminos cuadrticos puros, ya que han
desaparecido las interacciones. Si se representa de nuevo la superficie, pero ahora respecto a las nuevas
variables X, se observa que los ejes de simetra de la superficie son paralelos a los ejes de coordenadas.
Para hallar la forma cannica B hay que determinar la distancia a la que se encuentran los
puntos crticos de la superficie (mximo, mnimo, punto silla, zona de mximos, etc.) del origen de
coordenadas. Si la zona crtica est dentro de la regin de experimentacin, se considera que la
aproximacin de la superficie ser igual de vlida alrededor del nuevo origen de coordenadas. Si en
cambio la regin crtica est lejos de la zona de experimentacin, no tiene sentido extrapolar la
superficie hasta la zona crtica y, por lo tanto, no se halla la forma cannica B.
En el ejemplo de las tapas, la distancia del punto crtico al centro de experimentacin es
y; por lo tanto, podemos considerar que la aproximacin obtenida en (9.26) puede extenderse a la
regin alrededor de este punto.
217

( ) b b X
x
x
x
x
b
b
b
b
b
B
b
b
b
b
b
b
b
b
b
k k
k k
k
k
kk
0 0
1
2
3
1
2
3
11
12
1
12
22
2
1
2
1 2
1 2
1 2
1 2
1 2
1 2

1
]
1
1
1
1
1
1
1
1

1
]
1
1
1
1
1
1
1
1

1
]
1
1
1
1

/
/
/
/
/
/
(9.35)
( ) ( ) ( )( ) ( ) Y b x M M b x M M BM M x + +
0
' ' ' ' ' (9.38)
d + 115 0 39 12
2 2
. . . (9.40)
Por consiguiente, para obtener la forma cannica B, se puede realizar la segunda operacin de
cambiar el origen de coordenadas de (0,0) por (-1.15,-0.39), si se trabaja en unidades codificadas
originales, o de (0,0) por M (-1.15,-0.39), si se trabaja con las coordenadas nuevas.
Dado que el resultado final es independiente del orden en que se realicen estas dos operaciones
(cambio de ejes de coordenadas y traslacin del origen), en aquellos casos en que se han calculado con
anterioridad las coordenadas del punto crtico, es ms sencillo trabajar con las coordenadas del punto
crtico en unidades originales x.
Por lo tanto, si se aplica este cambio de origen en (9.38) antes de pasar a cambiar los ejes, se
obtiene la expresin
que se simplifica dando lugar a la forma cannica B, que aparece en (9.39) en su forma general.
Forma cannica B
Es decir, las nuevas coordenadas se pueden obtener trasladando x
o
(en unidades originales
codificadas) y girando con M, o girando con M para obtener las nuevas coordenadas X y trasladando
X
0
respecto a las coordenadas del punto estacionario (en las nuevas coordenadas).
Con la ecuacin (9.42) se est en situacin de interpretar la superficie. El signo de los valores
propios
i
determinarn el tipo de superficie, y su valor absoluto determina el tamao de los ejes de
simetra.
La figura 9.9 contiene la clasificacin de las superficies para dos factores. Para interpretar
superficies con ms factores se pueden seleccionar subgrupos de dos factores e interpretar la
proyeccin de la superficie en ellos.
En el caso de las tapas de aluminio, para hallar la forma cannica B se han de obtener los valores
propios y los vectores propios de la matriz B en el modelo (9.32).
Por lo tanto, llevando los valores de (9.43) a (9.42) se obtiene la forma cannica B:
donde la relacin entre las nuevas coordenadas y las anteriores es:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
218

( ) ( )( ) ( ) ( )
( )
( ) ( ) Y Y x x M M b x x M M BM M x x + +
0 0 0 0
' ' ' ' '
(9.41)
Y Y X X X
k k
+ + + +
0 1 1
2
2 2
2 2

~ ~ ~

( )
~
' ' ' X M x x d M x M x X X
i i io i io i io

(9.42)
( ) b X
x
x
b B
0
1
2
284
051
0
0 26
011
011
032

1
]
1

1
]
1

1
]
1
.
. .
.
.
.
M

1
]
1

0 61
0 79
0 79
0 61
0 40 018
1 2
.
.
.
.
. .
(9.43)
Y B X X + + + 2 55 0 36 0 40 018
1
2
2
2
. . .
~
.
~
(9.44)
( ) ( )
~
. . . . . . . X x x x x
1 1 2 1 2
0 61 115 0 79 039 0 61 0 79 039 + + + +
( ) ( )
~
. . . . . . . X x x x x
2 1 2 1 2
0 79 115 0 61 039 0 79 0 61 115 + + + +
(9.45)
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
donde x
1
y x
2
los son valores de la presin y la temperatura en unidades codificadas.
Una vez en la ltima etapa de la investigacin (figura 9.6) se ha de hacer un estudio de la forma
cannica de la superficie si se desean conocer las condiciones ptimas y la manera en que se relaciona
la porosidad con los factores de control.
Analizando la forma cannica se puede contestar a los objetivos planteados en el apartado 9.2.
Se aprecian los siguientes hechos:
219

Figura 9.10 Representacin de superficies cuadrticas en dos factores. a) Mximo (


1
y
2
<0) (o mnimo (
1
y
2
>0);
b) Punto silla (
1
y
2
de distinto signo); c) Teja horizontal (
2
= 0 ); d) Teja inclinada (
2
=0) y trmino lineal en X
1
)
37
40
43
46
49
3 2 1 0 -1 -2 -3
3
2
1
0
-1
-2
-3
A
B
3 2 1 0 -1 -2 -3
3
2
1
0
-1
-2
-3
A
B3.5 6.0 8.5
11.0
13.5
16.0
18.5
8.5 6.0 3.5
11.0
13.5
16.0
18.5
3.5 5.0 6.5 8.0 9.5
3 2 1 0 -1 -2 -3
3
2
1
0
-1
-2
-3
A
B
9.5 8.0 6.5 5.0 3.5
0 2 4 6
8
10
12
3 2 1 0 -1 -2 -3
3
2
1
0
-1
-2
-3
A
B
Al ser positivos los coeficientes de los trminos cuadrticos en la forma cannica B, existe un
nico punto donde se obtiene un ndice de porosidad mnimo. Las coordenadas de este punto
son aproximadamente (688.5C, 835.1 kg/cm
2
).
Si se desean hacer predicciones del valor de la respuesta para determinadas condiciones de los
factores, se puede obtener el modelo en unidades originales. No obstante, hay que tener en
cuenta que el modelo obtenido es una aproximacin local de la superficie en la zona de
experimentacin y que, cuanto ms alejado de tal zona se est, menor precisin en la prediccin
se obtendr. La manera ms sencilla de obtener el modelo en unidades originales es
descodificando la ecuacin (9.32) mediante:
para obtener el modelo en unidades originales,
La porosidad cambia ms rpidamente en la direccin de que en la de ello
es debido a que el valor propio
1
=0.39 es mayor que
2
= 0.17. La direccin de mnimo cambio
en porosidad viene determinada por
y la de mximo por
es decir, manteniendo similares los valores de x
1
y x
2
, se logra la mnima variacin en la
porosidad al variar las condiciones de temperatura y presin.
Dada una porosidad lmite, existe una variedad de combinacin de condiciones para la
temperatura y la presin que permite trabajar con menor porosidad. Basta con hallar la curva de
nivel apropiada para este valor y seleccionar cualquier combinacin que quede en la regin
interna de la curva de nivel.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
220

x
T
x
P
1 2
700
10
845
25


Y B T P T P T P + + + 1087 6 0 36 2 85 0 25 0 0026 0 00051 0 00088
2 2
. . . . . .
(9.46)
(9.47)
~
(
~
) X X
1 2
0
~
(
~
) X X
2 1
0
~
. . . X x x
1 1 2
0 0 61 0 79 0 39 +
~
. . . X x x
2 1 2
0 0 79 0 61 115 + +
(9.48)
(9.49)
INTRODUCCIN A LA METODOLOGA DE SUPERFICIE DE RESPUESTA
Ejercicios
9.1. Se realiza un experimento con dos variables codificadas x
1
= (X
1
-450)/10 y x
2
= (X
2
-130)/5 y se
obtienen los siguientes resultados:
a) Es necesario el uso de un modelo de segundo orden para aproxi-
marnos a la superficie estimada por y?
b) Razonar si un modelo de primer orden se ajusta bien a la superficie de
respuesta representada por y. (Use algn tipo de test de ajuste del
modelo.)
c) Est el punto (X
1
,X
2
) = (268,98) en el camino de mximo decre-
cimiento?
d) D un modelo que permita predecir los valores de la respuesta a travs
de los valores de X
1
y X
2
sin codificar.
9.2. Un experimentador ha realizado un diseo 2
5-1
con cuatro puntos aadidos en el centro y desea
aadir una estrella a una distancia axial y n
e0
puntos en el centro.
a) Qu valor de se ha de seleccionar si se quiere conseguir rotabilidad?
b) Y si se quiere conseguir que los dos bloques sean ortogonales?
c) Se puede conseguir rotabilidad y ortogonalidad a la vez?
9.3. Realice un anlisis cannico de la superficie:
y = 6.88 + 0.0325 x
1
+ 0.2588 x
2
- 0.1363 x
3
- 0.1466 (x
1
)
2
-0.0053 (x
2
)
2
+ 0.1359 (x
3
)
2
obtenida por un anlisis de regresin usando las variables codificadas:
x
1
=(x
1
-5)/3, x
2
=(x
2
-4)/10 y x
3
=(x
3
-25)/9
a) Cules son las coordenadas del punto estacionario y el valor de la respuesta en tal punto?
b) Qu tipo de superficie es?
c) Realice un grfico de contornos en funcin de x
1
y x
2
(variables codificadas originales)
alrededor del punto estacionario, dejando fijo el valor de x
3
en la coordenada que posee el punto
estacionario.
9.4. Un experimentador realiza un experimento con dos
variables x
1
y x
2
alrededor del punto (90,20), para el
que realiza cinco experimentos:
a) Ajuste un modelo a los datos y diga cul de
las siguientes observaciones estaran en la
direccin del steepest ascent.
El experimentador decide ahora combinar
los dos experimentos de coordenadas
(X
1
,X
2
,Y) = (43.25, 53, 65) y (34.75, 59,68)
con las seis siguientes:
b) Ajuste un modelo de primer orden a los datos.
c) Realice un test de falta de ajuste usando las rplicas.
d) Realice un dibujo de cmo han sido expuestos los experimentos con los respectivos valores de
la respuesta.
221

x1 x2 y
-1
1
-1
1
0
0
-1
-1
1
1
0
0
44.1
53.2
47.3
56.4
49.5
51.0
X1 80 100 80 100 90
X2 10 10 30 30 20
Y 11 0 29 6 12
X1 64.5 47.5 39 30.5 43.25 34.75
X2 38 50 56 62 53 59
Y 43 58 72 62 65 68
X1 34.75 43.25 39 39 39 39
X2 53 59 56 56 56 56
Y 71 68 71 72 72 73
Las metodologas de diseo de experimentos y superficie de respuesta presentadas en los
captulos anteriores han sido utilizadas para la determinacin de los factores que afectaban a una
caracterstica particular de calidad, para la seleccin de los niveles ptimos de tales factores, y para la
estimacin local de la relacin existente entre la respuesta y los factores de diseo en la regin de las
condiciones ptimas.
En la prctica, muchas caractersticas de calidad vienen afectadas por factores de difcil control
o que no han podido ser controlados durante la obtencin del producto, incluso por factores que
aparecen una vez que el producto est en manos del cliente.
Una manera de atacar este problema sera mediante el control de tales fuentes de variacin, lo
cual resulta caro y muchas veces imposible. Por el contrario, se pueden disear productos o procesos
robustos que sean insensibles a estas causas.
En este captulo vamos a presentar la aplicacin de las tcnicas anteriormente citadas en la
consecucin de tales objetivos.
10.1 Concepto de producto robusto
La definicin que da el diccionario a la palabra robusto es fuerte, vigoroso, sano, saludable.
Por ejemplo, decimos que un ciclista es robusto cuando su rendimiento queda poco afectado por
los cambios que se producen en su entorno: pedalea con igual intensidad en das de sol o en das de
lluvia, no le afectan las crticas de los peridicos, se adapta a los diferentes tipos de bicicletas, etc.
En la industria tambin se desea obtener productos robustos y sern aquellos que mantengan
sus caractersticas de calidad con un mnimo nivel de variabilidad. Como veremos en el apartado 10.2,
esta variabilidad en el nivel de calidad es debida a factores externos (temperatura ambiente, humedad,
etc.), internos (deterioro, etc.) y de produccin (capacidad de los procesos de fabricacin).
Veamos dos situaciones en las que se desea obtener productos robustos, que sern analizadas en
detalle a lo largo del captulo.
Se desea obtener una frmula para fabricar un suavizante de ropa. La caracterstica de calidad
que se estudia es su viscosidad. Se conocen el tipo de materia prima, la cantidad de
estabilizante, el Ph del producto y el tipo y la cantidad de sales que han de entrar en la frmula
del producto. Ahora bien, la viscosidad as obtenida puede verse alterada una vez que el
10
Diseo de productos robustos
223
producto est en manos del cliente, debido al tiempo en que el envase del producto permanece
abierto o debido a caractersticas del agua de lavado. El suavizante que se desea ha de ser
robusto a estos factores externos a su frmula, es decir, su viscosidad debe mantenerse en un
nivel aceptable sea cual sea el agua de lavado o el tiempo en que el envase est abierto.
Se desea disear un tubo calefactor seleccionando los niveles de tres parmetros de diseo:
temperatura interior y exterior del cilindro calefactor y proporcin entre dimetro exterior e
interior. El tubo resultante, adems de permitir el paso de un flujo determinado de calor por su
superficie, ha de ser robusto, o insensible, a pequeas variaciones en los parmetros de diseo.
Esta preocupacin reciente en las empresas por obtener productos robustos ha sido motivada
por las demandas actuales del cliente dentro de un entorno competitivo muy particular.
Un mismo producto puede ser fabricado en empresas situadas en zonas geogrficas lejanas, las
cuales pueden ser aprovisionadas por diferentes proveedores, e incluso tener diseados sus procesos de
diferente manera. Sin embargo, cuando el cliente compra un producto quiere que sea robusto a estas
condiciones del mercado o a otras tales como las caractersticas culturales, condiciones ambientales,
etc. El producto es identificado por la marca y no por la empresa que lo fabrica.
Un cliente no satisfecho puede reclamar una compensacin econmica por la falta de calidad o
incluso puede cambiarse a un producto de la competencia. Ello conlleva unas prdidas econmicas a
la empresa que se estima que son directamente proporcionales a la desviacin cuadrtica de la
caracterstica de calidad respecto a su valor nominal u objetivo.
Algunos autores prefieren hablar de una funcin matemtica que mide la calidad de un producto
en funcin de la desviaciones cuadrticas de cada individuo respecto al valor nominal. El ingeniero
Genichi Taguchi (1986), por ejemplo, define la funcin de prdidas que presentamos en el apndice 10.A.
El objetivo del diseador es por lo tanto definir productos en los que las prdidas debidas a estas
fuentes de variacin sean mnimas. No basta con fabricar bajo el nivel nominal, hay que hacerlo con
la mnima variabilidad.
10.2 Variabilidad funcional
La variabilidad entre productos una vez que stos estn en manos del cliente es inevitable. Sin
embargo, si se identifican las causas de tales variaciones, se pueden tomar medidas con el fin de
reducirla.
Las causas que originan tal variabilidad pueden englobarse en tres grupos:
Causas que provocan variabilidad en el proceso que da lugar al producto, y que determinan la
capacidad de aqul: variaciones en la materia prima, mtodos de trabajo, mantenimiento, etc.
Causas en el entorno en que se usa el producto: variaciones humanas en el uso del producto,
condiciones ambientales, etc.
Causas relacionadas con las caractersticas internas del producto: envejecimiento, deterioro de
partes, etc.
El efecto, en general impredicible, que estas causas producen sobre la caracterstica de inters
se denomina ruido y, por extensin, a las causas de tal variabilidad se las denomina factores ruido.
Para reducir el ruido la empresa puede adoptar varias posturas. Una sera controlar los factores ruido
que estn a su alcance (aquellos que aparecen antes de que el producto salga de la empresa), y
segmentar la produccin de acuerdo con los hbitos del consumidor. Esta postura es en general costosa
y resulta imposible imaginrsela implantada totalmente en las empresas. (Ello no quiere decir que sea
totalmente descabellada; por ejemplo, algunas multinacionales del sector del automvil ya estn
reduciendo al mximo el nmero de proveedores, lo cual reduce una gran fuente de variabilidad.)
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
224

DISEO DE PRODUCTOS ROBUSTOS


Una segunda estrategia ms econmica y eficaz, consistira en tomar contramedidas contra cada
una de las causas de variabilidad a lo largo de las etapas de desarrollo de un nuevo producto. La tabla
10.1 (Kackar 1985) presenta en qu fases del desarrollo de un producto es posible actuar para
minimizar el efecto de cada una de las causas de variabilidad.
Tabla 10.1 Contramedidas posibles en cada una de las fases del desarrollo de un producto
Estas etapas, de una manera simplificada, son las siguientes:
Etapa de diseo del producto de acuerdo con las expectativas del cliente.
Etapa de diseo del proceso que ha de generar los productos diseados en la etapa anterior.
Etapa de produccin de acuerdo con las etapas anteriores en la que se obtendr el producto final.
La estadstica, como ciencia que estudia los fenmenos a travs de la cuantificacin de la
informacin procedente de los mismos, es de una gran ayuda en estas fases.
As, en la fase de produccin, mediante la utilizacin del control estadstico de procesos (SPC)
se controla el proceso para identificar la aparicin de causas asignables de variabilidad y actuar sobre
ellas de una manera adecuada para mantener el proceso bajo control (en el captulo 11 se presenta este
tema de una manera ms amplia).
En general, la reduccin de variabilidad utilizando slo SPC (o por otra parte inspeccin del
producto acabado) requiere inversiones econmicas considerables (seleccionar los mejores
proveedores, aumentar el mantenimiento de las mquinas, etc.); y el resultado final, una vez ms,
depender de lo bien que est diseado el proceso.
En el diseo del proceso de produccin tambin se pueden tomar medidas contra la variabilidad
en la produccin, escogiendo mquinas con la mnima capacidad o variabilidad, lo cual es tambin
costoso.
Sin embargo, slo en la fase de diseo del producto se pueden tomar medidas contra cada una
de las diferentes causas de variabilidad. Las tcnicas estadsticas que hemos denominado diseo de
experimentos robustos son tcnicas que, aplicadas en las etapas del diseo del producto y del proceso,
producen una reduccin considerable de la variabilidad final del producto en manos del cliente y con
una inversin econmica, en general, inferior a cuando se utiliza slo SPC.
10.3 Metodologa del diseo
Las primeras ideas para conseguir el aseguramiento de la calidad de un producto centrando los
esfuerzos especialmente en su fase de diseo, se deben al ingeniero Genichi Taguchi, quien comenz
a aplicar las tcnicas de diseo de productos robustos a comienzos de los aos 80.
G. Taguchi (1986) divide la etapa de diseo del producto en tres fases claramente diferenciadas:
Diseo primario: consiste en el diseo conceptual o funcional del producto para responder a
una necesidad del mercado. En esta fase utilizan conocimientos especializados del dominio.
225

CAUSAS DE VARIABILIDAD
(RUIDO)
FASES DEL DESARROLLO
DE UN PRODUCTO
Externas
(Ambiente)
Internas
(Deterioro)
Produccin
(Fabricacin)
Diseo del producto O O O
Diseo del proceso X X O
Proceso de produccin X X O
O Contramedidas posibles
X Imposibilidad de contramedidas
Diseo secundario, o diseo de los parmetros: consiste en la obtencin de los valores
nominales ptimos de los factores, para minimizar la variabilidad de las caractersticas de
calidad del producto. En esta fase se necesita de la colaboracin de los tcnicos del
producto y de personal conocedor de las tcnicas estadsticas de diseo y anlisis de
experimentos.
Diseo terciario: diseo de tolerancias, para garantizar la mnima variabilidad requerida,
cuando la variabilidad final del diseo secundario es todava excesiva.
En este captulo presentaremos las tcnicas estadsticas que ayudan a la consecucin del
diseo secundario o diseo de parmetros. Estas tcnicas comprenden la seleccin de una matriz de
diseo adecuada y el anlisis e interpretacin de los resultados.
A pesar de que existe una metodologa ampliamente divulgada denominada metodologa de
Taguchi, para llevar a cabo los objetivos anteriormente citados, en los ltimos aos se han
presentado crticas en cuanto a sus aspectos estadsticos y metodolgicos y se han propuesto
alternativas como las de Box (1986), Grima (1993), Maghsoodloo (1990), Ryan (1988), Shoemaker
(1991), Tort-Martorell (1985), Tribus (1989) y Wu (1987).
En este captulo hemos optado por tomar aquellos aspectos del mtodo de Taguchi que,
siendo tiles por su simplicidad, no se alejan demasiado de la tcnica ptima. Por otra parte, aquellos
aspectos dbiles en la metodologa, tales como el anlisis de los resultados, los hemos sustituido por
mtodos alternativos. El lector interesado en conocer los aspectos fundamentales de la metodologa
de Taguchi puede dirigirse al apndice 10.B.
10.4 Diseo de parmetros
El diseo de parmetros consiste principalmente en una estrategia de experimentacin durante la etapa
de diseo del producto o del proceso mediante la cual, con un anlisis adecuado de los resultados, se
determinan los niveles de los factores o parmetros del diseo, bajo los cuales se obtienen productos
que cumplen el doble objetivo de presentar la caracterstica de calidad lo ms cercana al valor nominal
deseado y con mnima variabilidad.
La experimentacin se realiza con los dos tipos de factores que hemos introducido
anteriormente y que hemos denominado:
factores de control,
factores ruido.
Los primeros son los factores cuyos valores pueden ser seleccionados por el experimentador
durante el diseo del producto (o proceso): temperatura del horno, tiempo en el horno, porcentaje de
enzima, etc.
Llamamos factores ruido a aquellos factores que, afectando a la caracterstica de calidad del
producto (bien en las fases iniciales de fabricacin, o bien cuando el cliente utiliza el producto), no
pueden ser controlados, bien por los costes que ello implica o por otras causas, si bien en muchas
situaciones ser posible realizar experimentos con valores controlados de este tipo de factores. Algunos
de estos factores son: la temperatura ambiente en la lnea de fabricacin, el conocimiento por parte del
operario del proceso, la humedad relativa cuando se utiliza el producto, etc.
La presencia de variabilidad, como ya hemos comentado en al apartado 10.2, es consecuencia
del ruido externo y del ruido interno. Es decir, de la variabilidad provocada por factores no controlables
y la transmitida por los factores de control. Durante la experimentacin, los factores de control y
algunos de estos factores ruido son seleccionados y prefijados para conocer su efecto en la
caracterstica de calidad.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
226

DISEO DE PRODUCTOS ROBUSTOS


As, se podrn tomar contramedidas contra la presencia de variabilidad, si ocurre alguna de
estas dos circunstancias:
1 Ruido externo: existen interacciones entre factores de control y factores ruido. Ello implica que
el efecto del factor ruido en la respuesta depende del nivel en que se encuentre el factor de
control. En consecuencia, se podr seleccionar un nivel de este ltimo donde la respuesta sea
ms insensible al ruido externo (ver figura 10.1).
2 Ruido interno: la relacin entre los factores de control y la respuesta no es lineal. De esta
manera, se puede seleccionar aquel nivel del factor de control en que la respuesta sea ms
robusta al ruido interno.
A continuacin presentaremos un mtodo de seleccin de la matriz de diseo, as como la
manera de analizar los resultados.
10.5 Matriz de diseo
Las dos circunstancias anteriormente citadas pueden ser detectadas mediante la experimentacin, si se
selecciona adecuadamente la matriz de diseo y se analiza convenientemente los resultados.
En este apartado estudiaremos la seleccin de una matriz de diseo para disear productos
robustos a la variabilidad externa. La metodologa a seguir cuando se trabaja con ruido interno se
presentar en el apartado 10.7 con un ejemplo.
227

Fig. 10.1 Variabilidad transmitida por un factor ruido R


para diferentes niveles del factor de diseo D
a) La variabilidad transmitida por el factor R al cambiar
de R
o
a R
1
es la misma para cualquier nivel de D.
b) La variabilidad transmitida por R es diferente depen-
diendo del nivel en que se encuentre el factor de
diseo D: existe por lo tanto una interaccin entre el
factor de diseo y el factor ruido. En este ejemplo,
cuando D est en el nivel D
1
la variabilidad
transmitida es menor.
Fig. 10.2 Relacin lineal y no lineal entre los parmetros
del producto (o proceso) y la caracterstica de calidad
a) Si la relacin entre el parmetro y la respuesta es
lineal, la variabilidad que se transmite a Y, por la
relacin f(x), es de la misma magnitud en x
0
o en x
1
.
b) Sin embargo, si la relacin entre el parmetro del
diseo y la caracterstica no es lineal, la variabilidad se
transmite de manera diferente, dependiendo del valor
en que est fijado el parmetro. En x
1
la variabilidad
transmitida es menor que en x
0
.
La matriz de diseo deber permitir estimar un modelo del tipo
en el que una vez estimados sus parmetros, su correcta interpretacin debe permitir alcanzar el valor
nominal con la mnima variabilidad.
Aquellos efectos
ik
que sean significativos nos permitirn seleccionar los niveles de los
factores de control X
i
en que el producto sea ms robusto a la variabilidad transmitida por los
factores ruido Z
k
.
Aquellos factores X
i
que sean significativos pero que no interaccionen con factores ruido,
permitirn llevar la respuesta a su nivel nominal.
Aunque la estimacin de los efectos de los factores ruido
k
en principio no es til, puesto que
son factores que no se controlan, el conocimiento de su significacin puede servir a los tcnicos
para replantear el diseo del producto o proceso.
Por lo tanto, el diseo seleccionado debe permitir estimar, como mnimo, los efectos asociados
a los factores
X
i
, X
i
X
j
, y X
i
Z
k
(10.2)
y ser de ayuda si adems permite estimar los efectos asociados a los factores ruido.
Las soluciones dadas a este problema han sido principalmente tres:
Disear por separado las matrices para los factores de control y para los factores ruido y cruzar
las dos para dar lugar a una matriz producto. Esta matriz producto puede ser obtenida a travs
de los diseos 2
k-p
propuestos en los captulos 7 y 8 y tambin de los orthogonal arrays
propuestos por Taguchi (1986).
Realizar un diseo fraccional de resolucin V con todos los factores de control y ruido
estudiados conjuntamente.
Seleccionar diseos especiales de resolucin IV que no confundan las interacciones a estudio.
La primera opcin es la ms sencilla. Adems, permite seleccionar un grado de fraccionamiento
diferente para cada tipo de factores. En general, el diseo para los factores ruido suele ser ms
fraccionado de lo que se acostumbra cuando se trabaja con factores de control. Ello es debido a que no
estamos tan interesados en la estimacin, libre de confusiones, de las interacciones entre factores ruido.
Aunque la tercera opcin conlleva la realizacin de menos experimentos que la primera y la
segunda, la matriz producto est ms difundida en la industria y es ms fcil que sea seleccionada por
personal poco experto. Es esta la razn principal que nos ha hecho decidirnos por presentar esta matriz
en este captulo aunque existen otras razones de tipo analtico (con esta matriz se puede desglosar mejor
la variabilidad debida al ruido en: la transmitida
por los factores ruido que han intervenido en el
experimento y el ruido ajeno a estos).
La matriz de diseo se representa con
dos entradas tal como aparece en la figura 10.3.
Por una parte aparecen los k factores de control
combinados segn un diseo 2
k-p
y, por otra, los
r factores ruido combinados segn otro diseo
2
r-q
. Por consiguiente, se obtienen 2
k-p
2
r-q
condiciones experimentales.
Una vez aleatorizado el orden de
experimentacin de las 2
k-p
2
r-q
condiciones
experimentales, se realiza cada experimento y se
mide la caracterstica de calidad. Las filas de la
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
228

Y X X X Z Z Z X Z
o i i ij i j k k kl k l ik i k
+ + + + + + (10.1)
Matriz interna
Matriz externa
Matriz producto
Factores ruido
Factores de diseo
x1 x2 x3 . . .
z1
z2
z3
.
Fig. 10.3 Diseo de la matriz de experimentacin 2
k-p
2
r-q
Matriz interna Matriz producto
Matriz externa
Factores ruido
Factores de diseo
x1, x2, x3. . .
z1
z2
z3
.
DISEO DE PRODUCTOS ROBUSTOS
matriz pueden ser consideradas como prototipos idnticos de un producto diseado con los niveles de los
parmetros de la parte izquierda de la tabla y sometidos a diferentes condiciones de los factores ruido.
Si la muestra fuese lo suficientemente grande, la representacin grfica en histogramas de la
caracterstica de calidad en estos individuos dara una idea general de la distribucin de la calidad del
producto; bastara con observar el centro de la distribucin y su dispersin.
Esta manera intuitiva de interpretar la matriz de diseo ha dado lugar a un anlisis de los datos
basndose en la informacin obtenida para cada fila o condicin de los parmetros de diseo.
Una vez ms, existen diferencias en el tratamiento de estos datos. Remitimos al lector al apndice
10.B si quiere obtener informacin sobre el mtodo seguido por Taguchi basado en la seal ruido.
Nosotros introduciremos al lector dos mtodos de anlisis que creemos que mejoran
sustancialmente el enfoque expuesto en dicho apndice:
El primero est basado en el anlisis de los datos directamente de la matriz producto. Para
llevarlo a cabo se obtendrn la media y la variabilidad para cada condicin de diseo y se
aplicarn las tcnicas de anlisis de los captulos 7 y 8. Ello permitir estimar los parmetros de
un modelo del tipo:
Y=
0
+
i
X
i
+
ij
X
i
X
j
+ (10.3)
Para aplicar el segundo mtodo juntaremos los factores de control y los factores ruido en una
nica matriz 2(
k+r)-(p+q)
y pasaremos a estimar los parmetros del modelo en (10.1) que es
sensiblemente diferente al modelo en (10.3), puesto que incorpora los factores ruido en su
estructura.
Debemos decir que, si uno planifica analizar los resultados del experimento con la segunda
opcin, puede seleccionar la matriz producto de tal forma que el diseo 2
(k+r)-(p+q)
resultante sea ptimo
en el sentido de mxima resolucin a costa de, en general, no reproducir todas las condiciones de los
factores ruido para cada condicin de los factores de control.
A continuacin presentamos el ejemplo de suavizante donde se aplicarn los mtodos de
anlisis aqu mencionados.
10.6 Ejemplo de producto robusto a ruido externo: suavizante
El experimento que se presenta a continuacin est relacionado con un suavizante de ropa. La
caracterstica de calidad que se estudiar es la viscosidad del producto; es deseable que sea lo mnima
posible y robusta a factores externos.
En un principio se han seleccionado cinco
factores de control partcipes en la frmula del
suavizante, y tres factores ruido que aparecen una
vez el suavizante est en manos del cliente final.
La tabla 10.2 presenta estos factores junto con los
niveles en que se trabaj.
El diseo seleccionado ha sido
un 2
5-2
2
3-1
con generadores:
D=AB y E=BC para los factores
de control,
O=MN para los factores ruido.
Ntese que, si juntamos dos
diseos de la forma 2
k-p
y 2
r-q
, el
resultado se podr interpretar como un
229

FACTORES DE CONTROL - +
A Tipo de materia prima M1 M2
B Cantidad de estabilizante baja alta
C Ph del producto 2.5 3.5
D Tipo de sales S1 S2
E Cantidad de sales baja alta
FACTORES RUIDO - +
M Tiempo que el producto est abierto < 10 das 10 das
N Tipo de agua blanda dura
O Temperatura del agua fra templada
Tabla 10.2 Factores que toman parte en la experimentacin con sus niveles
diseo 2
(k+r)-(p+q)
que, en general, no es de mxima resolucin. En este caso podemos considerar el
diseo como un 2
8-3
.
La matriz del diseo junto con los resultados de la viscosidad medida en centipoises se
encuentra en la tabla 10.3.
Tabla 10.3 Matriz de diseo y resultado del experimento para el ejemplo del suavizante
En la parte izquierda estn definidos los niveles en que se han colocado los factores de control
para todas las condiciones de ruido situadas en la parte superior derecha de la tabla. Para cada una de
estas condiciones se obtienen cuatro suavizantes (en el orden de experimentacin preestablecido), que
son sometidos a las condiciones de ruido que vienen dadas por los niveles de la parte superior derecha
de la matriz
As, en la primera fila aparecen los cuatro suavizantes fabricados con la frmula determinada
por la materia prima M1, el estabilizante E1, con ph 2.5, con el tipo de sal S2 y con una cantidad de
sal alta. stos, como todos los dems, han sido sometidos a las cuatro condiciones de ruido.
Tabla 10.4 Media y variabilidad en el ejemplo del suavizante
Anlisis de los datos. Mtodo de matriz producto
Como hemos comentado anteriormente, para cada condicin experimental de los factores de control
deberemos hallar la media y la variabilidad a lo largo de las condiciones de ruido, y obtendremos los
resultados de la tabla 10.4.
Para estimar los parmetros del modelo (10.3) para la media, por una parte, y para la
variabilidad por otra, se pueden utilizar los mismos procedimientos utilizados en los captulos 7 y 8.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
230

TIEMPO - + - +
T. AGUA - - + +
M.PRIMA ESTABILZ. PH T. SALES C. SALES C AGUA + - - +
- - - + + 3200 4500 175 1560
+ - - - + 37.5 42.5 300 242.5
- + - - - 1600 475 137.5 60
+ + - + - 1900 2200 302.5 3660
- - + + - 125 112.5 965 1900
+ - + - - 250 325 325 1920
- + + - + 50 112.5 445 2050
+ + + + + 175 97.5 492.5 340
M. PRIMA ESTABILIZ. PH T. SALES C. SALES LOG(s)
-
+
-
+
-
+
-
+
-
-
+
+
-
-
+
+
-
-
-
-
+
+
+
+
+
-
-
+
+
-
-
+
+
+
-
-
-
-
+
+
2358.7
155.6
568.1
2015.6
775.6
705.0
664.4
276.3
3.28
2.13
2.85
3.14
2.92
2.90
2.97
2.25
Y
DISEO DE PRODUCTOS ROBUSTOS
Para ello se tomarn como respuestas la media, , y una
transformacin logartmica de la variabilidad, ln(s). (El uso de
la transformacin logartmica es muy comn cuando se modela
la varianza debido a que los residuos no siguen la distribucin
normal. En este ejemplo, adems, es doblemente aconsejable
esta transformacin por existir un rango muy amplio de
variacin en los datos.)
Aplicando el algoritmo de los signos a las dos
respuestas, se obtienen las estimaciones de los efectos para la
media y el logaritmo de la variabilidad que aparecen en la tabla
10.5. Llevando estos resultados a un grfico en papel
probabilstico normal se obtienen los grficos representados en
la figura 10.4.
Se puede apreciar que los grupos de efectos significativos son:
AE+CD, C+BE y D+AB para la media,
AE+CD, A+BD y E+BC para la variabilidad.
Aunque existen confusiones debido al fraccionamiento del experimento, los expertos en el tema
consideraron que no tena sentido la existencia de la interaccin AE y BE, as como que D era un fuerte
candidato a tener influencia en la viscosidad media, lo cual por otra parte tiene bastante sentido. Por lo
tanto, para el estudio de la media se seleccionaron C, D y su interaccin CD.
En el estudio de la variabilidad se seleccionaron como posibles efectos significativos (a falta de
experimentos para confirmarlo) los efectos A, E y su interaccin AE.
Con los resultados del anlisis se pueden obtener los modelos que permitan una aproximacin
lineal en la zona de experimentacin (ver el captulo 9 para aproximaciones ms complejas) de la
media y la variabilidad de la viscosidad en funcin de los factores de diseo.
Estos modelos son:
Viscosidad media = 940 - 335 Ph + 417 T. Sales -496 Ph T. Sales + e V(e) = 259.5
2
Logn(s) = 281 - 0.20 M. prima - 0.15 C. sales - 0.27 M. prima C. Sales + e V(e) = 0.143
2
En ninguno de los dos modelos se ha detectado evidencia alguna de comportamiento anmalo
en los residuos; por lo tanto, a continuacin pasaremos a seleccionar aquellos niveles que optimicen
las dos funciones.
x
231

EFECTOS MEDIA LOGN(S)


media 939.9 2.81
A+BD -303.6 -0.40
B+AD+CE -117.7 -0.01
C+BE -669.2 -0.09
D+AB 833.3 0.18
E+BC -152.3 -0.30
AC+DE 74.2 0.03
AE+CD -992.0 -0.53
Tabla 10.5 Efectos sobre la media y la
variabilidad en el ejemplo del suavizante
(A= Materia prima; B= Estabilizante; C= Ph;
D= Tipo de sales; E= Cantidad de sales)
Fig. 10.4 Representacin en papel probabilstico normal de los efectos sobre la media A) y sobre la
variabilidad B). (A= Materia prima; B= Estabilizante; C= Ph; D= Tipo de sales; E= Cantidad de sales)
D+AB
AE+CD
C+BE
A B
E+BC
A+BD
AE+CD
Optimizacin de la variabilidad
Se desea un suavizante con una viscosidad lo ms robusta posible a influencias de factores ruido, esto
se traduce en que la variabilidad de la viscosidad del suavizante fabricado bajo una frmula
determinada (mismas condiciones de los facto-
res de control) ha de ser mnima.
Del anlisis de la figura 10.5 se extrae que
ello se consigue fabricando el suavizante con:
materia prima: M2,
cantidad de sales: alta.
En tal caso la variabilidad media
esperada en los suavizantes, independiente-
mente de los valores en que trabaje en los
dems factores de control, ser de
logn(s) = 2.81 - 0.2 - 0.15 - 0.27 = 2.19
s = exp (2.19) = 8.93 centipoises
Optimizacin de la viscosidad media
Para la seleccin de aquellos niveles de los factores ph y tipo de sales que minimicen la viscosidad, es
preciso analizar la interaccin entre ellos, y para ello se ha construido la figura 10.5.
Los niveles de los factores de control que
minimizan la viscosidad son por lo tanto:
Ph: 2.5
Tipo de sales: S1
Adems, la viscosidad media esperada en
estos suavizantes ser de:
Visc. media = 940+335-417-496=362 centipoises.
Por lo tanto, se concluye que el diseo del
suavizante robusto al ruido externo queda
definido por:
materia prima: M2
cantidad de sales: alta
ph: 2.5
tipo de sales: S1
De los suavizantes fabricados en tales condiciones se esperar una viscosidad media de 362
centipoises con una variabilidad de s=8.93 centipoises.
Anlisis de los datos. Mtodo de una nica matriz (Box-Jones)
Como comentamos en el apartado 10.3 de este captulo, las tcnicas de diseo robusto a la variabilidad
externa se basan en la interaccin existente entre factores de control y factores ruido. Este hecho
provoca que la caracterstica de calidad, al verse afectada por diferentes condiciones de factores ruido,
vare de manera diferente dependiendo del nivel en que se encuentre el factor de control.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
232

Fig. 10.5 Grfico de la interaccin materia prima cantidad de


sales en el estudio de la variabilidad.
Fig. 10.7 Grfico de la interaccin ph tipo de sales en el
estudio de la viscosidad media
M1 M2
M. prima
C. sales (alta)
C. sales (baja)
Log(s)
2.5 3.5
Ph
Tipo sal (S2)
Tipo sal (S2)
Viscosidad
media
DISEO DE PRODUCTOS ROBUSTOS
En el anlisis realizado anteriormente, en ningn momento se ha trabajado con interacciones
entre factores de control y factores ruido. Para que estas interacciones, que aparecen en el modelo
(10.1), puedan ser analizadas, se tienen que ordenar las condiciones experimentales de la matriz
producto como si pertenecieran a una matriz nica de un diseo fraccional con ocho factores en 32
experimentos.
La matriz producto estaba formada por dos diseos, de generadores:
D=AB y E=BC en el diseo 2
5-2
para los factores de control
O=MN en el diseo 2
3-1
para los factores ruido.
Si los interpretamos conjuntamente tendremos un diseo 2
(5+3)-(2+1)
=2
8-3
, con tres generadores:
D=AB, E=BC y O=MN y con relacin de definicin:
I= ABD = EBC = MNO = ACDE = ABDMNO = EBCMNO = ACDEMNO.
Como se puede comprobar, aunque este diseo es de resolucin III, permite estimar sin
confusiones las interacciones entre factores de control y factores ruido.
Para analizar el problema del suavizante como un diseo 2
8-3
, los datos han sido colocados tal
como aparecen en la tabla 10.6, y para las estimaciones de los efectos que se encuentran en la tabla
10.7 se ha utilizado la regla de los signos.
Podemos clasificar los efectos estimados en tres grupos:
1 El grupo que incluye los factores de control y las interacciones entre ellos.
2 El grupo que incluye los factores ruido y las interacciones entre ellos.
3 El grupo que incluye interacciones de factores de control con factores ruido.
Los efectos significativos (tanto efectos principales como interacciones) pertenecientes a
factores del primer grupo determinarn los factores de control que influyen en la viscosidad media del
suavizante.
Los efectos significativos asociados a factores pertenecientes al segundo grupo nos informarn
de aquellos factores ruido que afecten a la viscosidad media. Debido a la naturaleza de estos factores
no se podrn seleccionar sus niveles ptimos. (Esta informacin es realmente importante en aquellos
casos en que exista la posibilidad de cambiar el proceso para pasar a controlar algn factor ruido.)
Los factores del tercer grupo que posean efecto significativo identificarn los factores de
control que pueden ser seleccionados para que la variabilidad transmitida por los factores ruido sea
mnima. Adems, quedarn perfectamente identificados aquellos factores ruido que provocan tal
variabilidad. (Una vez ms esto puede hacer pensar a los tcnicos del problema en la posibilidad de
cambiar el diseo del proceso, el mtodo de distribucin de los productos,.etc.)
En el ejemplo que nos ocupa, llevando los datos de la tabla 10.7 al papel probabilstico normal
se observa que los grupos de efectos significativos son:
AE+CD, C+BE, D+AB, M+NO, O+MN, CN, CDM+AEM y ACN+DEN
Se observa que:
aparecen los mismos factores de control afectando a la viscosidad media que en el anlisis
trabajando con la matriz producto: AE+CD, C+BE, D+AB. Por las mismas consideraciones
anteriores seleccionaramos C, D y CD como los que contribuyen a la viscosidad;
los factores ruido M = Tiempo en que el recipiente del suavizante est abierto y O =
Temperatura del agua influyen notablemente en la viscosidad media. Estos factores dependen
totalmente del cliente, pero existe la posibilidad de desarrollar un recipiente de suavizante que
cierre hermticamente, de tal forma que el factor M no sea tan importante;
el grupo de interacciones CN, CDM+AEM y ACN+DEN puede ser utilizado para controlar la
variabilidad en la viscosidad, seleccionando aquellos niveles de los factores de control en que
el suavizante es ms robusto a cambios en los factores ruido.
233

MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD


234

M. PRIMA ESTABILZ. PH T. SALES C. SALES TIEMPO T. AGUA C AGUA VISCOSIDAD


- - - + + - - + 3200
+ - - - + - - + 37.5
- + - - - - - + 1600
+ + - + - - - + 1900
- - + + - - - + 125
+ - + - - - - + 250
- + + - + - - + 50
+ + + + + - - + 175
- - - + + + - - 4500
+ - - - + + - - 42.5
- + - - - + - - 475
+ + - + - + - - 2200
- - + + - + - - 112.5
+ - + - - + - - 325
- + + - + + - - 112.5
+ + + + + + - - 97.5
- - - + + - + - 175
+ - - - + - + - 300
- + - - - - + - 137.5
+ + - + - - + - 302.5
- - + + - - + - 965
+ - + - - - + - 325
- + + - + - + - 445
+ + + + + - + - 492.5
- - - + + + + + 1560
+ - - - + + + + 242.5
- + - - - + + + 60
+ + - + - + + + 3660
- - + + - + + + 1900
+ - + - - + + + 1920
- + + - + + + + 2050
+ + + + + + + + 340
MEDIA 939.9 M+NO 569.8 AN 339.8 DO -2
A+BD -303.6 N+MO -20.5 BN 130.2 EO -317.7
B+AD+CE -117.7 O+MN 504.0 CN 919.2 ACM+DEM -204.5
C+BE -669.2 AM 60.8 DN -343.9 CDM+AEM -640.2
D+AB 833.3 BM -83.3 EN -305.8 ACN+DEN -681.1
E+BC -152.3 CM -66.1 AO 51.1 CDN+AEN 242
AC+DE 74.2 DM 309.5 BO 192.7 ACO+DEO -181.7
AE+CD -992.0 EM -61.1 CO -12.0 CDO+AEO -271.7
Tabla 10.6 Matriz de diseo 2
8-3
y resultados de la experimentacin en el problema del suavizante
Tabla 10.7 Estimacin de los efectos en el ejemplo del suavizante para el diseo 2
8-3
(excepto en
los seis ltimos grupos, se han omitido las interacciones de orden 30 superior)
DISEO DE PRODUCTOS ROBUSTOS
Si consideramos las interacciones CN y ACN como las de mayor contribucin con el factor
ruido N, y la AEM para el factor M, los grficos en las figuras 10.7 y 10.8 ayudan notablemente en la
interpretacin y seleccin de las condiciones ptimas de diseo.
Como se puede observar en la figura 10.7, la naturaleza de esta interaccin no permite
seleccionar un nivel para los factores M. prima y ph tales que la variacin transmitida por el tipo de
agua sea mnima. En todo caso los grficos sugieren que tal vez con un ph intermedio se puedan lograr
resultados esperanzadores.
De la interpretacin de la figura 10.8 en la que est representada la interaccin de m. prima c. sales
con el factor ruido tiempo abierto se obtienen mejores resultados.
Fig. 10.7 Grfico de la interaccin m. prima ph tipo de agua.
Fig. 10.8 Grfico de interaccin entre m. prima c. sales tiempo abierto.
Se observa que trabajando con la materia prima y la cantidad de sales a un mismo nivel ( M1
con cantidad de sal baja y M2 con cantidad de sal alta), la variabilidad transmitida es mucho menor.
Por lo tanto, concluimos que para obtener un suavizante con mnima viscosidad y robusto al
ruido externo, hemos de trabajar con:
ph de 2.5 y sales del tipo S1 si queremos conseguir mnima viscosidad;
con m. prima del tipo M2 y cantidad alta de sales o con menos sal si se trabaja con la materia
prima M1 si se desea conseguir un suavizante robusto a la variabilidad transmitida por el efecto
del tiempo abierto.
Como el lector habr comprobado, esta ltima forma de analizar los experimentos permite
conocer ms sobre el producto, ya que quedan identificados:
los factores ruido que tienen influencia en la media: M y O;
los factores ruido que pueden ser contrarrestados por medio de una seleccin adecuada del
diseo: M y N.
235

Ph (3.5)
M. prima (M1)
M. prima (M2)
Blanda Dura
Viscosidad
media
Tipo de agua
Ph (2.5)
M. prima (M1)
M. prima (M2)
Blanda Dura
Viscosidad
media
Tipo de agua
C. sal (bajo)
M. prima (M1)
<10 das >10 das
Viscosidad
media
Tiempo abierto
C. sal (alto)
C. sal (bajo)
M. prima (M2)
<10 das >10 das
Viscosidad
media
Tiempo abierto
C. sal (alto)
Sin embargo, con el primer mtodo de anlisis de la matriz producto, la variabilidad estimada
para cada condicin de diseo tiene una componente debida a aquellos factores ruido ajenos a los
controlados en la experimentacin y, por lo tanto, podramos decir que el producto resultante es ms
robusto que el obtenido con el mtodo de la nica matriz.
Por la experiencia que hemos ido adquiriendo en la aplicacin de las tcnicas de anlisis de los
diseos de experimentos, no podemos decir que un mtodo de anlisis sea mejor que el otro. Por el
contrario, ambos son vlidos y complementarios. Del anlisis conjunto los tcnicos pueden obtener
importantes conclusiones tanto para el objetivo particular que les ocupa como para futuras lneas de
experimentacin.
(En todos los anlisis aqu considerados se ha asumido que el orden de experimentacin ha sido
aleatorio. En la prctica algunos experimentadores no cumplen este requisito, fabrican prototipos
seguidos para cada condicin de la matriz de diseo y los someten uno detrs de otro a las condiciones
de ruido. El experimentador que se encuentre en esta situacin est rompiendo una de las hiptesis en
que se basan los anlisis aqu presentados y para un correcto anlisis de los datos tendr que aplicar las
tcnicas de anlisis de varianza denominada split-plot (Milliken y Johnson (1984).)
10.7 Ejemplo de producto robusto a ruido interno: tubo calefactor
Se entiende por ruido interno la variabilidad que presentan ciertas caractersticas de calidad de los
productos debido a que los valores que realmente toman sus factores de diseo no son los nominales,
o, si lo son al principio, sufren una cierta variacin a lo largo del
tiempo.
De forma anloga al caso de la existencia de ruido externo, la
metodologa que se propone consta de las siguientes fases:
Establecer una hiptesis sobre el modelo de la respuesta.
Seleccionar un diseo apropiado que permita estimar los
parmetros del modelo.
Estimar los parmetros del modelo.
Analizar la media y la varianza en la respuesta.
Como ya comentamos en el apartado 10.4 se puede analizar la
variacin transmitida por los factores internos y minimizarla slo si la
relacin entre stos y la respuesta es no lineal (ver figura 10.2).
Para poder detectar este tipo de relaciones no lineales debemos
experimentar con diseos que as nos lo permitan. Algunos de estos
diseos, los denominados diseos centrales compuestos, fueron presentados en el captulo 9.
El ejemplo que vamos a presentar se trata del diseo de un tubo calefactor, tal como el que
aparece en la figura 10.9, en el que la caracterstica a estudio es el flujo de calor que pasa por la
superficie. El objetivo es obtener un tubo de flujo 1400 cal/seg y lo ms robusto posible a pequeas
variaciones en los parmetros de diseo. stos son:
T1 :Temperatura en el exterior del cilindro (C).
T2 :Temperatura en el interior del cilindro (C).
b :Dimetro exterior del cilindro (cm.).
a :Dimetro interior del cilindro (cm.).
Para la realizacin del experimento se toma un tubo de 1 cm de largo, con un coeficiente de
conductividad trmica de k=0.92 cal/seg cm C. Como se conoce la ley fsica que relaciona el flujo de
calor con los parmetros de diseo:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
236

T1
T2
a
b
Fig. 10.9 Seccin cilndrica del
tubo calefactor
DISEO DE PRODUCTOS ROBUSTOS
Flujo = 2p(T
2
-T
1
)/ln(b/a) (10.5)
no hara falta experimentar. Sin embargo, vamos a seguir los pasos que seguira el experimentador en
caso de desconocer tal ley, aunque los datos sern obtenidos al sustituir los parmetros de diseo en la
frmula.
El modelo que el experimentador desea estimar ser un
modelo de segundo orden del tipo:
Y=
0
+
i
X
i
+
ij
X
i
X
j
+
ii
X
2
i
+ (10.6)
y para ello se han seleccionado las condiciones experimentales que
aparecen en la tabla 10.8,
basndose en las diseos que se presentaron en el captulo 9.
Los niveles de los factores son:
Aplicando las tcnicas expuestas en el captulo 9 el modelo
estimado por mnimos cuadrados es el que aparece en (10.7) una vez
expresado en unidades originales. En ste, e representa la parte del
flujo que no queda explicada por el modelo.
Flujo = 57199 + 270.4 (T
2
-T
1
) - 95421 r - 193.1 (T
2
-T
1
) r + 39605 r
2
+ e (10.7)
Si se realiza un anlisis cannico a esta superficie utilizando las tcnicas del captulo 9, se
observa que esta aproximacin local de la superficie representa una cresta no estacionaria. La curvatura
de la cresta la da la relacin cuadrtica del flujo con r, y la no estacionalidad la da la relacin lineal
con (T
2
-T
1
). Por lo tanto, para minimizar la variabilidad transmitida por los factores ruido, debemos
utilizar la relacin cuadrtica existente entre el flujo y r.
Veamos lo que ocurre si hacemos fijo T
2
-T
1
= 50C. En tal caso el modelo anterior queda de la forma
Flujo = 70719 - 105076 r + 39605 r
2
+ (10.8)
y la transmisin de la variabilidad debido al ruido interno puede obtenerse a travs de la expresin
que en este caso particular toma la forma:
Tal expresin, para un valor fijo de Sr
2
, es decreciente en el intervalo (1, 1.3) y tiene un mnimo
en r =1.3.
En consecuencia, si fijamos r =1.3 conseguimos un tubo calefactor lo ms robusto posible al
ruido interno (por supuesto que r no tiene que ser estrictamente 1.3; este resultado debe de
confrontarse posteriormente con el de la media de flujo que se desee). Cabe notar que el valor
seleccionado para r ser vlido para cualquier valor de T
2
-T
1
, a pesar de que ha sido hallado con un
valor particular de T
2
-T
1
=50.
237

T1 T2 r FLUJO
- - - 909.7
+ - - 303.2
- + - 4245.1
+ + - 3638.7
- - + 330.5
+ - + 110.2
- + + 1542.1
+ + + 1321.8
-1.2 0 0 1188.8
1.2 0 0 1381.5
0 -1.2 0 996.2
0 1.2 0 129.2
0 0 -1.2 2248.4
0 0 1.2 2871.7
0 0 0 777.3
Tabla 10.8 Resultados de la expe-
rimentacin con el tubo calefactor
obtenidos de la frmula fsica
NIVELES DE LOS FACTORES
-1.2 -1 0 +1 +1.2
T
1
19 20C 25C 30C 31C
T
2
29.5C 35C 62.5C 90C 95.5C
r 1.08 1.1 1.2 1.3 1.32
s
X
s
Funcion
Funcion
i
X
i
2 2

1
]
1

(10.9)
[ ]
s r r s
Flujo r
2 9 2 2
10 11 16 6 6 3 + . .
(10.10)
Una vez minimizada la varianza, el valor medio del flujo de este calefactor se puede conseguir
seleccionando adecuadamente el valor de T
2
-T
1
. As, si se sustituye en el modelo general (10.7) el
valor r =1.3, se obtiene
Flujo = 84.15 + 19.37 (T
2
- T
1
) + e (10.11)
y se logra el flujo deseado vario T
2
-T
1
. Puesto que el valor objetivo era 1400 cal/seg el valor de (T
2
-T
1
)
ha de situarse en 73 C.
En general podemos decir que la metodologa de diseo de productos robustos a ruido interno:
utiliza las relaciones no lineales de la caracterstica a estudio con determinados factores para
seleccionar un nivel de estos ltimos en el que la variacin transmitida sea mnima,
utiliza las relaciones lineales de la caracterstica a estudio con determinados factores para llevar
el valor medio de la caracterstica a su valor nominal.
10.8 Diseo de tolerancias
En el apartado 10.3 hemos citado el diseo de tolerancias como una de las fases diferenciadas en la
etapa de diseo de un producto o proceso, al cual se recurre cuando una vez aplicada la fase de diseo
de parmetros la variabilidad resultante no es todava satisfactoria.
En el diseo de tolerancias se toman decisiones sobre la variabilidad que se est dispuesto a
admitir en las componentes de un producto.
Una de las implicaciones es que hay que poner cotas de variacin a los parmetros de diseo.
Para ello hay que evaluar la variabilidad transmitida por cada componente del diseo en el producto
final, a partir del modelo estimado en el diseo de parmetros.
La aplicacin del diseo de tolerancias es costosa en general, ya que conlleva la seleccin de
proveedores ms caros, mquinas ms capaces, mantenimiento ms rgido, etc.
En el ejemplo del tubo calefactor del apartado 10.7, se tratara de seleccionar aquellos
proveedores de tubos calefactores que fuesen ms capaces en el suministro de tubos de determinada
proporcin r = b/a. Es decir, aquellos cuya s
r
fuese menor. Asmismo habra que seleccionar aparatos
precisos de medida, etc.
A aquellos lectores que deseen ampliar el tema les recomendamos la lectura de Taguchi (1986).
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
238

DISEO DE PRODUCTOS ROBUSTOS


Apndice 10A. Funcin de prdidas
El ingeniero Genichi Taguchi introdujo una nueva filosofa de la calidad impulsada por los cambios
que los sistemas productivos han experimentado en los ltimos aos.
Taguchi da una medida de calidad de un producto basada en la prdida econmica que supone la
variacin de las caractersticas de tal producto respecto de los valores nominales para los cuales est definido.
En general, dada una caracterstica de calidad Y con valor nominal , la relacin existente entre
diferentes valores de tal caracterstica y las prdidas econmicas ocasionadas por tales variaciones
puede ser aproximada por una funcin cuadrtica P(y):
Tal funcin puede ser interpretada como una funcin determinante de la calidad de un individuo
cuya caracterstica de calidad tiene el valor y. Aunque la relacin real sea ms compleja, P(y) puede
ser considerada como una aproximacin local obtenida con los trminos cuadrticos del desarrollo de
Taylor de la funcin terica en torno el valor mnimo .
La figura 10.A.1 representa la funcin P(y). Como se observa, cuanto ms alejado se est del
valor nominal, ms prdidas se ocasiona al cliente y, por lo tanto, segn la definicin anterior, menos
calidad tiene el producto.
Cuando el producto est en el valor nominal , el coste del producto es el mnimo que se puede
obtener. Por otra parte el valor de la constante k queda determinada en el momento que se conoce las
prdidas en cualquier valor de la caracterstica distinta del valor nominal.
Por ejemplo si se conoce la prdida en el valor y = a, k se obtendr mediante la frmula
Sin embargo, cuando se habla de un producto, se engloban las diferentes unidades fabricadas
por el proceso considerado. Tales unidades presentarn variabilidad en cuanto a la caracterstica de
calidad a estudio y, por lo tanto, cada una de ellas poseer diferente calidad.
Por consiguiente, la prdida esperada para
un proceso en su conjunto, en cuanto a una carac-
terstica de calidad determinada, se obtendr
promediando la calidad de las diferentes unidades
producidas. Esta calidad se obtiene hallando el
valor esperado de la funcin de prdidas P(y),
donde y
2
representan la media y la varianza
que presenta la caracterstica una vez est en
manos del cliente. Dado que en general se
procurar que
= E(y) = (10.15)
se tendr
L(y) = k
2
(10.16)
De (10.16) se deduce que no basta con
centrar un proceso en su valor nominal, sino que
hay que hacerlo con la mnima variabilidad.
239

P y k y ( ) ( )
2
(10.12)
Figura 10.A.1 Funcin de prdidas
k
P a
a

( )
( )
2
(10.13)
L y E P y E k y k ( ) ( ( )) ( ( ) ) ( ( ) ) +
2 2 2
Apndice 10B Mtodo de Taguchi
Las aportaciones de Genichi Taguchi a la ingeniera de la calidad son unnimemente reconocidas como
una de las ms importantes en los ltimos tiempos (Box 1988), (Kackar 1985), (Ross 1988). A l se
deben las primeras ideas para dar mayor nfasis a la etapa de diseo del producto en la mejora de la
calidad, tal como se ha comentado en el apartado 10.2.
Esquemticamente, esta metodologa puede resumirse en las siguientes etapas:
a. Identificacin de los factores de diseo, de los factores de ruido y de sus niveles de
experimentacin.
El diseador del producto debe identificar las variables que presumiblemente afectan a las
caractersticas de inters, as como los niveles a los que conviene experimentar.
Igualmente deber identificar los factores de ruido y decidir entre qu niveles de estos factores
se desea que el producto sea insensible.
b. Construccin de las matrices de diseo (para los factores de control y para los factores de
ruido), y planificacin del experimento.
Las matrices de diseo, tanto para los factores de control como para los de ruido, son, en
esencia, del tipo de las comentadas en los captulos 7 y 8, aunque Taguchi utiliza los
denominados orthogonal arrays (ver Taguchi (1986)).
Los experimentos se realizan para cada una de las condiciones de la matriz de factores de ruido
(matriz externa) en cada una de las condiciones de los factores de control (matriz interna),
formando la llamada matriz producto. (Vase la figura 10.B.1.)
c. Realizar los experimentos y evaluar el estadstico adecuado.
Una vez obtenidos los resultados experimentales para cada una de las condiciones de la matriz
de diseo, se calculan dos estadsticos: la media y el denominado proporcin seal-ruido ().
La optimizacin de los valores de los factores de diseo se resuelve en dos etapas:
i) Determinar los factores que afectan a la proporcin seal-ruido y escoger los valores que
lo maximizan.
ii) Seleccionar algn factor que, teniendo influencia sobre el nivel de la respuesta tenga un
efecto lo menor posible sobre la prporcin seal-ruido. ste ser el factor que se utilizar para
llevar la respuesta al nivel deseado.
Figura 10.B.1: Matriz producto segn el plan experimental propuesto por Taguchi
Taguchi propone diferentes proporciones seal-ruido segn el objetivo que se persiga. As, si lo
que se pretende es minimizar la respuesta, se deber trabajar en las condiciones que maximicen:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
240

Matriz interna
Matriz externa
Matriz producto
Factores ruido
Factores de diseo
x1 x2 x3 . . .
z1
z2
z3
.
Factores de ruido
Factores de diseo
Matriz interna
Matriz externa
Matriz producto
x1 x2 x3 ...
z1
z2
z3
.
DISEO DE PRODUCTOS ROBUSTOS
Si el objetivo es que la respuesta sea lo mayor posible, se maximiza:
Y si se trata de mantener la respuesta en su valor nominal, se maximizar:
donde:
Vector que representa una determinada combinacin de niveles de los factores de
diseo.
Y
i
: Respuesta en la condicin i-sima de la matriz externa.
n: Nmero de condiciones experimentales de la matriz externa.
s
2
: Varianza de las respuestas obtenidas en cada una de las condiciones experimentales
definidas por la matriz externa, para un determinado valor de .
d. Analizar la significacin de los efectos.
Los resultados se analizan mediante tablas de anlisis de la varianza. Esta tcnica de anlisis de
la significacin de los efectos es uno de los aspectos ms controvertidos del mtodo de Taguchi.
(Box (1986), entre otros, ha realizado un detallado anlisis crtico sobre este aspecto.)
e. Realizacin de experimentos confirmatorios.
Antes de dar definitivamente por bueno el resultado obtenido, Taguchi propone la realizacin
de una serie de experimentos para confirmar que las condiciones obtenidas como ptimas son
efectivamente las mejores.
241

(10.18)
(10.19)
H
x:
( ) log
H
x
Y
n
i
i
n

_
,

10
2
1
( )
( ) log
H
x
Y
n
i
i
n

_
,

10
1
2
1
( ) log
H
x
Y
s
10
2
2
H
X
Ejercicios
10.1. Con el objetivo de fabricar un material que, tras haber sido usado durante un cierto tiempo bajo
condiciones extremas diferentes, presentase el mnimo desgaste en una prueba estndar, siendo
ese desgaste lo ms independiente posible de aquellas condiciones externas, se realizaron ocho
experimentos con los resultados siguientes:
a) Encuentre el diseo ptimo del producto razonando el mtodo que se ha utilizado para llegar a l.
b) Qu factor transmite ms variabilidad en el desgaste?
(Suponer
A
2
=
B
2
=
C
2
=
D
2
=
E
2
)
c) Comparar el diseo ptimo ptimo con las condiciones actuales
10.2. Se dispone de tres factores controlables A, B, C y un factor ruido 0. Tras conducir un
experimento adecuado se obtiene:
Cul sera la manera de conseguir una respuesta lo ms baja posible con el mnimo de
variabilidad?
10.3. En un departamento de una empresa se quieren conocer los factores que influyen en el
contenido de CO en determinado motor con el fin de reducir su presencia. Para ello se han
seleccionado siete factores A, B, C, D, E, F, G, y se han realizado bajo ocho condiciones
experimentales diferentes tres experimentos en condiciones adversas al proceso. Los resultados
obtenidos de CO (en gramos) estn en la tabla siguiente:
a) Qu factores afectan
a la media y a la variabi-
lidad del contenido en CO?
b) Cules son las
condiciones ptimas de
trabajo? Qu concentra-
cin media se espera en-
contrar? Con qu varia-
bilidad?
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
242

FACTORES CONDICIONES EXTERNAS


A B C D E c1 c2 c3 c4 c5 c6 c7 c8
-1
1
-1
1
-1
1
-1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
1
1
-1
1
1
-1
1
-1
-1
1
12
6
9
8
16
18
14
16
12
10
10
8
14
26
22
13
10
3
5
5
8
4
7
5
13
5
4
4
8
2
5
4
3
3
2
3
3
3
3
11
3
4
1
4
2
3
4
4
16
20
3
9
20
7
19
14
20
18
2
9
33
10
21
30
Diseo actual 17 22 7 12 10 8 18 25
MEDIA A B C AB AC BC ABC
Efecto nivel (media)
Efecto variable (log S)
7.8
0.3
0.5
-0.8
0.4
0.1
-1
-0.2
0.8
0.3
0.2
0.0
-0.1
0.5
0.2
0.2
A B C D E F G R1 R2 R3
N 1 2 3 4 5 6 7
1
2
3
4
5
6
7
8
1
1
1
1
2
2
2
2
1
1
2
2
1
1
2
2
1
1
2
2
2
2
1
1
1
2
1
2
1
2
1
2
1
2
1
2
2
1
2
1
1
2
2
1
1
2
2
1
1
2
2
1
2
1
1
2
1.04
1.42
1.01
1.50
1.28
1.14
1.33
1.33
1.20
1.76
1.23
1.87
1.34
1.26
1.42
1.52
1.54
2.10
1.52
2.25
2.05
1.88
2.10
2.13
Consideremos que el proceso de relleno de botellas de agua mencionado en el captulo 3, que tena de
especificaciones 200 2 cm
3
, est en estado de control rellenando con una media =200 cm
3
y
desviacin tpica = 0.7 cm
3
. Supongamos que cada hora se toman datos del contenido de un nmero
determinado de botellas. Qu estrategia se ha de seguir, basndose en esta informacin, para poder
detectar lo antes posible cambios en el proceso que provoquen el relleno de botellas fuera de
tolerancias?
En este captulo se presentar la herramienta estadstica denominada control estadstico de
procesos (CEP o SPC en trminos anglosajones), que ayudar a llevar a cabo los objetivos que
presentamos en el siguiente apartado, uno de los cuales es el anteriormente planteado con la lnea de
embotellado. El CEP utiliza grficos de control que dependen del tipo de caracterstica a estudio y de
la naturaleza de cada proceso. Los grficos que presentaremos en este captulo son los que
corresponden a las situaciones ms generales que presentan los procesos. Para aquellas situaciones ms
especficas, se recomienda al lector la bibliografa que se propone al final del libro: Box y Kramer
(1992), Douglas y Montgomery (1991), MacGregor (1990) y Montgomery (1991) entre otros.
11.1 Evolucin del CEP y objetivos
Las tcnicas de control estadstico de procesos comenzaron a ser desarrolladas en 1920 en EEUU por
W. A. Shewart, cobrando especial importancia su utilizacin durante la Segunda Guerra Mundial en
las empresas de armamento. Hasta entonces las pruebas de calidad que se adoptaban en las empresas
estaban basadas principalmente en la inspeccin de los productos una vez acabados, eliminando los
defectuosos. Este procedimiento se revel ineficaz por los motivos expuestos en el captulo 1 de este
libro y el control de la calidad se desplaz al proceso de fabricacin.
A partir de entonces el control de procesos ha ido evolucionando respondiendo a las
necesidades de la industria dando lugar a dos corrientes. La primera, que sigue denominndose control
estadstico de procesos (Statistical Process Control, SPC), ha estado ms relacionada con las industrias
de produccin en serie y se desarroll principalmente a partir de la crisis de los aos 70 en empresas
relacionadas con el sector de automocin. A la segunda corriente se la denomina control adaptativo o
automtico de procesos (Automatic Process Control, APC) y ha estado ms ligada a empresas de
11
Control estadstico de procesos
243
produccin continua, como pueden ser las empresas qumicas. Hoy en da la utilizacin de unas
tcnicas u otras es compartida cada vez ms por ambos sectores industriales.
En este captulo presentaremos el CEP remitiendo al lector a la lectura de Box y Kramer (1992)
si desea comparar ambas tcnicas o encontrar referencias sobre la prctica de APC.
En primer lugar, podemos decir que los objetivos principales del CEP son los siguientes:
1) Minimizar la produccin defectuosa.
2) Mantener una actitud de mejora continua del proceso.
3) Comparar la produccin respecto a las especificaciones.
Para poder llevar a cabo estos objetivos hay que tener en cuenta, como dira Bill Hunter, que
todo proceso genera un producto, pero adems genera informacin. Informacin que se puede obtener
tomando datos numricos de las caractersticas de los productos que salen del proceso y tratndola
adecuadamente. La informacin permite escuchar el proceso y poder llevar a cabo los objetivos
anteriormente citados.
Con la actual filosofa de la calidad total, no basta con conseguir el objetivo 1) de minimizar la
produccin defectuosa; hay que mantenerse en una mejora continua, tal como se coment en el
captulo 1, y los estndares internos de fabricacin se han de ir cambiando independientemente de las
especificaciones externas del cliente.
Adems, las tcnicas de CEP han de ser aplicadas lo ms prximas posible al proceso que
genere la informacin para poder disminuir el tiempo de reaccin ante el proceso. Por ello, han de ser
sencillas de utilizar e interpretar para que los operarios puedan utilizarlas sin apenas necesitar la ayuda
de los especialistas en CEP.
Para un correcto seguimiento de este captulo es recomendable que se revisen los conceptos
desarrollados en los captulos 3 y 4.
11.2 Proceso en estado de control
En el apartado 3.1 del captulo 3 se defini un proceso en estado de control como aquel que slo est
afectado por causas comunes de variacin. En la tabla 3.1 del mismo captulo se presentaron las
principales caractersticas asociadas a las causas comunes y asignables, una de las cuales es la
posibilidad de modelar matemticamente la variabilidad asociada al efecto de las primeras. Para
presentar las filosofa de los grficos de control es necesario identificar el modelo que subyace en un
proceso en estado de control, es decir, se ha de clasificar la caracterstica de inters bajo los modelos
ms comunes presentados en el captulo 4: ley Normal, Binomial y Poisson.
11.2.1 Comportamiento esperado de las observaciones individuales en un proceso en estado de
control
Volvamos al ejemplo del proceso de relleno de botellas de agua que, en estado de control, trabaja con
media =200 cm
3
y desviacin tpica =0.7 cm
3
. Supongamos que se toma una botella a intervalos de
tiempo fijo y se anota su contenido en un grfico como el que aparece en la figura 11.1.
Como ya se mencion en el apartado 4.1, el modelo matemtico que caracteriza tal proceso es
la ley normal y observamos que la mayora de estas botellas estn dentro de unos lmites
representados por 3 del proceso. En este caso particular, los lmites son 197.9 y 202.1 cm
3
,
obtenidos por el conocimiento previo que se tena de los parmetros (en el apartado 11.4.1 se explica
cmo estimar estos parmetros cuando sean desconocidos). Adems, observamos que los valores
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
244
CONTROL ESTADSTICO DE PROCESOS
aparecen de forma aleatoria alrededor del
valor central representado por la media.
Supongamos ahora que durante el
proceso de toma de datos se desajusta la
mquina de relleno en 1 cm
3
pasando a
rellenar con media 201 cm
3
e igual disper-
sin, tal como muestra la figura 11.2.a.
Observamos que ha habido un aumento
considerable de las observaciones apare-
ciendo por encima de la media. Incluso,
alguna de estas observaciones aparece
ms all de los lmites marcados por el
proceso anterior.
Si, en cambio, el desajuste de la
mquina provoca un aumento en la
variabilidad del proceso de relleno,
pasando de =0.7 a = 1, los valores en
la figura 11.2.b aparecen ms dispersos,
aunque en torno al mismo valor central.
Se observa que el contenido de alguna de
las botellas va ms all de los lmites
originales.
De lo hasta aqu expuesto se intuye
que una herramienta de control de
aparicin de causas asignables podra ser
un grfico que contenga:
una lnea central que representa a
la media del proceso;
dos lmites, superior e inferior, a
distancia de 3 de la lnea central.
As, el control se realizara
tomando un individuo del proceso,
midiendo la caracterstica de inters y
anotando este valor en el grfico. Si estos
valores surgen ms all de los lmites se
interpreta como que una causa asignable
ha entrado en el proceso. (Lo mismo
ocurre si se detecta cualquier otro patrn
de tendencia en los datos, como se ver en
el apartado 11.4.4.)
Uno de los inconvenientes que
presentan los grficos as construidos es
que si el desajuste en el proceso es
pequeo, la aparicin de botellas ms
all de los lmites de 3 puede no
ocurrir o hacerlo con mucha demora. Por
ello es necesario obtener los lmites de
245

Fig. 11.1 Contenido en cm


3
de 50 botellas de agua de un proceso en
estado de control
Fig. 11.2 Contenido en 50 botellas cuando el proceso se ha
desajustado: a) la media de 200 cm
3
a 201 cm
3
. b) la desviacin tpica
de 0.7 cm
3
a 1 cm
3
con media de 200 cm
3
control de modo que se acorte el tiempo de deteccin de un desajuste sin que, por otro lado, aumente
mucho la probabilidad de falsas alarmas.
Esto se puede conseguir en el proceso de embotellado si, en lugar de tomar una botella cada vez,
se toma una muestra de botellas y se analiza el comportamiento del contenido medio de la muestra.
Como se vio en el apartado 4.9, la distribucin muestral de la media de un proceso en estado de control
es N(, / ) y, por lo tanto, el grfico de control tendr los lmites ms estrechos.
11.2.2 Comportamiento de la media de un proceso en estado de control
La figura 11.3 ha sido obtenida al tomar
cuatro botellas y anotar el contenido
medio en las tres situaciones que se han
trabajado en el apartado 11.2.1. Se
observa que, al ser los lmites ms
estrechos, el poder de deteccin aumenta.
En efecto, se observa un mayor nmero de
observaciones fuera de lmites, y adems
el tiempo que transcurre desde que se
produce el cambio hasta que se detecta es
mucho menor que cuando se tomaba una
nica botella.
De hecho, se puede comparar el
poder de deteccin del grfico de la media
para distinto tamao de muestra en
funcin del cambio que se produce en el
proceso. La tabla 11.1 presenta un anlisis
comparativo para cuando el desajuste se
realiza en media.
Se puede observar que para cambios
moderados de 2 o ms, la probabilidad de
deteccin cuando se trabaja con una
muestra es mucho mayor que cuando se
trabaja con el mismo nmero de obser-
vaciones individuales. Adems, hay que
tener en cuenta en todos los casos que para
obtener n observaciones individuales se
deben esperar n unidades de tiempo, lo cual
implica que el proceso est produciendo
con este desajuste durante ms tiempo.
Por otra parte se observa que si el
cambio es de 1.5 o menos, ninguno de
los dos mtodos de control, el de obser-
vaciones individuales o el de medias, son
muy eficaces. En el apartado 11.6 se
presentan grficos alternativos para este
tipo de cambios.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
246
n
DESAJUSTE DEL PROCESO EN MEDIA
0.5 1 1.5 2
n = 1 0.6 %
(464)
2.3 %
(130)
6.7 %
(44)
15.9 %
(18)
n = 2 1.3 %*
1.4 %**
(271)***
4.5 %
5.6 %
(52)
12.9 %
19 %
(14)
29.2 %
43.2 %
(6)
n = 3 1.9 %
1.6 %
(181)
6.7 %
10.2 %
(28)
18.7 %
34.4 %
(7)
40.4 %
67.9 %
(3)
n = 4 2.6 %
2.7 %
(130)
8.8 %
15.9 %
(18)
24.2 %
50 %
(5)
49.9 %
84.1 %
(2)
n = 5 5.0 %
5.1 %
(52)
16.3 %
43.2 %
(6)
42.5 %
89.3 %
(2)
74.9 %
99.6 %
(1)
Tabla 11.1 Probabilidad de deteccin de cambios en la media del proceso
* Tomando n observaciones aisladas. ** Tomando medias de n
observaciones. *** N de muestras de tamao n que se han de tomar
para que exista una probabilidad de al menos 95% de detectar el
cambio en el proceso.
Fig. 11.3 Grfico del contenido medio de 4 botellas con =200 y
=0.7 (observaciones1-20), con =201 y =0.7 (Observaciones 21-40)
y con =200 y =1 (ltimas 20 observaciones)
CONTROL ESTADSTICO DE PROCESOS
En el siguiente apartado profundizaremos sobre algunos de los aspectos ms importantes de la
estructura de los grficos de control, tales como los lmites del grfico, la frecuencia de muestreo,
quin ha de utilizarlos, etc.
11.3 Qu es un grfico de control? Metodologa
Un grfico de control es un grfico en el que se representa el comportamiento de un proceso anotando
sus datos ordenados en el tiempo.
El objetivo principal de los grficos de control es detectar lo antes posible cambios en el proceso
que puedan dar lugar a la produccin de unidades defectuosas, y ello se consigue minimizando el
tiempo que transcurre desde que se produce un desajuste hasta que se detecta.
Asimismo, como ya se mencion en el apartado 11.1, el CEP hay que verlo tambin como una
herramienta de mejora continua de la calidad de los productos, puesto que hoy en da se mide la calidad
de un producto como un valor que es inversamente proporcional a la variabilidad que presentan sus
caractersticas de calidad en el cliente (ver apartado 3.1). Puesto que reducir la variabilidad debido a
las causas comunes resulta ms complejo, en general el CEP ayuda a la deteccin de causas asignables
para tomar acciones en funcin de su naturaleza.
Por lo tanto, el objetivo primordial de los grficos es la deteccin rpida de la presencia de
causas asignables en un proceso y para ello son importantes los siguientes puntos:
1) El riesgo que se est dispuesto a admitir cada vez que se decida que una causa asignable ha
entrado en el proceso.
2) El cambio mnimo en el valor del parmetro que se desea detectar.
3) El tiempo medio esperado entre desajustes.
Se entiende que un grfico de control da falsas alarmas cuando las observaciones de un
proceso en estado de control llevadas al grfico son interpretadas errneamente como seales de
aparicin de causas asignables. Para que esto no ocurra con frecuencia, se toman los lmites tales que
la probabilidad de falsa alarma sea del orden de un 3, es decir, se ha de estar muy seguro para aceptar
que el proceso ha cambiado. Para ello, en el caso de la distribucin normal los lmites de control se han
de situar a una distancia de la lnea central de tres desviaciones tpicas del estadstico que se sita en
el grfico.
En cuanto al punto (3), el tiempo medio en que se producen los desajustes en el proceso
determinar la frecuencia de muestreo: cuanto ms estable es un proceso menos inversin (tiempo y
dinero) debe dedicarse a controlarlo. Puesto
que se ha de minimizar el tiempo de deteccin
de un cambio en el proceso, la frecuencia de
muestreo ha de ser superior a la del tiempo
esperado entre cambios, tal como muestra la
figura 11.4.
Por otra parte, adems del tiempo medio
entre desajustes, es importante estimar los
costes de producir fuera de control en este
tiempo, de tomar datos del proceso y de
ajustarlo y, en funcin de ellos, realizar una
poltica de control lo ms ptima posible.
En el ejemplo de la figura 11.4, la
opcin T(1) es ms cara desde el punto de vista
247

Fig. 11.4 Frecuencia de muestreo T(1) y T(2) para un proceso


en que se controla la media
T(1)
T(2)
del coste de control que la opcin T(2), ya que la frecuencia de muestreo es mayor, pero tal vez los
beneficios obtenidos al detectar antes un cambio en el proceso sean mayores en T(1).
Por ltimo, de poco o nada sirve lo hasta aqu expuesto, si la informacin que emana de los
grficos de control tarda en ser escuchada por aquellas personas que directamente pueden actuar
sobre el proceso, o no se le presta la debida atencin. Es decir, poner en marcha un sistema de control
estadstico de procesos no consiste en:
rellenar plantillas de recogida de datos por parte de los operarios, para ser llevados a final de
mes a un grfico por parte de los tcnicos y posteriormente ser archivados;
realizar un grfico con los lmites obtenidos la primera vez que se implement el CEP, los
cuales se observan que poco tienen que ver con la situacin actual del proceso.
El CEP es una tcnica que ha de ser utilizada cerca del proceso y, por lo tanto, es recomendable
que sean los operarios los que la utilicen. Para ello, los grficos de control han de ser sencillos de
construir e interpretar.
En cuanto a la actualizacin de los lmites de control en los grficos, hemos de decir que los
lmites no se han de cambiar mientras no se tenga evidencia de que el sistema de causas comunes haya
cambiado o de que cambia el procedimiento de toma de datos.
A continuacin presentamos los grficos de control ms comunes clasificados, de acuerdo con
el tipo de caracterstica que se controla, en grficos de control para variables y para atributos.
11.4 Grficos de control para variables
Se denominan as los grficos de control para caractersticas continuas del producto o del proceso tales
como: contenido en cm
3
de un lquido, peso de un saco de pienso, viscosidad de una resina, intensidad
de una tinta, temperatura de un horno, etc., las cuales, cuando el proceso est en estado de control, se
distribuyen en general segn la ley normal
1
.
Un proceso del cual se est controlando una caracterstica continua puede abandonar su estado
de control por verse afectada su media, su variabilidad o ambas a la vez. Por consiguiente, hay que
construir grficos para controlar ambos parmetros por separado, no slo la media.
El control de la media del proceso se realiza, siempre que se pueda, a travs de las medias de
muestras de tamao n, tal como se vio en el apartado 11.2.2.
Si de las mismas muestras se calcula la desviacin tpica muestral s, se puede construir un
grfico de control para utilizando la distribucin terica de s presentada en el apartado 4.8
As, tomando los percentiles adecuados de la chi-Cuadrado, se tendra un grfico para s
2
(notar
que este grfico no es simtrico). En la prctica, el clculo de la varianza muestral resulta difcil para
personal poco familiarizado con la estadstica y se recurre a calcular el rango de variacin muestral R,
que se define como la diferencia entre las observaciones extremas. Se puede demostrar
matemticamente que existe una relacin entre s
2
y el rango muestral para muestras de tamao n y tal
relacin es:
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
248
1
Si no se distribuyen las observaciones individuales, si lo hacen las medias para tamao suficientemente grande (teorema
central del lmite.)
( )
s
n
X
n
2
2
1
2
1

(11.1)
CONTROL ESTADSTICO DE PROCESOS
donde d
2
se puede encontrar, para diferentes tamaos de muestra, en la tabla H del apndice 1 al final
del libro.
A continuacin se presentan los grficos ms utilizados para caractersticas continuas.
11.4.1 Grficos -R
El CEP utilizando grficos -R se lleva a cabo tomando muestras de n individuos (entre dos y seis),
calculando la media y el recorrido muestral y llevando estos valores a los grficos correspondientes.
Las muestras han de ser obtenidas de tal forma que contengan individuos homogneos, es decir,
producidos bajo las mismas condiciones; as, los estadsticos que se obtengan de ellos, la media y el
recorrido, sern buenos estimadores de los parmetros del proceso. Es decir, debe procurarse que,
durante el tiempo que el proceso fabrica los individuos que forman parte de una muestra, slo hayan
actuado causas comunes de variabilidad.
Los lmites en los grficos se colocan en
donde los valores de A
2
, D
3
y D
4
se pueden encontrar, para distintos tamaos de muestra, en la tabla H
del apndice 1 al final del libro.
En aquellos casos en que no se tenga una estimacin de los parmetros del proceso en el
momento de implementar los grficos de control, o se desee recalcularlos, se han de seguir los
siguientes pasos:
1) Tomar k (al menos 20) muestras de tamao n (entre dos y seis) de forma consecutiva y a
intervalos de tiempo iguales, calculando la media y el rango de cada muestra:
2) Calcular la media de las k medias muestrales y la media de los k rangos:
3) Calcular los lmites de control del grfico mediante las expresiones (11.3) y (11.4).
X
X
249

s
R
d

2
(11.2)


+ +

3
3
2
2
n
x A R
x
n
x A R
o
o
o
Grfico X
(11.3)
D R
R
D R
4
3
Grfico R
(11.4)
( ) ( )
x
x x x
n
R max x min x j n
i
i i in
i ij ij

+ + +

1 2
1 2 3

. . , , , ,
(11.5)
x
x
k
R
R
k
i
i
k
i
i
k



1 1
(11.6)
Lmite superior
Lmite central
Lmite inferior
Lmite superior
Lmite central
Lmite inferior
4) Llevar los valores de las medias y los rangos de las muestras obtenidas a los grficos y
comprobar que no hay ningn tipo de comportamiento anmalo en ninguno de ellos. En tal
caso, pasar al apartado siguiente.
Si existe evidencia de que durante la construccin del grfico el proceso no ha estado bajo
control, se han de buscar las causas asignables y actuar sobre ellas. Slo en este caso se
reconstruir el grfico eliminando las anomalas y comenzando en el paso 2). En aquellos casos
en que hayan variado notablemente las caractersticas del proceso, debe comenzarse desde el
principio.
5) Mantener los lmites de control calculados en el apartado 3) y establecer un plan de control para
el futuro con el objetivo de realizar un seguimiento del proceso.
Para ello, dependiendo de las caractersticas del proceso (coste de inspeccin, produccin
diaria, coste de producir fuera de especificaciones) se toman muestras de tamao n en intervalos de
tiempo determinado y se lleva la media muestral,
i
, y el recorrido, R
i
, a los grficos correspondientes.
Una llamada de atencin en uno de los grficos, equivale a que una causa asignable ha entrado
en el proceso. En este caso, se ha de buscar la causa asignable y deben tomarse las acciones adecuadas
para llevar al proceso a su estado de control.
Cuando la construccin de los grficos se hace manualmente, existen plantillas que han sido
adoptadas con pequeas variantes en las empresas. En ellas, adems del espacio reservado para los
grficos, existen casillas donde se debe anotar toda la informacin que pueda ayudar a una posterior
interpretacin del grfico. Un ejemplo de esta plantilla se presenta al final del captulo.
El grfico de la figura 11.3 es un caso particular del uso del grfico . En l, los lmites se han
calculado a partir de las primeras 20 observaciones que se encuentran en la tabla 11.2.
Lmite superior = 200 + 0.729 x 1.48 = 201.1
Lmite central = 200
Lmite inferior = 200 - 0.729 x 1.48 = 198.9
Como ya se coment en el apartado 11.2.2, con este grfico se han detectado cambios en el
proceso debidos a cambios en la media y tambin a un incremento de la variabilidad.
Para el grfico de la variabilidad, se llevan los rangos de la tabla 11.2 a un grfico como el de
la figura 11.5, donde los lmites de control se han calculado a partir del rango medio y los valores de
D
3
= 0 y D
4
= 2.282 correspondientes a una muestra de tamao 4.
Los lmites as calculados son los siguientes:
Lmite superior = 2.282 x 1.48 = 3.38
Lmite central = 1.48
Lmite inferior = 0x 1.48 = 0
Como se puede observar en el
grfico R, el aumento de la media del
proceso a partir de la observacin 20
provoca un ligero incremento en los
rangos, aunque este aumento es ms
manifiesto cuando aumenta la varia-
bilidad del proceso a partir de la obser-
vacin 40, llegando incluso a salir los
rangos fuera de los lmites.
X
x
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
250
Fig. 11.5 Grfico R para la variabilidad del proceso de embotellado.
Con =200 y =0.7 (observacines 1-20), con =201 y =0.7 (obser-
vaciones 21-40) y con =200 y =1 (ltimas 20 observaciones)
CONTROL ESTADSTICO DE PROCESOS
11.4.2 Grfico de observaciones individuales y grfico de rangos mviles
Estos grficos son similares a los grficos -R con la diferencia de que los primeros se utilizan en
aquellos casos en que se obtiene una nica observacin en cada instante. Algunas situaciones en las
que esto ocurre son:
slo puede obtenerse una observacin por lote o partida de material;
en procesos continuos o de batch en los cuales no tiene sentido hablar de individuos;
se requiere realizar una comparacin directa con las especificaciones.
Para la implementacin de los grficos de observaciones individuales y de rangos mviles se
han de seguir los pasos presentados para los grficos -R, teniendo en cuenta que, al ser n=1, se
tendrn que realizar algunas modificaciones.
As, con las k observaciones obtenidas segn el paso 1) del apartado 11.4.1 se estima la media
del proceso, , segn,
donde x
i
observacin i-sima y k total de observaciones
El rango medio se obtiene promediando los rangos mviles obtenidos al hacer muestras de tamao
wde la siguiente manera: para obtener R
1
se toman las primeras wobservaciones (x
1
, x
2
, ...,x
w
) y se calcula
el rango. R
2
se obtiene a partir de (x
2
, x
3
, ..., x
w
, x
w+1
), y as sucesivamente. As, se obtiene la media de rangos,
X
X
251

X1 X2 X3 X4 MEDIA Ri
1 202.016 200.218 200.588 199.930 200.688 2.085
2 200.390 200.18 198.385 199.120 199.520 2.005
3 200.08 199.420 200.045 199.985 199.884 0.665
4 198.584 201.011 200.260 200.097 199.988 2.427
5 199.413 199.453 200.012 200.720 199.900 1.306
6 199.701 198.761 200.001 200.118 199.645 1.357
7 199.380 200.491 200.361 200.057 200.072 1.111
8 201.435 200.279 199.727 200.513 200.488 1.707
9 199.440 199.155 199.966 200.129 199.672 0.974
10 200.857 201.021 199.526 200.654 200.515 1.496
11 200.445 199.933 200.030 199.044 199.863 1.401
12 200.109 200.900 200.116 201.751 200.719 1.642
13 199.985 200.006 200.659 200.600 200.312 0.673
14 200.580 199.934 199.789 199.699 200.001 0.881
15 199.796 199.759 199.880 200.340 199.944 0.581
16 199.277 200.722 198.398 200.410 199.702 2.324
17 200.612 198.605 199.194 199.998 199.602 2.007
18 199.899 201.027 199.998 200.806 200.432 1.129
19 200.310 199.998 200.571 199.250 200.032 1.322
20 198.692 198.650 200.686 201.191 199.805 2.541
Tabla 11.2 Contenido en cm
3
de 20 muestras de tamao 4 de botellas de agua
X 200 R 148 .
x
x
k
i
i
k

1
donde:
k: total observaciones,
w: n de observaciones utilizadas en el clculo del rango mvil,
R
i
: rango del grupo mvil (x
i
,...,x
i+w-1
),
media de rangos mviles,
De esta manera el control estadstico de la media del proceso se realiza llevando las
observaciones individuales a un grfico que tiene de lmites,
Para el control estadstico de la variabilidad se utilizan los rangos mviles calculados
anteriormente, siendo el grfico similar al grfico R en (11.4). En ambos grficos para el clculo de los
valores d
2
, D
3
y D
4
se considera n=w.
Hay que notar que w ha de ser seleccionado de tal manera que los elementos en un mismo grupo
sean lo ms homogneos posibles. Un valor de w muy utilizado es w=2, y en tal caso d
2
es
aproximadamente 9/8.
El grfico de observaciones individuales es menos sensible que el grfico , como ya se
coment en el apartado 11.2.1. Adems, si la distribucin de los datos no sigue una ley normal, hay
que tener mucho cuidado en la interpretacin del grfico.
Tngase en cuenta por otra parte, que el hecho de que los valores R
i
no sean totalmente
independientes tambin dificulta la interpretacin del grfico de la variabilidad.
11.4.3 Grfico de medias mviles
El grfico de medias mviles, o grfico MA (Moving Average), es un grfico para controlar la
media del proceso y se emplea en general en aquellos casos en los que, obtenindose observaciones
individuales del proceso, se desea analizar el mismo con la sensibilidad que permite un grfico de
medias. Para ello, las medias mviles se obtienen de igual manera que se han obtenido los rangos
mviles en el apartado anterior y los lmites de control se obtienen ahora directamente de (11.3)
para n=w.
Estos grficos suavizan el comportamiento observado en el de observaciones individuales y
muestran mejor la tendencia del proceso. Por otra parte, y tal como ocurra en el grfico de rangos
mviles, las observaciones no son independientes, lo cual dificulta la interpretacin.
11.4.4 Interpretacin de los grficos de control
El objetivo de la utilizacin de los grficos de control para el seguimiento de un proceso es
primordialmente el de detectar cualquier evidencia de que la media y la variabilidad del proceso no se
X
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
252
R
R
k w
i
i
k w

1
1
1
(11.7)
x
R
d
x
x
R
d
+

3
3
2
2
(11.8)
Lmite superior
Lmite central
Lmite inferior
R:
CONTROL ESTADSTICO DE PROCESOS
han mantenido constantes a lo largo del tiempo. Es decir, se pretende detectar la aparicin de causas
asignables de variabilidad.
Con tal objetivo en el grfico se han representado dos cotas o lmites de variabilidad las cuales
evidencian la presencia de tales causas si son sobrepasadas. Este patrn de inestabilidad fue el que se
mantuvo durante los primeros aos de la implantacin de los grficos Shewart.
Los grficos as construidos tenan varios inconvenientes:
Permanecan impasibles ante aquellas causas asignables que afectaban al proceso sin llegar a
provocar individuos fuera de lmites.
Detectaban algunas anomalas demasiado tarde.
No tenan en cuenta la informacin histrica del proceso.
Para contrarrestar los puntos anteriormente citados, se incorporaron nuevos patrones de
inestabilidad. Estos ltimos tienen la particularidad de ser tan poco probables de ser presenciados en
un proceso bajo control como el hecho de obtener una observacin fuera de lmites; adems, tienen en
cuenta el comportamiento histrico del proceso a corto plazo.
Para la deteccin de tales patrones, se han de dividir las dos reas alrededor del lmite central
en tres zonas: A, B y C.
Las figuras 11.6.a y 11.6.b presentan los patrones ms utilizados en la interpretacin de los
grficos de control. Si alguno de los ocho patrones presentados aparece en el grfico, se interpreta que
el proceso est siendo afectado por causas asignables. En tal caso, si se est seguro de cul es la causa
que ha provocado la anomala y se sabe cmo actuar sobre ella, se han de tomar las acciones adecuadas
para llevar al proceso a su estado de control.
Ntese, adems, que cuanto ms se muestrea ms posibilidades existen de obtener falsas
alarmas y tomar, por lo tanto, acciones que, en lugar de disminuir la variabilidad del proceso, la
aumentan. Por lo tanto, no se ha de actuar si no se est seguro de la presencia de causas asignables y
se conoce su identidad.
253

Fig. 11.6.a Patrones 1-4 de inestabilidad


Patrn 1
Un punto fuera de los lmites
Patrn 2
2 puntos de 3 al mismo lado de A
Patrn 3
4 puntos de 5 al mismo lado de B
Patrn 3
8 puntos consecutivos al mismo lado de C
Generalmente, cuesta identificar una causa asignable entre todas las posibles. En la prctica lo
que se hace es estar atento al proceso cuando ste comienza a mostrar anomalas y tratar de analizar la
disposicin de los datos entre los cuales van apareciendo estos patrones de inestabilidad.
La manera en que aparecen las anomalas puede ayudar a identificar las causas asignables pero
no existe una regla general ya que:
cada proceso tiene unas caractersticas particulares que hacen que un tipo de inestabilidades
sean ms frecuentes que otras;
dado un patrn de inestabilidad, las causas que pueden provocarlo son variadas y dependen
totalmente del proceso con el que se est trabajando.
Por consiguiente, para la interpretacin de los grficos de control es primordial conocer el proceso.
En general, las causas que afectan a la media del proceso son aquellas que cuando intervienen
afectan a todo el producto de forma parecida. Por el contrario, las causas que afectan a la variabilidad
afectan slo a una parte del producto.
Por supuesto que ciertas causas pueden afectar a la media y a la variabilidad del proceso a la
vez. Por ello, si se trabaja con los grficos -R es recomendable analizar el comportamiento de la
media y el recorrido por separado. Primero el comportamiento del grfico R, que es ms sensible a
cambios en el proceso, despus el grfico y finalmente los dos a la vez. (No tiene sentido interpretar
el grfico si el grfico R no est bajo control.)
Recomendamos al lector la lectura del manual de AT&T (1985) sobre el control estadstico de
procesos si desea ampliar el tema de interpretacin de los grficos de control.
Por ltimo hemos de insistir en el hecho de que el objetivo en la interpretacin de un grfico de
control es analizar si el proceso se comporta de una forma estable a lo largo del tiempo. Este anlisis
no pretende comparar las caractersticas del proceso con sus especificaciones o tolerancias. Cuando tal
comparacin sea necesaria se realizar un estudio de capacidad, tal como se describe en el apartado
11.4.5, el cual ser fiable slo cuando el proceso est bajo control.
X
X
X
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
254
Fig. 11.6.b Patrones 5-8 de inestabilidad
Patrn 5
15 puntos consecutivos en la zona C
Patrn 6
8 puntos seguidos a los dos lados de la
lnea central y ninguno en C
Patrn 7
14 puntos seguidos alternados
Patrn 8
6 puntos seguidos creciendo o decreciendo
CONTROL ESTADSTICO DE PROCESOS
11.4.5 Estudios de capacidad
Consideremos el proceso de relleno de
botellas utilizado a lo largo de este captulo.
Cuando tal proceso est en estado de control, a
la amplitud del intervalo de variabilidad de las
observaciones individuales, se la denomina
capacidad. A tal capacidad contribuirn entre
otros, las caractersticas de las mquinas, el
personal, el servicio de mantenimiento del
proceso, la forma de la boca de la botella, etc.,
que varan a lo largo del tiempo. Por este
motivo se habla de capacidad a largo plazo.
Tambin podemos preguntarnos sobre
la capacidad de la mquina embotelladora por
s sola. En tal caso nos referimos estrictamente
a la variabilidad atribuible a la mquina
cuando el resto de las caractersticas
permanecen lo ms homogneas posible, lo
cual ocurre a corto plazo y, por lo tanto, se
denomina a esta capacidad de mquina,
capacidad a corto plazo.
La idea de capacidad sugiere una
caracterstica positiva, de forma que cuanto ms
mejor, pero en este contexto, capacidad =
variabilidad y, por lo tanto, cuanto menos mejor.
La capacidad es una caracterstica
innata a cada mquina o proceso e
independiente de las tolerancias o
especificaciones del producto que genera. Es
ms, la capacidad de una mquina se puede
especificar incluso antes de ser vendida y, por
supuesto, antes de saber las tolerancias del
producto que va a elaborar.
Si tomsemos 40 botellas obtenidas
del proceso de rellenado estando ste en estado de control, un histograma de los contenidos de agua
obtenidos no tendra, seguramente, ninguna de las formas que se indican en la figura 11.8.a, sino que
sera del tipo de la figura 11.8.b recordando a una distribucin normal.
Como esta variabilidad debida a causas aleatorias sigue una distribucin normal, la capacidad
de una mquina se define tradicionalmente como la amplitud 6, intervalo que contiene el 99.7% de
las unidades. Actualmente, y especialmente en el sector del automvil, prefiere hablarse de 8 e
incluso 10, intervalos que dejan fuera 63.4 y 0.6 unidades por milln respectivamente, lo cual
equivale prcticamente a hablar del total de la produccin.
Los estudios de capacidad son una herramienta fundamental para la racionalizacin del control
de calidad. Es necesario saber lo que la mquina es realmente capaz de hacer, y no slo deben saberlo
las personas involucradas en la fabricacin, sino tambin los comerciales cuando negocian con los
clientes las caractersticas de los productos.
255

Fig. 11.7 Capacidad de mquina y de proceso, capacidad a corto


y a largo plazo
Figura 11.8 Histogramas representando la variabilidad de un
proceso
Para el clculo de la capacidad de una mquina el proceso a seguir es el siguiente:
1. Asegurarse de que la mquina se encuentra en estado de control.
2. Tomar un mnimo de 50 unidades consecutivas (normalmente entre 50 y 100), midiendo para
cada una la caracterstica que se quiere estudiar estudiar.
3. Verificar la normalidad de los datos. Esta verificacin suele hacerse representando la funcin de
distribucin de los datos en papel probabilstico normal.
4. Estimar la desviacin tipo del proceso o, directamente, su capacidad.
Puede verse una explicacin detallada de este procedimiento en el libro de J.L. Vachette,
Mejora continua de la calidad (ver bibliografa).
La capacidad del proceso se determina igual que la capacidad de una mquina pero a partir de
muestras tomadas en toda la variedad de condiciones en que debe trabajar la mquina (variedad de
turnos, operarios, materias primas, etc.), y se toma el intervalo de 6 para definirla.
Una vez se tienen los datos, stos se representan en un grfico de control para asegurarse de que
no existen causas de variabilidad asignables. Si, por ejemplo, se presentan puntos fuera de lmites, debe
identificarse la causa que ha producido esa variacin inusual y eliminarla. Si no se es capaz de
identificar cul ha sido la causa, no hay razn para eliminar el dato, y debe considerarse, al menos
provisionalmente, que esa variacin forma parte del proceso.
Por otra parte, las tolerancias del producto deben ser fijadas al concebir el producto en funcin
de las necesidades y expectativas de los clientes (no en funcin de las caractersticas del proceso,
obviamente). Sin embargo, una vez definidas las especificaciones de un producto es necesario
compararlas con la capacidad del proceso.
Dado un proceso y dadas unas especificaciones diremos que un proceso es capaz, si puede
producir dentro de las especificaciones exigidas, es decir, si su capacidad es menor que las
tolerancias. Para poder comparar estas dos caractersticas se define un ndice, el ndice de capacidad,
que es una medida de lo que se puede conseguir con el proceso teniendo en cuenta las
especificaciones.
Los ndices de capacidad son universalmente empleados en la relacin de las empresas con los
proveedores y con los clientes. As por ejemplo Ford, empresa pionera en la filosofa de mejora
continua de la calidad, impone a sus proveedores que la dispersin de la mquina o proceso debe estar
contenida dentro de la especificaciones del producto que compra.
El ndice de capacidad viene definido, dependiendo de si es para una mquina (corto plazo) o
para un proceso (largo plazo), de la manera siguiente:
La diferencia de la definicin estriba en que para poder conseguir que el C
p
sea aceptable
comparando con las especificaciones, se ha de ser ms estricto en el C
m
de las mquinas que componen
el proceso.
El valor de C
p
da una idea de la variabilidad transmitida por el proceso a los individuos. Si C
p
>1
se dice que el proceso es capaz; si por el contrario, C
p
<1, se dice que no es capaz. En general es
preferible que el C
p
sea superior a 1, ya que aquellos procesos con C
p
en torno a 1 han de ser vigilados
rigurosamente ya que pequeos descentramientos respecto del valor nominal pueden ocasionar la
aparicin de un nmero elevado de individuos defectuosos.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
256
C
LTS LTI
m

Tolerancia
8
Capacidad de maquina
8
C
LTS LTI
p

Tolerancia
6
Capacidad de proceso
6
(11.9)
Capacidad de mquina
CONTROL ESTADSTICO DE PROCESOS
Asimismo, el ndice C
p
se puede considerar como una medida de lo implantado que est el
programa de aseguramiento de calidad en una empresa; por ejemplo, en las empresas de
automocin, pioneras en la aplicacin de programas de calidad, se habla de C
p
>1.33 o incluso
superiores.
Para aquellos procesos que no estn centrados en el valor nominal, los ndices de capacidad
slo muestran la posibilidad de la mquina, o proceso en su caso, de producir dentro de tolerancias
en caso de que se consiga centrarlos. Es decir, es un ndice que indica la capacidad potencial de
poder cumplir con las especificaciones, pero no tiene por qu coincidir con el comportamiento
real.
Para subsanar este hecho se define un nuevo ndice de capacidad que se desva del valor de C
p
cuanto mayor es el descentramiento del proceso respecto al valor nominal. Estos ndices denominados
C
mk
y C
pk
, dependiendo de si se refieren a mquinas o a procesos, vienen definidos de la siguiente
manera:
Es fcil comprobar que C
mk
C
m
y C
pk
C
p
. En el caso de procesos centrados y simtricos, la
media del proceso coincide con el punto medio de las especificaciones (valor nominal) y, por lo tanto,
se verifica C
mk
= C
m
y C
pk
= C
p
. Ocurre que cuanto mayor es la diferencia entre los dos ndices mayor
es el descentramiento. Los valores C
mk
y C
pk
podran ser interpretados como ndices de capacidad p
respecto a la tolerancia ms prxima.
La tabla 11.3 muestra la relacin existente entre distintos valores de C
p
y C
pk
, y el porcentaje
que tales procesos producen dentro de especificaciones cuando estn en estado de control. Cabe notar
que para valores negativos de C
pk,
el porcentaje fuera de especificaciones es similar,
independientemente del valor de C
p
.
En el ejemplo de la planta embotelladora podemos realizar un estudio de capacidad con los
datos de la tabla 11.2 sabiendo que las especificaciones del cliente son 200 2 cm
3
. La capacidad de
este proceso puede ser estimada a travs del rango medio obtenido con grupos de cuatro observaciones
utilizando la expresin (11.2). As,
capacidad del proceso = 6 s = 6 x 1.48/2.06 = 4.32
Para los ndices de capacidad, observamos que el proceso est centrado en el valor nominal,
entonces
C
p
= C
pk
= 4/4.32 = 0.93
La produccin defectuosa se puede hallar utilizando la distribucin de referencia que es la ley
normal (200, 0.72):
En consecuencia, el proceso de embotellado tiende a producir cinco botellas de cada 1.000
fuera de especificaciones, lo cual puede ser un nmero no demasiado elevado. Sin embargo, el hecho
de que el valor C
p
sea aproximadamente 1 implica que hay que tener cuidado con este proceso, ya que
si por alguna causa se descentra, el porcentaje defectuoso se eleva rpidamente, tal como muestra la
tabla 11.3.
257

C
LTS X
C
X LTI
C
LTS X
C
X LTI
mu ml pu pl


4 4 3 3
( ) ( ) C C C C C C
mk mu ml pk pu pl
minimo minimo , ,
(11.10)
( ) ( ) ( ) Pr Pr Pr
.
Pr
.
Pr . . % x x z z z < + >

_
,

+ >

_
,

> 198 202


198 200
0 72
202 200
0 72
2 2 78 2 4 o
mnimo mnimo
N= valor nominal.
11.5 Grficos de control para atributos
Existen situaciones en que la caracterstica de calidad que interesa controlar no es una caracterstica
medible, sino que es cierto atributo que puede poseer o no el producto. Incluso se pueden estudiar
varias cualidades del mismo producto y analizar si permanecen estables a lo largo del tiempo.
A veces el atributo va ligado a una caracterstica medible, por ejemplo, cuando en la lnea de
relleno de botellas presentado a lo largo de este captulo se controla el nmero de las mismas que salen
fuera de tolerancias. En tales casos, aunque resulta ms fcil realizar el control por atributos que por
variables, perderemos la informacin continua que nos puede aportar un control por variables del
contenido de cada botella.
Un punto muy importante que hay que tener en cuenta en los grficos de control por atributos,
pues de no considerarlo lleva a interpretaciones errneas en cuanto al funcionamiento del proceso: es
el criterio empleado para decidir si un individuo posee la caracterstica a estudio. Tal criterio ha de ser
claro y no ha de cambiar mientras se mantienen los lmites de control, en caso contrario se han de
recalcular los lmites y comenzar de cero.
11.5.1 Grfico P
El grfico P se utiliza cuando los individuos de un proceso se clasifican en defectuosos-no defectuosos,
enfermos-sanos, fuera-dentro de tolerancias, etc., y se desea controlar la proporcin p de individuos en
uno de estos grupos.
El control del proceso se realiza anotando la proporcin de individuos defectuosos en el grfico.
Los lmites del grfico P son hallados utilizando el modelo terico que sigue el estadstico a controlar
p, que como ya se present en el apartado 4.2 puede ser obtenido de la ley binomial.
Los lmites del grfico sern obtenidos de tal forma que la probabilidad de ocurrencia ms all
de los lmites estando el proceso en estado de control sea entorno a un 3. Estos lmites sern
prcticamente simtricos respecto el lmite central para tamaos de muestra suficientemente grande y
np> 5, (debido a la convergencia a la ley normal), y no tanto cuando las muestras sean pequeas.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
258
Cp 0.33 0.33 0.33 0.67 0.67 0.67 0.67
Cpk 0.33 0 -0.33 0.67 0.33 0 -0.33
Media = N = N = N2 = N = N = N2 = N3
% Fuera de
tolerancias
31.7 % 52.3 % 84.3 % 4.6 % 16 % 50 % 84.1%
Cp 1 1 1 1 1.33 1.33 0.67 0.67
Cpk 1 0.33 0 -0.33 1.33 0.67 0.33 -0.33
Media = N = N2 = N3 = N4 = N = N2 = N3 = N5
% Fuera de
tolerancias
0.3 % 15.9 % 50 % 84.1 % 63 ppm 2.3 % 15.9 % 84.1%
Tabla 11.3 Relacin entre los ndices de capacidad C
p
y C
pk
, y el % fuera de tolerancias
CONTROL ESTADSTICO DE PROCESOS
El control de la proporcin p se realiza analizando el comportamiento de las proporciones
muestrales a lo largo del tiempo. Para ello, se aconseja tomar muestras de tamao lo suficientemente
grandes como para dar oportunidad a que aparezcan, al menos, tres o cuatro unidades defectuosas.
Por ejemplo, si extraemos muestras de tamao 10 en un proceso que genere un 5% de
individuos defectuosos difcilmente podremos detectar un aumento en la proporcin defectuosa a un
10%, puesto que en ambos casos la mayora de las muestras no contendrn individuos defectuosos. El
poder de deteccin de este cambio, sin embargo, aumenta si las muestras se toman de tamao 100.
Una vez presentadas las puntualizaciones anteriores pasemos a la construccin del grfico.
Notemos que a diferencia de los grficos por variables, aqu slo hay un parmetro independiente del
proceso que es la proporcin p (la variabilidad muestral en este parmetro una vez elegido n es p(1-p)/n).
Pasos a seguir en la implementacin del grfico P (supondremos que se clasifican los
individuos segn sean o no defectuosos)
1) Investigar si existe informacin histrica de la proporcin p de individuos defectuosos
generados por el proceso en estado de control. En tal caso construir el grfico como en 5),
sustituyendo la estimacin del parmetro.
2) Seleccionar n
i
permitiendo que aparezcan al menos cuatro defectuosos en media en una
muestra. Tomar k (al menos 20) muestras de tamao n
i
(n no tiene por qu ser fija) de forma
consecutiva y a intervalos de tiempo iguales.
3) Calcular la fraccin de individuos defectuosos para cada muestra.
4) Calcular la estimacin de p a travs del total de individuos defectuosos encontrados.
El valor ser una estimacin de la proporcin p de defectuosos del proceso si ste ha
permanecido estable, slo afectado por causas comunes, durante la toma de las muestras.
5) Calcular los lmites de control del grfico mediante las frmulas que siguen. (Si se trabaja con
p en %, los lmites son iguales excepto que debe aparecer 100-p en lugar de 1-p.)
Ntese que los valores de los lmites superior e inferior cambian con el tamao del subgrupo:
cuanto mayor es n ms precisin se tiene en la estimacin del parmetro p y antes se detecta un
cambio en el proceso.
Los lmites de control as elegidos estn basados en la aproximacin a la normal. En general, esta
aproximacin es vlida para la mayora de los procesos industriales en los cuales la proporcin
defectuosa se puede estimar en partes por cien. En aquellos otros procesos industriales en los
cuales se habla de defectos por mil, se utiliza ms la aproximacin a la ley Poisson.
259

p
n
n
i k
i
i

, , ,
defectuosos en muestra i
1 2
(11.11)
p
n p
n
i i
i

_
,

Total defectuosos
Total muestreado
(11.12)
p
( )
( ) p
p p
n
L S
i
+

3
1
. .
( ) p L C . .
( )
( ) p
p p
n
L I
i


3
1
. .
(11.13)
Lmite superior
Lmite inferior
Lmite central
6) Llevar los valores de los p
i
obtenidos de las k muestras al grfico, y comprobar que no haya
evidencia de que alguna causa asignable haya estado actuando durante la recogida de los
datos. En tal caso pasar al apartado siguiente.
Si se detecta alguna anomala, antes de implementar los grficos aqu construidos se han de
identificar las causas asignables y emprender las acciones pertinentes. Slo en este caso se
pueden eliminar las observaciones anmalas y reconstruir el grfico comenzando por el paso
4). Una vez ms, si el cambio en el proceso ha sido notable se ha de comenzar por el
apartado 2).
7) Mantener los lmites de control calculados en el apartado 5) y establecer un plan de control para
el futuro con el objetivo de detectar cambios en la proporcin de individuos defectuosos que
genera el proceso. Este plan contendr:
el criterio a utilizar para clasificar a un individuo como defectuoso, que ser idntico al
utilizado para calcular los lmites;
el nmero de individuos que contendr cada grupo, n;
la frecuencia de muestreo.
Los dos primeros puntos ya se han tratado anteriormente. En cuanto a la frecuencia de muestreo,
que ya se coment en parte en el apartado 11.3, depender de varios factores, entre ellos el ritmo de
produccin, el coste de inspeccin y las exigencias de los clientes. Adems, esta frecuencia no tiene
por qu ser fija. Por ejemplo, puede ser severa cuando se pone un proceso en marcha y algo ms
relajada cuando el proceso es estable a unos niveles de calidad aceptables.
Una vez establecido el plan, los pasos
a seguir sern:
Extraer una muestra de tamao n
i
.
Contar el nmero de elementos defec-
tuosos y hallar p
i
, la fraccin defectuosa.
Llevar p
i
al grfico.
Ajustar los lmites si n
i
no es fijo mante-
niendo el valor de p.
Comprobar si existe evidencia de que
alguna causa asignable ha entrado en el
proceso.
Emprender acciones: actuar cuando alguna
causa asignable entre en el proceso o
seguir mientras no haya evidencia de ello.
Existen plantillas para el grfico P
para el caso en que el control se realice
manualmente. En ellas es conveniente
apuntar, aparte de la informacin signifi-
cativa del proceso, cualquier incidencia que
haya ocurrido durante la toma de datos y que
pueda ayudar a la interpretacin del compor-
tamiento del proceso.
A continuacin construiremos el grfico
de control para la proporcin de botellas
defectuosas en el proceso de embotellado. Los
criterios seguidos para rechazar una botella han
sido, adems de comparar el contenido con las
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
260
Tabla 11.4 Botellas defectuosas encontradas en 20 muestras.
NM.
MUESTRA
BOTELLAS
DEFECTUOSAS
TAMAO DE
LA MUESTRA
PROPORCIN
DEFECTUOSA
1 6 100 6 %
2 7 150 4.7 %
3 5 120 4.2 %
4 10 100 10 %
5 8 140 5.7 %
6 7 90 7.8%
7 4 100 4 %
8 2 100 2 %
9 1 100 1 %
10 9 150 6 %
11 12 145 8.3 %
12 5 130 3.8 %
13 6 100 6 %
14 11 160 6.9 %
15 3 120 2.5 %
16 14 140 10 %
17 4 100 4 %
18 7 90 7.8 %
19 6 100 6 %
20 9 100 9 %
Total = 136 Total
=2.335
CONTROL ESTADSTICO DE PROCESOS
especificaciones del cliente, defectos de las botellas, mal etiquetado y defectos de cierre. Los datos
obtenidos se encuentran en la tabla 11.4.
Para la implementacin del grfico P estimaremos la proporcin de botellas defectuosas,
tomando la proporcin de botellas defectuosas encontradas en estas 20 muestras y no el promedio de
las proporciones de cada una de las muestras. Por lo tanto,
A partir de (11.13) se obtiene el grfico de control de la figura 11.9 que en este caso por ser el
tamao de muestra variable, no tiene los lmites fijos. Para las dos primeras muestras se obtiene,
El control de la proporcin
defectuosa se realizar tomando
muestras de botellas a intervalos de
tiempo fijo y llevando la proporcin
defectuosa hallada al grfico de control,
que mantendr el lmite central en p =
5.82 %, y los lmites superior e inferior
variables segn la expresin (11.13).
11.5.2 Grfico NP
El grfico NP se aplica al mismo tipo de problemas que el grfico P, pero cuando el tamao de muestra
es fijo. En tales casos, el control de la calidad en el proceso se puede realizar por el nmero de
individuos defectuosos observados en lugar de la proporcin defectuosa. El primero es ms fcil de
construir que el segundo, ya que no hace falta hallar la fraccin defectuosa, y si se quiere interpretar
en trminos de proporciones slo se tiene que dividir por n la escala vertical del grfico.
Para la construccin del grfico se utiliza de distribucin de referencia la ley binomial (n, p).
En esta distribucin, el nmero medio de individuos defectuosos es igual a np y la varianza igual a
np(1-p). Como en el apartado anterior, slo se realiza un grfico y ste controlar el nmero medio de
unidades defectuosas en n.
261

p
136
2 335
582
.
. % (11.14)
Fig. 11.9 Grfico P para la proporcin de botellas defectuosas
( )
( )
Muestra 1
L. superior =
L. central = 5.82
L. inferior =
n
+

'

100
582 3 582 100 582 100 12 84
582 3 582 100 582 100 0
. . . / .
. . . /
( )
( )
Muestra 2
L. superior =
L. central = 5.82
L. inferior =
n
+

'

150
582 3 582 100 582 150 1155
582 3 582 100 582 150 0 09
. . . / .
. . . / .
(11.15)
Nmero de muestra
0 5 10 15 20
P 0 05824 .
LCL
UCL
Grfico p
0.120
0.060
0.000
P
r
o
p
o
r
c
i

n
Una vez seleccionado n, si no se conoce p se ha de estimar su valor. Para ello es recomendable
seguir los pasos que a continuacin se sealan, puesto que adems de dar una estimacin de np
comprueban si el proceso ha estado bajo control durante la estimacin del parmetro.
Los pasos a seguir son:
1) Investigar si existe informacin histrica de la proporcin p de individuos defectuosos que
genera el proceso. En tal caso elegir n y construir los grficos basndose en los lmites:
pasando directamente al paso 7).
2) Seleccionar n permitiendo que al menos aparezcan cuatro o cinco defectuosos en media por
muestra. Tomar k (al menos 20) muestras de tamao n de forma consecutiva y a intervalos de
tiempo iguales.
3) Contar el nmero de defectuosos en cada muestra.
d
i
= n p
i
con i=1, 2, ..., k
4) Calcular el nmero medio de defectuosos por muestra promediando por el total de muestras.
Este valor ser un estimador de np, la media terica de elementos defectuosos del proceso en
grupos de tamao n.
5) Calcular los lmites de control del grfico mediante las frmulas en (11.16), sustituyendo el
valor de np por su estimador n .
Ntese que la amplitud del grfico, o cotas de variabilidad permisible en estado de control,
aumenta con el tamao del subgrupo. Ello no quiere decir que se consiga menos precisin
cuanto mayor es el valor de n, sino todo lo contrario. (Dejamos al lector tal comprobacin que
se puede obtener simplemente con un cambio de la escala dividiendo por n.)
Al igual que en los grficos P estos lmites estn basados en la aproximacin de la binomial a
la normal bajo las condiciones comentadas en el apartado 4.2.
6) Llevar los valores del nmero de defectuosos por grupo al grfico, y comprobar que durante la
obtencin de las muestras el proceso ha estado bajo control. En tal caso tomar el estimador
obtenido de np para el futuro y pasar a la fase siguiente.
Si existe evidencia de que alguna causa asignable ha entrado en el proceso, antes de continuar
se ha de identificar tal causa y tomar las medidas adecuadas. Slo en tal caso se eliminar la
informacin de los grupos afectados y se reconstruirn los grficos a partir del paso 4). En
aquellos casos que las medidas correctivas hayan producido un cambio significativo en la
naturaleza del proceso, se deber comenzar el proceso desde el paso 1).
7) Mantener los lmites de control calculados siempre y cuando no se cambie el diseo del proceso
y el criterio de clasificacin de los productos, y establecer un plan de control para el futuro tal
como se coment para el grfico P.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
262
( ) ( ) + np np p L S 3 1 . .
( ) np L C . .
( ) ( ) np np p L I 3 1 . .
(11.16)
d
d
k
np np np
k
n
p p p
k
np
i
i
k
k k

+ + +

+ + +

_
,

1
1 2 1 2

(11.17)
p
Lmite superior
Lmite inferior
Lmite central
CONTROL ESTADSTICO DE PROCESOS
11.5.3 Grfico C
(2)
En muchas ocasiones la caracterstica que nos interesa controlar no es el nmero de individuos
defectuosos sino el nmero de defectos que aparecen en un individuo. Este tipo de control puede ser
ms completo que los presentados anteriormente puesto que:
el individuo puede no ser defectuoso y presentar defectos;
el carcter defectuoso puede ser de distinta magnitud dependiendo de la cantidad de defectos
que presenta.
En aquellos procesos que no generan individuos, como por ejemplo, los procesos continuos,
tambin nos puede interesar el control del nmero de defectos por cierta unidad definida: metro, metro
cuadrado, hora, etc. Otros ejemplos en los que se puede aplicar estos grficos son cuando se desea
controlar el n de pasajeros que toman un vuelo determinado por da, o el n de camas ocupadas en un
hospital por semana, o el n de personas que pasan por una caja registradora de unos grandes almacenes
por hora.
En uno u otro caso, este tipo de control puede ser llevado tomando la distribucin de referencia
de la ley Poisson (), donde representa el nmero medio de ocurrencias por unidad de tiempo,
superficie, etc.
Cuando es suficientemente grande se puede hacer una aproximacin de la ley Poisson por la
ley normal, tal como se vio en el apartado 4.3.
Para la implementacin del grfico de control hay que tener en cuenta que slo hay un parmetro
independiente a controlar, , ya que la varianza en la ley Poisson es tambin . Supondremos en lo que
sigue que se mide el nmero de defectos de estampacin por metro cuadrado de tela.
Los pasos que se deben seguir en la construccin del grfico C son los siguientes:
1) Seleccionar lo que va a ser una unidad de medicin: un individuo, un metro de cable, un metro
cuadrado de tela, una hora, etc., permitiendo que en tal unidad ocurran en media al menos 10
ocurrencias del fenmeno a estudio.
2) Investigar si existe informacin histrica del parmetro : nmero medio de defectos por metro
cuadrado. En tal caso construir los grficos basndose en los lmites:
pasando directamente al paso 5).
3) Tomar k (al menos 20) piezas de un metro cuadrado de tela de forma consecutiva y a intervalos
de tiempo iguales. Contar el nmero de defectos en cada pieza y calcular el valor medio
llevando este valor a la expresin (11.18). Cuando el valor de no es muy grande, la
convergencia a la normal no es muy buena. En tales casos el lmite inferior suele ser negativo,
lo cual no tiene ningn sentido, y se sustituye por 0.
263

2
Llamado grfico C porque controla las no-conformidades. Aunque en la mayora de libros se utiliza la notacin de la letra
C en lugar de la , nosotros utilizaremos esta ltima.
( ) + 3 L S . .
( ) L C . .
( ) 3 L I . .
(11.18)

i
i
k
k
i k
1
1 2 , , , (11.19)
Lmite superior
Lmite inferior
Lmite central
4) Acomodar los datos obtenidos en 3) y seguir las mismas reglas de control que con los grficos
anteriores.
5) Con los grficos definitivos, establecer un plan de control para el futuro.
Como ejemplo de aplicacin presentamos los datos de la tabla 11.5, que recogen el nmero de
defectos de estampacin encontrados por m
2
en un proceso textil. A partir de estos datos, durante la
recogida de los cuales se puede comprobar en la figura 11.10 que el proceso ha estado bajo control, se
elaborar el grfico de control a utilizar en un futuro.
A partir de estos datos se puede estimar el valor de utilizando la expresin (11.19),
y, por lo tanto, los lmites de control del grfico C se mantendrn en , tal como aparecen
en la figura 11.10.
7 83 3 7 83 . . t
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
264
NM. DE
OBSERVACIN
NM. DEFECTOS
POR m
2
NM. DE
OBSERVACIN
NM. DEFECTOS
POR m
2
1 9 16 6
2 9 17 9
3 7 18 13
4 14 19 7
5 8 20 6
6 5 21 11
7 5 22 5
8 5 23 8
9 6 24 10
10 9 25 6
11 4 26 5
12 7 27 10
13 4 28 8
14 11 29 9
15 10 30 9
Total = 235
Fig. 11.10 Grfico C para el nmero de defectos de
estampacin por m
2
en un proceso textil

defectos
unidades
235
30
7 83
Tabla 11.5 N de defectos de estampacin
por m
2
en un proceso de estampacin textil
(11.20)
CONTROL ESTADSTICO DE PROCESOS
11.5.4 Grfico U
El grfico U se utiliza para el mismo tipo de problemas que el grfico C, pero en aquellos casos en que
no se puede tomar una unidad del mismo tamao para controlar el nmero de defectos. A continuacin
se presentan algunos ejemplos donde esto ocurre y que pueden ser representativos de las situaciones
generales:
Puede resultar difcil tomar exactamente un metro cuadrado de tela, por lo que se toman piezas
similares de aproximadamente un metro cuadrado.
En el control del nmero de personas que acuden a una mquina registradora en una tienda, en
lugar de tomar las mediciones en intervalos de tiempo iguales, se toman las mediciones en
intervalos ms flexibles.
Cuando se mide el nmero de defectos por lote, ste puede no contener un nmero fijo de
individuos.
En el grfico U se colocan igualmente el nmero de defectos por unidad, pero ahora no tiene
porqu ser un valor entero. La distribucin de referencia en la cual est basado el grfico U puede ser
calculada a travs de la ley Poisson. En efecto, si
c
i
= n de defectos en la muestra i,
n
i
= unidades inspeccionadas en la muestra i,
u
i
= c
i
/ n
i
ser el n de defectos por unidad en la muestra i,
los valores u
i
seguirn una distribucin de Poisson de media:
Cuando en lugar de tomar una unidad tomamos n
i
unidades, la variabilidad muestral de u
i
es,
y, por lo tanto, los lmites de control del grfico U se obtendrn a partir de las expresiones (11.18),
(11.21) y (11.22) como,
Por lo tanto, los pasos a seguir en la implementacin del grfico Usern idnticos a los seguidos
para el grfico C con la diferencia que:
el valor que se lleva al grfico es u
i
, el nmero medio de defectos por unidad, y no el nmero de
defectos encontrados en la muestra (conteniendo n
i
unidades);
los lmites de control no son fijos sino que dependen del tamao de muestra.
265

u
c
n
i k
i
i

1, ,
(11.21)
[ ]
[ ]
V u
V c
n
n u
n
u
n
i
i
i
i
i i

2 2
(11.22)
Limite superior u
u
n
L S
i
+ 3 ( . .)
Limite central u L C ( . . )
Limite inferior u
u
n
L I
i
3 ( . .)
(11.23)
Lmite superior
Lmite inferior
Lmite central
11.6 Otros grficos de control
11.6.1 Grfico CUSUM
El grfico CUSUM (sumas acumuladas) puede ser aplicado en reas muy variadas tales como control
de procesos industriales, administracin, ciencias mdicas, marketing, comercio, biologa, etc. En este
captulo presentaremos la aplicacin de los grficos CUSUM al control de procesos industriales.
Los grficos de control CUSUM surgieron como una alternativa a los grficos Shewart para
detectar cambios moderados en los parmetros del proceso (en torno a 0.5-2 , siendo la desviacin
estndar de los valores observables). Las diferencias principales entre los dos grficos se deben a los
objetivos que persiguen.
Mientras que el objetivo de los grficos Shewart es detectar la aparicin de causas asignables
de variabilidad, el objetivo del CUSUM es algo diferente. Durante el control con CUSUM se desea
fabricar en torno a un valor nominal o target T y se pretende detectar cualquier evidencia de
alejamiento por parte del proceso de T en una magnitud superior a un valor preestablecido.
Este valor T puede ser, dependiendo de la caracterstica a estudio:
Un valor constante: el valor nominal de una variable continua, la varianza del proceso
2
, una
proporcin de individuos defectuosos p, etc.
Un valor no constante: los valores que predice un modelo terico.
Para la presentacin de los grficos CUSUM nos basaremos en el caso particular en el que se
pretende controlar la media de cierta caracterstica y en tal caso T=.
A igual que en los grficos -R se han de tomar muestras de tamao n del proceso, a intervalos
de tiempo equidistantes, y se ha de calcular la media
i
y el recorrido, R
i
.
A partir de estos datos, en cada instante k, se obtiene el estadstico C
k
:
que es el que se llevar al grfico CUSUM. Este valor acumula las discrepancias de los valores
observados respecto al valor nominal.
Si el proceso est bajo control produciendo con
media =T, los sumandos positivos y negativos se
compensarn unos con otros y observaremos a C
k
oscilar
alrededor de 0 (u otro valor fijo), tal como se muestra en
la figura 11.11.
Por el contrario, si la media del proceso no coincide
con T, las discrepancias de los valores observados respecto
T se acentuarn en un sentido, dependiendo de si T es
superior o inferior al verdadero valor de , y por lo tanto
el grfico CUSUM tendr una apariencia similar a una de
las presentadas en la figura 11.12.
Por lo tanto, en un grfico CUSUM la magnitud
del valor representado no tiene tanto inters como en los
grficos Shewart, pues aqu la importancia la tiene la pendiente que forma una trama de puntos.
En consecuencia, una trama de puntos horizontales, sea cual sea su magnitud, puede ser
interpretada como que en ese perodo de tiempo no hay evidencia de que la media del proceso no sea
T. Por el contrario, el alejamiento de la horizontal da pruebas de cambios en la media del proceso:
cuanto mayor sea la pendiente, mayor ser la discrepancia entre y T.
x
X
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
266
( ) C x T T
k i
i
k

1
, siendo en este caso particular (11.24)
Fig. 11.11 Grfico CUSUM cuando el proceso est
bajo control con T=
CONTROL ESTADSTICO DE PROCESOS
Por ejemplo, la figura 11.13 presenta un
proceso que se ha mantenido con media =T al
comienzo de la implementacin del grfico
CUSUM; posteriormente la media del proceso ha
pasado a ser ms pequea, volviendo a su valor
original T durante un perodo intermedio.
Al final la media del proceso nuevamente
cambia a un valor mayor que T. Si comparamos esta
pendiente creciente con la anterior decreciente,
podemos sospechar que el ltimo cambio experi-
mentado en la media es de mayor magnitud.
Como ya se ha mencionado, el anlisis de los
grficos CUSUM se har analizando la pendiente de
una trama de observaciones seguidas. Por lo tanto, los lmites de control en lugar de estar formados por
lneas paralelas estarn formados por dos pendientes, que representarn las mximas pendientes
permitidas antes de concluir que hay pruebas de que causas asignables estn actuando en el proceso
provocando un cambio en media superior a la admitida.
La pendiente de los lmites de control depender de cuatro factores:
La escala del grfico.
La variabilidad innata del proceso, .
El cambio en el parmetro del proceso que se pretende detectar.
El riesgo que se admite tomar en las decisiones ().
En cuanto a la escala del grfico se recomienda que la escala del eje vertical (o escala CUSUM)
tenga la siguiente relacin con la escala del eje horizontal (o escala del tiempo),
1 unidad escala horizontal = 2
e
escala vertical = A, (11.25)
donde
e
es la desviacin estndar del estadstico del cual se obtienen las sumas acumuladas. Por
ejemplo, si
e
=5, y colocamos las observaciones en el grfico CUSUM con una separacin de un
centmetro en la horizontal, en la escala vertical un centmetro representar 10 unidades de la
caracterstica que se mida.
La variabilidad innata del proceso influye directamente en los lmites de control: a mayor
variabilidad ms fcil es encontrar tramas de puntos en pendiente y ms acentuadas pueden ser stas
aun estando el proceso bajo control.
Por lo tanto, para la construccin del grfico se ha de estimar
e
, o desviacin estndar del
estadstico obtenido de la muestra. sta puede tomar diferentes expresiones dependiendo de la
caracterstica que se estudie, y puede ser estimada de la misma manera que en los grficos Shewart.
267

Fig. 11.12 grficos CUSUM cuando el proceso no est bajo control: a) > T. b) < T
Fig. 11.13 grfico CUSUM para la media de un proceso
0
0
Algunas de las formas que puede tomar
e
son:
si se toma la medida de cierta caracterstica que vara con desviacin tpica ;
si se toman proporciones de individuos defectuosos;
si se toma nmero de individuos defectuosos;
si se toma nmero de ocurrencias por unidad.
A continuacin daremos las pautas a seguir en la construccin de los grficos CUSUM. Para
ello nos referiremos al caso particular en el que se quiera controlar la media de un proceso que, en el
momento de la implementacin del CUSUM, est centrada en el valor nominal =T.
1) Tomar muestras de tamao n a intervalos de tiempo equidistantes y obtener la media,
i
, y el
recorrido, R
i
, de la caracterstica a estudio para cada una de las muestras.
2) Calcular en cada instante la suma acumulada de las discrepancias de los valores obtenidos en
1) con el valor nominal T=.
3) Obtener una estimacin de . sta puede ser obtenida en funcin del recorrido
medio de un nmero suficientemente grande de muestras como:
4) Determinar el nivel de probabilidad , o riesgo que se est dispuesto a asumir en la toma de
decisiones, en cada uno de los lados del grfico. ( = 0.00135 en los grficos Shewart.)
5) Definir el factor de escala del grfico. Es recomendable que
1 unidad horizontal =2 s
e
unidad vertical = A (11.28)
6) Determinar el menor cambio D en media que se quiere detectar y calcular
= D/ s
e
(11.29)
7) Obtener, a partir de , la distancia principal d
donde es la probabilidad de no detectar un cambio de D unidades en la media, y el ngulo
8) A partir de d y construir la plantilla que definen los lmites de control, tal como se muestra en
la figura 11.14.
Para la interpretacin del grfico CUSUM, el punto O en la plantilla se ha de colocar en el
ltimo valor de C
k
obtenido. Si alguno de los puntos anteriores queda cubierto por la plantilla, se
interpreta que alguna causa asignable ha entrado en el proceso y ha provocado un cambio en la media
superior a D unidades.
Adems se ha de tener en cuenta que:
el primer punto cubierto por la plantilla muestra el momento en que el proceso ha dejado de estar
bajo control;
si los puntos estn cubiertos por encima de la plantilla es que la media del proceso ha disminuido;
si los puntos estn cubiertos por debajo de la plantilla es que la media del proceso ha aumentado.
x
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
268
/ n
( ) p p n 1 /
( ) np p 1

( ) C x T
k i
i
k


1
(11.26)

e e
s s n
s
R d
n
e

/
2
(11.27)
( ) ( )
d d

2 1 2
2 2
ln / ln

o, si es pequea,
( ) arctg / D A 2
y
t
CONTROL ESTADSTICO DE PROCESOS
En la interpretacin de los grficos
CUSUM de la manera aqu expuesta hay que
tomar ciertas precauciones. La primera es que la
variabilidad del proceso ha de permanecer
constante, para ello se ha de llevar un control
aparte de la misma.
En segundo lugar, los grficos as
construidos no son muy eficaces en la deteccin
de cambios graduales en media o en los cambios
que surgen y desaparecen rpidamente del
proceso. Por lo tanto es recomendable usar los
grficos CUSUM para detectar saltos en la
media del proceso y paralelamente los grficos
Shewart para ayudarnos a interpretar otro tipo
de anomalas.
11.6.2 Grficos EWMA
El grfico EWMA (Exponentially Weighted Moving Average), o grfico de medias mviles con pesos
exponenciales, fueron introducidos en 1971 por Wortham y Ringer, una vez ms para suplir la deficiencia
de los grficos Shewart en detectar determinados alejamientos del proceso de su estado de control.
Esta necesidad surgi de las empresas de procesos qumicos. Tales procesos, ante la presencia
de causas asignables, vean modificados sus parmetros generalmente de una manera muy lenta y de
modo gradual, no a saltos.
Cuando tal hecho ocurra, la aplicacin de grficos Shewart era insensible a tales cambios o, en
el mejor de los casos, de efectos muy retardados. Por otra parte los grficos CUSUM tampoco eran
adecuados puesto que los cambios no eran escalonados y, por consiguiente, se interpretaba mal el
funcionamiento de los procesos.
El grfico EWMA posee memoria, pero sta es de diferente naturaleza que la de los grficos
CUSUM. Mientras que estos ltimos daban igual peso a cualquier instante en el pasado, lo que se
denomina memoria de elefante, los pri-
meros dan pesos a los datos de una manera
exponencial: contribuyendo en mayor
cantidad al presente y cada vez menos
cuanto ms alejados estn en el pasado, lo
que se denomina memoria humana. Este
hecho queda plasmado en la figura 11.15.
Una caracterstica que diferencia a
los grficos EWMA del resto es que la
interpretacin del grfico se hace en
funcin del comportamiento esperado del
proceso en el instante siguiente.
Para ver todos estos puntos
definamos primero el estadstico a utilizar
en el grfico EWMA. ste es una media,
pero con pesos exponenciales,
269

Fig. 11.14 Grfico de control CUSUM con la plantilla de


control
Fig. 11.15 Pesos de los datos en la interpretacin del grfico en el
presente t para grficos Shewart, CUSUM y EWMA
+1
Tal estadstico depende de los datos anteriores a travs de un peso que decrece de forma
exponencial. Operando con la anterior expresin,
se llega a la expresin
En ella, a se le denomina prediccin para el instante t+1 hecha en el instante t, y puede
obtenerse a partir de la prediccin en el instante t-1 hecha para t y el error de prediccin, corregida
por un factor de .
Hay que entender que este estadstico as construido no predice el valor que se va a obtener en
el proceso, puesto que el valor previsto para observaciones independientes de un proceso en estado de
control es la media. En cambio, es un valor que acumula la informacin del pasado, permitiendo as
detectar pequeos cambios graduales en la media del proceso.
As, si el proceso est afectado nicamente por causas comunes, el estadstico se obtendr
por suma de datos independientes distribuidos segn una ley normal de parmetros N(,
2
) y, por lo
tanto, seguir una distribucin normal con:
Es decir, al ser distribuido segn una , podemos utilizar los lmites de
control definidos por
y construir as el grfico de control EWMA. En l representaremos las predicciones para el tiempo
t+1. Si se detecta alguna de las anomalas descritas en el apartado de grficos -R, se tomarn las
medidas oportunas en el tiempo t.
Adems, recomendamos aadir en el grfico EWMA las observaciones originales del proceso,
con sus lmites correspondientes, ya que as,
X
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
270
( ) ( ) ( ) EWMA + + + +
+
y y y y y
t t t t t 1 1
2
2
3
3
1 1 1
( ) ( ) ( )
[ ]
y y y y y
t t t t t +
+ + + +
1 1 2
2
3
1 1 1
( )
y y y
t t t +
+
1
1
( )
y y y y
t t t t +
+
1

(11.31)
(11.30)
y y e
t t t +
+
1

(11.32)
y
t +1
y
t +1
y
t +1
[ ] [ ] ( ) [ ] ( ) [ ] ( ) [ ] E y E y E y E y E y
t t t t t

+
+ + + +
1 1
2
2
3
3
1 1 1
[ ] ( ) E y
t
k
k


1
0
1
[ ] [ ] ( ) [ ] ( ) [ ] ( ) [ ] V y V y V y V y V y
t t t t t

+
+ + + +
1
2 2
2
1
2
4
2
2
6
3
1 1 1
[ ] ( ) V y
t
k
k

1
2 2
0
2
2
1
2

(11.33)
(11.34)
y
t +1
N( , / )
2
2
( ) Limite superior + 3 2 /
Limite central
( ) Limite inferior 3 2 /
(11.35)
y
t +1
Lmite superior
Lmite inferior
Lmite central
CONTROL ESTADSTICO DE PROCESOS
no se pierde las referencias reales de la caracterstica de calidad bajo estudio;
permite calcular de una manera sencilla los valores del EWMA, , en cada instante.
La sensibilidad los grficos EWMA para detectar cambios en el proceso depende del valor que
adopte . Si $ 1, el valor de EWMA depende totalmente de las observaciones ms recientes y el
comportamiento del grfico es similar al del grfico Shewart. Sin embargo, conforme $ 0 se da ms
peso al comportamiento histrico del proceso, y en tal caso estamos acercndonos al tratamiento de los
grficos CUSUM. Aunque la eleccin de es libre y a juicio del investigador, si se usan los grficos
EWMA para aplicarlos sobre procesos que en estado de control generan observaciones que se pueden
considerar independientes, ser seleccionado en funcin del cambio que se desea detectar.
Para aquellos procesos que en estado de control generan datos dependientes, bien porque las
causas asignables no se pueden eliminar o bien porque las mediciones se toman muy seguidas, por
ejemplo cuando se realizan lecturas automticas, no se recomienda la aplicacin de estos grficos, sino
una variante de los mismos que se presenta al final del captulo.
11.7 El precontrol
El precontrol se utiliza como un mtodo de control estadstico de procesos, que responde al objetivo
de controlar la variabilidad del proceso que pueda provocar la aparicin de individuos fuera de
tolerancias. Tal variabilidad puede ser provocada tanto por causas comunes como asignables.
Respondiendo a tal objetivo, algunos casos en que se utiliza el precontrol son:
procesos en los que existe una variacin importante de la caracterstica a controlar dentro de su
margen de tolerancias;
procesos de corta duracin en los que se sabe que existen problemas de puesta a punto al
comienzo de la produccin, pero requieren poco seguimiento posteriormente.
Por lo tanto, la intervencin en el proceso slo se realiza en funcin de la posicin del individuo
respecto de sus especificaciones, y se dice que un proceso est en estado de control si permanece dentro
de las lneas de precontrol que a continuacin presentamos, independientemente de si est afectado por
causas asignables de variabilidad.
El grfico precontrol se construye de acuerdo con las especificaciones del producto, y se divide
en tres zonas a cada lado de la lnea central que son pintadas de diferentes colores: verde, amarillo y
rojo. A los lmites que separan las zonas verdes de las amarillas se las denomina lneas de precontrol.
La implementacin de estos grficos se lleva a cabo de la siguiente manera:
1) Construir el grfico tal como se ha comentado anteriormente.
2) Para determinar si el proceso es capaz, tomar cinco mediciones consecutivas del proceso. Si
todas caen en la zona verde, se considera que el proceso est en estado de control y se ha de
continuar la produccin en las condiciones actuales.
Si en cambio, al menos una no cae en la zona verde, se considera que el proceso no est bajo
control y se ha de intentar reducir la variabilidad, bien identificando causas asignables o bien
utilizando tcnicas de diseo de experimentos. Una vez realizadas las acciones adecuadas se
comienza otra vez.
3) Una vez el proceso est bajo control, tomar dos mediciones consecutivas peridicamente. La
posicin de estas unidades determinar las medidas que se deban tomar:
Si las dos caen en la zona verde, o una en la verde y una en la amarilla, se contina.
Si las dos caen en la zona amarilla al mismo lado se ha de ajustar el proceso.
Si las dos caen en la zona amarilla en distinto lado, se ha de estar atento al proceso para una
posible intervencin.
271

y
t +1
Si alguna cae en la zona roja, se ha de
parar la produccin, buscar las causas que
han provocado esta unidad defectuosa y
eliminarlas.
Ntese que siempre que se acte sobre el
proceso se ha de comenzar el precontrol a
partir del paso 2).
La frecuencia del muestreo puede
variar en funcin de la salida del proceso
siendo recomendable tomar dos unidades con
una frecuencia de:
lo cual hace que aquellos procesos que se comporten bien sean muestreados con poca frecuencia.
Los grficos precontrol son muy sensibles cuando actan sobre procesos en los que 6 es mayor
que las especificaciones y obligan a una mejora del proceso. Sin embargo, para aquellos procesos en
que 6 es mucho menor que el intervalo de especificaciones, el precontrol permite producir muchas
unidades sin actuar sobre el proceso.
11.8 Grficos de control para observaciones dependientes
El presente captulo ha tratado el control estadstico de procesos en el supuesto de que el proceso en
estado de control muestre observaciones independientes entre s. Con tal hiptesis, toda evidencia de
no aleatoriedad era interpretada como presencia de causas asignables y, por tanto, se deban emprender
acciones para encontrar las causas asignables y actuar adecuadamente sobre ellas.
Sin embargo, existen procesos que muestran dependencia entre las observaciones debido a la
presencia de ciertas causas asignables, que actan continuamente sin poder ser eliminadas. Los
procesos continuos son un claro ejemplo de estos procesos. En tales procesos, la aplicacin de las
tcnicas clsicas de SPC conlleva la aparicin continua de patrones anmalos sin que se pueda actuar
sobre ellos en la mayora de las veces.
La estrategia a seguir para el control de procesos con datos dependientes es, por tanto, diferente
a la presentada en este captulo, existiendo dos maneras de analizar y, en consecuencia, de actuar.
La primera se sigue denominando
SPC y consiste en acomodar los grficos
anteriores al modelo que sigue la variabilidad
del proceso. Tales modelos, as como los
grficos de control apropiados, pueden ser
estimados empleando la metodologa Box-
Jenkins (1976).
La segunda tcnica utilizada se
denomina control estadstico y automtico, o
adaptativo, de procesos (ASPC) y consiste
en, adems de realizar un control estadstico
del proceso para la deteccin de causas
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
272
Fig. 11.16 Grfico precontrol
frecuencia =
tiempo medido entre dos paradas del proceso
6
Fig. 11.17 Esquema del control adaptativo de procesos
CONTROL ESTADSTICO DE PROCESOS
asignables de variabilidad, realizar ajustes en el proceso siempre y cuando ste se aleje
considerablemente de su valor nominal. La figura 11.17 presenta un esquema de esta tcnica.
Igualmente es necesario estimar el modelo que sigue el proceso Z
t
, afectado por causas comunes,
y conocer el mecanismo de correccin del proceso o funcin de transferencia Y
t
= F(X
t
, X
t-1
,...), siendo
X
t
una variable del proceso que puede ser modificada convenientemente para ajustar el proceso una
cantidad Y
t
. Si adems se incluyen los criterios de costes, la estrategia de control vara. Una vez ms
el lector que quiera ampliar conocimientos sobre el tema puede hacerlo a travs de las lecturas
recomendadas al comienzo del captulo.
273

Ejercicios
11.1. En un cierto proceso de fabricacin, una de las operaciones consiste en efectuar un corte en una
pieza de plstico. Dicho corte debe tener una profundidad especificada en los planos. Dado que
en el procesado posterior de dichas piezas se tenan problemas debido a piezas con cortes no
adecuados, un ingeniero decide recoger informacin del proceso.
Para ello recogi datos de 25 conjuntos de piezas cada uno a intervalos de tiempo de 15 minutos
y midi la profundidad del corte obtenido. Los datos obtenidos son los de la tabla adjunta.
a) Represente las medias de cada conjunto de cinco piezas, en secuencia temporal y comente la
informacin que contiene dicho grfico.
b) Represente la secuencia temporal de evolucin de la amplitud y, a la vista de la informacin
obtenida con los dos grficos anteriores, haga un resumen del comportamiento de los datos de
la operacin de corte.
11.2. En una determinada empresa, se producen piezas A y B que se ensamblan tal como se muestra
en la figura:
Los siguientes datos (en micras) corresponden a
mediciones de la dimensin b de la pieza B, y
son las medias y rangos de 24 subgrupos (1 cada
hora) de cuatro unidades cada uno. Los datos se
tomaron durante los tres turnos de un da de
produccin.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
274
CONJUNTO N R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
160.0
159.7
159.2
159.5
159.6
159.8
159.7
159.2
159.4
159.5
159.4
159.5
159.7
159.3
159.7
159.1
159.2
160.0
159.9
159.5
159.9
159.6
159.8
159.3
159.3
159.5
159.5
159.7
159.7
159.3
160.5
160.2
159.6
159.3
159.5
159.6
160.0
159.3
159.9
158.8
158.9
159.8
159.9
159.7
160.6
159.9
159.5
159.4
160.3
159.7
159.6
159.5
159.7
159.2
159.6
160.2
159.5
159.6
159.3
159.5
159.6
160.0
159.3
159.9
158.8
158.9
159.8
159.9
159.7
160.6
159.9
159.5
159.4
160.3
159.7
159.7
159.5
159.5
159.2
159.5
159.3
159.0
160.0
159.9
158.9
159.8
159.3
159.4
158.5
160.6
159.6
159.8
160.3
159.6
160.6
159.5
159.7
160.0
159.9
160.1
159.7
160.0
160.2
159.1
159.4
159.5
159.7
159.9
159.5
159.5
159.8
159.4
159.2
159.5
159.1
159.7
159.7
159.3
159.3
159.8
161.0
159.5
159.7
160.0
160.1
159.7
159.6
159.7
159.3
159.5
159.9
159.6
159.7
159.6
159.5
159.4
159.6
159.4
159.4
159.5
159.5
159.7
160.0
159.7
159.9
160.0
159.9
159.8
160.0
159.8
0.5
0.5
1.0
0.6
0.3
1.2
1.2
0.8
0.6
1.3
1.5
0.7
0.5
1.4
1.8
0.8
0.8
1.2
0.8
1.1
1.5
1.6
0.8
1.3
0.8
PROFUNDIDAD DEL CORTE X
CONTROL ESTADSTICO DE PROCESOS
a) Representar y comentar el grfico medias-rangos.
La capacidad del proceso (6) de fabricacin de la pieza B con respecto a la dimensin de b es
de 45.6.
b) Que relacin hay, y bajo que condiciones entre la capacidad del proceso y los lmites de
control? Se cumple en este caso?
11.3. Despus de un lamentable accidente, una empresa de ascensores decide implantar el control
estadstico en su proceso de fabricacin de pernos. Para ello, se toman cuatro pernos en cada
turno y se someten a una prueba de resistencia. Los datos, despus de ocho das de trabajo son
los siguientes:
Realizar los grficos de control que se crea
convenientes y comentarlos.
11.4. Se quiere realizar un grfico de control -R tomando muestras de cuatro unidades. Se
comprueba que los lmites de control LCL y UCL toman los valores de la tolerancia inferior y
superior respectivamente, y el valor nominal coincide con LC. Cul es la proporcin esperada
de piezas defectuosas?
11.5. En una mquina que produce bobinas de papel aparecen en promedio 0.7 manchas cada 10
metros. Cada treinta minutos el operador observa pasar 10 m de papel y anota el nmero de
manchas en un grfico. Cul es el grfico adecuado y cules son los lmites de control?
11.6. Una mquina produce piezas de mica. Se toman 50 piezas consecutivas y se mide el grosor:
X
275

SUB R SUB R SUB R


1
2
3
4
5
6
7
8
288.50
281.75
294.25
284.75
293.00
293.00
291.25
300.25
16
19
15
17
28
18
17
3
9
10
11
12
13
14
15
16
296.00
292.75
289.25
299.00
282.75
296.00
284.25
295.00
2
12
22
8
9
16
21
20
17
18
19
20
21
22
23
24
296.00
301.25
296.75
294.00
296.00
298.00
289.50
285.00
6
26
23
13
18
16
19
15
TURNO 1 TURNO 2 TURNO 3
X X X
DA TURNO 1 TURNO 2 TURNO 3
X R X R X R
1
2
3
4
5
6
7
8
27.0
29.0
30.8
24.3
23.5
26.8
30.3
5.3
5
2
12
11
18
12
18
12
25.3
26.5
21.5
17.8
30.5
8.1
30.0
14.8
11
28
13
33
14
4
15
14
26.5
26.5
25.5
19.3
29.3
10.3
20.0
18.0
3
24
13
35
12
3
10
9
X R 22 79 13 79 . .
8.0
10.0
12.0
12.0
11.5
12.5
10.5
10.5
12.5
9.0
12.5
8.0
13.5
15.5
9.5
14.0
15.0
11.5
13.5
11.5
13.5
9.0
12.0
12.5
12.5
12.0
13.0
15.5
17.0
14.0
14.0
11.0
14.0
8.0
11.5
12.0
10.0
7.5
11.0
13.0
10.0
14.0
11.5
11.5
13.0
14.5
11.0
11.0
17.0
15.0
a) Realizar el estudio de capacidad de los datos anteriores, dando el valor de la media, la
desviacin tipo y la capacidad de la mquina.
b) Si se consideran aceptables las piezas entre 6.75 y 15.75, es capaz dicha mquina? Cal es su
C
p
? Qu fraccin de la produccin ser defectuosa?
c) Hacer el estudio grfico para que slo el 1% de las piezas sean ms grandes de 14.0 y slo un
3% sean ms pequeas que 7. Cules sern los nuevos valores de la media, desviacin tipo y
capacidad?
11.7. Una caracterstica de calidad de un producto con tolerancias (7.9, 12.1), se distribuye segn una
normal N(10, 1). El proceso se descentra y pasa a fabricar alrededor de 10.5. Qu se puede
decir de la capacidad del proceso?
11.8. Un fabricante de botellas de PVC detecta que el nmero de botellas producidas es inferior al
que debera ser, dado el consumo de materia prima (PVC). Se sospecha que la diferencia es
debida a que se producen botellas con un peso superior al especificado (33 0.4gr.) Para
comprobarlo se decide realizar un estudio de capacidad pesando 50 botellas. Los datos
recogidos, en gramos, son:
a) Realizar un estudio de capacidad, determinando la media y la desviacin tipo.
b) Qu porcentaje de piezas se puede esperar que no estn dentro de los lmites especificados?
c) Segn el estudio realizado, para conseguir que como mximo se produjesen el 1% de botellas
con exceso de peso y un 5% con un peso inferior al especificado, debera variar la media? Y
la desviacin tipo? Cules son los valores que se deberan tomar?
11.9. Una empresa de helados se dedica en una de sus plantas a la fabricacin de helados de
chocolate. El helado es vendido en tarrinas de 1.5 dl. Se decide comenzar un estudio de control
del proceso, y para ello se extraen cuatro tarrinas durante la produccin, a intervalos de tiempo
de 10 minutos. Las medidas de las pesadas estn en la tabla que sigue:
Hacer un estudio del proceso e interpretarlo.
MTODOS ESTADSTICOS. CONTROL Y MEJORA DE LA CALIDAD
276
33.0
32.6
33.0
32.8
32.6
32.7
32.9
32.8
33.4
33.3
33.0
32.8
33.0
33.5
33.0
33.2
33.4
32.4
32.6
33.1
33.1
33.0
33.0
32.7
32.9
32.7
32.7
33.1
33.4
32.9
32.9
33.4
33.2
32.8
33.1
33.1
32.9
33.1
32.8
33.1
33.2
33.0
33.3
33.1
32.5
32.9
33.2
32.9
32.9
33.0
N GRUPO R
13
14
15
16
17
18
19
20
21
22
23
24
203
214
192
207
205
204
205
202
204
206
204
206
204
212
198
208
214
208
204
202
206
206
202
205
204
206
204
206
215
196
205
208
209
206
204
204
203
208
198
204
212
196
204
208
202
210
207
202
1
8
12
4
10
12
1
6
7
4
5
4
203.50
210.00
198.00
206.25
211.50
201.00
204.50
205.00
205.25
207.00
204.25
204.25
N GRUPO R
1
2
3
4
5
6
7
8
9
10
11
12
202
200
202
201
210
202
198
206
206
208
198
204
201
202
201
200
196
206
196
204
204
214
201
204
198
212
208
200
200
205
202
204
203
213
199
202
199
202
201
202
198
203
199
206
204
207
198
206
4
12
7
2
14
4
6
2
3
7
3
4
200.00
204.00
203.00
200.75
201.00
204.00
198.75
205.00
204.25
210.50
199.00
204.00
X X
X 20395 .
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.
Los autores, 1998; Edicions UPC, 1998.