Você está na página 1de 24

2.1. Familia de diseos para comparar tratamientos.

Los diseos experimentales ms utilizados para comparar tratamientos son:


1.
2.
3.
4.

Diseo completamente al azar (DCA)


Diseo en bloque completamente al azar (DBCA)
Diseo en cuadro latino (DCL)
Diseo en cuadro grecolatino (DCGL)

La diferencia fundamental entre estos diseos es el nmero de factores de bloque que


incorporan o controlan de forma explcita durante el experimento. La comparacin de
los tratamientos en cuanto a la respuesta media que logran, en cualquiera de estos
diseos, se hace mediante la hiptesis que se prueba con la tcnica estadstica
llamada Anlisis de Varianza (ANOVA) con uno, dos, tres o cuatro criterios de
clasificacin, dependiendo del nmero de factores de bloques incorporados al
diseo.
Dise
o
DC
A
DB
CA
DCL
DC
GL

Factores
de
0
1

ANOVA

Modelo estadstico

Un criterio
Dos criterios

Tres criterios

Cuatro criterios

Y es la variable de salida, la media global,


son los efectos de tres factores de bloqueo.

el efecto del i-simotratamiento,

error aleatorio, y,

El modelo estadstico que describe el comportamiento de la variable observada


Y en cada diseo, incorpora un trmino adicional por cada factor de bloqueo
controlado.
De acuerdo con los modelos dados en la tabla, para cada diseo
comparativo se tienen al menos dos fuentes de variabilidad: los tratamientos o niveles
del factor de inters y el error aleatorio. Se agrega una nueva fuente de variabilidad por
cada factor de bloque que se controla directamente. Se observa que los diseos suponen
que no hay efectos de interaccin entre los factores, lo cual sera lo deseable
que ocurra; de no ocurrir as, tal efecto se recarga al error y el problema de
comparacin no se resuelve con xito.
Un efecto de interaccin entre dos factores hace referencia a que el efecto
de cada factor depende del nivel en que se encuentra el otro.

2.2. El modelo de efectos fijos


El modelo de efectos fijos (es cuando se estudian todos los posibles tratamientos) de
anlisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al
grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la
media, permaneciendo la "variable respuesta" con una distribucin normal.
Este modelo se supone cuando el investigador se interesa nicamente por los niveles del
factor presentes en el experimento, por lo que cualquier variacin observada en las
puntuaciones se deber al error experimental.
Donde es el parmetro de escala comn a todos los tratamientos, llamado media global,
; es un parmetro que mide el efecto del tratamiento y es el error atribuible a la
medicin . Este modelo implica que en el diseo completamente al azar actuaran a lo
ms dos fuentes de variabilidad: Los tratamientos y el error aleatorio. La media global de
la variable de respuesta no se considera una fuente de variabilidad por ser una constante
comn a todos los tratamientos, que hace las veces de punto de referencia con respecto al
cual se comparan las respuestas medias de los tratamientos.
Si la respuesta media de un tratamiento particular es muy diferente de la
respuesta media global , es un sntoma de que existe un efecto de dicho tratamiento, ya
que como se ver ms adelante. La diferencia que debe tener las medias entre s para
concluir que hay un efecto (que los tratamientos son diferentes), nos lo dice el anlisis
de varianza (ANOVA).
En la prctica puede suceder que los tratamientos que se desea comparar sean
demasiados como para experimentar con todos. Cuando esto sucede es conveniente
comparar slo una muestra de la poblacin de tratamientos, de modo que pasa a ser
una variable aleatoria con su propia varianza que deber estimarse a partir de los
datos. En este captulo slo se presenta el caso en que todos los tratamientos que se
tienen se prueban, es decir, se supone una poblacin pequea de tratamientos, lo cual
hace posible compararlos a todos. En este caso, el modelo dado por la ecuacin (2.2) se
llama modelo de efectos fijos.

2.3. Diseo completamente al azar y ANOVA


Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseo
completamente al azar (DCA), que es el ms simple de todos los diseos que se utilizan
para comparar dos o ms tratamientos, dado que slo consideran dos fuentes de

variabilidad: los tratamientos y el error aleatorio. En la siguiente unidad veremos


diseos que consideran la influencia de otras fuentes de variabilidad (bloques).
Este diseo se llama completamente al azar porque todas las corridas
experimentales se realizan en orden aleatorio completo. De esta manera, si durante el
estudio se hacen en total N pruebas, stas se corren al azar, de manera que los posibles
efectos ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.
Ejemplo 1
Comparacin de cuatro mtodos de ensamble. Un equipo de mejora investiga el
efecto de cuatro mtodos de ensamble A, B, C y D, sobre el tiempo de ensamble en
minutos con un nivel de significancia de 0.05. En primera instancia, la estrategia
experimental es aplicar cuatro veces los cuatro mtodos de ensamble en orden
completamente aleatorio (las 16 pruebas en orden aleatorio). Los tiempos de ensamble
obtenidos se muestran en la tabla 2.1. Si se usa el diseo completamente al azar (DCA),
se supone que, adems del mtodo de ensamble, no existe ningn otro factor que influya
de manera significativa sobre la variable de respuesta (tiempo de ensamble)
Tabla 2,1 Diseo completamente al azar
para el ejemplo 1

Mtodo de
ensamble
A B
C
6
7
1
1
8
9
1
7
1
6
8
0
1
8
1

D
1
0
1
2
1
1

Ejemplo 2
Comparacin de cuatro tipos de cuero. Un fabricante de calzado desea mejorar la
calidad de las suelas, las cuales se pueden hacer con uno de los cuatro tipos de cuero A,
B, C y D disponibles en el mercado. Para ello, prueba los cueros con una mquina que
hace pasar los zapatos por una superficie abrasiva; la suela de stos se desgasta al
pasarla por dicha superficie. Como criterio de desgaste se usa la prdida de peso
despus de un nmero fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de
cada tipo de cuero. Al hacer las pruebas en orden completamente al azar se evitan
sesgos y las mediciones en un tipo de cuero resultan independientes de las dems. Los
datos (en miligramos) sobre el desgaste de cada tipo de cuero se muestran en la tabla 2.2
Tabla 2,2 Comparacin de cuatro tipos de cuero (cuatro tratamientos)

Tipo de
cuero

Observaciones

Promedi
o

A
B
C

264 260 258 241 262


255
208 220 216 200 213
206
220 263 219 225 230

256,7
209,8
230,8
220,7

Diseos completamente al azar y


ANOVA

52

El anlisis de la varianza de un criterio (ANOVA de un criterio) es una


metodologa para analizar la variacin entre muestras y la variacin al interior de las
mismas con varianzas, en lugar de rangos. Como tal, es un mtodo estadstico til para
comparar dos o ms medias poblacionales.
El objetivo del anlisis de varianza en el DCA es probar las hiptesis de
igualdad de los tratamientos con respecto a la media de la correspondiente variable de
respuesta:

Nota: Primeramente explicare el clculo manual tradicional para ANOVA,


posteriormente el simplificado y ms prctico, as como su solucin utilizando un
paquete computacional.
El mtodo de ANOVA con un criterio requiere del clculo de dos estimaciones
independientes para
, la varianza poblacional comn. Estas dos estimaciones se
denotan por
y .
. Se denomina estimacin de la varianza entre muestras (Mtodo entre)
. Se denomina estimacin de la varianza al interior de las muestras (Mtodo dentro)
El estadstico entonces resulta

y tiene una distribucin muestral que sigue

una distribucin F.
Estadstico F para el ANOVA con un criterio

(2,3)

El cual se contrastara con el valor de encontrado en tablas en relacin a los


grados de libertad del numerador entre grados de libertad del denominador y con un
nivel de significancia ( ) prefijado.
Se rechaza la

si

Se deduce que si es grande, se contradice la hiptesis de que no hay efectos


de tratamientos; en cambio, si es pequeo se confirma la validez de

Mtodo dentro

Diseos completamente al azar y


ANOVA

53

El mtodo dentro de estimacin de la varianza produce una estimacin vlida sin


importar si la hiptesis nula de las medias poblacionales iguales es cierta. Esto se debe a
que la variabilidad de los valores de la muestra se determina comparando cada elemento

en los datos con la media muestral. Cada valor de la muestra obtenido de la poblacin A
se compara con la media muestral A; cada elemento obtenido de la poblacin B se
compara con la media muestral B, y as sucesivamente. La ecuacin para calcular la
estimacin de la varianza con el mtodo dentro es:

=
donde:
= Estimacin de la varianza muestral con el mtodo entre.
= i-simo elemento de los datos de grupo j.
= media del grupo j
C = nmero de grupos
n = nmero de elementos de la muestra en cada grupo.

(2,4)

El nmero adecuado de grados de libertad para el mtodo dentro se calcula como


c(n-1) si el nmero de observaciones en cada grupo es igual. Como a cada elemento del
grupo se le resta la media de ese grupo, slo (n-1) elementos de cada grupo pueden
variar. Adems como se tienen c grupos, c se multiplica por (n-1) para obtener los
grados de libertad para el mtodo dentro.
Grados de libertad para
glw = C(n 1)

Mtodo entre

El segundo mtodo para estimar la varianza comn de la poblacin produce una


estimacin vlida slo si la hiptesis nula es cierta. Para entender el mtodo entre
recuerde el teorema del lmite central. Este importante teorema en estadstica establece
que la distribucin de las medias muestrales tiende a una distribucin normal conforme
crece el tamao de la muestra, con una media y una desviacin estndar n. Si el
error estndar de la media es n, entonces la varianza de la distribucin es igual al
2
error estndar al cuadrado, n.
Esta varianza es una medida de las diferencias entre todas las medias muestrales
que puedan obtenerse de la distribucin y la media de la poblacin. La raz cuadrada de
esta varianza es el error estndar de la media, es decir, la diferencia estndar entre una
media muestral y la media poblacional.
En ANOVA, para estimar la varianza de la distribucin muestral de
medias, se debe estimar primero la media poblacional. La media de todos los valores
muestrales proporciona esa estimacin. Despus, se determina la diferencia entre la
media de cada grupo y esta media poblacional estimada, y estas diferencias se elevan al
cuadrado y se suman. Este valor, con frecuencia se llama la suma de cuadrados entre
(SCb). Esta suma se divide entonces entre el nmero adecuado de grados de libertad

para obtener la estimacin de la varianza de la distribucin muestral. La ecuacin


siguiente da el clculo de la estimacin de la varianza de la distribucin muestral de las
medias:

=
donde:

(2,5)

= Estimacin del mtodo entre de la varianza poblacional comn.


= media del grupo j.
= media global (media de todos los valores), usada como estimacin de .
C = nmero de grupos
n = nmero de elementos de la muestra en cada grupo si el nmero de
observaciones en cada uno es el mismo.
Grados de libertad para
glb = (C 1)

Tabla ANOVA

Los resultados del anlisis de varianza se presentan en una tabla ANOVA que
resume los valores importantes de la prueba. Esta tabla tiene un formato estndar que
usan los libros y los problemas de computadora que ejecutan ANOVA. La siguiente
tabla muestra la forma general de la tabla ANOVA.
En dicha tabla se resumen los clculos necesarios para la prueba de igualdad de las
medias poblacionales usando anlisis de varianza. Primero se usa el mtodo dentro para
2
estimar . Cada valor de los datos se compara con su propia media, y la suma de las
diferencias al cuadrado se divide entre los grados de libertad c(n-1).

Fuente de
variacin
Grupos Entre
Grupos
Dentro
Total

SC

GL
2

c-1

c(n-1)

Estimacin
de
/ glb2

Coeficiente F
/

/ glb

( xij x )

donde:
= Nmero de la columna
i = Nmero de la fila
c = Nmero de columnas (grupos)
n = Nmero de elementos en cada grupo (tamao de la muestra)
La tabla ANOVA contiene columnas con las fuentes de variacin, las sumas de
cuadrados, los grados de libertad, las estimaciones de la varianza y el valor F para el
procedimiento de anlisis de varianza.

Retomando el problema del efecto de cuatro mtodos de ensamble A, B, C y D,


sobre el tiempo de ensamble en minutos tenemos:

Mtodo de
ensamble
A B
C
D
6
7
1
1
1
0
8
9
1
1
7
1
6
2
0
8
1
1
8
1
1
Media ( i) 7,25 8,5 12,75 10,5
Media global : = 9,73
C = 4, n = 4
=4

+
+

Completando la tabla ANOVA, quedando de la siguiente manera


Fuente de
2
Variacin
SC
gl
Estimacin de
Coeficiente F
---------------------------------------------------------------------------------------------------------Grupos entre
69,49
3
69,75/3 = 23,25
23,25/2,45 =
9,42
Grupos
29,48
12
29,48/12 = 2,45
----------------------------------------------------------- ----------------------------------------------TOTA
98,97
15

Como la hiptesis a probar es


H0:
H1:

1 = 2 = 3 = 4
No todas las poblaciones tienen la misma media

El valor de F calculado por tabla cuando tenemos un nivel de significancia de


0,05 y 3 grados de libertad en el numerador y 12 grados de libertad en el denominador
es
F0,05 (3,12) = 3,49

Como nuestro estadstico de prueba F (9,42) excede el valor crtico tabulado


(3,49), rechazamos la hiptesis nula y aceptamos la alterna, concluyendo que s hay
diferencia o efecto de los mtodos de ensamble en cuanto a su tiempo promedio.

Ahora veremos el procedimiento y notacin ms comnmente utilizado para la


solucin de ANOVA
Tabla 2.3 Diseo completamente al azar (DCA)

Tratamientos

.
.
.
.
.
.

Notacin de puntos

Sirve para presentar de manera abreviada cantidades numricas que se pueden calcular a
partir de los datos experimentales donde
representa la
observacin en el
tratamiento , con
y
. Las cantidades de inters son las
siguientes:

Note que el punto indica la suma sobre el correspondiente subndice. As, algunas
relaciones vlidas son:

(2.6)

donde

es el total de observaciones.

ANOVA

Como ya lo mencionamos el objetivo del anlisis de varianza en el DCA es probar la


hiptesis de igualdad de los tratamientos con respecto a la media de correspondiente
variable de respuesta.
Para probar la hiptesis dada por la relacin:

mediante la tcnica de ANOVA, lo primero es descomponer la variabilidad total de los


datos en sus dos componentes: la variabilidad debida a tratamientos y la que
corresponde al error aleatorio (equivalente al mtodo entre y mtodo dentro), como se
hace a continuacin.
Una medida de la variabilidad total presente en las observaciones de la tabla 2.3

es la suma total de cuadrados (

) dada por:

(2.7)

donde

es la suma de los

datos en el experimento.

La suma de cuadrados de tratamientos (

) sta

dado por:

(2.8)

donde apreciamos que la


mide la variacin o diferencias entre tratamientos, ya
que si stos son muy diferentes entre s, entonces la diferencia tender a ser
grande en valor absoluto, y con ello tambin ser grande la
La suma de cuadrados del error (

) sta dado por:

(2.9)

donde la mide la variacin dentro de tratamientos, ya que si hay mucha variacin


entre las observaciones de cada tratamiento entonces
tender a ser grande en
valor absoluto. En forma abreviada, esta descomposicin de la suma total de cuadrados
se puede describir como:

(2.10)

La suma de cuadrados divididos entre sus respectivos grados de libertad se


llaman cuadrados medios. Los dos que ms interesan son el cuadrado medio de
tratamientos (
) y el cuadrado medio del error (
, que se denotan por:

(2.11)

(2.12)

Con base en este hecho se construye el estadstico de prueba como sigue: se sabe
que
y
son independientes, por lo que
y
son dos
variables son dos variables aleatorias independientes con distribucin ji-cuadrada con
y grados de libertad, respectivamente. Entonces, bajo el supuesto de que la
hiptesis
es verdadera, el estadstico

(2.13)

sigue una distribucin


con (
grados de libertad en el numerador y (
)
grados de libertad en el denominador. De la ecuacin (2.13) se deduce que si es
grande, se contradice la hiptesis de que no hay efecto de tratamientos; en cambio, si

es pequeo se confirma la validez de . As para un nivel de significancia prefijado,


se rechaza
si
donde
es el percentil (
) x 100 de
la distribucin . Tambin se rechaza si el valor-p
, donde el valor-p es el rea
bajo la distribucin
a la derecha del estadstico , es decir, el
)
Toda la informacin necesaria para calcular el estadstico hasta llegar al valorp se escribe en la llamada tabla de anlisis de varianza (ANOVA) que se muestra
en la tabla 2.4. En esta tabla, las abreviaturas significan lo siguiente: fuente de
variabilidad (efecto),
suma de cuadrados,
grados de libertad,
cuadrado medio,
estadstico de prueba, valor-p = significancia observada
Tabla 2.4 Tabla de ANOVA para DCA
SC

GL

CM

Valorp

Tratamient
os

Er
ro
r

Anlisis del ejemplo 1 (comparacin de cuatro tipos de mtodos de ensamble).


La interrogante que se plante en el problema de la comparacin entre los cuatro tipos
de mtodos de ensamble fue: existen diferencias entre el tiempo promedio de los
diferentes mtodos de ensamble? La respuesta a esta pregunta es el resultado de
contrastar las hiptesis:

Clculos manuales
Detalles de los clculos para el ANOVA en DCA para el tiempo de ensamble
Mtodos de ensamble
Observaciones

A B
D6
7 11
10
8 9 16 12
7 10 11 11
C

Total por
Tratamiento (
29 34 51
42
Numero de datos
En cada tratamiento ( 4 4 4
4
Media muestral por
Tratamiento (
7.25 8.50
12.75

10.50
Desviaciones respecto
-1.25 3.0 0.75

A la media global (

-2.50

Operaciones bsicas
=
Suma de los cuadrados de todas las
observaciones o datos
=
suma de los datos

mediciones

global

total de

media

1.- Suma total de cuadrados o variabilidad total de los datos:


= 1620 2.- Suma de cuadrados de tratamientos o variabilidad debida a la diferencia entre
mtodos de ensamble:

3.- Suma de cuadrados del error o variabilidad dentro de mtodos de ensamble:

4.- Cuadrados medios de tratamientos y del error (efecto ponderado de cada fuente de
variacin):

5.- Estadstico de prueba:

Con toda esta informacin se procede a llenar la tabla ANOVA. El valor de la


significancia observada o valor-p es el rea bajo la curva de la distribucin a la
derecha de
, lo cual es difcil de calcular de forma manual. Sin embargo,
cuando esto no sea posible, recordemos que otra forma de rechazar o no una hiptesis es
comparar el estadstico de prueba contra un nmero crtico de tablas. En el caso de las
tablas de la distribucin , en donde se lee que el valor crtico para
es
. Como:

entonces se rechaza , con lo cual se concluye que s hay diferencias o efecto de los
mtodos de ensamble en cuanto a su tiempo promedio
Tabla ANOVA
S
Fuente de
C
variacione
s
Tratamient
69
os
,5
Error
29
,5
Total
99
,0

G
L

C
M

3
1
12
5

23,
17
2,
46

9,4
2

Val
or
crti
co
3,49

Resultados arrojados en un paquete computacional (Excel y Minitab), para el


ejemplo 1 de los tiempos de ensamble para los cuatro mtodos.

6
0

CAPTULO
2

Diseo de experimentos de
un factor

ANOVA unidireccional: A; B; C; D Minitab


Fuent
e
Facto
r
Error
Total

G
L
3
1
2
1
5
S = 1,568

Niv
el
A
B
C
D

N
4
4
4
4

SC
MC
69,5
23,17
0
29,5
2,46
0
99,0
0
R-cuad. = 70,20%

Media
7,250
8,500
12,75
0
10,50
0

Desv.Est
.
0,957
1,291
2,363
1,291

P
0,00
2
R-cuad.(ajustado) = 62,75%

ICs de 95% individuales para la media


basados en Desv.Est. agrupada
--------+---------+---------+--------+(------*------)
(------*------)
(------*------)
(------*------)
--------+---------+---------+--------7,5
10,0
12,5
15,0

Desv.Est. agrupada = 1,568

Diagrama de cajas simultneos

Los diagramas de cajas es una herramienta para describir el comportamiento e unos


datos, y es de suma utilidad para comparar procesos, tratamientos y, en general, para
hacer anlisis por estratos (lotes, proveedores, turnos). En el resultado arrojado por
Minitab se observa en la figura (figura 2.1) que el mtodo C parece diferente al los
mtodos A y B en cuanto a sus medias; la media del mtodo D tambin se ve diferente
a la media del mtodo A. Por otra parte, se observa un poco ms de variabilidad en el
mtodo C que en todos los dems. Lo que sigue es verificar que lo que se observa en el
diagrama de cajas implica diferencias significativas entre los distintos tratamientos; por
lo tanto, es necesario hacer pruebas estadsticas porque los datos que se analizan en los

6
CAPTULO Diseo de experimentos de
0
2 de cajas son
unmuestras.
factor
diagramas

En general, cuando los diagramas no se traslapan es probable que los


tratamientos correspondientes sean diferentes entre s, y la probabilidad es mayor en la
medida que los diagramas estn basados en ms datos. Cuando se traslapan un poco
puede ser que haya o no diferencias significativas, y en cualquier caso es conveniente
utilizar una prueba estadstica para determinar cules diferencias son significativas.
Estas pruebas se vern en la siguiente seccin.
Grfica de caja de A; B; C; D
17,5

15,0

12,5

Datos

10,0

7,5

5,0
A

Figura 2.1 Diagrama de cajas para los mtodos de ensamble

Anlisis del ejemplo 2 (comparacin de cuatro tipos de cuero). La interrogante que se


plante en el problema de la comparacin entre los cuatro tipos de cuero fue: existen
diferencias entre el desgaste promedio de los diferentes tipos de cuero? La respuesta a
esta pregunta es el resultado de contrastar las hiptesis:

En el resultado arrojado por Excel, se muestra el anlisis de varianza para este


ejemplo. Como el valor-p = 0,0000 es menor que la significancia prefijada
, se
rechaza y se acepta que al menos un par de tipos de cuero tiene un desgaste
promedio diferente
Anlisis de varianza de un
factor en Excel
RESUMEN
Grupos
A
B
C
D

Cuenta
6
6
6
6

Suma
1540
1263
1385
1327

Promedio
256,6666667
210,5
230,8333333
221,1666667

Varianza
68,6666667
52,7
266,966667
22,9666667

ANLISIS DE
VARIANZA
Origen de las
Entre grupos
Dentro de los
grupos
Total

Suma de
7019,458333
2056,
5
9075,958333

Grados de
3
2
0
2
3

Promedio de los
2339,81944
4 102,825

Probabilidad
22,7553556
1,17615E-06

Valor crtico
3,098391
224

ANOVA unidireccional: A; B; C; D Minitab


Fuent
e
Facto
r
Error
Total

G
L
3
2
0
2
3
S = 10,14

Nivel
A
6
B
6
C
6
D

SC
MC
F
70
2340
19
20
103
57
90
76
R-cuad. = 77,34%

P
0,0
00
R-cuad.(ajustado) = 73,94%

ICs de 95% individuales para la media


basados en Desv.Est. agrupada
Media
Desv.Est. ----+---------+---------+---------+----(----*-----)
256,
8,29
67
210,
7,26
(----50
*----)
230,
16,3
(---221,17
4,79
(----*-----)
----+---------+---------+---------+----208
224
240
256

Desv.Est. agrupada = 10,14

Você também pode gostar