Você está na página 1de 95

EXPERIMENTOS CON

UN SOLO FACTOR:
EL ANLISIS DE
VARIANZA
CAPITULO 3
Diseo y Anlisis de Experimentos
Montgomery
NDICE
Experimentos con un solo factor: anlisis de
variancia.
Estimacin de los parmetros del modelo.
Comparacin de Medias de Tratamientos
Individuales
Comparacin de Parejas de Medias de
Tratamientos
Efecto de Modelos Aleatorios
UN EJEMPLO
Ejemplo 3.1 Pag. 70 - Peso porcentual del algodn
Un ingeniero de desarrollo de producto tiene inters en investigar la resistencia
a la tensin de la fibra sinttica nueva que se usar para hacer tela de camisas
para caballero. El ingeniero sabe por experiencia previa que la resistencia a la
tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de
algodn se incrementar la resistencia. Sabe asimismo que el contenido de
algodn deber variar entre 10 y 40 por ciento para que el producto final tenga
otras caractersticas de calidad que se desean (como la capacidad de ser
sometido a un tratamiento de planchado permanente). El ingeniero decide
probar ejemplares en cinco niveles del peso porcentual del algodn: 15, 20, 25,
30 y 35 por ciento. Tambin decide probar cinco ejemplares en cada nivel del
contenido de algodn.
1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
Peso
porcentual
del algodn
Observaciones
39
Peso porcentual del algodn (continuacin)
15 1 2 3 4 5
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Peso
porcentual
del algodn
Nmero de corrida experimental
Peso porcentual del algodn (continuacin)
1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
18 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15
Porcentaje de algodn Secuencia de prueba Nmero de corrida
Resultados del Experimento
1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
Peso porcentual del
algodn
Observaciones
Peso porcentual del algodn (continuacin)
Figura 3-1
Peso porcentual del algodn (continuacin)
Observaciones Individuales
Promedio de la resistencia a la Tensin
Figura 3-2
EL ANALISIS DE VARIANZA
MODELO PARA LOS DATOS
Es til describir las observaciones mediante el modelo
estadstico lineal
y
ij
=
i
+ c
ij
, donde i = 1, 2, ... , a; j = 1, 2, ... n (3.1)
y
ij
es la observacin ij-sima.

i
es la media del nivel del factor o tratamiento i-simo.
c
ij
es un componente del error aleatorio que incorpora todas las
dems fuentes de variabilidad del experimento
A la ecuacin (3.1) se le llama modelo de medias. Una forma
alternativa de describir un modelo de los datos es definiendo

i
= + t
i
, i = 1, 2, , a
De tal modo que la ecuacin (3.1) se convierte en
y
ij
= + t
i
+ c
ij
, donde i = 1, 2, ... , a; j = 1, 2, ... n (3.2)

es la media global
t
i
es el efecto del tratamiento i-simo
A la ecuacin (3.2) se le llama el modelo de los efectos.

ANALIS DEL MODELO CON
EFECTOS FIJOS
Anlisis del Modelo con Efectos Fijos
Donde N = an es el nmero total de observaciones.
El subndice punto implica la operacin suma sobre el
subndice que reemplaza.

a = Nmero de niveles o nmero de tratamientos.
n = Nmero de observaciones por nivel o tratamiento.
0
1
=

=
n
i
i
t
. ,..., 2 , 1 _ _ , / , , , , ,
. .
_
1
.
a i donde n y y y y
i i
n
j
ij i
= = =

=
N y y y y
a
i
n
j
ij
/ .. .. , , , , ..
1 1
= =

= =
(3.3)
Anlisis del Modelo con Efectos Fijos (continuacin)
El inters se encuentra en probar la igualdad de las
a medias de los tratamientos; es decir,
E(y
ij
) = + t
i
=
i
, i = 1, 2, , a. Las hiptesis son:

H
o
:
1
=
2
= ... =
a

H
1
:
i
=
j
para al menos un par (i, j)
En el modelo de los efectos, la media
i
del tratamiento i-simo
se descompone en dos componentes tales que
i
= + t
i
. Por
lo general, se considera como una media global, de tal modo
que
Esta definicin implica que

Es decir, los efectos del tratamiento o factor pueden
considerarse como desviaciones de la media global. Una forma
de escribir las hiptesis anteriores es en trmino de los efectos
de los tratamientos t
i

H
o
: t
1
= t
2
= ... = t
a
= 0
H
1
: t
i
= 0 for at least one i

=
a
a
i
i
1 0
1
=

=
a
i
i
t
El procedimiento apropiado para
probar la igualdad de las medias,
es el anlisis de varianza
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL
El nombre anlisis de varianza se deriva de la particin de
variabilidad total en sus partes componentes. La suma de cuadrados
total corregida


se usa como una medida de la variabilidad global de los datos.
La suma de cuadrados total corregida SS
T
se puede escribir como




Sin embargo :
( )


= =
=
a
1 i
n
1 j
2
T
y
y
..
ij
SS
( ) ( )
2
a
1 i
n
1 j
a
1 i
n
1 j
2
) y y ( ) y y ( y y
. i ij .. . i .. ij

+


= = = =
=
( )
( )
( )
( )
( )


= = = = = = =
+ + =
a
1 i
n
1 j
a
1 i
n
1 j
2
2
a
1 i
a
1 i
n
1 j
2
y y
y y
y y
y y y y
. i ij
.. . i
2
. i ij
.. . i
n
.. ij
( )
( )
0
/
. . . .
1
.
= = =

=
n y n
y y n y y y
i i i i
n
j
i ij
SS SS SS
E os Tratamient T
+ =

( )
( )
( )


= = = = =
+ =
a
1 i
n
1 j
2
2
a
1 i
a
1 i
n
1 j
2
y y
y y y y
. i ij
.. . i
n
.. ij
(3.4)
(3.5)
(3.6)
16
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
Es til examinar los dos trminos del lado derecho de la identidad
fundamental del ANOVA.



En esta forma es fcil ver que el trmino entre corchetes, si se divide
por n-1, es la varianza muestral del tratamiento i-simo, o



Si se combinan las a varianzas muestrales se obtiene una sola
estimacin de la varianza poblacional

( ) ( )
| |


=


=
= = = =
a
i
n
j
a
i
n
j
E
y y y y
SS
i ij i ij
1 1
2
2
1 1
. .
( ) ( ) ( )
( )
| |
( )
( ) a N
SS
n
y y
n n n
S
n
S
n
S
n
E
a
i
a
i
n
j a
i ij




=
+ + +
+ + +
=
= =
1
1 1
2
2 2
2
2
1
1
) 1 ( ... ) 1 ( ) 1 (
1 ... 1 1
.
( )
a i para
n
y y
S
n
j
i
i ij
,..., 2 , 1 , , , :, , , , , ,
1
1
2
2
.
=


=
=
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La relacin es una estimacin combinada
de la varianza comn dentro de cada uno de los a
tratamientos.
De manera similar, si no hubiera diferencia entre
las medias de los tratamientos, podra usarse la
variacin de los promedios de los tratamientos y el
gran promedio para estimar o
2
. Especficamente



Es una estimacin de o
2
si las medias de los
tratamientos son iguales.
( ) a N
SSE

( )
1
.. .
1
1
2



=
a
i
n
a
a
i os Tratamient
y y
SS
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La identidad del anlisis de varianza (ecuacin 3.6) proporciona dos
estimaciones de o
2
:
Una basada en la variabilidad inherente dentro los tratamientos.
Una basada en la variabilidad entre los tratamientos.
Si no hay diferencias en las medias de los tratamientos, estas dos
estimaciones debern ser muy similares, y si no lo son, se sospecha
que la diferencia observada puede ser causada por diferencias en las
medias de los tratamientos.
A las cantidades (entre los tratamientos)

y (dentro de los tratamientos)

se les llama cuadrados medios.
1
=
a
SS
MS
os Tratamient
os Tratamient
a N
SS
MS
E
E

=
TEOREMA DE COCHRAN
Si Z
i
igual a NID(0, 1) para i = 1, 2,, v y


Donde s < v, y Q
i
tiene v
i
grados de libertad (i = 1, 2,, s).
Entonces Q
1
, Q
2
,.., Q
s
son variables aleatorias ji-cuadrada
independientes con v
1
, v
2
,, v
s
grados de libertad, respectivamente, si y
solo si

Puesto que los grados de libertad de SS
Tratamientos
y SS
E
suman N 1,
el nmero total de grados de libertad, el teorema de Cochran implica que
SS
Tratamientos
/o
2
y SS
E
/ o
2
son variables aleatorias ji-cuadrada con una
distribucin independiente. Por lo tanto, si la hiptesis nula de que no
hay diferencias en las medias de los tratamientos es verdadera, el
coeficiente

se distribuye como F con a -1 y N a grados de libertad. F
0
es el
estadstico de prueba para la hiptesis. H
0
se rechaza si:
Q Q Q
Z
S
v
i
i
+ + + =

=
...
2 1
1
2
v v v v s
+ + + = ...
2 1
( )
( )
MS
MS
a N
SS
a
SS
F
E
os Tratamient
E
os Tratamient
=


=
/
1 /
0
F F a N a
>
, 1 , 0 o
TEOREMA DE COCHRAN (continuacin)
Es posible obtener frmulas para calcular estas sumas de
cuadrados reescribiendo y simplificando las definiciones de
SS
Tratamientos
y SS
T
, as:







La suma de cuadrados del error se obtiene por substraccin como:



El procedimiento de prueba se resume en las siguiente tablas:


N
y
y
n
SS
N
y
y
SS
a
i
i
os Tratamient
a
i
n
j
ij
T
2
..
1
2
.
2
..
1 1
2
1

=
=
= =
SS SS SS os Tratamient T E
=
Anlisis de Variancia
Anlisis de Variancia (continuacin)
Fuente de
Variacion
Suma Cuadrados (SS)
Grados de
libertad (Dof)
Cuadrado Medio
(MS)
Fo
Entre los
tratamiento
Error (Dentro de
los tratamientos)
Total
(Tabla Analisis de Varianza para un Factor)

= =
=
a
i
n
j
ij T
N
y
y SS
1 1
2
2
..
. Trat T E
SS SS SS =
1 a
a N
1 N
Trat
Trat
Trat
Dof
SS
MS =
.
E
E
E
Dof
SS
MS =
E
T
MS
MS
F =
0

=
=
a
i
i
Trat
N
y
n
SS
y
1
2
..
2
.
.
1
Peso porcentual del algodn Anlisis de Variancia
1 2 3 4 5
7 7 15 11 9 49 9.8
12 17 12 18 18 77 15.4
14 18 18 19 19 88 17.6
19 25 22 19 23 108 21.6
7 10 11 15 11 54 10.8
y.. 376 15.04
Promedios
Datos de la resistencia a la tensin ( lb / pulg.
2
)
Observaciones
Totales
y
i.
Peso porcentual del algodn Anlisis de
Variancia (continuacin)
Fuente de
Variacion
Suma
Cuadrados
(SS)
Grados
de
libertad
(Dof)
Cuadrado
Medio
(MS)
Fo P value
Entre los
tratamiento
475.76 4 118.94 14.76 2.87 0.00000913
Error (Dentro
de los
tratamientos)
161.2 20 8.06
Total 636.96 24
Puesto que F
0
= 14.76 > 2.87, se rechaza H
0
y se concluye
que la media de los tratamientos difieren; es decir, el peso
porcentual del algodn en la fibra afecta de manera
significativa la resistencia a la tensin media. Puesto que P
value = 0.00000913 < 0.05, resfuerza la conclusin dada.
ANOVA - Peso porcentual del algodn
(Tabla Analisis de Varianza para un Factor)
Ejercicio en clases
La fuerza de la tensin de la adhesin del mortero de cemento
portland es una caracterstica importante del producto. Un ingeniero
est interesado en comparar la fuerza de una formulacin
modificada en la que se han agregado emulsiones de ltex de
polmeros durante el mezclado, con la fuerza del mortero sin
modificar. El experimentador ha reunido 10 observaciones de la
fuerza de la formulacin modificada y otras 10 observaciones de la
formulacin sin modificar. Los datos se muestran a continuacin.
Podra hacerse referencia a las dos formulaciones diferentes como
dos tratamientos o como dos niveles del factor formulaciones.
1 16.85 17.50
2 16.40 17.63
3 17.21 18.25
4 16.35 18.00
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.90
9 16.59 17.96
10 16.57 18.15
j
Mortero
modificado
Mortero sin
modificar
Experimentos
Comparativos Simples
ESTIMACIN DE LOS PARMETROS DEL MODELO
y
..
=
.

Es necesarios desarrollar estimadores para los parmetros


del modelo de clasificacin, partiendo de:
ij i ij
y c t + + =
t
i
es el efecto del tratamiento i-simo
Luego de desarrollar el mtodo de mnimos cuadrados,
derivar y simplificar obtenemos un sistema de ecuaciones
lineales, cuya solucin es la siguiente:
a i
i
y y
i
,..., 2 , 1 , , , , , , ,
.. .
= =
.
t
ESTIMACIN DE LOS PARMETROS DEL MODELO (continuacin)
n
t
n
t
MS
y
MS
y
E
a N
i i
E
a N
i

+ s s
, 2 /
.
, 2 /
.
o o

Ahora, es posible determinar un intervalo de confianza
para estimar la media del i-simo tratamiento, dicha media
es:
Un intervalo de confianza para (1o)100% para el i-simo
tratamiento podra ser:
i i
t + =
De la misma manera para una diferencia de medias, digamos

i

j
, sera:
n
t
n
t
MS
y y
MS
y y
E
a N
j i j i
E
a N
j i
2 2
, 2 /
. .
, 2 /
. .

+ s s
o o

Ejemplo 3.3 Pag. 75: Siguiendo el ejemplo 3-1 pueden
encontrarse las estimaciones de la media global y de los
efectos de los tratamientos como:
04 . 15 25 / 376 = =
.

Y utilizando la ecuacin:
Calculamos los efectos de 1 a 5.
1 2 3 4 5
7 7 15 11 9 49 9.8
12 17 12 18 18 77 15.4
14 18 18 19 19 88 17.6
19 25 22 19 23 108 21.6
7 10 11 15 11 54 10.8
376 15.04
Promedios
Datos de la resistencia a la tensin ( lb / pulg.
2
)
Observaciones
Totales
a i
y y
i i
,..., 2 , 1 , , , , , , ,
.. .
= =
.
t
24 . 5 04 . 15 80 . 9
.. . 1 1
= = =
.
y y t
56 . 6 04 . 15 60 . 21
.. . 4 4
+ = = =
.
y y t
36 . 0 04 . 15 40 . 15
.. . 2 2
+ = = =
.
y y t
56 . 2 04 . 15 60 . 17
.. . 3 3
+ = = =
.
y y t
24 . 4 04 . 15 80 . 10
.. . 5 5
= = =
.
y y t
Ejemplo 3.3 (continuacin)



Con un intervalo de confianza del 95% para la media del
tratamiento 4 (30% de algodn), obtenemos: 21.60 +- 2.651,
por lo que el intervalo quedara de la siguiente manera:

25 . 25 95 . 18
65 . 2 60 . 21 65 . 2 60 . 21
5
06 . 8
086 . 2 60 . 21
5
06 . 8
086 . 2 60 . 21
4
4
4
s s
+ s s
+ s s


n
t
n
t
MS
y
MS
y
E
a N
i i
E
a N
i

+ s s
, 2 /
.
, 2 /
.
o o

Por lo tanto, el intervalo de confianza de 95% es:
DATOS NO BALANCEADOS
En algunos experimentos de un solo factor, el nmero de
observaciones recolectadas en cada tratamiento pueden ser
diferentes, cuando esto ocurre, se dice que el diseo est
desequilibrado, es no balanceado.
Sigue siendo posible aplicar el anlisis de varianza
anteriormente establecido para datos no balanceados, pero
deben hacerse ligeras modificaciones en las frmulas de las
sumas de cuadrados.
Hay dos ventajas al elegir un diseo equilibrado:
Primera con muestras del mismo tamao, la estadstica
de la prueba es relativamente insensible a pequeas
desviaciones de la suposicin de la igualdad de las
varianzas en los tratamientos.
Segunda, el poder de la prueba se maximiza cuando las
muestras tienen el mismo tamao.
DATOS NO BALANCEADOS (continuacin)
Sea que se hagan n
i
observaciones bajo el tratamiento
i (i = 1, 2, , a) y que

Las frmulas para calcular manualmente SS
T
y
SS
Tratamientos
quedan como:







No se requieren ms cambios.

=
=
a
i i
n
N
1

=
=
a
i
i
i
os Tratamient
N
y
n
y
SS
1
2
..
2
.

= =
=
a
i
n
j
ij T
N
y
y SS
1 1
2
2
..
Ejercicio en clase (datos no balanceados)
Se estn investigando cuatro catalizadores que
pueden afectar la concentracin de un componente en
una mezcla lquida de tres componentes. Se obtienen
las siguientes concentraciones:






a) Tienen los cuatro catalizadores el mismo efecto
sobre la concentracin?
b) Analizar los residuales de este experimento.
c) Construir la estimacin de un intervalo de confianza de
99% para la respuesta media del catalizador 1.

1 2 3 4
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57.0 55.4 50.0
55.8 55.3 51.7
54.9
Catalizador
VERIFICACION DE LA
ADECUACION DEL
MODELO
EL SUPUESTO DE NORMALIDAD
La verificacin del supuesto de normalidad podra hacerse graficando
un histograma de los residuales.
Si se satisface el supuesto NID(0, o
2
) para los errores, esta grfica
deber parecerse como una muestra de una distribucin normal con
centro en cero. Pero con muestras pequeas suelen ocurrir
fluctuaciones significativas y pueden aparecer una desviacin
moderada de la normalidad.
Un procedimiento en extremo til es construir una grfica de
probabilidad normal de los residuales.
Los residuales se calculan as:

1 2 3 4 5
15 -2.8 -2.8 5.2 1.2 -0.8
20 -3.4 1.6 -3.4 2.6 2.6
25 -3.6 0.4 0.4 1.4 1.4
30 -2.6 3.4 0.4 -2.6 1.4
35 -3.8 -0.8 0.2 4.2 0.2
Residuales - Peso porcentual del algodn
Peso porcentual
del algodn
Residuales
y y sidual
i ij ij .
Re =
EL SUPUESTO DE NORMALIDAD (continuacin)

0
20
40
60
80
100
120
-6 -4 -2 0 2 4 6
%

d
e

P
r
o
b
a
b
i
l
i
d
a
d

N
o
r
m
a
l


























(
P
j

=

(
(

j

-

0
.
5
)
/
N
)
1
0
0
)

Residual (eij = yij - ybi.)
Grfica de Probabilidad Normal de los Residuales
1 -3.8 2
2 -3.6 6
3 -3.4 10
4 -3.4 14
5 -2.8 18
6 -2.8 22
7 -2.6 26
8 -2.6 30
9 -0.8 34
10 -0.8 38
11 0.2 42
12 0.2 46
13 0.4 50
14 0.4 54
15 0.4 58
16 1.2 62
17 1.4 66
18 1.4 70
19 1.4 74
20 1.6 78
21 2.6 82
22 2.6 86
23 3.4 90
24 4.2 94
25 5.2 98
Secuencia Residual
% Probabilidad
Normal
RESIDUALES ORDENADOS
p
j
= (( j 0.5) / N) * 100
EL SUPUESTO DE NORMALIDAD (continuacin)
Grfica de Probabilidad Normal de los Residuales
0
20
40
60
80
100
120
-6 -4 -2 0 2 4 6
Residual (eij = yij - ybi.)
%

d
e

P
r
o
b
a
b
i
l
i
d
a
d

N
o
r
m
a
l


























(
P
j

=

(
(

j

-

0
.
5
)
/
N
)
1
0
0
)
p
j
= (( j 0.5) / N) * 100
GRAFICA DE LOS RESIDUALES EN
SECUENCIA EN EL TIEMPO
1 -3.4
2 0.4
3 2.6
4 0.2
5 3.4
6 -0.8
7 1.4
8 -3.4
9 1.4
10 1.4
11 2.6
12 1.2
13 0.4
14 1.6
15 -2.8
16 4.2
17 -3.8
18 -3.6
19 -2.8
20 0.4
21 -0.8
22 -2.6
23 0.2
24 -2.6
25 5.2
RESIDUALES EN ORDEN
CRONOLOGICO
GRAFICA DE LOS RESIDUALES CONTRA EL TIEMPO
-6
-4
-2
0
2
4
6
0 5 10 15 20 25 30
TIEMPO
R
E
S
I
D
U
A
L
E
S
GRAFICA DE LOS RESIDUALES CONTRA
LOS VALORES AJUSTADOS
9.8 -2.8
9.8 -2.8
9.8 5.2
9.8 1.2
9.8 -0.8
15.4 -3.4
15.4 1.6
15.4 -3.4
15.4 2.6
15.4 2.6
17.6 -3.6
17.6 0.4
17.6 0.4
17.6 1.4
17.6 1.4
21.6 -2.6
21.6 3.4
21.6 0.4
21.6 -2.6
21.6 1.4
10.8 -3.8
10.8 -0.8
10.8 0.2
10.8 4.2
10.8 0.2
e
ij
yi
GRAFICA DE LOS RESIDUALES CONTRA LOS VALORES
AJUSTADOS
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
0 5 10 15 20 25
yij barra
R
e
s
i
d
u
a
l
e

e
i
j
GRAFICA DE LOS RESIDUALES
VS. LOS NIVELES
NIVEL RESIDUAL
15 -2.8
15 -2.8
15 5.2
15 1.2
15 -0.8
20 -3.4
20 1.6
20 -3.4
20 2.6
20 2.6
25 -3.6
25 0.4
25 0.4
25 1.4
25 1.4
30 -2.6
30 3.4
30 0.4
30 -2.6
30 1.4
35 -3.8
35 -0.8
35 0.2
35 4.2
35 0.2
GRAFICA DE LOS RESIDUALES
-6
-4
-2
0
2
4
6
0 5 10 15 20 25 30 35 40
NIVELES
R
E
S
I
D
U
A
L
E
S
GRAFICA DE LOS RESIDUALES
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
0 5 10 15 20 25 30 35 40
NIVELES
R
E
S
I
D
U
A
L
E
S
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA
Aun cuando es frecuente el uso de las grficas residuales para
diagnosticar la desigualdad de varianzas, se han propuesto tambin
varias pruebas estadsticas.
Estas pruebas pueden considerarse como pruebas formales de las
hiptesis H
0
: o
2
1
= o
2
2
= ... = o
2
a

H
1
: o
2
i
= o
2
j
Para al menos un par (i, j)
Un procedimiento muy til es la prueba de Barlett.
La igualdad de varianza se conoce como homocedasticidad.

donde

c
q
3026 . 2
2
0
=
_
( )
( ) ( )
( )
a N
i
a
c
a N q
a
i
i i
p
a
i
i
a
i
i p
S n
S
a N
n
S n S

=
|
.
|

\
|

+ =
=

=
=

=
1
2
2
1
1 1
2
1
10
2
10
1
1 3
1
1
) 1 ( ) (
1
log log
S
i
2
es la varianza
muestral de la
poblacin i-sima
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA (continuacin)
La cantidad q es grande cuando la diferencia entre las
varianzas muestrales S
i
2
es considerablemente grande, y es
igual a cero cuando todas las S
i
2
son iguales.
H
0
deber rechazarse para los valores de _
0
2
que sean muy
grandes; es decir, se rechaza H
0
slo cuando
_
2
0

> _
2
o,a-1

Donde _
2
o,a-1
es el punto porcentual o superior a la
distribucin ji-cuadrada con a - 1 grados de libertad.
La prueba de Barlett es muy sensible al supuesto de
normalidad. Por consiguiente, cuando la validez de este
supuesto est en duda, no deber usarse la prueba de
Barlett.
Ejemplo 3.4 Pag. 82
Ya que el supuesto de normalidad no est entre dicho en
este ejemplo, se puede usar la prueba de Barlett.
Se calculan primero las varianzas muestrales de cada
tratamiento y se encuentra que: S
2
1
=11.2, S
2
2
=9.8, S
2
3
=4.3,
S
2
4
=6.8, S
2
5
=8.2. Entonces





Y el estadstico de prueba es
Puesto que _
2
0.05, 4
= 9.49
,
no puede rechazarse la hiptesis
nula y se concluye que las cinco varianzas son iguales.
| |
10 . 1
20
1
4
5
) 4 ( 3
1
1 c
45 . 0 2 . 8 8 . 6 3 . 4 8 . 9 2 . 11 4 ) 06 . 8 ( 20 q
06 . 8
5 25
) 2 . 8 ( 4 ) 8 . 6 ( 4 ) 3 . 4 ( 4 ) 8 . 9 ( 4 ) 2 . 11 ( 4
log log log log log log
S
10 10 10 10 10 10
2
p
=
|
.
|

\
|
+ =
= + + + + =
=

+ + + +
=
93 . 0
10 . 1
45 . 0
3026 . 2
2
0
= =
_
3
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA (continuacin)
La prueba de Levene modificada es un procedimiento muy til
ya que es robusto en cuanto a las desviaciones de normalidad.
Para probar la hiptesis de que las varianzas son iguales en
todos los tratamientos, la prueba de Levene modificada utiliza
las desviaciones absoluta d
ij
de las observaciones y
ij
de cada
tratamiento de la mediana de los tratamientos, por ejemplo .
Sea que estas desviaciones se denoten por
para i = 1, 2, , a; j = 1, 2, , n
i
La prueba de Leveve modificada evala entonces si la media
de estas desviaciones es igual o no para todos los tratamientos.
Cuando las desviaciones medias son iguales, la varianza de las
observaciones de todos los tratamientos sern iguales.
El estadstico de prueba para la prueba de Levene es
simplemente el estadstico FANOVA usual para probar la
igualdad de las medias que se aplica a las desviaciones
absolutas.

y
i
y
i
d
ij
= I y
ij
- I
Ejemplo 3.5 Pag. 83
Un ingeniero civil est interesado en determinar si cuatro
mtodos diferentes para estimar la frecuencia de las
inundaciones producen estimaciones equivalentes de la
descarga pico cuando se aplican a la misma cuenca.
Cada procedimiento se usa seis veces en la cuenca, y los
datos de las descargas resultantes son:






1 0.34 0.12 1.23 0.70 1.75 0.12
2 0.91 2.94 2.14 2.36 2.86 4.55
3 6.31 8.37 9.75 6.09 9.82 7.24
4 17.15 11.82 10.95 17.20 14.35 16.82
Mtodo de
Estimacin
Observaciones
Ejemplo 3.5 Pag. 83 (continuacin)




El anlisis de varianza implica que hay una
diferencia en las estimaciones de las descargas
pico promedio obtenidas en los cuatro
procedimientos como se muestra a continuacin.

1 0.34 0.12 1.23 0.70 1.75 0.12 0.71 0.52 0.66
2 0.91 2.94 2.14 2.36 2.86 4.55 2.63 2.61 1.19
3 6.31 8.37 9.75 6.09 9.82 7.24 7.93 7.81 1.65
4 17.15 11.82 10.95 17.20 14.35 16.82 14.72 15.59 2.80
S
i
Mtodo de
Estimacin
Observaciones
yi yi
Source Sum of Squares Df Mean Square F-Ratio F
0.05,3,20
P-Value
Between groups 708.3470 3 236.1160 76.0700 3.0984 0.0000
Within groups 62.0811 20 3.1041
Total (Corr.) 770.4280 23
ANOVA Table for Col_2 by Col_1
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica de los residuales contra los valores ajustados es preocupante
porque la forma de embudo con la boca hacia afuera indica que no se
satisface el supuesto de una varianza constante.
0.71 -0.370
0.71 -0.590
0.71 0.520
0.71 -0.010
0.71 1.040
0.71 -0.590
2.63 -1.717
2.63 0.313
2.63 -0.487
2.63 -0.267
2.63 0.233
2.63 1.923
7.93 -1.620
7.93 0.440
7.93 1.820
7.93 -1.840
7.93 1.890
7.93 -0.690
14.72 2.435
14.72 -2.895
14.72 -3.765
14.72 2.485
14.72 -0.365
14.72 2.105
e
ij
yi
Grafica de los residuales contra yij
-5
-4
-3
-2
-1
0
1
2
3
0 2 4 6 8 10 12 14 16
yij
R
e
s
i
d
u
a
l
e
s

e
i
j
Ejemplo 3.5 Pag. 83 (continuacin)
Las desviaciones d
ij
alrededor de las medianas de los
tratamientos se muestran a continuacin:








La prueba de Levene consiste en realizar un anlisis de
varianza estndar en las d
ij
.
El estadstico de prueba F que resulta en este caso es
F
0
= 4.57, para el cual el valor P es P = 0.0136. Por lo tanto,
la prueba de Levene rechaza la hiptesis nula de que las
varianzas son iguales, coincidiendo en esencia con el
diagnstico que se hizo a partir del examen visual de la
grfica de los residuales contra los valores ajustados.
1 0.180 0.400 0.710 0.180 1.230 0.400
2 1.700 0.330 0.470 0.250 0.250 1.940
3 1.495 0.565 1.945 1.715 2.015 0.565
4 1.565 3.765 4.635 1.615 1.235 1.235
Mtodo de
Estimacin
Desviaciones d
ij
para la prueba de Levene
modificada
y
i
d
ij
= I y
ij
- I
Ejemplo 3.5 Pag. 83 (continuacin)
La tabla ANOVA para los datos ajustados, con
la cual se lleg a la anterior conclusin, se
muestra a continuacin




Los datos de la descarga pico son un buen
candidato para una trasformacin de datos.

Source Sum of Squares Df Mean Square F-Ratio F
0.05,3,20
P-Value
Between groups 11.5697 3 3.8566 4.5700 3.0984 0.0136
Within groups 16.8835 20 0.8442
Total (Corr.) 28.4532 23
ANOVA Table for Col_2 by Col_1
Ejemplo 3.5 Pag. 83 (continuacin)
Seleccin emprica de una trasformacin:
Si los experimentadores conocieran la relacin entre la
varianza de las observaciones y la media, podran usar
esta informacin como gua para la seleccin de la forma
de la transformacin. Se desarrolla ahora este punto:
Sea E(y) = la media de y, y suponga que la desviacin
estndar de y es proporcional a una potencia de la media
de y tal que: o
y

o
Quiere encontrarse una transformacin de y que produzca
una varianza constante. Suponga que la transformacin es
una potencia de los datos originales, por ejemplo y* = y

Puede demostrarse entonces que: o
y*

+o1

Evidentemente, si se hace = 1 o, la varianza de los datos
transformados y* es constante.
Ejemplo 3.5 Pag. 83 (continuacin)
En la siguiente tabla se resumen varias de las transformaciones
comunes y se enlistan en el orden de fuerza creciente. Por fuerza
de una transformacin se entiende la cantidad de curvatura que
induce.
Una transformacin suave aplicada a datos que se extienden en un
rango estrecho tiene escaso efecto sobre el anlisis, mientras que
una transformacin fuerte aplicada a un rango amplio puede tener
resultados dramticos.
Con frecuencia las transformaciones tienen escaso efecto a menos
que el cociente y
mx
/y
mn
sea mayor que 2 3.
o
y
constante 0 1 Sin transformacin
o
y

1/2
1/2 1/2 Raz cuadrada Datos (nmeros) de Poisson
o
y
1 0 Log
o
y

3/2
3/2 -1/2 Raz cuadrada recproca
o
y

2
2 -1 Recproco
Transformaciones para estabilizar la varianza
Relacin entre
o
y
y
o = 1 o Transformacin Comentario
Ejemplo 3.5 Pag. 83 (continuacin)
Al graficar log S
i
contra log , se observa que la pendiente
de la recta que pasa por los cuatro puntos est cerca de ,
por la tabla de transformaciones para estabilizar la
varianza, se considera que la transformacin de la raz
cuadrada puede ser apropiada.

-0.15 -0.18
0.42 0.08
0.90 0.22
1.17 0.45
log S
i
Grafica de log Si contra log yi barra
-0.30
-0.20
-0.10
0.00
0.10
0.20
0.30
0.40
0.50
-0.40 -0.20 0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40
log yi barra
l
o
g

S
i
y
i.
log y
i.
Ejemplo 3.5 Pag. 83 (continuacin)
La tabla de los datos transformados, se muestra a
continuacin:




El anlisis de varianza es entonces:

1 0.58 0.35 1.11 0.84 1.32 0.35
2 0.95 1.71 1.46 1.54 1.69 2.13
3 2.51 2.89 3.12 2.47 3.13 2.69
4 4.14 3.44 3.31 4.15 3.79 4.10
Mtodo de
Estimacin
Observaciones Transformadas
ANLISIS DE VARIANZA
Entre grupos 32.6842 3 10.8947 76.9965 3.1274 0.0000000001
Dentro de los grupos 2.6884 19 0.1415
Total 35.3726 22
F
0
Valor crtico
para F
P value
Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica residual muestra una mejora sensible
en comparacin con la anterior.
Val Ajust Residuales
0.71 -0.18
0.71 -0.41
0.71 0.35
0.71 0.08
0.71 0.56
0.71 -0.41
1.61 -0.63
1.61 0.13
1.61 -0.12
1.61 -0.04
1.61 0.11
1.61 0.55
2.79 -0.29
2.79 0.09
2.79 0.32
2.79 -0.33
2.79 0.33
2.79 -0.11
3.94 0.32
3.94 -0.38
3.94 -0.51
3.94 0.33
3.94 -0.03
3.94 0.28
Grfica de los Residuales contra el valor Ajustado de los yij
-0.80
-0.60
-0.40
-0.20
0.00
0.20
0.40
0.60
0.80
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50
Valor ajustado de yij
R
e
s
i
d
u
a
l
e
s
INTERPRETACION
PRCTICA DE LOS
RESULTADOS
INTERPRETACION PRCTICA
DE LOS RESULTADOS
Un Modelo de Regresin
.
Un Modelo de Regresin (continuacin)
1 2 3 4 5
15 7 7 15 11 9 9,8
20 12 17 12 18 18 15,4
25 14 18 18 19 19 17,6
30 19 25 22 19 23 21,6
35 7 10 11 15 11 10,8
Peso
porcentual
del algodn
Observaciones
Promedio
i
y = -0,0886x
2
+ 4,5926x -
39,989
R
2
= 0,7921
0
5
10
15
20
25
30
0 20 40
Serie1
Serie2
Serie3
Serie4
Serie5
Serie6
Polinmica
(Serie6)
y = -0,0076x
3
+ 0,4814x
2
-
9,0114x + 62,611
R
2
= 0,9286
0
5
10
15
20
25
30
0 20 40
Serie1
Serie2
Serie3
Serie4
Serie5
Serie6
Polinmica
(Serie6)
Un Modelo de Regresin (continuacin)
y = -0,0076x3 + 0,4814x2 - 9,0114x + 62,611
-0,0076 0,4814 -9,0114 62,611
25,00 -118,75 300,875 -225,29 19,4510000
26,00 -133,58 325,426 -234,3 20,1634000
27,00 -149,59 350,941 -243,31 20,6530000
27,50 -158,06 364,059 -247,81 20,8000000
27,90 -165,05 374,727 -251,42 20,8654576
28,00 -166,84 377,418 -252,32 20,8742000
28,10 -168,63 380,118 -253,22 20,8798024
28,20 -170,44 382,829 -254,12 20,8822192
28,25 -171,34 384,187 -254,57 20,8822188
28,30 -172,26 385,548 -255,02 20,8814048
28,50 -175,93 391,017 -256,82 20,8699000
29,00 -185,36 404,857 -261,33 20,7814000
30,00 -205,2 433,26 -270,34 20,3290000
31,00 -226,41 462,625 -279,35 19,4714000
32,00 -249,04 492,954 -288,36 18,1630000
Coeficientes Ecuacin Cbica
Ecuacin Cbica
Peso
Porcentual
Algodn X
Trmino
con
potencia
3
Trmino
con
potencia
2
Trmino
con
potencia
1
Valor de y
Comparacin Grfica de Medias
Es muy sencillo desarrollar un procedimiento grfico para la comparacin
de las medias despus de un ANOVA.
Suponga que el factor de inters tiene a niveles y que son
los promedios de los tratamientos. Si se conoce o, el promedio de
cualquier tratamiento tendr una desviacin estndar .
Entonces, si todas las medias de los niveles del factor son idnticas, las
medias muestrales observadas se comportaran como un conjunto de
observaciones tomadas al azar de una distribucin normal con media
y desviacin estndar .
Visualice una distribucin normal con la capacidad de ser deslizada sobre
un eje abajo del cual estn graficadas . Si todas las medias
de las tratamientos son iguales, deber haber una posicin de esta
distribucin que haga evidente que los valores se sacaron de la misma
distribucin.
Si no es este el caso, los valores que no parecen haberse sacado de
esta distribucin se asocian con los niveles del factor que producen
respuestas medias diferentes.
n / o
_ _ _
y y y
. a ... . 2 , . 1
_
.
y
i
_
..
y
n / o
_
.
y
i
_
y
. i
_ _ _
y y y
. a ... . 2 , . 1
Comparacin Grfica de Medias (continuacin)
Punto dbil: se desconoce o, en este caso o se sustituye con del
anlisis de varianza y usar una distribucin t con factor de escala
en lugar de la distribucin normal.
Ejemplo: Para trazar la distribucin t, simplemente se multiplica el valor de
la abscisa t por el factor de escala y se grafica
contra la ordenada de t en este punto.
En la figura se ve que no hay ninguna posicin de la distribucin tal que
los cinco promedios puedan considerarse como observaciones tpicas
seleccionadas al azar de la distribucin.
Esto implica que las cinco medias no son iguales; por lo tanto, la figura es
una representacin grfica de los resultados del anlisis de varianza.
La figura indica que el 30% de algodn produce resistencia a la tensin
mucho ms alta que 20 25 por ciento de algodn y que 15 35 por
ciento de algodn producirn resistencias aun ms bajas.
n MS
E
/
E
MS
27 . 1
5
06 . 8
= =
n
MS
E
5 10 15 20 25 Media (Res.Ten.)
15 35 20 25 30 Niveles (% Algodn)
Resistencia a la tensin promedio (lb/pulg
2
)
Contrastes
Muchos mtodos de comparacin mltiple utilizan el concepto de
contrastes.
Puesto que se rechaz la hiptesis nula en el caso de la resistencia del
algodn, se sabe que algunos pesos porcentuales del algodn
producen resistencia a la tensin diferente de otros, pero, cules son
los que causan en realidad esta diferencia?
Al principio podra sospecharse que los niveles 4 y 5 (30% y 35%)
producen la misma resistencia a la tensin, lo que implica que la
hiptesis a probar sera H
0
:
4
=
5

H
i
:
4
=
5
(3.23)

Si desde el principio del experimento se hubiera sospechado que el
promedio de los niveles ms bajos del peso porcentual del algodn
(1 y 2) no difera del promedio de los niveles ms altos del peso
porcentual del algodn (4 y 5), entonces la hiptesis habra sido
H
0
:
1
+
2
=
4
+
5
H
i
:
1
+
2
=
4
+
5
(3.24)

Contrastes (continuacin)
En general, un contraste es una combinacin lineal de parmetros de

la forma donde las constantes de los contrastes c
1
, c
2
,.., c
a


suman cero; es decir,

Las dos hiptesis anteriores pueden expresarse en trminos de
contrastes.

(3.25)




Las constantes de los contrastes para las hiptesis de la ecuacin 3.23
son c
1
= c
2
= c
3
= 0; c
4
= +1; c
5
= -1; mientras que para la ecuacin 3.24
son c
1
= c
2
= +1; c
3
= 0; c
4
= c
5
= -1.

=
=
a
i
i
c
1
0

i
a
i
i
c

=
= I
1
0 :
0 :
1
1
1
0
=
=

=
=

i
a
i
i
i
a
i
i
c H
c H
Contrastes (continuacin)
Las pruebas de hiptesis que incluyen contrastes pueden hacerse de
dos maneras bsicas. En el primer mtodo se utiliza la prueba t.
El contraste de inters se escribe en trminos de los totales de los
tratamientos, obtenindose


La varianza de C es (3.26) cuando los

tamaos de las muestras de cada tratamiento son iguales. Si la
hiptesis nula de la ecuacin 3.25 es verdadera, el cociente

tiene la distribucin N(0,1). Entonces se sustituira
la varianza desconocida o
2
con su estimacin, el
error cuadrtico medio MS
E
, y se utilizara el
estadstico

(3.27) para probar la hiptesis de la ecuacin
3.25. La H
0
se rechaza si It
0
I excede
t
a/2, N-a

y
c
i
a
i
i
C
.
1

=
=

=
=
a
i
i
c n
C V
1
2 2
) (
o

=
=
a
i
i
a
i
i
i
c n
y
c
1
2 2
1
.
o

=
=
=
a
i
i E
a
i
i
i
c MS n
y
c
t
1
2
1
.
0
Contrastes (continuacin)
En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de
una variable aleatoria t con v grados de libertad es una variable
aleatoria F con un grado de libertad en el numerador y v grados de
libertad en el denominador. Por lo tanto puede obtenerse



Este estadstico de prueba de la ecuacin 3.28 puede escribirse como



Donde la suma de cuadrados de los contrastes con un solo grado de
libertad es
( )

= =
=
=
a
i
i E
a
i
i
i
c MS n
y
c
t F
1
2
1
2
.
2
0 0
Como un estadstico F para probar la
ecuacin 3.25. La hiptesis nula se
rechazara si F
0
>F
a,1,N-a
(3.28)
MS
SS
MS
MS
F
E
C
E
C
1 /
0
= =
( )

=
=
=
a
i
i
a
i
i
i
C
c
n
y
c
SS
1
2
2
1
.
(3.29)
62
Intervalos de Confianza para un Contraste
En lugar de probar hiptesis acerca de un contraste, puede ser ms til
construir un intervalo de confianza. Entonces el contraste suele
expresarse en trmino de los promedios de los tratamientos
Suponga que el contraste de inters es:

Al sustituir las medias de los tratamientos con los promedios de los
tratamientos se obtiene



cuando los tamaos de las muestras son iguales. Si se usa MS
E
para
estimar o
2
, el intervalo de confianza de 100(1-a) por ciento para el
contraste es

(3.30)
Evidentemente, si este intervalo de confianza incluye al cero, no podra
rechazarse la hiptesis nula en la ecuacin 3.25.

i
a
i
i
c

=
= I
1
y
i.

=
=
=
=
a
i
i
i
a
i
i
c
n
y
c
C V
C
1
2
2
.
1
) (
o

i
a
i i
c

=1

=

= = =

=
+ s s
a
i
i
E
a N
i
a
i
i
i
a
i
i
a
i
i
E
a N
i
a
i
i c
n
MS
t
y
c c c
n
MS
t
y
c
1
2
,
2
.
1 1 1
2
,
2
.
1
o o
Contraste Estandarizado
Cuando hay inters en ms de un contraste, con frecuencia es
til evaluarlos en la misma escala. Una forma de hacer esto es
estandarizando el contraste para que su varianza sea o
2
.
Si el contraste se expresa en trminos de los
totales de los tratamientos como al dividirlo por
se obtendr un contraste estandarizado con
varianza o
2
. Entonces el contraste estandarizado es en
realidad

donde

i
a
i i
c

=1
y
c
i
a
i i
.
1

=
a
i i
c
n
1
2
y
c
i
a
i i
.
1
*

=
=
a
i
i
i
i
c
c
c
n
1
2
*
Tamao de las Muestras Desiguales
Cuando los tamaos de las muestras de cada tratamiento son
diferentes, se introducen modificaciones menores en los resultados
anteriores. Primero, observe que la definicin de un contraste
requiere ahora que

Otros cambios requeridos son directos. Por ejemplo, el estadstico t
de la ecuacin 3.27 queda como



Y la suma de cuadrados de los contrastes de la ecuacin 3.29
queda como
0
1
=

=
c n
i
a
i i

=
=
=
a
i
i
E
a
i
i
i
c
n MS
y
c
t
i
1
2
1
.
0
( )

=
=
=
a
i
i
a
i
i
i
C
c
n
y
c
SS
i
1
2
2
1
.
Contrastes Ortogonales ( caso especial )
Dos contrastes con coeficientes { c
i
} y { d
i
} son
ortogonales, si:

o, para un diseo no balanceado, si

Para a tratamientos, el conjunto de a-1 de contrastes
ortogonales hace la particin de la suma de cuadrados
debida a los tratamientos en a-1 componentes
independientes con un solo grado de libertad. Por lo tanto,
las pruebas que se realizan en los contrastes ortogonales
son independientes.

=
=
a
i
i i
d c
1
0

=
=
a
i
i i i
d c n
1
0
Contrastes Ortogonales ( caso especial )
Ejemplo: Si hay a = 3 tratamientos, donde el tratamiento 1 es el control y
donde los niveles del factor en los tratamientos 2 y 3 son de inters para
el experimentador, los contrastes ortogonales apropiados podran ser
los siguientes:






Contraste 1: c
i
= -2,1,1 ( compara el efecto promedio del factor con el
control ).
Contraste 2: d
i
= 0,-1,1 ( compara los dos niveles del factor de inters )
En general, el mtodo de contrastes (o de contrastes ortogonales) es til
para lo que se llama comparaciones preplaneadas.

Tratamientos
1 ( control )
2 ( nivel 1 )
3 ( nivel 2 )
Coeficientes para contrastes ortogonales
-2
1
1
0
-1
1
Ejemplo 3.6 Pag. 94
1 2 3 4 5
7 7 15 11 9 49 9.8
12 17 12 18 18 71 15.4
14 18 18 19 19 88 17.6
19 25 22 19 23 108 21.6
7 10 11 15 11 54 10.8
370 15.04
Promedios
Datos de la resistencia a la tensin ( lb / pulg.
2
)
Observaciones
Totales
Considere los datos del ejemplo 3.1
Suponga que antes de correr el experimento se especific la
siguiente serie de comparaciones entre las medias de los
tratamientos
5 medias de tratamientos y 4 grados de libertad.

Hiptesis Contraste
Ho:
4
=
5
C
1
= -y
4.
+ y
5.
Ho:
1
+
3
=
4
+
5
C
2
= y
1.
+ y
3.
- y
4.
- y
5.

Ho:
1
=
3
C
3
= y
1.
- y
3.

Ho: 4
2
=
1
+
3
+
4
+
5
C
4
= -y
1.
+ 4y
2.
- y
3.
- y
4.
- y
5.

Ejemplo 3.6 (continuacin)
Los coeficientes de los contrastes son ortogonales. Con los
datos de la tabla, se determina el valor numrico de los
contrastes y la suma de los cuadrados.



Remplazando:


C
1
= -54 SSc
1
= ( -54 )
2
/ (5 * ( 2 )) = 291.6

C
2
= -25 SSc
2
= ( -25 )
2
/ (5 * ( 4 )) = 31.25

C
3
= -39 SSc
3
= ( -39 )
2
/ (5 * ( 2 )) = 152.1

C
4
= 9 SSc
4
= ( 9 )
2
/ (5 * ( 20 )) = 0.81

( )

=
=
=
a
i
i
a
i
i
i
C
c
n
y
c
SS
1
2
2
1
.
Ejemplo 3.6 (continuacin)

Por los valores de P se concluye que hay diferencias
significativas entre los niveles 4 y 5 y 1 y 3 del peso porcentual
del algodn, pero que el promedio de los niveles 1 y 3 no
difiere del promedio de los niveles 4 y 5 con el nivel o = 0.05,
y que el nivel 2 no difiere del promedio de los otros 4 niveles.
Fuente de Variacion
Suma
Cuadrados
(SS)
Grados
de
libertad
(Dof)
Cuadra
do
Medio
(MS)
Fo F
0.05,4,20
P value
Peso porcentual del algodn 475.76 4 118.94 14.76 2.87 0.00000913
Contrastes ortogonales
C
1
= -y
4.
+ y
5.
291.6 1 291.6 36.18 4.35 0.00000701
C
2
= y
1.
+ y
3.
- y
4.
- y
5.
31.25 1 31.25 3.88 4.35 0.06295952
C
3
= y
1.
- y
3.
152.1 1 152.1 18.87 4.35 0.00031474
C
4
= -y
1.
+ 4y
2.
- y
3.
- y
4.
- y
5.
0.81 1 0.81 0.10 4.35 0.75452031
Error (Dentro de los tratamientos) 161.20 20 8.06
Total 636.96 24
ANOVA - Resistencia a la Tensin del Peso porcentual del algodn
Mtodo de Scheff para Comparar todos
los Contrastes
Scheff ha propuesto un mtodo para comparar todos y cada uno de los
contrastes posibles entre las medias de los tratamientos.
Supongamos que se ha determinado un conjunto de m contrastes de las medias
de tratamientos.
t
u
= c
1u

1
+ c
2u

2
+ .... + c
au

a
u = 1, 2, ..., m (3.31)
El contraste correspondiente usando los promedios de tratamiento es:
C
u
= c
1u
+ c
2u
+ .... + c
au
u = 1, 2, ..., m (3.32)

El error estndar de este contraste es: (3.33

n
i
es el nmero de observaciones en el tratamiento i-simo.
El valor crtico con el que debe ser comparado C
u
es:
(3.34)

Para probar la hiptesis nula de que el contraste t
u
difiere de manera significativa
de cero, se compara C
u
con el valor crtico. Si se rechaza la
hiptesis de que el contraste t
u
es igual a cero.

( )
i
iu
a
i
E
u
n Sc
c MS
/
2
1

=
=
a N a
C
u a
F a S
S
u

=
, 1 , ,
) 1 (
o
u
u
S
C
, o
>
y
i
.
y
2.
y
1.
y
a.
Mtodo de Scheff para Comparar todos
los Contrastes (continuacin)
Para ilustrar el procedimiento, considere los datos del ejemplo 3.1 y suponga
que los contrastes de inters son:
t
1
=
1
+
3

4

5
t
2
=
1

4
Los valores numricos de estos contrastes son:


C
1
= + - -
= 9.80 + 17.60 21.60 10.80 = 5.00
C
2
= -
= 9.80 - 21.60 = -11.80
Los errores estndar se calculan con 3.33:




Por la ecuacin 3.34, los valores crticos de 1% son

( )
( ) 80 . 1 5 / ) 1 1 ( 06 . 8 /
54 . 2 5 / ) 1 1 1 1 ( 06 . 8 /
2
2
5
1
2
2
1
5
1
1
= + = =
= + + + = =
=
=
i
i
i
E
i
i
i
E
n
c MS
Sc
n
c MS
Sc
y
1.
y
4.
y
3.
y
5.
y
1.
y
4.
58 . 7 ) 43 . 4 ( 4 80 . 1 ) 1 (
69 . 10 ) 43 . 4 ( 4 54 . 2 ) 1 (
, 1 , 01 . 0 2 , 01 . 0
, 1 , 01 . 0 1 , 01 . 0
1
1
= = =
= = =


a N a
C
a N a
C
F a S
F a S
S
S
Puesto que | C
1
| < S
0.01,1
, se
concluye que el contraste
t
1
=
1
+
3

4

5
es igual
a cero; es decir, no existe
evidencia slida para concluir
que las medias de los tratamientos
1 y 3 como grupo difieren de las
Medias de los tratamientos 4 y 5
como grupo.
Sin embargo, como | C
2
| > S
0.01,2
,
se concluye que el contraste
t
1
=
1

4
no es igual acero; es
decir, las resistencias medias de
los tratamientos 1 y 4 difieren
significativamente.
Mtodo de las Diferencias Significativas
Mnimas (LSD) de Fisher
En este procedimiento se utiliza el estadstico F para probar H
0
:
i
=
j





Suponiendo una hiptesis alternativa de dos colas, los pares de medias
i

y
j
se declararan significativamente diferentes si

. A la cantidad

se le llama diferencia significativa mnima, para un diseo no balanceado.
Si el diseo es balanceado, n
1
= n
2
= = n
a
= n, y


Para usar el procedimiento LSD de Fisher, simplemente se compara la
diferencia observada entre cada par de promedios con la LSD
correspondiente. Si se concluye que la medias poblacionales

i
y
j
difieren.
|
|
.
|

\
|
+

=
n n
MS
y y
t
j i
E
j i
1 1
. .
0
( )
n n MS t
y y
j i E a N
j i
/ 1 / 1
, 2 /
. .
+ >
o
n
MS
t
E
LSD
a N
2
, 2 /
=
o
|
|
.
|

\
|
+ =
o
n n
MS t
j i
E a N , 2 /
1 1
LSD
(3.39)
(3.40)
,
. .
LSD
y y
j i
>
Ejemplo 3.8 Pag. 99
Para ilustrar el procedimiento, se usan los datos del experimento 3.1, la
LSD con o = 0.05 es


Por lo tanto, cualquier par de promedios de los tratamientos que difiera
del valor absoluto por ms de 3.75 implicara que el par correspondiente
de medias poblacionales es significativamente diferente. Las diferencias
en los promedios son:

75 . 3
5
) 06 . 8 ( 2
086 . 2
2
20 , 025 . 0
= = =
n
MS
t
E
LSD
* 8 . 10 8 . 10 6 . 21
* 8 . 6 8 . 10 6 . 17
* 0 . 4 6 . 21 6 . 17
* 6 . 4 8 . 10 4 . 15
* 2 . 6 6 . 21 4 . 15
2 . 2 6 . 17 4 . 15
0 . 1 8 . 10 8 . 9
* 8 . 11 6 . 21 8 . 9
* 8 . 7 6 . 17 8 . 9
* 6 . 5 4 . 15 8 . 9
. 5 . 4
. 5 . 3
. 4 . 3
. 5 . 2
. 4 . 2
. 3 . 2
. 5 . 1
. 4 . 1
. 3 . 1
. 2 . 1
= =
= =
= =
= =
= =
= =
= =
= =
= =
= =
y y
y y
y y
y y
y y
y y
y y
y y
y y
y y
y
. 1
y
. 3
y
. 5
y
. 4
y
. 2
9.8 10.8 15.4 17.6 21.6
Los valores marcados con asterisco indican
pares de medias que son significativamente
diferentes.
Los nicos pares de medias que no difieren
significativamente son 1 y 5 y 2 y 3, y el
trmino 4 produce una resistencia
significativamente mayor que los otros
tratamientos.
RESUMEN DE LOS RESULTADOS
Prueba de Rango Mltiple de Duncan
Un procedimiento muy utilizado para comparar todos los pares de medias es
la prueba de rango mltiple desarrollada por Duncan.
Para aplicar esta prueba cuando los tamaos de las muestras son iguales,
los a promedios de los tratamientos se arreglan en orden ascendente, y el
error estndar de cada promedio se determina como
(3.42)
Para tamaos de las muestras desiguales, se sustituye n en la ecuacin
(3.42) con la media armnica nh del {nj}, donde
(3.43)

Observe que si n
1
= n
2
= = n
a
, n
h
= n. En la tabla de Duncan de rangos
significativos se obtienen los valores r
o
(p,f) para p = 2, 3, , a donde o es
el nivel de significacin y f es el nmero de grados de libertad del error.
Estos rangos se convierten en un conjunto de a 1 rangos mnimos de
significacin (por ejemplo R
p
) para p = 2, 3, , a calculando

n
MS
S
E
y
i
=

=
=
a
i
i
h
n
a
n
1
) / 1 (
a p para f p
S r R
i
y a p
,..., 3 , 2 ) , ( = =
Prueba de Rango Mltiple de Duncan
(continuacin)
Entonces, se prueban las diferencias observadas entre las medias,
empezando con la ms grande contra la menor, la cual se comparara
con el rango mnimo de significacin R
a
.
Despus se calcula la diferencia de la mayor y la segunda menor y se
comparara con el rango mnimo de significacin R
a-1
.
Estas comparaciones se continan hasta cuando todas las medias se
han comparado con la media mayor.
Por ltimo, se calcula la diferencia entre la segunda media mayor y la
menor y se compara con el rango mnimo de significacin R
a-1
.
Este proceso se contina hasta cuando se han considerado las
diferencias entre todos los a(a-1)/2 pares de medias posibles.
Si una diferencia observada es mayor que el rango de significacin
mnima correspondiente, se concluye que el par de medias en
cuestin es significativamente diferente.
Para evitar contradicciones, ninguna de las diferencias entre un par
de medias se considera significativa si las dos medias en cuestin se
localizan entre otras dos medias que no difieren significativamente.
Ejemplo 3.9 Pag. 101
La prueba del rango mltiple de Duncan puede aplicarse al
experimento de ejemplo 3.1. Recuerde que MS
E
= 8.06,
N = 25, n = 5 y hay 20 grados de libertad del error. Al arreglar
los promedios en orden ascendente se tiene:
El error estndar de cada promedio es
. En el conjunto de
rangos significativos basado en la tabla
VII del apndice del texto para 20 GL y
o = 0.05 se obtiene r
0.05
(2, 20) = 2.95,
r
0.05
(3, 20) = 3.10, r
0.05
(4, 20) = 3.18,
r
0.05
(5, 20) = 3.25. Los rangos son

6 . 21
6 . 17
4 . 15
8 . 10
8 . 9
. 4
. 3
. 2
. 5
. 1
=
=
=
=
=
y
y
y
y
y
( )
( )
( )
( ) 13 . 4 ) 27 . 1 )( 25 . 3 ( 20 , 5
04 . 4 ) 27 . 1 )( 18 . 3 ( 20 , 4
94 . 3 ) 27 . 1 )( 10 . 3 ( 20 , 3
75 . 3 ) 27 . 1 )( 95 . 2 ( 20 , 2
.
.
.
.
05 . 0 5
05 . 0 4
05 . 0 3
05 . 0 2
= = =
= = =
= = =
= = =
S r R
S r R
S r R
S r R
i
i
i
i
y
y
y
y
27 . 1 5 / 06 . 8
.
= =
S
i
y
4 vs. 1: 21.6 - 9.8= 11.8 > 4.13
4 vs. 5: 21.6 - 10.8= 10.8 > 4.04
4 vs. 2: 21.6 - 15.4= 6.2 > 3.94
4 vs. 3: 21.6 - 17.6= 4.0 > 3.75
3 vs. 1: 17.6 - 9.8= 7.8 > 4.04
3 vs. 5: 17.6 - 10.8= 6.8 > 3.94
3 vs. 2: 17.6 - 15.4= 2.2 < 3.75
2 vs. 1: 15.4 - 9.8= 5.6 > 3.94
2 vs. 5: 15.4 - 10.8= 4.6 > 3.75
5 vs. 1: 10.8 - 9.8= 1.0 < 3.75
Los resultados de las comparaciones son
Ejemplo 3.9 (continuacin)
Por el anlisis se observa que hay diferencias
significativas entre todos los pares de media con
excepcin de la 3 y la 2 y la 5 y la 1.
En la grfica las medias que no son significativamente
diferentes aparecen subrayadas.

y
. 1
y
. 3
y
. 5
y
. 4
y
. 2
9.8 10.8 15.4 17.6 21.6
Resultados de la prueba de rangos
mltiples de Duncan
Prueba de Newman-Keuls
La diferencia con la prueba de Duncan, es que los valores crticos para
calcular la diferencia de medias son calculados de acuerdo a:
K
p
= q
a
(p,f)S

i
.
p= 2,3,...,a (3-45)
Donde q
a
(p,f) es el punto porcentual superior de tamao o del intervalo
studentizado para grupos de medias de tamao p y f grados de
libertad.
El rango se define mediante:
q = (max min)/[sqr(MSE/n)]
Donde ymax y ymin corresponden a las medias muestrales
mxima y mnima. Una vez se calculan los valores de K
p
, los pares
extremos de medias en grupos de tamao p se comparan con K
p

exactamente como la prueba de intervalos mltiples de Duncan.
Prueba de Newman-Keuls (continuacin)
Esta prueba es ms conservadora que la de Duncan en el sentido
que generalmente la razn del error tipo I (o) es menor.

Observamos que si p > 2, se tiene que q
o
(p,f) > r
o
(p,f). Es decir, es
ms difcil declarar que dos medias son significativamente diferentes
al utilizar la prueba de Newman-Keuls que cuando se usa el
procedimiento de Duncan. Esto se ilustra a continuacin para el caso
en que o = 0.01, a = 8 y f = 20:
p 2 3 4 5 6 7 8
r
0.01
(p,20) 4.02 4.22 4.33 4.40 4.47 4.53 4.58
q
0.01
(p,20)
4.02 4.64 5.02 5.29 5.51 5.69 5.84
DETERMINACIN DEL
TAMAO DE LA MUESTRA
DETERMINACIN DEL TAMAO DE
LA MUESTRA
En cualquier problema de diseo
experimental, una decisin crtica es la
eleccin del tamao de la muestra; es
decir, determinar el nmero de rplicas
que se deben correr.
Si el experimentador tiene inters en
detectar efectos pequeos, se necesitan
ms rplicas que cuando se interesa en
detectar efectos grandes.


DETERMINACIN DEL TAMAO DE LA
MUESTRA (continuacin)
Curva de operacin caracterstica:

DETERMINACIN DEL TAMAO DE LA
MUESTRA (continuacin)
Curva de operacin caracterstica (cont.):

Curva de operacin caracterstica
Curva de operacin caracterstica (continuacin)
Curva de operacin caracterstica (continuacin)
Curva de operacin caracterstica (continuacin)
Ejercicio 3.11
Ejercicio 3.11 (continuacin)
Curva de operacin caracterstica
Una compaa textil utiliza un gran nmero de telares. Se
desea que los telares sean homogneos con el objeto de
producir tela de resistencia uniforme. El ingeniero de
procesos supone que, aparte de la variacin usual en la
resistencia de la tela en muestras del mismo telar, puede
existir una variacin significativa de la resistencia entre
los distintos telares. Para investigar esto, selecciona
cuatro telares al azar y realiza cuatro determinaciones de
la resistencia de la tela manufacturada por cada uno.
Este experimento es realizado en orden aleatorio y los
datos que se recopilan aparecen en la Tabla 1. Se lleva a
cabo un anlisis de varianza cuyos resultados se
muestran en la Tabla 2. De este anlisis se concluye que
existe diferencia significativa entre los telares de la
planta.
Ejercicio en clases
Tablas
Tabla 2. Anlisis de varianza para los datos de resistencia
Looms 89.19 3 29.73 15.68 0.00018787
Error 22.75 12 1.9
Total 111.94 15
Fo Pvalue
Fuente de
variacin
Suma de
cuadrados
Grados de
Libertad
Media de
Cuadrados

Você também pode gostar