Escolar Documentos
Profissional Documentos
Cultura Documentos
Anlisis de Varianza
ANOVA
Reconocer
Definir
Medir
Analizar
Mejorar
Controlar
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Fabricacin:
Un ingeniero de proceso necesita determinar el efecto de tres niveles de
resistencia en la densidad del plstico.
- Cmo debera el ingeniero plantear y analizar el experimento?
Administracin:
Un equipo administrativo tiene asignado el proyecto de reducir el
tiempo de ingreso de datos de los acuerdos de licencia. El equipo
ha elaborado cuatro tipos diferentes de formularios.
-Cmo debera el equipo plantear y analizar el experimento?
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Suma de Cuadrados
xji 1
Factor
j =1 i =1
(xji -x)
SS total
0
1
Respuesta
j =1
(x j - x )
SS factor
j =1 i =1
(xji - x j )
SS error
Total: SS total = Suma de Cuadrados Total del experimento (valores individuales - media general)
Entre Tratamientos: SS factor = Suma de Cuadrados de los Factores (media del grupo - media general)
Dentro de cada tratamiento: SS error = Suma de Cuadrados dentro de cada grupo (valores individuales - media del grupo)
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Trminos
Cuadrado medio del factor (MS): La SS factor dividida por los DF [(g-1)].
MS es tambin un estimador de la varianza
Cuadrado Medio del Error (MSE): La SS error dividida por los DF [g(n-1)].
MSE es tambin un estimador de la varianza.
Tabla de ANOVA
Fuente
Entre
grupos
Suma de
Cuadrados
SSFactor
g-1
SS Factor
(g-1)
SS Error
g(n-1)
Dentro de
grupos
SS Error
g(n-1)
Total
SS Total
ng-1
MSfactor
MSerror
P(F)
g = # de grupos
n = # en el grupo
DF entre = g-1
SS
DF
MS (=SS/df)
ENTRE
SS factor
g-1
SS factor/(g - 1)
DENTRO
SS error
g(n -1)
SS error/g(n - 1)
TOTAL
SS total
gn - 1
F {=MS(factor)/MS(Error)}
MSfactor / MSError
Varianza de error ponderado
La prueba F y la Distribucin F
F = Variacin entre tratamientos
= SS factor / (g-1)
Variacin dentro de los tratamientos
SS error / g(n-1)
Si F > F crit entonces al menos una media es distinta.
La distribucin F es
una familia de
curvas dependientes
del nmero de
grados de libertad.
0.7
0.6
Prob
0.5
Fcrit en el punto 5%
0.4
0.3
Fcrit en el punto 1%
0.2
0.1
0
0
7
Valor - F
10
11
12
13
14
Si el valor F
observado
es > 5, el
valor - P= 0
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Supuestos Estadsticos
Normalidad: las muestras se extraen de poblaciones normalmente
distribuidas.
Nota: La distribucin dentro de los subgrupos debe ser normal. No se
puede asumir que el total de la poblacin bajo estudio sea normal.
Independencia: Las muestras son independientes
Minitab: Stat>Basic Statistics>Correlation
Homogeneidad de Varianzas: Las poblacionales tienen varianzas
iguales.
Minitab: Stat>ANOVA>Test for Equal Variances (use stacked data)
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Primero,
hay que
encontrar el tamao de
muestra necesario para
determinar si hay una
diferencia estadsticamente significativa entre
las medias de los tiempos
requeridos para completar
los distintos formularios.
Luego,
Entonces
se usa ANOVA
para determinar si existe
diferencia entre las
medias.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
1.
Abrir Minitab
Ir a Stat > Power and Sample Size
> ANOVA para un factor
2.
3.
Nota:
El sigma
histrico es 2
4.0 segundos
es una
diferencia
significativa
a = 5%
b = 20%
1
2
4.
5.
En Number of
levels: tipear 4
En Values of the
maximum
difference
between means:
tipear 4.0
En Power
values: tipear
0.80 (1.00 0.20)
En Sigma:
tipear 2.0
Seleccione OK
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
SS Means
8
Sample
Size
7
Target Actual
Power Power
0.8000 0.8361
Maximum
Difference
4
En archivo
DataFile ANOVA1,
usaremos 6 debido
a restricciones de
recursos
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
2.
3.
1
4
4.
5.
6.
6
7.
Seleccione C1 A, C2 B,
C3 C, y C4 D
Presione Select
Observe A-D en Stack
the following columns:
Seleccione Column of
current worksheet: y
tipee Response
En Store subscripts in:
tipee Factor
Seleccione Use variable
names in subscript
column
Seleccione OK
7
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Normalidad
(Resumen Grfico) usando Minitab
Desarrollo:
Usar DataFile\ANOVA1.mtw
Ir a Stat > Basic Statistics > Graphical Summary
1
1. En Variables:
Seleccione Response
2. En By Variables
seleccione Factor
3. Seleccione OK
3
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Normalidad
(Resmen Grfico)
p value > .05
57.5
60.0
62.5
65.0
67.5
70.0
0.46
A-Squared
0.162
P-Value
0.493
Mean
StDev
61.000
1.897
Mean
StDev
66.000
2.828
3.600
Variance
0.00000
Skewness
1.19324
Kurtosis
N
-2.68519
6
Kurtosis
N
1.66875
6
Minimum
59.000
Minimum
63.000
1st Quartile
Median
3rd Quartile
59.000
61.000
63.000
1st Quartile
Median
3rd Quartile
63.750
65.500
68.000
Maximum
63.000
Maximum
71.000
55.0
57.5
60.0
62.5
65.0
67.5
70.0
59.009
62.991
63.032
63.000
1.184
4.654
Median
68.968
Mean
8.000
Skewness
0.29
P-Value
Variance
55.0
Factor = A
69.571
Mean
1.766
6.937
Median
60.0
61.5
63.0
65.0
65.0
67.5
70.0
A-Squared
P-Value
0.493
Mean
StDev
68.000
1.673
Mean
StDev
61.000
2.828
2.800
Variance
1.15254
2.50000
Skewness
Kurtosis
Minimum
1st Quartile
66.000
66.750
Median
3rd Quartile
68.000
68.750
Maximum
71.000
66.244
55.0
57.5
60.0
62.5
65.0
67.5
70.0
69.756
Mean
1.044
Median
3rd Quartile
61.500
63.250
Maximum
64.000
58.032
69.929
4.104
56.000
59.000
63.968
Median
Minimum
1st Quartile
8.000
-1.19324
1.66875
0.29
0.129
62.5
0.49
P-Value
Skewness
Kurtosis
60.0
Factor = D
Variance
57.5
70.0
Factor = C
A-Squared
55.0
67.5
63.643
Mean
1.766
6.937
Median
66
68
70
57
60
63
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
1.95
0.584
Factor
0.60
0.622
P > 0.05:
no podemos
rechazar la
hiptesis nula
de igualdad de
varianzas
1
2
3
4
5
6
7 Usar
8
9 Bartlett's
95% Bonferroni Confidence Intervals for StDevs
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Valor - p
C
A
B
0.298
0.566
0.630
0.180
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Desarrollo:
Usar DataFile\ANOVA1.mtw con columnas apiladas
Ir a Stat > ANOVA > One-way
3
1
4
1. Seleccione C1 A, C2
B, C3 C, and C4 D
2. Presione Select
3. En Response:
seleccione Response
4. En Factor:
seleccione Factor
5. Seleccione OK
5
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
SS
MS
F
P
228.00 76.00 13.57
0.000
112.00 5.60
340.00
Una, o mas, medias de los
tratamientos es estadsticamente
diferente de la media general
Veamos el grfico!
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
4.
5.
Seleccione One Y
with Groups.
En Graph Variables:
Seleccione Response
En Categorical
Variables Seleccione
Factor
Seleccione OK
Seleccione OK
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
of Response vs Factor
Es la media deInterval Plot
95% CI for the Mean
A diferente
de la
70
media
de B?
68
Response
66
64
62
60
58
A
Examine las
diferencias
entre medias
utilizando
Comparaciones
Mltiples.
Factor
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Desarrollo:
Usar DataFile\ANOVA1.mtw
Ir a Stat > ANOVA > One-way
Seleccionar Comparisons
2
1. Seleccione Tukeys
3
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
La hiptesis nula de no
of diferencia
Factor
entre medias es
falsa s y slo si el intervalo de
confianza no contiene al cero.
Factor
Lower
Center
Upper
1.174
5.000
8.826
3.174
7.000
10.826
-3.826
0.000
3.826
--------+---------+---------+---------+(-----*------)
(------*-----)
(-----*-----)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Level 1
Factor B
Level 2
Factor A
Level 1
Level 2
Y1, 11
Y1, 21
Y2, 11
Y2, 21
Y1, 12
Y1, 22
Y1, 12
Y2, 22
Combinacin de
tratamientos
A al Level 2
B al Level 1
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Desarrollo:
Ir a DataFile\ANOVA2.mtw
Notar el orden de los datos
Una columna tiene un nmero para la ubicacin
En cada ubicacin hay datos del desgaste para cada una de las cuatro
marcas.
Cada una de las marcas es medida cuatro veces - cuatro rplicas.
Ir a Data> Stack > Columns
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
1.
1.
2
4
2.
3.
5
4.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Desarrollo:
Ir a Stat > ANOVA > Two-way
1
1. En Response:
seleccione Carpet Stack
2. En Row factor:
seleccione Location
3. En Column factor:
seleccione Carpet
4. Seleccione OK
2
3
4
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Source
Loc
Carpet
Interaction
Error
Total
DF
3
3
9
48
63
SS
MS
F
P
9.99
3.329 0.31 0.815
796.72 265.575 25.02 0.000
46.91
5.212 0.49 0.873
509.56 10.616
1363.17
Carpet es
el nico
factor
significativo
(p <= 0.05)
1
2
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Loc
18
16
14
12
10
8
Carpet 1 Carpet 2 Carpet 3 Carpet 4
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
1
2
3
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
20
15
Carpet
C arpet
C arpet 1
C arpet 2
C arpet 3
C arpet 4
Hay interaccin,
pero no es
estadsticamente
significativa.
10
20
15
Loc
Loc
1
2
3
4
10
5
Carpet 1 Carpet 2 Carpet 3 Carpet 4
Su Turno!
Abra DataFile\ANOVA3.mtw
Realice una anlisis ANOVA de los datos (determine el efecto de la
Resistencia (Strength) en la Densidad (Density))
Responda las siguientes preguntas:
1. Se cumplen los supuestos estadsticos?
2. Puede utilizarse ANOVA para un factor para analizar estos datos?
3. Hay alguna diferencia entre las resistencias?
4. Cul resistencia rinde densidad mas alta?
5. Mire los datos. Cul resistencia tiene la densidad mas alta?
6. El anlisis ANOVA respalda sus conclusiones?
7. Cul es la potencia de la prueba realizada?
8. Qu niveles de alfa y beta eligi? Qu tamao de muestra se
debera haber utilizado para el valor de beta elegido?
Est preparado para presentar sus resultados y para indicar sus
conclusiones. (Solucin: DataFile\ANOVA3 SOLUTION.mtw)
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Fabricacin:
Un ingeniero de proceso necesita determinar el efecto de tres niveles
de resistencia en la densidad del plstico.
- Cmo debera el ingeniero plantear y analizar el experimento?
Administracin:
Un equipo administrativo tiene asignado el proyecto de reducir el
tiempo para el ingreso de datos en los acuerdos de licencia. El equipo
ha elaborado cuatro tipos diferentes de formularios.
-Cmo debera el equipo plantear y analizar el experimento?
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Qu hemos aprendido
1. Anlisis de Varianza (ANOVA)
2. Variacin y Suma de Cuadrados
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Bibliografa
Statistical Analysis for Decision Making, 1993, Hamburg & Young,
publicado por The Dryden Press, Captulo 8
Statistics for Experimenters, Box, Hunter & Hunter, 1978, publicado por
John Wiley and Sons, Captulo 7.
Design and Analysis of Experiments, 3rd Edition 1991, Montgomery,
publicado por John Wiley and Sons, Captulo 5.
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Tamao de la muestra =
(Z
+Z )
2
Tamao de la muestra =
(Z
+ Z ) (
2
2
1
2
+ 22 )
( - )
Para la
alternativa de
una cola, y
ANOVA, use Za
La Potencia del
ensayo es 1 - b
Tamao de la muestra =
(Z
p 0 (1 - p 0 ) + Z p(1 - p) 2
2
(p - p )
INSTITUTO PARA LA CALIDAD 2008. Prohibida su reproduccin total o parcial sin permiso del autor y del Instituto para la Calidad de la Pontificia
Universidad Catlica del Per.
Tamao de muestra =
(Z
+ Z
) (
2
2
1
2
+ 22 )
( - )
0
(Z
+ Z
)(
2
k =1
2
( - )
2k )
Nmero de nveles
de factores
Tamao de la muestra =
d = diferencia
significativa
Tamao
mnimo de
muestra
(1.645 + 0.842)2 * 4 * 22
4
= 6.185 = 6