Você está na página 1de 10

2-7 PROBLEMAS

57

e) Comentar el supuesto de normalidad y su papel en este problema.


d) Verificar la normalidad construyendo una grfica de probabilidad normal. A qu conclusiones se

2-15.

llega?
Doce inspectores midieron el dimetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de
calibradores. Los resultados fueron

Inspector
1
2
3
4
5
6
7
8
9
10
11
12

2-16.

Calibrador 1
0.265
0.265
0.266
0.267
0.267
0.265
0.267
0.267
0.265
0.268
0.268
0.265

Calibrador 2
0.264
0.265
0.264
0.266
0.267
0.268
0.264
0.265
0.265
0.267
0.268
0.269

a) Existe una diferencia significativa entre las medias de la poblacin de mediciones de las que se seleccionaron las dos muestras? Utilizar a = 0.05.
b) Encontrar el valor P para la prueba del inciso a.
e) Construir un intervalo de confianza de 95 % para la diferencia en las mediciones de los dimetros promedio para los dos tipos de calibradores.
En un artculo de Joumal ofStrainAnalysis (vol. 18, no. 2) se comparan varios procedimientos para predecir
la resistencia al corte de vigas d placas de acero. Los datos para nueve vigas en la forma del cociente de la
carga predicha y la observada para dos de estos procedimientos, los mtodos Karlsruhe y Lehigh, son los siguientes

Viga

Mtodo Karlsruhe

Sl/l
S2/1
S3/1
S4/1
S5/1
S2/1
S2/2
S2/3
S2/4

1.186
1.151
1.322
1.339
1.200
1.402
1.365
1.537
1.559

Mtodo Lehigh
1.061
0.992
1.063
1.062
1.065
1.178
1.037
1.086
1.052

a) Existe alguna evidencia que apoye la afirmacin de que hay una diferencia en el des.empeo promedio
entre los dos mtodos? Utilizar a = 0.05.
b) Cul es el valor P para la prueba del inciso a?
e) Construir un intervalo de confianza de 95% para la diferencia en la carga promedio predicha y la observada.
d) Investigar el supuesto de normalidad en ambas muestras.
e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos mtodos.
/) Comentar el papel del supuesto de normalidad en la prueba t pareada.

58
2-17.

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Se estudia la temperatura de deflexin bajo carga de dos formulaciones diferentes de un tubo de plstico
ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada'formulacin y las temperaturas de deflexin (en F) se presentan abajo:

206
188
205
187

2-18.
2-19.

Formulacin 1
193
192
207
210
185
194
189
178

177
197
206
201

176
185
200
197

198
188
189
203

a) Construir las grficas de probabilidad normal para ambas muestras. Estas grficas apoyan los supuestos
de normalidad y de la igualdad de la varianza de ambas muestras?
b) Los datos apoyan la afirmacin de que la temperatura promedio de deflexin bajo carga de la formulacin 1 excede la de la formulacin 2? Utilizar a = 0.05.
e) Cul es el valor P para la prueba del inciso a?
Referirse a los datos del problema 2-17. Los datos apoyan la afirmacin de que la temperatura promedio de
deflexin bajo carga de la formulacin 1 excede la de la formulacin 2 en al menos 3F?
En la fabricacin de semiconductores es comn el uso del grabado qumico hmedo para eliminar el silicio
de la parte posterior de las obleas antes de la metalizacin. La rapidez del grabado es una caracterstica importante de este proceso. Se estn evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas
seleccionadas al azar en cada solucin, y las cifras de la rapidez del grabado observada (en milsimas de pulgada/min) se muestran abajo
Solucin 1
10.6
9.9
9.4
10.3
9.3
10.0
9.8
10.3

2-20.

Formulacin 2

Solucin 2
10.2
10.6
10.0
10.2
10.7
10.4
10.5
10.3

a) Los datos indican que la afirmacin de que ambas soluciones tienen la misma rapidez de grabado promedio es verdadera? Utilizar a = 0.05 y suponer la igualdad de las varianzas.
b) Encontrar un intervalo de confianza de 95% para la diferencia en la rapidez de grabado promedio.
e) Usar grficas de probabilidad normal para investigar la adecuacin de los supuestos de normalidad e
igualdad de las varianzas.
Se estn comparando dos populares analgsicos con base en la rapidez de absorcin del cuerpo. Especficamente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que y a~ se
conocen. Desarrollar un estadstico de prueba para

a;

H o:2f.l = f.l2
H:2f.l :;f:.f.l2

2-21.

Suponga que se est probando


Ho:f.l =f.l2
H:f.l :;f:.f.l2

2-22.

donde a; y a~ se conocen. Los recursos para hacer el muestreo son limitados, por lo que n + n 2 = N. Cmo
debern asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia ms
alta?
Desarrollar la ecuacin 2-46 para un intervalo de confianza de 100(1- a) por ciento para la varianza de una
distribucin normal.

2-7 PROBLEMAS

2-23.

a)

59

ai /a;,

Desarrollar la ecuacin 2-50 para un intervalo de confianza de 100(1- por ciento para el cociente
donde
y
son las varianzas de dos distribuciones normales.
2-24. Desarrollar una ecuacin para encontrar un intervalo de confianza de 100(1-a) por ciento para la diferencia en las medias de dos distribuciones normales donde ;t:
Aplicar la ecuacin desarrollada a los datos
del experimento del cemento portland, y encontrar un intervalo de confianza de 95%.
2-25. .Construir un conjunto de datos para los que el estadstico de prueba t pareada sea muy grande, pero para el
cual el estadstico de prueba t de dos muestras o combinada usual sea pequeo. En general, describir cmo se
crearon los datos. Le da esto al lector alguna idea respecto de cmo funciona la prueba t pareada?

ai a;

ai a;.

Experimentos con un solo


factor: el anlisis de varianza

En el captulo 2 se analizaron los mtodos para comparar dos condiciones o tratamientos. Por ejemplo, el
experimento de la fuerza de la tensin de adhesin del cemento portland incluy dos formulaciones diferentes del mortero. Otra forma de describir este experimento es como un experimento con un solo factor,
con dos niveles del factor, donde el factor es la formulacin del mortero y los dos niveles son los dos mtodos diferentes para hacer la formulacin. Muchos experimentos de este tipo involucran ms de dos niveles del factor. En este captulo se presentan los mtodos para el diseo y el anlisis de los experimentos
con un solo factor cona niveles del mismo (o a tratamientos). Se supondr que el experimento se ha aleatorizado completamente.

3~ 1

UN EJEMPLO

Un ingeniero de desarrollo de productos tiene inters en investigar la resistencia a la tensin de una fibra
sinttica nueva que se usar para hacer tela de camisas para caballero. El ingeniero sabe por experiencia
previa que la resistencia a la tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de algodn se incrementar la resistencia, al menos en un principio. Sabe asimismo que el contenido de algodn deber variar entre 10 y
40 por ciento para que el producto final tenga otras caractersticas de calidad que se desean (como la
capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodn: 15,20,25,30 Y35 por ciento. Tambin decide probar cinco ejemplares en cada nivel del contenido de algodn.
Se trata de un ejemplo de un experimento con un solo factor con a = 5 niveles del factor y n = 5 rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar cmo puede aleatorizarse el orden de las corridas, suponga que las corridas se numeran de la siguiente manera:

60

3-1 UN EJEMPLO

Peso
porcentual
del algodn

15
20
25
30
35

61

Nmero de corrida experimental

1
6

2
7
12
17
22

11

16
21

3
8
13

18
23

4
9
14
19
24

5
10

15
20
25

Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero es 8. Entonces la observacin nmero 8 (20% de algodn) se corre primero. Este proceso se repetira hasta que las 25 observaciones tengan asignada una posicin en la secuencia de prueba. 1 Muchos paquetes de software de
computadora para ayudar a los experimentadores a seleccionar y construir un diseo, aleatorizan el orden de las corridas utilizando nmeros aleatorios de esta manera.
Suponga que la secuencia de prueba obtenida es
Secuencia de prueba

Nmero de corrida

Peso porcentual del algodn

2
3
4

18
10
23
17

20
30
20
35
30
15
25
20
25
30
20
15
25
20
15
35
35
25
15
25
35
30
35
30
15

5
6

14

8
9
10

11

15
20

12

9
4

13

12

14
15
16

17

18
19
20
21
22
23
24
25

24
21
11

2
13
22

16
25
19
3

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras
desconocidas -las cuales quiz varen fuera de control durante el experimento-- contaminen los resultados. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original
no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodn, despus se prue1 La nica restriccin sobre la aleatorizacin en este caso, es que si se saca de nuevo el mismo nmero (es decir, 8), se descarta. Se trata de una restriccin secundaria y se ignora.

62

CAPTULO 3

Tabla 3-1

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Datos (en lb/pulgadaZ) del experimento de la resistencia a la tensin


Observaciones

Peso porcentual
del algodn

15
20
25
30
35

7
12
14
19
7

7
17
18
25
10

15
12
18
22
11

4
11
18
19
19
15

Total

Promedio

9
18
19
23
11

49
77
88
108
54

9.8
15.4
17.6
21.6
10.8
-15.04

376

ban los cinco ejemplares con 20% de algodn, etc.). Si la mquina empleada para probar la resistencia a la
tensin presenta un efecto de calentamiento tal que entre ms tiempo est funcionando sean menores las
lecturas de la resistencia a la tensin observadas, el efecto del calentamiento contaminar potencialmente los datos de la resistencia a la tensin y destruir la validez del experimento.
Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En la tabla 3-1
se muestran las observaciones que obtiene para la resistencia a la tensin.
Siempre es una buena idea examinar grficamente los datos experimentales. En la figura 3-1 se muestran los diagramas de caja para la resistencia a la tensin con cada nivel del peso porcentual de algodn, y
en la figura 3-2 se ilustra n diagrama de dispersin de la resistencia a la tensin contra el peso porcentual del algodn. En la figura 3-2, los puntos rellenos son las observaciones individuales y los crculos huecos son los promedios de la resistencia a la tensin observada. Ambas grficas indican que la resistencia a
la tensin se incrementa cuando el contenido de algodn se incrementa, hasta cerca de 30% de algodn.
Despus de 30% de algodn, hay un marcado descenso de la resistencia a la tensin. No hay evidencia slida que sugiera que la variabilidad de la resistencia a la tensin alrededor del promedio dependa del peso
porcentual del algodn. Con base en este anlisis grfico simple, se tienen firmes sospechas de que 1) el
contenido de algodn afecta la resistencia a la tensin y 2) alrededor de 30% de algodn produce la resistencia mxima.
Suponga que se quiere ser ms objetivo en el anlisis de los datos. Especficamente, imagine que
quieren probarse las diferencias entre las resistencias a la tensin promedio con todos los niveles a = 5 del
30
'b;
:;

c:
'0
.;
c:

20

l!l

..!!!
ro
ro
'

ij 10

t
.;
ID

a:

oL-_--L_ _- I -_ _...l-_ _l - _ - . . l ._ _- '


15

20

25

30

Peso porcentual del algodn

Figura 3-1 Diagramas de caja de la resistencia a la tensin


contra el peso porcentual del algodn.

3-2 EL ANLISIS DE VARIANZA

63

30

"b;
:;

~20

c:
-o
'i
c:

10

'i

..!!!
ro
ro
';
c:

Q)

a:

OL---I.---'----'----'------'
Pese eercentual del alcedn

Figura 3-2 Diagrama de dispersin de la resistencia


a la tensin contra el peso porcentual del algodn.

peso porcentual del algodn. Por lo tanto, el inters se centra en probar la igualdad de las cinco medias. Pudiera parecer que este problema se resolvera realizando una prueba t para todos los pares de medias
posibles. Sin embargo, no es sta la mejor solucin de este problema, porque llevara a una distorsin considerable en el error tipo 1. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias
usando comparaciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctamente la
hiptesis nula en cada prueba individual es de 1 - a = 0.95, la probabilidad de aceptar correctamente la
hiptesis nula en las 10 pruebas es de (0.95)10 = 0.60 si las pruebas son independientes. Por lo tanto, ha
ocurrido un incremento sustancial en el error tipo l.
El procedimiento correcto para probar la igualdad de varias medias es el anlisis de varianza. Sin
embargo, el anlisis de varianza tiene un rango de aplicaciones mucho ms amplio que el problema anterior. Probablemente sea la tcnica ms til en el campo de la inferencia estadstica.

3..2

EL ANLISIS DE VARIANZA

Suponga que se tienen a tratamientos o niveles diferentes de un solo factor que quieren compararse. La
respuesta observada de cada uno de los a tratamientos es una variable aleatoria. Los datos apareceran
como en la tabla 3-2. Una entrada de la tabla 3-2 (por ejemplo, Yij) representa la observacinj-sima to-

Tabla 3-2

Datos tpicos de un experimento de un solo factor

'Itatamiento
(nivel)

Observaciones

Totales Promedios

fu

fu

~,

Ya!

Ya2

Yan

y,.

5'..

64

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

mada bajo el nivel del factor o tratamiento i. Habr, en general,}1 observaciones bajo el tratamiento i-simo. Observe que la tabla 3-2 es el caso general de los datos del experimento de la resistencia a la tensin
de la tabla 3-1.
Modelos para los datos
Se encontrar til describir las observaciones de un experimento con un modelo. Una manera de escribir
este modelo es

i=l, 2,

,a

Yij=fl+cij { }=1,2,

,11

(3-1)

dondeYij es la observacin ij-sima, t es la media del nivel del factor o tratamiento i-simo, y cij es un componente del error aleatorio que incorpora todas las dems fuentes de variabilidad del experimento, incluyendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las
unidades experimentales (como los materiales de prueba, etc.) a las que se aplican los tratamientos, y el
ruido de fondo general en el proceso (ya sean la variabilidad con el tiempo, los efectos de variables ambientales, etc.). Es conveniente considerar que los errores tienen media cero, de tal modo que E(yij) = fl.
A la ecuacin 3-1 se le llama el modelo de las medias. Una forma alternativa de escribir un modelo de
los datos es definiendo
i

= 1,

2, ..., a

de tal modo que la ecuacin 3-1 se convierte en


i=l, 2, ..., a
y.. = fl+. +1' .. {
IJ
IJ j= 1,2, ... ,11

(3-2)

En esta forma del modelo, fl es un parmetro comn a todos los tratamientos al que se llama la media global, y es un parmetro nico del tratamiento i-simo al que se le llama el efecto del tratamiento i-simo.
A la ecuacin 3-2 se le llama por lo general el modelo de los efectos.
Tanto el modelo de las medias como el de los efectos son modelos estadsticos lineales; es decir, la variable de respuestaYij es una funcin lineal de los parmetros del modelo. Aun cuando ambas formas del
modelo son tiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseo
experimental. Tiene cierto atractivo intuitivo por cuanto fl es una constante y los efectos de los tratamientos representan desviaciones de esta constante cuando se aplican los tratamientos especficos.
A la ecuacin 3-2 (o a la 3-1) se le llama tambin el modelo del anlisis de varianza simple o de un
solo factor (o direccin), porque nicamente se investiga un factor. Adems, ser un requisito que el experimento se lleve a cabo en orden aleatorio para que el ambiente en el que se apliquen los tratamientos
(llamados con frecuencia unidades experimentales) sea lo ms uniforme posible. Por lo tanto, el diseo
experimental es un diseo completamente aleatorizado. Los objetivos sern probar las hiptesis apropiadas acerca de las medias de los tratamientos y estimarlas. Para probar las hiptesis, se supone que los
errores del modelo son variables aleatorias que siguen una distribucin normal e independiente con media cero y varianza el. Se supone asimismo que la varianza el es constante para todos los niveles del factor.
Esto implica que las observaciones

y que las observaciones son mutuamente independientes.

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

65

Factor fijo o aleatorio?

El modelo estadstico (ecuacin 3-2) describe dos situaciones diferentes con respecto a los efectos de los
tratamientos. Primera, los a tratamientos pudieron ser elegidos expresamente por el experimentador. En
esta situacin quieren probarse hiptesis acerca de las medias de los tratamientos, y las conclusiones se
aplicarn nicamente a los niveles del factor considerados en el anlisis. Las conclusiones no pueden extenderse a tratamientos similares que no fueron considerados explcitamente. Tambin se podra querer
estimar los parmetros del modelo (p" Ti' 02). A ste se le llama el modelo con efectos fijos. De manera alternativa, los a tratamientos podran ser una muestra aleatoria de una poblacin ms grande de tratamientos. En esta situacin sera deseable poder extender las conclusiones (las cuales se basan en la
muestra de los tratamientos) a la totalidad de los tratamientos de la poblacin, sea que se hayan considerado explcitamente en el anlisis o no. Aqu las Ti son variables aleatorias, y el conocimiento de las Ti particulares que se investigaron es relativamente intil. Ms bien, se prueban hiptesis acerca de la
variabilidad de las Ti y se intenta estimar su variabilidad. A ste se le llama el modelo con efectos aleatorios
o modelo de los componentes de la varianza. La revisin de experimentos con factores aleatorios se pospondr hasta el captulo 12.

3~3

ANLISIS DEL MODELO CON EFECTOS FIJOS

En esta seccin se desarrolla el anlisis de varianza de un solo factor para el modelo con efectos fijos. Recuerde que Yi. representa el total de las observaciones bajo el tratamiento i-simo. Sea que Yi. represente el
promedio de las observaciones bajo el tratamiento i-simo. De manera similar, sea que Y.. represente el
gran total de todas las observaciones y que Y.. represente el gran promedio de todas las observaciones.
Expresado simblicamente,

Yi.=}:

= 1, 2, oo.,

j=l

Y..

(3-3)

= }:}:

Yj

Y.. = Y.. / N

=l j=l

donde N = an es el nmero total de observaciones. Se nota que el subndice "punto" implica la operacin
suma sobre el subndice que reemplaza.
El inters se encuentra en probar la igualdad de lasa medias de los tratamientos; es decir,E(yJ =fl +
T = fli' i = 1, 2,
a. Las hiptesis apropiadas son
OO"

Ho:fll

= fl2 = oo. = fla

H 1 : fli

fl j

para al menos un par (i, j)

En el modelo de los efectos, la mediafli del tratamiento i-simo se descompone en dos componentes tales
que fli = fl + Ti' Por lo general, fl se considera como una media global, de tl modo que

~fli
i=l

--=fl

Esta definicin implica que

~
i=l

=O

66

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Es decir, los efectos del tratamiento o factor pueden considerarse como desviaciones de la media globaI.z
Por consiguiente, una forma equivalente de escribir las hiptesis anteriores es en trminos de los efectos
de los tratamientos Ti> por ejemplo
H o :T 1 =T 2 =T a =O
H 1 : Ti ':!; O
para al menos una i

Por 10 tanto, se habla de probar la igualdad de las medias de los tratamientos o de probar que los efectos
de los tratamientos (las Ti) son cero. El procedimiento apropiado para probar la igualdad de las medias de
los a tratamientos es el anlisis de varianza.
3~3.1

Descomposicin de la suma de cuadrados total

El nombre anlisis de varianza se deriva de la particin de la variabilidad total en sus partes componentes. La suma de cuadrados total corregida

se usa como una medida de la variabilidad global de los datos. Intuitivamente, esto es razonable porque,
si SST tuviera que dividirse por el nmero apropiado de grados de libertad (en este caso, an -1 = N -1), se
obtendra la varianza muestral de las y. La varianza muestral es, desde luego, una medida estndar de variabilidad.
Observe que la suma de cuadrados total corregida SST se puede escribir como
(3-4)

~ ~ ( _ - )2 _ ~ (- _ - )2 + L.J
~ L.J
~
L.J L.J Yij Y. - nL.J Yi. Y..
i=l j=l

i=l

(Yij _ Yi.
- )2

i=l j=l
a

(3-5)

+2""
L"., L"., (y-,~. - Y-.. )(y..lJ - y-,t. )
i=l j=l

Sin embargo, el trmino del producto cruzado de la ecuacin 3-5 es cero, ya que

y.t. -ny-.l.
L"., (y lJ.. -y-.)=
l.

= y.

l.

-n(y. /n)= O
l.

j=l

Se tiene, por 10 tanto,

~ ~ ( _ - )2 _ ~ (- _ - )2 + L.J
~ L.J
~ (Yij
L.J L.J Yij Y. - n L.J Yi. y..
i=l j=l

i=l

_ Yi.
- )2

(3-6)

i=l j=l

La ecuacin 3-6 establece que puede hacerse la particin de la variabilidad total de los datos, medida por
la suma de cuadrados total corregida, en una suma de cuadrados de las diferencias eutre los promedios de
los tratamientos y el gran promedio, ms una suma de cuadrados de las diferencias de las observaciones
dentro de los tratamientos y el promedio de los tratamientos. Entonces, la diferencia entre los promedios
2

Para ms informacin sobre este tema, referirse al material suplementario del texto del captulo 3.

Você também pode gostar