Você está na página 1de 16

ANOVA

Pregunta 1
1. La siguiente información es muestral. Pruebe la hipótesis de que las
medias de tratamiento son iguales. Utilice el nivel de significancia 0.05.

Tratamiento 1 Tratamiento 2 Tratamiento 3


9 13 10
7 20 9
11 14 15
9 13 14
12 15
10

a) Establezca las hipótesis nula y alternativa.


b) ¿Cuál es la regla de decisión?
c) Calcule SST, SSE y SS total.
d) Elabore una tabla ANOVA.
e) Exprese su decisión acerca de la hipótesis nula.
Se seguirá el procedimiento usual de cinco pasos para la prueba de hipótesis.
Paso 1: Plantear la hipótesis nula y la hipótesis alternativa
𝐻0 : µ1 = µ2 = µ3
𝐻1 : 𝐿𝑜𝑠 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑡𝑜𝑑𝑜𝑠 𝑖𝑔𝑢𝑎𝑙𝑒𝑠.
Paso2: Establecer nivel de significancia.
α = 0.05
Paso 3: Determinar el estadístico de prueba. Estamos ante una distribución
F, ANOVA.
Paso 4: Establecer la regla de decisión.
Grados de libertad para el numerador = k – 1 = 3 – 1 = 2
Grados de libertad para el numerador = n - k = 15 – 3 = 12
Intersectando en la tabla, encontramos el valor de 3.89. Así que la regla de
decisión es rechazar la 𝐻0 si el valor calculado para F es mayor que 3.89.
Paso 5: Seleccionar muestra, realizar los cálculos y tomar una decisión.

Tratamient Tratamient Tratamiento Total


o1 o2 3
𝑋 𝑋2 𝑋 𝑋2 𝑋 𝑋2
9 81 13 169 10 100
7 49 20 400 9 81
11 121 14 196 15 225
9 81 13 169 14 196
12 144 15 225
10 100
𝑇𝑐 58 60 63 181
𝑛𝑐 6 4 5 15
𝑋2 576 934 827 2337

Las entradas para la tabla ANOVA se calculan como sigue.


(∑ 𝑋)2 1812
SS total = ∑ 𝑋 2 − = 2337 − = 𝟏𝟓𝟐. 𝟗𝟑𝟑
𝑛 15

𝑇2 (∑ 𝑋)2 582 602 632 1812


SST = ∑ ( 𝑛𝑐 ) − = + + − = 𝟕𝟎. 𝟒
𝑐 𝑛 6 4 5 15

SSE = SS total – SST = 152.933 – 70.4 = 82.533


Al insertar estos valores en una tabla ANOVA y calcular el valor de F se tiene:
Tabla ANOVA
Fuente de Suma de Grados de Cuadrado F
variación cuadrados libertad medio
Tratamientos SST = 70.4 k-1 = 3- SST/(k- MST/MSE=5.12
Error SSE = 82.533 1=2 1)=35.2
Total SStotal = n-k=15- SSE/(n-
152.933 3=12 k)=6.878
n-1=14

El valor calculado para F es 5.12, que es mayor que el valor crítico 3.89, por tanto
se rechaza la hipótesis nula. Se concluye que las medias poblacionales no son
iguales. Los tratamientos promedio no son iguales en los tres grupos de
evaluación. Por ahora sólo se puede concluir que hay una diferencia entre las
medias de tratamiento.

ANOVA unidireccional: tratamiento1; tratamiento2; tratamiento3

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


Factor 3 tratamiento1; tratamiento2; tratamiento3

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Factor 2 70.40 35.200 5.12 0.025
Error 12 82.53 6.878
Total 14 152.93

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
2.62255 46.03% 37.04% 12.12%

Medias

Factor N Media Desv.Est. IC de 95%


tratamiento1 6 9.667 1.751 (7.334; 11.999)
tratamiento2 4 15.00 3.37 (12.14; 17.86)
tratamiento3 5 12.60 2.88 (10.04; 15.16)

Desv.Est. agrupada = 2.62255

Gráfica de intervalos de tratamiento1; tratamiento2; ...


95% IC para la media

18

16

14
Datos

12

10

6
tratamiento1 tratamiento2 tratamiento3
La desviación estándar agrupada se utilizó para calcular los intervalos.
EJERCICIO
Una compañía de desarrollos inmobiliarios considera la inversión en un centro
comercial en las afueras de Atlanta, Georgia. Se evalúan tres terrenos. El ingreso
de los pobladores de la zona aledaña al centro comercial es de especial
importancia. Se selecciona una muestra aleatoria de cuatro familias que viven
cerca de cada terreno. A continuación se presentan los resultados muestrales.
Al nivel de significancia de 0.05, ¿ puede concluir la compañía que hay diferencia
en los ingresos promedio? Utilice el procedimiento usual de cinco pasos para
prueba de hipótesis.

Southwyck Parque Franklin Old Orchard


(miles US$) (miles US$) (miles US$)
64 74 75
68 71 80
70 69 76
60 70 78

Se seguirá el procedimiento usual de cinco pasos para la prueba de hipótesis.


Paso 1: Plantear la hipótesis nula y la hipótesis alternativa
𝐻0 : µ1 = µ2 = µ3
𝐻1 : 𝐿𝑜𝑠 𝑖𝑛𝑔𝑟𝑒𝑠𝑜𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑛𝑜 𝑠𝑜𝑛 𝑡𝑜𝑑𝑜𝑠 𝑖𝑔𝑢𝑎𝑙𝑒𝑠.
Paso 2:
Establecer nivel de significancia.
α = 0.05
Paso 3: Determinar el estadístico de prueba. Estamos ante una distribución
F, ANOVA.
Paso 4: Establecer la regla de decisión.
Grados de libertad para el numerador = k – 1 = 3 – 1 = 2
Grados de libertad para el numerador = n - k = 12 – 3 = 9
Intersectando en la tabla, encontramos el valor de 4.26. Así que la regla de
decisión es rechazar la 𝐻0 si el valor calculado para F es mayor que 4.26.
Paso 5: Seleccionar muestra, realizar los cálculos y tomar una decisión.

Southwyck Parque Old Total


(miles US$) Franklin Orchard
(miles US$) (miles US$)
𝑋 𝑋2 𝑋 𝑋2 𝑋 𝑋2
64 4096 74 5476 75 5625
68 4624 71 5041 80 6400
70 4900 69 4761 76 5776
60 3600 70 4900 78 6084

𝑇𝑐 262 284 309 855


𝑛𝑐 4 4 4 12
𝑋2 1722 2017 2388 61283
0 8 5

Las entradas para la tabla ANOVA se calculan como sigue.


(∑ 𝑋)2 8552
SS total = ∑ 𝑋 2 − = 61283 − = 𝟑𝟔𝟒. 𝟐𝟓
𝑛 12

𝑇2 (∑ 𝑋)2 2622 2842 3092 8552


SST = ∑ ( 𝑛𝑐 ) − = + + − = 𝟐𝟕𝟔. 𝟓
𝑐 𝑛 4 4 4 12

SSE = SS total – SST = 364.25 – 276.5 = 87.75


Al insertar estos valores en una tabla ANOVA y calcular el valor de F se tiene:
Tabla ANOVA
Fuente de Suma de Grados de Cuadrado F
variación cuadrados libertad medio
Tratamientos SST = 276.5 k-1 = 3- SST/(k- MST/MSE=14.18
Error SSE = 87.75 1=2 1)=138.25
Total SStotal = n-k=12- SSE/(n-
364.25 3=9 k)=9.75
n-1=12-
1=11

El valor calculado para F es 14.18, que es mayor que el valor crítico 4.26, por
tanto se rechaza la hipótesis nula. Se concluye que las medias poblacionales no
son iguales. Los ingresos promedio no son iguales en los tres grupos de
evaluación. Por ahora sólo se puede concluir que hay una diferencia entre las
medias de tratamiento.

ANOVA unidireccional: tratamiento1; tratamiento2; tratamiento3

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


Factor 3 tratamiento1; tratamiento2; tratamiento3

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Factor 2 70.40 35.200 4.26 0.025
Error 12 82.53 6.878
Total 14 152.93

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
2.62255 46.03% 37.04% 12.12%

Medias

Factor N Media Desv.Est. IC de 95%


tratamiento1 6 9.667 1.751 (7.334; 11.999)
tratamiento2 4 15.00 3.37 (12.14; 17.86)
tratamiento3 5 12.60 2.88 (10.04; 15.16)

Desv.Est. agrupada = 2.62255

ANOVA unidireccional: SouthWyck; Parque Flanklin; Old Orchard

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


Factor 3 SouthWyck; Parque Flanklin; Old Orchard

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Factor 2 276.50 138.250 14.18 0.002
Error 9 87.75 9.750
Total 11 364.25

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
3.12250 75.91% 70.56% 57.17%

Medias

Factor N Media Desv.Est. IC de 95%


SouthWyck 4 65.50 4.43 (61.97; 69.03)
Parque Flanklin 4 71.00 2.16 (67.47; 74.53)
Old Orchard 4 77.25 2.22 (73.72; 80.78)

Desv.Est. agrupada = 3.12250

Gráfica de intervalos de SouthWyck; Parque Flank; ...


95% IC para la media

80

75
Datos

70

65

60
SouthWyck Parque Flanklin Old Orchard
La desviación estándar agrupada se utilizó para calcular los intervalos.

ANALISIS DE VARIANZA EN DOS DIRECCIONES (ANOVA II)


1. Cada una de las tres cadenas de supermercados en la región de Denver
indica que ofrece los precios más bajos. Como parte de un estudio de
investigación sobre publicidad de supermercados, el diario Denver Daily
News realizó un estudio. Primero selecciono una muestra aleatoria de
nueve artículos comestibles. Después se revisó el precio de cada uno de
estos productos en cada una de las tres cadenas, el mismo día. Al nivel
de significancia 0.05, ¿hay alguna diferencia en los precios medios de los
supermercados y de los artículos?
Articulo Super$ Ralph’s Lowblaws
1 $ 1.12 $ 1.02 $ 1.07
2 1.14 1.10 1.21
3 1.72 1.97 2.08
4 2.22 2.09 2.32
5 2.40 2.10 2.30
6 4.04 4.32 4.15
7 5.05 4.95 5.05
8 4.68 4.13 4.67
9 5.52 5.46 5.86

Solución:
Se seguirá el procedimiento usual de cinco pasos para la prueba de hipótesis.
Paso 1: Plantear la hipótesis nula y la hipótesis alternativa
Los dos conjuntos de hipótesis son:
1.
𝐻0 : µ1 = µ2 = µ3
𝐻1 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

2.
𝐻0 : µ1 = µ2 = µ3
𝐻1 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑑𝑒 𝑏𝑙𝑜𝑞𝑢𝑒 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Paso 2: Establecer nivel de significancia. α = 0.05
Paso 3: Determinar el estadístico de prueba. Estamos ante un ANOVA de dos
direcciones.

Paso 4: Establecer la regla de decisión.


a) Primero se probara la hipótesis relativa a las medidas de tratamiento:
Grados de libertad para el numerador = k – 1 = 3 – 1 = 2
Grados de libertad para el numerador = (b-1)*(k-1) = (3-1)*(9-1)= 16
Intersectando en la tabla, encontramos el valor de 3.63. Así que la regla de
decisión es rechazar la 𝐻0 si el valor calculado para F es mayor que 3.63
(Fcrit>3.63).
b) Luego se realizará la prueba de hipótesis a las medidas de bloques:
Grados de libertad para el numerador = b – 1 = 9 – 1 = 8
Grados de libertad para el numerador = (b-1)*(k-1) = (3-1)*(9-1)= 16
Intersectando en la tabla, encontramos el valor de 2.59. Así que la regla de
decisión es rechazar la 𝐻0 si el valor calculado para F es mayor que 2.59
(Fcrit>2.59).
Paso 5: Seleccionar muestra, realizar los cálculos y tomar una decisión.

Articulo Super$ Ralph’s Lowblaws


2 2
X 𝑋 X 𝑋 X 𝑋2 Suma
reglones
Bt
1 $ 1.12 1.2544 $ 1.02 1.0404 $ 1.07 1.1449 3.21
2 1.14 1.2996 1.10 1.21 1.21 1.4641 3.45
3 1.72 2.9584 1.97 3.8809 2.08 4.3264 5.77
4 2.22 4.9284 2.09 4.3681 2.32 5.3824 6.63
5 2.40 5.76 2.10 4.41 2.30 5.29 6.8
6 4.04 16.3216 4.32 18.6624 4.15 17.2225 12.51
7 5.05 25.5025 4.95 24.5025 5.05 25.5025 15.05
8 4.68 21.9024 4.13 17.0569 4.67 21.8089 13.48
9 5.52 30.4704 5.46 29.8116 5.86 34.3396 16.84
Total 27.89 27.14 28.71 83.74
columna
Suma de 110.3977 104.9428 116.4813 331.8218
cuadrados

(∑ 𝑋)2
2
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑋 −
𝑛
83.742
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 331.8218 − = 72.1037
27

𝑇𝑐 2 ∑ 𝑋2
𝑆𝑆𝑇 = ∑( ) −
𝑛𝑐 𝑛
27.892 27.142 28.712 83.742
𝑆𝑆𝑇 = + + − = 0.1370
9 9 9 27

𝐵𝑡 2 ∑ 𝑋2
𝑆𝑆𝐵 = ∑( ) −
𝑘 𝑛
3.212 3.452 5.772 6.632 6.82 12.512 15.052 13.482
𝑆𝑆𝐵 = + + + + + + +
3 3 3 3 3 3 3 3
16.842 83.742
+ − = 71.6136
3 27

𝑆𝑆𝐸 = 𝑆𝑆𝑇𝑜𝑡𝑎𝑙 − 𝑆𝑆𝑇 − 𝑆𝑆𝐵


𝑆𝑆𝐸 = 72.1037 − 0.1370 − 71.6136 = 0.3531

𝑀𝑆𝑇 = 𝑆𝑆𝑇/(𝑘 − 1)
0.1370
𝑀𝑆𝑇 = = 0.0685
2

𝑀𝑆𝐵 = 𝑆𝑆𝐵/(𝑏 − 1)
71.6136
𝑀𝑆𝐵 = = 8.9517
8

𝑀𝑆𝐸 = 𝑆𝑆𝐸/(𝑘 − 1)(𝑏 − 1)


0.3531
𝑀𝑆𝐸 = = 0.0221
16

Fuente de Suma de Grados de Cuadrado medio


variación Cuadrados Libertad
Tratamientos 0.1370 2 0.0685
Bloques 71.6136 8 8.9517
Error 0.3531 16 0.0221
Total 72.1037

𝑀𝑆𝑇 0.0685
𝐹𝑐𝑟𝑖𝑡 = = = 3.0995
𝑀𝑆𝐸 0.0221
No se rechaza la hipótesis nula de medias de tratamiento ya que del F hallado
en menor que 3.63. Se concluye que los precios no difieren en todas las
tiendas

𝑀𝑆𝐵 8.9517
𝐹𝑐𝑟𝑖𝑡 = = = 405,0543
𝑀𝑆𝐸 0.0221
Se rechaza la hipótesis nula de medias de bloques ya que el F hallado es
mayor que 2.59. Se concluye que hay diferencia entre los artículos
observados.

ANOVA bidireccional: Super$; Ralph s; Lowblaws

Método

Hipótesis nula Todas las medias son iguales


Hipótesis alterna Por lo menos una media es diferente
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

Información del factor

Factor Niveles Valores


Factor 3 Super$; Ralph s; Lowblaws

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Factor 2 0.1370 0.06851 3.0995 0.002
Error 8 71.9667 2.99861 405.0543
Total 16 72.1037

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.73165 0.19% 0.00% 0.00%

Medias

Factor N Media Desv.Est. IC de 95%


Super$ 9 3.099 1.731 (1.908; 4.290)
Ralph s 9 3.016 1.699 (1.824; 4.207)
Lowblaws 9 3.190 1.764 (1.999; 4.381)
PROBLEMAS UTILIZANDO METODOS NO PARAMETRICOS
PRUEBA DEL SIGNO

PROBLEMA

Una gran cadena de tiendas departa La dirección de una empresa recomendó


realizar una capacitación de computación en planta para los gerentes, con el
objeto de mejorar su conocimiento, en contabilidad, mantenimiento,
producción y otras operaciones. Se eligió al azar una muestra de 15 gerentes.
El nivel general de capacidad de cada uno en cuánto a la técnica
computacional lo determino un grupo de expertos antes de que principiara el
programa. Su capacidad y comprensión se evaluaron como sobresalientes,
excelentes, buenas, aceptables o deficientes. Después del programa de
entrenamiento de tres meses, el mismo grupo de expertos en computación
evaluó de nuevo a cada gerente. Las dos evaluaciones antes y después se
indican junto con el signo de la diferencia. El signo + indica mejoría, y el signo
- señala que la capacidad computacional declinó después del programa de
entrenamiento.

NOMBRE ANTES DESPUES DIFERENCIA


José Bueno Sobresaliente +
Omar Aceptable Excelente +
Modesto Excelente Bueno -
Miguel Deficiente Bueno +
Wilson Excelente Excelente 0
Edwin Bueno Sobresaliente +
Pedro Deficiente Aceptable +
Luis Excelente Sobresaliente +
Josué Bueno Deficiente -
Bruno Deficiente Bueno +
David Bueno Sobresaliente +
Washington Aceptable Excelente +
Steve Bueno Aceptable -
Rolando Bueno Sobresaliente +
Santiago Deficiente Bueno -

Se tiene interés en determinar si dicho programa de entrenamiento en planta fue


efectivo para mejorar la capacidad de los gerentes en materia de computación. Con
un nivel de significancia de 0.10 ¿Tales funcionarios son más aptos después de tomar
el programa de capacitación, que antes?

Solución:
1) H0 : p = 0.5 (no hay cambio en la capacidad como resultado de la capacitación)
Ha: p > 0.5 (se incrementó la capacidad como resultado de la capacitación)
2) α= 0.1
3) prueba binomial

NUMERO DE EXITOS PROBABILIDAD DE EXITO PROBABILIDAD


ACUMULADA
0 0.000 1.000
1 0.001 0.999
2 0.006 0.998
3 0.022 0.992
4 0.061 0.970
5 0.122 0.909
6 0.183 0.787
7 0.209 0.604
8 0.183 0.395
9 0.122 0.212
10 0.061 0.090
11 0.022 0.029
12 0.006 0.007
13 0.001 0.001
14 0.000 0.000

4) RA: < 2 – 10 >


RC: [10 – 12]
5) Cantidad de signos “+” = 10
Como 10 pertenece a la RC → Rechazo la HO y acepto la Ha.

Interpretación:
Se incrementó la capacidad como resultado de la capacitación.

Prueba de signos : Programa de capacitación

Prueba del signo de la mediana = 0.50000 vs. > 0.50000

N Debajo Igual Arriba P


Dif01 15 4 1 10 0.090

PROBLEMAS

Cornwall & Hudson, desea vender solo una marca de reproductor de discos
compactos de alta calidad. La lista de equipos reproductores de CD’s se ha
reducido a dos marcas: Sony y Pioneer. Para ayudar en la toma de decisión, se
reunió a un grupo de 16 expertos en audio. Se hizo la reproducción de un pasaje
musical usando componentes Sony (marcados A). Después se reprodujo el
mismo pasaje utilizando componentes Pioneer (marcados B). Un signo “+” en la
tabla siguiente indica la preferencia de una persona por los componentes Sony,
y un signo “-“ señala predilección por Pioneer, y un 0 significa que no hay
preferencia.

Experto
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
+ - + - + + - 0 - + - + + - + -

Realice una prueba de hipótesis al nivel de significancia 0.10 para determinar si


hay diferencia en la preferencia entre las dos marcas.

Solución:

Si p indica la proporción de la población de expertos en audio que favorecen a


Sony, se trata de probar los siguientes supuestos:
𝐻0 : 𝑝 = 0.50
𝐻1 : 𝑝 ≠ 0.50
Si no se puede rechazar Ho no tendremos pruebas que indiquen que hay
preferencia hacia una marca. Sin embargo, si se puede rechazar Ho, podremos
concluir que las preferencias de los expertos en audio son distintas hacia las dos
marcas. En este caso, la marca que seleccione la mayor cantidad de expertos
en audio será la más preferida.

Como podemos observar el experto en audio 8 no expreso su preferencia por lo


tanto eliminamos su observación reduciéndose el número de muestra a 15.

Con un tamaño de muestra n = 15, las probabilidades de la binomial con p = 0.50


son las que aparecen en la siguiente tabla:

Experto Probabilidad
0 0.000031
1 0.000458
2 0.003204
3 0.013885
4 0.041656
5 0.091644
6 0.152740
7 0.196381
8 0.196381
9 0.152740
10 0.091644
11 0.041656
12 0.013885
13 0.003204
14 0.000458
15 0.000031

𝛼= 0.10, tendríamos una región de rechazo cuya área aproximada fuera 0.05 en
cada extremo de la distribución. Si iniciamos en el extremo inferior de la
distribución, vemos que la probabilidad de obtener cero, uno, dos o tres signos
positivos es 0.000031 + 0.000458 + 0.003204 + 0.013885 = 0.017578, que es
menor que 0.05.
En consecuencia, adoptaremos la siguiente regla de rechazo:
Rechazar H0 si el número de signos positivos es menor que 4 o mayor que 11.

Como se han observado 8 signos positivos, no se rechaza la hipótesis nula. No


hay preferencia con respecto a las dos marcas de componentes.
Test and CI for One Proportion: datos

Test of p = 0.5 vs. p not = 0.5

Event = 1
Variable X N Sample p 90% CI Z-Value P-Value
datos 8 15 0.533333 (0.321456, 0.745211) 0.26 0.796

Using the normal approximation.

Usando el Minitab el valor de p es 0.796 el cual es mayor al nivel de significancia


𝛼 = 0.10 por lo tanto no se rechaza la hipótesis nula. No hay preferencia con
respecto a las dos marcas de componentes.

Você também pode gostar