Você está na página 1de 32

Capítulo 9

Análise de Variância - ANOVA

Objetivos do Capítulo

Este capítulo fornece métodos para comparar as médias de mais de duas populações.
Serão estudados dois métodos denominados Análise de variância para 1 fator e
Análise de variância para 2 fatores. Esses métodos utilizam uma distribuição chamada
distribuição F que será vista em primeiro lugar. Após o término deste capítulo, você
deverá ser capaz de:

1. Entender o termo análise de variância.


2. Determinar áreas sob a curva F.
3. Aplicar o procedimento ANOVA para experimentos completamente aleatorizados
4. Verificar validade do modelo estatístico
5. Aplicar o procedimento ANOVA para experimentos blocos aleatorizados
6. Aplicar o procedimento ANOVA para experimentos quadrados latinos

179
9.1) Distribuição F

O procedimento de análise de variância utiliza uma classe de distribuição contínua de


probabilidades, denominada distribuição F. As probabilidades para uma variável aleatória que
possui uma distribuição F são iguais às áreas sob a curva F, da mesma forma como definimos
para distribuições normais e distribuições t. Relembremos que uma curva t depende do número
de graus de liberdade (df ou GL). Uma curva F também depende do número de graus de
liberdade, porém existem dois graus de liberdade em vez de um. Na figura 9.1, estão desenhadas
duas curvas F, uma com df = (10,2) e outra com df = (9,50). O primeiro número é denominado
graus de liberdade do numerador e o segundo, graus de liberdade do denominador.

Figura 9.1 – Distribuição F.

Algumas propriedades das curvas F

1. A área total sob a curva é igual a 1.


2. Uma curva F começa no zero e se estende indefinidamente para a direita, se aproximando de
zero à medida que a variável cresce.
3. Uma curva F não é simétrica. Ela sobe rapidamente com F e desce se aproximando do eixo
horizontal mais suavemente.

Usando as curvas F

As áreas sob as curvas F podem ser encontradas em tabelas. Normalmente elas são usadas
para um valor  igual a 0,01 ou 0,05 o que nos conduz à notação F0,01 e F0,05 para indicar os
valores de F que definem uma área de 0,01 ou 0,05 à sua direita, respectivamente. A tabela 9.1
fornece os valores para F0,01. No topo da tabela estão especificados os graus de liberdade para o
numerador e na coluna à esquerda, os graus de liberdade para o denominador. A tabela 9.2 é
similar à tabela 9.1, fornecendo os valores para F0,05.

180
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 à direita de F.

Graus de Liberdade para o Numerador

1 2 3 4 5 6 7 8 9

1 4052.00 4999.50 5403.00 5625.00 5764.00 5859.00 5928.00 5981.00 6022.00


2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98
Graus de Liberdade para o Denominador

7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72


8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41

181
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 (continuação).

Graus de Liberdade para o Numerador


10 12 15 20 24 30 40 60 120 
1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
Graus de Liberdade para o Denominador

8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00

182
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 à direita de F.

Graus de Liberdade para o Numerador


1 2 3 4 5 6 7 8 9
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
Graus de Liberdade para o Denominador

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39


9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
10 4.96 4.10 3.71 3.48 3.33 3.32 3.14 3.07 3.02
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96
 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88

183
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 (continuação).

Graus de Liberdade para o Numerador


10 12 15 20 24 30 40 60 120 
1 241.90 243.90 245.90 248.00 249.10 250.10 251.10 252.20 253.30 254.30
2 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
Graus de Liberdade para o Denominador

9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 2.20 2.13 2.06 1.97 1.93 1.93 1.88 1.79 1.73 1.67
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00

184
Exemplo 9.1 – Ilustra o uso das tabelas

Para uma curva F com df = (4,12) determine F0,05.

Solução

Determinar F0,05 significa encontrar o valor de F de modo que a área à sua direita seja
igual a 0,05, como mostrado na figura 9.2.

Figura 9.2 – Curva F com df = (4,12).

Para obter o valor de F pedido podemos usar a tabela 9.2. Neste exemplo, o número de
graus de liberdade para o numerador é 4 e para o denominador é 12. Assim, procuramos pela
intersecção da coluna contendo o valor 4 com a linha contendo o valor 12 e encontramos o valor
3,26, que é o valor pedido, ou seja, F0,05 = 3,26.

Exercícios – Seqüência 9.1

1) Uma curva F tem df = (12,7). Qual é o número de graus de liberdade para


a) o numerador?
b) o denominador?

2) Para uma curva F com df = (12,5) determine o valor de F com


a) área 0,01 à sua direita
b) área 0,05 à sua direita

185
9.2 - Análise de variância para um fator

A análise de variância é um procedimento de inferência que é usado para comparar as


médias de diversas populações. Justifica-se a palavra “variância” no termo análise de variância
pelo fato do procedimento usado para comparar as médias envolver um estudo da variação ou
variabilidade dos dados contidos nas amostras.

A variabilidade que usualmente é encontrada na amostra é chamada variação dentro do


grupo, variabilidade aleatória ou erro. Isto não significa que um engano foi cometido na
coleta dos dados. O termo é um jargão estatístico para designar a variabilidade natural ou
aleatória que ocorre com os dados da amostra coletada. Por exemplo, a variação da vida de uma
ferramenta de corte quando se faz ensaios de corte com um material, ou a resistência à ruptura de
um material quando fazemos testes de tração.

Nesta seção veremos o procedimento adotado para comparar as médias considerando-se


apenas um fator ou tratamento. O termo fator (tratamento) significa a variável que pode estar
influenciando os valores coletados das amostras, ou seja, ele se refere a uma condição ou
estímulo a que um determinado grupo está exposto. Isto poderia ser uma determinada droga, um
novo método de fazer dieta ou um novo método de ensino.

Suponha a existência de três grupos (ou amostras), cada um sujeito a um tratamento,


como mostrado na tabela 9.3. Neste caso, podemos ver que não há variação nos dados dentro dos
grupos. A única variação ocorre entre as médias dos grupos e isto nos permite especular que os
tratamentos aplicados aos grupos têm influência na variação observada.

Estudando agora a tabela 9.4, já vemos uma situação mais comum onde uma variação
aleatória é encontrada dentro dos grupos.Vemos também que existe uma variação entre as
médias dos três grupos. Em virtude da variação dentro dos grupos, não é mais possível tirar
conclusões sobre o efeito dos diferentes tratamentos a que os grupos foram submetidos.

O ponto importante é que qualquer variação observada entre as médias dos grupos
consiste de (1) uma componente que é devido à variação dentro do grupo e (2) uma componente
que é devido a um possível efeito do tratamento.

Tabela 9.3 – Dados relativos a três tratamentos sem variação dentro dos grupos.
Tratamentos
1 2 3
6 9 13
6 9 13
6 9 13
6 9 13
6 9 13
_ _ _
x1 = 6 x1 = 9 x1 = 13

Se a variabilidade total entre os grupos consiste dessas duas componentes então nós
devemos, de alguma maneira, separar, avaliar e comparar essas duas componentes. Neste
processo, se nós encontrarmos que a variação entre os grupos não é maior que a variação
aleatória (ou erro) dentro dos grupos, então a conclusão será que os diferentes tratamentos não

186
têm um efeito significativo sobre os resultados e a variabilidade total é devida à variação
aleatória natural dos processos envolvidos na experimentação.

Tabela 9.4 – Dados relativos a três tratamentos com variação dentro dos grupos.
Tratamentos
1 2 3
6 3 5
4 8 6
7 4 4
3 5 6
5 9 3
_ _ _
x1 = 5 x1 = 5,8 x1 = 4,8

Cálculo da variabilidade

O procedimento ANOVA se baseia na determinação da variabilidade total dos dados, na


variabilidade dentro dos grupos e na variabilidade entre os grupos (médias dos grupos). A
variabilidade total, denominada soma de quadrados total (SQT) é dada por:

k n
 _

2
( x ) 2

SQT =   xij − x..  =  x 2 − (9.1)


j =1 i =1   nT

_
1 k n
e x.. =  xij , onde
nk j =1 i =1
(9.2)

_
x.. = média de todas as medidas
k = número de grupos
n = número de medidas (ou dados) por grupo
nT = n  k = número total de medidas ou observações
i = 1, 2, ..., n e j = 1, 2, ..., k

A variabilidade entre os grupos (ou tratamentos), denominada soma de quadrados entre


grupos (SQG) é dada por:

 k n 
  xij 
2
1 k  n
2  
 _ _ 
SQG = n  x j − x..  =    xij  −  
k
j =1 i =1
(9.3)
j =1   n j =1  i =1  n T

_
onde x j é a média do grupo j ( j = 1, 2, .., k)

Obs: se o número de medidas ou observações não for o mesmo para todos os grupos, isto é, se
tivermos n1 medidas no grupo 1, n2 medidas no grupo 2 e assim por diante, até nk medidas no
grupo k, então SQG será calculado de acordo com a expressão

187
2
 nj   k nj 
  xij    xij 
 i =1   
  −  j =1 i =1 
k
SQG =  (9.4)
j =1 nj nT

Ou, mais simplificadamente por

( x ) ( x ) 2 2
( x ) ( x )
2 2

SQG = + +  + −
1 2 k
(9.5)
n1 n2 nk nT

onde

xk = soma das medidas do grupo k


x = soma de todas as medidas

A variabilidade dentro de cada grupo é denominada soma de quadrados dos grupos ou


soma de quadrados dos erros (SQE) e é facilmente calculada por

2
k
 _n

SQE =   xij − x j  (9.6)
j =1 i =1  

_
onde x j é a média das observações do j-ésimo grupo ou amostra.

Se as médias das k populações forem iguais então toda a variabilidade medida pela
expressão (9.1) é devida ao acaso. Porém, se forem diferentes então parte da variabilidade é
proveniente da variabilidade natural dentro do grupo e parte devido à aplicação dos diferentes
tratamentos. Podemos demonstrar que a variabilidade total é igual à soma das variabilidades
dentro dos grupos e entre os grupos, ou seja,

SQT = SQG + SQE

2 2 2
k n
 _
 k
 _ _ k n
 _

  ij
j =1 i =1 
x − x .. 

= n   j ..    xij − x j 
j =1 
x − x

+
j =1 i =1  
(9.7)

Cada uma das somas de quadrados tem um grau de liberdade associado a ela, conforme
mostrado na tabela 9.5.

Tabela 9.5 – Graus de liberdade das somas de quadrados.


Graus de liberdade
Termo Amostras de mesmo tamanho n Amostras de tamanhos diferentes
SQT nT –1 = nk -1 nT -1
SQG k-1 k-1
SQE (nk – 1) – (k – 1) = k(n-1) nT – k

188
Dividindo cada uma das somas de quadrados SQT, SQG e SQE pelos respectivos graus
de liberdade, obtemos os quadrados médios, que são então dados por:

SQG
Quadrado médio entre grupos = QMG =
k −1

SQE
Quadrado médio dos erros = QME =
nT − k

Conforme mencionado, nós decidiremos se a variação entre as médias das amostras


(QMG) é grande o bastante para concluir que existe alguma diferença entre elas, pela
comparação com a variação existente dentro das amostras (QME). Portanto, a idéia é a seguinte:
QME é uma estimativa da variância comum das populações em estudo. Assim, se QMG é grande
relativo a QME, então podemos inferir que a variação entre as médias das amostras é devida a
diferenças entre as médias das populações e não da variação dentro das populações. Desta forma,
usamos a variável aleatória

QMG
F=
QME

como a estatística de teste. Grandes valores de F indicam que QMG é grande relativo a QME e
assim, que a hipótese de médias de populações iguais deve ser rejeitada. O procedimento de
análise de variância será explicado com base no exemplo a seguir.

Exemplo 9.2 – Ilustra ANOVA com um fator

Um fisioterapeuta deseja comparar os efeitos de três diferentes técnicas de fisioterapia no


progresso de pacientes idosos, que sofreram paralisia parcial devido a um ataque do coração de
média intensidade. Um total de 18 pacientes foi selecionado procurando manter constantes
parâmetros como idade, condição física, motivação, etc.. Esses pacientes foram divididos
aleatoriamente em três grupos e, após um período de seis meses, eles foram avaliados por um
especialista que não tinha conhecimento a que grupo pertencia cada paciente. Os dados obtidos,
juntamente com algumas estatísticas, estão resumidos na tabela 9.5.

Tabela 9.5 – Dados da avaliação dos pacientes.


Grupos de Terapia
Terapia A Terapia B Terapia C
80 56 97
73 72 90
79 61 75
88 64 87
68 80 88
75 74 83
_ 2 _ 2 _ 2
x A = 77,17 ; s A = 46.97 x B = 67,83 ; s B = 80,97 xC = 86,67 ; sC = 53,87
xA = 463 ; nA = 6 xB = 407 ; nB = 6 xC = 520; nC = 6
x = 109312
2
x = 1390 nT = 18 k=3

189
Com um nível de significância de 5%, existe alguma diferença nas médias dos três
tratamentos?

Solução

1) Queremos saber se há alguma diferença entre as médias das populações representadas por
cada um dos três grupos. Assim a hipótese nula é

Ho: A = B = C

2) A Hipótese alternativa será escrita da seguinte forma

Ha: Ao menos uma diferença existe entre as médias das populações

3) O nível de significância será definido em 5% conforme o enunciado.


4) Cálculo das somas dos quadrados (SQT, SQG E SQE).

( x ) 2
1390 2
SQT =  x − 2
= 109312 − = 1973,11
n T 18

( x ) ( x ) ( x ) ( x )
2 2 2 2

SQG = + + −
A B C

nA nB nC nT

SQG =
(463)2 + (407)2 + (520)2 − 107338,89 = 1064,11
6 6 6

SQE = SQT – SQG = 1973,11 – 1064,11 = 909

5) Graus de liberdade

GLT = nT – 1 = 18 – 1 = 17
GLG = k – 1 = 3 – 1 = 2
GLE = GLT – GLG = 17 – 2 = 15

6) Cálculo da estatística

Dividindo-se a soma dos quadrados pelos respectivos graus de liberdade obtém-se as


estimativas das variâncias (quadrados médios).

SQG 1064 ,11


QMG = = = 532 ,06
GLG 2

SQE 909
QME = = = 60 ,60
GLE 15

190
7) Cálculo de F e tabela ANOVA

QMG 532,06
F2,15 = = = 8,78
QME 60,60

Um resumo dos valores obtidos até agora pode ser mostrado na tabela 9.6.

Tabela 9.6 – Exemplo de uma tabela ANOVA.

Fonte GL SQ MQ F[2,15]

Grupos 2 1064,11 532,06 8,78

Erro 15 909,00 60,60

Total 17 1973,11

8) Rejeite ou deixe de rejeitar Ho

Da tabela 9.2, no cruzamento da coluna 2 com linha 15 obtemos o valor F 0,05 igual a 3,68,
para um nível de confiança de 5%. Como o valor de F obtido no passo anterior foi de
8,78, portanto maior que 3,68, concluímos que podemos rejeitar Ho. Isto significa que
temos evidências de que existe pelo menos uma diferença estatisticamente significativa
entre os três pares do grupo de médias.

A tabela mostrada no exemplo acima pode ser generalizada como mostrado na tabela 9.7.

Tabela 9.7 – Formato da tabela para análise de variância.


Fonte GL SQ QM=SQ/GL Estatística F
Tratamento ou k-1 SQG SQG QMG
QMG = F=
Grupo k −1 QME
Erro nT - k SQE SQE
QME =
nT − k
Total nT -1 SQT

O procedimento completo para a aplicação de análise de variância é dado a seguir com


fórmulas simplificadas a fim de facilitar sua aplicação.

191
Procedimento 9.1 – Aplicar ANOVA para k médias de populações
Amostras independentes
Populações normais
Populações com mesmo desvio padrão

Passo 1 – Escreva as hipóteses nula e alternativa


Passo 2 – Defina o nível de significância .
Passo 3 – O valor crítico é F, com GL = (k-1, n-k), onde n é o número total de dados

Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas

( x ) 2

SQT =  x − 2

n T

( x ) ( x ) 2 2
( x ) ( x )
2 2

SQG = + +  + −
1 2 k

n1 n2 nk nT

SQE = SQT - SQG

onde, j =1, 2, 3, ..., k e


nj = tamanho da amostra para a população j
xj = soma dos valores da amostra j

Passo 5 – Construa a tabela ANOVA

Fonte GL SQ QM=SQ/GL Estatística F


Tratamento ou k-1 SQG SQG QMG
QMG = F=
Grupo k −1 QME
Erro nT - k SQE SQE
QME =
nT − k
Total nT -1 SQT

Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.

Passo 7 – Escreva sua conclusão.

192
Exemplo 9.3 – Ilustra o procedimento 9.1

Os tempos requeridos por três trabalhadores para realizar uma tarefa em uma linha de montagem
foram cronometrados em cinco ocasiões aleatoriamente escolhidas. Os tempos são dados na
tabela abaixo, aproximados para o inteiro mais próximo.

José Marcos Pedro


8 8 10
10 9 9
9 9 10
11 8 11
10 10 9

Com um nível de significância de 5% podemos afirmar que existe uma diferença na


média dos tempos dos três trabalhadores?

Solução

Passo 1 – Hipóteses
Ho: 1 = 2 = 3
Ha: Ao menos uma diferença existe entre as médias das populações

Passo 2 – Nível de significância  = 0,05

Passo 3 – Valor crítico F0,05 = 3,89, pois GL = (2, 12)

Passo 4 – Cálculo das somas de quadrados

( x ) 2

SQT =  x − 2
= 1339 – (141)2/ 15 = 1339 – 1325,4 = 13,6
n T

( x ) ( x ) 2 2
( x ) ( x )
2 2

SQG = + +  + −
1 2 k
= (48)2/5 + (44)2/5 + (49)2/5 – 1325,4
n1 n2 nk nT

SQG = 460,8 + 387,2 + 480,2 – 1325,4 = 1328,2 – 1325,4 = 2,8

SQE = SQT – SQG = 13,6 – 2,8 = 10,8

Passo 5 – Tabela ANOVA

Fonte GL SQ QM=SQ/GL Estatística F


Tratamento ou 2 2,8 1,4 1,55
Grupo
Erro 12 10,8 0,9
Total 14 13,6

193
Passo 6 – O valor da estatística (1,55) é menor que o valor crítico (3,74) e, portanto, não
devemos rejeitar Ho.

Passo 7 – Os dados obtidos não fornecem evidências para concluir que o tempo médio gasto
pelos funcionários, para desempenhar a tarefa de montagem, sejam diferentes.

Exercícios – Seqüência 9.2

1) Um criador de porcos deseja testar três diferentes dietas desenvolvidas para maximizar o
ganho de peso. O criador seleciona aleatoriamente 12 porcos e os divide em três grupos,
também de maneira aleatória. A cada um dos grupos é aplicado um dos programas de dieta.
O ganho de peso para cada porco, em Kg, após um período de seis semanas é dado pela
tabela abaixo.

Dieta A Dieta B Dieta C


10,5 11,5 9,8
10,9 10,9 10,5
10,7 11,8 10,4
10,3 11,8 10,5

Com um nível de significância de 5% podemos afirmar que existe uma diferença na média
dos pesos das três dietas aplicadas?

2) As tabelas abaixo são tabelas ANOVA parcialmente preenchidas. Complete os dados


faltantes.
a)

Fonte GL SQ QM=SQ/GL Estatística F


Tratamento ou 2 21,652
Grupo
Erro 84,400 7,03
Total 14

b)

Fonte GL SQ QM=SQ/GL Estatística F


Tratamento ou 2,124 0,708 0,75
Grupo
Erro 20
Total

3) O gerente geral de uma grande cadeia de lojas de conveniência deseja testar os efeitos de três
estratégias de propaganda. As estratégias são:
Estratégia 1 : nenhuma propaganda
Estratégia 2: distribuir panfletos na vizinhança da loja
Estratégia 3: distribuir panfletos e anunciar em jornais
Foram escolhidas aleatoriamente 18 lojas divididas em 3 grupos. Cada grupo usou uma das
três estratégias. A tabela abaixo apresenta valores arrecadados com vendas em um período de

194
1 mês. Os dados coletados proporcionam evidência de que existem diferenças entre as
médias de vendas das três estratégias?

Estratégia 1 Estratégia 2 Estratégia 3


22 21 29
20 25 24
21 25 31
21 20 32
24 22 26
22 26 27

195
9.3 – Adequabilidade do modelo

Como já foi dito, o procedimento ANOVA consiste em comparar a variabilidade


existente dentro das amostras com a variabilidade existente entre as amostras. É usual descrever
as observações por um modelo linear estatístico

xij =  + j + ij (9.8)

onde xij é o valor da i-ésima observação do j-ésimo tratamento,  é a média global, j representa
o efeito do tratamento j e ij é o erro aleatório associado aos xij.

Para o teste de hipóteses, assumimos que os erros ij sejam variáveis aleatórias
independentes e normalmente distribuídas, com média zero e variância 2. A variância 2 é
considerada constante para todos os tratamentos ou níveis do fator em estudo. Como estamos
trabalhando com um único fator, o modelo apresentado acima é denominado modelo de análise
de variância para um fator. Se assumirmos que as observações são feitas de uma forma
completamente aleatória então o planejamento experimental é dito experimento completamente
aleatorizado com um único fator.

O modelo (9.8) pode ainda ser classificado em modelo de efeitos fixos ou modelo de
efeitos aleatórios. O modelo de efeitos fixos ocorre quando fixamos a priori os níveis do fator
estudado. Por exemplo, se queremos analisar o efeito de três técnicas de aprendizado somente,
então os níveis do fator estarão automaticamente fixados. No modelo de efeitos fixos são
testadas hipóteses sobre as médias dos diversos níveis ou tratamentos e as conclusões são válidas
apenas para os níveis escolhidos para análise.

Porém, se dispomos de mais de três técnicas e escolhemos de forma aleatória apenas três
entre as diversas técnicas disponíveis, isto é, se escolhemos uma amostra aleatória da população
de técnicas (níveis do fator) então estaremos tratando com o modelo de efeitos aleatórios. Neste
caso, as conclusões obtidas serão estendidas a todos os níveis do fator e não apenas àqueles
níveis selecionados.

9.3.1 – Verificação da adequação do modelo

O modelo (9.8) assume que os erros ij sejam variáveis aleatórias independentes e
normalmente distribuídas, com média zero e variância 2. Podemos verificar se essas hipóteses
estão satisfeitas através da análise dos resíduos, que são definidos por

_
eij = xij − x j (9.9)

Isto é, os resíduos para o j-ésimo tratamento são determinados subtraindo-se de cada


observação a média correspondente do tratamento. A verificação da adequabilidade do modelo
consiste em construir gráficos onde os resíduos são plotados contra alguns parâmetros. Isto será
mostrado através do exemplo abaixo.

196
Exemplo 9.4 – Ilustra os procedimentos de teste do modelo

Um certo fabricante tem interesse na resistência à tração de uma fibra sintética usada na
fabricação de tecidos para camisas masculinas. Ele suspeita que a resistência é afetada pela
porcentagem de algodão contida na fibra. Cinco níveis de porcentagem de algodão são de
interesse, 15 %, 20 %, 25%, 30% e 35%. Para cada nível, devem ser feitas 5 observações,
perfazendo um total de 25 observações. Um procedimento ANOVA com um único fator deve ser
adotado para testar se a resistência é realmente afetada pela quantidade de algodão presente na
fibra.

Solução

a) Aplicação do procedimento ANOVA

Inicialmente devemos nos preocupar em garantir que o experimento seja completamente


aleatorizado. Para obter uma ordem aleatória das observações suponha que nós numeremos as
observações como mostrado na tabela abaixo.

Tabela 9.8 – Número de ordem das observações


Número de ordem
15 1 2 3 4 5
Porcentagem
de Algodão

20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25

Podemos agora selecionar um número, aleatoriamente, entre 1 e 25. Suponha que este
número seja 8. Então o experimento é realizado, para as condições da observação de número 8
(20% de algodão), obtendo-se em primeiro lugar o valor para esta observação. Repetindo esta
escolha aleatória de números entre 1 e 25 definimos a ordem em que observações serão
coletadas. Isto nos leva à tabela abaixo.

Tabela 9.9 – Sequência de teste.


Sequência Número da % de Sequência Número da % de
de teste observação Algodão de teste observação Algodão
1 8 20 14 7 20
2 18 30 15 1 15
3 10 20 16 24 35
4 23 35 17 21 35
5 17 30 18 11 25
6 5 15 19 2 15
7 14 25 20 13 25
8 6 20 21 22 35
9 15 25 22 16 30
10 20 30 23 25 35
11 9 20 24 19 30
12 4 15 25 3 15
13 12 25

197
As 25 observações são feitas nesta seqüência e os dados obtidos são mostrados na tabela
seguinte.

Tabela 9.10 – Resistência à tração das fibras (lb/in2).


Porcentagem de Algodão
15 20 25 30 35
1 7 12 14 19 7
Observações

2 7 17 18 25 10
3 15 12 18 22 11
4 11 18 19 19 15
5 9 18 19 23 11
Totais 49 77 88 108 54 376

A tabela ANOVA é mostrada abaixo. O valor crítico de F para  = 0,01, com GL =


(4,20), é 4,43. Como podemos ver da tabela ANOVA, o valor da estatística de teste é 14,76 o
que nos leva a rejeitar a hipótese nula e concluir que a porcentagem de algodão na fibra afeta a
resistência.

Tabela 9.11 – ANOVA para os dados de resistência à tração.


Fonte GL SQ QM F[4,20]

Grupos 4 475,76 118,94 14,76

Erro 20 161,20 8,06

Total 24 636,96

b) Verificação da adequação do modelo

b1) Histograma dos resíduos - normalidade

Uma verificação da hipótese de normalidade pode ser feita construindo um histograma


dos resíduos. Se os erros seguirem a hipótese de normalidade então o histograma deve ser
aproximadamente simétrico e centrado no valor zero, que é a média esperada dos erros.

6
5
Frequência

4
3
2
1
0
-3 -2 -1 0 1 2 3 4 5 6
Resíduos

Figura 9.3 – Histograma dos resíduos.

198
Infelizmente, com amostras pequenas pode ocorrer uma flutuação considerável de modo
que uma fuga moderada da normalidade não necessariamente implica em uma violação séria e
pode requer uma análise mais profunda. Isto claramente está ocorrendo na figura acima.

b2) Gráfico de resíduos contra ordem de coleta - independência

Construindo um gráfico dos resíduos versus a ordem em que as observações foram


coletadas nos auxilia na detecção da correlação entre os resíduos. O gráfico deve apresentar os
resíduos espalhados em torno da média, de uma maneira aleatória, sem que um determinado
padrão fique configurado para que a hipótese de independência fique configurada. A tabela
abaixo sintetiza as informações necessárias para construir o gráfico. Em cada célula da tabela, o
valor superior se refere ao resíduo e os dois valores na linha inferior se referem ao valor da
observação e da ordem em que foi ela foi coletada (entre parênteses), respectivamente.

Tabela 9.12 – Dados e resíduos para as resistências à tração das fibras.


Porcentagem de Algodão
15 20 25 30 35
1 -2,8 -3,4 -3,6 -2,6 -3,8
7 (15) 12 (8) 14 (18) 19 (22) 7 (17)
2 -2,8 1,6 0,4 3,4 -0,8
7 (19) 17 (14) 18 (13) 25 (5) 10 (21)
Observações

3 5,2 -3,4 0,4 0,4 0,2


15 (25) 12 (1) 18 (20) 22 (2) 11 (4)
4 1,2 2,6 1,4 -2,6 4,2
11 (12) 18 (11) 19 (7) 19 (24) 15 (16)
5 -0,8 2,6 1,4 1,4 0,2
9 (6) 18 (3) 19 (9) 23 (10) 11 (23)
_
xj 9,8 15,4 17,6 21,6 10,8

O gráfico pode ser visto na figura 9.4 abaixo. Os resíduos representados pelos pontos do
gráfico não formam um padrão específico. Eles apresentam um espalhamento aleatório em torno
da média. Não há razão para suspeitar de qualquer violação de independência.

9.4 – Blocos Aleatorizados

Em muitos casos de pesquisa aplicada é necessário delinear o experimento de modo que a


variabilidade proveniente de fontes estranhas possa ser sistematicamente controlada. O exemplo
abaixo ilustra um desses casos.

Três analgésicos devem ser testados com o objetivo de determinar diferenças entre eles.
Poderíamos delinear o experimento como um experimento completamente aleatorizado. Para isto
teríamos que escolher aleatoriamente, digamos 18 pacientes, e dividi-los em três grupos de seis
pessoas cada. Em seguida, os elementos de cada grupo tomariam o analgésico especificado para
aquele grupo e teríamos as dezoito observações desejadas.

199
6
5
4
3

Resí duos ei j
2
1
0
-1 0 5 10 15 20 25 30
-2
-3
-4
-5
Ordem

Figura 9.4 – Gráfico dos resíduos versus ordem de coleta.

O perigo com tal procedimento está na possível diferença de metabolismo das pessoas
escolhidas para participar do experimento. Uma variabilidade muito grande dentro dos grupos
poderia mascarar os efeitos dos analgésicos, isto é, a variabilidade entre os tratamentos poderia
não ser detectada e assim concluirmos que os dados não apresentam suficiente evidências de que
as médias sejam diferentes (a hipótese Ho não seria rejeitada quando deveria ser).

No nosso exemplo, para controlar a fonte estranha (diferenças de metabolismo), e


remover a variabilidade entre os pacientes, utilizamos um delineamento de experimento
denominado Blocos Aleatorizados que requer que o pesquisador teste os três analgésicos em
cada paciente. Cada paciente constituirá um bloco do experimento. Os dados de tempo até o
alívio da dor de cabeça são então analisados com o procedimento da análise de variância.

Exemplo 9.5 – Ilustra o procedimento ANOVA para blocos aleatorizados

Deseja-se comparar três analgésicos com relação ao tempo requerido para aliviar uma dor
de cabeça. Um delineamento baseado em blocos aleatorizados deve ser usado. Para isso, seis
pessoas foram selecionadas com cada pessoa tomando os três comprimidos em diferentes
ocasiões. Os tempos para os medicamentos surtirem efeito são dados na tabela 9.13 abaixo. Ao
nível de 5% de significância, os dados obtidos permitem concluir que existe uma diferença entre
as médias dos tempos até o alívio da dor de cabeça?

Solução

a) As hipóteses neste exemplo podem ser escritas como

Ho: 1 = 2 = 3 (tempos médios de alívio são iguais)


Ha: existem diferenças entre as médias

200
Tabela 9.13 – Tempo até alívio da dor de cabeça (min).
Analgésico (Tratamentos ou Níveis do fator)
A B C Bi
1 18 22 25 65
Pessoas (Blocos)

2 14 23 13 50
3 21 19 23 63
4 20 29 24 73
5 12 19 13 44
6 13 20 20 53
Tj 98 132 118 348

b) O nível de significância é  = 0,05

c) Valor crítico F

Neste problema sabemos que

Número de tratamentos → k = 3
Número de blocos → m = 6
Número total de observações → n = km = 18

O número de graus de liberdade é dado por GL = (k-1, n-k-m+1) = (2, 10) e o valor
crítico, dado pela tabela, é F0,05 = 4,10.

d) Soma dos quadrados

Podemos calcular as diversas somas de quadrados de acordo com as fórmulas dadas


anteriormente.

A soma dos quadrados total SQT é dada por:

( x )2
(348)
2
SQT =  x 2
− = 7118 − = 7118 − 6728 = 390
n 18

A soma dos quadrados dos tratamentos ou grupos SQG representa a variação entre as
médias dos tempos até o alívio da dor para os tratamentos (analgésicos) e é dada por:

1  k 2  ( x ) (348)
2

( )
2
1 2
SQG =   T j  − = 98 + 132 + 118 −
2 2
= 6825,333 − 6728 = 97,333
m  j =1  n 6 18

A soma dos quadrados dos blocos SQB representa a variação entre as médias dos tempos
até o alívio da dor para os blocos (pessoas) e é dada por:

201
 ( x )
2
1 m
SQB =   Bi2  −
k  i =1
1
(
= 65 2 + 50 2 + 632 + 732 + 44 2 + 532 − )
348 2
= 194,667
 n 3 18

Finalmente, a soma dos quadrados dos erros SQE é dada pela diferença

SQE = SQT – SQG – SQB = 390 – 97,333 – 194,667 = 98

Ela representa a variação entre os tempos de alívio dentro das amostras para os
tratamentos com a variação devido aos blocos removida.

A tabela ANOVA pode agora ser construída. Para isso basta calcular os quadrados
médios QMG, QMB e QME.

QMG = SQG/(k-1) = 97,333/2 = 48,667


QMB = SQB/(m-1) = 194,667/5 = 38,933
QME = SQE/(n-k-m+1) = 98/10 = 9,800

Tabela 9.14 – Tabela ANOVA para o exemplo.


Fonte GL SQ QM F

Grupos ou Tratamentos 2 97,333 48,667 4,97

Blocos 5 194,667 38,933

Erro 10 98,000 9,8

390
Total 17

O valor crítico de F0,05 com GL = (2,10) é igual a 4,10. Desta forma, o valor da estatística
F cai na região de rejeição (4,97 > 4,10) e podemos concluir que os dados fornecem evidência
suficiente para rejeitar a hipótese nula e que existe diferenças entre as médias nos tempos de
alívio para os três analgésicos.

9.4.1 - Procedimento ANOVA para blocos aleatorizados

Através do exemplo foi possível observarmos que existem quatro somas dos quadrados como
mostrado na figura 9.5. A variabilidade total dos dados é dividida em uma componente
representando a variabilidade entre as médias das amostras para os tratamentos, uma componente
representando a variabilidade entre as médias das amostras para os blocos e uma componente
representando a variabilidade dentro das amostras para os tratamentos com a variabilidade
devida aos blocos removida.

202
Soma dos Quadrados dos tratamentos
SQG

Soma dos Quadrados Total Soma dos Quadrados dos Blocos


SQT SQB

Soma dos Quadrados dos Erros


SQE

Figura 9.5 – Partição da soma dos quadrados total.

Os valores das somas dos quadrados, dos graus de liberdade associados a cada um e os
respectivos quadrados médios são dispostos na tabela ANOVA de modo similar ao do
experimento completamente aleatorizado, como mostrado abaixo.

Tabela 9.15 – Tabela ANOVA genérica.


Fonte GL SQ QM F

Grupos ou Tratamentos k-1 SQG QMG = SQG/(k-1) QMG/QME

Blocos m-1 SQB QMB = SQB/(m-1)

Erro n-k-m+1 SQE QME = SQE/(n-k-m+1)

Total n-1 SQT

Os passos adotados para análise estatística de um delineamento com blocos aleatorizados


são descritos no procedimento 9.2 a seguir. Observemos que o teste de hipóteses é sempre
unilateral à direita uma vez que a hipótese nula é rejeitada somente quando a estatística de teste F
é muito grande.

203
Procedimento 9.2 – Aplicar ANOVA para k médias de populações
Blocos aleatorizados e amostras independentes
Populações normais
Populações com mesmo desvio padrão

Passo 1 – Escreva as hipóteses nula e alternativa


Passo 2 – Defina o nível de significância .
Passo 3 – O valor crítico é F, com GL = (k-1, n-k-m+1), onde m é o número de blocos e n
é o número total de dados

Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas

( x )2
( x ) 2

SQT =  x 2

n
1
( )
SQG = T12 + T22 + ... + Tk2 −
m n

( x ) 2
1
(
SQB = B12 + B22 + ... + Bm2 −
k
) n

SQE = SQT – SQG –SQB , onde, x = soma dos valores de todas as observações

Passo 5 – Construa a tabela ANOVA

Fonte GL SQ QM=SQ/GL Estatística F


Tratamento ou k-1 SQG SQG QMG
QMG = F=
Grupo k −1 QME
Bloco m-1 SQB SQB
QMB =
m −1
Erro n–k–m+1 SQE SQE
QME =
n − k − m +1
Total n -1 SQT

Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.

Passo 7 – Escreva sua conclusão.

204
Exercícios – Seqüência 9.3

1) A tabela abaixo é uma tabela ANOVA incompleta de um experimento com blocos


aleatorizados. Preencha os espaços em branco de acordo com a teoria vista.

Fonte GL SQ QM F

Grupos ou Tratamentos 2 21,667

Blocos 55,060

Erro 8

Total 14 127,733

2) Quatro marcas de gasolina devem ser testadas para se comparar o consumo. Para o teste seis
carros foram selecionadas. Cada carro percorreu uma distância de 480 Km, em rota
especificada, com cada uma das quatro marcas de gasolina. O consumo resultante, dado em
Km/l, é mostrado na tabela abaixo. Ao nível de 1% de significância, os dados obtidos
implicam que existe uma diferença no consumo médio entre as quatro marcas de gasolina?

Marca da Gasolina
A B C D
1 8 7 7 8
2 7 6 5 7
Carro

3 9 9 8 10
4 12 12 10 13
5 12 11 10 11
6 7 6 5 6

3) Discuta dois casos (não relatados neste texto) onde seria indicado usar um delineamento
baseado em blocos aleatorizados.

205
9.5 – Quadrados latinos

Na seção anterior nós introduzimos o delineamento com blocos aleatorizados como sendo
uma maneira de reduzir o erro residual em um experimento através da remoção da variabilidade
devido a fatores estranhos. Existem diversos outros tipos de delineamento que utilizam o
princípio dos bloqueios. Por exemplo, suponha que um pesquisador esteja estudando o efeito de
cinco diferentes formulações de uma mistura explosiva, usada na fabricação de dinamite, na
força de explosão. Cada formulação é obtida de um lote de matéria prima que é suficiente apenas
para cinco formulações serem testadas. Além disso, as formulações são preparadas por diferentes
operadores e pode haver diferenças substanciais nas habilidades e experiências dos operadores.
Dessa forma, dois fatores estranhos podem contribuir para uma maior variabilidade do erro
residual; lotes de matéria prima e operadores.

O delineamento adequado para este caso consiste em testar cada formulação exatamente
uma vez em cada lote de matéria prima de maneira que cada operador prepare uma única
formulação por lote. Assim, para cada lote, as cinco formulações serão preparadas pelos cinco
operadores, cada um deles preparando uma determinada formulação. O delineamento resultante,
mostrado na tabela 9.16, é denominado Quadrado Latino. Observemos que o delineamento é um
arranjo quadrado e que as cinco formulações (tratamentos) são identificadas pelas letras latinas
A, B, C, D e E, daí o nome Quadrado latino.

Tabela 9.16 – Quadrado latino para o problema de formulações de dinamite.


Lotes de Operadores
matéria prima 1 2 3 4 5
1 A = 24 B = 20 C = 19 D = 24 E = 24
2 B = 17 C = 24 D = 30 E = 27 A = 36
3 C = 18 D = 38 E = 26 A = 27 B = 21
4 D = 26 E = 31 A = 26 B = 23 C = 22
5 E = 22 A = 30 B = 20 C = 29 D = 31

O delineamento Quadrado latino é usado para eliminar duas fontes estranhas de


variabilidade; isto é, para bloquear sistematicamente duas direções. Em geral, um quadrado
latino para p fatores (ou tratamentos) é um quadrado contendo p linhas e p colunas. Cada uma
das p2 células ocorre uma e somente uma vez em cada linha e coluna.

O modelo estatístico para o Quadrado latino é

xijk =  + i + j + k + ijk , com

i = 1, 2, ... , p
j = 1, 2, ... , p
k = 1, 2, ... , p
xijk = observação na i-ésima linha e k-ésima coluna para o j-ésimo tratamento,
 = média global,
i = é o efeito da i-ésima linha,
k = é o efeito da k-ésima coluna,
ijk = erro aleatório.

206
A análise de variância consiste em partir a soma dos quadrados total das p2 observações
em componentes para as linhas, colunas, tratamentos e erros, como se segue.

SQT = SQlinhas + SQcolunas + SQtratamentos + SQE

( x ) 2

SQT =  x 2

n

( x ) 2
1
(
SQlinhas = L12 + L22 + ... + L2p −
p n
)

( x ) 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
)

( x ) 2

SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
)

Os termos L1, L2, ... , Lp correspondem aos totais das linhas e C1, C2, ... , Cp aos totais das
colunas.

Os termos T1, T2, ... , Tp correspondem, no exemplo dado, às diversas formulações sob
teste, isto é, às formulações A, B, C, D e E.

O número de graus de liberdade para cada soma de quadrados é

Total Linhas Colunas Tratamentos Erro

p2 -1 p-1 p-1 p-1 (p - 2)(p – 1)

Dividindo-se cada soma de quadrados acima pelo seu número de graus de liberdade
obtém-se os quadrados médios. A estatística de teste é, novamente, o quociente de QMG por
QME, ou seja:

F = QMG/QME

O número de graus de liberdade do numerador e do denominador pode ser indicado por


GL = [p-1, (p-2)(p-1)]. A tabela 9.17 mostra um resumo para o procedimento de análise de
variância para os Quadrados latinos.

Podemos observar que a análise é uma simples extensão do delineamento para blocos
aleatorizados. O exemplo anterior das formulações de dinamite será usado para mostrar como os
cálculos podem ser facilitados mediante uma simples codificação.

207
Tabela 9.17 – ANOVA para o delineamento por Quadrado latino.
Fonte GL SQ QM F

Grupos ou p-1 SQG QMG = SQG/(p-1) QMG/QME


Tratamentos

Linhas p-1 SQlinhas QML = SQlinhas/(p-1)

Colunas p-1 SQcolunas QMC =SQcolunas/(p-1)

Erro (p – 2)(p –1) SQE QME = SQE/(p-2)(p-1)

Total p2-1 SQT

Exemplo 9.6 – Ilustra o procedimento Quadrado Latino

Os dados da tabela 9.16 representam os resultados dos ensaios realizados com as


diferentes formulações de dinamite. Verificar se existem evidências suficientes para afirmarmos
que as diferentes formulações possuem efeitos diferentes com um nível de significância de 1%.

Solução

Os passos a serem seguidos são exatamente os mesmos mostrados nos procedimentos 9.1
e 9.2. Entretanto, para facilitar os cálculos vamos subtrair 25 de cada valor da tabela obtendo a
tabela abaixo. Podemos mostrar que as somas dos quadrados não se alteram quando subtraímos
um mesmo valor de cada uma das observações.

Lotes de Operadores Li
matéria prima 1 2 3 4 5
1 A = -1 B = -5 C = -6 D = -1 E = -1 -14
2 B = -8 C = -1 D=5 E=2 A = 11 9
3 C = -7 D = 13 E=1 A=2 B = -4 5
4 D=1 E=6 A=1 B = -2 C = -3 3
5 E = -3 A=5 B = -5 C=4 D=6 7
Cj -18 18 -4 5 9 x = 10

Passo 1 – Hipóteses

Ho: 1 = 2 = 3 = 4 = 5
Ha: pelo menos uma diferença existe

Passo 2 – Nível de significância  = 0,01

Passo 3 – Valor crítico F0,01 = 5,41 pois GL = (4,12)

208
Passo 4 – Soma dos quadrados

( x ) 2
10 2
SQT =  x 2
− = 680 − = 676,00
n 25

( x ) 1 2
1 2
p
(
SQlinhas = L1 + L2 + ... + L p −
2 2

n 5
)
= (−14) + 9 + 5 + 3 + 7 −
2 2 2 2 2
(
10 2
25
= 68,00 )

( x ) 1 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
) (
= (−18) 2 + 18 2 + (−4) 2 + 5 2 + 9 2 − 4 = 150,00
5
)

Os totais para os tratamentos são dados por

Tratamento Total do tratamento


(ou letra)
A 18
B -24
C -13
D 24
E 5

( x) 1 2 2

SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
) (
= 18 + (−24) 2 + (−13) 2 + 24 2 + 5 2 − 4 = 330,00
5
)

A soma dos quadrados dos erros é determinada por subtração.

SQE = SQT – (SQlinhas + SQcolunas + SQtratamentos )

SQE = 676,00 – 68,00 – 150,00 – 330,00 = 128,00

Passo 5 – Tabela ANOVA

Fonte GL SQ QM F

Grupos ou Tratamentos 4 330,00 QMG = 82,50 7,73


Linhas 4 68,00 QML = 17,00
Colunas 4 150,00 QMC = 37,50
Erro 12 128,00 QME = 10,67

Total 25 676,00

209
Passo 6 – Como O valor crítico é de 5,41, verificamos que o valor calculado da estatística cai na
região de rejeição, portanto devemos rejeitar a hipótese nula Ho.

Passo 7 – Os dados obtidos mostram evidências suficientes para concluirmos que existem
diferenças entre as diversas formulações.

Exercícios – Seqüência 9.4

1) Um engenheiro industrial está conduzindo uma experiência do efeito de quatro diferentes


métodos de montagem sobre tempo de montagem de um componente de uma televisão.
Quatro operadores são selecionados para o estudo. O engenheiro sabe que cada método de
montagem produz uma fadiga tal que o tempo requerido para a última montagem
possivelmente será maior que o requerido pela primeira, qualquer que seja o método usado.
Para levar em conta essa fonte de variabilidade, o engenheiro usou o delineamento Quadrado
latino obtendo os dados abaixo. Existe evidência de que os métodos de montagem produzam
efeitos diferentes a um nível de significância de 5%?

Ordem de Operador
montagem 1 2 3 4
1 C = 10 D = 14 A=7 B=8
2 B=7 C = 18 D = 11 A=8
3 A=5 B = 10 C = 11 D=9
4 D = 10 A = 10 B = 12 C = 14

210

Você também pode gostar