09 - Capítulo 9 - v01 - 2020 PDF

Capítulo 9
Análise de Variância - ANOVA
Objetivos do Capítulo
Este capítulo fornece métodos para comparar as médias de mais de duas populações.
Serão estudados dois métodos denominados Análise de variância para 1 fator e
Análise de variância para 2 fatores. Esses métodos utilizam uma distribuição chamada
distribuição F que será vista em primeiro lugar. Após o término deste capítulo, você
deverá ser capaz de:
1. Entender o termo análise de variância.

2. Determinar áreas sob a curva F.
3. Aplicar o procedimento ANOVA para experimentos completamente aleatorizados
4. Verificar validade do modelo estatístico
5. Aplicar o procedimento ANOVA para experimentos blocos aleatorizados
6. Aplicar o procedimento ANOVA para experimentos quadrados latinos
179
9.1) Distribuição F
O procedimento de análise de variância utiliza uma classe de distribuição contínua de

probabilidades, denominada distribuição F. As probabilidades para uma variável aleatória que
possui uma distribuição F são iguais às áreas sob a curva F, da mesma forma como definimos
para distribuições normais e distribuições t. Relembremos que uma curva t depende do número
de graus de liberdade (df ou GL). Uma curva F também depende do número de graus de
liberdade, porém existem dois graus de liberdade em vez de um. Na figura 9.1, estão desenhadas
duas curvas F, uma com df = (10,2) e outra com df = (9,50). O primeiro número é denominado
graus de liberdade do numerador e o segundo, graus de liberdade do denominador.
Figura 9.1 – Distribuição F.
Algumas propriedades das curvas F
1. A área total sob a curva é igual a 1.

2. Uma curva F começa no zero e se estende indefinidamente para a direita, se aproximando de
zero à medida que a variável cresce.
3. Uma curva F não é simétrica. Ela sobe rapidamente com F e desce se aproximando do eixo
horizontal mais suavemente.
Usando as curvas F
As áreas sob as curvas F podem ser encontradas em tabelas. Normalmente elas são usadas
para um valor  igual a 0,01 ou 0,05 o que nos conduz à notação F0,01 e F0,05 para indicar os
valores de F que definem uma área de 0,01 ou 0,05 à sua direita, respectivamente. A tabela 9.1
fornece os valores para F0,01. No topo da tabela estão especificados os graus de liberdade para o
numerador e na coluna à esquerda, os graus de liberdade para o denominador. A tabela 9.2 é
similar à tabela 9.1, fornecendo os valores para F0,05.
180
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 à direita de F.
Graus de Liberdade para o Numerador
1 2 3 4 5 6 7 8 9
1 4052.00 4999.50 5403.00 5625.00 5764.00 5859.00 5928.00 5981.00 6022.00

2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98
Graus de Liberdade para o Denominador
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72

8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41
181
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 (continuação).

10 12 15 20 24 30 40 60 120 
1 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50
3 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
182
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 à direita de F.

1 2 3 4 5 6 7 8 9
1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
10 4.96 4.10 3.71 3.48 3.33 3.32 3.14 3.07 3.02
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
120 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96
 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88
183
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 (continuação).

10 12 15 20 24 30 40 60 120 
1 241.90 243.90 245.90 248.00 249.10 250.10 251.10 252.20 253.30 254.30
2 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36
6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 2.20 2.13 2.06 1.97 1.93 1.93 1.88 1.79 1.73 1.67
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
184
Exemplo 9.1 – Ilustra o uso das tabelas
Para uma curva F com df = (4,12) determine F0,05.
Solução
Determinar F0,05 significa encontrar o valor de F de modo que a área à sua direita seja
igual a 0,05, como mostrado na figura 9.2.
Figura 9.2 – Curva F com df = (4,12).
Para obter o valor de F pedido podemos usar a tabela 9.2. Neste exemplo, o número de
graus de liberdade para o numerador é 4 e para o denominador é 12. Assim, procuramos pela
intersecção da coluna contendo o valor 4 com a linha contendo o valor 12 e encontramos o valor
3,26, que é o valor pedido, ou seja, F0,05 = 3,26.
Exercícios – Seqüência 9.1
1) Uma curva F tem df = (12,7). Qual é o número de graus de liberdade para

a) o numerador?
b) o denominador?
2) Para uma curva F com df = (12,5) determine o valor de F com

a) área 0,01 à sua direita
b) área 0,05 à sua direita
185
9.2 - Análise de variância para um fator
A análise de variância é um procedimento de inferência que é usado para comparar as

médias de diversas populações. Justifica-se a palavra “variância” no termo análise de variância
pelo fato do procedimento usado para comparar as médias envolver um estudo da variação ou
variabilidade dos dados contidos nas amostras.
A variabilidade que usualmente é encontrada na amostra é chamada variação dentro do

grupo, variabilidade aleatória ou erro. Isto não significa que um engano foi cometido na
coleta dos dados. O termo é um jargão estatístico para designar a variabilidade natural ou
aleatória que ocorre com os dados da amostra coletada. Por exemplo, a variação da vida de uma
ferramenta de corte quando se faz ensaios de corte com um material, ou a resistência à ruptura de
um material quando fazemos testes de tração.
Nesta seção veremos o procedimento adotado para comparar as médias considerando-se

apenas um fator ou tratamento. O termo fator (tratamento) significa a variável que pode estar
influenciando os valores coletados das amostras, ou seja, ele se refere a uma condição ou
estímulo a que um determinado grupo está exposto. Isto poderia ser uma determinada droga, um
novo método de fazer dieta ou um novo método de ensino.
Suponha a existência de três grupos (ou amostras), cada um sujeito a um tratamento,

como mostrado na tabela 9.3. Neste caso, podemos ver que não há variação nos dados dentro dos
grupos. A única variação ocorre entre as médias dos grupos e isto nos permite especular que os
tratamentos aplicados aos grupos têm influência na variação observada.
Estudando agora a tabela 9.4, já vemos uma situação mais comum onde uma variação
aleatória é encontrada dentro dos grupos.Vemos também que existe uma variação entre as
médias dos três grupos. Em virtude da variação dentro dos grupos, não é mais possível tirar
conclusões sobre o efeito dos diferentes tratamentos a que os grupos foram submetidos.
O ponto importante é que qualquer variação observada entre as médias dos grupos
consiste de (1) uma componente que é devido à variação dentro do grupo e (2) uma componente
que é devido a um possível efeito do tratamento.
Tabela 9.3 – Dados relativos a três tratamentos sem variação dentro dos grupos.
Tratamentos
1 2 3
6 9 13
6 9 13
6 9 13
6 9 13
6 9 13
_ _ _
x1 = 6 x1 = 9 x1 = 13
Se a variabilidade total entre os grupos consiste dessas duas componentes então nós
devemos, de alguma maneira, separar, avaliar e comparar essas duas componentes. Neste
processo, se nós encontrarmos que a variação entre os grupos não é maior que a variação
aleatória (ou erro) dentro dos grupos, então a conclusão será que os diferentes tratamentos não
186
têm um efeito significativo sobre os resultados e a variabilidade total é devida à variação
aleatória natural dos processos envolvidos na experimentação.
Tabela 9.4 – Dados relativos a três tratamentos com variação dentro dos grupos.
Tratamentos
1 2 3
6 3 5
4 8 6
7 4 4
3 5 6
5 9 3
_ _ _
x1 = 5 x1 = 5,8 x1 = 4,8
Cálculo da variabilidade
O procedimento ANOVA se baseia na determinação da variabilidade total dos dados, na

variabilidade dentro dos grupos e na variabilidade entre os grupos (médias dos grupos). A
variabilidade total, denominada soma de quadrados total (SQT) é dada por:
k n
 _

2
( x ) 2
SQT =   xij − x..  =  x 2 − (9.1)

j =1 i =1   nT
_
1 k n
e x.. =  xij , onde
nk j =1 i =1
(9.2)
_
x.. = média de todas as medidas
k = número de grupos
n = número de medidas (ou dados) por grupo
nT = n  k = número total de medidas ou observações
i = 1, 2, ..., n e j = 1, 2, ..., k
A variabilidade entre os grupos (ou tratamentos), denominada soma de quadrados entre

grupos (SQG) é dada por:
 k n 
  xij 
2
1 k  n
2  
 _ _ 
SQG = n  x j − x..  =    xij  −  
k
j =1 i =1
(9.3)
j =1   n j =1  i =1  n T
_
onde x j é a média do grupo j ( j = 1, 2, .., k)
Obs: se o número de medidas ou observações não for o mesmo para todos os grupos, isto é, se
tivermos n1 medidas no grupo 1, n2 medidas no grupo 2 e assim por diante, até nk medidas no
grupo k, então SQG será calculado de acordo com a expressão
187
2
 nj   k nj 
  xij    xij 
 i =1   
  −  j =1 i =1 
k
SQG =  (9.4)
j =1 nj nT
Ou, mais simplificadamente por
( x ) ( x ) 2 2
( x ) ( x )
2 2
SQG = + +  + −
1 2 k
(9.5)
n1 n2 nk nT
onde
xk = soma das medidas do grupo k

x = soma de todas as medidas
A variabilidade dentro de cada grupo é denominada soma de quadrados dos grupos ou

soma de quadrados dos erros (SQE) e é facilmente calculada por
2
k
 _n

SQE =   xij − x j  (9.6)
j =1 i =1  
_
onde x j é a média das observações do j-ésimo grupo ou amostra.
Se as médias das k populações forem iguais então toda a variabilidade medida pela
expressão (9.1) é devida ao acaso. Porém, se forem diferentes então parte da variabilidade é
proveniente da variabilidade natural dentro do grupo e parte devido à aplicação dos diferentes
tratamentos. Podemos demonstrar que a variabilidade total é igual à soma das variabilidades
dentro dos grupos e entre os grupos, ou seja,
SQT = SQG + SQE
2 2 2
k n
 _
 k
 _ _ k n
 _

  ij
j =1 i =1 
x − x .. 

= n   j ..    xij − x j 
j =1 
x − x

+
j =1 i =1  
(9.7)
Cada uma das somas de quadrados tem um grau de liberdade associado a ela, conforme
mostrado na tabela 9.5.
Tabela 9.5 – Graus de liberdade das somas de quadrados.

Graus de liberdade
Termo Amostras de mesmo tamanho n Amostras de tamanhos diferentes
SQT nT –1 = nk -1 nT -1
SQG k-1 k-1
SQE (nk – 1) – (k – 1) = k(n-1) nT – k
188
Dividindo cada uma das somas de quadrados SQT, SQG e SQE pelos respectivos graus
de liberdade, obtemos os quadrados médios, que são então dados por:
SQG
Quadrado médio entre grupos = QMG =
k −1
SQE
Quadrado médio dos erros = QME =
nT − k
Conforme mencionado, nós decidiremos se a variação entre as médias das amostras

(QMG) é grande o bastante para concluir que existe alguma diferença entre elas, pela
comparação com a variação existente dentro das amostras (QME). Portanto, a idéia é a seguinte:
QME é uma estimativa da variância comum das populações em estudo. Assim, se QMG é grande
relativo a QME, então podemos inferir que a variação entre as médias das amostras é devida a
diferenças entre as médias das populações e não da variação dentro das populações. Desta forma,
usamos a variável aleatória
QMG
F=
QME
como a estatística de teste. Grandes valores de F indicam que QMG é grande relativo a QME e
assim, que a hipótese de médias de populações iguais deve ser rejeitada. O procedimento de
análise de variância será explicado com base no exemplo a seguir.
Exemplo 9.2 – Ilustra ANOVA com um fator
Um fisioterapeuta deseja comparar os efeitos de três diferentes técnicas de fisioterapia no

progresso de pacientes idosos, que sofreram paralisia parcial devido a um ataque do coração de
média intensidade. Um total de 18 pacientes foi selecionado procurando manter constantes
parâmetros como idade, condição física, motivação, etc.. Esses pacientes foram divididos
aleatoriamente em três grupos e, após um período de seis meses, eles foram avaliados por um
especialista que não tinha conhecimento a que grupo pertencia cada paciente. Os dados obtidos,
juntamente com algumas estatísticas, estão resumidos na tabela 9.5.
Tabela 9.5 – Dados da avaliação dos pacientes.

Grupos de Terapia
Terapia A Terapia B Terapia C
80 56 97
73 72 90
79 61 75
88 64 87
68 80 88
75 74 83
_ 2 _ 2 _ 2
x A = 77,17 ; s A = 46.97 x B = 67,83 ; s B = 80,97 xC = 86,67 ; sC = 53,87
xA = 463 ; nA = 6 xB = 407 ; nB = 6 xC = 520; nC = 6
x = 109312
2
x = 1390 nT = 18 k=3
189
Com um nível de significância de 5%, existe alguma diferença nas médias dos três
tratamentos?
Solução
1) Queremos saber se há alguma diferença entre as médias das populações representadas por
cada um dos três grupos. Assim a hipótese nula é
Ho: A = B = C
2) A Hipótese alternativa será escrita da seguinte forma
Ha: Ao menos uma diferença existe entre as médias das populações
3) O nível de significância será definido em 5% conforme o enunciado.

4) Cálculo das somas dos quadrados (SQT, SQG E SQE).
( x ) 2
1390 2
SQT =  x − 2
= 109312 − = 1973,11
n T 18
( x ) ( x ) ( x ) ( x )
2 2 2 2
SQG = + + −
A B C
nA nB nC nT
SQG =
(463)2 + (407)2 + (520)2 − 107338,89 = 1064,11
6 6 6
SQE = SQT – SQG = 1973,11 – 1064,11 = 909
5) Graus de liberdade
GLT = nT – 1 = 18 – 1 = 17
GLG = k – 1 = 3 – 1 = 2
GLE = GLT – GLG = 17 – 2 = 15
6) Cálculo da estatística
Dividindo-se a soma dos quadrados pelos respectivos graus de liberdade obtém-se as

estimativas das variâncias (quadrados médios).
SQG 1064 ,11

QMG = = = 532 ,06
GLG 2
SQE 909
QME = = = 60 ,60
GLE 15
190
7) Cálculo de F e tabela ANOVA
QMG 532,06
F2,15 = = = 8,78
QME 60,60
Um resumo dos valores obtidos até agora pode ser mostrado na tabela 9.6.
Tabela 9.6 – Exemplo de uma tabela ANOVA.
Fonte GL SQ MQ F[2,15]
Grupos 2 1064,11 532,06 8,78
Erro 15 909,00 60,60
Total 17 1973,11
8) Rejeite ou deixe de rejeitar Ho
Da tabela 9.2, no cruzamento da coluna 2 com linha 15 obtemos o valor F 0,05 igual a 3,68,
para um nível de confiança de 5%. Como o valor de F obtido no passo anterior foi de
8,78, portanto maior que 3,68, concluímos que podemos rejeitar Ho. Isto significa que
temos evidências de que existe pelo menos uma diferença estatisticamente significativa
entre os três pares do grupo de médias.
A tabela mostrada no exemplo acima pode ser generalizada como mostrado na tabela 9.7.
Tabela 9.7 – Formato da tabela para análise de variância.

Fonte GL SQ QM=SQ/GL Estatística F
Tratamento ou k-1 SQG SQG QMG
QMG = F=
Grupo k −1 QME
Erro nT - k SQE SQE
QME =
nT − k
Total nT -1 SQT
O procedimento completo para a aplicação de análise de variância é dado a seguir com

fórmulas simplificadas a fim de facilitar sua aplicação.
191
Procedimento 9.1 – Aplicar ANOVA para k médias de populações
Amostras independentes
Populações normais
Populações com mesmo desvio padrão
Passo 1 – Escreva as hipóteses nula e alternativa

Passo 2 – Defina o nível de significância .
Passo 3 – O valor crítico é F, com GL = (k-1, n-k), onde n é o número total de dados
Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas
( x ) 2
SQT =  x − 2
n T
( x ) ( x ) 2 2
( x ) ( x )
2 2
SQG = + +  + −
1 2 k
n1 n2 nk nT
SQE = SQT - SQG
onde, j =1, 2, 3, ..., k e

nj = tamanho da amostra para a população j
xj = soma dos valores da amostra j
Passo 5 – Construa a tabela ANOVA

QMG = F=
Grupo k −1 QME
Erro nT - k SQE SQE
QME =
nT − k
Total nT -1 SQT
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
Passo 7 – Escreva sua conclusão.
192
Exemplo 9.3 – Ilustra o procedimento 9.1
Os tempos requeridos por três trabalhadores para realizar uma tarefa em uma linha de montagem
foram cronometrados em cinco ocasiões aleatoriamente escolhidas. Os tempos são dados na
tabela abaixo, aproximados para o inteiro mais próximo.
José Marcos Pedro

8 8 10
10 9 9
9 9 10
11 8 11
10 10 9
Com um nível de significância de 5% podemos afirmar que existe uma diferença na

média dos tempos dos três trabalhadores?
Solução
Passo 1 – Hipóteses
Ho: 1 = 2 = 3
Ha: Ao menos uma diferença existe entre as médias das populações
Passo 2 – Nível de significância  = 0,05
Passo 3 – Valor crítico F0,05 = 3,89, pois GL = (2, 12)
Passo 4 – Cálculo das somas de quadrados
( x ) 2
SQT =  x − 2
= 1339 – (141)2/ 15 = 1339 – 1325,4 = 13,6
n T
( x ) ( x ) 2 2
( x ) ( x )
2 2
SQG = + +  + −
1 2 k
= (48)2/5 + (44)2/5 + (49)2/5 – 1325,4
n1 n2 nk nT
SQG = 460,8 + 387,2 + 480,2 – 1325,4 = 1328,2 – 1325,4 = 2,8
SQE = SQT – SQG = 13,6 – 2,8 = 10,8
Passo 5 – Tabela ANOVA

Tratamento ou 2 2,8 1,4 1,55
Grupo
Erro 12 10,8 0,9
Total 14 13,6
193
Passo 6 – O valor da estatística (1,55) é menor que o valor crítico (3,74) e, portanto, não
devemos rejeitar Ho.
Passo 7 – Os dados obtidos não fornecem evidências para concluir que o tempo médio gasto
pelos funcionários, para desempenhar a tarefa de montagem, sejam diferentes.
1) Um criador de porcos deseja testar três diferentes dietas desenvolvidas para maximizar o
ganho de peso. O criador seleciona aleatoriamente 12 porcos e os divide em três grupos,
também de maneira aleatória. A cada um dos grupos é aplicado um dos programas de dieta.
O ganho de peso para cada porco, em Kg, após um período de seis semanas é dado pela
tabela abaixo.
Dieta A Dieta B Dieta C

10,5 11,5 9,8
10,9 10,9 10,5
10,7 11,8 10,4
10,3 11,8 10,5
Com um nível de significância de 5% podemos afirmar que existe uma diferença na média
dos pesos das três dietas aplicadas?
2) As tabelas abaixo são tabelas ANOVA parcialmente preenchidas. Complete os dados

faltantes.
a)

Tratamento ou 2 21,652
Grupo
Erro 84,400 7,03
Total 14
b)

Tratamento ou 2,124 0,708 0,75
Grupo
Erro 20
Total
3) O gerente geral de uma grande cadeia de lojas de conveniência deseja testar os efeitos de três
estratégias de propaganda. As estratégias são:
Estratégia 1 : nenhuma propaganda
Estratégia 2: distribuir panfletos na vizinhança da loja
Estratégia 3: distribuir panfletos e anunciar em jornais
Foram escolhidas aleatoriamente 18 lojas divididas em 3 grupos. Cada grupo usou uma das
três estratégias. A tabela abaixo apresenta valores arrecadados com vendas em um período de
194
1 mês. Os dados coletados proporcionam evidência de que existem diferenças entre as
médias de vendas das três estratégias?
Estratégia 1 Estratégia 2 Estratégia 3

22 21 29
20 25 24
21 25 31
21 20 32
24 22 26
22 26 27
195
9.3 – Adequabilidade do modelo
Como já foi dito, o procedimento ANOVA consiste em comparar a variabilidade

existente dentro das amostras com a variabilidade existente entre as amostras. É usual descrever
as observações por um modelo linear estatístico
xij =  + j + ij (9.8)
onde xij é o valor da i-ésima observação do j-ésimo tratamento,  é a média global, j representa
o efeito do tratamento j e ij é o erro aleatório associado aos xij.
Para o teste de hipóteses, assumimos que os erros ij sejam variáveis aleatórias
independentes e normalmente distribuídas, com média zero e variância 2. A variância 2 é
considerada constante para todos os tratamentos ou níveis do fator em estudo. Como estamos
trabalhando com um único fator, o modelo apresentado acima é denominado modelo de análise
de variância para um fator. Se assumirmos que as observações são feitas de uma forma
completamente aleatória então o planejamento experimental é dito experimento completamente
aleatorizado com um único fator.
O modelo (9.8) pode ainda ser classificado em modelo de efeitos fixos ou modelo de
efeitos aleatórios. O modelo de efeitos fixos ocorre quando fixamos a priori os níveis do fator
estudado. Por exemplo, se queremos analisar o efeito de três técnicas de aprendizado somente,
então os níveis do fator estarão automaticamente fixados. No modelo de efeitos fixos são
testadas hipóteses sobre as médias dos diversos níveis ou tratamentos e as conclusões são válidas
apenas para os níveis escolhidos para análise.
Porém, se dispomos de mais de três técnicas e escolhemos de forma aleatória apenas três
entre as diversas técnicas disponíveis, isto é, se escolhemos uma amostra aleatória da população
de técnicas (níveis do fator) então estaremos tratando com o modelo de efeitos aleatórios. Neste
caso, as conclusões obtidas serão estendidas a todos os níveis do fator e não apenas àqueles
níveis selecionados.
9.3.1 – Verificação da adequação do modelo
O modelo (9.8) assume que os erros ij sejam variáveis aleatórias independentes e
normalmente distribuídas, com média zero e variância 2. Podemos verificar se essas hipóteses
estão satisfeitas através da análise dos resíduos, que são definidos por
_
eij = xij − x j (9.9)
Isto é, os resíduos para o j-ésimo tratamento são determinados subtraindo-se de cada

observação a média correspondente do tratamento. A verificação da adequabilidade do modelo
consiste em construir gráficos onde os resíduos são plotados contra alguns parâmetros. Isto será
mostrado através do exemplo abaixo.
196
Exemplo 9.4 – Ilustra os procedimentos de teste do modelo
Um certo fabricante tem interesse na resistência à tração de uma fibra sintética usada na
fabricação de tecidos para camisas masculinas. Ele suspeita que a resistência é afetada pela
porcentagem de algodão contida na fibra. Cinco níveis de porcentagem de algodão são de
interesse, 15 %, 20 %, 25%, 30% e 35%. Para cada nível, devem ser feitas 5 observações,
perfazendo um total de 25 observações. Um procedimento ANOVA com um único fator deve ser
adotado para testar se a resistência é realmente afetada pela quantidade de algodão presente na
fibra.
Solução
a) Aplicação do procedimento ANOVA
Inicialmente devemos nos preocupar em garantir que o experimento seja completamente

aleatorizado. Para obter uma ordem aleatória das observações suponha que nós numeremos as
observações como mostrado na tabela abaixo.
Tabela 9.8 – Número de ordem das observações

Número de ordem
15 1 2 3 4 5
Porcentagem
de Algodão
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Podemos agora selecionar um número, aleatoriamente, entre 1 e 25. Suponha que este
número seja 8. Então o experimento é realizado, para as condições da observação de número 8
(20% de algodão), obtendo-se em primeiro lugar o valor para esta observação. Repetindo esta
escolha aleatória de números entre 1 e 25 definimos a ordem em que observações serão
coletadas. Isto nos leva à tabela abaixo.
Tabela 9.9 – Sequência de teste.

Sequência Número da % de Sequência Número da % de
de teste observação Algodão de teste observação Algodão
1 8 20 14 7 20
2 18 30 15 1 15
3 10 20 16 24 35
4 23 35 17 21 35
5 17 30 18 11 25
6 5 15 19 2 15
7 14 25 20 13 25
8 6 20 21 22 35
9 15 25 22 16 30
10 20 30 23 25 35
11 9 20 24 19 30
12 4 15 25 3 15
13 12 25
197
As 25 observações são feitas nesta seqüência e os dados obtidos são mostrados na tabela
seguinte.
Tabela 9.10 – Resistência à tração das fibras (lb/in2).

Porcentagem de Algodão
15 20 25 30 35
1 7 12 14 19 7
Observações
2 7 17 18 25 10
3 15 12 18 22 11
4 11 18 19 19 15
5 9 18 19 23 11
Totais 49 77 88 108 54 376
A tabela ANOVA é mostrada abaixo. O valor crítico de F para  = 0,01, com GL =

(4,20), é 4,43. Como podemos ver da tabela ANOVA, o valor da estatística de teste é 14,76 o
que nos leva a rejeitar a hipótese nula e concluir que a porcentagem de algodão na fibra afeta a
resistência.
Tabela 9.11 – ANOVA para os dados de resistência à tração.

Fonte GL SQ QM F[4,20]
Grupos 4 475,76 118,94 14,76
Erro 20 161,20 8,06
Total 24 636,96
b) Verificação da adequação do modelo
b1) Histograma dos resíduos - normalidade
Uma verificação da hipótese de normalidade pode ser feita construindo um histograma

dos resíduos. Se os erros seguirem a hipótese de normalidade então o histograma deve ser
aproximadamente simétrico e centrado no valor zero, que é a média esperada dos erros.
6
5
Frequência
4
3
2
1
0
-3 -2 -1 0 1 2 3 4 5 6
Resíduos
Figura 9.3 – Histograma dos resíduos.
198
Infelizmente, com amostras pequenas pode ocorrer uma flutuação considerável de modo
que uma fuga moderada da normalidade não necessariamente implica em uma violação séria e
pode requer uma análise mais profunda. Isto claramente está ocorrendo na figura acima.
b2) Gráfico de resíduos contra ordem de coleta - independência
Construindo um gráfico dos resíduos versus a ordem em que as observações foram

coletadas nos auxilia na detecção da correlação entre os resíduos. O gráfico deve apresentar os
resíduos espalhados em torno da média, de uma maneira aleatória, sem que um determinado
padrão fique configurado para que a hipótese de independência fique configurada. A tabela
abaixo sintetiza as informações necessárias para construir o gráfico. Em cada célula da tabela, o
valor superior se refere ao resíduo e os dois valores na linha inferior se referem ao valor da
observação e da ordem em que foi ela foi coletada (entre parênteses), respectivamente.
Tabela 9.12 – Dados e resíduos para as resistências à tração das fibras.

Porcentagem de Algodão
15 20 25 30 35
1 -2,8 -3,4 -3,6 -2,6 -3,8
7 (15) 12 (8) 14 (18) 19 (22) 7 (17)
2 -2,8 1,6 0,4 3,4 -0,8
7 (19) 17 (14) 18 (13) 25 (5) 10 (21)
Observações
3 5,2 -3,4 0,4 0,4 0,2

15 (25) 12 (1) 18 (20) 22 (2) 11 (4)
4 1,2 2,6 1,4 -2,6 4,2
11 (12) 18 (11) 19 (7) 19 (24) 15 (16)
5 -0,8 2,6 1,4 1,4 0,2
9 (6) 18 (3) 19 (9) 23 (10) 11 (23)
_
xj 9,8 15,4 17,6 21,6 10,8
O gráfico pode ser visto na figura 9.4 abaixo. Os resíduos representados pelos pontos do
gráfico não formam um padrão específico. Eles apresentam um espalhamento aleatório em torno
da média. Não há razão para suspeitar de qualquer violação de independência.
9.4 – Blocos Aleatorizados
Em muitos casos de pesquisa aplicada é necessário delinear o experimento de modo que a

variabilidade proveniente de fontes estranhas possa ser sistematicamente controlada. O exemplo
abaixo ilustra um desses casos.
Três analgésicos devem ser testados com o objetivo de determinar diferenças entre eles.
Poderíamos delinear o experimento como um experimento completamente aleatorizado. Para isto
teríamos que escolher aleatoriamente, digamos 18 pacientes, e dividi-los em três grupos de seis
pessoas cada. Em seguida, os elementos de cada grupo tomariam o analgésico especificado para
aquele grupo e teríamos as dezoito observações desejadas.
199
6
5
4
3
Resí duos ei j
2
1
0
-1 0 5 10 15 20 25 30
-2
-3
-4
-5
Ordem
Figura 9.4 – Gráfico dos resíduos versus ordem de coleta.
O perigo com tal procedimento está na possível diferença de metabolismo das pessoas
escolhidas para participar do experimento. Uma variabilidade muito grande dentro dos grupos
poderia mascarar os efeitos dos analgésicos, isto é, a variabilidade entre os tratamentos poderia
não ser detectada e assim concluirmos que os dados não apresentam suficiente evidências de que
as médias sejam diferentes (a hipótese Ho não seria rejeitada quando deveria ser).
No nosso exemplo, para controlar a fonte estranha (diferenças de metabolismo), e

remover a variabilidade entre os pacientes, utilizamos um delineamento de experimento
denominado Blocos Aleatorizados que requer que o pesquisador teste os três analgésicos em
cada paciente. Cada paciente constituirá um bloco do experimento. Os dados de tempo até o
alívio da dor de cabeça são então analisados com o procedimento da análise de variância.
Exemplo 9.5 – Ilustra o procedimento ANOVA para blocos aleatorizados
Deseja-se comparar três analgésicos com relação ao tempo requerido para aliviar uma dor
de cabeça. Um delineamento baseado em blocos aleatorizados deve ser usado. Para isso, seis
pessoas foram selecionadas com cada pessoa tomando os três comprimidos em diferentes
ocasiões. Os tempos para os medicamentos surtirem efeito são dados na tabela 9.13 abaixo. Ao
nível de 5% de significância, os dados obtidos permitem concluir que existe uma diferença entre
as médias dos tempos até o alívio da dor de cabeça?
Solução
a) As hipóteses neste exemplo podem ser escritas como
Ho: 1 = 2 = 3 (tempos médios de alívio são iguais)

Ha: existem diferenças entre as médias
200
Tabela 9.13 – Tempo até alívio da dor de cabeça (min).
Analgésico (Tratamentos ou Níveis do fator)
A B C Bi
1 18 22 25 65
Pessoas (Blocos)
2 14 23 13 50
3 21 19 23 63
4 20 29 24 73
5 12 19 13 44
6 13 20 20 53
Tj 98 132 118 348
b) O nível de significância é  = 0,05
c) Valor crítico F
Neste problema sabemos que
Número de tratamentos → k = 3
Número de blocos → m = 6
Número total de observações → n = km = 18
O número de graus de liberdade é dado por GL = (k-1, n-k-m+1) = (2, 10) e o valor
crítico, dado pela tabela, é F0,05 = 4,10.
d) Soma dos quadrados
Podemos calcular as diversas somas de quadrados de acordo com as fórmulas dadas

anteriormente.
A soma dos quadrados total SQT é dada por:
( x )2
(348)
2
SQT =  x 2
− = 7118 − = 7118 − 6728 = 390
n 18
A soma dos quadrados dos tratamentos ou grupos SQG representa a variação entre as
médias dos tempos até o alívio da dor para os tratamentos (analgésicos) e é dada por:
1  k 2  ( x ) (348)
2
( )
2
1 2
SQG =   T j  − = 98 + 132 + 118 −
2 2
= 6825,333 − 6728 = 97,333
m  j =1  n 6 18
A soma dos quadrados dos blocos SQB representa a variação entre as médias dos tempos
até o alívio da dor para os blocos (pessoas) e é dada por:
201
 ( x )
2
1 m
SQB =   Bi2  −
k  i =1
1
(
= 65 2 + 50 2 + 632 + 732 + 44 2 + 532 − )
348 2
= 194,667
 n 3 18
Finalmente, a soma dos quadrados dos erros SQE é dada pela diferença
SQE = SQT – SQG – SQB = 390 – 97,333 – 194,667 = 98
Ela representa a variação entre os tempos de alívio dentro das amostras para os
tratamentos com a variação devido aos blocos removida.
A tabela ANOVA pode agora ser construída. Para isso basta calcular os quadrados
médios QMG, QMB e QME.
QMG = SQG/(k-1) = 97,333/2 = 48,667

QMB = SQB/(m-1) = 194,667/5 = 38,933
QME = SQE/(n-k-m+1) = 98/10 = 9,800
Tabela 9.14 – Tabela ANOVA para o exemplo.

Fonte GL SQ QM F
Grupos ou Tratamentos 2 97,333 48,667 4,97
Blocos 5 194,667 38,933
Erro 10 98,000 9,8
390
Total 17
O valor crítico de F0,05 com GL = (2,10) é igual a 4,10. Desta forma, o valor da estatística
F cai na região de rejeição (4,97 > 4,10) e podemos concluir que os dados fornecem evidência
suficiente para rejeitar a hipótese nula e que existe diferenças entre as médias nos tempos de
alívio para os três analgésicos.
9.4.1 - Procedimento ANOVA para blocos aleatorizados
Através do exemplo foi possível observarmos que existem quatro somas dos quadrados como
mostrado na figura 9.5. A variabilidade total dos dados é dividida em uma componente
representando a variabilidade entre as médias das amostras para os tratamentos, uma componente
representando a variabilidade entre as médias das amostras para os blocos e uma componente
representando a variabilidade dentro das amostras para os tratamentos com a variabilidade
devida aos blocos removida.
202
Soma dos Quadrados dos tratamentos
SQG
Soma dos Quadrados Total Soma dos Quadrados dos Blocos

SQT SQB
Soma dos Quadrados dos Erros

SQE
Figura 9.5 – Partição da soma dos quadrados total.
Os valores das somas dos quadrados, dos graus de liberdade associados a cada um e os
respectivos quadrados médios são dispostos na tabela ANOVA de modo similar ao do
experimento completamente aleatorizado, como mostrado abaixo.
Tabela 9.15 – Tabela ANOVA genérica.

Fonte GL SQ QM F
Grupos ou Tratamentos k-1 SQG QMG = SQG/(k-1) QMG/QME
Blocos m-1 SQB QMB = SQB/(m-1)
Erro n-k-m+1 SQE QME = SQE/(n-k-m+1)
Total n-1 SQT
Os passos adotados para análise estatística de um delineamento com blocos aleatorizados

são descritos no procedimento 9.2 a seguir. Observemos que o teste de hipóteses é sempre
unilateral à direita uma vez que a hipótese nula é rejeitada somente quando a estatística de teste F
é muito grande.
203
Procedimento 9.2 – Aplicar ANOVA para k médias de populações
Blocos aleatorizados e amostras independentes
Populações normais
Populações com mesmo desvio padrão
Passo 1 – Escreva as hipóteses nula e alternativa

Passo 2 – Defina o nível de significância .
Passo 3 – O valor crítico é F, com GL = (k-1, n-k-m+1), onde m é o número de blocos e n
é o número total de dados
Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas
( x )2
( x ) 2
SQT =  x 2
−
n
1
( )
SQG = T12 + T22 + ... + Tk2 −
m n
( x ) 2
1
(
SQB = B12 + B22 + ... + Bm2 −
k
) n
SQE = SQT – SQG –SQB , onde, x = soma dos valores de todas as observações
Passo 5 – Construa a tabela ANOVA

QMG = F=
Grupo k −1 QME
Bloco m-1 SQB SQB
QMB =
m −1
Erro n–k–m+1 SQE SQE
QME =
n − k − m +1
Total n -1 SQT
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
Passo 7 – Escreva sua conclusão.
204
1) A tabela abaixo é uma tabela ANOVA incompleta de um experimento com blocos

aleatorizados. Preencha os espaços em branco de acordo com a teoria vista.
Fonte GL SQ QM F
Grupos ou Tratamentos 2 21,667
Blocos 55,060
Erro 8
Total 14 127,733
2) Quatro marcas de gasolina devem ser testadas para se comparar o consumo. Para o teste seis
carros foram selecionadas. Cada carro percorreu uma distância de 480 Km, em rota
especificada, com cada uma das quatro marcas de gasolina. O consumo resultante, dado em
Km/l, é mostrado na tabela abaixo. Ao nível de 1% de significância, os dados obtidos
implicam que existe uma diferença no consumo médio entre as quatro marcas de gasolina?
Marca da Gasolina
A B C D
1 8 7 7 8
2 7 6 5 7
Carro
3 9 9 8 10
4 12 12 10 13
5 12 11 10 11
6 7 6 5 6
3) Discuta dois casos (não relatados neste texto) onde seria indicado usar um delineamento
baseado em blocos aleatorizados.
205
9.5 – Quadrados latinos
Na seção anterior nós introduzimos o delineamento com blocos aleatorizados como sendo
uma maneira de reduzir o erro residual em um experimento através da remoção da variabilidade
devido a fatores estranhos. Existem diversos outros tipos de delineamento que utilizam o
princípio dos bloqueios. Por exemplo, suponha que um pesquisador esteja estudando o efeito de
cinco diferentes formulações de uma mistura explosiva, usada na fabricação de dinamite, na
força de explosão. Cada formulação é obtida de um lote de matéria prima que é suficiente apenas
para cinco formulações serem testadas. Além disso, as formulações são preparadas por diferentes
operadores e pode haver diferenças substanciais nas habilidades e experiências dos operadores.
Dessa forma, dois fatores estranhos podem contribuir para uma maior variabilidade do erro
residual; lotes de matéria prima e operadores.
O delineamento adequado para este caso consiste em testar cada formulação exatamente
uma vez em cada lote de matéria prima de maneira que cada operador prepare uma única
formulação por lote. Assim, para cada lote, as cinco formulações serão preparadas pelos cinco
operadores, cada um deles preparando uma determinada formulação. O delineamento resultante,
mostrado na tabela 9.16, é denominado Quadrado Latino. Observemos que o delineamento é um
arranjo quadrado e que as cinco formulações (tratamentos) são identificadas pelas letras latinas
A, B, C, D e E, daí o nome Quadrado latino.
Tabela 9.16 – Quadrado latino para o problema de formulações de dinamite.

Lotes de Operadores
matéria prima 1 2 3 4 5
1 A = 24 B = 20 C = 19 D = 24 E = 24
2 B = 17 C = 24 D = 30 E = 27 A = 36
3 C = 18 D = 38 E = 26 A = 27 B = 21
4 D = 26 E = 31 A = 26 B = 23 C = 22
5 E = 22 A = 30 B = 20 C = 29 D = 31
O delineamento Quadrado latino é usado para eliminar duas fontes estranhas de

variabilidade; isto é, para bloquear sistematicamente duas direções. Em geral, um quadrado
latino para p fatores (ou tratamentos) é um quadrado contendo p linhas e p colunas. Cada uma
das p2 células ocorre uma e somente uma vez em cada linha e coluna.
O modelo estatístico para o Quadrado latino é
xijk =  + i + j + k + ijk , com
i = 1, 2, ... , p
j = 1, 2, ... , p
k = 1, 2, ... , p
xijk = observação na i-ésima linha e k-ésima coluna para o j-ésimo tratamento,
 = média global,
i = é o efeito da i-ésima linha,
k = é o efeito da k-ésima coluna,
ijk = erro aleatório.
206
A análise de variância consiste em partir a soma dos quadrados total das p2 observações
em componentes para as linhas, colunas, tratamentos e erros, como se segue.
SQT = SQlinhas + SQcolunas + SQtratamentos + SQE
( x ) 2
SQT =  x 2
−
n
( x ) 2
1
(
SQlinhas = L12 + L22 + ... + L2p −
p n
)
( x ) 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
)
( x ) 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
)
Os termos L1, L2, ... , Lp correspondem aos totais das linhas e C1, C2, ... , Cp aos totais das
colunas.
Os termos T1, T2, ... , Tp correspondem, no exemplo dado, às diversas formulações sob
teste, isto é, às formulações A, B, C, D e E.
O número de graus de liberdade para cada soma de quadrados é
Total Linhas Colunas Tratamentos Erro
p2 -1 p-1 p-1 p-1 (p - 2)(p – 1)
Dividindo-se cada soma de quadrados acima pelo seu número de graus de liberdade
obtém-se os quadrados médios. A estatística de teste é, novamente, o quociente de QMG por
QME, ou seja:
F = QMG/QME
O número de graus de liberdade do numerador e do denominador pode ser indicado por

GL = [p-1, (p-2)(p-1)]. A tabela 9.17 mostra um resumo para o procedimento de análise de
variância para os Quadrados latinos.
Podemos observar que a análise é uma simples extensão do delineamento para blocos
aleatorizados. O exemplo anterior das formulações de dinamite será usado para mostrar como os
cálculos podem ser facilitados mediante uma simples codificação.
207
Tabela 9.17 – ANOVA para o delineamento por Quadrado latino.
Fonte GL SQ QM F
Grupos ou p-1 SQG QMG = SQG/(p-1) QMG/QME

Tratamentos
Linhas p-1 SQlinhas QML = SQlinhas/(p-1)
Colunas p-1 SQcolunas QMC =SQcolunas/(p-1)
Erro (p – 2)(p –1) SQE QME = SQE/(p-2)(p-1)
Total p2-1 SQT
Exemplo 9.6 – Ilustra o procedimento Quadrado Latino
Os dados da tabela 9.16 representam os resultados dos ensaios realizados com as

diferentes formulações de dinamite. Verificar se existem evidências suficientes para afirmarmos
que as diferentes formulações possuem efeitos diferentes com um nível de significância de 1%.
Solução
Os passos a serem seguidos são exatamente os mesmos mostrados nos procedimentos 9.1
e 9.2. Entretanto, para facilitar os cálculos vamos subtrair 25 de cada valor da tabela obtendo a
tabela abaixo. Podemos mostrar que as somas dos quadrados não se alteram quando subtraímos
um mesmo valor de cada uma das observações.
Lotes de Operadores Li
matéria prima 1 2 3 4 5
1 A = -1 B = -5 C = -6 D = -1 E = -1 -14
2 B = -8 C = -1 D=5 E=2 A = 11 9
3 C = -7 D = 13 E=1 A=2 B = -4 5
4 D=1 E=6 A=1 B = -2 C = -3 3
5 E = -3 A=5 B = -5 C=4 D=6 7
Cj -18 18 -4 5 9 x = 10
Passo 1 – Hipóteses
Ho: 1 = 2 = 3 = 4 = 5
Ha: pelo menos uma diferença existe
Passo 2 – Nível de significância  = 0,01
Passo 3 – Valor crítico F0,01 = 5,41 pois GL = (4,12)
208
Passo 4 – Soma dos quadrados
( x ) 2
10 2
SQT =  x 2
− = 680 − = 676,00
n 25
( x ) 1 2
1 2
p
(
SQlinhas = L1 + L2 + ... + L p −
2 2
n 5
)
= (−14) + 9 + 5 + 3 + 7 −
2 2 2 2 2
(
10 2
25
= 68,00 )
( x ) 1 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
) (
= (−18) 2 + 18 2 + (−4) 2 + 5 2 + 9 2 − 4 = 150,00
5
)
Os totais para os tratamentos são dados por
Tratamento Total do tratamento

(ou letra)
A 18
B -24
C -13
D 24
E 5
( x) 1 2 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
) (
= 18 + (−24) 2 + (−13) 2 + 24 2 + 5 2 − 4 = 330,00
5
)
A soma dos quadrados dos erros é determinada por subtração.
SQE = SQT – (SQlinhas + SQcolunas + SQtratamentos )
SQE = 676,00 – 68,00 – 150,00 – 330,00 = 128,00
Passo 5 – Tabela ANOVA
Fonte GL SQ QM F
Grupos ou Tratamentos 4 330,00 QMG = 82,50 7,73

Linhas 4 68,00 QML = 17,00
Colunas 4 150,00 QMC = 37,50
Erro 12 128,00 QME = 10,67
Total 25 676,00
209
Passo 6 – Como O valor crítico é de 5,41, verificamos que o valor calculado da estatística cai na
região de rejeição, portanto devemos rejeitar a hipótese nula Ho.
Passo 7 – Os dados obtidos mostram evidências suficientes para concluirmos que existem
diferenças entre as diversas formulações.
1) Um engenheiro industrial está conduzindo uma experiência do efeito de quatro diferentes

métodos de montagem sobre tempo de montagem de um componente de uma televisão.
Quatro operadores são selecionados para o estudo. O engenheiro sabe que cada método de
montagem produz uma fadiga tal que o tempo requerido para a última montagem
possivelmente será maior que o requerido pela primeira, qualquer que seja o método usado.
Para levar em conta essa fonte de variabilidade, o engenheiro usou o delineamento Quadrado
latino obtendo os dados abaixo. Existe evidência de que os métodos de montagem produzam
efeitos diferentes a um nível de significância de 5%?
Ordem de Operador
montagem 1 2 3 4
1 C = 10 D = 14 A=7 B=8
2 B=7 C = 18 D = 11 A=8
3 A=5 B = 10 C = 11 D=9
4 D = 10 A = 10 B = 12 C = 14
210

09 - Capítulo 9 - v01 - 2020 PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

09 - Capítulo 9 - v01 - 2020 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Capítulo 9

Análise de Variância - ANOVA

1. Entender o termo análise de variância.

O procedimento de análise de variância utiliza uma classe de distribuição contínua de

Figura 9.1 – Distribuição F.

Algumas propriedades das curvas F

1. A área total sob a curva é igual a 1.

Graus de Liberdade para o Numerador

1 4052.00 4999.50 5403.00 5625.00 5764.00 5859.00 5928.00 5981.00 6022.00

7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72

Graus de Liberdade para o Numerador

Graus de Liberdade para o Numerador

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39

Graus de Liberdade para o Numerador

Para uma curva F com df = (4,12) determine F0,05.

Figura 9.2 – Curva F com df = (4,12).

Exercícios – Seqüência 9.1

1) Uma curva F tem df = (12,7). Qual é o número de graus de liberdade para

2) Para uma curva F com df = (12,5) determine o valor de F com

A análise de variância é um procedimento de inferência que é usado para comparar as

A variabilidade que usualmente é encontrada na amostra é chamada variação dentro do

Nesta seção veremos o procedimento adotado para comparar as médias considerando-se

Suponha a existência de três grupos (ou amostras), cada um sujeito a um tratamento,

O procedimento ANOVA se baseia na determinação da variabilidade total dos dados, na

SQT =   xij − x..  =  x 2 − (9.1)

A variabilidade entre os grupos (ou tratamentos), denominada soma de quadrados entre

Ou, mais simplificadamente por

xk = soma das medidas do grupo k

A variabilidade dentro de cada grupo é denominada soma de quadrados dos grupos ou

SQT = SQG + SQE

Tabela 9.5 – Graus de liberdade das somas de quadrados.

Conforme mencionado, nós decidiremos se a variação entre as médias das amostras

Exemplo 9.2 – Ilustra ANOVA com um fator

Um fisioterapeuta deseja comparar os efeitos de três diferentes técnicas de fisioterapia no

Tabela 9.5 – Dados da avaliação dos pacientes.

2) A Hipótese alternativa será escrita da seguinte forma

Ha: Ao menos uma diferença existe entre as médias das populações

3) O nível de significância será definido em 5% conforme o enunciado.

SQE = SQT – SQG = 1973,11 – 1064,11 = 909

Dividindo-se a soma dos quadrados pelos respectivos graus de liberdade obtém-se as

SQG 1064 ,11

Tabela 9.6 – Exemplo de uma tabela ANOVA.

Grupos 2 1064,11 532,06 8,78

Erro 15 909,00 60,60

8) Rejeite ou deixe de rejeitar Ho

Tabela 9.7 – Formato da tabela para análise de variância.

O procedimento completo para a aplicação de análise de variância é dado a seguir com

Passo 1 – Escreva as hipóteses nula e alternativa

Passo 4 – Calcule as somas de quadrados usando as fórmulas simplificadas

SQE = SQT - SQG

onde, j =1, 2, 3, ..., k e

Passo 5 – Construa a tabela ANOVA

Fonte GL SQ QM=SQ/GL Estatística F

Passo 7 – Escreva sua conclusão.

José Marcos Pedro

Com um nível de significância de 5% podemos afirmar que existe uma diferença na

Passo 2 – Nível de significância  = 0,05

Passo 3 – Valor crítico F0,05 = 3,89, pois GL = (2, 12)

Passo 4 – Cálculo das somas de quadrados

SQG = 460,8 + 387,2 + 480,2 – 1325,4 = 1328,2 – 1325,4 = 2,8

SQE = SQT – SQG = 13,6 – 2,8 = 10,8

Passo 5 – Tabela ANOVA

Fonte GL SQ QM=SQ/GL Estatística F