Escolar Documentos
Profissional Documentos
Cultura Documentos
Objetivos do Capítulo
Este capítulo fornece métodos para comparar as médias de mais de duas populações.
Serão estudados dois métodos denominados Análise de variância para 1 fator e
Análise de variância para 2 fatores. Esses métodos utilizam uma distribuição chamada
distribuição F que será vista em primeiro lugar. Após o término deste capítulo, você
deverá ser capaz de:
179
9.1) Distribuição F
Usando as curvas F
As áreas sob as curvas F podem ser encontradas em tabelas. Normalmente elas são usadas
para um valor igual a 0,01 ou 0,05 o que nos conduz à notação F0,01 e F0,05 para indicar os
valores de F que definem uma área de 0,01 ou 0,05 à sua direita, respectivamente. A tabela 9.1
fornece os valores para F0,01. No topo da tabela estão especificados os graus de liberdade para o
numerador e na coluna à esquerda, os graus de liberdade para o denominador. A tabela 9.2 é
similar à tabela 9.1, fornecendo os valores para F0,05.
180
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 à direita de F.
1 2 3 4 5 6 7 8 9
181
Tabela 9.1 – Valores de F (F0,01 ) para uma área de 0,01 (continuação).
8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
182
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 à direita de F.
183
Tabela 9.2 – Valores de F (F0,05 ) para uma área de 0,05 (continuação).
9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 2.20 2.13 2.06 1.97 1.93 1.93 1.88 1.79 1.73 1.67
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
184
Exemplo 9.1 – Ilustra o uso das tabelas
Solução
Determinar F0,05 significa encontrar o valor de F de modo que a área à sua direita seja
igual a 0,05, como mostrado na figura 9.2.
Para obter o valor de F pedido podemos usar a tabela 9.2. Neste exemplo, o número de
graus de liberdade para o numerador é 4 e para o denominador é 12. Assim, procuramos pela
intersecção da coluna contendo o valor 4 com a linha contendo o valor 12 e encontramos o valor
3,26, que é o valor pedido, ou seja, F0,05 = 3,26.
185
9.2 - Análise de variância para um fator
Estudando agora a tabela 9.4, já vemos uma situação mais comum onde uma variação
aleatória é encontrada dentro dos grupos.Vemos também que existe uma variação entre as
médias dos três grupos. Em virtude da variação dentro dos grupos, não é mais possível tirar
conclusões sobre o efeito dos diferentes tratamentos a que os grupos foram submetidos.
O ponto importante é que qualquer variação observada entre as médias dos grupos
consiste de (1) uma componente que é devido à variação dentro do grupo e (2) uma componente
que é devido a um possível efeito do tratamento.
Tabela 9.3 – Dados relativos a três tratamentos sem variação dentro dos grupos.
Tratamentos
1 2 3
6 9 13
6 9 13
6 9 13
6 9 13
6 9 13
_ _ _
x1 = 6 x1 = 9 x1 = 13
Se a variabilidade total entre os grupos consiste dessas duas componentes então nós
devemos, de alguma maneira, separar, avaliar e comparar essas duas componentes. Neste
processo, se nós encontrarmos que a variação entre os grupos não é maior que a variação
aleatória (ou erro) dentro dos grupos, então a conclusão será que os diferentes tratamentos não
186
têm um efeito significativo sobre os resultados e a variabilidade total é devida à variação
aleatória natural dos processos envolvidos na experimentação.
Tabela 9.4 – Dados relativos a três tratamentos com variação dentro dos grupos.
Tratamentos
1 2 3
6 3 5
4 8 6
7 4 4
3 5 6
5 9 3
_ _ _
x1 = 5 x1 = 5,8 x1 = 4,8
Cálculo da variabilidade
k n
_
2
( x ) 2
_
1 k n
e x.. = xij , onde
nk j =1 i =1
(9.2)
_
x.. = média de todas as medidas
k = número de grupos
n = número de medidas (ou dados) por grupo
nT = n k = número total de medidas ou observações
i = 1, 2, ..., n e j = 1, 2, ..., k
k n
xij
2
1 k n
2
_ _
SQG = n x j − x.. = xij −
k
j =1 i =1
(9.3)
j =1 n j =1 i =1 n T
_
onde x j é a média do grupo j ( j = 1, 2, .., k)
Obs: se o número de medidas ou observações não for o mesmo para todos os grupos, isto é, se
tivermos n1 medidas no grupo 1, n2 medidas no grupo 2 e assim por diante, até nk medidas no
grupo k, então SQG será calculado de acordo com a expressão
187
2
nj k nj
xij xij
i =1
− j =1 i =1
k
SQG = (9.4)
j =1 nj nT
( x ) ( x ) 2 2
( x ) ( x )
2 2
SQG = + + + −
1 2 k
(9.5)
n1 n2 nk nT
onde
2
k
_n
SQE = xij − x j (9.6)
j =1 i =1
_
onde x j é a média das observações do j-ésimo grupo ou amostra.
Se as médias das k populações forem iguais então toda a variabilidade medida pela
expressão (9.1) é devida ao acaso. Porém, se forem diferentes então parte da variabilidade é
proveniente da variabilidade natural dentro do grupo e parte devido à aplicação dos diferentes
tratamentos. Podemos demonstrar que a variabilidade total é igual à soma das variabilidades
dentro dos grupos e entre os grupos, ou seja,
2 2 2
k n
_
k
_ _ k n
_
ij
j =1 i =1
x − x ..
= n j .. xij − x j
j =1
x − x
+
j =1 i =1
(9.7)
Cada uma das somas de quadrados tem um grau de liberdade associado a ela, conforme
mostrado na tabela 9.5.
188
Dividindo cada uma das somas de quadrados SQT, SQG e SQE pelos respectivos graus
de liberdade, obtemos os quadrados médios, que são então dados por:
SQG
Quadrado médio entre grupos = QMG =
k −1
SQE
Quadrado médio dos erros = QME =
nT − k
QMG
F=
QME
como a estatística de teste. Grandes valores de F indicam que QMG é grande relativo a QME e
assim, que a hipótese de médias de populações iguais deve ser rejeitada. O procedimento de
análise de variância será explicado com base no exemplo a seguir.
189
Com um nível de significância de 5%, existe alguma diferença nas médias dos três
tratamentos?
Solução
1) Queremos saber se há alguma diferença entre as médias das populações representadas por
cada um dos três grupos. Assim a hipótese nula é
Ho: A = B = C
( x ) 2
1390 2
SQT = x − 2
= 109312 − = 1973,11
n T 18
( x ) ( x ) ( x ) ( x )
2 2 2 2
SQG = + + −
A B C
nA nB nC nT
SQG =
(463)2 + (407)2 + (520)2 − 107338,89 = 1064,11
6 6 6
5) Graus de liberdade
GLT = nT – 1 = 18 – 1 = 17
GLG = k – 1 = 3 – 1 = 2
GLE = GLT – GLG = 17 – 2 = 15
6) Cálculo da estatística
SQE 909
QME = = = 60 ,60
GLE 15
190
7) Cálculo de F e tabela ANOVA
QMG 532,06
F2,15 = = = 8,78
QME 60,60
Um resumo dos valores obtidos até agora pode ser mostrado na tabela 9.6.
Fonte GL SQ MQ F[2,15]
Total 17 1973,11
Da tabela 9.2, no cruzamento da coluna 2 com linha 15 obtemos o valor F 0,05 igual a 3,68,
para um nível de confiança de 5%. Como o valor de F obtido no passo anterior foi de
8,78, portanto maior que 3,68, concluímos que podemos rejeitar Ho. Isto significa que
temos evidências de que existe pelo menos uma diferença estatisticamente significativa
entre os três pares do grupo de médias.
A tabela mostrada no exemplo acima pode ser generalizada como mostrado na tabela 9.7.
191
Procedimento 9.1 – Aplicar ANOVA para k médias de populações
Amostras independentes
Populações normais
Populações com mesmo desvio padrão
( x ) 2
SQT = x − 2
n T
( x ) ( x ) 2 2
( x ) ( x )
2 2
SQG = + + + −
1 2 k
n1 n2 nk nT
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
192
Exemplo 9.3 – Ilustra o procedimento 9.1
Os tempos requeridos por três trabalhadores para realizar uma tarefa em uma linha de montagem
foram cronometrados em cinco ocasiões aleatoriamente escolhidas. Os tempos são dados na
tabela abaixo, aproximados para o inteiro mais próximo.
Solução
Passo 1 – Hipóteses
Ho: 1 = 2 = 3
Ha: Ao menos uma diferença existe entre as médias das populações
( x ) 2
SQT = x − 2
= 1339 – (141)2/ 15 = 1339 – 1325,4 = 13,6
n T
( x ) ( x ) 2 2
( x ) ( x )
2 2
SQG = + + + −
1 2 k
= (48)2/5 + (44)2/5 + (49)2/5 – 1325,4
n1 n2 nk nT
193
Passo 6 – O valor da estatística (1,55) é menor que o valor crítico (3,74) e, portanto, não
devemos rejeitar Ho.
Passo 7 – Os dados obtidos não fornecem evidências para concluir que o tempo médio gasto
pelos funcionários, para desempenhar a tarefa de montagem, sejam diferentes.
1) Um criador de porcos deseja testar três diferentes dietas desenvolvidas para maximizar o
ganho de peso. O criador seleciona aleatoriamente 12 porcos e os divide em três grupos,
também de maneira aleatória. A cada um dos grupos é aplicado um dos programas de dieta.
O ganho de peso para cada porco, em Kg, após um período de seis semanas é dado pela
tabela abaixo.
Com um nível de significância de 5% podemos afirmar que existe uma diferença na média
dos pesos das três dietas aplicadas?
b)
3) O gerente geral de uma grande cadeia de lojas de conveniência deseja testar os efeitos de três
estratégias de propaganda. As estratégias são:
Estratégia 1 : nenhuma propaganda
Estratégia 2: distribuir panfletos na vizinhança da loja
Estratégia 3: distribuir panfletos e anunciar em jornais
Foram escolhidas aleatoriamente 18 lojas divididas em 3 grupos. Cada grupo usou uma das
três estratégias. A tabela abaixo apresenta valores arrecadados com vendas em um período de
194
1 mês. Os dados coletados proporcionam evidência de que existem diferenças entre as
médias de vendas das três estratégias?
195
9.3 – Adequabilidade do modelo
onde xij é o valor da i-ésima observação do j-ésimo tratamento, é a média global, j representa
o efeito do tratamento j e ij é o erro aleatório associado aos xij.
Para o teste de hipóteses, assumimos que os erros ij sejam variáveis aleatórias
independentes e normalmente distribuídas, com média zero e variância 2. A variância 2 é
considerada constante para todos os tratamentos ou níveis do fator em estudo. Como estamos
trabalhando com um único fator, o modelo apresentado acima é denominado modelo de análise
de variância para um fator. Se assumirmos que as observações são feitas de uma forma
completamente aleatória então o planejamento experimental é dito experimento completamente
aleatorizado com um único fator.
O modelo (9.8) pode ainda ser classificado em modelo de efeitos fixos ou modelo de
efeitos aleatórios. O modelo de efeitos fixos ocorre quando fixamos a priori os níveis do fator
estudado. Por exemplo, se queremos analisar o efeito de três técnicas de aprendizado somente,
então os níveis do fator estarão automaticamente fixados. No modelo de efeitos fixos são
testadas hipóteses sobre as médias dos diversos níveis ou tratamentos e as conclusões são válidas
apenas para os níveis escolhidos para análise.
Porém, se dispomos de mais de três técnicas e escolhemos de forma aleatória apenas três
entre as diversas técnicas disponíveis, isto é, se escolhemos uma amostra aleatória da população
de técnicas (níveis do fator) então estaremos tratando com o modelo de efeitos aleatórios. Neste
caso, as conclusões obtidas serão estendidas a todos os níveis do fator e não apenas àqueles
níveis selecionados.
O modelo (9.8) assume que os erros ij sejam variáveis aleatórias independentes e
normalmente distribuídas, com média zero e variância 2. Podemos verificar se essas hipóteses
estão satisfeitas através da análise dos resíduos, que são definidos por
_
eij = xij − x j (9.9)
196
Exemplo 9.4 – Ilustra os procedimentos de teste do modelo
Um certo fabricante tem interesse na resistência à tração de uma fibra sintética usada na
fabricação de tecidos para camisas masculinas. Ele suspeita que a resistência é afetada pela
porcentagem de algodão contida na fibra. Cinco níveis de porcentagem de algodão são de
interesse, 15 %, 20 %, 25%, 30% e 35%. Para cada nível, devem ser feitas 5 observações,
perfazendo um total de 25 observações. Um procedimento ANOVA com um único fator deve ser
adotado para testar se a resistência é realmente afetada pela quantidade de algodão presente na
fibra.
Solução
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Podemos agora selecionar um número, aleatoriamente, entre 1 e 25. Suponha que este
número seja 8. Então o experimento é realizado, para as condições da observação de número 8
(20% de algodão), obtendo-se em primeiro lugar o valor para esta observação. Repetindo esta
escolha aleatória de números entre 1 e 25 definimos a ordem em que observações serão
coletadas. Isto nos leva à tabela abaixo.
197
As 25 observações são feitas nesta seqüência e os dados obtidos são mostrados na tabela
seguinte.
2 7 17 18 25 10
3 15 12 18 22 11
4 11 18 19 19 15
5 9 18 19 23 11
Totais 49 77 88 108 54 376
Total 24 636,96
6
5
Frequência
4
3
2
1
0
-3 -2 -1 0 1 2 3 4 5 6
Resíduos
198
Infelizmente, com amostras pequenas pode ocorrer uma flutuação considerável de modo
que uma fuga moderada da normalidade não necessariamente implica em uma violação séria e
pode requer uma análise mais profunda. Isto claramente está ocorrendo na figura acima.
O gráfico pode ser visto na figura 9.4 abaixo. Os resíduos representados pelos pontos do
gráfico não formam um padrão específico. Eles apresentam um espalhamento aleatório em torno
da média. Não há razão para suspeitar de qualquer violação de independência.
Três analgésicos devem ser testados com o objetivo de determinar diferenças entre eles.
Poderíamos delinear o experimento como um experimento completamente aleatorizado. Para isto
teríamos que escolher aleatoriamente, digamos 18 pacientes, e dividi-los em três grupos de seis
pessoas cada. Em seguida, os elementos de cada grupo tomariam o analgésico especificado para
aquele grupo e teríamos as dezoito observações desejadas.
199
6
5
4
3
Resí duos ei j
2
1
0
-1 0 5 10 15 20 25 30
-2
-3
-4
-5
Ordem
O perigo com tal procedimento está na possível diferença de metabolismo das pessoas
escolhidas para participar do experimento. Uma variabilidade muito grande dentro dos grupos
poderia mascarar os efeitos dos analgésicos, isto é, a variabilidade entre os tratamentos poderia
não ser detectada e assim concluirmos que os dados não apresentam suficiente evidências de que
as médias sejam diferentes (a hipótese Ho não seria rejeitada quando deveria ser).
Deseja-se comparar três analgésicos com relação ao tempo requerido para aliviar uma dor
de cabeça. Um delineamento baseado em blocos aleatorizados deve ser usado. Para isso, seis
pessoas foram selecionadas com cada pessoa tomando os três comprimidos em diferentes
ocasiões. Os tempos para os medicamentos surtirem efeito são dados na tabela 9.13 abaixo. Ao
nível de 5% de significância, os dados obtidos permitem concluir que existe uma diferença entre
as médias dos tempos até o alívio da dor de cabeça?
Solução
200
Tabela 9.13 – Tempo até alívio da dor de cabeça (min).
Analgésico (Tratamentos ou Níveis do fator)
A B C Bi
1 18 22 25 65
Pessoas (Blocos)
2 14 23 13 50
3 21 19 23 63
4 20 29 24 73
5 12 19 13 44
6 13 20 20 53
Tj 98 132 118 348
c) Valor crítico F
Número de tratamentos → k = 3
Número de blocos → m = 6
Número total de observações → n = km = 18
O número de graus de liberdade é dado por GL = (k-1, n-k-m+1) = (2, 10) e o valor
crítico, dado pela tabela, é F0,05 = 4,10.
( x )2
(348)
2
SQT = x 2
− = 7118 − = 7118 − 6728 = 390
n 18
A soma dos quadrados dos tratamentos ou grupos SQG representa a variação entre as
médias dos tempos até o alívio da dor para os tratamentos (analgésicos) e é dada por:
1 k 2 ( x ) (348)
2
( )
2
1 2
SQG = T j − = 98 + 132 + 118 −
2 2
= 6825,333 − 6728 = 97,333
m j =1 n 6 18
A soma dos quadrados dos blocos SQB representa a variação entre as médias dos tempos
até o alívio da dor para os blocos (pessoas) e é dada por:
201
( x )
2
1 m
SQB = Bi2 −
k i =1
1
(
= 65 2 + 50 2 + 632 + 732 + 44 2 + 532 − )
348 2
= 194,667
n 3 18
Finalmente, a soma dos quadrados dos erros SQE é dada pela diferença
Ela representa a variação entre os tempos de alívio dentro das amostras para os
tratamentos com a variação devido aos blocos removida.
A tabela ANOVA pode agora ser construída. Para isso basta calcular os quadrados
médios QMG, QMB e QME.
390
Total 17
O valor crítico de F0,05 com GL = (2,10) é igual a 4,10. Desta forma, o valor da estatística
F cai na região de rejeição (4,97 > 4,10) e podemos concluir que os dados fornecem evidência
suficiente para rejeitar a hipótese nula e que existe diferenças entre as médias nos tempos de
alívio para os três analgésicos.
Através do exemplo foi possível observarmos que existem quatro somas dos quadrados como
mostrado na figura 9.5. A variabilidade total dos dados é dividida em uma componente
representando a variabilidade entre as médias das amostras para os tratamentos, uma componente
representando a variabilidade entre as médias das amostras para os blocos e uma componente
representando a variabilidade dentro das amostras para os tratamentos com a variabilidade
devida aos blocos removida.
202
Soma dos Quadrados dos tratamentos
SQG
Os valores das somas dos quadrados, dos graus de liberdade associados a cada um e os
respectivos quadrados médios são dispostos na tabela ANOVA de modo similar ao do
experimento completamente aleatorizado, como mostrado abaixo.
203
Procedimento 9.2 – Aplicar ANOVA para k médias de populações
Blocos aleatorizados e amostras independentes
Populações normais
Populações com mesmo desvio padrão
( x )2
( x ) 2
SQT = x 2
−
n
1
( )
SQG = T12 + T22 + ... + Tk2 −
m n
( x ) 2
1
(
SQB = B12 + B22 + ... + Bm2 −
k
) n
SQE = SQT – SQG –SQB , onde, x = soma dos valores de todas as observações
Passo 6 – Se o valor da estatística F cair na região de rejeição, rejeite Ho; caso contrário não
rejeite Ho.
204
Exercícios – Seqüência 9.3
Fonte GL SQ QM F
Blocos 55,060
Erro 8
Total 14 127,733
2) Quatro marcas de gasolina devem ser testadas para se comparar o consumo. Para o teste seis
carros foram selecionadas. Cada carro percorreu uma distância de 480 Km, em rota
especificada, com cada uma das quatro marcas de gasolina. O consumo resultante, dado em
Km/l, é mostrado na tabela abaixo. Ao nível de 1% de significância, os dados obtidos
implicam que existe uma diferença no consumo médio entre as quatro marcas de gasolina?
Marca da Gasolina
A B C D
1 8 7 7 8
2 7 6 5 7
Carro
3 9 9 8 10
4 12 12 10 13
5 12 11 10 11
6 7 6 5 6
3) Discuta dois casos (não relatados neste texto) onde seria indicado usar um delineamento
baseado em blocos aleatorizados.
205
9.5 – Quadrados latinos
Na seção anterior nós introduzimos o delineamento com blocos aleatorizados como sendo
uma maneira de reduzir o erro residual em um experimento através da remoção da variabilidade
devido a fatores estranhos. Existem diversos outros tipos de delineamento que utilizam o
princípio dos bloqueios. Por exemplo, suponha que um pesquisador esteja estudando o efeito de
cinco diferentes formulações de uma mistura explosiva, usada na fabricação de dinamite, na
força de explosão. Cada formulação é obtida de um lote de matéria prima que é suficiente apenas
para cinco formulações serem testadas. Além disso, as formulações são preparadas por diferentes
operadores e pode haver diferenças substanciais nas habilidades e experiências dos operadores.
Dessa forma, dois fatores estranhos podem contribuir para uma maior variabilidade do erro
residual; lotes de matéria prima e operadores.
O delineamento adequado para este caso consiste em testar cada formulação exatamente
uma vez em cada lote de matéria prima de maneira que cada operador prepare uma única
formulação por lote. Assim, para cada lote, as cinco formulações serão preparadas pelos cinco
operadores, cada um deles preparando uma determinada formulação. O delineamento resultante,
mostrado na tabela 9.16, é denominado Quadrado Latino. Observemos que o delineamento é um
arranjo quadrado e que as cinco formulações (tratamentos) são identificadas pelas letras latinas
A, B, C, D e E, daí o nome Quadrado latino.
i = 1, 2, ... , p
j = 1, 2, ... , p
k = 1, 2, ... , p
xijk = observação na i-ésima linha e k-ésima coluna para o j-ésimo tratamento,
= média global,
i = é o efeito da i-ésima linha,
k = é o efeito da k-ésima coluna,
ijk = erro aleatório.
206
A análise de variância consiste em partir a soma dos quadrados total das p2 observações
em componentes para as linhas, colunas, tratamentos e erros, como se segue.
( x ) 2
SQT = x 2
−
n
( x ) 2
1
(
SQlinhas = L12 + L22 + ... + L2p −
p n
)
( x ) 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
)
( x ) 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
)
Os termos L1, L2, ... , Lp correspondem aos totais das linhas e C1, C2, ... , Cp aos totais das
colunas.
Os termos T1, T2, ... , Tp correspondem, no exemplo dado, às diversas formulações sob
teste, isto é, às formulações A, B, C, D e E.
Dividindo-se cada soma de quadrados acima pelo seu número de graus de liberdade
obtém-se os quadrados médios. A estatística de teste é, novamente, o quociente de QMG por
QME, ou seja:
F = QMG/QME
Podemos observar que a análise é uma simples extensão do delineamento para blocos
aleatorizados. O exemplo anterior das formulações de dinamite será usado para mostrar como os
cálculos podem ser facilitados mediante uma simples codificação.
207
Tabela 9.17 – ANOVA para o delineamento por Quadrado latino.
Fonte GL SQ QM F
Solução
Os passos a serem seguidos são exatamente os mesmos mostrados nos procedimentos 9.1
e 9.2. Entretanto, para facilitar os cálculos vamos subtrair 25 de cada valor da tabela obtendo a
tabela abaixo. Podemos mostrar que as somas dos quadrados não se alteram quando subtraímos
um mesmo valor de cada uma das observações.
Lotes de Operadores Li
matéria prima 1 2 3 4 5
1 A = -1 B = -5 C = -6 D = -1 E = -1 -14
2 B = -8 C = -1 D=5 E=2 A = 11 9
3 C = -7 D = 13 E=1 A=2 B = -4 5
4 D=1 E=6 A=1 B = -2 C = -3 3
5 E = -3 A=5 B = -5 C=4 D=6 7
Cj -18 18 -4 5 9 x = 10
Passo 1 – Hipóteses
Ho: 1 = 2 = 3 = 4 = 5
Ha: pelo menos uma diferença existe
208
Passo 4 – Soma dos quadrados
( x ) 2
10 2
SQT = x 2
− = 680 − = 676,00
n 25
( x ) 1 2
1 2
p
(
SQlinhas = L1 + L2 + ... + L p −
2 2
n 5
)
= (−14) + 9 + 5 + 3 + 7 −
2 2 2 2 2
(
10 2
25
= 68,00 )
( x ) 1 2
1
(
SQcolunas = C12 + C 22 + ... + C p2 −
p n
) (
= (−18) 2 + 18 2 + (−4) 2 + 5 2 + 9 2 − 4 = 150,00
5
)
( x) 1 2 2
SQtratamentos
1
(
= T12 + T22 + ... + T p2 −
p n
) (
= 18 + (−24) 2 + (−13) 2 + 24 2 + 5 2 − 4 = 330,00
5
)
Fonte GL SQ QM F
Total 25 676,00
209
Passo 6 – Como O valor crítico é de 5,41, verificamos que o valor calculado da estatística cai na
região de rejeição, portanto devemos rejeitar a hipótese nula Ho.
Passo 7 – Os dados obtidos mostram evidências suficientes para concluirmos que existem
diferenças entre as diversas formulações.
Ordem de Operador
montagem 1 2 3 4
1 C = 10 D = 14 A=7 B=8
2 B=7 C = 18 D = 11 A=8
3 A=5 B = 10 C = 11 D=9
4 D = 10 A = 10 B = 12 C = 14
210