Escolar Documentos
Profissional Documentos
Cultura Documentos
Moisés Balassiano
A rejeição de Ho num estudo de Análise de Variância de efeitos fixos leva o
investigador a uma conclusão importante: a de que existe pelo menos um tratamento que na
amostra considerada mostrou um efeito diferenciado dos demais. O próximo passo consiste
na identificação do(s) tratamento(s) responsável(is) pela rejeição. O procedimento adotado
para esse tipo de investigação é o das comparações múltiplas que visa identificar tratamentos,
ou grupos deles, cujas médias difiram significativamente, ou cuja dimensão dos seus
contrastes seja elevada. Como exemplo, suponha que quatro tipos de treinamento sejam
testados: presencial diário; presencial nos finais de semana; programado à distância; e pela
Internet. Suponha, ainda, que os resultados tenham levado à rejeição de Ho. Podemos testar,
a partir desse experimento, uma infinidade de possíveis contrastes para tentar identificar o
possível motivo dessa rejeição, tais como a diferença simples entre as médias dos métodos 1 e
4, presencial diário e pela Internet, ou, ainda, grupos de tratamentos, de modo a se avaliar se
os métodos de treinamento presencias, 1 e 2, diferem dos métodos de ensino à distância, 3 e 4.
Note que para os dois casos acima podemos definir combinações lineares entre as
médias dos tratamentos para avaliar a significância entre as diferenças. No primeiro caso
definimos Ho: µ1 - µ4 = 0, enquanto no segundo Ho: µ1 + µ2 - µ3 - µ4 = 0. Para o primeiro
contraste do exemplo acima podemos definir um vetor, digamos c, cujos componentes seriam
(1 0 0 -1)’, enquanto para o segundo teríamos c = (1 1 –1 –1)’.
Definimos, então, contraste como uma combinação linear envolvendo as médias dos
I
tratamentos, isto é, C = ∑ c i µ i ,sujeita à restrição Σci = 0.
i =1
A Soma dos Quadrados de um contraste, na amostra, é expressa através de
2
I
K ∑ c i Yi
i =1 , que tem apenas 1 grau de liberdade. Quando o desenho experimental
SQ c = I
∑ c i2
i =1
2
I
∑ n i c i Yi
não é balanceado, a Soma dos Quadrados dos contrastes será SQ c = i =1 I .
∑ n i c i2
i =1
O teste do contraste é realizado, como sempre, através da razão entre a Média dos
Quadrados dos Contrastes e a Média dos Quadrados dos Erros. Essa razão tem distribuição
F1,n-I para os desenhos experimentais com apenas 1 Fator.
Um aspecto importante na definição do teste estatístico é o fato do estudo dos
contrastes ter sido planejado antes ou depois do experimento. Essa definição torna-se
importante para a definição do nível de significância a ser adotado para o teste.
Quando estudamos apenas um contraste, é óbvio que o teste será, como visto acima,
tão somente um teste de diferença de médias simples e toda inferência a ser feita será baseada
na estatística diferença entre médias de amostras independentes, que terá distribuição Normal
ou t de Student, dependendo do tamanho da amostra. Isso significa dizer que as hipóteses a
serem testadas serão baseadas num valor calculado para a diferença entre as médias das
amostras, que será comparada com o valor crítico para se avaliar as divergências entre a
amostra e o hipotético valor da diferença na população. Da mesma forma, construir um
intervalo de confiança para a diferença entre as médias na população consiste em se calcular
1
um intervalo de valores plausíveis para as possíveis diferenças entre as médias na população,
com base nas médias amostrais.
No entanto, quando mais do que um contraste está sendo investigado
simultaneamente, deixamos de trabalhar com um vetor dos coeficientes e passamos a
trabalhar com uma matriz C dos contrastes estudados, onde cada linha corresponde ao
respectivo vetor do contraste a ser analisado. Consequentemente, ao invés de um ponto sobre
a reta dos números reais, os contrastes múltiplos serão agora um ponto no espaço t-
dimensional dos contrastes e a distribuição de probabilidade do estimador passa a ser T2 de
Hotteling. O Intervalo de Confiança torna-se , então, a se configurar numa Região de
Confiança, cuja dimensão será igual ao número de contrastes sendo investigados, isto é, t. A
forma da região irá depender de como os contrastes são analisados.
Há vários métodos para se analisar contrastes. O presente material irá restringir-se aos
principais, ou seja, Scheffé, Tuckey e Duncan. Todos esses métodos são definidos para
análises de contrastes feitos após a realização do experimento e uma pré investigação dos seus
resultados.
2
Teste de Amplitudes Múltiplas de Duncan
Como sabemos, sob Ho todas as médias são iguais, o que vale dizer que os grupos são
homogêneos. Sendo assim, cada um dos I grupos definirá uma estatística Yi cujo valor
σ 2 MQE
esperado será µ, comum a todos os grupos, e variância σ 2Y = = , já que
n n
homogeneidade significa que os grupos provêm de uma mesma distribuição. Quando o
tamanho das células não é igual, devemos substituir n pela média harmônica dos tamanhos
das células, isto é:
I
nh =
I
1 .
∑
i =1 n i
Para aplicarmos esse método devemos dispor as médias dos grupos em ordem
crescente (decrescente) e obtermos o valor de r(α, p, f) na tabela específica, onde α é o nível
de significância para o experimento, p é a ordem do contraste (p = 2, 3, ... , I) e f o número de
graus de liberdade da Soma dos Quadrados dos Erros. Esses valores são transformados num
conjunto de (I – 1) amplitudes de significação mínima, R2, ... RI, crescentes, através de Rp = r(
α, p, f). S Y .
Todas as diferenças entre as médias são, então, testadas segundo o seguinte
procedimento:
(i) Toma-se a maior média e calculam-se todos os (I – 1) contrastes em relação a
ela, sempre do maior para o menor. Os resultados são confrontados com os
valores Rp (p = I, ...,2). Assim, o maior contraste é confrontado com RI, o
segundo maior com R(I-1), até o menor contraste envolvendo a maior média, que
será confrontado com R2.
(ii) Toma-se, então, a segunda maior média e repete-se o procedimento acima,
confrontando os valores dos contrastes com Rp, agora p = (I – 1), ... , 2, e assim
sucessivamente até o último contraste envolvendo as duas menores médias, que
será confrontado com R2.
Sempre que o contraste for maior do que as amplitudes de significância mínima, Rp,
devemos rejeitar Ho, concluindo pela sua significância.
Teste de Tukey
Tukey propôs um método de comparações múltiplas baseado na amplitude
padronizada, que independe do número de médias que serão contrastadas. O procedimento
requer a utilização de q(α, I, f), obtido em tabela própria, para poder chegar ao valor crítico
para todas as comparações dos contrastes entre as médias. Um contraste será
significativamente diferente de zero quando seu valor calculado exceder a
Tα = q(α, i, f) S Y .
Assim, utilizamos um único valor crítico para julgar a significância de todas as
comparações.
Considere, a título de exemplo, o caso citado em Montgomery (1991 p. 60) no qual um
engenheiro de desenvolvimento de produto está interessado em maximizar a resistência da
elasticidade de uma nova fibra sintética que será usada na fabricação de camisas para homens.
O engenheiro conhece, através de experiências passadas que essa resistência é afetada pela
percentagem de algodão na fibra. Ele suspeita que aumentando essa percentagem a
resistência da fibra estará aumentando. Ele sabe, também, que o conteúdo de algodão deve
variar entre 10 e 40% para se obter um produto com uma certa qualidade desejável. Ele
decide, então testar a resistência de amostras de fibras contendo cinco diferentes níveis de
3
algodão: 15; 20; 25; 30 e 35%. Cinco amostras de tecidos de cada nível de conteúdo de
algodão são testadas e as resistências, medidas em libras/polegadas2, anotadas (ver p. 50 para
detalhes do experimento).
Total 636,96 24
SCt = MQE.
∑c 2
i
= 1,7956 desvio padrão dos contrastes
n
ε = SCt . ( I − 1).F.05,4,20 = 6,0837 erro amostral
Abaixo encontram-se os resultados:
4
Contrastes Valor Lim inf Lim sup
Y4 − Y3 4,0 -2,0837 10,0837
Y4 − Y2 6,2 0,1163 12,2837 *
Y4 − Y5 10,8 4,7163 16,8837 *
Y4 − Y1 11,8 5,7163 17,8837 *
Y3 − Y2 2,2 -3,8837 8,2837
Y3 − Y5 6,8 0,7163 12,8837 *
Y3 − Y1 7,8 1,7163 13,8837 *
Y2 − Y5 4,6 -1,4837 10,6837
Y2 − Y1 5,6 -0,4837 11,6837
Y5 − Y1 1,0 -5,0837 7,0837
Conforme assinalado acima, cinco intervalos não contêm o zero. Os contrastes
relativos aos respectivos intervalos nos levam à rejeição da hipótese nula.
5
Notamos que exceto por dois contrastes todos os demais mostraram-se significativos a
5%. A razão principal para tal é que o teste de Duncan requer diferenças mais elevadas para
poder detectar contrastes significativos na medida em que o número de médias inseridas na
amplitude aumenta.
C:/Word/Apostila/Anova/Contrastes.doc