Escolar Documentos
Profissional Documentos
Cultura Documentos
Verificar se estas suposições são atendidas é de suma importância em uma ANOVA, pois
o teste foi construído levando estas em consideração a fim de verificar se as amostras (ou
tratamentos) apresentam diferença as médias. Na Figura 1 podemos visualizar a relação entre
as distribuições entre as amostras (tratamentos) e as hipóteses testadas pela análise de
variância.
Figura 1 – Relação entre as distribuições entre as amostras e as hipóteses da ANOVA
Fonte: https://www.profcremona.com/materiais/material-estatistica/metodos-estatisticos/anova-tukey
Aqui vamos estudar a análise de variância de um fator. Esta é uma técnica de teste de
hipótese usada para comparar médias de três ou mais populações em que uma única variável
independente está sendo estudada.
Em uma ANOVA utiliza-se dois processos para estimar a variância da população: a
variância das médias de cada tratamento (variação entre os tratamentos) e a variância dentro
de cada tratamento (variação devida ao erro ou residual). Se as duas estimativas são
aproximadamente iguais, então as médias populacionais são iguais; se uma das estimativas
é muito maior que a outra, então pelo menos uma das médias populacionais é diferente.
Suponha, por exemplo, que é preciso comparar a produção de três máquinas. Por razões
diversas, a produção dessas máquinas está sujeita a flutuações aleatórias. Extraímos de cada
máquina uma amostra aleatória de cinco horas diferentes de produção, os resultados estão
no Quadro 1.
Como podemos observar no Quadro 1 as médias amostrais não são iguais, mas a
diferença observada nas médias pode ser atribuída ao acaso, ou algum fator esta interferindo
na produção de uma ou mais máquinas? Neste caso, a análise de variância pode ser utilizada
para determinar se as médias amostrais sugerem diferenças efetivas na produção
populacional, ou se tais diferenças decorrem apenas da variabilidade residual amostral.
A variabilidade residual amostral é devida ao acaso, ou seja, por mais bem calibrada
que esteja uma máquina ela pode apresentar variação aleatória, que aqui denominamos de
residual. Por outro lado, caso exista uma diferença entre as máquinas esta será evidenciada
pela variabilidade entre os tratamentos, ou seja, entre as máquinas. Por este motivo, na
estatística de teste de uma ANOVA, compara-se a variância entre os tratamentos com a
variância dentro dos tratamentos.
A estatística de teste em uma ANOVA é calculada com base na Distribuição F de
Fisher-Snedecor:
QMTr
Fteste =
QMR
onde:
QMTr = Quadrado médio de tratamento (variância entre as médias amostrais)
QMR = Quadrado médio do resíduo (variância residual amostral)
No Quadro 3 estão os valores para calcular o teste F no caso de exemplo das três
máquinas.
Quadro 3 – Análise de variância de um fator
Causas da Graus de liberdade Soma dos quadrados Quadrado médio F
variação (g.l.)
Tratamento 2 130 65 8,3
Resíduo 12 94 7,83
Total 14 224
Para verificar se o valor de Fteste caiu na área de rejeição ou não rejeição precisamos
obter o valor crítico na tabela da Distribuição F de Fisher. Para cada valor de nível de
significância temos uma tabela diferente. Nesta disciplina iremos adotar apenas a tabela de α
= 5%.
3,89 8,3
Fα; k-1; n-k
F0,05; 2; 12 = 19,41
OBS: Existe mais de uma tabela para a distribuição F de Fisher, uma para cada nível de
significância. Assim, cuidado ao consultar uma tabela, verifique se o nível de significância é o
considerado. Outro detalhe importante diz respeito a forma como os graus de liberdade do
numerador e denominador estão organizados na tabela (linha ou coluna). Leia com atenção
as orientações na tabela.
Como obter os valores para a realização do teste F? No Quadro 4 apresenta-se
detalhadamente um experimento de k tratamentos, na sequência a forma de obter cada um
dos valores do Quadro 2.
Tratamento Total
1 2 3 ... K
y11 y21 y31 ... yk1
y12 y22 y32 ... yk2
. . . .
. . . .
y1r y2r y3r ... ykr
Total T1 T2 T3 Tk T = y
Número de repetições em r r r ... R n = k.r
cada tratamento
Média y1 y2 y3 ... yk
Onde
r é o número de repetições (ou elementos) em cada tratamento (ou em cada amostra);
n= k.r o número total de pontos experimentais apenas no caso em que o número de repetições
em cada tratamento é o mesmo.
Caso ao final de um teste ANOVA a conclusão final for rejeitar a hipótese nula, ou seja,
pelo menos uma das médias populacionais é diferente, fica a pergunta: Qual ou quais médias
são estatisticamente diferentes? Para tal, existem alguns testes que podem ser realizados,
aqui apresentamos um deles.
1 1
DMS = t ; GLR . + .QMR
2 ri rj
onde GLR é o grau de liberdade do resíduo (g.l = n – k); QMR é o quadrado médio dos
resíduos; e t ; GLR é o valor de t crítico.
2
Qualquer diferença entre duas médias maior que o DMS calculado é considerada
estatisticamente significativa ao nível especificado. O valor de tc é dado na tabela da
distribuição t de Student, para os graus de liberdade do resíduo; r é o número de repetições
dos tratamentos; ri e rj são o número de repetições de cada tratamento, em tratamentos com
número diferente de repetições; e QMR é o quadrado médio do resíduo.
O valor da DMS é comparado ao módulo da diferença entre as médias de cada
tratamento, como por exemplo:
|média do tratamento 1 – média do tratamento 2|
Caso esta diferença seja menor que o valor da DMS concluímos que os dois
tratamentos não apresentam diferença significativa entre as médias. Caso contrário
concluímos que as médias apresentam diferença significativa.
|média do tratamento 1– média do tratamento 2 | < DMS => as médias não
apresentam diferença significativa
|média do tratamento 1– média do tratamento 2 | > DMS => as médias apresentam
diferença significativa
Tipo de Carga
D A E O
24,9 27,9 38,4 23,8
20,4 28,1 38,6 25,3
24,2 28,4 41,2 23,5
22,3 25,3 43,9 27,6
20,3 29,3 40,2 25,5
24,0 28,5 40,2 23,9
23,5 27,9 37,3 22,6
̅ = 22,8
𝒙 ̅ =27,9
𝒙 ̅ = 40,1
𝒙 ̅ = 24,6
𝒙
Ho: µ1 = µ2 = µ3
Ha: Pelo menos uma média populacional é diferente
1
Magalhães e Lima (2010, p. 337)
O valor crítico obtemos na tabela F de Fisher, conforme apresentado a seguir:
F0,05; 3; 24 = 3,01
3,01 134,54
Conclusão: Rejeita a Ho ao α = 5%, ou seja, o peso médio das cargas apresenta diferença
significativa.
A partir desta conclusão fica o seguinte questionamento: Qual tipo de carga apresenta
média diferente das demais, ou quais tipos de cargas apresentam diferença estatisticamente
significativa?
2QMR
DMS = t ; GLR .
2 r
Com base no resultado da DMS podemos concluir que apenas o peso médio das
cargas do tipo doméstico (D) e outros tipos (O) não apresentam diferença estatisticamente
significativa.
As demais médias das cargas apresentam peso médio estatisticamente significativo.