Você está na página 1de 135

Universidade Estadual de Londrina

Centro de Cincias Exatas


Departamento de Estatstica

Estatstica Experimental
com o uso do software R

Prof. Silvano Cesar da Costa

LONDRINA
Estado do Paran - Brasil

Sumrio
1 Testes de Hipteses

1.1 Tipos de Deciso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1.1 Teste para a mdia de uma populao com varincia desconhecida . . . .

1.2 Teste para a Diferena entre duas Mdias . . . . . . . . . . . . . . . . . . . . . . .

1.2.1 Teste Para Duas Amostras Independentes . . . . . . . . . . . . . . . . . . .

1.2.2 Teste para duas amostras dependentes (pareados) . . . . . . . . . . . . . .

10

1.3 Teste de Shapiro-Wilk

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Anlise de Varincia

13
22

2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.2 Princpios bsicos da experimentao . . . . . . . . . . . . . . . . . . . . . . . . . .

23

2.3 Conduo do experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

2.4 Planejamento do experimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

2.5 Classificao dos experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

3 Delineamento Inteiramente Casualizado

30

3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

3.1.1 Modelos de efeitos fixos e aleatrios . . . . . . . . . . . . . . . . . . . . . . .

34

3.2 Anlise do modelo de efeitos fixos . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

3.2.1 Decomposio das Somas de Quadrados . . . . . . . . . . . . . . . . . . . .

36

3.3 Testes de Comparaes Mltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

3.3.1 Contrastes

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

39

3.3.2 Contrastes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40

3.3.3 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

3.3.4 Teste F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

44

3.3.5 Teste de Student-Newman-Keuls

. . . . . . . . . . . . . . . . . . . . . . . .

46

3.3.6 Teste de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

3.3.7 Teste de Scheff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

Sumrio

ii

3.3.8 Teste de Duncan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

3.3.9 Teste de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

3.3.10Teste de Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

4 Delineamento em Blocos Casualizados

60

4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

4.2 Modelo estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

5 Delineamento em Quadrado Latino

71

5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

5.1.1 Repetindo o Quadrado Latino . . . . . . . . . . . . . . . . . . . . . . . . . .

78

6 Experimentos Fatoriais

85

6.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

6.2 Anlise e interpretao de um experimento fatorial, com 2 fatores . . . . . . . . .

87

6.2.1 Desdobramento da interao R E para estudar o comportamento das


espcies dentro de cada recipiente . . . . . . . . . . . . . . . . . . . . . . . .

94

6.2.2 Desdobramento da interao R E para estudar o comportamento dos


recipientes dentro de cada espcie . . . . . . . . . . . . . . . . . . . . . . . .

95

6.2.2.1 Recipientes dentro de E1 . . . . . . . . . . . . . . . . . . . . . . . .

96

6.2.2.2 Recipientes dentro de E2 . . . . . . . . . . . . . . . . . . . . . . . .

97

7 Experimentos em parcelas subdivididas


7.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

99
99

7.1.1 Experimentos em parcelas subdivididas no tempo . . . . . . . . . . . . . . 107


8 Transformao de dados

112

8.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112


8.1.1 Seleo emprica de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
8.1.2 Mtodo analtico para selecionar uma transformao em Y . . . . . . . . . 113
9 Polinmios Ortogonais

117

9.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117


9.2 Teste de aditividade de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
9.2.1 Desenvolvimento do teste estatstico . . . . . . . . . . . . . . . . . . . . . . 123
9.3 Tabela de Hartley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

Lista de Tabelas
1.1 Nveis de hemoglobina no sangue antes e aps a aplicao de niacina em sunos. 11
1.2 Valores dos coeficientes ani+1 das estatsticas de ordem de uma amostra de
tamanho n de uma distribuio Normal.

. . . . . . . . . . . . . . . . . . . . . . .

1.4 Valores crticos da estatstica W de Shapiro-Wilk.

16

. . . . . . . . . . . . . . . . . .

18

2.1 Valores de produo de leite (kg), obtidos no experimento. . . . . . . . . . . . . .

26

2.2 Estatsticas calculadas para cada tratamento.

. . . . . . . . . . . . . . . . . . . .

27

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

3.2 Anlise de varincia para os dados do Exemplo 2. . . . . . . . . . . . . . . . . . .

38

3.3 Anlise de varincia para os dados do Exemplo 2. . . . . . . . . . . . . . . . . . .

45

3.4 Peso (kg) das parcelas (10 aves) ao final do experimento. . . . . . . . . . . . . . .

57

4.1 Quadro da anlise de varincia para delineamento em blocos casualizados. . . .

64

4.2 Valores de produo de leite (kg). . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

4.3 Anlise de varincia no delineamento em blocos casualizados.

67

3.1 Quadro da Anlise de Varincia.

. . . . . . . . . .

4.4 Nmero mdio de ovos por ave nos respectivos tratamentos e blocos.

. . . . . .

70

5.1 Ganhos de pesos, em quilos, ao final do experimento (252 dias), nos respectivos
tratamentos

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.2 Quadro da Anlise de Varincia.

72

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

74

5.3 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 1. . .

78

5.4 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 2. . .

79

5.5 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 3. . .

79

5.6 Ganhos de pesos, em quilos, ao final do 2 experimento (252 dias), nos respectivos tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7 Anlise de varincia do segundo experimento.

80

. . . . . . . . . . . . . . . . . . . .

80

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

5.9 Respostas observadas no experimento com gatos. . . . . . . . . . . . . . . . . . .

84

5.8 Anlise de varincia conjunta.

iii

Lista de Tabelas

iv

6.1 Experimento fatorial 2 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

6.2 Alturas mdias das mudas, em centmetros, aos 80 dias de idade.

. . . . . . . .

87

. . . . . . . . . . . . . . . . . . . . .

88

6.4 Anlise de varincia para um experimento fatorial com 2 fatores. . . . . . . . . .

91

6.5 Alturas mdias das mudas, em centmetros, aos 80 dias de idade.

92

6.3 Arranjo geral para um experimento fatorial.

. . . . . . . .

6.6 Anlise de varincia de acordo com o esquema fatorial 3 2. Quero ver como ele
fazx com linhas compridas.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

6.7 Estudo das Espcies dentro de cada Recipiente. . . . . . . . . . . . . . . . . . . .

95

6.8 Estudo dos Recipientes dentro de cada Espcie. . . . . . . . . . . . . . . . . . . .

96

6.9 ndices de converso alimentar (kg de rao / kg de ganho de peso).

98

. . . . . . .

7.1 Quadro da anlise de varincia de um experimento em parcela subdividida com


a tratamentos primrios, b tratamentos secundrios e c repeties, nos delineamentos inteiramente casualizado, blocos casualizados e quadrado latino. . . . . 100
7.2 Ganhos de pesos, em quilos, ao final do experimento. . . . . . . . . . . . . . . . . 101
7.3 Quadro da Anlise de Varincia.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

7.4 Tabela auxiliar para clculo das somas de quadrados das parcelas.

. . . . . . . 104

7.5 Tabela auxiliar para clculo das somas de quadrados das Subparcelas. . . . . . 105
7.6 Quadro da anlise de varincia do experimento em parcelas subdivididas no
delineamento em blocos ao acaso.

. . . . . . . . . . . . . . . . . . . . . . . . . . . 106

7.7 Produo de adubos verdes e milho (kg de matria seca verde por parcela).

. . . 107

7.8 Quadro da anlise de varincia do experimento em parcelas subdivididas no


delineamento em blocos ao acaso.

. . . . . . . . . . . . . . . . . . . . . . . . . . . 107

7.9 Tabela auxiliar para clculo das somas de quadrados das parcelas.

. . . . . . . 108

7.10 Tabela auxiliar para clculo das somas de quadrados das Subparcelas. . . . . . 108
7.11 Efeito dos anos em cada tratamento separadamente.

. . . . . . . . . . . . . . . . 109

7.12 Efeito dos tratamentos em cada ano separadamente.

. . . . . . . . . . . . . . . . 109

8.1 Transformaes estabilizadoras da varincia.

. . . . . . . . . . . . . . . . . . . . 113

8.2 Contagem do nmero de pulges encontrados. . . . . . . . . . . . . . . . . . . . . 114


8.3 Logaritmos das mdias e varincias dos tratamentos. . . . . . . . . . . . . . . . . 115
9.1 ndices de converso (kg de rao / kg de ganho de peso
9.2 Anlise de varincia para ndices de converso.

. . . . . . . . . . . . . . 118

. . . . . . . . . . . . . . . . . . . 118

9.3 Decomposio dos graus de liberdade de tratamentos.

. . . . . . . . . . . . . . . 120

9.4 Tabela para o Fmax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

Lista de Figuras
2.1 Produo de leite (kg) levando-se em conta o complemento alimentar.

. . . . . .

27

3.1 Diferenas nas mdias dos tratamentos . . . . . . . . . . . . . . . . . . . . . . . .

49

4.1 Produo de leite (kg) levando-se em conta o complemento alimentar.

. . . . . .

65

. . . . . . .

68

5.1 Tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

5.2 Linhas

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

5.3 Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

5.4 Mdias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

5.5 QQPlot para verificar se os dados tm distribuio normal.

. . . . . . . . . . . .

76

5.6 Mdias dos tratamentos considerando o experimento conjunto. . . . . . . . . . .

81

5.7 Comparao das mdias dos tratamentos considerando o experimento conjunto.

83

6.1 Experimento fatorial sem interao.

. . . . . . . . . . . . . . . . . . . . . . . . . .

86

6.2 Experimento fatorial com interao.

. . . . . . . . . . . . . . . . . . . . . . . . . .

86

6.3 Interao Rec Esp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

6.4 Interao Esp Rec.

93

4.2 Comparao das diferenas entre tratamentos pelo Teste de Tukey.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7.1 Tipos de Raes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101


7.2 Tipos de Suplementos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
8.1 Nmero de pulges encontrados considerando-se os tratamentos.

. . . . . . . . 115

8.2 Relao linear dos dados da Tabela 8.3. . . . . . . . . . . . . . . . . . . . . . . . . 116


9.1 Modelo de regresso linear ajustado aos dados.

. . . . . . . . . . . . . . . . . . . 121

Prefcio
Este material foi preparado com a inteno de cobrir o programa do curso de
mestrado em Cincia Animal, da Universidade Estadual de Londrina. Parte dele tambm
adotado no curso de graduao em Medicina Veterinria da Universidade Estadual de Londrina, especificamente no segundo semestre quando ministrado o contedo de estatstica
experimental.
Muito embora o emprego de softwares para a realizao de anlises estatsticas
seja bastante comum, por questes didticas e em sala de aula, se o conjunto de dados
for relativamente pequeno os clculos podero ser feitos manualmente, com o uso de uma
calculadora cientfica, tornando-se impraticvel se o volume de dados for muito grande. Neste
caso, faz-se necessrio o uso de um computador e um software para anlises estatsticas.
Existem muitos softwares, gratuitos ou no, no mercado. Optei pela utilizao do
software R por ser gratuito, de cdigo fonte aberto e adotado por pesquisadores do mundo
todo. Voc pode obt-lo no seguinte endereo: htpp://www.r-project.org. Vrios manuais
tambm esto disponveis.
Assim, tentei aliar o contedo terico com o uso prtico dos computadores para
um melhor entendimento das anlises. Em alguns momentos coloco apenas os comandos
para realizar determinada tarefa, deixando ao leitor a tarefa de execut-los e interpretar os
resultados. E, em outras situaes, apresento os comandos e a sada.
O material no est livre de erros e/ou imperfeies e toda e qualquer contribuio
ser bem-vinda.

vi

Captulo 1

Testes de Hipteses
Anterior a definio de um teste de hiptese necessrio o entendimento de que
uma hiptese estatstica uma suposio ou afirmao, relativa a uma ou mais populaes,
sobre um ou mais parmetros populacionais, podendo esta suposio ser verdadeira ou no.
Logo, o teste de hiptese um procedimento formal, baseado no clculo de probabilidades,
para tomada de deciso quanto a hiptese estatstica.
Claro que se poderia pensar em inspecionar todos os elementos da populao e
comparar com o valor da hiptese feita, mas na prtica, isto praticamente impossvel. Sendo
assim, examina-se uma amostra aleatria da populao. Caso os dados amostrais no sejam
consistentes com a hiptese estatstica, a mesma ser rejeitada. H dois tipos de hipteses
estatsticas:
Hiptese Nula: denotada por H0 , usualmente a hiptese que as observaes amostrais
resultam puramente do acaso;
Hiptese Alternativa: denotada por H1 ou Ha , a hiptese que as observaes amostrais
so influenciadas por causas no-aleatrias.
Sendo assim, a ideia bsica que a partir de uma amostra da populao seja
estabelecida uma regra de deciso, segundo a qual a hiptese proposta ser rejeitada ou
no-rejeitada. Esta regra de deciso chamada de teste estatstico.
Exemplo: Suponha que um pesquisador esteja desconfiado que o peso mdio (kg) aos 21 dias
de idade, de leites da raa Large White, seja diferente dos 5 kg esperados para a raa. As
hipteses estatsticas para estudar o problema podero ser expressas por:
H0 : = 5, 0 kg

H1 : = 5, 0 kg

vs

(1.1)

Observe que a hiptese nula define o peso histrico de animais aos 21 dias de
idade para a raa. J a hiptese alternativa o que o pesquisador efetivamente quer verificar.
1

Captulo 1. Testes de Hipteses

Entenda que dependendo do que o pesquisador estiver observando, sua hiptese


de pesquisa poder ser outra. Se ele percebe que os animais esto muito magros ou muito
gordos, as hipteses poderiam ser:

H : = 5, 0 kg
0
Animais magros
H : < 5, 0 kg
1

H : = 5, 0 kg
0
Animais gordos
H : > 5, 0 kg
1

Observe que, neste caso, a hiptese do pesquisador estabelecida apenas para


uma populao, raa Large White, sobre a qual ele quer estudar o peso mdio aos 21 dias de
idade.
J, se o interesse for comparar os pesos mdios de duas raas diferentes, Large
White (LW) e Duroc (D), aos 21 dias de idade, as possveis hipteses de pesquisa poderiam ser:
Diferena entre as mdias de pesos:

H0 : LW = D

Peso mdio de LW maior que D:

ou

H1 : LW = D

H0 : LW = D

Peso mdio de LW menor que D:

ou

H1 : LW > D

H0 : LW = D
H1 : LW < D

Assim, o objetivo de um teste estatstico fornecer ferramentas que permitam rejeitar ou no rejeitar uma hiptese estatstica atravs dos resultados obtidos de uma amostra.
Alguns exemplos de hipteses estatsticas so:
a) o peso mdio de aves tratadas com rao comercial e acesso a pasto composto por: grama
batatais, estrela e seda maior que aquelas sem acesso ao pasto;
b) o tempo mdio de reao de determinado reagente qumico de 60 segundos;
c) a proporo de animais com a doena A de 40%;
d) a rao A melhor que a rao B na engorda de sunos;
muito provvel que o peso mdio de aves com acesso ao pasto no seja igual ao
peso mdio de aves sem acesso ao pasto. Portanto, o que se busca, na verdade, verificar se
a diferena de peso mdio existente entre os dois grupos significativa.
Em estatstica, a palavra significncia implica a ideia de que muito provvel que
um resultado, similar ao que foi obtido na amostra, teria sido obtido se toda a populao
tivesse sido estudada.

1.1 Tipos de Deciso


Ao se tomar uma deciso, a favor ou contra uma hiptese, existem dois tipos de
erros que se pode cometer. Pode-se rejeitar uma hiptese nula quando de fato ela verdadeira
(erro Tipo I) ou pode-se no-rejeitar H0 quando, de fato, ela falsa (erro Tipo II). Frequentemente, denotam-se as probabilidades destes dois tipos de erros como e , respectivamente.

Tipos de Deciso

Existe um balano entre esses dois tipos de erros, no sentido de que ao se tentar minimizar , aumenta-se . Isto , no possvel minimizar estas duas probabilidades
simultaneamente e, na prtica, costume fixar um valor (pequeno) para .
Pode-se resumir os tipos de deciso e erros associados a testes de hipteses da
seguinte maneira:

Deciso
Situao real
Aceitar H0

Rejeitar H0

H0 verdadeira

Deciso correta (1 )

Erro tipo I (probab. )

H0 falsa

Erro tipo II (probab. )

Deciso correta (1 )

a) Os erros Tipo I e Tipo II so correlacionados: o aumento da probabilidade de ocorrncia de


um reduz a probabilidade de ocorrncia do outro;

b) A probabilidade de cometer um erro Tipo I chamado nvel de significncia e denotado


por ;

c) A probabilidade de cometer um erro Tipo II chamado erro beta e denotado por . A


probabilidade de no cometer o erro Tipo II chamado poder do teste, denotado por 1 .
O valor de no fixo, diferentemente do erro Tipo I, e depender de trs fatores: o prprio
valor de , o valor testado na hiptese alternativa (Ha ) e o tamanho da amostra (n);

d) A nica forma de causar uma reduo de e simultaneamente aumentar o tamanho


da amostra;

e) Se H0 for falsa, ser maior quanto mais prximo o valor do parmetro estiver do valor
sob a hiptese H0 .

Normalmente no se calcula o valor de . Ele , em geral, definido como sendo


5% ou 1%. Mas possvel calcular o seu valor diretamente com as informaes obtidas dos
dados. Assim, suponha que se decida no-rejeitar a hiptese nula da equao (1.1) se a mdia
amostral estiver entre 4 e 6 kg. Caso isto no ocorra, a deciso ser rejeitar H0 . Sendo 50 o

Captulo 1. Testes de Hipteses

nmero de amostras coletadas e o desvio-padro igual a = 1, o valor de ser:

P (Rejeitar H0 | H0 verdadeiro)

P (
y < 4 | = 5) + P (
y > 6 | = 5)
(
)
(
)
y 4
45
y 6
65
<
>
P
+P
1/ 50
1/ 50
1/ 50
1/ 50
P (z1 < 7, 0711) + P (z2 > 7, 0711)

=
=

= 1, 5375 1012
Portanto, dadas as condies apresentadas, a probabilidade de se rejeitar H0
praticamente nula. O clculo pode ser feito diretamente no R, com os seguintes comandos:
mu=5 ; sigma=1 ; n=50 ;
z1=(4-mu)/(sigma/sqrt(n)) ; z2=(6-mu)/(sigma/sqrt(n))
(alpha = pnorm(z1) + pnorm(z2, lower.tail=F))

Existem discusses entre a interpretao do resultado do teste de hipteses. A


distino entre aceitar e no-rejeitar a hiptese nula. Aceitar implica que a hiptese
nula verdadeira; No rejeitar implica que os dados no so suficientemente persuasivos
para se preferir a hiptese alternativa ao invs da hiptese nula.
Neste livro adotaremos as expresses rejeitar ou no-rejeitar a hiptese nula.

1.1.1 Teste para a mdia de uma populao com varincia desconhecida


Este tipo de teste para a mdia muito comum, uma vez que, na prtica, dificilmente se conhece a varincia populacional. Todas as etapas realizadas anteriormente so
empregadas nesta situao, sendo que a mudana ocorre na varivel teste utilizada. Como a
varincia populacional desconhecida, aplica-se a equao:
T =

y 0
s ,

em que T segue uma distribui o t de Student 1 , ou seja, T tn1;/2 .


Ainda,

s2

1 pseudnimo

n
n

1
1

2
(yi y) =
y2

n 1 i=1
n 1 i=1 i

de William Sealy Gosset, qumico e matemtico ingls.

)2
yi

i=1

Tipos de Deciso

Exemplo: Foi retirada uma amostra de 10 bezerros da raa Nelore, aos 210 dias de idade, com
o objetivo de verificar se o peso mdio desses animais atinge 186 kg nesta idade. Os valores
obtidos, em kg, foram os seguintes:
178

199

182

186

188

191

189

185

174

158

Calcule:
a) a mdia;
b) a varincia;
c) o desvio padro;
d) o erro padro da mdia;
e) o coeficiente de variao;
f) teste as hipteses:
H0 : = 186

vs

H1 : = 186

ao nvel de 5% de significncia.
Soluo:

Antes de realizar o teste, sempre interessante explorar o conjunto de dados com medidas
descritivas e grficas. Usando o R, bastam os seguintes comandos:

Captulo 1. Testes de Hipteses

pesos = c(178, 199, 182, 186, 188, 191, 189, 185, 174, 158)
(media = mean(pesos))
(variancia = var(pesos))
(desvio = sd(pesos) )
(erro.padro = desvio / sqrt(length(pesos)))
(cv = desvio/media*100)

par(mai=c(1,1,.3,.2))
boxplot(pesos, ylab=Pesos (kg), las=1, col=LightYellow)
points(media, pch=+, cex=2, col=red)

hist(pesos)
plot(pesos)
plot(density(pesos))
qqnorm(pesos,las=1); qqline(pesos)
qqnorm(scale(pesos)); qqline(scale(pesos))

hist(scale(pesos), las=1, ylim=c(0,.6), freq=FALSE)


curve(dnorm(x), add=TRUE, col=blue, lwd=2);
lines(density(scale(pesos)), col=red)

hist(scale(pesos), las=1, ylim=c(0,.6), freq=FALSE, xaxt=n)


axis(1, -3:3, pos=0) ; abline(h=0)
curve(dnorm(x), add=TRUE, col=blue, lwd=2);
lines(density(scale(pesos)), col=red)

shapiro.test(pesos)
t.test(pesos, mu=186)

Observe que antes da aplicao do teste de hiptese, foi realizada uma anlise
exploratria dos dados e verificado a suposio de normalidade, usando-se o teste de ShapiroWilk, (Shapiro and Wilk, 1965). Os procedimentos para realizao do teste de Shapiro-Wilk
so apresentados no final deste captulo, pg. 13.

Teste para a Diferena entre duas Mdias

1.2 Teste para a Diferena entre duas Mdias


1.2.1

Teste Para Duas Amostras Independentes


Um dos testes mais frequentes em estatstica consiste na avaliao da diferena

entre duas amostras independentes, ou seja, naqueles casos em que os dados de uma das
amostras no esto relacionados com os valores da outra. Na conduo de experimentos dessa
ordem, procura-se verificar se a diferena observada de tal magnitude que permita concluir
que as amostras foram retiradas de populaes distintas. As seguintes pressuposies devem
ser observadas para a realizao deste teste:
a) as amostras de cada populao investigada devem ser aleatrias e independentes;
b) admitir que as varincias das duas populaes (12 e 22 ), embora desconhecidas, sejam
iguais. Sendo assim, estima-se a varincia conjunta, Sp2 , dada por
Sp2 =

(n1 1) S12 + (n2 1) S22


.
n1 + n2 2

c) as variveis das populaes de onde as amostras foram selecionadas devem apresentar


distribuio aproximadamente normal.
A hiptese nula e as possveis hipteses alternativas so:

< 2

1
H0 : 1 = 2
vs
H1 :
1 = 2

>
1
2
Como so utilizadas estimativas das varincias populacionais, a padronizao da diferena
das mdias dada por:
T =

(Y1 Y2 ) (10 20 )

.
1
1
Sp
+
n1
n2

Assume-se que T tn1 +n2 2; .


A forma geral para clculo de varincia conjunta dada por:
n

(ni 1) Si2

Si2 =

i=1
n

(ni 1)

i=1

Para aplicao deste teste necessrio que as varincias populacionais, embora


desconhecidas, possam ser consideradas homogneas. Portanto, antes da realizao do teste

Captulo 1. Testes de Hipteses

necessrio verificar se as varincias so homogneas. Nesta situao as hipteses testadas

2 < 22

so:
H0 : 12 = 22

H1 :

12 = 22

2 > 2
1
2

vs

H1 : 12 > 22 . A varivel teste para a

vs

sendo que mais comum testar H0 : 12 = 22

homogeneidade de varincias de duas populaes independentes dada por:

F =

s2
maior valor de (s21 , s22 )
= 21
2
2
menor valor de (s1 , s2 )
s2

Exemplo: Um pesquisador quer verificar se os pesos ao nascer de animais machos das raas
Gir e Guzer diferem. Foram pesados 10 animais de cada raa. Testar, ao nvel de 5% de
significncia, se os pesos diferem. Os pesos (kg) observados so:

Guzer

30

26

25

23

25

29

34

30

30

31

Gir

23

21

20

20

23

26

22

27

26

27

Soluo:
Guzer:
n = 10
y1 = 28, 3 kg
s = 3, 40098 kg

Gir:
n = 10
y2 = 23, 5 kg
s = 2, 798809 kg

Teste para a Diferena entre duas Mdias

Para resolver o exemplo dado no R, bastam os seguintes comandos:

Guzer = c(30, 26, 25, 23, 25, 29, 34, 30, 30, 31)
Gir

= c(23, 21, 20, 20, 23, 26, 22, 27, 26, 27)

mean(Guzer) ; mean(Gir)
var(Guzer) ; var(Gir)
sd(Guzer) ; sd(Gir)
sd(Guzer)/mean(Guzer) * 100

sd(Gir)/mean(Gir) * 100

boxplot(Guzer, Gir, names=c(Guzer, Gir), las=1, xlab=Raas,


ylab=Pesos ao Nascer (kg))
points(c(mean(Guzer),mean(Gir)), pch=+, col=red, cex=2)

par(mfrow=c(1,2))
qqnorm(Guzer); qqline(Guzer)
qqnorm(Gir); qqline(Gir)

qqnorm(scale(Guzer), asp=1); qqline(scale(Guzer))


qqnorm(scale(Gir), asp=1); qqline(scale(Gir))

hist(scale(Guzer), freq=FALSE)
curve(dnorm(x), add=TRUE, col=2); lines(density(scale(Guzer)), col=3)

hist(scale(Gir), freq=FALSE)
curve(dnorm(x), add=TRUE, col=2); lines(density(scale(Gir)), col=3)
layout(1)

shapiro.test(Guzer) ; shapiro.test(Gir)
var.test(Guzer, Gir)

# ou var.test(Guzer, Gir, alt=greater)

t.test(Guzer, Gir, var.equal=T)

Caso as varincias no sejam homogneas aplicada a aproximao de Satterthwaite (ou Welch) para os graus de liberdade usados e a estatstica de teste fica:

T =

(y1 y2 ) (1 2 )

s21
s2
+ 2
n1
n2

Captulo 1. Testes de Hipteses

10
em que os graus de liberdade so calculados por:
(

)2
s2
s21
+ 2
n1
n2
= ( )2
( 2 )2 .
2
s2
s1
n1
n2
+
n1 1
n2 1
Assume-se que T t;

No R, basta alterar a opo de varincias iguais para var.equal=F ou simplesmente no colocar nada a respeito das varincias, uma vez que o default para varincias
no homogneas.
t.test(Guzer, Gir)

1.2.2 Teste para duas amostras dependentes (pareados)


utilizado quando o mesmo grupo de elementos submetido a algum tipo de
tratamento em duas situaes distintas (ou dois tempos distintos). O objetivo seria saber se
um determinado tratamento realizado faz com que o resultado final se altere. As hipteses
testadas so:
H0 : 1 2 = 0

vs

2 < 0

1
H1 :
1 2 = 0

>0
1
2

A estatstica de teste dada por:

T =

d 0
,
s
d
n

em que:
# d a mdia das diferenas entre os dois grupos, dada por:
1
di
n i=1
n

d =

1
(yi1 yi2 ),
n i=1
n

d = y1 y2 .

i = 1, 2, . . . , n

Teste para a Diferena entre duas Mdias

11

# sd o desvio padro das diferenas entre os dois grupos, dado por:

( n )2

n
di

1
2

i=1
2
sd =
di

n 1 i=1
n

Portanto, observa-se que a diferena para o teste para igualdade de duas mdias independentes est no clculo da varincia, que feito considerando-se todas as diferenas entre as
observaes dependentes.
Exemplo: Andrade and Ogliari (2007) apresentam um experimento conduzido para estudar
o contedo de hemoglobina no sangue de sunos com deficincia de niacina2 . Aplicaram-se
20 mg de niacina em oito sunos. Os nveis de hemoglobina no sangue foram mensurados
antes e depois da aplicao da niacina. Os resultados obtidos no experimento foram:
Tabela 1.1: Nveis de hemoglobina no sangue antes e aps a aplicao de niacina em sunos.
Animal

Antes

12,4

13,6

13,6

14,7

12,3

12,2

13,0

11,4

Depois

10,4

11,4

12,5

14,6

13,0

11,7

10,3

9,8

Diferenas
Pode-se afirmar que a aplicao de niacina alterou a hemoglobina no sangue dos sunos?
Soluo:

2 Tambm

conhecida como vitamina B3 , vitamina PP ou cido nicotnico, uma vitamina hidrossolvel cujos

derivados (N AD + , NADH, N ADP + e NADPH) desempenham importante papel no metabolismo energtico celular e
na reparao do DNA.

Captulo 1. Testes de Hipteses

12

Para resolver o exemplo dado no R, bastam os seguintes comandos:

rm(list=ls())

Fases = factor(rep(LETTERS[c(1,4)], each=8))


Resp = c(12.4, 13.6, 13.6, 14.7, 12.3, 12.2, 13.0, 11.4,
10.4, 11.4, 12.5, 14.6, 13.0, 11.7, 10.3,

9.8)

(niacina = data.frame(Fases, Resp))


attach(niacina)

(medias = tapply(Resp, Fases, mean))


(varincias = tapply(Resp, Fases, var))

par(mai=c(1,1,.2,.2))
plot(Resp ~ Fases, xlab=Situao, ylab=Hemoglobina no Sangue,
names=c(Antes, Depois), col=LightYellow, las=1)
points(medias, pch=+, col=red, cex=2)

shapiro.test(Resp[Fases==A])
shapiro.test(Resp[Fases==D])

t.test(Resp[Fases==A], Resp[Fases==D], paired=T)

Teste de Shapiro-Wilk

13

1.3 Teste de Shapiro-Wilk


O teste de Shapiro-Wilk testa a hiptese nula que uma amostra y1 , y2 , , yn , retirada de uma populao, tem distribuio normal. Para calcular o valor da estatstica W , dada
a amostra aleatria, de tamanho n, deve-se proceder da seguinte maneira:
1) Obter uma amostra ordenada: y1 y2 yn ;
2) Calcular

(
n
n

S =
(yi y)2 =
yi2
2

i=1

i=1

)2
yi

i=1

3) Uma vez que se tem o nmero de amostras (n) coletadas, tem-se que:
a) se n par, n = 2k, calcule:
b=

ani+1 (yni+1 yi )

i=1

em que os valores de ai so obtidos da Tabela 1.2;


b) se n mpar, n = 2k + 1, o clculo exatamente como no item 3a, uma vez que ak+1 = 0
quando n = 2k + 1. Assim, determina-se:
b = an (yn y1 ) + + ak+2 (yk+2 yk )
em que o valor de yk+1 , que a mediana, no entra no clculo de b.
4) Calcule
W =

b2
.
S2

5) Para tomada de deciso a respeito da normalidade dos dados, compara-se o valor calculado
de W com o valor tabelado Wn; , obtido da Tabela 1.4. Se o valor calculado W for menor
que o tabelado, rejeita-se a hiptese de normalidade ao nvel de significncia.

Exemplo: Considere os pesos (kg), j ordenados, de 11 homens adultos:

y(1)

y(2)

y(3)

y(4)

y(5)

y(6)

y(7)

y(8)

y(9)

y(10)

y(11)

67,1

69,9

71,7

72,6

73,0

73,5

75,3

77,1

82,6

88,5

107,0

Verifique se estes dados provm de uma populao com distribuio normal.

Captulo 1. Testes de Hipteses

14
Soluo:
1) As hipteses testadas so:
H0 : Os dados so normalmente distribudos, e
H1 : Os dados no so normalmente distribudos
2) Como a amostra j est ordenada, basta calcular S 2 :
(
S

yi2

yi

i=1

i=1

= 68.235, 67
S2

)2

(858, 1968)2
11

= 1.278, 569.

3) Como n mpar, os valores de ani+1 , obtidos da Tabela 1.2, so:


a11

a10

a9

a8

a7

a6

0,5601

0,3315

0,2260

0,1429

0,0695

0,0000

Assim,
b

= an (yn y1 ) + + ak+2 (yk+2 yk )

= 0, 5601 (107 67, 1) + 0, 3315 (88, 5 69, 9) + 0, 2260 (82, 6 71, 7) +


0, 1429 (77, 1 72, 6) + 0, 0695 (75, 3 73, 0)

= 31, 78019.

4) O valor de W dado por:


W

b2
S2

(31, 78019)2
1.280, 975

0, 7899.

5) Observa-se na tabela 1.4, que o valor calculado W = 0, 7899 menor que o valor tabelado
Wtab11;0,01 = 0, 792. Neste caso, rejeita-se H0 , os dados no so normalmente distribudos.
Para obter esses resultados utilizando-se do R, basta digitar o comando:
dados = c(67.1, 69.8, 71.7, 72.6, 73.0, 73.5, 75.3, 77.1, 82.6, 88.4, 107)
shapiro.test(dados)

Teste de Shapiro-Wilk

15

Alm do teste de Shapiro-Wilk para verificao da normalidade, podem ser citados


ainda os seguintes testes:
a) Anderson-Darling;
b) Cramer-von-Mises;
c) Lilliefors (Kolmogorov-Smirnov);
d) Shapiro-Francia;
Todos estes testes esto implementados no pacote nortest.

Captulo 1. Testes de Hipteses

16

Tabela 1.2 Valores dos coeficientes ani+1 das estatsticas de ordem de uma amostra de
tamanho n de uma distribuio Normal.
i\n

0,7071

0,7071

0,6872

0,6646

0,6431

0,1677

0,2413

0,2806
0,0875

0,1401

10

0,6233

0,6062

0,5888

0,5739

0,3031

0,3164

0,3244

0,3291

0,1743

0,1976

0,2141

0,2260

0,0561

0,0947

0,1224

0,1429

0,1586

0,1707

0,0399

0,0695

0,0922

0,1099

0,0803

0,0539

4
5

11

12

13

0,5601

0,5475

0,5359

0,3315

0,3325

0,3325

0,2347

0,2412

i\n

14

15

16

17

18

19

20

21

22

23

24

25

0,5251

0,5150

0,5056

0,4968

0,4886

0,4808

0,4734

0,4643

0,4590

0,4542

0,4493

0,4450

0,3318

0,3306

0,3290

0,3273

0,3253

0,3232

0,3211

0,3185

0,3156

0,3126

0,3098

0,3069

0,2460

0,2495

0,2521

0,2540

0,2553

0,2561

0,2565

0,2578

0,2571

0,2563

0,2554

0,2543

0,1802

0,1878

0,1939

0,1988

0,2027

0,2059

0,2085

0,2119

0,2131

0,2139

0,2145

0,2148

0,1240

0,1353

0,1447

0,1524

0,1587

0,1641

0,1686

0,1736

0,1764

0,1787

0,1807

0,1822

0,0727

0,0880

0,1005

0,1109

0,1197

0,1271

0,1334

0,1399

0,1443

0,1480

0,1512

0,1539

0,0240

0,0433

0,0593

0,0725

0,0837

0,0932

0,1013

0,1092

0,1150

0,1201

0,1245

0,1283

0,0196

0,0359

0,0496

0,0612

0,0711

0,0804

0,0878

0,0941

0,0997

0,1046

0,0163

0,0303

0,0422

0,0530

0,0618

0,0696

0,0764

0,0823

0,0140

0,0263

0,0368

0,0459

0,0539

0,0610

0,0122

0,0228

0,0321

0,0403

0,0107

0,0200

8
9
10
11
12
13

0,0000

i\n

26

27

28

29

30

31

32

33

34

35

36

37

0,4407

0,4366

0,4328

0,4291

0,4254

0,4220

0,4188

0,4156

0,4127

0,4096

0,4068

0,4040

0,3043

0,3018

0,2992

0,2968

0,2944

0,2921

0,2898

0,2876

0,2854

0,2834

0,2813

0,2794

0,2533

0,2522

0,2510

0,2499

0,2487

0,2475

0,2463

0,2451

0,2439

0,2427

0,2415

0,2403

0,2151

0,2152

0,2151

0,2150

0,2148

0,2145

0,2141

0,2137

0,2132

0,1227

0,2121

0,2116

0,1836

0,1848

0,1857

0,1864

0,1870

0,1874

0,1878

0,1880

0,1882

0,1883

0,1883

0,1883

0,1563

0,1584

0,1601

0,1616

0,1630

0,1641

0,1651

0,1660

0,1667

0,1673

0,1678

0,1683

0,1316

0,1346

0,1372

0,1395

0,1415

0,1433

0,1449

0,1463

0,1475

0,1487

0,1496

0,1505

0,1089

0,1128

0,1162

0,1192

0,1219

0,1243

0,1265

0,1284

0,1301

0,1317

0,1331

0,1344

0,0876

0,0923

0,0965

0,1002

0,1036

0,1066

0,1093

0,1118

0,1140

0,1160

0,1179

0,1196

10

0,0672

0,0728

0,0778

0,0822

0,0862

0,0899

0,0931

0,0961

0,0988

0,1013

0,1036

0,1056

11

0,0476

0,0540

0,0598

0,0650

0,0697

0,0739

0,0777

0,0812

0,0844

0,0873

0,0900

0,0924

12

0,0284

0,0358

0,0424

0,0483

0,0537

0,0585

0,0629

0,0669

0,0706

0,0739

0,0770

0,0798

13

0,0094

0,0178

0,0253

0,0320

0,0381

0,0435

0,0485

0,0530

0,0572

0,0610

0,0645

0,0677

0,0000

0,0084

0,0159

0,0227

0,0289

0,0344

0,0395

0,0441

0,0484

0,0523

0,0559

0,0000

0,0076

0,0144

0,0206

0,0262

0,0314

0,0361

0,0404

0,0444

0,0000

0,0068

0,0131

0,0187

0,0239

0,0287

0,0331

0,0000

0,0062

0,0119

0,0172

0,0220

0,0000

0,0057

0,0110

14
15
16
17
18
19

0,0000

Teste de Shapiro-Wilk

17

i\n

38

39

40

41

42

43

44

45

46

47

48

49

50

0,4015

0,3989

0,3964

0,3940

0,3917

0,3894

0,3872

0,3850

0,3830

0,3808

0,3789

0,3770

0,3751

0,2774

0,2755

0,2737

0,2719

0,2701

0,2684

0,2667

0,2651

0,2635

0,2620

0,2604

0,2589

0,2574

0,2391

0,2380

0,2368

0,2357

0,2345

0,2334

0,2323

0,2313

0,2302

0,2291

0,2281

0,2271

0,2260

0,2110

0,2104

0,2098

0,2091

0,2085

0,2078

0,2072

0,2065

0,2058

0,2052

0,2045

0,2038

0,2032

0,1881

0,1880

0,1878

0,1876

0,1874

0,1871

0,1868

0,1865

0,1862

0,1859

0,1855

0,1851

0,1847

0,1686

0,1689

0,1691

0,1693

0,1694

0,1695

0,1695

0,1695

0,1695

0,1695

0,1693

0,1692

0,1691

0,1513

0,1520

0,1526

0,1531

0,1535

0,1539

0,1542

0,1545

0,1548

0,1550

0,1551

0,1553

0,1554

0,1356

0,1366

0,1376

0,1384

0,1392

0,1398

0,1405

0,1410

0,1415

0,1420

0,1423

0,1427

0,1430

0,1211

0,1225

0,1237

0,1249

0,1259

0,1269

0,1278

0,1286

0,1293

0,1300

0,1306

0,1312

0,1317

10

0,1075

0,1092

0,1108

0,1123

0,1136

0,1149

0,1160

0,1170

0,1180

0,1189

0,1197

0,1205

0,1212

11

0,0947

0,0967

0,0986

0,1004

0,1020

0,1035

0,1049

0,1062

0,1073

0,1085

0,1095

0,1105

0,1113

12

0,0824

0,0848

0,0870

0,0891

0,0909

0,0927

0,0943

0,0959

0,0972

0,0986

0,0998

0,1010

0,1020

13

0,0706

0,0733

0,0759

0,0782

0,0804

0,0824

0,0842

0,0860

0,0876

0,0892

0,0906

0,0919

0,0932

14

0,0592

0,0622

0,0651

0,0677

0,0701

0,0724

0,0745

0,0765

0,0783

0,0801

0,0817

0,0832

0,0846

15

0,0481

0,0515

0,0546

0,0575

0,0602

0,0628

0,0651

0,0673

0,0694

0,0713

0,0731

0,0748

0,0764

16

0,0372

0,0409

0,0444

0,0476

0,0506

0,0534

0,0560

0,0584

0,0607

0,0628

0,0648

0,0667

0,0685

17

0,0264

0,0305

0,0343

0,0379

0,0411

0,0442

0,0471

0,0497

0,0522

0,0546

0,0568

0,0588

0,0608

18

0,0158

0,0203

0,0244

0,0283

0,0318

0,0352

0,0383

0,0412

0,0439

0,0465

0,0489

0,0511

0,0532

19

0,0053

0,0101

0,0146

0,0188

0,0227

0,0263

0,0296

0,0328

0,0357

0,0385

0,0411

0,0436

0,0459

0,0000

0,0049

0,0094

0,0136

0,0175

0,0211

0,0245

0,0277

0,0307

0,0335

0,0361

0,0386

0,0000

0,0045

0,0087

0,0126

0,0163

0,0197

0,0229

0,0259

0,0288

0,0314

0,0000

0,0042

0,0081

0,0118

0,0153

0,0185

0,0215

0,0244

0,0000

0,0039

0,0076

0,0111

0,0143

0,0174

0,0000

0,0037

0,0071

0,0104

0,0000

0,0350

20
21
22
23
24
25

http://www.portalaction.com.br/content/64-teste-de-shapiro-wilk, em 08/03/2014.

Captulo 1. Testes de Hipteses

18

Tabela 1.4 Valores crticos da estatstica W de Shapiro-Wilk.


Nvel de significncia

N
0,01

0,02

0,05

0,1

0,5

0,9

0,95

0,98

0,99

0,753

0,756

0,767

0,789

0,959

0,998

0,999

1,000

1,000

0,687

0,707

0,748

0,792

0,935

0,987

0,992

0,996

0,997

0,686

0,715

0,762

0,806

0,927

0,979

0,986

0,991

0,993

0,713

0,743

0,788

0,826

0,927

0,974

0,981

0,986

0,989

0,730

0,760

0,803

0,838

0,928

0,972

0,979

0,985

0,988

0,749

0,778

0,818

0,851

0,932

0,972

0,978

0,984

0,987

0,764

0,791

0,829

0,859

0,935

0,972

0,978

0,984

0,986

10

0,781

0,806

0,842

0,869

0,938

0,972

0,978

0,983

0,986

11

0,792

0,817

0,850

0,876

0,940

0,973

0,979

0,984

0,986

12

0,805

0,828

0,859

0,883

0,943

0,973

0,979

0,984

0,986

13

0,814

0,837

0,866

0,889

0,945

0,974

0,979

0,984

0,986

14

0,825

0,846

0,874

0,895

0,947

0,975

0,980

0,984

0,986

15

0,835

0,855

0,881

0,901

0,950

0,975

0,980

0,984

0,987

16

0,844

0,863

0,887

0,906

0,952

0,976

0,981

0,985

0,987

17

0,851

0,869

0,892

0,910

0,954

0,977

0,981

0,985

0,987

18

0,858

0,874

0,897

0,914

0,956

0,978

0,982

0,986

0,988

19

0,863

0,879

0,901

0,917

0,957

0,978

0,982

0,986

0,988

20

0,868

0,884

0,905

0,920

0,959

0,979

0,983

0,986

0,988

21

0,873

0,888

0,908

0,923

0,960

0,980

0,983

0,987

0,989

22

0,878

0,892

0,911

0,926

0,961

0,980

0,984

0,987

0,989

23

0,881

0,895

0,914

0,928

0,962

0,981

0,984

0,987

0,989

24

0,884

0,898

0,916

0,930

0,963

0,981

0,984

0,987

0,989

25

0,888

0,901

0,918

0,931

0,964

0,981

0,985

0,988

0,989

26

0,891

0,904

0,920

0,933

0,965

0,982

0,985

0,988

0,989

27

0,894

0,906

0,923

0,935

0,965

0,982

0,985

0,988

0,990

28

0,896

0,908

0,924

0,936

0,966

0,982

0,985

0,988

0,990

29

0,898

0,910

0,926

0,937

0,966

0,982

0,985

0,988

0,990

30

0,900

0,912

0,927

0,939

0,967

0,983

0,985

0,988

0,990

31

0,902

0,914

0,929

0,940

0,967

0,983

0,986

0,988

0,990

32

0,904

0,915

0,930

0,941

0,968

0,983

0,986

0,988

0,990

33

0,906

0,917

0,931

0,942

0,968

0,983

0,986

0,989

0,990

34

0,908

0,919

0,933

0,943

0,969

0,983

0,986

0,989

0,990

35

0,910

0,920

0,934

0,944

0,969

0,984

0,986

0,989

0,990

36

0,912

0,922

0,935

0,945

0,970

0,984

0,986

0,989

0,990

37

0,914

0,924

0,936

0,946

0,970

0,984

0,987

0,989

0,990

38

0,916

0,925

0,938

0,947

0,971

0,984

0,987

0,989

0,990

39

0,917

0,927

0,939

0,948

0,971

0,984

0,987

0,989

0,991

40

0,919

0,928

0,940

0,949

0,972

0,985

0,987

0,989

0,991

41

0,920

0,929

0,941

0,950

0,972

0,985

0,987

0,989

0,991

42

0,922

0,930

0,942

0,951

0,972

0,985

0,987

0,989

0,991

43

0,923

0,932

0,943

0,951

0,973

0,985

0,987

0,990

0,991

44

0,924

0,933

0,944

0,952

0,973

0,985

0,987

0,990

0,991

45

0,926

0,934

0,945

0,953

0,973

0,985

0,988

0,990

0,991

46

0,927

0,935

0,945

0,953

0,974

0,985

0,988

0,990

0,991

47

0,928

0,936

0,946

0,954

0,974

0,985

0,988

0,990

0,991

48

0,929

0,937

0,947

0,954

0,974

0,985

0,988

0,990

0,991

49

0,929

0,938

0,947

0,955

0,974

0,985

0,988

0,990

0,991

50

0,930

0,939

0,947

0,955

0,974

0,985

0,988

0,990

0,991

http://www.portalaction.com.br/content/64-teste-de-shapiro-wilk, em 08/03/2014.

Teste de Shapiro-Wilk

19

Exerccios

1) O valor mdio de espessura de toucinho, para animais prontos para o abate, obtido com
pistola eletrnica de 24 mm. Um produtor, no dispondo da pistola eletrnica, fez as
mensuraes usando regra milimetrada e obteve os seguintes resultados:

37,8

28,8

36,6

28,6

40,1

28,9

29,4

36,2

32,7

35,6

41,0

33,4

35,1

33,7

38,5

23,9

23,8

36,6

24,3

36,5

33,9

36,4

32,4

39,2

26,4

37,7

27,1

27,6

25,7

26,0

a) Determine a mdia, a varincia, o desvio-padro, o erro-padro da mdia e o coeficiente


de variao dos dados;
b) Construa o grfico de caixas. H algum outlier nesses dados?
c) Verifique se os dados apresentam distribuio normal;
d) Verifique se a mdia obtida com a rgua milimetrada difere da mdia esperada com a
pistola eletrnica.

2) A finalidade de um estudo foi investigar a natureza da destruio do pulmo em fumantes


antes do desenvolvimento de enfisema. Trs mensuraes foram realizadas nos pulmes
de fumantes e no-fumantes que morreram repentinamente de causas no-respiratrias.
Uma maior pontuao indica maior dano ao pulmo, o qual o valor registrado. O dano
ao pulmo maior aos fumantes que aos no-fumantes?
No fumantes

18,1

6,0

10,8

11,0

7,7

17,9

8,5

13,0

18,9

16,6

13,9

11,3

26,6

17,4

15,3

15,8

12,3

18,6

12,0

12,0

24,1

16,5

21,8

16,3

23,4

18,8

Fumantes

a) Calcule a mdia, a varincia, o desvio-padro, o erro-padro da mdia e o coeficiente de


variao dos dados para cada grupo;
b) Construa o grfico de caixas. H evidncias de diferenas entre as mdias? Observa-se
algum outlier em algum dos grupos?
c) Teste se as varincias so homogneas. Adote = 5%.

Captulo 1. Testes de Hipteses

20

d) Pode-se concluir que os fumantes tem um dano maior no pulmo que os no-fumantes?
Considere = 5%. Vale a pena fumar?
3) Os dados a seguir (parte deles) so relativos a um experimento com Tilpias do Nilo (Oreochromis niloticus) e foram obtidos pelos alunos do curso de Medicina Veterinria da UEL
em 2004.
Turma

Induo (s)

Peso (g)

Comprimento (cm)

2021

165

408,50

29,00

2021

183

400,00

29,50

2021

161

397,20

29,30

2021

108

431,60

29,50

2021

146

336,50

26,20

2021

147

309,40

25,80

2021

173

387,70

29,80

2021

193

348,50

27,50

2021

160

346,10

26,70

2021

155

307,80

27,00

2022

261

477,20

31,00

2022

203

282,50

25,70

2022

238

290,00

26,00

2022

174

429,10

30,50

2022

155

346,80

27,50

2022

202

464,60

30,50

2022

231

429,60

29,00

2022

207

284,20

26,50

2022

279

400,50

29,20

a) Calcule a mdia, varincia, desvio padro, o erro-padro da mdia e o coeficiente de


variao para cada uma das variveis numricas ;
b) Construa o grfico de caixas para o peso das tilpias. O que se observa?
c) Verifique se os dados seguem uma distribuio normal;

Teste de Shapiro-Wilk

21

d) O peso mdio de tilpia do nilo adulta de 340 g. Pode-se afirmar que o peso mdio
encontrado no experimento segue este padro?
e) Repita o item 3a, mas calculado para cada Turma;
f) Faa um grfico de caixas, comparando as Turmas, para cada uma das trs variveis e
discuta os resultados;
g) Para cada varivel, verifique se os dados seguem uma distribuio normal;
h) Para cada varivel, verifique se as varincias entre as Turmas so homogneas;
i) Para cada varivel, verifique se h diferena entre as mdias das Turmas.
4) Dez coelhos adultos foram submetidos a suplementao alimentar durante uma semana.
Os animais foram mantidos em gaiolas individuais e tiveram seus pesos (kg) mensurados
no incio e no final da suplementao.

Incio

2,43

2,59

2,50

2,48

2,53

2,52

2,57

2,51

2,47

2,43

Final

2,62

2,71

2,69

2,65

2,70

2,68

2,67

2,64

2,68

2,66

a) Qual dos tempos, Incio ou Final, apresentou maior variabilidade?


b) Construa o grfico de caixas. Discuta o resultado;
c) Adotando-se = 0, 05, h razo para acreditar que a suplementao fornece um aumento no peso mdio?

Captulo 2

Anlise de Varincia
2.1 Introduo
A ideia bsica da anlise de varincia decompor a variabilidade total, em partes
atribudas a causas conhecidas e independentes e a uma parte residual de origem desconhecida e de natureza aleatria.
Banzatto and Kronka (1995), enunciam alguns conceitos bsicos relacionados s
etapas da experimentao, que so:
a) Experimento ou ensaio: um trabalho previamente planejado, que segue determinados
princpios bsicos e no qual se faz a comparao dos efeitos dos tratamentos;
b) Tratamento: o mtodo, elemento ou material cujo efeito se deseja medir ou comparar em
um experimento. Os tratamentos podem ser considerados fixos ou aleatrios, dependendo
da forma como o experimento conduzido.
Exemplos: Rao, doses de medicamentos, inseticidas, raas, etc.;
c) Unidade experimental ou parcela: a unidade que vai receber o tratamento e fornecer os
dados que devero refletir seu efeito.
Exemplos: Um animal, um grupo de animais, uma planta, uma placa de Petri com um
meio de cultura, etc.;
d) Delineamento experimental: o plano utilizado na experimentao e implica na forma
como os tratamentos sero designados s unidades experimentais. Esta etapa extremamente importante porque os erros cometidos no delineamento podem invalidar os resultados do experimento.
Exemplos: Delineamentos experimentais: inteiramente casualizado, blocos casualizados,
quadrado latino, etc.
22

Princpios bsicos da experimentao

23

2.2 Princpios bsicos da experimentao


a) Repetio: a ideia, em experimentao, comparar grupos, no apenas unidades. As
unidades experimentais do mesmo grupo recebem, em estatstica, o nome de repeties
e sua finalidade obter uma estimativa do erro experimental. O nmero de repeties a
ser usado em um experimento uma questo difcil de responder. De um modo geral,
quanto maior for o nmero de repeties mais precisas sero as estimativas das mdias e
dos desvios-padres. Como regra prtica, aplicvel a uma grande maioria de casos, Gomes
(1990) destaca que os experimentos devem ter pelo menos vinte parcelas ou dez graus de
liberdade para o resduo.
b) Casualizao: consiste em se aplicar os tratamentos s parcelas, atravs do sorteio. Tem
por finalidade propiciar a todos os tratamentos a mesma probabilidade de serem designados a qualquer das unidades experimentais, fazendo com que cada observao (ou erro)
seja uma varivel aleatria independentemente distribuda. A casualizao foi formalmente
proposta por Fisher, na dcada de 1920;
c) Controle Local: uma tcnica usada para melhorar a preciso do experimento, cuja finalidade dividir um ambiente heterogneo em sub-ambientes homogneos e tornar o
delineamento experimental mais eficiente, pela reduo do erro experimental. Esses
sub-ambientes homogneos so chamados blocos.

2.3

Conduo do experimento
No se deve permitir que uma tcnica experimental inadequada ou imperfeita

seja a responsvel principal pelo tamanho do erro experimental. Um ensaio bem delineado
e planejado pode perder muito do seu valor se no for conduzido cuidadosamente. Deve-se
pesar o material, calibrar o equipamento ou tirar as medidas necessrias, com o mximo de
preciso possvel.
Uma das primeiras precaues a se tomar com a marcao adequada das unidades experimentais. Com animais, h mtodos padronizados de marcao de gado ou aves,
assim, o nico cuidado manter a anotao do cdigo utilizado.
Uma falha bastante comum a aplicao no uniforme dos tratamentos em todas
as repeties. Por exemplo, quando no se cuida da limpeza do equipamento utilizado para
fornecer raes aos animais, podem ocorrer diferenas que no so devidas s raes e sim,
quantidade de rao que cada animal recebeu. Em experimentos com animais eventualmente
coprfagos1 , como sunos, quando os mesmos tm acesso a uma rea comum e quando os
1 Copro

em latim significa fezes; fagia significa ingesto. Pratica ingesto de fezes

Captulo 2. Anlise de Varincia

24

tratamentos so aditivos de raes (vitaminas, minerais, etc.), que podem ser eliminados
pelas fezes, se no houver um monitoramente constante, os resultados obtidos podem ser
influenciados por esse hbito dos animais.
Finalmente, se mais de uma pessoa est aplicando os tratamentos, deve-se cuidar
para que as variaes entre elas no sejam confundidas com variaes entre tratamentos.
Neste caso, possvel aproveitar o delineamento experimental fazendo com que as variaes
entre as pessoas afetem todos os tratamentos igualmente.

2.4 Planejamento do experimento


Para se ter um experimento planejado, necessrio definir:
a) os tratamentos que sero comparados;
b) o nmero de repeties a ser utilizado;
c) a unidade experimental;
d) a forma como os tratamentos sero designados s unidades experimentais;
e) a varivel em anlise e a forma como ser medida;
f) o delineamento experimental.

Exemplo 1: Suponha que se deseja comparar o efeito de duas raes na engorda de sunos.
O experimento poderia ser planejado, definindo-se:
a) os tratamentos que sero comparados:
;
b) a unidade experimental:
;
c) a forma como os tratamentos sero designados s unidades experimentais:
.
d) a varivel em anlise e a forma como ser medida:
;
e) o delineamento experimental:
;

Planejamento do experimento

25

Exemplo 2: Considere um experimento cujo objetivo verificar se a incluso de razes e


tubrculos, como suplementao de inverno na alimentao de vacas em lactao, aumenta a
produo de leite. Para isso, sero considerados 24 animais, trs tipos de suplementos e uma
testemunha, que so:
a) Sem Suplemento (S);

b) Mandioca (M);

c) Araruta (A);

d) Batata Doce (B);

e o experimento instalado no delineamento inteiramente casualizado. Para se definir o tipo


de suplemento que ser dado a cada animal, realiza-se um sorteio enumerando cada um
dos 24 animais (parcelas) que participaro do estudo (1 a 24) e, em seguida, colocam-se os
tratamentos em uma sequncia, como a dada a seguir:
S1 S2 S3 S4 S5 S6

M1 M2 M3 M4 M5 M6

A1 A2 A3 A4 A5 A6

B1 B2 B3 B4 B5 B6

e, a partir da, utilizando uma tabela de nmeros aleatrios, faz-se a alocao do tipo de
suplemento a cada animal. Suponha que a sequncia de nmeros aleatrios sorteada, tenha
sido:
24 23 22 14 1 13

6 20 8 7 9 4

21 15 17 16 19 2

11 5 10 3 18 12

Para obter a sequncia de nmeros aleatrios e aloc-las a cada tratamentos


usando o R, bastam os seguintes comandos:
Rao = factor(rep(c(S,M,A,B), each=6))
(Animal = sample(1:24))
data.frame(Rao, Animal)

Assim, ter-se-ia, por exemplo, a seguinte configurao do experimento:


Animais
Tratamentos

Animais
Tratamentos

Animais
Tratamentos

13

Animais
Tratamentos

19

S5
8
M4

A6

B4
9

M3
14

10
M5

15

S6

S4

A5

20
M2

5
M6
11
B3

16
A2

21

12

17

B6
18

A4
23

S3

6
M1

B1

A3
22

A1

B2

B5
24

S2

S1

Considere as seguintes produes mdias dirias (kg) de leite a 4% de gordura das vacas
submetidas a administrao de razes e tubrculos, como suplementao de inverno na alimentao de vacas em lactao.

Captulo 2. Anlise de Varincia

26

Animais - Tratamentos

1 - S5

Produo (kg)

22,81

Animais - Tratamentos

7 - M4

Produo (kg)
Animais - Tratamentos

3 - B4

35,19
8 - M3

20,37
9 - M5

4 - M6

5 - B2

6 - M1

24,80

24,37

23,40

10 - B3

11 - B1

12 - B6

25,12

24,36

22,94

26,54

22,15

24,06

13 - S6

14 - S4

15 - A2

16 - A3

17 - A4

18 - B5

23,54

25,42

32,47

34,48

35,04

19,54

19 - A5

20 - M2

21 - A1

22 - S3

23 - S2

24 - S1

35,04

22,37

35,42

23,43

21,07

19,58

Produo (kg)
Animais - Tratamentos

2 - A6

Produo (kg)

Seja yij o valor da produo de leite da j-sima vaca que recebeu o i-simo tratamento. Os
valores das produes (kg) de leite a 4% de gordura das vacas que participaram do estudo,
podem ser resumidos na forma da Tabela 2.1.
Tabela 2.1 Valores de produo de leite (kg), obtidos no experimento.
Sem suplementao (t1 )

i=1
6

Mandioca (t2 )

Araruta (t3 )

Batata Doce (t4 )

19,58

23,40

35,42

22,15

21,07

22,37

32,47

24,37

23,43

24,36

34,48

26,54

25,42

25,12

33,79

20,37

22,81

22,94

35,04

19,54

23,54

21,56

35,19

24,06

yij

135,85

139,75

206,39

137,03

2
yij

3.096,8903

3.263,4781

7.105,6495

3.164,523

22,6417

23,2917

34,3983

i=1

yi

22,8383

Ao nvel de 5% de significncia, concluir a respeito da suplementao e sobre os tipos de


suplementao usados.
sempre interessante examinar os dados graficamente. A Figura 2.1 apresenta
o grfico de caixas (box plot) para cada nvel da varivel produo de leite. Note que h uma
forte evidncia de que a produo de leite pode estar relacionada com o suplemento alimentar
Araruta.

Planejamento do experimento

27

35

Quilos

30

25

20

Sem Suplemento

Mandioca

Araruta

Batata Doce

Tratamentos

Figura 2.1 Produo de leite (kg) levando-se em conta o complemento alimentar.

A mdia geral e o desvio padro de produo diria (kg) so, respectivamente,


dadas por:
y = 25, 7925 kg

s = 5, 374932 kg

As mdias e desvios de cada suplementao so dadas a seguir:


Tabela 2.2 Estatsticas calculadas para cada tratamento.
Sem Suplementao
Mdias (kg)

22,64

Mandioca
23,29

Araruta
34,398

Batata Doce
22,84

Varincias (kg 2 )

4,203977

1,6935367

1,2354967

6,997257

Desvios-Padro (kg)

2,0503601

1,3013595

1,111529

2,6452328

Erros-Padro (kg)

0,837056

0,531278

0,4537798

1,079911768

Os resultados anteriores so obtidos no R com os seguintes comandos:


Quilos = c(19.58, 21.07, 23.43, 25.42, 22.81, 23.54,
23.40, 22.37, 24.36, 25.12, 22.94, 21.56,
35.42, 32.47, 34.48, 33.79, 35.04, 35.19,
22.15, 24.37, 26.54, 20.37, 19.54, 24.06)
(Leite = data.frame(Trat = factor(rep(c(T1,T2,T3,T4), each=6)),
Quilos))
attach(Leite)

Captulo 2. Anlise de Varincia

28

names(Leite)
(media = tapply(Quilos, Trat, mean))
(desvio = tapply(Quilos, Trat, sd))
(varincias = tapply(Quilos, Trat, var))
par(mai=c(1, 1, .2, .2))
boxplot(Quilos ~ Trat, las=1, col=LightYellow,
ylab=Produo leite (kg), xlab=Tipos de Suplementos,
names=c(Sem Suplementao, Mandioca", Araruta,
Batata Doce))
points(media, pch=+", col=red, cex=1.5)
Poder-se-ia pensar em aplicar o teste t para amostras independentes e analisarmos todos os pares de mdias. Sabe-se que a estatstica de teste para comparao de duas
amostras dada por:
tcal

(
y1 y2 ) (1 2 )

=
sp n11 + n12

s2p =

(n1 1)s21 + (n2 1)s22


,
n1 + n2 2

e a hiptese nula : H0 : 1 = 2 ou H0 : 1 2 = 0.
Os resultados do teste t para todas as amostras, tomadas duas a duas, so dados
por:
SS

MA

AR

BD

Sem Suplemento (SS)

ns

**

ns

Mandioca (MA)

**

ns

Araruta (AR)

**

Batata Doce (BD)

em que:
ns - no h diferena significativa entre as mdias e,
- H diferena significativa entre as mdias, ao nvel de 5%.
Obs.: Para se obter a varincia geral dos dados, calculou-se:

ni
a
i = 1, . . . , a;

1
s2 =
(yij y)2 ,
j = 1, . . . , n .
n1
i=1 j=1

Para o clculo da varincia para cada tipo de suplemento, calculou-se:

ni
i = 1, . . . , a;

1
s2i =
(yj yi )2 ,
j = 1, . . . , n .
ni 1 j=1
i

Classificao dos experimentos

29

Entretanto, esta soluo ser incorreta, pois leva a uma considervel distoro
no erro Tipo I. Por exemplo, suponha que seja testada a igualdade das quatro mdias usando
comparaes pareadas. H 6 possveis pares e, se a probabilidade de corretamente aceitar a
hiptese nula para cada par testado de (1 ) = 0, 95, ento a probabilidade de corretamente
aceitar a hiptese nula para todos os 6 pares (0, 95)6 = 0, 7359, se os testes forem independentes. O procedimento apropriado para testar a igualdade de vrias mdias a anlise de
varincia.

2.5 Classificao dos experimentos


Os experimentos com animais podem ser classificados em: contnuos e alternativos. Nos primeiros, os animais colocados sob um determinado tratamento, nele permanecem
at o fim do experimento. Os delineamentos mais utilizados nesse tipo de estudo so: inteiramente ao acaso, blocos casualizados, quadrados latinos e parcelas subdivididas. Os ensaios
contnuos so, de forma geral, realizados com aves, coelhos, sunos, ovinos, equdeos, gado
de corte e, mais raramente, com vacas leiteiras.
Nos ensaios alternativos (cross-over ou change-over), os animais recebem, em
sequncia, dois ou mais tratamentos durante o transcorrer do experimento. So, em especial,
realizados com vacas leiteiras, mas, conforme o tipo do problema, os delineamentos podem
ser adaptados s outras espcies de animais.

Captulo 3

Delineamento Inteiramente
Casualizado
3.1 Introduo
Suponha que haja a tratamentos ou diferentes nveis de um nico fator que se
queira comparar. A resposta observada de cada dos a tratamentos uma varivel aleatria.
Os dados seriam da forma:
Tratamentos

Observaes

Totais

Mdias

y11

y12

y1n

y1

y1

y21

y22

y2n

y2

y2

..
.

..
.

..
.

..
.

..
.

..
.

yi1

yi2

yin

yi

yi

em que yij representa a j-sima observao do i-simo tratamento;


yi =

j=1

yij

yi =

yij
j=1

yij
y
=
.
an
an
i=1 j=1
a

y =

Por levar em considerao apenas os princpios da repetio e da casualizao, so considerados os mais simples delineamentos experimentais. So instalados em situao de homogeneidade, por isso, so muito usados em laboratrios, casas de vegetao, etc.
O modelo estatstico para o delineamento inteiramente casualizado :
{
yij = + i + ij ,

i = 1, 2, . . . , a

j = 1, 2, . . . , n

30

(3.1)

Introduo

31

em que:
a) yij o valor observado na parcela j que recebeu o tratamento i;
b) um parmetro constante, comum a todos os tratamentos, chamado mdia geral (quando os dados
so balanceados);
c) i um parmetro nico que representa o i-simo efeito de tratamento;
d) ij um componente do erro aleatrio, associado j-sima repetio do i-simo tratamento;

O objetivo testar hipteses apropriadas sobre os efeitos dos tratamentos e estimlos. A anlise de varincia para testar essas hipteses s vlida se forem satisfeitas as
seguintes condies:
1) aditividade: o modelo deve ser aditivo, ou seja, os efeitos devem se somar (no h interao). Para verificao da aditividade, pode-se usar o teste de no-aditividade de Tukey;
2) independncia: os erros (ij ), devidos ao efeito de fatores no controlados, devem ser
independentes, o que , at certo ponto, garantido pelo princpio da casualizao;
3) normalidade: os erros (ij ), devidos ao efeito de fatores no controlados, devem possuir
uma distribuio normal de probabilidade. Para a verificao da normalidade dos erros,
em geral, utilizam-se os testes de normalidade, tais como Lilliefors (Kolmogorov-Smirnov),
o 2 e Shapiro-Wilk, alm da anlise de resduos, construindo o grfico qqplot. O teste mais
amplamente usado para este fim o teste de Shapiro-Wilk e apresentado em detalhes na
pgina 13.
O comando do R, bem como o resultado do teste usando-se os resduos dos dados da Tabela
2.1,
shapiro.test(anava.av$res)
Shapiro-Wilk normality test
data:

anava.av$res

W = 0.9705, p-value = 0.6787


require(nortest)
lillie.test(anava.av$res)
Lilliefors (Kolmogorov-Smirnov) normality test
data:

anava.av$res

D = 0.1205, p-value = 0.4896


mostrando que os erros tm uma distribuio normal. Claro que pode-se, alm do teste,
utilizar os recursos grficos para verificao da normalidade dos dados. Os comandos para
gerar os grficos dos resduos e o QQ-Plot discutidos na aula prtica so apresentados na
seo 3.2.

Captulo 3. Delineamento Inteiramente Casualizado

32

4) homocedasticidade ou homogeneidade de varincias: os erros (ij ), devido ao efeito de


fatores no controlados, devem possuir uma varincia comum 2 . A homogeneidade das
varincias pode ser verificada atravs de testes ou pela anlise dos resduos. No caso de se
utilizar testes, tm-se:
a) F mximo ou teste de Hartley: dado por
Fmax =

s2max
.
s2min

Esse valor calculado comparado com o valor tabelado (Tabela 9.4, na pgina 126), em
que a refere-se ao nmero de tratamentos e = n 1 (graus de liberdade do nmero de
repeties em cada tratamento).
FHart = F (p = 1 , df = , k = a)
Se Fmax < FHart , ento no se rejeita a hiptese de homogeneidade de varincias.
Para realizar o teste usando o R e obter os valores da tabela de Hartley, usa-se o seguinte
comando:
require(SuppDists)
(F_hart = qmaxFratio(p=.95, df=5 , k=4))
[1] 13.72395
(F_max = max(variancia)/ min(variancia))
[1] 5.663517
Portanto, como o Fmax < FHart , no se rejeita a hiptese de homogeneidade de varincias.
b) teste de Bartlett1 , que dado por:
B=

M
C

em que:
M

a
a

(ni 1) ln (s2p )
(ni 1) ln s2i
i=1

= 1+

i=1

1
1
1

3(a 1) i=1 ni 1

(ni 1)
i=1

ainda,
a

(ni 1)s2i

s2p =

i=1
a

(ni 1)

i=1
1 Maurice

Stevenson Bartlett, nascido em Chiswick, Londres, em 18 junho de 1910 e falecido em 8 janeiro de 2002

Introduo

33

Muitos pesquisadores preferem trabalhar com logaritmos na base 10, logo, faz-se uma
mudana de base, dada por:
ln (s2p ) =

log10 (s2p )
= 2, 302585 log10 (s2p )
log10 (e)

e a frmula para o teste de Bartlett fica:

B=

M
=
C

]
[ a
a

2
2
(ni 1) log si
2, 3026
(ni 1) log (sp )
i=1

1+

i=1

1
1
1

3(a 1) i=1 ni 1

(ni 1)
i=1

em que B

2a1; .

Obs.: Para experimentos desbalanceados, usar o teste de Bartlett.


Para realizar o teste de Bartlett no R, usa-se o seguinte comando:
bartlett.test(Quilos~Trat)
O resultado do teste para os dados da Tabela 2.1,
Bartlett test of homogeneity of variances
data:

Quilos by Trat

Bartletts K-squared = 5.2207, df = 3, p-value = 0.1563


Como o p-valor 0, 1563, no se rejeita a hiptese de homogeneidade de varincias.
c) teste de Levene: estudos indicam que o teste de Bartlett muito sensvel falta de
normalidade e no deve ser aplicado quando houver dvida sobre a suposio de normalidade. Neste caso, deve-se utilizar o teste de Levene ou Brown-Forsythe que so
alternativas ao teste de Bartlett por serem menos sensveis a afastamentos da normalidade. Para a realizao do teste de Levene, deve-se:
obter os resduos da anlise de varincia: eij = yij
i ;
realizar uma anlise de varincia dos valores absolutos desses resduos;
observar o p-valor obtido na anlise e comparar com o nvel de significncia adotado
e concluir.
Para aplicar o teste de Levene usando o R, basta o comando:
require(car)
leveneTest(Quilos, Trat, center=mean)

Captulo 3. Delineamento Inteiramente Casualizado

34

3.1.1 Modelos de efeitos fixos e aleatrios


O modelo (3.1) descreve duas situaes diferentes com relao aos efeitos dos
tratamentos. Primeira, os a tratamentos poderiam ter sido especificamente escolhidos pelo
pesquisador. Nessa situao, o objetivo testar hipteses sobre as mdias dos tratamentos e
a concluso se aplica apenas aos nveis do fator considerado na anlise. As concluses no
podem ser estendidas tratamentos similares que no foram explicitamente considerados.
Pode-se estimar os parmetros do modelo (, i , 2 ). Esse tipo de anlise chamada modelo
de efeitos fixos.
Alternativamente, os a tratamentos poderiam ser uma amostra aleatria de uma
populao maior de tratamentos. Nessa situao, o objetivo estender as concluses (que so
baseadas em uma amostra de tratamentos) para todos os tratamentos da populao, quer eles
tenham feito parte do experimento ou no. Nesse caso, os i so variveis aleatrias e os testes
de hipteses recaem sobre a variabilidade de i tentando-se estimar essa variabilidade. Esse
tipo de anlise chamada modelo de efeitos aleatrios ou modelo de componentes de
varincia.

3.2 Anlise do modelo de efeitos fixos


Quando se instala um experimento no delineamento inteiramente casualizado, o
objetivo , em geral, verificar se existe diferena significativa entre pelo menos duas mdias
de tratamentos. As hipteses testadas so:
H0

: 1 = 2 = = a

H1

: i = i Pelo menos duas mdias de tratamentos diferem entre si

Uma forma equivalente de escrever as hipteses anteriores em termos dos efeitos


dos tratamentos i , que :
H0

: 1 = 2 = = a = 0

H1

: i = 0

pelo menos um tratamento

Considere a estimao dos parmetros do modelo (3.1), usando o mtodo de mnimos quadrados. A funo de mnimos quadrados :
a
n

i=1 j=1

{z
L

2ij
}

a
n

i=1 j=1

[yij i ] .

Anlise do modelo de efeitos fixos

35

Derivando-se L em relao aos parmetros ( e i ) tem-se:

= 2

L
i

= 2

a
n

[yij
i ] (1) = 0

i=1 j=1
n

[yij
i ] (1) = 0

j=1

e igualando-se os resultados a zero e aplicando os somatrios, obtm-se o chamado sistema


de equaes normais:

a
n

yij

i=1 j=1

y1j

j=1

n

y2j

j=1

..

yaj

= an
+ n
1 + n
2 + + n
a
=

n
+ n
1

= n

+ n
2
..
.

= n

+ n
a

j=1

cujo sistema tem (a + 1) equaes e (a + 1) incgnitas (, 1 , 2 , , a ), apresentando infinitas


solues. Pode ser resumido como:
a n

yij

i=1 j=1
n

yij

an
+n

i=1

n
+ n
i .

j=1

Para obter uma soluo nica impe-se uma restrio, ou seja,

i = 0. que nos permite

i=1

obter a estimativa da mdia independente do efeito de tratamentos.


Os estimadores de mnimos quadrados para e i , so dados por:

= y.. ;

= yi. y..

(3.2)
i = 1, 2, . . . , a;

(3.3)

Captulo 3. Delineamento Inteiramente Casualizado

36

3.2.1 Decomposio das Somas de Quadrados


A variabilidade total dos dados pode ser reescrita em funo das mdias de cada
tratamento, assim
a
n

(yij
)

a
n

i=1 j=1

(yij yi + yi
)

i=1 j=1
n [
a

]
2
2
(yij yi ) + (
yi y ) + 2 (
yi y ) (yij yi )

i=1 j=1
a
n

=
a
n

(yij
)

i=1 j=1
a
n

i=1 j=1

a
n

i=1 j=1
a
n

(yij yi ) +
(yij yi ) +

i=1 j=1

(
yi y ) + 2

a
n

(
yi y ) (yij yi )

i=1 j=1

(
yi y )

i=1 j=1

observe que,
n
a

n
a

yi y )
(yij yi ) (

(
yi y ) (yij yi ) =

i=1 j=1

i=1

j=1

0 (
yi y )

i=1
a
n

(
yi y ) (yij yi ) = 0

i=1 j=1

pois, a soma dos desvios das variveis em relao mdia respectiva nula. Logo,
a
n

i=1 j=1

(yij y )
{z

a
n

a
n

(yij yi ) +

i=1 j=1

{z

i=1 j=1

SQRes

SQT otal

(
yi y )
{z

SQT rat

em que, desenvolvendo-se os quadrados, obtm-se


SQT otal

a
n

2
yij

i=1 j=1

SQT rat

y2

i.

i=1

SQRes

y2
o termo C = =
an

a
n

i=1 j=1

an

y2
an

y2
an

= SQT otal SQT rat

2
yij
chamado correo.

Fazendo-se a usual suposio de normalidade, a estatstica apropriada para H0 : i = 0

Anlise do modelo de efeitos fixos

37

SQT rat/(a 1)
QM T rat
=
.
SQRes/a(n 1)
QM Res

Fcal =

sendo que Fcal F(a1); a(n1); . Se Fcal > F;(a1),a(n1) , rejeita-se H0 .


Para verificarmos se a hiptese nula (H0 ) aceita ou no, completa-se o seguinte
Quadro da Anlise de Varincia:
Tabela 3.1 Quadro da Anlise de Varincia.
Causa de variao Somas de Quadrados

g.l.

Quadrados Mdios

Fcalc

Ftab

QM T rat
QM Res

F;a1,a(n1)

Tratamentos

SQTrat

a-1

SQT rat
a1

Resduo

SQRes

a(n-1)

SQRes
a(n1)

SQTotal

an - 1

Total

em que as somas de quadrados, obtidas a partir da equao (3.1), so dadas por:

SQT otal

a
n

2
yij
C

C=

i=1 j=1

1 2
y C
n i=1 i

a
n

2
yij

i=1 j=1

an

SQT rat =

SQRes = SQT otal SQtrat

Como no se rejeitou as hipteses de homogeneidade de varincias e de normalidade dos erros, j verificados anteriormente, pode-se aplicar a metodologia discutida aos
dados apresentados na Tabela 2.1, cujas somas de quadrados so:
SQT otal

a
n

2
yij

i=1 j=1

SQTotal

SQT rat

19, 582 + 21, 072 + . . . + 24, 062

664,4676

y2

i.

i=1

=
SQTrat

y2
an

(619, 02)2
46

y2
an

] (619, 02)2
1[
135, 852 + 139, 752 + 206, 392 + 137, 032
6
46
593,82

Captulo 3. Delineamento Inteiramente Casualizado

38

SQRes = SQT otal SQT Rat

SQRes

664, 4676 593, 82

70,65

e substituindo-se esses resultados no quadro da anlise de varincia, dado na Tabela 3.1,


obtm-se:
Tabela 3.2 Anlise de varincia para os dados do Exemplo 2.
Causa de Variao
Tratamentos
Resduo

gl

S.Q.

Q.M.

Fcalc

Ftab

Pr(> F)

593,8163167

197,9387722

56,03

3,098

6,4953602e-10

20

70,6513333

3,5325667

Como Fcal > Ftab , rejeita-se H0 , ou seja, pelo menos uma mdia de tratamento difere das
demais.
Para obter esses resultados da anlise de varincia, utilizando-se do R, basta digitar o comando:
anava.av = aov(Quilos~Trat)
anova(anava.av)
qf(0.95,3,20)

# Valor tabelado

3.3 Testes de Comparaes Mltiplas


Na anlise realizada, rejeitou-se a hiptese de que as mdias dos tratamentos (suplementos) fossem iguais. Claro que, nessa situao, seria lgico perguntar quais as mdias
que diferem entre si. Ser que a mdia de produo sem suplemento diferente da mdia da
produo usando mandioca como suplemento? Ser que a mdia de produo com araruta
diferente de batata doce? E assim por diante.
Para responder a estas perguntas o pesquisador precisa de um mtodo que fornea a diferena mnima significativa entre duas mdias. H diversos testes de comparaes
mltiplas para calcular a diferena mnima significativa.
De acordo com (Conagin et al., 2007), a aplicao dos testes, no caso de tratamentos qualitativos, pode ser realizada da seguinte forma:
Contrastes ortogonais: teste t, teste F e teste de Scheff;

Testes de Comparaes Mltiplas

39

Mdias duas a duas: teste de Tukey, teste de Duncan, teste de Bonferroni e teste de NewmanKeuls;
Comparao entre o controle e as demais mdias: teste de Dunnett.
Para os testes de comparaes de mdias duas a duas, pode-se citar, ainda, o
teste de Scott-Knott.
J para o estudo de tratamentos quantitativos, deve-se aplicar a anlise de regresso.

3.3.1

Contrastes
Muitos mtodos de comparaes mltiplas usam a ideia de contraste. Uma vez

que a hiptese nula H0 : i = 0 foi rejeitada, sabe-se que algum tratamento produz uma
produo de leite diferente dos outros. Mas qual deles causa tal diferena? Poderia-se pensar,
inicialmente, que os suplementos 3 e 4 produzem a mesma quantidade de leite, implicando
que poderia-se testar a hiptese:
H0 : 3 = 4
H1 : 3 = 4
Tal hiptese poderia ser testada utilizando-se uma combinao linear apropriada dos tratamentos, tal como:
y3 y4 = 0
Se h suspeitas de que a mdia dos tratamentos 1 e 2 no diferem da mdia dos
tratamentos 3 e 4, ento a hiptese nula poderia ser
H0 : 1 + 2 = 3 + 4
H1 : 1 + 2 = 3 + 4
que implica na combinao linear
y1 + y2 y3 y4 = 0
Em geral, a comparao das mdias de tratamentos de interesse implicar em
uma combinao linear dos tratamentos, dada por:
C=

ci yi

i=1

com a restrio

i=1

ci = 0. Tais combinaes lineares so chamadas contrastes.

Captulo 3. Delineamento Inteiramente Casualizado

40

Exemplo: Em um experimento para a cura de mastite em bovinos, foram utilizados dois


antibiticos em duas dosagens para cada um. A varivel resposta o tempo de cura, em dias.
Tratamento

Dose

Droga

Descrio

Baixa

Dose baixa da droga A

Alta

Dose alta da droga A

Baixa

Dose baixa da droga B

Alta

Dose alta da droga B

Pode-se definir, entre outros, os seguintes contrastes:


Y1 = (1 2 ) (3 4 )
Y2 = (1 2 )
Y3 = (3 4 )
A soma de quadrados para qualquer contraste :
( a

)2
ci yi

i=1

SQC =

(3.4)
c2i

i=1

e tem um grau de liberdade. Se o delineamento desbalanceado, ento a comparao das


a

mdias de tratamento exige que


ni ci = 0 e a equao 3.4 resultar em:
i=1

( a

SQC =

)2
ci yi

i=1
a

(3.5)
ni c2i

i=1

Um contraste testado comparando-se sua soma de quadrados ao quadrado mdio do resduo. A estatstica resultante ter uma distribuio F com N a graus de liberdade.

3.3.2 Contrastes ortogonais


Um caso especial muito importante do procedimento da subseo 3.3.1 aquele
de contrastes ortogonais. Dois contrastes com coeficientes ci e di so ortogonais se
a

i=1

ci di = 0

Testes de Comparaes Mltiplas

41

ou, para um delineamento desbalanceado, se


a

ni ci di = 0

i=1

A ortogonalidade indica que a variao de um contraste inteiramente independente da variao de outro qualquer que lhe seja ortogonal.
Para a tratamentos o conjunto de a 1 contrastes ortogonais particiona a soma de
quadrados devido a tratamentos para a 1 componentes independentes com um nico grau
de liberdade.
H muitas maneiras de escolher os coeficientes dos contrastes ortogonais para
um conjunto de tratamentos. Usualmente, algo na natureza do experimento dever sugerir
quais comparaes sero de interesse.
Considere o experimento discutido no exemplo 2.1. Os contrastes ortogonais apropriados poderiam ser:
Coeficientes dos contrastes
Tratamentos
C1

C2

C3

Mandioca

Araruta

Batata Doce

Sem Suplemento

Note que o contraste C1 compara o efeito mdio dos tratamentos com suplemento
e sem suplemento. J no contraste C2 so comparados os efeitos mdios da Araruta com a
Mandioca e Batata Doce. Por ltimo, compara-se o efeito mdio da Mandioca e da Batata
Doce.
Os coeficientes dos contrastes devem ser escolhidos antes de executar o experimento e examinar os dados. A razo para isto que, se comparaes so selecionadas aps
examinar os dados, muitos pesquisadores construiriam testes que corresponderiam a grandes
diferenas observadas na mdia.

3.3.3

Teste t
talvez o menos usado devido s suas exigncias e porque as mesmas compa-

raes feitas com ele, podem ser feitas com o teste F , na prpria anlise de varincia, pois
F = t2 , quando se tem apenas 1 grau de liberdade. As exigncias do teste t, so:

Captulo 3. Delineamento Inteiramente Casualizado

42

a) Os contrastes devem ser estabelecidos antes do conhecimento dos resultados, isto , deve
ser uma hiptese de pesquisa;
b) Os contrastes devem ser ortogonais;
c) o nmero de contrastes ortogonais deve ser, no mximo, igual ao nmero de graus de
liberdade de tratamentos.
A equao do teste dada por:
Yi 0
tcalc =
V (Yi )
em que:

Yi a estimativa de um contraste;
V (Yi ) a estimativa da varincia da estimativa de um contraste.
Quando se aplica o teste t a um contraste, o interesse, em geral, verificar se a
sua estimativa (Y ) difere significativamente de zero, valor que deveria assumir se a hiptese
nula fosse verdadeira.
Para verificar a significncia, ou no, do contraste, consulta-se a tabela t com n =
nmero de graus de liberdade do resduo, a um nvel de probabilidade.
Se tcalc ttab , rejeita-se H0 , ou seja, admite-se que Yi = 0.
Se tcalc < ttab , aceita-se H0 .
Exemplo: Considere os dados da Tabela 2.1 e que as hipteses de pesquisa foram elaboradas
antes da realizao do experimento e so:
Y1

= 31 (2 + 3 + 4 )

Y2

= 23 (2 + 4 )

Y3

= 2 4 .

Uma estimativa para qualquer desses contrastes obtida substituindo-se as mdias por suas
estimativas, dadas por yi .
Seja
Y1 = 3
y1 (
y2 + y3 + y4 )
a estimativa do contraste Y1 , tomada em mdulo. Portanto a varincia do contraste, admitindose que as mdias dos tratamentos sejam independentes, dada por:
V (Y1 ) = 9V (
y1 ) + V (
y2 ) + V (
y3 ) + V (
y4 )

Testes de Comparaes Mltiplas

mas, V (
yi ) =

43

i2
e, admitindo-se que os dados so balanceados, tem-se:
ni
2
2
2
2
V (Y1 ) = 9 1 + 2 + 3 + 4
n1
n2
n3
n4

Se a homogeneidade de varincias aceita, tem-se que 12 = 22 = 32 = 42 e, portanto,


12 =

22 =
32 =
42 = QM Res. Assim, como os dados so balanceados com 6 repeties, a estimativa
da varincia da estimativa do contraste fica:
QM Res
V (Y1 ) = 12
n
De forma geral, dado por:
V (Yi ) =

a2
i

ni

QM Res.

Como o QM Res = 3, 5325667 e h 6 repeties por tratamento, o teste t para o contraste Y1 fica:
tcalc

tcalc

Y 0
i
V (Yi )
12, 6033333 0

3, 5325667
12
6

= 4, 741604

o valor tabelado ttab = t20;0,05 = 1, 72. Logo, o contraste Y1 significativo. Fica ao leitor a
tarefa de realizar os clculos para os demais contrastes.
Os comandos para realizar os testes para todos os contrastes usando o R :
> require(gregmisc)
(C = rbind(" 3t1 vs (t2+t3+t4) " = c(3, -1, -1, -1),
" 2t3 vs (t2 + t4) "

= c(0, -1,

2, -1),

" t2 vs t4 " = c(0, 1, 0, -1)))


fit.contrast(anava.av, "Trat", C, conf=0.95 )
qt(.95, 20)
cujos resultados so:
Contrasts
Trat 3t1 vs (t2+t3+t4)
Trat 2t3 vs (t2 + t4)
Trat

t2 vs

t4

Estimate

Std. Error

t value

Pr(>|t|)

lower CI

upper CI

-12.60

2.66

-4.74

0.00

-18.15

-7.06

22.67

1.88

12.06

0.00

18.75

26.59

0.45

1.09

0.42

0.68

-1.81

2.72

Obs.: O nvel de significncia obtido por contraste. J o nvel de significncia conjunto


dado por:
= 1 (1 )k

(3.6)

Captulo 3. Delineamento Inteiramente Casualizado

44

em que o nvel de significncia individual, geralmente 5% ou 1% e k o nmero de contrastes


ortogonais.
No exemplo apresentado, = 0, 05 e
= 1 (1 0, 05)3 = 0, 1426.

ou seja, para 3 contrastes ortogonais, tem-se 14, 26% de chance que ocorra uma diferena
significativa por acaso (portanto, menos rigor nas concluses).
Uma boa aproximao para
= n

que em nosso caso fica:


= 3 0, 05 = 0, 15.

3.3.4 Teste F
Esse mesmo estudo dos contrastes ortogonais feito pelo teste t, pode ser feito de
forma mais elegante na prpria anlise de varincia. Esse procedimento conhecido como
desdobramento de graus de liberdade de tratamento ou partio da Soma de Quadrados de
Tratamentos, sendo que a cada contraste estar associado 1 grau de liberdade. Assim, em
nosso exemplo, utilizando a equao 3.4 tem-se:
(
SQC

)2
ci yi

i=1

c2i

i=1

(3 135, 85 139, 75 206, 39 137, 03)


6 [32 + (1)2 + (1)2 + (1)2 ]

SQY1

SQY1

= 79, 4220054

Testes de Comparaes Mltiplas

45

SQY2

(2 206, 39 139, 75 137, 03)


6 [22 + (1)2 + (1)2 ]

SQY2

513, 7777778

SQY3

(139, 75 137, 03)


6 [(1)2 + (1)2 ]

SQY3

0, 616533

Assim, o quadro da anlise de varincia, apresentado na Tabela 3.3 pode ser


escrito da seguinte forma:
Tabela 3.3 Anlise de varincia para os dados do Exemplo 2.
Causa de Variao gl

S.Q.

Q.M.

Y1

79,4220054

79,4220054

Y2

1 513,7777778

513,7777778

Y3

0,61653333

0,61653333

Tratamentos

(3) (593,8163167) 197,9387722

Resduo

20

70,6513333

Fcalc

Ftab

Pr(> F)

22,48280419 4,351 0,0001


145,4404
0,1745
56,03

4,351 1,245041e-10
4,351 0,6806
3,098 6,4953602e-10

3,5325667

Obs.: Note que nesse caso em que F tem 1 grau de liberdade, tem-se que F = t2 . As concluses
so as mesmas.
Os comandos para realizar os desdobramentos usando o R :
(contraste = rbind(c(3, -1, -1, -1),
c(0, -1,

2, -1),

c(0, 1, 0, -1)))
contr.ginv = ginv(contraste)
colnames(contr.ginv) = paste("Contraste", 1:3, sep = " ")
contrasts(exe0$Trat) = contr.ginv
mod1 = lm(Quilos ~ Trat, data = exe0)
anova(mod1)
summary(mod1)
exe0co = data.frame(model.matrix(Quilos ~ Trat, exe0)[, -1])
names(exe0co) = paste("Contraste", 1:3)

Captulo 3. Delineamento Inteiramente Casualizado

46

exe0co$resp = exe0$resp
mod2 = lm(Quilos ~ ., data = exe0co)
(av2 = anova(mod2))
contrasts(exe0$Trat) = NULL

3.3.5 Teste de Student-Newman-Keuls


O teste de Newman foi aperfeioado por Keuls e est sendo apresentado nos livros
de estatstica, como teste de Student-Newman-Keuls (SNK).
O SNK derivado do teste de Tukey, sendo menos conservador (encontra mais
diferenas). O teste de Tukey controla o erro para todas as comparaes, j o SNK controla
apenas para as comparaes em considerao.
O teste consiste no seguinte: suponha-se que o experimento investigue a tratamentos. Deve-se ordenar pela ordem crescente, por exemplo, as mdias obtidas; isto ,
deve-se colocar y1 < y2 < < ya .
Na sequncia, calcula-se a diferena entre as mdias. Se o valor obtido for maior
que o determinado por snk :

snk = qi

QM Res
r

a diferena ser significativa, e assim por diante.


O valor de qi obtido da tabela de Tukey, para o nvel de significncia, correspondente a i distncias entre as mdias comparadas e n graus de liberdade do resduo.
Se as mdias comparadas y1 e y2 apresentarem diferente nmero de repeties, a
diferena mnima significativa ser dada por:

snk = qi

QM Res
2

1
1
+
r1
r2

Os comandos para realizar o teste de Student-Newman-Keuls usando o R :


require(agricolae)
teste.snk = SNK.test(anava.av, "Trat", main="")
SNK.test(anava.av, "Trat", group=FALSE)
bar.group(teste.snk, ylim=c(0,40), density=4, border="blue", las=1,
main=Teste SNK, xlab=Tipos de Rao,
ylab=Peso mdio das aves (kg))
abline(h=0, col=black)

Testes de Comparaes Mltiplas

3.3.6

47

Teste de Tukey
Tukey (1953), props um procedimento de comparao mltipla que tambm

baseado na estatstica da amplitude estudentizada. Para obter o valor da diferena mnima


significativa (d.m.s.), basta calcular:

=q

QM Res
r

(3.7)

em que:
, QMRes o quadrado mdio do resduo da anlise de varincia;
, r o nmero de repeties dos tratamentos;
, q

a amplitude total estudentizada e seu valor tabelado em funo do nmero de

tratamento (a) e do nmero de graus de liberdade do resduo.


Para o exemplo em questo, tem-se que: QM Res = 3, 5325667; q = q4;20 = 3, 958293 e
r = 6.
logo, substituindo-se os valores na Equao 3.7, a diferena mnima significativa ser, ao
nvel de 5%:

= 3, 96

3, 5325667
= 3, 04 kg.
6

Construindo-se a tabela das mdias ordenadas em ordem decrescente, tem-se:


Mdias (kg)
Araruta (AR)

34,398

Mandioca (MA)

23,29

Batata Doce (BD)

22,84

Sem Suplemento (SS)

22,64

em que letras iguais indicam mdias semelhantes.


Para obter o resultado do teste de Tukey usando o R, basta o seguinte comando:
anava.tukey = TukeyHSD(anava.av, Trat, ord=T)
anava.tukey
plot(anava.tukey, las=1, main=NULL, col=blue)

ou, usando o pacote agricolae:

Captulo 3. Delineamento Inteiramente Casualizado

48

teste.HSD = HSD.test(anava.av, Trat, main=Ganhos de Peso)


bar.group(teste.HSD, ylim=c(0,40), density=10, border="blue",
las=1, angle=45, col=red, main=Teste de Tukey,
xlab=Tipos de Rao, ylab=Peso mdio das aves (kg))
abline(h=0, col=black, lwd=1.9)

Os valores das diferenas (diff ) entre as mdias de pares de tratamentos, sendo


t1 = Sem Suplementao, t2 = Mandioca, t3 = Araruta e t4 = Batata Doce, so:

Tukey multiple comparisons of means


95% family-wise confidence level
factor levels have been ordered
Fit: aov(formula = Quilos ~ Trat)
$Trat
diff

lwr

upr

p adj

t4-t1

0.1966667 -2.786929

3.180262 0.9976951

t2-t1

1.1900000 -1.793595

4.173595 0.6839503

t3-t1 11.7566667
t2-t4

8.773071 14.740262 0.0000000

0.9933333 -1.990262

3.976929 0.7882850

t3-t4 11.5600000

8.576405 14.543595 0.0000000

t3-t2 10.5666667

7.583071 13.550262 0.0000000

Observe que os pares que apresentam diferenas significativas so aqueles cujos


limites inferiores (lwr) e superiores (upr) tm o mesmo sinal. Portanto, conclu-se que o
suplemento alimentar Araruta, melhora a produo significativamente, no havendo diferena
entre as mdias dos demais tratamentos.
Uma visualizao mais rpida das diferenas entre os pares de mdias obtida
atravs da Figura 3.1:

Testes de Comparaes Mltiplas

49

95% familywise confidence level

t4t1

t2t1

t3t1

t2t4

t3t4

t3t2
0

10

15

Differences in mean levels of Trat

Figura 3.1 Diferenas nas mdias dos tratamentos

O mtodo de Tukey exato quando todos os tratamentos tm o mesmo nmero


de repeties. Caso as mdias confrontadas no possuam o mesmo nmero de repeties,
aplica-se o teste de forma aproximada, da seguinte forma:

= q
(

V (Y ) =

1
V (Y )
2

1
1
+
ri
rk

)
QM res

em que ri e rk indicam o nmero de repeties das mdias que esto sendo comparadas.
O teste de Tukey:
a) fornece amplitudes dos intervalos de confiana menores que Bonferroni ou Scheff;
b) em sua forma bsica, s pode ser usado para contrastes de mdias duas a duas. (H
extenso para contrastes com mais de duas mdias, mas neste caso aconselhvel o teste
de Scheff.)

3.3.7

Teste de Scheff
O teste de Scheff pode ser aplicado para testar todo e qualquer contraste envol-

vendo mdias de tratamentos do tipo


Y = c1 1 + c2 2 + + ca a ,

Captulo 3. Delineamento Inteiramente Casualizado

50

sendo a estimativa do contraste dada por:


Y = c1 y1 + c2 y2 + + ca ya .

(3.8)

Ele no exige ortogonalidade nem que os contrastes sejam estabelecidos a priori,


bastando apenas que o teste F da anlise de varincia para tratamentos seja significativo. A
estatstica do teste, denotada por S, calculada por:
S=

(a 1) Ftab V (Y ),

em que:
a) a o nmero de tratamentos do experimento;
b) Ftab o valor crtico da tabela, ao nvel de probabilidade, em funo dos nmeros de
graus de liberdade de tratamentos e do resduo.
c) V (Y ) = QM Res

c2i
n
i=1 i

A Regra de Deciso do teste de Scheff para saber se o contraste diferente de


zero, tomada comparando-se a estimativa do contraste Y com o valor de S, da seguinte
forma
a) se |Yi | S, rejeita-se a hiptese H0 : Yi = 0, concluindo-se que o contraste de mdias
diferente de zero;
b) se |Yi | < S, no se rejeita a hiptese H0 : Yi = 0, concluindo-se que o contraste de mdias
no diferente de zero;

Exemplo: Considere os dados da Tabela 2.1 e que o contraste a ser testado seja: Y1 = 33 (1 + 2 + 4 ).
Logo, as hipteses so:
H0 : Yi

= 0

H1 : Yi

= 0

A estimativa do contraste Y1 , ento:


Y1

= 3 34, 398 (22, 64 + 23, 29 + 22, 84)

Y1

= 34, 424 kg

Como o experimento balanceado com 6 repeties para cada um dos 4 tratamentos, tem-se que o valor do Ftab = F3; 20; 0,05 = 3, 10 e, ainda, que QM Res = 3, 5325667.

Testes de Comparaes Mltiplas

51

Observando-se que:
V (Y ) =
V (Y ) =
V (Y ) =

c2i
QM Res
n
i=1 i
( 2
)
3 + 12 + 12 + 12
3, 5325667
6

7, 0651334 kg 2 .

Aplicando-se o teste de Scheff, tem-se:

S =
(a 1) Ftab V (Y )

S =
(4 1) 3, 10 7, 0651334
S

8, 10590776 kg.

Portanto, como |Yi | S, rejeita-se a hiptese H0 : Yi = 0, concluindo-se que a Araruta apresenta, em mdia, uma produo superior mdia dos demais tipos de suplementao alimentar da ordem de 11, 5 kg.
O teste de Scheff:
a) no importa quantas comparaes sero feitas; aceito para compraes aps os dados
terem sido observados;
b) se o nmero de comparaes grande, as amplitudes dos intervalos de confiana so
menores do que o de Bonferroni;
c) se o nmero de comparaes pequeno, interessante usar outro teste.
Os comandos para realizar o teste de Scheff usando o R :
library(agricolae)
teste.scheffe = scheffe.test(anava.av, "Trat", main="")
bar.group(teste.scheffe, ylim=c(0,40), density=4, border="blue",
las=1, main=Teste Scheffe,
xlab=Tipos de Rao, ylab=Peso mdio das aves (kg))
abline(h=0, col=black)
Obs.: o teste de Scheff bastante rigoroso e seu uso desaconselhvel para a comparao
entre duas mdias de tratamentos, sendo mais indicado para testar contrastes mais complicados.

3.3.8

Teste de Duncan
Para aplicar o teste de Duncan para tratamentos com mesmo nmero de repeti-

es, as mdias dos a tratamentos so ordenadas de forma crescente. O teste de Duncan

Captulo 3. Delineamento Inteiramente Casualizado

52
dado por:

Rp = D

QM Res
r

(3.9)

em que:
, QM Res o quadrado mdio do resduo da anlise de varincia;
, r o nmero de repeties dos tratamentos;
, D uma constante e seu valor tabelado em funo do nmero de mdias abrangidas
pelo teste e do nmero de graus de liberdade do resduo.
As diferenas observadas entre as mdias so testadas, iniciando-se com a maior
versus a menor, que sero comparadas com a diferena mnima significativa Rp . A seguir, a
diferena entre a menor e a segunda maior mdia calculada e comparada com a diferena
mnima significativa Ra1 . Estas comparaes so realizadas at que todas as mdias tenham
sido comparadas com a maior mdia. Finalmente, a diferena da segunda maior mdia e a
menor calculada e comparada com o valor de Ra1 . O processo continua at que as diferenas entre todos os possveis pares de mdias tenham sido consideradas. Se uma diferena
observada maior que a diferena mnima significativa correspondente, ento conclui-se que
o par de mdias em questo significativamente diferente.
Caso o nmero de repetio dos tratamentos seja diferente, basta trocar r na
Equao 3.9 pela mdia harmnica rh dos ri , dada por:
rh =

a
a

1
i=1

ri

Note que se r1 = r2 = = ra , ento rh = r.


O teste de Duncan menos rigoroso que o teste de Tukey, pois o nvel de significncia varia de acordo com o nmero de mdias envolvidas no grupo de mdias ordenadas e
pode detectar diferenas no discriminadas pelo teste de Tukey.
Para calcular o nvel de significncia do teste, basta substituir os termos da equao 3.6, observando que k o nmero de mdias abrangidas pelo teste.
Exemplo: Considere os dados da Tabela 2.1 cuja anlise apresentada na Tabela 3.3.
Construindo-se a tabela das mdias ordenadas em ordem crescente, tem-se:
Mdias (kg)
Sem Suplemento (SS)

22,64

y1

Batata Doce (BD)

22,84

y2

Mandioca (MA)

23,29

y3

Araruta (AR)

34,398

y4

Testes de Comparaes Mltiplas

53

Os valores tabelados D, ao nvel de 5% de significncia, levam em considerao o


nmero de mdias abrangidas pelo teste, logo, tem-se que considerar:
D(2, 20) = 2, 95

D(3, 20) = 3, 10

D(4, 20) = 3, 18

e as diferenas mnimas significativas, considerando-se 2, 3 e 4 mdias, so dadas por:

3, 5325667
R2 = 2, 95
= 2, 26 kg
6

3, 5325667
= 2, 38 kg
R3 = 3, 10
6

3, 5325667
R4 = 3, 18
= 2, 45 kg
6
Procedendo-se a comparao da diferena entre as mdias com os valores de Rp ,
tem-se:
4

vs

1:

34, 398 22, 64 = 11, 758 kg

> 2, 45 kg

= 0, 1855

vs

2:

34, 398 22, 84 = 11, 558 kg

> 2, 38 kg

= 0, 1426

vs

3:

34, 398 23, 29 = 11, 108 kg

> 2, 26 kg

= 0, 0975

vs

1:

23, 29 22, 64 = 0, 65 kg

< 2, 38 kg

= 0, 1426

vs

2:

23, 29 22, 84 = 0, 45 kg

< 2, 26 kg

= 0, 0975

vs

1:

22, 84 22, 64 = 0, 20 kg

< 2, 26 kg

= 0, 0975

Do quadro, nota-se que s h diferena significativa para as mdias confrontadas com a


Araruta, no havendo diferena entre as demais.
No R para realizar o teste de Duncan bastam os seguintes comandos:
library(agricolae)
teste.duncan = duncan.test(anava.av, "Trat", main="Ganhos de Pesos")
duncan.test(anava.av, "Trat", alpha=0.01)
bar.group(teste.duncan, ylim=c(0,40), density=4, border="blue",
las=1, main=Teste de Duncan,
xlab=Tipos de Rao, ylab=Peso mdio das aves (kg))
abline(h=0, col=black)

3.3.9

Teste de Bonferroni
O teste de Bonferroni pode ser usado no clculo de intervalos de confiana ou no

estudo da comparao de k mdias.

Captulo 3. Delineamento Inteiramente Casualizado

54

Se as mdias de dois tratamentos forem y1 e y2 , com r repeties, as diferenas


entre elas ser considerada como significativa de acordo com o teste de Bonferroni, se |
yi
yi | > B , sendo que:

B = t( ; gl)
2g

(
QM Res

1
1
+
ri
r i

em que:
i) o valor de t o t de Student.
ii) se vo ser feitas todas as comparaes entre as mdias, ento o nmero de grupos de
( )
mdias que sero comparados dado por: g = k2 (combinaes das k mdias, duas a
duas).
iii) se o nvel de significncia for adotado para o conjunto das k comparaes entre mdias
duas a duas, ento o nvel adotado de significncia para os testes individuais, ser

B = .
g
iv) gl o nmero de graus de liberdade do resduo, no quadro da anlise de varincia.
O teste de Bonferroni:
a) no recomendado para dados j observados. muito fcil ignorar as comparaes que
foram feitas para decidir o que testar;
b) interessante para comparaes pr-planejadas, sendo pequeno o nmero de comparaes
planejadas;
c) no til quando o nmero de comparaes grande.
Os comandos para realizar o teste de Bonferroni usando o R :
library(agricolae)
teste.bonferroni = LSD.test(anava.av, "Trat", main="Ganhos de Pesos",
p.adj="bonferroni")
bar.group(teste.bonferroni, ylim=c(0,40), density=4, border="blue", las=1,
main=Teste de Bonferroni, xlab=Tipos de Rao,
ylab=Peso mdio das aves (kg))
abline(h=0, col=black)

3.3.10 Teste de Dunnett


Em muitos experimentos, um dos tratamentos o chamado controle (ou testemunha) e o pesquisador est interessado em comparar cada uma das a1 mdias de tratamentos

Testes de Comparaes Mltiplas

55

com esse controle. Logo, h somente a1 comparaes a serem feitas. Um procedimento para
fazer estas comparaes foi apresentado por Dunnett em 1964.
Suponha que o tratamento a seja o controle. Ento, quer-se testar as hipteses:
H0 : i = a
H1 : i = a
para i = 1, 2, . . . , a 1. O teste de Dunnett uma modificao do usual teste t. Para cada
hiptese, calcula-se as diferenas observadas nas mdias amostrais
yi. ya.

i = 1, 2, . . . , a 1

A hiptese nula H0 : i = a rejeitada se

|
yi. ya. | > d

QM Res

1
1
+
ri
ra

em que:
, QM Res o quadrado mdio do resduo da anlise de varincia;
, ri o nmero de repeties dos tratamentos;
, ra o nmero de repeties da testemunha;
, d uma constante e seu valor tabelado em funo do nmero de tratamento (a 1) e
do nmero de graus de liberdade do resduo.
Exemplo: Considere os dados da Tabela 2.1 cuja anlise apresentada na Tabela 3.3. Se o
objetivo do pesquisador fosse comparar os tratamentos com a testemunha (neste caso Sem
Complemento), aplicar-se-ia o teste de Dunnett:

= d (a 1; gl)

QM Res

2, 54

= 2, 707576 kg

3, 5325667

1
1
+
ri
ra

1 1
+
6 6

em que d (a 1; gl) o valor tabelado, sendo a 1 = 4 1 = 3 tratamentos e gl = 20 graus de


liberdade do resduo, ao nvel de 5% de significncia.

Mdias (kg)
|
yi. ya. |

Sem Suplemento (22, 64)

Mandioca (23, 29)

Batata Doce (22, 84)

Araruta (34, 398)

0, 65ns

0, 196667ns

11, 756667

Captulo 3. Delineamento Inteiramente Casualizado

56

Assim, comparando-se as diferenas de mdias entre os tratamentos e a testemunha com o


valor calculado D, verifica-se que apenas a Araruta difere significativamente da testemunha
(Sem Suplemento).
O teste de Dunnett:
a) o melhor mtodo para comparaes de tratamentos vs controle;
b) no aplicvel para outros tipos de comparaes.
No R para realizar o teste de Dunnett, preciso instalar o pacote multcomp e os
seguintes comandos:
require(multcomp)
contra = glht(anava.av, linfct = mcp(Trat = c("t2 - t1 = 0",
"t3 - t1 = 0",
"t4 - t1 = 0")))
summary(contra)
confint(contra, level = 0.95)

Testes de Comparaes Mltiplas

57

Anlise de varincia com um fator


1) Experimentos realizados com aves (pintos) so baratos, relativamente homogneos e de
fcil manejo. Os fatores de variao a controlar so: linhagem, sexo e instalaes e a
unidade experimental tem, em geral, de 8 a 10 aves. Considerando que as condies
experimentais so homogneas, realizou-se um experimento no delineamento inteiramente
casualizado para comparao de quatro tipos de raes. Os dados so apresentados na
Tabela 3.4.
Tabela 3.4 Peso (kg) das parcelas (10 aves) ao final do experimento.
Rao A

Rao B

Rao C

Rao D

20,00

17,44

19,20

18,74

23,40

19,42

23,26

16,18

22,40

20,32

23,14

18,48

20,68

18,24

20,32

18,94

21,26

18,22

19,42

18,18

20,00

19,30

18,80

18,80

Pede-se:
a) Determine as mdias e varincias para cada tratamento;
b) Faa o grfico de caixas, comparando os tratamentos;
c) Verifique se a pressuposio de homogeneidade de varincia atendida;
d) Verifique se a pressuposio de normalidade dos resduos atendida;
e) Enuncie as hipteses e proceda anlise de varincia;
f) Caso haja significncia dos tratamentos, aplique o teste de Tukey;
g) Tirar as concluses prticas possveis para este experimento;
h) Determine os erros padres dos tratamentos e o coeficiente de variao do experimento.
2) Num experimento inteiramente casualizado com 4 tratamentos e 4 repeties, estudaramse os efeitos de Bacitracina2 de zinco (BDZ) e Anti-stress sobre frangos de corte alimentados
com raes base de sorgo, desde a fase inicial at a final. Foram utilizados 540 pintos da
raa Cobb-100 da Granja Avisco - Mococa, SP., e os tratamentos foram:
2A

Bacitracina um antibitico produzido pelas cepas TRACY-I de Bacillus subtilis, formando um grupo de anti-

biticos polipeptdios

Captulo 3. Delineamento Inteiramente Casualizado

58

A - Concentrado Comercial + Milho;


B - Concentrado Comercial + Sorgo;
C - Concentrado Comercial + Sorgo + BDZ;
D - Concentrado Comercial + Sorgo + Anti-stress.
Os resultados obtidos para a converso alimentar no perodo inicial (4 a 35 de idade) foram:

Tratamentos

Rep. 1

Rep. 2

Rep. 3

Rep. 4

Total

2,10

1,99

2,02

2,00

8,11

2,35

2,26

2,18

2,17

8,96

2,02

2,04

2,03

2,05

8,14

2,19

2,11

2,29

2,30

8,89

Pede-se:
a) Determine as mdias e varincias para cada tratamento;
b) Faa o grfico de caixas, comparando os tratamentos;
c) Verifique se a pressuposio de homogeneidade de varincia atendida;
d) Verifique se a pressuposio de normalidade dos resduos atendida;
e) Enuncie as hipteses e proceda anlise de varincia;
f) Estabelecer os contrastes de totais de tratamentos para cada componente do desdobramento:
i) Milho vs sorgos;
ii) Sorgo vs Sorgo + Aditivos;
iii) Bacitracina vs Anti-stress.
g) Calcular as somas de quadrados para cada componente do desdobramento realizado no
item (2f);
h) Construa o quadro da anlise de varincia, acrescentando as somas de quadrados dos
desdobramentos dos graus de liberdade de tratamentos;
i) Tirar as concluses prticas possveis para este experimento;
j) Determine os erros padres dos tratamentos e o coeficiente de variao do experimento.

Testes de Comparaes Mltiplas

59

Aprender a nica coisa que a mente nunca se


cansa, nunca tem medo e nunca se arrepende.
Leonardo da Vinci.

Captulo 4

Delineamento em Blocos
Casualizados
4.1 Introduo
Experimento em blocos casualizados so aqueles que levam em considerao os 3
princpios bsicos da experimentao, sendo que o controle local feito na sua forma mais
simples e chamado de blocos.
Sempre que no houver homogeneidade das condies experimentais, deve-se utilizar o princpio do controle local, estabelecendo, ento, sub-ambientes homogneos (blocos) e
instalando, em cada um deles, todos os tratamentos, igualmente repetidos. Como cada bloco
deve receber todos os tratamentos uma s vez, diz-se que blocos so repeties. Se receber
mais de uma vez cada tratamento, diz-se experimentos em blocos casualizados com repeties
dentro de blocos.
O delineamento em blocos casualizados mais eficiente que o inteiramente ao
acaso e, essa eficincia depende da uniformidade das parcelas de cada bloco, podendo, inclusive, haver diferenas bem acentuadas de um bloco para outro.

4.2 Modelo estatstico


Suponha a tratamentos que sero comparados e b blocos. Suponha ainda que
h uma observao por tratamento em cada bloco e a ordem em que os tratamentos so
atribudos a cada um dos blocos determinado aleatoriamente. Os dados seriam da forma:
60

Modelo estatstico

61
Bloco 1

Bloco 2

Bloco b

y11

y12

y1b

y21

y22

y2b

y31
..
.

y32
..
.

ya1

ya2

...

y3b
..
.
yab

O modelo estatstico para este delineamento :


{
yij = + i + j + ij ,

i = 1, 2, . . . , a

(4.1)

j = 1, 2, . . . , b

em que:
a) a mdia geral (ou uma constante);
b) yij o valor observado na parcela que recebeu o i-simo tratamento no j-simo bloco;
c) i um parmetro que representa o i-simo efeito de tratamento;
d) j um parmetro que representa o j-simo efeito de bloco;
e) ij um componente do erro aleatrio, associado ao j-simo bloco e i-simo tratamento, tal
que ij N ID(0, 2 ).
Considere a estimao dos parmetros do modelo (4.1), usando o mtodo de mnimos quadrados. A funo de mnimos quadrados :

L=

a
b

[yij i j ] .

i=1 j=1

Derivando-se L em relao aos parmetros (, i e j ) tem-se:


L

= 2

L
i

= 2

L
j

a
b [

]
yij
i j (1) = 0

i=1 j=1
b [

]
yij
i j (1) = 0

j=1

= 2

a [

]
yij
i j (1) = 0

i=1

e igualando-se os resultados a zero e aplicando os somatrios, obtm-se o chamado sistema


de equaes normais:

Captulo 4. Delineamento em Blocos Casualizados

62

a
b

yij

i=1
j=1

y1j

j=1

y2j

j=1

..

yaj

j=1

yi1

i=1

yi2

i=1

..

yib

= ab
+ b
1 + b
2 + + b
a + a1 + a2 + + ab
=

b
+ b
1

+ 1 + 2 + + b
+ 1 + 2 + + b

+ b
2
..
.

+ b
a + 1 + 2 + + b

a
+ 1 + 2 + + a + a1

a
+ 1 + 2 + + a

+ a2
..
.

+ ab

a
+ 1 + 2 + + a

i=1

que pode ser resumido como:


a b

yij

i=1 j=1


b
yij

j=1

yij

= ab
+b

i + a

i=1

= b
+ b
i +
= a
+

i=1

j=1

j=1

i + aj

i=1

cujo sistema s tem soluo, se impusermos as restries

i = 0 e

i=1

j = 0. E os resulta-

j=1

dos so:
a b

yij

i=1
j=1


b
yij

j=1

yij

= ab

= b
+ b
i

i = 1, 2, . . . , a

= a
+ aj

j = 1, 2, . . . , b

i=1

Os estimadores de mnimos quadrados para , i e j , so dados por:


(4.2)

= y.. ;
i

= yi. y..

i = 1, 2, . . . , a;

(4.3)

= y.j y..

j = 1, 2, . . . , b;

(4.4)

Modelo estatstico

63

A reduo na soma de quadrados devido ao ajuste do modelo (4.1) dada por:


a

R(, , ) =
y +

i yi +

i=1

j yj

(4.5)

j=1

Substituindo-se as estimativas obtidas pelas equaes de 4.2 a 4.4, na equao


4.5 e, aps manipulao algbrica, tem-se:
R(, , )

y +

i yi +

i=1

= y y +

j yj

j=1

(
yi. y.. ) yi +

i=1

R(, , )

y2

i=1

(
y.j y.. ) yj

j=1

b
2

yj
j=1

y2
ab

(4.6)

com a + b 1 graus de liberdade. A variabilidade restante no levada em conta pelo modelo


a chamada soma de quadrados de resduos, dada por:
SQRes =

a
b

2
R(, , )
yij

(4.7)

i=1 j=1

Substituindo-se a equao 4.6 em 4.7, obtm-se:


SQRes

a
b

2
yij

i=1 j=1

y2

i=1

b
2

yj
j=1

y2
ab

(4.8)

com (a 1)(b 1) graus de liberdade.


Para testar a hiptese H0 : i = 0, o modelo reduzido :
yij = + j + ij
que uma anlise de varincia no delineamento inteiramente casualizado. Por analogia com
a equao ??, tem-se:
R(, ) =

b
2

yj
j=1

que tem b graus de liberdade. Portanto, a soma de quadrados devido a i , aps ajustar para
e j :
R( | , )

=
=

R( | , )

R(, , ) R(, )
a

i=1
a

i=1

2
yj

(4.9)
b

2
yj

y2
yi2
+

b
a
ab j=1 a
j=1

(4.10)

yi2
y2

b
ab

(4.11)

que a soma de quadrados de tratamentos, com a 1 graus de liberdade.

Captulo 4. Delineamento em Blocos Casualizados

64

A soma de quadrados de blocos obtida ajustando-se o modelo reduzido:


yij = + i + ij
que , tambm, uma anlise de varincia no delineamento inteiramente casualizado. Novamente, por analogia com a equao ??, a reduo na soma de quadrados para o ajuste desse
modelo :
R(, ) =

y2

i=1

com a graus de liberdade. Assim, a soma de quadrados para blocos j , aps ajustar para
e i :
R( | , )

=
=

R(, , ) R(, )
a

y2

i=1

R( | , )

b
2

yj
j=1

b
2

yj
j=1

y2 yi2

ab i=1 b
a

y2
ab

que a soma de quadrados de blocos, com a 1 graus de liberdade.


Pode-se resumir as somas de quadrados da seguinte forma:
SQT otal =

a
n

2
yij

i=1 j=1

SQBlocos =

b
2

yj
j=1

y2
ab

SQT rat =

y2

i=1

y2
ab

y2
ab

SQRes = SQT otal SQT rat SQBlocos

Os clculos so usualmente apresentados em uma tabela de varincia, tal como a Tabela 4.1.
Tabela 4.1 Quadro da anlise de varincia para delineamento em blocos casualizados.

Causa de Variao
Tratamentos
Blocos
Resduo
Total

S.Q.

gl

Q.M.

Fcalc

Ftab

SQT rat

a1

SQT rat
a1

QM T rat
QM Res

F;a1,(a1)(b1)

SQBlocos

b1

SQBlocos
b1

SQRes

(a 1)(b 1)

SQRes
(a1)(b1)

SQT otal

ab 1

Pr(> F)

Exemplo: Com a finalidade de estudar os efeitos da administrao de razes e tubrculos,


como suplementao de inverno na alimentao de vacas em lactao, considerou-se um
experimento em blocos casualizados com 4 tipos de suplementos (tratamentos) e 5 raas
(blocos). As produes mdias dirias de leite (kg) so apresentadas na Tabela 4.2.

Modelo estatstico

65
Tabela 4.2 Valores de produo de leite (kg).
Tratamentos

Blocos

Sem
suplementao

Batata
Mandioca

Araruta

Totais

Doce

Gir

6,4

10,9

12,0

11,2

40,5

Holandesa

6,2

11,6

10,9

11,6

40,3

Jersey

6,2

11,4

11,5

10,9

40,0

Nelore

7,1

10,4

11,1

12,1

40,7

Guzer

6,6

12,4

11,8

10,1

40,9

yij

32,5

56,7

57,3

55,9

202,4

2
yij

211,81

645,25

657,51

627,23

j=1
5

2.141,8

j=1

Antes de se proceder anlise de varincia, pode-se utilizar o grfico de caixas


para explorao dos dados e, tambm, verificar se as exigncias do modelo esto satisfeitas.
A Figura 4.1 apresenta o grfico de caixas (box plot) para cada nvel da varivel produo de
leite. Note que h uma forte evidncia de que a produo de leite pode estar relacionada com
a suplementao alimentar.

12

11

Quilos

10

x
6
Sem Suplemento

Mandioca

Araruta

Batata Doce

Tratamentos

Figura 4.1 Produo de leite (kg) levando-se em conta o complemento alimentar.

Captulo 4. Delineamento em Blocos Casualizados

66
A entrada de dados no R

prod = c(6.4,6.2,6.2,7.1,6.6,10.9,11.6,11.4,10.4,12.4,12.0,10.9,
11.5,11.1,11.8,11.2,11.6,10.9,12.1,10.1)

Prod = data.frame(Trat=factor(rep(1:4, each=5)), Blocos=factor(rep(1:5, 4)), resp=pro


attach(Prod)

Homogeneidade de varincias: A aplicao do teste de Bartlett :

> bartlett.test(prod, Trat)


Bartlett test of homogeneity of variances
data:

Prod by Trat

Bartletts K-squared = 2.5002, df = 3, p-value = 0.4753

mostrando que h homogeneidade de varincias.


Normalidade dos resduos: Usa-se o teste de Shapiro-Wilks, cujo resultado :

> anava.bl = aov(prod~Trat+Blocos)


> shapiro.test(anava.bl$res)
Shapiro-Wilk normality test
data:

res

W = 0.9778, p-value = 0.9033

Aditividade: Usa-se o teste de aditividade de Tukey, cujo resultado :

> require(asbio)
> tukey.add.test(prod, Trat, Blocos)
Tukeys one df test for additivity
data:

Trat and Blocos on

prod

F = 0.2978, num.df = 1, denom.df = 11, p-value = 0.5962

A realizao do teste apresentada em detalhes na seo 9.2.


Logo, verificou-se que h homogeneidade de varincias, os erros tm distribuio
normal e que os efeitos principais so aditivos. Pode-se, portanto, aplicar a metodologia

Modelo estatstico

67

discutida aos dados apresentados na Tabela 4.2, tem-se:


SQT otal

a
b

2
yij

i=1 j=1

=
SQT otal
SQT rat

) (202, 4)2
6, 42 + 10, 92 + + 10, 12
45

= 93, 512
a

y2

i=1

SQBlocos

SQBlocos

SQRes

SQRes

y2
ab

= 87, 560

b
2

yj
j=1

] (202, 4)2
1[
55, 92 + 56, 72 + 57, 32 + 32, 52
5
45

=
SQT rat

y2
ab

y2
ab

] (202, 4)2
1[
40, 52 + 40, 32 + 40, 02 + 40, 72 + 40, 92
4
45

= 0, 122

SQT otal SQT rat SQBlocos

93, 512 87, 560 0, 122

= 5, 83

e substituindo-se esses resultados na Tabela 4.1, obtm-se a anlise de varincia no delineamento em blocos ao acaso, apresentada na Tabela 4.3.

Tabela 4.3 Anlise de varincia no delineamento em blocos casualizados.


Causa de variao
Blocos
Tratamentos
Resduos

S.Q.

g.l.

Q.M.

Fcalc

Ftab

Pr(>F)

0,122

0,030

0,0628

3,2592ns

0,9918

87,560

29,187

60,0755

3,4903

1,689e-07

5,830

12

0,486

Como Fcalc > 3, 49, rejeita-se H0 , ou seja, pelo menos um dos tratamentos difere dos demais.
Como pelo menos uma das mdias dos tratamentos difere, necessrio aplicar o
teste de Tukey para se determinar qual o tratamento que difere dos demais. Assim, aplicando-

Captulo 4. Delineamento em Blocos Casualizados

68

se a frmula 3.7, tem-se

0, 4858
= 1, 308788 kg.
5
No R para se determinar o valor q tabelado, basta o seguinte comando:
= 4, 19866

qtt = qtukey(.95, 4, 12)


ou, a diferena mnima significativa, diretamente, dada por:
Delta = qtukey(.95,4,12)*sqrt(anova(anava.bl)$Mean[3]/5)
Delta
Construindo-se a tabela das mdias ordenadas em ordem decrescente, tem-se:
Mdias (kg)
Araruta (AR)

11,46

Mandioca (MA)

11,34

Batata Doce (BD)

11,18

6,50

Sem Suplemento (SS)


em que letras iguais indicam mdias semelhantes.

Conclu-se que quando no se usa suplemento alimentar, a mdia de produo


de leite reduz significativamente. As diferenas entre as mdias de tratamentos podem ser
visualizadas na Figura 4.2
95% familywise confidence level

21

31

41

32

42

43
0

Differences in mean levels of Trat

Figura 4.2 Comparao das diferenas entre tratamentos pelo Teste de Tukey.

Modelo estatstico
Para obter o teste de Tukey diretamente do R, os comandos so:
summary(anava.bl = aov(prod ~ Blocos + Trat))
TukeyHSD(anava.bl, "Trat", ordered = TRUE)
plot(TukeyHSD(anava.bl, "Trat"), col=blue, las=1)

69

Captulo 4. Delineamento em Blocos Casualizados

70

Anlise de varincia com dois fatores


1) Em um experimento com poedeiras, os fatores a controlar so: raa ou linhagem; nvel e estgio da produo de ovos; peso do corpo e instalaes. O nmero de poedeiras comumente
empregado por parcela de 4 a 8. Assim, num experimento simulado de alimentao de
poedeiras, utilizou-se cinco tratamentos e quatro repeties por bloco. A constituio dos
blocos foi levando em considerao os pesos das poedeiras. Portanto, num bloco colocouse as melhores poedeiras, noutro as de segunda escolha e assim por diante. Na Tabela
4.4 so apresentados os nmeros mdios de ovos por poedeira, durante o perodo total de
postura, nos diferentes tratamentos e blocos.
Tabela 4.4 Nmero mdio de ovos por ave nos respectivos tratamentos e blocos.
Tratamentos

Bloco I

Bloco II

Bloco III

Bloco IV

Total

202,5

200,4

180,9

190,3

774,1

220,3

215,4

219,6

210,5

865,8

210,7

205,6

200,4

190,8

807,5

230,4

225,6

215,7

220,1

891,8

200,0

194,1

180,7

190,0

764,6

Total

1.063,9

1.041,1

997,1

1.001,7

4.103,8

Pede-se:
a) Determine as mdias e varincias para cada tratamento;
b) Faa o grfico de caixas, comparando os tratamentos;
c) Verifique se a pressuposio de homogeneidade de varincia atendida;
d) Verifique se a pressuposio de normalidade dos resduos atendida;
e) Verifique se a pressuposio de aditividade dos fatores atendida;
f) Enuncie as hipteses e proceda anlise de varincia;
g) Caso haja significncia dos tratamentos, aplique o teste de Tukey;
h) Tirar as concluses prticas possveis para este experimento;
i) Determine os erros padres dos tratamentos e o coeficiente de variao do experimento.

Captulo 5

Delineamento em Quadrado Latino


5.1 Introduo
Na Seo 4 introduziu-se o delineamento em blocos casualizados como um delineamento usado para reduzir o erro residual de um experimento, removendo a variabilidade
devido a uma varivel de perturbao conhecida e controlvel. H outros tipos de delineamentos que se utilizam do princpio de blocagem.
Considere um experimento, cujo objetivo foi estudar o efeito da idade de castrao
no desenvolvimento e produo de sunos, avaliando-se o peso dos leites. Quatro tratamentos foram estudados:
A - castrao aos 56 dias de idades;
B - inteiros (no castrados).
C - castrao aos 7 dias de idade;
D - castrao aos 21 dias de idade;
Duas causas de variao que podem afetar o peso final dos animais so: o nmero
de leites de cada cria (leitegada) e o peso inicial de cada animal. Essas duas causas de
variao podem ser controladas utilizando-se o delineamento em Quadrado Latino, sendo que
a variao entre leitegadas foi controlada pelas linhas do quadrado e a variao dos pesos
dos leites dentro das leitegadas foi isolada pelas colunas.
A Tabela 5.1 apresenta a aleatorizao usada para cada fator e os valores de
ganhos de pesos, em quilos, obtidos ao final do experimento (252 dias).
71

Captulo 5. Delineamento em Quadrado Latino

72

Tabela 5.1 Ganhos de pesos, em quilos, ao final do experimento (252 dias), nos respectivos
tratamentos
Linhas
Leitegada 1

Coluna 1

Coluna 2

Coluna 3

Coluna 4

(A)

(B)

(C)

(D)

93,0

108,6

(B)

Leitegada 2

(D)
115,4
(A)
102,1

Totais da Coluna

(C)

(D)

390,0

100,2
(B)

116,9
(B)

(C)

412,5

102,0

77,9

94,9

(D)

Leitegada 4

(A)
96,5

(C)

Leitegada 3

108,9

Totais da linha

409,9

96,0
(A)

117,6

114,1

118,7

97,6

428,1

414,1

422,4

395,8

448,0
1.660,4

O quadrado latino usado para eliminar duas causas de variao, ou seja, ele
permite blocos em duas direes. Deste modo linhas e colunas representam, na verdade,
duas restries aleatorizao. Em geral, um quadrado latino para p fatores, ou um quadrado
latino p p, um quadrado contendo p linhas e p colunas. Cada uma das p2 caselas contm
uma das p letras que correspondem aos tratamentos e, cada letra ocorre apenas uma vez em
cada linha e coluna. Alguns exemplos de quadrados latinos so:
44

55

66

A principal exigncia do quadrado latino que o nmero de repeties seja igual


ao nmero de tratamentos. O inconveniente que quando este nmero muito grande, o
quadrado latino torna-se impraticvel.
Para atribuir os tratamentos s parcelas usando o R, basta digitar o comando:
library(agricolae)
Tratamentos = c(LETTERS[1:4])
# ou,
Tratamentos = c(A,B,C,D)

Introduo

73

(QL = design.lsd(Tratamentos, number=1, seed=23))

O modelo estatstico para o delineamento quadrado latino :

i = 1, 2, . . . , p

yijk = + i + j + k + ijk ,
j = 1, 2, . . . , p

k = 1, 2, . . . , p

(5.1)

em que:
a) yijk o valor observado na i-sima linha e k-sima coluna para o j-simo tratamento;
b) a mdia geral;
c) i o efeito da i-sima linha;
d) j o efeito do j-simo tratamento;
e) k o efeito da k-sima coluna;
f) ijk um componente do erro aleatrio, associado i-sima linha, k-sima coluna e j-simo
tratamento;
O modelo completamente aditivo, ou seja, no h interao entre linhas, colunas e tratamentos.
Assim como nos modelos estudados anteriormente, o modelo dado pela equao
(5.1) superparametrizado. Logo, impe-se as restries usuais, que implicam que os efeitos
i , k e j sejam interpretados como desvios em relao mdia geral, , devido linha,
coluna e tratamento:

i = 0;

i=1

k = 0;

i = 0.

i=1

k=1

A anlise de varincia consiste em particionar a soma de quadrado de N = p2


observaes para componentes de linhas, colunas, tratamentos e resduo, da seguinte forma:
SQT otal = SQLinhas + SQColunas + SQT ratamentos + SQResiduo

(5.2)

com os respectivos graus de liberdade:


p2 1 = (p 1) + (p 1) + (p 1) + (p 2)(p 1).
Sob a suposio usual que ijk N ID(0, 2 ), cada soma de quadrado do lado
direito da Equao 5.2 , aps a diviso por 2 , uma varivel aleatria qui-quadrado independentemente distribuda. A estatstica apropriada para testar que no existe diferena entre
tratamentos dada por:
F0 =

QM T rat
QM Res

Captulo 5. Delineamento em Quadrado Latino

74

que tem distribuio F(p1),(p2)(p1) sob a hiptese nula. Pode-se tambm testar se existe
efeito de linhas e colunas atravs da razo entre QM Linhas ou QM Colunas em relao ao
QM Res. Entretanto, como as linhas e colunas representam restries na aleatorizao, estes
testes no so apropriados.
Para verificarmos se a hiptese nula (H0 : 1 = 2 = 3 = 4 ) aceita ou no,
completa-se o Quadro da Anlise de Varincia apresentado na Tabela 5.2.
Tabela 5.2 Quadro da Anlise de Varincia.
C.V.

S.Q.

g.l.

Q.M.

Fcalc

Ftab

SQT rat
p1
SQLinhas
p1
SQT rat
p1
SQRes
(p2)(p1)

QM T rat
QM Res

F;p1,(p2)(p1)

Tratamentos

SQT rat

p1

Linhas

SQLinhas

p1

Colunas

SQColunas

p1

Resduo

SQRes

Total

SQT otal

(p 2)(p 1)
p2 1

em que as somas de quadrados so dadas por:

SQT otal

SQT rat

SQLinhas

SQColunas

SQRes

p
p
p

2
yijk
C

i=1 j=1 k=1


p
1 2
y C
p j=1 j
p
1 2
y C
p i=1 i
p
1 2
yk C
p
k=1

C=

p
p

2
yijk

i=1 j=1 k=1

= SQT otal SQT rat SQLinhas SQColunas

Considerando os dados apresentados na Tabela 5.1, percebe-se que foram aproveitados quatro leites de cada leitegada, de forma que na primeira coluna foram colocados
os leites mais pesados, na segunda os que vinham a seguir e na ltima os mais leves.
Antes de se proceder anlise de varincia, pode-se utilizar o grfico de caixas
para explorao dos dados. As Figuras 5.1, 5.2, 5.3 e 5.4, mostram o comportamento da
varivel ganho de peso. Observa-se, na Figura 5.1, que o tratamento A parece destoar dos
demais, o que confirmado com o grfico das mdias, apresentado na Figura 5.4. Observe
que o tratamento A o nmero 1 do grfico de mdias.

Introduo

75

120

120

+
+

110

110

+
Ganho de Peso (kg)

Ganho de Peso (kg)

+
100

90

100

90

80

80

L1

L2

Tratamentos

L3

L4

Leitegadas

Figura 5.1 Tratamentos

Figura 5.2 Linhas

120
4
110

2
4

110

1
3

100

105

+
+

Ganhos de Pesos

Ganho de Peso (kg)

1
3

100
4
2

90
95

80
1
linhas
C1

C2

C3

colunas

trat

C4

Pesos

Figura 5.3 Colunas

Figura 5.4 Mdias

Antes de proceder anlise de varincia necessrio checar se os resduos tm


distribuio normal e se as varincias so homogneas. A verificao da distribuio dos
erros feita graficamente e atrves do teste de Shapiro-Wilks que no R, so realizadas com os
comandos:
par(mai=c(1,1,.5,.5))
plot(latin, which=c(2:2), pch=19, col=red, las=1)
latin = aov(ganhoq1 ~ trat + linhas + colunas)

O grfico para verificao da normalidade dos resduos apresentado na Figura 5.5. Percebe-se que no h razo para duvidar que os resduos tenham distribuio
normal.

Captulo 5. Delineamento em Quadrado Latino

76

Normal QQ
2
5
11

Standardized residuals

Theoretical Quantiles
aov(ganhoq1 ~ trat + linhas + colunas)

Figura 5.5 QQPlot para verificar se os dados tm distribuio normal.


A confirmao da normalidade dos resduos feita atravs do teste de ShapiroWilk, cujo resultado :
> shapiro.test(latin$res)
Shapiro-Wilk normality test
data:

latin$res

W = 0.959, p-value = 0.644


A verificao da homogeneidade de varincias, atravs do teste de Bartlett, realizada com os seguintes comandos:
> bartlett.test(ganhoq, trat)
Bartlett test of homogeneity of variances
data:

ganhoq and trat

Bartletts K-squared = 0.7291, df = 3, p-value = 0.8663


mostrando no haver motivos para duvidar da homogeneidade entre as varincias dos tratamentos.
Considerando que os pressupostos foram atendidos, procede-se anlise de varincia:
C.V.

S.Q.

g.l.

Q.M.

Fcalc

P r(> F )

Tratamentos

913,57

304,525

4,42

0,0578

Linhas

436,55

145,518

2,11

0,1998

Colunas

148,95

49,648

0,72

0,5749

Resduo

413,00

68,833

Introduo

77

os clculos para obteno dos valores apresentados no quadro da Anlise de varincia so:
2

p
p

yijk
C

=
=

SQT otal

i=1 j=1 k=1

N
2
2
(93, 0 + 108, 6 + . . . + 118, 7 + 97, 6)
(1660, 4)
=
16
16
172.308
p
p
p

2
yijk
C

i=1 j=1 k=1

SQT otal

)
(
93, 02 + 108, 62 + . . . + 118, 72 + 97, 62 172.308

1.912, 07

1 2
y C
p j=1 j
p

SQT rat =

)
1 (
363, 42 + 438, 72 + 425, 32 + 433, 02 172.308
4
= 913, 575

=
SQT rat

1 2
y C
p i=1 i
p

SQLinhas

)
1 (
412, 52 + 390, 02 + 409, 92 + 448, 02 172.308
4
SQLinhas = 436, 555
=

1 2
yk C
p
p

SQColunas

k=1

SQColunas

)
1 (
=
428, 12 + 414, 12 + 422, 42 + 395, 82 172.308
4
= 148, 945

SQRes = SQT otal SQT rat SQLinhas SQColunas


= 1.912, 07 913, 575 436, 555 148, 945
SQRes

= 412, 995

Considerando que o p valor est no limite da significncia e que o nmero de graus de


liberdade do resduo baixo, seria interessante que o experimento pudesse ser repetido.
Caso, na conduo do experimento, uma observao seja perdida possvel estimla usando:
yijk

(
)

p yi
+ yj
+ yk
2y
=
(p 2)(p 1)

Captulo 5. Delineamento em Quadrado Latino

78

em que as aspas indicam os totais para linha, tratamento e coluna com o valor perdido e, y

o total geral com o valor perdido.

5.1.1 Repetindo o Quadrado Latino


Uma desvantagem de quadrados latinos pequenos que eles fornecem um nmero
relativamente baixo de graus de liberdade no resduo. Por exemplo, um quadrado latino 3 3
tem somente 2 graus de liberdade no resduo, um quadrado latino 4 4 tem somente 6 graus
de liberdade no resduo e assim por diante. Quando pequenos quadrados latinos so usados
recomendvel repet-los para aumentar os graus de liberdade do resduo.
H algumas maneiras de se repetir o quadrado latino. Considere que o quadrado
latino 4 4 foi repetido n vezes. Isto poderia ter sido feito da seguinte forma:
Caso 1. Usar os mesmos nveis (em linhas e colunas) em cada repetio;
Caso 2. Usar os mesmos nveis nas linhas, mas diferentes nas colunas em cada repetio
(ou, de forma equivalente, usar os mesmos nveis nas colunas e diferentes nas linhas);
Caso 3. Usar nveis diferentes em linhas e colunas.
A anlise de varincia ir depender do mtodo de repetio.

Caso 1 - Considere a situao em que os mesmos nveis dos fatores linhas e colunas so
usados em cada repetio. Seja yijkl a observao da i-sima linha, j-simo tratamento, ksima coluna e l-sima repetio. H N = np2 observaes no total. A anlise de varincia
resumida na Tabela 5.3
Tabela 5.3 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 1.

C.V.

S.Q.

g.l.

Q.M.

Fcalc
QM T rat
QM Res

Tratamentos

p
1 2
y2
yj
np j=1
N

p1

SQT rat
p1

Linhas

p
y2
1 2
yi
np i=1
N

p1

SQLinhas
p1

Colunas

p
1 2
y2
yk
np
N

p1

SQColunas
p1

Quad. Latino

n
1 2
y2
yl
2
p
N

n1

SQQLatino
n1

(p 1)[n(p + 1) 3]

SQRes
(p1)[n(p+1)3]

k=1

l=1

Resduo
Total

Diferena

2
yijkl

2
y
N

np2 1

Introduo

79

Caso 2 - Considere a situao em que o material usado nas linhas diferente, mas o material
usado nas colunas o mesmo em cada repetio. Ou seja, h 5 novas linhas (em geral, p
novas linhas) dentro de cada repetio. A anlise de varincia resumida na Tabela 5.4
Tabela 5.4 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 2.

C.V.

S.Q.

Tratamentos

p
y2
1 2
yj
np j=1
N

Linhas

p
n
n
2

y
1 2
yil
p
p2
i=1

g.l.

Q.M.

Fcalc

p1

SQT rat
p1

QM T rat
QM Res

n(p 1)

SQLinhas
n(p1)

l=1

l=1

Colunas

p
1 2
y2
yk
np
N

p1

SQColunas
p1

Quad. Latino

n
1 2
y2
yl
2
p
N

n1

SQQLatino
n1

(p 1)(np 2)

SQRes
(p1)(np2)

k=1

l=1

Resduo
Total

Diferena

2
yijkl

2
y
N

np2 1

Caso 3 - Considere a situao em que o material na repetio diferente, tanto nas linhas
quanto nas colunas. A anlise de varincia resumida na Tabela 5.5
Tabela 5.5 Quadro da Anlise de Varincia para um Quadrado Latino repetido - Caso 3.

C.V.

S.Q.

g.l.

Q.M.

Fcalc

p1

SQT rat
p1

QM T rat
QM Res

Tratamentos

p
y2
1 2
yj
np j=1
N

Linhas

p
n
n
2

1 2
yl
yil
p
p2
i=1

n(p 1)

SQLinhas
n(p1)

p
n
1 2
y2
ykl l
p
p2

n(p 1)

SQColunas
n(p1)

n1

SQQLatino
n1

(p 1)[n(p 1) 1]

SQRes
(p1)[n(p1)1]

l=1

Colunas

l=1

l=1 k=1

Quad. Latino

n
1 2
y2
yl
2
p
N
l=1

Resduo
Total

Diferena

2
yijkl

2
y
N

np2 1

Obs.: esta a situao que est sendo considerada no exemplo discutido. Se repetirmos o
experimento, haver novas leitegadas e o peso inicial dever ser diferente tambm.

Captulo 5. Delineamento em Quadrado Latino

80

Considere a repetio do segundo experimento, no delineamento quadrado latino,


e os resultados obtidos, apresentados na Tabela 5.6
Tabela 5.6 Ganhos de pesos, em quilos, ao final do 2o experimento (252 dias), nos respectivos tratamentos
Linhas

Coluna 1

Coluna 2

Coluna 3

Coluna 4

(A)

(B)

(C)

(D)

Totais da linha

Leitegada 5

465,5
125,2
(B)

109,4
(D)

116,4
(A)

114,5
(C)

Leitegada 6

425,8
120,7

106,8
(A)

(C)

95,4
(D)

102,9
(B)

Leitegada 7

452,7
117,6
(D)

112,4

112,3
(B)

(C)

110,4
(A)

Leitegada 8

Totais da Coluna

497,2
135,8

126,3

133,3

101,8

499,3

454,9

457,4

429,6

1.841,2

A anlise de varincia para os dados obtidos no segundo experimento apresentada na Tabela 5.7.
Tabela 5.7 Anlise de varincia do segundo experimento.
CV

SQ

gl

QM

Fcalc

Pr(>F)

Tratamentos

230,93

76,98

1,27

0,3664

Linhas

659,17

219,72

3,62

0,0842

Colunas

625,27

208,42

3,44

0,0926

Resduos

363,89

60,65

Nota-se, da Tabela 5.7 que os tratamentos tambm no diferiram entre si.


Considerando-se que os graus de liberdade para os dois experimentos so baixos, pode-se realizar uma anlise conjunta, levando-se em conta os dois quadrados latinos e
incorporando ao modelo o efeito do quadrado latino (experimento).
O grfico de caixas para a anlise conjunta, apresentado na Figura 5.6, mostra
que o tratamento A parece diferir dos demais.

Introduo

81

130

Ganho de Peso (kg)

120

+
+

110

100

90

80

Tratamentos

Figura 5.6 Mdias dos tratamentos considerando o experimento conjunto.

Aplicando-se as frmulas apresentadas para o Caso 3 (Tabela 5.5), obtm-se a


anlise conjunta apresentada na Tabela 5.8.

Tabela 5.8 Anlise de varincia conjunta.


CV

SQ

gl

QM

Fcalc

Pr(>F)
0, 0079

Tratamentos

1029,61

343,20

5,77

Quadrado Latino

1021,52

1021,52

17,18

Linhas d. QL

1095,72

182,62

3,07

0, 0364

Colunas d. QL

774,21

129,03

2,17

0,1047

15

891,78

59,45

Resduos

0, 0009

Nota-se que houve efeito de tratamentos, ou seja, pelo menos uma mdia de tratamento difere
das demais. A obteno dos valores da Tabela 5.8 foi obtida atravs da aplicao das seguintes
frmulas:

SQT otal

2
y
(3.501, 6)2
=

C = 383.162, 6
N
32

2
=
yijkl
C
(
)
= 93, 02 + 108, 62 + + 97, 62 + 125, 22 + 109, 42 + + 101, 82 383.162, 6

SQT otal

= 4.812, 84

Captulo 5. Delineamento em Quadrado Latino

82

1 2
y C
np j=1 j
p

SQT rat =
=
SQT rat =

y2
1 2
l
yil
2
p
p
i=1
n

SQLinhas

(
)
1
798, 22 + 912, 52 + 888, 52 + 902, 42 383.162, 6
(2 4)
1.029, 608

l=1

SQLinhas

l=1

)
(
)
1660, 42 + 1841, 22
1(
2
2
2
2
=
412, 5 + + 448 + 465, 5 + + 497, 2
4
16
= 1.095, 72

1 2
y2
ykl l
p
p2
n

SQColunas

SQColunas

(
)
)
1660, 42 + 1841, 22
1(
2
2
2
2
428, 1 + + 395, 8 + 499, 3 + + 429, 6
=
4
16
= 774, 21

l=1 k=1

n
1 2
yl C
p2

SQQLatino

SQQLatino

)
1 (
=
1660, 42 + 1841, 22 383.162, 6
16
= 1.021, 52

l=1

SQRes

= SQT otal SQT rat SQLinhas SQColunas SQQLatino


= 4.812, 84 1.029, 608 1.095, 72 774, 21 1.021, 51

SQRes

= 891, 7825

A seguir, aplica-se o teste de Tukey, cujos resultados so:


>

require(laercio)

>

LTukey(caso3, which=trat)
TUKEY TEST TO COMPARE MEANS
Confidence level:
Dependent variable:

0.95
ganhoq

Variation Coefficient:

7.0464 %

Introduo

83

Independent variable:

trat

Factors Means
2

114.0625 a

112.8

111.0625 a

99.775

Portanto, conclui-se que tratamento 1 difere dos demais. As diferenas de mdias


entre os tratamentos pode ser visualizada na Figura 5.7
95% familywise confidence level
31

41

21

43

23

24
10

10

15

20

25

Differences in mean levels of trat

Figura 5.7 Comparao das mdias dos tratamentos considerando o experimento conjunto.

Captulo 5. Delineamento em Quadrado Latino

84

Anlise de varincia em Quadrado Latino


1) Considere o seguinte exemplo, extrado da apostila do Prof. Gener, UNESP Jaboticabal,
citando Rao, P.V. Statistical research methods in the life science, pg. 727: Em um estudo para comparar as tolerncias de gatos a quatro substncias cardacas (A, B, C, D) foi
conduzida utilizando-se um Delineamento em Quadrado Latino, no qual as linhas representavam quatro combinaes de dois perodos (A.M., P.M.) e duas tcnicas (I e II) e as
colunas representam os dias nos quais as medidas foram feitas. A cada um dos 16 gatos
foi administrada uma substncia cardaca a uma taxa fixada e a dose (taxa de infuso
tempo) na qual o efeito especificado foi observado foi anotado. As respostas medidas, em
10 log(dose em g), so apresentadas na Tabela 5.9.
Tabela 5.9 Respostas observadas no experimento com gatos.
Linhas
I, AM

Dia 1

Dia 2

Dia 3

Dia 4

(D)

(B)

(A)

(C)

3,26
I, PM

(B)
2,73

II, AM

(A)
3,45

II, PM

(C)
3,20

4,15
(D)
3,38
(C)
4,09
(A)
3,14

3,02
(C)
3,29
(B)
2,66
(D)
3,48

3,67
(A)
4,50
(D)
3,51
(B)
3,40

Pede-se:
a) Determine as mdias e varincias para cada tratamento;
b) Faa o grfico de caixas, comparando os tratamentos;
c) Verifique se a pressuposio de homogeneidade de varincia atendida;
d) Verifique se a pressuposio de normalidade dos resduos atendida;
e) Enuncie as hipteses e proceda anlise de varincia;
f) Construa o quadro da anlise de varincia;
g) Conclua.

Captulo 6

Experimentos Fatoriais
6.1 Introduo
Muitos experimentos envolvem o estudo dos efeitos de dois ou mais fatores. Em
geral, experimentos fatoriais so mais eficientes para este tipo de experimento, pois estudam,
ao mesmo tempo, os efeitos de dois ou mais tipos de tratamentos ou fatores. Cada subdiviso
de um fator denominada nvel do fator e os tratamentos consistem de todas as combinaes
possveis entre os diversos fatores nos seus diferentes nveis.
O tipo mais simples de experimento fatorial o 2 2. Nesses experimentos so
analisados dois fatores, em dois nveis. Por exemplo, pode-se combinar 2 Variedades (V) de
cana-de-acar, com 2 diferentes Herbicidas (H). Os nveis para Variedades (V) so dados por:
V1 e V2 e os nveis de Herbicida (H) por: H1 e H2 , de forma que as combinaes desses nveis,
geram os seguintes tratamentos:
V1 H1

V1 H2

V2 H1

V2 H2 .

Considere os dados (fictcios) da Tabela 6.1, referentes a produo de uma determinada cultura.
Tabela 6.1 Experimento fatorial 2 2.
Herbicidas
H1

H2

V1

20

30

V2

40

52

Variedades

85

Captulo 6. Experimentos Fatoriais

86

O efeito de um fator definido como sendo a mudana na resposta produzida por


uma mudana no nvel do fator. Isto frequentemente chamado efeito principal por que
ele se refere aos fatores principais de interesse no experimento. O efeito principal do fator V
poderia ser pensado como a diferena entre a resposta mdia para o primeiro nvel de V e a
resposta mdia para o segundo nvel de V . Numericamente, tem-se:

V =

40 + 52 20 + 30

= 21,
2
2

ou seja, acrscimos na produo (fator V ) do nvel H1 para o nvel H2 causar um acrscimo


na resposta mdia de 21 unidades. De forma anloga, o efeito principal de H :

H=

52 + 30 40 + 20

= 11,
2
2

Em alguns experimentos, pode-se encontrar que a diferena na resposta entre os


nveis de um fator no a mesma para os nveis de outros fatores. Quando isto ocorre, h
uma interao entre os fatores, como mostrado na Figura 6.2. Na Figura 6.1 apresentado
a situao em que no h interao entre os fatores (as linhas de H1 e H2 so paralelas) ,
mostrando que a diferena nos nveis de um fator ocorre para os nveis de outros fatores (vide

50

Tabela 6.1).

50

Herbicidas

Herbicidas
H1
H2

30

Produo

35
20

25

20

30

Produo

40

40

45

H1
H2

V1

V2

V1

Variedades

Variedades

Figura 6.1 Experimento fatorial sem interao.

V2

Figura 6.2 Experimento fatorial com interao.

Obs.: Os experimentos fatoriais no constituem um delineamento experimental, e sim um


esquema orientado de desdobramento de graus de liberdade de tratamentos e podem ser
instalados em qualquer dos delineamentos experimentais.

Anlise e interpretao de um experimento fatorial, com 2 fatores

87

6.2 Anlise e interpretao de um experimento fatorial, com


2 fatores

Considere os dados da Tabela 6.2, referentes a um experimento no delineamento


inteiramente casualizado, no esquema fatorial 3 2, para testar os efeitos de trs 3 recipientes
para produo de mudas e 2 espcies de eucaliptos, quanto ao desenvolvimento das mudas.
Esse exemplo apresentado em Banzatto & Kronka (1995).

Tabela 6.2 Alturas mdias das mudas, em centmetros, aos 80 dias de idade.
Espcies
Recipientes
E1

E2

26,2

26,0

24,8

24,6

25,0

25,4

26,7

25,2

25,7

26,3

19,6

21,1

25,1

26,4

19,0

18,6

22,8

19,4

19,8

21,4

18,8

19,2

22,8

21,3

R1

R2

R3

em que:

R1 - saco plstico pequeno;

E1 - Eucalyptus citriodora;

R2 - saco plstico grande;

E2 - Eucalyptus grandis;

R3 - laminado;
Antes de proceder anlise dos dados da Tabela 6.2, considere o caso geral de
um experimento fatorial com dois fatores.
Seja yijk a resposta observada para o i-simo nvel (i = 1, 2, . . . , a) do fator A e jsimo nvel (j = 1, 2, . . . , b) do fator B, para a k-sima repetio (k = 1, 2, . . . , n). Em geral, os
dados sero apresentados na forma da Tabela 6.3.

Captulo 6. Experimentos Fatoriais

88

Tabela 6.3 Arranjo geral para um experimento fatorial.


Fator B
1

...

y111 , y112 , . . . , y11n

y121 , y122 , . . . , y12n

...

y1b1 , y1b2 , . . . , y1bn

y211 , y212 , . . . , y21n

y221 , y222 , . . . , y22n

...

y2b1 , y2b2 , . . . , y2bn

..
.

..
.

..
.

..
.

..
.

ya11 , ya12 , . . . , ya1n

ya21 , ya22 , . . . , ya2n

...

yab1 , yab2 , . . . , yabn

Fator A

As observaes podem ser descritas pelo modelo estatstico linear:

i = 1, 2, . . . , a
yijk = + i + j + ( )ij + ijk
j = 1, 2, . . . , b

k = 1, 2, . . . , n

(6.1)

em que o efeito da mdia geral, i o efeito do i-simo nvel do fator linha A, j o efeito do
j-simo nvel do fator coluna, ( )ij o efeito da interao entre i e j e ijk o componente
de erro aleatrio.
No experimento fatorial com 2 fatores, deseja-se testar a significncia de ambos
os fatores. H interesse em testar hipteses sobre a igualdade dos efeitos de tratamentos nas
linhas, isto :
H0

: 1 = 2 = . . . a = 0

H0

Pelo menos um i = 0

e a igualdade nos efeitos de tratamentos nas colunas, ou seja:


H0

: 1 = 2 = . . . b = 0

H0

Pelo menos um j = 0

e, ainda, se h interao entre linhas e colunas:


H0

: ( )ij = 0

H0

para todo i, j

Pelo menos um ( )ij = 0

Considere a estimao dos parmetros do modelo, dado pela Equao 6.1, usando
o mtodo de mnimos quadrados. A funo de mnimos quadrados :

Anlise e interpretao de um experimento fatorial, com 2 fatores

L=

b
n
a

89

[yijk i j ( )ij ] .

i=1 j=1 k=1

Derivando-se L em relao aos parmetros (, i , j e ( )ij ) tem-se:

= 2

L
i

= 2

L
j

= 2

a
b
n [

]
d
yijk
i j (
)ij (1) = 0

i=1 j=1 j=1


b
n [

j=1 k=1
a
n [

]
d
yijk
i j (
)ij (1) = 0

]
d
yijk
i j (
)ij (1) = 0

i=1 j=1

= 2

n [

]
d
yijk
i j (
)ij (1) = 0

k=1

e igualando-se os resultados a zero e aplicando os somatrios, obtm-se o chamado sistema


de equaes normais:
a
b
n

yijk

= abn
+ bn

i=1 j=1 k=1


b
n

j=1 k=1
a
n

i=1 k=1
n

i + an

i=1

yijk

= bn
+ bn
i + n

j + n

j=1
b

j + n

j=1

yijk

= an
+n

d
(
)ij

i=1 j=1
b

d
(
)ij

j=1
a

i + anj + n

i=1

yijk

a
b

d
(
)ij

i=1

d
= n
+ n
i + nj + n(
)ij

k=1

cujo sistema s tem soluo, se impusermos as restries:


a

= 0

= 0

d
(
)ij

= 0

j = 1, 2, . . . , b

d
(
)ij

= 0

i = 1, 2, . . . , a

i=1
b

j=1
a

i=1
b

j=1

Assim, os estimadores de mnimos quadrados para , i , j e ( )ij , so dados


por:

Captulo 6. Experimentos Fatoriais

90

= y... ;

= yi.. y...

i = 1, 2, . . . , a;

= y.j. y...

j = 1, 2, . . . , b;

c
ij

= yij. yi.. y.j. y...

i = 1, 2, . . . , a
j = 1, 2, . . . , b

sendo:
y...

a
b
n

yijk

y... =

i=1 j=1 k=1

yi..
y.j.
yij.

b
n

j=1 k=1
a
n

(6.2)

yijk

yi.. =

yi..
bn

i = 1, 2, . . . , a

(6.3)

yijk

y.j. =

y.j.
an

j = 1, 2, . . . , b

(6.4)

i=1 k=1
n

y...
abn

yijk

yij.

k=1

yij.
=
n

i = 1, 2, . . . , a
j = 1, 2, . . . , b

(6.5)

Usando a notao das Equaes de 6.2 a 6.5, pode-se escrever a soma de quadrados total corrigida como:
a
b
n

(yijk y)

i=1 j=1 k=1

a
b
n [

(
yi.. y... ) + (
y.j. y... ) + (
yij. yi.. y.j. + y... )

i=1 j=1 k=1

+ (yijk yij. )
=

bn

]2

(
yi.. y... ) + an

i=1

+n

(
y.j. y... )

j=1

a
b

(
yij. yi.. y.j. + y... ) +

i=1 j=1

a
b
n

(yijk yij. ) , (6.6)

i=1 j=1 k=1

j que os seis produtos cruzados resultam em zero.


Note que a soma de quadrados total foi particionada para a soma de quadrados de linhas
ou fator A (SQA); uma soma de quadrados devido colunas ou fator B (SQB); uma soma
de quadrados devido interao entre A e B (SQAB); e uma soma de quadrados devido ao
resduo (SQRes).
Assim, pode-se escrever a Equao 6.6, como:
SQT otal = SQA + SQB + SQAB + SQRes,
de forma que a soma de quadrados total, usualmente calculada, dada por:
SQT otal =

a
b
n

i=1 j=1 k=1

2
yijk

2
y...
.
abn

(6.7)

Anlise e interpretao de um experimento fatorial, com 2 fatores

91

As somas de quadrados para os efeitos principais so:

SQA

y2

i..

i=1

SQB

bn

2
y...
abn

(6.8)

2
y...
.
abn

(6.9)

b
2

y.j.

j=1

an

Para o clculo da soma de quadrados da interao (SQAB), deve-se, inicialmente, calcular a


soma de quadrados do efeito conjunto de A e B, denotada por SQA, B. Logo,

SQA, B =

a
b
2

yij.
i=1 j=1

2
y...
.
abn

Esta soma de quadrados contm SQA e SQB. Portanto, a soma de quadrados da interao :
SQAB = SQA SQB SQA, B,
e,a soma de quadrados de resduos, obtm pela diferena:
SQRes = SQT otal SQA SQB SQAB.

Obs.: Nos experimentos fatoriais com 2 fatores, a soma de quadrados do efeito conjunto
sempre igual soma de quadrados de tratamentos.
O procedimento para a realizao da anlise de varincia resumido na Tabela
6.4.
Tabela 6.4 Anlise de varincia para um experimento fatorial com 2 fatores.
Causa de Variao

S.Q.

g.l.

SQA

a1

SQB

b1

AB

SQA B

(a 1)(b 1)

Resduo

SQRes

ab(n 1)

Total

SQT otal

abn 1

Q.M.

Fcal

QM A =

SQA
a1

Fcal =

QM A
QM Res

QM B =

SQA
b1

Fcal =

QM B
QM Res

QM AB =
QM Res =

SQAB
(a1)(b1)

Fcal =

Ftab

QM AB
QM Res

SQRes
ab(n1)

A Tabela 6.5 apresenta os dados do desenvolvimento das mudas de 2 espcies de


eucaliptos (E1 e E2 ) plantados em 3 tipos de recipientes (R1 , R2 e R3 ).

Captulo 6. Experimentos Fatoriais

92

Tabela 6.5 Alturas mdias das mudas, em centmetros, aos 80 dias de idade.
Espcies
Recipientes

E1

R1

R2

R3

yij.

26,2

26,0

25,0

25,4

25,7

26,3

25,1

26,4

22,8

19,4

18,8

19,2

E2

102,6

103,5

80,2

yij.

24,8

24,6

26,7

25,2

19,6

21,1

19,0

18,6

19,8

21,4

22,8

21,3

286,3

y.j.

yi..

101,3

203, 9

78,3

181, 8

85,3

165, 5

264,9

y... = 551, 2

As somas de quadrados so calculadas a seguir:


SQT otal

a
b
n

2
yijk

i=1 j=1 k=1

2
y...
.
abn

= (26, 2)2 + (26, 0)2 + + (21, 3)2

SQRec =

y2

i..

2
y...
abn

2
y...
.
abn

bn
(
)
203, 92 + 181, 82 + 165, 52
(551, 2)2

= 92,86083333
24
324

i=1

SQEsp =

b
2

y.j.

an
(
)
286, 32 + 264, 92
(551, 2)2
=

= 19,08166667
34
324
a
b
2

yij.
y2
=
...
n
abn
i=1 j=1
(
)
102, 62 + 103, 52 + + 85, 32
(551, 2)2

= 175,7033333
=
4
324
j=1

SQRec, Esp

SQRec Esp

(551, 2)2
= 198,7933
324

= SQRec, Esp SQRec SQEsp


=

175, 7 92, 86 19, 08 = 63,76083333

SQRes = SQT otal SQRec SQEsp SQRec Esp


=

198, 79 92, 86 19, 08 63, 76 = 23,09

Anlise e interpretao de um experimento fatorial, com 2 fatores

93

Substituindo-se os resultados obtidos na Tabela 6.4, tem-se o quadro da anlise


de varincia, apresentado na Tabela 6.6.
Tabela 6.6 Anlise de varincia de acordo com o esquema fatorial 3 2. Quero ver como ele
fazx com linhas compridas.
Causa de Variao

S.Q.

g.l.

Q.M.

Fcalc

Ftab

P r(> F )

Recipientes (Rec)

92,86083333

46,43041667

36, 20

3,554557

4,924e-07 ***

Espcies (Esp)

19,08166667

19,08166667

14, 88

4,413873

0,001155 **

RecEsp

63,76083333

31,88041667

24, 85

3,554557

6,635e-06 ***

Resduo

23,09000000

18

198,79333333

23

Total

1,2827778

Como o valor tabelado F0,05; 2; 18 = 3, 5546, conclui-se que h uma interao significativa entre
Recipientes e Espcies de eucaliptos, o que pode ser observado nas Figuras 6.3 e 6.4.
26
Recipientes
25

26

R1
R3
R2

23

24

23

22

22

Produo Mdia

24

E1
E2

Alturas mdias (cm)

25

Espcies

21

21

20

20

R1

R2

E1

R3

E2
Espcies

Recipientes

Figura 6.3 Interao Rec Esp.

Figura 6.4 Interao Esp Rec.

Note que a soma de quadrados devido ao modelo definida por:


SQM odelo =
=

SQRec + SQEsp + SQRec Esp


92, 86083333 + 19, 08166667 + 63, 76083333 = 175,7033

e que
R2 =

175, 7033
SQM odelo
=
= 0,8838.
SQT otal
198, 7933

Captulo 6. Experimentos Fatoriais

94

ou seja, cerca de 88% da variabilidade no desenvolvimento das mudas explicada pelos


recipientes, espcies e a interao recipientes-espcies.
Pelos resultados apresentados na Tabela 6.6, conclui-se que a interao entre
Recipientes e Espcies foi significativa. Sendo assim, as concluses para os efeitos principais
ficam prejudicadas, dado que existe dependncia entre os efeitos dos fatores estudados. Logo,
deve-se proceder ao desdobramento da interao Recipiente Espcie, o que pode ser feito
de duas maneiras:

estudar o comportamento das espcies dentro de cada recipiente;

estudar o comportamento dos recipientes dentro de cada espcie.

Para obter os resultados apresentados na Tabela 6.6, os comandos so:

fat.av = aov(alturas ~ recip*espec)


summary(fat.av)
# ou, ainda
fat.av = aov(alturas ~ recip + espec + recip*espec)
summary(fat.av)

6.2.1 Desdobramento da interao R E para estudar o comportamento


das espcies dentro de cada recipiente
Tem-se que:

SQEsp d. R1

) (203, 9)2
1(
= 0, 21
102, 62 + 101, 32
4
8

SQEsp d. R2

) (181, 8)2
1(
= 79, 38
103, 52 + 78, 32
4
8

SQEsp d. R3

) (165, 5)2
1(
= 3, 25
80, 22 + 85, 32
4
8

O quadro de anlise da varincia do desdobramento apresentado na Tabela 6.7.

Anlise e interpretao de um experimento fatorial, com 2 fatores

95

Tabela 6.7 Estudo das Espcies dentro de cada Recipiente.


Causa de Variao
Recipientes

S.Q.

g.l.

92,86

Recip:Espec

(82,84)

( 3)

Q.M.

Fcalc

Ftab

P r(> F )

46,43

36,20

3,554557

4,924e-07 ***

27,61

21,53

3,1599

< 0, 0001

Espcies d. R1

0,21

0,21

0, 16

3,554557

0, 6897ns

Espcies d. R2

79,38

79,38

61, 88

4,413873

< 0, 0001

Espcies d. R3

3,25

3,25

2, 53

4,413873

0, 1288ns

Resduo
Total

23,09000000

18

198,79333333

23

1,2827778

Considerando-se que h apenas dois tipos de Recipientes sendo analisado, a interpretao dos resultados apresentados na Tabela 6.7 direta, sem a necessidade de algum
teste de comparao mltipla. Portanto, tem-se as seguintes concluses:
a) Quando se utiliza o recipiente: saco plstico pequeno (R1 ), no h diferena significativa
(p = 0, 6897) para o desenvolvimento das mudas das 2 espcies;
b) Quando se utiliza o recipiente: saco plstico grande (R2 ), h diferena significativa (p <
0, 0001) para o desenvolvimento das mudas das 2 espcies, sendo que a espcie Eucalyptus
citriodra (E1 ) a melhor;
c) Quando se utiliza o recipiente: laminado (R3 ), no h diferena significativa (p = 0, 1288)
para o desenvolvimento das mudas das 2 espcies;
Para obter os resultados apresentados na Tabela 6.7, os comandos so:
fat.esprec = aov(alturas ~ recip/espec)
summary(fat.esprec, split=list("recip:espec" = list(r1=1, r2=2, r3=3)))

6.2.2

Desdobramento da interao R E para estudar o comportamento


dos recipientes dentro de cada espcie
Tem-se que:
SQRec d. E1

) (286, 3)2
1(
= 87, 12
102, 62 + 103, 52 + 80, 22
4
12

SQRec d. E2

) (264, 9)2
1(
= 69, 50
101, 32 + 78, 32 + 85, 32
4
12

Captulo 6. Experimentos Fatoriais

96

O quadro de anlise da varincia do desdobramento apresentado na Tabela 6.7.


Tabela 6.8 Estudo dos Recipientes dentro de cada Espcie.
Causa de Variao
Espcies

S.Q.
19,08

Espec:Recip

(156,62)

g.l.
1
( 4)

Q.M.

Fcalc

Ftab

P r(> F )

19,08

14,88

4,413873

0,0012 ***

39,16

30,52

2,927744

< 0, 0001

Recip d. E1

87,12

43,56

33,96

3,554557

7, 776e 07

Recip d. E2

69,50

34,75

27,09

3,554557

3, 730e 06

Resduo
Total

23,09000000

18

198,79333333

23

1,2827778

Portanto, tem-se as seguintes concluses:


a) Os recipientes tm efeitos diferentes (p < 0, 0001) sobre o desenvolvimento das mudas de
Eucalyptus citriodora (E1 );
b) Os recipientes tm efeitos diferentes (p < 0, 0001) sobre o desenvolvimento das mudas de
Eucalyptus grandis (E2 ).
Basta, agora, aplicar o teste de Tukey para se verificar quais as mdias do fator
Recipiente diferem, dentro de cada nvel de Espcie.
Para obter os resultados apresentados na Tabela 6.7, os comandos so:
fat.recesp = aov(alturas ~ espec/recip)
summary(fat.recesp, split=list("espec:recip" = list(e1=c(1,3), e2=c(2,4))))

6.2.2.1 Recipientes dentro de E1


Assume-se que a melhor estimativa da varincia residual o QM Res da tabela
da anlise de varincia, utilizando a suposio de que a varincia residual experimental a
mesma para todos os tratamentos. As trs mdias para recipientes, em ordem decrescente,
so:
y21. =

103, 5
= 25, 875 cm
4

(R2 - saco plstico grande )

y11. =

102, 6
= 25, 650 cm
4

(R1 - saco plstico pequeno)

80, 2
= 20, 050 cm
(R3 - laminado )
4
O erro padro das mdias desses tratamentos :

QM Res
1, 2827778
syi1. =
=
= 0, 5663 cm
n
4
y31. =

Anlise e interpretao de um experimento fatorial, com 2 fatores

97

A diferena mnima significativa pelo teste de Tukey :


= qsyi1. = 3, 6093 0, 5663 = 2,04 cm

(6.10)

e as comparaes das mdias dos recipientes geram:


R2 vs R1

25, 875 25, 650

0, 225 cm

<

2, 04 cm

R2 vs R3

25, 875 20, 050

5, 825 cm

>

2, 04 cm

R1 vs R3

25, 650 20, 050

5, 6 cm

>

2, 04 cm

Concluso: Para o Eucalyptus citriodora (E1 ), os melhores recipientes foram os sacos plsticos (R1 e R2 ), que determinaram desenvolvimento de mudas significativamente maiores que o
laminado (R3 ), sem diferirem entre si.
6.2.2.2

Recipientes dentro de E2
Neste caso, as trs mdias para recipientes, em ordem decrescente, so:
y12. =

101, 3
= 25, 325cm
4

(R1 - saco plstico pequeno)

y32. =

85, 3
= 21, 325cm
4

(R3 - laminado)

78.3
= 19, 575cm
(R2 - saco plstico grande)
4
A diferena mnima significativa, pelo teste de Tukey, apresentada na Equao 6.10, e as
y22. =

R1 vs R3

25, 325 21, 325

4, 00 cm

>

2, 04 cm

comparaes das mdias dos recipientes geram: R1 vs R2

25, 325 19, 575

5, 75 cm

>

2, 04 cm

R3 vs R2 = 21, 325 19, 575 = 1, 75 cm


Concluso: Para o Eucalyptus grandis (E2 ), o melhor recipiente foi o saco plstico pequeno

<

2, 04 cm

(R1 ), que determinou desenvolvimento de mudas significativamente maior que o saco plstico
grande (R2 ) e que o laminado.

Captulo 6. Experimentos Fatoriais

98

Exerccios
1) Em experimentos com sunos, deve-se considerar como fatores de variao: raa ou graude-sangue; sexo; idade e pesos iniciais e, se possvel, filiao. usual parcelas formadas
por apenas um animal, embora dependa da quantidade de material disponvel. Um experimento foi instalado com o objetivo de estudar a utilizao do milho opaco-2 no crescimento
e engorda de sunos. Os tratamentos foram dispostos em esquema fatorial, com trs repeties, e as parcelas constitudas por dois animais. Os fatores estudados foram: Milho
(comum e opaco-2) e Soja (ausncia e presena). Na Tabela 6.9 so apresentados os ndices
de converso (kg de rao / kg de ganho de peso).
Tabela 6.9 ndices de converso alimentar (kg de rao / kg de ganho de peso).
Tratamentos

Bloco I

Bloco II

Bloco III

Total

4,07

3,80

3,86

11,73

3,91

3,77

3,46

11,14

4,90

5,31

4,73

14,94

3,79

3,50

3,46

10,75

Total

16,67

16,38

15,51

48,56

em que:
A - Milho Opaco-2, sem soja;

B - Milho Opaco-2, com soja;

C - Milho Comum, sem soja;

D - Milho Comum, com soja;

Pede-se:
a) Determine as mdias e varincias para cada tratamento;
b) Faa o grfico de caixas, comparando os tratamentos;
c) Verifique se a pressuposio de homogeneidade de varincia atendida;
d) Verifique se a pressuposio de normalidade dos resduos atendida;
e) Enuncie as hipteses e proceda anlise de varincia;
f) Caso haja significncia dos tratamentos, desdobre os graus de liberdade de tratamento
usando o esquema fatorial;
g) Construa o quadro da anlise de varincia incluindo os desdobramentos;
h) Caso a interao seja significativa, proceda a novo desdobramento, estudando o efeito
da soja junto ao milho opaco2 e comum;
i) Determine o coeficiente de variao do experimento.

Captulo 7

Experimentos em parcelas
subdivididas
7.1 Introduo
Nos experimentos fatoriais, todas as combinaes de tratamentos so distribudas nas unidades experimentais, seguindo a casualizao caracterstica de um delineamento
inteiramente casualizado, em blocos ao acaso, ou em quadrados latinos. Entretanto, outros
tipos de casualizao so possveis e uma dessas alternativas nos leva ao experimento em
parcelas subdivididas, que um tipo especial de delineamento em blocos casualizados.
H muitas variaes do experimento em parcelas subdivididas e cada variao impe certas restries. O experimento bsico envolve a designao de tratamentos de um fator
s parcelas. Estas, por sua vez, podem ser arranjadas em blocos completos casualizados ou
em quadrado latino. Deve-se designar s parcelas os tratamentos para os quais se deseja, ou
que se pode, ter uma preciso menor. Os tratamentos do segundo fator so ento designados, por sorteio, s subparcelas dentro de cada parcela. Tal disposio permite obter uma
estimativa geral de maior preciso para os efeitos dos tratamentos do segundo fator. Temse, portanto, dois resduos distintos: um correspondente s parcelas e outro s subparcelas
dentro das parcelas.
Em casos mais complexos, as subparcelas podem, tambm, ser repartidas em
subsubparcelas. Tem-se, neste caso, trs resduos distintos: Resduo (a), referente s parcelas; Resduo (b), subparcelas e Resduo (c), correspondendo s subsubparcelas.
Esse tipo de experimento largamente utilizado nas pesquisas agrcolas, industrial e biolgica, til em situaes, tais como:
a) quando os nveis de um ou mais fatores exigem grandes quantidades do material experi99

Captulo 7. Experimentos em parcelas subdivididas

100

mental (por exemplo, mtodos de preparo do solo);


b) quando informaes prvias asseguram que as diferenas entre os nveis de um dos fatores
so maiores do que s do outro fator;
c) quando se deseja maior preciso para comparaes entre nveis de um dos fatores;
d) quando existe um fator de maior importncia e outro de importncia secundria, sendo
que este includo para aumentar a extenso dos resultados;
e) nas situaes prticas onde difcil a instalao do experimento no esquema fatorial.
Os experimentos em parcelas subdivididas so teis nas seguintes condies:
a) os tratamentos associados com os nveis de um dos fatores exigem grandes pores do
material experimental. Isto comum na experimentao de campo, laboratrios, indstrias
e certas reas de sociologia. Por exemplo, um experimento de campo, um dos fatores pode
ser mtodos de preparo do solo ou aplicao de fertilizantes, ambos normalmente requerem
grandes parcelas. O outro fator pode ser cultivares, que podem ser comparadas usando
parcelas pequenas;
b) quando um fator adicional introduzido no experimento para aumentar seu objetivo.
A decomposio do nmero de graus de liberdade de um experimento em parcela
subdividida, em que as parcelas so dispostas nos principais delineamentos, apresentada
na Tabela 7.1.
Tabela 7.1 Quadro da anlise de varincia de um experimento em parcela subdividida com
a tratamentos primrios, b tratamentos secundrios e c repeties, nos delineamentos inteiramente casualizado, blocos casualizados e quadrado latino.
Inteiramente Casualizado
CV
Fator A
Resduo(a)

gl

Blocos Casualizados
CV

gl

Quadrado Latino
CV

gl

a1

Blocos

b1

Linhas

a1

a(b 1)

Fator A

a1

Colunas

a1

(a 1)(b 1)

Fator A

a1

Parcelas

ab 1

Resduo(a)

Fator B

c1

Parcelas

ab 1

Resduo(a)

AB

(a 1)(c 1)

Fator B

c1

Parcelas

a2 1

Resduo(b)

a(b 1)(c 1)

AB

(a 1)(c 1)

Fator B

c1

Resduo(b)

a(b 1)(c 1)

AB

(a 1)(c 1)

Resduo(b)

a(a 1)(c 1)

Total

abc 1

Total

abc 1

Total

(a 1)(a 2)

a2 c 1

Introduo

101

Exemplo: Suponha o caso de um experimento com trs raes (A, B, e C), em seis blocos
casualizados, cada parcela constituda por dois animais. Em uma determinada fase do ensaio, os bovinos, dentro de cada parcela, passaram a receber, por sorteio, um dos tipos de
suplementos minerais (M ou P ). Os ganhos de pesos individuais, ao final do experimento, so
apresentados na Tabela 7.2.
Tabela 7.2 Ganhos de pesos, em quilos, ao final do experimento.
Tipos de Rao
Blocos

Totais

107

89

116

101

90

96

599

II

117

101

136

110

112

89

665

III

122

98

130

104

99

92

645

IV

111

101

122

91

105

78

608

90

95

117

100

110

90

602

VI

116

90

114

94

114

93

621

Totais

663

574

735

600

630

538

3.740

As Figuras 7.1 e 7.2 mostram o comportamento de ganho de peso para os tipos de

130

130

120

120

110

+
100

Ganhos de Peso (kg)

Ganhos de Peso (kg)

raes e os tipos de suplementos.

+
110

100

90

90

80

80

Raes

Figura 7.1 Tipos de raes.

P
Suplementos minerais

Figura 7.2 Tipos de suplementos.

Os comandos para a criao do conjunto de dados usando o R so:


ganhos = scan()

Captulo 7. Experimentos em parcelas subdivididas

102

107

89 116 101

111 101 122

90 96 117 101 136 110 112 89 122 98 130 104

91 105 78

90

95 117 100 110 90 116 90 114

99 92

94 114 93

(Ganhos = data.frame(Blocos=factor(rep(1:6, each=6)), Trat=factor(rep(1:3, each=2)),


Supl=factor(rep(1:2, 2)), resp=ganhos))
attach(Ganhos)

e os comandos para a construo do grfico de caixas para Raes e Suplementos, so dados


por:
par(mai=c(1,1,.2,.2))
boxplot(ganhos ~ Trat, names=c("A", "B", "C"), las=1, col=LightYellow,
ylab="Ganhos de Peso (kg)", xlab="Raes")
points(mediast, pch="+", col=2, cex=1.5)

boxplot(ganhos ~ Supl, names=c("M", "P"), las=1, col=LightYellow,


ylab="Ganhos de Peso (kg)", xlab="Suplementos minerais")
points(mediasup, pch="+", col=2, cex=1.5)

O modelo linear para o experimento em parcelas subdivididas no delineamento


em blocos ao acaso dado por:

yijk = + i + j + ( )ij + k + ( )ik + ()ik + ( )ijk ,

i = 1, 2, . . . , a

j = 1, 2, . . . , b

k = 1, 2, . . . , c

em que:
a) yijk o valor observado no i-simo tratamento, j-simo bloco e k-sima subparcela;
b) uma constante;
c) i o efeito do i-simo tratamento (rao);
d) j o efeito do j-simo bloco;
e) ( )ij o resduo da parcela;
f) k o efeito do k-simo suplemento mineral;
g) ( )ik e ()jk so as interaes;
h) ( )ijk o resduo da subparcela;

(7.1)

Introduo

103

Considerando que as pressuposies para a realizao da anlise de varincia


foram atendidas, passa-se, ento, a construo do quadro de anlise de varincia que dado
por:
Tabela 7.3 Quadro da Anlise de Varincia.
C.V.

S.Q.

g.l.

Q.M.

Fcalc

Ftab

Blocos

SQBlocos

j1

SQBlocos
j1

QM Blocos
QM Res(a)

F;[(j1);(i1)(j1)]

Tratamentos

SQT rat

i1

SQT rat
i1

QM T rat
QM Res(a)

F;[(i1);(i1)(j1)]

Resduo(a)

SQRes(a)

(Parcelas)

SQP arcelas

ij 1

Subparcelas

SQSubparc

k1

SQSubparc
k1

QM Subparc
QM Res(b)

F;[(k1);i(j1)(k1)]

Interao(T rat Subparcelas)

SQInter

(i 1)(k 1)

SQInt
(i1)(k1)

QM Subparc
QM Int

F;[(i1)(k1);i(j1)(k1)]

Resduo(b)

SQRes(b)

i(j 1)(k 1)

SQRes(b)
i(j1)(k1)

Total

SQT otal

ijk 1

(i 1)(j 1)

em que as somas de quadrados so dadas por:

SQT otal

a
b
c

2
yijk
C

C=

a
b
c

a
1 2
y C
j k i=1 i

SQBlocos =

b
1 2
y C
i k j=1 j

SQP arcelas

SQRes(a) =
SQSubparc

yijk

i=1 j=1 k=1

i=1 j=1 k=1

SQT rat =

a
b
1 2
y C
k i=1 j=1 ij

SQP arcelas SQT rat SQBlocos


c
1 2
yk C
ij
k=1

SQT rat, Subparc =

b
c
1 2
yi C
i k j=1
k=1

SQInter

= SQT rat, Subparc SQT rat SQSubparc

SQRes(b) =

SQT otal SQP arcelas SQSubparcec SQInter

Captulo 7. Experimentos em parcelas subdivididas

104

Para facilitar o clculo das somas de quadrados, pode-se construir tabelas auxiliares, como apresentado na Tabela 7.9.

Tabela 7.4 Tabela auxiliar para clculo das somas de quadrados das parcelas.
Tipos de Rao

Blocos (2)

Totais

196

217

186

599

II

218

246

201

665

III

220

234

191

645

IV

212

213

183

608

185

217

200

602

VI

206

208

207

621

Totais

1.237 (12)

1.335 (12)

1.168 (12)

3.740

Para o clculo das somas de quadrados das Parcelas, tem-se:

SQTotal =

a
b
c

i=1 j=1 k=1

N
a
b
c

2
yijk
=

(107 + 117 + + 90 + 93)2


= 388.544,4
326

2
C = (1072 + 1172 + + 902 + 932 ) 388.544, 4 = 6.061,556
yijk

i=1 j=1 k=1

SQTrat

SQBlocos =

SQParcelas =

SQRes(a)

a
1
1 2
yi C =
(1.2372 + 1.3352 + 1.1682 ) 388.544, 4 = 1.173,722
j k i=1
26
b
1 2
1
y C =
(5992 + + 6212 ) 388.544, 4 = 582,2222
i k j=1 j
23
a
b
1 2
1
y C = (1962 + 2182 + + 2002 + 2072 ) 388.544, 4 = 2.377,556
k i=1 j=1 ij
2

= SQP arcelas SQT rat SQBlocos = 2.377, 556 1.173, 722 582, 2222 = 621,6111

Para o clculo das demais somas de quadrados, utiliza-se a Tabela 7.5.

Introduo

105

Tabela 7.5 Tabela auxiliar para clculo das somas de quadrados das Subparcelas.

Suplementos (6)

Tipos de Rao

Totais

663

735

630

2.028

574

600

538

1.712

Totais

1.237 (12)

SQSubparc =

1.335 (12)

1.168 (12)

c
1 2
yk C
ij
k=1

1
=
(2.0282 + 1.7122 ) 388.544, 4
36
= 2.773,778

SQTrat,Subparc =

b
c
1 2
yi C
i k j=1
k=1

1
=
(6632 + 5742 + + 6302 + 5382 ) 388.544, 4
32
SQTrat,Subparc = 4.057.889

SQInter = SQT rat, Subparc SQT rat SQSubparc


=

4.057, 889 1.173, 722 2.773, 778

SQInter = 110,3889

SQRes(b) = SQT otal SQP arcelas SQSubparcec SQInter


=

6.061, 556 2.377, 556 2.773, 778 110, 3889

SQRes(b) = 799,8333

Assim, o quadro da anlise de varincia para os dados da Tabela 7.2 fica:

3.740

Captulo 7. Experimentos em parcelas subdivididas

106

Tabela 7.6 Quadro da anlise de varincia do experimento em parcelas subdivididas no


delineamento em blocos ao acaso.
Causa da Variao

S.Q.

g.l.

Q.M.

Fcalc

Blocos

582, 22

116, 44

Rao

1.173, 72

586, 86

621, 61

10

62, 16

2.377, 556

17

2.773, 78

2.773, 78

52, 0192

Rao Suplementos

110, 39

55, 19

1, 0351

Resduo(b)

799, 83

15

53, 32

6.061, 556

35

Resduo(a)
(Parcelas)
Suplementos

Total

9, 441

P r(> F )

0, 004976

3, 011 10(6)

0, 3792

Os efeitos das Raes e dos Blocos so testados usando o Resduo(a).


Os efeitos dos Suplementos e da Interao so testados usando o Resduo(b).
Verifica-se da Tabela 7.6 que a interao entre os tipos de Rao e Suplementos
no foi significativa, havendo efeito dos fatores principais: Rao e Suplemento. Logo, aplicase o teste de Tukey para verificar quais os tipos de Rao que diferem entre si. No caso de
Suplementos, como s h dois nveis, no necessrio a aplicao do teste de Tukey.
Assim, aplica-se a Equao 7.2 para Rao, observando-se que o QM Res utilizado
ser o Residuo(a) da Tabela 7.6.

QM Res
r

= 3, 876777

62, 16111
12

8,8 kg

(7.2)

Construindo-se a tabela das mdias ordenadas em ordem decrescente, tem-se:


Mdias (kg)
Rao B

111,25

Rao A

103,0833

ab

Rao C

97,3333

em que letras iguais indicam mdias semelhantes.


No caso dos suplementos, basta observar que a mdia de ganho de peso dos animais que foram alimentados com o suprimento M foi de yM = 112, 7 kg e com o suprimento F
foi de yF = 95, 1 kg, mostrando que o suprimento M foi mais eficiente no ganho de peso.

Introduo

7.1.1

107

Experimentos em parcelas subdivididas no tempo


Considere o exemplo apresentado por Pimentel Gomes (1990), que consiste de um

experimento com 8 tratamentos (7 adubos verdes e milho) em blocos ao acaso, com 4 repeties, realizado em dois anos consecutivos nas mesmas parcelas. Os dados so apresentados
na Tabela 7.7.
Tabela 7.7 Produo de adubos verdes e milho (kg de matria seca verde por parcela).

Tratamentos

Bloco 1

Bloco 2

Bloco 3

Bloco 4
o

Totais

1 ano

2 ano

1 ano

2 ano

1 ano

2 ano

1 ano

2o ano

Mucuna preta

86,8

90,2

76,8

94,0

88,6

86,4

81,6

82,2

686,6

Feijo de porco

44,0

83,8

56,6

72,2

52,4

88,6

52,2

83,2

533,0

102,4

120,2

90,8

104,6

92,0

112,0

84,8

113,6

820,4

Guandu

68,4

91,0

55,2

78,8

49,0

83,4

61,2

91,2

578,2

Teph. Candida

34,0

57,2

32,4

54,0

24,4

50,8

30,0

46,2

329,0

Soja

33,0

33,6

34,8

33,2

32,0

33,4

33,6

42,6

276,2

Crot. grantiana

25,8

77,0

21,6

62,4

19,2

63,6

21,0

63,4

354,0

Milho

138,8

110,2

106,4

80,0

108,0

92,0

81,8

90,6

807,8

Totais

533,2

663,2

474,6

579,2

465,6

610,2

446,2

613,0

4.385,2

Crot. juncea

Proceder anlise considerando um experimento em parcela subdividida no delineamento em


blocos ao acaso, em que o tempo a subparcela.
Complete o quadro da anlise de varincia.
Tabela 7.8 Quadro da anlise de varincia do experimento em parcelas subdivididas no
delineamento em blocos ao acaso.
Causa da Variao

S.Q.

g.l.

Q.M.

Fcalc

P r(> F )

Blocos
Tratamentos
Resduo(a)
(Parcelas)
Anos
Anos Tratamentos

18, 82

Resduo(b)
Total

53.348, 8775

63

2, 571e 08

Captulo 7. Experimentos em parcelas subdivididas

108

As tabelas auxiliares, para o clculos das somas de quadrados de parcelas e subparcelas, so dadas por:
Tabela 7.9 Tabela auxiliar para clculo das somas de quadrados das parcelas.
Blocos

Tratamentos

II

III

Totais

IV

Mucuna preta

177,00

170,80

175,00

163,80

686,6

Feijo de porco

127,80

128,80

141,00

135,40

533,0

Crot. juncea

222,60

195,40

204,00

198,40

820,4

Guandu

159,40

134,00

132,40

152,40

578,2

Teph. Candida

91,20

86,40

75,20

76,20

329,0

Soja

66,60

68,00

65,40

76,20

276,2

Crot. grantiana

102,80

84,00

82,80

84,40

354,0

Milho

249,00

186,40

200,00

172,40

807,8

Totais

1.196,4

1.053,8

1.075,8

1.059,2

4.385,2

Para o clculo das demais somas de quadrados, utiliza-se a Tabela 7.10.


Tabela 7.10 Tabela auxiliar para clculo das somas de quadrados das Subparcelas.

Tratamentos

Anos
o

1 Ano

2o Ano

Totais

Mucuna preta

333,8

352,8

686,6

Feijo de porco

205,2

327,8

533,0

Crot. juncea

370,0

450,4

820,4

Guandu

233,8

344,4

578,2

Teph. Candida

120,8

208,2

329,0

Soja

133,4

142,8

276,2

87,6

266,4

354,0

Milho

435,0

372,8

807,8

Totais

1.919,6

2.465,6

4.385,2

Crot. grantiana

No caso da interao ser significativa, pode-se estudar o efeito dos anos em cada
tratamento, fazendo o desdobramento dos graus de liberdade da interao ou, ainda, verificar
quais os tratamentos que diferem dentro de cada ano.

Introduo

109
Tabela 7.11 Efeito dos anos em cada tratamento separadamente.

Causa da Variao

S.Q.

g.l.

53.348, 8775

63

Q.M.

Fcalc

P r(> F )

Blocos
Tratamentos
Resduo(a)
(Parcelas)
Anos d. Trat. 1
Anos d. Trat. 2
Anos d. Trat. 3
Anos d. Trat. 4
Anos d. Trat. 5
Anos d. Trat. 6
Anos d. Trat. 7
Anos d. Trat. 8
Resduo(b)
Total

Tabela 7.12 Efeito dos tratamentos em cada ano separadamente.


Causa da Variao

S.Q.

g.l.

53.348, 8775

63

Q.M.

Fcalc

P r(> F )

Blocos
Tratamentos
Resduo(a)
(Parcelas)
Tratamentos d. Ano 1
Tratamentos d. Ano 2
Resduo(b)
Total

Sendo significativos os efeitos dos tratamentos dentro dos anos 1 e 2, aplica-se o


teste de Tukey para verificar quais os tratamentos que diferem entre si.

Captulo 7. Experimentos em parcelas subdivididas

110

Sero considerados quatro casos, baseados na tabela geral:


Causa da Variao

S.Q.

g.l.

Blocos

r1

Tratamentos (A)

a1

Resduo(a)

na = (a 1)(r 1)

(Parcelas)

(ar 1)

Tratamentos (B)

b1

Interao A B

(a 1)(b 1)
nb = a(b 1)(r 1)

Resduo(b)

Q.M.

s2a

s2b

abr 1

Subparcelas

1o Caso: A comparao entre mdias de tratamentos A feita utilizando-se o desvio-padro


sa , sendo:

=q

s2a
br

em que q o valor tabelado, correspondendo a a tratamentos e na graus de liberdade.


2o Caso: A comparao entre mdias de tratamentos B feita utilizando-se o desvio-padro
sb , sendo:

=q

s2b
ar

em que q o valor tabelado, correspondendo a b tratamentos e nb graus de liberdade.


3o Caso: A comparao entre mdias de tratamentos B num mesmo nvel de A, ainda se
utiliza o desvio-padro sb , sendo:

=q

s2b
ar

em que q o valor tabelado, correspondendo a b tratamentos e nb graus de liberdade.


4o Caso: A comparao entre mdias de tratamentos A num mesmo nvel de B, um pouco
mais complexa, por envolver, simultaneamente, os desvios- padres sa e sb . Neste caso,
calcula-se s , da seguinte forma:

s =

(b 1) s2b + s2a
b

sendo que os graus de liberdade de s dado por Satterthwaite:


[ 2
]2
s + (b 1)s2b
n = ( )2a
( )2 .
(b 1)2 s2b
s2a
+
na
nb

Introduo
Portanto, o teste de Tukey fica:

111

s
= q
r

em que q o valor tabelado, correspondendo a a tratamentos e n graus de liberdade.

Captulo 8

Transformao de dados
8.1 Introduo
Aps a anlise grfica dos resduos e da aplicao de um teste para verificao
da homogeneidade de varincias, se for constatada a violao de uma ou mais suposies
para os erros, possvel amenizar o problema fazendo alguma transformao pertinente na
varivel resposta para contornar o problema, antes de optar pela aplicao da estatstica
no-paramtrica.
Uma suposio comumente violada a de varincias homocedsticas (constante) e isto ocorre pelo fato da varivel resposta seguir, em geral, uma distribuio de probabilidade em que a varincia est funcionalmente relacionada com a mdia.
Se o pesquisador conhece a relao entre a varincia das observaes e a mdia,
ele usa esta informao para selecionar a forma da transformao. Caso ele no conhea a
relao possvel estimar o tipo de transformao usando os dados.
Seja E(Y ) = a mdia de Y e suponha que o desvio padro de Y proporcional a
potncia da mdia de Y tal que:
Y .
O objetivo encontrar uma transformao de Y que gere uma varincia constante. Suponha
que a transformao uma potncia dos dados originais, isto
Y =Y
E pode ser mostrado que
Y +1 .
Caso = 1, ento a varincia dos dados transformados Y constante, mostrando que no
necessrio transformao. Algumas das transformaes mais comuns so apresentadas na
Tabela 8.1.
112

Introduo

113
Tabela 8.1 Transformaes estabilizadoras da varincia.
Relao entre Y e

=1

Y constante

1/2

1/2

3/2

-1/2

-1

Y 1/2
Y
Y 3/2
Y 2

Transformao
no necessria
Raiz quadrada
Log
Recproca da raiz quadrada
Recproca

Observe que = 0 implica na transformao logartmica.

8.1.1

Seleo emprica de
Em muitas situaes de delineamentos experimentais em que h repeties, pode-

se estimar empiricamente a partir dos dados. Dado que na i-sima combinao de trata
mentos Y
i = i , em que uma constante de proporcionalidade, pode-se aplicar

logaritmos para obter:


log Yi = log + log i

(8.1)

Portanto, um grfico de log Yi versus log i seria uma linha reta com uma inclinao . Como
no se conhece Yi e i , utilizam-se estimativas delas na equao 8.1 e usa-se o parmetro
de inclinao da equao linear ajustada como uma estimativa de . Em geral, utiliza-se o
desvio padro si e a mdia yi do i-simo tratamento para estimar Yi e i .

8.1.2

Mtodo analtico para selecionar uma transformao em Y


Box & Cox (1964) mostraram como o parmetro de transformao em Y = Y

pode ser estimado simultaneamente com outros parmetros do modelo (mdia geral e efeitos
de tratamentos) usando o mtodo de mxima verossimilhana.
O objetivo da transformao de Box e Cox, quando aplicada a um conjunto de
valores observados, produzir aproximadamente a normalidade, a constncia de varincia e
tambm a linearidade.
O procedimento consiste em realizar, para vrios valores de , uma anlise de
varincia padro sobre:

y 1

, para = 0

z=

log y, para = 0

Captulo 8. Transformao de dados

114

sendo uma constante conhecida. A estimativa de mxima verossimilhana de o valor


para o qual a soma de quadrado do resduo, SQRes(), mnima. Este valor de encontrado
atravs do grfico de SQRes() versus , sendo que o valor que minimiza a SQRes().
Um intervalo de confiana 100(1 )% para pode ser encontrado calculando-se:
(
IC() = SQRes() 1

t2/2;

em que o nmero de graus de liberdade. Se o intervalo de confiana incluir o valor = 1,


isto quer dizer que no necessrio transformar os dados.
Exemplo: Kronka & Banzatto apresentam os dados de um experimento que visa o controle
do pulgo (Aphis gossypii Glover) em cultura de pepino em que se utilizou um delineamento
inteiramente ao acaso com cinco tratamentos e seis repeties por tratamento. Os dados so
apresentados na Tabela 8.2.

Tabela 8.2 Contagem do nmero de pulges encontrados.


Tratamentos
A
B
C
D
E

2.370
1.282
562
173
193

1.687
1.527
321
127
71

Repeties
3
4
2.592
871
636
132
82

2.283
1.025
317
150
62

2.910
825
485
129
96

3.020
920
842
227
44

sendo que:

A - Testemunha;

B - Azinfs etlico;

C - Supracid 40CE dose 1;

D - Supracid 40CE dose 2;

E - Diazinon 60CE.

A Figura 8.1 apresenta o nmero de pulges considerando os tratamentos.

Introduo

115

3000

2500

Nmero de pulges

2000

1500

1000

500

0
Testemunha

Azinfs etlico

Supracid 40CE dose 2


Tratamentos

Figura 8.1 Nmero de pulges encontrados considerando-se os tratamentos.


O p valor do teste de Bartlett para verificao da homogeneidade de varincias
foi 5, 942 106 , o que mostra que as varincias no so homogneas, tendo sido violada uma
das pressuposies para realizao da anlise de varincia. Portanto, deve-se proceder a uma
transformao dos dados para tentar estabilizar as varincias.
Como so dados de contagem, poder-se-ia pensar em utilizar diretamente a trans
formao Y para tentar estabilizar as varincias, porm, deve-se aplicar uma das duas formas de transformao de dados discutidas nas sees 8.1.1 e 8.1.2.
Os logaritmos da mdia e da varincia, para cada tratamento, so dados por:
Tabela 8.3 Logaritmos das mdias e varincias dos tratamentos.
Tratamentos
A
B
C
D
E

log(
yi )
7,81
6,98
6,27
5,05
4,51

log(Vi )
12,36
11,23
10,60
7,31
7,93

Ajustando-se o modelo linear, dado pela equao 8.1, obtm:


log Yi = 0, 44 + 1, 54 log i .
Logo, o valor de ser:
= 1
= 1 1, 54
= 0, 54,

indicando que a transformao indicada a Y . O ajuste do modelo aos dados da Tabela 8.3
apresentado na Figura 8.2.

Captulo 8. Transformao de dados

116

12

Log(varincias)

11

10

4.5

5.0

5.5

6.0

6.5

7.0

7.5

Log(mdias)

Figura 8.2 Relao linear dos dados da Tabela 8.3.

Os comandos do Rso:
pulgao = scan()
2370 1687 2592 2283 2910 3020 1282 1527 871 1025 825 920 562 321 636
317

485

842

173

127

132

150

129 227

193

71

82

62

96

44

Exp = data.frame(Trat = factor(rep(1:5, each=6), labels=LETTERS[1:5]), resp = pulgao)


attach(Exp)
(mediastrat = tapply(pulgao, Trat, mean))
(varitrat = tapply(pulgao, Trat, var))
bartlett.test(resp ~ Trat)
# Usando a relao linear:
data.frame(log(mediastrat), log(varitrat))
par(mai=c(1,1,.2,.2))
plot(log(varitrat)~log(mediastrat), xlab=Log(mdias),
ylab=Log(varincias), las=1, pch=19, bty=l)
reg = lm(log(varitrat) ~ log(mediastrat))

anova(reg)

lambda

names(reg)

abline(reg, col=red, lwd=2)


reg$coef

lambda = 1 - reg$coef[2]

Cabe ao leitor a transformao dos dados, a verificao das pressuposies dos


dados transformados e a anlise de varincia.

Captulo 9

Polinmios Ortogonais
9.1 Introduo
A varivel analisada na anlise de varincia nos delineamentos discutidos anteriormente pode ser qualitativa ou quantitativa. Uma varivel quantitativa aquela cujos nveis
podem ser associados com pontos em uma escala numrica, tal como temperatura, presso
ou tempo. Variveis qualitativas, por outro lado, apresentam valores que no podem ser
colocados em ordem de magnitude.
Num experimento de alimentao de sunos em crescimento realizado no delineamento inteiramente casualizado foram utilizadas quatro tipos de rao: A, B, C e D. Os
animais da raa Duroc-Jersey, com idade aproximada de 3 meses.
Nas raes, a farinha de carne era substituda total ou parcialmente pelo farelo
de soja torrada, de tal modo que a porcentagem desta ltima nas raes eram as seguintes:
A - zero de soja (18% de farinha de carne);
B - 10% de soja (12% de farinha de carne);
C - 20% de soja (6% de farinha de carne);
D - 30% de soja (zero de farinha de carne);
O experimento foi conduzido por 98 dias, procedendo-se s pesagens regulares
dos animais a cada 14 dias, sempre pela manh e com animais em jejum por mais de 15
horas. Na Tabela 9.1 so apresentados os ndices de converso observados durante o perodo
de 98 dias.
117

Captulo 9. Polinmios Ortogonais

118

Tabela 9.1 ndices de converso (kg de rao / kg de ganho de peso


Rao A

Rao B

Rao C

Rao D

3,66

3,15

3,14

3,17

3,38

3,33

3,47

3,04

2,93

3,42

3,11

2,97

3,71

3,28

3,38

3,13

3,67

3,16

3,15

2,75

3,39

3,47

3,00

2,62

3,22

3,35

3,06

3,37

3,34

2,99

3,01

3,05

27,3

26,15

25,32

24,10

A entrada de dados no R pode ser da seguinte forma:


indices = c(3.66,3.15,3.14,3.17,3.38,3.33,3.47,3.04,2.93,3.42,3.11,2.97,3.71,3.28,3.38,3.13,
3.67,3.16,3.15,2.75,3.39,3.47,3.00,2.623.22,3.35,3.06,3.37,3.34,2.99,3.01,3.05)
(Indices = data.frame(Raes=factor(rep(1:4,8)), P_Soja=rep(c(0,10,20,30),4), resp=indices))
attach(Indices)

A anlise de varincia para os dados apresentada na Tabela 9.2


Tabela 9.2 Anlise de varincia para ndices de converso.
CV

gl

SQ

QM

Fcalc

Pr(>F)

Raes

0,68321

0,22774

5,025

0, 0065

28

1,26899

0,04532

Resduos

O comando R para a construo da tabela da anlise de varincia :


anava.reg = aov(indices ~ Raes)
anova(anava.reg)

Como o efeito de Raes foi significativo e, como os nveis das raes so quantitativos, deve-se decompor os graus de liberdade das Raes em regresso linear, quadrtica e
cbica. Em situaes em que os nveis da varivel so igualmente espaados, esta decomposio pode ser feita de modo simples pelo mtodo dos polinmios ortogonais, com o auxlio de

Introduo

119

coeficientes dados em tabelas, como por exemplo no livro Design and Analysis of Experiments,
pg. 623, de Douglas Montgomery.
Constri-se uma tabela em que constam os totais dos tratamentos (yi ) e os coeficientes (ci ) a serem usados para os componentes de 1o grau (c1i ), 2o grau (c2i ) e 3o grau
(c3i ):

Nveis dos

Totais de

Coeficientes dos contrastes ortogonais (ci )

Tratamentos

Tratamentos (yi )

Linear

Quadrtico

Cbico

27,30

-3

-1

10

26,15

-1

-1

20

25,32

-1

-3

30

24,10
a

K=
c2i

20

20

10
3

i=1

Assim, pode-se construir os contrastes para cada regresso polinomial e obter


suas respectivas somas de quadrados, da seguinte maneira:

Yb

ci yi

i=1

YbL

= 3 (27, 30) 1 (26, 15) + 1 (25, 32) + 3 (24, 1) = -10,43

YbQ

= 1 (27, 30) 1 (26, 15) 1 (25, 32) + 1 (24, 1) = -0,07

YbC

= 1 (27, 30) + 3 (26, 15) 3 (25, 32) + 1 (24, 1) = -0,71

As somas de quadrados dos contrastes definida por: SQYbreg =

2
Ybreg
.
nK

Assim, tem-se:

SQYbL =

(10, 43)2
= 0,679906
8 20

SQYbQ =

(0, 07)
= 0,000153
84

A decomposio apresentada na Tabela9.3

SQYbC =

(0, 71)
= 0,003151
8 20

Captulo 9. Polinmios Ortogonais

120

Tabela 9.3 Decomposio dos graus de liberdade de tratamentos.


CV

gl

SQ

QM

Fcalc

Pr(>F)

0, 0065

Linear

0,679906

0,679906

Quadrtica

0,000153

0,000153

0, 003ns

0, 954ns

Cbica

0,003151

0,003151

0, 069ns

0, 794ns

Raes

(3)

(0,68321)

0,22774

5,025

0, 0065

Resduos

28

1,26899

0,04532

Total

31

1,952197

15, 002

Tal decomposio obtida no R com os seguintes comandos:


(anava.reg = aov(indices ~ I(P_Soja) + I(P_Soja^2) + I(P_Soja^3)))
summary(anava.reg)

Da Tabela 9.3 nota-se que apenas o modelo linear foi significativo. Assim, deve-se
determinar os coeficientes do modelo:
Y = 0 + 1 P1 (x) +
em que:
ou seja, a mdia geral dos dados.
b
YL
n KL

= y..

e Pu (x) a u-sima ordem do polinmio ortogonal, que implica que se h a nveis de x, tem-se
a

Pu (xj )Ps (xj ) = 0, para u = s.


i=1

Os primeiros cinco polinmios ortogonais sao:


P0 (x) = 1
[
P1 (x) =

xx

[(
P2 (x) =

2
[(

P3 (x) =

3
[(

P4 (x) =

xx

d
xx

d
xx

)2

)3

)4

a2 1
12
xx

d
xx

)]

)(

3a2 7
20

)2 (

)]

3a2 13
14

3(a2 1)(a2 9)
+
560

sendo x
a mdia dos nveis quantitativos e d a distancia entre os nveis de x.

Introduo

121

Como 0 = y = 3, 214688, 1 = 2, tem-se


y = 0 + 1 P1 (x)
[
]
YbL
xx

y = y +
1
n KL
d
y = 3, 2146 +

10, 43
(x 15)
2
8 20
10

Assim, o modelo de regresso linear ajustado aos dados :


y = 3, 41 0, 013 x
que explica, aproximadamente, 35% da variabilidade do ndice de converso. O modelo ajustado apresentado na Figura 9.1.
O ajuste do modelo final pode ser obtido no R com:
(anava.reg = aov(indices~I(P_Soja)))
summary(anava.reg)
(anavareg = lm(indices~I(P_Soja)))
summary(anavareg)

3.6

ndice de Converso

3.4

3.2

3.0

2.8

2.6
0

10

20

30

Percentual de Soja

Figura 9.1 Modelo de regresso linear ajustado aos dados.

Captulo 9. Polinmios Ortogonais

122

Exerccios
1) Num experimento estudou-se a adio de triguilho1 a uma dieta bsica de milho e farelo
de soja na alimentao de sunos, mestios (Landrace x Large White), com peso inicial de
10, 5 kg durante um perodo experimental de 40 dias, mantidos em gaiolas metlicas de
1, 90 0, 74 m. O delineamento experimental foi o inteiramente casualizado com 5 tratamentos e 8 repeties e a parcela experimental representada por 4 animais (dois machos
castrados e duas fmeas). Os tratamentos consistiram na incluso de 0; 7,5; 15,0; 22,5; e
30% de triguilho em dietas base de milho e soja.
Os ganhos de peso mdio dirio em gramas (mdia dos 4 animais na parcela) foram:
Tratamentos

Repeties

Total

% de triguilho

0,0

340

320

310

350

320

340

330

340

2.650

7,5

360

350

350

360

370

380

340

350

2.860

15,0

370

370

380

390

360

370

360

380

2.980

22,5

380

390

380

390

360

360

360

390

3.010

30,0

400

390

410

420

380

390

410

420

3.220

a) Determine as mdias e varincias para cada tratamento;


b) Faa o grfico de caixas, comparando os tratamentos;
c) Verifique se a pressuposio de homogeneidade de varincia atendida;
d) Verifique se a pressuposio de normalidade dos resduos atendida;
e) Construa o quadro da anlise de varincia;
f) Calcular as somas de quadrados para o efeito linear, quadrtico e cbico;
g) Construa a tabela da anlise de varincia com desdobramento dos graus de liberdade
de tratamentos por polinmios ortogonais;
h) Tirar as concluses prticas possveis para este experimento;
i) Calcular as mdias e os erros padres das mdias dos tratamentos e o coeficiente de
variao do experimento.

1 Denomina-se

de TRIGUILHO os gros de trigo pouco desenvolvidos, mal granados ou chochos, obtidos aps o

processamento de limpeza e industrializao de lotes cujo peso especfico menor que o mnimo exigido na moagem
ou da classificao do trigo e por isso so considerados subprodutos do mesmo.

Teste de aditividade de Tukey

123

9.2 Teste de aditividade de Tukey


Como citado, um dos pressupostos para a realizao da anlise de varincia
que os efeitos principais do modelos so aditivos. Para verificao da aditividade dos efeitos
aplicado o teste de aditividade de Tukey.

9.2.1

Desenvolvimento do teste estatstico


Como notado na seo 4.2, a anlise de varincia foi construda sem testar a

interao entre blocos e tratamento. No modelo considerado, para realizar o teste para a
aditividade do efeitos, basta acrescentar o termo da interao entre os efeitos que poderia ser
dado por:
()ij = Di j
e, portanto, o modelo seria:
{
yij = + i + j + Di j + ij ,

i = 1, 2, . . . , a

(9.1)

j = 1, 2, . . . , b

sendo que cada um dos termos tem o significado usual, definido na seo 4.2.

Portanto, a soma de quadrados da interao


D2 i2 j2 precisa ser obtida.
i

Assumindo que os outros parmetros sejam conhecidos, o estimador de mnimos quadrados


para D :

=
D

i2

i j yij

j2

(9.2)

O estimador usual para i (


yi y ) e que de j (
yj y ). Substituindo os parmetros em
pelos estimadores, obtm-se:
D

(
yi y )(
yj y )yij
i
j
=

D
(
yi y )2
(
yj y )2
i

(9.3)

Logo, a soma de quadrados da interao

D2 i2 j2 :

(
yi y )(
yj y )yij
SQAB =

(
yi y )2
(
yj y )2
i

(9.4)

Observe que a soma de quadrados calculada em (4.8) reflete somente a variabilidade dos erros sem a interao. Se a interao existe, a SQRes reflete no somente a variao

Captulo 9. Polinmios Ortogonais

124

aleatria do erro, mas tambm refletir os efeitos da interao. Assim, a soma de quadrados
do erro puro pode ser obtida por subtrao:
SQEP = SQRes SQAB
em que a SQRes definida por (4.8) e SQAB por (9.5).
Pode-se mostrar que se D = 0, ou seja, se no existe interao, SQEP e SQAB so
independentemente distribudas, e a estatstica de teste dada por:
Fcalc =

SQAB
SQEP

1
ab a b

distribuda como F (1, ab a b). Note que um grau de liberdade associado com SQAB e
(a 1)(b 1) = ab a b graus de liberdade so associados com SQEP .
Portanto, para testar:
H0 : D

= 0

no existe interao

H0 : D

= 0

existe interao

usa-se a estatstica de teste Fc alc. A regra de deciso apropriada para controlar o erro Tipo I
:
Se Fcalc

F (1 ; 1, ab a b)

aceita-se H0

Se Fcalc

> F (1 ; 1, ab a b)

rejeita-se H0

Exemplo: Para aplicao do teste de aditividade ao exemplo apresentado na Tabela 4.3,


procede-se da seguinte forma:

(
yi y )(
yj y )yij
i

= (6, 50 10, 12)(10, 125 10, 12)(6, 4) +

+ (11, 18 10, 12)(10, 225)(10, 1) = 0, 2865

(
yi y )2

87, 560
SQT rat
=
= 17, 512
b
5

0, 122
SQBlocos
=
= 0, 0305
a
4

(
yj y )2
j

Portanto, a soma de quadrados da interao :


SQAB =

(0, 2865)2
= 0, 1536787
17, 512 0, 0305

Teste de aditividade de Tukey

125

A soma de quadrados dos resduos, conforme a Tabela 4.3 SQRes = 5, 83. Logo, a soma de
quadrados do erro puro :
SQEP

SQEP

= SQRes SQAB
=

5, 83 0, 1536787

5, 676321305

e, aplicando-se a estatstica de teste, tem-se:


Fcalc

Fcalc

SQAB
SQEP

1
ab a b

0, 1536787 5, 676321305

1
20 4 5

0, 2978

Como o Fcalc menor que o valor tabelado, dado por F (0, 95; 1, 11) = 4, 84, aceita-se H0 , logo os
efeitos principais so aditivos.

Captulo 9. Polinmios Ortogonais

126

9.3 Tabela de Hartley

Tabela 9.4 Tabela para o Fmax .


Nmero de Tratamentos

10

11

12

39,0

87,5

142

202

266

333

403

475

550

626

704

15,4

27,8

39,2

50,7

62,0

72,9

83,5

93,9

104

114

124

9,6

15,5

20,6

25,2

29,5

33,6

37,5

41,1

44,6

48,0

51,4

7,2

10,8

13,7

16,3

18,7

20,8

22,9

24,7

26,5

28,2

29,9

5,82

8,38

10,4

12,1

13,7

15,0

16,3

17,5

18,6

19,7

20,7

4,99

6,94

8,44

9,70

10,8

11,8

12,7

13,5

14,3

15,1

15,8

4,43

6,00

7,18

8,12

9,03

9,78

10,5

11,1

11,7

12,2

12,7

4,03

5,34

6,31

7,11

7,80

8,41

8,95

9,45

9,91

10,3

10,7

10

3,72

4,85

5,67

6,34

6,92

7,42

7,87

8,28

8,66

9,01

9,34

12

3,28

4,16

4,75

5,30

5,72

6,09

6,42

6,72

7,00

7,25

7,43

15

2,86

3,54

4,01

4,37

4,68

4,95

5,19

5,40

5,59

5,77

5,95

20

2,46

2,95

3,29

3,54

3,76

3,94

4,10

4,24

4,37

4,49

4,59

30

2,07

2,40

2,61

2,78

2,91

3,02

3,12

3,21

3,29

3,36

3,39

60

1,67

1,85

1,96

2,04

2,11

2,17

2,22

2,26

2,30

2,33

2,36

1,00

1,00

1,00

1,00

1,00

1,00

1,00

1,00

1,00

1,00

1,00

- Graus de Liberdade

Referncias Bibliogrficas
Banzatto, D.A.; Kronka, S.N. Experimentao Agrcola. 3a ed., Funep, Jaboticabal, 1995.
Gomes, F.P. Curso de Estatstica Experimental. 13a ed. ESALQ, 1990.
Kalil, E.B.; Princpios de Tcnica Experimental com Animais. Material apostilado do curso
de ps-graduao de nutrio animal e pastagens da ESALQ. Piracicaba, 1974.
Montgomery, D.C. Design and Analysis of Experiments. 3a Editora Wiley & Sons, 1991.
Neter, J.; Wasserman, W.; Kutner, M.H. Applied Linear Statistical Models. 2a , Richard D.
Irwin, Inc., 1985.
Shapiro, S.S; Wilk, M.B An Analysis of Variance Test for Normality (Complete Samples).
Biometrika, vol. 52, no 3/4, dec. 1965.
Silva, N. N. Amostragem Probabilstica. 2a ed., Editora da Universidade de So Paulo, 2004,
120p.
Steel, R.G.; Torrie, J.H. Principles and Procedures of Statistics. Editora McGraw-Hill, 1980.
Vieira, S. Estatstica Experimental. 2a Editora Atlas, 1999.
Winer, B.J. Statistical Principles in Experimental Design. 2a ed., Editaora McGraw-Hill,
1971.

127

Referncias Bibliogrficas
D.F. Andrade and P.J. Ogliari. Estatstica para as cincias agrrias e biolgicas com noes de
experimentao. Editora da UFSC, Florianpolis, 2007.
D.A. Banzatto and S.N. Kronka. Experimentao Agrcola. Ed. Funep, Jaboticabal, 3a edition,
1995.
A. Conagin, V. Nagai, and L. A. Ambrsio. Princpios de tcnica experimental e anlise estatstica de experimentos. Material utilizado nos vrios cursos ministrados no Instituto
Agronmico de Campinas, 2007.
F.P Gomes. Curso de Estatstica Experimental. Ed. ESALQ, Piracicaba, 13a edition, 1990.
S.S Shapiro and M.B. Wilk. An analysis of variance test for normality (complete samples).
Biometrika, 52(3-4):591611, Dec 1965.

128

Você também pode gostar