Você está na página 1de 129

SUMÁRIO

1 Conceitos Preliminares Utilizados na Estatı́stica Experimental 3


1.1 Estimadores das variâncias e covariância entre dois contrastes . . 5
1.2 O Teste F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 O Teste t-Student . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 O Teste de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 O Teste de Duncan . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 O Teste de Scheffé . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Experimentos inteiramente casualizados com um fator fixo 13


2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Um possı́vel desenho desse tipo de ensaio no campo, com 5 trata-
mentos e 5 repetições. . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Organização dos dados . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4 O Modelo Matemático e Suposições . . . . . . . . . . . . . . . . . 15
2.5 Estimativas dos parâmetros do modelo . . . . . . . . . . . . . . . 17
2.6 Decomposição da variabilidade total . . . . . . . . . . . . . . . . 19
2.7 Distribuições de probabilidade dos estimadores e das somas dos
quadrados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.8 Valores esperados das somas dos quadrados e dos quadrados médios 25
2.9 Análises estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.10 Comparações Múltiplas . . . . . . . . . . . . . . . . . . . . . . . 29
2.11 Desdobramento da análise . . . . . . . . . . . . . . . . . . . . . . 30
2.12 Comparações Múltiplas - Teste de Tukey . . . . . . . . . . . . . . 37
2.13 Comprovação da idoneidade do modelo . . . . . . . . . . . . . . . 39
2.13.1 Obtenção dos resı́duos . . . . . . . . . . . . . . . . . . . . 39
2.13.2 Análise dos resı́duos . . . . . . . . . . . . . . . . . . . . . 42
2.13.3 Transformaçõs nos dados . . . . . . . . . . . . . . . . . . 52
2.14 Experimento inteiramente casualizado com nı́veis quantitativos
do fator tratamento. . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.15 Experimento inteiramente casualizado com nı́veis quantitativos
do fator tratamento. . . . . . . . . . . . . . . . . . . . . . . . . . 62

1
2

3 Experimentos em blocos completos casualizados 71


3.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.2 Um possı́vel desenho desse tipo de ensaio no campo, com I=5
tratamentos e J=4 blocos. . . . . . . . . . . . . . . . . . . . . . . 72
3.3 Organização dos dados numa tabela . . . . . . . . . . . . . . . . 72
3.4 O modelo matemático e suposições . . . . . . . . . . . . . . . . . 73
3.5 Estimativas dos parâmetros . . . . . . . . . . . . . . . . . . . . . 74
3.6 Decomposição da variabilidade total . . . . . . . . . . . . . . . . 75
3.7 Distribuição de probabilidade dos estimadores e das somas dos
quadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.8 Valores esperados das somas dos quadrados e dos quadrados médios 77
3.9 Análises estatı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.10 Teste de comparações múltiplas - Tukey . . . . . . . . . . . . . . 79
3.11 Um exemplo de aplicação . . . . . . . . . . . . . . . . . . . . . . 79

4 Experimentos em quadrados latinos 87


4.1 Exemplo de um possı́vel desenho de um quadrado latino 5 × 5 no
campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.2 Organização dos dados de um experimento em quadrado latino
com 5 tratamentos . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.3 O modelo matemático e suposições . . . . . . . . . . . . . . . . . 89
4.4 Estimativas dos parâmetros . . . . . . . . . . . . . . . . . . . . . 90
4.5 A Decomposição da variabilidade total . . . . . . . . . . . . . . . 90
4.6 Teste de comparações múltiplas - Tukey . . . . . . . . . . . . . . 91
4.7 Um exemplo de aplicação . . . . . . . . . . . . . . . . . . . . . . 92
4.7.1 As estimativas dos parâmetros . . . . . . . . . . . . . . . 93
4.7.2 Comparações das médias das variedades duas a duas . . . 97

5 Experimentos em parcelas subdivididas 99


5.1 Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.2 Possı́veis desenhos desse tipo de experimento no campo, com 3
tratamentos, 4 subtratamentos e 3 repetições . . . . . . . . . . . 100
5.3 O modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . 103
5.4 Estimação dos parâmetros do modelo . . . . . . . . . . . . . . . . 104
5.5 A decomposição da variabilidade total . . . . . . . . . . . . . . . 105
5.6 As esperanças dos quadrados médios . . . . . . . . . . . . . . . . 106
5.7 Testes de comparações múltiplas - Tukey . . . . . . . . . . . . . . 109
5.8 Um exemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . . 111
5.9 Comparações múltiplas - Teste de Tukey . . . . . . . . . . . . . . 115
5.10 Desdobramento dos graus de liberdade e das somas dos quadrados 117
Capı́tulo 1

Conceitos Preliminares
Utilizados na Estatı́stica
Experimental

• Princı́pios Básicos

– Repetição
– Casualização
– Controle local

• Unidade experimental ou parcela

– Um indivı́duo ou um grupo de indivı́duos



Área útil
– Área fı́sica
Bordaduras
• População e amostras, estimadores e estimativas

– Médias populacionais: µ1 , µ2 , · · · , µi , · · · µI (são parâmetros)


– Médias amostrais: m1 , m2 , · · · , mi , · · · , mI (são estimadores dos parâmetros)
– Observações:

y11 , y12 , · · · , y1j , · · · , y1r1 (uma a.a. de r1 indivı́duos da população 1)


y21 , y22 , · · · , y2j , · · · , y2r2 (uma a.a. de r2 indivı́duos da população 2)
..
.
yI1 , yI2 , · · · , yIj , · · · , yInI (uma a.a. de rI indivı́duos da população I)

– Organização das observações (amostras):

3
4

Tabela 1.1: Amostras de tamanho ri , (i = 1, ..., I), de I populações

Populações Repetições Totais Médias


Pi 1 2 ··· j ··· ri yi. ȳi = yri.i = mi
P1 y11 y12 · · · y1j ··· y1r1 y1. ȳ1. = yr1. 1
= m1
P2 y21 y22 · · · y2j ··· y2r2 y2. ȳ2. = yr2. 2
= m2
.. .. .. .. .. .. ..
. . . . . . .
Pi yi1 yi2 · · · yij ··· yiri yi. ȳi. = yri.i = mi
.. .. .. .. .. .. ..
. . . . . . .
PI yI1 yI2 · · · yIj ··· yIrI yI. ȳI. = yrI. I
= mI
Geral - - - - - - y.. ȳ..

• Estimadores de µi :
ri
1 X
mi = yij
ri j=1

• Contrastes de médias:
I
X I
X
Ψh = c1 µ1 + c2 µ2 + · · · + cI µI = ci µi , com ci = 0
i=1 i=1

Exemplo 1: Consideremos as estimativas das médias de produção de 4 varie-


dades de cana-de-açúcar:
CB41 − 76 : m1 = 123, 8ton/ha
CB56 − 43 : m2 = 105, 4ton/ha
CB52 − 46 : m3 = 100, 7ton/ha
Co419 : m4 = 98, 4ton/ha

• Contraste de interesse: Ψ1 = 31 (µ1 + µ2 + µ3 ) − µ4

• Estimador do comtraste: Ψ̂1 = 13 (m1 + m2 + m3 ) − m4

• Estimativa do contraste: ψ̂1 = 13 (123, 8 + 105, 4 + 100, 7) − 98, 4 = 11, 57.

Em Estatı́stica Experimental, quando queremos colocar à prova uma hipótese


de interesse H0 contra a hipótese alternativa H1 , em geral, formulamos H0
em termos de um contraste das médias das populações envolvidas no estudo.
Por exemplo, o contraste Ψ1 corresponde a hipótese H0 : µ1 +µ32 +µ3 = µ4 a
qual é equivalente a H0 : µ1 + µ2 + µ3 − 3µ4 = 0 e a hipótese alternativa
seria H1 : µ1 +µ32 +µ3 6= µ4 ou H1 : µ1 + µ2 + µ3 − 3µ4 6= 0 ou, simplesmente,
H0 : Ψ1 = 0 contra H1 : Ψ1 6= 0. Neste caso, estamos interessados em testar se
a média de produção das variedades CB ′ s, juntas, é igual à média de produção
da variedade Co419.
5

1.1 Estimadores das variâncias e covariância en-


tre dois contrastes

Consideremos os contrastes de médias:

Ψ1 = a1 µ1 + a2 µ2 + · · · + aI µI e Ψ2 = b1 µ1 + b2 µ2 + · · · + bI µI

e seus respectivos estimadores:

Ψ̂1 = a1 m1 + a2 m2 + · · · + aI mI e Ψ̂2 = b1 m1 + b2 m2 + · · · + bI mI .

Considerando-se que mi e mi′ , i = 6 i′ , são médias de amostras aleatórias de


populações independentes, então, as variâncias e covariância dos estimadores
dos contrastes, são dadas por:

σ2 σ2 σ2 P
I
σ2
• V ar(Ψ̂1 ) = a21 r11 + a22 r22 + · · · + a2I rII = a2i rii ,
i=1

σ2 σ2 σ2 P σ2
• V ar(Ψ̂2 ) = b21 r11 + b22 r22 + · · · + b2I rII = b2i rii ,

σ2 σ2 σ2 P σ2
• Cov(Ψ̂1 , Ψ̂2 ) = a1 b1 r11 + a2 b2 r22 + · · · + aI bI rII = ai bi rii .

Admitindo, como em geral ocorre nos experimentos, que

r1 = r2 = · · · = rI = J e σ12 = σ22 = · · · = σI2 = σ 2 ,

então teremos:
2
σ2
P
• V ar(Ψ̂1 ) = (a21 + a22 + · · · + a2I ) σJ = J a2i ,
2
σ2
P
• V ar(Ψ̂2 ) = (b21 + b22 + · · · + b2I ) σJ = J b2i ,
2
σ2
P
• Cov(Ψ̂1 , Ψ̂2 ) = (a1 b1 + a2 b2 + · · · + aI bI ) σJ = J ai bi .

E, os estimadores das variâncias e covariância dos estimadores dos contrastes


ficam,
2
s2
P
• Vd
ar(Ψ̂1 ) = (a21 + a22 + · · · + a2I ) sJ = J a2i ,
2
s2
P
• Vd
ar(Ψ̂2 ) = (b21 + b22 + · · · + b2I ) sJ = J b2i ,

d Ψ̂1 , Ψ̂2 ) = (a1 b1 + a2 b2 + · · · + aI bI ) s2 = s2


P
• Cov( J J ai bi ,

onde s2 é um estimador apropriado de σ 2 , a variância do erro experimental.

OBS.: Se (a1 b1 + a2 b2 + · · · + aI bI ) = 0, diremos que os contrastes Ψ1 e Ψ2 são


ortogonais entre si.
6

Exemplo 2: Num experimento com 5 tratamentos repetidos 6 vezes foram obti-


das as seguintes estimativas das médias de % de açúcar provável, para os
tratamentos, bem como, a estimativa s2 , de σ 2 e o número de graus de
liberdade dos resı́duos:

m1 = 14, 85
m2 = 14, 68
m3 = 14, 35 s2 = QM Res = 0, 8312
m4 = 13, 74 ν = 25 → g.l. de resı́duo.
m5 = 13, 20

Sejam os estimadores dos contrastes:


• Ψ̂1 = 2m1 + 2m2 + 2m3 − 3m4 − 3m5
• Ψ̂2 = 2m1 − m2 − m3
Então, as estimativas dos contrastes e respectivas estimativas das variâncias e
covariância das estimativas dos contrastes, são:
• ψ̂1 = 2(14, 85) + 2(14, 68) + 2(14, 35) − 3(13, 74) − 3(13, 20) = 6, 94,

• ψ̂2 = 2(14, 85) − 1(14, 68) − 1(14, 35) = 0, 67,


 
• Vdar(ψ̂1 ) = 22 + 22 + 22 + (−3)2 + (−3)2 0,8312 6 = 4, 156,
 2 
• Vdar(ψ̂2 ) = 2 + (−1)2 + (−1)2 0,8312 6 = 0, 8312,
d ψ̂1 , ψ̂2 ) = [4 − 2 − 2 + 0 + 0] 0,8312 = 0.
• Cov( 6

Em particular, a variância do estimador de um contraste entre duas médias,


é dada por:
   
1 1 2 d 1 1
V ar(Ψ̂h ) = + σ e o seu estimador é V ar(Ψ̂h ) = + s2 .
ri ri′ ri ri′

Além disso, se ri = ri′ = J, como em geral ocorre nos experimentos, então o


estimador da variância do estimador de um contraste entre duas médias, será
dada por:
2s2
Vdar(Ψ̂h ) = .
J

1.2 O Teste F
• Seja s21 a variância amostral obtida de n1 observações de uma população
normal,
• Seja s22 a variância amostral obtida de n2 observações de uma população
normal,
7

• Suponha que as duas amostras sejam independentes, então

s21
F = ,
s22

tem distribuição F de Snedecor e Cochran com (n1 − 1) e (n2 − 1) graus


de liberdade.

Quando aplicamos o teste F estamos contrastando as hipóteses

H0 : σ12 = σ22 vs H1 : σ12 > σ22 .

Exemplo 3: Suponhamos

s21 = 13, 62 com 6 g.l.


s22 = 6, 47 com 12 g.l.

Assim sendo, teremos


13, 62
F = = 2, 10.
6, 47
Na tabela da distribuição F , temos:

F[6; 12; 5%] = 3, 00

Visto que F calculado é menor que F da tabela, então não rejeitamos


H0 : σ12 = σ22 , ao nı́vel de 5% de significância.
OBS.1: Sempre que aplicando o teste F estamos admitindo que s21 > s22 .
OBS.2: O emprego mais comum do teste F é na Análise da Variância.

1.3 O Teste t-Student

O teste t-Student pode ser empregado para comparar médias de populações


normais.
Recomenda-se, para aplicação desse teste, que os contrastes entre as médias
dos tratamentos considerados no experiemnto sejam ortogonais entre si e esta-
belecidos no planejamento.
Pode se fazer no máximo tantas comparações quantos forem o número de
g.l. dos tratamentos.
Obs.: Na análise da variância os contrastes ortogonais têm um papel im-
portantı́ssimo.
Para testar a hipótese:

H0 : Ψ = 0 vs H1 : Ψ 6= 0,

calculamos:
8

|ψ̂h − 0|
t= q .
Vdar(ψ̂h )

Regra de decisão: rejeitamos H0 em favor de H1 , ao nı́vel de significância α,


se o t calculado for maior do que o t de tabela.

Exemplo: Considerando os dados do Exemplo 2 e admitindo que queremos


contrastar as hipóteses:

H0 : Ψ1 = 0 vs H1 : Ψ1 6= 0,

onde, Ψ1 = 2µ1 + 2µ2 + 2µ3 − 3µ4 − 3µ5 .

Então,
|6, 94 − 0|
t= √ = 3, 404
4, 156
Da tabela da t-Student tem-se que t[25; 5%] = 2, 06. Como o valor de t
calculado é maior que o valor de tabela então rejeitamos H0 e concluimos,
ao nı́vel de 5% de significância, que a média dos três primeiros tratamentos
é diferente da média dos dois últimos.

1.4 O Teste de Tukey

Pode ser utilizado para todo e qualquer contrastes entre duas médias dos
tratamentos envolvidos num experimento.
O teste é exato se os tratamentos são igualmente repetidos e é apenas apro-
ximado se o número de repetições por tratamento forem diferentes.
Para contrastar as hipóteses

H0 : µi = µi′ vs H1 : µi 6= µi′ , ∀ i 6= i′ .

Calculamos: s  
1 1 1
∆ = DM S = q(I; ν; α) + s2 ,
2 ri ri′
 
onde, s2 = QM Res, r1i + r1′ s2 é a estimativa da variância do estimador do
i
contraste entre duas médias, Ψh = µi − µi′ , q(I; ν; α) é o valor da tabela da am-
plitude total estudentizada de Tukey correspondente ao número de tratamentos
I, número de graus de liberdade dos resı́duos, ν e nı́vel de significância α.

Regra de decisão: rejeitamos H0 : µi = µi′ se, ψ̂h = |mi − mi′ | > DM S.


9

Utilizando os dados do exemplo anterior, temos q[5; 25; 5%] = 4, 16, e,


s  
1 1 1
∆ = DM S = 4, 16 + 0.8312 = 1, 55.
2 6 6

Portanto, qualquer contraste entre duas médias dos tratamentos cujo valor
absoluto da estimativa for superior a 1,55, rejeitamos a hipótese H0 : µi = µi′
em favor de H1 : µi 6= µi′ , ao nı́vel de 5% de significância pelo teste de Tukey.

1.5 O Teste de Duncan

O teste de Duncan consegue discriminar mais que o teste de Tukey. Ele


rejeita a hipótese H0 : µi = µi′ , (i 6= i′ ), onde o teste de Tukey não consegue
rejeitar.
O teste é exato quando o número de repetições por tratamento é o mesmo e
aproximado em situação contrária.
Para testar a hipótese

H0 : µi = µi′ vs H1 : µi 6= µi′ , ∀ i 6= i′ .

Calculamos:
s  
1 1 1
Dk = z(k; ν; α) + s2 ,
2 ri ri′
 
onde, s2 = QM Res, r1i + r1′ s2 é a estimativa da variância do estimador do
i
contraste entre duas médias, Ψh = µi − µi′ , z(k; ν; α) é dado de tabela para o
número k de médias ordenadas abrangidas no contraste de interesse, o número
de graus de liberdade do resı́duo ν e nı́vel de significância α.

Regra de decisão: rejeitamos H0 : µi = µi′ , ao nı́vel de significância α, se o


valor absoluto da estimativa do contraste for maior que o valor de D calculado.
Isto é, se |ψ̂h | = |mi − mi′ | > D.
No nosso exemplo, as médias já estão naturalmente ordenadas, isto é,

m1 = 14, 85
m2 = 14, 68
m3 = 14, 35 s2 = QM Res = 0, 8312
m4 = 13, 74 ν = 25 → .g.l. de resı́duo.
m5 = 13, 20
10

Por exemplo:
q 
|ψ̂1 | = |m1 − m5 | = 1, 65 −→ D5 = 3, 21 12 1
6 + 1
6 0, 8312 = 1, 19;
q 
|ψ̂2 | = |m1 − m4 | = 1, 11 −→ D4 = 3, 14 12 1
6 + 1
6 0, 8312 = 1, 17;
|ψ̂3 | = |m2 − m5 | = 1, 48 −→ D4 = 1, 17;q

|ψ̂4 | = |m1 − m3 | = 0, 50 −→ D3 = 3, 06 12 1
6 + 1
6 0, 8312 = 1, 14;
q 
|ψ̂5 | = |m1 − m2 | = 0, 17 −→ D2 = 2, 91 12 1
6 + 1
6 0, 8312 = 1, 08.

Note que existem outros possı́veis contrastes de interesse entre duas média neste
experimento.
11

1.6 O Teste de Scheffé

Este teste só deve ser aplicado quando a hipótese de igualdade das médias,
isto é, H0 : µ1 = µ2 = · · · = µI = µ, for rejeitada. Se a mesma não for rejeitada
nenhum contraste entre as médias será estatisticamente significativo.
É um teste mais geral que o de Tukey ou de Duncan. Pois, permite julgar
contrastes que envolvem duas ou mais médias.
Para testar a hipótese

H0 : Ψh = 0 vs H1 : Ψh 6= 0.

Calculamos: q
S= (I − 1)Vd
ar(ψ̂h ).F[(I−1); (n−I); α] ,

onde I é o número de tratamentos, Vd ar(ψ̂h ) é a estimativa da variância do


estimador do contraste h e F[(I−1); (n−I); α] é o valor de tabela da distribuição
F , ao nı́vel de significância α, correspondente ao número de graus de liberdade
de tratamento e graus de liberdade dos resı́duos.

Regra de decisão: rejeitamos H0 , ao nı́vel de significância α se, e somente se,


|ψ̂| ≥ S.

Exemplo:
Seja o seguinte contraste de médias:

Ψ1 = 2µ1 + 2µ2 + 2µ3 − 3µ4 − 3µ5 .

Então, o estimador do contraste Ψ1 e sua estimativa são dados por:

Ψ̂1 = 2m1 + 2m2 + 2m3 − 3m4 − 3m5 e


ψ̂1 = 2(14, 85) + 2(14, 68) + 2(14, 35) − 3(13, 74) − 3(13, 2) = 6, 94.

A estimativa da variância do estimador do contraste Ψ1 é


0, 8312
Vd
ar(ψ̂1 ) = [(+2)2 + (+2)2 + (+2)2 + (−3)2 + (−3)2 ] = 4, 156
6
e
F[4; 25; 5%] = 2, 76.
Portanto, p
S= (5 − 1)4, 156 × 2, 76 = 6, 77.
Como |ψ̂1 | = 6, 94 > S = 6, 77, então rejeitamos H0 ao nı́vel de 5% de
significância.
Observação: Existem outros testes utilizados para comparar médias. Aquı́,
nos contentamos com estes.
12
Capı́tulo 2

Experimentos inteiramente
casualizados com um fator
fixo

2.1 Introdução

• Leva em consideração apenas dois princı́pios da experimentação: repetição


e casualização;

• O ambiente no qual o ensaio vai ser instalado e/ou o material experimental


devem ser homogêneos;

• O número de repetições pode variar de um tratamento para outro sem que


isso dificulte as análises estatı́sticas posteriores, embora seja conveniente
planejar experimentos com o mesmo número de repetições por tratamento;

• É mais eficiente que os outros delineamentos experimentais, uma vez que


o número de graus de liberdade para o resı́duo é o maior possı́vel.

• Uma desvantagem desse tipo de experimento é que, em geral, ele conduz


a estimativas mais elevadas da variância do erro experimental, uma vez
que todas as fontes de variação, com exceção dos tratamentos, que atuam
sobre a variável resposta, são atribuı́das ao acaso.

13
14

2.2 Um possı́vel desenho desse tipo de ensaio no


campo, com 5 tratamentos e 5 repetições.

T1 T5 T3 T4 T5

T4 T2 T1 T3 T4

T5 T4 T2 T5 T3

T1 T2 T1 T4 T2

T2 T3 T5 T3 T1

2.3 Organização dos dados

Os dados de um experimento devem ser colocados em tabelas de forma or-


ganizada para facilitar as análises estatı́sticas subsequentes. No caso de um
experimento inteiramente casualizado com I tratamentos, onde cada um deles
foi repetido ri vezes, (i = 1, 2, · · · , I), os dados observados de uma variável
resposta podem ser organizados conforme sugere a Tabela 2.1.
15

Tabela 2.1: Dados observados de um experimento inteiramente casualizado


com I tratamentos repetidos ri vezes.

Tratamento Repetições Total Média


Ti 1 2 ··· j ··· ri yi. ȳi = mi
T1 y11 y12 · · · y1j · · · y1r1 y1. ȳ1. = m1
T2 y21 y22 · · · y2j · · · y2r2 y2. ȳ2. = m2
.. .. .. .. .. .. ..
. . . . . . .
Ti yi1 yi2 ··· yij ··· yiri yi. ȳi. = mi
.. .. .. .. .. .. ..
. . . . . . .
TI yI1 yI2 ··· yIj ··· yIrI yI. ȳI. = mI
Geral - - - - - - y.. ȳ..

2.4 O Modelo Matemático e Suposições

No delineamento completamente aleatorizado com um fator as observações


na população serão escritas como:

i = 1, 2, · · · , I,
yij = µ + τi + εij , com (2.1)
j = 1, 2, · · · , ri ,

onde,
• yij é a observação obtida da j-ésima unidade experimental que recebeu o
tratamento i,
• µ é a média geral,
• τi é o efeito do i-ésimo tratamento sobre a variável resposta, aqui consi-
derado fixo,
• εij é o erro casual (ou perturbação aleatória) associado a observação yij .
• Adicionalmente supõe-se, neste modelo, que εij são variáveis aleatórias
independentes com distribuição normal de média zero e variância comum
σ2 .
Cosequentemente, tem-se que:
1. Como os εij são aleatórios, µ e τi são fixos, então verifica-se que:

E(εij ) = 0 e E(ε2ij ) = σ 2 ,
E(µ) = µ e E(µ2 ) = µ2 ,
E(τi ) = τi e E(τi2 ) = τi2 ;
16

2. Dada a independência dos erros, tem-se que:

E(εij εrs ) = E(εij )E(εrs ) = 0; ∀ i 6= r ou j 6= s;

3. O valor esperado da variável resposta no i-ésimo nı́vel, é denotada por µi


e é dado por

µi = E(yij ) = µ + τi e segue que τi = µi − µ;

4. Como os efeitos dos tratamentos τi são fixos e expressos pelos desvios entre
a média dos tratamentos e a média geral, então verifica-se que:
I
X
ri τi = 0;
i=1

5. As observações yij são variáveis aleatórias normais independentes com


média µi = µ + τi e variância σ 2 , denotaremos por:

yij ∼ N (µi ; σ 2 ).

Obsesvação 1: Quando os tratamentos forem igualmente repetidos, ou seja,


quando r1 = r2 = · · · = rI = J, diremos que o experimento é balanceado e o
modelo (2.1) será escrito da seguinte maneira,

i = 1, 2, · · · , I,
yij = µ + τi + εij , com (2.2)
j = 1, 2, · · · , J.

Existem duas maneiras pelas quais os I tratamento são escolhidos para o


experimento:

1. Os I tratamentos são escolhidos (fixados) pelo pesquisador. Nesse caso,


desejamos estimar e contrastar hipóteses sobre os τi e, as conclusões serão
válidas apenas para os tratamentos considerados, não podendo ser esten-
didas a outros tratamentos que não foram considerados no experimento.
Assim sendo, dizemos que o modelo é de efeitos fixos;

2. Os I tratamento são sorteados aleatoriamente de uma população de trata-


mentos. Nessa situação, as conclusões (baseadas numa amostra de trata-
mentos) serão válidas para toda população de tratamentos, tendo eles
sido considerados explicitamente no experimento ou não. Dessa forma,
os τi são variáveis aleatórias e o nosso interesse será estimar e contrastar
hipóteses sobre a variabilidade dos τi . Assim sendo, dizemos que o modelo
é de efeitos aleatórios ou de componentes da variância.

Consideraremos nesta seção, o modelo de efeitos fixos cujas hipóteses de


interesse a serem contrastadas são formuladas da seguinte maneira:
17


 H0 : τi = 0, ∀ i
vs (2.3)

H1 : τi 6= 0, para pelo menos um i.
Se H0 for verdadeira concluimos que os tratamentos não produzem nenhum
efeito sobre a variável resposta. Caso contrário, isto é, se H0 for falsa, concluire-
mos que pelo menos um tratamento tem efeito sobre a variável resposta.
As hipóteses H0 e H1 em (2.3) podem ser escritas de froma equivante como:

 H0 : µ1 = · · · = µI = µ
vs (2.4)

H1 : µi 6= µi′ , para pelo menos um i 6= i′ .
Neste caso, se H0 for verdadeira concluimos que as médias da variável res-
posta relativas aos tratamentos são todas iguais a µ, caso contrário, diremos
que existe pelo menos um par de médias, (µi , µi′ ), i 6= i′ , que diferem estatisti-
camente entre si.

2.5 Estimativas dos parâmetros do modelo

Como não conhecemos os parâmetros populacionais, (µ, τi ), tão pouco os


verdadeiros erros experimentais, εij , as observações experimentais (as amostras),
(y11 , · · · , y1r1 , · · · , yi1 , · · · , yiri , · · · , yI1 , · · · , yIrI ), poderão ser escritas pelo mo-
delo matemático em termos dos estimadores, isto é,

i = 1, 2, · · · , I,
yij = m + ti + eij , com (2.5)
j = 1, 2 · · · , ri ,

onde, m é o estimador de µ, ti é o estimador de τi e os resı́duos eij são os


estimadores dos erros experimentais, εij .
A partir do modelo (2.5), os resı́duos poderão ser obtidos por:

eij = yij − m − ti .

Para encontrar os estimadores, que são funções das observações experimen-


tais, utilizaremos o método dos mı́nimos quadrados, o qual consiste de encontrar
os valores de m e ti que minimizam a soma dos quadrados dos resı́duos. Neste
sentido, teremos:

eij = yij − m − ti =⇒ e2ij = (yij − m − ti )2 ,

e segue que
X X
Z= e2ij = (yij − m − ti )2 .
ij ij
18

Para se obter os valores de m e ti que minimizam a soma dos quadrados


dos resı́duos, derivamos parcialmente a função Z em relação a cada parâmetro,
igualamos a zero e em seguida explicitamos cada estimador. Ou seja,
∂Z X X
=2 (yij − m − ti )(−1) = 0 =⇒ nm + ri ti = y.. (I)
∂m ij i

∂Z X
=2 (yij − m − ti )(−1) = 0 =⇒ ri m + ri ti = yi. , (II)
∂ti j
P
onde n = i ri .
As equações (I) e (II) formam um sistema denominado Sistema de Equações
Normais, que é dado por:
 P
 nm + i ri ti = y..
(2.6)

ri m + ri ti = yi.
O sistema (2.6) é indeterminado, uma vez que apresenta duas equações e
P 1) incógnitas. Para resolvê-lo impomos uma restrição conveniente, a saber,
(I +
i ri ti = 0. Dessa forma, podemos encontrar os estimadores de µ e τi . Isto é,

m = ȳ.. e ti = ȳi. − ȳ..


e, segue que os estimadores de µi = µ + τi e εij , são dados por:
µ̂i = Ê(yij ) = ŷij = m + ti = ȳi. e eij = yij − ŷij = yij − ȳi.
A Tabela 2.2 apresenta um resumo dos resultados encontrados nesta seção.

Tabela 2.2: Estimadores das caracterı́sticas relativas ao modelo matemático


utilizado para descrever as observações de um experimento inteiramente casua-
lizado com um fator de efeitos fixos.

Caracterı́stica Notação Estimador da


ou parâmetro (população) caracterı́stica
Média geral µ → m = yn.. = ȳ..

Efeito do tratamento i τi → ti = ȳi. − ȳ..

Média do tratamento i µi = E(yij ) → ŷij = m + ti = ȳi.

Erro experimental εij → eij = yij − ŷij = yij − ȳi.

Variância∗ σ2 → s2 = QM Res.


Mostraremos posteriormente que s2 = QM Res. é um estimador não vicia-
do para σ 2 .
19

2.6 Decomposição da variabilidade total

De acordo com os resultados apresentados na Tabela 2.2, o modelo (2.3)


pode ser representado pela identidade

yij = ȳ.. + (ȳi. − ȳ.. ) + (yij − ȳi. ) (2.7)


|{z} | {z } | {z }
m ti eij

daı́, podemos escrever

(yij − ȳi. ) = (yij − ȳ.. ) + (ȳi. − ȳ.. ) (2.8)

Elevando-se ao quadrado os dois lado da equação (2.8) e somando-se para todas


as observações, obtem-se
X X X X
(yij − ȳi. )2 = (yij − ȳ.. )2 + (ȳi. − ȳ.. )2 − 2 (yij − ȳ.. )(ȳi. − ȳ.. )
i,j i,j i,j i,j
X X X
2 2
= (yij − ȳ.. ) + ri (ȳi. − ȳ.. ) − 2 ri (ȳi. − ȳ.. )2
i,j i i
X X
2 2
= (yij − ȳ.. ) − ri (ȳi. − ȳ.. ) .
i,j i

Portanto, desenvolvendo algebricamente os termos da equação acima, encontra-


se   !
X X X y2
(yij − ŷij ) = 
2
yij − C  −
2 i.
−C (2.9)
ij ij i
ri
| {z } | {z } | {z }
SQRes. SQT otal SQT rat.

2
onde, ŷij = Ê(yij ) = m + ti = mi = ȳi. e C = (yn.. ) .
Assim sendo, a variabilidade total é decomposta em duas partes: a variabi-
lidade devida aos tratamentos e variabilidade devida ao acaso, ou seja,

SQT otal = SQT rat. + SQRes. (2.10)

Na prática, SQRes. é obtida por diferença, isto é,

SQRes. = SQT otal − SQT rat. (2.11)

Para contrastar as hipóteses de interesse empregamos a técnica da Análise


da Variância (ANOVA), que é baseada na distribuição de probabilidade F e,
para entendermos como isto é feito, precisamos descobrir as distribuições de
probabilidade dos estimadores e das somas dos quadrados, em seguida obter os
valores esperados das somas dos quadrados e dos quadrados médios.
20

2.7 Distribuições de probabilidade dos estima-


dores e das somas dos quadrados.
1. Distribuições de probabilidade de m e de C
1X
m = ȳ.. = yij .
n i,j

Observe que m é uma combinação linear dos yij os quais seguem uma
distribuição normal. Portanto, como sabemos que uma combinação linear
de variáveis aleatórias normais, também segue uma distribuição normal,
então m é normal. Precisamos agora, encontrar as carcterı́sticas da dis-
tribuição, isto é,
1X 1X
m = yij = (µ + τi + εij )
n i,j n i,j
 
X  0X
1 > 1X
= nµ + r
i τi + εij  = µ + εij
n  n ij
i i,j

Assim, teremos:
E(m) = µ
e
 2  2
1 X 1 X
V ar(m) = E[m − E(m)]2 = E µ + εij − µ = 2 E  εij 
n ij n ij

1 1
= E(ε11 + · · · + εIrI )2 = 2 E(ε211 + · · · + ε2IrI + 2ε11 ε12 + odp)
n2 n
1 2 2 σ2
= (σ + · · · + σ +0 + 0) = ,
n2 | {z } n
n vezes

onde, odp significa outros duplos produtos.


2
Portanto, m segue uma distribuição normal com média µ e variância σn ,
denotada por:  
σ2
m = ȳ.. ∼ N µ; . (2.12)
n
Segue que

ȳ − µ n(ȳ.. − µ)
p.. ∼ N (0; 1) ⇐⇒ ∼ N (0; 1).
σ 2 /n σ

Assim sendo, sob a hipótese H0 : µ = 0, as estatı́sticas


√ (y )2
n(ȳ.. ) n(ȳ.. )2 ..
C
∼ N (0; 1) e = n
= ∼ χ2(1) . (2.13)
σ σ2 σ2 σ2
21

Portanto, sob H0 : µ = 0, a estatı́stica σC2 , segue uma distribuição de


qui-quadrado central com um grau de liberdade.

2. Distribuições de probabilidade de ti e de SQT rat.

Já sabemos que

1 X 1X
ti = ȳi. − ȳ.. = yij − yij .
ri j n i,j

Logo, ti é uma combinação linear dos yij os quais seguem uma distribuição
normal e, portanto, ti segue uma distribuição normal.
As caracterı́sticas da distribuição de ti serão obtidas da seguinte maneira:

1 X 1X
ti = yij − yij
ri j n i,j
ri
1 X 1X
= (µ + τi + εij ) − (µ + τi + εij )
ri j=1 n i,j

Xri X  0
1 1 > X
= (ri µ + riτi + εij ) − (nµ + r
τ + εij )
ri n i i
j=1 i i,j
1 X 1X
= τi + εij − εij .
ri j n i,j

Agora,
E(ti ) = τi
e
1 X 1 X 2
V ar(ti ) = E[ti − E(ti )]2 = E εij − εij
ri j n i,j
 1 X 2 1 X 2 2 X  X 
= E 2 εij + 2 εij − εij εij
ri j n i,j nri j i,j

σ2 σ2 2σ 2 σ2 σ2 (n − ri )σ 2
= + − = − = .
ri n n ri n nri
Portanto,  
(n − ri )σ 2
ti ∼ N τi ; . (2.14)
nri

Sendo  
(n − ri )σ 2
ti = ȳi. − ȳ.. ∼ N τi ; , então,
nri
22

ȳi. − ȳ.. − τi
q ∼ N (0; 1).
(n−ri )σ 2

nri

Sob a hipótese H0 : τi = 0, tem-se que

ȳ − ȳ.. ri (ȳi. − ȳ.. )2


q i. ∼ N (0; 1) =⇒ (n−ri )σ 2
∼ χ2(1) ou
(n−ri )σ 2
nri n

ri (ȳi. − ȳ.. )2 (n − ri ) 2
∼ χ(1)
σ2 n
e segue que

P
I
ri (ȳi. − ȳ.. )2
i=1 SQT rat. (In − n) 2
= ∼ χ(1) = (I − 1)χ2(1) = χ2(I−1) .
σ2 σ2 n
(2.15)
O resultado (3.6) se verifica porque sendo os yij variáveis aleatórias inde-
pendentes, os termos: r1 (ȳ1. − ȳ.. ), r2 (ȳ2. − ȳ.. ), · · · , rI (ȳI. − ȳ.. ), sujeitos
P
I P
I
a restrição: ri (ȳi. − ȳ.. ) = ri ti = 0, também o são. E, portanto, a
i=1 i=1
P
I
2
ri (ȳi. −ȳ.. )
i=1
estatı́stica σ2 está associada a (I − 1) graus de liberdade.

3. Distribuição de probabilidade de eij e da SQRes.

Sabemos que
ri
1 X
eij = yij − ŷij = yij − ȳi. = yij − yij (2.16)
ri j=1

é uma combinação linear dos yij que têm distribuição normal. Sendo
assim, eij também segue uma distribuição normal.
Desenvolvendo a expressão (3.7), vem,
ri ri
1 X 1 X
eij = yij − yij = µ + τi + εij − (ri µ + ri τi + εij )
ri j=1 ri j=1
ri
1 X
= εij − εij .
ri j=1

Daı́, encontramos:
E(eij ) = 0
23

e
 2
Xri
1
V ar(eij ) = E[eij − E(eij )]2 = E εij − εij 
ri j=1
  2 
r r
 1 X  i
2εij X i

= E ε2ij + 2  εij − εij 


ri j=1 ri j=1

σ2 2σ 2 σ2 (ri − 1)σ 2
= σ2 + − = σ2 − = .
ri ri ri ri

Assim sendo, teremos


 
(ri − 1)σ 2
eij ∼ N 0; . (2.17)
ri

Como
 
(ri − 1)σ 2 yij − ȳi.
eij = yij − ȳi. ∼ N 0; =⇒ q ∼ N (0; 1)
ri (ri −1)σ 2
ri

segue que

(yij − ȳi. )2 (yij − ȳi. )2 (ri − 1) 2


−1)σ 2
∼ χ2(1) =⇒ ∼ χ(1) .
(ri σ2 ri
ri

Somando-se para todos os resı́duos, teremos:


P
(yij − ȳi. )2 I ri
i,j SQRes. X X (ri − 1) 2
= ∼ χ(1) = (n − I)χ2(1) = χ2(n−I) .
σ2 σ2 i=1 j=1
ri

(2.18)

4. Distribuição de probabilidade da SQT otal


Sejam as diferenças entre cada observação e a média geral,

0
1
I
X  X
yij − ȳ.. = µ + τi + εij − (nµ + ri τi + εij )
n i=1 i,j
1X
= τi + εij − εij .
n i,j

Então,
E(yij − ȳ.. ) = τi
24

e
2
V ar(yij − ȳ.. ) = E [yij − ȳ.. − E(yij − ȳ.. )]
 2   2 
1X   1 X 2εij X 
= E εij − εij = E ε2ij + 2  εij ) − εij 
n i,j n i,j
n i,j

σ2 2σ 2 σ2 (n − 1) 2
= σ2 + − = σ2 − = σ .
n n n n
Portanto,  
(n − 1) 2
yij − ȳ.. ∼ N τi ; σ .
n
Sob a hipótese de que não exite efeito dos tratamentos. isto é, H0 : τi = 0
as estatı́sticas
y − ȳ.. (yij − ȳ.. )2
qij ∼ N (0; 1) e (n−1) 2
∼ χ2(1)
n σ
(n−1) 2
n σ

e, ainda,
(yij − ȳ.. )2 (n − 1) 2
2
∼ χ(1) .
σ n
Somando-se para todas as diferenças, teremos
P
(yij − ȳ.. )2
i,j SQT otal
2
= ∼ (n − 1)χ2(1) = χ2(n−1) .
σ σ2

Os resultados das distribuições de probabilidade dos estimadores dos parâ-


metros e das somas dos quadrados encontram-se na Tabela 3.6.

Tabela 2.3: Distribuições de probabilidade dos parâmetros e das somas dos


quadrados

 
σ2
m = ȳ.. ∼ N µ; n
e sob H0 : µ = 0, C
σ2
∼ χ2(1)

(n−ri ) 2

ti = ȳi. − ȳ.. ∼ N τi ; nri
σ e sob H0 : τi = 0, SQT rat.
σ2
∼ χ2(I−1)

(ri −1) 2

eij = yij − ȳi. ∼ N 0; ri
σ e independente de H0 , SQRes.
σ2
∼ χ2(n−I)

(n−1) 2

yij − ȳ.. ∼ N τi ; n
σ e sob H0 : τi = 0, SQT otal
σ2
∼ χ2(n−1) .
25

iid
Teorema 2.7.1 (Teorema de Cochran) Sejam Zi ∼ N (0; 1), i = 1, · · · , ν
e seja

Zi2 = Q1 + · · · + Qs
i=1
onde s < ν e Qi é qui-quadrado com νi graus de liberdade (ν1 , · · · , νs ). Então,
Q1 , · · · , Qs , são variáveis aleatórias qui-quadrado independentes, com ν1 , · · · , νs
graus de liberdade, respectivamente se, e somente si,
ν = ν1 + · · · + ν s .
Dividindo-se os dois lados da expressão (2.10) por σ 2 , isto é,
SQT otal SQT rat. SQRes.
2
= + (2.19)
σ σ2 σ2
e considerando-se os resultados apresentados na Tabela 3.6, a equação (3.9)
pode ser posta em termos de suas respectivas distribuições de probabilidade, ou
seja,
χ2(n−1) = χ2(I−1) + χ2(n−I) .
Como (n − 1) = (I − 1) + (n − I), de acordo com o teorema de Cochran, isso
prova a independência entre a SQT rat. e SQRes..

2.8 Valores esperados das somas dos quadrados


e dos quadrados médios

Dentre os argumentos teóricos utilizados para construir a ANOVA, a obtenção


dos valores esperados das somas dos quadrados e dos quadrados médios tem im-
portância fundamental. A seguir, procuraremos demonstrar como estes valores
esperados são obtidos.
1. Esperança da SQT otal
 
X X
E[SQT otal] = E  2
yij − C  = E[ 2
yij ] − E[C]
| {z }
i,j i,j
| {z } (II)
(I)

Mas,
X X
(I) = E[ (µ + τi + εij )2 ] = E[ (µ2 + τi2 + ε2ij + 2µτi + odp)]
i,j i,j
X
2
= E[µ + τi2 + ε2ij + 2µτi + odp]
i,j

X X  0 X
2  >
= nµ + ri τi2 + nσ + 2µ2
ri τi = nµ2 + ri τi2 + nσ 2

i i i
26

e
 2 
 
(y.. )2 1  X  
(II) = E[C] = E = E  yij 
n n i,j

X X  0
1 2 1
> X
= E{[ (µ + τi + εij )] } = E[(nµ + rτ + εij )2 ]
n n i i
i,j i i,j
1 X X
2 2 2
= E(n µ + ( εij ) + 2nµ εij ) = nµ2 + σ 2 .
n i,j i,j

Portanto,
X
E(SQT otal) = (I) − (II) = (n − 1)σ 2 + ri τi2 . (2.20)
i

2. Esperança da SQT rat. e do QM T rat.


" # " #
X y2 X y2
i. i.
E(SQT rat.) = E −C =E − E(C)
ri ri | {z }
i i
| {z } (II)
(III)

Mas,
" #  2
X y2 X 1 X
(III) = E i.
= E ri µ + ri τi + εi,j 
i
ri i
ri j
 
X 1 X ri
= E ri2 µ2 + ri2 τi2 + ( εij )2 + 2µri2 τi + odp
i
ri j=1
X 1
= (ri2 µ2 + ri2 τi2 + ri σ 2 + 2µri2 τi )
i
ri

X X  0 X
2  >
= nµ + ri τi2 2
+ Iσ + 2µ ri τi = nµ2 + ri τi2 + Iσ 2 .

i i i

Sendo assim, teremos:


X
E[SQT rat.] = nµ
(III) − (II) =  2
+ nµ
ri τi2 + Iσ 2 −  2
− σ2
i
X
2
= (I − 1)σ + ri τi2 .
i

e  
SQT rat 1 X
E(QM T rat.) = E = σ2 + ri τi2 (2.21)
I −1 I −1 i
27

ou
1 X
E(QM T rat.) = σ 2 + ri (µ + τi − µ)2
I −1 i
1 X
= σ2 + ri (µi − µ)2 . (2.22)
I −1 i

3. Esperança da SQRes. e do QM Res.

E(SQRes.) = E(SQT otal) − E(SQT rat.)


X  X 
= (n − 1)σ 2 + r 2 2
i τi − (I − 1)σ − r 2
i τi
 
i i
= (n − I)σ 2 .

e  
SQRes.
E(QM Res.) = E = σ2 .
n−I
Logo, s2 = QM Res. é um estimador não viciado para σ 2 , a variância do
erro.

A tabela a seguir é conhecida por tabela da AN OV A. Ela apresenta, de


forma organizada, as fontes de variação, os graus de liberdade, as somas dos
quadrados, os quadrados médios e os valores esperados dos quadrados médios.

Tabela 2.4: Tabela da ANOVA com as esperanças dos quadrados médios

F. Variação GL SQ QM E[QM ] P
1
Tratamentos (I − 1) SQT rat. QM T rat. σ 2 + I−1 ri τi2
i
Resı́duo (n − I) SQRes. QM Res. = s2 σ2
Total (n − 1) SQT otal -

2.9 Análises estatı́sticas

Como foi mensionado anteriormente as hipóteses de interesse a serem con-


trastadas neste modelo, são:

 H0 : τ 1 = · · · = τ I = 0
vs

H1 : τi 6= 0, para pelo menos um τi , i = 1, · · · , I
28

ou equivalentemente

 H0 : µ1 = · · · = µI = µ
vs

H1 : µi 6= µi′ , para pelo menos um par de médias (µi , µi′ ), i 6= i′ .
Comprovamos que:
1. QM Res. é um estimador não viciado para σ 2 independentemente de que
a hipótese nula se verifique;
2. Se H0 : µ1 = · · · = µI P = µ for verdadeira, isto é, se as médias forem
todas iguais a µ, então i ri (µi − µ)2 = 0 e QM T rat. é um estimador
não viciado para σ 2 . Por outro lado, se as médias dos tratamentos forem
diferentes da média geral, o valor esperado do QM T rat. é maior σ 2 . Assim
sendo, deduz-se que o contraste das hipóteses, H0 vs H1 , pode ser efetuado
comparando-se QM T rat. com QM Res.;
3. As estatı́sticas: SQT
σ2
rat.
∼ χ2(I−1) e QMσRes.
2 ∼ χ2(n−I) , além de serem
independentemente distribuı́da uma da outra.
Consequentemente, a estatı́stica
SQT rat. (I−1)QM T rat.
σ2 σ2
I−1 I−1 QM T rat.
F = SQRes. = (n−I)QM Res.
= ∼ F[(I−1); (n−I)] ,
σ2 σ2
QM Res.
n−I n−I

isto é, a estatı́stica F = QM T rat/QM Res. segue uma distribuição F de


Snedecor com (I − 1) graus de liberdade do numerador e (n − I) graus de
liberdade do denominador e será a estatı́stica utilizada para contrastar as
hipóteses H0 contra H1 . Se H0 for verdadeira, tanto o numerador como o
denominador da F são estimadores não viciados de σ 2 , enquanto que se H0
for falsa o valor esperado do QM T rat. é maior que σ 2 . Portanto, rejeita-
mos H0 quando o valor da estatı́stica F for maior que o correspondente
valor teórico da distribuição F com (I − 1) e (n − I) graus de liberdade
ao nı́vel de significância α.
4. Procedimento prático para se contrastar as hipóteses H0 vs H1 :
• Estabelecer as hipóteses a serem contrastadas:

 H0 : µ1 = µ2 = · · · = µI = µ
vs

H1 : µi 6= µi′ , para pelo menos um i 6= i′ ; i, i′ = 1, 2, · · · , I;
• calcular as somas dos quadrados, organizar a tabela da AN OV A e
encontrar o valor da estatı́stica F , conforme sugerem a Tabela 3.3
ou fórmulas (3.2), a seguir.
P 2 P yi.2
SQT otal = yij − C, SQT rat. = ri − C
i,j i (2.23)
e SQRes. = SQT otal − SQT rat., F = QM T rat
QM Res
29

Tabela 2.5: Tabela de análise da variância (AN OV A)

F. Variação GL SQ QM F
Tratamentos I-1 SQTrat. QMTrat. QMTrat./QMRes.

Resı́duo (n-I) SQRes. QMRes.=s2 -


Total n-1 SQTotal

• comparar o valor de F com F[(I−1); (n−I); α] obtido da tabela da dis-


tribuição de probabilidade F com (I − 1) graus de liberdade devidos
a tratamentos, (n − I) graus de liberdade do resı́duo ao nı́vel de
significância α;
• Regra de decisão: rejeitar H0 em favor de H1 se, e somente se,

F > F[(I−1); (n−I); α] .

• Conclusão: Se F > F[(I−1); (n−I); α] , rejeitamos a hipótese de que as


médias da variável resposta relativas aos tratamentos são todas iguais
e concluimos, ao nı́vel de significância α, que existe pelo menos um
par de médias (µi , µi′ ), i 6= i′ , que diferem estatı́sticamente entre si.

2.10 Comparações Múltiplas

Caso a hipótese H0 = µ1 = µ2 = · · · = µI = µ seja rejeitata, ao nı́vel de


significância α desejado (em geral α = 0, 05), deveremos continuar as análises
estatı́sticas, aplicando um teste de comparações múltiplas, que pode ser aquele
que o pesquisador/estatı́stico achar mais conveniente: Tukey, ou t-Student, ou
Duncan, ou Scheffé, ou Bonferroni, etc. Neste curso, trabalharemos com o teste
de Tukey, cujo procedimento utilizado para este fim, é o seguinte:
• Para contrastar as hipóteses:

 H0 : µi = µi′
vs

H1 : µi 6= µi′ , ∀ i 6= i′ e i, i′ = 1, 2, · · · , I;

• Usando os dados observados no experimento, calcular o valor da estatı́stica


de teste, ∆ = DM S, e os valores absolutos das diferenças entre as esti-
mativas das médias relativas aos tratamentos. Isto é,
s  
1 1 1
∆ = DM S = q[I; (n−I); α] + s2
2 ri ri′
30

e
|ȳi − ȳi′ |, ∀ i 6= i′ e i, i′ = 1, 2, · · · , I;

• Regra de decisão: Rejeitar H0 : µi = µi′ em favor de H1 : µi 6= µi′ , se


|ȳi − ȳi′ | > ∆.

• Conclusão: Se |ȳi − ȳi′ | > ∆, rejeitamos a hipótese de que as médias µi e


µi′ são iguais e concluimos, ao nı́vel de significância α pelo teste de Tukey,
que a média µi difere estatisticamente da média µi′ .

2.11 Desdobramento da análise

Quando o pesquisador tem interesse em testar um grupo de contrastes de


médias (combinações lineares das médias), é mais eficiente e mais informa-
tivo proceder ao desdobramento dos graus de liberdade dos tratamentos dentro
da própria análise da variância ao invés de utilizar métodos de comparações
múltiplas. Porém, é recomendável que os contrastes a serem julgados pelo teste
F na análise da variância, sejam ortogonais entre si e estabelecidos no planeja-
mento do experimento.
Seja a combinação linear de médias (contraste):
I
X
Ψh = ch1 µ1 + ch2 µ2 + · · · + chI µI = chi µi
i=1

cujo estimador é
I
X
Ψ̂h = ch1 ȳ1. + ch2 ȳ2. + · · · + chI ȳI. = chi ȳi. .
i=1

Sendo Ψ̂h , uma combinação linear dos yij , os quais seguem uma distribuição
normal, então Ψ̂h , também segue uma distribuição normal e as caracterı́sticas
da distribuição são dadas por:

PI

E(Ψ̂h ) = chi µi 
 !

 I I
i=1 X X 2
2 σ
e =⇒ Ψ̂h ∼ N chi µi ; chi .
 ri
P 2 
I  i=1 i=1
V ar(Ψ̂h ) = c2hi σri 

i=1

Se os tratamentos forem igualmente repetidos, isto é, se r1 = · · · = rI = J,


teremos:
I
!
X σ2 X
Ψ̂h ∼ N chi µi ; Kh , onde Kh = c2hi .
i=1
J i
31

E segue que

PI P
I
chi ȳi. − chi µi
Ψ̂h − E(Ψ̂h ) i=1 i=1
Z= q = q ∼ N (0; 1).
Kh 2
V ar(Ψ̂h ) J σ

(h) P
I
Sob a hipótese H0 : chi µi = 0, tem-se que
i=1
 2
P
I
P
I chi yi.
chi ȳi. i=1 (h)
i=1 JKh SQ(H0 )
q ∼ N (0; 1) =⇒ = ∼ χ2(1) .
Kh 2 σ2 σ2
J σ

(h)
Posto que SQ(H0 ) é independentemente dstribuı́da da SQRes, então
(h)
QM (H0 )
F = ∼ F[1; (n−I)] .
QM Res.

Procedimento:

• Os (I − 1) graus de liberdade dos tratamentos podem ser desdobrados em


(I − 1) contrastes de interesse, ortogonais entre si, cada um com 1 grau
de liberdade;

• É conveniente transformar as hipóteses de interesse em hipóteses equi-


valentes na formaPde contrastes, de modo que dado o contraste Ψh =
P I
i=1 chi µi , (com i chi = 0), a hipótese de interesse possa ser represen-
tada por H0 : Ψh = 0.
Por exemplo, seja a hipótese de interesse:

(h) µ1 + µ2 + µ3 µ4 + µ5
H0 : = ,
3 2
então, esta hipótese pode ser posta na forma equivalente, isto é:
(h)
H0 : 2µ1 + 2µ2 + 2µ3 − 3µ4 − 3µ5 = 0

ou
(h)
H0 : Ψh = 0,
onde, Ψh = 2µ1 + 2µ2 + 2µ3 − 3µ4 − 3µ5 .
Dessa forma, a estimativa do contraste será dada por:
ȳ1. + ȳ2. + ȳ3. ȳ4. + ȳ5.
ψ̂h = −
3 2
32

e a soma de quadrados da hipótese será dada por:


P
2 ( chi yi. )2
(h) (Ψ̂h )
SQ(H0 ) = = i
JKh JKh
(2y1. + 2y2. + 2y3. − 3y4. − 3y5. )2
=
J × 30
P
onde, Kh = c2hi = 22 + 22 + 22 + (−3)2 + (−3)2 = 30 e J é o número de
i
repetições por tratamento.

Exemplo 2.11.1 A Tabela 2.6 contém os dados de um experimento utilizado


por Gomez & Gomez(1984), onde os tratamentos T2 , T3 e T4 são inseticidas
em forma de pó seco e T5 , T6 e T7 em forma lı́quida.
33

Tabela 2.6: Resultados de produção (toneladas por hectare) de grãos de arroz


submetidos a diferentes inseticidas (granulados e lı́quidos)

Tratamento Repetições Total Média Variância


1 2 3 4 yi. ȳi s2i
Testemunha 1,401 1,516 1,270 1,077 5,264 1,316 0,035487
Dol-Mix (1 kg) 2,537 2,069 2,104 1,798 8,508 2,127 0,093411
Dol-Mix (2 kg) 3,366 2,591 2,211 2,544 10,712 2,678 0,238986
DDT+γ-BHC 2,536 2,459 2,827 2,386 10,208 2,552 0,037362
Azodrin 2,387 2,453 1,556 2,116 8,512 2,128 0,166678
Dimecron-Boom 1,997 1,679 1,649 1,859 7,184 1,796 0,026556
Dimecron-Knap 1,796 1,704 1,904 1,320 6,724 1,681 0,064601
57,112 2,040 0,663081

Hipóteses de interesse:

Ao planejar este experimento o pesquisador tinha interesse em contrastar as


hipóteses:

 (1)
 H0 : µ1 = µ2 = · · · = µ7 = µ
vs

 H (1) : µ 6= µ ′ , para pelo menos um i 6= i′ ; i, i′ = 1, · · · , I
1 i i

(2) µ2 +µ3 +···+µ7 (2) µ2 +µ3 +···+µ7


H0 : µ1 = 6 vs H1 : µ1 6= 6 ,

(3) µ2 +µ3 +µ4 µ5 +µ6 +µ7 (3) µ2 +µ3 +µ4 µ5 +µ6 +µ7
H0 : 3 = 3 vs H1 : 3 6= 3 ,

(4) µ2 +µ3 (4) µ2 +µ3


H0 : 2 = µ4 vs H1 : 2 6= µ4 ,

(5) (5)
H0 : µ2 = µ3 vs H1 : µ2 6= µ3 ,

(6) µ6 +µ7 (6) µ6 +µ7


H0 : µ5 = 2 vs H1 : µ5 6= 2 ,

(7) (7)
H0 : µ6 = µ7 vs H1 : µ6 6= µ7 .
Para verificação destas hipóteses precisamos calcular as somas dos quadrados
associadas a cada uma delas.

Cálculo das somas dos quadrados:


• Cálculo do fator C:
(y.. )2 (57, 112)2
C= = = 116, 4922;
n 28
34

• Cálculo da soma dos quadrados total:


X
2
SQT otal = yij −C
i,j

= (1, 401)2 + · · · + (1, 320)2 − 116, 4922


= 7, 5776;

• Cálculo da soma dos quadrados dos tratamentos:


X y2 I
i. 1X 2
SQT rat. = −C = y −C
i
ri J i=1 i.
1 
= (5, 264)2 + · · · + (6, 724)2 − 116, 4922
4
= 5, 5884

• Cálculo da soma dos quadrados dos resı́duos:


SQRes. = SQT otal − SQT rat.
= 7, 5776 − 5, 5884
= 1, 9892.

Com estes resultados podemos estruturar a tabela da análise da variância e


contrastar as hipóteses:

 (1)
 H0 : µ1 = µ2 = · · · = µ7 = µ
vs

 H (1) : µ 6= µ ′ , para pelo menos um i 6= i′ ; i, i′ = 1, 2, · · · , I
1 i i

Tabela 2.7: A análise da variância


F. Variação GL SQ QM F Pr > F
(1) ∗∗
Trat.(H0 : µ1 = · · · = µI = µ) 6 5,5884 0,9314 9, 83 0,0001
Resı́duo 21 1,9892 0,0947
Total 27 7,5776

(1)
Conforme podemos observar, a hipótese H0 foi rejeitada ao nı́vel de 1%
(1)
de significância. Pois, F = 9, 83 > F[6; 21; 0,01] = 3, 81. Assim, a hipótese H1
foi aceita, o que significa dizer que existe pelo menos um contraste entre duas
médias dos tratamentos que difere estatisticamente de zero. Dessa forma, há
necessidade de continuar as análises estatı́sticas e, neste sentido, procuramos
desdobrar os graus de liberdade dos tratamentos em contrastes de interesse.
Vejamos como calcular as estimativas e as somas dos quadrados desses con-
trastes.
35

Cálculos das estimativas dos contrastes e das somas dos


quadrados das hipóteses de interesse:

P
i c2i ȳi. 6(ȳ1. ) − 1(ȳ2. ) − · · · − 1(ȳ7. )
ψ̂2 = =
1×6 6
6(1, 316) − 1(2, 217) − · · · − 1(1, 681)
= = −0, 844ton/ha;
6
 2
P
I
c2i yi. 2
(2) i=1 [6(y1. ) − 1(y2. ) − · · · − 1(y7. )]
SQ(H0 ) = =
JK2 4 × 42
2
[6(5, 264) − 1(8, 508) − · · · − 1(6, 724)]
= = 2.4442;
168
P
i c3i yi.
3(ȳ2. ) + 3(ȳ3. ) + 3(ȳ4. ) − 3(ȳ5. ) − 3(ȳ6. ) − 3(ȳ7. )
ψ̂3 = =
3×3 9
(2, 127 + 2, 678 + 2, 552 − 2, 128 − 1, 796 − 1, 681)
=
3
= 0, 584ton/ha;

 2
P
I
c3i yi.
(3) i=1
SQ(H0 ) =
JK3
2
[3(y2. ) + 3(y3. ) + 3(y4. ) − 3(y5. ) − 3(y6. ) − 3(y7. )]
=
4 × 54
2
[3(8, 508 + 10, 712 + 10, 208 − 8, 512 − 7, 184 − 6, 724)]
=
4 × 54
= 2, 0463;

P
i c4i ȳi.
1(ȳ2. ) + 1(ȳ3. ) − 2(ȳ4. )
ψ̂4 = =
1×2 2
1(2, 127) + 1(2, 678) − 2(2, 552)
= = −0, 150ton/ha;
2
 2
P
I
c4i yi.
(4) i=1
SQ(H0 ) =
JK4
2
[1(y2. ) + 1(y3. ) − 2(y4. )]
=
4×6
2
[1(8, 508) + 1(10, 712) − 2(10, 208)]
= = 0, 0596;
24
36
X
ψ̂5 = c5i ȳi. = ȳ2. − ȳ3. = 2, 127 − 2, 678 = −0, 551ton/ha;
i
 2
P
I
c5i yi.
(5) i=1 (y2. − y3. )2
SQ(H0 ) = =
JK5 4×2
(8, 508 − 10, 712)2
= = 0, 6072;
8

P
I
c6i ȳi.
i=1 2(ȳ5. ) − 1(ȳ6. ) − 1(ȳ7. )
ψ̂6 = =
1×2 2
2(2, 128) − 1(1, 796) − 1(1, 681)
= = 0, 390ton/ha;
2
 2
P
I
c6i yi. 2
(6) i=1 [2(y5. ) − 1(y6. ) − 1(y7. )]
SQ(H0 ) = =
JK6 4×6
2
[2(8, 512) − 1(7, 184) − 1(6, 724)]
= = 0, 4046;
24

X
ψ̂7 = = c7i ȳi. = ȳ6. − ȳ7. = 1, 796 − 1, 681 = 0, 115ton/ha;
i
 2
P
I
c7i yi.
(7) i=1 (y6. − y7. )2
SQ(H0 ) = =
JK7 4×2
(7, 184 − 6, 724)2
= = 0, 0264.
8

Com base nestes resultados, construı́mos a Tabela 2.8 que corresponde a


uma reestruturação da análise da variâncias.

Analizando-se os resultados da análise da variância apresentada na Tabela


(2)
2.8, percebemos que a hipótese H0 foi rejeitada ao nı́vel de 1% de significância,
indicando que, sob as condições em que o experimento foi instalado e conduzido,
a produção média do arroz que recebeu os defensivos utilizados foi diferente
da produção do arroz que não foi tratado com os defensivos. E, neste sentido,
observou-se que, a média estimada da produção do arroz tratado foi de 844kg/ha
(3)
a mais que o arroz não tratado. Por outro lado, a hipótese H0 também foi re-
jeitada ao nı́vel de 1% de significância. Neste caso, concluı́mos que os defensivos
em forma de pó foram mais eficientes que os defensivos na forma lı́quida, uma
vez que a estimativa do contraste encontrada foi de 584kg/ha. A rejeição da
37

Tabela 2.8: A análise da variância


F.Variação GL SQ QM F Pr > F
(2)
H0 : µ1 = µ2 +µ3 +···+µ
6
7
1 2,4442 2,4442 25, 80∗∗ 0,0001
(3)
H0 : µ2 +µ33 +µ4 = µ5 +µ36 +µ7 1 2,0463 2,0463 21, 60∗∗ 0,0001
(4)
H0 : µ2 +µ
2
3
= µ4 1 0,0596 0,0596 0,63 0,4365
(5)
H0 : µ 2 = µ 3 1 0,6072 0,6072 6, 41∗ 0,0194
(6)
H0 : µ5 = µ6 +µ2
7
1 0,4046 0,4046 4,27 0,0513
(7)
H0 : µ 6 = µ 7 1 0,0265 0,0265 0,28 0,6027
(1)
Trat. (H0 : µ1 = · · · = µ7 = µ) (6) (5,5884) 0,9314 9, 83∗∗ 0,0001
Resı́duo 21 1,9892 0,0947
Total 27 7,5776

(5)
hipótese H0 ao nı́vel de 5% de significância nos leva a concluir que a aplicação
de 2kg de Dom-Mix foi mais eficiente que a aplicação de 1, 0kg. Pois, estimou-
se que a produção média obtida com a aplicação de 2, 0kg de Dol-Mix foi de
551kg/ha a mais do que quando se aplicou 1, 0kg.

Observação: Note que, para 1 grau de liberdade do numerador, F = t2 . Por


(5)
exemplo, quando aplicamos o teste t-Student para testar a hipótese H0 ,
ao nı́vel α = 0, 05, o valor encontrado para estatı́stica de teste foi t =

p|ψ̂5 −0| = 2, 53 = 6, 41.
d
V ar(Ŷ4 )

Cuidado!!! Seber(1977), Kirk(1968). Para que o nı́vel de significância con-


junto seja preservado em α é necessário que cada hipótese individualmen-
te seja testada a um nı́vel de significância αs = 1 − (1 − α)1/p , em que
s = 1, 2, · · · , p e p = (I − 1) é o número de contrastes ortogonais corre-
spondentes ao número de graus de liberdade dos tratamentos. Para o nosso
exemplo, encontramos αs = 1−(0, 95)1/6 = 0, 0085. Isto é, deveremos tes-
tar as hipóteses individuais ao nı́vel de significância de 0,0085 para que o
nı́vel de significância conjunto seja preservado em 0,05. Observe que para
(5)
a hipótese H0 encontramos F = 6, 41 =⇒ P r{F[1; 21] ≥ 6, 41} = 0, 0194.
Portanto, como 0, 0194 > 0, 0085, o nı́vel de significância conjunto não
está preservado em α = 0, 05. Daı́, o motivo pelo qual se recomenda que
os contrastes a serem julgados pelo teste F na ANOVA sejam ortogonais
entre si e estabelcidos no planejamento do experimento.

2.12 Comparações Múltiplas - Teste de Tukey

É importante lembrar que os testes de comparações múltiplas preservam o


nı́vel de significância conjunto.
38

• Para contrastar as hipóteses:


H0 : µi = µi′ vs H1 : µi 6= µi′ , i 6= i′ , i, i′ = 1, · · · , I,

• Calcular, com os dados do experimento, o valor da estatı́stica ∆, a saber:


s  
1 1 1
∆ = DM S = q[7; 21; 0,05] + s2
2 ri ri′
s  
1 1 1
= 4, 60 + 0, 0947 = 0, 708.
2 4 4

• Regra de decisão: rejeitar H0 : µi = µi′ , ao nı́vel de 5% de significância


se, e somente se, |ȳi − ȳi′ | > 0, 708.
Para o exemplo em questão, comparamos todos os possı́veis contrastes entre
duas médias pelo teste de Tukey, ao nı́vel de 5% de significância, e apresentamos
na tabela a seguir:

∆ = 0, 708
ȳ1 ȳ2 ȳ3 ȳ4 ȳ5 ȳ6
Médias 1,316 2,127 2,678 2,552 2,128 1,796
ȳ2 = 2, 127 S -
ȳ3 = 2, 678 S NS -
ȳ4 = 2, 552 S NS NS -
ȳ5 = 2, 128 S NS NS NS -
ȳ6 = 1, 796 NS NS S S NS -
ȳ7 = 1, 681 NS NS S S NS NS
S - Quando o valor absoluto da diferença entre a média da coluna i, (ȳi ) e
a média da linha i′ , (ȳi′ ) é maior que ∆ = 0, 708, atribui-se a letra S
e conclui-se que o contraste entre as médias µi e µi′ é estatisticamente
significativo, ao nı́vel de 5% de probabilidade.
NS - Quando o valor absoluto da diferença entre a média da coluna i, (ȳi ) e a
média da linha i′ , (ȳi′ ) não é maior que ∆ = 0, 708. atribui-se as letras N S
e conclui-se que o contraste entre as médias µi e µi′ não é estatisticamente
significativo, ao nı́vel de 5% de probabilidade.
Uma forma alternativa de apresentar os resultados das comparações das
médias é o seguinte:
ȳ3 = 2, 678 a
ȳ4 = 2, 552 a
ȳ5 = 2, 128 a b
ȳ2 = 2, 127 a b
ȳ6 = 1, 796 b c
ȳ7 = 1, 681 b c
ȳ1 = 1, 316 c
39

donde, se depreende que, as médias seguidas das mesmas letras não diferem
estatisticamente entre si, ao nı́vel de 5% de probabilidade pelo teste de Tukey.

2.13 Comprovação da idoneidade do modelo

Para que o tipo de análise que acabamos de realizar fosse possı́vel, admitimos
que:

a) Cada observação yij pode ser descrita pelo modelo aditivo:

yij = µ + τi + εij , i = 1, · · · , I e j = 1, · · · , ri

b) Os erros εij são variáveis aleatórias independentes e identicamente dis-


tribuı́das como uma normal de média zero e variância σ 2 . Isto é,
iid
εij ∼ N (0, σ 2 ).

Isso é verdade?????
Antes de concluirmos sobre os achados da pesquisa é necessário validar
o modelo. Ou seja, é preciso comprovar que as suposições impostas às ob-
servações yij e aos erros εij são válidas. Sem isso, as nossas conclusões serão
dúbias e poderemos correr o risco de concluir erroneamente sobre o que estamos
pesquisando. Ou melhor, uma pesquisa que não valida o modelo suposto para
descrever os dados não é digna de crédito.
Os resı́duos constituem a principal ferramenta para comprovar as suposições
proposto para descrever os dados. Se yij = µ + τi + εij é apropriado, os resı́duos
observados eij refletirão as propriedades exigidas para as perturbações εij . Esta
é a idéia básica na análise dos resı́duos. Assim, se as hipóteses relativas ao
modelo estão corretas os resı́duos variarão aleatoriamente. Ao contrário, se
descobrirmos que os resı́duos apresentam tendências sistemáticas inexplicáveis,
deveremos desconfiar da validez do modelo.

2.13.1 Obtenção dos resı́duos

Dadas as observações experimentais:

y11 , · · · , y1r1 , y21 , · · · , y2r2 , · · · , · · · , yI1 , · · · , yIrI ,

então, cada observação yij pode ser escrita como

yij = m + ti + eij , (i = 1, · · · , I e j = 1. · · · , ri ).
40

Utilizando o método dos mı́nimos quadrados, encontramos os estimadores


para as caracteı́sticas na população, conforme pode ser observado na tabela 2.9.

Tabela 2.9: Caracterı́sticas populacionais e estimadores

Caracterı́stica Estimador da
na população caracterı́stica
µ m = ȳ..

τi ti = ȳi. − ȳ..

E(yij ) = µ + τi = µi ŷij = m + ti = ȳi.

εij eij = yij − ŷij = yij − ȳi.

σ2 s2 = QM Res.

Por outro lado, se as suposições acerca do modelo estão corretas, deveremos


ter:
iid eij iid
eij ≈ N (0, σ 2 ) e zij = √ ≈ N (0, 1).
s2
E, segue que,
P r(−1 ≤ zij ≤ 1) ≈ 0, 6820
P r(−2 ≤ zij ≤ 2) ≈ 0, 9544
P r(−3 ≤ zij ≤ 3) ≈ 0, 9974.
Considerando os dados do exemplo 2.11.1, encontramos:


 t1 = 1, 316 − 2, 040 = −0, 724

 t2 = 2, 127 − 2, 040 = +0, 087
m = ȳ.. = 2, 040, ti = ȳi. − ȳ.. =⇒ ..

 .


t7 = 1, 681 − 2, 040 = −0, 359.

Na Tabela 5.6 apresentamos, para o exemplo 2.11.1, os valores observados


yij , os resı́duos
√ estimados eij = yij − ȳi. e os resı́duos padronizados estimados
zij = eij / s2 .
41

Tabela 2.10: Valores observados yij e resı́duos estimados eij e zij .

Repetições
Trat. R1 R2 R3 R4 ŷij = ȳi.
y1j 1,401 1,516 1,270 1,077 1,316
T1 e1j 0,085 0,200 -0,046 -0,239
z1j 0,2765 0,6506 -0,1496 -0,7775
y2j 2,537 2,069 2,104 1,798 2,127
T2 e2j 0,410 -0,058 -0,023 -0,329
z2j 1,3337 -0,1887 -0,0748 -1,0702
y3j 3,366 2,591 2,211 2,544 2,678
T3 e3j 0,688 -0,087 -0,467 -0,134
z3j 2,2381 -0,2830 -1,5191, -0,4359
y4j 2,536 2,459 2,827 2,386 2,552
T4 e4j -0,016 -0,093 0,275 -0,166
z4j -0,0520 -0,3025 0,8946 -0,5400
y5j 2,387 2,453 1,556 2,116 2,128
T5 e5j 0,259 0,325 -0,572 -0,012
z5j 0,8425 1,0572 -1,8607 -0,0390
y6j 1,997 1,679 1,649 1,859 1,796
T6 e6j 0,201 -0,117 -0,147 0,063
z6j 0,6538 -0,3806 -0,4782 0,2049
y7j 1,796 1,704 1,904 1,320 1,681
T7 e7j 0,115 0,023 0,223 -0,361
z7j 0,3741 0,0748 0,7254 -1,1743

As suposições serão verificadas por dois métodos: Análise gráfica dos resı́duos
e testes de hipóteses sobre os erros.
42

2.13.2 Análise dos resı́duos

Em geral, este procedimento consiste em representar graficamente os resı́duos


padronizados zij de várias formas, a saber:

a) Gráficos dos resı́duos na forma de Ramo-e-folha ou na forma de histograma


das freqüências;

b) Gráfico dos resı́duos contra a ordem de obtenção dos dados (tempo);

c) Gráfico dos resı́duos contra ŷij ;

d) Gráfico dos resı́duos contra xij (ou tratamentos);

e) Gráfico em qualquer direção que seja sensı́vel ao problema considerado.


O gráfico dos resı́duos eij (ou resı́duos padronizados zij ) contra os valores
ajustados pode apresentar um dos aspectos sugeridos pela Figura 2.1:

Figura 2.1: Gráficos dos resı́duos eij (ou zij ) contra ŷij
43

O Modelo é ideal para a ANOVA

Se o modelo associado aos dados é adequado, os resı́duos variarão aleatori-


amente e o gráfico dos resı́duos contra os valores ajustados terá uma aparência
próxima daquela sugerida pelo gráfico (a) da Figura 2.1.

Heterogeneidade das variâncias

Quando as variâncias são heterogêneas o gráfico de zij contra ŷij apresenta


um dos aspectos sugeridos pelos gráficos (e), (f) e (g) da Figura 2.1.

A não independência dos erros

Se há dependência entre os erros o gráfico de zij contra ŷij tem um aspecto
parecido com um dos gráficos da Figura 2.2

Figura 2.2: Gráfico dos resı́duos dij = zij contra ŷij , apresentando evidência
de autocorrelação
44

Presença de dados anômalos (outliers)

Se no conjunto de dados houver algum dado discrepante o gráfico dos resı́-


duos zij contra ŷij o identificará. Observe o gráfico (d) da Figura 2.1.

A ausência de normalidade

Para este fim, poderemos observar os seguintes gráficos:


i) Ramo-e-folha e histograma das freqüências. Fazer os gráficos dos reı́duos zij
e verificar se os mesmos não têm forma de sino com centro em zero.

ii) Gáfico de probabilidade normal. Plotar os resı́duos ordenados z(i) contra


[i − 1/2]/n no papel de probabilidade normal e observar se este não se
aproxima de uma reta.

Obs.: Caso os gráficos de Ramo-e-folha e histograma das freqüências tenham


forma de sino com centro em zero e o Gáfico de probabilidade normal
aproxime-se de uma reta, não teremos motivos para suspeitar da violação
da normalidade dos erros.

Gráficos dos resı́duos do exemplo de referência

Na Figura 2.3 encontram-se os gráficos dos resı́duos zij contra os valores


estimados ŷij e o gráfico de probabilidade normal, relativos ao dados do exemplo
2.11.1. Conforme se pode observar no primeiro, os resı́duos variam aleatoria-
mente, indicando que o modelo yij = µ + τi + εij é adequado para descrever
os dados e no segundo gráfico observa-se que o gráfico de probabilidade normal
aproxima-se de uma reta, evidenciando que os resı́duos seguem uma distribuição
normal.
45

2
1
Resíduos padronizados

0
−1
−2

1.4 1.6 1.8 2.0 2.2 2.4 2.6

Valores ajustados
0.6
0.4
0.2
Resíduos

0.0
−0.2
−0.4
−0.6

−2 −1 0 1 2

Theoretical Quantiles

Figura 2.3: Gráficos dos resı́duos padronizados contra valores estimados e


gráfico normal de probabilidade
46

A seguir, abordaremos alguns testes de hipóteses sobre o modelo adotado


para os dados, bem como, para os erros.

Testes para verificação da homogeneidade das variâncias

Existem vários testes para verificar a homogeneidade das variâncias, dentre


outros, apresentaremos os testes de Hartley, Cochran e Bartlett. Estes testes são
baseados nas suposições de que os dados são provenietes de populações normais,
independentes e que o número de repetições por tratamento é o mesmo. Isto
é, r1 = r2 = · · · = rI = J. Porém, se o número de repetições por tratamentos
forem diferentes os testes de Hartley e Cochran poderão ser aplicados, sendo
que os resultados serão apenas aproximados.

1. Teste de Hartley (1950)

Para contrastar as hipóteses,



 H0 : σ12 = · · · = σI2 = σ 2
vs

H1 : σi2 6= σi2′ , para i 6= i′ e i, i′ = 1, · · · , I.

Calculamos:
Máx(s2i )
Hexp =
Mı́n(s2i )
e comparamos o valor de Hexp com o percentil (1 − α)100 da distribuição
de H, isto é, H[I; (J−1); (1−α)] . Tais valores encontram-se tabelados por
Pearson & Hartley, para I tratamentos, (J − 1) graus de liberdade
de cada variância amostral s2i e nı́vel de significância α. Daı́, adotamos a
seguinte regra de decisão:

• Rejeitar H0 , ao nı́vel de significância α se, Hexp > H[I; (J−1); (1−α)] ,


• Aceitar H0 , ao nı́vel de significância α se, Hexp ≤ H[I; (J−1); (1−α)] .

Nota:PSe o número de repetições por tratamento for diferente, então,


J = I1 i ri ou simplesmente, J = rmax +r
2
min
.
Para o exemplo 2.11.1, Máx(s2i ) = s23 = 0, 238986 e Mı́n(s2i ) = s26 =
0, 026556. Portanto,

Máx(s2i ) s23 0, 238986


H= 2 = 2 = = 8, 999.
Mı́n(si ) s6 0, 026556

Como Hexp = 8, 999 < H[7; 3; 0,05] = 72, 9. Não rejeitamos H0 , ao nı́vel de
5% de significância e concluı́mos que as variâncias são homogêneas.
47

2. Teste de Cochran (1947)

Para contrastar as hipóteses,



 H0 : σ12 = · · · = σI2 = σ 2
vs

H1 : σi2 6= σi2′ , para i 6= i′ e i, i′ = 1, · · · , I.

Calculamos:
s2(M áx)
Cexp = P 2
i si

Comparamos com o valor do percentil (1 − α)100 da distribuição de C, ou


seja, C[I; (J−1); (1−α)] . Tais valores foram tabelados por Cochran, para
I tratamentos, (J − 1) graus de liberdade de cada variância amostral e
nı́vel de significância α. Tal como no teste de Hartley, se oPnúmero
de repetições por tratamento forem diferentes, então, J = I1 i ri ou
simplesmente, J = rmax +r 2
min
. A regra de decião é a seguinte:
• Rejeitar H0 , ao nı́vel de significância α se, Cexp > C[I; (J−1); (1−α)] ,
• Aceitar H0 , ao nı́vel de significância α se, Cexp ≤ C[I; (J−1); (1−α)] .
Para o nosso exemplo, tem-se
s2(M áx) 0, 238986
Cexp = P 2 = = 0, 360.
s
i i 0, 663081

Como Cexp = 0, 360 < C[7; 3; 0,99] = 0, 568, não rejeitamos H0 , ao nı́vel de
5% de significância, e concluı́mos que as variâncias são homogêneas.
3. Teste de Bartlett (1937)
Para contrastar as hipóteses

 H0 : σ12 = · · · = σI2 = σ 2
vs

H1 : σi2 6= σi2′ , para i 6= i′ e i, i′ = 1, 2, · · · , I

Calculamos:
 P 
1  X ( y )2
j ij 
s2i = y2 − , i = 1, · · · , I,
ri − 1 j ij ri

1 X X
MA = (ri − 1)s2i , onde, n= ri
n−I i i
e q
MG = n−I
(s21 )r1 −1 (s22 )r2 −1 · · · (s2I )rI −1 .
48

Sabemos que, para qualquer conjunto de valores, a média geométrica é


sempre menor qua a média aritmética, quer dizer, M G ≤ M A, verificando-
se a igualdade apenas quando todos os valores envolvidos forem iguais.
Aplicando tal propriedade, tem-se que:
MA
• Se M G aproxima-se de 1, temos evidência de que as variâncias popu-
lacionais são iguais;
MA
• se M G for grande, há evidência de que as variâncias populacionais
são desiguais.
MA
Pode-se pensar de modo similar que loge MG = loge (M A) − loge (M G).
Bartlett demonstrou que se as I amostras aleatórias são provenientes
de populações normais independentes, a estatı́stica
n−I
B= [loge (M A) − loge (M G)] ,
C
segue, sob H0 e para tamanho de amostras grandes, uma distribuição de
qui-quadrado com (I − 1) graus de liberdade, onde
" I #
1 X 1 1
C =1+ − .
3(I − 1) i=1 ri − 1 n − I

Para facilitar os cálculos, esta estatı́stica também pode ser escrita como:
" I
#
1 X
2
B= (n − I) loge (M A) − (ri − 1) loge si .
C i=1

Considerando o dados do exemplo 2.11.1, temos:


s2i loge s2i
s21 = 0, 035487 loge s21 = −3, 338589
s22 = 0, 093411 loge s22 = −2, 370746
s23 = 0, 238986 loge s23 = −1, 431350
s24 = 0, 037362 loge s24 = −3, 287101
s25 = 0, 166678 loge s25 = −1, 791691
s26 = 0, 026556 loge s26 = −3, 628500
s27 = 0, 064601 loge s27 = −2, 739525
P
7 P
7
s2i = 0, 663081 log s2i = −18, 587502
i=1 i=1

7
1 X X
MA = (ri − 1)s2i , onde, n= ri = 28
n − I i=1 i
7 7
1 X 3 X 2
= (4 − 1)s2i = s
28 − 7 i=1 21 i=1 i
0, 663081
= = 0, 094726.
7
49
" I #
1 X 1 1
C = 1+ −
3(I − 1) i=1 ri − 1 n − I
 
1 7 1
= 1+ − = 1, 126984.
3 × 6 3 21
e
" I
#
1 X
2
Bexp = (n − I) loge (M A) − (ri − 1) loge si
C i=1
" I
#
1 X
= 21 loge (0, 094726) − 3 loge s2i
1, 126984 i=1
1
= [21 loge (0, 094726) − 3(−18, 587502)] = 5, 564.
1, 126984

Regra de decisão:
• Rejeitar H0 se, e somente se, Bexp > χ2[(I−1) ; α]
• Aceitar H0 se, e somente se, Bexp ≤ χ2[(I−1) ; α] .

Portanto, como Bexp = 5, 564 < χ2[6; 0,05] = 12, 60, não rejeitamos H0
e conclı́mos, ao nı́vel de significância de 5%, que as variâncias são ho-
mogêneas.
4. Existem outros testes: Levene(1974), Han(1969), etc...

Teste para verificar a independência dos erros


O efeito da dependência entre os resı́duos pode ser um problema muito grave e
difı́cil de corrigir, por isso é importante prevenı́-lo quando os dados estão sendo
recolhidos. O método mais eficiente para prevenir a dependência é adotar um
procedimento apropriado de aleatorização.
1. Teste de Durbin-Watson

Calcula-se o coeficiente de autocorrelação de primeira ordem ρ̂ e a estatı́stica


de teste d de Durbin-Watson:
Pn Pn 2
t=2 et et−1 t=2 (et − et−1 )
ρ̂ = e d =
(n − 1)s2 (n − I)s2
O coeficiente de autocorrelação ρ, varia de −1 a +1. E, conforme Hoffmann
& Vieira(1998), para n bastante grande d = 2(1 − ρ̂). Então,

Se ρ̂ → +1 =⇒ d → 0, (existe autocorrelação positiva),


Se ρ̂ → −1 =⇒ d → 4, (existe autocorrelação negativa),
Se ρ̂ → 0 =⇒ d → 2, (não há autocorrelação).
50

Assim, para testar a hipótese ao nı́vel de significância α:


(1)
H0 :ρ=0 vs H1 : ρ > 0.
(1)
• Se d < dL , rejeita-se H0 ,
(1)
• Se d > dU , não se hejeita H0 ,
• Se dL < d < dU , o resultado é inconclusivo.
onde, dL e dU são valores crı́ticos do teste de Durbin-Watson tabelados para
diferentes valores de n e p = número de variáveis independentes e nı́veis de
significância de 1% e 5%. (ver Hoffmann & Vieira(1998), pg.: 371-372).
Para testar a hipótese ao nı́vel de significância α:
(2)
H0 :ρ=0 vs H1 : ρ < 0.
(2)
• Se d > 4 − dL , rejeita-se H0 ,
(2)
• Se d < 4 − dU , não se hejeita H0 ,
• Se 4 − dU < d < 4 − dL , o resultado é inconclusivo.
Para o nosso exemplo de referência, encontramos(PROC GLM/SAS):

dL = 0, 70 ⇒ 4 − dL = 3, 30
ρ̂ = −0, 2845, d = 2, 50, e para α = 0, 05
dU = 1, 83 ⇒ 4 − dU = 2, 17.
(1)
Portanto, não rejeitamos H0 e o resultado do teste é inconclusivo para verificar
(2)
H0 , (α = 0, 05).
Os autores afirmam que o teste de Durbin-Watson é apropriados para
dados em seqüência no tempo. Uma forma de resolver o problema da autocor-
relação entre os resı́duos é incluir no modelo o fator tempo. Os autores afirmam
ainda, que para I, J ≥ 4 ou quando n é muito grande comparado com I os
efeitos das correlações são negligenciáveis.

Teste para verificação de valores anômalos (outlier’s)


.

Não há nenhum teste formal para se detectar valores anômalos.


Já sabemos que se o modelo é adequado para os dados, então,

 P r(−1 < zij < +1) ≈ 0, 68
zij ≈ N (0, 1) =⇒ P r(−2 < zij < +2) ≈ 0, 95

P r(−3 < zij < +3) ≈ 0, 99
Dessa forma, se zij < −3 ou zij > +3 deveremos suspeitar da observação
correspondente.
Uma forma de resolver o problema do outlier é eliminar do conjunto de
dados e refazer as análises.
51

Testes para verificação da normalidade dos erros


1. Teste do qui-quadrado
Se o número de observações é suficientemente grande, podemos aplicar um
teste de aderência. Isto é, para contrastar as hipóteses:

H0 : os erros seguem distribuição normal


H1 : os erros não seguem distribuição normal

Estabelecemos a distribuição das freqüências dos zij em intervalos de classe


e, calculamos
Xk
(F oi − F ei )2
X2 = ,
i=1
F ei
onde F oi é a freqüência observada na classe i e F ei é a respectiva freqüên-
cia esperada sob a hipótese de que zij ∼ N (0, 1).
Sob H0 , X 2 ∼ χ2[K] .
Rejeitamos H0 , ao nı́vel de significância α, se X 2 ≥ χ2[K, α] .

2. Teste de Lilliefors (1967) Para contrastar as hipóteses

H0 : Os erros têm distribuição normal


H1 : Os erros não têm distribuição normal

Procedimento:
• Ordenar os zij em ordem crescente, obtendo-se:

z(1) ≤ z(2) ≤ · · · ≤ z(n) .

• Obter F (z(i) ) = proporção de valores esperados ≤ z(i) . Isto é, Φ(z(i) ) e


o correspondente S(z(i) ) = proporção de valores obtidos ≤ x(i) . Isto
é, S(z(i) ) = K/n, onde K é o número de ordem (i).

• Calcular D = Supz(i) [F (z(i) ) − S(z(i) )], [F (z(i) ) − S(z(i−1) )] de
cada par.
Rejeitamos H0 ao nı́vel de significância α se D ≥ d. Os valores da
distribuição de d encontrm-se tabelados no livro de Humberto de
Campose.
3. Teste de Shapiro-Wilk

H0 : Os erros têm distribuição normal


H1 : Os erros não têm distribuição normal

O PROC UNIVARIATE DO SAS com declaração NORMAL PLOT re-


torna o valor da estatı́stica W de Shapiro-Wilk.
Se Wc ≥ W rejeitamos H0 ao nı́vel de significância α.
52

2.13.3 Transformaçõs nos dados


Caso seja identificada a violação de uma ou mais suposições acerca do modelo,
faz-se necessário adotar uma das seguintes medidas corretoras: 1) Modificar o
modelo proposto para descrever os dados. Esta atitude pode levar a análises
estatı́sticas extremamente complexas; 2) Fazer uma transformação adequada
dos dados; 3) quando a dificuldade básica é a falta de normalidade, deveremos
aplicar algum teste estatı́stico não-paramétrico, tal como, o teste da mediana,
o teste de Kruskal-Wallis, teste de Friedman, etc.
A seguir, de modo extremamente resumido, apresentaremos os tipos de trans-
formação utilizadas para corrigir a falta de normalidade e para estabilizar a
variância.

Transformações para estabilizar a variância


a) Quando σy2 for proporcional a µ

y∗ = y,

b) Quando σy for proporcional a µ

y ∗ = log y,

c) Quando σy for proporcional a µ2


1
y∗ = ,
y

d) De modo geral, quando σy ∝ µα

y ∗ = y 1−α .

Assim, em resumo, teremos:

Relação entre
σy e µ α λ=1−α Transformação
σi = Kµ2i 2 -1 Recı́proca
3/2
σi = Kµi 3/2 -1/2 Inversa da raiz
σi = Kµi 1 0 Logarı́tmica
σi = Kµ1/2 1/2 1/2 Raiz quadrada
σi = K 0 1 Não transformar

Transformações para corrigir a falta de normalidade


a) Se yij ∼ bin(ni , pi ), então:
p
∗ yij + 3/8
yij = arcsen p
ri + 3/4
53

b) Se yij ∼ P oisson(λ), então:


∗ √ ∗
p
yij = yij ou yij = yij + 1

c) Se yij ∼ Lognorma, então:



yij = log yij

d) Transformação de Box & Cox(1964)


 (y +m)−1
 ij λ , se λ 6= 0
(λ)
yij = −→ (estabiliza variância)

ln(yij + m), se λ = 0
 λ

 yijλ−1 , se λ 6= 0
(λ)
yij = −→ (normaliza os dados).

 ln y , se λ = 0
ij
54

2.14 Experimento inteiramente casualizado com


nı́veis quantitativos do fator tratamento.
Exemplo 2.14.1 (Bussab, W. O. & Morettin, P. A. (2004), p. 213.)
Para estudar o tempo de reação a um estı́mulo visual foram considerados 20
indivı́duos com idade entre 20 e 40 anos. Os resultados observados dos tempos
de reação ao estı́mulo visual, para cada indivı́duo, encontram-se na Tabela 2.16.

Tabela 2.11: Tempo de reação a um estı́mulo visual em função da idade


Tratamentos Indivı́duos Total Média
(idade em anos) 1 2 3 4 (yi. ) (ȳi. )
T1 = 20anos 96 92 106 100 394 98,50
T2 = 25anos 98 104 110 101 413 103,25
T3 = 30anos 116 106 109 100 431 107,75
T4 = 35anos 112 105 118 108 443 110,75
T5 = 40anos 113 112 127 117 469 117,25
Soma - - - - 2150 107,50

Fazer as análises estatı́sticas dos dados.

Cálculo das somas dos quadrados:


Inicialmente calculamos a correção para média, isto é,
(y.. )2 (2150)2
C= = = 231125, 00;
n 5×4
e em seguida as somas dos quadrados:
X
2
SQT otal = yij −C
i,j

= (96)2 + (92)2 + · · · + (117)2 − 231125, 00 = 1373, 00;

X y2 I
i. 1X 2
SQT rat. = −C = y −C
i
ri J i=1 i.
1
= [(394)2 + · · · + (469)2 ] − 231125, 00 = 819, 00;
4
SQRes. = SQT otal − SQT rat. = 1373, 00 − 819, 00 = 554, 00.
A análise da variância
Para contrastar a hipótese de igualdade das médias contra a hipótese alter-
nativa, isto é,
(1) (1)
H0 : µ1 = µ2 = · · · = µ5 = µ vs H1 : µi 6= µi′ , para algum i 6= i′ ,
55

Tabela 2.12: A análise da variância

Fvariação GL SQ QM F
(1)
Trat.(H0 : µ1 = · · · = µ5 = µ) 4 819,00 204,75 5, 54∗∗
Resı́duo 15 554,00 36,93 -
Total 19 1373,00 - -

utilizaremos a análise da variância, cujos resultados encontram-se na Tabela


2.17.
A tabela da distribuição F com 4 graus de liberdade do numerador e 15
graus de liberdade do denominador, ao nı́vel de 1% de significância, nos fornece
F[4; 15; 0,01] = 4, 89. Assim, como F = 5, 54 > F[4; 15; 0,01] = 4, 89, então rejeita-
(1)
mos a hipótese H0 e concluı́mos, ao nı́vel de 1% de significância que existe pelo
menos um contraste entre duas médias dos tratamentos que é estatı́sticamente
significativo. Podemos concluir também, que o efeito da idade sobre o tempo
de reação ao estı́mulo visual é estatı́sticamente significativo ao nı́vel de 1% de
probabilidade.
Para dar sequência às análises estatı́sticas do experimento, deveremos des-
dobrar os 4 graus de liberdade dos tratamentos em componentes polinomiais de
primeiro a quarto graus, cada um com 1 grau de liberdade. Tal desdobramente
deve-se ao fato de que os nı́veis do fator tratamento (Idade) são quantitativos
e é mais informativo estudar o comportamento do tempo de reação ao estı́mulo
visual em relação à idade. A técnica consiste de assumir a priori que os tempos
de reação podem ser escritos por um modelo polinomial de grau (I − 1). Para
este exemplo, teremos:

Yi = β0 + β1 Xi + β2 Xi2 + β3 Xi3 + β4 Xi4 + ǫi , i = 1, 2, · · · , n.

A nossa tarefa, em termos de análises estatı́sticas, é contrastar as hipóteses,

H0 : βg = 0 vs H1 : βg 6= 0, para g = 1, 2, 3, 4.

e em seguida selecionar o modelo que descreve a variável resposta adequadamen-


te em função das rejeições das hipóteses H0 : βg = 0, com g = 1, 2, · · · , (I − 1).
Para este fim, utilizaremos a técnica dos polinômios ortogonais, cujas somas
dos quadrados são calculadas da seguinte forma:
 5 2  5 2
P P
cgi yi. cgi yi.
SQ(Comp. g o
i=1 i=1
¯ grau) = JKg
ou SQ(H0 : βg = 0) =
JKg

onde, os valores dos coeficientes cgi encontram-se tabelados para o número de


nı́veis equidistantes do fator em estudo. Os detalhes da teoria sobre polinômios
ortogonais serão estudados posteriormente.
56

Para o exemplo que estamos considerando, os nı́veis do fator tratamento são


equidistantes, ou seja, as distâncias entre as idades consideradas no experimento
são todas iguais a 5 anos: 20, 25, 30, 35 e 40. E, de acordo com Gomes, F. P.
1985, pg. 243-251, os coeficientes são dados pela Tabela 2.18.

Tabela 2.13: Coeficientes dos polinômios ortogonais para 5 nı́veis

Tratamentos Coeficientes Total


(Idade em anos) c1i c2i c3i c4i yi.
20 -2 +2 -1 +1 394
25 -1 -1 +2 -4 413
30 0 -2 0 +6 431
35 +1 -1 -2 -4 443
40 +2 +2 +1 +1 469
Kg 10 14 10 70
5 35
Mg 1 1 6 12

De posse das informações contidas na Tabela 2.18 podemos calcular as somas


dos quadrados de cada componente, a saber:
 2
P
5
c1i yi.
SQ(Comp. 1o
¯ grau) =
i=1
JK1
[−2(394) − 1(413) + 0(431) + 1(443) + 2(469)]2
=
4 × 10
= 810, 0000;
 5 2
P
c2i yi.
SQ(Comp. 2o
¯ grau) =
i=1
JK2
[2(394) − 1(413) − 2(431) − 1(443) + 2(469)]2
=
4 × 14
= 1, 1429;
 5 2
P
c3i yi.
SQ(Comp. 3o
¯ grau) =
i=1
JK3
[−1(394) + 2(413) + 0(431) − 2(443) + 1(469)]2
=
4 × 10
= 5, 6250;
 5 2
P
c4i yi.
SQ(Comp. 4o
¯ grau) =
i=1
JK4
57

[1(394) − 4(413) + 6(431) − 4(443) + 1(469)]2


=
4 × 70
= 2, 2321.

Usando a notação SQ(H0 : βg = 0) em lugar de SQ(Comp. g o¯ grau), reestru-


(.)

turamos a análise da variância, cujos resultados encontram-se na tabela 2.19.

Tabela 2.14: A análise da variância


Fvariação GL SQ QM F
(2)
H0 : β1 = 0 1 810,00 810,00 21, 93∗∗
(3)
H0 : β2 = 0 1 1,14 1,14 0,03
(4)
H0 : β3 = 0 1 5,63 5,63 0,15
(5)
H0 : β4 = 0 1 2,23 2,23 0,06
(1)
Trat.(H0 : µ1 = · · · = µ5 = µ) (4) (819,00) 204,75 5, 54∗∗
Resı́duo 15 554,00 36,93 -
Total 19 1373,00 - -

De acordo com a Tabela 2.19, os valores obtidos para a estatı́stica F rela-


(3) (4) (5)
tivos às hipóteses H0 , H0 e H0 foram todos inferiores ao valor crı́tico da
distribuição F , ao nı́vel de 5% de significância, ou seja, F[1; 15; 0,05] = 4, 54. Isto
indica que os componentes polinomiais de segundo, terceiro e quarto graus são
todos estatisticamente nulos. Por isso, as somas dos quadrados dos componen-
tes de segundo, terceiro e quarto graus podem ser reunidas em uma só, com 3
(6)
graus de liberdade, o qual denotaremos por SQ(H0 : β2 = β3 = β4 = 0). Isto
é,
(6) (3) (4)
SQ(H0 : β2 = β3 = β4 = 0) = SQ(H0 : β2 = 0) + SQ(H0 : β3 = 0) +
(5)
SQ(H0 : β4 = 0)
= 1, 14 + 5, 63 + 2, 23 = 9, 00.

Com este resultado, a nova tabela da análise da variância fica:

Tabela 2.15: A análise da variância


Fvariação GL SQ QM F
(2)
H0 : β1 = 0 1 810,00 810,00 21, 93∗∗
(6)
H0 : β2 = β3 = β4 = 0 3 9,00 3,00 0,08
(1)
Trat.(H0 : µ1 = · · · = µ5 = µ) (4) (819,00) 204,75 5, 54∗∗
Resı́duo 15 554,00 36,93 -
Total 19 1373,00 - -

(6)
Conforme podemos observar a hipótese H0 também não foi rejeitada ao
nı́vel de 5% de significância.
58

(2)
Por outro lado, o valor obtido para a estatı́stica F relativo a hipótese H0
foi F = 21, 93, o qual é maior que F[1; 15; 0,01] = 8, 68. Assim sendo, rejeitamos a
(2)
hipótese H0 e concluı́mos ao nı́vel de 1% de significância que o componente de
primeiro grau não é nulo e o modelo apropriado para estimar o comportamento
médio do tempo de reação ao estı́mulo visual em relação a idade é um polinômio
do primeiro grau. Isto é,

Ŷ = Ê(Y |x) = β̂0 + β̂1 x, 20 ≤ x ≤ 40.

em que β̂0 e β̂1 serão obtidos de acordo com as técnicas dos polinômios ortogo-
nais, conforme se segue.
O polinômio, até um certo grau g, tem a seguinte expressão:

Ŷi = Ȳ + B1 M1 P1 + B2 M2 P2 + · · · + Bg Mg Pg , (i = 1, 2, · · · , I)

onde,
P P P P
yi. c1i yi. c2i yi. cgi yi.
Ȳ = IJ ;
i
B1 = i
JK1 ; B2 = i
JK2 ; · · · ; Bg = i
JKg .

As constantes Mg e Kg são obtidas das tabelas dos polinômios ortogonais, e Ŷ


é o estimador do tempo médio de reação oa estı́mulo visual relativa a idade x e
Pg são os polinômios de grau g, em que:

I 2 −1 3I 2 −7
P1 = x; P2 = x2 − 12 ; P3 = x3 − 20 x; ··· e

Xi −X̄
x= q , (por exemplo).

onde, Xi são os nı́veis do fator e q é a equidistância entre os nı́veis.


Para o nosso exemplo, precisamos estimar um modelo do primeiro grau e
para tal, calculamos:
P P
i yi. 2150 c1i yi. 180
Ȳ = = = 107, 5; B1 = i = = 4, 5
IJ 5×4 JK1 4 × 10

e o polinômio P1 = x = Xi q−X̄ = Xi −30


5 .
Portanto, fazendo as devidas substituições, teremos:
 
Xi − 30
Ŷi = Ȳ + B1 M1 P1 = 107, 5 + 4, 5 × 1 × = 80, 5 + 0, 9Xi .
5

Portando, uma estimativa do tempo médio de reação ao estı́mulo visual para


uma dada idade X = x é dada por:

Ê(Y |X = x) = ŷ = 80, 5 + 0, 9x, 20 ≤ x ≤ 40.


59

125
120
Tempo de reação ao estímulo visual

115
110
105
100
95

20 25 30 35 40

Idade

Figura 2.4: Comportamento médio do tempo de reação ao estı́mulo visual em


relação a idade, estimado pelo modelo: Ŷ = 80, 5 + 0, 9X.
60

Exemplo 2.14.2 A tabela a seguir apresenta os valores observados de um ex-


perimento utilizado por Ye, W. M. M. (2008), pg. 252. O experimento teve
com objetivo, estudar o efeito da temperatura sobre a quantidade de um com-
posto quı́mico dissolvido em cem gramas de água.

Temperatura Repetição Total Média


(o C) 1 2 3 (yi. ) (ȳi. )
T1 = 00 8 6 8 22 7,3
T2 = 15 12 10 14 36 12,0
T3 = 30 25 21 24 70 23,3
T4 = 45 31 33 28 92 30,7
T5 = 60 44 39 42 125 41,7
T6 = 75 48 51 44 143 47,6
Total - - - 488 27,1

Sabendo-se que os totais dos tratamentos, as constantes Kg e Mg e os coefi-


cientes dos polinômios ortogonais para 6 nı́veis encontram-se na tabela a seguir,

Tratamentos Coeficientes Totais


(Ti ) c1i c2i c3i c4i c5i (ȳi. )
T1 = 00 -5 +5 -5 +1 -1 22
T2 = 15 -3 -1 +7 -3 +5 36
T3 = 30 -1 -4 +4 +2 -10 70
T4 = 45 +1 -4 -4 +2 +10 92
T5 = 60 +3 -1 -7 -3 -5 125
T6 = 75 +5 +5 +5 +1 +1 143
Kg 70 84 180 28 252 488
3 5 7 21
Mg 2 2 3 12 10 -

Pede-se:
Fazer uma análise estatı́stica dos dados obtidos no experimento, tecendo co-
mentários e tirando conclusões.
61

Exemplo 2.14.3 A tabela a seguir apresenta os valores observados da produção


em ton/ha de um experimento de competição de variedades RB ′ s de cana-de-
açúcar, conduzido por um pesquisador de melhoramento genético da Estação
Experimental de Cana-de-açúcar de Carpina - PE. O objetivo principal do
pesquisador era selecionar as melhores variedades para região.

Variedades Repetição Total Média


(o C) 1 2 3 4 (yi. ) (ȳi. )
V1 110,8 104,6 105,7 109,2 430,3 107,6
V2 99,1 98,1 97,1 99,3 393,6 98,4
V3 98,2 97,2 96,2 96,7 388,3 97,1
V4 96,3 97,3 95,2 97,9 386,7 96,7
V5 98,4 97,3 97,4 100,5 393,6 98,4
V6 88,5 89,5 90,4 87,1 355,5 88,9
Total - - - - 2348,0 97,8

Pede-se:

1. Admitindo que yij = µ + τi + εij , (i = 1, 2, · · · , 6 e j = 1, 2, 3, 4), é apro-


priado para descrever as observações, encontre as estimativas de mı́nimos
quadrados para os parâmetros do modelo;

2. Fazer uma análise dos resı́duos para verificar se podemos assumir a validez
das suposições: aditividade do modelo, normalidade e independência dos
erros e homogeneidade das variâncias;

3. Fazer as análises estatı́sticas cabı́veis dos dados experimentais, fazendo


comentários e tirando conclusões.
62

2.15 Experimento inteiramente casualizado com


nı́veis quantitativos do fator tratamento.
Exemplo 02: (Bussab, W. O. & Morettin, P. A. (2004), p. 213)
Para estudar o tempo de reação a um estı́mulo visual foram considerados 20
indivı́duos com idade entre 20 e 40 anos. Os resultados observados dos tempos
de reação ao estı́mulo visual, para cada indivı́duo, encontram-se na Tabela 2.16.

Tabela 2.16: Tempo de reação a um estı́mulo visual em função da idade


Tratamentos Indivı́duos Total Média
(idade em anos) 1 2 3 4 (yi. ) (ȳi. )
T1 = 20anos 96 92 106 100 394 98,50
T2 = 25anos 98 104 110 101 413 103,25
T3 = 30anos 116 106 109 100 431 107,75
T4 = 35anos 112 105 118 108 443 110,75
T5 = 40anos 113 112 127 117 469 117,25
Soma - - - - 2150 107,50

Cálculo das somas dos quadrados:


Inicialmente calculamos a correção para média, isto é,
(y.. )2 (2150)2
C= = = 231125, 00;
n 5×4
e em seguida as somas dos quadrados:
X
2
SQT otal = yij −C
i,j

= (96)2 + (92)2 + · · · + (117)2 − 231125, 00 = 1373, 00;

X y2 I
i. 1X 2
SQT rat. = −C = y −C
i
ri J i=1 i.
1
= [(394)2 + · · · + (469)2 ] − 231125, 00 = 819, 00;
4
SQRes. = SQT otal − SQT rat. = 1373, 00 − 819, 00 = 554, 00.
A análise da variância
Para contrastar a hipótese de igualdade das médias contra a hipótese alter-
nativa, isto é,
(1) (1)
H0 : µ1 = µ2 = · · · = µ5 = µ vs H1 : µi 6= µi′ , para algum i 6= i′ ,
utilizaremos a análise da variância, cujos resultados encontram-se na Tabela
2.17.
63

Tabela 2.17: A análise da variância


Fvariação GL SQ QM F
(1)
Trat.(H0 : µ1 = · · · = µ5 = µ) 4 819,00 204,75 5, 54∗∗
Resı́duo 15 554,00 36,93 -
Total 19 1373,00 - -

A tabela da distribuição F com 4 graus de liberdade do numerador e 15


graus de liberdade do denominador, ao nı́vel de 1% de significância, nos fornece
F[4; 15; 0,01] = 4, 89. Assim, como F = 5, 54 > F[4; 15; 0,01] = 4, 89, então rejeita-
(1)
mos a hipótese H0 e concluı́mos, ao nı́vel de 1% de significância que existe pelo
menos um contraste entre duas médias dos tratamentos que é estatı́sticamente
significativo. Podemos concluir também, que o efeito da idade sobre o tempo
de reação ao estı́mulo visual é estatı́sticamente significativo ao nı́vel de 1% de
probabilidade.
Para dar sequência às análises estatı́sticas do experimento, deveremos des-
dobrar os 4 graus de liberdade dos tratamentos em componentes polinomiais de
primeiro a quarto graus, cada um com 1 grau de liberdade. Tal desdobramente
se deve ao fato de que os nı́veis do fator tratamento (Idade) são quantitativos
e é mais informativo estudar o comportamento do tempo de reação ao estı́mulo
visual em relação à idade. A técnica consiste de assumir a priori que os tempos
de reação podem ser escritos por um modelo polinomial de grau (I − 1). Para
este exemplo, teremos:

Yi = β0 + β1 Xi + β2 Xi2 + β3 Xi3 + β4 Xi4 + ǫi , i = 1, 2, · · · , n.

A nossa tarefa, em termos de análises estatı́sticas, é contrastar as hipóteses,

H0 : βg = 0 vs H1 : βg 6= 0.

e em seguida selecionar o modelo que descreve a variável resposta adequadamen-


te em função das rejeições das hipóteses H0 : βg = 0, com g = 1, 2, · · · , (I − 1).
Para este fim, utilizaremos a técnica dos polinômios ortogonais, cujas somas
dos quadrados são calculadas da seguinte forma:
 5 2  5 2
P P
cgi yi. cgi yi.
SQ(Comp. g o
i=1 i=1
¯ grau) = JKg
ou SQ(H0 : βg = 0) =
JKg

onde, os valores dos coeficientes cgi encontram-se tabelados para o número de


nı́veis equidistantes do fator em estudo. Os detalhes da teoria sobre polinômios
ortogonais serão estudados posteriormente.
Para o exemplo que estamos considerando, os nı́veis do fator tratamento são
equidistantes, ou seja, as distâncias entre as idades consideradas no experimento
são todas iguais a 5 anos: 20, 25, 30, 35 e 40. E, de acordo com Gomes, F. P.
1985, pg. 243-251, os coeficientes são dados pela Tabela 2.16.
64

Tabela 2.18: Coeficientes dos polinômios ortogonais para 5 nı́veis


Tratamentos Coeficientes Total
(Idade em anos) c1i c2i c3i c4i yi.
20 -2 +2 -1 +1 394
25 -1 -1 +2 -4 413
30 0 -2 0 +6 431
35 +1 -1 -2 -4 443
40 +2 +2 +1 +1 469
Kg 10 14 10 70
5 35
Mg 1 1 6 12

De posse das informações contidas na Tabela 2.18 podemos calcular as somas


dos quadrados de cada componente, a saber:
 2
P
5
c1i yi.
SQ(Comp. 1o
¯ grau) =
i=1
JK1
[−2(394) − 1(413) + 0(431) + 1(443) + 2(469)]2
=
4 × 10
= 810, 0000;
 5 2
P
c2i yi.
SQ(Comp. 2o
¯ grau) =
i=1
JK2
[2(394) − 1(413) − 2(431) − 1(443) + 2(469)]2
=
4 × 14
= 1, 1429;
 5 2
P
c3i yi.
SQ(Comp. 3o
¯ grau) =
i=1
JK3
[−1(394) + 2(413) + 0(431) − 2(443) + 1(469)]2
=
4 × 10
= 5, 6250;
 5 2
P
c4i yi.
SQ(Comp. 4o
¯ grau) =
i=1
JK4
[1(394) − 4(413) + 6(431) − 4(443) + 1(469)]2
=
4 × 70
= 2, 2321.

Usando a notação SQ(H0 : βg = 0) em lugar de SQ(Comp. g o¯ grau), reestru-


(.)
65

turamos a análise da variância, cujos resultados encontram-se na tabela 2.19.

Tabela 2.19: A análise da variância


Fvariação GL SQ QM F
(2)
H0 : β1 = 0 1 810,00 810,00 21, 93∗∗
(3)
H0 : β2 = 0 1 1,14 1,14 0,03
(4)
H0 : β3 = 0 1 5,63 5,63 0,15
(5)
H0 : β4 = 0 1 2,23 2,23 0,06
(1)
Trat.(H0 : µ1 = · · · = µ5 = µ) (4) (819,00) 204,75 5, 54∗∗
Resı́duo 15 554,00 36,93 -
Total 19 1373,00 - -

De acordo com a Tabela 2.19, os valores obtidos para a estatı́stica F rela-


(3) (4) (5)
tivos às hipóteses H0 , H0 e H0 foram todos inferiores ao valor crı́tico da
distribuição F , ao nı́vel de 5% de significância, ou seja, F[1; 15; 0,05] = 4, 54. Isto
indica que os componentes polinomiais de segundo, terceiro e quarto graus são
todos estatisticamente nulos. Por isso, as somas dos quadrados dos componen-
tes de segundo, terceiro e quarto graus podem ser reunidas em uma só, com 3
(6)
graus de liberdade, o qual denotaremos por SQ(H0 : β2 = β3 = β4 = 0). Isto
é,
(6) (3) (4)
SQ(H0 : β2 = β3 = β4 = 0) = SQ(H0 : β2 = 0) + SQ(H0 : β3 = 0) +
(5)
SQ(H0 : β4 = 0)
= 1, 14 + 5, 63 + 2, 23 = 9, 00.

Com este resultado, a nova tabela da análise da variância fica:

Tabela 2.20: A análise da variância


Fvariação GL SQ QM F
(2)
H0 : β1 = 0 1 810,00 810,00 21, 93∗∗
(6)
H0 : β2 = β3 = β4 = 0 3 9,00 3,00 0,08
(1)
Trat.(H0 : µ1 = · · · = µ5 = µ) (4) (819,00) 204,75 5, 54∗∗
Resı́duo 15 554,00 36,93 -
Total 19 1373,00 - -

(6)
Conforme podemos observar a hipótese H0 também não foi rejeitada ao
nı́vel de 5% de significância.
(2)
Por outro lado, o valor obtido para a estatı́stica F relativo a hipótese H0
foi F = 21, 93, o qual é maior que F[1; 15; 0,01] = 8, 68. Assim sendo, rejeitamos a
(2)
hipótese H0 e concluı́mos ao nı́vel de 1% de significância que o componente de
primeiro grau não é nulo e o modelo apropriado para estimar o comportamento
66

médio do tempo de reação ao estı́mulo visual em relação a idade é um polinômio


do primeiro grau. Isto é,

Ŷ = Ê(Y |x) = β̂0 + β̂1 x, 20 ≤ x ≤ 40.

em que β̂0 e β̂1 serão obtidos de acordo com as técnicas dos polinômios ortogo-
nais, conforme se segue.
O polinômio, até um certo grau g, tem a seguinte expressão:

Ŷi = Ȳ + B1 M1 P1 + B2 M2 P2 + · · · + Bg Mg Pg , (i = 1, 2, · · · , I)

onde,
P P P P
yi. c1i yi. c2i yi. cgi yi.
Ȳ = IJ ;
i
B1 = i
JK1 ; B2 = i
JK2 ; · · · ; Bg = i
JKg .

As constante Mg e Kg são obtidas das tabelas dos polinômios ortogonais, e Ŷ


é o estimador do tempo médio de reação oa estı́mulo visual relativa a idade x e
Pg são os polinômios de grau g, em que:

I 2 −1 3I 2 −7
P1 = x; P2 = x2 − 12 ; P3 = x3 − 20 x; ··· e

Xi −X̄
x= q , (por exemplo).

onde, Xi são os nı́veis do fator e q é a equidistância entre os nı́veis.


Para o nosso exemplo, precisamos estimar um modelo do primeiro grau e
para tal, calculamos:
P P
i yi. 2150 c1i yi. 180
Ȳ = = = 107, 5; B1 = i = = 4, 5
IJ 5×4 JK1 4 × 10

e o polinômio P1 = x = Xi q−X̄ = Xi −30


5 .
Portanto, fazendo as devidas substituições, teremos:
 
Xi − 30
Ŷi = Ȳ + B1 M1 P1 = 107, 5 + 4, 5 × 1 × = 80, 5 + 0, 9Xi .
5

Portando, uma estimativa do tempo médio de reação ao estı́mulo visual para


uma dada idade X = x é dada por:

Ê(Y |X = x) = ŷ = 80, 5 + 0, 9x, 20 ≤ x ≤ 40.


67

125
120
Tempo de reação ao estímulo visual

115
110
105
100
95

20 25 30 35 40

Idade

Figura 2.5: Comportamento médio do tempo de reação ao estı́mulo visual em


relação a idade, estimado pelo modelo: Ŷ = 80, 5 + 0, 9X.

Exercı́cio 03: A tabela a seguir apresenta os valores observados de um


experimento utilizado por Ye, W. M. M. (2008), pg. 252. O experimento
teve com objetivo, estudar o efeito da temperatura sobre a quantidade de um
composto quı́mico dissolvido em cem gramas de água.

Temperatura Repetição Total Média


(o C) 1 2 3 (yi. ) (ȳi. )
T1 = 00 8 6 8 22 7,3
T2 = 15 12 10 14 36 12,0
T3 = 30 25 21 24 70 23,3
T4 = 45 31 33 28 92 30,7
T5 = 60 44 39 42 125 41,7
T6 = 75 48 51 44 143 47,6
Total - - - 488 27,1

Sabendo-se que os totais dos tratamentos, as constantes Kg e Mg e os coeficientes


dos polinômios ortogonais para 6 nı́veis encontram-se na tabela a seguir,
68

Tratamentos Coeficientes Totais


(Ti ) c1i c2i c3i c4i c5i (ȳi. )
T1 = 00 -5 +5 -5 +1 -1 22
T2 = 15 -3 -1 +7 -3 +5 36
T3 = 30 -1 -4 +4 +2 -10 70
T4 = 45 +1 -4 -4 +2 +10 92
T5 = 60 +3 -1 -7 -3 -5 125
T6 = 75 +5 +5 +5 +1 +1 143
Kg 70 84 180 28 252 488
3 5 7 21
Mg 2 2 3 12 10 -

Pede-se:
Fazer uma análise estatı́stica dos dados obtidos no experimento, tecendo
comentários e tirando conclusões.

Exercı́cio 04: A tabela a seguir apresenta os valores observados da produção


em ton/ha de um experimento de competição de variedades RB ′ s de cana-de-
açúcar, conduzido por um pesquisador de melhoramento genético da Estação
Experimental de Cana-de-açúcar de Carpina - PE. O objetivo principal do
pesquisador era selecionar as melhores variedades para região.

Variedades Repetição Total Média


(o C) 1 2 3 4 (yi. ) (ȳi. )
V1 110,8 104,6 105,7 109,2 430,3 107,6
V2 99,1 98,1 97,1 99,3 393,6 98,4
V3 98,2 97,2 96,2 96,7 388,3 97,1
V4 96,3 97,3 95,2 97,9 386,7 96,7
V5 98,4 97,3 97,4 100,5 393,6 98,4
V6 88,5 89,5 90,4 87,1 355,5 88,9
Total - - - - 2348,0 97,8

Pede-se:

1. Admitindo que yij = µ + τi + εij , (i = 1, 2, · · · , 6 e j = 1, 2, 3, 4), é apro-


priado para descrever as observações, encontre as estimativas de mı́nimos
quadrados para os parâmetros do modelo;

2. Fazer uma análise dos resı́duos para verificar se podemos assumir a validez
das suposições: aditividade do modelo, normalidade e independência dos
erros e homogeneidade das variâncias;

3. Fazer as análises estatı́sticas cabı́veis dos dados experimentais, fazendo


comentários e tirando conclusões.
69

UEPB - CCT - DME


COORDENAÇÃO DE ESTATÍSTICA

AV-2 / UT-1
DISCIPLINA: Planejamento de Experimentos DATA: 24/03/2009
PROFESSOR: João Gil de Luna NOTA:...................
ALUNO(A): MATRÍCULA: 2009.1

A tabela a seguir apresenta os valores observados de um experimento con-


duzido com o objetivo de avaliar o efeito da temperatura sobre a quantidade de
um composto quı́mico dissolvido em cem gramas de água.

Temperatura Repetição Total Média


(o C) 1 2 3 (yi. ) (ȳi. )
T1 = 00 8 6 8 22 7,3
T2 = 15 12 10 14 36 12,0
T3 = 30 25 21 24 70 23,3
T4 = 45 31 33 28 92 30,7
T5 = 60 44 39 42 125 41,7
T6 = 75 48 51 44 143 47,6
Total - - - 488 27,1

Sabendo-se que os totais dos tratamentos, as constantes Kg e Mg e os coeficientes


dos polinômios ortogonais para 6 nı́veis encontram-se na tabela a seguir,

Tratamentos Coeficientes Totais


(Ti ) c1i c2i c3i c4i c5i (ȳi. )
T1 = 00 -5 +5 -5 +1 -1 22
T2 = 15 -3 -1 +7 -3 +5 36
T3 = 30 -1 -4 +4 +2 -10 70
T4 = 45 +1 -4 -4 +2 +10 92
T5 = 60 +3 -1 -7 -3 -5 125
T6 = 75 +5 +5 +5 +1 +1 143
Kg 70 84 180 28 252 488
3 5 7 21
Mg 2 2 3 12 10 -

Pede-se:
Fazer uma análise estatı́stica dos dados obtidos no experimento, tecendo
comentários e tirando conclusões.

BOM TRABALHO
70

UEPB - CCT - DME


COORDENAÇÃO DE ESTATÍSTICA

AV-2 / UT-1
DISCIPLINA: Planejamento de Experimentos DATA: 26/03/2009
PROFESSOR: João Gil de Luna NOTA:...................
ALUNO(A): MATRÍCULA: 2009.1

A tabela a seguir apresenta os valores observados da produção em ton/ha


de um experimento de competição de variedades RB ′ s de cana-de-açúcar, con-
duzido por um pesquisador de melhoramento genético da Estação Experimental
de Cana-de-açúcar de Carpina - PE. O objetivo principal do pesquisador era
selecionar as melhores variedades para região.

Variedades Repetição Total Média


(o C) 1 2 3 4 (yi. ) (ȳi. )
V1 110,8 104,6 105,7 109,2 430,3 107,6
V2 99,1 98,1 97,1 99,3 393,6 98,4
V3 98,2 97,2 96,2 96,7 388,3 97,1
V4 96,3 97,3 95,2 97,9 386,7 96,7
V5 98,4 97,3 97,4 100,5 393,6 98,4
V6 88,5 89,5 90,4 87,1 355,5 88,9
Total - - - - 2348,0 97,8

Pede-se:

1. Admitindo que yij = µ + τi + εij , (i = 1, 2, · · · , 6 e j = 1, 2, 3, 4), é apro-


priado para descrever as observações, encontre as estimativas de mı́nimos
quadrados para os parâmetros do modelo;

2. Fazer uma análise dos resı́duos para verificar se podemos assumir a validez
das suposições: aditividade do modelo, normalidade e independência dos
erros e homogeneidade das variâncias;

3. Fazer as análises estatı́sticas cabı́veis dos dados experimentais, fazendo


comentários e tirando conclusões.

BOM TRABALHO
Capı́tulo 3

Experimentos em blocos
completos casualizados

3.1 Generalidades
• Leva em consideração os três princı́pios básicos da experimentação, quais
sejam: Repetição, Casualização e Controle local;

• É o delineamento mais empregado na experimentação;

• Deverá ser utilizado sempre que tivermos dúvida ou certeza da heterogenei-


dade do ambiente no qual vamos instalar o experimento ou do material
experimental a ser utilizado;

• Cada bloco deverá ser um ambiente homogêneo, onde será instalado aleato-
riamente um conjunto completo dos tratamentos, constituindo dessa forma,
uma repetição;

• Uma vantagem é que esse tipo de delineamento experimental controla uma


outra fonte de variação, que é atribuı́do aos efeitos dos blocos. Com isso
teremos a estimativa da variância do erro casual menor;
• Uma desvantagem é que a perda de uma ou mais unidades experimen-
tais resulta um problema mais sério do que o delineamento inteiramente
casualizado.

71
72

3.2 Um possı́vel desenho desse tipo de ensaio no


campo, com I=5 tratamentos e J=4 blocos.

A distribuição dos tratamentos dentro dos ambientes homogênios (blocos)


pode assumir várias configurações. Dentre outras, apresentamos a seguir, uma
delas.

T3 T1 T5 T4 T2 −→ B1

T5 T2 T4 T1 T3 −→ B2

T1 T4 T2 T3 T5 −→ B3

T4 T3 T1 T5 T2 −→ B4

Observe que:

1. cada bloco contém um conjunto completo dos tratamentos;

2. os tratamentos são distribuı́dos aleatoriamente dentro de cada bloco.

3.3 Organização dos dados numa tabela

É importante que os valores observados no experimento sejam organizados,


de modo conveniente, para facilitar as análises estatı́sticas subsequentes. A
73

seguir, apresentamos uma sugestão de tabela para esta finalidade.

Tratamentos Blocos Total Média


Ti 1 2 ··· j ··· J yi. mi = ȳi
T1 y11 y12 · · · y1j ··· y1J y1. m1 = ȳ1.
T2 y21 y22 · · · y2j ··· y2J y2. m2 = ȳ2.
.. .. .. .. .. .. ..
. . . . . . .
Ti yi1 yi2 ··· yij ··· yiJ yi. mi = ȳi.
.. .. .. .. .. .. ..
. . . . . . .
TI yI1 yI2 ··· yIj ··· yIJ yI. mI = ȳI.
Total y.1 y.2 ··· y.j ··· y.J y..
Média ȳ.1 ȳ.2 ··· ȳ.j ··· ȳ.J m = ȳ..

onde,
J
X I
X I X
X J
yi. = yij , y.j = yij , y.. = yij ,
j=1 i=1 i=1 j=1

yi. y.j y..


ȳi. = , ȳ.j = , ȳ.. = .
J I IJ

3.4 O modelo matemático e suposições

O modelo matemático usado para descrever as observações de um experi-


mento em blocos completos casualizados, é o seguinte:

i = 1, 2, · · · , I
yij = µ + τi + βj + εij , (3.1)
j = 1, 2, · · · , J
onde,

• yij é o valor da variável resposta obtido da unidade de observação que


recebeu o tratamento i no j-ésimo bloco;

• µ é a média geral;

• τi é o efeito do i-ésimo tratamento, aqui considerado fixo, i = 1, 2, · · · , I;

• βj é o efeito do j-ésimo bloco, também considerado fixo, j = 1, 2, · · · , J;

• εij é a contribuição do acaso. Isto é, as causas das variações da variável


resposta devidas a outros fatores não considerados no modelo (3.1). Além
disso, supomos que os erros εij são variáveis aleatórias independentes e
identicamente distribuı́das como uma normal de média zero e variância
constante, σ 2 .
74

Nestas condições, teremos:

E(µ) = µ, E(µ2 ) = µ2 , E(τi ) = τi , E(τi2 ) = τi2 ,

E(βj ) = βj , E(βj2 ) = βj2 , E(εij ) = 0, E(ε2ij ) = σ 2 ,

E(µτi ) = µτi , E(µβj ) = µβj , E(µεij ) = 0, E(τi βj ) = τi βj ,

E(τi εij ) = 0, E(βj εij ) = 0, E(εij εrs ) = 0, ∀ i 6= r ou j 6= s.

Além disso, sendo µ a média geral, τi e βj de efeitos fixos, então cumpre-se que

I
X J
X
τi = 0 e βj = 0. (3.2)
i=1 j=1

3.5 Estimativas dos parâmetros

Dadas as observações experimentais (as amostras):

y11 , y12 · · · , y1J , y21 , y22 , · · · , y2J , · · · , yi1 , yi2 · · · , yiJ , · · · , yI1 , yI2 , · · · , yIJ .

O modelo matemático associado aos dados (associado às amostras), fica:

yij = m + ti + bj + eij . (3.3)

Aplicando o método dos mı́nimos quadrados e admitindo as restrições na


P
I P
J
solução do sistema de equações normais, ti = 0 e bj = 0, encontramos:
i=1 j=1

m = ȳ.. −→ o estimador de µ,

ti = ȳi. − ȳ.. −→ o estimador de τi ,

bj = ȳ.j − ȳ.. −→ o estimador de βj ,

ŷij = ȳi. + ȳ.j − ȳ.. −→ o estimador de E(yij ) = µ + τi + βj ,

eij = yij − ȳi. − ȳ.j + ȳ.. −→ o estimador de εij ,

s2 = QM Res. −→ o estimador de σ 2 .
(3.4)
Observação: veremos posteriormente que s2 = QM Res. é um estimador não
viciado para variância do erro experimental, εij .
75

3.6 Decomposição da variabilidade total

Para comparar globalmente os efeitos dos tratamentos e/ou dos blocos,


emprega-se a técnica da análise da variância que se baseia na decomposição
da variabilidade total dos dados em partes componentes. Para isto, substitui-se
os estimadores em (3.4) na expressão (3.3) e chega-se a identidade:
yij = ȳ.. + (ȳi. − ȳ.. ) + (ȳ.j − ȳ.. ) + (yij − ȳi. − ȳ.j + ȳ.. ) (3.5)
ou
yij − ȳ.. = (ȳi. − ȳ.. ) + (ȳ.j − ȳ.. ) + (yij − ȳi. − ȳ.j + ȳ.. ) (3.6)
que elavando-se, os dois lado, ao quadrado e somando-se para todas as ob-
servações, obtem-se
X J
I X I
X J
X I X
X J
(yij − ȳ.. )2 = J (ȳi. − ȳ.. )2 +I (ȳ.j − ȳ.. )2 + (ȳij − ȳi. − ȳ.j + ȳ.. )2
i=1 j=1 i=1 j=1 i=1 j=1
(3.7)
onde, os duplos produtos se anulam uma vez que os termos na identidade são
ortogonais entre si.
Assim, desenvolvendo algebricamente, a expressão (3.7) resulta em:
! ! !
XX
I J
1X
I
1X
J
2 2 2
yij −C = yi. −C + y.j −C
J I
i=1 j=1 i=1 j=1
| {z } | {z } | {z }
SQT otal SQT rat. SQBlocos
! ! !
I X
X J
1 X
I
1 X
J
2 2 2
+ yij −C − yi. −C − y.j −C .
J I
i=1 j=1 i=1 j=1
| {z }
SQRes.

onde,
(y.. )2
C= .
I ×J
Dessa forma, teremos:
SQRes. = SQT otal − SQT rat. − SQBlocos
e
SQT otal = SQT rat. + SQBlocos + SQRes. (3.8)
Em palavras, a variabilidade total é decomposta em três partes componentes: a
variabilidade devida aos efitos dos blocos, mais a variabilidade devida aos efeitos
dos tratamentos mais a variabilidade do acaso.
Os quadrados médios das partes componentes são dadas pela razão entre as
somas dos quadrados e seus respectivos graus de liberdade. Isto é,
SQT rat SQBlocos SQRes
QM T rat = , QM Blocos = e QM Res = .
I −1 J −1 (I − 1)(J − 1)
76

3.7 Distribuição de probabilidade dos estimadores


e das somas dos quadrados

Aquı́, apresentaremos apenas os resultados encontrados para as distribuições


de probabilidade dos estimadores dos parâmetros do modelo (3.1) e para as
somas dos quadrados em (3.7). As demonstrações desses resultados poderão ser
obtidas utilizando-se procedimentos análogos àqueles apresentados na seção 2.7.

Tabela 3.1: Distribuições de probabilidade dos estimadores dos parâmetros e


das somas dos quadrados

σ2
 (µ)
m = ȳ.. ∼ N µ; e sob H0 : µ = 0, C
∼ χ2(1)
IJ σ2

(I−1) 2
 (1) SQT rat.
ti = ȳi. − ȳ.. ∼ N τi ; IJ σ e sob H0 : τi = 0, ∼ χ2(I−1)
σ2

(J−1) 2
 (2) SQBlocos
bj = ȳ.j − ȳ.. ∼ N βj ; IJ σ , e sob H0 : βj = 0, ∼ χ2(J−1)
σ2

(I−1)(J−1) 2
 (1) (2) SQRes.
eij = yij − ŷij ∼ N 0; σ e indep. de H0 e H0 , ∼ χ2[(I−1)(J−1)]
IJ σ2

(IJ−1) 2
 (1) (2) SQT otal
yij − ȳ.. ∼ N τi + βj ; σ e sob H0 e H0 , ∼ χ2(IJ−1) .
IJ σ2

Dividindo-se os dois lados da expressão (3.8) por σ 2 , ou seja,

SQT otal SQT rat. SQBlocos SQRes.


2
= + + (3.9)
σ σ2 σ2 σ2
e representando cada termo da expressão (3.9) por suas respectivas distribuições
de probabilidade, isto é,

χ2(IJ−1) = χ2(I−1) + χ2(J−1) + χ2[(I−1)(J−1)] .

justificamos, conforme o teorema de Cochran, a independência entre a SQT rat.,


SQBlocos e SQRes., uma vez que, (IJ − 1) = (I − 1) + (J − 1) + (I − 1)(J − 1).
77

3.8 Valores esperados das somas dos quadrados


e dos quadrados médios

Utilizando-se o método da análise da variância1 , que consiste de encontrar


os valores esperados dos quadrados médios envolvidos na análise da variância,
obtém-se:
P
I P
I
E(SQT rat) = (I − 1)σ 2 + J τi2 =⇒ E(QM T rat) = σ 2 + J
I−1
τi2 ,
i=1 i=1

P
J P
J
E(SQBlocos) = (J − 1)σ 2 + I βj2 =⇒ E(QM Blocos) = σ 2 + I
J−1
βj2 ,
j=1 j=1

E(SQRes) = (I − 1)(J − 1)σ 2 =⇒ E(QM Res) = σ 2 .

Observe que QM Res é um estimador não viciado para σ 2 , a variância do


erro.

3.9 Análises estatı́sticas

Geralmente, num experimento em blocos casualizados, o maior interesse é


testar a hipóteses de que os efeitos dos tratamentos sobre a variável resposta não
existem, o que é equivalente a testar a hipótese de que as médias dos tratamento
são todas iguais, ou seja,
(τ ) (τ )
H0 : τ1 = · · · = τI = 0 vs H1 : τi 6= 0, para pelo menos um τi , i = 1, · · · , I.
que é equivalente a
(τ ) (τ )
H0 : µ1 = · · · = µI = µ vs H0 : µi 6= µi′ , para pelo menos um par (µi , µi′ ), i 6= i′ .

Não muito raro, também é de interesse testar a hipótese da não existência


dos efeitos dos blocos. Isto é,
(β) (b)
H0 : β1 = · · · = βJ = 0 vs H1 : βi 6= 0, para pelo menos um βj , j = 1, · · · , J.

Considerando os resultados apresentados na seção 3.8 podemos concluir que:


(τ )
• Sob H0 : τ1 = · · · = τI = 0, o QM T rat é um estimador não viciado para
σ2 ;
(β)
• Sob H0 : β1 = · · · = βJ = 0, o QM Blocos é um estimador não tendecioso
para σ 2 ;
1 Ver livro: Componentes de variância do Profo. Décio Barbin (1998), FEALQ.
ESALQ/USP. Piracicaba - SP.
78

(τ ) (β)
• Independentemente de que se verifique H0 e/ou H0 , o QM Res. é um
estimador não viciado para σ 2 .
No entanto, percebe-se que:
– Se os efeitos dos tratamentos não forem todos nulos, o valor esperado
de QM T rat é maior que σ 2 ;
– Também, se os efeitos dos blocos não forem todos nulos, o valor
esperado de QM Blocos é maior que σ 2 .
Portanto, um teste para verificar tanto a hipótese nula de igualdade das
médias dos tratamentos como a hipótese nula de igualdade das médias dos blo-
cos, deve ser aquele que compara QM T rat com QM Res e QM Blocos com
QM Res.
????????????? ESCREVER DAQUI PARA FRENTE ??????????????
A partir destes resultados, podemos organizar a tabela da análise da variância
a seguir:

Tabela 3.2: Tabela da análise da variância

F. Varição GL SQ QM F
(β) QM Bloco
Bloco (H0 ) ν1 = (J − 1) SQBloco QM Bloco QM Res

(τ ) QM T rat.
Tratamento (H0 ) ν2 = (I − 1) SQT rat. QM T rat. QM Res.

Resı́duo ν = (I − 1)(J − 1) SQRes. QM Res. = s2 -


Total IJ − 1 SQT otal

(β)
Sob H0 : β1 = · · · = βJ = 0, a estatı́stica
QM Bloco
F = ∼ F[ν1 ; ν] ,
QM Res
(τ )
Sob H0 : τ1 = · · · = τI = 0, a estatı́stica
QM T rat.
F = ∼ F[ν2 ; ν]
QM Res.
(β) (τ )
Rejeitamos as hipóteses H0 e H0 , ao nı́vel de significância α se, e somente
se, F = QM Blocos QM T rat.
QM Res. > F[ν1 ; ν] e F = QM Res. > F[ν2 ; ν] , respectivamente. E, con-
cluimos, ao nı́vel de significância α, que os efeitos dos blocos e dos tratamentos
sobre a variável resposta não são nulo (ou que os efeitos dos blocos e dos trata-
mentos sobre a variável resposta são estatisticamente significativos). Ou ainda,
que as médias da variável resposta relativas aos blocos e aos tratamentos não
são todas iguais.
79

3.10 Teste de comparações múltiplas - Tukey

Para contrastar a hipóteses de igualdade entre duas médias de tratamentos,


isto é,

H0 : µi = µi′ vs H1 : µi 6= µi′ , ∀ i 6= i′ . i, i′ = 1, 2, · · · , I.

Calculamos
r
QM Res
DM S = ∆ = q[I, (I−1)(J−1), α]
J
e comparamos com o valor de |ŷh | = |mi − mi′ |. Se este for maior que ∆
concluimos que as médias µi e µi′ diferem estatisticamente entre si, pelo método
de Tukey ao nı́vel α de significância.

3.11 Um exemplo de aplicação

Num estudo sobre o processo de preparo de amostras na diagnose


foliar de cana-de-açúcar, foram considerados os seguintes tratamentos:

T1: Folhas sem sofrerem limpeza;

T2: Folhas sofrendo apenas a passagem de escova acoplada a aspidador de pó;

T3: Folhas lavadas em água corrente e enxaguadas em água destilada e desmi-


neralizada;

T4: Folhas lavadas em solução diluı́da de detergente (ODD a 0,1%), a seguir


com água destilada, depois com HCL 0,1 N e finalmente com água desmi-
neralizada;

T5: Folhas lavadas em solução diluı́da de detergente (ODD a 0,1%) enxaguada


em água destilada até remoção do detergente e finalmente água desmine-
ralizada.

Os resultados observados no experimento, para o teor de cobre (ppm), en-


contram-se apresentados na Tabela 3.3:
Pede-se:

1. Fazer a análise da variância;

2. Contrastar, ao nı́vel α = 0, 05, pelo teste F , as seguintes hipóteses sobre


80

Tabela 3.3: Resultados do teor de cobre (ppm) encontrados nas amostras de


folha de cana-de-açúcar.

Blocos
Trat. 1 2 3 4 5 6 7 8 Total Média
T1 11,5 12,7 12,6 12,2 10,4 12,0 12,2 8,5 92,1 11,5
T2 7,7 9,0 9,1 8,6 8,8 8,6 8,4 8,4 68,6 8,6
T3 9,8 8,0 7,4 9,5 8,3 8,9 10,5 10,4 72,8 9,1
T4 10,7 10,8 10,2 9,6 9,8 10,1 11,1 11,5 83,8 10,5
T5 12,0 10,9 10,3 9,8 9,4 9,5 9,7 10,1 81,7 10,2
Total 51,7 51,4 49,6 49,7 46,7 49,1 51,9 48,9 399,0 10,0

as médias dos tratamentos:


(1) µ2 +µ3 +µ4 +µ5 (1) µ2 +µ3 +µ4 +µ5
H0 : µ1 = 4 vs H1 : µ1 6= 4

(2) µ2 +µ3 µ4 +µ5 (2) µ2 +µ3 µ4 +µ5


H0 : 2 = 2 vs H1 : 2 6= 2

(3) (3)
H0 : µ2 = µ3 vs H1 : µ2 6= µ3

(4) (4)
H0 : µ4 = µ5 vs H1 : µ4 6= µ5 .

As hipóteses acima são equivalentes, respectivamente, a:


(1) τ2 +τ3 +τ4 +τ5 (1) τ2 +τ3 +µ4 +τ5
H0 : τ1 = 4 vs H1 : τ1 6= 4

(2) τ2 +τ3 τ4 +τ5 (2) τ2 +µ3 τ4 +τ5


H0 : 2 = 2 vs H1 : 2 6= 2

(3) (3)
H0 : τ2 = τ3 vs H1 : τ2 6= τ3

(4) (4)
H0 : τ4 = τ5 vs H1 : τ4 6= τ5 .

3. Aplique o teste de Tukey à taxa de 5% de probabilidade às médias.

SOLUÇÃO:
a) Cálculos da correção e das somas dos quadrados:

y..2 (399, 0)2


C= = = 3980, 03;
IJ 5×8
X
2
SQT otal = yij − C = (11, 5)2 + (12, 7)2 + · · · + (10, 1)2 − 3980, 03 = 75, 99;
i,j
81

8
1X 2 1 
SQBlocos = y.j − C = (51, 7)2 + · · · + (48, 9)2 − 3980, 03 = 4, 30;
I j=1 5
5
1X 2 1 
SQT rat = yi. − C = (92, 1)2 + · · · + (81, 7)2 − 3980, 03 = 43, 17;
J i=1 8
SQRes. = SQT otal − SQBlocos − SQT rat. = 75, 99 − 4, 30 − 43, 17 = 28, 52.

1) A análise da variância

F. Variação GL SQ QM F
(β)
Blocos(H0 : β1 = · · · = β8 = 0) 7 4,30 0,61
(τ )
Tratamentos(H0 : τ1 = · · · = τ5 = 0) 4 43,17 10,79 10, 58∗∗
Resı́duo 28 28,52 s2 =1,02
Total 39 75,99
(τ )
Como F = 10, 58 > F[4, 28, 0,01] = 4, 07, rejeitamos H0 : τ1 = · · · = τ8 = 0, ao
nı́vel de significância de 1% e concluimos que existe pelo menos um contraste
entre duas média dos tratamentos estatisticamente significativo (ou que pelo
menos um dos tratamento tem efeito significativo sobre o teor de cobre nas
folhas).

2) Cálculos das estimativas dos contrastes das médias e respectivas somas


dos quadrados das hipóteses de interesse:
(1) µ2 + µ3 + µ4 + µ5 (1)
H0 : µ1 = é equivalente a H0 : 4µ1 − µ2 − µ3 − µ4 − µ5 = 0.
4
Portanto, a estimativa do contraste é:
ȳ2 + ȳ3 + ȳ4 + ȳ5
ψ̂1 = ȳ1 −
4
8, 6 + 9, 1 + 10, 5 + 10, 2
= 11, 5 − = 1, 90ppm
4
e a soma dos quadrados do contraste é:
 I 2
P
c1i yi. 2
(1) i=1 [4y1. − 1y2. − 1y3. − 1y4. − 1y5. ]
SQH0 = =
JK1 8 × 20
2
[4(92, 1) − 1(68, 6) − 1(72, 8) − 1(83, 8) − 1(81, 7)]
=
160
(61, 5)2
= = 23, 64;
160
De modo análogo, teremos:
(2) µ2 + µ3 µ4 + µ5 (2)
H0 : = é equivalente a H0 : µ2 + µ3 − µ4 − µ5 = 0.
2 2
82

ȳ2. + ȳ3. ȳ4. + ȳ5. 8, 6 + 9, 1 10, 5 + 10, 2


ψ̂2 = − = − = −1, 50ppm;
2 2 2 2
e
 2
P
I
c2i yi. 2
(2) i=1 [0(y1. ) + 1(y2. ) + 1(y3. ) − 1(y4. ) − 1(y5. )]
SQH0 = =
JK2 8×4
(68, 6 + 72, 8 − 83, 8 − 81, 7)2 (−24, 1)2
= = = 18, 15;
32 32
(3) (3)
H0 : µ2 = µ3 é equivalente a H0 : µ2 − µ3 = 0.
ψ̂3 = ȳ2. − ȳ3. = 8, 6 − 9, 1 = −0, 50ppm;
 2
P
I
c3i yi. 2
(3) i=1 [0(y1. ) + 1(y2. ) − 1(y3. ) + 0(y4. ) + 0(y5. )]
SQH0 = =
JK3 8×2
2 2
(68, 6 − 72, 8) (−4, 2)
= = = 1, 10;
16 16
(4) (4)
H0 : µ4 = µ5 é equivalente a H0 : µ4 − µ5 = 0.
ψ̂4 = ȳ4. − ȳ5. = 10, 5 − 10, 2 = 0, 30ppm;
 2
P
I
c4i yi. 2
(4) i=1 [0(y1. ) + 0(y2. ) + 0(y3. ) + 1(y4. ) − 1(y5. )]
SQH0 = =
JK4 8×2
(83, 8 − 81, 7)2 (2, 1)2
= = = 0, 28.
16 16
A nova tabela da análise da variância fica:

F. Variação GL SQ QM F
(1)
H0 : τ1 = τ2 +τ3 +τ
4
4 +τ5
1 23,64 23,64 23, 18∗∗
(2) τ2 +τ3 τ4 +τ5
H0 : 2 = 2 1 18,15 18,15 17, 79∗∗
(3)
H0 : τ2 = τ3 1 1,10 1,10 1,08
(4)
H0 : τ4 = τ5 1 0,28 0,28 0,27
(τ )
Tratamentos(H0 : τ1 = · · · = τ5 = 0) (4) (43,17) 10.79 10.58∗∗
(β)
Blocos(H0 : β1 = · · · = β8 = 0) 7 4,30
Resı́duo 28 28,52 1,02
Total 39 75,99

F[1, 28, 0,01] = 7, 64, F[1, 28, 0,05] = 4, 20 e F[4, 28, 0,01] = 4, 70
(τ ) (1) (2)
Portanto, as hipóteses H0 , H0 e H0 foram rejeitadas ao nı́vel de 1% de
significância pelo teste F . Daı́, podemos tirar as seguintes conclusões:
83

(τ )
• a rejeição de H0 nos leva a concluir que pelo menos um tratamento tem
efeito estatisticamente significativo sobre o teor de cobre nas folhas;
(1)
• a rejeição de H0 nos conduz a concluir que existe fortes evidências de
que o teor médio de cobre nas folhas que não passaram por nenhum tipo
de limpeza é maior que o teor médio de cobre daquelas que passaram por
algum tipo de limpeza. A estimativa deste contraste foi de 1,90ppm;
(2)
• a rejeição de H0 nos leva a concluir que, dentre as folhas que passaram
por algum tipo de limpeza, aquelas que não foram limpas com solução
diluı́da de detergente ODD a 0,1%, T2 e T3 , apresentaram menores teores
médios de cobre do que as folhas que no seu processo de limpeza utilizou
o detergente. A estimativa deste contraste foi de -1,50ppm.

3) Teste de Tukey

Para contrastar as hipóteses

H0 : µi = µi′ vs H1 : µi 6= µi′ , ∀ i 6= i′ , i, i′ = 1, · · · , 5

Calculamos:
 
I
|ŷh | = |mi − mi′ |, para h = 1, · · · , , i < i′ = 2, · · · , 5
2
e comparamos com
r r
QM Res 1, 02
∆ = q[5, 28, 0,05] = 4, 13 = 1, 47.
J 8
Os confrontos das médias pelo método de Tukey ao nı́vel de 5% de sig-
nificância encontram-se a seguir:

∆ = 1, 47

m1 m2 m3 m4
Médias 11,5 8,6 9,1 10,5
m2 = 8, 6 S
m3 = 9, 1 S NS
m4 = 10, 5 NS S NS
m5 = 10, 2 NS S NS NS
Se |mi − mi′ | > 1, 47 rejeitamos H0 : µi = µi′ e concluimos, ao nı́vel de
significância de 5%, que µi 6= µi′ e denotamos por S = Significativo e, caso
contrário, denotamos por N S = Não significativo. Assim, o teor médio de co-
bre nas folhas do tratamento T1 , isto é, µ1 , difere estatisticamente das médias
dos tratamento T2 e T3 , isto é, µ2 e µ3 e o teor médio de cobre nas folhas
do tratamento T2 , ou seja µ2 , difere estatisticamente de µ4 e µ5 , pelo teste de
84

Tukey a 5% de significância. Os demais confrontos das médias não apresentaram


significância estatı́stica.

Não esquecer de validar o modelo!!!!!!!!!!!!

Obs.: No processo de validação do modelo, observar que não é possı́vel se


verificar a hipótese de homogeneidade das variâncias, a menos que se tenha, em
cada bloco, mais de uma observação por tratamento.

Exercı́cio #2: [Leal, J. G. & Porras, A. M. L.(1998)] Uma indústria


algodoeira, está interessada em maximizar o rendimento das sementes de al-
godão. A indústria quer comprovar se o rendimento das sementes depende do
tipo de fertilizante utilizado para tratar a planta. A sua disposição tem 5 tipos
de fertilizantes. Como pode haver diferença entre as unidades experimentais,
o experimentador decide utilizar um delineamento em blocos ao acaso. Para
este fim, ele divide o terreno em 4 blocos e cada bloco em 5 parcelas e distribui
aleatoriamente os 5 fertilizantes nas parcelas de cada bloco. Após a colheita, os
rendimentos das parcela foram anotados e encontram-se na tabela a seguir.

Tabela 3.4: Rendimento por parcela de sementes de algodão

Fertilizantes Blocos Totais Médias


(Tratamentos) B1 B2 B3 B4 (yi. ) ȳi.
F1 87 86 88 83 344 86,00
F2 85 87 95 85 352 88,00
F3 90 92 95 90 367 91,75
F4 89 97 98 88 372 93,00
F5 99 96 91 90 376 94,00
Totais (y.j ) 450 458 467 436 1811 90,55

Exercı́cio #2: [Leal, J. G. & Porras, A. M. L.(1998)] Um laboratório


utiliza 4 fornos na fabricação de um determinado produto. Desconfia-se que
a temperatura afeta a dureza do produto obtido. Cada forno pode operar a
4 temperaturas distintas. É sabido que cada forno tem suas próprias carac-
terı́sticas de operação, de modo que eles se consideram uma variável influente
na fabricação do dito produto. É utilizado um delineamento em blocos casu-
alizados considerando os fornos como blocos. Os resultados do experimento
encontram-se na tabela a seguir

a) Existe alguma evidência de que a teperatura influi na dureza do produto?

b) Existe alguma evidência de que os fornos influem na dureza do produto?


85

Tabela 3.5: Resultados das durezas dos produtos considerando-se as 4 tempe-


raturas

Temperaturas Fornos Totais Médias


(o C) F1 F2 F3 F4 (yi. ) (ȳi. )
T1 = 80 7 6 10 5 28 7,00
T2 = 90 9 7 12 8 36 9,00
T3 = 100 7 15 10 7 39 9,75
T4 = 110 12 6 5 10 33 8,25
Totais 35 34 37 30 136 8,50

c) Desdobrar os graus de liberdade dos tratamentos em componentes polino-


miais para verificar o comportamento da dureza do produto em relação às
temperaturas (se for necessário).

Exercı́cio #3: [Montgomery, D. C. (2007)] Um fabricante de disposi-


tivos médicos produz enxertos vasculares (veias artificiais). Esses enxertos são
produzidos por extrusão de resina de tarugo de politetrafluoretileno (PTFE)
combinado com lubrificante em tubos. Frequentemente, alguns dos tubos no
ciclo de produção apresentam pequenas protuberâncias duras na superfı́cie ex-
terna. Esses defeitos são conhecidos como ”os filmes” (flicks). O defeito é a
causa da rejeição da unidade.
O desenvolvedor de produtos responsável pelos enxertos vasculares desconfia
que a pressão de extrusão afeta a ocorrência de defeitos (flicks) e, portanto,
pretende conduzir um experimento para investigar esta hipótese. Por outro
lado, a resina é fabricada por um fornecedor externo e é entregue aos fabricantes
de dispositivos médicos em lotes. O engenheiro também suspeita que pode
haver variações significativas de um lote para outro, porque, o material deve ser
coerente com relação aos parâmetros, tais como, peso molecular, tamanho médio
da partı́cula, retenção e taxa de pico de altura, ele provavelmente não é devido
a variação na produção do fornecedor de resina e variação natural do material.
Assim sendo, o desenvolvedor de produtos decide investigar os efeitos de 4 dife-
rentes nı́veis de pressão de extrusão sobre a ocorrência dos filmes (flicks) usando
um delineamento em blocos casualizados, considerando lotes como blocos. A
variável resposta é a porcentagem de tubos que não apresentam defeitos no cilo
de produção. Os resultados observados no experimento foram os seguints:
86

Tabela 3.6: Porcentagem de tubos sem defeitos na linha de produção


Pressão de extrusão Lotes de resina(blocos) Totais Médias
(Tratamentos) B1 B2 B3 B4 B5 B6 yi. ȳi.
T1 = 8500 90,3 89,2 98,2 93,9 87,4 97,9 556,9 92,8
T2 = 8700 92,5 89,5 90,6 94,7 87,0 95,8 550,1 91,7
T3 = 8900 85,5 90,8 89,6 86,2 88,0 93,4 533,5 88,9
T4 = 9100 82,5 89,5 85,6 87,4 78,9 90,7 514,6 85,8
Totais (y.j ) 350,8 359,0 364,0 362,2 341,3 377,8 2155,1 71,8
Capı́tulo 4

Experimentos em
quadrados latinos

• Levam em consideração os princı́pios da repetição, casualização e o controle


local em duas direções: linhas e colunas;

• É um delineamento pouco utilizado na prática por ser menos flexı́vel (mais


restritivo) que os experimentos em blocos casualizados, pois, os números
de tratamentos, linhas e colunas devem ser os mesmos;

• Devido ao número de repetições ser igual ao número de tratamentos, em


geral, não se usam os quadrados latinos em experimentos com mais de 8
tratamentos, pois, o número de unidades experimentais cresce exagerada-
mente a medida que aumentamos o número de tratamentos, dificultando a
condução do experimento a nı́vel de campo. Por outro lado, os quadrados
latinos 2 × 2, 3 × 3 e 4 × 4 encerram tão poucas unidades experimentais
que só se justificam se o experimento incluir vários quadrados latinos.

• Os quadrados latinos mais utilizados na prática são os 5 × 5 a 8 × 8. Ou


seja, aqueles que envolvem de 5 a 8 tratamentos.

87
88

4.1 Exemplo de um possı́vel desenho de um quadrado


latino 5 × 5 no campo

C1 C2 C3 C4 C5

T4 T1 T2 T5 T3 L1

T3 T5 T4 T1 T2 L2

T5 T2 T1 T3 T4 L3

T1 T4 T3 T2 T5 L4

T2 T3 T5 T4 T1 L5

4.2 Organização dos dados de um experimento


em quadrado latino com 5 tratamentos

Linha Colunas (Cj ) Total Média


(Li ) C1 C2 C3 C4 C5 (yi.. ) (ȳi.. )
L1 y114 y121 y132 y145 y153 y1.. ȳ1..
L2 y213 y225 y234 y241 y252 y2.. ȳ2..
L3 y315 y322 y331 y343 y354 y3.. ȳ3..
L4 y411 y424 y433 y442 y455 y4.. ȳ4..
L5 y512 y523 y535 y544 y551 y5.. ȳ5..
Total (y.j. ) y.1. y.2. y.3. y.4. y.5. y... -
Média (ȳ.j. ) ȳ.1. ȳ.2. ȳ.3. ȳ.4. ȳ.5. - ȳ...

onde,
• yijk é a observação obtida da unidade experimental localizada na linha i
e coluna j que recebeu o tratamento k;
89

• yi.. é a soma dos valores observados na i-ésima linha;

• y.j. é a soma dos valores observados na j-ésima coluna;


• y..k é a soma dos valores observados relativos ao k-ésimo tratamento, isto
é,

y121 + y241 + y331 + y411 + y551 = y..1 −→ total do tratamento 1,


y132 + y252 + y322 + y442 + y512 = y..2 −→ total do tratamento 2,
..
.
y145 + y225 + y315 + y455 + y535 = y..5 −→ total do tratamento 5.

• y... é o total geral.

• ȳi.. , ȳ.j. , ȳ..k e ȳ... são, respectivamente, as médias da i-ésima linha, j-ésima
coluna, k-ésimo tratamentos e geral.

4.3 O modelo matemático e suposições

Um modelo matemático adequado para descrever as observações obtidas de


um experimento em quadrado latino, é o seguinte,

yijk = µ + αi + βj + τk + εijk

onde,

• yijk é o valor da variável resposta obtido da unidade experimental locali-


zada na linha i e coluna j que recebeu o k-ésimo tratamento;

• µ é a média geral;

• αi é o efeito da i-ésima linha sobre a variável resposta, aqui considerado


fixo;
• βj é o efeito da j-ésimo coluna sobre a variável resposta, também consi-
derado fixo;

• τk é o efeito do k-ésimo tratamento sobre a variável resposta, considerado


fixo;

• εijk é a contribuição do acaso. Isto é, a parte da variação devida a fatores


não controláveis. Além disso, supomos que os erros εijk são variáveis
aleatórias independentes e identicamente distribuı́das como uma normal
de média zero e variância constante, σ 2 .
90

4.4 Estimativas dos parâmetros

Dadas as observações de um experimento em quadrados latinos R × R, isto


é,
y111 , · · · , y1R3 , y212 , · · · , y2RR , · · · , · · · , yR14 , · · · , yRRR .
O modelo matemático associado aos dados, fica:
yijk = m + ai + bj + tk + eijk , i, j, k = 1, 2, · · · , R
e, aplicando o método dos mı́nimos quadrados encontramos:
m = ȳ... −→ o estimador de µ,

ai = ȳi.. − ȳ... −→ o estimador de αi ,

bj = ȳ.j. − ȳ... −→ o estimador de βj

tk = ȳ..k − ȳ... −→ o estimador de τk

ŷijk = ȳi.. + ȳ.j. + ȳ..k − 2ȳ... −→ o estimador de yijk

eijk = yijk − ŷijk −→ o estimador de εijk

s2 = QM Res. −→ o estimador de σ 2 .

4.5 A Decomposição da variabilidade total

X X
SQRes. = e2ijk = (yijk − ŷijk )2
i,j i,j
  !  
X R R
1 X 2 1 X
=  2
yijk − C − y − C − y2 − C 
i,j
R i=1 i.. R j=1 .j.
| {z } | {z } | {z }
SQT otal SQLinhas SQColunas
R
!
1 X
2
− y..k −C .
R
k=1
| {z }
SQT rat.

onde,
2
y...
C= .
R2
Assim, teremos:
SQRes. = SQT otal − SQLinhas − SQColunas − SQT rat.
91

ou
SQT otal = SQLinhas + SQColunas + SQT rat. + SQRes.

Tabela 4.1: Tabela da análise da variância

F. Variação GL SQ QM F
QM Linhas
Linhas (R − 1) SQLinhas QM Linhas QM Res

QM Colunas
Colunas (R − 1) SQColunas QM Colunas QM Res

QM T rat.
Tratamentos (R − 1) SQT rat. QM T rat. QM Res

Resı́duos (R − 1)(R − 2) SQRes. QM Res. = s2 -


Total R2 − 1 SQT otal

(α)
Sob Ho : α1 = · · · = αR = 0, a estatı́stica

QM Linhas
F = ∼ F[(R−1), (R−1)(R−2)]
QM Res
(β)
Sob H0 : β1 = · · · = βR = 0, a estatı́stica

QM Colunas
F = ∼ F[(R−1), (R−1)(R−2)] ,
QM Res
(τ )
Sob H0 : τ1 = · · · = τR = 0, a estatı́stica

QM T rat.
F = ∼ F[(R−1), (R−1)(R−2)]
QM Res
(α) (β) (τ )
Rejeitamos H0 , H0 e H0 , ao nı́vel de significância α, se F calculado
for maior do que o valor encontrado de tabela para os correspondentes graus
de liberdade e nı́vel de significância α fixado. E, concluimos, ao nı́vel de sig-
nificância α, que os efeitos das Linhas e/ou das Colunas e/ou dos Tratamentos
sobre a variável resposta não são nulo (ou que os efeitos das Linhas e/ou das
Colunas e/ou dos Tratamentos sobre a variável resposta são estatisticamente
significativos).

4.6 Teste de comparações múltiplas - Tukey


92

Para contrastar as hipóteses entre duas médias de Linhas, Colunas e trata-


mentos, isto é,

H0 : µi = µi′ vs H1 : µi 6= µi′ , ∀ i 6= i′ . i, i′ = 1, 2, · · · , R

ou
H0 : µj = µj ′ vs H1 : µj 6= µj ′ , ∀ j 6= j ′ . j, j ′ = 1, 2, · · · , R
ou
H0 : µk = µk′ vs H1 : µk 6= µk′ , ∀ k 6= k ′ . k, k ′ = 1, 2, · · · , R
Calculamos
r
QM Res
DM S = ∆ = q[R, (R−1)(R−2), α]
R
e comparamos com o valor de |ŷh | = |mi − mi′ | ou |ŷh | = |mj − mj ′ | ou |ŷh | =
|mk − mk′ | . Se este for maior que ∆ diremos que as médias µi e µi′ ou µj e µj ′
ou µk e µk′ diferem estatisticamente entre si, pelo método de Tukey ao nı́vel α
de significância.

4.7 Um exemplo de aplicação


Pimentel Gomes(1985). Num experimento de competição de variedades de
cana-de-açúcar foram utilizadas 5 variedades: V1 = Co290, V2 = Co421, V3 =
Co419, V4 = POJ2878 e V5 = CP36-13, dispostas em um quadrado latino 5×5.
As produções de cana planta, em kg/parcela, são dadas na tabela a seguir.

Linha Colunas (Cj ) Total Média


(Li ) C1 C2 C3 C4 C5 (yi.. ) (ȳi.. )
L1 V 4(432) V 1(518) V 2(458) V 3(583) V 5(331) 2322 464, 4
L2 V 3(724) V 5(478) V 1(524) V 2(550) V 4(400) 2676 535, 2
L3 V 5(489) V 2(384) V 3(556) V 4(297) V 1(420) 2146 429, 2
L4 V 2(494) V 4(500) V 5(313) V 1(486) V 3(501) 2294 458, 8
L5 V 1(515) V 3(660) V 4(438) V 5(394) V 2(318) 2325 465, 0
Total (y.j. ) 2654 2540 2289 2310 1970 11763 -
Média (ȳ.j. ) 530, 8 508, 0 457, 8 462, 0 394, 0 - 470, 52

Os totais e as médias observados das variedades, isto é, y..k e ȳ..k , para
k = 1, 2, 3, 4, 5, foram:

y..1 = 518 + 524 + 420 + 486 + 515 = 2463 e ȳ..1 = 492, 6;


y..2 = 458 + 550 + 384 + 494 + 318 = 2204 e ȳ..2 = 440, 8;
y..3 = 583 + 724 + 556 + 501 + 660 = 3024 e ȳ..3 = 604, 8;
y..4 = 432 + 400 + 297 + 500 + 438 = 2067 e ȳ..4 = 413, 4;
y..5 = 331 + 478 + 489 + 313 + 394 = 2005 e ȳ..5 = 401, 0.
93

4.7.1 As estimativas dos parâmetros

O principal objetivo de se ter as estimativas dos parâmetros é poder utilizá-


las para calcular os resı́duos que constituem o principal argumento para valida-
ção do modelo. Na tabela a seguir encontram-se as estimativas dos parâmetros
relativos aos dados do experimento com variedades de cona-de-açúcar.
Em primeiro lugar calculamos a estimativa da média geral, isto é,

m = ȳ... = 470, 52.

Na Tabela 4.2 encontram-se as estimativas dos efeitos das linhas, das colu-
nas e das variedades sobre a produção de cana-de-açúcar por parcela. E, na
Tabela 4.3 encontram-se os valores observados nas parcelas, bem como, suas
estimativas, os reı́duos e os resı́duos padronizados, correspondentes.

Tabela 4.2: Estimativas dos efeitos das linhas, colunas e variedades

ai = ȳi.. − ȳ... bj = ȳ.j. − ȳ... tk = ȳ..k − ȳ...


a1 = −6, 12 b1 = +60, 28 t1 = +22, 08
a2 = +64, 68 b2 = +37, 48 t2 = −29, 72
a3 = −41, 32 b3 = −12, 72 t3 = +134, 28
a4 = −11, 72 b4 = −8, 52 t4 = −57, 12
a5 = −5, 52 b5 = −76, 52 t5 = −69, 52

Tabela 4.3: Valores observados yijk , valores estimados ŷijk , resı́duos eijk
e resı́duos padronizados zijk
e
yijk ŷijk = m + ai + bj + tk eijk = yijk − ŷijk zijk = √ ijk
QM Res
y114 = 432 ŷ114 = 467, 56 e114 = −35, 56 -0,6769
y121 = 518 ŷ121 = 523, 96 e121 = −5, 96 -0,1135
.. .. .. ..
. . . .
y552 = 318 ŷ552 = 358, 76 e552 = −40, 76 -0,7759

De posse desses resultados podemos validar o modelo.

Cálculos das somas dos quadrados e a análise da variância

X X (y... )2
2
yijk = 11763, yijk = 5792451 e C= = 5534726, 76.
i,j i,j
R2
94
X
2
SQT otal = yijk −C
i,j
= 5792451 − 5534726, 76
= 257724, 24;

R
1 X 2
SQLinhas = y −C
R i=1 i..
1
= [(2322)2 + · · · + (2325)2 ] − 5534726, 76
5
= 30480, 64;

R
1 X 2
SQColunas = y −C
R j=1 .j.
1
= [(2654)2 + · · · + (1970)2 ] − 5534726, 76
5
= 55640, 64;

R
1 X 2
SQV ariedades = y..k − C
R
k=1
1
= [(2463)2 + · · · + (2005)2 ] − 5534726, 76
5
= 137488, 24;

SQResíduo = SQT otal − SQLinhas − SQColunas − SQV ariedades


= 257724, 24 − 30480, 64 − 55640, 64 − 137488, 24
= 34114, 72.

Com esses resultados podemos organizar a tabela da análise da variância

Tabela 4.4: Tabela da análise da variância

F. Variação GL SQ QM F
(α)
Linhas (H0 : α1 = · · · = α5 = 0) 4 30480,64 7620,16 2,68
(β)
Colunas (H0 : β1 = · · · = β5 = 0) 4 55640,64 13910,16 4, 89∗
(τ )
Variedades (H0 : τ1 = · · · = τ5 = 0) 4 137488,24 34372,06 12, 09∗∗
Resı́duo 12 34114,72 2842,89 -
Total 24 257724,24 - -

(*) Significativo a 5% e (**) Significativo a 1%.


95

(α)
Conforme se observa, a hipótese H0 : α1 = · · · = α5 = 0 não foi rejeitada
(β)
ao nı́vel de 5% de significância pelo teste F. Por outro lado, a hipótese H0 :
β1 = · · · = β5 = 0 foi rejeitada ao nı́vel de 5% de significância enquanto que a
(τ )
hipótese H0 : τ1 = · · · = τ5 = 0 foi rejeitada ao nı́vel de 1% de significância.
Isto indica que tanto o efeito das colunas como o efeito das variedades sobre a
variável resposta foram estatı́sticamente significativos.
Como dissemos antes, o desdobramento dos graus de libertade dos tratamen-
tos (variedades) em contrastes de interesse, em geral, estabelecidos no planeja-
mento do experimento, é mais informativo e mais elegante quando feito na
própria análise da variância. Admitamos que o pesquisador planejou verificar
as seguintes hipóteses (contrastes) relativas aos tratamentos:
(1) µ1 +µ2 +µ3 µ4 +µ5 (1) µ1 +µ2 +µ3 µ4 +µ5
• H0 : 3 = 2 vs H1 : 3 6= 2
(2) µ1 +µ2 (2) µ1 +µ2
• H0 : 2 = µ3 vs H1 : 2 6= µ3 ,
(3) (3)
• H0 : µ1 = µ2 vs H1 : µ1 6= µ2 ,
(4) (4)
• H0 : µ4 = µ5 vs H1 : µ4 6= µ5 .
Cálculos das estimativas dos contrastes e respectivas somas dos quadrados das
hipóteses de interesse:
(1) µ1 + µ2 + µ3 µ4 + µ5 (1)
H0 : = é equivalente a H0 : 2µ1 +2µ2 +2µ3 −3µ4 −3µ5 = 0.
3 2
Portanto, a estimativa do contraste Ψ1 é
ȳ..1 + ȳ..2 + ȳ..3 ȳ..4 + ȳ..5
ψ̂1 = −
3 2
492, 6 + 440, 8 + 604, 8 413, 4 + 401, 0
= −
3 2
= 105, 53kg/parcela
(1)
e a soma de quadrados da hipótese H0 é
 2
P
5
c1k y..k
(1) k=1 [2(y..1 ) + 2(y..2 ) + 2(y..3 ) − 3(y..4 ) − 3(y..5 )]2
SQ(H0 ) = =
JK1 5 × 30
2
[2(2463) + 2(2204) + 2(3024) − 3(2067) − 3(2005)]
=
150
= 66823, 7067;
µ1 + µ2
(2) (2)
H0 :
= µ3 é equivalente a H0 : µ1 + µ2 − 2µ3 = 0.
2
Daı́, a estimativa do contraste Ψ2 é
ȳ..1 + ȳ..2 429, 6 + 440, 8
ψ̂2 = − ȳ..3 = − 604, 8 = −138, 1kg/parcela,
2 2
96

(2)
e a soma de quadrados da hipótese H0 é
 2
P
5
c2k y..k
(2) k=1 [1(y..1 ) + 1(y..2 ) − 2(y..3 ) + 0(y..4 ) + 0(y..5 )]2
SQ(H0 ) = =
JK2 5×6
[1(2463) + 1(2204) − 2(3024)]2
= = 63572, 0333;
30
de modo análogo teremos:

ψ̂3 = ȳ..1 − ȳ..2 = 492, 6 − 440, 8 = 51, 8kg/parcela;

e  2
P
5
c3k y..k
(3) k=1 [1(2463) − 1(2204)]2
SQ(H0 ) = = = 6708, 1000;
J × K3 5×2
ψ̂4 = ȳ..4 − ȳ..5 = 413, 4 − 401, 0 = 12, 4kg/parcela.
e  2
P
5
c4k y..k
(4) k=1 [1(2067) − 1(2005)]2
SQ(H0 ) = = = 384, 4000.
J × K4 5×2
A estimativa do contraste ψ̂1 , por exemplo, é interpretada como: nas condições
em que esse experimento foi instalado e conduzido, estima-se que as varieda-
des Co produzem, em média, 105,53kg/parcela a mais que as variedades CP
e P OJ, juntas. Por outro lado, o contraste ψ̂2 , estima que as duas primeiras
variedades Co produzem, em média, 138, 1kg/parcela a menos que a variedade
Co419. Interpretações análogas podem ser feitas para os demais contrastes.
Com os resultados encontrados para as somas de quadrados podemos reestru-
turar a análise da variância que está apresentada na Tabela 4.5.
(τ ) (1) (2)
Observe que, de acordo com a Tabela 4.5, as hipóteses H0 , H0 e H0
foram rejeitadas ao nı́vel de 1% de significância pelo teste F de Snedecor, en-
(β)
quato que a hipótese H0 foi rejeitada ao nı́vel de 5% de significância. As
demais hipóteses não foram rejeitadas ao nı́vel de 5%.
97

Tabela 4.5: Análise da variância com desdobramento dos graus de liberdade


de tratamentos (variedades) em contrastes de interesse

F.Variação GL SQ QM F
(1)
H0 : τ1 +τ32 +τ3 = τ4 +τ
2
5
1 66823,71 66823,71 23, 51∗∗
(2) τ1 +τ2
H0 : 2 = τ 3 1 63572,03 63572,03 22, 36∗∗
(3)
H0 : τ 1 = τ 2 1 6708,10 6708,10 2,36
(4)
H0 : τ 4 = τ 5 1 384,40 384,40 0,14
(τ )
Variedades(H0 : τ1 = · · · = τ5 = 0) (4) 137488,24 34372,06 12, 09∗∗
(α)
Linhas(H0 : α1 = · · · = α5 = 0) 4 30480,64 7620,16 2,28
(β)
Colunas(H0 : β1 = · · · = β5 = 0) 4 55640,64 13910,16 4, 89∗
Resı́duo 12 34114,72 2842,89 -
Total 24 257724,24 - -

4.7.2 Comparações das médias das variedades duas a duas

Teste de Tukey
Para contrastar as hipóteses relativas às médias das variedades, isto é,

H0 : µk − µk′ = 0 vs H1 : µk − µk′ 6= 0, ∀ k 6= k ′ , k < k ′ = 2, · · · , 5

Calculamos:
 
R
|ŷh | = |ȳ..k − ȳ..k′ |, para h = 1, · · · , , k < k ′ = 2, · · · , 5
2
e comparar com
r r
QM Res 2842, 89
∆ = q[5, 12, 0,05] = 4, 51 = 107, 54kg/parcela.
R 5
Rejeitamos H0 ao nı́vel de significância de 5% pelo teste de Tukey se |ŷh | ≥
107, 54.
Os confrontos das médias das variedades quando comparadas duas-a-duas
pelo método de tukey a 5% de significância, encontram-se apresentados na tabela
a seguir.
98

∆ = 107, 54kg/parcela.

m1 m2 m3 m4
Médias 492,6 440,8 604,8 413,4
m2 = 440, 8 NS
m3 = 604, 8 S S
m4 = 413, 4 NS NS S
m5 = 401, 0 NS NS S NS
onde, S = Significativo e N S = Não significativo.
Observe que apenas a média da variedade Co419 supera as demais, ao
nı́vel de 5% de significância pelo método de Tukey. Os demais confrontos das
médias não foram estatisticamente significativos pelo teste de Tukey a 5% de
significância.

Não esquecer de validar o modelo!!!!!!!!!!!!


Capı́tulo 5

Experimentos em parcelas
subdivididas

5.1 Generalidades

Os experimentos em parcelas subdivididas (Split−P lot) envolvem dois tipos


de tratamentos ou fatores denominados tratamentos primários ou simplesmente
tratamentos e tratamentos secundários ou subtratamentos. Cada tratamento
contém, dentro de si, um conjunto de todos os subtratamentos distribuı́dos
aleatoriamente e cada repetição ou bloco envolve um conjunto de todos os trata-
mentos, também distribuı́dos ao acaso.
Este tipo de experimento pode ser instalado em qualquer delineamento ex-
perimental, porém é mais encontrado nos desenhos completamente aleatorizados
ou em blocos ao acaso.
De acordo com a estrutura dos subtratamentos os experimentos Split − P lot
são classificados em dois tipo:

• Experimentos em parcelas subdivididas no espaço, no qual a área


de cada tratamento é subdividida em sub-áreas, constituindo, cada uma
delas, um subtratamento. Como por exemplo, podemos ter como trata-
mentos, tipos de tratos culturais (T1 = Manual, T2 = Tração animal e T3
= Mecânico) e como subtratamentos, variedades de cana-de-açúcar (S1 =
Co997, S2 = Co419, S3 = CB45-3 e S4 = CB45-15).

• Experimentos em parcelas subdivididas no tempo, onde as áreas


dos tratamentos não são subdivididas em sub-áreas, más, periodicamen-
te, são feitas medições ou retiradas de amostras aleatórias para avaliações
em cada uma delas, e, as épocas de avaliações passam a constituir os
subtratamentos. Por exemplo, instalamos um experimento inteiramente
casualizado com variedades de cana-de-açúcar e periodicamente retiramos
amostras aleatórias das variedades para determinar os teores de sacarose.

99
100

• Obs.: É impotante tomar cuidado para não confundir o segundo tipo de


split − plot com um experimento onde as medidas são repetidas no tempo,
ou seja, onde os mesmos indivı́duos são medidos (avaliados) periodica-
mente.

Em termos de análises estatı́sticas estes dois tipos de Split − P lot são exa-
tamente as mesmas.

5.2 Possı́veis desenhos desse tipo de experimento


no campo, com 3 tratamentos, 4 subtrata-
mentos e 3 repetições

Figura 5.1: Inteiramente casualizado com parcelas subdivididas


101

Figura 5.2: Blocos casualizados com parcelas subdivididas

Figura 5.3: Quadrados latinos com parcelas subdivididas


102

Genericamente, os dados de um experimento com parcelas subdivididas ins-


talado num delineamento inteiramente ao acaso ou em blocos casualizados com I
tratamentos e J repetições, podem ser colocados de forma organizada de acordo
com a Tabela 5.1:

Tabela 5.1: Organização das observações de um experimento em parcelas sub-


divididas com I tratamentos K subtratamentos e J repetições/blocos.

Repetições/Blocos
Trat. Subtrat. 1 2 ··· J Soma
1 y111 y112 · · · y11J y11.
1 2 y121 y122 · · · y12J y12.
.. .. .. .. ..
. . . . .
K y1K1 y1K2 ··· y1KJ y1K.
Soma y1.1 y1.2 ··· y1.J y1..
1 y211 y212 ··· y21J y21.
2 2 y221 y222 ··· y22J y22.
.. .. .. .. ..
. . . . .
K y2K1 y2K2 ··· y2KJ y2K.
Soma y2.1 y2.2 ··· y2.J y2..
.. .. .. .. ..
. . . . .
.. .. .. .. ..
. . . . .
1 yI11 yI12 ··· yI1J yI1.
I 2 yI21 yI22 ··· yI2J yI2.
.. .. .. .. ..
. . . . .
K yIK1 yIK2 ··· yIKJ yIK.
Soma yI.1 yI.2 ··· yI.J yI..
Soma y..1 y..2 ··· y..J y...

Onde yi.j é o total das K observações que receberam o tratamento i na j-ésima


repetição/bloco; y.kj é o total das I observações que receberam o subtratamento
k na j-ésima repetição/bloco; yik. é o total das J unidades experimentais que
receberam o i-ésimo tratamento e k-ésimo subtratamento; yi.. é o total das KJ
observações que receberam o tratamento i; y.k. é o total das IJ observações que
receberam o k-ésimo subtratamento; y..j é o total das IK observações corres-
pondentes a j-ésima repetição/bloco e y... corresponde ao total geral.
Para facilitar os cálculos, além da Tabela 5.1, é conveniente organizar as
seguintes tabelas auxiliares:
103

Tabela 5.2: Tratamentos × Repetições/Blocos

(K) Repetições/Blocos
Trat. 1 2 ··· J Soma
1 y1.1 y1.2 · · · y1.J y1..
2 y2.1 y2.2 · · · y2.J y2..
.. .. .. .. ..
. . . . .
I yI.1 yI.2 ··· yI.J yI..
Soma y..1 y..2 ··· y..J y...

Tabela 5.3: Tratamentos × Subtratamentos

(J) Subtratamentos
Trat. 1 2 ··· K Soma
1 y11. y12. · · · y1K. y1..
2 y21. y22. · · · y2K. y2..
.. .. .. .. ..
. . . . .
I yI1. yI2. ··· yIK. yI..
Soma y.1. y.2. ··· y.K. y...

5.3 O modelo matemático

O modelo matemático associado às observações de um experimento em parce-


las subdivididas é de acordo com o delineamento utilizado na sua instalação. Ou
seja,

• Quando o experimento for instalado num delineamento inteiramente ca-


sualizado, então o modelo matemático será

 i = 1, 2, · · · , I
yikj = µ + τi + ǫij + θk + γik + εikj k = 1, 2, · · · , K (5.1)

j = 1, 2, · · · , J

• Caso o delineamento utilizado para instalação do experimento seja o de


blocos casualizados, então o modelo matemático apropriado será

 i = 1, 2, · · · , I
yikj = µ + τi + βj + ǫij + θk + γik + εikj k = 1, 2, · · · , K (5.2)

j = 1, 2, · · · , J
104

• Se o delineamento utilizado para instalação do experimento for em quadra-


dos latinos, então o modelo matemático associado aos dador será


 r = 1, 2, · · · , R

c = 1, 2, · · · , R
yikrc = µ + τi + ℓr + δc + ǫirc + θk + γik + εikrc (5.3)

 i = 1, 2, · · · , R

k = 1, 2, · · · , K

onde, os termos associados aos três modelos são definidos como:


• µ é a média geral;
• τi é o efeito do i-ésimo tratamento sobre a variável resposta, aqui consi-
derado fixo;
• βj é o efeito do j-ésimo bloco sobre a variável resposta, aqui considerado
fixo;
• ℓr é o efeito da j-ésima linha sobre a variável resposta, considerado fixo;
• δc é o efeito da c-ésima coluna sobre a variável resposta, considerado fixo;
• ǫij é o erro aleatório a nı́vel de parcelas;
• ǫirc é o erro aleatório a nı́vel de parcelas (em quadrados latinos);
• θk é o efeito do k-ésimo sub-tratameno sobre a variável resposta, conside-
rado fixo;
• γik é o efeito da interação do i-ésimo tratamento com o k-ésimo subtrata-
mento;
• εikj é o erro casual associado a observação yikj a nı́vel de subparcelas;
• εikrc é o erro casual associado a observação yikrc a nı́vel de subparcelas;
• Além das suposições acima, consideram-se que os erros ǫij e εikj são
iid
variáveis aleatórias independentes e identicamente distribuidas como ǫij ∼
iid
N (0, σǫ2 ) e εikj ∼ N (0, σε2 ), respectivamente.

5.4 Estimação dos parâmetros do modelo

Daqui por diante trataremos apenas do modelo (5.2), isto é, do caso onde o
experimento em parcelas subdivididas é instalado num delineamento em blocos
casualizados. Assim sendo, dadas as observações desse tipo de experimento, o
modelo matemático associado às observações fica:

 i = 1, 2, · · · , I
yikj = m + ti + bj + eij + dk + gik + uikj , j = 1, 2, · · · , J . (5.4)

k = 1, 2, · · · , K
105

Aplicando-se o método dos mı́nimos quadrados encontraremos os estimadores


das caracterı́sticas na população, a saber:

m = ȳ... −→ o estimador de µ,

ti = ȳi.. − ȳ... −→ o estimador de τi ,

bj = ȳ..j − ȳ... −→ o estimador de βj ,

eij = ȳi.j − ȳi.. − ȳ..j + ȳ... −→ o estimador de ǫij ,

dk = ȳ.k. − ȳ... −→ o estimador de θk ,

gik = ȳik. − ȳi.. − ȳ.k. + ȳ... −→ o estimador de γik ,

ŷijk = m + ti + bj + eij + dk + gik −→ o estimador da observação yikj ,

uikj = yikj − ŷikj −→ o estimador de εikj ,

onde ȳ... é a média geral obtida a partir dos dados colhidos no experimento; ȳi.. é
a média do i-ésimo tratamento observada no experimento; ȳ.k. é a média obtida
no experimento para o k-ésimo subtratamento; ȳ..j é a média observada no
experimento para a j-ésima repetição/bloco; ȳi.j é a média das K observações
experimentais para o i-ésimo tratamento na j-ésima repetição/ bloco e ȳik.
é a média das J observações que receberam o i-ésimo tratamento e k-ésimo
subtratamento.

5.5 A decomposição da variabilidade total

Desenvolvendo-se algebricamente a soma dos quadrados dos resı́duos a nı́vel


de subparcelas, chegaremos aos seguintes resultados:
X X
SQRes(b) = u2ikj = (yikj − ŷikj )2
i,k,j i,k,j
! ! !
X 1 X
I
1 X
J
2 2 2
= yikj −C − yi.. −C − y..j −C
JK IK
i,k,j i=1 j=1
| {z } | {z } | {z }
SQT otal SQT ratamentos SQBlocos
 
 ! ! !
 1 X 1 X
I
1 XJ

− 2
yi.j −C − 2
yi.. −C − 2
y..j −C 
 K JK IK 
 i,j i=1 j=1 
| {z } | {z } | {z }
SQP arcelas SQT ratamentos SQBlocos
| {z }
SQRes(a)
106
!
1 X
K
2
− y.k. −C
IJ
k=1
| {z }
SQSubtratamentos
 
 ! ! !
 1 X 1 X
I
1 XK

− 2
yik. −C − 2
yi.. −C − y.k. − C 
2
 J JK IJ 
 i,k i=1 k=1 
| {z } | {z } | {z }
SQ(T rat,Subtrat) SQT ratamentos SQSubtratamentos
| {z }
SQInteracão(T ratamentos×Subtratamentos)

Portanto, abreviando-se cada fonte de variação envolvida no modelo pela sua


primeira letra, a decomposição da variabilidade total poderá ser escrita como:

SQT otal = SQB + SQT + SQR(a) + SQS + SQ(T × S) + SQR(b).

Com esses resultados podemos organizar a tabela de análise da variância:

Tabela 5.4: Tabela da análise da variância - ANOVA


F. Variação G.L. SQ QM F
QM B
Blocos (J − 1) SQB QM B QM R(a)

QM T
Tratamentos(T) (I − 1) SQT QM T QM R(a)

Resı́duo(a) (I − 1)(J − 1) SQR(a) QM R(a) -

Parcelas (IJ − 1) SQP - -

QM S
Subtratamentos(S) (K − 1) SQS QM S QM R(b)

QM (T ×S)
Interação T × S (I − 1)(K − 1) SQ(T × S) QM (T × S) QM R(b)

Resı́duo(b) I(J − 1)(K − 1) SQR(b) QM R(b) -


Total IJK − 1 SQT otal - -

5.6 As esperanças dos quadrados médios

Conforme foram definidos os termos no modelo (5.2), verifica-se que:

E(µ) = µ; E(µ2 ) = µ2 ; E(τi ) = τi ; E(τi2 ) = τi2 ;


2 2 2 2
E(βj ) = βj ; E(βj ) = βj ; E(γik ) = γik ; E(γik ) = γik ;
E(ǫij ) = 0; E(ǫij ) = σa ; E(εikj ) = 0; E(εikj ) = σb2 ;
2 2 2
107

E(ǫij ǫrj ) = E(ǫij ǫis ) = 0, ∀ i 6= r ou j 6= s;


E(εikj εrkj ) = E(εikj ǫiks ) = E(εikj ǫinj ) = 0, ∀ i 6= r ou j 6= s ou k 6= n;
E(ǫij εrkj ) = E(ǫij εiks ) = 0, ∀ i 6= r ou j 6= s.
com as seguintes restrições:
I
X J
X K
X I
X K
X I X
X K
τi = βj = θk = γik = γik = γik = 0.
i=1 j=1 k=1 i=1 k=1 i=1 k=1

Nestas condições, as esperanças dos quadrados médios, obtidos pelo método de


Hicks modificado, são de acordo com a Tabela 5.5;

Tabela 5.5: Esperanças dos quadrados médios obtidos pelo método de Hicks
modificado
I J K
F.V. i j k E(QM )
τi 0 I K σ 2 + Kσa2 + JKΦτ
βj I 0 K σ 2 + Kσa2 + IKΦβ
ǫik 1 1 K σ 2 + Kσa2
θk I J 0 σ 2 + IJΦθ
γik 0 J 0 σ 2 + JΦγ
εikj 1 1 1 σ2

em que, P P
1 1
Φβ = J−1 βj2 , Φτ = I−1 τi2 ,
j i

1
P 1
P
Φθ = K−1 k θk2 e Φγ = (I−1)(J−1)
2
γij .
i,j

Na tabela 5.6 encontram-se os resultados da análise da variância com respec-


tivos valores esperados dos quadrados médios.
Portanto, estudando-se as distribuições de probabilidade e propriedades dos
quadrados médios, através da teoria de Estatı́stica Matemática, chega-se às jus-
tificativas teóricas para os seguintes resultados:
(1)
1. Sob H0 : β1 = β2 = · · · = βJ = 0, tem-se que Φβ = 0 e a estatı́stica
QM B
Fb = ∼ F[(J−1); (I−1)(J−1)] .
QM R(a)
Em palavras, sob a hipótese de que não existe efeito dos nı́veis do fator
bloco sobre a variável resposta, a estatı́stica Fb segue uma distribuição F
central com (J − 1) graus de liberdade do numerador e (I − 1)(J − 1) graus
de liberdade do denominador.
(2)
2. Sob H0 : τ1 = τ2 = · · · = τI = 0, tem-se que Φτ = 0 e a estatı́stica
QM T
Ft = ∼ F[(I−1); (I−1)(J−1)] .
QM R(a)
108

Tabela 5.6: Tabela da análise da variância com as esperanças dos quadrados


médios

F. Variação G.L. QM E(QM ) F


QM B
Blocos (J − 1) QM B σ 2 + Kσa2 + IKΦβ QM R(a)

QM T
Tratamentos(T) (I − 1) QM T σ 2 + Kσa2 + JKΦτ QM R(a)

Resı́duo(a) (I − 1)(J − 1) QM R(a) σ 2 + Kσa2 -

Parcelas (IJ − 1) − - -

QM S
Subtrat.(S) (K − 1) QM S σ 2 + IJΦθ QM R(b)

QM (T ×S)
Interação T × S (I − 1)(K − 1) QM (T × S) σ 2 + JΦγ QM R(b)

Resı́duo(b) I(J − 1)(K − 1) QM R(b) σ2 -


Total IJK − 1 SQT otal - -

Ou seja, sob a hipótese de que não existe efeito dos nı́veis do fator trata-
mento sobre a variável resposta, a estatı́stica Ft segue uma distribuição
F central com (I − 1) graus de liberdade do numerador e (I − 1)(J − 1)
graus de liberdade do denominador.
(3)
3. Sob H0 : θ1 = θ2 = · · · = θK = 0, tem-se que Φθ = 0 e a estatı́stica

QM S
Fs = ∼ F[(K−1); I(J−1)(K−1)] .
QM R(b)

Isto é, sob a hipótese de que não existe efeito dos nı́veis do fator subtrata-
mento sobre a variável resposta, a estatı́stica Fs segue uma distribuição F
central com (K − 1) graus de liberdade do numerador e I(J − 1)(K − 1)
graus de liberdade do denominador.
(4)
4. Sob H0 : γ11 = γ12 = · · · = γIK = 0, tem-se que Φγ = 0 e a estatı́stica

QM T × S
Fg = ∼ F[(I−1)(K−1); I(J−1)(K−1)] .
QM R(b)

Ou melhor, sob a hipótese de que não existe efeito da interação do i-ésimo


nı́vel do fator tratamento com o k-ésimo nı́vel do fator subtratamento sobre
a variável resposta, a estatı́stica Fg segue uma distribuição F central com
(I − 1)(K − 1) graus de liberdade do numerador e I(J − 1)(K − 1) graus
de liberdade do denominador.
Consequentemente, para contrastar as hipótese de interesse nesse tipo de
experimento, isto é,
109

(1) (1)
1. H0 : β1 = β2 = · · · = βJ = 0 × H1 : βj 6= 0, para pelo menos um βj ,
com j = 1, 2, · · · , J,
(2) (2)
2. H0 : τ1 = τ2 = · · · = τI = 0 × H1 : τi 6= 0, para pelo menos um τi ,
com i = 1, 2, · · · , I,
(3) (3)
3. H0 : θ1 = θ2 = · · · = θK = 0, × H1 : θk 6= 0, para pelo menos um θk ,
com k = 1, 2, · · · , K,
(4) (4)
4. H0 : γ11 = γ12 = · · · = γIJ = 0, × H1 : γik 6= 0, para pelo menos um
γik , com i = 1, 2, · · · , I e k = 1, 2, · · · , K,

com base nos dados de um experimento, calculamos as respectivas estatı́sticas


associadas a cada hipótese:
QM B QM T QM S QM (T ×S)
Fb = QM R(a) , Ft = QM R(a) , Fs = QM R(b) e Fg = QM R(b)

(h) (h)
e rejeitamos H0 , h = 1, 2, 3, 4 em favor de H1 , ao nı́vel de significância α, se

Fb ≥ F[(J−1); (I−1)(J−1); α] , Ft ≥ F[(I−1); (I−1)(J−1); α] ,

Fs ≥ F[(K−1); I(J−1)(K−1); α] , Fg ≥ F[(I−1)(K−1); I(J−1)(K−1); α] .

5.7 Testes de comparações múltiplas - Tukey

Quando instalamos um experimento em parcelas subdivididas, normalmente


estamos interessados em fazer quatro tipos de comparações de médias, ou sejam,

1o. Caso: Comparações entre duas médias de tratamentos:


Para contrastar as hipóteses do tipo
(5) (5)
H0 : µi = µi′ vs H1 : µi 6= µi′ , i 6= i′ ,

calculamos
r
1
DM S = q[I; (I−1)(J−1); α] V̂ ar(ȳi.. − ȳi′ .. ) e |ȳi.. − ȳi′ .. |
2
onde,
2
QM R(a),
V̂ ar(ȳi.. − ȳi′ .. ) =
JK
e adotamos a seguinte regra de decisão:
(5)
Se |ȳi.. − ȳi′ .. | ≥ DM S, rejeitamos H0 e concluimos ao nı́vel α de sig-
nificância que o contraste é estatı́sticamente diferente de zero, ou que a
média do tratamento i difere estatisticamente da média do tratamento i′ .
110

2o. Caso: Comparações entre duas médias de subtratamentos:


Para contrastar as hipóteses do tipo
(6) (6)
H0 : µk = µk′ vs H1 : µk 6= µk′ , k 6= k ′ ,

calculamos
r
1
DM S = q[K; I(J−1)(K−1); α] V̂ ar(ȳ.k. − ȳ.k′ . ) e |ȳ.k. − ȳ.k′ . |
2
onde,
2
V̂ ar(ȳ.k. − ȳ.k′ . ) = QM R(b),
IJ
e adotamos a seguinte regra de decisão:
(6)
Se |ȳ.k. − ȳ.k′ . | ≥ DM S, rejeitamos H0 e concluimos ao nı́vel α de sig-
nificância que o contraste é estatı́sticamente significativo, ou que a média
do subtratamento k difere estatisticamente da média do subtratamento
k′ .

3o. Caso: Comparações entre duas médias de subtratamentos num mesmo nı́vel
de tratamento:
Para contrastar as hipóteses do tipo
(7) (7)
H0 : µik = µik′ vs H1 : µik 6= µik′ , k 6= k ′ ,

calculamos
r
1
DM S = q[K; I(J−1)(K−1); α] V̂ ar(ȳik. − ȳik′ . ) e |ȳik. − ȳik′ . |
2
onde,
2
V̂ ar(ȳik. − ȳik′ . ) = QM R(b),
J
e adotamos a seguinte regra de decisão:
(7)
Se |ȳik. − ȳik′ . | ≥ DM S, rejeitamos H0 e concluimos ao nı́vel α de sig-
nificância que o contraste é estatı́sticamente diferente de zero, ou que a
média do subtratamento k difere estatisticamente da média do subtrata-
mento k ′ no tratamento i.

4o. Caso: Comparações entre duas médias de tratamentos num mesmo nı́vel de
subtratamento

Para contrastar as hipóteses do tipo


(8) (8)
H0 : µik = µi′ k vs H1 : µik 6= µi′ k , i 6= i′ ,
111

calculamos
r
1
DM S = q[I; ν; α] V̂ ar(ȳik. − ȳi′ k. ) e |ȳik. − ȳi′ k. |
2
onde,
2
V̂ ar(ȳik. − ȳi′ k. ) = [QM R(a) + (K − 1)QM R(b)]
JK
e
[QM R(a) + (K − 1)QM R(b)]2
ν= [QM R(a)]2 (K−1)2 [QM R(b)]2
.
(I−1)(J−1) + I(J−1)(K−1)

E, adotamos a seguinte regra de decisão:


(8)
Se |ȳik. − ȳi′ k. | ≥ DM S, rejeitamos H0 e concluimos ao nı́vel α de sig-
nificância que o contraste é estatı́sticamente diferente de zero, ou que a média
do tratamento i difere estatisticamente da média do tratamento i′ no subtrata-
mento k.

5.8 Um exemplo ilustrativo

Os dados apresentados na Tabela 5.7, referem-se ao teor de brix no caldo


obtidos de um experimento com amadurecedores quı́micos em cana-de-açúcar,
conduzido por pesquisadores da Coordenadoria Regional Norte do PLANALSU-
CAR. Foi planejado, para o estudo, a instalação de um experimento em blocos
casualizados com parcelas subdivididas com 3 tratamentos (T1 = T estemunha,
T2 = P olaris e T3 = Ethrel), 8 blocos e 6 subtratamentos (0, 2, 4, 6, 8, 10 se-
manas após a aplicação dos amadurecedores quı́micos). É importante salientar
que cada parcela útil foi planejada com 6 linhas de cana-de-acúcar onde cada
linha foi sorteada aleatóriamente para representar cada época de avaliação do
teor de brix. Assim, os tratamentos e subtratamentos utilizados foram:

Tratamentos:
T1 = Testemunha,
T2 = Polaris,
T3 = Ethrel.

Subtratamentos :
S1 = 0 Semana após a instalação do experimento,
S2 = 2 Semanas após a instalação do experimento,
S3 = 4 Semanas após a instalação do experimento,
S4 = 6 Semanas após a instalação do experimento,
S5 = 8 Semanas após a instalação do experimento,
S6 = 10 Semanas após a instalação do experimento.
112

Tabela 5.7: Porcentagem de brix no caldo de cana-de-açúcar

Blocos
Trat. Semanas 1 2 3 4 5 6 7 8 Soma
0 17,70 17,50 17,95 17,90 17,30 17,60 17,40 17,75 141,10
2 16,95 18,60 17,05 18,00 19,40 18,55 17,80 18,05 144,40
T1 4 18,95 18,10 17,60 18,35 19,20 18,90 18,25 18,70 148,05
6 18,65 18,50 19,65 18,30 20,10 18,75 19,25 17,40 150,60
8 19,70 20,20 19,70 19,70 20,55 20,25 19,80 18,70 158,60
10 20,75 19,00 19,85 20,80 19,45 21,70 19,10 18,25 158,90
Soma 112,70 111,90 111,80 113,05 116,00 115,75 111,60 108,85 901,65
0 16,83 16,96 17,25 18,22 17,75 16,90 16,70 17,19 137,80
2 17,70 17,56 18,17 17,72 19,48 18,20 18,58 18,14 145,55
T2 4 18,00 18,05 18,55 19,52 20,70 18,85 18,41 19,20 151,28
6 18,68 18,83 17,65 20,40 20,03 19,63 18,70 19,71 153,63
8 19,55 19,38 18,10 20,85 20,80 20,42 19,33 21,10 159,53
10 15,56 17,18 19,00 19,40 20,45 19,92 20,00 19,65 151,16
Soma 106,32 107,96 108,72 116,11 119,21 113,92 111,72 114,99 898,95
0 16,63 17,70 17,52 17,52 17,26 17,18 17,43 16,52 137,76
2 17,18 17,75 17,65 17,55 18,61 18,26 18,00 16,56 141,56
T3 4 18,05 18,20 18,57 19,57 19,03 18,91 18,48 17,73 148,54
6 18,50 19,53 19,08 19,03 19,48 18,95 18,77 16,54 149,88
8 20,65 20,90 18,68 18,55 20,28 20,25 19,27 15,60 154,18
10 19,90 23,96 19,08 19,03 20,62 20,33 20,06 18,85 161,83
Soma 110,91 118,04 110,58 111,25 115,28 113,88 112,01 101,80 893,75
Total 329,93 337,90 331,10 340,41 350,49 343,55 335,33 325,64 2694,35

Para facilitar os cálculos das somas dos quadrados necessárias para elabo-
ração da análise da variância, estruturamos as tabelas 5.8 e 5.9:

Tabela 5.8: Tratamentos × Blocos


(K = 6) Blocos
Trat. 1 2 3 4 5 6 7 8 Soma
T1 112,70 111,90 111,80 113,05 116,00 115,75 111,60 108,85 901,65
T2 106,32 107,96 108,72 116,11 119,21 113,92 111,72 114,99 898,95
T3 110,91 118,04 110,58 111,25 115,28 113,88 112,01 101,80 893,75
Soma 329,93 337,90 331,10 340,41 350,49 343,55 335,33 325,64 2694,35

Tabela 5.9: Tratamentos × Semanas


(J = 8) Semanas
Trat. 0 2 4 6 8 10 Soma
T1 141,10 144,40 148,05 150,60 158,60 158,90 901,65
T2 137,80 145,55 151,28 153,63 159,53 151,16 898,95
T3 137,76 141,56 148,54 149,88 154,18 161,83 893,75
Soma 416,66 431,51 447,87 454,11 472,31 471,89 2694,35

A partir das tabelas 5.7, 5.8 e 5.9, calculamos:


113

P
yikj = y... = 17, 70 + 17, 50 + · · · + 18, 85 = 2694, 35;
i,k,j

P 2
yikj = (17, 70)2 + (17, 50)2 + · · · + (18, 85)2 = 50647, 2445 e
i,k,j

2
y... (2694,35)2
C= IJK = 144 = 50413, 3467.

X
2
SQT otal = yikj −C = 50647, 2445 − 50413, 3467
i,k,j
= 233, 8978;

1 X 2
SQBlocos = y −C
IK j ..j
1  
= (329, 93)2 + · · · + (325, 64)2 − 50413, 3467
18
= 25, 2008;

1 X 2
SQT rat = y −C
JK i i..
1  
= (901, 65)2 + · · · + (893, 75)2 − 50413, 3467
48
= 0, 6718;

1 X 2
SQP arcelas = y −C
K i,j i.j
1 
= (112, 70)2 + · · · + (101, 80)2 − 50413, 3467
6
= 56, 6021;

SQResı́duo(a) = SQP arcelas − SQBlocos − SQT rat


= 56, 6021 − 25, 2008 − 0, 6718
= 30, 7295;

1 X 2
SQSemanas = y.k. − C
IJ
k
1  
= (416, 66)2 + · · · + (471, 89)2 − 50413, 3467
24
= 101, 9355;
114

1X 2
SQ(T rat, Semanas) = yik. − C
J
i,k
1 
= (141, 10)2 + · · · + (161, 83)2 − 50413, 3467
8
= 115, 2965;

SQ(T × S) = SQ(T rat, Semanas) − SQT rat − SQSemanas


= 115, 2965 − 0, 6718 − 101, 9355
= 12, 6892;

SQResı́duo(b) = SQT otal − SQP arcelas − SQSemanas − SQ(T × S)


= 233, 8978 − 56, 6021 − 101, 9355 − 12, 6892
= 62, 6710;

De posse desses resultados, organizamos a análise da variância a qual se


encontra apresentada na Tabela 5.10.

Tabela 5.10: Tabela da análise da variância

F. Variação G.L. SQ QM F.
Blocos 7 25,2008 3,6001 -

Tratamentos(T) 2 0,6718 0,3359 Ft = 0, 15

Resı́duo(a) 14 30,7295 2,1950 -

Parcelas (23) (56,6021) - -

Semanas(S) 5 101,9355 20,3871 Fs = 34, 16∗∗

Interação T × S 10 12,6892 1,2689 Fg = 2, 13∗

Resı́duo(b) 105 62,6710 0,5969 -


Total 143 233,8978 - -

F[2; 14; 5%] = 3, 74; F[5; 105; 1%] = 3, 21 e F[10; 105; 5%] = 1, 93.

(2)
Conforme pode ser observado na Tabela 5.10, a hipótese H0 : τ1 = τ2 =
τ3 = 0 não foi rejeitada ao nı́vel de significância de 5%, pois, verificou-se que
Ft = 0, 15 ≤ F[2; 14; 0,05] = 3, 74. Daı́, podemos concluir que, independentemen-
te das épocas de amostragem (semanas), os efeitos dos tratamentos sobre o brix
são todos nulos. Ou ainda, que as médias da % de brix em relação aos trata-
mentos são todas estatisticamente iguais. Observa-se também que a hipótese
115

(3)
H0 : θ1 = θ2 = · · · = θK = 0 foi rejeitada ao nı́vel 1% de significância, uma
vez que Fs = 34, 16 > F[5; 105; 0,01] = 3, 21. Isto indica que, independentemente
do tratamento aplicado, o efeito de pelo menos uma semana sobre a % de brix
é diferente de zero, ou que existe pelo menos um par de médias de % brix em
relação às semanas que diferem estatisticamente entre si. Pode ser observado
(4)
ainda, que a hipótese H0 : γ11 = γ12 = · · · = γIK = 0 também foi rejeitada ao
nı́vel de 5% de significância, evidenciando que o comportamento da % de brix
no caldo em relação às semanas não é o mesmo em cada tratamento ou que as
médias dos teores de brix no caldo em relação aos tratamento se comportam de
uma forma numa dada época de avalição (semana) e de outra forma em uma
outra época. Os testes de comparações das médias que faremos a seguir e os
desdobramentos dos graus de liberdadade da interação T × S dentro da própria
análise da variância elucidarão melhor estas conclusões.

5.9 Comparações múltiplas - Teste de Tukey

1o. Caso: Comparações entre duas médias de tratamentos


r
QM R(a)
DM S = q[I; (I−1)(J−1); α]
JK
r r
2, 1950 2, 1950
= q[3; 14; 5%] = 3, 70 = 0, 79;
8×6 48
ȳ1.. = 18, 78 a
ȳ2.. = 18, 73 a
ȳ3.. = 18, 62 a
Obs.: Médias seguidas das mesmas letras não diferem estatisticamente
entre si, pelo teste de Tukey ao nı́vel de 5% de significância.
2o. Caso: Comparações entre duas médias de semanas
r
QM R(b)
DM S = q[K; I(J−1)(K−1); 5%]
IJ
r r
0, 5969 0, 5969
= q[6; 105; 5%] = 4, 12 = 0, 65;
3×8 24
ȳ.1. = 17, 36 a
ȳ.2. = 17, 98 a
ȳ.3. = 18, 66 b
ȳ.4. = 18, 92 b
ȳ.5. = 19, 68 c
ȳ.6. = 19, 66 c
Obs.: Médias seguidas das mesmas letras não diferem estatisticamente
entre si, pelo teste de Tukey ao nı́vel de 5% de significância.
116

Tabela 5.11: Estimativas das médias da interação T × S

↓ Tratamentos
Semanas T1 T2 T3
0 17, 64 b 17, 22 c 17, 22 d
2 18, 05 b 18, 19 bc 17, 70 cd
4 18, 51 b 18, 91ab 18, 57 bc
6 18, 23 b 19, 20ab 18, 73 bc
8 19, 82a 19, 94a 19, 27ab
10 19, 86a 18, 90ab 20, 23a

3o. Caso: Comparações entre duas médias de semanas num mesmo tratamento
r
QM R(b)
DM S = q[K; I(J−1)(K−1); α]
J
r r
0, 5969 0, 5969
= q[6; 105; 5%] = 4, 12 = 1, 13;
8 8
Obs.: Médias seguidas das mesmas letras, em cada tratamento, não
diferem estatisticamente entre si, pelo teste de Tukey ao nı́vel de 5% de
significância.
4o. Caso: Comparações entre duas médias de tratamentos numa mesma semana
Inicialmente calculamos o resı́duo combinado:

[QM R(a) + (K − 1)QM R(b)]


QM R = (5.5)
K
[2, 1950 + (6 − 1)0, 5969]
QM R = = 0, 8633
6
e os graus de liberdade pela fórmula de Satterthwaite (1946):
[QM R(a) + (K − 1)QM R(b)]2
ν= [QM R(a)]2 (K−1)2 [QM R(b)]2
(5.6)
(I−1)(J−1) + I(J−1)(K−1)

[2, 1950 + 5(0, 5969)]2 ∼


ν= [2,1950]2 2 = 63.
14 + 25[0,5969]
105
Agora, calculamos
r
QM R
DM S = q[I; ν; α]
J
r r
0, 8633 0, 8633
= q[3; 63; 5%] = 3, 40 = 1, 12.
8 8
117

Tabela 5.12: Estimativas das médias da interação T × S

→ Tratamentos
Semanas T1 T2 T3
0 17, 64a 17, 22a 17, 22a
2 18, 05a 18, 19a 17, 70a
4 18, 51a 18, 91a 18, 57a
6 18, 23a 19, 20a 18, 73a
8 19, 82a 19, 94a 19, 27a
10 19, 86ab 18, 90 b 20, 23a

Obs.: Médias seguidas das mesmas letras, dentro de cada semana, não diferem
estatisticamente entre si, pelo teste de Tukey ao nı́vel de 5% de significância.
(4)
Nota: Quando a hipótese H0 : γ11 = γ12 = · · · = γIK = 0 for rejeitada, como
é o caso presente, deveremos dar mais importâncias às comparações relativas aos
3o. e 4o. casos, onde comparamos as médias do brix em relação às semanas dentro
de cada tratamento e as médias do brix em relação aos tratamentos dentro de
cada semana.

5.10 Desdobramento dos graus de liberdade e


das somas dos quadrados

No experimento que estamos considerando, os nı́veis do fator tratamento


são qualitativos (Testemunha, Polaris e Ethrel) enquanto que os nı́veis do fa-
tor semana são quantitativo (0, 2, 4, 6, 8, 10). Neste caso, em vez de fazer
comparações das médias, é mais elegante e mais informativo proceder ao desdo-
bramento dos 2 graus de liberdade de tratamentos em 2 hipóteses (contrastes)
de interesse, cada uma com 1 grau de liberdade e os 5 graus de liberdade dos
subtratamentos em 5 hipóteses sobre os coeficientes da regressão polinomial,
cada um com um grau de liberdade. Para esta finalidade consideramos como
interessantes as seguintes hipóteses:
(9) τ2 + τ3 (9) τ2 + τ3
H0 : τ1 = vs H1 : τ1 6=
2 2
e
(10) (10)
H0 : τ2 = τ3 vs H1 : τ2 6= τ3 .
Sendo µi = µ + τi , as duas hipóteses acima são equivalentes a:
(9) (9)
H0 : 2µ1 − µ2 − µ3 = 0 vs H1 : 2µ1 − µ2 − µ3 6= 0

e
(10) (10)
H0 : µ2 − µ3 = 0 vs H1 : µ2 − µ3 6= 0.
118

(9)
Denotando por c1i e c2i os coeficientes dos contrastes das médias em H0 e
(10)
H0 , respectivamente, as somas dos quadrados das hipóteses, serão obtidas da
seguinte maneira:
 2
P
c1i yi.. 2
(9) [2(901, 65) − 1(898, 95) − 1(893, 75)]
SQH0 = i P 2 = = 0, 3901
JK c1i 48 × 6
i
e
 2
P
c2i yi.. 2
(10) i [0(901, 65) + 1(898, 95) − 1(893, 75)]
SQH0 = P 2 = = 0, 2817.
JK c2i 48 × 2
i

Para os cálculos das somas dos quadrados associadas a cada componente αi ,


i = 1, · · · , 5, do modelo polinomial: Yk = α0 + α1 Xk + α2 Xk2 + · · · + α5 Xk5 , (Yk
é a média da porcentagem de brix na semana Xk ) precisamos dos coeficientes
dos polinômios ortogonais, dos totais dos subtratamentos e dos valores de Mj e
Kj , apresentados na tabela a seguir:

Coeficientes Totais
k c1k c2k c3k c4k c5k (y..k )
1 -5 5 -5 1 -1 416,66
2 -3 -1 7 -3 5 431,51
3 -1 -4 4 2 -10 447,87
4 1 -4 -4 2 10 454,11
5 3 -1 -7 -3 -5 472,31
6 5 5 5 1 1 471,89
P
Kj = c2jk 70 84 180 28 252 -
k
Mj 2 3/2 5/3 7/12 21/10 -

Daı́, calculamos
 2
P
c1k y.k. 2
(11) k [−5(416, 66) + · · · + 5(471, 89)]
SQ(H0 : α1 = 0) = =
IJK1 24 × 70
2
[404, 79]
= = 97, 5327;
1680
 2
P
c2k y.k. 2
(12) k [5(416, 66) + · · · + 5(471, 89)]
SQ(H0 : α2 = 0) = =
IJK2 24 × 84
2
[−68, 99]
= = 2, 3609;
2016
119

 2
P
c3k y.k. 2
(13) k [−5(416, 66) + · · · + 5(471, 89)]
SQ(H0 : α3 = 0) = =
IJK3 24 × 180
2
[−34, 41]
= = 0, 2741;
4320

 2
P
c4k y.k. 2
(14) k [1(416, 66) + · · · + 1(471, 89)]
SQ(H0 : α4 = 0) = =
IJK4 24 × 28
2
[−18, 95]
= = 0, 5344;
672

 2
P
c5k y.k. 2
(15) k [−1(416, 66) + · · · + 1(471, 89)]
SQ(H0 : α5 = 0) = =
IJK5 24 × 252
2
[−86, 37]
= = 1, 2334.
6048
(13) (14) (15)
As somas dos quadrados das hipóteses H0 , H0 e H0 podem ser reu-
nidas em uma só, denominada Desvio de regressão, com 3 graus de liberdade,
visto que não apresentam significância estatı́stica. Ou seja,
(13) (14) (15)
SQ(Desv. Reg.) = SQ(H0 ) + SQ(H0 ) + SQ(H0 ) = 2, 0419.

Assim sendo, a análise da variância pode ser reorganizada conforme Tabela


(9)
5.13, onde podemos observar que a hipótese H0 : τ1 = τ2 +τ 2
3
não foi rejeitada,
ao nı́vel de 5% de significância pelo teste F . Pois, F = 0, 18 < F[1; 14; 5%] = 4, 60.
Isto indica que, independentemente das épocas de avaliação, os amadurecedores
não apresentaram efeitos estatisticamente significativos sobre a porcentagem de
(10)
brix no caldo da cana-de-açúcar. Observamos também, que a hipótese H0 :
τ2 = τ3 não foi rejeitada ao nı́vel de 5% de significância, uma vez que F =
0, 13 < F[1; 14; 5%] = 4, 60, evidenciando que, independentemente das épocas
de avaliação, o efeito do Polaris sobre a porcentagem de brix no caldo não é
estatisticamente diferente do efeito do Ethrel.
Ainda, de acordo com os resultados apresentados na Tabela 5.13, pode-
mos observar que, independentemente dos tratamentos envolvidos, os efeitos
das épocas de avaliação sobre o teor de brix no caldo da cana, se comporta
(11)
parabolicamente, tendo em vista que as hipóteses H0 foi rejeitada a 1% de sig-
(12)
nificância e H0 a 5%. Indicando que os componentes polinomiais de primeiro e
segundo graus são estatisticamente significativos. Observe também, que o valor
da estatı́stica de teste relativo ao Desv. Reg. que serve para testar a hipótese
(16)
H0 : α3 = α4 = α5 = 0, não foi suficientemente grande para que esta fosse
120

Tabela 5.13: Tabela da análise da variância

F. Variação G.L. SQ QM F.
(9)
H0 : τ1 = τ2 +τ
2
3
1 0,3901 0,3901 0,18
(10)
H0 : τ 2 = τ 3 1 0,2817 0,2817 0,13
Tratamentos(T) (2) (0,6718) 0,3359 Ft = 0, 15
Blocos 7 25,2008 3,6001 -
Resı́duo(a) 14 30,7295 2,1950 -
Parcelas (23) (56,6021) - -
(11)
H0 : α1 = 0 1 97,5327 97,5327 163, 40∗∗
(12)
H0 : α2 = 0 1 2,3609 2,3609 3, 96∗
(16)
H0 : α3 = α4 = α5 = 0 3 2,0419 0,6806 1,14
Semanas(S) (5) (101,9355) 20,3871 Fs = 34, 16∗∗
Interação T × S 10 12,6892 1,2689 Fg = 2, 13∗
Resı́duo(b) 105 62,6710 0,5969 -
Total 143 233,8978 - -

F[1; 14; 5%] = 4, 60; F[2; 14; 5%] = 3, 74; F[1; 105; 5%] = 3, 94;
F[1; 105; 1%] = 6, 91; F[3; 105; 5%] = 4, 00.

rejeitada ao nı́vel de 5% de significância. Isto evidencia que os componentes de


terceiro, quarto e quinto graus são todos estatisticamente nulos.
O modelo do segundo grau ajustado para estimar a porcentagem de brix
no caldo em relação às épocas de avaliação, independentemente do tratamento
aplicado, foi obtido do seguinte modo:
P
y.k. 2694, 35
α̂0 = k = = 18, 7108;
IJK 144

P
k c1k y.k.
α̂1 = M1
IJK1
[−5(416, 66) + · · · + 5(471, 89)]
= 2× = 0, 4819;
24 × 70

P
k c2k y.k.
α̂2 = M2
IJK2
3 [5(416, 66) + · · · + 5(−69, 99)]
= × = −0, 0521.
2 24 × 84
Tendo em vista que:

P1 = x, onde, x = X−
q

= X−5
2 ;
2
2 n −1 2
P2 = x − 12 = x − 2, 9167;
121

e substituindo-se estes resultados na equação (5.7),


Ŷ = α̂0 + α̂1 P1 + α̂2 P2 (5.7)
encontramos,
  " 2 #
X −5 X −5
Ŷ = 18, 7108 + 0, 4819 − 0, 0521 − 2, 9167
2 2
= 17, 3324 + 0, 3712X − 0, 0130X 2 .
Além disso, sendo a interação estatisticamente significativa, é convenien-
te desdobrar os graus de liberdade e respectiva soma dos quadrados da in-
(9)
teração T × S em contrastes de interesse, representados pelas hipóteses, H0 =
(10)
γ1k − γ2k +γ 2
3k
e H0 = γ2k − γ3k , dentro de cada semana, isto é, para k =
1, 2, · · · , 6. Para facilitar os cálculas das somas dos quadrados correspondentes
a cada hipótese, estruturamos a Tabela 5.14 contendo os coeficientes dos dois
contrastes de interesse e os totais dos tratamentos dentro de cada semana:

Tabela 5.14: Coeficientes dos dois contrastes de interesse e totais dos trata-
mentos dentro de cada semana.
(J = 8) Coeficientes T ratamentos × Semanas Totais
i c1i c2i yi1. yi2. yi3. yi4. yi5. yi6. yi..
1 2 0 141,10 144,40 148,05 150,60 158,60 158,90 901,65
2 -1 1 137,80 145,55 151,28 153,63 159,53 151,16 898,95
3 -1 -1 137,76 141,56 148,54 149,88 154,18 161,83 893,75
Soma - - 416,66 431,51 447,87 454,11 472,31 471,89 2694,35

Em seguida calculamos as somas dos quadrados:


 2
P
c1i yi1.
(9) i
SQ(H0 d. S1 ) = P
J c21i
i
2
[2(141, 10) − 1(137, 80) − 1(137, 76)]
= = 0, 9185;
8×6
 2
P
c2i yi1.
(10) i
SQ(H0 d. S1 ) = P
J c22i
i
2
[0(141, 10) + 1(137, 80) − 1(137, 76)]
= = 0, 0001;
8×2
e
1X 2 y2
SQ(T rat d. S1 ) = yi1. − .1.
J i IJ
122

1  (416, 66)2
= (141, 10)2 + (137, 80)2 + (137, 76)2 −
8 24
= 0, 9186;

 2
P
c1i yi2.
(9) i
SQ(H0 d. S2 ) = P
J c21i
i
2
[2(144, 40) − 1(145, 55) − 1(141, 56)]
= = 0, 0595;
8×6

 2
P
c2i yi2.
(10) i
SQ(H0 d. S2 ) = P
J c22i
i
2
[0(144, 40) + 1(145, 55) − 1(141, 56)]
= = 0, 9950;
8×2
e
1X 2 y2
SQ(T rat d. S2 ) = yi2. − .2.
J i IJ
1  (431, 51)2
= (144, 40)2 + (145, 55)2 + (141, 56)2 −
8 24
= 1, 0545;
e de modo análogo, teremos:
(9) (10)
SQ(H0 d. S3 ) = 0, 2883; SQ(H0 d. S3 ) = 0, 4692; SQ(T rat d. S3 ) = 0, 7575;

(9) (10)
SQ(H0 d. S4 ) = 0, 1112; SQ(H0 d. S4 ) = 0, 8789; SQ(T rat d. S4 ) = 0, 9901;

(9) (10)
SQ(H0 d. S5 ) = 0, 2538; SQ(H0 d. S5 ) = 1, 7889; SQ(T rat d. S5 ) = 2, 0427;

(9) (10)
SQ(H0 d. S6 ) = 0, 4820; SQ(H0 d. S6 ) = 7, 1156; SQ(T rat d. S6 ) = 7, 5976;

Estes resultados estão colocados de forma organizados na Tabela 5.15.


(9)
Como podemos observar, a hipótese H0 : γ1k = γ2k +γ 2
3k
, para k = 1, 2, · · · , 6,
na Tabela 5.15, não foi rejeitada, ao nı́vel de significância de 5%, em todas as
(10)
épocas de amostragem do brix, porém, embora a hipótese H0 não tenha
sido rejeitada, ao nı́vel de 5% de significância, nas primeiras cinco épocas de
avaliação, ela foi rejeitada, ao nı́vel de significância de 1%, na décima semana
após a aplicação dos amadurecedores, ou seja, para k = 6.
123

Tabela 5.15: Tabela da análise da variância com desdobramento da interação.

F. Variação G.L. SQ QM F.
(9)
H0 : γ11 = γ21 +γ
2
31
1 0,9185 0,9185 1,54
(10)
H0 : γ21 = γ31 1 0,0001 0,0001 0,00
H0 : γ11 = γ21 = γ31 =0 (2) (0,9186) 0,4593 0,77

(9)
H0 : γ12 = γ22 +γ
2
32
1 0,0595 0,0595 0,10
(10)
H0 : γ22 = γ32 1 0,9950 0,9950 1,67
H0 : γ12 = γ22 = γ32 = 0 (2) (1,0545) 0,5273 0,88

(9)
H0 : γ13 = γ23 +γ
2
33
1 0,2883 0,2883 0,48
(10)
H0 : γ23 = γ33 1 0,4692 0,4692 0,79
H0 : γ13 = γ23 = γ33 = 0 (2) (0,7575) 0,3788 0,63

(9)
H0 : γ14 = γ24 +γ
2
34
1 0,1112 0,1112 0,19
(10)
H0 : γ24 = γ34 1 0,8789 0,8789 1,47
H0 : γ14 = γ24 = γ34 = 0 (2) (0,9901) 0,4951 0,83

(9)
H0 : γ15 = γ25 +γ
2
35
1 0,2538 0,2538 0,43
(10)
H0 : γ25 = γ35 1 1,7889 1,7889 3,00
H0 : γ15 = γ25 = γ35 = 0 (2) (2,0427) 1,0214 3,01

(9)
H0 : γ16 = γ26 +γ
2
36
1 0,4820 0,4820 0,81
(10)
H0 : γ26 = γ36 1 7,1156 7,1156 11, 92∗∗
H0 : γ16 = γ26 = γ36 = 0 (2) (7,5976) 3,7988 6, 36∗∗

Resı́duo(b) 105 62,6710 0,5969 -

Ainda, pelo motivo da significância estatı́stica da interação, também é con-


veniente estudarmos o comportamento dos teores médios de brix em relação às
épocas de avaliação (semana) dentro de cada tratamento. Para este fim, estru-
turamos a Tabela 5.16, com os coeficientes dos polinômios ortogonais para 6
nı́veis e os totais relativos a interação T × S e a seguir calculamos as somas dos
(11) (15)
quadrados das hipóteses H0 a H0 dentro de cada tratamento, como sejam:
124

Tabela 5.16: Coeficientes dos polinômios ortogonais e totais de brix por trata-
mento e época de amostragem (semana)

Coeficientes T ×S Totais
k c1k c2k c3k c4k c5k y1k. y2k. y3k. (y.k. )
1 -5 5 -5 1 -1 141,10 137,80 137,76 416,66
2 -3 -1 7 -3 5 144,40 145,55 141,56 431,51
3 -1 -4 4 2 -10 148,05 151,28 148,54 447,87
4 1 -4 -4 2 10 150,60 153,63 149,88 454,11
5 3 -1 -7 -3 -5 158,60 159,53 154,18 472,31
6 5 5 5 1 1 158,90 151,16 161,83 471,89
P
Kj = c2jk 70 84 180 28 252 - - - -
k
Mj 2 3/2 5/3 7/12 21/10 - - - -

Em seguida, calculamos:
 2
P
c1k y1k.
(11) k
SQ(H0 : α1 = 0) d. T1 =
JK1
2
[−5(141, 10) + · · · + 5(158, 90)]
=
8 × 70
(134, 15)2
= = 32, 1361;
560
 2
P
c2k y1k.
(12) k
SQ(H0 : α2 = 0) d. T1 =
JK2
2
[5(141, 10) + · · · + 5(158, 90)]
=
8 × 84
(2, 40)2
= = 0, 0086;
672
 2
P
c3k y1k.
k
SQ(Ho(13) : α3 = 0) d. T1 =
JK3
2
[−5(141, 10) + · · · + 5(158, 90)]
=
8 × 180
(−20, 60)2
= = 0, 2947;
1440
 2
P
c3k y1k.
k
SQ(Ho(14) : α4 = 0) d. T1 =
JK4
125

2
[1(141, 10) + · · · + 1(158, 90)]
=
8 × 28
(−11, 70)2
= = 0, 6111;
224

 2
P
c3k y1k.
k
SQ(Ho(15) : α5 = 0) d. T1 =
JK5
2
[−1(141, 10) + · · · + 1(158, 90)]
=
8 × 252
(−27, 70)2
= = 0, 3806;
2016

1X 2 y2
SQ(S d. T1 ) = y1k. − 1..
J JK
k
1  (901, 65)2
= (141, 10)2 + · · · + (158, 90)2 −
8 48
= 33, 4311;

De modo análogo encontramos:


 2
P
c1k y2k.
(11) k (111,09)2
SQ(H0 : α1 = 0) d. T2 = = = 22, 0375;
 JK1 2 560
P
c2k y2k.
(12) k (−79,92)2
SQ(H0 : α2 = 0) d. T2 = = = 9, 5048;
 JK2 2 672
P
c3k y2k.
(13) k (−40,46)2
SQ(H0 : α3 = 0) d. T2 = = = 1, 1368;
 JK3 2 1440
P
c4k y2k.
(14) k (−16,46)2
SQ(H0 : α4 = 0) d. T2 = = = 1, 2095;
 JK4 2 224
P
c5k y2k.
(15) k (−33,04)2
SQ(H0 : α5 = 0) d. T2 = JK5 = 2016 = 0, 5415;

1X 2 y2
SQ(S d. T2 ) = y2k. − 2..
J JK
k
1  (901, 65)2
= (141, 10)2 + · · · + (158, 90)2 −
8 48
= 33, 4311;
126
 2
P
c1k y3k.
(11) k (111,09)2
SQ(H0 : α1 = 0) d. T3 = = = 22, 0375;
 JK1 2 560
P
c2k y3k.
(12) k (−79,92)2
SQ(H0 : α2 = 0) d. T3 = = = 9, 5048;
 JK2 2 672
P
c3k y3k.
(13) k (−40,46)2
SQ(H0 : α3 = 0) d. T3 = = = 1, 1368;
 JK3 2 1440
P
c4k y3k.
(14) k (−16,46)2
SQ(H0 : α4 = 0) d. T3 = = = 1, 2095;
 JK4 2 224
P
c5k y3k.
(15) k (−33,04)2
SQ(H0 : α5 = 0) d. T3 = JK5 = 2016 = 0, 5415;

1X 2 y2
SQ(S d. T3 ) = y3k. − 3..
J JK
k
1  (901, 65)2
= (141, 10)2 + · · · + (158, 90)2 −
8 48
= 33, 4311;

Finalmente, para determinar o valor da estatı́stica de teste associada a cada


hipótese (Teste F) precisamos, neste caso, do resı́duo combinado e do número de
graus de liberdade correspondente, os quais são obtidos a partir das expressões
(5.5) e (5.6) que, para este exemplo, resultaram em QM R = 0, 8633 e ν = 63
graus de liberdade.
(13)
Note que, de acordo com a Tabela 5.17: SQ(H0 : α3 = 0) d. Ti ,
(14) (15)
SQ(H0 : α4 = 0) d. Ti e SQ(H0 : α5 = 0) d. Ti , para i = 1, 2, 3, não
apresentam significância estatı́stica, ao nı́vel de 5% de significância. Sendo as-
sim, podemos reunir estas somas de quadrados numa única que chamaremos de
(16)
SQ(Desvio de Regressão) d. Ti , a qual corresponde a SQ(H0 : α3 = α4 =
α5 = 0) d. Ti e juntamente com os demais resultados, estruturamos a análise da
variância apresentada na Tabela 5.17.
127

Tabela 5.17: Tabela da análise da variância

F. Variação G.L. SQ QM F.
(11)
(H0 : α1 = 0) d. T1 1 32,1361 32,1361 37, 22∗∗
(12)
(H0 : α2 = 0) d. T1 1 0,0086 0,0086 0,01
(16)
(H0 : α3 = α4 = α5 = 0) d. T1 3 1,2864 ,4288 0,50
Semanas d. T1 (5) 33,4311 6,6862 7, 74∗∗
(11)
(H0 : α1 = 0) d. T2 1 22,0375 22,0375 25, 53∗∗
(12)
(H0 : α2 = 0) d. T2 1 9,5048 9,5048 11, 01∗∗
(16)
(H0 : α3 = α4 = α5 = 0) d. T2 3 2,8878 0,9626 1,12
Semanas d. T2 (5) 34,4301 6,8860 7, 98∗∗
(11)
(H0 : α1 = 0) d. T3 1 45,4575 45,4575 52, 66∗∗
(12)
(H0 : α2 = 0) d. T3 1 0,1083 0,1083 0,13
(16)
(H0 : α3 = α4 = α5 = 0) d. T3 3 1,1977 0,3992 0,46
Semanas d. T3 (5) 46,7635 9,3527 10, 83∗∗
Resı́duo 63 - 0,8633 -

F[1; 63; 0,05] = 4, 00, F[3; 63; 0,05] = 2, 76, F[5; 63; 0,05] = 2, 37,
F[1; 63; 0,01] = 7, 07, F[3; 63; 0,01] = 4, 12, F[5; 63; 0,01] = 3, 33.

(11)
Conforme se depreende, a hipótese (H0 : α1 = 0) foi rejeitada ao nı́vel
(12)
de 1% de significância nos três tratamentos, enquanto que (H0 : α2 = 0) só
foi rejeitada no tratamento 2. Isto indica que o comportamento da porcenta-
gem de brix no caldo da cana-de-açúcar, em relação às épocas de avaliação, é
linear dentro da Testemunha, linear onde foi aplicado o amadurecedor Ethrel e
parabólico onde foi aplicado o amadurecedor Polaris. Os demais componentes
polinomiais para épocas de avaliação dentro dos tratamentos não apresentaram
significância estatı́stica ao nı́vel de 5% de significância.
Uma vez realizada a análise da variância precisamos encontrar os polinômios
ajustados em função dos nı́veis do fator semana e isto é feito considerando os
coeficientes de mais alto graus significativos. Para o nosso exemplo, teremos:
Modelo 1: Comportamento dos teores médios de brix em reação às Semanas
d. T1 −→ Ŷ = α̂0 + α̂1 P1 , em que
P1 = x,

X−X̄ X−5
x= q = 2 ;

y1.. 901,65
α̂0 = J×K = 48 = 18, 7844 e
 
P
c1k y1k.
k 134,15
α̂1 = M1 JK1 =2× 560 = 0, 4791;
128

Daı́, tem-se:
 
X −5
Ŷ = 18, 7844 + 0, 4791 =⇒ Ŷ = 17, 5867 + 0, 2396X;
2

Modelo 2: Comportamento dos teores médios de brix em relação às semanas


d. T2 −→ Ŷ = α̂0 + α̂1 P1 + α̂2 P2 , onde
n2 −1 62 −1
P2 = x2 − 12 = x2 − 12 = x2 − 2, 9167,

X−5
x= 2 ,

y2.. 898,95
α̂0 = J×K  = 48 = 18, 7281,

P
c1k y2k.
k (111,09)
α̂1 = M1 JK1 =2× 560 = 0, 39675,
 
P
c2k y2k.
k 3 (−79,92)
α̂2 = M2 JK2 = 2 × 672 = −0, 1784,

Fazendo-se as devidas substituições, encontramos:

Ŷ = 17, 1415 + 0, 6444X − 0, 0446X 2 . (5.8)

Modelo 3: Comportamento dos teores médios de brix em relação às semanas


d. T3 −→ Ŷ = α̂0 + α̂1 x, em que

P1 = x,

X−X̄ X−5
x= q = 2 ;

y1.. 893,75
α̂0 = J×K = 48 = 18, 6198 e
 
P
c1k y3k.
k 159,55
α̂1 = M1 JK1 =2× 560 = 0, 5698;

Daı́, tem-se:
 
X −5
Ŷ = 18, 6198 + 0, 5698 =⇒ Ŷ = 17, 1953 + 0, 2849X;
2

Os gráficos do comportamento do brix em relação às épocas de avaliação dentro


de cada tratamento podem ser apreciados na Figura 5.4, a seguir:
129

%Brix d. T1 %Brix d. T2
21 21
20.5 20.5
20 20
19.5 19.5
19 19
18.5 18.5
18 18
17.5 17.5
4 Semana 4 Semana
2 6 8 10 2 6 8 10

%Brix d. T3
21 %Brix d. T1,T2,T3
20.5 21
20 20.5
20
19.5 19.5
19 19
18.5 18.5
18 18
17.5 17.5
Semana 2 4 6 8 10 Semana
2 4 6 8 10

Figura 5.4: Comportamento do brix em relação às épocas de avaliação em cada


tratamento

Neste caso, apenas para o amadurecedor Polaris, é possı́vel determinar o


ponto de máxima produção de brix. Para isto, derivamos a equação (5.8) em
relação a X, igualamos a zero, tiramos o valor de X e encontramos o valor
0,6444
X̃ = 2×0,0446 ∼
= 7, 2 semanas que é a época em que a porcentagem de brix
atinge seu ponto máximo quando a cana-de-açúcar for tratada com Polaris.
Estima-se que, nesta época, a porcentagem máxima de brix obtida será de Ŷ =
17, 1415 + 0, 6444(7, 2) − 0, 0446(7, 2)2 = 19, 5%. Por outro lado, de acordo
com os modelos ajustados para explicar o teor de brix em relação às épocas de
avaliação, observou-se que o aumento médio da porcentagem do brix no caldo
por semana na Testemunha foi de 0,2396% enquanto que para a cana tratada
com Ethrel o aumento médio do brix por semana foi de 0,2849%.

Você também pode gostar